Googleに負けないものを作りたい――女子大生が挑む日本独自の「かわいい検索」

女の子の“かわいい”を検索できる「かわいい検索」は、アルゴリズムの設計からプログラミング、デザインまで、学生が中心になって作り上げたWebアプリ。Googleが無視している「Webページの見た目の雰囲気」という要素にこだわり、日本人独自の検索エンジンを目指す。

» 2011年06月29日 21時20分 公開
[山本恵太,ITmedia]
※本記事はアフィリエイトプログラムによる収益を得ています

 「ゆるかわ検索」「キュート検索」「きれい検索」「おもしろ検索」「まじめ検索」――5つの“かわいい”系統から気になるアイテムを検索ができる検索エンジン「かわいい検索」がリリースされた。開発したのは慶応義塾大学SFC(湘南藤沢キャンパス)の女子大生3人だ。

 現在は検索対象がブログのみとなっており、例えば「バッグ」(bag)を検索すると、5つの“かわいい”の系統のうち選択した分野に当てはまるバッグを紹介したファッション系のブログが表示される。芸能人ブログなど、バッグの写真だけでなく、バッグを持っている有名人の写真を見ることができるため、流行の“かわいい”も検索結果から分かるのが特徴となっている。

 開発を担当したのは同大学院修士課程の橋口恭子さん、同大学3年生の若林里奈さんと松野香織さんの3人。橋口さんがアルゴリズムの設計とプログラミングを担当し、若林さんがデザイン、松野さんがターゲットの調査や評価実験などを担当した。3人とも小川克彦 環境情報学部教授の研究室に所属している。

左から、松野香織さん、橋口恭子さん、若林里奈さん

始まりは「文字で砂時計を作る」アイデア

 「かわいい検索」は絵文字、ひらがな、顔文字、漢字、文字数、ギザギザ、単語数、画像、行間、ゆる絵文字、画数、記号という12の要素を使ってブログを分析している。「ゆる絵文字」というのは、携帯メールの絵文字とは別に、ブログで独自に使われているGIF画像のことで、「記号」はAAのような顔文字などを表す。

 この12の要素を使って、ブログをゆるかわ、キュート、きれい、おもしろ、まじめの5つに分類する。ゆるかわはひらがなが多く、ふんわりした見た目のブログ記事。キュートは絵文字が多くにぎやかな見た目。きれいはシンプルで大人っぽく、おもしろはカラフルで個性的、まじめは飾り気がなくきちんとした見た目、といった具合に分けられる。

 例えば、文字数や画数が多いブログ記事は「まじめ」の系統に分類されることが多く、絵文字が多いブログ記事は「キュート」に分類されることが多い。

 「かわいい検索」の元になる研究は、橋口さんが大学3年生になったときの「文字で砂時計ができないかな」というアイデアからスタートした。このアイデアは、画面上に表示した任意の文章をバラバラに崩し、画数が多く密度の濃い文字ほど重いと仮定して、画面の下の方に落としていくというもの。これにより、文章の要約ができるのではと考えたという。

「面喰い検索」研究資料より

 そのアイデアを、同年秋に「面喰い検索」として進化させ、SFCの研究発表会である「ORF(Open Research Forum) 2009」で公開し、注目を浴びた。

 「面喰い検索」は文章の見た目から、検索ワードが目立って見えるページを上位に表示するというもの。例えば「あいあい愛あいあいあい愛あい」という文章では、密度の濃い「愛」という文字が目立って見える。検索文字の関連性ではなく、検索文字が目立って見えるページを重視するのが特徴。この研究は、卒業時に優秀卒業制作として大学から表彰された。この「面喰い検索」を進化させたのが「かわいい検索」だ。

Webページの「雰囲気」を検索したい

橋口恭子さん。ニックネームは“きょんちゃん”

 開発の中心になった橋口さんは、検索エンジンなどの分散処理について学んでいる。プログラミングを覚えたのは大学2年生からで、「憂鬱なプログラマのためのオブジェクト指向開発講座―C++による実践的ソフトウェア構築入門」「やさしいPHP」を読んで基礎を学び、Google検索を頼りに独学で習得した。

 かわいい検索を開発しようと考えたのは、Google検索など一般的に使われている検索エンジンでは、ページの“見た目の雰囲気”が要素として無視されている点に気付いたから。女子高生や女子大生は、単にテキスト情報や画像データだけではなく、絵文字や行間が醸し出す雰囲気も含めてブログ記事だと考えている。橋口さんは、この“雰囲気”、特に“かわいい雰囲気”を検索するためのアルゴリズムを作りたいと考えた。

 かわいい雰囲気を検索できるようにするのは雲をつかむように難しい。そこで、橋口さんはまずブログ記事を印刷して、見た目の雰囲気から分類し、要素を探した。印刷した紙の枚数は1000枚を超えた。SFCの学生は、学校に泊まったり深夜まで残ったりして課題や研究の作業を続けることを“残留”と呼ぶが、橋口さんは毎日のように研究室で“残留”したという。そして最終的に、前述した12の要素と5つの分類を導き出した。

 「面喰い検索」から「かわいい検索」まで、検索キーワードと内容のマッチングという検索エンジンの常識とは異なる手法にこだわるのはなぜだろうか。橋口さんは、「検索エンジンの分野で日本は負けています。Googleのような、外国の人が開発したものに負けない日本人独自の検索エンジンができるはず」と語る。同じやり方の検索エンジンを作っても勝てないのは分かっている。そこで、ひねりを加えて考え出したのが「かわいい検索」だ。別のアルゴリズムに応用すれば「かっこいい検索」や「かっこ悪い検索」なども可能になる。

 それでも“かわいい”にこだわるのは、海外展開を視野に入れているから。小川教授から、「面喰い検索」では海外で理解されにくいというアドバイスがあり、海外でも通じるようになってきた“KAWAII”に着目した。7月にはアメリカで開催される国際会議「HCI International 2011」で発表を行う予定という。

「学部生で大丈夫かなって思っていた」

SFCでは、ほぼ全学生がPCを持って授業に出ている。3人ともMacユーザー。開発にはMacが適しているという

 橋口さんたちがかわいい検索を開発する上で大きな助けになったのが、NTTレゾナントの研究プロジェクト「gooラボ」のメンバー。元NTTサイバーソリューション研究所所長でもある小川教授が、橋口さんが4年生になった年の夏に紹介した。

 「正直なところ学部生で大丈夫かなって思っていた」と話すのは、橋口さんたちのアイデア出しやプログラミングのサポートを行ってきたgooラボの藤代裕之氏。例えば、橋口さんが書いたソースコードで、セキュリティの弱い部分や大規模に処理する上で必要な部分を修正、追加するといった形で支援してきた。「最終的に僕らが引き取って完成させるという方法もあったと思うけど、想像以上に頑張ってくれた。ここまでできる人はなかなかいないので、サポートしがいがあった」と同氏は言う。

 gooラボはこれまでNTT研究所の技術を活用する場として動いていたが、今回のかわいい検索は、NTTグループと慶応大学の産学連携としての取り組みとなる。小川教授は、「NTT研究所の技術をgooラボで試すことは昔からやってきたが、“かわいい”がキーワードになるようなプロジェクトはNTT研究所ではやらない。若者の発想だ」と語る。実際、橋口さんが「砂時計のように文字が落ちるアイデア」について説明すると、その話を初めて聞いたgooラボのメンバーが、「すごい」「聞いたことがない」「(発想が)飛んでるなあ」と感心する場面もあったという。

完成を目指して

 かわいい検索は未完成だが、今回、さまざまなユーザーに使ってもらうことで、どんな反応が得られるかを確かめるため実験的に公開した。すでに公開初日で、使い方の説明が不十分な点や、ターゲットとしている女子高生や女子大生に使ってもらえていないことが課題として出てきたという。

 橋口さんは検索の精度についても満足していない。実際、一部のブログは「おもしろ検索」にしか出さないといった手作業の登録をしており、すべてが自動で分類されるわけではない。「Googleに負けないものを作りたいというのは、まだまだ心の中に秘めている思いです」と本音を語る。

 7月には国際会議での発表があり、秋にはSFCの研究発表会である「ORF」が控えている。より使いやすく、そして精度を高めた検索エンジンを目指して、3人は「かわいい検索」の研究を続けていく覚悟だ。

上段左から、NTTレゾナントの藤代裕之氏、徳永徹郎氏、森本恭平氏、小川克彦教授、下段左から橋口恭子さん、若林里奈さん、松野香織さん

Copyright © ITmedia, Inc. All Rights Reserved.

昨日の総合アクセスTOP10
  1. /nl/articles/2404/27/news009.jpg しぶとい雑草“ドクダミ”を生やさない超簡単な方法が115万再生! 除草剤を使わない画期的な対策に「スゴイ発見」
  2. /nl/articles/2404/27/news020.jpg パパに笑顔を見せる4カ月の赤ちゃん、ママの顔を見ると…… あるあるな反応に「なんで?!」「ママをすごく信頼してる証拠」とさまざまな声集まる
  3. /nl/articles/2401/26/news015.jpg スーパーで買ったレモンの種が1年後…… まさかの結果が635万再生「さっそくやってみます」「すごーい!」「手品みたい」
  4. /nl/articles/2404/27/news003.jpg 顔の半分は童顔メイク、もう半分の仕上がりに驚がく 同一人物と思えない半顔メイクが860万再生「凄いねメイクの力」
  5. /nl/articles/2404/21/news011.jpg 小1娘、ペンギンの卵を楽しみに育ててみたら…… 期待を裏切る生き物の爆誕に「声出して笑ってしまったw」「反応がめちゃくちゃ可愛い」
  6. /nl/articles/2404/27/news008.jpg 釣りに行こうとしたら、海岸に子猫が打ち上げられていて…… 保護後、予想だにしない展開に「神様降臨」「涙が止まりません」
  7. /nl/articles/2404/27/news010.jpg 巨大ウサギのデカさを伝えるため、2Lペットボトルを横に置いてみたら…… 衝撃の比較結果に「えっ、500mlじゃないんですか」「マジで大きい」
  8. /nl/articles/2404/26/news154.jpg 元「AKB48」メンバー、整形に250万円の近影に驚きの声「整形しすぎてて原型なくなっててびびった」
  9. /nl/articles/2404/26/news187.jpg 実写「シティーハンター」、最後まで見るとあるはずの仕様がない配慮「わかってる」「粋なはからい」「いい判断」
  10. /nl/articles/2404/25/news174.jpg 身長174センチの女性アイドルに「ここは女性専用車両です!!!」 電車内で突如怒られ「声か、、、」と嘆き 「理不尽すぎる」と反響の声
先週の総合アクセスTOP10
  1. 小1娘、ペンギンの卵を楽しみに育ててみたら…… 期待を裏切る生き物の爆誕に「声出して笑ってしまったw」「反応がめちゃくちゃ可愛い」
  2. 富山県警のX投稿に登場の女性白バイ隊員に過去一注目集まる「可愛い過ぎて、取締り情報が入ってこない」
  3. 2カ月赤ちゃん、おばあちゃんに少々強引な寝かしつけをされると…… コントのようなオチに「爆笑!」「可愛すぎて無事昇天」
  4. 異世界転生したローソン出現 ラスボスに挑む前のショップみたいで「合成かと思った」「日本にあるんだ」
  5. 【今日の計算】「8+9÷3−5」を計算せよ
  6. 21歳の無名アイドル、ビジュアル拡散で「あの頃の橋本環奈すぎる」とSNS騒然 「実物の方が可愛い」「見つかっちゃったなー」の声も
  7. 1歳赤ちゃん、寝る時間に現れないと思ったら…… 思わぬお仲間連れとご紹介が「めっちゃくちゃ可愛い」と220万再生
  8. 業務スーパーで買ったアサリに豆乳を与えて育てたら…… 数日後の摩訶不思議な変化に「面白い」「ちゃんと豆乳を食べてた?」
  9. 祖母から継いだ築80年の古家で「謎の箱」を発見→開けてみると…… 驚きの中身に「うわー!スゴッ」「かなり高価だと思いますよ!」
  10. 「ゆるキャン△」のイメージビジュアルそのまま? 工事の看板イラストが登場キャラにしか見えない 工事担当者「狙いました」
先月の総合アクセスTOP10
  1. フワちゃん、弟の結婚式で卑劣な行為に「席次見て名前覚えたからな」 めでたい場でのひんしゅく行為に「プライベート守ろうよ!」の声
  2. 親が「絶対たぬき」「賭けてもいい」と言い張る動物を、保護して育ててみた結果…… 驚愕の正体が230万表示「こんなん噴くわ!」
  3. 水道検針員から直筆の手紙、驚き確認すると…… メーターボックスで起きた珍事が300万再生「これはびっくり」「生命の逞しさ」
  4. フワちゃん、収録中に見えてはいけない“部位”が映る まさかの露出に「拡大しちゃったじゃん」「またか」の声
  5. スーパーで売れ残っていた半額のカニを水槽に入れてみたら…… 220万再生された涙の結末に「切なくなった」「凄く感動」
  6. 桐朋高等学校、78期卒業生の答辞に賛辞やまず 「只者ではない」「感動のあまり泣いて10回読み直した」
  7. 「これは悲劇」 ヤマザキ“春のパンまつり”シールを集めていたはずなのに…… 途中で気づいたまさかの現実
  8. 「ふざけんな」 宿泊施設に「キャンセル料金を払わなくする方法」が物議 宿泊施設「大目に見てきたが厳格化する」
  9. がん闘病中の見栄晴、20回以上の放射線治療を受け変化が…… 「痛がゆくなって来ました」
  10. 食べ終わったパイナップルの葉を土に植えたら…… 3年半後、目を疑う結果に「もう、ただただ感動です」「ちょっと泣きそう」