2005年11月20日

検索の鉄人に会った

自分の仕事は下準備に色々調べることが多い。

このため、いつも効率的にネットで検索エンジンを使って調べ物できるよう、自分なりに努力しているつもりだ。

そんなことを考えている中で色々お世話になっている(完全に一方的だが)のが、関裕司さん。1997年に当時サービスを立ち上げたばかりのgooが行ったコンテストで初代検索の鉄人に輝いた人だ。関さんは当時別の仕事をしながら、検索に関して講演をする二足のわらじを続けていたが、昨年6月頃にYahoo!Japanに華麗なる転身を遂げ、現在は同社のリスティング事業部サーファー部で働いている。関さんのサイト四軒丁には検索のテクニックや興味深いサイトの紹介もある(一部はメーリングリストでも公開している)。

そんな関さんが講演をすることを本人のアナウンスで知った。

場所は秋葉原にあるデジタルハリウッド大学。あれ?デジハリって専門学校じゃなかったっけ?と思っていたが、どうやら今年の4月に大学を開校したらしく、現在は1年生のみだそうだ。

そんなデジハリ大が大学祭を19-20日にやっていて、その中で同大の学生である横山兼大君(学生なので君付けにさせてもらいます)が代表のリッチメディアというサークル主催のイベント「検索テクニックの最前線 2005」に参加した。

彼の先生の橋本大也さんは同大の助教授でもあり、社内向けなど特殊な検索エンジンをつくるベンチャー「データセクション」の代表取締役でもあるが、書評でも有名なブログ「情報考学 Passion for The Future」を運営するアルファブロガーという本でも紹介されている有名人。(橋本さんのブログにもイベント告知がありました)

そんなお二人に会えるのが楽しみにアキバに向かった。

スタートは19:00だが、17:00には到着。本当はもっと早く出て、健康のために神保町あたりから歩くつもりだったが、ずっと前に買っていたのにようやく昨夜から始めたみんごるにはまってしまい、出発が遅れた。

この前つくばからの帰りに素通りしただけなので、秋葉原も久しぶりだと思いながら、少しうろついた。秋葉原ではいつも安くて便利なPC周辺機器が好きで探してしまう(今回は結局何も買わなかったけど)。

ぶらぶらした後、18:00頃にデジハリ大に行ってみたが、すでに大学祭は始まっているようだったものの、何か活気がなく、一度戻って喫茶店でコーヒーを買い、タバコをふかして時間を潰し、もう一度18:20頃に大学祭の会場に到着した。

会場に入ると無料の人生相談をやっていたり、学生のCG作品とか、シルバーアクセとかを展示していたが、あまり入ってきた人を積極的に迎える雰囲気がなく、内輪の集まりっぽかったのがちょっと残念。

受付開始の18:30直前に関さん発見。結構背が高い人なんだなぁ。隣にいる橋本さんは、自分とあまり歳が変わらないかもというのがそれぞれの第一印象だ。

ようやく受付が始まり、このイベントに協賛しているYahoo!Japanからのノベルティもゲットした。いよいよだとワクワクする。

イベントでもらったYahoo!の腕時計


受付の順番が早かったので、かなり前に席を確保する。

関さんの講演を聞くのは初めてだが、さすがに慣れた様子でプレゼンの準備をしている。

デジハリ大の杉山知之学長の挨拶でイベントがスタート。

第一部は今回のイベントを企画した横山兼大君のスピーチ。

彼がデジハリ大を受験しようと思ってから現在までの経験を語る。さすがに話し慣れていないので、敬語の使い方も怪しかったが一生懸命。思わず頑張れ!と心の中で叫ぶ。へぇー、デジハリ大の入学式って、ハリウッドでやったんだ。

そして楽しみにしていた関さんの講演が始まる。

Yahoo!Japanは今年10月にカテゴリー検索中心から独自開発のYST(Yahoo! Search Technorogy)メインにインターフェースを切り替えたが、ネット上でやや批判があったらしく、関さんは「その言い訳もちょっと話しますね」とのこと。

以前のインターフェースではLong Tailへの対応が不充分だったというのが一つの理由らしい。あるクエリーが検索された回数を縦軸に、クエリーを横軸にとったグラフを見ると、図のようになる(関さんがメーリングリストで紹介したサイトを使って書いた図を自分で再現)。

つまり多くの人が検索する語はわずかで、全体の60%は1日1回しか検索されないような語であり、そういう語が延々と長い尾のように分布しているということらしい。Yahoo!Japanのカテゴリー検索などはこの頭(Head)にあるような語の検索は出来てもTail、長い尾の部分にあるような語は引っかかってこないのだだという。

うーん。興味深い。

続いてサーファー部の仕事の話。
カテゴリー検索がメインでなくなっても忙しいのだそうで、YSTが新しいアルゴリズムを導入した時のテストをしたり、井の中のカワズ君という検索をテーマにしたフジテレビの番組にはサーファー部がクロールを提供して全面協力したりしているそうだ。

次は検索のテクニック。
現在Yahoo!のインデックスは世界で200億もあり、単純に一語で検索すると膨大な検索結果が出てくるという。

こういう時に先ほどの話の続きになるが、Headを検索し有名なサイトを探すだけでなく、Tailを検索すると個人の感想などが書かれたようなサイトが見つかる。

例として関さんが挙げたのは全国の温泉の効能が書かれたようなサイトを探す場合。

普通なら「全国 温泉 効能」と上の文章の中にある言葉を並べる検索をするだろう。その結果はこうなる

これで充分という場合もあるが、ここでTaleを探すには、「1つの集合の中にある同じ要素を含む語を思い浮かべて追加していく」のが有効だそうだ。

それは例えば「温泉 効能 酸性 アルカリ性 市 町 村」といった具合で、酸性とかアルカリ性は必ず泉質の説明にあるはずだし、市町村は住所の部分にある。この場合、最初の検索にあったYahoo!のサーファーが決めた有名サイトを示すサングラスマーク(Coolマーク)のサイトは姿を消し、よりレアな情報が顔を出す。

なるほど。

今度は検索のTips。
検索語に続けて「site:」、その後にドメインを加え、ドメイン内を検索できることは自分も使っているが、他にもurlに含まれる語を指定する「inurl:」やタイトルに含まれる語を指定する「intitle:」、リンクされているサイトを探す「link:」もある。

また目的に応じてYahoo!のデータベースを使い分ける話も面白い。
関さんは湯豆腐が大好きらしいが、湯豆腐の鍋の中でタレを温めるものをなんと呼ぶかという問題を出した。自分も含め即座に答えられる人はいないだろう。

普通にyahoo!で「湯豆腐 鍋 真ん中 温める」と検索するとこんな結果になり、豆腐を使った料理の解説とか関係ないものが多く出てくるが、Yahoo!にある商品検索で「湯豆腐 鍋」と検索すると、途中にある商品説明でこれが中子というものであることがわかる。

商品検索をこんな風に使うことができるんだと感心した。

他にも「ただでは転ばない」検索として、検索結果の中から絞り込むことの出来る別の追加キーワードを探すという方法を解説。

英単語でどんな種類の林檎があるか探す例を挙げる。最初は「fuji」だけで検索。笑いながら「富士フイルムとか出てきちゃいますねぇ」。確かに。「するとGolden Deliciousという種類がありますよね」と、「"golden delicious"」(""はフレーズ検索)を加え、「fuji "golden delicious"」で検索。「だいぶ林檎っぽくなってきました」。さらに「検索結果を見るとgranny smithという品種があるようです」と、「fuji "golden delicious" "granny smith"」で検索する。だんだんマニアックなサイトに絞り込まれてくる。

興味深いTipsだ。

「?」や「とは」を使った検索や、翻訳検索が紹介されたほか、検索結果の上に出てくる関連検索ワードは前日のクエリーから自分が検索した語をもう一つの語と組み合わせて検索した結果の中から上位の組み合わせを表示していることなどが明かされた。

ちなみに今「清子」で検索したら、「黒田 清子」「紀宮 清子」「清子 結婚式」「清子 結婚」などが表示された。

そしてYahoo!の今後の話。
さすがに先のことなので詳しい話はできないようだが、ギリギリのレベルで色々なサービスが始まる可能性を語る。
Yahoo!のサーファーが長年蓄積し磨いてきたカテゴリー検索を専用ページとして立ち上げる予定らしい。

第2部の後半は横山君が司会となり、さらに橋本さんが加わってのフリーディスカッション。

橋本さんは大学8年中退、関さんは7年中退というすばらしい?経歴をお持ちで、学生さんに「大学ぐらいは出ておいたほうがいい」と強調。

注目される検索関連技術として橋本さんが挙げていたProgrammable Webも興味深い。現在yahoo!をはじめ有名なサイトがいろんなAPI(Application Interface)を公開し始めていて、これを組み合わせるだけで色々なサービスが生まれるという話。表示されたマトリックスで○が付いているところはすでに立ち上がっているサービスらしい。今は42×42だが、マトリックスが埋まりながら、さらにAPIの数も増えていくのだろう。

他にも検索技術のトレンドが検索エンジンのアルゴリズムからマン・マシンインターフェースに変わっていくのでは?という話もあった。普通の検索エンジンで「ラーメン屋 藤沢市」と検索するとたとえ歩いていける距離にある隣の市のラーメン屋であっても、検索結果に出て来ないが、地図サイトのローカル検索のような場合は近隣の市のラーメン屋も探せるという例を挙げていた。

また関さんは「米国のYahoo!では一部実用化されつつある検索結果のパーソナル化に加え、検索結果を友人や会社の同僚とシェアするなど、様々な公開のレベルを持った検索もできるようになるのでは」という。

Yahoo!の現在の世界共通のキーワードはFUSE。これはF(ind) U(se) S(hare) E(xpand)の頭文字をとったもので、検索結果をうまく使ってこれを共有し、広げていくという意味だそうだ。

勉強という堅苦しさはなく、非常に内容の濃い、充実した2時間を過ごした。こういうイベントにはまた参加してみたいな。
posted by hirozo at 01:05| Comment(8) | TrackBack(6) | webサービス | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
hirozo さん、はじめまして

私もこのセミナー行ってました。(前から2列目です)
詳細なご報告ありがとうございます。改めて昨日の内容を思い出しました。

TBさせていただきますね。

P.S.
細かな事ですが、Long Tale(長い話)は正確には Long Tail(長いしっぽ)ではないかと。
Posted by ten at 2005年11月20日 13:35
Tenさん、コメント&TBありがとうございます。

ほんとだ、間違えてますね。
睡魔と闘っていながら書いていたというのは言い訳ですが、修正しました。

私もかなり前の列でした。

結構内容の濃いイベントでしたね。

またよろしくお願いします。
Posted by hirozo at 2005年11月20日 13:53
hirozoさん、こんばんは

私のブログへのコメントありがとうございました。

睡魔と闘いながらの長文レポートありがとうございました。
これこそホントの long tale ですね(笑)
Posted by ten at 2005年11月20日 17:41
Tenさんのブログもすごい情報が詰まっていますね。

自分は居酒屋と映画ばっかりで気楽なもんです^^;

TenさんのブログへのTBがうまくいってない…。
Posted by hirozo at 2005年11月20日 22:40
お恥ずかしい…。

TBのurlを貼り付ける場所を間違えるなんて…。
ようやくTBを返すことができた。
Posted by hirozo at 2005年11月23日 15:02
hirozoさん、TBありがとうございました。

うまく行って良かったです。
Posted by ten at 2005年11月24日 17:03
TBありがとうございます。
イベントでご一緒だったんですね。
詳細なレポートありがとうございます。
復習してます。
Posted by blc at 2005年11月30日 13:02
不人気ブログなので、今までにないコメント数&TB数にびっくりしています^^;

確かにsurveyMLは活発ですね(自分はROMですが)。
でも、関さんのMLも結構な参加者がいると思います。興味深いサイトが紹介されていて、楽しいですよ。
Posted by hirozo at 2005年11月30日 23:19
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック

検索テクニックの最前線 2005 in デジハリ
Excerpt:  本日は秋葉原のデジタルハリウッド大学に行ってきました。目的はこのイベントです。...
Weblog: 10倍ブログ(自己啓発編)
Tracked: 2005-11-20 13:35

メモを取りやすいプレゼンをするコツ
Excerpt: この週末に「検索テクニックの最前線2005」というセミナーに行ってきました。前回のエントリ名が奇しくも「スカッ!と検索するコツ」だったのですが、最近「検索」が自分の中でホットです。セミナーの内容につい..
Weblog: 仕事を楽しくする研究日誌 - ohashiさんのブログ - シゴタノ!
Tracked: 2005-11-21 08:57

「検索テクニックの最前線 2005」の裏側
Excerpt: リッチメディア代表の横山です。 この度は「検索テクニックの最前線2005」にご来場いただき誠にありがとうございました。 イベントの裏話を書きましたので、お時間がありましたらお読み下さい。
Weblog: アキバで学ぶ大学生のブログ
Tracked: 2005-11-21 14:25

Y!なイベント
Excerpt: 酸化してきました。 ...
Weblog: wolog
Tracked: 2005-11-22 16:19

「検索テクニックの最前線 2005」をちょっと前に聴いてきた
Excerpt: 11月19日にデジタルハリウッド大学の学園祭で、「検索テクニックの最前線 2005」という講演イベントがあるというので行ってみました。 講演をしてくれたのは、通称『検索の鉄人』と呼ばれているらし..
Weblog: まったりんの「一秒後は未来」
Tracked: 2005-11-30 08:26

最新検索技術
Excerpt:  19日土曜日の夜、デジタルハリウッド大学の学園祭で「検索テクニックの最前線2005」という講演をやっていたので、いってみた。そう、デジタルハリウッド大学って日本初の株式会社立の大学で、秋葉原にある。..
Weblog: 発見の日々
Tracked: 2005-11-30 13:05
www.flickr.com