nomuran's diary

野村直之のはてな日記(後継ブログ)です

ノイズレスサーチ目指してキーワードの分類カテゴリーを考える

先日の拙日記で言及した取材は、佐藤記者が、
セマンティックWebの応用は検索だけなのか?
それではインパクトが小さいのでは? という問題意識から着手したという面がありました。

検索、というよく知られたアプリケーションで、しかもご利益が
検索精度があがるだけ(ノイズレスサーチ)では、質的に違う何かが
生まれる感じがしない、というものですね。確かに気持ちはよくわかります。

そこで、エンタープライズマッシュアップ、それも、企業バージョンの
マッシュアップ開発手法だけでなく、「エンタープライズ【を】マッシュアップ
できる環境(例:今まで出会いようがなかったドイツの片田舎の中小企業の技術と
日本のベンチャーの商品サービスが素早くマッシュアップ)が、セマンティックWeb
【的な】メタデータオントロジー応用により実現する、というストーリーをお話しました。

ただ、そのようなご利益も、手法的、技術的には、ノイズレスサーチを駆使した
結果でもあります。即物的な、ある一面を切り取った見方ではありますが。

もちろん、汎用のノイズレスサーチなどがあれば、とても有り難いことであります。
現状、改善して欲しいところはたくさんあります。それは、1本のアルゴリズムで、
というより、いろんなしかけを丹念に積み上げていくことで実現できること、
という気がしています。

一例を、この「はてな」が豊富に自動生成してくれるメタデータの【精度】に
とってみましょう。対象を人間としてみます。物理的存在(立って半畳寝て一畳)、
生物医学的存在(ヒト)、人格としての人間、社会的存在(仕事/生活//旅行
だけで数万異常の属性)、文学的存在などなどで何百万もの属性をもっている
人間。しかしながら、何かの作業、、たとえばはてなキーワードに登録するついで
に、貴重な時間を執筆者に割いていただいて、その1つだけをカテゴリー識別語
として選ぶとどうなるか。

はてなキーワードでは、現状、野村直之はコンピュータです。

野村直之 http://d.hatena.ne.jp/keyword/%CC%EE%C2%BC%C4%BE%C7%B7

カテゴリー: コンピュータ

その結果、次のようなリンクが自動生成されています:

求人: 「野村直之」に関する仕事 (リブオン・エンタープライズ株式会社(LiveOn Enterprise Co.,Ltd.))
ウェブ検索: 「野村直之」をはてな検索で検索
ショッピング: 「野村直之」を楽天市場で検索
オークション: 「野村直之」をYahoo!オークションで検索

書籍ならば著書、題材、などの形で見つかるかもしれませんが、普通は
人間が商品として販売されることはないでしょう。確かヤフオクなどでも、
人身売買は明示的に禁止されていたはず。※にもかかわらず、「美人の
中国人女性紹介します」がオークションの「商品」になっていたことは
あります。厳密には人間そのものじゃなくて、紹介するという行為、
サービスの売買取引なのだとは思いますが。

こちらの自動生成ページには、求人、ウェブ検索は無くて、ショッピング、
オークションはあります。

「野村直之」の言及数の過去100日間の統計グラフです。
http://d.hatena.ne.jp/keywordstats/%CC%EE%C2%BC%C4%BE%C7%B7

はてなさんも、もちろん大変がんばっておられて、言及数の閾値などで
各種キーワードをクリッカブルなリンクとして見せるかのコントロール
をすることで利便性を提供しているわけです。しかし、キーワードの基本属性
であるところの「カテゴリー」にもう一工夫も二工夫もしないと、
ちょっと視覚的にうるさい、無駄なリンクが多数自動生成されてしまい、
ノイズになります。

このあたりが、セマンティックWeb的なものが解決をになうべきところです。
ただ、CGMに適合させるのはそう簡単ではないでしょう。
でも望みはあります。ヒントになる1つのエピソードを思い出しました。

「ピアノ」というキーワードです。
これを、音楽専門の文献にあたると、楽器という意味以外に、
音楽の音量の相対的大小、弱い、小さい音(英語では、なぜかsoftという
形容詞を使います)という意味で使われるケースが激増するのです。
一般記事では、ほとんど楽器という意味だけになります。

つまり、CGMに向き合っているユーザが、そのテーマ、キーワードについて
どの程度の専門家であるかを検出、認識できれば、少数のカテゴリー付け
の貴重なてがかりを最も有効に活用できそうだ、ということになります。

以上はいずれ改題、加筆して、
翔泳社EnterpriseZineの執筆者紹介頁 http://enterprisezine.jp/author/38/
にも書くと思います。え?「それより早く実装、実現してくれ」って?

はい。まさにその通りでございます。
誰か一緒にやりませんか? (汗)