検索の結果をユーザにとってより価値のある有用性の高いものにしようという試みは,多くの研究者やエンジニアが長い間継続して取り組んでいる重要なテーマのひとつです. 検索エンジンに与えたクエリに対する検索結果は,通常はURLのリストとして返されますが,多くのユーザは,その中のせいぜい10個程度しかクリックしないといわれています. したがって,クエリにはあらわれていないユーザの嗜好(のようなもの)を如何にしてうまく汲み取り,その嗜好にあったURLをリストの上位に如何にうまく表示させるかが, ウェブアプリケーションの設計者の腕の見せどころということになります(URLの重要性をはかる尺度としてGoogleで使われているページランクがよく知られていますが, ここでいうユーザの嗜好による主観的なランクづけは,ページランクのような客観的なランクづけとも併用することができます).
私たちのグループではこの問題に対して,「ウェブ検索のパーソナライゼーション」という切り口からの研究を進めています. 直感的なイメージとしては,各ユーザが自分用にカスタマイズされた(使い込まれた)ブラウザを使って検索を行うことで,自分にとって有用な情報をすばやく見つけられるような 仕掛けだといえば理解しやすいかもしれません. 私たちはそのようなシステムの実現を目指して,ウェブページに対するアクセス履歴からそのユーザの嗜好を自動的に取得するための新しい枠組みをコンピュータ上に実装しました. この方法では一種の協調フィルタリングを行っているのですが(Amazon.comで買い物をしたときに出てくる「この商品を買った人は,こんな商品も買っています」というメッセージの 裏側で動いているのが協調フィルタリングという仕組みです), ウェブを閲覧するだけでそのような情報が自動的に取得されるという点で,オリジナリティがあります.
またこのアイデアをさらに発展させ,ユーザの嗜好を,タグ集合とその上で定義される構造(タグをノードとするグラフ構造だと考えてください)とによってあらわす方法を提案しました. またそれと並行して,RSSなどのフィードリーダーを通して自動的に送られてくる大量の情報の中からそのユーザにとって興味のあるものを優先的に推薦するシステムや, (はてなブックマークなどの)ソーシャルブックマークの履歴情報を利用した, 多くのユーザが興味をもつ可能性のある有望サイトを自動検出するシステムの提案なども行いました. ユーザプロファイルの新しい作成方法の提案や,タグのつながり方に注目した意外性のある情報提示法の提案などを行い, 対象をソーシャルネットワークに広げ, 1) ソーシャルブックマークの周期性の分析,2) Twitter上のRetweet構造の分析,3) ソーシャルタグの拡張などをおこないました.