Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
INFORMATION SEARCH SYSTEM, METHOD, AND PROGRAM, AND INFORMATION SEARCH SERVICE PROVIDING METHOD
Document Type and Number:
WIPO Patent Application WO/2009/025095
Kind Code:
A1
Abstract:
A dialogic information search system is realized by comprehensively utilizing ontology of the classification system of a library and an Wikipedia category which differ in nature from each other. The information search system provides the realization of the infrastructure of a new information search by comprehensively utilizing the ontology of the classification system of the library and the Wikipedia category which differ in nature from each other. With this, the paradigm of a new information search that a search is deepened by the utilization of the library with the Web as a clue can be promoted to the world. This results in the contribution to the improvement of the literacy of the whole society and conduciveness to the rediscovery of the reason of the existence of the library and furthermore to the realization of an electronic library.

Inventors:
KIYOTA YOJI (JP)
NAKAGAWA HIROSHI (JP)
Application Number:
PCT/JP2008/053760
Publication Date:
February 26, 2009
Filing Date:
March 03, 2008
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
UNIV TOKYO (JP)
KIYOTA YOJI (JP)
NAKAGAWA HIROSHI (JP)
International Classes:
G06F17/30
Foreign References:
US20020059289A12002-05-16
US20050256867A12005-11-17
Other References:
YOJI KIYOTA ET AL.: "Reference navigator:ishu ontology no togo browsing tool-toshokan no bunrui taikei to wikipedia category no taio tsuke-", THE ASSOCIATION FOR NATURAL LANGUAGE PROCESSING DAI 13 KAI NENJI TAIKAI WORKSHOP'GENGOTEKI ONTOLOGY NO KOCHIKU RENKEI RIYO'RONBUSHU, 19 March 2007 (2007-03-19), pages 35 - 38
KAZUAKI KISHIDA: "Internet jidai ni okeru tosei goi no igi to yakuwari", THE JOURNAL OF INFORMATION SCIENCE AND TECHNOLOGY ASSOCIATION, vol. 57, no. 2, 1 February 2007 (2007-02-01), pages 62 - 67
Attorney, Agent or Firm:
ITO, Mitsuru (Yotsuya Chuou Building 2-17 Yotsuya 3-chome Shinjuku-k, Tokyo 04, JP)
Download PDF:
Claims:
 利用者からの検索要求に基づき、情報検索を行う情報検索システムにおいて、
 前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索手段と、
 前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出手段と、
 前記抽出手段が取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索手段と、
 を含むことを特徴とする情報検索システム。
 請求項1記載の情報検索システムにおいて、
 少なくとも、前記第1の検索手段が検索した結果と前記第2の検索手段が検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成手段と、
 を含むことを特徴とする情報検索システム。
 請求項2記載の情報検索システムにおいて、
 前記パスファインダー作成手段は、前記第2の検索手段が検索した結果とともに、検索要求中のキーワードから前記第2の検索手段が検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索システム。
 請求項1又は2記載の情報検索システムにおいて、
 前記抽出手段は、
 フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付け手段と、
 前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出手段と、
 前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出手段と、
 を含むことを特徴とする情報検索システム。
 利用者からの検索要求に基づき、情報検索を行う情報検索方法において、
 前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索ステップと、
 前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出ステップと、
 前記抽出ステップにおいて取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索ステップと、
 を含むことを特徴とする情報検索方法。
 請求項5記載の情報検索方法において、
 少なくとも、前記第1の検索ステップで検索した結果と前記第2の検索ステップで検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成ステップ、
 を含むことを特徴とする情報検索方法。
 請求項6記載の情報検索方法において、
 前記パスファインダー作成ステップにおいては、前記第2の検索ステップにおいて検索した結果とともに、図書館オントロジー中のキーワードから前記第2の検索ステップにおいて検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索方法。
 請求項5又は6記載の情報検索方法において、
 前記抽出ステップは、
 フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付けステップと、
 前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出ステップと、
 前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出ステップと、
 を含むことを特徴とする情報検索方法。
 コンピュータを、利用者からの検索要求に基づき、情報検索を行う情報検索システムとして動作させるプログラムにおいて、
 前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索手順と、
 前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出手順と、
 前記抽出手段が取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索手順と、
 を、前記コンピュータに実行させることを特徴とするプログラム。
 請求項9記載のプログラムにおいて、
 前記抽出手順は、
 フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付け手順と、
 前記各概念に対して付与された前記重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出手順と、
 前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出手順と、
 を含むことを特徴とするプログラム。
 利用者からの検索要求に基づき、情報検索を行ってその結果を前記利用者に提供する情報検索サービス提供方法において、
 前記検索要求に基づきフォークソノミー型オントロジーを検索する第1の検索ステップと、
 前記検索によって得られた各概念に対して、対応付けられた概念を図書館オントロジー中から取り出す抽出ステップと、
 前記抽出ステップにおいて取り出した概念を用いて、前記図書館オントロジーを検索する第2の検索ステップと、
 少なくとも、前記第1の検索ステップで検索した結果と前記第2の検索ステップで検索した結果とを有する情報検索のための手がかりとなるパスファインダーを作成するパスファインダー作成ステップと、
 前記作成したパスファインダーを前記利用者に提供するパスファインダー提供ステップと、
 を含むことを特徴とする情報検索サービス提供方法。
 請求項11記載の情報検索サービス提供方法において、
 前記パスファインダー作成ステップにおいては、前記第2の検索ステップにおいて検索した結果とともに、図書館オントロジー中のキーワードから前記第2の検索ステップにおいて検索した概念に至るまでの経路を含む前記パスファインダーを作成することを特徴とする情報検索サービス提供方法。
 請求項11又は12記載の情報検索サービス提供方法において、
 前記抽出ステップは、
 フォークソノミー型オントロジー中から得られた前記各概念に対して、前記検索要求中のキーワードとの距離・類似度を表す重みを付与する重み付けステップと、
 前記各概念に対して付与された重みに基づき、前記図書館オントロジー中の概念に対して、その概念と対応付けられているフォークソノミー型オントロジー中の概念の中で最も大きな重み付けがなされているその重みを、導出スコアとして付与する導出スコア算出ステップと、
 前記求めた導出スコアの値によって、値の大きな上位の予め定められた個数の概念のみを取り出す上位抽出ステップと、
 を含むことを特徴とする情報検索サービス提供方法。
 請求項1~4のいずれか1項に記載の情報検索システムにおいて、
 前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とする情報検索システム。
 請求項5~8のいずれか1項に記載の情報検索方法において、
 前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とする情報検索方法。
 請求項9又は10に記載のプログラムにおいて、
 前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とするプログラム。
 請求項11~13のいずれか1項に記載のサービス提供方法において、
 前記図書館オントロジーに代えて、ピラミッド型オントロジーを用いたことを特徴とするサービス提供方法。
Description:
情報検索システム及び方法及び ログラム並びに情報検索サービス提供方法

 本発明は、図書館のオントロジーと、Web のオントロジーとを組み合わせてより効率 なデータを検索する方法・システムに関す 。さらにそのようなシステムを形成するプ グラムに関する。

 A.発明に至るまでの経緯 
 まず、本発明に至るまでの経緯、本件の発 者らの調査・研究を述べる。

 近年、大学図書館や公共図書館において ジタルレファレンスサービス(DRS)が広く普 し始めている。このDRSとは、インターネッ を活用して使用者からの多様な質問を受け けるレファレンスサービスである。

 しかし、現在、提供されているDRSの主流 、後述するようなインタビュー機能を有し おらず、調べたい対象や探索したい事実が 然としている場合は、必ずしも有効である は言えなかった。

  A-1. 従来のシステム図書館サービ ス
 従来の図書館は様々なサービスを提供して るが、その中の一つにレファレンスサービ と呼ばれるサービスがある。

レファレンスサービスとは、利用者の資料 ・情報の検索を図書館員が援助する人的資源 サービスである。「図書館のコンシェルジェ サービス」とも例えられるサービスである( 特許文献1)。

 一般にこのサービスには、非常に一般的で 範囲な質問が寄せられる。例えば、次のよ な質問がある
 ・利用案内:OPACの使用方法を教えて下さい

 ・所蔵調査:歌舞伎登場人物辞典は東大図書 館にありますか?
 ・文献調査:江戸時代の農民一揆に関する本 を探したい。  
 ・事項調査:大学いもの「大学」は東京大学 のことですか?
 レファレンスサービスは、利用者の多様な 報ニーズに応える主要な図書館サービスの つであるが、そのサービスは図書館内でし 受けることができない。また、利用できる 間帯も限られたものである。また、社会人 高齢者、障害者、離島・山間部の住民など らは来館せずに図書館サービスを享受した というニーズも寄せられている。

  A-2. デジタルレファレンスサービ ス(DRS)
 そこで、近年では、インターネットを利用 て利用者からの質問を受け付けるデジタル ファレンスサービス(DRS)が注目されている

 このDRSは、時間的な特性から見ると、非 期型サービスと同期型サービスとに分類す ことができる。リアルタイムで回答を得る とができるか否かの違いがある。

 主な非同期型サービスとしては電子メー を利用したものが知られている。これは、2 4時間どこからでも質問をすることができる 用なサービスであるが、従来のレファレン サービスで重要な役割を果たしていた利用 へのインタビューには不向きであるという 点がある。

 一方、同期型サービスには、米国を中心 するチャットによるサービスが展開されて るが、担当者が常駐する必要があるため、 ストがかかってしまうという問題点がある

 レファレンスサービスに割くことができ 人的資源には限界があるので、現状の図書 の態勢では全ての利用者のニーズを満たす とは困難である。

 よって、現在、図書館員が行っているレ ァレンス応答を自動で行うことができるオ ラインシステムが強く望まれている。

 そこで、本件の発明者らは、自動レファ ンスサービスシステム実現に向けて、必要 知見を得るために、まず、現状で提供され いるレファレンスサービスの業務分析を行 た。

  A-3. 現状の業務分析
 具体的には、東京大学附属図書館の協力を て、利用者の質問の傾向、回答者が頻繁に 照するリソース、等について調査した。

 東京大学附属図書館のレファレンスサービ の業務分析
 現在、東京大学附属図書館が行っているレ ァレンスサービスは、以下の3種に大別でき る。

 ・カウンターによる質問の受付。 
 ・文書による参考調査依頼。 
 ・ASKサービス。

  A-3-1 カウンターによる質問
 平成17年度の統計によれば東京大学附属図 館のカウンターには年間6630件の質問が寄せ れた。その種別及び件数は以下の通りであ 。

 ・利用案内 3984件
 ・所蔵調査 1675件
 ・文献調査  718件
 ・事項調査  233件
 ・その他    20件
 最も多かった利用案内の質問の大半は、既 頻繁になされている質問であり、図書館員 即答できる内容であることが判明した。ま 、これらの質問の回答は図書館利用ガイド に既に記載されているものが多いことが判 した。

  A-3-2 文書を介した質問応答
 平成17年度、FAX、郵便、E-mailで寄せられた 問の種別及び件数は以下の通りである。

 ・利用案内    5件
 ・所蔵調査 1550件
 ・文献調査  175件
 ・事項調査  170件
 ・その他    90件
 図書館員がこれらの質問に対してどのよう リソースを利用しているのかを調べた。

 その結果
 (a)OPACを調べる。

 (b)(a)で見つからなければ全学総合目録カ ドで調べる。

 (c)(b)で見つからなければ、東京大学では 蔵していないと判断し、NACSIS Webcatで他大 が所蔵しているかどうか調べる。

 また、レファレンス情報源の使用も多か た。例えばJapanKnowledgeのように複数のコン ンツをオンラインで一括検索できるシステ も存在している。

 現状のサービス体系では、目的に応じて のリソースを利用すればよいかを利用者が 確に把握することは困難であると考えられ 。

  A-3-3 ASKサービス
 東京大学附属図書館が提供しているDRSの一 に、ASKサービスがある。このASKサービスは レファレンス質問をWebから行い、回答をメ ルで受け取るシステムである。

 このASKサービスに寄せられる質問の種別 び件数は以下の通りである。

 ・利用案内  219件
 ・所蔵調査   21件
 ・文献調査   11件
 ・事項調査   12件
 ・その他     9件
 そして、上記利用案内の質問のほとんどは 電子ジャーナルのトラブルであることが判 している。そのため、このASKサービスは電 ジャーナルのトラブルシューティング窓口 しているのが現状である。

 このような現状分析の結果、以下のよう 問題点が把握できた。

 1 図書館が提供している情報やリソース 利用者にわかりやすい形で整備されていな 。すなわち、図書館が保持している知識や 存のオンラインリソースを体系的に整備す 必要がある。

 2.インタビュー機能を有するDRSが整備さ ていない。つまり、対話的に問い合わせが きるDRSが有効であると考えられる。米国で チャット中心のDRSも存在するが司書が不足 ている我が国では困難な面がある。

 上記1からは、図書館が保持している知識 や既存のオンラインリソースを体系的に整備 する必要性があることがわかる。

 この問題に対して、例えば、下記非特許 献4では、大学図書館が今後より積極的に取 り組むべき教育支援サービスとして、ある特 定のトピックに関する資料や情報を収集する 手順を簡便にまとめたパスファインダーの構 築と提供が挙げられている。しかし、現在の パスファインダーは、トピック毎に人手で作 成しているため、コストが掛かり、網羅して いる範囲が狭いという問題点がある。

 また、上記2からは、対話型のインターフ ェースを有するDRSが有効であることがわかる 。例えば、京都大学附属図書館レファレンス サービスシステム(下記非特許文献5)や、ダイ アログナビ(下記非特許文献6)が知られている 。

 以上のことから、本願発明者らは、利用 の情報探索を支援する資料や利用案内など 利用者の情報要求にしたがって自動的に整 し、対話的に示すシステムが必要であるこ を強く認識するに至った。言い換えれば、 パスファインダーのオンデマンド生成」が く望まれていることが明らかになったので る。

 このようなシステム実現のためには、図 館の利用方法に関する知識や、OPAC、百科事 典、Webサーチエンジンなどの図書館内外の様 々なオンラインリソースの統合的な利用が必 要である。

 特に、本願発明者らは、インターネット の共同作業によって構築されたWikipediaを代 するフォークソノミー型オントロジーが、 存の百科事典より項目数が多く幅広い範囲 用語が収録されているため、レファレンス ールとして十分に活用可能であると考えた( 非特許文献7)。

 そこで、本願発明者らは、フォークソノ ー型オントロジーと図書館分類とを対応づ 、且つ、対話型のインターフェースを有す 情報検索ツールを開発した。

  B.本特許出願の情報検索ツール
 上で述べたような状況の下、本発明者らが どのようにして統合ブラウジングツールを 築するに至ったかを技術的バックグランド 含めて順に説明する。なお、本件発明の特 の一つは、異種オントロジーの統合ブラウ ングツールの開発(図書館の分類体系とフォ ークソノミー型オントロジーカテゴリの対応 )にある。以下、詳細に説明する。

  B-1.インターネットの普及前
 さて、インターネットが一般に普及する以 、情報探索を行うにあたって中心的な役割 果たしていたのは図書館であった。この図 館は、膨大な資料を整理・組織化し、利用 の情報探索に役立てる様々なツールが存在 ていた。

 代表的なツールとしては、日本十進分類 (NDC)(非特許文献8)や、基本件名標目表(非特 文献9)などが挙げられよう。

 近代にあっては、図書館に代わって、Web( インターネット)が情報探索の中心的な役割 果たしつつある。

  B-2. インターネットの普及後
 インターネット普及後、「初期」には Yahoo !などのWebディレクトリが広く利用されてい 。インターネットの普及期(1995年~)より遅れ 2000年頃、Googleなどの実用的なWebサーチエン ジンが登場したことによって、大抵の検索質 問に対して、何らかのWebページを見つけるこ とができるという仕組みが広く利用されるよ うになった。これは現時点でも変わらず広く 利用されている。

 しかし、Web上の膨大な情報は十分に組織 されているとは言い難く、情報要求に適し ページを見つけることは必ずしも容易では い。

 近年、Web技術を活用することで、膨大な 識を多人数の共同作業によって、組織化し うとする取り組みが盛んに行われつつある その代表例としては、Wikipedia(http://ja.wikipedi a.org)や各種のフォークソノミーサービス(例 ばFlickr(http://flickr.com)など)が知られている。

 その結果、Web上に一種の情報探索用オン ロジーと呼べるものが形成されてきている これらのオントロジーには、多数の人々の 様な観点が反映されているという大きな利 があるが、限界もまたよく知られている。

 これらのオントロジーの構築に関わる人 の中心的な動機は、「自分の興味を満たす 報を効率的に探せるようにしたい」という のであるので、「情報の消費者」としての 点が大きく反映される。

 しかし、情報の生産者、言い換えれば「 れまであまり知られていない情報を探し出 、新たな知見を生み出したい」という知的 求心を持つ人々の観点は反映されにくい。 の理由は、そのような人々は彼らにとって 値の高い情報の資源の所在を秘密にしてお たいという動機が働く傾向にあるからであ 。

 結果として、Web上に存在するオントロジ は浅い組織化に留まる傾向にあり、探索を く掘り下げていくという用途には必ずしも してはいなかった。

 一方で、Webの世界での変革に対応して図 館の世界においても新たな潮流が見られる 例えば、図書館において情報探索の窓口の 割を果たしているレファレンスサービスで 、Wikipediaをレファレンスツールとして活用 ようとする試みがなされている(非特許文献 7)。しかし、現在はレファレンスサービス自 が一般的に浸透していないのが現状である( 非特許文献10)。

 また、特定のトピック毎に図書館が提供 きる関連資料をリスト化したパスファイン ーと呼ばれる情報資源をWeb上で公開する取 組みも活発に行われている(非特許文献11)。 しかし、このパスファインダーは図書館が人 手をかけて構築する必要があるため、Web上に 存在するオントロジーに比べてごく一部のト ピックをカバーしているに過ぎない。図書館 はまだWebの変革スピードに追いついてはいな いのが現状である。

 このように、Webによる情報探索と図書館 よる情報検索とはそれぞれ問題点を抱えて るのが実情である。

 そこで、本願発明者らは、解決策として 図書館の分類体系とWeb上で構築された各種 ントロジーを対応付け、情報検索の新しい ンフラとして活用する」ことを考えた。

 このようなことができるシステムを実現 ることによって、Webを出発点とした情報探 を図書館を利用した深い探索に誘導してい ことが可能となる。また、図書館の存在意 の再発見にも繋がると考えられる。

 本願発明者らは、具体的には、図書館の 類体系(ここでは、NDC、BSH)と、オントロジ としてのWikipedia(特にWikipediaのカテゴリ体系) を比較し、それをふまえて、B-2節で両者の比 較対応と情報探索への統合的活用法を提案し 、その有用性を説明する。

 また、後述する「発明を実施するための 良の形態」中の「第3 レファレンスナビゲ タ」では、異種オントロジーの統合ブラウ ングツールとしてのレファレンスナビゲー を説明する。

  B-3 図書館の分類体系とWikipediaの 較
 ここでは、情報検索ツールとしての図書館 分類体系とWikipediaとの比較を行い、それぞ の長所、短所を整理して説明する。

  B-3-2 図書館の分類体系
 一般的に図書館情報学分野の専門家によっ 管理されているものであり、例えば、日本 書館協会では、委員会を組織して日本十進 類法(NDC)や基本件名標目表(BSH)等の改訂作業 を行っている。現在は、NDC第9版(NDC9)、BSH第4 (BSH4)が最新版である。

 これらは、専門家による慎重な作業を介 てトップダウン的に構築されているので、 定的に利用すること可能であり、また、深 組織化がなされてるという長所がある。

 また、BSH、LCSH(米国議会図書館件名標目 )、NDLSH(国立国会図書館件名標目表」等の各 件名標目表が知られており、有用なツール ある。

 反面、改訂の周期が長く、新しい概念に 対応が困難な面がある。

 一般的に上位概念は一つしか持てないの 、概念の多様な側面を反映することは困難 場合がある。また、件名標目表は一般的に 子体で提供されているので、一般利用者か は利用が困難であるという問題がある。

  B-3-3 Wikipedia
 Wikipediaは、Web上でWikiシステムによって、共 同編集されているオンライン百科事典であり 、誰でもどこからでも自由に編集することが できるものである。

 多数の人が編集に参加していることから 世界中のほとんどの概念を網羅していると われており、また、ハイパーリンクを容易 張ることができるという特徴を持っている この特長を生かした項目の組織化の取り組 も行われている。

 膨大な項目から効率的に一覧を生成する めに「Wikipediaカテゴリ」と呼ばれるボトム ップ的な組織化の仕組みが導入されている この仕組みによって項目を多様な観点から 類することが可能となっている。この点は ォークソノミーに類似している。よって、W ikipediaカテゴリは、フォークソノミー型オン ロジーの一種としてとらえることができる

 例えば、「価格」という項目には「マー ティング」「経済学」「市場」のような複 のカテゴリを付与すうことができる。また カテゴリ自体も上位概念の(親の)カテゴリ 付与することができる。複数の親を持たせ ことができる点は従来の分類体系にはない きな特徴である。

 その反面、頻繁に編集が行われており、 系が安定していない、と言う問題点がある また、信頼性に欠ける情報も少なくない等 欠点も指摘されている。そこで、信頼性を 保するために種々の取り組みが行われてい が、対症療法的な取り組みに留まるとの指 も多い。また、上述したように、浅い組織 に留まっていることも多い。

  B-3-4 本発明で提案する手法・原
 情報探索ツールとして図書館の分類体系と Wikipediaを代表とするフォークソノミー型オ トロジーとには、それぞれ異なる利点、欠 が存在する。これが図1に示されている。

 図1に示されているように、アプローチと しては、図書館分類体系はトップダウン的で あるのに対して、フォークソノミー型オント ロジーは、ボトムアップ的である。また、長 所としては、図書館分類体系は「安定」して おり「深い組織化」が挙げられるが、フォー クソノミー型オントロジーは「多様な観点の 反映」「新しい概念への対応」性に富むとい う長所がある。また、短所としては、図書館 分類側が「多様な観点の反映」が困難である 点と、「新しい概念を含まない」点が挙げら れよう。フォークソノミー型オントロジー側 の欠点としては、「不安定」である点と、「 浅い組織化」が挙げられよう。

 また、親のカテゴリとしては、図書館分 側は「1」個しか持てないが、Wikipedia側は「 複数」の親のカテゴリを持つことができる。

 また、総カテゴリ数は、図書館分類側は11,1 84個であり、Wikipedia側は15,532個である。ここ 、図1の数値は、それぞれの分類体系の代表 例(図書館分類→BSH、フォークソノミー型オ トロジー→Wikipediaカテゴリ)であることに留 されたい。また、図書館分類側とWikipedia側 の間で共通するカテゴリ名は1,363個である(2 006年8月の時点で)。 
 このように両者には、様々な利点・欠点の 違があり、係る相違に基づいて情報探索の に、両者を適切に使い分けることが有用で る。

 本実施の形態では、両者の持つ共通部分 対応付けることによって、情報探索の出発 としてフォークソノミー型オントロジーを い、そこから概念を一般化することによっ 図書館の分類体系に導いていくという統合 活用法を提案するものである。

  B-3-5 活用の一例
 図2には情報探索の活用例を示す。まず、情 報探索の出発点としてのWikipediaの活用につい て説明する。ここで、Wikipediaの記事「阪神・ 淡路大震災」にはカテゴリとして「日本の経 済史」「地震の歴史」が付与されている。さ らに、カテゴリ「日本の経済史」には、上位 カテゴリとして「経済史」が付与されている 。また、カテゴリ「地震の歴史」には、上位 カテゴリとして「災害と防災の歴史」及び「 地震」が付与されている。このように、Wikipe diaの記事を一つ取り上げてみると、関連する カテゴリ群をツリー構造として取り出すこと ができることが理解されよう。

 このツリー構造を辿ることで、阪神・淡 大震災について調べる際の切り口が明確に っていくのである。

 例えば、「日本の経済史」→「経済史」 辿っていくと「阪神・淡路大震災が日本経 に与えた影響」について調べることができ ことが判明する。

 また一方、「地震の歴史」→「地震」と ることによって、「阪神・淡路大震災を引 起こした地震(すなわち1995年兵庫県南部地 )」について調べることが可能だと言うこと 判明する。

 結果として、「阪神・淡路大震災」とい 探索主題を「経済史」「災害」「地震」に 般化して調べることが可能となる。

  B-3-6 対応
 次に、Wikipediaカテゴリと図書館の分類体系( BSH、NDC)の対応と、図書館の分類体系の活用 ついて説明する。

 Wikipediaカテゴリと、図書館の分類体系の には、後述するようにカテゴリ名が一致す ものが存在する。上述した図2では、「経済 史」「災害」「地震」が一致している。この 一致を利用することによってWikipediaの活用に よって一般化された探索主題を図書館の分類 体系によって、より深く掘り下げることが可 能である。例えば、「経済史」→「経済史- 本」→「経済史-日本-平安時代」と辿ってい くと、NDC分類記号332.107によって「日本経済 典」(日本経済新聞社、1996年)等を探すこと できる。また、「地震」→「耐震建築」と っていくと、件名「耐震建築」によって「 震とマンション」(西澤英和他、筑摩書房、2 000年)などを探すことができる。

  B-3-7 提案する手法・原理の優れ いる点
 ここで述べた統合的活用のアプローチは、 下の理由によって、極めて有効であること 明らかである。

 理由1 : オーバーラップが存在すること
 図1の下方に示すように、図書館の分類区分 (BSH4)とWikipediaカテゴリの間には、カテゴリ名 が一致するものが多数存在する。Wikipediaの15, 532カテゴリに対して、1,363カテゴリが一致し いる。したがって、Wikipediaの項目から、図 館の情報資源に誘導できる可能性は大きい 考えられる。

 また、類似したカテゴリ名も対応付ける とができれば、さらにその可能性は大きく る。これは、図書館情報資源の有効活用に がることを意味する。

 理由2 : 広範な概念を網羅できること
 図書館の分類体系(特にBSH)の「項目数が少 く、新しい概念を網羅できていない」とい 欠点を、Wikipediaカテゴリとの対応によって うことが可能である。すなわち、Wikipediaに まれる膨大な数の項目を情報探索の出発点 することができるので、(潜在的には)世界中 のあらゆる概念に対応可能である。

 理由3 : 情報探索を収束させること 
 Wikipediaカテゴリはボトムアップ的に構築さ ているため、浅い組織化に留まっているこ も多い。これをそのまま情報探索に利用す と、いわゆるWebサーフィンと同様の結果と り、探索が発散してしまう恐れが大きい。 書館の分類 体系 と対応して利用することによって、情報探索 が収束し、深い探索につなげることが可能と なる。

  B-4 レファレンスナビゲータ
 本願発明者らは、上述した図書館の分類体 とWikipediaの統合的利用の最初の試みとして 異種オントロジーの統合ブラウジングツー 「レファレンスナビゲータ」を作成した。

 本ツールのインターフェース画面の一例 図3に示す。

 本ツールは、Wikipedia、NDC9、BSH4、のオン ロジー構造に加えて、Open Directory Project で 構築されたWebディレクトリ構造をリレーショ ナルデータベースに格納しており、統合的に 探索することが可能である。

 上部のテキストボックスに探索主題(Wikipe diaの項目名)を入力すると、その上位カテゴ 名等がハイパーリンクとして表示される。 こで、いずれかのカテゴリ名をクリックす と、さらにそのカテゴリの上位カテゴリ名 下位カテゴリ名などが表示される。同一の テゴリ名がWikipedia以外にも含まれる場合に 、それらの上位カテゴリ名、下位カテゴリ も共に表示される。利用者がクリックを繰 返していくことによって情報探索を深めて き、図書館の情報資源を探すための手がか を得ることができる。

 このレファレンスナビゲータは、後に詳 するように、特に以下の特徴を備えている

 (1)類似したカテゴリ名の対応
 現在の図書館の分類体系とWikipediaの対応は カテゴリ名が文字列レベルで完全に一致し ものに限られず、類似したものまで対応を っている。特に、本発明では、自然言語処 を活用して類似したカテゴリ名まで精度良 対応を行っている。例えば、図2の点線部分 で示した関係
「阪神・淡路大震災」 ←→ 「地震災害」
「日本の経済史」+「平成時代」 ←→ 「NDC3 32.107」
を対応付けることが可能である。

 (2)パスファインダーの自動生成
 上述したように、いくつかの図書館で構築 れているパスファインダーは情報探索にと て有用なツールであるが、人手で構築され いるため、網羅されている項目が著しく少 いという問題がある。そこで、Wikipediaの項 に対してNDC分類記号などを自動推定し、そ が付与されている参考図書等を蔵書目録(OPA C)から取得することによって、あらゆる概念 ついてのパスファインダーを自動生成する

 (3)自動レファレンスサービスシステムの実
 京都大学付属図書館レファレンスサービス ステム(非特許文献12)や、ダイアログナビ( 特許文献6)などの方法論を発展させて、対話 的に図書館利用者の情報検索を支援するシス テムを構築した。具体的には、上で述べた統 合オントロジーに加えて、情報検索に関する 様々なメタ知識(非特許文献13)を知識ベース して利用するシステムを構築した。

  C.先行特許文献・非特許文献  
 下記特許文献1には、分類番号の関連ファイ ルを利用した資料情報検索方式が記載されて いる。分類番号が階層構造を持つことに着目 し、検索キーを分類番号に置き換えると共に 、その上位・下位レベルも参照できると記載 されている。

 また、下記特許文献2には、RFIDを用いた 書保管管理システムが開示されている。RFID 用いることによって複数の書籍のデータを 括して読み取ることができるとされている

 また、下記特許文献3には、蔵書検索方法 ・蔵書検索システム等が開示されている。こ こに記載のシステムによれば、多様な条件で 検索を行えるとされている。

特開平8-314956号公報

特開平10-273208号公報

特開2007-102487号公報 井上真琴:図書館に訊け!、ちくま新書(200 4) 福田求:デジタルレファレンスサービス おけるコミュニケーション技術に関する考 、情報科学研究、No.20、PP.29-40(2002) 小田充宏:デジタルレファレンスサービ の現在、情報の科学と技術、Vol.56、PP.84-89(20 06) 文部科学省 科学技術・学術審議会 学 分科会 研究環境基盤部会 学術情報基盤作 部会:学術情報基盤の今後の在り方について (報告)(2006) 平田大志、日笠亘、藤井綱貴、黒橋禎夫 :図書館の自動レファレンス・サービス・シ テムの構築、言語処理学会第6回年次大会発 論文集(2000) 清田陽司、黒橋禎夫、水戸冬子:大規模 キスト知識ベースに基づく自動質問応答-ダ アログナビ-、自然言語処理、Vol.10、No.4、PP .145-175(2003) 兼宗進:デジタル・レファレンス・ツー としてのWikipedia、情報の化学と技術、Vol.56 PP.103-107(2006) もり・きよし、日本図書館協会分類委員 会(編)、日本十進分類法 新訂9版、日本図書 協会、1995 日本図書館協会件名標目委員会(編)、基 件名標目表(BSH)第4版、日本図書館協会、1999 斉藤文男、図書館利用者にとってのレフ ァレンス・サービス、東京都図書館協会報、 No.81、2001 Laura B.Cohen and Julie M.Still. A comparison o f research university and two-year college library we b sites: content, functionality, and form,. College a nd research libraries, Vol. 60, No.3, pp.275-289, 199 9. 黒橋禎夫、日笠亘、京都大学附属図書館 における自動レファレンス・サービス・シス テム、情報管理、Vol.47、No.1、pp.184-189、2001 長澤雅男、情報と文献の探索、第3版、 善株式会社、1994 國安結、清田陽司、綾部輝幸、東京大学 附属図書館におけるレファレンスサービス業 務分析-自動レファレンスサービスシステム 実現を目指して-日本図書館情報学会第54回 究大会発表要綱、pp.101-104、2006

 そこで、本願発明者らは、図書館員が行 ているレファレンス応答を自動で行うこと できるシステムの実現に向けて鋭意研究を い、具体的にレファレンスサービスシステ を構築するに至った。

 以上述べてきたように、本発明の目的は 図書館の分類体系とWikipediaカテゴリという 質の異なるオントロジーを統合的に活用す ことによって、対話的な情報検索システム 実現することである。

 本発明は、基本的な考え方として、図書 の分類体系とWikipediaカテゴリという性質の なるオントロジーを統合的に活用すること 新たな情報検索のインフラを実現したもの ある。

 これによって、Webを手がかりとした図書 の利用によって探索を深めていくという新 い情報探索のパラダイムが世の中に広める とができ、その結果、社会全体のリテラシ の向上に寄与し、図書館の存在意義の再発 、ひいては電子図書館の実現にも資するも である。

 本発明は、具体的には、以下の構成を採 する。

 (1)本発明は、上記課題を解決するために 利用者からの検索要求に基づき、情報検索 行う情報検索システムにおいて、前記検索 求に基づきフォークソノミー型オントロジ を検索する第1の検索手段と、前記検索によ って得られた各概念に対して、対応付けられ た概念を図書館オントロジー中から取り出す 抽出手段と、前記抽出手段が取り出した概念 を用いて、前記図書館オントロジーを検索す る第2の検索手段と、を含むことを特徴とす 情報検索システムである。

 (2)また、本発明は、(1)記載の情報検索シ テムにおいて、少なくとも、前記第1の検索 手段が検索した結果と前記第2の検索手段が 索した結果とを有する情報検索のための手 かりとなるパスファインダーを作成するパ ファインダー作成手段と、を含むことを特 とする情報検索システムである。

 (3)また、本発明は、(2)記載の情報検索シ テムにおいて、前記パスファインダー作成 段は、前記第2の検索手段が検索した結果と ともに、検索要求中のキーワードから前記第 2の検索手段が検索した概念に至るまでの経 を含む前記パスファインダーを作成するこ を特徴とする情報検索システムである。

 (4)また、本発明は、(1)又は(2)記載の情報 索システムにおいて、前記抽出手段は、フ ークソノミー型オントロジー中から得られ 前記各概念に対して、前記検索要求中のキ ワードとの距離・類似度を表す重みを付与 る重み付け手段と、前記各概念に対して付 された重みに基づき、前記図書館オントロ ー中の概念に対して、その概念と対応付け れているフォークソノミー型オントロジー の概念の中で最も大きな重み付けがなされ いるその重みを、導出スコアとして付与す 導出スコア算出手段と、前記求めた導出ス アの値によって、値の大きな上位の予め定 られた個数の概念のみを取り出す上位抽出 段と、を含むことを特徴とする情報検索シ テムである。

 (5)本発明は、上記課題を解決するために 利用者からの検索要求に基づき、情報検索 行う情報検索方法において、前記検索要求 基づきフォークソノミー型オントロジーを 索する第1の検索ステップと、前記検索によ って得られた各概念に対して、対応付けられ た概念を図書館オントロジー中から取り出す 抽出ステップと、前記抽出ステップにおいて 取り出した概念を用いて、前記図書館オント ロジーを検索する第2の検索ステップと、を むことを特徴とする情報検索方法である。

 (6)また、本発明は、(5)記載の情報検索方 において、少なくとも、前記第1の検索ステ ップで検索した結果と前記第2の検索ステッ で検索した結果とを有する情報検索のため 手がかりとなるパスファインダーを作成す パスファインダー作成ステップ、を含むこ を特徴とする情報検索方法である。

 (7)また、本発明は、(6)記載の情報検索方 において、前記パスファインダー作成ステ プにおいては、前記第2の検索ステップにお いて検索した結果とともに、図書館オントロ ジー中のキーワードから前記第2の検索ステ プにおいて検索した概念に至るまでの経路 含む前記パスファインダーを作成すること 特徴とする情報検索方法である。

 (8)また、本発明は、(5)又は(6)記載の情報 索方法において、前記抽出ステップは、フ ークソノミー型オントロジー中から得られ 前記各概念に対して、前記検索要求中のキ ワードとの距離・類似度を表す重みを付与 る重み付けステップと、前記各概念に対し 付与された重みに基づき、前記図書館オン ロジー中の概念に対して、その概念と対応 けられているフォークソノミー型オントロ ー中の概念の中で最も大きな重み付けがな れているその重みを、導出スコアとして付 する導出スコア算出ステップと、前記求め 導出スコアの値によって、値の大きな上位 予め定められた個数の概念のみを取り出す 位抽出ステップと、を含むことを特徴とす 情報検索方法である。

 (9)また、本発明は、上記課題を解決する めに、コンピュータを、利用者からの検索 求に基づき、情報検索を行う情報検索シス ムとして動作させるプログラムにおいて、 記検索要求に基づきフォークソノミー型オ トロジーを検索する第1の検索手順と、前記 検索によって得られた各概念に対して、対応 付けられた概念を図書館オントロジー中から 取り出す抽出手順と、前記抽出手段が取り出 した概念を用いて、前記図書館オントロジー を検索する第2の検索手順と、を、前記コン ュータに実行させることを特徴とするプロ ラムである。

 (10)また、本発明は、(9)記載記載のプログ ラムにおいて、前記抽出手順は、フォークソ ノミー型オントロジー中から得られた前記各 概念に対して、前記検索要求中のキーワード との距離・類似度を表す重みを付与する重み 付け手順と、前記各概念に対して付与された 前記重みに基づき、前記図書館オントロジー 中の概念に対して、その概念と対応付けられ ているフォークソノミー型オントロジー中の 概念の中で最も大きな重み付けがなされてい るその重みを、導出スコアとして付与する導 出スコア算出手順と、前記求めた導出スコア の値によって、値の大きな上位の予め定めら れた個数の概念のみを取り出す上位抽出手順 と、を含むことを特徴とするプログラムであ る。

 (11)また、本発明は、上記課題を解決する ために、利用者からの検索要求に基づき、情 報検索を行ってその結果を前記利用者に提供 する情報検索サービス提供方法において、前 記検索要求に基づきフォークソノミー型オン トロジーを検索する第1の検索ステップと、 記検索によって得られた各概念に対して、 応付けられた概念を図書館オントロジー中 ら取り出す抽出ステップと、前記抽出ステ プにおいて取り出した概念を用いて、前記 書館オントロジーを検索する第2の検索ステ プと、少なくとも、前記第1の検索ステップ で検索した結果と前記第2の検索ステップで 索した結果とを有する情報検索のための手 かりとなるパスファインダーを作成するパ ファインダー作成ステップと、前記作成し パスファインダーを前記利用者に提供する スファインダー提供ステップと、を含むこ を特徴とする情報検索サービス提供方法で る。

 (12)また、本発明は、上記(11)記載の情報 索サービス提供方法において、前記パスフ インダー作成ステップにおいては、前記第2 検索ステップにおいて検索した結果ととも 、図書館オントロジー中のキーワードから 記第2の検索ステップにおいて検索した概念 に至るまでの経路を含む前記パスファインダ ーを作成することを特徴とする情報検索サー ビス提供方法である。

 (13)また、本発明は、(11)又は(12)記載の情 検索サービス提供方法において、前記抽出 テップは、フォークソノミー型オントロジ 中から得られた前記各概念に対して、前記 索要求中のキーワードとの距離・類似度を す重みを付与する重み付けステップと、前 各概念に対して付与された重みに基づき、 記図書館オントロジー中の概念に対して、 の概念と対応付けられているフォークソノ ー型オントロジー中の概念の中で最も大き 重み付けがなされているその重みを、導出 コアとして付与する導出スコア算出ステッ と、前記求めた導出スコアの値によって、 の大きな上位の予め定められた個数の概念 みを取り出す上位抽出ステップと、を含む とを特徴とする情報検索サービス提供方法 ある。

 なお、本件発明において、後述する実施 形態においてWikipediaオントロジーを主に説 しているが、これはフォークソノミー型オ トロジーの好ましい一例に相当する。

 (14)また、本発明は、上記(1)~(4)のいずれ 1項に記載の情報検索システムにおいて、前 図書館オントロジーに代えて、ピラミッド オントロジーを用いたことを特徴とする情 検索システムである。

 (15)また、本発明は、上記(5)~(8)のいずれ 1項に記載の情報検索方法において、前記図 館オントロジーに代えて、ピラミッド型オ トロジーを用いたことを特徴とする情報検 方法である。

 (16)また、本発明は、上記(9)又は(10)に記 のプログラムにおいて、前記図書館オント ジーに代えて、ピラミッド型オントロジー 用いたことを特徴とするプログラムである

 (17)また、本発明は、上記(11)~(13)のいずれ か1項に記載のサービス提供方法において、 記図書館オントロジーに代えて、ピラミッ 型オントロジーを用いたことを特徴とする ービス提供方法である。

 このように、本件発明においては、後述 る実施の形態では図書館オントロジーを主 して説明しているが、一般的なピラミッド オントロジーでもかまわない。

 以上述べたように、本発明によれば、対 的な操作によって情報検索が可能なシステ を提供することが可能である。

 特に、本発明においては、2つの性質の異 なるオントロジーを組み合わせることによっ てより精度の高い、使いやすい情報検索シス テムを提供することが可能である。

情報探索ツールとして図書館の分類体 と、Wikipediaとを比較した表である。 本発明で採用する図書館オントロジー Wikipediaオントロジーを統合した場合の情報 索の活用例の概念図である。 本願発明者らが開発したレファレンス ビゲータの画面の一例である。 図書館オントロジー、Webオントロジー Wikipediaオントロジーの関係を示す概念図で る。 阪神・淡路大震災というキーワードか 出発して、種々の概念(カテゴリ)に到達す ことができる。その様子を示す概念図であ 。 本実施の形態に係る情報検索システム( レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム( レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム( レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム( レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム (レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム (レファレンスナビゲータ)の構成図である。 本実施の形態に係る情報検索システム (レファレンスナビゲータ)の構成図であり、 にユーザ端末の構成図である。 本実施の形態に係る情報検索動作及び パスファインダーの作成動作を表すフローチ ャートである。 本実施の形態に係る情報検索動作及び パスファインダーの作成動作を表すフローチ ャートである。 マウスで所定のキーワードをクリック した場合の情報検索動作及びそれに伴うパス ファインダーの作成動作を表すフローチャー トである。

符号の説明

 10 ユーザ端末
 12 キーボード
 14 マウス
 16 インターネット
 18 HTTPサーバ
 20 Webアプリケーションエンジン
 22 記憶装置
 24 関数呼び出し処理エンジン
 26 連想検索モジュール
 28 セッション管理モジュール
 30 利用者認証DB
 32 ログDB
 34 パスファインダー生成モジュール
 36 パスファインダー生成制御ファイル
 38 質問文解析モジュールA
 40 解析ルール集
 42 自然文解析エンジン
 44 質問文解析モジュールB
 46 質問文解析モジュールC
 48 文字列検索モジュール
 50 外部リンク生成モジュール
 52 外部リンク制御ファイル
 54 検索エンジン(1)
 56 Aインデックス
 58 Bインデックス
 60 検索エンジン(1)インデクサ
 62 検索エンジン(2)
 64 検索エンジン(2)インデクサ
 66 Aインデックス
 68 Bインデックス
 70 オントロジーAインデックス
 72 オントロジーBインデックス
 74 オントロジー処理モジュール
 76 上位概念自動導出モジュール
 78 キーワード比較エンジン
 80 同義語辞典
 90 中央制御モジュール
 92 Webドキュメント
 94 スクリプトコード
 96 マウス選択処理モジュール
 98 キー入力処理モジュール
 100 履歴管理モジュール
 102 履歴保存領域
 104 パスファインダー描画エンジン
 106 履歴描画エンジン
 108 連想検索描画エンジン

 以下、図面を用いて、発明の実施の形態 説明する。

  第1 はじめに
 本実施の形態では、図書館分類とWikipediaと う2種のオントロジーを統合させた新しい情 報探索システム・情報探索手法を提案する。

 そこで、まず、本実施の形態の背景とな 図書館分類とWebオントロジー(Wikipediaを含む )とを簡単に説明する。

  1-1 書架分類法(classification)
 NDC(日本十進分類法)は日本で最も普及して る図書館資料の書架分類法である。一つの 料に一つのNDCコードが付与される。書架分 法としては、他にも種々知られている。例 ば
 DDC(デューイ十進分類法)
 UDC(国際十進分類法)
 NDLC(国立国会図書館分類法)
 LLC(米国議会図書館分類表)
が知られている。

  1-2 件名標目表(Subject Headngs)
 BSH(基本件名標目表)は、図書館資料の統制 ーワードであり、一つの資料に複数の件名 付与される。また、NDCとの対応がなされて る。件名標目表としては、他にも種々知ら ている。例えば、
 LCSH(米国議会図書館件名標目表)
 NDLSH(国立国会図書館件名標目票)
が知られている。

  1-3 フォークソノミー
 2005年頃から普及し始めたWebサービスであり 、Flickr、del.icio.us、Youtubeなどが有名である。

 フォークソノミーは、個々の利用者が自 の視点でコンテンツにタグを付与できるの 特徴である。システム全体としてみれば多 なタグが個々のコンテンツに付与されてい 状態となる。

  1-4 Wikipedia
 インターネット上で共同編集されている多 語百科事典である。各記事にはカテゴリが グとして付与されている。したがって、フ ークソノミーの特徴をも包含する。また、 テゴリにもさらにカテゴリのタグを付与で る。したがって、緩やかな階層構造を取る とも可能である。また、複数の上位概念を 与することができる。したがって、多重承 が可能である。

 特に、図書館オントロジーとWikipediaとの 較を行った表が図1に示されており、既に説 明した通りである。

  第2 アプローチ
 本願発明者らは、図書館オントロジーをWiki pediaで拡張することが有効であろうと考えた

 それは、Wikipediaは、Webの汎用的な情報資 としては最も組織化されている(Wikipediaカテ ゴリと呼ばれるカテゴリが存在する)ので、 書館オントロジーとの親和性がある程度は いと考えられたからである。さらに、Wikipedi aは、Web上の他の情報資源との親和性を持っ いるからである。

 また、図書館オントロジー(書架分類法、 件名標目表)は、人類がこれまで長い期間営 と積み重ねてきた知識体系であり、価値判 に必要な情報資源への有力なポインタとな うるものである。

 これらの関係を表す概念図が図4に示され ている。この図に示すように、情報探索のス タート地点としてはWebオントロジーは優れて いるが、より深い専門性、信頼性を獲得する にはWebオントロジーだけでは困難である。図 書館オントロジーは、情報探索のスタート地 点としての適性は低いものの、図4に示すよ に、より深い情報の専門性、信頼性を得よ とする場合は非常に高い適応性を有してい 。また、Wikipediaは、Webオントロジーではあ ものの、ある程度の階層性、組織性を有し いるので、図書館オントロジーとの親和性 高いと言えよう。この結果、Wikipediaにおけ 情報探索から図書館オントロジーへの移行 円滑に行えば、より使いやすい情報検索シ テムが達成できると考えられる。

 このような移行は、両者に共通するカテ リ名を用いて行うことができる。このよう 共通するカテゴリの例は、阪神・淡路大震 の例が図2に示されている。

 この図2のように、阪神・淡路大震災から 、種々の概念(カテゴリ)に到達することがで る。その結果を示す図が図5に示されている 。

 図5に示すように、Wikipediaにおいて、「日 本の経済史」に到達することによって、震災 が日本経済に与えた影響を知ることができる 。また、「災害と防災の歴史」から震災がそ の後の防災対策に与えた影響を知ることがで きる。さらに、「地震」から震災を起こした 地震(1995年兵庫県南部地震)を知ることができ る。

 一方、図書館オントロジーへ移行するこ によって、図5に示すように、「経済史-日 -平成時代(332.107)」から「経済学事典(日本経 済新聞社、1996年)の存在を知ることができる また、「地震災害」という項目から、「地 防災の辞典(岡田恒男ほか、2000年」を知る とができる。また、「地震史(453.2)」から、 日本被害地震総覧(宇佐見龍夫、2003年)を読 ことが可能である。

  第3 レファレンスナビゲータ
 以上述べたように、図書館オントロジーとW ikipediaとを統合することによってより使いや く、且つより深い専門性の高い情報を探索 能な情報探索システムが実現できると考え れる。この考えに基づき、本願発明者らは レファレンスナビゲータと呼ばれるシステ を開発し、一定の成果を上げることができ 。以下、このレファレンスナビゲータにつ て説明する。

  3-1 類似について
 本レファレンスナビゲータは、Wikipediaと図 館オントロジーとの間で概念の対応を行っ いるが、その対応は、概念を表すキーワー の文字列が一致する場合だけでなく、文字 の間に一定の類似度がある場合も含めて対 を行っている。

 類似度は、いわゆる単語n-gramや、文字n-gr amとよばれるモデルによって計算している。 こで、nは自然数であり、単語2-gram、単語3-g ram、単語4-gram等を意味する。単語n-gramは、簡 単に言えば、一定のフレーズを単語に分けて 、その単語がn個連続して一致していた場合 類似と判断する手法であり、nは上述したよ に自然数である。

 また、文字n-gramは、簡単に言えば、一定 フレーズをn文字毎に分けて、そのうちいず れかが一致するような他のフレーズがあれば 、それを類似と判断する手法である。例えば 、「地震の歴史」に対して文字2-gramを適用す ると、「地震」「震の」「の歴」「歴史」と いう4個の2文字群が得られる。この文字群と ずれかが一致するような他のフレーズがあ ば、そのフレーズを類似と判断するのであ 。

 さらに、本実施の形態のレファレンスナ ゲータでは、いわゆるシソーラスによって 義語を探索し、その類義語も類似すると判 している。

  3-2 上位概念の導出
 上位概念の説明のため、記法を若干説明す 。

 探索対象である入力キーワードを、K0と す。例えば、図2では、「阪神・淡路大震災 がK0である。Wikipediaでは、このK0から上位に あるカテゴリを見つけることができる。上述 したように、Wikipediaでは上位概念を複数個持 てるので、一般に複数個の上位概念が見つか る。これら、直接見つかったn個の上位概念 1次の上位概念と呼び、それぞれK11、・・・K 1nで表す。

 すなわち、本実施の形態では、概念(カテ ゴリ名)をKabと表し、このaは探索対象からの さを表すレベル、次数であり、bはシリアル 番号(すなわち、そのレベルに存在する概念 通し番号を付したもの)である。

 さて、K0である「阪神・淡路大震災」に対 て、1次の上位概念は、
 K11「地震の歴史」
 K12「日本の経済史」
 K13「平成時代」
の3個である(図2参照)。

 さらに、K11「地震の歴史」のさらに上位概 を求める(つまりK0から見れば第2レベル(2次) となる)と、
 K21「地震」
 K22「災害と防災の歴史」
の2個である。なお、第2レベルの上位概念は 他の(第1レベルの)概念を経由して辿る場合 あり、例えば、K23「経済史」が図2に示され ている。また、図2には、3次の上位概念であ K31「災害」も記されている。

  3-3 対応
 このように上位概念を辿った場合には、図2 に示すように、K21「地震」と完全一致の概念 「地震(453)」がNDC、BSH中に存在することが見 けられる。また、K31「災害」に完全一致す 概念がNDC、BSH中に存在することが見つけら る。同様に、K23「経済史」と完全一致する 念「経済史(332)」がNDC、BSH中に存在するこ が見つけられる(図2参照)。

 一方、シソーラスを用いることによって K0「阪神・淡路大震災」の類似概念として 地震災害」がNDC、BSH中に見つけられる。ま 、n-gramの手法を用いて、K12「日本の経済史 及びK13「平成時代」などと類似する概念と て「経済史-日本-平成時代(332、107))が見つけ られる。

  3-4 重み
 本実施の形態において特徴的なことは、各 念に対して重みによるスコアを計算し、係 スコアによって表示順を決定等しているこ である。

 ある概念Kmn(mレベルのn番目の概念)の重み をW(Kmn)で表すと、W(Kmn)は、以下の式で表され る。


  W(Kmn) = S(Kmn、C(Kmn))×W(C(Kmn))

 但し、1<m<t の範囲で計算する。ここで tはしきい値である。これは計算対象となる ベルの深さを一定の値に制限したものであ 。なお、Kmnは、ノードとも呼ばれる。

 また、W(K0) = 1.0 である。これは、探索 象である概念K0の重みは「1」であるとした のである。

 また、上式で S()は、類似度であり、C(Kmn )は、Kmnの下位概念のうち、Kmnを導いたもの 表す。例えば、K23=「経済史」に対して、C(K2 3)=K12=「日本の経済史」となる。

 つまり、上式は、
 その概念の重み = その概念の下位概念と 類似度 × その下位概念の重み
という意味をなしている。

 記号をまとめてみよう。

 Kmnは、レベルmのn番目の概念(ノード)である 。 
 C(K)は、概念(ノード)Kの下位概念(ノード)で る。 
 S(K1、K2)は、概念K1と概念K2との類似度であ 。 
 W(K)は、概念(ノード)Kへの重みである。 
  3-5 類似度
 類似度S(K1、K2)は、下記の式で計算される。 概念K1とK2との類似度は、

 この数式中、αは伝搬パラメータであり、 えば0.8等の定数である。

 また、TK1、TK2は、概念K1とK2のn-gramの総数 である。

 例えば、n=2(すなわち 2-gram)、K1が「地震」 K2が「地震の歴史」の場合は、
 TK1 = 1 「地震」の1個であるので「1」
 TK2 = 4 「地震」「震の」「の歴」「歴史 の4個であるので「4」
となる。

 また、TKCは、共通n-gram数である。例えば上 挙げた例の場合は、
 TKC = 1 (共通する概念は「地震」の1個であ る)
となる。

 したがって、K1が「地震」、K2が「地震の歴 史」の場合は、

と計算され、類似度は0.6と計算される。

 さて、この類似度Sは、基本的には0~1の間 の数を取る。0の場合は似てないことを意味 、1は似ていることを意味する。但し、αの が1より小さい場合は、0~1ではなく、例えば0 .2~1.0の範囲の数を取る(αが0.8の場合)。

 記法をまとめてみよう。 
 αは伝搬パラメータである。 
 TKは、概念(ノード)Kのn-gramの総数である。 
 TKCは、共通するn-gramの数である。

  3-6 導出スコア
 フォークソノミー型オントロジー、すなわ Wikipediaの各概念に対して以上のように重み けをした後、それに基づいて図書館オント ジーの各概念Niに対して導出スコアI(Ni)を計 算する。

 図2で示す例によれば、Wikipediaにおいて第 3レベルまで重みを計算した場合、「地震」 災害」「経済史」などが完全一致する概念 して、図書館オントロジー側から見つけ出 れる。

 したがって、これら「地震」「災害」「 済史」について導出スコアIを算出する。も ちろん、導出スコアは、完全一致する概念だ けでなく類似概念に関しても導出スコアIが められる。導出スコアI(Ni)は、以下のように して算出する。


 ここで、Niは、図書館オントロジー中の概 (「地震」「災害」「経済史」等)である。

 そして、X(Ni)は、その図書館オントロジ 中の概念に対応付けられているWikipedia中の 念の集合である。例えば、「地震(453)」に対 応付けられているWikipediaの概念は1個である は限らず、一般的に複数個存在する。これ を集合としたものである。

 このWikipedia中の概念は、請求の範囲のフ ークソノミー型オントロジー中の概念の好 な一例に相当する。

 例えば、図2の例では、「経済史-日本-平 時代(332.108)」には「日本の経済史」と「平 時代」との2個の概念が対応付けられている 。したがって、X(「経済史-日本-平成時代(332. 108)」) = {「日本の経済史」、「平成時代」} という集合となる。

 上記式により求められる導出スコアは、 の集合中、最も重みの大きな概念のその重 の値である。

 また、記法をまとめてみよう。

 N又はNiは、図書館オントロジー中の概念( ノード)である。また、X(Ni)は、概念Niに対応 けられているWikipedia中の概念(ノード)であ 。

 このWikipediaは、請求の範囲におけるフォ クソノミー型オントロジーの好適な一例に 当する。

  3-7 選定
 本実施の形態において特徴的なことは、こ I(Ni)の値が大きい順に上位J個のN(図書館オ トロジーのエントリ(概念))を選定し、情報 索の結果として出力することである。Jは所 の個数であり、自然数である。

 特に本実施の形態のレファレンスナビゲ タでは、J個のエントリのそれぞれについて 、K0からの導出パス、及び導出スコアを合わ て出力する。

 例えば、
 エントリ      パス            導 スコア
 地震(453) ← 地震の歴史        :0.0906
 経済(330) ← 経済史 ← 日本の経済史 :0.0 607
 災害(369.3) ← 災害 
           ← 災害と防災の歴史 
           ← 地震の歴史      :0.036 2
 のように表示する。

 このように、導出スコアだけでなく、パ も出力すれば利用者はどのようなつながり その概念が出力されたか知ることができ、 便性に富む情報探索システムを構築するこ ができる。

  第4 レファレンスナビゲータの構 成
 次に、本実施の形態に係る情報探索システ であるレファレンスナビゲータの構成につ て説明する。

 本情報検索システム(レファレンスナビゲ ータ)の構成図が図6~図12に示されている。利 者は図12に示す構成の端末装置から通信回 (インターネット)を介してこのシステムを利 用する。

 まず、図6に示すように、ユーザ端末10上 はPCブラウザが搭載されており、このブラ ザを介して、利用者は本システムにアクセ し情報探索を行う。

 ユーザ端末10には、キーボード12やマウス 14等が接続されており、利用者はこれらを通 てユーザ端末10を操作する。ユーザ端末10は 典型的にはパーソナルコンピュータで構成す ることが好ましいが、PDAや携帯通信端末を用 いることも好ましい。

 ユーザ端末10はインターネット16を介して 本システムのHTTPサーバ18と接続する。HTTPサ バ18は、Webアプリケーションエンジン20によ て制御されている。

 本システムの基本的な動作を記述してい のがこのWebアプリケーションエンジン20で る。本願発明者らはこれを、Java(登録商標) 語によって記述したが、もちろん他の言語 も良い。このWebアプリケーションエンジン20 には図6に示すように、情報探索サービスの 供に用いるWebドキュメントのデータ(インタ フェース画面の定義等)や、スクリプトコー ド(JavaScript等)を記録した記憶装置22が備えら ている。記憶装置22は、ハードディスクや 導体記憶装置、各種光ディスク等が使用可 である。

 Webアプリケーションエンジン20は関数呼 出し処理エンジン24を利用して情報探索を行 う。この関数呼び出し処理エンジン24はXML RP Cプロトコルで実装されているが、他のプロ コルでも良い。この関数呼び出し処理エン ン24は連想検索モジュール26を用いて連想検 を行っている。連想検索モジュール26は、 ッション管理モジュール28と連携し、連想検 索を行う。

 さて、セッション管理モジュール28はユ ザ端末10とのセッションを管理しており、そ のために利用者認証DB30及び検索のログを取 ためのログDB32を備えている。

 関数呼び出し処理エンジン24及びセッシ ン管理モジュール28は、パスファインダー生 成モジュール34がパスファインダーを生成す のに必要な情報を提供する。

 パスファインダー生成モジュール34は、 数呼び出し処理エンジン24及びセッション管 理モジュール28などからの指示に基づき、パ ファインダーを生成する。パスファインダ 生成モジュール34は、パスファインダー生 制御ファイル36を備えており、この制御ファ イルの内容に基づきパスファインダーを生成 する。

 パスファインダー生成モジュール34には にも種々のモジュールが接続されており、 調作業を実行している。

 図7には、パスファインダー生成モジュー ル34に接続する他のモジュールが描かれてい 。

 まず、質問文解析モジュールA38は、利用 からの質問を解析する。その際の解析ルー の正規表現が解析ルール集40に格納されて る。また、自然文解析エンジン42が備えられ ており、自然文で記述された質問文の形態素 解析や構文解析を行う。

 このような質問文解析モジュールは複数 存在し、図7には、質問文解析モジュールA38 の他に、質問文解析モジュールB44、質問文解 析モジュールC46も示されている。

 図8にも、パスファインダー生成モジュー ル34に接続する他のモジュールが描かれてい 。文字列検索モジュール48は、検索対象で る所定の文字列を検索するモジュールであ 。外部リンク生成モジュール50は、所定の文 字列等に対してリンクを埋め込むための外部 リンクを生成するモジュールであり、後述す るパスファインダーの画面上に、このリンク が設けられる。また、この外部リンクモジュ ール生成モジュール50には、外部をリンクす 際に用いる制御ファイルの記憶手段52が設 られている。

 図9には、図8の文字列検索モジュール48と 共に検索動作を担う手段が種々示されている 。文字列検索モジュール48には検索エンジン( 1)54が設けられており、実際の検索動作を実 する。この検索エンジン(1)54は、Aインデッ ス56と、Bインデックス58と、を検索する。A ンデックス56は、検索エンジン(1)54用の検索 ンジン(1)インデクサ60によってオントロジ Aのデータベースから作成されたものである 同様に、Bインデックス58も、検索エンジン( 1)54用の検索エンジン(1)インデクサ60によって 、オントロジーBのデータベースから作成さ たものである。

 文字列検索モジュール48には、複数の検 エンジンを設けることができる。図9におい は、検索エンジン(2)62が示されている。こ 検索エンジン(2)60にも検索エンジン(2)インデ クサ64が備えられており、オントロジーAのデ ータベースからAインデックス66を作成し、オ ントロジーBのデータベースからBインデック 68を作成する。そして、検索エンジン(2)62は 、Aインデックス66とBインデックス68とを検索 する。

 ここで、オントロジーAは、Wikipediaオント ロジーを表す。また、オントロジーBは図書 オントロジーを表す。

 図10には、上で述べたデータベースの詳 が記されている。検索エンジン(1)インデク 60は、オントロジーAデータベース70と、オン トロジーBデータベース72と、に基づき上述し たようにAインデックス56とBインデックス58と を作成する。同様に、検索エンジン(2)インデ クサ64は、オントロジーAデータベース66と、 ントロジーBデータベース68と、に基づき上 したようにAインデックス66とBインデックス 68とを作成する。

 オントロジーAデータベース70は、Wikipedia ントロジーのデータベースであり、図10に すように、IDとキーワードのリストであるキ ーワードリストを備えている。また、オント ロジーAデータベース70は、各キーワードに対 して上位の概念のIDと、下位の概念のIDとを えた上位下位テーブルを備えている。この 位下位テーブルには、例えば「東京大学」 上位概念として「3」が示されている。このI D3のキーワードは「国立大学」である。すな ち、「国立大学」が「東京大学」の上位概 である。

 また、「国立大学」の上位概念として「4 」が示されている。このID4のキーワードは「 東京都」である。すなわち、「東京都」が「 国立大学」の上位概念である。また、「国立 大学」の下位概念として「1」が示されてい 。このID1のキーワードは「東京大学」であ 。すなわち、「東京大学」が「国立大学」 下位概念である。

 さらに、オントロジーAデータベース70に 、各キーワードに対して同義語の概念のID 示した同義語テーブルを備えている。例え 、「東京大学」の同義語としてID5が示され いる。ID5のキーワードは「東大」である。 なわち、「東京大学」の同義語が「東大」 ある。

 以上のような各種テーブルからオントロ ーAデータベース70が構成されている。また オントロジーBデータベース72は、図書館オ トロジーのデータベースである点がオント ジーAデータベース70と異なるが、その他の 成はほぼ同様である。

 すなわち、オントロジーBデータベース72 、オントロジーAデータベース70と同様にキ ワードリスト、上位下位テーブル、同義語 ーブル等を備えている。

 図11には、パスファインダー生成モジュ ル34にと、上記オントロジーAデータベース70 やオントロジーBデータベース72に関連するモ ジュールが示されている。

 まず、オントロジー処理モジュール74は パスファインダー生成モジュール34からの指 示に従ってオントロジーAデータベース70・オ ントロジーBデータベース72に対するオントロ ジー処理を実行する。その際、上位概念自動 導出モジュール76はパスファインダー生成モ ュールからの指示に従い上位概念を導出し オントロジー処理モジュール74に供給する 上位概念導出モジュール76はキーワード比較 エンジン78を用いて上位概念を導出する。キ ワード比較エンジン78は、同義語辞書80を有 しており、キーワードの比較として、既に述 べたn-gramによる比較だけでなく、同義語かど うかを加味した比較も行う。

  第5 ユーザ端末の構成
 図12には、ユーザ端末10の構成ブロック図が 示されている。

 まず、中央制御モジュール90が、インタ ネット16を介してHTTPサーバ18との通信を行っ ている。中央制御モジュール90は、Webドキュ ントを取得しその表示を行う。同時にスク プトコード94の取得を行いそれを実行する

 中央制御モジュール90はマウス選択処理 ジュール96をコントロールし、利用者のマウ ス動作(例えばキーワードの選択動作など)を 視・入力し、所定の処理を実行する。また 中央制御モジュール90はキー入力処理モジ ール98をコントロールし、利用者のキー入力 (キーワード「ハンバーガー」の入力など)を 視・入力し、所定の処理を実行する。

 また、中央制御モジュール90は、履歴管 モジュール100を備えており、情報検索の結 の履歴を保存している。

 本実施の形態において特徴的なことは、 の履歴を利用者の選択に応じて適宜画面に 示できることである。これによって、利用 は過去の情報探索の結果を利用することが 易である。この履歴管理モジュール100は、 歴を保存するための履歴保存領域102を備え いる。

 履歴管理モジュール100は、情報探索の履 を用いてパスファインダーを作成する。パ ファインダーは種々の検索の結果として表 てくるので、その履歴を表示することによ て、パスファインダーが作成される。実際 パスファインダーの画面への描画はパスフ インダー描画エンジン104が実行する(図12参 )。図12には、ユーザ端末10の構成ブロック だけでなく、端末のディスプレイに表示さ る画面の様子の概要が模式的に示されてい 。このように、パスファインダーは、画面 の一区画(ペインと呼ばれることが多い)を占 める。履歴管理モジュール100は情報探索の結 果の履歴をパスファインダーとは別に「履歴 」として表示する。実際の履歴の画面への描 画は履歴描画エンジン106が実行する(図12参照 )。図12に示す例では、画面の右端部分がタブ 切り換えによって種々の情報が表示可能に構 成されている例を示している。図11の例では 履歴と、連想検索U.I.が示されているが、タ ブの切り換えによって別の情報を表示するこ とも好ましい。

 また、本実施の形態においてはユーザ端 10は、連想検索描画エンジン108を備えてい 。この連想検索エンジン108がHTTPサーバ18とXM LPRCによる通信を行い、連想検索の結果を得 と、これを連想検索U.I.の部分(図12の画面右 部参照)に表示する。

 以上のような構成によって、利用者は、 実施の形態に係るレファレンスナビゲータ 利用することができる。

  第6 情報検索動作及びパスファイ ンダーの作成動作
 以下、情報検索動作及びそれに伴うパスフ インダーの具体的な作成動作をフローチャ トに基づき説明する。

 図13、図14には、情報検索動作及びパスフ ァインダーの作成動作を表すフローチャート が示されている。ここでは、キーボードによ って質問文が入力される場合について説明す る。マウスによって所定のキーワードがクリ ックされた場合の動作については次節で述べ る。

 まず、図13のステップS13-1においては、利 用者が「ハンバーガーについて調べたい」と いう自然文をユーザ端末10において入力する

 ステップS13-2においては、中央制御モジ ール90がキー入力処理モジュール98を介して 記自然文による質問文を取得し、これにつ て、関数呼び出しをサーバへ要求する。

 ステップS13-3においては、HTTPサーバ18が 信した上記質問文をWebアプリケーションエ ジン20が関数呼び出し処理エンジン24に供給 る。関数呼び出し処理エンジン24はこの質 文に基づきパスファインダー生成モジュー 34を呼び出す。この結果、パスファインダー のオブジェクト(以下、これをPFobjectと呼ぶ場 合もある)は「Q:ハンバーガーについて調べた い」という質問文となる。

 ステップS13-4においては、質問文解析モ ュールA38が起動し、PFobject「Q:ハンバーガー ついて調べたい」からX:ハンバーガーを取 出す。

 次に、ステップS13-5において、質問文「Q:ハ ンバーガーについて調べたい」と、このX:ハ バーガーが文字列検索モジュール48に供給 れ、文字列の検索が行われる。その結果、PF objectは、
  Q:ハンバーガーについて調べたい
  X:ハンバーガー
  L:1:ハンバーガー     100.0% (関連性 以 同じ)
    2:ハンバーガー司祭     0.4%
    3:ハンバーガーチェーン   0.3%
    4:ナンバーガール      0.2%
  R:ハンバーガー
となる。

 次に、ステップS13-6においては、パスファ ンダー生成モジュール34が、オントロジー処 理モジュール74を呼び出し、オントロジー処 を行わせる。その結果、PFobjectは、
  Q:ハンバーガーについて調べたい
  X:ハンバーガー
  L:1:ハンバーガー     100.0% (関連性 以 同じ)
    2:ハンバーガー司祭     0.4%
    3:ハンバーガーチェーン   0.3%
    4:ナンバーガール      0.2%
  R:ハンバーガー
  BT:パン、ファーストフード
  NT:モスバーガー、マクドナルド、・・・
  RT:佐世保バーガー、外食産業、・・・
となる。なお、ここで、BTは上位語を表し、N Tは下位語を表す。また、RTは関連語を表す。

 次にステップS13-7においては、パスファイ ダー生成モジュール34が、上位概念自動導出 モジュール76を呼び出し、上位概念の導出を わせる。その結果、PFobjectは、
  Q:ハンバーガーについて調べたい
  X:ハンバーガー
  L:1:ハンバーガー     100.0% (関連性 以 同じ)
    2:ハンバーガー司祭     0.4%
    3:ハンバーガーチェーン   0.3%
    4:ナンバーガール      0.2%
  R:ハンバーガー
  BT:パン、ファーストフード
  NT:モスバーガー、マクドナルド、・・・
  RT:佐世保バーガー、外食産業、・・・
  BTI:パン(588.32)、食品(588)、飲食店(637.97)、 ァーストフード、・・・
 となる。なお、ここで、BTIは、拡張された 位語リストを表す。

 本実施の形態において特徴的なことは、 位概念の導出において、Wikipediaのオントロ ーから、図書館オントロジーの概念を取り していることである。このような動作によ てWikipediaのオントロジーと図書館オントロ ーとを組み合わせることができ、より深い 容・専門性の高い内容の情報にアクセスし すい情報探索システムが得られたものであ 。

 この際、既に述べたように、各概念(ノー ド)に重みを行い、この重みに基づいて類似 る概念、上位概念、を求めている。また、 に述べたように、この際、シソーラス(同義 辞典)等も加味して関連する概念の取り出し 、関連付けを行っている。

 このような処理によって、Wikipediaオント ジーと図書館オントロジーとの統合を図る とができ、より利便性の高い情報検索シス ムを提供することができる。

 次に、図14に移り、ステップS14-1において は、パスファインダー生成モジュール34が、 報資源取得モジュール(不図示)を呼び出し 他の種々の情報資源の取得を行わせる。他 情報資源とは、例えば、東大OPAC、Google、Amaz on、JapanKnowledge、等が挙げられる。パスファ ンダーにはそのような外部リンクも含めれ 、より利便性の高いパスファインダーが得 れる。

 次に、ステップS14-2においては、上記ス ップS14-1において見いだされた他の情報資源 に基づき、外部リンク作成モジュール50が外 リンクを作成する。

 この結果、PFobjectは、
  Q:ハンバーガーについて調べたい
  X:ハンバーガー
  L:1:ハンバーガー     100.0% (関連性 以 同じ)
    2:ハンバーガー司祭     0.4%
    3:ハンバーガーチェーン   0.3%
    4:ナンバーガール      0.2%
  R:ハンバーガー
  BT:パン、ファーストフード
  NT:モスバーガー、マクドナルド、・・・
  RT:佐世保バーガー、外食産業、・・・
  BTI:パン(588.32)、食品(588)、飲食店(637.97)、 ァーストフード、・・・
  INFON:農林水産省(http://www.maff.go.jp )
       :外食産業総合調査研究センター(ht tp://www.gaishokusoken.jp/)
       :日本フードサービス協会(http://www. jfnet.or.jp )
  INFOB:外食産業統計資料集(ISBN:9784906357192 (4 906357199))
       :外食産業マーケティング便覧(ISBN: 不明)
  EXTL :東大OPAC(https://opac.dl.itc.u-tokyo.ac.jp/)
       :Google(http://www.google.co.jp )
       :Amazon(http://www.amazon.co.jp )
 となる。

 次に、ステップS14-3においては、パスフ インダー生成モジュール34が、レスポンス生 成モジュール(不図示)に、レスポンスの生成 行わせ、上記PFobjectをユーザ端末10に送信す る。

 ここで作成するレスポンスは、XMLオブジェ トであり、具体的には、
  ハンバーガーについて調べるには・・・
  ・図書館の蔵書を探す : NDC588.32(パン) 58 8(食品)
  ・範囲を広げて調べる : パン、食品、飲 食店、ファーストフード
  ・範囲を限定して調べる: モスバーガー マクドナルド
  ・関連する項目を調べる: 佐世保バーガ 、外食産業
  ・類似した項目を調べる: ハンバーガー 祭、ハンバーガーチェーン、
               ナンバーガール
  ・外部リソースを検索する:OPAC、Google、Ama zon
 のようなデータが作成される。

 このうち、図書館の蔵書を探す欄は、BTI 図書分類を利用して作成し、範囲を広げて べる欄は、BTIを利用して作成する。範囲を 定して調べる欄は、NTを利用する。また、 連する項目を調べる欄はRTを利用する。また 、類似した項目を調べる欄は、Lを用いる。 た、外部リソースを検索する欄はEXTLを用い 、それぞれ作成する。

 作成したXMLデータ(レスポンス)は、ユー 端末10に送信される。

 次に、ステップS14-4においては、ユーザ 末10の中央制御モジュール90がこのレスポン を受信し、その内容を画面に表示する。そ 結果、利用者は図11で示したようなパスフ インダーの画面を見ることができる。また 既に述べたように、ユーザ端末10は、履歴管 理モジュール100を有しているので、過去のパ スファインダーを適宜呼び出して閲覧するこ とができ、利用者にとって使いやすい情報検 索サービスが実現されている。

  第7 情報検索動作及びパスファイ ンダーの作成動作(マウスクリックによる場 )
 上記第6では、キーボードで質問文を入力し た場合の動作をフローチャートに基づき説明 したが、本第7では、利用者がマウスで所定 キーワードをクリックした場合の情報検索 作及びそれに伴うパスファインダーの作成 作についてフローチャートに基づき説明す 。

 図15には、利用者がマウスで所定のキー ードをクリックした場合の情報検索動作及 パスファインダーの作成動作を表すフロー ャートが示されている。ここでは、所定の ーワード「ハンバーガー」がマウスクリッ された場合について説明する。

 まず、図15のステップS15-1においては、利 用者が「ハンバーガー」というキーワードを ユーザ端末10の画面上でクリックする。

 ステップS15-2においては、中央制御モジ ール90がキー入力処理モジュール98を介して 記クリックしたキーワードを取得し、これ ついて、関数呼び出しをサーバへ要求する

 ステップS15-3においては、HTTPサーバ18が受 した上記キーワード「ハンバーガー」をWeb プリケーションエンジン20が関数呼び出し処 理エンジン24に供給する。関数呼び出し処理 ンジン24はこのキーワードに基づきパスフ インダー生成モジュール34を呼び出す。この 結果、パスファインダーのオブジェクト(以 、これをPFobjectと呼ぶ場合もある)は
 Q:「ハンバーガー」を選択
 X:ハンバーガー
 R:ハンバーガー
となる。

 次に、ステップS15-4においては、パスフ インダー生成モジュール34が、オントロジー 処理モジュール74を呼び出し、オントロジー 理を行わせる。

 なお、図15のフローチャートの場合は、 13で示した例(キーボードによる質問入力)と なり、質問文処理モジュール38、文字列検 モジュール48等は使用しない。

 次にステップS15-5においては、パスファ ンダー生成モジュール34が、上位概念自動導 出モジュール76を呼び出し、上位概念の導出 行わせる。

 ここでも、上記図13と同様に、上位概念 導出において、Wikipediaのオントロジーから 図書館オントロジーの概念を取り出してい ことである。この点が本実施の形態におい 特徴的な事項であり、従来の情報検索にお て無かった点である。

 特に、このような動作によってWikipediaの ントロジーと図書館オントロジーとを組み わせることが可能となったので、より深い 容・専門性の高い内容の情報にアクセスし すい情報探索システムが得られたものであ 。

 また、Wikipediaオントロジーの概念から、 書館オントロジーの概念への対応付けにお ては、既に説明したように、各概念(ノード )に重みを行い、この重みに基づいて類似す 概念、上位概念、を求めることによって、 書館オントロジーへの「対応付け」を行っ いる。また、既に述べたように、この際、 ソーラス(同義語辞典)等も加味して関連する 概念の取り出し、関連付けを行っている。

 このような処理によって、Wikipediaオント ジーと図書館オントロジーとの統合を図る とができ、より利便性の高い情報検索シス ムを提供することができる。

  第8 まとめ
 以上述べたように、本実施の形態によれば Wikipediaのオントロジーと図書館オントロジ とを統合したので、双方の長所を生かした いやすい情報検索を行うことができる。

 特に、検索動作に伴って、パスファイン ーが自動的に作成されるので、利便性の高 情報検索システムが構成できる。

  第9 Wikipediaとフォークソノミー(fo lksonomy)
 これまでWikipediaオントロジーと図書館オン ロジーの統合に関して説明してきたが、こ Wikipediaオントロジーは、より一般的に言え 、フォークソノミーオントロジーと言える あろう。

 以下、「imidas」(集英社)からの引用であ 。

 フォークソノミーとは、「利用者が、イン ーネットのコンテンツを自分の好みで収集 分類すること。「人々(folk)」と「分類(taxono my)」とを組み合わせた造語。従来のインター ネット上での情報分類は、ディレクトリ型検 索エンジンを代表とした提供者側の、階層構 造をともなう分類であるが、フォークソノミ ーでは、利用者が自らタグとよばれるインデ ックス情報を付加し、情報を分類・整理して いる。ネットワーク上の写真共有サービス「 Flickr」や、ソーシャルブックマーク・サービ スの「del.icio.us」はフォークソノミーを利用 た代表的なサービス。前者は、写真登録者( アップロードした人)が自由にタグを付与し キーワードとすることにより、写真を介し 利用者同士を結びつける。また、後者は、 ックマーク(お気に入り)をタグづけし、共有 することにより、同じ指向のブックマークか ら有益な情報が見つけやすくなっている。」
                                 (引用終わり)
 このようなフォークソノミーにおけるオン ロジーをフォークソノミー型オントロジー 呼ぶ。このフォークソノミー型オントロジ の一例として上述したWikipediaオントロジー 位置づけることができる。したがって、本 明は、一般的にこのフォークソノミー型の ントロジーを用いて実現することが可能で る。

  第10 プログラムとコンピュータ
 さて、本実施の形態では、図6~図12を用いて 、システムの構成を説明してきたが、そこに 示された各種モジュールやエンジン、インデ クサなどは、いずれもプログラムによって構 成されている。言い換えれば、コンピュータ (サーバや、クライアントであるユーザ端末) それらモジュールを実行することによって 図13~図15その他、上で述べた動作を行うの ある。

 このように、本実施の形態で説明したシ テムは、各種プログラムと、記憶装置に格 された各種データベース(オントロジーAデ タベース70、オントロジーBデータベース72、 利用者認証DB(データベース)、ログDB(データ ース))から構成されている。また、各種の制 御ファイル(パスファインダー制御ファイル36 、外部リンク制御ファイル52等)、辞書データ (同義語辞書80)、等から構成されている。

 ここで、各所のデータベースや辞書は所 の記憶手段に格納しておくことが好ましい 例えば、ハードディスクや、各種半導体記 装置、各種の光ディスク、等が好ましい。 れらは、コンピュータの近傍に設置しても いが、ネットワークを介して遠隔の装置か ダウンロードしてもよい。

 また、各種モジュールやエンジンなどの ログラムも上記のような記憶手段に格納し おくことが好ましい。また、持ち運び可能 可搬型記憶媒体(例えばCDROM等)に格納してお くことも好ましい。また、遠隔地のサーバに 格納しておき、ネットワークを介してそのサ ーバ中のプログラムを実行するように構成す ることも好ましい。

  第11 応用分野
 (1)以上述べたように、本発明は、情報検索 ステムに関し、特に図書館オントロジーと ォークソノミー型オントロジーとを組み合 せた点に特徴を有する。

 したがって、本情報検索システムは、主 して図書館及びその関連施設において用い ことが好適である。特に、本発明によれば 概念検索によって、蔵書を効率的に検索で るので、図書館の職員、司書、各種研究者 対して「情報検索」を教育するシステムと て利用することも好適である。また、図書 の利用者に対する「情報検索」の教育に用 ることも好適である。

 (2)本発明は、異なるオントロジーを組み わせることによって、概念検索を非常に効 的に行うことが可能である。したがって、 情報検索システムを用いて得られた「概念 を用いて外部の検索エンジン(インターネッ ト上の一般的な検索エンジン)に誘導して、 索を行えば、効率的な検索を行うことがで ると考えられる。

 そのためには、本情報検索システムの画 上に、外部の検索エンジンに対する外部リ クボタンをもうけておくことが好ましい。 えば有名な検索エンジンであるGoogleに対す このような外部リンクボタンを、上述した ーザ端末10の画面上に設けておき、ユーザ この外部リンクボタンをクリックした場合 、検索結果である概念をキーワードとするGo ogle検索が行われるように構成しておくこと 便利である。

 なお、このように、キーワードを検索エ ジンにfeedして検索を行わせるように外部リ ンクボタンを構成することは従来から行われ ていることであるので、当業者(その技術分 における通常の知識を持つ人をいう)であれ 容易にそのようなボタンを構成することが きる。

 その結果、インターネット全般における 索を行うことも可能である。

 (3)これまで、図書館オントロジーについ 説明してきたが、これはある概念に対する 位概念がただ一つ定まるオントロジーであ 。換言すれば、このように上位概念がただ つのみ定められているようなオントロジー あれば他のオントロジーを採用することも 理的に可能である。このようにある概念の 位概念が必ず一つであるようなオントロジ をピラミッド型オントロジーと呼ぶ。

 そして、その採用するピラミッド型オン ロジーの内容は、適用したい分野によって 々なものを採用することができるであろう すなわち、本発明は、図書館関連の検索シ テムに限られず、他の種々の分野における 報検索に利用することが可能である。

 要するに、概念分類を利用した語基分類 書ツールとしての利用を図ることができる のである。

 例えば、インターネット上の広告効果・ 響を指標化する目的に利用することができ 。世の中には種々の宣伝・広告媒体が存在 るが、一般に宣伝を行うと、それを見た消 者がインターネット上でブログや記事の書 込み、掲示板への書き込みを行う。書き込 れた文書に関して、宣伝商品の言葉を語基 語幹にして概念分類を行うことによって、 基を分類することができる。その結果、概 毎に語基が並べられた辞書ツールを得るこ が可能である。これを用いれば、広告主へ フィードバック材料や、広告打ち出しのた のヒントキーワード検索ツールとしての利 もできよう。

 具体的な例を挙げよう。例えば、化粧品 シャンプーの広告効果を計測できる情報検 システムを構築することができる。

 例えば、S社が新しいシャンプー「つばめ 」を開発し、この広告をインターネット上で 繰り広げた場合を想定しよう。この広告の効 果を計るには、従来は、「つばめ」を取り上 げている記事やブログを検索し、何回取り上 げられているか? ブログで言及された回数は ? それに対するコメント数は? などの数値を 得て、その数値から、おおよその広告効果を 推定するしかなかった。

 これに本発明の情報検索システムを適用 る。まず、「つばめ」に対するピラミッド オントロジーを構築する。これはシャンプ や化粧品等を対象としたオントロジーを専 家が構築すればよい。

 そして、「つばめ」に関する種々の概念 抽出した後、その概念を用いて、インター ット上の記事やブログを検索するのである

 「つばめ」について、上述したように、 ラミッド型オントロジーと、フォークソノ ー型オントロジーとを組み合わせた情報検 システムを用いて関連する概念を得る。そ 結果、「S社」や、「シャンプー」「化粧品 」、ひいては競合商品である「U社」のシャ プーである「ラック」などを得る。

 これらを用いてインターネット上の記事 ブログを検索することによって、より精度 高い検索をすることができる。さらに、競 他社の製品(U社の「ラック」)との比較を行 こともできるので、広告効果をより詳細に 査することができる。