Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
MOLECULAR NETWORK ANALYSIS SUPPORT PROGRAM, RECORDING MEDIUM STORING THE PROGRAM, MOLECULAR NETWORK ANALYSIS SUPPORT SYSTEM AND MOLECULAR NETWORK ANALYSIS SUPPORT METHOD
Document Type and Number:
WIPO Patent Application WO/2008/102658
Kind Code:
A1
Abstract:
By estimating intermolecular actions closely relating to a disease, a biologically meaningful pathway can be efficiently obtained from among a great number of pathways. By a molecular network analysis support system, the standard molecule indication and molecular type of the starting node and the standard molecule indication and molecular type of the ending node (a node generated from a biological phenomenon), a search route and the relation strength (S3) in the search route can be obtained as the search results (1110) for each search route (pathway ID). By calculating the relation strengths (S3) to a definite biological phenomenon for all search routes and sorting the results, sort results (1800) can be obtained and a search route closely relating to the definite biological phenomenon can be preferentially selected. Thus, a disease pathway fitting for user's viewpoint can be extracted. As a result, drug discovery researches can be accelerated in practice.

Inventors:
KINOSHITA SHUHEI (JP)
DOI KENTARO (JP)
Application Number:
PCT/JP2008/052149
Publication Date:
August 28, 2008
Filing Date:
February 08, 2008
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
FUJITSU LTD (JP)
KINOSHITA SHUHEI (JP)
DOI KENTARO (JP)
International Classes:
G16B5/00; G06F17/30
Domestic Patent References:
WO2005096207A12005-10-13
WO2003077159A12003-09-18
Foreign References:
JP2006146380A2006-06-08
JP2005122231A2005-05-12
JP2003186894A2003-07-04
JP2006146380A2006-06-08
JP2005122231A2005-05-12
Other References:
"KEGG: Kyoto Encyclopedia of Genes and Genomes", 25 December 2006
BIOCARTA, 25 December 2006 (2006-12-25), Retrieved from the Internet
MESH, 25 December 2006 (2006-12-25)
BMC BIOINFORMATICS, vol. 6, no. 1, 24 May 2005 (2005-05-24), pages 4
BIOCREATIVE, 25 December 2006 (2006-12-25), Retrieved from the Internet
HUMAN PROTEIN REFERENCE DATABASE, 16 January 2007 (2007-01-16), Retrieved from the Internet
See also references of EP 2113854A4
Attorney, Agent or Firm:
SAKAI, Akinori (20F Kasumigaseki Building,2-5, Kasumigaseki 3-chom, Chiyoda-ku Tokyo 20, JP)
Download PDF:
Claims:
 コンピュータを、
 任意の生体内現象の指定を受け付ける指定手段、
 分子ネットワークの中から任意の相互作用を抽出する抽出手段、
 前記指定手段によって指定された生体内現象と前記抽出手段によって抽出された相互作用との関連強度を算出する算出手段、
 として機能させることを特徴とする分子ネットワーク分析支援プログラム。
 前記算出手段は、
 前記生体内現象と前記相互作用を特定する分子との関連強度を算出するとともに、当該関連強度に基づいて、前記生体内現象と前記相互作用との関連強度を算出することを特徴とする請求項1に記載の分子ネットワーク分析支援プログラム。
 前記コンピュータを、
 表示画面を制御して、前記算出手段によって算出された前記生体内現象と前記相互作用との関連強度を前記相互作用に関連付けて前記分子ネットワークを表示する表示制御手段として機能させることを特徴とする請求項1または2に記載の分子ネットワーク分析支援プログラム。
 前記コンピュータを、
 前記分子ネットワークの中から開始ノードの選択を受け付ける選択手段、
 前記選択手段によって選択された開始ノードから既知生体内現象が発生するノードまでの経路を前記分子ネットワークの中から探索する探索手段として機能させ、
 前記表示制御手段は、
 前記表示画面を制御して、前記探索手段によって探索された経路を表示することを特徴とする請求項3に記載の分子ネットワーク分析支援プログラム。
 前記コンピュータを、
 前記経路を構成する相互作用の中から不安定な相互作用を検出する検出手段、
 前記検出手段によって検出された不安定な相互作用の方向を反転させた方向反転後の分子ネットワークを生成する生成手段として機能させ、
 前記探索手段は、
 前記方向が反転された相互作用を通過する前記開始ノードから前記既知生体内現象が発生するノードまでの方向反転後の経路を前記生成手段によって生成された方向反転後の分子ネットワークの中から探索し、
 前記表示制御手段は、
 前記表示画面を制御して、前記探索手段によって探索された方向反転後の経路を表示することを特徴とする請求項4に記載の分子ネットワーク分析支援プログラム。
 前記算出手段は、
 前記生体内現象と前記相互作用との関連強度に基づいて、前記生体内現象と前記探索手段によって探索された経路との関連強度を算出し、
 前記表示制御手段は、
 前記表示画面を制御して、前記算出手段によって算出された前記生体内現象と前記経路との関連強度に基づいて、前記経路を表示することを特徴とする請求項4または5に記載の分子ネットワーク分析支援プログラム。
 コンピュータを、
 分子ネットワークの中から開始ノードの選択を受け付ける選択手段、
 前記選択手段によって選択された開始ノードから既知生体内現象が発生するノードまでの経路を構成する相互作用の中から不安定な相互作用を検出する検出手段、
 前記検出手段によって検出された不安定な相互作用の方向を反転させた方向反転後の分子ネットワークを生成する生成手段、
 前記方向が反転された相互作用を通過する前記開始ノードから前記既知生体内現象が発生するノードまでの方向反転後の経路を前記生成手段によって生成された方向反転後の分子ネットワークの中から探索する探索手段、
 表示画面を制御して、前記探索手段によって探索された方向反転後の経路を表示する表示制御手段、
 として機能させることを特徴とする分子ネットワーク分析支援プログラム。
 任意の生体内現象の指定を受け付ける指定手段と、
 分子ネットワークの中から任意の相互作用を抽出する抽出手段と、
 前記指定手段によって指定された生体内現象と前記抽出手段によって抽出された相互作用との関連強度を算出する算出手段と、
 を備えることを特徴とする分子ネットワーク分析支援装置。
 分子ネットワークの中から開始ノードの選択を受け付ける選択手段と、
 前記選択手段によって選択された開始ノードから既知生体内現象が発生するノードまでの経路を構成する相互作用の中から不安定な相互作用を検出する検出手段と、
 前記検出手段によって検出された不安定な相互作用の方向を反転させた方向反転後の分子ネットワークを生成する生成手段と、
 前記方向が反転された相互作用を通過する前記開始ノードから前記既知生体内現象が発生するノードまでの方向反転後の経路を前記生成手段によって生成された方向反転後の分子ネットワークの中から探索する探索手段と、
 表示画面を制御して、前記探索手段によって探索された方向反転後の経路を表示する表示制御手段と、
 を備えることを特徴とする分子ネットワーク分析支援装置。
 任意の生体内現象の指定を受け付ける指定工程と、
 分子ネットワークの中から任意の相互作用を抽出する抽出工程と、
 前記指定工程によって指定された生体内現象と前記抽出工程によって抽出された相互作用との関連強度を算出する算出工程と、
 を含んだことを特徴とする分子ネットワーク分析支援方法。
 分子ネットワークの中から開始ノードの選択を受け付ける選択工程と、
 前記選択工程によって選択された開始ノードから既知生体内現象が発生するノードまでの経路を構成する相互作用の中から不安定な相互作用を検出する検出工程と、
 前記検出工程によって検出された不安定な相互作用の方向を反転させた方向反転後の分子ネットワークを生成する生成工程と、
 前記方向が反転された相互作用を通過する前記開始ノードから前記既知生体内現象が発生するノードまでの方向反転後の経路を前記生成工程によって生成された方向反転後の分子ネットワークの中から探索する探索工程と、
 前記探索工程によって探索された方向反転後の経路を表示画面に表示する表示工程と、
 を含んだことを特徴とする分子ネットワーク分析支援方法。
Description:
分子ネットワーク分析支援プロ ラム、該プログラムを記録した記録媒体、 子ネットワーク分析支援装置、および分子 ットワーク分析支援方法

 この発明は、生体内現象の分析を支援す 分子ネットワーク分析支援プログラム、該 ログラムを記録した記録媒体、分子ネット ーク分析支援装置、および分子ネットワー 分析支援方法に関する。

 生物の体内、いわゆる生体内では、遺伝 やタンパク質、脂質や酸など、多くの化学 質が存在する。これらの化学物質は分子単 で存在し、互いに影響を及ぼしあっている この分子間相互の影響を、分子間相互作用 呼ぶ。

 生体内には無数の分子が存在するので、 然のことながら、多くの分子間相互作用が 在する。また、分子間相互作用は単一で存 せず、多くは分子間相互作用どうしの連な を形成する。例として、「分子Aが分子Bに 響を与え、その結果、分子Bが分子Cを形成す る。」などがある。つまり、分子間相互作用 は、分子Aから分子B、そして分子Cという数珠 繋ぎを形成する。このように数珠状に連なっ た分子間相互作用群を、「パスウェイ」とい う。

 図30は、パスウェイを示す説明図である パスウェイは、生命活動を理解するうえで 用である。例として、「分子Aと分子Bの相互 作用により、分子Cは変形する。その結果、 子Cの変形が原因となって特定の疾患が誘発 れる。」や「分子Aと分子Bの相互作用によ 、分子Cが特定の形状を保つ。その結果、正 な臓器の活動が継続される。」などがある

 これらの例のように、分子間相互作用の なりであるパスウェイの結果として、正常 疾患にかかわらず、生命活動のあらましが 解可能となる。よって、パスウェイを構築 ることは、医療・薬剤開発などの生命科学 分野にとって重要である。パスウェイの構 方法は、いくつか存在する。

 そのひとつとして、キュレーションが存 する。キュレーションとは、キュレーター 呼ばれる専門家が文献を読み、文献内の記 中から分子間相互作用を抽出し、分子間相 作用を組み合わせてパスウェイを構築する 法である。

 キュレーションは、キュレーターという 的資源を基盤にした構築法であるので、読 対象となる文献数が作業負荷に直結する。 献群を格納したデータベースを公開してい ウェブサイトに、PubMed(非特許文献1を参照 )が存在する。

 参考として、キュレーションにより構築 れたパスウェイを格納したデータベースを 開しているウェブサイトにKEGG(非特許文献2 参照。)やBioCarta(非特許文献3を参照。)など 存在する。

 もう一つのパスウェイ構築例として、機 処理によるデータマイニングおよびテキス マイニングが存在する。データマイニング は、種々の統計解析手法を用いて大量のデ タを分析し、隠れた関係性や意味を見つけ す知識発見手法の総称である。特に、テキ トデータ(通常の自然文)を単語などに分割 、その出現頻度や相関関係などを解析する とで、一定の知見や発想を得ることをテキ トマイニングという。

 バイオテクノロジーに特化したテキスト イニングでは、文献中における、分子間相 作用を起こす「分子」と、その分子が起こ 「動作」などに対して、機械的構文解析を こなうことで、相互作用を抽出してパスウ イを構築する方法などがとられている。こ らテキストマイニングとデータマイニング 組み合わせることで、「大腸がんと関連が るパスウェイ」といった、生命科学的に意 のあるパスウェイが、計算機により構築可 となる。

 生物学的なデータマイニングに使用され 生物医学用語としてMeSHターム(非特許文献4 参照)が存在する。MeSHはMedical Subject Headings の略語であり、生物・医学的な用語群を指す 。MeSHは文献に付与されており、MeSHタームの 計量を算出することで、特定の文献群が、 物・医学的にどのような意味を持つのかを 析可能である。

 また、パスウェイの構成要素である分子 、生物・医学的な意味づけをおこない、デ タベース化し、公開しているウェブサイト 存在する。OMIM(非特許文献5を参照。)、H‐in vDB(非特許文献6を参照。)が、それに相当する 。ともに遺伝子に関する意味づけがおこなわ れたデータベースである。これらのデータベ ースのデータもまた、データマイニングに使 用することで、遺伝子という分子に対する生 物・医学的な意味を見出すことが可能である 。

 また、生物・医学に特化したテキストマ ニングに関する参考文献として非特許文献7 があり、また研究団体としてBioCreAtIvE(非特許 文献8を参照。)が存在する。また、相互作用 報をあらかじめ格納したデータベースを公 しているウェブサイトに、HPRD(非特許文献9 参照。)やBIND(非特許文献10を参照。)が存在 る。これらのウェブサイトでは、「結合」 ど、タンパク質間の直接的な相互作用が登 されている。また、登録されている分子間 互作用の情報は一括で入手でき、データマ ニングなどへの利用が可能である。

 分子間相互作用と分子間相互作用を起こ 分子に、その「種類」や「機能」が意味づ られた商用データベースとして、ARIADNE GENO MICS社のResNetが存在する。このようなデータ ースを購入し、データマイニングをおこな ことも可能である。

 テキストマイニングとデータマイニング 機能に盛り込んだソフトウェアとして、セ スター・レキシコ・サイエンシズ社のMedTAK 存在する。このソフトウェアは、文献群中 記載されている「分子群」「MeSHターム」な どに対して、その出現頻度などを統計解析し 、生物・医学的意味の抽出を支援する。ただ し、本ソフトウェアのテキストマイニング技 術は、分子間相互作用の抽出機能を有してい ない。

 また、パスウェイにより分子ネットワー を構築した場合、「生物・医学的に意味の る経路の選択法」が必要となる。この「生 ・医学的に意味」を見出す点により、パス ェイにおける経路選択は、ネットワークに ける通常の経路選択と状況が異なる。パス ェイにおける既存の経路選択手法は、いく か存在する。

 たとえば、下記特許文献1では、疾患など の「生物・医学的」情報を、分子間相互作用 に付与する従来技術が紹介されている。しか し、分子間の経路選択に関しては、本手法で は常に最短経路が選択される。

 また、下記特許文献2では、疾患への関連 度を考慮した経路選択のアプローチとして、 サブネットと呼ばれる二つ以上の分子間の経 路集合を用いた手法を紹介している。疾患な どに関係するサブネットをあらかじめ構築し ておき、経路探索時に、疾患と関係するサブ ネットがヒットした場合、疾患と関係する経 路選択が可能になる。

 また、下記特許文献3では、遺伝子に関係 する化合物、疾患名、タンパク質などの用語 ネットワークを構築するための画面表示方法 が開示されている。本手法は、用語群1と用 群2をユーザが指定し、用語間の関係性を示 する文献情報を、ネットワークとして描画 るための手法である。

Pubmed、[online]、[平成18年12月25日検索]、 ンターネット<URL:http://www.ncbi.nlm.nih.gov/entre z/query.fcgi> KEGG:Kyoto Encyclopedia of Genes and Genomes、[o nline]、[平成18年12月25日検索]、インターネッ <URL:http://www.genome.jp/kegg/pathway.html> BioCarta:[online]、[平成18年12月25日検索]、 ンターネット<URL:http://www.biocarta.com/> MeSH、[online]、[平成18年12月25日検索]、イ ターネット<URL:http://www.nlm.nih.gov/mesh/meshhom e.html> OMIM、[online]、[平成18年12月26日検索]、イ ターネット<URL:http://www.ncbi.nlm.nih.gov/entrez/ query.fcgi?db=OMIM> H-inv DB[online]、[平成18年12月26日検索]、 ンターネット<URL:http://www.jbic.or.jp/activity/i_ db_pj/h-inv_db.html> BMC Bioinformatics. 2005;6 Suppl 1 S4.Epub 2005 May 24. BioCreAtIvE、[online]、[平成18年12月25日検索] 、インターネット<URL:http://biocreative.sourcefor ge.net/> Human Protein Reference Database、[online]、[平 19年1月16日検索]、インターネット<URL:http: //www.hprd.org/> BIND、[online]、[平成19年1月16日検索]、イ ターネット<URL:http://www.blueprint.org/>

特開2006-146380号公報

国際公開2003/077159号パンフレット

特開2005-122231号公報

 しかしながら、パスウェイには、そのネ トワーク形状の特性から、「経路選択」に する課題が存在する。すなわち、PubMed(非特 許文献1)に登録されている文献が膨大である ゆえに、抽出される分子間相互作用数も膨 なものとなる。パスウェイの構成要素であ 分子間相互作用数が膨大であるので、当然 パスウェイの形状は、より広範かつ複雑な ットワークを形成し、経路選択が困難にな という問題がある。広範かつ経路選択が困 なネットワークを図29に示す。

 キュレーションにより、分子間相互作用 を減じてパスウェイを構築することも可能 あるが、PubMedにおける文献数は、2006年11月 点で1600万件以上存在しており、一ヶ月あた り5~6万件のペースで増加している。したがっ て、読む対象である文献は現時点でも膨大で あり、構築に膨大な時間がかかるという問題 がある。

 また、文献数の増加も継続することから 更新情報による「新説への対応」などに対 て限界があるという問題がある。また、キ レーションには、キュレーターの主観によ 、偏ったパスウェイが構築される場合があ という問題がある。

 また、上述した特許文献1では、経路が複 数存在し、かつ、経路長が長い経路の方が生 物・医学的に意味があった場合、考察不可能 であり、疾患などのメカニズムの解明のため には不十分である。経路が複数あることは、 パスウェイでは頻繁であり、また、経路長の 短さと生物・医学的意味の相関も確認されて いない。

 また、生体内分子のメカニズムに関する 究は、常に現在進行形であるため、あらか め構築されたサブネットでは、生物・医学 な新規情報に関する漏れが生じる。しかし がら、上述した特許文献2では代替手段は提 示されていない。また計算機等を用いた常時 更新可能な疾患に関係するサブネットの構築 手法に関しては述べられておらず不十分であ る。

 また、上述した特許文献3でも、各分子や 分子間の連なりに対して、特定疾患という生 物・医学的意味との関係性を表示する手法は 提示されておらず、不十分である。また、OMI M(非特許文献5)やH‐invDB(非特許文献6)など、 伝子ごとに医学・生物学的な意味を付与し いるデータベースや、相互作用情報を格納 たHPRD(非特許文献9)、BIND(非特許文献10)など 、データマイニングの材料としては有効で るものの、それ自体は、パスウェイを構築 る機能を有していない。よって、パスウェ の結果である生体内での現象を考察できず 当然、その経路選択に寄与しない。

 また、セレスター・レキシコ・サイエン ズ社のソフトウェアであるMedTAKにおいては データマイニング技術により、文献群から 学・生物学的意味を抽出しているものの、 子間相互作用を抽出していない。よって、 ソフトウェアも、パスウェイの構築がかな ず、経路選択に寄与しない。

 このように、上述した特許文献1~3および データベース(OMIM、H‐invDB、HPRD、BIND)やソ トウェア(MedTAK)のいずれにおいても、パスウ ェイにおける「生物・医学的に意味のある経 路の選択法」に関して不十分であるという問 題がある。

 この発明は、上述した従来技術による問 点を解消するため、疾患などの生体内現象 密接に関わる分子間相互作用を推定するこ により、膨大な経路の中から生物学的意味 ある経路を効率的に得ることができる分子 ットワーク分析支援プログラム、該プログ ムを記録した記録媒体、分子ネットワーク 析支援装置、および分子ネットワーク分析 援方法を提供することを目的とする。

 上述した課題を解決し、目的を達成する め、第1の発明にかかる分子ネットワーク分 析支援プログラム、該プログラムを記録した 記録媒体、分子ネットワーク分析支援装置、 および分子ネットワーク分析支援方法は、任 意の生体内現象の指定を受け付け、分子ネッ トワークの中から任意の相互作用を抽出し、 指定された生体内現象と抽出された相互作用 との関連強度を算出することを特徴とする。

 この発明によれば、分析対象となる分子 ットワーク(パスウェイまたはパスウェイか ら抽出された分子ネットワーク)を構成する 互作用に対して、医学・生物学的な意味を つ数値を、関連強度として付与することが きる。

 また、上記発明において、前記生体内現 と前記相互作用を特定する分子との関連強 を算出するとともに、当該関連強度に基づ て、前記生体内現象と前記相互作用との関 強度を算出することとしてもよい。

 この発明によれば、指定生体内現象に対 る分子の関与を強調することができる。

 また、上記発明において、表示画面を制 して、算出された前記生体内現象と前記相 作用との関連強度を前記相互作用に関連付 て前記分子ネットワークを表示することと てもよい。

 この発明によれば、指定生体内現象に対 る相互作用や分子の関与を直感的かつわか やすく出力することができる。

 また、上記発明において、前記分子ネッ ワークの中から開始ノードの選択を受け付 、選択された開始ノードから既知生体内現 が発生するノードまでの経路を前記分子ネ トワークの中から探索し、前記表示画面を 御して、探索された経路を表示することと てもよい。

 この発明によれば、特定の生体内現象と 連性の深い探索経路を機械的に選択するこ ができる。

 また、上記発明において、前記経路を構 する相互作用の中から不安定な相互作用を 出し、検出された不安定な相互作用の方向 反転させた方向反転後の分子ネットワーク 生成し、前記方向が反転された相互作用を 過する前記開始ノードから前記既知生体内 象が発生するノードまでの方向反転後の経 を方向反転後の分子ネットワークの中から 索し、前記表示画面を制御して、探索され 方向反転後の経路を表示することとしても い。

 この発明によれば、不安定な相互作用を 出してその方向を反転させることで、想定 の新規的な分子ペアや探索経路を提供する とができる。

 前記生体内現象と前記相互作用との関連 度に基づいて、前記生体内現象と探索され 経路との関連強度を算出し、前記表示画面 制御して、算出された前記生体内現象と前 経路との関連強度に基づいて、前記経路を 示することとしてもよい。

 この発明によれば、指定生体内現象に対 る分子の関与を強調することができる。

 また、第2の発明にかかる分子ネットワー ク分析支援プログラム、該プログラムを記録 した記録媒体、分子ネットワーク分析支援装 置、および分子ネットワーク分析支援方法は 、分子ネットワークの中から開始ノードの選 択を受け付け、選択された開始ノードから既 知生体内現象が発生するノードまでの経路を 構成する相互作用の中から不安定な相互作用 を検出し、検出された不安定な相互作用の方 向を反転させた方向反転後の分子ネットワー クを生成し、前記方向が反転された相互作用 を通過する前記開始ノードから前記既知生体 内現象が発生するノードまでの方向反転後の 経路を方向反転後の分子ネットワークの中か ら探索し、表示画面を制御して、探索された 方向反転後の経路を表示することを特徴とす る。

 この発明によれば、不安定な相互作用を 出してその方向を反転させることで、想定 の新規的な分子ペアや探索経路を提供する とができる。

 本発明にかかる分子ネットワーク分析支 プログラム、該プログラムを記録した記録 体、分子ネットワーク分析支援装置、およ 分子ネットワーク分析支援方法によれば、 患と密接に関わる分子間相互作用を推定す ことにより、膨大な経路の中から生物学的 味のある経路を効率的に得ることができる いう効果を奏する。

この発明の実施の形態にかかる分子ネ トワーク分析支援装置のハードウェア構成 示すブロック図である。 この発明の実施の形態にかかる分子ネ トワーク分析支援装置100に用いられる医学 献DBの記憶内容を示す説明図である。 この発明の実施の形態にかかる分子ネ トワーク分析支援装置100に用いられる相互 用DBの記憶内容を示す説明図である。 この発明の実施の形態にかかる分子ネ トワーク分析支援装置100に用いられる薬理D Bの記憶内容を示す説明図である。 この発明の実施の形態にかかる分子ネ トワーク分析支援装置100の機能的構成を示 ブロック図である。 図5に示した分子ネットワーク生成処理 部501の機能的構成を示すブロック図である。 検索条件の検索画面を示す説明図で る。 指定ボタン730のクリック後の検索画 700を示す説明図である。 取得部603によって取得された相互作用 集合を示す説明図である。 非冗長相互作用の集合とその連結結果 示す説明図である。 この発明の実施の形態にかかる分子ネ ットワーク分析支援装置100の分子ネットワー ク生成処理手順を示すフローチャートである 。 図5に示した関連強度算出/経路探索処 部502の機能的構成を示すブロック図である 分子ネットワーク510の表示画面500を示 す説明図である。 分子ペアごとの相互作用(非冗長相互 用)と指定生体内現象との関連強度S1を示す 明図である。 関連強度S1のマッピング画面を示す説 図である。 相互作用(非冗長相互作用)を特定する 子と指定生体内現象との関連強度S2を示す 明図である。 関連強度算出/表示処理手順を示すフ ーチャートである。 開始ノードとなる分子の選択受け付け 後のマッピング画面1400を示す説明図である 探索部1106による探索結果1110を示す説 図である。 探索経路を表示したマッピング画面140 0を示す説明図(その1)である。 探索経路を表示したマッピング画面140 0を示す説明図(その2)である。 探索部1106による探索結果1110をソート たソート結果2100を示す説明図である。 探索経路を表示したマッピング画面140 0を示す説明図(その3)である。 探索経路を表示したマッピング画面140 0を示す説明図(その4)である。 開始ノード選択/経路探索処理手順を すフローチャートである。 経路探索処理(ステップS2403)の詳細な 理手順を示すフローチャートである。 相互作用の方向反転後の分子ネットワ ーク510を示す説明図である。 経路追加処理を有する経路探索処理手 順を示すフローチャートである。 経路追加処理(ステップS2700)の詳細な 理手順を示すフローチャートである。 広範かつ経路選択が困難なネットワー クの説明図である。 パスウェイを示す説明図である。

符号の説明

 100 分子ネットワーク分析支援装置
 500 表示画面
 501 分子ネットワーク生成処理部
 502 関連強度算出/経路探索処理部
 510 分子ネットワーク
 601 入力部
 602 検索部
 603 取得部
 604 生成部
1101 指定部
1102 抽出部
1103 算出部
1104 表示制御部
1105 選択部
1106 探索部

 以下に添付図面を参照して、この発明に かる分子ネットワーク分析支援プログラム 該プログラムを記録した記録媒体、分子ネ トワーク分析支援装置、および分子ネット ーク分析支援方法の好適な実施の形態を詳 に説明する。なお、本明細書において、分 間相互作用を構成する「分子」とは、生体 に存在する化学物質を構成する分子のほか 遺伝子やタンパク質、化合物も「分子」と て扱う。

(分子ネットワーク分析支援装置のハードウ ア構成)
 まず、この発明の実施の形態にかかる分子 ットワーク分析支援装置のハードウェア構 について説明する。図1は、この発明の実施 の形態にかかる分子ネットワーク分析支援装 置のハードウェア構成を示すブロック図であ る。

 図1において、分子ネットワーク分析支援 装置100は、コンピュータ本体110と、入力装置 120と、出力装置130と、から構成されており、 不図示のルータやモデムを介してLAN,WANやイ ターネットなどのネットワーク140に接続可 である。

 コンピュータ本体110は、CPU,メモリ,イン ーフェースを有する。CPUは、分子ネットワ ク分析支援装置100の全体の制御を司る。メ リは、ROM,RAM,HD,光ディスク111,フラッシュメ リから構成される。メモリはCPUのワークエ アとして使用される。

 また、メモリには各種プログラムが格納 れており、CPUからの命令に応じてロードさ る。HDおよび光ディスク111はディスクドラ ブによりデータのリード/ライトが制御され 。また、光ディスク111およびフラッシュメ リはコンピュータ本体110に対し着脱自在で る。インターフェースは、入力装置120から 入力、出力装置130への出力、ネットワーク1 40に対する送受信の制御をおこなう。

 また、入力装置120としては、キーボード1 21、マウス122、スキャナ123などがある。キー ード121は、文字、数字、各種指示などの入 のためのキーを備え、データの入力をおこ う。また、タッチパネル式であってもよい マウス122は、カーソルの移動や範囲選択、 るいはウィンドウの移動やサイズの変更な をおこなう。スキャナ123は、画像を光学的 読み取る。読み取られた画像は画像データ して取り込まれ、コンピュータ本体110内の モリに格納される。なお、スキャナ123にOCR 能を持たせてもよい。

 また、出力装置130としては、ディスプレ 131、プリンタ132、スピーカ133などがある。 ィスプレイ131は、カーソル、アイコンある はツールボックスをはじめ、文書、画像、 能情報などのデータを表示する。また、プ ンタ132は、画像データや文書データを印刷 る。またスピーカ133は、効果音や読み上げ などの音声を出力する。

(医学文献DBの記憶内容)
 つぎに、この発明の実施の形態にかかる分 ネットワーク分析支援装置100に用いられる 学文献DBの記憶内容について説明する。図2 、この発明の実施の形態にかかる分子ネッ ワーク分析支援装置100に用いられる医学文 DBの記憶内容を示す説明図である。

 図2において、医学文献DB200は一般に公開 れているデータベースであり、医学文献を 定する文献IDごとに、医学文献のタイトル アブストラクト(要約)、著者、出版年月日、 MeSHタームが記憶されている。MeSHタームは、 献検索に使用される生物医学用語である。 学文献に付与されたMeSHタームの統計量を算 出することで、特定の医学文献群が、生物・ 医学的にどのような意味を持つのかを解析す ることができる。

 医学文献DB200は、HDや半導体メモリなどの 記録媒体によってその機能を実現する。また 、医学文献DB200は、分子ネットワーク分析支 装置100に備えられていてもよく、また、外 のサーバからネットワーク140を介して分子 ットワーク分析支援装置100とアクセス可能 してもよい。

(相互作用DBの記憶内容)
 つぎに、この発明の実施の形態にかかる分 ネットワーク分析支援装置100に用いられる 互作用DBの記憶内容について説明する。図3 、この発明の実施の形態にかかる分子ネッ ワーク分析支援装置100に用いられる相互作 DBの記憶内容を示す説明図である。

 図3において、相互作用DB300は、分子Aの標 準分子表記および分子タイプ、分子Bの標準 子表記および分子タイプ、文献ID、相互作用 タイプ、相互作用の方向を記憶することで、 レコードごとに、分子間相互作用(以下、単 「相互作用」という)を特定する。

 ここで、分子Aとは、相互作用を構成する 一端の分子であり、分子Bとは他端の分子で る。また、標準分子表記とは、相互作用を 成する分子の標準的な表記である。分子タ プとは、相互作用を構成する分子の種別(タ パク質、化合物など)をあらわす。

 文献IDとは、相互作用を特定する分子が 述された医学文献の文献IDであり、この文献 IDにより医学文献DB200と関連付けられる。相 作用タイプとは、両分子(分子Aおよび分子B) の相互作用の種別(阻害、結合、活性化など )をあらわす。相互作用の方向とは、相互作 を特定する分子が影響先か影響元かを特定 る情報である。たとえば、「→」となって る場合、その相互作用では分子Aが分子Bに影 響を与えていることを示す。

 相互作用は、分子Aの標準分子表記および 分子タイプ、分子Bの標準分子表記および分 タイプ、文献ID、相互作用タイプ、および相 互作用の方向により、レコードごとに特定さ れる。相互作用は、キュレーションや自然言 語処理による構文解析(例えば非特許文献4)に より抽出された情報により構築される。

 相互作用DB300は、HDや半導体メモリなどの 記録媒体によってその機能を実現する。また 、相互作用DB300は、分子ネットワーク分析支 装置100に備えられていてもよく、また、外 のサーバからネットワークを介して分子ネ トワーク分析支援装置100とアクセス可能と てもよい。

(薬理DBの記憶内容)
 つぎに、この発明の実施の形態にかかる分 ネットワーク分析支援装置100に用いられる 理DBの記憶内容について説明する。図4は、 の発明の実施の形態にかかる分子ネットワ ク分析支援装置100に用いられる薬理DBの記 内容を示す説明図である。

 図4において、薬理DB400は、以下の例1およ び例2で示すように、特定タンパクの変異、 ックアウト、ノックダウン、過剰発現など 験の結果が疾患に関与したという事実に関 る情報を記憶するデータベースである。

 例1)二型糖尿病で遺伝子Xが過剰発現した。
 例2)RNAi実験で遺伝子Yをノックダウンすると 、肝硬変が誘発された。

 薬理DB400には、データベースID、対象とす るタンパク質の標準分子表記、関連する生体 内現象名、その関連記述が記憶されている。 データベースIDとは、キュレーションされた ータベースを特定するIDであり、関連記述 は、実験の種類や関連有りとされた疾患が 述されたテキストデータである。なお、本 施の形態の分子ネットワーク分析支援装置10 0により発見した新規薬理情報や、実験など 発見した情報も追加登録することとしても い。これにより、薬理DB400の網羅性を向上さ せることもできる。

 薬理DB400は、HDや半導体メモリなどの記録 媒体によってその機能を実現する。また、薬 理DB400は、分子ネットワーク分析支援装置100 備えられていてもよく、また、外部のサー からネットワーク140を介して分子ネットワ ク分析支援装置100とアクセス可能としても い。

(分子ネットワーク分析支援装置100の機能的 成)
 つぎに、この発明の実施の形態にかかる分 ネットワーク分析支援装置100の機能的構成 ついて説明する。図5は、この発明の実施の 形態にかかる分子ネットワーク分析支援装置 100の機能的構成を示すブロック図である。図 5において、分子ネットワーク分析支援装置10 0は、分子ネットワーク生成処理部501と、関 強度算出/経路探索処理部502とを備えている これら各機能501,502は、メモリに格納された 当該機能に関するプログラムをCPUに実行させ ることにより、または、入出力I/Fにより、当 該機能を実現することができる。

 また、各機能501,502からの出力データはメ モリに保持される。また、図5中矢印で示し 接続先の機能は、接続元の機能からの出力 ータをメモリから読み込んで、当該機能に するプログラムをCPUに実行させる。

 まず、分子ネットワーク生成処理部501は 医学文献DB200および相互作用DB300を参照する ことにより、パスウェイの中からユーザが分 析したい分子ネットワーク510を生成する機能 を有する。生成された分子ネットワーク510は 表示画面500に表示される。なお、分子ネット ワーク生成処理部501の詳細は図6において説 する。

 また、関連強度算出/経路探索処理部502は 、薬理DB400を参照することにより、分子ネッ ワーク510の各相互作用の関連強度を算出し り、分子ネットワーク510に含まれている膨 な経路の中から生物学的意味のある経路を 索する。また、探索された経路の関連強度 算出することもできる。

 算出された関連強度は、分子ネットワー 510中の該当する相互作用にその関連強度に じた色を施したり、数値情報を相互作用の 傍に位置するようにして、表示画面500に表 される。また、探索された経路をあらわす 画も分子ネットワーク510中の相互作用に沿 ようにして表示画面500に表示される。なお 関連強度算出/経路探索処理部502の詳細は図 11において説明する。

(分子ネットワーク生成処理部501の機能的構 )
 つぎに、図5に示した分子ネットワーク生成 処理部501の機能的構成について説明する。図 6は、図5に示した分子ネットワーク生成処理 501の機能的構成を示すブロック図である。 6において、分子ネットワーク生成処理部501 は、入力部601と、検索部602と、取得部603と、 生成部604と、を備えている。

 まず、入力部601は、分子または相互作用 関する検索条件の入力を受け付ける機能を する。ここで、分子または相互作用に関す 検索条件とは、ユーザが分析したい分子ネ トワーク510に含まれている分子や相互作用 識別情報であり、たとえば、図3に示した分 子Aの標準分子表記および分子タイプ、分子B 標準分子表記および分子タイプ、文献ID、 互作用タイプ、相互作用の方向などが挙げ れる。また、MeSHタームなどのフリーキーワ ドを検索条件として入力することとしても い。

 ここで、検索条件の入力例について説明 る。図7-1は、検索条件の検索画面を示す説 図である。図7において、検索画面700には、 医学文献の文献単位で検索条件を入力する文 献単位領域710と、ユーザが分析したい相互作 用単位で検索条件を入力する相互作用単位領 域720と、が表示されている。

 文献単位の検索条件で検索を実行する場 には、文献単位領域710において、「使用」 あらわすチェックボックス711にチェック入 し、文献単位の検索条件で検索を実行しな 場合には、「不使用」をあらわすチェック ックス712にチェック入力する。図7では、チ ェックボックス711にチェック入力されている 。

 また、キーワード入力欄713には、ユーザ 自由にキーワードを入力する。図7では、キ ーワードとして「Diabetes Mellitus」が入力され ている。また、出版年月入力欄714,715に出版 月を入力することにより、検索対象となる 学文献を絞り込むこともできる。

 また、相互作用単位の検索条件で検索を 行する場合には、相互作用単位領域720にお て、「使用」をあらわすチェックボックス7 16にチェック入力し、相互作用単位の検索条 で検索を実行しない場合には、「不使用」 あらわすチェックボックス717にチェック入 する。図7では、チェックボックス716にチェ ック入力されている。したがって、図7の入 例では、文献単位で、かつ相互作用単位に り検索を実行することとなる。

 また、分子Aの入力領域721-1は、分子Aの分 子タイプおよび標準分子名を検索条件として 入力することができ、分子Bの入力領域722-1は 、分子Bの分子タイプおよび標準分子名を検 条件として入力することができ、相互作用 入力領域723-1は、相互作用タイプおよび相互 作用の方向を検索条件として入力することが できる。また、指定ボタン730をクリックする と、あらたに相互作用の検索条件を入力する ことができる。

 図7-2は、指定ボタン730のクリック後の検 画面700を示す説明図である。図7-2において 、あらたな入力領域721-2,722-2,723-3が出現す 。このように、指定ボタン730をクリックす 度に、入力領域{721-1,722-1,723-1},{721-2,722-2,723-2 },・・・が出現して、あらたな検索条件を入 することができる。

 検索条件を入力した後、描画ボタン740を リックすると、医学文献の検索処理、相互 用の特定情報の取得処理、分子ネットワー 510の生成処理を実行する。そして、生成さ た分子ネットワーク510が表示画面500に表示 れる。

 また、図6において、検索部602は、医学文 献DB200の中から入力部601によって入力された 索条件に一致または関連する医学文献を検 する機能を有する。具体的には、たとえば 図7-1や図7-2に示した文献単位領域710のチェ クボックス711にチェック入力されている場 には、文献単位領域710に入力された検索条 と一致または関連する医学文献を医学文献D B200から検索する。検索結果は、医学文献の 献IDの集合となる。

 より具体的には、キーワード入力欄713に 力されたキーワード(入力キーワード)と一 するキーワードが含まれている医学文献や 入力キーワードと一部一致する医学文献を 索する。また、入力欄714,715により出版年月 期間が指定されている場合には、当該期間 出版年月とする医学文献に絞り込むことが きる。

 また、図7-1や図7-2に示した相互作用単位 域720のチェックボックス716にチェック入力 れている場合には、相互作用単位領域720に 力された検索条件と一致または関連する医 文献を医学文献DB200から検索する。より具 的には、入力領域721-1により分子Aが特定さ ている場合には、分子Aの分子タイプまたは 準分子名が記述された医学文献の文献IDが 索される。

 また、入力領域722-1により分子Bが特定さ ている場合には、分子Bの分子タイプまたは 標準分子名が記述された医学文献が検索され る。また、入力領域723-1により相互作用が特 されている場合には、相互作用のタイプお び方向が記述された医学文献の文献IDが検 される。

 なお、図7-1の入力例では、分子Aの分子タ イプが「化合物」、標準分子名が「Drug1」で り、かつ、分子Bの分子タイプが「タンパク 質」であり、かつ、相互作用方向が「⇒」( 子Aが⇒の左端、分子Bが⇒の右端)とする分 A,B間の相互作用が記述されている医学文献 文献IDが検索される。

 なお、医学文献DB200のMeSHタームは階層構 をとる構成であるため、下位階層のMeSHター ムを含めて検索することとしてもよい。具体 的には、たとえば、「Diabetes Mellitus, Type 2 (2型糖尿病)というMeSHタームがあるが、異な 階層に「Diabetes Mellitus, Lipoatrophic」が存在 るため、この属性を持つ医学文献も合わせ 検索することにより、より広範な相互作用 抽出することができる。

 また、図6において、取得部603は、相互作 用DB300の中から、検索部602によって検索され 医学文献に関連付けられている相互作用の 合を取得する機能を有する。具体的には、 とえば、検索された医学文献の文献IDをキ として、当該文献IDを有するレコードを相互 作用として相互作用DB300から抽出する。

 図8は、取得部603によって取得された相互 作用の集合を示す説明図である。相互作用の 集合800では、検索された文献IDの医学文献か 特定される相互作用がすべて網羅されるこ となるが、ここでは、簡単に説明するため タンパク質P1が分子A、タンパク質P2が分子B ある場合の取得結果のみを示している。

 また、図6において、生成部604は、取得部 603によって取得された相互作用の集合800によ り特定される分子ペアを連結することにより 、検索条件に応じた分子ネットワーク510を生 成する機能を有する。具体的には、たとえば 、分子Aと分子Bの組み合わせが同一であって 、相互作用タイプや相互作用の方向が医学 献により異なっているため、取得部603によ て取得された相互作用の集合800を集約する

 その集約方法を図8の相互作用の集合800を 用いて説明する。符号810は相互作用の集合800 の集約結果である。集約結果810を「非冗長相 互作用」と称す。相互作用の集合800は、分子 Aがタンパク質P1であり分子Bがタンパク質P2に 関する相互作用の集合である。

 この分子Aと分子Bの組み合わせにおいて 相互作用タイプおよび相互作用の方向の組 合わせごとに文献ID数の多数決を取り、最多 となった組み合わせを分子Aおよび分子B間の 冗長相互作用に決定する。図8の例では、相 互作用タイプ「活性化」でかつ相互作用の方 向「→」の文献ID数(=4個)が最多となる。

 そして、図8に示した集約処理を、相互作 用を特定する分子ペア(分子Aおよび分子B)ご におこない、各非冗長相互作用を共通する 子どうしで連結することにより、分子ネッ ワーク510を生成する。

 図9は、非冗長相互作用810の集合とその連 結結果を示す説明図である。図9において、 結結果910は分子ネットワーク510となる。な 、分子ネットワーク510において、分子タイ は図形であらわし、標準分子表記はその図 内の文字列であらわし、相互作用の方向は 印であらわし、相互作用タイプは矢印の種 によって表現している。

 また、分子ネットワーク510は単純な有向 ラフではなく、ノード自体に種類(タンパク 質、化合物、DNAなど)や、相互作用について 性(活性化、阻害、転写活性など)と、直接結 合が実験によって確認されているか否かの情 報が盛り込まれている。

(分子ネットワーク生成処理手順)
 つぎに、この発明の実施の形態にかかる分 ネットワーク分析支援装置100の分子ネット ーク生成処理手順について説明する。図10 、この発明の実施の形態にかかる分子ネッ ワーク分析支援装置100の分子ネットワーク 成処理手順を示すフローチャートである。

 図10において、まず、入力部601により検 条件を入力する(ステップS1001)。具体的には たとえば、図7-1や図7-2に示した検索画面700 ユーザ操作により各種検索条件を入力する そして、描画ボタン740のクリックが検出さ るまで待ち受ける(ステップS1002:No)。

 そして、描画ボタン740のクリックが検出 れた場合(ステップS1002:Yes)、検索部602によ 、検索条件に一致または関連する医学文献 文献IDを検索する(ステップS1003)。そして、 得部603により、相互作用DB300から分子ペアご とに相互作用の集合を取得する(ステップS1004 )。

 つぎに、生成部604により、分子ペアごと 相互作用の集合を集約する(ステップS1005)。 これにより、分子ペアごとの非冗長相互作用 を得ることができる。そして、非冗長相互作 用を共通する分子どうしで連結する(ステッ S1006)。これにより、分子ネットワーク510を 成することができる。そして、このあと、 示画面500に分子ネットワーク510を表示する( テップS1007)。

 このように、上述した生成部604によれば 膨大な相互作用が数珠状に連なったパスウ イの中から、ユーザが分析したい分子ネッ ワーク510のみを抽出することができる。

(関連強度算出/経路探索処理部502の機能的構 )
 つぎに、図5に示した関連強度算出/経路探 処理部502の機能的構成について説明する。 11は、図5に示した関連強度算出/経路探索処 部502の機能的構成を示すブロック図である 図11において、関連強度算出/経路探索処理 502は、指定部1101と、抽出部1102と、算出部11 03と、表示制御部1104と、選択部1105と、探索 1106と、から構成されている。

 まず、指定部1101は、任意の生体内現象の 指定を受け付ける機能を有する。生体内現象 とは、疾患、病気など生体内で発生する現象 である。具体的には、たとえば、ユーザ操作 により生体内現象の名称となるMeSHタームを 力することにより、生体内現象の指定が受 付けられる。このような生体内現象を指定 体内現象と称す。

 図12は、分子ネットワーク510の表示画面 示す説明図である。図12の表示画面1200は、 7-1または図7-2に示した描画ボタン740をクリ クすることで表示される画面である。入力 1201は生体内現象名を入力する入力欄である ここでは、「Diabetes Mellitus,Type 2」(二型糖 病)が入力されている。そして、適用ボタン 1202をクリックすることで、生体内現象の指 が受け付けられる。

 また、図11において、抽出部1102は、生体 現象が指定された場合、分子ネットワーク5 10の中から任意の相互作用を抽出する機能を する。分子ネットワーク510は非冗長相互作 を連結したネットワークであるため、抽出 れる相互作用は、非冗長相互作用となる。 体的には、たとえば、図9に示した非冗長相 互作用810の集合の中から非冗長相互作用を抽 出する。

 また、算出部1103は、指定生体内現象と抽 出部1102によって抽出された相互作用(非冗長 互作用)との関連強度を算出する機能を有す る。ここで、生体内現象と相互作用との関連 強度は、生体内現象と相互作用との結びつき の強さをあらわす情報である。この情報を数 値であらわす場合、数値が高いほど関連強度 が強いこととなる。なお、関連強度の算出対 象となる相互作用を特定する分子ペアを「対 象分子ペア」と称す。

 この関連強度S1は、たとえば、下記式(1)~( 3)のスコアにより算出することができる。

 S1=Log(X/Y)・・・(1)
 X=X2/X1・・・(2)
 Y=Y2/Y1・・・(3)

 X1は、MEDLINEにおける医学文献集合全体の ち、対象分子ペアが出現した医学文献集合 文献数である。また、X2は、指定生体内現 (MeSHターム)が出現した医学文献集合のうち 対象分子ペアにより特定される相互作用が 現した医学文献集合の文献数である。

 Y1は、MEDLINEにおける医学文献集合全体か 抽出された全分子ペアにより特定される相 作用が出現した医学文献集合の文献数であ 。また、Y2は、指定生体内現象(MeSHターム) 出現した医学文献集合のうち、全分子ペア より特定される相互作用が出現した医学文 集合の文献数である。

 図13は、分子ペアごとの相互作用(非冗長 互作用)と指定生体内現象との関連強度S1を す説明図である。図13において、関連強度S1 の大きさに応じて対応色が決定される。対応 色は、分子ネットワーク510の相互作用をあら わすエッジ(矢印)に施される着色である。

 なお、算出部1103において、同一の相互作 用タイプや、方向性の有無、同一分子ペアの 種別などの条件を限定することにより、関連 強度S1を算出することとしてもよい。また、M eSHタームの構造を利用することにより、関連 強度S1を算出することとしてもよい。これに り、指定生体内現象に特異的な分子ペアを 定することができ、疾患メカニズムの解明 役立たせることができる。また、関連強度S 1は、2値でなく連続値で算出されるため、こ 関連強度S1をキーにして相互作用群をソー することにより着目すべき相互作用を段階 に把握することができる。

 図14は、関連強度S1のマッピング画面を示 す説明図である。このマッピング画面1400は 図12に示した適用ボタン1202をクリックする とにより表示される。

 また、算出部1103は、指定生体内現象と相 互作用を特定する対象分子ペアの各分子との 関連強度S2を算出する。この関連強度S2は、 とえば、式(3)~(5)のスコアにより算出するこ ができる。

 S2=Log(x/Y)・・・(4)
 x=x2/x1・・・(5)

 x1は、MEDLINEにおける医学文献集合全体の ち、対象分子ペアの分子が出現した医学文 集合の文献数である。また、x2は、指定生 内現象(MeSHターム)が出現した医学文献集合 うち、対象分子ペアの分子により特定され 相互作用が出現した医学文献集合の文献数 ある。

 図15は、相互作用(非冗長相互作用)を特定 する分子と指定生体内現象との関連強度S2を す説明図である。図15において、関連強度S2 の大きさに応じて対応色が決定される。対応 色は、分子ネットワーク510の相互作用をあら わすエッジ(矢印)に施される着色である。

 また、相互作用との関連強度S1が低く特 性が現れないが、分子単位の関連強度S2が高 くなって特異性が現れる場合がある。このよ うな場合には、関連強度S2を用いて関連強度S 1を補正することにより、指定生体内現象に する分子の関与を強調することができる。 の補正は、たとえば、下記式(6),(7)によりあ わされる。

 S1’=S1×w1+S2av×w2・・・(6)
 S2av=(S2A+S2B)/2・・・・(7)

 ここで、S1’は関連強度S1の補正後の関連 強度であり、w1は関連強度S1に対する重みで り、w2は、関連強度S2avに対する重みである w1,w2はあらかじめ設定されている。

 また、S2Aは対象分子ペアの分子Aと指定生 体内現象との関連強度であり、S2Bは対象分子 ペアの分子Bと指定生体内現象との関連強度 あり、S2avは、関連強度S2Aと関連強度S2Bとの 均値である。

 たとえば、図13に示した分子A(タンパク質 P5)と分子B(タンパク質P2)との分子ペアの関連 度S1は「1.33」と低い値である一方、図15に した分子A(タンパク質P5)の関連強度S2は「9.14 」、分子B(タンパク質P2)の関連強度S2は「28.35 」となっており、関連強度S1よりも高い値と っている。

 ここで、重みw1をw1=0.8、w2をw2=0.2として、 上記式(6)、(7)に代入すると、補正後の関連強 度S1’はS1’=4.813となり、補正前よりも高い に補正することができる。したがって、後 する探索処理においてその分子への経路も 患に関与すると見て探索のプライオリティ 上昇させることができる。

 また、図11において、表示制御部1104は、 12に示したように、表示画面500を制御する とにより分子ネットワーク510を表示する機 を有する。また、図14に示したように、相互 作用をあらわすエッジや分子をあらわすノー ドに関連強度S1,S2に対応する対応色を施すこ により、分子ネットワーク510を表示するこ もできる。

 また、指定生体内現象との共起回数(たと えば、図13に示した文献IDの数)に応じて強調 示することとしてもよい。これにより、各 象分子ペアが指定生体内現象で確認がとれ いるか否かを一目で把握することができる 図14に示した分子ネットワーク510では、「Dr ug1」が指定生体内現象において有意に変動し ている部分を段階的に強調表示している。

 たとえば、関連強度S1が10ポイント以上で かつ共起カウントが5カウント以上を赤、関 強度S1が5ポイント以上でピンク、関連強度S1 が3ポイント以上で青、共起カウントが1カウ トでも存在するものを灰色、関連強度S2が2 イント未満を黒色としてエッジコネクショ に着色する。これらの条件はグラフィカル ーザインタフェースで変更可能にすること より、関連強度S1などが似通った値になっ 場合にスコア指標を変化させることで、ユ ザが着目すべき関係性を示すこともできる

 なお、選択部1105および探索部1106につい 説明する前に、ここで、関連強度算出/表示 理手順について説明する。図16は、関連強 算出/表示処理手順を示すフローチャートで る。図16において、まず、指定部1101により 図12に示したように入力欄1201に生体内現象 をユーザ操作により入力することで、生体 現象の指定を受け付ける(ステップS1601)。

 つぎに、適用ボタン1202のクリックが検出 されるまで待ち受け(ステップS1602:No)、検出 れた場合(ステップS1602:Yes)、抽出部1102によ 、分子ネットワーク510の中から関連強度S1が 算出されていない未処理の(非冗長)相互作用 あるか否かを判断する(ステップS1603)。

 未処理の相互作用がある場合(ステップS16 03:Yes)、その相互作用を抽出する(ステップS160 4)。そして、算出部1103により、指定生体内現 象と抽出された相互作用との関連強度S1を算 して(ステップS1605)、ステップS1603に戻る。

 また、ステップS1603において、未処理の 互作用がない場合(ステップS1603:No)、相互作 ごとに算出された関連強度に応じて分子ネ トワーク510のエッジを強調表示する(ステッ プS1606)。

 このように、相互作用との関連強度S1に じてそのエッジを強調表示することにより 各相互作用が指定生体内現象で確認がとれ いるか否かを一目で把握できる。また、相 作用との関連強度S1は、報告されている医学 文献数に依存するため、ポピュラーな関係で あれば可視化することができるという利点が あるが、統計的手法であるがために、本来の メカニズムを可視化できない場合もある。

 このようなケースをカバーするために、 子との関連強度S2を用いて相互作用との関 強度S1を補正することにより、その分子への 経路も疾患に関与すると見て探索のプライオ リティを上昇させることができる。これによ り実験データなしで、ユーザが実験の仮説を 構築するための手がかりを増やすことができ る。

 つぎに、図11に示した選択部1105および探 部1106について説明する。選択部1105は、分 ネットワーク510を構成するノードの中から 始ノードとなる分子の選択を受け付ける機 を有する。具体的には、たとえば、図14に示 したマッピング画面1400における開始分子の 力欄1401に、ユーザ操作により開始ノードと る分子の標準分子表記が入力されることで 開始分子の選択を受け付ける。

 図17は、開始ノードとなる分子の選択受 付け後のマッピング画面1400を示す説明図で る。図17(図14も同様)において、米印は既知 体内現象をあらわしている。既知生体内現 は、指定生体内現象との因果関係が確認さ ている遺伝子やタンパク質のIDをキーとし 薬理DB400にアクセスすることにより、既知生 体内現象が発生するか否かを判断することが できる。

 たとえば、薬理DB400に「二型糖尿病で遺 子(DNA1)が過剰発現した。」という情報が保 されている場合、分子ネットワーク510中、 準分子表記「DNA1」のノードに既知生体内現 が発生することが判明する。したがって、 該ノード近傍に米印を表示しておく。

 また、探索部1106は、開始ノードから既知 生体内現象を発生するノードまでの経路を探 索し、探索結果1110を出力する機能を有する 探索部1106は、相互作用をあらわすエッジ(矢 印)の方向にしたがって探索する。また、2以 のエッジに分岐する場合には、関連強度S1 値が高いエッジを優先的に選択する。

 またこの場合、算出部1103により、探索経 路についても関連強度S3を算出する。生体内 象と探索経路との関連強度S3は、探索中の 相互作用との関連強度S1の調和平均、相加平 均、相乗平均により算出することができる。 このうち、調和平均を用いることにより、突 出した関連強度S3を持つ相互作用に引きずら にくくなるため、各相互作用ペアをリスペ トでき、この問題に合致する。

 関連強度S3は、下記式(8)により算出する とができる。

 式(8)中、f(a)は、相互作用と指定生体内現 象との関連強度S2に基づく関数であり、常用 数を取ってもよいし、閾値を設定して足き してもよい。Nは探索経路における相互作用 数である。すなわち、探索経路のノード数か ら1引いた値となる。

 また、g(a)は直接結合の有無をあらわす関 数であり、0<g(a)≦1の値を取る。たとえば 直接結合する場合はg(a)=1とし、直接結合が 認されていない場合、ドメイン単位では確 されている場合はg(a)=0.7とする。また、直接 結合の報告がされていない場合はg(a)=0.5、直 結合しないことが分かっている場合はg(a)=0. 3とする。

 図18は、探索部1106による探索結果1110を示 す説明図である。図18において、探索結果1110 として、探索経路(の経路ID)ごとに、開始ノ ドの標準分子表記および分子タイプ、終了 ード(生体内現象が発生するノード)の標準分 子表記および分子タイプ、探索経路、探索経 路の関連強度S3を得ることができる。

 また、図18に示したように、全探索経路 ついて指定生体内現象との関連強度S3を算出 し、結果をソートすることにより、ソート結 果1800が得られ、指定生体内現象に密接に関 る探索経路を優先的に選択することができ 。これにより、ユーザの観点に適合した疾 経路を抽出することができる。したがって 創薬研究の加速化を実現することができる

 また表示制御部1104により、関連強度S3の い順にエッジを強調表示したり、ユーザの タンクリックにより、関連強度S3の高い探 経路を表示することもできる。図19は、探索 経路を表示したマッピング画面1400を示す説 図(その1)である。探索経路R1は、図18に示し ランク1位の探索経路(経路ID:003)である。

 また、Nextボタン1701をクリックすると、 点(ランク2位)の探索経路が表示される。図20 は、探索経路を表示したマッピング画面1400 示す説明図(その2)である。探索経路R2は、図 18に示したランク2位の探索経路(経路ID:006)で る。また、Nextボタン1701をクリックすると 次点(ランク3位)の探索経路が表示される。 方、Prevボタン2001をクリックすると1ランク の探索経路が表示される。

 また、算出部1103では、上記式(8)により、 相互作用との関連強度S1を用いて探索経路の 連強度S3を算出することとしたが、下記式(9 )のように、各ノードとの関連強度S2を重みと して補助的に利用した算出式を用いてもよい 。

 式(9)中、h(a)は、対象分子との関連強度S2 相加平均、相乗平均または調和平均などを いて算出する。常用対数をとった結果をh(a) としてもよい。この場合、相互作用との関連 強度S1が高くなくても、分子との関連強度S2 高ければ、この対象分子ペアの探索経路が 択される確率が増大する。

 図21は、探索部1106による探索結果1110をソ ートしたソート結果2100を示す説明図である 図21では、上記式(9)によって算出された関連 強度S3により探索結果1110がソートされている 。

 図22は、探索経路を表示したマッピング 面1400を示す説明図(その3)である。探索経路R 1は、図21に示したランク1位の探索経路(経路I D:006)である。図23は、探索経路を表示したマ ピング画面1400を示す説明図(その4)である。 探索経路R2は、図21に示したランク2位の探索 路(経路ID:003)である。

 つぎに、開始ノード選択/経路探索処理手 順について説明する。図24は、開始ノード選 /経路探索処理手順を示すフローチャートで ある。図24において、まず、選択部1105により 、図12に示したように入力欄1201に開始ノード となる分子名をユーザ操作により入力するこ とで、開始ノードとなる分子の選択を受け付 ける(ステップS2401)。

 つぎに、Nextボタン1701のクリックが検出 れるまで待ち受け(ステップS2402:No)、検出さ た場合(ステップS2402:Yes)、探索部1106による 路探索処理を実行する(ステップS2403)。

 このあと、図19、図20、図22、図23に示し ように、表示制御部1104により、探索経路を 子ネットワーク510とともに表示画面500に表 する(ステップS2404)。ステップS2404では、最 に、関連強度が最高ポイントの探索経路を 示し、その後は、Nextボタン1701やPrevボタン2 001のクリックに応じて探索経路を表示する。

 つぎに、ステップS2403で示した経路探索 理の詳細な処理手順について説明する。図25 は、経路探索処理(ステップS2403)の詳細な処 手順を示すフローチャートである。図25にお いて、開始ノードおよび終了ノードが設定さ れた状態で、すべての経路を網羅するように 探索する(ステップS2501)。探索経路には、経 ID:i(i=1,2,・・・,n)が割り振られる。

 そして、探索経路数をnとすると、経路ID: i=1とし(ステップS2502)、i>nであるか否かを 断する(ステップS2503)。i>nでない場合(ステ ップS2503:No)、算出部1103により、経路ID:iの関 強度S3を算出する(ステップS2504)。そして、i を1つインクリメントして(ステップS2505)、ス ップS2503に戻る。

 一方、ステップS2503において、i>nであ 場合(ステップS2503:Yes)、図18に示したように 関連強度S3が降順となるように探索結果1110 ソートする(ステップS2506)。このあと、ステ ップS2404に移行する。

 このように、すべての探索経路に指定生 内現象との関連強度S3を算出し、探索結果11 10をソートすることにより、指定生体内現象 密接に関わる探索経路を優先的に選択する とができ、分子ネットワーク510からユーザ 観点に適合した疾患経路を抽出することが き、創薬研究を加速することができる。

(経路探索の他の例)
 つぎに、経路探索の他の例について説明す 。上述した探索部1106による経路探索処理は 、指定生体内現象である場合のポピュラーな 経路を把握するために有用であるが、ここで は、ユーザによってはあまり研究されていな い新規的な分子ペアや探索経路を創出する。

 具体的には、たとえば、探索経路を構成 る相互作用の中から不安定な相互作用を検 する検出機能と、検出された不安定な相互 用の方向を反転させた方向反転後の分子ネ トワーク510を生成する生成機能を追加する これにより、ユーザによってはあまり研究 れていない新規的な分子ペアや探索経路を 出することができる。

 ここで、不安定な相互作用とは、相互作 集合において非冗長相互作用が僅差で決定 れた場合、その非冗長相互作用は、「不安 な相互作用」となる。たとえば、相互作用 方向が一方の方向として記述されている文 ID数と相互作用の方向が他方の方向として 述されている文献ID数との差が所定値以内で ある場合、不安定な相互作用となる。したが って、多数決で決定された方向を反転して、 あらたな分子ネットワーク510を生成する。

 図26は、相互作用の方向反転後の分子ネ トワーク510を示す説明図である。図26におい て、分子ペアP5,P3間の相互作用の方向が反転 た分子ネットワーク2600が生成され、マッピ ング画面1400に表示されている。探索経路Qは この方向反転によりあらたに探索された探 経路である。これにより、方向反転後の相 作用(エッジe)とその探索経路Qとを創出する ことができる。

 つぎに、この場合の経路探索処理につい 説明する。図27は、経路追加処理を有する 路探索処理手順を示すフローチャートであ 。なお、図25に示した処理ステップと同一ス テップには同一ステップ番号を付し、その説 明を省略する。図27において、ステップS2503:Y esとステップS2506との間において経路追加処 を実行する(ステップS2700)。

 図28は、経路追加処理(ステップS2700)の詳 な処理手順を示すフローチャートである。 ず、分子ネットワーク510を構成する相互作 の中から不安定な相互作用が検出されたか かを判断する(ステップS2801)。すなわち、不 安定な相互作用の数をm個とした場合、m>0 あるか否かを判断する。m>0でない場合(ス ップS2801:No)、不安定な相互作用がないため ステップS2506に移行する。

 一方、m>0である場合(ステップS2801:Yes)、M( M=2 m -1)通りの分子ネットワーク510を生成する(ス ップS2802)。あらたに生成されたM通りの分子 ットワーク510には、ネットワークID:j(j=1,2, ・・,M)が割り振られる。

 つぎに、ネットワークID:j=1として(ステップ S2803)、j>Mであるか否かを判断する(ステッ S2804)。j>Mでない場合(ステップS2804:No)、ネ トワークID:jの分子ネットワーク510を経路探 索する(ステップS2805)。探索経路には経路ID:i( i=1,2,・・・,n j )が割り振られる。

 つぎに、経路ID:i=1として(ステップS2806)、i&g t;n j であるか否かを判断する(ステップS2807)。i> n j でない場合(ステップS2807:No)、算出部1103によ 、経路ID:iの関連強度S3を算出する(ステップ S2808)。このあと、経路ID:iを1つインクリメン して(ステップS2809)、ステップS2807に戻る。

 一方、ステップS2807において、i>n j である場合(ステップS2807:Yes)、ネットワークI D:jを1つインクリメントして(ステップS2810)、 テップS2804に戻る。また、ステップS2804にお いて、j>Mである場合(ステップS2804:Yes)、す ての分子ネットワーク510の経路探索が終了 たので、ステップS2506に移行する。

 このように、不安定な相互作用を検出し その方向を反転させることで、ユーザによ てはあまり研究されていない新規的な分子 アや探索経路を創出することができる。

 上述した実施の形態における、相互作用 生体内現象での、関連強度の算出方法は、 伝子の連鎖解析にも用いられている。しか 本実施の形態では、遺伝子の連鎖解析とは なり、計算対象に「医学文献に付与されたM eSHターム群」と「相互作用」を設定する。こ れにより、「相互作用」にMeSHタームの持つ 医学・生物学的意味を、数値的に付与する とができる。したがって、分子ネットワー 510において今までできなかった個々の相互 用と指定生体内現象との結びつきを可視的 表現することができる。

 また、相互作用に対して、医学・生物学 な意味をもつ数値が、関連強度として付与 れたため、特定の生体内現象と関連性の深 探索経路をパスウェイから機械的に選択す ことができる。

 また、パスウェイ中の相互作用に医学・ 物学的な意味との関連強度を付与している め、従来手法では、得られなかった経路探 が可能となり、あらたな生体内現象を考察 ることができる。

 また、複雑多岐に発散したパスウェイを 路探索により簡略化することができるため そのパスウェイの構成要素である相互作用 記述した文献数もまた減少する。よって、 択された経路の医学・生物学的な意味に関 て、その詳細を確認する際に、読まなけれ ならない文献数を減らすことができる。

 また、パスウェイに対する機械的な経路 択は、膨大な医学文献群に記述された、医 ・生物学的に意味のある用語、いわゆるMeSH タームを、データマイニングによって統計的 に処理し、その統計量をパスウェイに付与す ることで可能になる。このような、膨大な医 学文献群に対する機械的処理は、背景技術の 欄で述べた人間の手によるキュレーションで は不可能である。よって、本実施の形態によ り得られる医学・生物学的な意味は、人間の 経験などから来る固定観念の範疇を超えた、 非常に新規性の高い発見につなげることがで きる。

 また、キュレーションと異なり、パスウ イ中の相互作用や分子に対して、機械的に 学・生物学的意味をもつ関連強度をスコア して付与する。したがって、算出に用いら るPubMedなどの医学文献に関するデータの増 ・更新があった場合でも、機械的かつ即座 対応することができる。そうすることによ 、研究者らが投稿する医学文献の更新状況 、即座にパスウェイに反映させ、パスウェ の持つ生物・医学的意味の固定化を避け、 究状況に応じたパスウェイ更新を容易にす ことができる。

 また、既存の医学文献から得られる相互 用を基に、パスウェイの描画と経路選択を 能にしているので、ユーザ(研究者)は自ら 験することなく、医学・生物学的に意味の る現象を考察し、あらたな研究対象を見出 、すなわち仮説を構築することができる。

 以上のことから、上述した実施の形態に れば、疾患と密接に関わる分子間相互作用 推定することにより、膨大な経路の中から 物学的意味のある経路を効率的に得ること できる。したがって、生体内のメカニズム 対する仮説構築と考察を、効率的におこな ことができ、製薬企業や学術機関において 生命科学に取り組む研究者に対する負荷を 減することができる。

 また、負荷の軽減だけでなく、研究者に して新発見を促すこともできる。また、常 あらたな知識を反映させたパスウェイを研 者に提供することで、研究の進歩や時代的 遷による、知見の陳腐化を回避することが きる。

 なお、本実施の形態で説明した分子ネッ ワーク分析支援方法は、予め用意されたプ グラムをパーソナル・コンピュータやワー ステーション等のコンピュータで実行する とにより実現することができる。このプロ ラムは、ハードディスク、フレキシブルデ スク、CD-ROM、MO、DVD等のコンピュータで読 取り可能な記録媒体に記録され、コンピュ タによって記録媒体から読み出されること よって実行される。またこのプログラムは インターネット等のネットワークを介して 布することが可能な伝送媒体であってもよ 。

 以上のように、本発明にかかる分子ネッ ワーク分析支援装置、分子ネットワーク分 支援方法、および分子ネットワーク分析支 プログラムは、パスウェイなどの分子ネッ ワークの分析支援に有用である。