Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD OF DIAGNOSING INTEGRATION DYSFUNCTION SYNDROME
Document Type and Number:
WIPO Patent Application WO/2009/157251
Kind Code:
A1
Abstract:
Disclosed is a novel means whereby integration dysfunction syndrome can be highly accurately and objectively diagnosed with the use of the blood of a patient as a sample. A method of detecting integration dysfunction syndrome with the use, as indications, of the expression amounts of ten specific genes in a sample separated from living body. According to this method, integration dysfunction syndrome can be objectively diagnosed at a high accuracy. By using a number of specimens, it is confirmed that both of the detection sensitivity (i.e., true positive ratio) and the specificity (i.e., true negative ratio) exceed 80%. Since blood is usable as the specimen, this method can be conveniently carried out.

Inventors:
AOSHIMA HIDEYUKI (JP)
TAKEMURA KAZUO (JP)
IIJIMA KENTARO (JP)
HAYASHI HIROSHI (JP)
Application Number:
PCT/JP2009/057861
Publication Date:
December 30, 2009
Filing Date:
April 20, 2009
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SRL INC (JP)
AOSHIMA HIDEYUKI (JP)
TAKEMURA KAZUO (JP)
IIJIMA KENTARO (JP)
HAYASHI HIROSHI (JP)
International Classes:
C12Q1/68; C12N15/09; G01N33/50; G01N37/00
Domestic Patent References:
WO2008024114A12008-02-28
WO2009001095A22008-12-31
Foreign References:
US20050209181A12005-09-22
US20040024727A12004-02-05
Other References:
HAKAK Y. ET AL.: "Genome-wide expression analysis reveals dysregulation of myelination- related genes in chronic schizophrenia.", PROC. NATL. ACAD. SCI. USA, vol. 98, 2001, pages 4746 - 4751
LEWIS D.A ET AL.: "Transcriptome alterations in schizophrenia: disturbing the functional architecture of the dorsolateral prefrontal cortex.", PROG. BRAIN RES., vol. 158, 2006, pages 141 - 152
YASUSHI KAJII: "Bunretsubyo Kanren Idenshi", SAISHIN SEISHIN IGAKU, vol. 6, 2001, pages 529 - 536
Attorney, Agent or Firm:
TANIGAWA, Hidejiro (JP)
Mountain stream Eijiro (JP)
Download PDF:
Claims:
 生体から分離された試料における下記(1)~(10)の遺伝子群の発現量を指標とする、統合失調症の検出方法。
(1) DLGAP3(配列番号1)
(2) KCNJ15(配列番号2)
(3) GPR30(配列番号3)
(4) NPCR(配列番号4)
(5) TMED1(配列番号5)
(6) PAFAH2(配列番号6)
(7) TMEM23(配列番号7)
(8) ABCG1(配列番号8)
(9) PGRMC1(配列番号9)
(10) INSL3(配列番号10)
 上記(1)~(10)の遺伝子群の発現量のみを指標とする請求項1記載の方法。
 前記遺伝子群の発現量は、配列番号34、配列番号42、配列番号77、配列番号81、配列番号98、配列番号109、配列番号122、配列番号165、配列番号200及び配列番号218に示される塩基配列を有するオリゴヌクレオチドプローブにより測定される、請求項1又は2記載の方法。
 前記試料における前記遺伝子群の発現量を、あらかじめ測定した、既知の統合失調症患者及び健常者における前記遺伝子群の発現量と対比する工程を含む、請求項1ないし3ののいずれか1項に記載の方法。
 前記対比は、既知の統合失調症患者及び健常者における前記遺伝子群の発現量を用いて変数増加法により学習させたニューラルネットワークにより行なわれる請求項4記載の方法。
 前記対比は、前記遺伝子群の発現量を説明変数として用いた重回帰分析により行なわれる請求項4記載の方法。
 前記試料について計算された従属変数を、既知の統合失調症患者及び健常者について計算された従属変数に基づいて定められたカットオフ値と対比することを含む、請求項6記載の方法。
 前記遺伝子群の発現量は、配列番号11~226に示される塩基配列を有するオリゴヌクレオチドプローブがスポットされたアレイにより測定される遺伝子発現量のシグナル強度をグローバルノーマライゼーション法により正規化したものである、請求項3ないし7のいずれか1項に記載の方法。
 前記アレイは配列番号227~525に示される塩基配列を有するオリゴヌクレオチドプローブをさらに含む、請求項8記載の方法。
 前記試料は血液である請求項1ないし9のいずれか1項に記載の方法。
Description:
統合失調症の診断方法

 本発明は、血液を試料とした統合失調症 診断方法に関する。

 日本国内における統合失調症の発症率は 口の約0.8%であり、主に青年期に発症する。 該疾患の予後は多様である。概ね全体の1/3の 患者については、顕著で継続的な改善をみる 。1/3はいくらか改善するが,間欠性再発と残 性障害を残す。残りの1/3は重篤で,永久的に 力が失われ、社会的機能遂行に支障をきた 重大な精神疾患である。

 統合失調症の治療では早期の治療が重要 ある。従来、統合失調症の診断としては、 国精神医学会(APA)が制定した精神疾患の診 ・統計マニュアルであるDSM-IV (Diagnostic and  Statistical Manual of Mental Disorders-IV) による包 括的評価に基いて下される。しかし、このよ うな方法では、診断医の主観や技量に大きく 依存するため、該疾患を客観的かつ早期に診 断することは困難である。

 統合失調症の生物学的マーカー等を用い 客観的な診断方法が確立すれば、早期診断 早期治療が可能になり、重症化の回避や治 率の向上が可能になる。現在までに報告さ ている、生物学的マーカーを用いた診断方 としては、例えば、上皮細胞成長因子の血 中濃度を指標として精神分裂病(統合失調症 )を診断する方法(特許文献1)や、血液を試料 して用い、特定の遺伝子の発現量を指標と る方法がある(特許文献2)。しかしながら、 許文献1及び2記載の方法は、診断の精度が未 だ満足することができない。

特許第3706913号公報

特開2004-135667号公報

 従って、本発明の目的は、患者血液を試 として高い精度で客観的に統合失調症を診 することができる手段を提供することにあ 。

 本願発明者らは、血液を試料として用い 約55000種類の遺伝子の発現量を健常人と統 失調症患者の間で比較し、発現量が有意に 動する遺伝子を選び、さらに後述する本願 明者らが独自に考え出した基準で絞込み、 れをニューラルネットワークを駆使した変 増加法とcross validation法にかけて遺伝子群の 一次選択を行い、一次選択された遺伝子群に さらに本願発明者らが独自に選定したかなり の数の分類予測候補遺伝子を付加した遺伝子 群を搭載した低コストで汎用性の高いマイク ロアレイを作成し、上記と同様にニューラル ネットワークで処理し、構築された分類予測 アルゴリズムにより、検出の感度(真陽性率) び特異度(真陰性率)が80%以上となることを 際の多数の検体を用いて確認し、本発明を 成した。

 すなわち、本発明は、生体から分離された 料における下記(1)~(10)の遺伝子群の発現量 指標とする、統合失調症の検出方法を提供 る。
(1) DLGAP3(配列番号1)
(2) KCNJ15(配列番号2)
(3) GPR30(配列番号3)
(4) NPCR(配列番号4)
(5) TMED1(配列番号5)
(6) PAFAH2(配列番号6)
(7) TMEM23(配列番号7)
(8) ABCG1(配列番号8)
(9) PGRMC1(配列番号9)
(10) INSL3(配列番号10)

 本発明により、高い精度で客観的に統合 調症を診断することができる手段が初めて 供された。

本発明の実施例で行った、ニューラル ットワークによる分類予測モデルにおける プローブ数と正答率の関係を示す図である 重回帰分析により求めた学習例及び試 例の各検体の従属変数を示す図である。

 上記の通り、本発明は、(1)~(10)の遺伝子 の発現量を指標とする。各遺伝子の発現量 測定する試料は、生体から分離された試料 あれば特に限定されるわけではないが、下 実施例で詳述するとおり、上記遺伝子群は 血液を試料として用いて選定されたもので るので、血液を試料とすることが好ましい なお、上記遺伝子群には、統合失調症患者 おいて発現量が増大しているものも減少し いるものも含まれる。また、下記実施例に いて、検出の感度(真陽性率)及び特異度(真 性率)が80%以上となることが確認された上記1 0種類の遺伝子のみの発現量に基づいて判定 ることが好ましい。なお、下記実施例に具 的に記載するように、測定の精度を確保す 等のために、正規化のための種々の遺伝子 の他の遺伝子の発現量を同時に測定するこ は好ましいことであり、「上記10種類の遺伝 子のみの発現量に基づく」とは、上記10種類 遺伝子のみの発現量を分類予測の直接的な 数として用いるという意味である。また、 度を表わす真陽性率は、下記表1におけるa/( a+b)、特異度を表わす真陰性率は、1-偽陽性=d/ (c+d)である。また、正答率は、(a+d)/(a+b+c+d)で る。

 上記10種類の遺伝子の配列は、上記した 配列番号に記載されているが、各遺伝子のGe nBankアクセション番号、遺伝子産物、下記実 例で用いた、各遺伝子の発現量の測定に用 たプローブ番号及びその配列番号を下記表2 に示す。

 また、これらのうち、機能がよく知られ いる遺伝子の機能の説明と、統合失調症患 において健常者と比較して発現量が増える( 上向き矢印)のか減る(下向き矢印)のかを下記 表3に示す。

 試料中の各遺伝子の発現量の測定自体は 知の方法により行なうことができる。測定 法は、特に限定されないが、各遺伝子のセ ス鎖又はアンチセンス鎖とハイブリダイズ る一本鎖オリゴヌクレオチドプローブ、好 しくはDNAプローブが固定化されたDNAアレイ 用いる方法が簡便で好ましい。例えば、下 実施例に具体的に記載するように、血液か 全mRNAを抽出し、抽出したmRNAから、ビオチ 等で標識されたcRNAを調製し、各遺伝子由来 cRNAとハイブリダイズするオリゴヌクレオチ ドプローブが固定化されたアレイにcRNAを施 てcRNAとプローブとをハイブリダイズさせ、 レイを洗浄後、基板上に残留する標識量を 定することによりcRNA量、ひいてはmRNA量、 なわち遺伝子の発現量を測定することがで る。

 なお、固定化されるプローブは、cRNAと特 異的にハイブリダイズするサイズを有するも のであり、通常、18塩基~50塩基、好ましくは2 0塩基~40塩基程度のサイズを有する。また、 定化するプローブは、それがハイブリダイ するRNAの領域と完全に相補的であることが ましいが、下記実施例に具体的に記載する うな、DNAアレイを用いる際の通常のハイブ ダイズ条件下でハイブリダイズするもので れば少数(通常、1個か2個)のミスマッチがあ ても許容できる。従って、遺伝子に天然のS NPが生じている場合でも、同じDNAアレイを用 て測定可能である。

 下記実施例では、前記遺伝子群の発現量 、配列番号34、配列番号42、配列番号77、配 番号81、配列番号98、配列番号109、配列番号 122、配列番号165、配列番号200及び配列番号218 に示される塩基配列を有するオリゴヌクレオ チドプローブを用いて測定されており、これ らのプローブを固定化したDNAアレイを好まし く利用することができる。

 上記遺伝子群の発現量に基づく判定は、 本的には前記遺伝子群の発現量を、あらか め測定した、既知の統合失調症患者及び健 者における前記遺伝子群の発現量と対比す ことにより行われる。この対比は、既知の 合失調症患者及び健常者における前記遺伝 群の発現量を用いて変数増加法により学習 せたニューラルネットワークにより行なう とが好ましい。構築した学習済みのニュー ルネットワーク(構築方法は後述)に測定し 上記10種類の遺伝子の発現量を入力し、該ニ ューラルネットワークに分類される群の予測 確率を出力させ、この予測確率を判定基準と して統合失調症を検出することができる。

 あるいはまた、上記対比は、重回帰分析 より行なうことも好ましい。測定した上記1 2種類の遺伝子の発現量を説明変数とし、既 の統合失調症患者及び健常者における前記 伝子群の発現量を重回帰分析すると、予測 (重回帰式)を得ることができる。得られた予 測式に、被検者における上記遺伝子群の発現 量を入力して従属変数を求め、この従属変数 の数値を既知の統合失調症患者及び健常者の 従属変数と対比することで、該被検者が統合 失調症か否かを判別することができる。この 対比は、例えば、既知の統合失調症患者群と 健常者群の各検体について計算された従属変 数をもとに、両群を好ましく分類できる従属 変数の値をカットオフ値として定め、被検者 の従属変数をこのカットオフ値と対比するこ とにより行なうことができる。例えば、統合 失調症患者で従属変数が大きくなるように設 定して発現量を分析した場合、被検者につい て計算された従属変数の数値がカットオフ値 よりも大きければ、該被検者は統合失調症で あると予測することができる。カットオフ値 は、既知の統合失調症患者及び健常者につい て計算された従属変数をもとに、常法の統計 処理により適宜定めることができる。重回帰 分析の手法自体は周知であり、重回帰分析を 行なうソフトウェア等も種々のものが公知で 、市販品も多く存在する。本発明ではいずれ のソフトウェアを用いてもよい。なお、予測 式は、既知の患者及び健常者についての分析 を一度行なえば定めることができるので、実 施の都度既知の患者/健常者群についての分 を行なう必要はなく、一旦得られた予測式 その後に実施する際にも用いることができ 。

 なお、本発明において「重回帰分析」と った場合には、得られた重回帰式を用いて 料の従属変数を求める工程を含む分析方法 広く包含し、重回帰式を得るための分析工 は必ずしも含まれない。従って、上記した うに、既に求められた重回帰式を用いて統 失調症の検出を行う方法であれば、本発明 いう「重回帰分析により対比を行なう検出 法」に包含される。

 本発明で用いる発現量の測定値は、下記 施例に記載される通り、測定されるシグナ 強度をグローバルノーマライゼーション(glo bal normalization)法により正規化したものであ ことが好ましい。ここで、グローバルノー ライゼーション法とは、DNAマイクロアレイ に搭載した全遺伝子の発現量の中央値を求 、この中央値で各遺伝子の発現量を除する とで相対的発現量を算出する方法である。

 ニューラルネットワークを用いて本発明 方法を実施する場合、ニューラルネットワ ク自体は周知であり、市販のニューラルネ トワークを用いることができる。もっとも ニューラルネットワーク自体は市販品を利 できるが、本発明では、ニューラルネット ークに学習させるデータに特徴があり、い なるデータを学習させることにより感度(真 陽性率)及び特異度(真陰性率)の両者を80%以上 にできるかは工夫が必要である(後述)。

 ニューラルネットワークを用いた分類予 モデルの最適モデルは、例えば下記実施例 詳述する方法により構築することができる 簡単に説明すると、例えば、次のようにし 最適モデルを決定することができる。まず 多数の統合失調症患者及び健常者から採取 た試料を用い、種々の遺伝子の発現量を測 する。遺伝子の発現量は、上記の通り、DNA イクロアレイを用いて行なうことができる 下記実施例では、約55000種類のヒト遺伝子 DNAプローブが搭載された市販のDNAマイクロ レイを用いた。

 次に、DNAマイクロアレイを用いて測定し 発現量をデータクレンジングする。ここで データクレンジングは、例えば、全体の発 量の30%tile未満の遺伝子のプローブや98%tile 上の遺伝子のプローブを除外することによ 行なうことができる。

 多数の統合失調症患者及び健常者のDNAマ クロアレイのデータを、学習例と学習例と 立した試験例に分け、学習例をニューラル ットワークに学習させ、構築された分類予 モデルによりどの程度の感度及び特異度が 成されるかを試験例を用いて算出、評価を うHold out cross validation法により構築した。 分類予測モデル構築には、ニューラルネット ワークのパラメーターを変更して行い、学習 例と試験例に振り分けた検体の独立性は担保 して検証を続け、最も良い成績のモデルを採 用した。下記実施例では、統合失調症患者及 び健常者の2/3を学習例、1/3を試験例として用 いた。

 まず、ニューラルネットワークに学習さ る学習用データを準備する。下記実施例で 、Quality Flag "Good"以外のプローブ、Y染色体 上に座位する遺伝子のプローブ、mRNA 3'末端 ら遠位に設定されているプローブなどを除 し、約55,000個のプローブから10,498個のプロ ブに絞り込んだ。ここで、Quality Flagが "Goo d"とは、測定された発現量がスポット周囲の ックグラウンドの1.5SDより大きく、測定値 して信頼できるということを意味する。ま Y染色体上に座位する遺伝子は男性にしか存 しないため、女性の検査を行った際に検出 感度及び/又は特異度が下がる恐れがあるの で除外した。また、mRNA 3'末端から遠位に設 されているプローブは、cRNAの調製における バイアスを受けやすいため、測定値の大きな 変動要因であるため除外した。さらに、予備 分析により、欠損値が25%以上あるもの、男女 間の発現量の差が大きいもの、アレイ製造時 のバッチ間差が大きいものも除外した。

 次にこのようにして選択した各プローブ ついて測定された、各プローブがハイブリ イズするRNAが由来する遺伝子の発現量をニ ーラルネットワークに入力し、2群間検定(t 定)、すなわち、学習例の統合失調症(未投 )と健常者群の間で有意差検定(t検定)を行な 。なお、下記実施例では、試料の絞込みも なった。すなわち、健常者56例の中央値を ローブごとに計算し、そのデータセットを 象として各試料の相関を調べ、近似曲線の ラメータやシグナル強度比が大きく隔たっ ものは分析対象から除外した。

 有意差検定により有意差が認められたプ ーブについて変数増加法(forward selection)に る選択を行なう。変数増加法自体は周知で り、説明変数(各プローブの測定結果)を1つ つ足していき、目的変数(正答率)との相関が 高い組合せを得ることにより行なう。コンピ ューターにインストールされたニューラルネ ットワークを用いて変数増加法を行ない、最 も正答率が高いプローブ数を選択する。下記 実施例では、上記した10,498個のプローブの測 定値の中から、14種類のプローブの測定値を 明変数として用いた場合に正答率が最高に った。このようにして構築されたニューラ ネットワークの最適モデルによれば、感度 び特異度とも80%を超えたので、この最適モ ル及び上記DNAマイクロアレイを用いて統合 調症の検出を行なうことが可能であった。

 しかしながら、約55000種類のプローブを 載したDNAマイクロアレイは高価であり、1枚 マイクロアレイで1検体しか処理できないの で、実用化のためにはより低コストのマイク ロアレイを用いることが望まれる。そこで、 下記実施例では、上記で選択された14種類の ローブを含み、統合失調症と健常者の間で 意差があるプローブから216種類のプローブ 選択し、基板に搭載した。この216種類のプ ーブのうち、上記した14種類のプローブ以 の202種類のプローブは、統合失調症と健常 の間で有意差のあるプローブのほか、類似 た精神疾患である双極性障害患者と統合失 症患者間で統計学的有意差の認められる遺 子を選択した。さらにグローバルノーマラ ゼーションに用いるプローブ及び管理用プ ーブ(位置合わせ用)も搭載した(詳細は下記 施例)。グローバルノーマライゼーションに 、アレイ間での変動が小さなものを選択し 。この実用化アレイは、1枚の基板上に複数 (下記実施例では16個)のチャンバーを形成す ことができ、すなわち、1枚のアレイで16検 の検査を同時に行なうことができ、アレイ 製のコスト並びに検査のコスト及び手間を 幅に下げることができる。

 この実用化アレイを用いて測定された、 に特定された14種類のプローブの測定結果 、先に構築したニューラルネットワークの 類予測モデルに入力し、上記試験例を用い 感度及び特異度を算出したところ、健常者 感度及び特異度が80%未満となり、さらに別 試験例を用いて感度及び特異度を算出した ころ、統合失調症(未治療)及び健常者の感度 及び特異度とも80%未満となってしまった。

 そこで、実用化アレイを用いた測定値を 用して、上記と同様、コンピューターにイ ストールされたニューラルネットワークを いて、cross validation法及び変数増加法を駆 して、正答率が最高となるプローブの組合 を求めた。その結果、上記した10種類の遺伝 子が特定された。なお、上記10種類の遺伝子 、先に特定された14種類の遺伝子とは異な ものであり、両方に重複する遺伝子は2種類 みであった。

 上記した10種類の遺伝子のプローブの測 値を説明変数として入力し、試験例につい 感度及び特異度を算出すると、統合失調症 び健常者のいずれも感度及び特異度が80%を え、高感度及び高特異度で統合失調症の検 が可能であることが確認された。

 また、上記した10種類の遺伝子のプロー の測定値を説明変数として用いて重回帰分 を行ない、試験例について感度及び特異度 算出した場合にも、統合失調症及び健常者 いずれも感度及び特異度が80%を超えた。重 帰分析によっても、上記10種類の遺伝子発現 量を用いて、高感度及び高特異度で統合失調 症の検出が可能であることが確認された。

 なお、本発明において、「塩基配列を有 る」とは、塩基がそのような順序で配列し いるという意味である。従って、例えば、 配列番号42で示される塩基配列を有するオ ゴヌクレオチドプローブ」とは、配列番号42 に示されるtcccacatcc ccttgaatat cccaggaaaaの塩基 列を持つ、30塩基のサイズのオリゴヌクレオ チドプローブを意味する。

 以下、実施例に基づき本発明をより具体 に説明する。

1. プローブの絞込み
採血および試料の保管
 統合失調症患者 抗精神病薬 未投薬群58例 健常者56例、対照精神疾患である双極性障 患者41例より、PAXgene Blood RNA Kit (Qiagen, Val encia, CA, USA) を用いて採血及びRNA抽出を行 った。PAXgene Blood RNA Tubes 2本に2.5mlづつ採 し、転倒混和したあと凍結し、実験室への 送を行った。保管は-80℃とした。

RNA抽出
 -80℃に保管しておいたPAXgene Blood RNA Tubes 室温で融解し、製造者の指示書に従ってtotal  RNAを抽出した。抽出したtotal RNAは、-80℃で 保管した。

抽出したRNAの濃度、クォリティーの確認
 抽出したtotal RNAを10mM Tris-HCl(pH7.5)で50倍に 釈し、230, 260, 280nmの吸光度を測定し、total  RNAの濃度を測定した。抽出したRNAのクォリ ィーは、Agilent 2100バイオアナライザー(Agile nt Technologies, Inc. Santa Clara, CA, USA)で確認 行った。

cRNAの調製
 抽出したtotal RNA 0.5μgを用いてcRNAを調製し た。iExpress kit(GE Healthcare Bioscience, Chandler,  CA, USA)を用い、製造者の指示書に従ってBiotin 標識したcRNAを調製した。

 調製したcRNAの定量およびクォリティーの 確認は、抽出したtotal RNAの定量及びクォリ ィーの確認と同様に行った。すなわち、50倍 に希釈したcRNA溶液の230, 260, 280 nmの吸光度 測定し、total RNAの濃度を測定した。cRNAの ォリティーの確認は、Agilent 2100バイオアナ イザーで行った。

アレイへのハイブリダイゼーションと洗浄
 マイクロアレイとして、Codelink(商標) 55K Bi oarray(GEヘルスケア バイオサイエンス)を用い た。Codelink(商標) 55K Bioarrayは、スライドガ ス表面を特殊な化学修飾を施したアクリル ミドでコーティングし、30merのプローブが3 元的に固定されているため、ハイブリダイ の効率が良く、再現性や感度に優れたマイ ロアレイであり、ヒトの約55,000遺伝子に対 するプローブが固定されている。

 10μgのcRNAを最終容量が20μlになるようRNase-Fr ee H 2 Oで調製し、iExpress kit の5×Fragmentation Buffer 5μl添加した後、94℃で20分間インキュベート してcRNAを断片化した。

 10μgの断片化したcRNA(25μl)、78μlのiExpress  kitのHybridization Buffer A、130μlのiExpress kit の Hybridization Buffer Bを混合し、計260μlになるよ うに調製した。90℃で5分間インキュベートし た後、氷上で5~30分間インキュベートした。

 250μlのハイブリダイゼーション溶液をCode Link(商標) 55K Bioarray(GE Healthcare Bioscience, Cha ndler, CA, USA)のチャンバーへ注入し、CodeLink( 標) INNOVAシェイカー(GE Healthcare Bioscience, C handler, CA, USA)を用いて、アレイを300rpmで旋 させながら、37℃で18~24時間インキュベート た。

 Hybridization Removal Toolを使用してアレイを 固定し、ハイブリダイゼーションチャンバー を引き剥がし、Bioarray Rackにアレイをセット た。アレイをセットしたBioarray Rackを46℃の 0.75×TNT Bufferの入ったLarge Reagentリザーバー 移し、46℃で1時間インキュベーションした

 Bioarray Rackを3.4 mlのStreptavidin-Cy5希釈溶液 で満たしたSmall Reagentリザーバーに移し、室 で30分間インキュベートした。染色後、Bioar ray Rack を240mlの1×TNT Bufferで満たしたLarge Re agentリザーバーに移し、室温で5分間インキュ ベートする操作を4回繰り返して洗浄した。 にBioarray Rackを0.1×SSC/0.05% Tween 20で満たし Large Reagentリザーバーに移し、30秒間洗浄し アレイを遠心して乾燥した後、スキャニン まで遮光して保存した。

アレイのスキャニング
 洗浄後乾燥させたアレイをAgilent Scanner (Agi lent Technologies, Santa Clara, CA, USA)にてスキャ ニングした。スキャナーの設定は、Red PMT [% ] を70%、 Dye ChannelをRed (RedはCy5)とした。こ れ以外の設定はデフォルトとした。スキャン したアレイデータはTIFファイルで保存し、数 値化を行った。

アレイデータの数値化
 製造者の指示書に従い、CodeLink(商標) Express ion AnalysisによりTIFファイルで保存したアレ データの数値化とグローバルノーマライゼ ションによる正規化を行った。

プローブの絞込み
 上記で得られた実験結果から、Quality Flag " Good"以外のプローブ、Y染色体上に座位するプ ローブ、mRNA 3’末端から遠位に設定されて るプローブなどを除外した。さらに、さら 、予備分析により、欠損値が25%以上あるも 、男女間の発現量の差が大きいもの、アレ 製造時のバッチ間差が大きいものも除外し 。これらにより、約55,000個のプローブから10 ,498個のプローブに絞り込んだ。

2. 統計処理
 以上のような条件で絞り込んだプローブか 、統合失調症患者 抗精神病薬 未投薬群43 体、健常者38検体の2群間での有意差および 極性障害患者32検体と統合失調症患者 抗精 神病薬 未投薬群40検体の間で統計学的有意 の認められたプローブ、さらに双極性障害 者32検体と健常者38検体の間で統計学的有意 の認められたプローブを216個抽出した。こ らのプローブの配列を配列表の配列番号11~2 26に示す。また、各プローブが由来する遺伝 名及びGenBank Accession No.を下記表4に示す。

3. 実用化アレイの設計
 CodeLink(商品名) 55K Bioarrayは、非常に高価で あり、1枚で1検体しか処理、解析ができない 実用化をはかるためには、より低コストで 析が可能なマイクロアレイが必要となる。 こで、CodeLink(商品名) 55K Bioarrayと全く同一 の表面処理を施し、これを16個のチャンバー 区切ることで、一度に最大で16検体の処理 解析が可能なCodeLink(商品名) 16-Assay Bioarray(A pplied Microarrays社)をベースにした実用化アレ を設計した。上記216遺伝子のプローブの他 グローバルノーマライゼーション用に使用 るプローブ(配列番号226~525)やメーカーによ 管理用プローブなど追加して、以下のよう アレイを設計した。

CodeLink(商品名) 16-Assay Bioarray プローブの内  
(合計 1714スポット/チャンバー)
・分類予測候補プローブ :  216プローブ × 4重スポット
・ノーマライゼーション用追加プローブ :  299プローブ × 2重スポット
・メーカーによる管理用プローブ :  96プロ ーブ × 各1スポット
・ 規格上の予約プローブ :  グリッド (32)  , Positive Control (60) , Negative Control (64)

4. CodeLink(商品名) 16-Assay Bioarrayによる測定 果を基にした分類予測(ニューラルネットワ ク)
 未治療統合失調症患者 60例、健常者 56例 遺伝子発現情報を基に、分類予測に優れた ューラルネットワークによる分類予測モデ の構築を試みた。

 分類予測モデルを構築するにあたって、 体の約2/3を学習例(統合失調症患者 抗精神 薬 未投薬群40検体、健常者38検体)として分 類予測モデルの構築に用い、モデルの構築に 関与していない、残りの1/3を試験例(統合失 症患者 抗精神病薬 未投薬群20検体、健常 18検体)としてモデルの評価を行うHold out cro ss validation法により検証を行った。

(1) 遺伝子発現情報の取得
 216プローブを含む上記実用化アレイを用い 、未治療統合失調症患者 60例、健常者 56 の遺伝子発現情報を取得した。採血、RNAの 出、cRNAの調製、アレイへのハイブリダイゼ ション、蛍光シグナル(蛍光色素Cy5)のスキ ニングは、上記と同様に行なった。スキャ ーで読み取った1714スポットの画像データは CodeLink(商標) Expression Analysisソフトウェア 用いて数値化及びグローバルノーマライゼ ションによる正規化を行なった。

(2) ニューラルネットワークによる分類予測 デルの構築
 市販の解析ソフトArrayAssist(登録商標)(STRATAGE NE社)に搭載されているニューラルネットワー クを用いて、正規化したデータの解析を行な い、分類予測アルゴリズムの構築を試みた。 分類予測アルゴリズムとは、あらかじめ属性 が明らかになっているデータセットを入力し 「学習、訓練」を行なうことで、最適な解を 出力することができるようになる一連のアル ゴリズムであり、ニューラルネットワークは 、学習効果の高さから高い分類精度のアルゴ リズムが構築できるとされている。

 正規化されたデータの2/3(統合失調症患者  抗精神病薬 未投薬群40例、健常者38例)を学 習例として、ArrayAssistのニューラルネットワ クに入力し、アルゴリズムの構築を行なっ 。Feature Selectionは変数増加法(Forward Selection )により行ない、学習データを3組に分けたcros s validation(N-fold cross validation (N=3))により分 予測アルゴリズムを構築した。具体的には 学習例のデータセットを3分割し、データセ ットを入れ替えながら、216個のプローブのう ちで有意差のあったプローブを一つずつ使っ て分類予測を行ない、最も正しく分類できた プローブを分類予測に用いるプローブとして 採用することとし、これを順次繰り返して採 用するプローブを追加していった。このよう にして、徐々に用いるプローブを増やしてい き、正しく分類できた割合(Number of Class Accu racy(%))がプラトーに達したところで学習を終 させた。

 次いで、このようにして学習させたアル リズムを用いて、試験例のデータセットを 析した。Number of Class Accuracyがプラトーに した点で使用されているプローブセットに いての正規化データを上記学習済みアルゴ ズムに入力し、試験例についての該アルゴ ズムによる分類が臨床診断とどの程度一致 るかを検証した。

 ニューラルネットワークの各種パラメー ー(学習効率、Momentum、繰り返し数、レイヤ 数、ニューロン数)を種々に変化させて多数 のアルゴリズムを構築し、それぞれについて 上記したcross validationによる学習及び試験例 用いた診断精度の検証を行なった。

 その結果、パラメーターを下記の通りに設 したアルゴリズムにおいて、試験例を最も しく分類することができた。
  学習効率:0.5
  Momentum:0.3
  繰り返し数:115
  レイヤー数:1
  ニューロン数:3

 このアルゴリズムによる学習例及び試験 についての予測結果を表5及び表6に示す。 た、このアルゴリズムについてのForward Selec tionの結果を図1に示す。

 図1に示される通り、構築されたアルゴリ ズムによれば、10個のプローブ(表2、前掲)に る発現データを用いて統合失調症と健常者 を精度良く分類することができる。これら プローブによって検出される遺伝子の生物 的機能について調査したところ、上記表3に 示すように、脳神経系での作用が報告されて いる遺伝子があった。

5. CodeLink(商品名) 16-Assay Bioarrayによる測定 果を基にした分類予測(重回帰分析)
 上記と同様に、未治療統合失調症患者60例 健常者56例の遺伝子発現情報を用いて、重回 帰分析による分類予測を試みた。上記10個の ローブによる発現データを説明変数として いて、上記学習例について市販のソフトウ ア(SPSS)を用いて重回帰分析を行ない、予測 を構築した。重回帰分析は、統合失調症患 で従属変数が大きくなるように設定して行 た。次いで、構築された予測式を用いて、 記試験例について従属変数を計算した。な 、得られた予測式は以下の通りである。
Y=(A 1 X 1 +A 2 X 2 +A 3 X 3 +A 4 X 4 +A 5 X 5 +A 6 X 6 +A 7 X 7 +A 8 X 8 +A 9 X 9 +A 10 X 10 +C)×100
ここで、
X 1 は、DLGAP3(GE54859 配列番号42)の遺伝子発現量
X 2 は、KCN15J(GE58277 配列番号77)の遺伝子発現量
X 3 は、GPR30 (GE80129 配列番号165)の遺伝子発現量
X 4 は、NPCR (GE540583 配列番号34)の遺伝子発現量
X 5 は、TMED1(GE85017 配列番号200)の遺伝子発現量
X 6 は、PAFAH2 (GE62881 配列番号122)の遺伝子発現
X 7 は、TMEM23 (GE60313 配列番号98)の遺伝子発現量
X 8 は、ABCG1 (GE586854 配列番号81)の遺伝子発現量
X 9 は、PGRMC1 (GE62032 配列番号109)の遺伝子発現
X 10 は、INSL3 (GE88024 配列番号218)の遺伝子発現量
をそれぞれ指す。
各遺伝子の発現量に乗ずる係数は、それぞれ 、
A 1 は、1.00019621196698
A 2 は、0.273175387505458
A 3 は、0.606651443546423
A 4 は、-0.659859665599205
A 5 は、-0.287215519193429
A 6 は、-0.271285204843002
A 7 は、-0.220049126802913
A 8 は、-0.00285057386315785
A 9 は、0.478133475554455
A 10 は、-0.169744977943406
定数Cは、0.0429404615746508
である。

 従属変数50をカットオフ値として集計し 結果を表7及び表8に示す。また、学習例及び 試験例の各検体について計算された従属変数 を図2に示す。

感度:92.5%(37/40)、特異度:92.1%(35/38)、正答率:92. 3%(72/78)

感度:95.0%(19/20)、特異度:94.4%(17/18)、正答率:94. 7%(36/38)

 以上の通り、カットオフ値を50とすると 試験例において感度・特異度ともに80%を超 る結果となった。重回帰分析によっても、 記10種類の遺伝子発現量を用いて統合失調症 と健常者とを精度良く分類することができた 。