Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
NEUROGLIOMA MOLECULAR SUBTYPING GENE GROUP AND USE THEREOF
Document Type and Number:
WIPO Patent Application WO/2014/190760
Kind Code:
A1
Abstract:
Provided in the present invention is a set of gene groups for predicting or for the auxiliary prediction of the survival time prognosis of patients with neuroglioma, consisting of a PM gene group and an EM gene group with a total of 68 genes. A subtype marking gene group consisting of two major gene groups co-expressed with PDGFRA and EGFR can stably divide neuroglioma samples derived from different database sources into three specific subtypes, and can be applied to clinical diagnosis for neuroglioma and judging the survival time prognosis of patients with neuroglioma.

Inventors:
FAN XIAOLONG (CN)
SUN YINGYU (CN)
JIANG TAO (CN)
Application Number:
PCT/CN2014/000535
Publication Date:
December 04, 2014
Filing Date:
May 27, 2014
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
UNIV BEIJING NORMAL (CN)
International Classes:
C12Q1/68
Domestic Patent References:
WO2011109440A12011-09-09
Foreign References:
CN101336300A2008-12-31
CN102041316A2011-05-04
Attorney, Agent or Firm:
JEEKAI & PARTNERS (CN)
北京纪凯知识产权代理有限公司 (CN)
Download PDF:
Claims:
权利要求

1、 一种预测或辅助预测神经胶质瘤患者预后生存期的试剂盒, 包括 用于检测待测神经胶质瘤患者离体样本中 PM基因群和 EM基因群中的各个 基因的表达量的试剂和比对卡;

所述 PM基因群由如下 39个基因组成:

C10orf l8、 C1QLK Clorfl06、 C9orfl40、 CACNG4、 CHD7、 CSNK1E、 EIF4EBP2 , ETVU FAM5C, KLRC3 , LIX1L, L0C283174, LPHN3 , LPPRU MARCKS, MEX3A、 MMP16、 MYT1、 應 1、 NLGNU NOVAK NXPHU OLIGU 0LIG2 , PATZU PCGF2、 PDGFRA, P0LR2F, RFX7 , S0X4、 S0X6、 S0X8、 TACC2、 TMCC1、 TSHZU ZEBU ZNF22 , ZNF462 ;

所述 EM基因群由如下 29个基因组成:

ACSS3、 CDKN2C、 DENND2A, 匿 TA2、 EGFR、 EL0VL2 , HS3ST3BU ITGB8、 LFNG, NC0A3、 NES、 NFIA、 PDGFA、 PMS2P1 U P0U3F2、 PRPF3 U RNF180, SALLU SEC61G、 SEMA6D、 SH0X2 , SNX5、 S0CS2、 S0X9、 TNFRSF19, TRIOBP, 丽 Fl、 VAV3、 ZNF558 ;

所述比对卡记载如下内容:

若所述待测神经胶质瘤患者离体样本中所述 PM基因群平均表达量大 于或等于所述 EM基因群平均表达量, 则所述待测神经胶质瘤患者的预后 生存期超过或候选超过 1. 9年;

若所述待测神经胶质瘤患者离体样本中所述 PM基因群平均表达量小 于所述 EM基因群平均表达量, 则所述待测神经胶质瘤患者的预后生存期 不超过或候选不超过 1. 9年。

2、 根据权利要求 1所述的试剂盒, 其特征在于:

所述比对卡记载如下内容:

若所述待测神经胶质瘤患者离体样本中所述 PM基因群平均表达量大 于所述 EM基因群平均表达量, 则所述待测神经胶质瘤患者的预后生存期 为或候选为 3. 7-4. 9年或 2. 3-2. 7年;

若所述 PM基因群平均表达量等于所述 EM基因群平均表达量, 则所述 待测神经胶质瘤患者的预后生存期为或候选为 1. 9-3. 0年或 1. 9-2. 5年; 若所述待测神经胶质瘤患者离体样本中所述 PM基因群平均表达量小 于所述 EM基因群平均表达量, 则所述待测神经胶质瘤患者的预后生存期 为或候选为 1.3-1.7年或 1.1-1.6年。

3、 根据权利要求 1或 2所述的试剂盒, 其特征在于:

所述 PM基因群平均表达量大于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 1.2-5;

所述 PM基因群平均表达量等于所述 EM基因群平均表达量无显著差异 指 PM基因群平均表达量与 EM基因群平均表达量的比值为 0.9-1.1;

所述 PM基因群平均表达量小于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 0-0.8, 且不为 0。

4、 根据权利要求 1-3中任一所述的试剂盒, 其特征在于:

所述比对卡记载如下内容 A或 B:

A:

所述 PM基因群平均表达量大于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 1.714±0.032;

所述 PM基因群平均表达量等于所述 EM基因群平均表达量无显著差异 指 PM基因群平均表达量与 EM基因群平均表达量的比值为 1.074±0.022; 所述 PM基因群平均表达量小于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 0.592±0.012;

B:

所述 PM基因群平均表达量大于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 1.427±0.034;

所述 PM基因群平均表达量等于所述 EM基因群平均表达量无显著差异 指 PM基因群平均表达量与 EM基因群平均表达量的比值为 0.939±0.033; 所述 PM基因群平均表达量小于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 0.460±0.031。

5、 根据权利要求 1-4中任一所述的试剂盒, 其特征在于:

所述试剂包括能与所述离体样本中的所述 68 个基因或各个基因的 mRNA或各个基因的 cRNA杂交的芯片;

所述芯片具体为人类全基因组寡核苷酸微阵列芯片。 6、 根据权利要求 1-5中任一所述的试剂盒, 其特征在于:

所述离体样本为离体神经胶质瘤组织。

7、 一组用于预测或辅助预测神经胶质瘤患者预后生存期的基因群组, 由 PM基因群和 EM基因群共 68个基因组成:

所述 PM基因群由如下 39个基因组成:

C10orf l8、 C1QLK Clorfl06、 C9orfl40、 CACNG4、 CHD7、 CSNK1E、 EIF4EBP2 , ETVU FAM5C, KLRC3 , LIX1L, L0C283174, LPHN3 , LPPRU MARCKS, MEX3A、 MMP16、 MYT1、 應 1、 NLGNU NOVAK NXPHU OLIGU 0LIG2 , PATZU PCGF2、 PDGFRA, P0LR2F, RFX7 , S0X4、 S0X6、 S0X8、 TACC2、 TMCC1、 TSHZU ZEBU ZNF22 , ZNF462 ;

所述 EM基因群由如下 29个基因组成:

ACSS3、 CDKN2C、 DENND2A, 匿 TA2、 EGFR、 EL0VL2 , HS3ST3BU ITGB8、 LFNG, NC0A3、 NES、 NFIA、 PDGFA、 PMS2P1 U P0U3F2、 PRPF3 U RNF180, SALLU SEC61G、 SEMA6D、 SH0X2 , SNX5、 S0CS2、 S0X9、 TNFRSF19, TRIOBP, UHRFU VAV3、 ZNF558。

8、 权利要求 1-6中任一所述的试剂盒或权利要求 7所述的基因群组 在制备预测或辅助预测神经胶质瘤患者预后生存期的产品中的应用。

9、 权利要求 7 所述基因群组作为标志物在制备预测或辅助预测神经 胶质瘤患者预后生存期的产品中的应用。

Description:
神经胶质瘤分子分型基因群及其应用 技术领域

本发明涉及生物技术领域, 尤其涉及神经胶质瘤分子分型基因群及其 应用, 主要涉及功能基因组学的肿瘤相关基因表达谱 的研究和标志基因群 的筛选及验证, 即在人功能基因组范围内筛选神经胶质瘤的分 型标志基因 群, 根据这些基因的 mRNA表达水平对神经胶质瘤样本进行分型诊断 可预 测患者预后。

背景技术

神经胶质瘤是中枢神经系统最常见的原发性肿 瘤, 是人类健康的重大 威胁。 大多数高度恶性胶质瘤患者, 生存期仅为 1-2年。 低度恶性胶质瘤 最终将发展为高度恶性胶质瘤, 但其进展快慢存在巨大的个体差异。 目前 仍不清楚低度恶性胶质瘤进展快慢的本质原因 , 并且, 至今未能发现有效 的神经胶质瘤治疗靶点。

疾病的诊断是治疗方案研究和制定的重要依据 。 目前对于神经胶质瘤 的诊断仍主要建立在形态学基础之上。 但胶质瘤在形态学上的异质性, 以 及医生诊断过程中的主观性差异, 诊断的不一致性可达 30%-40%, 对相当 一部分神经胶质瘤无法进行明确的形态学诊断 。 并且, 基于形态学的诊断 不能准确反映疾病的本质特征。 因此, 现有的形态学诊断标准较大地制约 了胶质瘤的临床治疗研究。 近年来, 基于基因表达的分型方法为胶质瘤的 诊断开辟了新的思路。 分子分型方法为揭示胶质瘤发生和发展的细胞 学和 遗传学本质提供了可能, 可极大地促进胶质瘤的靶向治疗研究。 但目前, 全世界范围内尚缺乏有效的基于基因表达的神 经胶质瘤临床诊断方案。 发明公开

本发明的一个目的是提供一种预测或辅助预测 神经胶质瘤患者预后 生存期的试剂盒。

本发明提供的试剂盒, 包括用于检测待测神经胶质瘤患者离体样本中 PM基因群和 EM基因群中的各个基因的表达量的试剂和比对 ;

所述 PM基因群由如下 39个基因组成:

C10orfl8、 C1QLK Clorfl06、 C9orfl40、 CACNG4、 CHD7、 CSNK1E、 EIF4EBP2 , ETVU FAM5C, KLRC3 , LIX1L, L0C283174, LPHN3 , LPPRU MARCKS, MEX3A、 MMP16、 MYT1、應 1、 NLGNU NOVAK NXPHU OLIGU 0LIG2 , PATZU PCGF2、 PDGFRA, P0LR2F, RFX7 , S0X4、 S0X6、 S0X8、 TACC2、 TMCC1、 TSHZU ZEBU ZNF22 , ZNF462 ;

所述 EM基因群由如下 29个基因组成:

ACSS3、 CDKN2C、 DENND2A,匿 TA2、 EGFR、 EL0VL2 , HS3ST3BU ITGB8、 LFNG, NC0A3、 NES、 NFIA、 PDGFA、 PMS2P1 U P0U3F2、 PRPF3 U RNF180, SALLU SEC61G、 SEMA6D、 SH0X2 , SNX5、 S0CS2、 S0X9、 TNFRSF19, TRIOBP, UHRFU VAV3、 ZNF558 ;

所述比对卡记载如下内容:

若所述待测神经胶质瘤患者离体样本中所述 PM基因群平均表达量大 于或等于所述 EM基因群平均表达量, 则所述待测神经胶质瘤患者的预后 生存期超过或候选超过 1. 9年;

若所述待测神经胶质瘤患者离体样本中所述 PM基因群平均表达量小 于所述 EM基因群平均表达量, 则所述待测神经胶质瘤患者的预后生存期 不超过或候选不超过 1. 9年。

上述试剂盒中, 所述比对卡记载如下内容:

若所述待测神经胶质瘤患者离体样本中所述 PM基因群平均表达量大 于所述 EM基因群平均表达量, 则所述待测神经胶质瘤患者的预后生存期 为或候选为 3. 7-4. 9年 (欧美人, 具体为美国 REMBRANT神经胶质瘤大型 数据库) 或 2. 3-2. 7年 (亚洲人, 具体为 2006-2009年北京天坛医院所收 谱计划

若所述 PM基因群平均表达量等于所述 EM基因群平均表达量, 则所述 待测神经胶质瘤患者的预后生存期为或候选为 1. 9-3. 0年 (欧美人, 具体 为美国 REMBRANT神经胶质瘤大型数据库) 或 1. 9-2. 5年 (亚洲人, 具体 为 2006-2009年北京天坛医院所收治的神经胶质瘤病 例, 中国脑胶质瘤基 因组图谱计划 http : //jzl. daj iankang. com/ portal, php ) ;

若所述待测神经胶质瘤患者离体样本中所述 PM基因群平均表达量小 于所述 EM基因群平均表达量, 则所述待测神经胶质瘤患者的预后生存期 为或候选为 1.3-1.7年 (欧美人, 具体为美国 REMBRANT神经胶质瘤大型 数据库) 或 1.1-1.6年 (亚洲人, 具体为 2006-2009年北京天坛医院所收

达量指 PM基因群平均表达量与 EM基因群平均表达量的比值为 1.2-5; 所述 PM基因群平均表达量等于所述 EM基因群平均表达量无显著差异 指 PM基因群平均表达量与 EM基因群平均表达量的比值为 0.9-1.1;

所述 PM基因群平均表达量小于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 0-0.8, 且不为 0。

上述试剂盒中的比对卡记载如下内容 A或 B:

A (针对美国 REMBRANT神经胶质瘤大型数据库) :

所述 PM基因群平均表达量大于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 1.714±0.032;

所述 PM基因群平均表达量等于所述 EM基因群平均表达量无显著差异 指 PM基因群平均表达量与 EM基因群平均表达量的比值为 1.074±0.022; 所述 PM基因群平均表达量小于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 0.592±0.012;

B (2006-2009年北京天坛医院所收治的神经胶质瘤 例, 中国脑胶质 瘤基因组图谱计划 http://jzl. dajiankang. com/ portal, php) :

所述 PM基因群平均表达量大于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 1.427±0.034;

所述 PM基因群平均表达量等于所述 EM基因群平均表达量无显著差异 指 PM基因群平均表达量与 EM基因群平均表达量的比值为 0.939±0.033; 所述 PM基因群平均表达量小于所述 EM基因群平均表达量指 PM基因 群平均表达量与 EM基因群平均表达量的比值为 0.460±0.031。

上述试剂盒中, 所述试剂包括能与所述离体样本中的所述 68 个基因 或各个基因的 mRNA或各个基因的 cRNA杂交的芯片;

所述芯片具体为人类全基因组寡核苷酸微阵列 芯片。

上述各个基因的 cRNA按照如下方法制备: 将离体样本提取总 RNA, 经 Agi lent RNA 线性扩增试齐 lj盒 (Agi lent Low RNA Input Linear Ampl ification Ki t PLUS), 将 mRNA扩增为 cRNA并进行 Cy3标记, 得到 各个基因的 cRNA。

上述试剂盒中, 所述离体样本为离体神经胶质瘤组织。

本发明的另一个目的是提供一组用于预测或辅 助预测神经胶质瘤患 者预后生存期的基因群组。

本发明提供的基因群组, 由 PM基因群和 EM基因群共 68个基因组成: 所述 PM基因群由如下 39个基因组成:

C10orf l8、 C1QLK Clorfl06、 C9orfl40、 CACNG4、 CHD7、 CSNK1E、 EIF4EBP2 , ETVU FAM5C, KLRC3 , LIX1L, L0C283174, LPHN3 , LPPRU MARCKS, MEX3A、 MMP16、 MYT1、 應 1、 NLGNU NOVAK NXPHU OLIGU 0LIG2 , PATZU PCGF2、 PDGFRA, P0LR2F, RFX7 , S0X4、 S0X6、 S0X8、 TACC2、 TMCC1、 TSHZU ZEBU ZNF22 , ZNF462 ;

所述 EM基因群由如下 29个基因组成:

ACSS3、 CDKN2C、 DENND2A, DMRTA2 , EGFR、 EL0VL2 , HS3ST3BU ITGB8、

LFNG, NC0A3、 NES、 NFIA、 PDGFA、 PMS2P1 U P0U3F2、 PRPF3 U RNF180, SALLU SEC61G、 SEMA6D、 SH0X2 , SNX5、 S0CS2、 S0X9、 TNFRSF19, TRIOBP, 丽 Fl、 VAV3、 ZNF558。

上述的试剂盒或上述的基因群组在制备预测或 辅助预测神经胶质瘤 患者预后生存期的产品中的应用。

上述基因群组作为标志物在制备预测或辅助预 测神经胶质瘤患者预 后生存期的产品中的应用。

上述中, 基因群的平均表达量指基因群中各基因 mRNA表达量的平均 值。

上述中, PM基因群平均表达量是指 PM基因群中每个基因的表达量之 和除以 39 ;

上述中, EM基因群平均表达量是指 EM基因群中每个基因的表达量之 和除以 29。

上述中, 每个基因的表达量是指每个基因表达的 mRNA的量。

本项发明利用神经胶质瘤数据库 mRNA表达谱数据,筛选获得与 和 ^¾7W共表达的两个基因群(分别称为 PM和 EM基因)共 68个分型标志基 因。 利用基因芯片、 分子杂交、 RT-PCR等方法分别检测 PM和 EM基因群中 的多个或全部基因的 mRNA水平, 可对神经胶质瘤样本进行稳定的分型鉴 别诊断, 并有效预测患者预后生存期。

本发明还可以利用 68 个分型标志基因制备成基因芯片用于神经胶质 瘤的分型鉴定, 该基因芯片为将这些基因的 cDNA或寡核苷酸探针固定成 微阵列, 其中每个探针可以特异性地与来源于组织样本 中相应基因的 cDNA、 mRNA或其扩增产物杂交。 微阵列可以是平板、 微珠、 细针或膜相阵 列, 可以是寡核苷酸、 多核苷酸或者 cDNA阵列。

本发明通过检测组织标本中的 68个分型标志基因 mRNA表达量, 可以 通过核酸分子杂交探针或 RT-PCR扩增检测 mRNA表达量进行神经胶质瘤的 分型鉴别。核酸分子杂交可以是组织切片的原 位杂交, RT-PCR可以是定量、 半定量方法, 及定性方法。

本发明中利用 68 个分型标志基因进行鉴别神经胶质瘤亚型的方 法具 体如下:

a)从神经胶质瘤患者的手术切除癌组织样本中 取总 RNA;

b)对样本总 RNA中的 mRNA扩增为反义 RNA ( cRNA)并进行荧光标记; c)用标记后的样本 cRNA与基因芯片 (可以为利用 68个分型标志基因 制备成基因芯片, 也可以为人类全基因组寡核苷酸微阵列芯片) 杂交; d)用 NMF聚类分析样本基因表达; 并计算胶质瘤样本 PM基因群与 EM 基因群的 mRNA表达量的均值之比, 与各亚型比值相比较, 准确鉴别诊断 神经胶质瘤亚型,并根据相应亚型患者的生存 期,判断患者的预后生存期。 附图说明

图 1为 REMBRANDT数据库神经胶质瘤样本的 PM/EM分型基因表达谱 图 2为 REMBRANDT数据库神经胶质瘤分子亚型的生存期分 析

图 3为天坛数据库神经胶质瘤样本的 PM/EM分型基因表达谱

图 4为天坛数据库神经胶质瘤分子亚型的生存期 析

实施发明的最佳方式

下述实施例中所使用的实验方法如无特殊说明 , 均为常规方法。

下述实施例中所用的材料、 试剂等, 如无特殊说明, 均可从商业途径 得到。

实施例 1、 神经胶质瘤分型标志基因群的筛选及分型标准 的确定 1、 神经胶质瘤分型标志基因群的筛选和分型标准 的确定

利用 NCBI公布的神经胶质瘤基因表达谱数据库 GSE4290

(http: //www. ncbi. nlm. nih. gov/ geo/ query/ acc.。8:ί (3θ=03Ε4290&8ΐιΐΜ it. x=0&submit. y=0),通过 Pearson相关性分析, 获得 37个与表皮生长因 子受体 共表达基因(称为 EM基因)组成的基因群, 以及 44个与血 小板来源的生长因子受体 A {PDGFRA)共表达基因 (称为 PM基因) 组成的 基因群。 两个基因群互相独立, 无重叠。 非监督型等级聚类分析发现, 该 数据库胶质瘤样本的 PM基因群与 EM基因群的表达量表现出三种特异的模 式: PM基因高表达而 EM基因低表达 (称为 PM hlgh ) 、 PM基因低表达而 EM 基因高表达(称为 EM hlgh ) 以及两群基因皆低表达(称为 PM lOT EM lOT ) 。 因此, 利用 PM/EM基因群,可对该数据库的神经胶质瘤样本 行分类,称为 PM/EM 分型法。 通过进一步过滤去除非差异表达的一部分基因 后, 最终确定 29 个 EM基因和 39个 PM基因, 共 68个基因, 组成 PM/EM分型的标志基因群 (见表 1) 。 并根据该 39个 PM基因 mRNA表达量的平均值 (即 PM基因群 平均表达量) 与 29个 EM基因的平均表达量 (即 EM基因群平均表达量) 的相对高低, 确定 PM/EM分型标准如下:

1) 若 PM基因群平均表达量大于 EM基因群平均表达量, 样本亚型为 PM hiBh ;

2) 若 PM基因群平均表达量等于 EM基因群平均表达量, 样本亚型为 EM low PM low ;

3) 若 PM基因群平均表达量小于 EM基因群平均表达量, 样本亚型为

EM high

具体也可以根据神经胶质瘤样本中 PM基因群平均表达量与 EM基因群 平均表达量的比值 (简称 PM/EM比值) 确定 PM/EM分型标准:

1)若 PM/EM的比值 =1.2-5, 样本亚型为 PM hiBh ;

2)若 PM/EM的比值 =0.9-1. 1, 样本亚型为 EM low PM low ;

3)若 PM/EM的比值 =0-0.8, 样本亚型为 EM high , 且不为 0。

表 1. 神经胶质瘤分型标志基因群的基因列表 (共 68个基因) Access ion 群 Number 类型

ACSS3 丽— —024560 acyl CoA synthetase short chain fami ly EM member 3

C10orf l8 丽— —017782 chromosome 10 open reading frame 18 PM

C1QL1 丽— —006688 EGF containing f ibul in l ike extracel lular PM matrix protein 1

Clorf l06 丽— —018265 chromosome 1 open reading frame 106 PM

C9orf l40 丽— —178448 chromosome 9 open reading frame 140 PM

CACNG4 丽— —014405 calcium channel, vol tage dependent, gamma PM subuni t 4

CDKN2C 丽— —001262 cycl in dependent kinase inhib i tor 2C (p l8, EM inhib i ts CDK4)

CHD7 丽— —017780 chromo domain hel icase DNA binding protein 7 PM

CSNK1E 丽— —152221 casein kinase 1, eps i Ion PM

DENND2A 丽— —015689 DENN/MADD domain containing 2A EM

DMRTA2 丽— —032110 DMRT l ike fami ly A2 EM

EGFR 丽— —005228 ep idermal growth factor receptor EM

EIF4EBP2 丽— —004096 eukaryotic trans lation ini tiation factor 4E PM b inding protein 2

EL0VL2 丽— —017770 elongation of very long chain fatty aci ds EM

(FENl/Elo2, SUR4/Elo3, yeast) l ike 2

ETV1 丽— —001163151 ets variant 1 PM

FAM5C 丽— —199051 fami ly with sequence simi lari ty 5, member C PM

HS3ST3B1 丽— —006041 heparan sulfate (glucosamine) EM

3 0 sulfo transferase 3B1

ITGB8 丽— —002214 integr in, beta 8 EM

KLRC3 丽— —002261 ki l ler cel l lectin l ike receptor subfami ly C, PM member 3

LFNG NG_ —008109 LFNG 0 f ucosylpepti de EM

3 beta N ace ty 1 g luco s ami nyl transferase

LIX1L 丽— —153713 Lixl homo log (mouse) l ike PM

L0C283174 丽— —024344 hypothetical L0C283174 PM

LPHN3 丽— —015236 latrophi 1 in 3 PM

LPPR1 丽— —207299 l ipi d phosphate phosphatase related protein PM type 1

MARCKS 丽— —002356 myri stoylated alanine rich protein kinase C PM substrate

MEX3A 丽— —001093725 mex 3 homo log A (C. elegans) PM 丽 PI 6 丽— —005941 matrix metal lopepti dase 16 PM

(membrane inserted)

MYT1 丽— —004535 myel in transcription factor 1 PM

NAV1 丽— _001167738 neuron navigator 1 PM

NC0A3 丽— —181659 nuclear receptor coactivator 3 EM

NES 丽— —006617 nestin EM

NFIA 丽— —001145511 nuclear factor I/A EM

NLGN1 丽— —014932 neurol igin 1 PM

N0VA1 丽— —006491 neuro oncological ventral antigen 1 PM

NXPH1 丽— —152745 neurexophi 1 in 1 PM

0LIG1 丽— _138983 ol igodendrocyte transcription factor 1 PM

0LIG2 丽— —005議 ol igodendrocyte l ineage transcription factor PM 38 PATZ1 丽——032052 POZ (BTB) and AT hook containing z inc f inger PM

39 PCGF2 丽— —007144 polycomb group ring f inger 2 PM

40 PDGFA 丽— —033023 p latelet derived growth factor alpha EM

polypepti de

41 PDGFRA 丽— —006206 p latelet derived growth factor receptor, PM

alpha polypepti de

42 PMS2P11 NR_ —023383 postmeiotic segregation increased 2 EM

pseudogene 11

43 P0LR2F 丽— —021974 polymerase (RNA) I I (DNA directed) PM

polypepti de F

44 P0U3F2 丽— —005604 P0U class 3 homeobox 2 EM

45 PRPF31 丽— —015629 PRP31 pre mRNA processing factor 31 homolog EM

(S. cerevi s iae)

46 RFX7 丽— —022841 regulatory factor X, 7 PM

47 RNF180 丽— —001113561 ring f inger protein 180 EM

48 SALL1 NG_ —007990 sal 1 ike 1 (Drosophi la) EM

49 SEC61G 丽— —014302 Sec61 gamma subuni t EM

50 SEMA6D 丽— —001198999 sema domain, transmembrane domain (TM) , and EM

cytop lasmic domain, (semaphor in) 6D

51 SH0X2 丽— —003030 short stature homeobox 2 EM

52 SNX5 丽— —152227 sorting nexin 5 EM

53 S0CS2 丽— —003877 suppressor of cytokine s ignal ing 2 EM

54 S0X4 丽— _003107 SRY (sex determining region Y) box 4 PM

55 S0X6 丽— —033326 SRY (sex determining region Y) box 6 PM

56 S0X8 丽— —014587 SRY (sex determining region Y) box 8 PM

57 S0X9 丽— —000346 SRY (sex determining region Y) box 9 EM

58 TACC2 丽— _206860 transforming, aci dic coi led coi l containing PM

protein 2

59 TMCC1 丽— —001017395 transmembrane and coi led coi l domain fami ly PM

60 TNFRSF19 丽— —148957 tumor necros i s factor receptor superf ami ly, EM

member 19

61 TRIOBP 丽— —001039141 TRIO and F actin b inding protein EM

62 TSHZ1 丽— —005786 teashirt z inc f inger homeobox 1 PM

63 UHRF1 丽— —001048201 ub iqui tin l ike with PHD and ring f inger EM

domains 1

64 VAV3 丽— —006113 vav 3 guanine nucleotide exchange factor EM

65 ZEB1 丽— —001128128 z inc f inger E box b inding homeobox 1 PM

66 ZNF22 丽— —006963 z inc f inger protein 22 (K0X 15) PM

67 ZNF462 丽— —021224 z inc f inger protein 462 PM

68 ZNF558 丽— —144693 z inc f inger protein 558 EM

2、 神经胶质瘤 PM/EM分型标准的验证及预后生存期分析

利用美国 REMBRANT神经胶质瘤大型数据库 (美国多家医疗科研单位 合作建立的公共数据平台

http: // ca integrator- info. nc i . nih. gov/ rembrandt ) 中具有予页后生存期 信息的 403例神经胶质瘤样本的 mRNA表达谱数据, 验证上述 PM/EM分型 标准, 并检测 PM/EM分型与预后生存期的关系。 基于 WHO的胶质瘤分类标 准, 该 403例神经胶质瘤样本的病理诊断类型分别包括 109例星形胶质细 胞瘤 (Astrocytoma; II、 III级) 、 193例神经胶质母细胞瘤 ( GBM; IV 级) 、 51例少突胶质细胞瘤 (Ol igodendrogl ioma; I I、 III级) 、 7例少 突星形胶质细胞瘤 (Ol igoastrocytoma, I I、 I II级) 和 43例未有明确诊 断的胶质瘤。 根据 PM和 EM基因群的 mRNA表达谱, 利用非负矩阵分解聚 类算法 MF)进行非监督型聚类分析,与 GSE4290数据库类似, REMBRANDT 数据库的神经胶质瘤样本表现出三种亚型 (图 1 ) :

1 )PM基因群平均表达量大于 EM基因群平均表达量,样本亚型为 PM hlgh

165例;

2 ) PM基因群平均表达量等于 EM基因群平均表达量,样本亚型为 EM hlgh , 184例;

3 ) PM基因群平均表达量小于 EM基因群平均表达量, 样本亚型为 EM low PM low , 54例。

PM/EM各亚型中含有所有的病理诊断类型, 无明确病理诊断的胶质瘤 样本也被明确地划分到 PM high 、 EM low PM lo \ EM high 各亚型中。 各亚型胶质瘤样 本的 PM基因群与 EM基因群平均表达量之比 (即 PM/EM比值) 均落在上述 1确定的 PM/EM分型标准所确定的相应亚型的比值范围之 , 并且, 统计 学检验显示, 三个亚型之间具有极显著差异(表 2, p < 0. 0001,

Kruskal-Wall istest)。

基因群的平均表达量指基因群中各基因 mRNA表达量的平均值。

表 2. REMBRANT数据库神经胶质瘤样本的 PM/EM分型

PM hiBh EM low PM low EM hiBh

PM/EM比值 1. 714士 1. 074士 0. 592士

(Mean士 SEM) 0. 032 0. 022 0. 012 通过生存期分析发现, 不同亚型患者, 即 PM hlgh ( 165例) 、 EM lOT PM lOT ( 54例) 以及 EM high ( 184例)的预后(图 2, p < 0. 0001, Log-rank test; ) 存在显著差异。 PM hlg n EM lOT PM lOT \§者预后较好, 95%患者预后生存期分别 为 3.7-4.9年和 1.9-3.0年; 而 EM hlgh 患者预后较差, 95%患者预后生存期 为 1.3- 1.7年。

上述结果表明, PM/EM分型可用于预测胶质瘤患者的生存期: 若 PM基因群平均表达量大于 EM基因群平均表达量 (样本分子亚型为 PM hlBh ) 或 PM基因群平均表达量等于 EM基因群平均表达量 (样本分子亚型 为 EM lOT PM lOT ) , 则该样本的预后生存期为或候选为超过 1.9年 (包括 1.9 年) ; 其中, 样本分子亚型为 PM hlgh ; 该分子亚型的预后生存期为或候选具 体为 3.7-4.9年; 样本分子亚型为 EM lOT PM lOT ; 该分子亚型的预后生存期为 或候选具体为 1.9-3.0年;

若 PM基因群平均表达量小于 EM基因群平均表达量 (样本分子亚型为

EM hlBh ),则该样本的预后生存期为或候选为不 过 1.9年(不包括 1.9年); 该分子亚型的预后生存期为或候选具体为 1.3-1.7年。

具体也可以根据神经胶质瘤样本中 PM基因群平均表达量与 EM基因群 平均表达量的比值进一步确定待测神经胶质瘤 样本分型归属的标准, 并可 预测各亚型患者的生存期:

若 PM/EM的比值 =1.2-5, 样本分子亚型为 PM hlgh ; 该分子亚型的预后生 存期为或候选为 3.7-4.9年;

若 PM/EM的比值 =0.9-1.1, 样本分子亚型为 EM lOT PM lOT ; 该分子亚型的 预后生存期为或候选为 1.9-3.0年;

若 PM/EM的比值 =0-0.8, 且不为 0; 样本分子亚型为 EM high ; 该分子亚 型的预后生存期为或候选为 1.3-1.7年。

针对 REMBRANT数据库神经胶质瘤样本, 上述标准具体也可以如下: 若 PM/EM的比值 =1.714±0.032, 样本分子亚型为 PM high ; 该分子亚型 的预后生存期为或候选为 3.7-4.9年;

若 PM/EM的比值 =1.074±0.022, 样本分子亚型为 EM lOT PM lOT ; 该分子亚 型的预后生存期为或候选为 1.9-3.0年;

若 PM/EM的比值 =0.592±0.012; 样本分子亚型为 EM high ; 该分子亚型 的预后生存期为或候选为 1.3-1.7年。

实施例 2、 神经胶质瘤分型标志基因群及分型标准在预测 待测神经胶 质瘤患者预后生存期中的应用 一、 基因表达量的检测

1、 病例选择与标本处理

209例样本来自于 2006-2009年北京天坛医院所收治的神经胶质瘤病 例 (患者知情;中国脑胶质瘤基因组图谱计划

http://jzl. dajiankang. com/portal, php),基于 WHO的胶质瘤分类标准, 病理类型包括星形胶质细胞瘤 (Astrocytoma II级、 58例; Astrocytoma III级、 8例) 、 神经胶质母细胞瘤 (Astrocytoma IV级、 GBM、 79例) 、 少突胶质细胞瘤 (Oligodendroglioma II级、 18例; Oligodendroglioma III级、 11例) 、 少突星形胶质细胞瘤 (Oligoastrocytoma II级、 20例; Oligoastrocytoma III级、 15例) 。

癌组织样本经病理学诊断证实, 经液氮速冻,于 -8CTC保存。

2、 基因芯片杂交

利用总 RNA分离试剂盒 (AM1830; Ambion, Austin, ΤΧ;) 分别提取各 个胶质瘤组织样本的总 RNA。 通过 NanoDropND-1000分光光度计

(NanoDropND Technologies, Houston, TX) , 测量丽浓度。

经 Agilent RNA 线性扩增试剂盒 (Agilent Low RNA Input Linear Amplification Kit PLUS), 将 mRNA扩增为 cRNA并进行 Cy3标记。

荧光标记的 cRNA产物与规格为 4X44的 Agilent人类全基因组寡核 苷酸微阵歹 ϋ芯片(G4845A; Agilent Whole Human Genome Oligo Microarray; Agilent Technologies)进行杂交。杂交后的芯片经洗涤后 通过 Agilent G2565 BA 基因芯片微阵扫描系统进行图像扫描。 所有样本的标记、 杂交、 洗涤和扫描均严格按照基因芯片生厂商的产品 操作说明。

采用 Agilent 特征提取软件 (v9.1) (Agilent Feature Extraction Software) 读取与预处理图像的荧光强度。 运用 GeneSpring GX 11.0 (Agilent Technologies) 实现数据的标准化和筛选。 只有被标记为存在 (present) 或高于测量下限 (marginal) 的基因才可通过质量过滤筛选。 基因芯片的数据被标准化到该芯片荧光强度的 50%。

二、 样本的分型

基于各基因的荧光强度值所代表的基因的表达 量, 利用非负矩阵分解 聚类方法 (NMF) 进行非监督型聚类分析, 得到将神经胶质瘤样本进行明 确分类的 PM/EM基因表达谱, 如图 3所示, 与上述两个数据库一致, 天坛 胶质瘤样本被划分为三种特定类型: 1) PM基因群平均表达量大于 EM基因 群平均表达量, 样本亚型为 PM hlgh , 106例; 2) PM基因群平均表达量等于 EM基因群平均表达量, 样本亚型为 EM lOT PM lOT , 46例; 3) PM基因群平均表 达量小于 EM基因群平均表达量, 样本亚型为 EM high , 57例。

计算各亚型胶质瘤样本 PM基因群与 EM基因群的平均表达量之比 (简 称 PM/EM比值) , 并分析各亚型患者的生存期。

基因群的平均表达量指基因群中各基因 mRNA表达量的平均值。

结果如图 3和表 3所示, 图 3示 209例神经胶质瘤样本的 PM/EM基因 表达谱, 可明确分为如下三种亚型: PM hiBh (106例) 、 EM low PM low (46例) 、 EM hlgh (57例) 。 统计分析显示, 各亚型的 PM基因群平均表达量与 EM基因 群平均表达量的比值 (简称 PM/EM比值) 均落在上述 1确定的相应亚型的 比值范围之内。 各亚型之间具有极显著性差异(P < 0.0001,

Kruskal-Wallistest; 表 3)。

表 3. 天坛数据库神经胶质瘤样本的 PM/EM分型

PM hiBh EM low PM low EM hiBh

PM/EM比值 1.427±0· 0.939±0· 0.460士

(Mean士 SEM) 034 033 0.031

2012年 12月生存期分析显示, 不同亚型患者, 即 PM hlgh (106例) 、 EM low PM low (46例)及 EM hlgh (57例)的预后具有显著差异 (图 4, p < 0.0001, Log-rank test; ) 。 PM high 患者和 EM lOT PM lOT 患者预后较好, 95%的患者预后 生存期分别为 2.3-2.7年和 1.9-2.5年; 而 EM hlgh 患者预后较差, 95%患者 预后生存期 1.1-1.6年。

上述结果表明, PM/EM分型可用于预测胶质瘤患者的生存期: 若 PM基因群平均表达量大于 EM基因群平均表达量 (样本分子亚型为

PM hlBh ) 或 PM基因群平均表达量等于 EM基因群平均表达量 (样本分子亚型 为 EM lOT PM lOT ) , 则该样本的预后生存期为或候选为超过 1.9年 (包括 1.9 年) ; 其中, 样本分子亚型为 PM hlgh ; 该分子亚型的预后生存期为或候选具 体为 2.3-2.7年; 样本分子亚型为 EM lOT PM lOT ; 该分子亚型的预后生存期为 或候选具体为 1.9-2.5年; 若 PM基因群平均表达量小于 EM基因群平均表达量 (样本分子亚型为 EM hlBh ),则该样本的预后生存期为或候选为不超过 1. 9年(不包括 1. 9年); 该分子亚型的预后生存期为或候选具体为 1. 1-1. 6年。

具体也可以根据神经胶质瘤样本中 PM基因群平均表达量与 EM基因群 平均表达量的比值确定待测神经胶质瘤样本的 类型, 并预测各亚型患者的 生存期:

若 PM/EM的比值 =1. 2-5, 样本分子亚型为 PM hlgh ; 该分子亚型的预后生 存期为或候选为 2. 3-2. 7年;

若 PM/EM的比值 =0. 9-1. 1, 样本分子亚型为 EM lOT PM lOT ; 该分子亚型的 预后生存期为或候选为 1. 9-2. 5年;

若 PM/EM的比值 =0-0. 8, 且不为 0 ; 样本分子亚型为 EM hlgh ; 该分子亚 型的预后生存期为或候选为 1. 1-1. 6年。

针对北京天坛医院所收治的神经胶质瘤病例, 上述标准具体也可以如 下:

若 PM/EM的比值 =1. 427 ± 0. 034, 样本分子亚型为 PM high ; 该分子亚型 的预后生存期为或候选为 2. 3-2. 7年;

若 PM/EM的比值 =0. 939 ± 0. 033, 样本分子亚型为 EM lOT PM lOT ; 该分子亚 型的预后生存期为或候选为 1. 9-2. 5年;

若 PM/EM的比值 =0. 460 ± 0. 031 ; 样本分子亚型为 EM high ; 该分子亚型 的预后生存期为或候选为 1. 1-1. 6年。

从上述实验看出, 该 PM/EM基因群的表达谱数据可以准确地对胶质瘤 样本做出分子分型诊断。 该分型可有效地判断病人的预后, 并有助于寻找 治疗靶点。

工业应用

本发明的实验证明, 本发明所获得的与 和 ^? 共表达的两大 基因群共 68 个基因所组成的分型标志基因群可将不同数据 库来源的神经 胶质瘤样本稳定地区分为特异的三个亚型, 极大地克服了现有形态学诊断 的局限性, 可应用于神经胶质瘤临床诊断而指导临床治疗 , 并可较为准确 判断神经胶质瘤患者的预后生存期。 此外, 由于该 68 个基因与神经干细 胞、 祖细胞的增殖和分化以及肿瘤的产生和恶化紧 密相关, 为揭示神经胶 质瘤的细胞和遗传学起源、 进而发现和筛选治疗靶点提供重要指导, 并为 建立筛选治疗化合物的相关模型等提供快速便 捷的检测平台。 因此, 本项 发明可在科研、 医疗、 制药等产业中得到广泛应用。