Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
DETECTION METHOD OF FETAL CHROMOSOMAL ANEUPLOIDY
Document Type and Number:
WIPO Patent Application WO/2011/130880
Kind Code:
A1
Abstract:
The invention provides a detection method of fetal chromosomal aneuploidy, wherein the prenatal diagnosis of the fetal chromosomal aneuploidy is carried out using the values of amounts of nucleic acid molecules in the first kind of chromosome windows and the values of amounts of nucleic acid molecules in the corresponding windows of the second kind of chromosome, and the function relation between them.

Inventors:
LI YINGRUI (CN)
LI SONGGANG (CN)
YANG GUANGXIA (CN)
JIANG FUMAN (CN)
ZHANG XIUQING (CN)
XUAN ZHAOLING (CN)
CHEN FANG (CN)
LIN JINGRONG (CN)
Application Number:
PCT/CN2010/000568
Publication Date:
October 27, 2011
Filing Date:
April 23, 2010
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
BGI SHENZHEN CO LTD (CN)
LI YINGRUI (CN)
LI SONGGANG (CN)
YANG GUANGXIA (CN)
JIANG FUMAN (CN)
ZHANG XIUQING (CN)
XUAN ZHAOLING (CN)
CHEN FANG (CN)
LIN JINGRONG (CN)
International Classes:
C12Q1/68; G06F17/15
Domestic Patent References:
WO2009013496A12009-01-29
WO2010033578A22010-03-25
Foreign References:
CN101137760A2008-03-05
Other References:
ROSSA WK CHIU ET AL.: "Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma", PNAS, vol. 105, no. 51, 23 December 2008 (2008-12-23), pages 20458 - 20463
Attorney, Agent or Firm:
CCPIT PATENT AND TRADEMARK LAW OFFICE (CN)
中国国际贸易促进委员会专利商标事务所 (CN)
Download PDF:
Claims:
1. 检测个体染色体非整倍性的方法, 包括:

对全基因组进行测序, 将作为研究对象的待研究染色体定义为第一类染色体, 全基 因組中其余染色体定义为第二类染色体; 依据第二类染色体片段与第一类染色体片段的 行为值的相关性, 在全基因组上建立数学模型;

对待测个体进行全基因组测序, 进而得到待检测个体本身的的笫一类染色体和第二 类染色体的行为值, 如果在一定的置信水平上的行为值不满足前述数学模型, 则可以确 定待测个体的染色体是非整倍性的。

2. 权利要求 1的方法, 所述方法包括:

将全部染色体分别切割成相互重叠或者不重叠的片段, 每个片段定义为一个窗口; 通过测序统计来自无染色体缺陷的正常个体样本的染色体各窗口的核酸分子的量, 将该量定义为行为值;

依据行为值, 通过数学统计方法寻找第二类染色体上的与第一类染色体有强相关性 的窗口或其组合, 建立函数关系式;

依据函数关系式和待检测样本中第二类染色体各窗口中真实的核酸分子的量, 在一 定置信水平下, 得到待研究笫一类染色体的行为值的模拟值置信区间;

通过判断检测样本的笫一类染色体的行为值与其模拟值置信区间的关系, 判定第一 类染色体是否异常。

3.权利要求 1的方法, 包括建模步骤(1) - (4)和检测步骤(5) - (8) , 所述步骤如下:

(1)选择来自无染色体缺陷的正常个体样本的全基因组进行测序,将作为研究对象的 待研究染色体定义为第一类染色体, 其余染色体定义为第二类染色体;

(2)将(1)中的所有染色体分别切割成相互重叠或者不重叠的片段, 每个片段定义为 一个窗口;

(3)统计在多个不同实验条件下多个正常个体样本染色体各窗口的核酸分子的量,将 该量定义为行为值;

(4)依据(3)中的行为值, 通过数学统计法寻找(1)中的第二类染色体上的与(1)中的 笫一类染色体有强相关性的窗口或其组合, 建立第一类染色体的窗口和所找到的有强相 关性窗口或其组合的函数关系式 A, 由此完成建模步骤;

(5)对待检测个体的样本的全基因组的所有染色体进行测序,其中作为研究对象的待 研究染色体同样被定义为第一类染色体,其是与(1)中的第一类染色体对应相同编号的染 色体, 其余染色体作为第二类染色体;

(6)按照(2)中同样的窗口规格切割(5)中待检测样本的染色体,统计第一类染色体和 第二类染色体的行为值;

(7)将 (6)中的第二类染色体各窗口的行为值引入到关系式 A中, 设定置信水平, 计 算得到第一类染色体行为值的理论区间;

(8)如果(6)中统计的第一类染色体的行为值不在(7)中的行为值的理论区间范围内, 则认为待研究的第一类染色体异常。

4. 权利要求 3的方法, 其中将步骤(1) - (4)的关系式在不同待测样本的检测中重复使用, 不需要每次样本检测时都重复测定, 通过进行步骤(5) - (8)测定染色体的非整倍性。

5.权利要求 1的方法,将待检样本全基因组染色体切割成和正常样本中参数一致的窗口。

6. 权利要求 3的方法, 其中所述函数关系式可以是一个方程式或者多个方程式的组。

7.权利要求 5的方法, 其中所述函数关系式是一元函数式或是多元函数式。

8.权利要求 3的方法, 其中所述待检测个体的样本是来自孕妇的含有胎儿的 DNA的生物 样本。

9. 权利要求 8的方法, 其中所述的来自孕妇的含有胎儿的 DNA的生物样本选自血浆、血 清、 尿液和唾液。

10.权利要求 8的方法,其中所述的来自孕妇的含有胎儿的 DNA的生物样本选自子宫颈脱 落细胞和子宫颈沖洗液。

11. 权利要求 1或 3的方法, 其中的第一类染色体选自 21号染色体序列, 18号染色体 序列, 1 3号染色体序列, X染色体序列和 Y染色体序列或其片段序列,

12.权利要求 3的方法, 正常个体样本的选择来自不同实验条件下多个样本。

13.权利要求 1或 3的方法, 其中数学模型的建立由计算机程序优化完成。

14.权利要求 1 3的方法, 其中计算机程序通过不同的参数选择, 完成相关性窗口的寻找, 寻找最优参数, 建立第一类染色体窗口与第二类染色体窗口的函数关系式。

15.权利要求 1或 14的方法, 其中所迷参数选自窗口大小和 over l ap大小.

16.权利要求 15的方法, 其中的窗口大小选自 300kb和 500kb, 对应的 over l ap大小分 别为 150kb 和 250kb。 '

17.权利要求 3的方法,其中所迷置信水平为 90%置信区间、 95½置信区间或 99%置信区间。

18.权利要求 17的方法, 其中所述置信区间包括每个检测窗口的置信区间和整条染色体 的置信区间。

19. 权利要求 3的方法, 当窗口为 300kb时, over l ap为 150kb, 其中有极强相关性窗口 组合选自下述窗口组合:

当第一类染色体的窗口是第 21号染色体的碱基位置为 14400 k - 14700 k的窗口时, 其对应的笫二类染色体窗口是第 1 3号染色体的碱基位置为 37050 k-37350 k的窗口; 当第一类染色体的窗口是第 21号染色体的碱基位置为 14550 k-14850 k的窗口时, 其对应的笫二类染色体窗口是第 5号染色体的碱基位置为 88050 k-88350 k的窗口; 当第一类染色体的窗口是第 21号染色体的碱基位置为 14700 k - 15000 k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 16500 k-16800 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 14850 k - 15150 k的窗口时, 其对应的笫二类染色体窗口是笫 12号染色体的碱基位置为 1 6500 k-16800 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 15000 k - 15300 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 144300 k-144600 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 15150 k - 15450 k的窗口时, 其对应的笫二类染色体窗口是第 2号染色体的碱基位置为 144300 k-144600 k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 15300 k - 15600 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 145050 k-145350 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 15450 k - 15750 k的窗口时, 其对应的第二类染色体窗口是第 17号染色体的碱基位置为 56400 k-56700 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 15600 k - 15900 k的窗口时, 其对应的第二类染色体窗口是笫 3号染色体的碱基位置为 21750 k-22050 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 15750 k - 16050 k的窗口时, 其对应的第二类染色体窗口是第 8号染色体的碱基位置为 1 05150 k-1 05450 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 15900 k - 16200 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 50850 k-51150 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 16050 k - 16350 k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 77850 k-78150 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 16200 k - 16500 k的窗口时, 其对应的第二类染色体窗口是笫 4号染色体的碱基位置为 1 12800 k-11 3100 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 16350 k - 16650 k的窗口时, 其对应的第二类染色体窗口是第 5号染色体的碱基位置为 83250 k-83550 k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 16500 k - 16800 k的窗口时, 其对应的笫二类染色体窗口是第 3号染色体的碱基位置为 76200 k-76500 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 16650 k - 16950 k的窗口时, 其对应的第二类染色体窗口是笫 9号染色体的碱基位置为 74850 k-75150 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 16800 k - 17100 k的窗口时, 其对应的第二类染色体窗口是笫 5号染色体的碱基位置为 50700 k-51000 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 16950 k - 17250 k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 1 38600 k-1 38900 k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 17100 k - 17400 k的窗口时, 其对应的第二类染色体窗口是第 8号染色体的碱基位置为 77100 k-77400 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 17250 k - 17550 k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 1 38450 k-1 38750 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 17700 k - 18000 k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 111750 k-112050 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 18000 k - 18300 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 36150 k-36450 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 18150 k - 18450 k的窗口时, 其对应的第二类染色体窗口是笫 4号染色体的碱基位置为 119250 k-119550 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 18300 k - 18600 k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 450 k-750 k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 18450 k - 18750 k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 69300 k-69600 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 18600 k - 18900 k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 69450 k-69750 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 18750 k - 19050 k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 62400 k-62700 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 18900 k - 19200 k的窗口时, 其对应的第二类染色体窗口是笫 4号染色体的碱基位置为 62250 k-62550 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 19050 k - 19350 k的窗口时, 其对应的笫二类染色体窗口是第 4号染色体的碱基位置为 1 35300 k-135600 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 19200 k - 19500 k的窗口时, 其对应的第二类染色体窗口是第 5号染色体的碱基位置为 1 03350 k-1 03650 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 19350 k - 19650 k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 125550 k-125850 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 19500 k - 19800 k的窗口时, 其对应的第二类染色体窗口是笫 3号染色体的碱基位置为 85350 k-85650 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 19650 k - 19950 k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 166650 k-166950 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 19800 k - 201 00 k的窗口时, 其对应的第二类染色体窗口是笫 1 3号染色体的碱基位置为 67350 k-67650 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 19950 k - 20250 k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 167250 k- 167550 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 20100 k - 20400 k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 62400 k-62700 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 20250 k - 20550 k的窗口时, 其对应的笫二类染色体窗口是第 4号染色体的碱基位置为 62400 k-62700 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 20400 k - 20700 k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 12150 k-12450 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 20550 k - 20850 k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 125550 k-125850 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 20700 k - 21 000 k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 1 18050 k-118350 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 20850 k - 21 150 k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 81750 k-82050 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 21000 k - 21 300 k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 112650 k-112950 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 21150 k - 21450 k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 81750 k-82050 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 21 300 k - 21600 k的窗口时, 其对应的笫二类染色体窗口是第 5号染色体的碱基位置为 83250 k-83550 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 21450 k - 21750 k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 84450 k-84750 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 21600 k - 21900 k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 84450 k-84750 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 21750 k - 22050 k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 82650 k-82950 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 21900 k - 22200 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 141150 k-141450 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 22050 k - 22350 k的窗口时, 其对应的第二类染色体窗口是第 5号染色体的碱基位置为 51450 k-51750 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 22200 k - 22500 k的窗口时, 其对应的第二类染色体窗口是第 5号染色体的碱基位置为 51450 k-51750 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 22500 k - 22800 k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 1 35150 k-135450 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 22650 k - 22950 k的窗口时, 其对应的第二类染色体窗口是第 5号染色体的碱基位置为 105300 k-105600 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 22800 k - 23100 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 184950 k-185250 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 22950 k - 23250 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 141000 k-141 300 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 23100 k - 23400 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 141600 k-141900 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 23250 k - 23550 k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 82350 k-82650 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 26700 k - 27000 k的窗口时, 其对应的第二类染色体窗口是第 8号染色体的碱基位置为 93450 k-93750 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 26850 k - 27150 k的窗口时, 其对应的第二类染色体窗口是第 1 3号染色体的碱基位置为 46800 k-47100 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 31200 k - 31500 k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 47100 k-47400 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 31350 k - 31650 k的窗口时, 其对应的第二类染色体窗口是第 18号染色体的碱基位置为 41100 k-41400 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 31500 k - 31800 k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 87600 k-87900 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 2i l 650 k - 31950 k的窗口时, 其对应的第二类染色体窗口是第 15号染色体的碱基位置为 60300 k-60600 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 31950 k - 32250 k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 38850 k-39150 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 32100 k - 32400 k的窗口时, 其对应的第二类染色体窗口是第 1 3号染色体的碱基位置为 97650 k-97950 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 32250 k - 32550 k的窗口时, 其对应的第二类染色体窗口是第 5号染色体的碱基位置为 169500 k-169800 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 32400 k - 32700 k的窗口时, 其对应的第二类染色体窗口是第 8号染色体的碱基位置为 20850 k-21150 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 32550 k - 32850 k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 1500 k-1800 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 33000 k - 33300 k的窗口时, 其对应的第二类染色体窗口是第 18号染色体的碱基位置为 71550 k-71850 k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 33150 k - 33450 k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 52350 k-52650 k的窗口; 笫一类染色体的窗口是第 21号染色体的碱基位置为 33300 k - 33600 k的窗口时, 其对应的第二类染色体窗口是第 18号染色体的碱基位置为 52350 k-52650 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 33600 k - 33900 k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 24600 k-24900 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 33750 k - 34050 k的窗口时, 其对应的笫二类染色体窗口是笫 11号染色体的碱基位置为 84900 k-85200 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 33900 k - 34200 k的窗口时, 其对应的第二类染色体窗口是第 11号染色体的碱基位置为 120300 k-120600 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 34050 k - 34350 k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 165450 k-165750 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 34200 k - 34500 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 45600 k-45900 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 34350 k - 34650 k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 105300 k-105600 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 34500 k - 34800 k的窗口时, 其对应的笫二类染色体窗口是第 21号染色体的碱基位置为 24750k-25050 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 34650k - 34950k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 60450k-60750 k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 34800k - 35100k的窗口时, 其 对应的第二类染色体窗口是第 6号染色体的碱基位置为 157950k-158250 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 34950k - 35250k的窗口时, 其 对应的第二类染色体窗口是第 6号染色体的碱基位置为 157950k-158250 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 35100k - 35400k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 8100k-8400 k的窗口; 笫一类染色体的窗口是笫 21号染色体的碱基位置为 35250k - 35550k的窗口时, 其 对应的第二类染色体窗口是第 5号染色体的碱基位置为 72600k-72900 k的窗口;

第一类染色体的窗口是笫 21号染色体的碱基位置为 35400k - 35700k的窗口时, 其 对应的第二类染色体窗口是第 4号染色体的碱基位置为 83550k-83850 k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 35550k - 35850k的窗口时, 其 对应的第二类染色体窗口是第 3号染色体的碱基位置为 73500k-73800 k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 35700k - 36000k的窗口时, 其 对应的第二类染色体窗口是第 12号染色体的碱基位置为 56100k-56400 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 35850k - 36150k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 174150k-174450 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 36000k - 36300k的窗口时, 其 对应的第二类染色体窗口是第 15号染色体的碱基位置为 58950k-59250 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 36150k - 36450k的窗口时, 其 对应的第二类染色体窗口是第 17号染色体的碱基位置为 15000k-15300 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 36300k - 36600k的窗口时, 其 对应的第二类染色体窗口是第 6号染色体的碱基位置为 157950k-158250 k的窗口; 笫一类染色体的窗口是第 21号染色体的碱基位置为 36600k - 36900k的窗口时, 其 对应的第二类染色体窗口是第 11号染色体的碱基位直为 12150k-12450 k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 36750k - 37050k的窗口时, 其 对应的第二类染色体窗口是第 15号染色体的碱基位置为 77100k-77400k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 36900k - 37200k的窗口时, 其 对应的第二类染色体窗口是第 11号染色体的碱基位置为 120150k-120450k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 37050k - 37350k的窗口时, 其 对应的第二类染色体窗口是第 3号染色体的碱基位置为 37500k-37800k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 37200k - 37500k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 42600k-42900k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 37350k - 37650k的窗口时, 其 对应的第二类染色体窗口是第 4号染色体的碱基位置为 186150 k -186450k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 37500k - 37800k的窗口时, 其 对应的第二类染色体窗口是第 9号染色体的碱基位置为 20100 k -20400k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 37650k - 37950k的窗口时, 其 对应的第二类染色体窗口是第 3号染色体的碱基位置为 54900 k -55200k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 37800k - 38100k的窗口时, 其 对应的第二类染色体窗口是第 15号染色体的碱基位置为 78750 k -79050k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 37950k - 38250k的窗口时, 其 对应的第二类染色体窗口是笫 12号染色体的碱基位置为 118350 k -118650k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 38100k - 38400k的窗口时, 其 对应的第二类染色体窗口是第 12号染色体的碱基位置为 93450 k -93750k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 38250k - 38550k的窗口时, 其 对应的第二类染色体窗口是第 12号染色体的碱基位置为 66150 k -66450k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 38400k - 38700k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 30300 k -30600k的窗口; 笫一类染色体的窗口是第 21号染色体的碱基位置为 38550k - 38850k的窗口时, 其 对应的第二类染色体窗口是第 9号染色体的碱基位置为 1 00800 k -1011 00k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 38700k - 39000k的窗口时, 其 对应的第二类染色体窗口是第 9号染色体的碱基位置为 96600 k -96900k的窗口; 笫一类染色体的窗口是第 21号染色体的碱基位置为 38850k - 39150k的窗口时, 其 对应的第二类染色体窗口是第 11号染色体的碱基位置为 1 30650k -130950k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 39000k - 39300k的窗口时, 其 对应的第二类染色体窗口是第 6号染色体的碱基位置为 1050k -1 350k的窗口;

第一类染色体的窗口是笫 21号染色体的碱基位置为 39150k - 39450k的窗口时, 其 对应的第二类染色体窗口是第 5号染色体的碱基位置为 169800k -170100k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 39300k - 39600k的窗口时, 其 对应的笫二类染色体窗口是第 3号染色体的碱基位置为 43200k -43500k的窗口;

第一类染色体的窗口是笫 21号染色体的碱基位置为 39450k - 39750k的窗口时, 其 对应的第二类染色体窗口是第 6号染色体的碱基位置为 25650k -25950k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 39750k - 40050k的窗口时, 其 对应的第二类染色体窗口是第 5号染色体的碱基位置为 173700k -174000k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 39900k - 40200k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 29550k -29850k的窗口;

第一类染色体的窗口是笫 21号染色体的碱基位置为 40200k - 40500k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 104700k -105000k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 40350k - 40650k的窗口时, 其 对应的第二类染色体窗口是第 11号染色体的碱基位置为 92100k -92400k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 40500k - 40800k的窗口时, 其 对应的第二类染色体窗口是第 18号染色体的碱基位置为 70650k -70950k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 40650k - 40950k的窗口时, 其 对应的第二类染色体窗口是第 12号染色体的碱基位置为 1 3950k -14250k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 40800k - 41100k的窗口时, 其 对应的第二类染色体窗口是第 8号染色体的碱基位置为 9900k -1 0200k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 40950k - 41250k的窗口时, 其 对应的第二类染色体窗口是第 18号染色体的碱基位置为 40650k -40950k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 41100k - 41400k的窗口时, 其 对应的第二类染色体窗口是第 8号染色体的碱基位置为 9750k -1 0050k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 41250k - 41550k的窗口时, 其 对应的第二类染色体窗口是第 20号染色体的碱基位置为 22350k -22650k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 41400k - 41700k的窗口时, 其 对应的笫二类染色体窗口是第 16号染色体的碱基位置为 55350k -55650k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 41550k - 41850k的窗口时, 其 对应的第二类染色体窗口是第 15号染色体的碱基位置为 99750k -100050k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 41700k - 42000k的窗口时, 其 对应的第二类染色体窗口是第 5号染色体的碱基位置为 170700k -171000k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 41850k - 42150k的窗口时, 其 对应的第二类染色体窗口是第 16号染色体的碱基位置为 48000k -48300k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 42000k - 42300k的窗口时, 其 对应的第二类染色体窗口是第 12号染色体的碱基位置为 Ok -300k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 42150k - 42450k的窗口时, 其 对应的第二类染色体窗口是第 16号染色体的碱基位置为 48000k -48300k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 42300k - 42600k的窗口时, 其 对应的第二类染色体窗口是第 17号染色体的碱基位置为 73200k -73500k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 42450k - 42750k的窗口时, 其 对应的第二类染色体窗口是第 17号染色体的碱基位置为 73050k -73350k的窗口; 笫一类染色体的窗口是第 21号染色体的碱基位置为 42600k - 42900k的窗口时, 其 对应的第二类染色体窗口是第 11号染色体的碱基位置为 17550k -17850k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 42750k - 43050k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 120750k -121050k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 42900k - 43200k的窗口时, 其 对应的第二类染色体窗口是第 11号染色体的碱基位置为 69300k -69600k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 43200k - 43500k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 240450k -240750k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 43350k - 43650k的窗口时, 其 对应的笫二类染色体窗口是第 21号染色体的碱基位置为 38100k -38400k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 43500k - 43800k的窗口时, 其 对应的笫二类染色体窗口是第 16号染色体的碱基位置为 83850k -84150k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 43650k - 43950k的窗口时, 其 对应的第二类染色体窗口是第 16号染色体的碱基位置为 3450k -3750k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 43800k - 44100k的窗口时, 其 对应的第二类染色体窗口是第 3号染色体的碱基位置为 46800k -47100k的窗口;

笫一类染色体的窗口是第 21号染色体的碱基位置为 43950k - 44250k的窗口时, 其 对应的第二类染色体窗口是第 17号染色体的碱基位置为 70950k -71250k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 44100k - 44400k的窗口时, 其 对应的第二类染色体窗口是第 7号染色体的碱基位置为 156900k -157200k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 44250k - 44550k的窗口时, 其 对应的第二类染色体窗口是笫 5号染色体的碱基位置为 1350k -1650k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 44400k - 44700k的窗口时, 其 对应的第二类染色体窗口是第 19号染色体的碱基位置为 1950k -2250k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 44550k - 44850k的窗口时, 其 对应的第二类染色体窗口是第 9号染色体的碱基位置为 136350k -136650k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 44700k - 45000k的窗口时, 其 对应的第二类染色体窗口是笫 2号染色体的碱基位置为 219900k -220200k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 44850k - 45150k的窗口时, 其 对应的第二类染色体窗口是第. 2号染色体的碱基位置为 219900k -220200k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 45000k - 45300k的窗口时, 其 对应的第二类染色体窗口是第 7号染色体的碱基位置为 750k -1050k的窗口;

第一类染色体的窗口是笫 21号染色体的碱基位置为 45150k - 45450k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 239550k -239850k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 45300k - 45600k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 238950k -239250k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 45450k - 45750k的窗口时, 其 对应的笫二类染色体窗口是第 20号染色体的碱基位置为 61050k -61350k的窗口; 第一类染色体的窗口是笫 21号染色体的碱基位置为 45600k - 45900k的窗口时, 其 对应的第二类染色体窗口是笫 7号染色体的碱基位置为 1950k -2250k的窗口;

第一类染色体的窗口是笫 21号染色体的碱基位置为 45750k - 46050k的窗口时, 其 对应的第二类染色体窗口是第 9号染色体的碱基位置为 135000k -135300k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 45900k - 46200k的窗口时, 其 对应的第二类染色体窗口是笫 19号染色体的碱基位置为 38700k -39000k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 46050k - 46350k的窗口时, 其 对应的第二类染色体窗口是第 9号染色体的碱基位置为 139800k -140100k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 46200k - 46500k的窗口时, 其 对应的第二类染色体窗口是第 7号染色体的碱基位置为 750k -1 050k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 46350k - 46650k的窗口时, 其 对应的第二类染色体窗口是第 5号染色体的碱基位置为 1 350k -1650k的窗口;

第一类染色体的窗口是第 21号染色体的碱基位置为 46500k - 46800k的窗口时, 其 对应的第二类染色体窗口是第 12号染色体的碱基位置为 46350k -46650k的窗口; 第一类染色体的窗口是第 21号染色体的碱基位置为 46650k - 46950k的窗口时, 其 对应的第二类染色体窗口是第 8号染色体的碱基位置为 1650k -1950k的窗口;

当第一类染色体的窗口是第 18号染色体的碱基位置为 1050 k - 1 350 k的窗口时, 其对应的第二类染色体窗口是笫 4号染色体的碱基位置为 178050k-178350k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 1200 k - 1500 k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 6450k-6750k的窗口;

当第一类染色体的窗口是第 18号染色体的碱基位置为 1 350 k - 1650 k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱 '基位置为 125700k-126000k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 1500 k - 1800 k的窗口时, 其对应的第二类染色体窗口是第 1 3号染色体的碱基位置为 53550k-53850k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 1650 k - 1950 k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 177450k-177750k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 1800k - 2100 k的窗口时, 其 对应的第二类染色体窗口是第 4号染色体的碱基位置为 122250k-122550k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 1950k - 2250 k的窗口时, 其 对应的第二类染色体窗口是笫 6号染色体的碱基位置为 18900k-19200k的窗口;

当第一类染色体的窗口是第 18号染色体的碱基位置为 2100k - 2400 k的窗口时, 其 对应的第二类染色体窗口是第 12号染色体的碱基位置为 32400 k -32700k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 2250 k - 2550 k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 9600 k -9900k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 2400k - 2700k的窗口时, 其 对应的第二类染色体窗口是第 5号染色体的碱基位置为 1 30650 k -1 30950 k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 2550k - 2850k的窗口吋, 其 对应的第二类染色体窗口是第 6号染色体的碱基位置为 48000 k -48300 k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 4200k - 4500k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 192450k -192750 k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 4350k - 4650k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 145800k -146100 k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 4650k - 4950k的窗口时, 其 对应的第二类染色体窗口是第 4号染色体的碱基位置为 1 07550k -107850 k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 4800k - 5100k的窗口时, 其 对应的第二类染色体窗口是笫 12号染色体的碱基位置为 38100k -38400 k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 4950k - 5250k的窗口时, 其 对应的第二类染色体窗口是第 2号染色体的碱基位置为 39000k -39300 k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 5100k - 5400k的窗口时, 其 对应的第二类染色体窗口是第 6号染色体的碱基位置为 164550k -164850 k的窗口; 当笫一类染色体的窗口是第 18号染色体的碱基位置为 9000k - 9300k的窗口时, 其 对应的第二类染色体窗口是第 8号染色体的碱基位置为 91050k -91 350 k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 16800k - 171 00k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 39150k -39450k的窗口; 当笫一类染色体的窗口是第 18号染色体的碱基位置为 16950k - 17250k的窗口时, 其对应的第二类染色体窗口是笫 1 1号染色体的碱基位置为 32850k -33150k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 17100k - 17400k的窗口时, 其对应的第二类染色体窗口是第 9号染色体的碱基位置为 19950k -20250k的窗口; 当笫一类染色体的窗口是第 18号染色体的碱基位置为 17250k - 17550k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 39600k -39900k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 17400k - 17700k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 80850k -81150k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 18450k - 18750k的窗口时, 其对应的第二类染色体窗口是第 17号染色体的碱基位置为 64350k -64650k的窗口; 当笫一类染色体的窗口是第 18号染色体的碱基位置为 18600k - 18900k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 19500k -19800k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 21750k - 22050k的窗口时, 其对应的笫二类染色体窗口是笫 4号染色体的碱基位置为 148350k -148650k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 21900k - 22200k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 1 3800k -14100k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 22800k - 23100k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 120150k -120450k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 23250k - 23550k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 153450k —153750k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 23550k - 23850k的窗口时, 其对应的笫二类染色体窗口是笫 12号染色体的碱基位置为 15450k -15750k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 24000k - 24300k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 125700k -126000k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 24150k - 2450k的窗口时,其 对应的第二类染色体窗口是笫 12号染色体的碱基位置为 80100k -80400k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 24300k - 24600k的窗口时, 其对应的第二类染色体窗口是第 17号染色体的碱基位置为 48150k -48450k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 24450k - 24750k的窗口时, 其对应的第二类染色体窗口是第 11号染色体的碱基位置为 26250k -26550k的窗口; 当笫一类染色体的窗口是第 18号染色体的碱基位置为 24600k - 24900k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 62550k -62850k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 24750k - 25050k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 47550k -47850k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 24900k - 25200k的窗口时, 其对应的第二类染色体窗口是第 9号染色体的碱基位置为 1 0050k -10350k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 25050k - 25350k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 84300k -84600k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 25200k - 25500k的窗口时, 其对应的第二类染色体窗口是笫 号染色体的碱基位置为 70800k -71100k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 25350k - 25650k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 119100k -119400k的窗口; 当笫一类染色体的窗口是第 8号染色体的碱基位置为 25500k - 25800k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 119100k -119400k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 25650k - 25950k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 51300k -51600k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 25800k - 26100k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 145200k -145500k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 25950k - 26250k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 125550k -125850k的窗口; 当第一类染色体的窗口是笫 8号染色体的碱基位置为 26100k - 26400k的窗口时, 其对应的第二类染色体窗口是第 1号染色体的碱基位置为 16500k -16800k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 26250k - 26550k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 6000k -96300k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 26400k - 26700k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 95850k -96150k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 26550k - 26850k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 61350k -61650k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 26700k - 27000k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 92850k -93150k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 26850k - 27150k的窗口时, 其对应的笫二类染色体窗口是第 号染色体的碱基位置为 89700k -90000k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 27000k - 27300k的窗口时, 其对应的第二类染色体窗口是笫 7号染色体的碱基位置为 25050k -25350k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 27150k - 27450k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 88050k -88350k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 28650k - 28950k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 92400k ■ -92700k的窗口; 当笫一类染色体的窗口是笫 18号染色体的碱基位置为 28800k - 29100k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 52050k - -52350k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 28950k - 29250k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 138300k -138600k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 29100k - 29400k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 144450k -144750k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 29250k - 29550k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 115200k -115500k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 29550k - 29850k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 92250k - -92550k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 29700k - 30000k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 62250k - -62550k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 29850k - 30150k的窗口时, 其对应的笫二类染色体窗口是第 8号染色体的碱基位置为 84900k - -85200k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 30000k - 30300k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 82650k - -82950k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 30150k - 30450k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 93600k - -93900k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 30300k - 30600k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 103950k -104250k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 32700k - 33000k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 77100k - -77400k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 33900k - 34200k的窗口时, 其对应的第二类染色体窗口是第 9号染色体的碱基位置为 76200k - -76500k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 34800k - 35100k的窗口时, 其对应的第二类染色体窗口是第 8号染色体的碱基位置为 106350k -106650k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 35550k - 35850k的窗口时, 其对应的第二类染色体窗口是第 5号染色体的碱基位置为 35400k -35700k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 36450k - 36750k的窗口时, 其对应的笫二类染色体窗口是第 号染色体的碱基位置为 145050k -145350k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 36600k - 36900k的窗口时, 其对应的第.二类染色体窗口是第 3号染色体的碱基位置为 103050k -103350k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 36750k - 37050k的窗口时, 其对应的笫二类染色体窗口是第 号染色体的碱基位置为 83250k -83550k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 36900k - 37200k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 34650k -34950k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 37800k - 38100k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 93300k -93600k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 38400k - 38700k的窗口时, 其对应的笫二类染色体窗口是第 号染色体的碱基位置为 50100k -50400k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 38550k - 38850k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 83100k -83400k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 38700k - 39000k的窗口时, 其对应的笫二类染色体窗口是笫 号染色体的碱基位置为 106350k -106650k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 38850k - 39150k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 141000k -141300k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 39000k - 39300k的窗口时, 其对应的第二类染色体窗口是笫 号染色体的碱基位置为 64050k -64350k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 39150k - 39450k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 69450k -69750k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 39300k - 39600k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 105150k -105450k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 39450k - 39750k的窗口时, 其对应的第二类染色体窗口是第 1号染色体的碱基位置为 29400k -29700k的窗口; 当笫一类染色体的窗口是第 8号染色体的碱基位置为 39600k - 39900k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 88950k -89250k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 39750k - 40050k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 71550k -71850k的窗口; 当笫一类染色体的窗口是第 8号染色体的碱基位置为 39900k - 40200k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 163200k -163500k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 44850k - 45150k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 112950k -113250k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 45000k - 45300k的窗口时, 其对应的第二类染色体窗口是第 1号染色体的碱基位置为 32850k -33150k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 48600k - 48900k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 76800k -77100k的窗口; 当笫一类染色体的窗口是第 8号染色体的碱基位置为 48750k - 49050k的窗口时, 其对应的第二类染色体窗口是第 1号染色体的碱基位置为 40800k -41100k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 49350k - 49650k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 38850k -39150k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 49650k - 49950k的窗口时, 其对应的第二类染色体窗口是笫 号染色体的碱基位置为 39900k -40200k的窗口; 当笫一类染色体的窗口是第 8号染色体的碱基位置为 49800k - 50100k的窗口时, 其对应的笫二类染色体窗口是第 号染色体的碱基位置为 130350k -130650k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 49950k - 50250k的窗口时, 其对应的第二类染色体窗口是笫 号染色体的碱基位置为 106350k -106650k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 50100k - 50400k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 87150k -87450k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 50250k - 50550k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 79350k -79650k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 52350k - 52650k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 70950k -71250k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 55950k - 56250k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 103800k -104100k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 56100k - 56400k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 172650k -172950k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 56250k - 56550k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 10050k -10350k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 56400k - 56700k的窗口时, 其对应的第二类染色体窗口是笫 号染色体的碱基位置为 90150k -90450k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 56550k - 56850k的窗口时, 其对应的笫二类染色体窗口是第 号染色体的碱基位置为 126750k -127050k的窗口; 当笫一类染色体的窗口是第 8号染色体的碱基位置为 57750k - 58050k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 79350k -79650k的窗口; 当笫一类染色体的窗口是第 8号染色体的碱基位置为 57900k - 58200k的窗口时, 其对应的笫二类染色体窗口是第 号染色体的碱基位置为 101700k -102000k的窗口; 当第一类染色体的窗口是笫 8号染色体的碱基位置为 60000k - 60300k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 77700k -78000k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 60150k - 60450k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 126450k -126750k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 60300k - 60600k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 167100k -167400k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 60450k - 60750k的窗口时, 其对应的第二类染色体窗口是笫 号染色体的碱基位置为 123300k -123600k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 60600k - 60900k的窗口时, 其对应的第二类染色体窗口是笫 号染色体的碱基位置为 34800k -35100k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 60750k - 61050k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 145950k -146250k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 60900k - 61200k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 93900k -94200k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 61050k - 61350k的窗口时, 其对应的第二类染色体窗口是笫 8号染色体的碱基位置为 116550k -116850k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 61200k - 61500k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 27000k -27300k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 61 350k - 61650k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 85950k -86250k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 61500k - 61800k的窗口时, 其对应的第二类染色体窗口是第 7号染色体的碱基位置为 81600k -81900k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 61650k - 61950k的窗口时, 其对应的笫二类染色体窗口是第 11号染色体的碱基位置为 89700k -90000k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 61800k - 621 00k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 83700k -84000k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 61950k - 62250k的窗口时, 其对应的第二类染色体窗口是笫 1 3号染色体的碱基位置为 81600k -81900k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 62100k - 62400k的窗口时, 其对应的第二类染色体窗口是第 8号染色体的碱基位置为 78450k -78750k的窗口; 当笫一类染色体的窗口是第 18号染色体的碱基位置为 62250k - 62550k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 96150k -96450k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 62400k - 62700k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 91050k -91350k的窗口; 当笫一类染色体的窗口是第 18号染色体的碱基位置为 62550k - 62850k的窗口时, 其对应的笫二类染色体窗口是第 12号染色体的碱基位置为 72900k -73200k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 62700k - 63000k的窗口时, 其对应的第二类染色体窗口是笫 12号染色体的碱基位置为 73650k -73950k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 62850k - 63150k的窗口时, 其对应的第二类染色体窗口是笫 2号染色体的碱基位置为 193200k -193500k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 63000k - 63300k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 181350k -181650k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 63150k - 63450k的窗口时, 其对应的第二类染色体窗口是第 ί2号染色体的碱基位置为 84150k -84450k的窗口; 当第一类染色体的窗口是第 L8号染色体的碱基位置为 63300k - 63600k的窗口时, 其对应的第二类染色体窗口是第 I号染色体的碱基位置为 157500k -157800k的窗口; 当第一类染色体的窗口是第 ί8号染色体的碱基位置为 63450k - 63750k的窗口时, 其对应的第二类染色体窗口是第 i号染色体的碱基位置为 21750k -22050k的窗口; 当第一类染色体的窗口是第 .8号染色体的碱基位置为 63600k - 63900k的窗口时, 其对应的笫二类染色体窗口是第 '号染色体的碱基位置为 80850k -81150k的窗口; 当第一类染色体的窗口是第 .8号染色体的碱基位置为 63750k - 64050k的窗口时, 其对应的第二类染色体窗口是第 '号染色体的碱基位置为 110250k -110550k的窗口; 当笫一类染色体的窗口是第 .8号染色体的碱基位置为 63900k - 64200k的窗口时, 其对应的第二类染色体窗口是第 '号染色体的碱基位置为 110250k -110550k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 64050k - 64350k的窗口时, 其对应的笫二类染色体窗口是第 2号染色体的碱基位置为 87150k -87450k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 64200k - 64500k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 12300k -12600k的窗口; 当第一类染色体的窗口是笫 8号染色体的碱基位置为 64350k - 64650k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 111600k -111900k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 64500k - 64800k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 9900k -10200k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 64650k - 64950k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 85050k -85350k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 64800k - 65100k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 72600k -72900k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 64950k - 65250k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 92100k -92400k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 65100k - 65400k的窗口时, 其对应的第二类染色体窗口是第 号染色体的碱基位置为 117450k -117750k的窗口; 当第一类染色体的窗口是第 8号染色体的碱基位置为 65250k - 65550k的窗口时, 其对应的第二类染色体窗口是第 6号染色体的碱基位置为 11 3400k -1 13700k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 65400k - 65700k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 181500k -181800k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 65700k - 66000k的窗口时, 其对应的第二类染色体窗口是第 5号染色体的碱基位置为 1 37100k -1 37400k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 65850k - 66150k的窗口时, 其对应的第二类染色体窗口是第 3号染色体的碱基位置为 1 74600k -174900k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 66450k - 66750k的窗口时, 其对应的笫二类染色体窗口是第 4号染色体的碱基位置为 145800k -146100k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 66600k - 66900k的窗口时, 其对应的第二类染色体窗口是笫 21号染色体的碱基位置为 27300k -27600k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 66750k - 67050k的窗口时, 其对应的笫二类染色体窗口是第 6号染色体的碱基位置为 123300k -123600k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 66900k - 67200k的窗口时, 其对应的笫二类染色体窗口是第 4号染色体的碱基位置为 181950k -182250k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 67050k - 67350k的窗口时, 其对应的第二类染色体窗口是第 8号染色体的碱基位置为 1 3800k - -14100k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 67200k - 67500k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 81 000k - -81300k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 67350k - 67650k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 162150k -162450k的窗口; 当第一类染色体的窗口是笫 18号染色体的碱基位置为 67500k - 67800k的窗口时, 其对应的笫二类染色体窗口是笫 7号染色体的碱基位置为 85050k - -85350k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 67650k - 67950k的窗口时, 其对应的第二类染色体窗口是第 2号染色体的碱基位置为 52050k - -52350k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 67800k - 681 00k的窗口时, 其对应的笫二类染色体窗口是第 4号染色体的碱基位置为 30900k - -31200k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 67950k - 68250k的窗口时, 其对应的第二类染色体窗口是第 12号染色体的碱基位置为 39450k -39750k的窗口; 当第一类染色体的窗口是第 18号染色体的碱基位置为 68100k - 68400k的窗口时, 其对应的第二类染色体窗口是第 4号染色体的碱基位置为 68400k -68700k的窗口; 当笫一类染色体的窗口是第 18号染色体的碱基位置为 68550k - 68850的窗口时,其 对应的第二类染色体窗口是第 5号染色体的碱基位置为 88350k -88650k的窗口;

当笫一类染色体的窗口是第 18号染色体的碱基位置为 68700k - 69000的窗口时,其 对应的笫二类染色体窗口是第 4号染色体的碱基位置为 87300k -87600k的窗口;

当第一类染色体的窗口是笫 18号染色体的碱基位置为 68850k - 69150的窗口时,其 对应的第二类染色体窗口是第 6号染色体的碱基位置为 70350k -70650k的窗口;

当第一类染色体的窗口是第 18号染色体的碱基位置为 69000k - 69300的窗口时,其 对应的第二类染色体窗口是第 7号染色体的碱基位置为 85950k -86250k的窗口。

20.权利要求 19中的有极强相关性窗口组合在建立用于染色体非整倍性的检测计算 函数式中的用途, 或者是在制备用于染色体非整倍性的检测试剂盒中的用途。

Description:
胎儿染色体非整倍性的检测方法 技术领域

本发明涉及医疗检测领域, 具体地涉及胎儿染色体非整倍体性的检测方法 , 通过第 一类染色体窗口组合的核酸分子量的值与其在 第二类染色体上的对应窗口的核酸分子的 量, 及其间的函数关系来检测产前胎儿染色体非整 倍性。

背景技术

胎儿非整倍体染色体是指染色体或染色体的某 一区域的量的异常。 这个异常的量可 以是异常的高, 如胎儿 21号三体, 即是比正常的二倍体胎儿多了一条 21号染色体; 或 者异常低, 如特纳综合征患者就是缺了一条或部分 X染色体。

传统中使用如绒毛膜绒毛取样(CVS)或羊膜穿 术的方法,获得从胎儿处分离得到细 胞,可以使用这些细胞进行常规产前诊断。虽 然用这种方法来诊断胎儿非整倍体的准确性 较高, 然而, 这些方法是侵入性的, 对母亲和胎儿具有明显的危险性。 (Tabor A, et al. Randomised control led trial of genetic amniocentesis in 4606 low-risk women. Lancet 1986, 1: 1287 -1293).

在母体血浆和血清中发现有非细胞的循环胎儿 DNA, 这为非侵入性产前诊断提供了 无限可能性。 Rossa W.LChiu等人在 PNAS 2008, 105: 20458-20463, 杂志上的文章 "利 用大规模高通量测序的方法来进行非整倍体染 色体的无创产前诊断" 详^介绍了利用这 种方法来进行无创胎儿非整倍体的诊断, 并且指出通过测序的手段可以最大程度的获得 外周血里面核酸分子的信息, 特别是在提取的母体样本里所含的来源于胎儿 染色体的核 酸分子相对于背景母体核酸分子的量来说是相 当少的情况下(Rossa W.K.Chiu ,et al. Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternalplasma. PNAS, 2008, 105: 20458- 20463)。 所述的方法为: 先提取出孕妇外周血血浆中的核酸分子, 再经过大规模高通量 第二代测序仪进行测序, 得到 DNA片断的序列信息及序列落在哪一条染色体上 的位置信 息。 Dennis Lo 等人基于这一基本信息, 然后统计来源于有医学意义的染色体(如 21 号, 18号, 13号染色体)上的核酸分子的量及来源于作为背 景染色体的核酸分子的量, 通过这两个量, 可以得到一个参数, 然后将这一参数与由正常样本所建得的一个或 多个 域值做比照, 进而发现在有医学意义染色体上有异常的样本 的这个参数与多种域值存在 着较大的差异 (Denni s Lo, e t a l. Presence of feta l DNA in ma terna l p lasma and serum. Lancet 1997, 350: 485-487)。 由此, 这种方法可用来检测胎儿的非整倍体。

然而, 这一方法存在着自身的局限性。 首先它对于每一个样本的检测都依赖于通过 N个(N大于 20个)标准阴性对照样本的序列分布数量所建 的正常对照值, 即上面所提 到的域值。 基于这些正常对照值, 才可能分析出所检测样本的情况。 也就是说为了做出 正确判断, 所测得的各样本的值之间的相互依赖性比较明 显, 因为要通过比较样本与样 本之间的值的差别才有可能做出正确的判断。

因此, 由于样本间需要相互比较的关系, 这种方法所要求的各批次样本所采用的实 验条件较为严格, 若实验条件差距较大, 将很难得到较为可信的正常对照值或是样本值 。 这个实验条件包括前期的样本制备,所用试剂 的批次及种类,测序 GC偏向,体系温度等, 也就是说, 各种实验条件的变化都应控制在相当小的范围 内, 否则会导致各阴性对照样 本间的值的方差增大, 或者各阴性对照样本的值的相互之间的较大偏 差, 有些阴性样本 的值甚至可能脱离正常值范围内, 成为离群值。 同理, 这一方法也依赖于待检测样本的 值的准确性, 为获得准确值, 制备该样本及所用的试剂及测序条件, 包括测序 GC偏向, 体系温度等, 都应该与实施阴性对照样本的尽量保持一致。 只有这样, 才能较为理想并 可信的统计出异常样本在所研究的染色体上的 分布数量的异常,并且保证其值为可信的。

但是, 要保证实验及测序条件下各微观体系条件的一 致性不是太简单的事情, 因为 实验过程中会有其它干扰因素, 所以往往会导致实验数据不太理想, 或者各样本之间数 据差异较大, 一方面, 一旦数据缺乏一致性, 其检测结果的可信度也随之降低, 而产生 假阳性或假阴性的结果; 另一方面, 如若数据由于实脸条件的变化因素所致差距较 大, 更会使之成为离群值而被抛弃不用。 众所周知, 测序成本目前还是较高的, 这样把离群 值抛弃不用理所当然会造成相当的浪费。

正如前面所说的目前比较先进的通过测序方法 来进行胎儿染色体非整倍性的诊断方 法中, 对样本制备或测序等的实验条件要求比较严格 , 因为在本质上来说, 它依赖于样 本与样本之间的比较。 正常样本与异常样本在所要研究的值上是有显 著差异的, 然而一 旦由于样本之间实验条件的不一样所引入的差 异大于异常样本与正常样本间的差异的时 候, 就会出现判断错误的情况, 降低检脸的可信度。 发明内容

本发明所要解决的技术问题:

针对这一情况, 发明人进行了多方面深入的研究, 终于研发出一种样本自身比照的 方法, 即不再通过样本之间的对比来做出决定, 而是通过比较来源于样本本身的相关值 来做出判断。 这样消除了对实验条件的依赖性, 这样提供了可用于胎儿染色体非整倍性 的无创检测新方法, 其消除了对实脸条件的依赖性。

本发明所采用的技术手段

具体而言, 发明人基于测序数据, 发现染色体间具有相互对应的核酸量的相关性 , 根据这种相关性提供了下迷方法, 依据本发明的数据采集和处理方法检测胎儿染 色体的 非整倍性。

具体地, 发明人的方法包括步骤:

1.检测个体染色体非整倍性的方法, 包括:

对全基因组进行测序, 将作为研究对象的待研究染色体定义为笫一类 染色体, 全基 因组中其余染色体定义为笫二类染色体; 依据第二类染色体片段与笫一类染色体片段的 行为值的相关性, 在全基因组上建立数学模型;

对待测个体进行全基因组测序, 进而得到待检测个体本身的的第一类染色体和 第二 类染色体的行为值, 如果在一定的置信水平上的行为值不满足前述 数学模型, 则可以确 定待测个体的染色体是非整倍性的。

2.项目 1的方法, 所迷方法包括:

将全部染色体分别切割成相互重叠或者不重叠 的片段, 每个片段定义为一个窗口; 通过测序统计来自无染色体缺陷的正常个体样 本的染色体各窗口的核酸分子的量, 将该量定义为行为值;

依据行为值, 通过数学统计方法寻找第二类染色体上的与笫 一类染色体有强相关性 的窗口或其组合, 建立函数关系式;

依据函数关系式和待检测样本中第二类染色体 各窗口中真实的核酸分子的量, 在一 定置信水平下, 得到待研究第一类染色体的行为值的模拟值置 信区间;

通过判断检测样本的第一类染色体的行为值与 其模拟值置信区间的关系, 判定笫一 类染色体是否异常。 3.项目 1的方法, 包括建模步骤(1) - (4)和检测步骤(5) - (8) , 具体如下:

(1)选择来自无染色体缺陷的正常个体的全基因 組进行测序,将作为研究对象的待研究染 色体定义为第一类染色体, 其余染色体定义为笫二类染色体;

(2)将(1)中的所有染色体切割成相互重叠或者 重叠的片段,每个片段定义为一个窗口;

(3)统计在多个不同实验奈件下多个样本染色 体各窗口的核酸分子的量, 定义为行为值;

(4)依据(3)中的行为值, 通过数学统计法寻找(1)中的第二类染色体上 与(1)中的第一 类染色体有强相关性的窗口或其组合, 建立第一类染色体的窗口和所找到的有强相关 性 窗口或其组合的函数关系式 A, 由此完成建模步骤;

(5)对待检测个体的样本的全基因组的所有染色 体进行测序,其中作为研究对象的待研究 染色体同样被定义为第一类染色体, 其是与(1)中的第一类染色体对应相同编号的 色 体, 其余染色体作为第二类染色体;

(6)按照(2)中同样的窗口规格切割(5)中待检 样本的染色体,统计第一类染色体和第二 类染色体的行为值;

(7)将(6)中的第二类染色体各窗口的行为值引 到关系式 A中, 设定置信水平, 计算得 到第一类染色体行为值的理论区间;

(8)如果(6)中统计的笫一类染色体的行为值不 (7)中的行为值的理论区间范围内,则认 为待研究的笫一类染色体异常。

4. 项目 3的方法, 其中将步骤(1) - (4)的关系式在不同待测样本的检测中重复使用 , 不 需要每次样本检测时都重复测定, 通过进行步骤(5) - (8)测定染色体的非整倍性。

上述的 "置信区间" 包括各窗口的置信区间和整条染色体的置信区 间。

上述的 "不同实猃条件" 主要包括测序 GC含量不一致, 试剂条件不一样, 实验制备 方法有差别等情况。

本发明提供了一种方法, 该方法使用来源于孕妇的单一样本, 并根据其染色体数据, 判断胎儿染色体是否为非整倍性。 由此方法, 发明最终获得了一组笫一类染色体窗口组 合, 和在第二类染色体中与其呈现强相关性的模拟 窗口組合, 以及在一定置信水平下校 正后的函数关系式。 通过这些窗口和函数关系式, 可以判断具体样本的第一类染色体是 否为非整倍性。

本发明的建模过程一旦确定, 即不再需要大量的正常样本进行建模, 只需将每次待 检测样本的自身的第二类染色体的行为值代入 在建模过程确定的关系式 A中, 即可判断 第一类染色体是否正常.

本发明的技术效果

本发明的方法可以用于非整倍体产前诊断。本 发明的方法摆脱了原方法对于严格控制 实验条件的较强依赖, 可适用于修正由于实猃条件变动所导致的离群 值样本, 从而减小 浪费. 本发明的方法可以通过样本自身对照, 而不依赖于其它样本的值, 给判断胎儿染 色体是否为非整倍性提供重要依据;本发明的 方法同时也避免侵入性方法而导致的风险。 本发明方法基于测序不但可以用来诊断染色体 是否为非整倍性, 更能够用于未知实驗条 件下或实验条件控制不好的情况下所获得的孤 立样本的染色体非整倍性诊断, 而且可与 背景技术中的方法结合一起使用, 互为验证, 从而进一步提高检验的准确度, 从大的影 响上来看, 可以有效地控制包括 21号三体在内的非整倍体染色体胎儿的出生率 另外本 发明的方法建立了一种数据处理方法, 灵活多变, 可模拟 21号染色体, 即找出与 21号 染色体的最优行为值一致内对照窗口组合, 也可以推广到所有感兴趣的染色体, 如 18号 染色体, 13号染色体等第一类染色体, 甚至一些感兴趣的染色体片断, 从而增加该方法 的应用范围。

附图简述

图 1 : 用来演示本发明在全基因组(除待研究的第一 类染色体)中寻找并确定与第一 类染色体各窗口组合有极强相关性的模拟窗口 組合的方法的流程图, 记为方法 100。

图 2: 用来演示本发明诊断孕妇所孕胎儿是否为染色 体非整倍性的方法的流程图, 记为方法 200。

图 3: 显示窗口间线性相关性的散点图。 通过对表 3所统计的来自于基因组窗口标 号为(chr4,642) 窗口区域上的核酸分子的量值 (89个行为值 x i ) , 与来自基因组窗口 标号为(chr21 , 180) 窗口区域上的核酸分子的量值(89个行为值 y i ), 利用统计学上的 相关性分析, 计算两窗口间的相关系数, 及关系函数, 图上显示的 R 2 为 0. 9724,说明两 窗口相关性很好。

图 4: 显示窗口间线性相关关系的散点图。 通过对表 3 所统计的来自基因組窗口标 号为(chrl, 256) 窗口区域上的核酸分子的量值 ( 89个行为值 xi ) , 与来自基因组窗口 标号为(chr21,180) 窗口区域上的核酸分子的量值(89个行为值 yi ) , 利用统计学上的 相关性分析, 计算两窗口间的相关关系系数 R, 由于相关系数 R 2 仅仅只有 0. 6 , 由图可 以看出两窗口线性关系不好。

图 5 : 显示窗口间线性相关性的散点图。 通过对表 7 所统计的来自基因组窗口标号 为(chr8,710) 窗口区域上的核酸分子的量值 (89个行为值 x i ) , 与来自基因组窗口标 号为(chr l 8, 259) 窗口区域上的核酸分子的量值(53个行为值 yi ), 利用统计学上的相 关性分析, 计算两窗口间的相关系数, 及关系函数。 图上显示的 R 2 为 0. 9816,说明两窗 口相关性很好。

图 6: 显示窗口间线性相关关系的散点图。 通过对表 7 所统计的来自基因组窗口标 号为(chrlj) 窗口区域上的核酸分子的量值 (53个行为值 x i ) , 与来自基因組窗口标 号为(chr l 8,259) 窗口区域上的核酸分子的量值( 53个行为值 yi ) , 利用统计学上的相 关性分析, 计算两窗口间的相关关系系数 R, 由于相关系数 R 2 仅仅只有 0. 0043 , 由图可 以看出两窗口线性关系不好。

图 7: 显示正常样本与异常样本的真实值与各自的模 拟值置信区间的关系的图。 具 体显示 4个来自孕妇外周血核酸样本,.样本 1与样本 2的真实值在各自的模拟值置信区 间之外, 样本为 21号染色体非整倍性; 而样本 5与样本 6的真实值在各自的模拟值置信 区间之内, 样本正常。

图 8: 显示正常样本与异常样本的真实值与各自的模 拟值置信区间的关系的图, 显 示 4个来自孕妇外周血核酸样本, 样本 3与样本 4的真实值在各自的模拟值置信区间之 外,样本为 21号染色体非整倍性; 而样本 7与样本 8的真实值在各自的模拟值置信区间 之内, 样本正常。

图 9: 显示正常样本与异常样本的真实值与各自的模 拟值置信区间的关系的图。 具 体显示 4个来自孕妇外周血核酸样本, 样本 1, 样本 2与样本 3的真实值在各自的模拟 值置信区间之内, 样本为 18号染色体正常; 而样本 4的真实值在各自的模拟值置信区间 之外, 为 18号染色体非整倍性。

图 10: 显示正常样本与异常样本的真实值与各自的模 拟值置信区间的关系的图. 显 示 2个来自孕妇外周血核酸样本, 样本 5与样本 6的真实值在各自的模拟值置信区间之 外,样本为 18号染色体非整倍性。

定义 为了更清楚地阐述本发明, 在本发明中使用的术语定义如下。

"非整倍体染色体" 或 "染色体非整倍性" 是指某条染色体相对于正常的二倍体基 因组上的这条染色体存在着整条或部分缺失或 冗余。 通常情况是, 有额外的一奈染色体 或其中的一条染色体丢失。 染色体非整倍性的最常见情况是三体, 即有一条额外的染色 体。 例如, 21号染色体三体就是在细胞中发现第三条 21号染色体的一种染色体异常.

"生物样本"是指来源于对象(如孕妇)的包含 兴趣的核酸分子的样本, 如血浆, 血 清或其它含有核酸分子的生物样本,

"正常样本"是指没有出现任何染色体有非整倍 异常的孕妇外周血样本。

"核酸分子"是指提取的生物样本里所含有的脱 核糖核苷酸分子, 在这里是指生物 样本里含有的, 来源于人的 3亿基因组碱基对的核酸分子。

"核酸片段分子" 是指生物样本经过制备等步骤后, 能够通过测序手段获得其序列 信息及其在基因组上的位置信息并可以代表与 其相对应的核酸分子的片段核酸分子。

"Unique核酸分子,,是指测序后信息分析表明 核酸分子在人类基因组上有且仅有一 个分布的位置。

"窗口" 是指可以将染色体或染色体区域根据人为定义 的单位核酸序列长度分割成 有重叠区域或没有重叠区域的片段, 而每个窗口都对应着这条染色体或染色体区域 上唯 一的一段, 位置信息唯一。

"核酸分子的量",也称行为值,依据核酸片段分 子基于测序定位到各染色体具体位置 后, 统计而得的定位在这个区域的核酸片段分子^ 数或者是能够反映有多少核酸分子 分布于这个区域的值,比如说将统计所得的可 以定位在这个区域的核酸片段分子的条数, 或者来自这个区域核酸分子的条数除以所有被 统计或部分被统计的核酸分子的条数所获 得的一个比值或者核酸片段分子长度的累积值 等, 总之, 对于一次实猃样本来说, 在某 一窗口区域里, 只要这个值能够反映核酸分子在这个窗口的分 布的量的情况, 这个值就 可以称为行为值或者来源于该窗口的核酸分子 的量。

"来源于某一窗口的核酸分子的量,,(窗口 行为值)是指依据核酸片段分子基于测序 定位到各染色体具体位置后, 统计所得的可以定位在这个区域的核酸片段分 子的条数或 者是能够反映到底有多少核酸分子分布于这个 区域的值, 比如说将统计所得的可以定位 在这个区域的核酸片段分子的条数, 或者来自同一区域核酸分子的条数除以所有被 统计 或部分被统计的核酸分子的条数所获得的一个 比值或者核酸片段分子长度的累积量等, 总之, 对于一次实验样本来说, 只要这个值能够反映核酸分子在这个窗口的分 布的量的 情况, 这个值就可以称为行为值或者来源于该窗口的 核酸分子的量。

"行为值一致 "是指两行为值, 其中的一个行为值发生变化, 另一行为值同时发生可 以用函数关系式近似表达的变化。

"真实值"指来源于第一类染色体的窗口的核酸 子的量。

"第一类染色体" 是指有临床研究价值的全部或部分核酸序列, 或者说在医学上, 经 常用这些染色体的不平衡来检测某些不正常的 症状。 例如 21 号染色体序列, 18 号染色 体序列, 1 3号染色体序列, X染色体序列或 Y染色体序列等。

"第二类染色体" 是指基因组上除去第一类染色体的其他染色体 , 本发明中指具体 实施中除去待研究第一类染色体的其他染色体 。

"第一类染色体窗口组合" 是指由若干个有重叠或无重叠窗口所构成的窗 口組合, 这一窗口组合可以覆盖整个或部分笫一类染色 体。

"与第一类染色体的窗口有极强相关性的模拟 口(模拟窗口组合) "是指在研究基 因组中, 存在于除当前研究的第一类染色体外其它染色 体上的特定模拟窗口, 该特定模 拟窗口与当前研究下的第一类染色体窗口存在 着强相关性, 其表现为: 对于其中的每一 个正常生物样本来说, 总是存在着这样一种关系, 即在这个样本中来源于第一类染色体 窗口的核酸分子的量若发生变化, 则来源于与第一类染色体窗口有极相关性的模 拟窗口 (模拟窗口组合)的核酸分子量也发生相应的 化, 而且这种一个量发生变化另一量也发 生变化的相关关系可以通过相关函数表达式近 似表达出来。 模拟窗口(模拟窗口组合)的 选定见方法 100。

"待研究染色体行为值的置信区间 "是指通过来源于第一类染色体的窗口组合的 酸分子的量和与其对应的函数关系式算得的在 一定置信水平下,该笫一类染色体(染色体 窗口)的置信区间。 若两窗口间表达关系式为 y=ax+b, 则此时统计所得的来源于与第一 类染色体窗口有极相关关系模拟窗口的核酸分 子的量为 X,根据函数关系式可以算得模拟 值 y,再根据统计学知识可以获得相应的置信区间

"不平衡" 在这里是指通过比较真实值不在根据模拟窗口 和函数关系式计算得到的 置信区间内, 认为此时检测的生物样本在所研究的第一类染 色体或第一类染色体区域存 在着不平衡,

本发明中的 "Chr" 是 "染色体" 的缩写, 例如 "Chr 18" 代表笫 18号染色体。 染 色体双螺旋链包括一正链, 一反链, 正反链是互补的, 即一条链碱基序列确定, 另外一 条互补链的碱基序列也确定。 因此, 其中的每一个位置碱基成对出现, 且碱基对是互补 的: A与 T互补, C与 G互补。 在人类的染色体上, 以正链的碱基位置为基准, 任何一个 位置都是指一对碱基对, 既包含了正链上的碱基, 同时也包含了反链上的互补碱基, 在 本发明中的定位位置,都是以 bp为单位的,即 base pa i r缩写(碱基对)。例如 chr21: 150 - 450kbp , 代表 21号染色体上处于 150000碱基对到 450000碱基对的窗口。 若要区分方 向的话, 正链是指 5, -3 ,的那条链,反链是与其互补的那条链, 而方向应该是 3,-5,。 我们通常都是以正链碱基位置为基准, 这里处于 chr21: 150bp的碱基是指, 从正链, 方 向 5, -3 ,,第 1个碱基开始数, 处于 150号的那个碱基对; 从负链, 方向 3, -5,,第 1 个碱基开始数, 处于 150号的那个碱基对.

在本发明的实施方案中, 提供一种寻找与第一类染色体窗口组合有极相 关性的模拟 窗口或窗口组合的方法。 所述的 "寻找模拟窗口或窗口组合" 的方法的本质是通过创新 性的各窗口间行为值的相关性分析找出与第一 类染色体窗口或窗口组合有极强相关性的 模拟窗口或模拟窗口組合, 例如, 所选的可以称为是第一类染色体窗口组合的模 拟窗口 组合里的窗口与其所对应的笫一类染色体窗口 之间的行为值相关系数接近于 1 , 且能够 获得一个普遍的函数关系式, 用来表述两窗口行为值之间的相关关系。

当第一类染色体的窗口只找到一个第二类染色 体窗口与之有强相关性时, 函数关系 式为二者之间的一元函数关系式, 如果找到了多个强相关性窗口时, 函数关系式为拟合 优化后的多元函数关系式。

本发明的实施方案, 提供了下述的诊断方法, 通过判断来源于同一样本的笫一类染 色体窗口组合的核酸分子的量是否在置信区间 内来诊断非整倍体染色体, 置信区间由来 源于前述寻找确定的模拟窗口组合的行为值及 各相应窗口间的相关关系共同决定。

实施例

以下的实施例仅用来解释本发明, 而不是用来限制本发明的保护范围, 任何与本发 明的方法等价的变体都包括在本发明当中.

实施例一 - v ^ υ ο 步骤 1:获得建模所需测序数据

选择 89个正常样本, 对这些样本在有差异的实验条件下制备并测序 。

简要地说, 先制备 DNA文库, 再将核酸片段分子连接到 So lexa测序接头上, 然后分 离纯化核酸片段长度在 150到 300碱基对的核酸分子。 连上接头的核酸分子可以与 f low ce l l表面互补接头杂交, 在一定条件下, 核酸分子成簇生长, 然后在 I l lumina Genome Ana lyzer上通过 36轮测序循环,即相当于每个核酸分子测得了 35个碱基对的核酸片段。 接下来测得的序列信息经过一个 P i pel ine过程, 最终可以获得以 NCBI里的人类基因组 序列为参照序列的 ELAND比对结果。

在研究中, 为避免一些重复序列的干扰, 发明人将那些处于基因组串联重复及转座 重复的核酸分子片段剔除, 只统计那些可以定位到基因組唯一位置的核酸 片段分子。 这 样说来, 在所有测出来的核酸分子中, 大概只有四分之一到三分之一的核酸分子是可 以 定位到基因组唯一位置。此时这些被统计的核 酸分子称为 Unique核酸分子, 而这个统计 所得的 Unique核酸分子的量依然代表分布在基因组特定 区域的核酸分子的量

该步骤对应于图 1的 110, 120步。

步骤 2:建立 21号染色体检测模型

根据图 1的流程图进行, 数学模型建立的过程由计算机程序优化完成。 计算机程序 通过不同的参数选择, 完成相关性窗口的寻找, 寻找最优参数, 建立第一类染色体窗口 与第二类染色体窗口的函数关系式。

在 130步中, 基于测序, 可以通过生物信息分析的手段将所测得的每条 核酸片段分 子定位到基因组的确切位置上.

在 140步中, 对每个样本进行切割窗口。 将构成基因组的每条染色体分割成若干窗 口序列. 将整个基因组切割成合适大小的窗口, 相当于将每条染色体看成由一些有重叠 区域或无重叠区域的窗口的组合。 如 21 号染色体总共有约 47Mega 的碱基对, 如果以 l OMega大小为一个窗口, 而每次窗口开始的位置向后滑动 lMega大小的话, 则 21号染 色体对应着 47个有重叠的 l OMega大小的窗口。 可以人为定义想要的窗口长度大小及窗 口重叠区序列的长度, 并也为窗口编号, 产生一对窗口编号到窗口在基因组上各染色体 上的真实坐标的映射,

实施例中以 300k为窗口大小, 150k为 over lap切分窗口 (即每个窗口的起始端为前 一个窗口起始端向后滑动 150k ) , 表 1显示了切割 21号染色体后的 40个窗口。 若一 个窗口对应的窗口标号为 chr21, 2 ,则其对应的在基因组上的位置为 chr21 : 150 - 45 O

表 1展示了通过人为切割 21号染色体所获得的窗口的标号及窗口在基因 上的位置 坐标, 表里仅显示 40个窗口。 如窗口标号为(chr21 , 180),表示它是切割 21号染色体后 的第 180个窗口, 在 21号染色体上的具体位置即坐标为(chr21 : 26850 - 27150kbp) , 即 处于 21号染色体的 26850000碱基对及 27150000碱基对之间。 由此, 每一个窗口标号都 代表着所对应染色体的映射位置, 即一段人为切割的染色体区域。

实施例中, 4号染色体是一条非第一类染色体, 若以 300k碱基对大小为一个窗口, 而每次窗口开始的位置向后滑动 150k碱基对的方式同理可以切割成若干窗口, 2列出 - 二十个窗口标号及在染色体上的位置信息即窗 口坐标。 如一个窗口对应的窗口标号为 chr4, 2 ,则其对应的在基因组上的位置为 chr4: 150 - 450kbp。 窗口标号 窗口坐标 窗口标号 窗口坐标 chr4,1 chr4 0~300kbp chr4,640 chr4:95850~96150kbp chr4,2 chr4 150~450kbp chr4,641 chr4:96000~96300kbp chr4,3 chr4 300~600kbp chr4,642 chr4:96150~96450kbp chr4,4 chr4 450~750kbp chr4,643 chr4:96300~96600kbp chr4,5 chr4 600~900kbp chr4,644 chr4:96450~96750kbp chr4,6 chr4 750~1050kbp chr4,645 chr4:96600~96900kbp chr4,7 chr4 900~1200kbp chr4,646 chr4:96750~97050kbp chr4,8 chr4 1050~1350kbp chr4,647 chr4:96900~97200kbp chr4,9 chr4 1200~1500kbp chr4,648 chr4:97050~97350kbp chr4,10 chr4 1350~1650kbp chr4,649 chr4:97200~97500kbp 表 2 中展示了通过人为切割笫 4号染色体所获得的窗口的标号及代表其在基 组上 的位置的窗口坐标, 仅显示其中的 20个窗口。 如窗口标号为(chr4, 643) ,表示它是切割 4号染色体后在其上第 180个窗口, 在 4号染色体上的具体位置即坐标为(chr4: 96300 - 96600kbp) , 即处于 4号染色体的 96330000碱基对及 96600000碱基对之间。

在 150步, 对这些在有差异的条件下制备及测序的样本, 基于测序所得信息, 分别 统计各样本来源于各窗口序列的核酸片段分子 的量。

如 21号染色体的窗口, 如前所述是指有临床研究价值的染色体的窗口 组合。假设这 一窗口组合中某一窗口的坐标为(chr21: 89000 - 89200bp) , 说明它处于 21号染色体上, 并且这个窗口区域从第 89000个碱基对开始到笫 89200个碱基对结束,而此时,测得的某 一核酸片段分子的起始坐标为 chr21: 89100, 而所测得的分子片段长度为 35个碱基对, 那么, 这个核酸片段分子的序列位置刚好在这个窗口 坐标之内, 则说明这一条核酸片段 分子来源于此窗口区域, 如可以统计一个样本的所有序列位置处于这一 窗口的核酸分子 的条数, 那么这个条数可以称为来源于这一窗口的核酸 分子的量。 然后将构成这个笫一 类染色体窗口組合的窗口的核酸片段分子的量 合起来, 就可以得到来源于第一类染色体 窗口组合的核酸分子量, 这里要强调的是这个第一类染色体窗口组合可 以根据情况部分 或整体地覆盖第一类染色体一次或多次。

在 160步, 对于 21号染色体的每一个窗口, 在整个基因組(除 21号染色体)上的窗 口分析与这一窗口的相关性, 选择极强相关性的窗口组保留, 并确定其间的函数关系式, 这时, 21号染色体的单个窗口可能会对应多个相关窗 , 组成相关窗口组合。 设统计所 得的来源于第二类染色体窗口的核酸分子量为 X i , 统计所得来源于第一类染色体窗口的 核酸分子量为 Y i, i代表样本编号, 则观测样本为(XI, Yl) , (X2,Y2), ...(Χη, Υη) .此时, 根据这些数据, 可以算得这两组数据的相关系数的平方。 相关系数的平方越接近 1 , 截 距接近于 0, 说明相关性越高。 每一个 21号染色体与其单个相关窗口都能确定一个函 数关系式。

实施例中,准备了 89个在有差异的实验条件及测序条件下进行样 制备及测序的生 物样本, 分别统计各样本来源于各窗口区域序列的核酸 片段的量, 即对每个样本, 其在 基因组上切割的每个窗口都对应着一个行为值 。 对于 89个样本来说, 每个窗口里有 89 个行为值。

在这个实施例中, 对于 21号染色体的每一个窗口, 同时在基因组(除 21号染色体) 上搜索与这一个窗口相关性极高的一个窗口。 为方便说明, 在这里仅取三个窗口用来说 明, 见表 5 , 一个来源于笫一类染色体窗口组合的窗口, 编号为(chr21,180) ,两个来源 于非第一类染色体的窗口, 编号分别为窗口(chr l, 256), 窗口(chr4, 642)。 见表 3, 所 示第一行, 显示样本编号, 即本方法所研究的 89个样本的编号; 第二行展示了样本编号 对应的 89 个样本中的每个样本的来自基因組窗口标号为 (chr l, 256)窗口上的核酸分子 的量值,即 89个行为值, 记为 X' i, i值从 1取到 89。 笫三行展示了样本编号对应的 89 个样本中的每个样本的来自基因组窗口标号为 (chr4, 642)窗口上的核酸分子的量值,也 是 89个行为值, 记为 xi,i值从 1取到 89。 第四行展示样本编号对应的 89个样本中的 每个样本的来自基因组窗口标号为(chr21,180) 窗口上的核酸分子的量值,也是 89 个行 为值, 记为 y i, i值从 1取到 89 ,

表 3

首先研究窗口 (chr4, 642)与窗口 (chr21,180)的相关关系, 此时观测样本为

(XI , YD , (X2. Y2) , ... (Χη, Υη) , 在这个实施例中, η可以取到 89,研究两列数值的相关系 数, 相关系数的平方越接近 1, 说明相关性越高, 即当一个窗口的行为值变动时, 另一 个窗口也会发生相应的变动。 当相关系数接近 1 时, 可以根据观测样本研究两窗口的行 为是否服从线性关系,表 3表示出的窗口(chr4,642)与窗口(chr21 , 180)的行为值服从线 性关系, 并且可以获得其线性方程的表达式和相关系数 R 的平方。 见图 3 , 在这个实施 例中,可以看出两窗口,窗口 (chr4, 642)与窗口 (chr21, 180) ,的行为值存在着极强的线性 相关性, 且相关表达式为: y=0. 7564-0. 6487, R 2 =0. 9724 „ 显然 R还是比较接近 1 的, 则这个窗口(chr4, 642)可以选定作为与实施例窗口(chr21,180)相 应的有极强相关性 的模拟窗口。 再来研究窗口(chr l , 256)与窗口(chr21, 180),见图 4,其 R 2 =0. 6214,则认为 两窗口行为值不是很相关, 以后可以不考虑该窗口。 就这样, 对于第一类染色体窗口组 合中的窗口都可以用这样的方法去寻得一个或 多个相关性极强的模拟窗口。 以后就只需 要已知一个 X值, 即只需要统计好来源于这个与实施例窗口相对 应的有极强相关性的模 拟窗口的量, 就可以通过关系式计算出一个模拟值或模拟值 置信区间。

如表 4公布了通过方法 100流程步骤所选得的与第一类窗口组合有极强 相关性的散 布在基因组其它位置的模拟窗口组合, 表中仅显示由 20个窗口所组成的组合。 第一列显 示位于第一类染色体上的窗口标号, 第二列显示其窗口坐标; 第三列显示与相应的第一 类染色体有极强相关性的模拟窗口的窗口标号 , 笫四列显示对应的模拟窗口坐标; 第五 列显示窗口与相关模拟窗口的关系表达式; 第六列显示相关系数的平方值, 即 R方值, R 平方值越接近 1,说明两窗口间相关性越高, 即其中来源于一个窗口的核酸分子量发生变 化, 则来源于另一窗口核酸分子量会发生相应的变 化。

表 4

接着可以将与 21号染色体窗口组合有极强相关性的模拟窗口 合起来,共同构成模 拟窗口组合, 再根据来源于模拟窗口或模拟窗口组合的核酸 分子的量算得一个修正过的 置信区间, 用于方法 200对染色体非整倍性的判断,

在 170步, 由于 21号染色体上的每个窗口可能有多个窗口与之 关, 所以为充分使 用测序数据, 提高检测准确性, 将这些窗口的相关函数关系式进行拟合, 并根据实际数 据, 进行校正, 最终确定 21号染色体中, 能在基因组上找到强相关性的每个窗口的函数 关系式。

步骤 3:对待检测样本测序

8 个孕妇志愿者参与本项检测, 所获得的样本编号分别为样本 1-8。 四个孕妇怀有 21号染色体三体胎儿, 四个孕妇怀有 21号染色体正常胎儿。 收集每个孕妇外周血, 并 对进行离心, 取血浆, 然后再从血浆中提取核酸分子, 通过 I l lumina公司的测序仪对这 些核酸分子进行大规模高通量测序。 根据图 2的 200方法的流程图进行, 具体地, 在 210步, 从孕妇处获得生物样本, 这个生物样本可以是血浆或其它合适的样本。 这种生物样本包含着来源于孕妇以及胎儿 的核酸分子。

在 220步, 对样本中的核酸分子进行随机测序。 被测序的核酸片段分子代表着整个 基因组的一部分, 可以定位在各条染色体上, 样本中的核酸分子可以只测一端(如测一端 35个碱基对)或测两端, 或者将整条核酸分子都测出来。

测序可以通过大规模高通量平行测序仪测序, 如 454, So lexa, SOL iD系统, 以及单 分子测序或纳米孔测序等。 在一个实施例中我们通过 I l lumina公司的 so lexa测序仪来 对核酸分子进行一端测序。

虽然样本制备以及实验的大概流程相同, 为了验证本发明方法适合实验条件不太一 致的情况, 即具有对实验条件要求不是很严格的优势, 所述的实验条件包括使用不同的 试剂, 测序 GC偏向不一致等。 特分为两组, 样本 1,样本 2,样本 5,样本 6为一组实验条 件 (A组) ; 样本 3,样本 4,样本 7,样本 8为另一组实验条件(B组)。 A组为抽取 5ml孕 妇血浆,使用 QIAamp DNA Mi cro k i t (QIAGEN, 56304)提取游离 DNA,按照 I l lumina/Solexa 建库流程使用 NEB试剂构建 SE文库,上 SE36测序, B組抽取 600ul孕妇血浆使用 TIANamp Mi cro DNA Ki t ( Tiangen DP316)提取游离 DNA, 按照 I l lumina/Solexa 建库流程使用 Enzyma t ics试剂构建 PEI文库, 上 SE36+7测序。

此步骤如图 2的 210, 220步。

步骤四: 检测样本,根据图 2的流程图进行。

在 230步中, 基于测序, 可以通过生物信息分析的手段将所测得的每条 核酸片段分 子定位到基因组的确切位置上。 如表 1其显示了通过测序所测得的可以定位到各条 色 体的核酸片段分子其在该染色体上的起始位置 坐标。

表 5显示了生物样本样本 1和样本 2测序后所得到的一些核酸分子定位到 4号染色 体和 21号染色体上的前十个起始位点的位置信息。

由表 5可以看出, 对于样本 1而言, 其可以定位到 21号染色体上的第一条核酸片段 分子的起始点位置为 9797443 , 即这条核酸片段分子的起始点位于 21 号染色体的笫 9797443碱基对位置。 同理, 其可以定位到 4 号染色体上的第一条核酸片段分子的起始 点位置为 19219, 即这条核酸片段分子的起始点位于 4号染色体的第 19219碱基对位置。

在 240步中, 和建立模型中一样, 用 300k为窗口大小, 150k为 over lap对 8个待 检测样本的所有染色体分别切割窗口. 在 250步中, 基于核酸片段位置信息, 统计来源 于 21号染色体各窗口的核酸片段分子的量。 在 260步中, 基于核 Ml!MJMd Mil酸三三三三... 片段位置信息, 统计 体体体体

来源于每个样本的与 21号染色体窗口有强相关性的模拟窗口组合的 酸分子的量,并依 据函数关系式算出置信区间。 在 270步中, 通过判定每个样本的第 250步胎胎胎胎所2 222

/, J获 II II 1 l 得的来源 三三三三 Ϊ3§ί33! 于 21号染色体窗口的核酸片段分子的量是否在同 样本的第 260步中所获得的置ε4*_εκ- .··.·.常常常常信区间 内, 可以判断胎儿是否在 21号染色体存在非整倍性的高风险,

表 6: 用本发明方法检测实施例中的八个样本所得到 的结果 样品 真实值 Y 模拟值 95%置信区间 HI

Samplel 53182 [43741.8577333385,49180.4533039014] 2 12

Sample2 58357 [50652.113474583,55849.319880917] 21:

Sample3 27972 [24280.9213020507,27555.3170942193] 21Z

Sample4 28149 [23685.2145432661 ,26901.8699143739] 21:

Sampled 60366 [56287.8434307435,62016.0997439065] 21

Sample6 56548 [52747.7578964899,58146.06907256] 21

Sample7 34747 [32444.1196306556,36615.1903005244] 21

Sample8 23258 [21945.9756617287,24982.0017753413] 21

表 6中的真实值 Y列,是统计所得的来源于各样本 21号染色体窗口组合的核酸分子 量;统计该样本中与 21号染色体窗口组合有强相关性的模拟窗口组 的核酸分子量及相 关关系表达式(如表 4 所示), 再通过统计学知识所得到的一个置信区间( 置信水平: 95% ) . 对于一个研究的样本来说, 当它的真实值存在于计算得到的置信区间内时 , 可以 认为所研究的样本是正常的可能性很大, 反之, 若真实值存在于模拟值置信区间之外, 则说明该样本是正常的可能性很小。 如样本 1,样本 2,样本 3,样本 4,它们的真实值即来 源于 21号染色体组合的核酸分子量都在置信区间范 之外,则用本方法所获得的结论为 它们为 21三体胎儿样本, 该结果得到了核型分析结果的证明。

通过比较上述的各样本来源于第一类染色体窗 口組合的核酸片段分子的量的值(真 实值)与所获得的模拟值置信区间,判断是否 存在着在第一类染色体上的胎儿非整倍体染 色体或非整倍体染色体区域, 如表 6所示, 可以看到 21号染色体三体的真实值在模拟值 置倌区间之外, 而正常两倍体样本其真实值在模拟值置信区间 范围之内。 图 7, 显示四 个来自孕妇外周血核酸样本, 样本 1与样本 2的真实值在各自的模拟值置信区间之上, 可以确定为 21号染色体非整倍性;而样本 5与样本 6的真实值在各自的模拟值置信区间 之内, 可以认为样本正常。 图 8 , 图示正常样本与异常样本的真实值与各自的模 拟值置 信区间的关系。 显示四个来自孕妇外周血核酸样本, 样本 3与样本 4的真实值在各自的 模拟值置信区间之上, 可以确定为 21号染色体非整倍性; 而样本 7与样本 8的真实值在 各自的模拟值置信区间之内, 可以认为样本正常。

实施例二

步骤 1 :获得建模所需测序数据

选择 53个正常样本, 对这些样本在有差异的实验条件下制备并测序 。

该步骤对应于图 1的 110, 120步。

步骤 2:建立 21号染色体检测模型

根据图 1 的流程图进行, 数学模型建立的过程由计算机程序优化完成。 计算机程序 通过不同的参数选择, 完成相关性窗口的寻找, 寻找最优参数, 建立笫一类染色体窗口 与第二类染色体窗口的函数关系式。

在 1 30步中, 基于测序, 可以通过生物信息分析的手段将所测得的每条 核酸片段分 子定位到基因组的确切位置上。

在 140步中, 对每个样本进行切割窗口。 将构成基因组的每条染色体分割成若干窗 口序列。 实施例中以 300k为窗口大小, 150k为 over l ap切分窗口 (即每个窗口的起始 端为前一个窗口起始端向后滑动 150k ) 。

在 150步, 对这些在有差异的条件下制备及测序的样本, 基于测序所得信息, 分别 统计各样本来源于各窗口序列的核酸片段分子 的量。

在 160步,对于 18号染色体的每一个窗口,在整个基因组(除 21号染色体)上的窗 口分析与逸一窗口的相关性,选择极强相关性 的窗口组保留, 并确定其间的函数关系式, 这时, 18号染色体的单个窗口若对应多个相关窗口, 组成相关窗口组合。

实施例二中, 准备了 53个在有差异的实验条件及测序条件下进行样 制备及测序 的生物样本, 分别统计各样本来源于各窗口区域序列的核酸 片段的量, 即对每个样本, 其在基因组上切割的每个窗口都对应着一个行 为值。对于 53个样本来说,每个窗口里有 53 个行为值。 如表 7 所示, 选取 3 个窗口, 分别来自于(chrl 8, 259) , (chrl, 8) , (chr8, 710)。 所示第一行, 显示样本编号, 即本实施例中所研究的 53个样本的编号; 第 二行展示了样本编号对应的 53 个样本中的每个样本的来自基因组窗口标号为 (chrl, 8) 窗口上的核酸分子的量值,即 53个行为值, 记为 4, 1值从1取到 53。 第三行展示了样 本编号对应的 53 个样本中的每个样本的来自基因组窗口标号为 (chrl 8, 259) 核酸分子 的量(53个行为值), 记为 xi, i值从 1取到 53, 第四行展示样本编号对应的 53个样本 中的每个样本的来自基因组窗口标号为(chrl 8, 259) 核酸分子的量(53个行为值), 记 为 yi, i值从 1取到 53。

表 7

首先研究窗口 (chr8, 710)与窗口 (chrl 8, 259)的相关关系, 此时观测样本为 (XI, YD , (X2. Y2) , ... (Χη, Υη) , 在这个实施例中, η可以取到 53,研究两列数值的相关系 数,得到窗口(chr8, 710)与窗口(chrl 8, 259)的行为值存在着强相关性,且相关表达式 : y= - 9. 18452 + 0. 98295x, R 2 =0. 9816 , 见图 5 。 显然 R 2 还是比较接近 1 的, 则这个窗口 (chr8, 710)可以选定作为与实施例窗口(chrl 8, 259)相对应的有强相关性的窗口。再研究 窗口(chrl j)与窗口(chr8, 259),见图 6,其 R 2 =0. 004344,则认为两窗口行为值不相关, 以后可以不考虑该窗口, 如此, 可以在基因组 (除 18 号染色体) 上选定一个或多个与 18号染色体相关性强的窗口。 以后就只需要已知一个 X值, 即只需要统计好来源于这个 与实施例窗口相对应的有极强相关性的模拟窗 口的量, 就可以通过函数关系式计算出一 个置信区间。

如表 8公布了通过方法 100流程所选得上面步骤所选得的与 18号染色体有极强相关 性的散布在基因组其它位置的窗口组合, 图中仅显示其中 20 个窗口。 第一列显示位于 18号染色体上的窗口标号, 笫二列显示其窗口坐标; 第三列显示与相应的 18 号染色体 有强相关性的窗口的标号, 第四列显示对应的窗口坐标; 第五列显示窗口与相关窗口的 关系表达式; 第六列显示相关系数的平方值, 即 R 2 .

表 8

接着可以将与 18号染色体窗口组合有极强相关性的窗口组合 来,再根据来源于各 窗口的核酸分子的量算得一个修正过的置信区 间, 用于方法 200对染色体非整倍性的判 断。

步骤 3:对待检测样本测序

6个孕妇志愿者参与本项检测,所获得的样本 号分别为样本 1-6。收集每个孕妇外 周血, 并对进行离心, 取血浆, 然后再从血浆中提取核酸分子, 通过 I l lumina公司的 测序仪对这些核酸分子进行大规模高通量测序 。

根据图 2的 200方法的流程图进行, 具体地, 在 210步, 从孕妇处获得生物样本。 这个生物样本可以是血浆或其它合适的样本, 这种生物样本包含着来源于孕妇以及胎儿 的核酸分子。

在 220步, 对样本中的核酸分子进行随机测序。 被测序的核酸片段分子代表着整个 基因组的一部分,可以定位在各条染色体上。 实施例中我们通过 I l lumina公司的 solexa 测序仪来对核酸分子进行一端测序。

特分为两组, 样本 1,样本 2,样本 4为一组实验条件( A组); 样本 3,样本 5,样本 6 为另一组实验条件(B 组), A 组为抽取 5ml 孕妇血浆, 使用 QIAamp DNA Mi cro k i t (QIAGEN, 56304)提取游离 DNA,按照 1 1 lumina/Solexa建库流程使用 NEB试剂构建 SE 文库,上 SE36测序,Β组抽取 600ul孕妇血浆使用 TIANamp Mi cro DNA K i t( T iangen DP316) 提取游离 DNA, 按照 I I lumina/Solexa建库流程使用 Enzyma t ics试剂构建 PEI文库, 上 SE36+7测序。

此步骤如图 2的 210 , 220步。

步骤 4: 检测样本

根据图 2的流程图进行.

在 230步中, 基于测序, 可以通过生物信息分析的手段将所测得的每条 核酸片段分 子定位到基因組的确切位置上。 如表 1其显示了通过测序所测得的可以定位到各奈 色 体的核酸片段分子其在该染色体上的起始位置 坐标。

在 240步中, 和建立模型中一样, 用 300k为窗口大小, 150k为 over l ap对 6个待 检测样本的所有染色体分别切割窗口,

在 250步中,基于核酸片段位置信息,统计来源于 18号染色体各窗口的核酸片段分 子的量。

在 260步中, 基于核酸片段位置信息, 统计来源于每个样本的与 18号染色体窗口有 强相关性的窗口组合的核酸分子的量, 并依据函数关系式算出置信区间。

在 270步中,通过判定每个样本的第 250步所获得的来源于 21号染色体窗口的核酸 片段分子的量是否在同一样本的第 260步中所获得的置信区间内, 可以判断胎儿是否在 18号染色体存在非整倍性的高风险。

表 9: 用本发明方法检测实施例中的八个样本所得到 的结果

表 9中的真实值(第二列), 是统计所得的来源于各样本 18号染色体窗口组合的核 酸分子量;统计该样本中与 18号染色体窗口组合有强相关性的模拟窗口组 的核酸分子 量及相关函数表达式(如表 8所示), 再通过统计学知识所得到的一个置信区间( 置信水 平: 95% )。 对于一个研究的样本来说, 当它的真实值存在于计算得到的置信区间内时 , 可以认为所研究的样本是正常的可能性很大, 反之, 若真实值存在于模拟值置信区间之 外, 则说明该样本是非整倍体的风险很大。 如样本 4,样本 5,样本 6,它们的真实值即来 源于 21号染色体组合的核酸分子量都在置信区间范 之外,则用本方法所获得的结论为 它们为 18号染色体非整倍性胎儿样本, 该结果得到了核型分析结果的证明。

通过比较上述的各样本来源于第一类染色体窗 口组合的核酸片段分子的量的值(真 实值)与所获得的模拟值置信区间,判断是否 存在着在第一类染色体上的胎儿非整倍体染 色体或非整倍体染色体区域。 如表 9所示, 可以看到 18号染色体三体的真实值在模拟值 置信区间之外, 而正常两倍体样本其真实值在模拟值置信区间 范围之内。 图 9和图 10, 显示了 6个来自孕妇外周血核酸样本, 样本 1, 样本 2与样本 3的真实值在各自的模拟 值置信区间之内, 可以认为样本正常, 而样本 4, 样本 5与样本 6的真实值在各自的置 信区间之外, 认为 18号染色体非整倍性风险很高。