Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
PCR-SEQUENCING METHOD BASED ON TECHNOLOGY OF DNA MOLECULAR INDEX AND STRATEGY OF DNA-BREAKING INCOMPLETELY
Document Type and Number:
WIPO Patent Application WO/2012/000152
Kind Code:
A1
Abstract:
The present invention provides a sequencing method for nucleic acid, which method comprises: amplifying the target nucleic acid using indexed primers, breaking the amplicons incompletely and purifying and recovering mixed DNAs, sequencing the mixed DNAs by a next-generation sequencing method to obtain the sequences of the broken DNAs, and assembling the sequences of the broken DNAs into a complete sequence for the target nucleic acid. The present invention further provides primer indexes for the sequencing method.

Inventors:
LI JIAN (CN)
LIU TAO (CN)
ZHAO MEIRU (CN)
ZHANG XIANDONG (CN)
Application Number:
PCT/CN2010/001834
Publication Date:
January 05, 2012
Filing Date:
November 15, 2010
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
BGI SHENZHEN CO LTD (CN)
LI JIAN (CN)
LIU TAO (CN)
ZHAO MEIRU (CN)
ZHANG XIANDONG (CN)
International Classes:
C12Q1/68
Domestic Patent References:
WO2008045575A22008-04-17
Foreign References:
CN101654691A2010-02-24
Other References:
RICHARD CRONN ET AL.: "Multiplex sequencing of plant chloroplast genomes using Solexa sequencing-by-synthesis technology", NUCLEIC ACIDS RESEARCH, vol. 36, no. 19, 2008, pages E122
Attorney, Agent or Firm:
CCPIT PATENT AND TRADEMARK LAW OFFICE (CN)
中国国际贸易促进委员会专利商标事务所 (CN)
Download PDF:
Claims:
权 利 要 求

1. 一种测定样品中目的核酸的核苷酸序列的方法, 其包括:

1 )提供 n个样品, n为大于等于 1的整数, 所述样品优选地来 自哺乳动物, 更优选是人, 特别是人的血样; 可选地, 将待分析 的 n个样品分成 m个小组, m为整数且 n > m > l;

2 )扩增: 对于每一个样品, 使用一对或多对标签引物, 在存 在来自该样品的模板时, 在适于扩增目的核酸的条件下进行 PCR 扩增, 其中, 每一对标签引物由包含引物标签的正向标签引物和 反向标签引物 (均可以是简并引物)构成, 其中正向标签引物和 反向标签引物所包含的引物标签可以相同或者不同; 不同样品所 用标签引物对中的引物标签彼此不同;

3 ) 混合: 当 η>1时, 将各样品的 PCR扩增产物混合在一起;

4 )打断: 将所得的扩增产物进行不完全打断, 并进行纯化回 收;

5 )测序: 将回收的 DNA混合物利用二代测序技术, 优选的是 Pair-End技术(例如 IUumina GA、 IUumina Hiseq 2000 )进行测序, 获得打断后的 DNA的序列; 和

6 )拼接:基于每个样品独特的引物标签将获得的测序结果与 样品 对应, 利用比对程序 (例如 Blast, BWA程序)把各个测 序序列定位到 PCR产物的相应 DNA参考序列上, 通过序列重叠和 连锁关系, 从打断后的 DNA的序列拼接出完整的目的核酸。

2. 权利要求 1所述的方法,其中每一对引物标签与 PCR引物对 组合成一对标签引物, 正反 PCR引物的 5,端分别具有(或者任选 通过连接序列连接)正向引物标签和反向引物标签。

3. 权利要求 1所述的方法, 其中所述 PCR引物是用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRBl 2号外显子的 PCR 引物, 优选的所述 PCR引物如表 2所示。

4. 权利要求 1所述的方法,其中所述引物标签针对 PCR引物进 行设计, 优选针对用于扩增 HLA的特定基因的 PCR引物进行设 计, 更优选是用于扩增 HLA-A/B的 2 , 3 , 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物,特别是如表 2所示的 PCR引物 进行设计,所述引物标签特别是包括表 1所示 95对引物标签中的至 少 10对, 或至少 20对, 或至少 30对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 95对 (或 者所述一组引物标签由表 1所示 95对引物标签中的 10 - 95对(例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95 对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组成) , 并且 所述一组引物标签优选地至少包括表 1所示 95对引物标签中 的 PI-1至 PI-10 , 或 PI-11至 PI-20 , 或 PI-21至 PI-30 , 或 PI-31至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70,或 PI-71 至 PI-80, 或 PI-81至 PI-90, 或 PI-91至 PI-95, 或者它们任何两个 或者多个的组合。

5. 权利要求 1所述的方法,其中所述 DNA打断包括化学打断方 法和物理打断方法, 其中所述化学方法包括酶切方法, 所述物理 打断方法包括超声波打断方法或机械打断方法。

6. 权利要求 1所述的方法, 其中所述 DNA打断后, 纯化回收 从测序仪最大读取长度到测序仪可适用的最长 DNA长度范围之间 的所有 DNA条带,其中所述纯化回收方法包括但不限于电泳割胶回 收, 也可以是磁珠回收。

7. 权利要求 1所述的方法, 其中所述方法还可以包括权利要求 1所述的步骤 1 ) - 4 ) , 以及如下步骤: 5 )建库: 将打断后的 PCR产物文库构建 PCR-Free测序文库, 可以对文库添加不同的文库接头 ( adapter ) 以区分不同的 PCR-Free测序文库, 纯化回收位于所用测序仪最大读长长度到所 用测序仪适用的最长 DNA长度范围之间的所有 DNA条带,优选地 是 450-750bp长度范围的 DNA片段;

6 ) 测序: 将回收的 DNA混合物利用二代测序技术, 优选的 是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行 测序, 获得打断后的 DNA的序列;

7 )拼接: 基于各个文库不同的文库接头序列和每个样品独特 的引物标签将获得的测序结果与样品一一对应,利用比对程序(例 如 Blast,BWA程序) ^各个测序序列定位到 PCR产物的相应 DNA 参考序列上,通过序列重叠和连锁关系,从打断后的 DNA的序列 拼接出完整的目的核酸。

8. 权利要求 1 - 7中任一项所述的方法用于 HLA分型的用途, 其特征在于包括: 使用权利要求 1 - 7中任一项的方法对来自患者 的样品 (特别是血样)进行测序, 以及将测序结果与 HLA数据库

(如 IMGT HLA专业数据库) 中 HLA-DRB1 2号外显子的序列数 据比对, 序列比对结果 100 %匹配的即为对应样本的 HLA-DRB1 基因型别。

9. 一组引物标签, 其包括表 1所示 95对引物标签中的至少 10 对, 或至少 20对, 或至少 30对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 95对 (或者所 述一组引物标签由表 1所示 95对引物标签中的 10 - 95对 (例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95 对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组成) , 并且 所述一组引物标签优选地至少包括表 1所示 95对引物标签中 的 PI-1至 PI-10, 或 PI-11至 PI-20 , 或 PI-21至 PI-30 , 或 PI-31至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70,或 PI-71 至 PI-80, 或 PI-81至 PI-90, 或 PI-91至 PI-95, 或者它们任何两个 或者多个的组合。

10. 权利要求 9所述的一组引物标签用于 PCR测序方法的用途, 其中特别是, 每一对引物标签与用于扩增待测目的序列的 PCR引 物对组合成一对标签引物, 正反 PCR引物的 5,端分别具有 (或者 任选通过连接序列连接)正向引物标签和反向引物标签。

11. 权利要求 10所述的用途, 其中 PCR引物是用于扩增 HLA的 特定基因的 PCR引物, 优选是用于扩增 HLA-A/B的 2, 3 , 4号外 显子以及 HLA-DRB1 2号外显子的 PCR引物, 优选的所述 PCR引 物如表 2所示。

12. 权利要求 9的一组引物标签与用于扩增待测目的序列的 PCR引物对组合成的一组标签引物, 其中每一对引物标签与 PCR 引物对组合成一对标签引物, 正反 PCR引物的 5,端各具有 (或者 任选通过连接序列连接) 一个引物标签。

13. 权利要求 12所述的标签引物, 其中所述 PCR引物是用于扩 增 HLA的特定基因的 PCR引物,优选是用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物, 优选的所述 PCR引物如表 2所示。

14. 权利要求 12所述的标签引物用于 PCR测序方法的用途。

Description:
一种基于 DNA分子标签技术和 DNA不完全打断策略的

PCR测序方法 技术领域

本发明涉及核酸测序技术领域, 特别是 PCR测序技术领域。 另一方面, 本发明还涉及 PCR-index/barcode技术领域。 本发明 的方法特别适用于第二代测序技术, 尤其是第二代测序技术中的 Pair-end测序技术, 还可以用于 HLA基因分型。 背景技术

PCR测序 (PCR sequencing ) 方法是通过 PCR的方法得到 目的基因 DNA片段, 再通过对所得到的目的基因 DNA片段进行 DNA序列检测, 从而得到目的基因 DNA序列信息的一种技术, 其具有直观、 准确的特点, 长久以来广泛应用于基因突变检测以 及基因分型等领域。

PCR-index/barcode技术,通过在 PCR引物的 5, 末端添加引 物标签( primer index )序列, 可在 PCR过程中对每个样本引入 独特的引物标签,使样本在利用第二代 DNA测序技术(以 Illumina GA, Roche 454, ABI Solid等测序仪为代表的可大规模, 高通量, 单分子测序的测序仪)检测过程中, 除 PCR ^节必须逐个样本处 理外, 其它实验环节可把多个样本混在一起同时处理 , 最终每个 样本的检测结果可以通过其独特的引物标签序 列我回; 该方法具 有成本低, 通量大和可同时检测大量样本的多个不同基因 位点的 特点。

第二代 DNA测序技术与第一代( Sanger法) DNA测序技术相 比, 其可连续测序的长度较短。 以 Illumina G A ( Illumina公司的 Genome Analyzer测序仪,简称 Illumina GA )为例, 当前 Illumina GA的最大测序长度为 200bp, 当 PCR产物的长度大于 200bp, 利 用 Illumina GA测序,直接釆取 PCR测序的方法,不能把整个 PCR 产物测通,得不到被检测 PCR产物的全部 DNA序列信息的。短的 测序读长限制了第二代测序技术的应用, 除了通过逐步改进测序技 术来获得更长的实际测序读长外, 开发可克服第二代 DNA测序仪 现有测序读长在 PCR测序应用领域不足的新技术也成为当务之急 。 发明内容

当前利用第二代测序技术, 对大量样本中的特定基因相关序 列同时进行测序分析时,一般会采用 PCR测序的策略,直接利用 引物标签 + 二代测序技术的组合。 当所用测序仪的测长可以覆 盖整个 PCR产物的长度时,上述技术就足够满足要求了 。但当所 用测序仪的测长不够覆盖整个 PCR产物的长度时,要么更换具有 更长测长的第二代测序仪(如用 Roche 454 GS-FLX)替代 Illumina GA, 如果测长还不满足要求的话, 只能牺牲成本和通量, 改用第 一代测序仪。

现实情况是, Illumina GA具有超高测序通量, 但其测长才 200bp; Roche 454 GS-FLX的测长虽然可以达到 500bp, 但其测 序成本较高, 通量较小; 第一代测序仪的测长虽然可以达到 lOOObp以上, 但其通量和成本没法和第二代测序仪相比。

有没有能够兼顾成本和通量, 能提高测序仪可以测通的 PCR 产物长度的技术呢? 本专利中的引物标签 + DNA不完全打断策略 + 二代测序技术的组合能在充分利用第二代测序 仪高通量、 低成 本特点的同时,使测序仪能够测通的 PCR产物长度达到测序仪本 身测长以上, 大大扩大了其适用范围。 其中, 本发明的所采用的 二代测序技术包括第二代测序技术中的 Pair-end测序技术, 以及 针对 PCR模板有 DNA参考序列 (DNA Reference Sequence ) 的 PCR测序技术。

本发明提供了用于 PCR测序的方法,通过所述方法减少了自 身测序读长较短造成的限制,扩大了第二代 DNA测序技术在 PCR 测序应用领域的应用。

引物标签的设计根据所应用的实验平台不同而 不同, 考虑 Illumina GA测序平台本身的特点, 本发明在设计引物标签时主 要考虑了以下几点: 1: 引物标签序列中避免 3 个以上 (包括 3 个)单碱基重复序列, 2: 所有引物标签的同一位点中碱基 A和 碱基 C的总含量占所有碱基含量的 30%-70%之间, 3: 引物标签 序列本身的 GC含量在 40-60%之间, 4: 引物标签之间序列差异 度大于 4个碱基, 5: 引物标签序列中避免出现与 Illumina GA测 序引物相似度高的序列, 6: 减少引物标签序列添加到 PCR引物 上后, 对 PCR引物造成的严重发卡( hairpin ), 二聚体( dimer ) 情况的出现。

本发明通过 PCR反应在 PCR产物两端各引入一个引物标签 (引物标签序列可以相同也可以不同),使 PCR产物任何一端的 引物标签都可以特异的标记 PCR产物的样本信息。 所得 PCR产 物经过经不完全打 。所谓不完全打断,指打断终产物中包含完整 的未被打断的 PCR产物和局部打断的 PCR产物。所述打断方法包 括但不限于化学打断方法 (例如酶切) 和物理打断方法, 所述物 理打断方法包括超声波打断方法或机械打断方 法等。打断的 DNA 经 2%琼脂糖电泳, 割胶纯化回收从测序仪最大读取长度到测序仪 可适用的最长 DNA长度范围之间的所有 DNA条带 ( Illumina GA 测序仪可适用的最长 DNA为 700bp, 此长度为原始 DNA长度, 没 有包括文库接头序列长度) 。 纯化回收方法包括但不限于电泳割 胶回收, 也可以是磁珠回收等。 回收的 DNA片段再按照第二代测 序仪测序文库构建的流程构建测序文库, 然后进行测序, 优选为 采用 PCR-FREE测序文库构建的流程构建测序文库,测 方法优 选釆用 Pair-End方法测序。 PCR-Free测序文库构建的流程按照 本领域技术人员已知方法构建。 在得到测序总数据中, 通过引物 标签序列可以找到所有所测样本的序列信息, 利用 BWA把各个 测序序列定位到 PCR 产物的相应 DNA 参考序列 (Reference Sequence )上,再通过测序序列之间的重叠和连锁关系 接出 PCR 产物的完整序列(图 1)。此处连锁是指由 Pair-End测序特点决定的 pair-end连锁关系。

"接头 ( adapter ) " 或 "文库接头 ( library adapter ) " 标 签技术是指通过对多个测序文库添加不同文库 接头 (不同文库接 头的组成序列不同, 序列不同的部分称为接头标签 (adapter index ) ) , 构建标签测序文库, 从而可实现多个不同标签测序文 库混合测序, 且最终各个标签测序文库的测序结果可相互区 分的 一种文库标签技术。

基于 DNA分子标签技术和 DNA不完全打断策略的 PCR测 序方法的使用可在不增加引物标签数目的情况 下, 大大提高可唯 一标记的样本数目。

结合文库接头标签技术的 PCR-FREE的文库构建方法,是指 将文库接头直接连接至测序文库中的 DNA片段两端,文库接头的 导入过程因为没有 PCR的参与, 因此称作 PCR-Free文库构建。 其中接入方法可以采用 DNA连接酶进行连接。 其整个文库构建 过程中无 PCR的参与, 避免了在高序列相似度的 PCR产物混合 ( pooling ) 文库的构建过程中, 由 PCR 引入错误而导致最后结 果的不准确性。

在本发明中,通过对正反 PCR引物添加引物标记,结合 DNA 不完全打断策略,使第二代测序技术应用于 PCR测序领域时, 实 际可测得的 PCR产物长度超过测序仪的最大测序长度。

在本发明的一个方面中, 提供了一组引物标签 ( primer index ) , 其包括表 1所示 95对引物标签中的至少 10对, 或至少 20对, 或至少 30对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 95对 (或者所述 一组引物标签由表 1所示 95对引物标签中的 10 - 95对(例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组成) , 并 且

所述一组引物标签优选地至少包括表 1所示 95对引物标签中 的 PI-1至 PI-10, 或 PI-11至 ΡΙ-20, 或 PI-21至 ΡΙ-30, 或 PI-31 至 ΡΙ-40,或 PI-41至 ΡΙ-50,或 PI-51至 ΡΙ-60,或 PI-61至 ΡΙ-70, 或 PI-71至 ΡΙ-80, 或 PI-81至 ΡΙ-90, 或 PI-91至 ΡΙ-95, 或者它 们任何两个或者多个的组合。

根据本发明另一方面, 还提供了所述的引物标签用于 PCR测 序方法的用途, 其中特别是, 每一对引物标签与用于扩增待测目的 序列的 PCR引物对组合成一对标签引物,正反 PCR引物的 5,端分 别具有(或者任选通过连接序列连接)正向引 物标签和反向引物标 签。

在本发明的一个具体实施方式中,所述 PCR引物是用于扩增 HLA的特定基因的 PCR引物, 优选是用于扩增 HLA-A/B 2, 3, 4号外显子和 HLA-DRB1 2号外显子的 PCR引物, 优选的所述 PCR引物如表 2所示。 本发明另一方面中, 提供了上文所述一组引物标签与用于扩 增待测目的序列的 PCR引物对组合成的一组标签引物,其中每一 对引物标签与 PCR引物对组合成一对标签引物, 正反 PCR引物 的 5,端分别具有 (或者任选通过连接序列连接)正向引物标签 和 反向引物标签。

在本发明的一个具体实施方式中, 上文所述标签引物中的 PCR引物是用于扩增 HLA的特定基因的 PCR引物,优选是用于 扩增 HLA-A/B 2, 3, 4号外显子和 HLA-DRB1 2号外显子的 PCR 引物,优选的所述 PCR引物如表 2所示。在本发明的另一个具体 实施方式中, 所述的标签引物用于 PCR测序方法。

本发明另一方面中, 提供了一种测定样品中目的核酸的核苷 酸序列的方法, 其包括:

1 )提供 n个样品, n 为大于等于 1的整数, 所述样品优选地来 自哺乳动物, 更优选是人, 特别是人的血样; 可选地, 将待分析 的 n个样品分成 m个小组, m为整数且 n > m > l ;

2 )扩增: 对于每一个样品, 使用一对标签引物, 在存在来自 该样品的模板时, 在适于扩增目的核酸的条件下进行 PCR扩增, 其中, 每一对标签引物由包含引物标签的正向标签引 物和反向标 签引物 (均可以是简并引物)构成, 其中正向标签 il物和反向标 签引物所包含的引物标签可以相同或者不同; 不同样品所用标签 引物对中的引物标签彼此不同;

3 )打断: 将所得的 PCR产物文库进行不完全打断;

4 ) 测序: 将回收的 DNA混合物利用二代测序技术, 优选的 是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行 测序, 获得打断后的 DNA的序列;

5 )拼接: 基于每个样品独特的引物标签将获得的测序结 果与 样品 对应, 利用比对程序 (例如 Blast, BWA程序)把各个 测序序列定位到 PCR产物的相应 DNA参考序列上, 通过序列重 叠和连锁关系, 从打断后的 DNA的序列拼接出完整的目的核酸。

本发明另一方面, 提供了一种测定样品中目的核酸的核苷酸 序列的方法, 其包括:

1 )提供 n个样品, n为大于等于 1的整数, 所述样品优选地来 自人, 特别是人的血样; 可选地, 将待分析的 n个样品分成 m个小 组, m为整数且 n > m > 1 ;

2 )扩增: 对于每一个样品, 使用一对标签引物, 在存在来自 该样品的模板时, 在适于扩增目的核酸的条件下进行 PCR 增, 其中, 每一对标签引物由包含引物标签的正向标签引 物和反向标 签引物 (均可以是简并引物)构成, 其中正向标签引物和反向标 签引物所包含的引物标签可以相同或者不同; 不同样品所用标签 引物对中的引物标签彼此不同;

3 ) 混合: 将各样品的 PCR扩增产物混合在一起, 获得 PCR 产物文库;

4 )打断: 将所得的 PCR产物文库进行不完全打断;

5 )建库: 将打断后的 PCR产物文库构建 PCR-Free测序文库, 回收位于所用测序仪最大读长长度到所用测序 仪适用的最长 DNA长度范围之间的所有 DNA条带, 可以对文库添加不同的文库 接头 (adapter ) 以区分不同的 PCR-Free测序文库;

6 ) 测序: 将回收的 DNA混合物利用二代测序技术, 优选的 是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行 测序, 获得打断后的 DNA的序列;

7 )拼接: 基于各个文库不同的文库接头序列和每个样品 独特 的引物标签将获得的测序结果与样品一一对应 ,利用比对程序(例 如 Blast,BWA程序 fe各个测序序列定位到 PCR产物的相应 DNA 参考序列上,通过序列重叠和连锁关系,从打 断后的 DNA的序列 拼接出完整的目的核酸。

在本发明的一个具体实施方式中,在上文所述 的测序方法中, 每一对引物标签与 PCR引物对组合成一对标签引物, 正反 PCR 引物的 5,端分别具有 (或者任选通过连接序列连接)正向引物标 签和反向引物标签。

在本发明的一个具体实施方式中,在上文所述 的测序方法中, 所述 PCR引物是用于扩增 HLA的特定基因的 PCR引物, 优选 是用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号 外显子的 PCR引物, 优选的所述 PCR引物如表 2所示。

在本发明的一个具体实施方式中,在上文所述 的测序方法中, 所述引物标签针对 PCR引物进行设计, 优选针对用于扩增 ¾A 的特定基因的 PCR引物进行设计,更优选针对用于扩增 HLA-A/B 的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物, 特别是如表 2所示的 PCR引物进行设计,所述引物标签特别是包 括表 1所示 95对引物标签中的至少 10对, 或至少 20对, 或至少 30对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 95对(或者所述一組引物标签由 表 1所示 95对引物标签中的 10 - 95对(例如 10 - 95对, 20 - 95 对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组成) , 并且

所述一组引物标签优选地至少包括表 1所示 95对引物标签中 的 PI-1至 PI-10, 或 PI-11至 PI-20, 或 PI-21至 PI-30, 或 PI-31 至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70, 或 PI-71至 PI-80, 或 PI-81至 PI-90, 或 PI-91至 PI-95, 或者它 们任何两个或者多个的组合。

在本发明的一个具体实施方式中,在上文所述 的测序方法中, 所述 DNA打断包括化学打断方法和物理打断方法, 其中所述化 学方法包括酶切方法, 所述物理打断方法包括超声波打断方法或 机械打断方法。 所述 DNA打断后, 分离 450-750bp长度的片段。

本发明另一方面中, 提供了一种 HLA分型方法, 包括: 使 用上文所述的测序方法对来自患者的样品 (特别是血样)进行测 序,以及将测序结果与 HLA数据库(如 IMGT HLA专业数据库) 中的标准序列数据比对, 序列比对结果 100 %匹配的即为对应样 本的 HLA基因型别。 附图说明

图 1: 为引物标签标记, DNA打断和 DNA测序后, 序列拼 接图示。 第 N号样本的 PCR产物两端引入了正反引物标签序列 Index-N-F/R (1), PCR产物经物理方法打断后的产物中包括: 一 端带有引物标签序列的产物, 两端都不带引物标签序列的产物, 完全未被打断的产物, 割胶纯化回收位于测序仪最大读长长度到 测序仪适用的最长 DNA长度范围之间的所有 DNA条带用于测序 ( 2 ) , 利用 Index-N-F/R在测序结果中找回属于第 N号样本的 PCR产物的测序结果, 利用 PCR产物已知的参考序列信息定位 各个测序序列相对参考的位置, 并根据测序序列之间的重叠和连 锁关系组装成完整的 PCR产物的测序结果 (3, 4 ) 。

图 2: 为 1号样本 HLA-A/B/DRB1相应外显子 PCR产物电泳 结果, 从电泳图上看, PCR产物为一系列片段大小 300bp-500bp 的单一条带,其中泳道 M是分子量标记物( DL 2000,Takara公司), 泳道 1-7为 1号样本的 HLA-A/B/DRB1各外显子 ( A2、 A3、 A4、 B2、 B3、 B4、 DRBl-2 ) PCR扩增产物, 阴性对照 (N )无扩增条 带。 其它样品的结果与此类似。

图 3: 为 HLA-Mix打断后 DNA电泳情况 (割胶前后), 割胶 区域为 450-750bp区域。 其中泳道 M是分子量标记物(NEB-50bp DNA Ladder ) , 泳道 1是割胶前 HLA-Mix的电泳情况, 泳道 2 是割胶后 HLA-Mix的胶图。

图 4: 1号样本的一致性(consensus )序列构建程序截图, 示 例说明了根据引物标签和 DN A片段之间的重叠关系拼接出 PCR产 物的完整序列。 具体实施方式

下面将结合实施例对本发明的实施方案进行详 细描述, 但是 本领域技术人员将会理解, 下列实施例仅用于说明本发明, 而不 应视为限定本发明的范围。

在本发明的实施例中, 通过采取引物标签 + DNA不完全打断 策略 + Illumia GA测序仪 Pair-End 100测序技术的组合对 95个 样本的 HLA-A/B 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 基因分型 (PCR产物长度大小处于 290bp-500bp之间) , 证明该 策略可以在充分发挥第二代测序仪高通量、低 成本^点的同时, 可 以实现对超过测序仪本身测长以上的基因片段 的分型。

原理: 将待分析的样本, 通过 PCR反应在 HLA-A/B 2, 3, 4 号外显子以及 HLA-DRB1 2号外显子的 PCR产物两端引入引物标 签, 使其特异的标记 PCR 产物的样本信息。 将各组内样品的 HLA-A/B/DRB1三个位点的 PCR扩增产物混合在一起,获得 PCR 产物文库; 所得 PCR 产物文库经过超声不完全打断后, 构建 PCR-Free测序文库, 测序文库经 2%低熔点琼脂糖电泳, 割胶纯 化回收位于 450bp-750bp 长度范围之间的所有 DNA 条带 (PCR-Free测序文库的构建过程中在 DNA 片段的两端都添加上 了文库接头, 使 DNA 片段在电泳图上体现的长度比实际长度大 了 250bp左右, 因此,此处回收 450bp-700bp的片段, 实际上相当 于回收原长度为 200bp-500bp 的 DNA 片段)。 回收的 DNA 经 Illumina GA PE-100测序。 通过引物标签序列可以找到所有所测 样本的序列信息, 再通过已知 DNA片段的参考序列信息和 DNA 片段序列之间的重叠和连锁关系组装出整个 P C R产物的序列,再 通过与 HLA-A/B/DRB1 相应外显子的标准数据库的比对结果可 组装出原 PCR产物的全序列,实现 HLA-A/B/DRB1的基因分型。 实施例 1

样本提取

使用 KingFisher 自动提取仪(美国 Thermo公司)从 95份 已知 HLA-SBT分型结果的血样 (中国造血干细胞捐献者资料库 (以下称 "中华骨髓库" )) 中提取 DNA。 主要步骤如下: 取出 6 个 Kingfisher自动提取仪配套的深孔板及 1个浅孔板, 根据说明 书分别加入一定量配套的试剂并做好标记, 将所有已加好试剂的 孔板按要求置于相应的位置, 选定程序 " Bioeasy一 200ul Blood DNA一 KF.msz" 程序, 按下 "star" 执行该程序进行核酸提取。 程序结束后收集 plate Elution中的 lOOul左右的洗脱产物即为提 取的 DNA。 实施例 2

PCR扩增

通过合成在 5, 末端具有不同引物标签的 PCR引物制作不同 的 PCR标签引物, 这样不同的 PCR标签引物可以用于不同的样 本, 所述 PCR 引物是针对 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物。其后通过 PCR反应在 PCR 产物两端引入引物标签,从而特异地标记了来 自不同样本的 PCR 产物。

以 95套 PCR标签引物来分别扩增 95份 DNA样本,每套 PCR 标签引物由一对双向引物标签(表 1 )和用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物 (表 2 ) 组成, 其中每个正向 PCR引物的 5, 末端上连接一对引物标签的 正向引物标签, 而反向 PCR引物的 5' 末端上连接一对引物标签 的反向引物标签。引物标签在引物合成时直接 添加在 PCR引物的 5,末端。

把实施例 1的样本提取步骤中所得的 95份 DNA, 依次编号 1-95, PCR反应在 96孔板中进行,共 7板,编号分别为 HLA-P-A2、 HLA-P-A3, HLA-P-A4, HLA-P-B2、 HLA-P-B3, HLA-P-B4以 及 HLA-P-DRB1-2 ( A2/3/4, B2/B3/B4, DRB1-2 表示扩增的位 点) , 板内设置一个不添加模板的阴性对照, 阴性对照所用引物 与模板 1的对应引物相同。 实验的同时, 记录下每对引物标签对 应的样本编号信息。

表 1, 引物标签的相关信息

sz PD 0DV0 DV10V13 8r-u

LZ £3 3V3VOVIVOXDI LZ-Ιά

91 ZD XV1019VI30I3 9Ζ-\ά sz ID IV0VXV3V30V3 XVI3XOX3VDV1 sr-u

PZ z 3V0丄 i)丄 03Vf)V丄 PZ-ld

£Z na :) VOlVJ Di:)丄 V £Z-ld

ZZ oia 1V0X3V30IV13 VOV13I3V30DV ΖΖ-Ιά

IZ 68 V IV IODVIO丄 f)V丄 vio i iv)

oz 80 νονοί):)ί)ν丄 f) V 30V03I3I01DV oz-u

61 Z.S 丄 VO VOVIVIDI 6I-IJ

81 99 9V3031VX0V1D 3VXVI31V303V 8T-U

LI DYDDIDYIDDDD DDD1DD1DDYDD "-Id

91 lyOLDDlYDDDV DXV3V1D3IDV3 9T-IJ

SI £9 YDDYDDLYDIDI : LOVD i );)丄 fXL Si-Id

za :)丄 OJ^VD!DVJLV:) DVS i:)丄 01331 n-iA

£T ia :) V 30i)Vi 丄 3IV3VOXVODV3 ει-υ

Zl nv 0109工 OVIOV工 V Ζ\-Ιά

II XIV ODV!DI OVJ^V丄 XV10303I3V0V II-Id

01 OIV X0303VD10V1V 3I3103V3VI3V 01 -u

6 6V 303V3VI0VI3V 6-Id

8 8V 8-Id

L LY 30VIV103IV9V L-ld

9 9V VO丄 V丄:)丄 30V0I30XV3V1 9-Id

S SV 10iDVf :)JLV丄 VIVO丄:) 3工:) s-w

P V :) Vi)工 OVlOI i)丄 P-Id

l7C8lOOOlOiN3/X3d S3 0V01V103V3VX £S-Id

ZS I VX03V0X30VXD DOVXVIOVOIVD zs-u

IS £3 03XV9V303V3V V i)丄 丄 is-w

OS za 131V1V0V30IV IDI0V1V130VD OS-Id

6P la VOV3V1VOIOD1 3IV1DV1VDOV3 6f"Id

SP rxa VOVIO丄 OVJ^Ol 303I3V3VDV0D 8f-IJ

LP na LP-ld

9P oia DlVOVD i:)丄 3丄 V3V13V31303I 9P-ld

SP 6a 3V0X0V03031V 3V13VOV1V313 Sf-ld

PP 8a V3IV10VXV0I3 DX0V013X3V0V Pf-ld

£P Ld 1:)丄 31Vi)li)\ £P-Id

ZP 9a DLVDVDyDl Dl DLDD1D 1Y1DL ΖΡ-ld

IP sa DDDDYDYIVDDI 1VOVX3X3VIVI IP-Id

OP t VODYDYDDLDYD 3V1V3XVX30V3 ΟΡ-ld

6£ εα DlDDl YDyDOy 6£-ld

S£ za XV13IV0VI03V V3I9V1DI3V3V 8£"Id

LI τα 9V01V0303V3X L£-ld

9£ zio V3VIDOIV1V9X 3030VX010V3V 9£-Id se UD V03X0VXVI3VX

013 31Vi:)i)JLi):)丄 31 f£-IJ εε 60 VXD3V313V1V3 丄 DOOV ££-ld zt 83 3V3VOXV3IVI3 XVOVXV3X3V3V re-id l£ LD VDVt)丄 ViDOiDVl ιε-id

0£ 93 XVID3X3XV3VI DYDIDDDDYDYD οε-Η

6Z S3 3VOVOI3V1V3V VX30V0I3V0V1

l7C8lOO/OlOZN3/X3d ZSTOOO/ZIOZ OAV 8 9D 丄:) DVOViDVliDVJL SL-ld

LL SO V3I303V013VD LL-Ιά

9L PD V3IVDOV13VIV 9L-\d

SL εο DVE VIV )丄 VOO 丄 OOJLVIOVO IV Si-Id L ZD 丄 Vi)丄 V丄 VOl Vf)丄 iDVOV 丄 3JL PL-Id

£L ID 丄 :>3:>vi)v 1V3V1VI3IOVX tL ld

ZL ΖΙΛ VlOVOlVi)丄 30丄 IVOOVlf):)丄 V1V ZL-Id

IL UA VXDV103V3V0D XVOVDVXVI3V3 -id

OL Old ) V丄 OVOliDliD l 丄 OZ.-U

69 6Λ 031V0IV30X3V VX3X3V3VXDV3 69-Id

89 8i IV3XDOXD1DV3 89-Id

L9 Ld DIDDIVDYIDDI V03V010XV3V1 L9-ld

99 9Λ l lV lOOOVi)丄 130X03I3VDVX 99-Id

S9 丄 ) 130丄 I3IDVIVOV3VX S9"Id 9 Λ P9-ld

£9 £Λ £9-ld

19 ΖΛ 3VOXODI3V13X Z9-U

19 ΙΛ I3IVIOX3V1V3 19-Id

09 ΠΉ V013VD1V130X O VDIDIO:)丄 ) V 09-Id

6S na 0V0I03V0313V 6S"Id

8S oia VDOVO丄 3 丄 V0V3V03I0X93 8S"Id

LS DDDyiDDDYDDl LS ld

9S 83 3V9IV030VXVX fJV JD工 V工 VO丄 3 9S-Id

,a D03V3VXVD0VX SS-Id

PS 93 丄:) 3VI303I3V03V

l7C8lOOOlOiN3/X3d PI-79 TGTATCACGAGC ATGATCGTATAC G7 79

PI-80 TACTGCTATCTC CGCTGCATAGCG G8 80

PI-81 CGCGAGCTCGTC ACTCGATGAGCT G9 81

PI-82 TAGAGTCTGTAT TGTCTATCACAT G10 82

PI-83 TACTATCGCTCT TATGTGACATAC Gil 83

PI-84 TAGATGACGCTC TACTCGTAGCGC G12 84

PI-85 TCGCGTGACATC ATCTACTGACGT HI 85

PI-86 ACACGCTCTACT ACAGTAGCGCAC H2 86

PI-87 TACATAGTCTCG CTAGTATCATGA H3 87

PI-88 TGAGTAGCACGC TCGATCATGCAG H4 88

PI-89 TAGATGCTATAC TACATGCACTCA H5 89

PI-90 ATCGATGTCACG CAGCTCGACTAC H6 90

PI-91 ATCATATGTAGC CTCTACAGTCAC H7 91

PI-92 TAGCATCGATAT AGATAGCACATC H8 92

PI-93 TGATCGACGCTC CTAGATATCGTC H9 93

PI-94 TGCAGCTCATAG TACAGACTGCAC H10 94

PI-95 CGACGTAGAGTC CAGTAGCACTAC Hll 95 表 2, 未添加引物标签前用于扩增 HLA-A/B/DRB1相应外显 子的 PCR引物

A-F4 GTGTCCCATGACAGATGCAAAA 扩 HLA-A基因 4

430bp

A-R4 GGCCCTGACCCTGCTAAAGG 号外显子

B-F2 AGGAGCGAGGGGACCGCA 扩 HLA-B基因 2

400bp

B-R2 CGGGCCGGGGTCACTCAC 号外显子

B-F3 CGGGGCCAGGGTCTCACA 扩 HLA-B基因 3

370bp

B-R3 GAGGCCATCCCCGGCGAC 号外显子

B-F4 GCTGGTCACATGGGTGGTCCTA 扩 HLA-A基因 4

380bp

B-R4 CTCCTTACCCCATCTCAGGGTG 号外显子

D2-F1 CACGTTTCTTGGAGTACTCTA

D2-F2 GTTTCTTGTGGCAgCTTAAgTT

D2-F3 CCTGTGGCAGGGTAAGTATA

D2-F4 GTTTCTTGAAGCAGGATAAGTT 扩 HLA-DRB1基

300bp

D2-F5 GCACGTTTCTTGGAGGAGG 因 2号外显子

D2-F6 TTTCCTGTGGCAGCCTAAGA

D2-F7 GTTTCTTGGAGCAGGTTAAAC

D2-R CCTCACCTCGCCGCTGCAC

D2-F1, D2-F2, D2-F3, D2-F4, D2-F5, D2-F6, D2-F7为扩增 HLA-DRBl 2号外显子的正向引物, D2-R为扩增 HLA-DRB1 2号 外显子的反向引物。

HLA-A/B/DRB1 的 PCR程序如下:

96 2min

95 °C 30s 60 30s 72 "C 20s (32cycles)

∞ HLA-A/B的 PCR反应体系如下所有试剂均购自普洛麦格(北 生物技术有限公司 (Promega )

HLA-DRBl的 PCR反应体系如下:

其中 PI Ar A/B/D2-F 1/2/3/4/5/6/7 表示引物 5,末端带有第 n号正向引 物标签序列(表 1 )的 HLA-A/B/DRB1的 F引物, PI nr A/B/D2-R 2/3/4 表示引物 5,末端带有第 n号反向引物标签序列的 HLA-A/B/DRB1 的 R引物(此处 n < 95 ) , 其它依次类推。 且每个样本对应特定的 一套 PCR引物 ( nr 删 -Έ聽 l4/sl6n , PI nr A/B/D2-R 2/3/4 ) 。

PCR反应在 Bio-Rad公司的 PTC-200 PCR仪上运行。 PCR完 成后, 取 2ul PCR产物经 1%的琼脂糖凝胶电泳检测。 图 2显示 了 1号样本 HLA-A/B/DRB1相应外显子 PCR产物电泳结果, DNA 分子标记为 DL 2000 ( Takara公司), 胶图上有一系列片段大小为 300bp-500bp单一条带, 表明 1号样本的 HLA-A/B/DRB1各外显 子 (A2、 A3、 A4、 B2、 B3、 B4、 DRB1-2 ) PCR扩增成功, 阴性 对照 (N )无扩增条带。 其它样品的结果与此类似 实施例 3

PCR产物混合和纯化

从 96孔板 HLA-P-A2剩余的 PCR产物中 (阴性对照除外) 各取 20ul混合在一个 3ml的 EP管中, 标记为 HLA-A2-Mix, 对 其它 6个 96孔板进行同样的操作, 分别标记为 HLA-A3-Mix、 HLA-A4-Mix、 HLA-B2-Mix、 HLA-B3-Mix v HLA-B4-Mix 和 HLA-D2-Mix, 震荡混匀, 从 HLA-A2-Mix、 HLA-A3-Mix、 HLA-A4-Mix、 HLA-B2-Mix、 HLA-B3-Mix、 HLA-B4-Mix 和 HLA-D2-Mix中各取 200ul混合在一个 3ml的 EP管中, 标记为 HLA-Mix, 从 HLA-Mix中取 500ul DNA混合物经 Qiagen DNA Purification kit试剂盒(QIAGEN公司) 过柱纯化 (具体纯化步 骤详见说明书 ) , 纯化所得的 200ul DNA , 经 Nanodrop 8000(Thermo Fisher Scientific公司)测定 HLA-Mix DNA浓度为 48ng/ul. 实施例 4

PCR产物的打断, 以及 Illumina GA PCR-Free测序文库的 构建

1. DNA打断

从纯化后的 HLA-Mix中取总量 5ug的 DNA 用带 AFA纤维 扣盖的 Covaris 微管在 Covaris S2DNA打断仪 (Covaris公司)上 打断。 打断条件如下:

频率扫描 ( fre uency sweeping )

2. 打断后纯化

将 HLA-Mix的所有打断产物用 QIAquick PCR Purification Kit 回收纯化, 分别溶于 37.5ul 的 EB ( QIAGEN Elution Buffer ) 中;

3. 末端修复反应

对打断后纯化的 HLA-Mix进行 DNA末端修复反应, 体系如

多核苷酸激酶緩冲液( 10x Polynucleotide Kinase Buffer( B904 ) ) 10

dNTP混合物 (每种 lOmM ) ( Solution Set ( lOmM each ) ) 4 μL

T4 DNA聚合酶( T4 DNA Polymerase ) 5μ

Kleno 片段 ( Klenow Fragment )

T4多聚核苷酸激酶( T4 Polynucleotide Kinase )

总体积 ( Total volume ) 100

反应条件为: 恒温混匀器 (Thermomixer, Eppendorf 公司)

20 温浴 30 min。

反应产物经 QIAquick PCR Purification Kit回收纯化, 溶于 34 μΐ的 EB ( QIAGEN Elution Buffer ) 中。

4. 3, 末端加 A反应

上一步回收 DNA的 3, 末端加 A反应, 体系如下 (试剂均 购自 Enzymatics公司 ) :

上一步所得 DNA 32

10x 蓝色緩沖液( 10x blue buffer ) 5 μL·

dATP(lmM, GE公司) 10

Klenow (3'-5' exo-) 3

总体积 ( Total volume ) 50

反应条件为: 恒温混匀器(Thermomixer, Eppendorf 公 司) 37 温浴 30 min。

反应产物经 MiniElute PCR Purification Kit( QIAGEN公司) 回收纯化, 溶于 13 μΐ的 EB溶液( QIAGEN Elution Buffer ) 中。

5. 连接 Illumina GA PCR-Free文库接头 (adapter ) 术语 "PCR-Free文库接头 (adapter ) " 是指经设计的一段 碱基, 其主要作用是辅助固定 DNA分子在测序芯片上以及提供 通用测序引物的结合位点, PCR-Free文库接头可以通过 DNA连 接酶将其直接连接至测序文库中的 DNA 片段两端, 文库接头的 导入过程因为没有 PCR的参与, 因此称作 PCR-Free文库接头。

加 A后的产物连接 Illumina GA PCR-Free文库接头, 体系 如下 (试剂均购自 Illumina公司) :

上一步所得 DNA Ιΐμί

2x 快速连接緩沖液 ( 2x Rapid ligation buffer )

PCR-free寡核苷酸接头混合物 (30mM) ( PCR-free Adapter Ιμί

oligo mix )

T4 DNA连接酶 ( T4 DNA Ligase ) (Rapid, L603-HC-L) 3μΙ 总体积 ( Total volume ) 30

反应条件为: 恒温混匀器(Thermomixer, Eppendorf 公 司) 20X温浴 15 min。

反应产物经 Ampure Beads(Beckman Coulter Genomics)纯化 后溶于 50ul去离子水, 经荧光定量 PCR ( QPCR )检测到 DNA 浓度结果如下:

6. 割胶回收

取 3(^L HLA-Mix用 2%低熔点琼脂糖胶进行回收。电泳条件 为 100V, 100min。DNA marker为 NEB公司的 50bp DNA marker。 割胶回收 450-750bp长度范围的 DNA片段(附图 3 ) 。 胶回收产 物经 QIAquick PCR Purification Kit ( QIAGE 公司)回收纯化, 纯化后体积为 32ul, 经荧光定量 PCR ( QPCR )检测到 DNA浓 度结果为 10.16nM。 实施例 5

Illumina GA测序

根据 QPCR 检测结果, 取 lOpmol DNA 用 Illumina GA PE-100程序测序, 具体操作流程详见 Illumina GA操作说明书 ( Illumina GA Π x ) 。 实施例 6

结果分析

Illumina GA产出的测序结果是一系列 DNA序列,通过查找 测序结果中的正反引物标签序列和引物序列, 建立各个引物标签 对应样本 HLA-A/B/DRB1 各外显子 PCR产物测序结果的数据 库。 通过 BWA(Burrows-Wheeler Aligner)把各外显子的测序结果 定位在相应外显子的参考序列上 ( 参考序列来源: http://www.ebi.ac.uk/imgt/hla/ ) 同时, 构建各个数据库的一致性

( consensus )序列, 再对数据库中 DNA序列进行筛选和测序错 误校正。 校正后的 DNA 序列通过序列重叠 (overlap ) 和连锁

( Pair-End连锁) 关系可组装成 HLA-A/B/DRB1 各外显子相应 的序列。 所得 DNA 序列利用与 IMGT HLA 专业数据库中 HLA-A/B/DRB1 相应各外显子的序列数据库比对,序列比对结 果 100%匹配的即为对应样本的 HLA-A/B/DRB1基因型别。 可参考 图 4示例说明的 1号样品的 HLA-A位点的 2号外显子一致性序 列构建程序的截图。 所有 95 个样本, 得到的分型结果与原已知分型结果完全相 , 其中 1-32号样本的具体结果如下:

样本编号 原 HLA-A/B/DRB1型别

Α*02:03 A*ll:01 38:02 B' *48:01 DRB1' "=14:54 DRB1*15:01

2 Α*01:01 Α*30:01 B J ¾ 08:01 B*13:02 DRB1' ¾ 03:01 DRB1*07:01

3. Α*01:01 Α*02:01 B J 45:11 B*47:01 DRB1*13:02 DRB1*15:01

4 Α*24:08 Α*26:01 k 40:01 B' k 51:01 DRB1' "04:04 DRB1*09:01

5 Α*01:01 Α*24:02 B J fe 54:01 B' "55:02 DRB1' "04:05 DRB1*09:01

6 Α*01:01 Α*03:02 fe 15:ll B' ^37:01 DRB1' "=10:01 DRB1*14:54

7 Α*11:01 Α*30:01 43:02 B' "15:18 DRB1' "=04:04 DRB1*07:01

8 Α*01:01 Α*02:01 "35:03 B' "81:01 DRB1' "11:01 DRB1*15:01

9 Α*02:06 Α*31:01 k 27:07 B' "40:02 DRB1' "03:01 DRB1*13:02

10 Α*01:01 Α*66:01 k 37:01 B' "49:01 DRB1' fe 10:01 DRB1*13:02

11 Α*01:01 Α*03:01 35:01 B ! k 52:0l DRB1' ¾ 01:01 DRB1*15:02

12 Α*11:01 Α*11:01 45:01 B*15:05 DRB1' "04:06 DRB1*15:01

13 Α*01:01 Α*11:02 Β*07:02 B*15:02 DRB1' "09:01 DRB1*15:01

14 Α*01:01 Α*02:01 k 52:01 B' "67:01 DRB1' "15:02 DRB1*16:02

15 Α*01:01 Α*02:05 Β*15:17 B' fc 50:01 DRB1' "=07:01 DRB1*15:01

16 Α*01:01 Α*11:01 Β*37:01 B' 0:02 DRB1' k 10:01 DRB1*12:02

17 Α*24:07 Α*32:01 Β*35:05 B*40:01 DRB1' "03:01 DRB1*04:05

18 Α*11:01 Α*24:02 k 13:01 B' "35:01 DRB1*16:02 DRB1*16:02

19 Α*11:01 Α*11:01 "40:02 B*55:12 DRB1' k 04:05 DRB1*15:01

20 Α*02:11 Α*24:02 k 40:01 B' 0:06 DRB1*11:01 DRB1*15:01

21 Α*01:01 Α*02:06 k 51:01 B' 7:01 DRB1*07:01 DRB1*12:01

22 Α*01:01 Α*29:01 k 07:05 B' "15:01 DRB1' k 04:05 DRB1*07:01

23 Α*01:01 Α*02:07 ^37:01 B' fe 46:01 DRB1' k 04:03 DRB1*10:01

24 Α*24:85 Α*30:01 Β ν 43:02 B' "55:02 DRB1' fe 07:01 DRB1*15:01

25 Α*11:01 Α*31:01 ^07:06 B' "51:01 DRB1' "12:02 DRB1*14:05

26 Α*01:01 Α*11:01 k 46:01 B' "57:01 DRB1' ¾ 07:01 DRB1*08:03

27 Α*01:01 Α*02:01 45:18 B*37:01 DRB1' ¾ 04:01 DRB1*15:01

28 Α*01:01 Α*24:02 Β*37:01 B' "46:01 DRB1' k 09:01 DRB1*10:01

29 Α*26:01 Α*66:01 Β ν k 40:40 B' ¾ 41:02 DRB1' ni:0l DRB1*1S:01

30 Α*02:01 Α*29:02 43:02 B' "45:01 DRB1' "03:01 DRB1*12:02

31 Α*01:01 Α*11:03 Β ν 5:01 B' "57:01 DRB1' fe 07:01 DRB1*15:01

32 Α*11:01 Α*26:01 Β*35:03 B' "38:01 DRB1' "11:03 DRB1*14:04 样本编号 测得的 HLA-A/B/DRB1型别

1 A*02:03 A*ll:01 B*38:02 B*48:01 DRB1*14:54 DRB1*15:01 2 A*01 01 A*30:01 B*08:01 B*13:02 DRB1*03:01 DRB1*07:01

3 A*01 01 A*02:01 B*15:ll B*47:01 DRB1*13:02 DRB1*15:01

4 A*24 08 A*26:01 B*40:01 B*51:01 DRB1*04:04 DRB1*09:01

5 A*01 01 A*24:02 B*54:01 B*55:02 DRB1*04:05 DRB1*09:01

6 A*01 01 A*03:02 B*15:ll B*37:01 DRB1*10:01 DRB1*14:54

7 A*ll 01 A*30:01 B*13:02 B*15:18 DRB1*04:04 DRB1*07:01

8 A*01 01 A*02:01 B*35:03 B*81:01 DRB1*11:01 DRB1*15:01

9 A*02 06 A*31:01 B*27:07 B*40:02 DRB1*03:01 DRB1*13:02

10 A*01 01 A*66:01 B*37:01 B*49:01 DRB1*10:01 DRB1*13:02

11 A*01 01 A*03:01 B*35:01 B*52:01 DRB1*01:01 DRB1*15:02

12 A*ll 01 A*ll:01 B*15:01 B*15:05 DRB1*04:06 DRB1*15:01

13 A*01 01 A*ll:02 B*07:02 B*15:02 DRB1*09:01 DRB1*15:01

14 A*01 01 A*02:01 B*52:01 B*67:01 DRB1*15:02 DRB1*16:02

15 A*01 01 A*02:05 B*15:17 B*50:01 DRB1*07:01 DRB1*15:01

16 A*01 01 A*ll:01 B*37:01 B*40:02 DRB1*10:01 DRB1*12:02

17 A*24 07 A*32:01 B*35:05 B*40:01 DRB1*03:01 DRB1*04:05

18 A*ll 01 A*24:02 B*13:01 B*35:01 DRB1*16:02 DRB1*16:02

19 A*ll 01 A* 11 :01 B*40:02 B*55:12 DRB1*04:05 DRB1*15:01

20 A*02 11 A*24:02 B*40:01 B*40:06 DRB1*11:01 DRB1*15:01

21 A*01 01 A*02:06 B*51:01 B*57:01 DRB1*07:01 DRB1*12:01

22 A*01 01 A*29:01 B*07:05 B*15:01 DRB1*04:05 DRB1*07:01

23 A*01 01 A*02:07 B*37:01 B 6.01 DRB1*04:03 DRB1*10:01

24 A*24 85 A*30:01 B* 13:02 B*55:02 DRB1*07:01 DRB1*15:01

25 A*ll 01 A*31:01 B*07:06 B*51:01 DRB1*12:02 DRB1*14:05

26 A*01 01 A*ll:01 B*46:01 B*57:01 DRB1*07:01 DRB1*08:03

27 A*01 01 A*02:01 B*15:18 B*37:01 DRB1*04:01 DRB1*15:01

28 A*01 01 A*24:02 B*37:01 B*46:01 DRB1*09:01 DRB1*10:01

29 A*26 01 A*66:01 B*40:40 B*41:02 DRB1*12:01 DRB1*15:01

30 A*02 01 A*29:02 B*13:02 B*45:01 DRB1*03:01 DRB1*12:02

31 A*01 01 A*ll:03 B*15:01 B*57:01 DRB1*07:01 DRB1*15:01

32 A*ll 01 A*26:01 B*35:03 B*38:01 DRB1*11:03 DRB1*14:04 注 : HLA-DRBl 型 别 中 的 DRB1*1201 不 排 除 DRB1*1206/1210/1217的可能性, DRB1*1454不排除 DRB1*1401 的可能性, 因为上述等位基因在 HLA-DRBl 2号外显子的序列完 全相同。 尽管本发明的具体实施方式已经得到详细的描 述, 本领域技 术人员将会理解。 根据已经公开的所有教导, 可以对那些细节进 行各种修改和替换, 这些改变均在本发明的保护范围之内。 本发 明的全部范围由所附权利要求及其任何等同物 给出。 参考文献

[1]. http://www.ebi.ac.uk/imgt/hla/stats.html

[2]. Tiercy J M. Molecular basis of HLA polymorphism: implications in clinical transplantation. [J]. Transpl Immunol, 2002, 9: 173-180.

[3]. C.Antoine, S.Muller, A.Cant, et al. Long-term survival and transplantation of haemopoietic stem cells for immunodeficiencies: report of the European experience. 1968-99.

[J]. The Lancet, 2003,9357:553-560.

[4】. H. A. Erlich, G. Opelz, J. Hansen, et al. HLA DNA Typing and Transplantation. [J].Immunity, 2001,14:347-356.

[5]. Lillo R, Balas A, Vicario JL, et al. Two new HLA class allele, DPBl*02014,by sequence-based typing. [J]. Tissue Antigens, 2002, 59: 47-48,

[6]. A. Dormoy, N. Froelich . Leisenbach, et al. Mono-allelic amplification of exons 2-4 using allele group-specific primers for sequence-based typing (SBT) of the HLA-A, -B and -C genes: Preparation and validation of ready-to-use pre-SBT mini-kits. [J]. Tissue Antigens, 2003, 62: 201-216.

[7]. Elaine R. Mardis. The impact of next-generation sequencing technology on genetics. [J]. Trends in Genetics.2008,24:133-141.

[8]. Christian Hoffmannl, Nana Minkahl, Jeremy Leipzig. DNA barcoding and pyrosequencing to identify rare HIV drug resistance mutations.【J】. Nucleic Acids Research,2007,l-8.

[9]. Shannon J.Odelberg, Robert B.Weiss , Akira Hata. Template-switching during DNA synthesis by Therm us aquaticus DNA polymerase I. [J]. Nucleic Acids Research.1995, 23:2049-2057.

[10]. Sayer D, Whidborne R, Brestovac B. HLA - DRB1 DNA sequencing based typing: an approach suitable for high throughput typing including unrelated bone marrow registry donors. [J]. Tissue Antigens. 2001, 57(l):46-54.

[11]. Iwanka Kozarewa, Zemin Ning, Michael A Quail. Amplification-free Illumina sequencing-library preparation facilitates improved mapping and assembly of (G+C)-biased genomes. [J]. Nature Methods. 2009, 6:291 - 295.