Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
HIGH RESOLUTION TYPING METHOD OF HLA GENE BASED ON ILLUMINA GA SEQUENCING TECHNOLOGY
Document Type and Number:
WIPO Patent Application WO/2012/000153
Kind Code:
A1
Abstract:
The invention provides a high resolution typing method of HLA gene based on Illumina GA sequencing technology. Also provided are primer indexes used for the method.

Inventors:
LI JIAN (CN)
TIAN GENG (CN)
JIANG HUI (CN)
Application Number:
PCT/CN2010/001835
Publication Date:
January 05, 2012
Filing Date:
November 15, 2010
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
BGI SHENZHEN CO LTD (CN)
LI JIAN (CN)
TIAN GENG (CN)
JIANG HUI (CN)
International Classes:
C12Q1/68; C07H21/00; C12N15/11
Foreign References:
CN101921840A2010-12-22
CN101921842A2010-12-22
US20100086914A12010-04-08
CN101654691A2010-02-24
Other References:
MICHAEL L. METZKER.: "Sequencing technologies --- the next generation.", NATURE REVIEWS GENETICS., vol. 11, January 2010 (2010-01-01), pages 31 - 46
Attorney, Agent or Firm:
CCPIT PATENT AND TRADEMARK LAW OFFICE (CN)
中国国际贸易促进委员会专利商标事务所 (CN)
Download PDF:
Claims:
权利要求

1. 一种 HLA分型方法, 其包括:

1 )提供 n个样品, n为大于等于 1的整数, 所述样品优选地来 自哺乳动物, 更优选是人, 特别是人的血样;

2 )将待分析的 n个样品分成 m个小组, m为整数且 n > m > l ;

3 )扩增: 对于每一个样品, 使用一对标签引物, 在存在来自 该样品的模板时, 在适于扩增目的核酸的条件下进行 PCR扩增, 其中, 每一对标签引物由包含引物标签的正向标签引物和反向标 签引物 (均可以是简并引物)构成, 其中正向标签引物和反向标 签引物所包含的引物标签可以相同或者不同; 不同样品所用标签 引物对中的引物标签彼此不同;

4 ) 混合: 将各样品的 PCR扩增产物混合在一起, 获得 PCR 产物文库;

5 )打断: 将所得的 PCR产物文库进行不完全打断;

6 )建库: 结合文库接头标签技术, 将打断后的 PCR产物文库 构建 PCR-Free测序文库, 可以对文库添加不同的文库接头

( adapter ) 以区分不同的 PCR-Free测序文库, 回收位于所用测 序仪最大读长长度到所用测序仪适用的最长 DNA长度范围之间 的所有 DNA条带, 具体而言是 450-750bp长度范围的 DNA片段;

7 )测序: 将回收的 DNA混合物利用二代测序技术, 优选的 是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行 测序, 获得打断后的 DNA的序列;

8 )拼接: 基于各个文库不同的文库接头序列和每个样品独特 的引物标签将获得的测序结果与样品一一对应,利用比对程序(例 如 Blast, BWA程序)把各个测序序列定位到 PCR产物的相应 DNA 参考序列上, 通过序列重叠和连锁关系, 从打断后的 DNA的序列 拼接出完整的目的核酸; 和

9 )分型: 将测序结果与 HLA数据库 (如 IMGT HLA专业数 据库) 中 HLA-DRB1 2号外显子的序列数据比对, 序列比对结果 100 %匹配的即为对应样本的 HLA-DRB1基因型别。

2. 权利要求 1所述的方法,其中每一对引物标签与 PCR引物对 组合成一对标签引物, 正反 PCR引物的 5,端分别具有 (或者任选 通过连接序列连接) 正向引物标签和反向引物标签。

3. 权利要求 1所述的方法,其中所述 PCR引物是用于扩增 HLA 的特定基因的 PCR引物, 优选是用于扩增 HLA-A/B的 2, 3, 4号 外显子以及 HLA-DRB1 2号外显子的 PCR引物, 更优选的所述 PCR引物如表 2所示。

4. 权利要求 1所述的方法, 其中所述引物标签针对用于扩增 HLA的特定基因的 PCR引物进行设计, 优选针对用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR 引物,特别是如表 2所示的 PCR引物进行设计,特别是所述引物标 签特别是包括表 1所示 95对引物标签中的至少 10对, 或至少 20对, 或至少 30对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 95对(或者所述一组引物标签由表 1 所示 95对引物标签中的 10 - 95对 (例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95对, 70 - 95对, 80 - 95 对, 90 - 95对, 或 95对)组成) , 并且

所述一组引物标签优选地至少包括表 1所示 95对引物标签中 的 PI-1至 PI-10 , 或 PI-11至 PI-20 , 或 PI-21至 PI-30 , 或 PI-31至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70,或 PI-71 至 PI-80, 或 PI-81至 PI-90, 或 PI-91至 PI-95, 或者它们任何两个 或者多个的组合。

5. 权利要求 1所述的测序方法,其中所述 DNA打断包括化学打 断方法和物理打断方法, 其中所述化学方法包括酶切方法, 所述 物理打断方法包括超声波打断方法或机械打断方法。

6. 权利要求 1所述的测序方法, 其中所述纯化回收方法包括但 不限于电泳割胶回收, 也可以是磁珠回收。

7. 权利要求 1所述的测序方法,所述结合文库接头标签技术, 将打断后的 PCR产物文库构建 PCR-Free测序文库是指使用 m 种文库接头给 2 ) 中得到的 m个 PCR产物文库加上接头, 其中 每一个 PCR产物文库使用一种不同的文库接头, 从而构建 m个 接头标签测序文库;将 m个接头标签测序文库等摩尔混合在一起 构建混合接头标签测序文库。 其中连接文库接头的方法是指不通 过 PCR程序直接采用 DNA连接酶进行连接。

8. 一组引物标签, 其包括表 1所示 95对引物标签中的至少 10 对, 或至少 20对, 或至少 30对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 95对 (或者所 述一组引物标签由表 1所示 95对引物标签中的 10 - 95对 (例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95 对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组成) , 并且 所述一组引物标签优选地至少包括表 1所示 95对引物标签中 的 PI-1至 PI-10 , 或 PI-11至 PI-20 , 或 PI-21至 PI-30 , 或 PI-31至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70,或 PI-71 至 PI-80, 或 PI-81至 PI-90 , 或 PI-91至 PI-95, 或者它们任何两个 或者多个的组合。

9. 权利要求 8所述的一组引物标签用于 PCR测序方法的用途, 其中特别是, 每一对引物标签与用于扩增待测目的序列的 PCR引 物对组合成一对标签引物, 正反 PCR引物的 5,端分别具有 (或者 任选通过连接序列连接)正向引物标签和反向引物标签。

10. 权利要求 9所述的用途, 其中 PCR引物是用于扩增 HLA的 特定基因的 PCR引物, 优选是用于扩增 HLA-A/B的 2, 3 , 4号外 显子以及 HLA-DRB1 2号外显子的 PCR引物, 优选的所述 PCR引 物如表 2所示。

11. 权利要求 8的一组引物标签与用于扩增待测目的序列的 PCR引物对组合成的一组标签引物, 其中每一对引物标签与 PCR 引物对组合成一对标签引物, 正反 PCR引物的 5,端各具有 (或者 任选通过连接序列连接)一个引物标签。

12. 权利要求 11所述的标签引物,其中所述 PCR引物是用于扩 增 HLA的特定基因的 PCR引物,优选是用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物, 优选的所述 PCR引物如表 2所示。

13. 权利要求 11所述的标签引物用于 PCR测序方法的用途。

Description:
基于 l l l um i na GA测序技术的 HLA 基因高分辨率分型方法 技术领域

本发明涉及核酸测序技术领域, 特别是 PCR测序技术领域。 另外,本发明还涉及 DN A分子标签技术和 DNA不完全打断策略。 本发明的方法特别适用于第二代测序技术。 本发明的方法涉及 DNA序列的分型方法, 特别是 HLA基因高分辨率分型方法。 背景技术

人类白细胞抗原, 即 HLA(human leukocyte antigen, HLA), 是迄今为止发现的多态性最高的基因系统之一 , 它是调控人体特 异性免疫应答和决定疾病易感性个体差异的主 要基因系统, 与同 种异体器官移植的排斥反应密切相关。 研究发现, 移植时, 供受 双方的 HLA相关基因匹配程度越高, 分辨率越高, 移植物的存 活时间越长。

HLA-SBT ( Sequence Based Typing, 基于 DNA序列的分型 方法)是当前 HLA高分辨率分型的主要方法。 该方法通过 PCR 扩增相应 HLA 的基因区域, 对扩增产物测序, 测序结果经过专 业的分型软件分型, 最终得到样本的 HLA基因型别信息。 其具 有直观、 高分辨且能检测新的等位基因的特点。

当前的 HLA-SBT方法主要是基乎 Sanger测序法,该测序方 法不能直接得到样本中单体型 (父本或者母本单独的序列信息) 的序列信息, 而只能得到二倍体型序列信息, 这给 HLA分型结 果带来了不确定性 (Ambiguity ) ,为了得到确定的分型结果, 需 要加测 GSSP (组特异性测序引物, Group Sepecific Sequencing Primer ) 或者通过克隆测序来解决上述问题 基于 Sanger测序法的测序通量小, 以 ABI公司的 3730.测序 仪一天 4000 个测序反应的饱和通量为例, 单份样本的 HLA-A/B/DRB1三个位点的 SBT分型大概需要 17个测序反应, 一台 3730测序仪整天不停运转也只能产出约 240份样本的数据 量。

目前 HLA-SBT主要通过专业分型软件来分型, 导入测序峰 图质量的好坏对分型软件的峰图识别能力影响 很大, 当软件识别 错误时, 需要分型人员能及时发现错误, 改正错误。 同时, 为了 避免人为错误, 同一批次样本的分型工作往往要由两人以上独 立 完成, 核对无误后, 才能确认结果。 如果能够实现软件分型的自 动化那将大大减少错误的发生率, 并且降低人力成本。

基于 Sanger测序法的 HLA-SBT实验步骤包括: PCR扩增、 PCR产物电泳、 PCR产物纯化、 测序反应、 测序反应产物纯化、 测序仪测序、 测序结果分型以及后继的加测 GSSP等, 整个实验 流程复杂, 且实验过程中, 不同 PCR产物不能混合在一起操作, 大大地加大了实验工作量。

HLA-SBT 整个实验流程复杂、 通量低和成本高等缺点使其 很难应用于大规模 HLA高分辨分型项目。

发明内容

Illumina GA测序 ( Illumina 公司的 Genome Analyzer测序 仪, 简称 Illumina GA )是利用边合成边测序的原理进行 DNA序 列分析, 可以检测单体型, 其最终产出的数据是一系列的碱基序 列, 可直接用于与 HLA数据库中的参考序列直接比对, 不存在 传统分型软件峰图误判的问题, 有利于软件分型的自动化。

Illumina GA的测序通量大,目前一个实验流程下来可以 生 50G ( 500亿)碱基的数据, 平均每天产生 50亿碱基的数据。 高的数 据通量可以在测序序列数确定的情况下, 使得每条序列获得高的 测序深度, 确保测序结果的可靠性。

目前还未有将 Illumina GA应用于 HLA分型领域的研究, 本 发明首次将 Illumina GA测序应用于 HLA分型领域, 结合 DNA 分子标签技术、 DNA不完全打断及 PCR-FREE建库的 PCR测序 技术, 实现 HLA 的低成本, 高通量、 高准确率、 高分辨率的分 型。

基于 DNA分子标签技术, 实现了对多样本 PCR产物的分别 标记, 使 Illumina 测序文库构建实验环节可把多个样本混合 ( pooling ) 成一个文岸同时处理, 大大简化了实验操作, 最终, 每个样本的检测结果可以通过其独特的标签( index )序列找回。

DNA不完全打断技术使 Illumina GA实际可测通的 PCR产 物长度超过测序仪的测序最大长度, 在当前 Illumina GA测序最 大长度 200bp的情况下,实际可测通的 PCR产物长度达到 200bp 以上。

"接头 (adapter ) " 或 "文库接头 ( library adapter ) " 标 签技术是指通过对多个测序文库添加不同文库 接头 (不同文库接 头的组成序列不同, 序列不同的部分称为接头标签 ( adapter index ), 构建标签测序文库, 从而可实现多个不同标签测序文库 混合测序, 且最终各个标签测序文库的测序结果可相互区 分的一 种文库标签技术。

基于 DNA分子标签技术和 DNA不完全打断策略的 PCR测 序方法的使用可在减少引物标签数目的情况下 , 大大提高可唯一 标记的样本数目 (图 1 ) 。

结合文库接头标签技术的 PCR-FREE的文库构建方法,是指 将文库接头直接连接至测序文库中的 DNA片段两端,文库接头的 导入过程因为没有 PCR的参与, 因此称作 PCR-Free文库构建。 其中接入方法可以采用 DNA连接酶进行连接。 其整个文库构建 过程中无 PCR的参与, 避免了在高序列相似度的 PCR产物混合 ( poolin ) 文库的构建过程中, 由 PCR 引入错误而导致最后结 果的不准确性。

本发明, 采用基于 DNA分子标签技术、 DNA不完全打断及 PCR-FREE建库的 PCR测序技术, 通过对待分析样本分组, 再 对每组样本通过双向引物标签标记的引物, 对 HLA基因目的片 段扩增 (PCR产物的最大长度取决于测序仪可结合的最 大 DNA 长度, 当前 Illumina GA适用的最大 DNA长度为 700bp, 此长度 为原始 DNA长度, 没有包括文库接头序列长度) , 所得 PCR产 物等量混合, 经 DNA不完全打断处理, 构建 PCR-Free标签测序 文库。 把各样本组得到的不同标签测序文库等摩尔混 合, 选择性 回收片段长度大于测序仪最大测序长度以上的 所有 DNA片段,随 后用 Illumina GA 测序仪测序。 通过对测序结果中接头标签 ( adapter index )、 引物标签以及 PCR引物的序列信息筛选, 可 获得每个样本的 DNA 序列信息, 所得 DNA 序列经过组装与 IMGT HLA专业数据库中对应数据库的比对,最终可得 到样本的 HLA基因型别。

在本发明的一个方面中, 提供了一组引物标签 ( primer index ) , 其包括表 1所示 95对引物标签中的至少 10对, 或至少 20对, 或至少 30对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 9 对 (或者所述 一组引物标签由表 1所示 95对引物标签中的 10 - 95对(例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组成) , 并 且

所述一组引物标签优选地至少包括表 1所示 95对引物标签中 的 PI-1至 PI-10, 或 PI-11至 PI-20, 或 PI-21至 PI-30, 或 PI-31 至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70, 或 PI-71至 PI-80, 或 PI-81至 PI-90, 或 PI-91至 PI-95, 或者它 们任何两个或者多个的组合。

根据本发明另一方面,还提供了所述的引物标 签用于 PCR测 序方法的用途, 其中特别是, 每一对引物标签与用于扩增待测目 的序列的 PCR引物对组合成一对标签引物, 正反 PCR引物的 5, 端分别具有 (或者任选通过连接序列连接)正向引物标签 和反向 引物标签。

在本发明的一个具体实施方式中,所述 PCR引物是用于扩增 HLA的特定基因的 PCR引物, 优选是用于扩增 HLA-A/B 2, 3, 4号外显子和 HLA-DRB1 2号外显子的 PCR引物, 优选的所述 PCR引物如表 2所示。

本发明另一方面中, 提供了上文所述一组引物标签与用于扩 增待测目的序列的 PCR引物对组合成的一组标签引物,其中每一 对引物标签与 PCR引物对组合成一对标签引物, 正反 PCR引物 的 5,端分别具有 (或者任选通过连接序列连接)正向引物标签 和 反向引物标签。

在本发明的一个具体实施方式中, 上文所述标签引物中的 PCR引物是用于扩增 HLA的特定基因的 PCR引物,优选是用于 扩增 HLA-A/B 2, 3, 4号外显子和 HLA-DRB1 2号外显子的 PCR 引物, 优选的所述 PCR引物如表 2所示。

在本发明的另一个具体实施方式中, 所述的标签引物用于 PCR测序方法。 本发明另一方面中, 提供了一种 HLA分型的方法, 其包括:

1 )提供 n 个样品, n为大于等于 1的整数, 所述样品优选地来 自哺乳动物, 更优选是人, 特别是人的血样;

2 )将待分析的 n个样品分成 m个小组, m为整数且 n > m > l ;

3 )扩增: 对于每一个样品, 使用一对标签引物, 在存在来自 该样品的模板时, 在适于扩增目的核酸的条件下进行 PCR扩增, 其中, 每一对标签引物由包含引物标签的正向标签引 物和反向标 签引物 (均可以是简并引物)构成, 其中正向标签引物和反向标 签引物所包含的引物标签可以相同或者不同; 不同样品所用标签 引物对中的引物标签彼此不同;

4 ) 混合: 将各样品的 PCR扩增产物混合在一起, 获得 PCR 产物文库;

5 )打断: 将所得的 PCR产物文库进行不完全打断;

6 )建库: 结合文库接头标签技术, 将打断后的 PCR产物文库 构建 PCR-Free测序文库, 回收位于所用测序仪最大读长长度到所 用测序仪适用的最长 DNA长度范围之间的所有 DNA条带, 可以对 文库添加不同的文库接头 (adapter ) 以区分不同的 PCR-Free测 序文库;

7 ) 测序: 将回收的 DNA混合物利用二代测序技术, 优选的 是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行 测序, 获得打断后的 DNA的序列;

8 )拼接: 基于各个文库不同的文库接头序列和每个样品 独特 的引物标签将获得的测序结果与样品一一对应 ,利用比对程序(例 如 Blast,BWA程序) ^各个测序序列定位到 PCR产物的相应 DNA 参考序列上,通过序列重叠和连锁关系,从打 断后的 DNA的序列 拼接出完整的目的核酸。 在本发明的一个具体实施方式中, 在上文所述的方法中, 所 述结合文库接头标签技术, 将打断后的 PCR 产物文库构建 PCR-Free测序文库是指使用 m种文库接头给 4 ) 中得到的 m个 PCR产物文库加上接头, 其中每一个 PCR产物文库使用一种不 同的文库接头, 从而构建 m个接头标签测序文库; 将 m个接头 标签测序文库等摩尔混合在一起构建混合接头 标签测序丈库。 其 中连接文库接头的方法是指不通过 PCR程序直接采用 DNA连接 酶进行连接。

在本发明的一个具体实施方式中, 在上文所述的方法中, 每 一对引物标签与 PCR引物对组合成一对标签引物, 正反 PCR引 物的 5,端分别具有 (或者任选通过连接序列连接)正向引物标签 和反向引物标签。

在本发明的一个具体实施方式中, 在上文所述的方法中, 所 述 PCR引物是用于扩增 HLA的特定基因的 PCR引物, 优选是 用于扩增 HLA-A/B 2, 3, 4号外显子和 HLA-DRB1 2号外显子 的 PCR引物, 优选的所述 PCR引物如表 2所示。

在本发明的一个具体实施方式中, 在上文所述的方法中, 所 述引物标签针对 PCR引物进行设计, 优选针对用于扩增 HLA的 特定基因的 PCR引物进行设计, 更优选针对用于扩增 HLA-A\B 2, 3, 4号外显子和 HLA-DRB1 2号外显子的 PCR引物, 特别 是如表 2所示的 PCR引物进行设计,所述引物标签特别是包括表 1所示 95对引物标签中的至少 10对, 或至少 20对, 或至少 30 对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或 至少 80对, 或至少 90对, 或 95对(或者所述一组引物标签由表 1所示 95对引物标签中的 10 - 95对 (例如 10 - 95对, 20 - 95 对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组成) , 并且

所述一组引物标签优选地至少包括表 1所示 95对引物标签中 的 PI-1至 PI-10, 或 PI-11至 PI-20, 或 PI-21至 PI-30, 或 PI-31 至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70, 或 PI-71至 PI-80, 或 PI-81至 PI-90, 或 PI-91至 PI-95, 或者它 们任何两个或者多个的组合。

在本发明的一个具体实施方式中, 在上文所述的方法中, 所 述 DNA打断包括化学打断方法和物理打断方法, 其中所述化学 方法包括酶切方法, 所述物理打断方法包括超声波打断方法或机 械打断方法。 所述 DNA打断后, 纯化回收 450-750bp长度的片 段。 所述纯化回收纯化回收方法包括但不限于电泳 割胶回收, 也可 以是磁珠回收。

在本发明的一个具体实施方式中, 在上文所述的方法中, 所 述 DNA打断后, 在构建 PCR-Free标签文库的过程中, 对不同组 样品的 DNA用不同的文库接头连接, 从而在其后的分型步骤中, 基于每个样品所用的引物标签和接头标签, 将获得的测序结果与 样本 对应。

利用比对程序把各个样本测序序列定位到其 PCR产物已知相应的 DNA 参考序列 (Reference Sequence )上, 通过序列重叠和连锁 关系, 从打断后的 DNA的序列拼接出完整的 PCR产物序列。

本发明另一方面中, 提供了一种 HLA分型方法, 包括: 使 用上文所述的测序方法对来自患者的样品 (特别是血样) 进行测 序和拼接, 以及将拼接好的序列与 HLA数据库 (如 IMGT HLA 专业数据库)中 HLA相关序列数据比对, 序列比对结果 100 %匹 配的即为对应样本的 HLA-DRB1基因型别。

发明的有益效果 本发明提供了基于 illumina GA测序技术的 HLA基因高分辨 率分型方法, 从而实现单体型测序、 软件分型自动化, 提高 HLA 基因分型的通量, 降低成本。

附图说明

图 1:为引物标签和接头标签(adaptor index )标记后的 PCR 产物示意图。 实验时, 通过 PCR在每个样本的 PCR产物两端同 时引入引物标签;把多个带有不同引物标签的 PCR产物混合在一 起, 用于构建测序文库。 测序文库构建过程中, 当需要构建多个 测序文库时, 可通过添加带有不同接头标签的文库接头, 来标记 各个测序文库。 文库构建完毕后, 带有不同接头标签标记的多个 测序文库可以混合在一起同时用 Illumina GA测序 (不同接头标 签标记的测序文库之间的引物标签可以相同) 。测序结果出来后, 通过对测序结果中接头标签和引物标签序列信 息的歸选, 可获得 每个样本的 DNA序列信息。

图 2: 为 1号样本 HLA-A/B/DRB1相应外显子 PCR产物电泳 结果, 从电泳图上看, PCR产物为一系列片段大小 300bp-500bp 的单一条带,其中泳道 M是分子量标记物( DL 2000,Takara公司), 泳道 1-7为 1号样本的 HLA-A/B/DRB1各外显子 ( A2、 A3、 A4、 B2、 B3、 B4、 DRBl-2 ) PCR扩增产物, 阴性对照 ( N )无扩增条 带。 其它样品的结果与此类似。

图 3: 为 HLA-Mix打断后 DNA电泳情况 (割胶前后), 割胶 区域为 450-750bp区域。 其中泳道 M是分子量标记物(NEB-50bp DNA Ladder ) , 泳道 1是割胶前 HLA-Mix的电泳情况, 泳道 2 是割胶后 HLA-Mix的胶图。

图 4: 1号样本一致性(consensus )序列构建程序截图, 示例 说明了根据引物标签和 DNA片段之间的重叠关系拼接出 PCR产物 的完整序列。

具体实施方式

下面将结合实施例对本发明的实施方案进行详 细描述, 但是 本领域技术人员将会理解, 下列实施例仅用于说明本发明, 而不 应视为限定本发明的范围。

在本发明的实施例中,釆用基于引物标签、 DNA不完全打断、 文库标签及 PCR-FREE建库的 PCR测序方法, 对 950个样本的 HLA-A/B 2, 3, 4号外显子以及 HLA-DRB1 2号外显子 (PCR产 物长度大小处于 290bp-500bp之间)的基因分型, 证明该发明能够 实现低成本、 高通量、 高准确率和高分辨率的 HLA基因分型。

原理: 将待分析的样本均分成 10组,对每组样本通过 PCR反 应在 HLA-A/B 2, 3,4号外显子以及 HLA-DRB1 2号外显子的 PCR 产物两端引入引物标签, 使其特异的标记 PCR产物的样本信息。 将各组内样品的 HLA-A/B/DRB1三个位点的 PCR扩增产物等体 积混合在一起, 获得 PCR产物文库; 所得 PCR产物文库经过超 声不完全打断后, 构建不同的 PCR-Free标签测序文库 (其中每 一个 PCR产物文库使用一种不同的接头, 从而构建 10个标签测 序文库); 将 10个标签测序文库等摩尔混合在一起构建混合 签 测序文库, 混合标签测序文库经 2%低熔点琼脂糖电泳, 割胶纯 化回收位于 450-750p 长度范围之间的所有 DNA 条带。 回收的 DNA经 Illumina GA PE-100测序。 通过文库标签和引物标签序 列可以找到所有所测样本的序列信息, 再通过已知 DNA 片段的 参考序列信息和 DNA 片段序列之间的重叠和连锁关系组装出整 个 PCR产物的序列, 再通过与 HLA-A/B/DRB1相应外显子的标 准数据库的比对结果可组装出原 PCR 产物的全序列,实现 HLA-A/B/DRB1的基因分型。 实施例 1

样本提取

使用 KingFisher 自动提取仪(请提供供货商信息) (美国 Therm (^公司)从 950份已知 HLA-SBT分型结果的血样(中国造 血干细胞捐献者资料库(以下称 "中华骨髓库" )) 中提取 DNA。 主要步骤如下: 取出 6个 Kingfisher自动提取仪配套的深孔板及 1个浅孔板, 根据说明书分别加入一定量配套的试剂并作好 标记, 将所有已加好试剂的孔板按要求置于相应的位 置, 选定程序 "Bioeasy— 200ul Blood DNA_KF.msz" 程序, 按下 "star" 执行 该程序进行核酸提取。 程序结束后收集 plate Elution中的 lOOul 左右的洗脱产物即为提取的 DNA, 准备做下一步 PCR中的模板 用。 实施例 2

PCR扩增

把样本提取步骤中所得的 950份 DNA依次编号 1-950, 均分 成 10组,每组 95份 DNA,分别标记为 HLA-1、 HLA-2、 HLA-3、 HLA-4、 HLA-5、 HLA-6、 HLA-7、 HLA-8、 HLA-9、 HLA-10. 对每组样本分别以 95 套带有双向引物标签 (表 1 ) 用于扩增 HLA-A/B 2, 3, 4号外显子和 HLA-DRB1 2号外显子的 PCR引 物 (表 2 ) 来分别扩增 95份 DNA样本。 PCR反应在 96孔板中 进行, 共 7 板, 编号分别为 HLA-X-P-A2、 HLA-X-P-A3、 HLA-X-P-A4、 HLA-X-P-B2, HLA-X-P-B3、 HLA-X-P-B4 以及 HLA-X-P-DRB1-2 ( "X"表示样本组号信息 1/2/3/4/5/6/7/8/9/10, "A2/3/4,B2/3/4,DRBl-2"表示扩增的位点) , 每板内设置一个不 添加模板的阴性对照, 阴性对照所用引物为 PI-1 (表 1 ) 标记的 引物。 实验的同时, 记录下每个样本对应的样本组号信息和引物 标签信息。

引物标签的相关信息

-ει-

SC8l00/0l0ZN3/13d CSIOOO/ZTOZ OAV

PI-95 CGACGTAGAGTC CAGTAGCACTAC Hll 95 95+95*n 表 2, 未添加引物标签前用于扩增 HLA-A/B/DRB1相应外显 子的 PCR引物

D2-F1, D2-F2, D2-F3, D2-F4, D2-F5, D2-F6, D2-F7为扩增 HLA-DRBl 2号外显子的正向引物, D2-R为扩增 HLA-DRB1 2号 外显子的反向引物。

HLA-A/B/DRB1 的 PCR程序如下:

96 2min

95 " 30s ->60 30s ^72 20s (32cycles)

15 ∞

HLA-A/B的 PCR反应体系如下

PI nf -D2-F7 ( 2pmol/ ul ) l.Oul

PI„ r -D2-R ( 2pmoI/ ul ) l.Oul

Promega Taq ( 5U/uI ) 0.2ul

DNA (约 20 ng/ul ) 5.0ul

ddH 2 0 4.8ul

Total 25.0ul

其中 PI nr A/B/D2-F 1/2/3/4/5/6/7 表示引物 5,末端带有第 n号正向引 物标签序列(表 1 )的 HLA-A/B/DRB1的 F引物, PI nr A/B/D2-R 2/3/4 表示引物 5,末端带有第 n号反向引物标签序列的 HLA-A/B/DRB1 的 R引物(此处 n < 95 ) , 其它依次类推。 且每个样本对应特定的 一套 PCR引物 ( PI n 「A/B/D2-F 1/2/3/4/5/6/7 , PI n 「A/B/D2-R 2/3/4 ) 。

PCR反应在 Bio-Rad公司的 PTC-200 PCR仪上运行。 PCR完 成后, 取 2ul PCR产物经 1%的琼脂糖凝胶电泳检测。 图 2显示 了 1号样本 HLA-A/B/DRB1相应外显子 PCR产物电泳结果, DNA 分子标记为 DL 2000 ( Takara公司), 胶图上有一系列片段大小为 300bp-500bp单一条带, 表明 1号样本的 HLA-A/B/DRB1各外显 子 (A2、 A3、 A4、 B2、 B3、 B4、 DRB1-2 ) PCR扩增成功, 阴性 对照 (N )无扩增条带。 其它样品的结果与此类似 实施例 3

PCR产物混合和纯化

对第 "X "组 ("X" 为 1/2/3/4/5/6/7/8/9/10)样本, 从 96 孔板 HLA-X-P-A2剩余的 PCR产物中 (阴性对照除外)各取 20 ul混 合在一个 3ml的 EP管中, 标记为 HLA-X-A2-Mix, 对第 "X"组 样本的其它 6 个 96 孔板进行同样的操作, 分别标记为 HLA-X-A3-Mix 、 HLA-X-A4-Mix 、 HLA-X-B2-Mix 、 HLA-X-B3-Mix、 HLA-X-B4-Mix和 HLA-X-D2-Mix, 震荡混匀, 从 HLA-X-A2-Mix 、 HLA-X-A3-Mix 、 HLA-X-A4-Mix 、 HLA-X-B2-Mix 、 HLA-X-B3-Mix 、 HLA-X-B4-Mix 和 HLA-X-D2-Mix中各取 200ul混合在一个 3ml的 EP管中, 标记 为 HLA-X-Mix。 从中各取 500ul DNA 混合物经 Qiagen DNA Purification kit过柱纯化(具体纯化步驟详见说明书) , 纯化所 得的 200ul DNA, 经 Nanodrop 8000(Thermo Fisher Scientific公 司)测定的 DNA浓度分别为:

实施例 4

Illumina GA测序文库构建

l.DNA打断

从纯化后的 HLA-X-Mix中各取总量 5ug的 DNA 用带 AFA 纤维扣盖的 Covaris 微管在 Covaris S2(Covaris公司)上打断。 打 断条件如下:

频率扫描 ( frequency sweepin )

2. 打断后纯化

将 HLA-X-Mix 的所有打断产物用 QIAquick PCR Purification Kit( QIAGEN公司)回收纯化,分别溶于 37.5ul 的 EB ( QIAGEN Elution Buffer ) 中;

3. 末端修复反应

对打断后纯化的 HLA-X-Mix进行 DNA末端修复反应, 体系 如下 (试剂均购自 Enzymatics公司) :

DNA 37.5 L

H 2 0 37.5μί 多核苷酸激酶緩冲液( 10x Polynucleotide Kinase Buffer( B904 ) ) 10

dNTP混合物 (每种 10mM ) ( Solution Set ( lOmM each ) ) 4

T4 DNA聚合酶 ( T4 DNA Polymerase ) 5μL

Kleno 片段 ( Klenow Fragment ) ΙμΙ

T 多聚核苷酸激酶( T4 Polynucleotide Kinase ) 5μL·

总体积 ( Total volume ) 100 μL·

反应条件为: 恒温混匀器 ( Thermomixer, Eppendorf公司)

20 温浴 30 min。

反应产物经 QIAquick PCR Purification Kit回收纯化, 溶于 34 μΐ的 EB ( QIAGEN Elution Buffer ) 中。

4. 3' 末端加 A反应

上一步回收 DNA的 3, 末端加 A反应, 体系如下 (试剂均 购自 Enzymatics公司 ) :

上一步所得 DNA 32

10x 蓝色緩沖液( 10x blue buffer ) 5

dATP(lmM , GE公司) 10

Klenow (3'-5' exo-) 3 μΐ^ 总体积 ( Total volume ) 50

反应条件为: 恒温混匀器 ( Thermomixer , Eppendorf 公 司)37t)温浴 30 min。

反应产物经 MiniElute PCR Purification Kit( QIAGEN公司) 回收纯化, 溶于 13 μΐ的 ΕΒ溶液( QIAGEN Elution Buffer )中。

5. 连接 Illumina GA PCR-Free文库接头 (adapter ) 术语 "PCR-Free文库接头 (adapter ) " 是指经设计的一段 碱基, 其主要作用是辅助固定 DNA分子在测序芯片上以及提供 通用测序引物的结合位点, PCR-Free文库接头可以通过 DNA连 接酶将其直接连接至测序文库中的 DNA片段两端,接头的导入过 程因为没有 PCR的参与, 因此称作 PCR-Free文库接头。

加 A后的产物分别连接不同的 Illumina GA PCR-Free index

反应条件为: 恒温混匀器 ( Thermomixer , Eppendorf 公 司) 20 温浴 15 min。

样本组与文库接头的对应关系如下

反应产物经 Ampure Beads(Beckman Coulter Genomics)纯化 后溶于 50ul去离子水, 经荧光定量 PCR ( QPCR )检测到 DNA 摩尔浓度结果如下:

6. 割胶回收

将 HLA-1-Mix、 HLA-2-Mix、 HLA-3-Mix , HLA-4-Mix、 HLA-5-Mix, HLA-6-Mix、 HLA-7-Mix、 HLA-8-Mix, HLA-9-Mix 和 HLA-10-Mix 等摩尔混合 (终浓度 72.13nM/ul ) , 标记为 HLA-Mix-10, 取 30 L HLA-Mix-10用 2%低熔点琼脂糖胶进行回 收。电泳条件为 100V, 100min。 DNA marker为 NEB公司的 50bp DNA marker 0 割胶回收 450-750bp长度范围的 DNA片段(附图 3 ) 。 胶回收产物经 QIAquick PCR Purification Kit ( QIAGEN 公司)回收纯化, 纯化后体积为 32ul, 经荧光定量 PCR ( QPCR ) 检测到 DNA浓度结果为 9.96nM。 实施例 5

Illumina GA测序

根据 QPCR 检测结果, 取 lOpmol DNA 用 Illumina GA PE-100程序测序, 具体操作流程详见 Illumina GA操作说明书 ( Illumina GA Π x ) 。 实施例 6

结果分析

Illumina GA产出的测序结果是一系列 DNA序列,通过查找 测序结果中的接头标签序列、 正反引物标签序列和引物序列, 建 立各个引物标签对应样本 HLA-A/B/DRBl 各外显子 PCR产物测 序结果的数据库。通过 BWA(Burrows-Wheeler Aligner)把各外显 子的测序结果定位在相应外显子的参考序列上 (参考序列来源: http://www.ebi.ac.uk/imgt/hla/ ) 同时, 构建各个数据库的一致性

( consensus )序列, 再对数据库中 DNA序列进行筛选和测序错 误校正。 校正后的 DNA 序列通过序列重叠 (overlap ) 和连锁

( Pair-End连锁) 关系可组装成 HLA-A/B/DRBl 各外显子相应 的序列。 所得 DNA 序列利用与 IMGT HLA 专业数据库中

HLA-A/B/DRBl 相应各外显子的序列数据库比对,序列比对结 果

100%匹配的即为对应样本的 HLA-A/B/DRBl基因型别。 可参考 图 4示例说明的 1号样品的 HLA-A位点的 2号外显子一致性序 列构建程序的截图。 所有 950个样本, 得到的分型结果与原已知 分型结果完全相符, 其中 1-32号样本的具体结果如下:

样本编号 原 HLA-A/B/DRBl型别

1 A*02:03 A*ll:01 38:02 "48:01 DRB1' "14:54 DRB1 *15:01

2 A*01:01 A*30:01 ^08:01 k 13:02 DRB1' ^03:01 DRB1 *07:01

3 A*01:01 A*02:01 B v 45:11 fe 47:01 DRB1' fe 13:02 DRB1 * 15:01

4 A*24:08 A*26:01 k 40:01 B J k 51:01 DRB1' "04:04 DRB1 *09:01

5 A*01:01 A*24:02 B j fc 54:01 B j 5:02 DRB1' "=04:05 DRB1 *09:01

6 A*01:01 A*03:02 B J 15:11 k 37:01 DRB1' 0:01 DRB1 *14:54

7 A*ll:01 A*30:01 43:02 B 45:18 DRB1' ^04:04 DRB1 *07:01

8 A*01:01 A*02:01 B v ^5:03 B v k 81:01 DRB1' 1:01 DRB1 *15:01

9 A*02:06 A*31:01 k 27:07 B J k 40:02 DRB1' "03:01 DRB1 *13:02

10 A*01:01 A*66:01 B J fc 37:01 fc 49:01 ORBV ^10:01 DRB1 fc 13:02

11 A*01:01 A*03:01 35:01 52:01 DRB1' k 01:01 DRB1 "15:02

12 A*ll:01 A*ll:01 B j 15:01 B J 45:05 DRB1*04:06 DRB1 45:01

13 A*01:01 A*ll:02 k 07:02 B J 45:02 DRB1' "09:01 DRB1' fc 15:01

14 A*01:01 A*02:01 k 52:01 B J k 67:01 ORBV "15:02 DRB1' *16:02

15 A*01:01 A*02:05 fc 15:17 B*50:01 ORBV fe 07:01 DRBl: fc 15:01

16 A*01:01 A*ll:01 k 37:01 B v k 40:02 ORBV 0:01 DRB1*12:02

17 A*24:07 A*32:01 B v k 35:05 k 40:01 ORBV ^03:01 DRB1 04:05

18 A*ll:01 A*24:02 B v k 13:01 B J k 35:01 ORBV 46:02 DRB1 fc 16:02

19 A*ll:01 A*ll:01 B J k 40:02 B v ^55:12 ORBV k 04:05 DRB1' "15:01

20 A*02:ll A*24:02 B*40:01 fe 40:06 DRB1' 1:01 DRB1*15:01 -it- εο:8θ*ιβπα 10: 0, I0:9 F a I0=T0*V 9Ζ

90 : Z.O, f a το : τε*ν ιο:π*ν SZ

ΙΟ:ΔΟ, f a ιο:οε*ν Ζ

ΙΟ:ΟΙ*ΙΗΉα εο:ΗΜβπα 10=9^*9 I0 : I0*V £Ζ iona¾a so: o. I0:6 V T0 : I0*V ζζ ιο:π* a 10: 0, IS, 90:Z0*V I0:I0*V ιζ io:s iaHa WIT. 90:0^*9 I0:0 π:ζο*ν οζ io:s 簡 a zx=ss*a f a ιο:π*ν 61 zo:9 ie«a Z0:9I, ιο:ει. Z0'PZ*Y ιο:ττ*ν 8Τ ιο:εο; L\ ana 10: Ϊ0:Ι0 91

I0:0S*fl ": SI, S0 : Z0*V το : ιο Ϋ ν SI zo:9i*簡 a j ana f a I0:I0*V

TO : s xaHa 10:60, ZO-LO^ ∑ο=τι*ν ιο:ιο*ν ετ io:s 簡 a 90:Hh I0:SI, ιο:π*ν η ro:s ia¾a 10:10; ιο:εο*ν ιο:ιο*ν II

wo I0:6 *8 I0:99*V χο:ιο*ν οτ ιο:εο. ja¾a το : τε ¥ ν 90:Z0*V 6 ιο:π. 10:18*8 ιο:ιο*ν 8

Τ0:/.0*Τ8Ηα 8i : si*a Z '£l, ιο:οε*ν L

10:01, ": SI, 9 io:60*ia¾a so: WPS> f a το:χο*ν S

T0 : 60*ia¾a 0, xo:TS*a 10=9Z*V Ρ io:s iaHa u f a I0:I0*V ε

TO : .o*ia¾a ιο:εο; Z0'-£ Q 10:80, ιο:ιο*ν ζ

Tfl¾a/9/V-VlH ^ t«

'蘭 a εο:ι ΐδΗα I0=TT*V

'腦 a χο:χο*ν τε

Ta«a T0 : £0 ¾ ro=6r*v οε m¾a lO'Z Π):Ι I0:99*V I0:9Z*V 6Z

I0:S im I0:H lo:厶 ε, I0:I0*V LZ

10:9 I0:10*V 9Z

ZO'-Z 90^0; f a T0 : I£*V I0:I V sz ima Z0'-£\^ ιο:οε*ν n io:o ia¾a 'ΐβπα W-L^ I0:I0*V

I 'LQ ia¾a xana SO: ( I0:I0*V zz

SC8T00/0l0iN3/X3d CSTOOO/ZTOi OAV 27 A*01:01 A*02:01 B' 5:18 fe 37:01 DRB1*04:01 DRB1*15:01

28 A*01:01 A*24:02 B' 7:01 B j k 46:01 DRB1*09:01 DRB1*10:01

29 A*26:01 A*66:01 B*40:40 B*41:02 DRB1*12:01 DRB1*15:01

30 A*02:01 A*29:02 fe 13:02 B J ^45:01 DRB1*03:01 DRB1*12:02

31 A*01:01 A*ll:03 45:01 B J k 57:01 DRB1*07:01 DRB1*15:01

32 A*ll:01 A*26:01 35:03 B" '38:01 DRB1*11:03 DRB1*14:04

HLA-DRB1 • 型 别 中 的 DRB1*1201 不 排 除

DRB1*1206/1210/1217的可能性, DRB1*1454不排除 DRB1*1401 的可能性, 因为上述等位基因在 2号外显子的序列完全相同。 同 理对于 HLA-A/B位点中 2、 3、 4号外显子序列完全相同的结果 取常见型。

釆用本发明的技术路线, 对 950份已知 HLA-SBT分型结果的 样本进行 HLA-A/B/DRB1位点的基因分型, 结果发现: 采用本发 明的技术路线所得的分型结果与原结果完全一 致。

尽管本发明的具体实施方式已经得到详细的描 述, 本领域技 术人员将会理解。 根据已经公开的所有教导, 可以对那些细节进 行各种修改和替换, 这些改变均在本发明的保护范围之内。 本发 明的全部范围由所附权利要求及其^:何等同物 出。 参考文献

[1]. http://www.ebi.ac.uk/imgt/hla/stats.html

[2]. Tiercy J M. Molecular basis of HLA polymorphism: implications in clinical transplantation. [J]. Transpl Immunol, 2002, 9: 173-180.

[3]. C.Antoine, S.MUIler, A.Cant, et al. Long-term survival and transplantation of haemopoietic stem cells for immunodeficiencies: report of the European experience. 1968-99. [J]. The Lancet, 2003,9357:553-560.

[4]. H. A. Erlich, G. Opelz, J. Hansen, et al. HLA DNA Typing and Transplantation. [J]. Immunity, 2001,14:347-356.

[5]. Lillo R, Balas A, Vicario JL, et al. Two new HLA class allele, DPBl*02014,by sequence-based typing. [J]. Tissue Antigens, 2002, 59: 47-48.

[6]. A. Dormoy, N. Froelich . Leisenbach, et al. Mono-allelic ampliHcation of exons 2-4 using allele group-specific primers for sequence-based typing (SBT) of the HLA-A, -B and -C genes: Preparation and validation of ready-to-use pre-SBT mini-kits. [J]. Tissue Antigens, 2003, 62: 201-216.

[7]. Elaine R. Mardis. The impact of next-generation sequencing technology on genetics. [J]. Trends in Genetics.2008,24:133-141.

[8]. Christian Hoffmannl, Nana Minkahl, Jeremy Leipzig. DNA barcoding and pyrosequencing to identify rare HIV drug resistance mutations. [J]. Nucleic Acids Research, 2007,1-8.

[9]. Shannon J.Odelberg, Robert B.Weiss, Akira Hata. Template-switching during DNA synthesis by Therm us aquatic ws DNA polymerase I. [J]. Nucleic Acids Research.1995, 23:2049-2057.

[10】. Sayer D, Whidborne R, Brestovac B. HLA-DRB1

DNA sequencing based typing: an approach suitable for hig h throughput typing including unrelated bone marrow regist ry donors. [J]. Tissue Antigens. 2001, 57(l):46-54.