PREPARATION OF NUCLEIC ACID LIBRARIES OR GENE BANKS

Title:

PREPARATION OF NUCLEIC ACID LIBRARIES OR GENE BANKS

Document Type and Number:

WIPO Patent Application WO/2020/012057

Kind Code:

Abstract:

The present invention relates to methods and compositions for high-performance analysis of populations of nucleic acid molecules, and more particularly to methods and compositions related to the production of libraries and the applications thereof.

Inventors:

LÓPEZ-VIOTA GALLARDO JULIÁN (ES)
CARAZO GALLEGO ÁNGEL (ES)
SALMERÓN ESCOBAR JAVIER (ES)
REDRUELLO GARCÍA ANAÏS (ES)

Application Number:

PCT/ES2019/070494

Publication Date:

January 16, 2020

Filing Date:

July 15, 2019

Export Citation:

Click for automatic bibliography generation Help

Assignee:

UNIV GRANADA (ES)
SERVICIO ANDALUZ DE SALUD (ES)
LOPEZ VIOTA GALLARDO JULIAN (ES)

International Classes:

C12Q1/686

Domestic Patent References:

WO2015031691A1

2015-03-05

Other References:

KERSTIN WAGNER ET AL.: "Synthesis of oligonucleotide-functionalized magnetic nanoparticles and study on their in vitro cell uptake", APPLIED ORGANOMETALLIC CHEMISTRY, vol. 18, no. 10, 10 January 2004 (2004-01-10), pages 514 - 519, XP055108694, ISSN: 0268-2605, DOI: 10.1002/aoc.752

Download PDF:

View/Download PDF PDF Help

Claims:

REIVINDICACIONES

1.- Un método para unir dos oligonucleótidos de cadena simple que comprende: a) unir uno de los oligonucleótidos a una partícula por el grupo amino de su extremo 5^' caracterizada por que

I) tiene un núcleo magnético,

II) tiene la superficie recubierta con compuestos orgánicos con grupos de carácter acido expuestos que le aportan carga negativa,

NI) es estable a PH alcalino y ácido, en un rango amplio entre pH 2 y 14, IV) tiene un reducido coeficiente de sedimentación y una reducida agregación,

V) tienen un tamaño de entre 100 nm y 2000 nm, preferiblemente entre 700 nm y 1500 nm, y más preferiblemente de aproximadamente 800 nm

VI) no inhibe la Taq polimerasa y puede usarse en reacciones de PCR, y Vil) La partícula es estable a temperaturas de hasta 100 °C, para crear un oligonucleótido plantilla, b) añadir el otro oligonucleótido ai extremo libre (3^') del oligonucleótido plantilla mediante cebadores de fusión, en presencia de Taq polimerasa, para hacer una elongación (de uno o varios ciclos) 2 - El método para unir dos oligonucleótidos de cadena simple según la reivindicación anterior, donde el oligonucleótido del paso (a) funciona como un cebador o primer en una reacción de polimerización del DNA.

3.- El método para unir dos oligonucleótidos de cadena simple según cualquiera de las reivindicaciones 1-2, donde el grupo ácido expuesto es el grupo carboxilo y el enlace que se establece con el extremo 5^' del oligonucleótido es un enlace amida.

4.- El método para unir dos oligonucleótidos de cadena simple según cualquiera de las reivindicaciones 1-3, donde el oligonucleótido del paso (b) es un oligonucleótido no elongable (tienen inactivado su extremo 3’).

HOJA DE REEMPLAZO (REGLA 26)

5.- E¡ método para unir dos oligonucleótidos de cadena simple según cualquiera de las reivindicaciones 1-4, donde la longitud total del oiigonucleótido del paso (b) oscila entre 30 y 100 bases

6.~ El método para unir dos oligonucleótidos de cadena simple según cualquiera de las reivindicaciones 1-5, donde el núcleo magnético es un núcleo“magnético blando”

7.~ El método para unir dos oligonucleótidos de cadena simple según cualquiera de las reivindicaciones 1-6, que adicional ente comprende: c) Realizar al menos un ciclo adicional de elongación, y d) eliminar la hebra no unida covalentemente a la macropartícula. 8.- El método para unir dos oligonucleótidos de cadena simple según cualquiera de las reivindicaciones 1-7, donde la eliminación de la hebra no unida covalentemente a la macropartícula se realiza mediante desnaturalización térmica o alcalina.

9.- El método según la reivindicación anterior, donde la eliminación de la hebra no unida covalentemente a la macropartícula se realiza mediante desnaturalización alcalina con una base fuerte, y preferiblemente la base fuerte es sosa.

10.- Un método para obtener librerías de amplicones que comprende llevar a cabo ios pasos de un método según cualquiera de las reivindicaciones 1 a 9, y adicionalmente comprende: e) unir el otro de los oligonucleótidos (adaptadores) a una partícula según se describe en la reivindicación 1 , y f) elongar la hebra en presencia de Taq polímerasa.

HOJA DE REEMPLAZO (REGLA 26)

Description:

PREPARACIÓN DE LIBRERÍAS DE ÁCIDOS NUCLEICOS O GENOTECAS

CAMPO DE LA TÉCNICA

La presente invención se refiere a métodos y composiciones para análisis de alto rendimiento de poblaciones de moléculas de ácidos núcléicos, y más particularmente, a métodos y composiciones relacionadas con la fabricación librerías y sus aplicaciones, especialmente en secuenciación de ácido nucleico de alto rendimiento (técnicas de secuenciación masiva o“ next-generation sequencing” - ngs-) y análisis genético.

ESTADO DE LA TÉCNICA

La detección de analitos, tales como las secuencias de ácidos nucleicos que están presentes en una muestra biológica, se ha utilizado como un método para identificar y clasificar microorganismos, diagnosticar enfermedades infecciosas, detectar y caracterizar anomalías genéticas, identificar cambios genéticos asociados al cáncer, estudiar la susceptibilidad genética frente a enfermedades, y medir la respuesta frente a diversos tipos de tratamiento. Una técnica común para detectar analitos, tales como las secuencias de ácido nucleico en una muestra biológica, es la secuenciación de ácidos nucleicos.

La metodología de la secuenciación de ácidos nucleicos ha evolucionado significativamente desde los métodos de degradación química utilizados por Maxam y Gilbert y los métodos de alargamiento de cadenas utilizados por Sanger. Hoy en día, las plataformas de secuenciación masiva de nueva generación permite procesar en paralelo millones de ácidos nucleicos, todos en una única secuencia o fragmento, obteniendo una profundidad de secuenciación significativa de los genomas o transcriptomas individuales de diferentes organismos. La instrumentación que realiza tales métodos es típicamente grande y costosa ya que los métodos actuales suelen basarse en grandes cantidades de reactivos costosos y conjuntos múltiples de filtros ópticos para registrar la incorporación de los ácidos nucleicos en las reacciones de secuenciación.

Las nuevas plataformas centran sus esfuerzos en la creación de librería de secuenciación paralela masiva, en generar tecnologías de procesado en paralelo y en el análisis de grandes cantidades de datos. Se ha puesto de manifiesto que la necesidad de tecnologías de secuenciación de ADN de alto rendimiento (técnicas de secuenciación masiva), más pequeñas y menos costosas será beneficiosa para obtener los frutos de la secuenciación del genoma. La medicina personalizada y de precisión se beneficiará de estas tecnologías; la secuenciación del genoma de un individuo o de una muestra tumoral, para identificar posibles mutaciones y anormalidades será crucial para identificar si una persona tiene una enfermedad en particular, o responde mejor o peor a un determinado tratamiento, seguido del desarrollo de terapias posteriores adaptadas a esa persona. En el ámbito de la investigación, la secuenciación masiva permite desarrollar técnicas de transcriptoma, que permiten analizar el conjunto de genes que se están expresando en un determinado momento, así como la intensidad de cada expresión. El transcriptoma acoplado a técnicas de cell sorting y/o a técnicas bioinformáticas de identificación clonal, permite analizar en profundidad la diversidad clonal de una muestra biológica.

Para acomodar un esfuerzo tan potente, la secuenciación debe avanzar y ser accesible a tecnologías de alto rendimiento no sólo por sus capacidades de alto rendimiento, sino también en términos de facilidad de uso, eficiencia de tiempo y costo, y accesibilidad de los clínicos a los instrumentos y reactivos.

La preparación de librerías (o genotecas) de alta calidad con alto rendimiento es un primer paso crítico en los flujos de trabajo y tiene un impacto directo en la calidad de los resultados de secuenciación masiva. Es importante considerar el objetivo primario de un experimento de secuenciación antes de tomar una decisión sobre el mejor protocolo de preparación de librerías.

La construcción de librerías es necesaria para la mayoría de las técnicas de secuenciación masiva, por ejemplo, pero sin limitarnos, la tecnología de secuenciación Polony (Dover Systems), secuenciación por plataformas de hibridación fluorescente (Complete Genomics), tecnología sTOP (Instituto de Investigación de Tecnología Industrial) y secuenciación por síntesis (lllumina, Life Technologies).

A día de hoy hay dos modelos principales de técnicas de secuenciación MPS: secuenciación por síntesis (SBS) que implica fragmentos cortos y Single-MoleculeReal- TimeSequencing (SMRT) que permite fragmentos de varias kilobases pero con mayor tasa de error. En el lado de los secuenciadores SBS, las dos tecnologías más asentadas son lllumina (detecta la adición de las bases una a una mediante fluoróforos) e Ion Torrent, que detecta grupos de bases iguales y que mide la señal mediante semiconductores que evalúan cambios de concentración de protones (pH). En cuanto a los secuenciadores de secuencias largas y detección en tiempo real de moléculas únicas, los dos exponentes principales son PacBio de Pacific Biosciences y Minlon de Oxford Nanopore. PacBio lee secuencias largas en tiempo real midiendo la emisión de luz del fluoró foro liberado tras la incorporación de cada nucleótido. Minlon detecta las bases de la secuencia midiendo cambios de corriente eléctrica en la membrana del poro a medida que pasa la secuencia de cadena simple del DNA.

Veamos más detalladamente en qué consiste cada técnica:

- Ion Torrent. La técnica de secuenciación de Ion Torrent inicia su procesamiento con una PCR en emulsión con microgotas (Nyrén, 1985) y usa semiconductores para detectar los H+ desprendidos en la incorporación de los dNTPs.

- Illumina. Una de las mayores aportaciones de la tecnología de secuenciación de Solexa - Illumina, es la PCR puente para la generación de clústeres, y el método de la terminación cíclica reversible para la secuenciación por síntesis. En cada ciclo, se une un dNTP marcado, se toma una fotografía y se retira para empezar de nuevo (Bentley, 2008).

Tanto Ion Torrent como Illumina, generan secuencias cortas. Illumina de 75 a 300 pares de bases; Ion Torrent hasta 400 (el modelo S5 llega a 650 pb). Si se necesitan lecturas más largas, los secuenciadores de Pacific Biosciences (Rhoads, 2015) y Oxford Nanopore Technologies (Haque, 2013) son capaces de producir lecturas que superan los 1.000 - 10.000 pares de bases. Estas tecnologías, facilitan la secuenciación de regiones del ADN que contienen alta cantidad de nucleótidos GC, y el alineamiento de secuencias que contienen repeticiones. Además, al no requerir un paso previo de amplificación por PCR, evitan los errores de la enzima polimerasa.

Todas las técnicas necesitan el paso previo de construcción de genotecas. Así, por ejemplo, los pasos básicos en la preparación de ARN o ADN para el análisis NGS en una platadorma de Illumina® son:

(i) fragmentación,

(ii) fijación de adaptadores e índices a los extremos de los fragmentos complementarios a plataformas Illumina®, y

(iii) en algunos casos, selección de fragmentos específicos para refinar el tamaño de la biblioteca, eliminando adaptadores u otros artefactos de la preparación de la biblioteca. Este es el procedimiento (fragmentación) que se emplea cuando se quiere secuenciar un genoma o transcriptoma a ciegas. La otra alternativa es la fabricación de una “librerías de amplicones” que parten de una PCR multiplex (con hasta 300 cebadores en la misma PCR). Ion Torrent ha desarrollado mucho más las librerías de amplicones y ha sacado numerosos kits al mercado. Los cebadores incorporan modificaciones químicas, de forma que tras la PCR multiplex (de pocos ciclos para minimizar sesgos de competencia entre cebadores) los cebadores y todos sus polímeros son digeridos y eliminados.

Formación de genotecas

Para la secuenciación después de MDA, se prepara, por ejemplo, una biblioteca de muestras amplificada creando una biblioteca de ADN como se describe en el kit de Mate Pair Library Prep, kits de Preparación de Muestras de ADN Genómico o kits de Preparación de Muestras TruSeq y Enriquecimiento Exorne (lllumina®, Inc. , San Diego CA). Las bibliotecas de ADN pueden inmovilizarse en una célula de flujo y una amplificación de puente realizada sobre los polinucleótidos inmovilizados antes de la secuenciación, por ejemplo secuencia por metodologías de síntesis. En la amplificación de puente, se híbrida un polinucleótido inmovilizado (por ejemplo, de una biblioteca de ADN) a un cebador de oligonucleótido inmovilizado. El extremo 3' de la molécula de polinucleótido inmovilizado proporciona la plantilla para una reacción de elongación dirigida por plantilla catalizada por polimerasa (por ejemplo, extensión de cebador) que se extiende desde el cebador oligonucleotídico inmovilizado. El producto de doble hebra resultante "puentea" los dos cebadores y ambas hebras están unidas covalentemente al soporte. En el ciclo siguiente, después de la desnaturalización que produce un par de hebras simples (la plantilla inmovilizada y el producto de cebador extendido) inmovilizadas al soporte sólido, ambas cadenas inmovilizadas pueden servir como plantillas para la extensión de un nuevo cebador. De este modo, la primera y segunda partes pueden amplificarse para producir una pluralidad de agrupaciones. Los grupos y colonias se usan indistintamente y se refieren a una pluralidad de copias de una secuencia de ácido nucleico y/o complementos de las mismas unidas a una superficie. Típicamente, el grupo comprende una pluralidad de copias de una secuencia de ácido nucleico y/o complementos de las mismas, unidas a través de sus extremos 5' a la superficie. La metodología de amplificación y agrupamiento de puentes ejemplares se describe, por ejemplo, en la Publicación de Patente

También pueden usarse métodos de PCR en emulsión para amplificar ácidos nucleicos antes de la secuenciación en combinación con métodos y composiciones como se describen en la presente memoria (tecnología que utiliza la plataforma Ion Torrent). La PCR en emulsión comprende la amplificación por PCR de una biblioteca de ADN al azar flanqueada con adaptador en una emulsión de agua en aceite. La PCR es una PCR multi-plantilla; sólo se utiliza un solo par de cebadores. Uno de los cebadores de PCR está atado a la superficie (unida por 5') de perlas de microescala. Una concentración de plantilla baja da como resultado que la mayoría de las microvesículas de emulsión que contienen perlas tengan presentes cero o una moléculas de plantilla. En las microvesículas de emulsión productiva (una microvesícula de emulsión en la que están presentes tanto una perla como una molécula plantilla), los amplicones de PCR pueden capturarse en la superficie de la perla. Después de romper la emulsión, las perlas que llevan productos de amplificación pueden enriquecerse selectivamente. Cada perla clonalmente amplificada soportará en su superficie productos de PCR correspondientes a la amplificación de una única molécula de la biblioteca de plantillas. Se establecen diversas realizaciones de métodos de PCR en emulsión en Dressman et al., (2003). Proc. Nati. Acad. Sci. USA 100: 8817-8822, Publicación de patente PCT. No. WO 05/010145, Publ. de patente de EE.UU. Nos. 2005/0130173, 2005/0064460, y U S2005/0042648.

El procedimiento de formación de genotecas puede llevar mucho tiempo, los productos a menudo se purifican de manera ineficaz y el resultado es que pueden producirse reacciones desconocidas que crean moléculas no deseadas y/o desconocidas unidas al ADN. Además, la purificación incompleta de la biblioteca (genoteca) puede dar como resultado etiquetas (el etiquetado es la identificación de cada muestra con una secuencia determinada en uno de los adaptadores) que producen contaminación cruzada durante las etapas de ligamiento, dando como resultado etiquetado erróneo. El resultado final para el examen y secuenciación de resultados positivos a partir de la biblioteca es que tiene emplearse secuenciación paralela de manera masiva debido al "ruido" inherente tanto de los ADN que se unen a moléculas que no se desean (por ejemplo, productos sin reaccionar o secundarios) como que están etiquetados de manera errónea. Por tanto, se pierde la eficacia de la secuenciación.

Actualmente, hay dos formas de fabricar librerías de secuenciación masiva:

Añadir los adaptadores mediante PCR y cebadores de fusión. Los adaptadores vienen incorporados en los extremos 5’ de cebadores de gran tamaño. Es un método exclusivo de librerías de amplicones. Exige conocer la secuencia de los extremos del DNA a secuenciar. Método artesanal difícil de poner a punto, debido al mal funcionamiento de los cebadores de gran tamaño en PCR.

Añadir los adaptadores mediante la reacción de ligación. Es el método más utilizado. Por ejemplo, es la base del Ion AmpliSeq Library Kit de la plataforma Ion Torrent, a lo que hay que sumar un kit para la PCR multiplex y el fungible de secuenciación masiva (aunque aquí se pueden juntar numerosas librerías si están correctamente“etiquetadas” o“multiplexadas”). Es un proceso costoso que lleva a cabo una reacción de ligación de extremos romos o, alternativamente, de un único nucleótido cohesivo (a partir de la adenina libre en 3’ que dejan varias DNA polimerasas, incluyendo la Taq-polimerasa). Los procedimientos basados en la digestión del cebador tras la PCR multiplex solo pueden usar ligaciones de extremos romos (la adenina libre es eliminada con la digestión del cebador incorporado en el amplicón).

Hay variantes de ligación sobre la molécula de cDNA (método SMART, por ejemplo).

Las "hebras a ser elongada" se añaden a los oligonucleótidos unidos a la nanopartícula por varios métodos. Por ejemplo, en el documento de patente W02015031691A1 se emplea la retrotranscripción a partir del extremo Poly(T) de un oligonucleótido unido a la partícula por su extremo 5’.

El método mostrado en la patente WO2015031691 A1 realiza una retrotranscripción elongando el extremo 3’ de los oligonucleótidos unidos a la partícula. De forma que estos adquieren en su extremo 3’ secuencias complementarias a las poblaciones de RNA mensajero (DNA copia). Si se quiere hacer posteriormente una librería de secuenciación masiva (como reivindica la patente W02015031691A1) a partir de los DNA copia unidos a la partícula, hay que añadirles adaptadores mediante reacciones de ligación, usando procedimientos habituales.

La reacción de ligación tiene varios inconvenientes:

• La DNA ligasa es lábil (caduca rápidamente, invalidando el kit).

• LA DNA ligasa es cara.

• La reacción de ligación tiene varios productos de reacción, de los cuales sólo uno es el correcto (el que une un adaptador diferente a cada extremo del DNA a secuenciar).

• La reacción de ligación introduce sesgos en función de la secuencia de los extremos a ligar. Los sesgos de ligación alteran las frecuencias iniciales de las secuencias en la muestra biológica. Se sobrevalorando ciertas secuencias e infravalorando otras.

• La reacción de ligación tiene una eficiencia muy baja que, además, se reduce drásticamente al incrementar el tamaño del DNA. Aparentemente, la reducida eficiencia no es un problema, porque tras la ligación se amplifica específicamente el producto deseado. Sin embargo, es la fuente de un importante“sesgo de muestreo”.

La baja eficiencia de la reacción de ligación y los sesgos en función de la secuencia son consecuencia de la estructura 3D que adopta la molécula de DNA. No hay que imaginarse el DNA como una molécula lineal, sino como una“madeja” en la que los extremos (que tienen que ligarse con los adaptadores) se“ocultan” con frecuencia en el interior del“ovillo”. Las estructuras 3D que adopta el DNA (y la probabilidad de ocultar los extremos) dependen del tamaño y de la secuencia.

Es necesario, por tanto, desarrollar un nuevo procedimiento para fabricar librerías (genotecas), útiles para las secuenciación paralela masiva, que minimicen la incorporación de sesgos.

BREVE DESCRIPCIÓN DE LA INVENCIÓN

La presente invención se refiere a métodos y composiciones relacionadas con la fabricación librerías y sus aplicaciones, especialmente en secuenciación de ácidos nucleicos de alto rendimiento y análisis genético.

En un primer aspecto de la invención se proporciona una partícula unida covalentemente a un oligonucleótido por su extremo 5’, de ahora en adelante partícula de la invención, donde la partícula se caracteriza porque: I) tiene un núcleo magnético,

II) tiene la superficie recubierta con compuestos orgánicos con grupos de carácter acido expuestos que le aportan carga negativa,

III) es estable a pH alcalino y ácido, en un rango amplio entre pH 2 y 14,

IV) tiene un reducido coeficiente de sedimentación y una reducida agregación, V) tienen un tamaño de entre 10Onm y 2000nm, preferiblemente en torno a 800nm,

VI) no inhibe la Taq polimerasa y puede usarse en reacciones de PCR,

Vil) La partícula es estable a temperaturas de hasta 100 °C.

En una realización preferida de este aspecto de la invención, el núcleo magnético es “magnético blando” (es decir, que solo tiene propiedades magnéticas en presencia de un campo magnético externo) pero podrían usarse núcleos “magnéticos duros” (magnéticos per se). Los núcleos magnéticos duros son menos recomendables.

En otra realización preferida de este aspecto de la invención, los compuestos orgánicos con grupos de carácter acido expuestos son grupos tiol o carboxilo, más preferiblemente carboxilo

En una realización preferida de la invención, el enlace del oligonucleótido a la partícula se da por el grupo amino de su extremo 5’, mediante un enlace con los grupos ácidos expuestos. Preferiblemente los grupos carboxilos expuestos son grupos carboxilo y el enlace es tipo amida.

El oligonucleótido debe de poder funcionar como un cebador o primer en una reacción de PCR o, en general, de polimerización del DNA.

Un segundo aspecto de la invención se refiere a un método para unir dos oligonucleótidos de cadena simple que comprende: a) unir uno de los oligonucleótidos a una partícula según se describe en el primer aspecto de la invención, para crear un oligonucleótido plantilla, b) añadir el otro oligonucleótido al extremo libre (3 ^') del oligonucleótido plantilla mediante cebadores de fusión, en presencia de Taq polimerasa, para hacer una elongación (de un solo ciclo) del oligonucleótido unido covalentemente a la partícula.

Como realización preferida, el método para unir dos oligonucleótidos de cadena simple según el tercer aspecto, adicionalmente comprende: c) realizar al menos un ciclo adicional de elongación, y d) eliminar la hebra unida a la macropartícula.

La eliminación de la hebra unida a la partícula puede realizarse mediante técnicas conocidas en el estado del arte, preferiblemente mediante desnaturalización (térmica o alcalina) se elimina la hebra de DNA no unida covalentemente a la partícula, mientras que la partícula retiene la hebra unida covalentemente que procede de la elongación del oligonucleótido unido a la partícula por 5’. Tras la desnaturalización, las partículas pueden sedimentarse, mediante un imán o cualquier otro método conocido, lo que permite la separación de ambas hebras. Un tercer aspecto de la invención recoge un método para obtener librerías de amplicones que comprende los pasos a), b), según como se indica en el segundo aspecto de la invención y opcionalmente los pasos (c) y (d) según se detalla en los aspectos anteriores, y adicionalmente, comprende: f) unir el otro de los oligonucleótidos (adaptadores) a una partícula según se describe en las reivindicaciones 1-2, y g) elongar la hebra en presencia de Taq polimerasa.

BREVE DESCRIPCIÓN DE LAS FIGURAS

Fig. 1. Ejemplo de unión de oligonucleótido a la partícula magnética. Puede unirse en forma de de hebra simple o hebra doble (en cuyo caso habría que eliminar la hebra no unida covalentemente mediante desnaturalización de DNA y sedimentación de partículas sobre un imán). La unión de hebra doble es preferible cuando se realiza la unión a la partícula mediante un grupo amino en la posición 5’. De esta forma se evita la unión (no buscada) mediante los grupos aminos de las bases nitrogenadas internas.

La figura es un esquema, no está a escala y hay que entender que numerosas moléculas de oligonucleótido se unen a la superficie de la partícula. En el esquema, los oligonucleótidos están representados mediante una “flecha”, cuya punta indica el extremo 3’. El linker de (CH3) _n (es recomendable su uso) se representa mediante una línea quebrada. El oligonucleótido unido a la partícula debe de ser capaz de funcionar en una reacción de PCR o elongación de DNA, como si fuese un cebador o primer.

Fig. 2. Tras funcionar en una reacción de PCR (multiplex o no) el cebador debe de haber elongado. Tras lo que se elimina la hebra no unida a la partícula mediante desnaturalización y sedimentación de partículas sobre imán. La figura es un esquema, no está a escala y hay que entender que numerosas moléculas de oligonucleótido se unen a la superficie de la partícula. En el esquema, las moléculas de DNA están representadas mediante una“flecha”, cuya punta indica el extremo 3’.

Fig. 3. Con el DNA de cadena simple unido a una partícula, se añade el adaptador mediante elongación del extremo 3’ usando un oligonucleótido de fusión. Este oligonucleótido porta en su extremo 3’ una secuencia de unión al extremo 3’ del DNA de cadena simple unido a la partícula y en su extremo 5’ porta una secuencia complementaria a uno de los adaptadores de la librería. El oligonucleótido de fusión puede portar un código de barrar.

Tras una pequeña incubación a 95°C (unos pocos minutos) con la intención de eliminar hibridaciones internas entre las moléculas, el oligonucleótido de fusión se incuba en presencia de Taq polimerasa a temperatura adecuada (preferiblemente en torno a 60 °C, aunque puede estar comprendida entre 40 y 75 °C). Pueden usarse simultáneamente amplias colecciones de oligonucleótidos de fusión, que difieren en su extremo 3’ y que son capaces de hibridar con la molécula de DNA de cadena simple unida a la partícula. Se incubarán en presencia de Taq polimerasa de sus sustratos y de tampón adecuado durante un periodo extendido (usualmente 20 minutos, aunque pueden usarse tiempos inferiores o superiores).

Preferiblemente, el cebador de fusión porta una modificación en 3’ que impide su elongación (aunque puede usarse sin esta modificación). De esta forma, la única elongación posible es la del DNA de cadena simple unido a la partícula. Se destaca que los oligonucleótidos de fusión no son cebadores o primers de PCR y, en consecuencia, no tienen que cumplir los requisitos de funcionamiento óptimo de cebadores. Se destaca que no es una reacción de PCR. No hay ciclos (aunque podría haberlos en alguna variante), no hay elongación del oligonucleótido de fusión y el oligonucleótido de fusión no tiene que competir por la hibridación con ninguna hebra complementaria al DNA unido a la partícula.

Tras la reacción de elongación, un paso de desnaturalización y lavado de las partículas sobre el imán permitirá la eliminación de cualquier hibridación no deseada sobre la hebra de DNA unida a la partícula. El único producto de reacción será la elongación de las hebras unidas a la partícula.

El otro adaptador de la genoteca puede incorporarse (al extremo unido a la partícula), mediante un procedimiento similar al descrito, trabajando sobre el DNA unido a la partícula o, preferiblemente, puede ir incorporado inicialmente en la secuencia del oligonucleótido originario (el que se unió covalentemente a la partícula por 5’).

La figura es un esquema, no está a escala y hay que entender que numerosas moléculas de DNA se unen a la superficie de la partícula. En el esquema, las moléculas de DNA están representadas mediante una“flecha”, cuya punta indica el extremo 3’.

Fig. 4. Amplificación de una región hipervariable de un material genético situado en tejido mediante PCR multiplex. Se observa la aparición aleatoria de artefactos de PCT, y un rendimiento escaso, solo asumióle con gran cantidad de DNA inicial. Fig. 5. Amplificación de una región hipervariable de un material genético situado en tejido mediante el método de la invención, uniendo el cebador sentido covalentemente a una nanopartícula magnética. La nanopartícula magnética puede ser fácilmente lavada tras la PCR multiplex, separando el producto deseado de los polímeros de cebadores sentido.

Fig. 6. librería de secuenciación masiva libre de partículas tras la fabricación de la librería, mediante una PCR convencional con cebadores frente a los extremos de los adaptadores, seguido de sedimentación magnética de las partículas.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN

La invención trata sobre un nuevo método para fabricar librerías, con tres ventajas:

• Se basa en Taq-polimerasa, enzima robusta y barata.

• No introduce sesgos de secuencia, al menos detectables mediante PCR a tiempo real.

• Eficiencia elevada (superior al 30 % en los experimentos iniciales de puesta a punto aunque puede incrementarse). En consecuencia, no introduce sesgos de muestreo.

La presente invención se refiere a métodos y composiciones relacionadas con la fabricación librerías y sus aplicaciones, especialmente en secuenciación de ácido nucleico de alto rendimiento y análisis genético.

En esta memoria el término“genoteca de secuenciación” o“librería de secuenciación genómica”, o simplemente “genoteca” o “librería” se refiere a una colección de fragmentos polinucleotidos con adaptadores específicos conectados.

Los adaptadores están diseñados para interactuar con una plataforma de NGS específica. La librería de secuenciación genómica dependerá (1) de la plataforma de secuenciamiento (Life Technologies, lllumina, Roche, Pacific Biosciences), de manera que los adaptadores empleados estarán diseñados para interactuar con una plataforma de NGS específica; y (2) del análisis planificado (secuenciación del genoma completo, secuenciación completa de exorna, secuenciación de una sección de ADN dirigida o amplicones, secuenciación del transcriptoma completo, secuenciación de RNA dirigido, ChIP-seq, RIP-seq, estudios epigenéticos, etc.). PARTÍCULA DE LA INVENCIÓN

En un primer aspecto de la invención se proporciona una partícula unida covalentemente a un oligonucleótido, de ahora en adelante partícula de la invención. El oligonucleótido puede actuar como cebador en una reacción de amplificación de DNA. La partícula de la invención se caracteriza porque:

I) tiene un núcleo magnético,

II) tiene la superficie recubierta con compuestos orgánicos con grupos de carácter acido expuestos que le aportan carga negativa,

III) es estable a pH alcalino y ácido, en un rango amplio entre pH 2 y 14, IV) tiene un reducido coeficiente de sedimentación y una reducida agregación,

V) tienen un tamaño de entre 100 nm y 2000 nm, preferiblemente entre 700 nm y 1500 nm, y más preferiblemente de aproximadamente 800 nm,

VI) no inhibe la Taq polimerasa y puede usarse en reacciones de PCR,

Vil) La partícula es estable a temperaturas de hasta 100 °C. En una realización preferida de este aspecto de la invención, el núcleo magnético es “magnético blando” (es decir, que solo tiene propiedades magnéticas en presencia de un campo magnético externo) pero podrían usarse núcleos “magnéticos duros” (magnéticos per se). Los núcleos magnéticos duros son menos recomendables.

En otra realización preferida de este aspecto de la invención, los compuestos orgánicos con grupos de carácter acido expuestos son grupos tiol o carboxilo, más preferiblmenete carboxilo

El oligonucleótido debe de poder funcionar como un cebador o primer en una reacción de PCR o, en general, de polimerización del DNA. Un segundo aspecto de la invención se refiere a un método para unir dos oligonucleótidos de cadena simple que comprende: a) unir uno de los oligonucleótidos a una partícula según se describe en el primer aspecto de la invención, para crear un oligonucleótido plantilla, b) añadir el otro oligonucleótido al extremo libre (3 ^') del oligonucleótido plantilla mediante cebadores de fusión, en presencia de Taq polimerasa, para hacer una elongación (de un solo ciclo).

Como realización preferida, el método para unir dos oligonucleótidos de cadena simple según el tercer aspecto, adicionalmente comprende: c) Realizar al menos un ciclo adicional de elongación, y d) eliminar la hebra unida a la macropartícula.

Un tercer aspecto de la invención recoge un método para obtener librerías de amplicones que comprende los pasos a), b), según como se indica en el segundo aspecto de la invención y opcionalmente los pasos (c) y (d) según se detalla en los aspectos anteriores, y adicionalmente, comprende: f) unir el otro de los oligonucleótidos (adaptadores) a una partícula según se describe en las reivindicaciones 1-2, y g) elongar la hebra en presencia de Taq polimerasa.

En esta memoria se entiende por“librería” o más exactamente“librería de secuenciación paralela masiva”, una colección de secuencias de DNA (destinadas a ser secuenciadas masivamente) a las que se les ha añadido en cada uno de los extremos dos adaptadores diferentes. Los adaptadores son secuencias concretas de DNA propias de cada plataforma de secuenciación masiva. Por ejemplo, los adaptadores de Ion Torrent son de más de 40 pb (los de lllumina son algo más pequeños). La“bridge PCR” de lllumina o la PCR en emulsión de Ion Torrent reconocen los adaptadores para individualizar secuencias, realizar una amplificación clonal y, finalmente, secuenciar cada uno de las amplificaciones clónales.

Uno de los adaptadores puede llevar un “código de barras” (del inglés “bar code”, proceso conocido como“etiquetado”). El código de barras es una pequeña secuencia identificadora de la librería (9 nucleótidos en Ion Torrent). De esta forma, pueden mezclarse (en la misma secuenciación) librerías procedentes de muestras diferentes, cada una de ellas con un código de barras propio y reconocible durante el análisis informático. A esto se le llama también“secuenciación multiplex” (no confundir con la PCR multipex).

Los ácidos nucleicos o polinucleótidos para la secuenciación incluyen, pero no se limitan a, ácidos nucleicos tales como ADN, ARN o PNA (ácido nucleico peptídico), variantes o fragmentos de los mismos y/o concatámeros de los mismos. Los polinucleótidos pueden ser de una secuencia conocida o desconocida, de naturaleza natural o artificial y pueden ser de cualquier fuente (por ejemplo, eucariotas o procariotas). Los polinucleótidos pueden derivarse naturalmente, producirse recombinantemente o sintetizarse químicamente. Los polinucleótidos concatamerizados pueden contener subunidades o análogos de los mismos que pueden o no pueden producirse en la naturaleza, o subunidades modificadas. Pueden usarse métodos como se describe en este documento para determinar una secuencia de un polinucleótido. La longitud del ácido nucleico diana para la secuenciación puede variar. Por ejemplo, el ácido nucleico para la secuenciación puede incluir al menos 10, al menos 20, al menos 30, al menos 40, al menos 50, al menos 100, al menos 200, al menos 500, al menos 1.000, al menos 10.000, al menos 100.000, al menos 1.000.000, al menos 10.000.000 nucleótidos. El polinucleótido para la secuenciación puede ser de origen genómico o fragmentos o variantes de los mismos. La cadena de ácido nucleico para la secuenciación puede ser de cadena sencilla y puede o no derivarse de una molécula de ácido nucleico bicatenario. Las moléculas de cadena sencilla también pueden producirse, por ejemplo, mediante métodos y tecnologías de síntesis química o in vitro. Las realizaciones como se describen en la presente memoria descriptiva no están limitadas por los métodos preparatorios del ácido nucleico y cualquier número de métodos puede ser practicado por los expertos en la técnica para proporcionar una composición para uso en los métodos descritos. Por ejemplo, en la secuencia mediante metodologías de síntesis a menudo se genera una biblioteca que comprende los ácidos nucleicos diana, y después se secuencia una parte de la biblioteca de ADN.

El ADN aislado de muestras, por ejemplo muestras que contienen ADN genómico, se modifica típicamente antes de la caracterización, por ejemplo mediante secuenciación utilizando métodos como los que se describen en la presente memoria. Se crean bibliotecas de ADN genómico (o librerías) que pueden secuenciarse mediante la práctica de los métodos descritos en la presente memoria.

La invención descrita puede sustituir numerosos kits comerciales basados en unión de adaptadores mediante DNA-ligasa, aportando, adicionalmente, notables ventajas técnicas.

El término anclaje o la expresión oligonucleótido de anclaje según aquí se utiliza, se refiere a un oligonucleótido que se puede acoplar a una matriz sólida a través de una modificación en su extremo 5’.

Preferiblemente, el oligonucleótido unido a la superficie de la partícula tiene un grupo amino en el extremo 5’. Alternativamente, puede tener un grupo thiol. Entre el nucleótido del extremo y el grupo amino hay preferiblemente un“linker” de hasta 50 carbonos (CH3) _n. Aunque es recomendable, es posible usar oligonucleótidos sin“linker”.

El término esplínquer o la expresión oligonucleótido esplínquer, según aquí se utiliza, se refiere a un oligonucleótido que no posee ninguna modificación ni presenta ningún otro tipo de modificación y que por consiguiente no se une por sí mismo a la matriz a la que los oligonucleótidos de anclaje se acoplan.

El término dumbbell (forma de pesa), según aquí se utiliza, se refiere a una estructura de DNA que se caracteriza por una doble cadena que está flanqueada por dos bucles.

Uno de los dos oligonucleótidos que se han de ligar en cada una de las etapas de reacción (el denominado oligonucleótido de anclaje), se puede acoplar a una matriz sólida a través de una modificación, p. ej., un compuesto químico de bajo peso molecular tal como biotina o digoxigenina. En una realización preferida, estas matrices sólidas son bolitas magnéticas recubiertas con estreptavidina o recubiertas con anti- digoxigenina. El otro oligonucleótido (el denominado oligonucleótido esplínquer) tiene también un extremo bloqueado pero no lleva una modificación de ese tipo ni lleva otro tipo de modificación. El punto decisivo es que los oligonucleótidos de anclaje se puedan separar de los oligonucleótidos esplínquer mediante unión a una matriz adecuada. Así pues, compuestos como p. ej. biotina, digoxigenina, isotiocianato de fluoresceína (FITC) , compuestos amino, ésteres de succinilo y otros compuestos familiares para el experto en la técnica, se pueden usar con la condición de que sean adecuados para mediar una unión directa o indirecta (p. ej. , a través de un anticuerpo) a una fase sólida.

Los oligonucleótidos de anclaje pueden estar compuestos, o por un oligonucleótido único, parcialmente autocomplementario, que se puede acoplar a una fase sólida a través de una modificación situada preferiblemente en la secuencia del bucle, o por dos oligonucleótidos monocatenarios que forman una doble cadena que preferiblemente tiene un solo extremo protuberante monocatenario. Debido a que solamente una de las dos cadenas se ha de acoplar a la matriz, la otra cadena se puede desnaturalizar y separar, en caso necesario, mediante tratamiento con álcali o con calor (con el fin, por ejemplo, de que sirva como molde para una reacción de PCR). Con el fin de tener la seguridad de que también en el caso de esos oligonucleótidos de anclaje bipartitos sólo uno de los extremos se puede ligar, los extremos que no se requieren para la ligación se bloquean en conformidad a ello.

Por "oligonucleótido iniciador" quiere decirse el oligonucleótido de partida para la síntesis de la biblioteca que también contiene un ligador unido covalentemente y un resto funcional para la adición de un nodo de diversidad o estructura de soporte. El oligonucleótido puede ser mono o bicatenario. El oligonucleótido puede consistir en bases naturales o modificadas.

Por "resto funcional" quiere decirse un resto químico que comprende uno o más elementos estructurales que pueden seleccionarse de cualquier molécula pequeña o diseñarse y construirse basándose en características deseadas, por ejemplo, de solubilidad, disponibilidad de donadores y aceptores de enlaces de hidrógeno, grados de libertad rotacionales de los enlaces, carga positiva, carga negativa y similares. El resto funcional debe ser compatible con la modificación química de manera que reacciona con la parte anterior. En determinadas realizaciones, el resto funcional puede hacerse reaccionar adicionalmente como una entidad bifuncional o trifuncional (o mayor). Los restos funcionales también pueden incluir elementos estructurales que se usan en cualquiera de las posiciones o nodos de diversidad.

Por "ligador" quiere decirse una molécula que une la parte de ácido nucleico de la biblioteca a las especies presentadas funcionales. Tales ligadores se conocen en la técnica, y los que pueden usarse durante la síntesis de la biblioteca incluyen, pero no se limitan a, 5'-0-dimetoxitritiM',2'-didesoxirribosa-3'-[(2-cianoetil)-(N ,N-diisopropil)]- fosforamidita; 1-[(2-cianoetil)-(N,N-diisopropil)]-fosforamidita de 9-O-dimetoxitritil- trietilenglicol; 3-(4,4'- dimetoxitritiloxi)propil-1 -[(2-cianoetil)-(N, N-diisopropil)]- fosforamidita; y 1-[(2-cianoetil)-(N,N-diisopropil)]-fosforamidita de 18-0- dimetoxitritilhexaetilenglicol. Tales ligadores pueden añadirse en tándem entre sí en diferentes combinaciones para generar ligadores de diferentes longitudes deseadas. Por "ligador ramificado" quiere decirse una molécula que une la posición de ácido nucleico de la biblioteca a 2 o más especies funcionales idénticas de la biblioteca. Los ligadores ramificados se conocen bien en la técnica y los ejemplos pueden consistir en dobletes simétricos o asimétricos (1) y (2) o un triplete asimétrico (3). Véanse, por ejemplo, Newcome et al., Dendritic Molecules: Concepts, Synthesis, Perspectives, VCH Publishers (1996); Boussif et al., Proc. Nati. Acad. Sci. USA 92: 7297-7301 (1995); y Jansen et al., Science 266: 1226 (1994).

Tal como se usa en el presente documento, el término "oligonucleótido" se refiere a un polímero de nucleótidos. El oligonucleótido puede incluir ADN o cualquier derivado del mismo conocido en la técnica que puede sintetizarse y usarse para el reconocimiento de pares de bases. El oligonucleótido no tiene que tener bases contiguas, sino que puede presentar restos de ligador intercalados. El polímero oligonucleotídico puede incluir nucleósidos naturales (por ejemplo, adenosina, timidina, guanosina, citidina, uridina, desoxiadenosina, desoxitimidina, desoxiguanosina y desoxicitidina), análogos de nucleósido (por ejemplo, 2-aminoadenosina, 2-tiotimidina, inosina, pirrolo-pirimidina, 3- metiladenosina, C5-propinilcitidina, C5-propiniluridina, C5-bromouridina, C5- fluorouridina, C5-yodouridina, C5- metilcitidina, 7-desazaadenosina, 7- desazaguanosina, 8-oxoadenosina, 8-oxoguanosina, 0(6)-metilguanina y 2- tiocitidina), bases modificadas químicamente, bases modificadas biológicamente (por ejemplo, bases metiladas), bases intercaladas, azúcares modificados (por ejemplo, 2'- fluororribosa, ribosa, 2'-desoxirribosa, arabinosa y hexosa) y/o grupos fosfato modificados (por ejemplo, enlaces fosforotioatos y 5'-N-fosforamidita).

Por "unido operativamente" quiere decirse que dos estructuras químicas se unen entre sí de tal manera que permanecen unidas a través de las diversas manipulaciones a las que se espera que se sometan. Normalmente, el resto funcional y el oligonucleótido codificante se unen covalentemente a través de un grupo de unión apropiado. Por ejemplo, el grupo de unión puede ser un resto bifuncional con un sitio de unión para el oligonucleótido codificante y un sitio de unión para el resto funcional.

La unión entre el extremo 5’ del oligonucleótido y la superficie de la partícula debe de realizarse mediante un enlace covalente. Prefriblemente existen dos opciones: un enlace amida (tal como se muestra en los ejemplos de la invención) o enlaces basados en grupos tiol como el enlace disulfuro.

Los métodos que se describen en la presente memoria descriptiva no están limitados por ningún método de preparación de muestras de secuenciación particular y las alternativas serán fácilmente evidentes para cualquier experto en la técnica y se consideran dentro del alcance de la presente descripción.

En algunas realizaciones, los métodos expuestos en la presente memoria pueden usarse en una versión modificada de los protocolos del fabricante en un sistema tal como los proporcionados por lllumina®, Inc. (sistemas HiSeq 1000, HiSeq 1000, Genome Analyzers, MiSeq, HiScan, ¡Sean, BeadExpress), Applied Biosystems Life Technologies (sistemas de detección de secuencias ABI PRISM®, SOLiD System), u otros instrumentos de secuenciación basados en fluorescencia, además de los descritos en, por ejemplo, las patentes de EE.UU. y las solicitudes de patentes 5.888.737, 6.175.002, 5.695.934, 6.140.489, 5.863.722, 2007/007991 , 2009/0247414,

2010/01 11768 y la solicitud de patente PCT W02007/123744, y WO2012/096703. Las modificaciones a los métodos comerciales pueden incluir, pero no se limitan a, la alteración de los marcadores utilizados y la adición de etapas para cambiar los estados del marcador como se expone en este documento.

La salida de un instrumento de secuenciación puede ser de cualquier tipo. Por ejemplo, la tecnología actual utiliza típicamente una salida legible generadora de luz, tal como fluorescencia o luminiscencia, sin embargo los presentes métodos no están limitados al tipo de salida legible mientras las diferencias en la señal de salida para una secuencia particular de interés sean potencialmente determinables. Ejemplos de software de análisis que pueden usarse para caracterizar la salida derivada de la práctica de métodos tal como se describen en este documento incluyen, pero no se limitan a, el software de análisis de datos Pipeline, CASAVA y GenomeStudio (lllumina®, Inc.), SOLiD, DNASTAR® SeqMan® NGen® y el software de análisis de datos Partek® Genomics Suite (Life Technologies), el software de análisis de datos Feature Extraction and Agilent Workbench (Agilent Technologies), Genotyping Consolé, el software de análisis de datos Chromosome Analysis Suite (Affymetrix®).

Cualquier experto en la materia conocerá otras numerosas alternativas de software comercial y académicamente disponibles para el análisis de datos para la producción generada por secuenciación. Las realizaciones descritas en la presente memoria descriptiva no están limitadas a ningún método de análisis de datos.

EJEMPLOS DE LA INVENCIÓN

Fabricación de genotecas (o librerías) de secuenciación masiva sin sesgos asociados a la ligación que contienen variantes de un gen en frecuencias idénticas a las de la muestra de origen. Se quiere obtener una librería de un material genómico hipervariable del mismo individuo que se encuentra en una célula concreta dentro de un tejido. La librería debe de partir de una amplificación con numerosos de cebadores en sentido y un único cebador antisentido. La PCR con multitud de cebadores se denomina PCR multiplex. Las PCRs multiplex tienen el inconveniente de general una amplia cantidad de polímeros decebadores. En sangre, el material genético es abundante y la PCR multiplex puede dar amplificaciones efectivas. Sin embargo, en tejido, el material genético está diluido entre el material procedente del resto de las células del tejido, por lo que no puede competir efectivamente con los polímeros de cebadores.

Siguiendo el método de la invención realizamos una PCR multiplex uniendo covalentemente el cebador común a todas las variantes mediante un enlace covalente en 5’. Este cebador porta, además, en 5’, la secuencia de uno de los adaptadores de la librería de secuenciación masiva.

La unión de hebra doble es preferible cuando se realiza la unión a la partícula mediante un grupo amino en la posición 5’. De esta forma se evita la unión (no buscada) mediante los grupos aminos de las bases nitrogenadas internas. Tras la unión, un tratamiento alcalino y lavado sobre imán, elimina la hebra no unida covalentemente a la partícula. Las partículas magnéticas portan en su superficie todas las variantes de la hipervariable diana que se encuentra en las células del tejido. Trabajando sobre ellas, se añade el otro adaptador en 3’. Tras funcionar en una reacción de PCR se elimina la hebra no unida a la partícula mediante desnaturalización en solución alcalina y sedimentación de partículas sobre imán. La figura es un esquema, no está a escala y hay que entender que numerosas moléculas de oligonucleótido se unen a la superficie de la partícula.

Con el DNA de cadena simple unido a una partícula, se añade el adaptador mediante elongación del extremo 3’ usando un oligonucleótido de fusión. Este oligonucleótido porta en su extremo 3’ una secuencia de unión al extremo 3’ del DNA de cadena simple unido a la partícula (en el ejemplo es una secuencia aleatoria, aunque funciona con una colección de cebadores) y en su extremo 5’ porta una secuencia complementaria a uno de los adaptadores de la librería. El oligonucleótido de fusión puede portar un código de barrar.

Tras la fabricación de la librería, mediante una PCR convencional con cebadores frente a los extremos de los adaptadores, seguido de sedimentación magnética de las partículas, se obtiene una librería de secuenciación masiva libre de partículas.

Se ha comprobado que no hay sesgos detectables, al menos según el umbral de detección de la técnica de PCR a tiempo real. Las frecuencias de las diferentes variantes presentes en la librería final son idénticas a la frecuencia observada en el cDNA de partida.

La Fig. 4 muestra el resultado de la amplificación de la región hipervariable empleando la PCR multiplex del cDNA, de manera convencional. La Fig. 5 y la Flg. 6 corresponden a los resultados obtenidos siguiendo el método de la invención.

Previous Patent: MACHINE FOR TESTING SPECIMENS HAVING A SURFACE WITH A NON-STICK COATING

Next Patent: APPARATUS, DEVICE AND COMPUTER IMPLEMENTED METHOD FOR DETERMINING REMAINING LIFE OF ENGINE OIL IN EN...