Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
NUCLEIC ACID MOLECULE, FUSION PROTEIN AND METHOD FOR ALTERING THE GENETIC MATERIAL OF A CELL
Document Type and Number:
WIPO Patent Application WO/2016/203088
Kind Code:
A1
Abstract:
The invention relates to a nucleic acid molecule encoding a fusion protein, said nucleic acid molecule comprising, in transcription direction 5´---3´, at least: one nucleic acid sequence encoding a DNA-binding domain; and a nucleic acid sequence encoding a FokI-type catalytic domain, the 3' end thereof comprising a nucleic acid sequence encoding a peptide comprising between 18 and 23 amino acids. The invention also relates to a fusion protein that can be obtained, for example, from the transcription of said molecule, and to a method for altering the genetic material of a cell using said molecule or protein.

Inventors:
GAINZA LAFUENTE EUSEBIO JESÚS (ES)
GAINZA LUCEA GARAZI (ES)
DEL POZO PEREZ ANGEL (ES)
PASTOR NAVARRO MARTA (ES)
PEDRAZ MUÑOZ JOSÉ LUIS (ES)
VIÑAS CIORDIA MIGUEL (ES)
BACHILLER PEREZ DANIEL (ES)
GALVEZ JEREZ VICTOR (ES)
Application Number:
PCT/ES2016/070459
Publication Date:
December 22, 2016
Filing Date:
June 17, 2016
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
BIOPRAXIS RES AIE (ES)
CONSEJO SUPERIOR DE INVESTIG CIENTÍFICAS (ES)
FUNDACIÓ D'INVESTIGACIÓ SANITÀRIA DE LES ILLES BALEARS (ES)
UNIV DEL PAIS VASCO/EUSKAL HERRIKO UNIBERTSITATEA (ES)
UNIV BARCELONA (ES)
International Classes:
C12N9/22; C12N15/62; C12N15/90
Domestic Patent References:
WO2013152220A22013-10-10
WO2012015938A22012-02-02
WO2011146121A12011-11-24
WO2012015938A22012-02-02
Foreign References:
EP2510096A22012-10-17
Other References:
NICHOLAS J BALTES: "PLANT GENOME ENGINEERING WITH SEQUENCE-SPECIFIC NUCLEASES: METHODS FOR EDITING DNA IN WHOLE PLANTS", PH. D. THESIS, 1 January 2014 (2014-01-01), pages i-xii, 1 - 176, XP055290136, Retrieved from the Internet [retrieved on 20160720]
ANDREW MARIANO ET AL: "Highly efficient genome editing via 2A-coupled co-expression of two TALEN monomers", BMC RESEARCH NOTES, BIOMED CENTRAL LTD, GB, vol. 7, no. 1, 10 September 2014 (2014-09-10), pages 628, XP021198051, ISSN: 1756-0500, DOI: 10.1186/1756-0500-7-628
LI XU ET AL: "Targeted Myostatin Gene Editing in Multiple Mammalian Species Directed by a Single Pair of TALE Nucleases", MOLECULAR THERAPY - NUCLEIC ACIDS, vol. 2, no. 7, 30 July 2013 (2013-07-30), pages e112, XP055184659, ISSN: 2162-2531, DOI: 10.1038/mtna.2013.39
LENGLER J ET AL: "FMDV-2A sequence and protein arrangement contribute to functionality of CYP2B1-reporter fusion protein", ANALYTICAL BIOCHEMISTRY, ACADEMIC PRESS INC, NEW YORK, vol. 343, no. 1, 25 May 2005 (2005-05-25) - 1 August 2005 (2005-08-01), pages 116 - 124, XP027200085, ISSN: 0003-2697, [retrieved on 20050712]
"FDMV-2A sequence and protein arrangement contribute to functionality of CYP281- reporter fusión protein", ANAL BIOCHEM, vol. 343, no. 1, 2005, pages 116 - 24
Attorney, Agent or Firm:
IGARTUA IRIZAR, Ismael (ES)
Download PDF:
Claims:
REIVINDICACIONES

1. Molécula de ácido nucleico que codifica una proteína de fusión, comprendiendo la molécula de ácido nucleico en sentido 5'— 3' de transcripción al menos:

(a) una secuencia de ácido nucleico que codifica un dominio de unión al ADN, y

(b) una secuencia de ácido nucleico que codifica un dominio catalítico del tipo Fokl, en donde en su extremo 3' comprende una secuencia de ácido nucleico que codifica un péptido que comprende entre 18 y 23 aminoácidos.

2. Molécula de ácido nucleico según la reivindicación 1 , en donde el péptido es un péptido del tipo 2A.

3. Molécula de ácido nucleico según la reivindicación 2, en donde el dominio de unión al ADN es del tipo TALE.

4. Molécula de ácido nucleico según la reivindicación 3, en donde en sentido 5'— 3' de transcripción:

(a) la secuencia de ácido nucleico que codifica el dominio de unión al ADN comprende un primer segmento de entre 150 y 600 pares de bases, preferiblemente entre 470 y 550 pares de bases, que codifican el extremo N-terminal de una proteína TALE y una señal de localización nuclear, un segundo segmento de entre 1100 y 2900 pares de bases que codifican el dominio de unión del tipo TALE al ADN, y un tercer segmento de entre 40 y 850 pares de bases que codifican el extremo C- terminal de la proteína TALE, y

(b) la secuencia de ácido nucleico que codifica el dominio catalítico del tipo Fokl comprende un primer segmento de entre 550 y 600 pares de bases, preferiblemente de entre 590 y 600 pares de bases, que codifican el dominio catalítico del tipo Fokl seguido de un segmento de entre 50 y 70 pares de bases, preferiblemente de 69 pares de bases, que codifica el péptido que comprende entre 18 y 23 aminoácidos, preferiblemente de 21 aminoácidos.

5. Molécula de ácido nucleico según la reivindicación 4, en donde el péptido es del tipo T2A y comprende una secuencia SEQ ID NO: 1.

6. Molécula de ácido nucleico según cualquiera de las reivindicaciones anteriores, en donde en sentido 5'— 3' de transcripción a continuación de la secuencia de ácido nucleico que codifica el péptido que comprende entre 18 y 23 aminoácidos, comprende una secuencia de ácido nucleico que codifica una proteína identificadora de la transcripción.

7. Molécula de ácido nucleico según la reivindicación 6, en donde la secuencia de ácido nucleico que codifica la proteína identificadora de la transcripción comprende entre 700 y 1000 pares de bases, y la proteína identificadora de la transcripción es una proteína fluorescente.

8. Molécula de ácido nucleico según cualquiera de las reivindicaciones anteriores, en donde el ácido nucleico es una molécula de ácido desoxirribonucleico o una molécula de ácido ribonucleico.

9. Molécula de ácido nucleico según cualquiera de las reivindicaciones anteriores, en donde dicha molécula forma un gen monocistrónico o un gen policistrónico.

10. Proteína de fusión que comprende en sentido N-terminal a C-terminal al menos un dominio de unión al ADN y al menos un dominio catalítico del tipo Fokl, en donde dicho dominio catalítico del tipo Fokl tiene unido a su extremo C-terminal un péptido que comprende entre 18 y 23 aminoácidos.

1 1. Proteína de fusión según la reivindicación 10, en donde el dominio de unión al ADN es del tipo TALE.

12. Proteína de fusión según la reivindicación 10 o 1 1 , en donde el péptido es un péptido 2A, preferiblemente un péptido del tipo T2A.

13. Proteína de fusión según cualquiera de las reivindicaciones 10 a 12, en donde el péptido comprende una secuencia SEQ ID NO: 1.

14. Método para modificar el material genético de una célula, que comprende las etapas de:

(i) proporcionar una célula que contiene una secuencia de nucleótidos diana de ADN, e (ii) introducir en dicha célula al menos una molécula de ácido nucleico según cualquiera de las reivindicaciones 1 a 9, o al menos una molécula de ácido nucleico que codifica al menos una proteína de fusión según cualquiera de las reivindicaciones 10 a 13, e inducir la expresión de dicha al menos una molécula de ácido nucleico, o

(iii) introducir en dicha célula al menos una proteína de fusión según cualquiera de las reivindicaciones 10 a 13,

de tal manera que el dominio de unión reconoce la secuencia de nucleótidos diana y el dominio catalítico del tipo Fokl puede cortar en una secuencia de nucleótidos adyacente a la secuencia de nucleótidos diana.

15. Método según la reivindicación 14, en donde se introduce al menos una molécula de ácido nucleico según la reivindicación 6 o 7, en donde la molécula de ácido nucleico comprende una secuencia de ácido nucleico que codifica una proteína fluorescente.

16. Método según la reivindicación 14, en donde se introducen al menos dos moléculas de ácido nucleico según la reivindicación 6 o 7, en donde cada molécula de ácido nucleico comprende una secuencia de ácido nucleico que codifica una proteína fluorescente teniendo cada proteína fluorescente un espectro de emisión diferente.

17. Método según la reivindicación 15 o 16, en donde las células a las que se les ha modificado el material genético se identifican y seleccionan en base a la fluorescencia emitida por dichas células.

18. Método según la reivindicación 17, en donde las células seleccionadas se amplifican en cultivo y se les vuelve a introducir la molécula de ácido nucleico o las moléculas de ácido nucleico, y en donde las células a las que se les ha vuelto a modificar el material genético se identifican y se seleccionan en base a la fluorescencia emitida por dichas células.

19. Método según cualquiera de las reivindicaciones 14 a 18, en donde el material genético se introduce en dicha célula por un sistema de vector viral y/o por un sistema de vector no viral.

20. Método según cualquiera de las reivindicaciones 14 a 19, en donde la secuencia de nucleótidos diana está en el gen humano CCR5, el cual codifica un correceptor de membrana presente en linfocitos T del virus de la inmunodeficiencia humana (VIH).

21. Método según la reivindicación 20, en donde la modificación del material genético del linfocito T da lugar a la eliminación y/o inactivación del correceptor de membrana.

22. Composición terapéutica que comprende al menos una molécula de ácido nucleico según cualquiera de las reivindicaciones 1 a 9, al menos una proteína de fusión según cualquiera de las reivindicaciones 10 a 13 o al menos una célula modificada genéticamente según cualquiera de las reivindicaciones 14 a 21.

23. Composición terapéutica según la reivindicación 22 para el tratamiento de enfermedades hereditarias.

24. Composición terapéutica según la reivindicación 22 para su uso en el tratamiento del SIDA.

Description:
DESCRIPCIÓN

Molécula de ácido nucleico, proteína de fusión y método para modificar el material genético de una célula

SECTOR DE LA TÉCNICA

La presente invención se relaciona con herramientas moleculares que permiten modificar el material genético de una célula.

ESTADO ANTERIOR DE LA TÉCNICA

Durante los últimos años han aparecido nuevos tipos de herramientas moleculares que permiten modificar el material genético de las células. A modo de ejemplo, las herramientas tales como "Zinc Finger" nucleasas, las CRISPR/Cas9 o las TALENs han supuesto una revolución tecnológica en este campo ya que todas ellas son capaces de cortar la doble hélice de ADN en secuencias específicas del genoma, lo que abre la posibilidad real de modificar a voluntad la información genética de células vivas. Estas herramientas, también conocidas como nucleasas específicas de secuencia, se caracterizan por tener un dominio de unión al ADN y otro dominio catalítico que cortan en una secuencia adyacente a la secuencia reconocida por el dominio de unión.

Han sido numerosos los esfuerzos en mejorar la eficacia y la especificidad de dichas herramientas en las técnicas de edición genómica dirigida. A modo de ejemplo, EP2510096 A1 describe una TALEN que mejora la selectividad de corte y WO2012015938 A2 describe nuevas variantes de dominios del tipo Fokl con al menos una mutación en alguno de los residuos de aminoácidos respecto al tipo silvestre.

La modificación de una secuencia peptídica mediante la adición de una secuencia que codifica entre 18 y 23 aminoácidos crea una proteína distinta que puede resultar inerte o tener características funcionales distintas a las proteínas de partida. De hecho, se han descrito casos en los que la adición de péptidos 2A en el extremo C ' terminal de una proteína ha provocado su inactivación. A modo de ejemplo, alguna de las estructuras descritas en Anal Biochem, 2005.343 (1):p.1 16-24 "FDMV-2A sequence and protein arrangement contribute to functionality of CYP2B1- repórter fusión protein". EXPOSICIÓN DE LA INVENCIÓN

El objeto de la invención es el de proporcionar una molécula de ácido nucleico, una proteína de fusión y un método para modificar el material genético de una célula, según se define en las reivindicaciones.

Un aspecto de la invención se refiere a una molécula de ácido nucleico que codifica una proteína de fusión, comprendiendo la molécula de ácido nucleico en sentido 5 ' — 3 ' de transcripción al menos:

(a) una secuencia de ácido nucleico que codifica un dominio de unión al ADN, y

(b) una secuencia de ácido nucleico que codifica un dominio catalítico del tipo Fokl, en donde en su extremo 3 ' comprende una secuencia de ácido nucleico que codifica un péptido que comprende entre 18 y 23 aminoácidos.

Otro aspecto de la invención se refiere a una proteína de fusión que comprende en sentido N-terminal a C-terminal al menos un dominio de unión al ADN y al menos un dominio catalítico del tipo Fokl, en donde dicho dominio catalítico del tipo Fokl tiene unido a su extremo C-terminal un péptido que comprende entre 18 y 23 aminoácidos.

Otro aspecto de la invención se refiere a un método para modificar el material genético de una célula, que comprende las etapas de:

(i) proporcionar una célula que contiene una secuencia de nucleótidos diana de ADN, e

(ii) introducir en dicha célula al menos dicha molécula de ácido nucleico, o al menos una molécula de ácido nucleico que codifica al menos dicha proteína de fusión, e inducir la expresión de dicha al menos una molécula de ácido nucleico, o

(iii) introducir en dicha célula al menos una dicha proteína de fusión de tal manera que el dominio de unión reconoce la secuencia de nucleótidos diana y el dominio catalítico del tipo Fokl puede cortar en una secuencia de nucleótidos adyacente a la secuencia de nucleótidos diana.

La presencia de un nuevo elemento en el extremo C-terminal del dominio Fokl supone aproximadamente un 20% de incremento en el tamaño de dicho dominio. Los estudios realizados por los inventores han demostrado que esta modificación mejora la eficacia de corte de Fokl. La molécula de ácido nucleico o la proteína de fusión de la invención pueden ser útiles en el tratamiento de enfermedades hereditarias, en particular de enfermedades hereditarias monogénicas. Por tanto, otro aspecto de la invención se dirige a la molécula de ácido nucleico o la proteína definida anteriormente o la célula modificada según el método definido anteriormente, para su uso como medicamento o una composición terapéutica.

Otro aspecto de la invención se dirige a un método de tratamiento y/o prevención de una enfermedad, preferentemente en el sistema inmunitario, preferentemente causadas por el VIH y/o especies afines, o de una enfermedad hereditaria monogénica y que comprende administrar una cantidad terapéuticamente efectiva de la molécula de ácido nucleico o la proteína de fusión definida anteriormente o de la célula modificada según el método definido anteriormente, junto con excipientes o portadores farmacéuticamente aceptables, en un sujeto en necesidad de ese tratamiento y/o prevención, incluyendo un humano.

Estas y otras ventajas y características de la invención se harán evidentes a la vista de las figuras y de la descripción detallada de la invención.

DESCRIPCIÓN DE LOS DIBUJOS

La figura 1 muestra un diagrama de un gen bicistrónico que comprende un molécula de ácido ribonucleico según una realización de la invención.

La figura 2 muestra un diagrama de un gen tricistrónico que comprende un molécula de ácido ribonucleico según una realización de la invención.

La figura 3 muestra la estructura de las proteínas producidas a partir del gen bicistrónico de la figura 1.

La figura 4 muestra el mecanismo de acción de las proteínas producidas a partir del gen bicistrónico de la figura 1.

La figura 5 muestra los resultados del ejemplo 2 de la actividad de una proteína de fusión de la invención respecto a la actividad de una proteína del estado de la técnica.

La figura 6 muestra un diagrama de dispersión de células transfectadas con dos proteínas de fusión según una realización del ejemplo 3. La figura 7 muestra la actividad de las proteínas de fusión y selección por fluorescencia según una realización del ejemplo 3.

La figura 8 muestra la producción de linfocitos T con dos copias nulas del gen CCR5 según una realización del ejemplo 4. .

EXPOSICIÓN DETALLADA DE LA INVENCIÓN

Un primer aspecto de la invención se refiere a la molécula de ácido nucleico que codifica una proteína de fusión que han desarrollado los inventores y comprende en sentido 5 ' — 3 ' de transcripción al menos una secuencia de ácido nucleico que codifica un dominio de unión al ADN y una secuencia de ácido nucleico que codifica un dominio catalítico del tipo Fokl, en donde en el extremo 3 ' de dicha secuencia de ácido nucleico que codifica el dominio catalítico del tipo Fokl comprende una secuencia de ácido nucleico que codifica un péptido que comprende entre 18 y 23 aminoácidos, preferentemente de 21 aminoácidos.

Los términos ácido nucleico, polinucleótido, oligonucleótido o nucleótido son intercambiables y se refieren a ácidos desoxirribonucleicos o ácido ribonucleicos, en una conformación lineal o circular, ya sea en forma monocatenaria o bicatenaria. Estos términos pueden abarcar análogos conocidos de nucleótidos naturales, así como los nucleótidos que están modificados en la base, azúcar y / o restos fosfato. De manera general, un análogo de un nucleótido particular tiene la misma especificidad de emparejamiento de bases que dicho nucleótido particular.

En el contexto de la presente invención, por proteína de fusión se entiende una proteína que comprende al menos un polipéptido que comprende un dominio de unión o de reconocimiento al ADN y un dominio catalítico del tipo Fokl que corta dicho ADN.

En el contexto de la invención, por dominio catalítico del tipo Fokl se entiende el dominio catalítico de una enzima Fokl. La enzima Fokl es una endonucleasa de restricción de tipo IIS de bacterias que se encuentra naturalmente en Flavobacterium okeanokoites. En el contexto de la invención el dominio catalítico puede estar en su conformación silvestre de homodímero o en conformación de heterodímero obligado.

En una realización particular, el péptido que comprende entre 18 y 23 aminoácidos es un péptido del tipo 2A.

En el contexto de la invención, el péptido del tipo 2A se refiere a una secuencia peptídica de entre 18 y 23 aminoácidos situada entre dos polipéptidos funcionales o proteínas.

Los péptidos 2A se encuentran originalmente en diferentes virus de la familia Picornavirus, donde actúan en el proceso de síntesis de proteínas. Todas las proteínas codificadas por el genoma de estos virus están comprendidas en un solo policistrón o marco único de lectura. Los elementos 2A inducen la interrupción del proceso de síntesis de la cadena poliproteínica mediante el proceso denominado " ribosomal skipping " , por el cual las diferentes proteínas codificadas en el genoma del virus acaban produciéndose de manera independiente.

En una realización particular dicho péptido del tipo 2A comprende 21 aminoácidos. Preferentemente, el péptido del tipo 2A es del tipo T2A.

En una realización particular, dicho péptido del tipo 2A comprende la secuencia de aminoácidos SEQ ID NO: 1.

Por dominio de unión al ADN se entiende un dominio comprendido dentro de un polipéptido, que comprende al menos una estructura que reconoce el ADN al que se une. Un dominio de unión al ADN puede reconocer una secuencia específica de ADN (una secuencia de reconocimiento) o puede tener una afinidad general por el ADN. Ejemplos de polipéptidos que comprenden el domino de unión al ADN son: ZFN, CRISPR/Cas9 o TALE.

En una realización particular el dominio de unión de la molécula de ácido nucleico según las características anteriores es del tipo TALE.

Por término TALE se entiende un efector TAL o polipéptido TALE o proteína TALE que comprende un dominio de unión de ADN que tiene una pluralidad de repeticiones de unión a ADN, donde cada repetición comprende un RVD que determina el reconocimiento de una base del ADN diana.

En una realización particular, la molécula de ácido nucleico según las características anteriores comprende en sentido 5 ' — 3 ' de transcripción: (a) la secuencia de ácido nucleico que codifica el dominio de unión al ADN que comprende un primer segmento de entre 150 y 600 pares de bases, preferiblemente entre 470 y 550 pares de bases, que codifican el extremo N-terminal de una proteína TALE y una señal de localización nuclear, un segundo segmento de entre 1100 y 2900 pares de bases que codifican el dominio de unión del tipo TALE al ADN, y un tercer segmento de entre 40 y 850 pares de bases que codifican el extremo C- terminal de la proteína TALE, y

(b) la secuencia de ácido nucleico que codifica el dominio catalítico del tipo Fokl que comprende un primer segmento de entre 550 y 600 pares de bases, preferiblemente de entre 590 y 600 pares de bases, que codifican el dominio catalítico del tipo Fokl seguido de un segmento de entre 50 y 70 pares de bases, preferiblemente de 69 pares de bases, que codifica el péptido que comprende entre 18 y 23 aminoácidos, preferiblemente de 21 aminoácidos.

En el contexto de la invención, por señal de localización nuclear (de ahora en adelante NLS) se entiende por una secuencia de aminoácidos que marca una proteína para que ésta pueda ser importada dentro del núcleo celular a través de las proteínas transportadoras conocidas como receptores de importación.

En una realización particular, la molécula de ácido nucleico según las características anteriores, en sentido 5 ' — 3 ' de transcripción a continuación de la secuencia de ácido nucleico que codifica el péptido que comprende entre 18 y 23 aminoácidos, comprende una secuencia de ácido nucleico que codifica una proteína identificadora de la transcripción

En una realización preferente, a continuación de la secuencia de ácido nucleico que codifica el dominio catalítico del tipo Fokl comprende una secuencia de ácido nucleico que codifica la proteína identificadora de la transcripción que comprende entre 700 y 1000 pares de bases.

En el contexto de la invención, por proteína identificadora de la transcripción se entiende un marcador que debido a su transcripción permite identificar y seleccionar aquellas células en las que se haya expresado la proteína de fusión de la invención. Como marcadores se incluyen sin limitación, productos que confieren resistencia a los antibióticos, productos que confieren una ventaja de crecimiento selectivo cuando la molécula de ácido nucleico se expresa en la presencia de un sustrato y/o proteínas fluorescentes.

En una realización preferente, la proteína identificadora de la transcripción es una proteína fluorescente. Ejemplos de proteínas fluorescentes incluyen, sin limitación, GFP, tdTomato, IRFP, mEmerald, DsRed, EBFP, EYFP, Cerulean, ECFP, etc. En una realización preferida la proteína fluorescente es una proteína mCherry o una proteína EGFP.

La molécula de ácido nucleico según las características anteriores puede formar un gen monocistrónico o un gen policistrónico, preferentemente un gen bicistrónico o un gen tricistrónico.

Una de las ventajas de que la molécula de ácido nucleico esté formando un gen policistrónico es que la proteína de fusión y la proteína identificadora de la transcripción se expresan a partir de un mismo promotor. La identificación y selección por la fluorescencia por ejemplo, permite obtener una población celular enriquecida en células que hayan pasado por un proceso de modificación genética. La estructura de la molécula de ácido nucleico de la invención minimiza el riesgo de la selección de falsos positivos que es inherente a la colocación de la secuencia que codifica la proteína fluorescente en situación 5 ' respecto al dominio catalítico del Fokl.

En una realización particular, la molécula de ácido nucleico constituye un gen bicistrónico que en sentido 5 ' — 3 ' de transcripción codifica al menos una proteína de fusión según las características anteriores y una proteína identificadora de la transcripción, preferentemente, una proteína fluorescente.

En otra realización particular, la molécula de ácido nucleico constituye un gen tricistrónico que en sentido 5 ' — 3 ' de transcripción codifica al menos una primera proteína TALE, un dominio catalítico Fokl en donde en su extremo C-terminal comprende un péptido que comprende entre 18 y 23 aminoácidos, preferiblemente del tipo 2A, una segunda proteína TALE, un dominio catalítico del tipo Fokl en donde en su extremo C-terminal comprende un segundo péptido que comprende entre 18 y 23 aminoácidos, preferiblemente del tipo 2A, más preferiblemente del tipo T2A, y una proteína identificadora de la transcripción, preferiblemente una proteína fluorescente.

En la figura 1 se presenta un ejemplo de gen bicistrónico 10 que comprende una realización de la molécula de ácido nucleico de la invención que expresa una proteína de fusión 100 y una proteína fluorescente 50, dicho gen bicistrónico comprendiendo en sentido 5 ' — 3 ' de transcripción: una secuencia 1 que codifica un promotor

la secuencia de ácido nucleico 2 que codifica el dominio de unión al ADN que comprende un primer segmento que codifica el extremo N-terminal 20 de una proteína TALE y una señal de localización nuclear, un segundo segmento que codifica el dominio de unión del tipo TALE 21 al ADN, y un tercer segmento 22 que codifica el extremo C- terminal de la proteína TALE, y

la secuencia de ácido nucleico que codifica el dominio catalítico del tipo Fokl que comprende un primer segmento 3 que codifica el propio dominio catalítico del tipo Fokl 30 seguido de un segmento 4 que codifica el péptido 40 que comprende entre 18 y 23 aminoácidos, preferiblemente de 23 aminoácidos, y

la secuencia de ácido nucleico 5 que codifica la proteína fluorescente 50.

En la figura 3 se presenta un ejemplo de la estructura de las proteínas producidas a partir del gen bicistrónico de la figura 1.

En la figura 2 se presenta un ejemplo de gen tricistrónico que comprende una realización de la molécula de ácido nucleico de la invención, en el que a partir de un mismo promotor 1 se expresa una primera proteína de fusión según la invención 20,21 ,22,30,40, una segunda proteína de fusión 20,21 ,22,30,40 según la invención y una proteína fluorescente 50.

Una ventaja de esta disposición de estos genes policistrónicos es que tanto la proteína de fusión como la proteína fluorescente se expresan a partir de un mismo promotor. Esta configuración minimiza el riesgo de la selección de falsos positivos que es inherente a la colocación de la secuencia que codifica la proteína fluorescente en situación 5 ' respecto al dominio catalítico del Fokl.

Cuando la molécula de ácido nucleico que forma el gen monocistrónico o policistrónico es un ácido ribonucleico, dicha molécula comprende en el extremo 5 ' una estructura denominada CAP conocida por el experto en la materia. De manera general, esta estructura aporta estabilidad al mensajero de ácido ribonucleico que se pudiese transcribir a partir del gen.

Cuando la molécula de ácido nucleico que forma el gen monocistrónico o policistrónico es una de ácido desoxirribonucleico, las secuencias nucleotídicas del gen están adaptadas al uso de codon del organismo vegetal, animal o humano, en el que se utilicen.

Otro aspecto de la invención se refiere a una proteína de fusión que comprende en sentido N-terminal a C-terminal al menos un dominio de unión al ADN y al menos un dominio catalítico del tipo Fokl, en donde dicho dominio catalítico del tipo Fokl tiene unido a su extremo C-terminal un péptido que comprende entre 18 y 23 aminoácidos, preferentemente 21 aminoácidos.

En una realización particular, el dominio de unión al ADN es del tipo TALE.

En una realización particular, el péptido que comprende entre 18 y 23 aminoácidos es un péptido 2A, preferentemente del tipo T2A.

En una realización preferente, el péptido T2A comprende una secuencia de aminoácidos SEQ ID NO: 1.

En una realización particular, la proteína de fusión comprende en sentido N-terminal a C- terminal al menos:

- un primer segmento de entre 50 y 200 aminoácidos de longitud que corresponden al extremo N-terminal de una proteína TALE,

- un dominio de unión de tipo TALE que proporciona una unión específica a una secuencia de nucleótidos diana,

- un segmento de entre 20 y 100 aminoácidos de longitud que corresponden al extremo C-terminal de una proteína TALE, y

- un dominio catalítico del tipo Fokl en donde en su extremo C-terminal comprende un péptido de entre 18 y 23 aminoácidos, preferiblemente de 21 aminoácidos.

Dicho dominio catalítico del tipo Fokl modificado puede estar en su conformación silvestre de homodímero o en su conformación de heterodímero obligado.

Otro aspecto de la invención se refiere a un método para modificar el material genético de una célula, que comprende las etapas de:

(i) proporcionar una célula que contiene una secuencia de nucleótidos diana de ADN, e

(ii) introducir en dicha célula al menos una molécula de ácido nucleico según cualquiera de las características anteriores, o al menos una molécula de ácido nucleico que codifica al menos una proteína de fusión según cualquiera de las características anteriores, e inducir la expresión de dicha al menos una molécula de ácido nucleico, o (iii) introducir en dicha célula al menos una proteína de fusión según cualquiera de las características anteriores, de tal manera que el dominio de unión reconoce la secuencia de nucleótidos diana y el dominio catalítico del tipo Fokl pueda cortar en una secuencia de nucleótidos adyacente a la secuencia de nucleótidos diana.

En el contexto de la invención, la célula puede ser vegetal o de mamífero humano o animal.

En una realización la célula es de un vegetal.

En otra realización la célula es de un mamífero animal.

En otra realización, la célula es de un mamífero humano. Ejemplos de célula humana sin limitación son el linfocito, la célula madre hematopoyética, el fibroblasto de una biopsia o una célula madre pluripotente inducida.

La secuencia de nucleótidos diana puede estar en cualquier tipo celular, tejido u organismo eucariótico.

En el contexto de la invención por adyacente se entiende dentro de la secuencia diana o a una distancia de entre 5 y 20 pares de bases en sentido 5 ' — -3 ' de la secuencia diana.

En una realización particular, en la célula se introducen al menos dos moléculas de ácido nucleico, cada molécula expresando una proteína de fusión de la invención. Al menos estas dos proteínas de fusión son complementarias.

En otra realización particular, en la célula se introducen al menos dos proteínas de fusión según la invención. Estas al menos dos proteínas de fusión son complementarias.

En el contexto de la invención, por complementarias se entiende que al menos cada una de las proteínas reconoce una secuencia diana en una determinada región del genoma de la célula, separada por entre 5 y 20 pares de bases de la reconocida por la otra proteína. El mecanismo de acción de las dos proteínas de fusión complementarias es conocido por el experto en la materia tal y como se recoge en la figura 4: el dominio de unión 21 de una primera proteína de fusión reconoce una primera secuencia de nucleótidos diana al que se une y el dominio de unión 21 de una segunda proteína de fusión reconoce una segunda secuencia de nucleótidos diana al que se une, los dominios catalíticos del tipo Fokl 30 de cada proteína de fusión forman un dímero entre ellos, y el dímero corta en una secuencia de nucleótidos entre las secuencia de nucleótidos diana reconocida por el dominio de unión de cada proteína de fusión.

En el contexto de la invención el dominio catalítico Fokl puede estar en su conformación silvestre de homodímero o en conformación de heterodímero obligado.

En una realización preferente, la molécula de ácido nucleico o las moléculas de ácido nucleico que se introducen en la célula comprende en sentido 5 ' — 3 ' de transcripción al menos:

- una secuencia de ácido nucleico que codifica un dominio de unión al ADN del tipo TALE, y

- una secuencia de ácido nucleico que codifica un dominio catalítico del tipo Fokl, en donde en su extremo 3 ' comprende una secuencia de ácido nucleico que codifica un péptido del tipo 2A, preferentemente del tipo T2A, que comprende una secuencia de aminoácidos SEQ ID NO: 1.

Adicionalmente, la molécula de ácido nucleico de esta realización preferente, en sentido 5 ' - -3 ' a continuación del péptido del tipo 2A, comprende una secuencia de ácido nucleico que codifica una proteína identificadora de la transcripción, preferentemente una proteína fluorescente. Este hecho le aporta unas ventajas adicionales al método ya que permite la identificación y selección de dicha célula.

En esta realización preferente, la molécula de ácido nucleico, preferentemente de ácido nucleico, puede estar formando un gen policistrónico, preferentemente un gen bicistrónico o un gen tricistrónico tal y como se han descrito anteriormente.

En una realización particular, en la célula se introducen al menos dos moléculas de ácido nucleico, preferiblemente, dos genes bicistrónicos. En esta realización, preferentemente, cada gen bicistrónico expresa una proteína de fusión 100 y una proteína fluorescente 50 con un espectro de emisión diferente y/o diferenciable entre ambas proteínas fluorescentes. Esta característica tiene una ventaja adicional, ya que permite identificar y seleccionar mediante la fluorescencia las células en las que se transcribe una, las dos o ninguna de las proteínas de fusión codificado por los genes bicistrónicos. Las proteínas de fusión obtenidas de la transcripción de estos dos genes bicistrónicos son complementarias. La identificación y selección por la fluorescencia permite enriquecer una población celular modificada genéticamente según el método de la invención.

En una realización particular, las células modificadas según el método de la invención se identifican y seleccionan en base a la fluorescencia emitida por dichas células. En otra realización, estas células modificadas seleccionadas se amplifican en cultivo y se les vuelve a introducir al menos dos moléculas de ácido nucleico descritos anteriormente. Las células modificadas en esta segunda fase son identificadas y seleccionadas en base a la fluorescencia emitida por dichas células. Cuando la molécula de ácido nucleico introducida en la célula es el gen tricistrónico anteriormente descrito, se obtendrá sólo una única fluorescencia. En otra realización particular en la célula se introduce al menos un gen tricistrónico. En esta realización, el gen tricistrónico expresa dos proteínas de fusión complementarias entre ambas y una proteína fluorescente. Esta realización permite identificar mediante la fluorescencia aquellas células en las que se han transcrito o expresado las dos proteínas de fusión.

En cualquiera de los casos anteriores, se podrá introducir al menos un gen tricistrónico que codifique dos proteínas de fusión según la invención complementarias entre sí y una única proteína fluorescente.

La introducción de la o las moléculas de ácido nucleico de la invención puede realizarse por los distintos mecanismos conocidos por el experto en la materia. La molécula de ácido nucleico de la invención puede ser introducida en la célula mediante un sistema de administración viral o no viral. Ejemplos no limitativos de sistemas de administración viral, comprenden virus de ADN, virus de ARN, vectores retrovirales, vectores lentivirales, adenovirus, pox virus, virus de herpes y/o virus adenoasociados. Ejemplos no limitativos de administración no viral comprenden la nucleofeccion, la electroporacion, la lipofección, la microinyección, la biolística, los virosomas, los liposomas, los inmunoliposomas, los niosomas, los conjugados de ácidos nucleicos con policationes o lípidos, el ADN desnudo o asociado a una nanopartícula, los viriones artificiales, los agentes inductores de la toma de ADN por la célula y la sonoporación.

En una realización particular, la molécula de ácido nucleico se introduce en forma de plásmido mediante nucleofeccion.

En otra realización particular, la molécula de ácido nucleico se administra mediante un vector lentiviral. En otra realización particular, la molécula de ácido nucleico se administra mediante un adenovirus. Ejemplos no limitativos de otros virus son los virus adenoasociados.

En una realización, la o las moléculas de ácido nucleico que expresan la proteína de fusión de la invención se administran directamente al organismo o paciente (in vivo).

En otra realización, la o las moléculas de ácido nucleico que expresan la proteína de fusión de la invención se administran a células en cultivo (in vitro) y una vez modificada la célula se introducen en un organismo o el paciente (ex vivó).

En una realización, las células en cultivo son células obtenidas del paciente a tratar o del organismo a modificar genéticamente según el método de la invención.

Las moléculas de ácido nucleico o las proteínas de fusión de la invención se utilizan ventajosamente: para sustituir una secuencia genómica por una secuencia no idéntica homologa (es decir, la recombinación homologa),

para borrar una secuencia genómica mediante corte de ADN en uno o más sitios en el genoma, seguido por la eliminación de la secuencia situadas entre los puntos de corte y la unión de los mismos,

para introducir una secuencia exógena en un punto específico del genoma donde anteriormente no se encontraba,

para la detección de los factores celulares que facilitan la recombinación homologa; y l o

para sustituir una secuencia de tipo salvaje con una secuencia muíante, o para convertir un alelo a un alelo diferente.

La modificación del material genético es por tanto aplicable para la modificación genética dirigida de una célula (deleción o inserción), para la edición genómica en sus diferentes formas, para la generación de animales o plantas modificadas genéticamente, y para terapia génica.

Cualquier patología o enfermedad en vegetales, animales y humanos dependiente o mediada por una secuencia genómica en particular, de cualquier manera, puede tratarse, ser corregida o aliviarse utilizando los métodos y las composiciones descritos en este documento. A modo de ejemplo, la secuencia de nucleótidos diana está en un gen relacionado con el tratamiento de las inmunodeficiencias adquiridas, la inmunoterapia del cáncer, enfermedades de depósito lisosomal (por ejemplo, enfermedad de Gaucher, GM1 , la enfermedad de Fabry y la enfermedad de Tay-Sachs), mucopolisacaridosis (por ejemplo, la enfermedad de Hunter, enfermedad de Hurler), y hemoglobinopatías (por ejemplo, las enfermedades de células falciformes, HbC, talasemia y hemofilias).

Los métodos y las composiciones descritos en este documento también permiten el tratamiento de infecciones (virales o bacterianas) en un huésped, por ejemplo, mediante el bloqueo o inactivación de la expresión de receptores virales o bacterianos, previniendo así la infección y / o difusión en un organismo huésped. En una realización particular, la secuencia de nucleótidos diana está en el gen humano CCR5.

El gen humano CCR5 codifica para el principal correceptor usado por el virus de la inmunodeficiencia humana (VIH), causante del SIDA, para penetrar en los linfocitos T. Se ha comprobado que la eliminación del correceptor CCR5 impide la entrada del virus en los linfocitos T y, por tanto, el progreso de la infección y el desarrollo de la enfermedad. En una realización particular, la molécula de la invención o las proteínas de fusión de la invención dan lugar a la modificación genética del gen CCR5 dando lugar a la inactivación del correceptor CCR5 en linfocitos primarios de pacientes de SIDA. La modificación genética ocurre en el tramo del ADN entre las secuencia de nucleótidos diana del gen humano CCR5 reconocidas por los dominios de unión de al menos dos proteínas de fusión complementarias entre sí, siendo las secuencias de nucleótidos diana preferentemente la SEQ ID NO: 2 y la SEQ ID NO: 3.

En una realización particular, en una primera fase de inactivación se introducen en los linfocitos T al menos dos moléculas de ácido nucleico, preferentemente dos genes bicistrónicos complementarios de la invención, por ejemplo según la figura 1 , específicos para el gen CCR5. La transcripción de los genes produce dos proteínas de fusión del tipo TALEN complementarias y dos proteínas fluorescentes, preferentemente mCherry y EGFP. Las proteínas TALENs reconocerán sus secuencias dianas respectivas, preferentemente SEQ ID NO: 2 y SEQ ID NO:3, situadas a una distancia tal que permite a los dos dominios catalíticos Fokl dimerizar y cortar la doble hebra de ADN. Al mismo tiempo, las fluorescencias roja y verde emitidas por las respectivas proteínas fluorescentes permiten identificar aquellas células en las que los dos genes bicistrónicos se hayan transcrito. La doble fluorescencia permite aislarlas mediante un separador celular y obtener así una población de células en la que prácticamente el 100% presente al menos uno de los dos alelos CCR5 inactivados. Los linfocitos T así obtenidos pueden someterse a una segunda fase de inactivación. Para ello, una vez aislados y amplificados en cultivo, se les vuelve a introducir al menos dos genes bicistrónicos complementarios de la invención, tal y como se han descrito anteriormente, modificando la copia del gen CCR5 que todavía no se haya modificado. Tanto los linfocitos T producidos en la primera fase, que serán en su mayoría heterocigóticos para la mutación del gen CCR5, como los producidos en la segunda fase, que serán en su mayoría homocigóticos para la mutación del gen CCR5, se administran con fines terapéuticos al donante original. Los linfocitos T producidos son parcial o totalmente resistentes a la infección por VIH, dependiendo de si son homocigóticos o heterocigóticos para la mutación del gen CCR5. La protección ofrecida por los linfocitos T modificados tendrá una duración limitada, por lo que para extenderla en el tiempo se realizan administraciones periódicas de linfocitos T modificados.

Para conseguir una protección permanente frente al VIH, se transplantan al paciente células madre hematopoyéticas a las que previamente se les ha modificado el gen CCR5 mediante el uso de la molécula de la invención o la proteína de fusión de la invención o el método de la invención. El procedimiento de inactivación será el mismo descrito para el caso de los linfocitos T. Las células madre hematopoyéticas se obtienen previamente del paciente, o podrán haberse producido in vitro a partir de células iPS derivadas de células diferenciadas del paciente. La modificación del gen CCR5 también se puede realizar en la propia célula iPS según el proceso descrito anteriormente. En cualquiera de los casos anteriores, el procedimiento de modificación del gen CCR5 podrá también realizarse mediante el uso de un sólo gen tricistrónico que codifique dos proteínas de fusión según la invención, complementarias específicas para el gen CCR5 y una única proteína fluorescente.

En otra realización particular, la secuencia de nucleótidos diana está en un gen relacionado con una enfermedad genética, preferentemente monogénica.

A modo de ejemplo no limitativo, enfermedades genéticas incluyen, pero no se limitan a, deficiencia de la prolidasa, siliadosis, galactosiliadosis, α manosidosis, β manosidosis, aspartilglucosaminuria, fucosidosis, la enfermedad de Schindler, leucodistrofia metacrom ática, deficiencia múltiple de sulfatasa, leucodistrofia floboides, enfermedad de Pompe, lipogranulomatosis de Farber, enfermedad de Wolman y la enfermedad de almacenamiento de ésteres de colesterilo, picnodistostosis, ceroidolipofuscinosis, cistinosis, enfermedad de Salla, mucolipidosis III o IV, la enfermedad de Danon, ceroidolipofuscinosis 6 y 8, la enfermedad de Chediak Higashi, las enfermedades de Griscelli tipo 1 , 2 y 3, la enfermedad de Hermansky Pudliak 2, retinosquisis ligada a X, la enfermedad de stargardt, coroideremia, retinosis pigmentarias 1-57, acondroplasia, acromatopsia, deficiencia de maltasa ácida, deficiencia de adenosina desaminasa (OMIM N° 102700), la adrenoleucodistrofia, síndrome de Aicardi, alfa-1 antitripsina, alfa-talasemia, síndrome de insensibilidad a andrógenos, síndrome de Apert, arritmogenia del ventrículo derecho, la displasia, ataxia telangictasia, síndrome de Barth, beta-talasemia, síndrome de Bean, enfermedad de Canavan, enfermedades granulomatosas crónicas (CGD), síndrome Cri du Chat, fibrosis quística, enfermedad de Dercum, displasia ectodérmica, anemia de Fanconi, fibrodisplasia osificante progresiva, el síndrome de X frágil, galactosemia, enfermedad de Gaucher, gangliosidosis generalizada (por ejemplo, GM1), hemocromatosis, la mutación de la hemoglobina C en el codón 6.sup.th de beta-globina (HBC), la hemofilia, la enfermedad de Huntington, síndrome de Hurler, la hipofosfatasia, síndrome Klinefleter, Enfermedad Krabbes, Síndrome de Langer-Giedion, deficiencia de adhesión leucocitaria (LAD, OMIM N° 1 16920), leucodistrofia, el síndrome de QT largo, síndrome de Marfan, síndrome de Moebius, mucopolisacaridosis (MPS), el síndrome de la rótula del clavo, diabetes insípida nefrogénica, la neurofibromatosis, la enfermedad Neimann-Pick, la osteogénesis imperfecta, la porfiria, el síndrome de Prader-Willi, progeria, síndrome de Proteus, retinoblastoma, síndrome de Rett, el síndrome de Rubinstein-Taybi, el síndrome de Sanfilippo, inmunodeficiencia combinada severa (SCID), el síndrome de Shwachman, enfermedad de células falciformes (anemia de células falciformes), el síndrome de Smith-Magenis, síndrome de Stickier, la enfermedad de Tay-Sachs, trombocitopenia Ausente Radio (TAR), síndrome de Down, síndrome de Treacher Collins, trisomía, esclerosis tuberosa, síndrome de Down, síndrome linfoproliferativo de Tumer trastorno del ciclo de la urea, la enfermedad de von Hippel-Lindau, el síndrome de Waardenburg, el síndrome de Williams, la enfermedad de Wilson, y el síndrome de Wiskott-Aldrich, ligada a X (XLP, OMIM N° 308240).

Por tanto, otro aspecto de la invención se dirige al uso de la molécula de ácido nucleico o la proteína de fusión o la célula modificada según el método de la invención para su uso como medicamento o para su uso en el tratamiento de las enfermedades anteriormente citadas.

Otro aspecto de la invención se refiere al uso de la molécula de ácido nucleico de la invención o la proteína de fusión de la invención o la célula modificada genéticamente según el método de la invención, para preparar un medicamento o una composición terapéutica para el tratamiento o prevención de una enfermedad. En una realización particular, dicho medicamento o dicha composición terapéutica se utiliza para el tratamiento o prevención del SIDA. En otra realización particular, dicho medicamento o dicha composición terapéutica se utiliza para el tratamiento o prevención de enfermedades hereditarias, preferentemente enfermedades hereditarias monogénicas.

Otro aspecto de la invención se dirige a un método de tratamiento o prevención de una de las enfermedades mencionadas anteriormente, que comprende en administrar una cantidad terapéuticamente efectiva de la moléculas de ácido nucleico o de la proteína de fusión definidas anteriormente, o de la célula modificada genéticamente según el método de la invención, junto con excipientes o portadores farmacéuticamente aceptables, en un sujeto en necesidad de ese tratamiento y/o prevención, incluyendo un humano.

El término "prevención o tratamiento" en el contexto de la invención significa la administración de las moléculas de ácido nucleico o las proteínas de fusión según la invención para preservar la salud en un paciente que sufre o está en riesgo de sufrir una de las enfermedades anteriormente descritas. Dichos términos también incluyen la administración de las moléculas de ácido nucleico o las proteínas de fusión según la invención para prevenir, mejorar, aliviar o eliminar uno o más síntomas asociados a la enfermedad. El término "mejorar" en el contexto de esta invención se entiende que significa cualquier mejora en la situación del paciente tratado, o bien subjetiva (sensación de o en el paciente) o bien objetivamente (parámetros medidos).

Las moléculas de ácido nucleico o las proteínas o las células modificadas de la presente invención, pueden estar formando parte de una composición terapéutica. Dichas composiciones terapéuticas incluyen cualquier composición sólida, semi-sólida o líquida.

La composición terapéutica de la invención comprende la molécula de ácido nucleico o la proteína de fusión o la célula modificada según la invención junto con vectores, excipientes o portadores farmacéuticamente aceptables, en un sujeto en necesidad de ese tratamiento y/o prevención, incluyendo un humano. El experto en la materia puede determinar qué componentes adicionales se pueden utilizar y si son necesarios, siendo muchos de ellos de uso común en composiciones terapéuticas.

La expresión "cantidad terapéuticamente efectiva" en el contexto de esta invención se refiere a la cantidad de composición que, una vez administrado, es suficiente para prevenir o tratar uno o más síntomas derivadas de la enfermedad. La dosis particular administrada según la presente invención será determinada según las circunstancias particulares que rodean al caso, incluyendo el compuesto administrado, la ruta de administración, la condición particular que se trata y las consideraciones similares. La expresión "excipientes o portadores farmacéuticamente aceptables" se refiere a materiales, composición o vehículos farmacéuticamente aceptables. Cada componente debe ser farmacéuticamente aceptable en el sentido de ser compatible con los otros ingredientes de la composición farmacéutica. Debe también ser adecuado para su uso en contacto con los tejidos u órganos humanos y animales sin una toxicidad excesiva, irritación, respuesta alérgica, inmunogenicidad u otros problemas o complicaciones acorde con una relación beneficio/ riesgo razonable.

A continuación, se describen algunos ejemplos ilustrativos que ponen de manifiesto las características y ventajas de la invención. No obstante, no se deben interpretar como limitativos del objeto de la invención tal como está definido en las reivindicaciones.

Ejemplos

Ejemplo 1: Preparación de una molécula de ácido nucleico bicistrónica según la invención

Los nuevos genes bicistrónico se han construido con la proteína de fluorescencia unida mediante un elemento 2A al extremo C-terminal del monómero Fokl. La unión se ha realizado mediante ampliaciones sucesivas, por PCR, de los fragmentos a ensamblar. En una primera serie de reacciones se amplificaron dos fragmentos. El primero estaba constituido por la parte 3 ' de la región codificante para el dominio catalítico de Fokl y el fragmento 2A. El segundo tenía en su parte 5 ' una zona solapante con el extremo 3 ' del primero, seguido de la secuencia codificante para la proteína fluorescente correspondiente. En la segunda reacción de amplificación se mezclaban los dos productos de la primera serie, con los cebadores correspondientes al extremo 5 ' de la primera reacción y al extremo 3 ' de la segunda. La reacción de PCR realizada con esta mezcla daba lugar a un fragmento de ADN que podía unirse mediante métodos clásicos de genética molecular a la estructura clásica de una TALEN, reemplazando el fragmento 3 ' del dominio Fokl descrito en el estado de la técnica, por otro conteniendo la adición de 21 aminoácidos y la proteína fluorescente correspondiente.

Ejemplo 2: Eficacia de corte de una proteína de fusión según la invención.

Se compararon las eficacias de corte de dos pares complementarios de proteínas de fusión 100 obtenidas según el ejemplo 1 respecto a un par complementario de una TALEN 80 del estado de la técnica. Las proteínas producidas según el ejemplo 1 tienen el fragmento de 21 aminoácidos con la secuencia SEQ ID NO: 1 añadido al extremo C-terminal del dominio catalítico de Fokl. Las proteínas 80 carecen de esos 21 aminoácidos. Los dos pares de proteínas complementarias son específicos respectivamente para las regiones próximas a Δ32 en el gen CCR5 y AF508 en el gen CFTR, ambos humanos, en dos tipos celulares: K562 y linfocitos primarios T (T-cells). Los genes codificantes para ambas proteínas se introdujeron en forma plasmídica en las células mediante Nucleofección (LONZA). Para medir la eficacia de corte se utilizó el método Surveyor ® conocido por el experto en la materia. Los resultados se cuantificaron mediante electroforesis virtual y densitometría realizados con un analizador molecular Bioanalyzer 2100 de Agilent Technologies. Para cada experimento se utilizó la misma cantidad de células y la misma cantidad de las proteínas 100 y 80. Ambas proteínas reconocen las mismas secuencias diana dentro de cada gen. Con el método Surveyor, la eficacia de corte se mide por la abundancia relativa de los productos de digestión comparados con la secuencia diana sin cortar (346 pb para la CCR5 y 360 pb para CFTR). En la figura 5 se presentan los resultados de eficacia obtenidos. Los valores obtenidos (como porcentajes del alelo sin modificar) se indican debajo de cada columna. Las flechas señalan la posición y el tamaño de los alelos sin modificar (bandas correspondientes a 346 pb y 360 pb) y de los correspondientes productos de digestión (200 pb, 146 pb, 210 pb y 150 pb). PM: marcador de peso molecular. Surveyor ® positive control: control interno de funcionamiento del kit. La escala numérica de la izquierda está formada por valores arbitrarios de desplazamiento utilizados por el aparato donde se realizó la medición (Bioanalyzer).

Por los resultados obtenidos se concluye que las proteínas de fusión de la invención son más eficaces que las proteínas del estado de la técnica.

Ejemplo 3: Identificación y enriquecimiento de una población celular sometida al método de modificación genética según la invención.

Se presentan los resultados de dos series experimentales realizadas con células K562. En cada una se ha inactivado un gen diana diferente. En un caso, el gen diana ha sido CCR5 y en otro CFTR. En cada experimento se han transfectado las células correspondientes con una pareja de genes bicistrónicos (de ahora en adelante denominados TALEN-F1 y TALEN- F2), cada gen bicistrónico codificando una proteína de fusión 100 y una proteína fluorescente 50. Las proteínas de fusión obtenidas de la transcripción de los dos tipos de gen bicistrónico son complementarias (específicas respectivamente para las regiones próximas a Δ32 en el gen CCR5 y AF508 en el gen CFTR), mientras que las proteínas fluorescentes obtenidas con cada tipo de gen tienen un espectro de emisión diferente y/o diferenciable entre ambas proteínas fluorescentes. Uno de los genes codifica una proteína fluorescente mCherry y el otro gen la proteína EGFP. La identificación y selección por la fluorescencia permite enriquecer una población celular modificada genéticamente según el método de la invención y así lo han demostrado los resultados obtenidos. En la figura 6, las gráficas de puntos representan la distribución de las células de acuerdo a la intensidad de la expresión de las dos proteínas fluorescentes obtenidas por el separador celular. En abscisas se representa la emisión correspondiente a GFP y en ordenadas la correspondiente a mCherry. Los parámetros del separador celular se han ajustado para que las células que sólo expresan una de las dos proteínas fluorescentes se agrupen junto a las dobles negativas en el cuadrante inferior izquierdo. El cuadrante superior derecho contienen las células que expresan las dos proteínas fluorescentes con mayor intensidad. Los porcentajes corresponden al porcentaje de células que expresan las dos proteínas fluorescentes frente al total de células de cada experimento.

En una segunda fase se determinó la actividad nucleasa o de corte de las proteínas de fusión de la invención mediante el método Surveyor ® citado anteriormente. Para ello, se extrajeron los ADNs de células aisladas que expresan las dos proteínas fluorescentes. La figura 7 refleja los resultados obtenidos con los genes humanos CCR5 y CFTR en células K562. En cada caso se utilizó la misma cantidad de células y de genes bicistrónicos y se compararon los porcentajes de corte de las proteínas de fusión en tres situaciones:

Transfección con TALEN-F1 y TALEN-F2 y sin realizar la selección por fluorescencia (columna 100).

Primera transfección con TALEN-F1 y TALEN-F2 y selección por fluorescencia (columna corte 1).

Segunda transfección con TALEN-F1 y TALEN-F2 y selección por fluorescencia (columna corte 2).

Después del primer ciclo de transfección y selección (cortel) puede observarse cómo los porcentajes de corte se encuentran alrededor del 50%. Esto implica que aproximadamente la mitad de las copias del gen presentes en cada muestra de ADN han sido cortadas por las proteínas de fusión expresadas por las TALEN-F1 y TALEN-F2. Puesto que todas las células contienen dos copias de cada gen, el resultado puede interpretarse como que en la práctica totalidad de las células seleccionadas se ha modificado al menos una copia del gen. En el corte 2 se observa que el segundo ciclo de transfección produce un incremento en los porcentajes de corte. El método Surveyor ® no tiene la suficiente precisión como para establecer cuantitativamente el porcentaje de cortes homocigóticos, pero en la figura 7 puede observarse cómo la banda correspondiente a los alelos silvestres de 346 pb en CCR5 y de 360 pb en CFTR ha desaparecido, dando paso a otras bandas de diferente tamaño. Se puede concluir, por tanto, que el método es eficaz para la obtención de células homocigóticas mutantes.

Ejemplo 4: Identificación y enriquecimiento de linfocitos T sometida al método de modificación genética según la invención.

Para comprobar la eficiencia del método en la producción de linfocitos T con dos copias nulas del gen CCR5, se realizó un experimento en el que se partió de linfocitos T de donantes heterocigóticos para la mutación Δ32. Los Linfocitos T se nucleofectaron, según el método de la invención, con una pareja de genes bicistrónicos específicos para el gen CCR5, cada gen bicistrónico codificando una proteína de fusión 100 comprendiendo la SEQ ID NO: 1 y una proteína fluorescente 50. Las proteínas de fusión obtenidas de la transcripción de los dos tipos de gen bicistrónico son complementarias teniendo una un dominio de unión específico para la SEQ ID NO: 2 y la otra un dominio de unión específico para la SEQ ID NO: 3. Uno de los genes codifica una proteína fluorescente mCherry y el otro gen la proteína EGFP. Para determinar la actividad nucleasa o de corte de las proteínas de fusión de la invención, y al mismo tiempo determinar la frecuencia del alelo silvestre del gen CCR5 en la población celular tratada, se utilizó el método Surveyor ® citado anteriormente. Se compararon muestras de ADN de la población original sin tratar, de la población inmediatamente después de la nucleofección, pero sin haber sido seleccionada, y de la población obtenida una vez seleccionados en el separador celular los linfocitos que expresaban los dos proteínas fluorescentes. La figura 8 recoge los resultados obtenidos. Puede observarse cómo la frecuencia del alelo silvestre disminuye con el tratamiento, hasta llegar prácticamente a desaparecer en la población celular seleccionada por fluorescencia.