Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
GENES INVOLVED IN THE BIOSYNTHESIS OF THIOCORALINE AND HETEROLOGOUS PRODUCTION OF SAME
Document Type and Number:
WIPO Patent Application WO/2007/014971
Kind Code:
A2
Abstract:
The invention relates to genes involved in the biosynthesis of thiocoraline and to the heterologous production of same. According to the invention, the cluster of genes responsible for the biosynthesis of thiocoraline was identified and cloned. Said gene cluster can be used in the heterologous production of thiocoraline which has an antitumour and antibacterial activity.

Inventors:
RAMOS CASTRO ANGELINA (ES)
FERNANDEZ BRANA ALFREDO (ES)
LOMBO BRUGOS FELIPE (ES)
MENDEZ FERNANDEZ CARMEN (ES)
SALAS FERNANDEZ JOSE ANTONIO (ES)
VELASCO IGLESIAS ANA (ES)
SCHLEISSNER SANCHEZ CARMEN (ES)
Application Number:
PCT/ES2006/000455
Publication Date:
February 08, 2007
Filing Date:
August 01, 2006
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
PHARMA MAR SA (ES)
RAMOS CASTRO ANGELINA (ES)
FERNANDEZ BRANA ALFREDO (ES)
LOMBO BRUGOS FELIPE (ES)
MENDEZ FERNANDEZ CARMEN (ES)
SALAS FERNANDEZ JOSE ANTONIO (ES)
VELASCO IGLESIAS ANA (ES)
SCHLEISSNER SANCHEZ CARMEN (ES)
International Classes:
C12N15/52; C12N15/76; C12N15/69; C12P17/12; C07K14/36
Domestic Patent References:
WO2003044186A2
WO2000040704A1
Other References:
PEREZ BAZ ET AL., J. ANTIBIOTICS, vol. 50, no. 9, 1997, pages 738 - 741
ROMERO ET AL., J. ANTIBIOTICS, vol. 50, no. 9, 1997, pages 734 - 737
FAIRCLOTH ET AL., EUR. J. CANCER, vol. 33, 1997, pages 175
QUING-TAO, S. ET AL.: "Dissecting and Exploiting Nonribosomal Peptide Synthetases", ACTA BIOCHIMICA ET BIOPHYSICA. SINICA, vol. 36, no. 4, 2004, pages 243 - 249
SAMBROOK ET AL.: "Molecular Cloning: A Laboratory Manual", 1989, COLD SPRING HARBOR LABORATORY PRESS
MERRIFIELD, J. AM. CHEM. SOC., vol. 85, 1963, pages 2149 - 2154
SAMBROOK ET AL.: "Molecular cloning: a laboratory manual", 2001, COLD SPRING HARBOR LABORATORY PRESS
RICHARDSON, GENE, vol. 61, 1987, pages 231 - 241
NEILAN ET AL., J. BACTERIOL., vol. 181, no. 13, 1999, pages 4089 - 4097
KOVACH, M.E. ET AL., GENE, vol. 166, 1995, pages 175 - 176
BIERMAN ET AL., GENE, vol. 116, 1992, pages 43 - 49
DEVEREUX ET AL., NUCLEIC ACID RES., vol. 12, 1984, pages 387 - 395
ALTSCHUL ET AL., NUCLEIC ACID RES., vol. 25, 1997, pages 3389 - 3402
VIEIRA ET AL., GENE, vol. 100, 1991, pages 189 - 194
ROSE, NUCLEIC ACIDS RES., vol. 16, 1988, pages 355
BLANCO ET AL., CHEM. BIOL., vol. 8, 2001, pages 253 - 263
CHATER ET AL., J. GENE. MICROBIOL., vol. 116, 1980, pages 323 - 334
REDENBACH ET AL., MOL. MICROBIOL., vol. 21, 1996, pages 77 - 96
FERNANDEZ ET AL., J. BACTERIOL., vol. 180, 1998, pages 4929 - 4937
Attorney, Agent or Firm:
ARIAS SANZ, Juan (S.L. Orens, 68 7º Madrid, ES)
Download PDF:
Claims:
Reivindicaciones

1. Una molécula de ácido nucleico aislada que comprende una secuencia de nucleótidos que codifica al menos una proteína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma.

2. Molécula de ácido nucleico según la reivindicación 1, que comprende una secuencia de nucleótidos que codifica la totalidad de las proteínas de la ruta biosintética de producción de tiocoralina, o fragmentos biológicamente activos de las mismas.

3. Molécula de ácido nucleico según la reivindicación 1 ó 2, que comprende la secuencia de nucleótidos mostrada en la SEQ ID NO: 1 o su cadena complementaria.

4. Una molécula de ácido nucleico que hibrida con la molécula de ácido nucleico de la reivindicación 3 y codifica al menos una proteína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma.

5. Molécula de ácido nucleico según la reivindicación 1, que comprende una secuencia de nucleótidos que codifica una proteína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma.

6. Molécula de ácido nucleico según la reivindicación 5, seleccionada del grupo formado por: - la molécula de ácido nucleico que comprende los nucleótidos 2-

535 de la SEQ ID NO: 1 (or/J);

- la molécula de ácido nucleico que comprende los nucleótidos 993- 1130c de la SEQ ID NO: 1 [orf2);

- la molécula de ácido nucleico que comprende los nucleótidos 1517-2131 de la SEQ ID NO: 1 {tio3);

- la molécula de ácido nucleico que comprende los nucleótidos 2154-2822c de la SEQ ID NO: 1 [tio4); - la molécula de ácido nucleico que comprende los nucleótidos

2970-379 Ic de la SEQ ID NO: 1 {tio5);

- la molécula de ácido nucleico que comprende los nucleótidos 3794-4777c de la SEQ ID NO: 1 {tio6)\

- la molécula de ácido nucleico que comprende los nucleótidos 4904-561 1 de la SEQ ID NO: 1 {tio7);

- la molécula de ácido nucleico que comprende los nucleótidos 5701-6426c de la SEQ ID NO: 1 (fιo8);

- la molécula de ácido nucleico que comprende los nucleótidos 6426-7688c de la SEQ ID NO: 1 [tio9)\ la molécula de ácido nucleico que comprende los nucleótidos

7733-8524c de la SEQ ID NO: 1 {tiol O);

- la molécula de ácido nucleico que comprende los nucleótidos 8791-10002 de la SEQ ID NO: 1 {tiol J);

- la molécula de ácido nucleico que comprende los nucleótidos 10002-1159Oc de la SEQ ID NO: 1 {tiol2); la molécula de ácido nucleico que comprende los nucleótidos 1 1847-13634 de la SEQ ID NO: 1 {tiol3);

- la molécula de ácido nucleico que comprende los nucleótidos 13734-15005c de la SEQ ID NO: 1 (tiol4); - la molécula de ácido nucleico que comprende los nucleótidos

15005- 16354c de la SEQ ID NO: 1 [tiol S);

- la molécula de ácido nucleico que comprende los nucleótidos 16441-18744C de la SEQ ID NO: 1 [tiol β);

- la molécula de ácido nucleico que comprende los nucleótidos 18774- 19055c de la SEQ ID NO: 1 (tiol 7);

- la molécula de ácido nucleico que comprende los nucleótidos 19260-20036 de la SEQ ID NO: 1 {tiol8};

O-¿¡

- la molécula de ácido nucleico que comprende los nucleótidos 20146-20880c de la SEQ ID NO: 1 {tiol 9);

- la molécula de ácido nucleico que comprende los nucleótidos 21188-28969 de la SEQ ID NO: 1 (tio20); - la molécula de ácido nucleico que comprende los nucleótidos

28979-38398 de la SEQ ID NO: 1 {tio21);

- la molécula de ácido nucleico que comprende los nucleótidos 38449-38661 de la SEQ ID NO: 1 {tio22);

- la molécula de ácido nucleico que comprende los nucleótidos 38642-41263 de la SEQ ID NO: 1 {tio23);

- la molécula de ácido nucleico que comprende los nucleótidos 41835-42368 de la SEQ ID NO: 1 (tio24);

- la molécula de ácido nucleico que comprende los nucleótidos 42395-43255c de la SEQ ID NO: 1 {tio25); - la molécula de ácido nucleico que comprende los nucleótidos

43340-4374 Ic de la SEQ ID NO: 1 (tio26);

- la molécula de ácido nucleico que comprende los nucleótidos 44152-49563 de la SEQ ID NO: 1 {tio27);

- la molécula de ácido nucleico que comprende los nucleótidos 49635-53669 de la SEQ ID NO: 1 (tio28); la molécula de ácido nucleico que comprende los nucleótidos 53749-55305c de la SEQ ID NO: 1 (orf29);

- la molécula de ácido nucleico que comprende los nucleótidos 55384-57222c de la SEQ ID NO: 1 (orf30); - la molécula de ácido nucleico que comprende los nucleótidos

57895-58467c de la SEQ ID NO: 1 {orf31);

- la molécula de ácido nucleico que comprende los nucleótidos 58535-59206c de la SEQ ID NO: 1 {orf32);

- la molécula de ácido nucleico que comprende los nucleótidos 59298-59564c de la SEQ ID NO: 1 [orf33);

- la molécula de ácido nucleico que comprende los nucleótidos 59611-601 14c de la SEQ ID NO: 1 [orf34);

JO

- la molécula de ácido nucleico que comprende los nucleótidos 60202-60888 de la SEQ ID NO: 1 {orf35);

- la molécula de ácido nucleico que comprende los nucleótidos 60960-62240 de la SEQ ID NO: 1 [orf36); - la molécula de ácido nucleico que comprende los nucleótidos

62300-62833 de la SEQ ID NO: 1 [orf37);

- la molécula de ácido nucleico que comprende los nucleótidos 62925-64650 de la SEQ ID NO: 1 (orf38); o fragmentos de las mismas que codifican fragmentos biológicamente activos de proteínas de la ruta biosintética de producción de tiocoralina.

7. Molécula de ácido nucleico según la reivindicación 1, que comprende una secuencia de nucleótidos que codifica dos o más proteínas de la ruta biosintética de producción de tiocoralina, o fragmentos biológicamente activos de las mismas.

8. Molécula de ácido nucleico según la reivindicación 7, que comprende dos o más genes seleccionados entre los genes identificados como orfl, orf2, tio3, tio4, tio5, tioδ, tio7, tio8, tio9, tiol O, tiol l, tiol2, tiol3, tiol4, tiol5, tiol β, tiol 7, tiol 8, tiol θ, tio20, tio21, tio22, tio23, tio24, tio25, tio26, tio27, tio28, orf29, orf30, orf31, orf32, orf33, orf34, orf35, orf36, orf37, orf38 y fragmentos de los mismos que codifican fragmentos biológicamente activos de proteínas de la ruta biosintética de producción de tiocoralina.

9. Molécula de ácido nucleico según la reivindicación 1 , que comprende una secuencia de nucleótidos que codifica al menos una proteína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma, o un mutante o variante de la misma, en donde dicha pro teína se selecciona del grupo formado por las proteínas identificadas como ORFl (SEQ ID NO: 2), ORF2 (SEQ ID NO: 3), Tio3 (SEQ ID NO: 4), Tio4 (SEQ ID NO: 5), Tio5 (SEQ ID NO: 6), Tioδ (SEQ ID NO: 7), Tio7 (SEQ ID NO: 8), Tio8 (SEQ ID NO: 9), Tio9

(SEQ ID NO: 10), TiolO (SEQ ID NO: 11), Tiol l (SEQ ID NO: 12), Tiol2 (SEQ ID NO: 13), Tiol3 (SEQ ID NO: 14), Tiol4 (SEQ ID NO: 15), Tiol5 (SEQ ID NO: 16), Tio lδ (SEQ ID NO: 17), Tio l7 (SEQ ID NO: 18), Tiolδ (SEQ ID NO: 19), Tiol9 (SEQ ID NO: 20), Tio20 (SEQ ID NO: 21), Tio21 (SEQ ID NO: 22), Tio22 (SEQ ID NO: 23), Tio23 (SEQ ID NO: 24), Tio24 (SEQ ID NO: 25), Tio25 (SEQ ID NO: 26), Tio26 (SEQ ID NO: 27), Tio27 (SEQ ID NO: 28), Tio28 (SEQ ID NO: 29), ORF29 (SEQ ID NO: 30), ORF30 (SEQ ID NO: 31), ORF31 (SEQ ID NO: 32), ORF32 (SEQ ID NO: 33), ORF33 (SEQ ID NO: 34), ORF34 (SEQ ID NO: 35), ORF35 (SEQ ID NO: 36), ORF36 (SEQ ID NO: 37), ORF37 (SEQ ID NO: 38), ORF38 (SEQ ID NO: 39) y combinaciones de las mismas.

10. Molécula de ácido nucleico según la reivindicación 1, que comprende una secuencia de nucleótidos que comprende un orfs seleccionado del grupo formado por orfl, orf2, tio3, tio4, tío 5, tioβ, tio7, tio8, tio9, tiol O, tiol l, tiol2, tiol3, tiol4, tiol 5, tiol δ, tio! 7, tiol8, tio! 9, tio20, tio21, tio22, tio23, tio24, tio25, tio26, tio27, tio28, orf29, orf30, orf31, orf32, orf33, orf34, orf35, oτf36, orf37, orf38 y combinaciones de los mismos, o de las correspondientes regiones, mutantes o variantes de los mismos.

11. Molécula de ácido nucleico según la reivindicación 1 , aislada de Micromonospora sp.

12. Una composición que comprende, al menos, una molécula de ácido nucleico según cualquiera de las reivindicaciones 1 a 1 1.

13. Una sonda que comprende una molécula de ácido nucleico según cualquiera de las reivindicaciones 1 a 11 o un fragmento de la misma.

OO

14. Un vector que comprende una molécula de ácido nucleico según cualquiera de las reivindicaciones 1 a 11 o una composición según la reivindicación 12.

15. Una célula hospedadora trasformada o transfectada con un vector de la invención.

16. Célula hospedadora según la reivindicación 15, en la que dicha célula hospedadora es un microorganismo, preferentemente una bacteria.

17. Célula hospedadora según la reivindicación 16, en la que dicha bacteria es una bacteria Gram-positiva, preferentemente un actinomiceto o un estreptomiceto.

18. Una pro teína codificada por la molécula de ácido nucleico de la invención.

19. Pro teína según la reivindicación 18, seleccionada del grupo formado por las proteínas identificadas como ORFl (SEQ ID NO: 2),

ORF2 (SEQ ID NO: 3), Tio3 (SEQ ID NO: 4), Tio4 (SEQ ID NO: 5), Tio5 (SEQ ID NO: 6), Tio6 (SEQ ID NO: 7), Tio7 (SEQ ID NO: 8), Tio8 (SEQ ID NO: 9), Tio9 (SEQ ID NO: 10), TiolO (SEQ ID NO: 11), Tiol l (SEQ ID NO: 12), Tiol2 (SEQ ID NO: 13), Tiol3 (SEQ ID NO: 14), Tiol4 (SEQ ID NO: 15), Tiol5 (SEQ ID NO: 16), Tiolδ (SEQ ID NO: 17), Tiol7 (SEQ ID NO: 18), Tiolδ (SEQ ID NO: 19), Tiol9 (SEQ ID NO: 20), Tio20 (SEQ ID NO: 21), Tio21 (SEQ ID NO: 22), Tio22 (SEQ ID NO: 23), Tio23 (SEQ ID NO: 24), Tio24 (SEQ ID NO: 25), Tio25 (SEQ ID NO: 26), Tio26 (SEQ ID NO: 27), Tio27 (SEQ ID NO: 28), Tio28 (SEQ ID NO: 29), ORF29 (SEQ ID NO: 30), ORF30 (SEQ ID NO: 31), ORF31 (SEQ ID NO: 32), ORF32 (SEQ ID NO: 33), ORF33 (SEQ ID NO: 34), ORF34 (SEQ ID NO: 35), ORF35 (SEQ ID NO: 36), ORF36 (SEQ ID NO: 37), ORF37 (SEQ ID NO: 38),

ORF38 (SEQ ID NO: 39), y combinaciones de las mismas, o fragmentos biológicamente activos de las mismas.

20. Un procedimiento para producir una proteína implicada en la biosíntesis de tiocoralina según cualquiera de las reivindicaciones 18 ó

19, que comprende crecer, bajo condiciones apropiadas, un organismo productor de tiocoralina, y, si se desea, aislar una o más de dichas proteínas implicadas en la biosíntesis de tiocoralina.

21. Un método para producir tiocoralina que comprende crecer, bajo condiciones apropiadas para producir dicho compuesto, un organismo productor de tiocoralina en el que se ha aumentado el número de copias de genes que codifican proteínas implicadas en la biosíntesis de tiocoralina, y, si se desea, aislar la tiocoralina.

22. Un método para producir tiocoralina que comprende crecer, bajo condiciones apropiadas para producir dicho compuesto, un organismo productor de tiocoralina en el que la expresión de los genes que codifican las proteínas responsables de la biosíntesis de tiocoralina ha sido modulada mediante manipulación o reemplazo de uno o más genes que codifican proteínas implicadas en la biosíntesis de tiocoralina o bien mediante la manipulación de las secuencias responsables de regular la expresión de dichos genes, y, si se desea, aislar la tiocoralina.

23. Método según cualquiera de las reivindicaciones 21 ó 22, en el que dicho organismo productor de tiocoralina es un actinomiceto, preferentemente Micromonospora sp.

24. Un método para producir tiocoralina que comprende crecer, bajo condiciones apropiadas para producir dicho compuesto, una célula hospedadora según cualquiera de las reivindicaciones 15 a 17, y, si se desea, aislar la tiocoralina.

25. Método según la reivindicación 24, en el que dicha célula hospedadora es un actinomiceto o un estreptomiceto.

26. Un procedimiento, basado en la utilización de genes responsables de la biosíntesis de tiocoralina de Micromonospora sp.

MLl 7 para la producción de dicho compuesto en otro actinomiceto, que comprende:

(1) la obtención de mutantes afectados en genes específicos de la ruta de biosíntesis de tiocoralina;

(2) el aislamiento de la región del cromosoma de Micromonospora sp. MLl que contiene el cluster de genes responsables de la biosíntesis de tiocoralina;

(3) la obtención y análisis de la secuencia de nucleótidos del cluster de genes responsables de la biosíntesis de tiocoralina; y

(4) la producción heteróloga de tiocoralina en otros actinomicetos.

Description:

GENES INVOLUCRADOS EN LA BIOSíNTESIS DE TIOCORALINA Y PRODUCCIóN HETERóLOGA DE LA MISMA

Campo de la invención

La presente invención está relacionada con el grupo de genes responsables de la biosíntesis de tiocoralina y su uso en la producción heteróloga de tiocoralina.

Antecedentes de la invención

La tiocoralina (I)

(I)

es un tiodepsipéptido ciclodimérico aislado de un actinomiceto marino, en concreto de la familia Micromonosporaceae (Pérez Baz et al., J. Antibiotics, 50(9), 738-741 , 1997; Romero et al., J. Antibiotics, 50(9), 734-737, 1997). Aunque se ha descrito que la tiocoralina se obtiene de Micromonospora marina o Micromonospora sp. L- 13-ACM-092, posteriores estudios han puesto de manifiesto que el compuesto también puede ser aislado del actinomiceto Micromonospora sp. MLl , el cual fue aislado de un molusco marino encontrado en la costa del

Océano índico, en Mozambique (Espliego, F. Tesis Doctoral, 1996, Universidad de León; de la Calle, F. Tesis Doctoral, 1998, Universidad Autónoma de Madrid) .

Estudios in υitro han demostrado la capacidad de la tiocoralina para inhibir el crecimiento de líneas celulares de diferentes tipos de tumores sólidos, tales como melanoma, cáncer de mama, pulmón no microcítico y colon. Asimismo, la tiocoralina ha mostrado poseer una marcada actividad antitumoral en ensayos in vivo frente a xenoinjertos (xenografts) de carcinomas humanos (Faircloth et al. Eur. J. Cáncer, 33, 175, 1997 (abstract)). Además, la tiocoralina muestra actividad antibacteriana frente a bacterias Gram-positivas.

Aunque la obtención de tiocoralina a partir de dicho actinomiceto marino (Micromonospora sp. MLl) es factible a pequeña escala, a gran escala dicha obtención se halla limitada debido a la variabilidad en la producción que se observa con ese microorganismo. Efectivamente, la producción de tiocoralina a partir de dicho organismo es un proceso que consume mucho tiempo debido a la baja tasa de crecimiento de ese organismo y muestra importantes fluctuaciones en los rendimientos de producción en diferentes lotes.

Por tanto, debido a que, por una parte, la obtención de tiocoralina a partir de dicho actinomiceto marino se halla bastante limitada, y, por otra parte, al hecho de que la molécula de tiocoralina posee una estructura compleja y su síntesis puede ser complicada a nivel industrial, es deseable entender las bases genéticas de su biosíntesis con el fin de crear unos medios para que influyan en su obtención de una manera dirigida. Ello podría dar lugar a un incremento en las cantidades de tiocoralina producidas, dado que las cepas productoras naturales generalmente producen el producto en baja concentración y de forma muy desigual. Asimismo, también podría permitir la

producción de tiocoralina en huéspedes que de forma natural no producen este compuesto.

El desarrollo de la tecnología del ADN recombinante ha abierto un interesante campo de investigación para la generación y producción de compuestos bioactivos mediante la manipulación de genes implicados en la biosíntesis de tales compuestos bioactivos, principalmente de bacterias del grupo de los actinomicetos. Estas técnicas pueden ser usadas para mejorar la producción de compuestos naturales ya conocidos, pues las cepas naturales suelen producir bajas concentraciones del metabolito de interés.

Asimismo, la expresión heteróloga del agrupamiento (cluster) de genes involucrados en la biosíntesis de tiocoralina en otros actinomicetos más apropiados para fermentación y manipulación genética permitiría producir dicho compuesto con rendimientos más reproducible en tiempos de fermentación más cortos.

Como es conocido, numerosas bacterias y hongos sintetizan una amplia variedad de péptidos biológicamente activos de origen no ribosomal, incluyendo antitumorales, antibióticos, etc. La biosíntesis de esta familia de compuestos se lleva a cabo por péptido sintetasas no ribosomales (NRPSs), que son enzimas multifuncionales con una organización modular de dominios catalíticos. Cada uno de estos módulos lleva a cabo un ciclo de elongación, es decir, activa e incorpora un aminoácido concreto en la estructura final del compuesto. Un módulo mínimo está constituido por tres dominios: (i) un dominio de adenilación (A, de aproximadamente 550 aminoácidos) que se encarga de seleccionar un determinado aminoácido y generar la versión aminoacil adenilada del mismo mediante el empleo de ATP; (ii) un dominio transportador peptidil (P, de aproximadamente 80 aminoácidos) que contiene un grupo prostético de fosfopan te teína (PP) que actúa como cofactor y se une por enlace covalente al dominio P;

este dominio se encarga de fijar él aminoácido adenilado activado antes de pasar a siguientes centros de reacción; y (iii) un dominio de condensación (C, de aproximadamente 450 aminoácidos) que genera un nuevo enlace peptídico entre dos restos aminoacil adenilados que se localizan en dos dominios P consecutivos. Los dominios C están ausentes en los módulos que activan el primer aminoácido del sistema. Algunas NRPSs poseen unos dominios extra para llevar a cabo actividades específicas, como epimerizaciones dando lugar a D- aminoácidos, metilaciones tipo N- o C-, circularizaciones actuando sobre los aminoácidos L-Cys o L-Ser. Generalmente, un último dominio, situado después del último módulo, se encarga de la liberación del enzima intermediario, generando un péptido linear o cíclico. Como regla general, la estructura de los diferentes módulos refleja la secuencia final de aminoácidos del péptido producto. Esta regla de colinealidad permite la asignación a cada módulo de una función específica de activación en una NRPS. Información sobre NRPSs puede encontrarse, por ejemplo, en Quing-Tao, S. et al, 2004. Dissecting and Exploiting Nonribosomal Peptide Synthetases. Acta Biochimica et Biophysica. Sínica, 36 (4): 243-249.

Compendio de la invención

Un objetivo importante de la presente invención consiste en aislar y caracterizar la secuencia de nucleótidos completa que codifica las proteínas responsables de la producción de tiocoralina. A partir de ahí, se puede aislar y determinar la función de las secuencias aminoacídicas que comprenden las proteínas involucradas en la biosíntesis de tiocoralina. Este objetivo puede alcanzarse proporcionando una nueva molécula de ácido nucleico, aislada y, opcionalmente, purificada, que codifica todas las proteínas relacionadas con la ruta biosintética completa de producción de tiocoralina.

Los inventores han sido capaces de identificar y clonar todos los genes responsables de la biosíntesis de tiocoralina, es decir, el cluster de genes implicados en la biosíntesis de tiocoralina, proporcionando las bases genéticas para mejorar y manipular de forma dirigida la producción de este compuesto.

Mediante el empleo de oligonucleótidos iniciadores derivados de secuencias consenso de los dominios de adenilación de péptido sintetasas no ribosomales (NRPSs) se amplificaron, mediante la reacción en cadena de la polimerasa (PCR), 6 fragmentos del cromosoma de Micromonospora sp. MLl, conteniendo todos ellos fragmentos de los dominios de adenilación de las NRPSs putativas (hipotéticas) denominados PSVl, PSV2, PSV3, PSV4, PSV5 y PSV6 (Ejemplo 3). La inactivación, por inserción, de dichos dominios de adenilación puso de manifiesto que dos de ellos (PSV2 y PSV5) generaban mutantes no- productores de tiocoralina, lo que indicaba que estaban implicados en la biosíntesis de tiocoralina (Ejemplos 7 y 10).

La secuenciación de una región de ADN de aproximadamente 64,6 kilobases (kb) (SEQ ID NO: 1) reveló la presencia de 36 marcos de lectura abiertos (ORFs) completos y otros 2 ORFs incompletos (Ejemplo

12, Tabla 1). La expresión heteróloga de una región de 53 kb aproximadamente, conteniendo 26 de dichas ORFS, en Streptomyces coelicolor, Streptomyces albus y Streptomyces lividans condujo a la producción de tiocoralina en dichos actinomicetos (Ejemplo 19).

El cluster de genes responsable de la biosíntesis de la tiocoralina se representa esquemáticamente en la Figura 1. Sorprendentemente, el cluster de genes de tiocoralina contiene más genes codificantes de NRPSs que los que cabría esperar en base al número de aminoácidos del esqueleto peptídico. Algunas de las proteínas identificadas están implicadas en la formación de la estructura peptídica de la tiocoralina, como, por ejemplo, varias de las NRPSs identificadas como Tiol2, Tiol7,

Tiolδ, Tiol9, Tio20, Tio21, Tio22, Tio27 y Tio28. Las proteínas identificadas como Tio20 y Tio21 constituyen probablemente las NRPSs implicadas en la biosíntesis del esqueleto de la tiocoralina y, probablemente, otras dos NRPSs, identificadas como Tio27 y Tio 28 podrían ser las responsables de la biosíntesis de un péptido pequeño que podría estar implicado en la regulación de la biosíntesis de tiocoralina en Micromonospora sp. MLl . Aparecen también varias proteínas que pueden estar relacionadas con procesos de resistencia, como Tio5, Tio6 y Tio23. Los posibles reguladores de la ruta de tiocoralina identificados en la región secuenciada corresponden a Tk>3, Tio4, Tio7, Tio24 y Tio25. Aparecen por último también varias proteínas relacionadas con la generación de la unidad iniciadora 3-hidroxi- quinaldato, Tio8, Tio9, TiolO y Tiol l . Los genes cuya interrupción génica genera un fenotipo no productor de tiocoralina se encuentran señalizados en la Figura 1 mediante un asterisco (tio20, tio27y tio28).

Por tanto, la presente invención se relaciona con la identificación y clonaje del cluster de los genes responsables de la biosíntesis de tiocoralina. Dicho cluster de genes responsables de la biosíntesis de tiocoralina y su expresión en una célula hospedadora apropiada permite la producción eficiente de tiocoralina.

En consecuencia, en un aspecto, la invención se relaciona con una molécula de ácido nucleico aislada que comprende una secuencia de nucleótidos que codifica al menos una proteína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma.

En otro aspecto, la invención se relaciona con una composición que comprende, al menos, una molécula de ácido nucleico proporcionada por esta invención.

En otro aspecto, la invención se relaciona con una sonda que comprende una molécula de ácido nucleico proporcionada por esta invención o un fragmento de la misma.

En otro aspecto, la invención se relaciona con un vector que comprende una molécula de ácido nucleico proporcionada por esta invención.

En otro aspecto, la invención se relaciona con una célula hospedadora trasformada o transfectada con un vector proporcionada por esta invención.

En otro aspecto, la invención se relaciona con una proteína codificada por una molécula de ácido nucleico proporcionada por esta invención.

En otro aspecto, la invención se relaciona con un método para producir una proteína implicada en la biosíntesis de tiocoralina, que comprende el empleo de un organismo productor de tiocoralina cuyo genoma ha sido manipulado.

En otro aspecto, la invención se relaciona con un procedimiento, basado en la utilización de genes responsables de la biosíntesis de tiocoralina de Micromonospora sp. MLl, para la producción de tiocoralina en otro actinomiceto.

Descripción de las figuras

Figura 1. Representación esquemática del cluster de genes de la tiocoralina y de los genes que los rodean incluyendo la organización génica de la zona del cromosoma de Micromonospora sp. MLl secuenciada. Se muestran los sitios de restricción utilizados para la

construcción de los plásmidos para la expresión heteróloga del cluster de genes de tiocoralina.

Figura 2. Representación esquemática de los cósmidos cosV33-D 12 y pCT2c. orí: origen de replicación para E. coli. SCP2: origen de replicación para Streptomyces. aac(3)W: gen de resistencia a apramicina. neo: gen de resistencia a neomicina. bla: gen de resistencia a ampicilina. SV40 orí: origen eucariótico para replicación episómica.

Figura 3. Esquema de clonaciones realizadas para la construcción del plásmido pFL1036. ori: origen de replicación para E. coli. M13 ori: origen de replicación para el fago M13. oriT: origen de transferencia conjugativa. lacZ: gen de la beta-galactosidasa. kan R : gen de resistencia a kanamicina. aac(3)W: gen de resistencia a apramicina. bla: gen de resistencia a ampicilina.

Figura 4. Esquema de clonaciones realizadas para la construcción del plásmido pFL1041. ori: origen de replicación para E. coli. SCP2: origen de replicación para Streptomyces. oriT: origen de transferencia conjugativa. lacZ: gen de la beta-galactosidasa. aac(3)ϊV: gen de resistencia a apramicina.

Figura 5. Esquema de clonaciones realizadas para la construcción del plásmido pAR15AT. ori pl5A: origen de replicación para E. coli. oriT: origen de transferencia conjugativa. intφC31 : gen de la integrasa del fago φC31. attP: sitio de recombinación sitio-específica. kan R : gen de resistencia a kanamicina. aac(3)TV: gen de resistencia a apramicina. κ : sitio de corte tratado con el fragmento Klenow de la ADN polimerasa de E. coli.

Figura 6. Esquema de clonaciones realizadas para la construcción del plásmido pAPR. ori pl5A: origen de replicación para E. coli oriT: origen de transferencia conjugativa. ori M 13: origen de replicación del fago M 13. ori: origen de replicación para E. coli lacZ: gen de la beta- galactosidasa. lacl: gen del represor del operón lactosa. intφC31: gen de la integrasa del fago φC31. attP: sitio de recombinación sitio-específica. kan R : gen de resistencia a kanamicina. aac(3)W: gen de resistencia a apramicina. κ : sitio de corte tratado con el fragmento Klenow de la ADN polimerasa de E. coli. PermE'- promotor del gen ermE.

Figura 7. Representación de los plásmidos pFL1048, pFL1048r y pFL1049. ori pl5A: origen de replicación para E. coli. oriT: origen de transferencia conjugativa. intφC31: gen de la integrasa del fago φC31. attP: sitio de recombinación sitio-específica. aac(3)W: gen de resistencia a apramicina.

Figura 8A. Cromatograma de HPLC de un extracto de un cultivo de Streptomyces albus (pFL1049) después de 7 días de crecimiento en medio R5A. Se muestra el pico correspondiente a tiocoralina y su tiempo de retención, 27 minutos.

Figura 8B. Espectro de absorción UV del producto (tiocoralina) presente en el pico de 27 minutos mostrado en la Figura 8A.

Figura 8C. Espectro de masas del producto (tiocoralina) presente en el pico de 27 minutos mostrado en la Figura 8A.

Descripción detallada de la invención

De acuerdo con la presente invención, se proporciona una nueva molécula de ácido nucleico, aislada y, opcionalmente purificada, que

codifica la totalidad o parte de las proteínas involucradas en la ruta biosintética completa de producción de tiocoralina.

Por tanto, en un aspecto, la invención se relaciona con una molécula de ácido nucleico, en adelante, molécula de ácido nucleico de la invención, preferentemente una molécula de ácido nucleico aislada, opcionalmente purificada, que comprende una secuencia de nucleótidos que codifica al menos una proteína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma. En general, dicha pro teína de la ruta biosintética de producción de tiocoralina es una péptido sintetasa no ribosomal (NRPS). Las NRPSs son las responsables de la biosíntesis de tiocoralina.

Tal como aquí se utiliza, la expresión "fragmento biológicamente activo", aplicado a una proteína de la ruta biosintética de ' producción de tiocoralina, se refiere a una parte de la estructura de la proteína que retiene la función activa de la proteína longitud completa. Dichos fragmentos biológicamente activos pueden ser codificados por las regiones correspondientes de la molécula de ácido nucleico de la invención. El tamaño de dichas regiones de la molécula de ácido nucleico de la invención puede variar dentro de un amplio intervalo; no obstante, en una realización particular, dichas regiones pueden tener al menos 10, 15, 20, 25, 50, 100, 1.000, 2.500, 5.000, 10.000, 20.000,

25.000 o más nucleótidos de longitud. Normalmente dichas regiones tienen entre 100 y 10.000 nucleótidos de longitud, preferentemente entre 100 y 7.500, y son biológicamente funcionales, es decir, pueden codificar un fragmento biológicamente activo de una proteína de la ruta biosintética de producción de tiocoralina.

La molécula de ácido nucleico de la invención puede ser una molécula de ácido desoxirribonucleico (ADN) o de ácido ribonucleico (ARN). Asimismo, la molécula de ácido nucleico de la invención puede ser una molécula de ácido nucleico monocatenario o bien una molécula

de ácido nucleico bicatenario derivada. Ejemplos ilustrativos, no limitativos, de moléculas de ácido nucleico de la invención moléculas de ADN genómico (ADNg), moléculas de ARN mensajero (ARNm) y moléculas de ADN complementarias (ADNc) a moléculas de ARNm.

Quedan incluidos dentro del ámbito de la presente invención los mutantes y variantes de la molécula de ácido nucleico de la invención. Entre dichos mutantes y variantes se incluyen las moléculas de ácido nucleico de la invención en las que, al menos, un nucleótido ha sido alterado, sustituido, eliminado o insertado. A modo ilustrativo, los mutantes y variantes de la molécula de ácido nucleico de la invención pueden tener 1 , 2, 3, 4, 5, 10, 15, 25, 50, 100, 200, 500 y más cambios (alteraciones, sustituciones, eliminaciones o inserciones) de nucleótidos. También son posibles variantes degeneradas que codifican la misma pro teína, así como variantes no degeneradas que codifican una proteína distinta. La secuencia de nucleótidos de dichos mutantes y variantes codifica una proteína, o un fragmento biológicamente activo de la misma, que conserva, al menos, una de las actividades o funciones biológicas de la proteína correspondiente codificada por cualquier marco de lectura abierto (ORF) del cluster de genes responsables de la biosíntesis de tiocoralina. Las formas alélicas de los genes de dicho cluster así como los polimorfismos también se hallan comprendidos dentro del ámbito de la presente invención.

En una realización particular, la molécula de ácido nucleico de la invención es una molécula de ácido nucleico aislada, opcionalmente purificada, que comprende una secuencia de nucleótidos que codifica la totalidad de las proteínas de la ruta biosintética de producción de tiocoralina, o fragmentos biológicamente activos de las mismas. En este caso, la molécula de ácido nucleico de la invención comprende la secuencia de nucleótidos que contiene el cluster completo de genes responsables de la biosíntesis de tiocoralina.

La secuencia de nucleótidos del cluster completo de genes responsables de la biosíntesis de tiocoralina se recoge en la SEQ ID NO:

1, una secuencia de ADN genómico de 64.650 pares de bases (pb) de

Micromonospora sp. MLl . El ámbito de la invención también incluye la cadena complementaria a la secuencia de nucleótidos mostrada en la

SEQ ID NO: 1 , es decir, la formada por nucleótidos que son complementarios a los indicados en la SEQ ID NO: 1 (e.g., A sustituido por T, C sustituido por G y viceversa) y/ o secuencias de nucleótidos inversas [es decir, las secuencias generadas cambiando la dirección del sentido de la lectura e.g., de (5' → 3') a (3' → 5')].

La presente invención incluye, además, una molécula de ácido nucleico que hibrida con la molécula de ácido nucleico de la invención que tiene la secuencia de nucleótidos mostrada en la SEQ ID NO: 1 o su cadena complementaria; dicha molécula puede ser aislada de uri organismo productor de tiocoralina y codifica, al menos, una proteína de la ruta biosintética de producción de tiocoralina. Las técnicas y condiciones típicas de hibridación, conocidas por los expertos en la materia, se mencionan, por ejemplo, en Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition, CoId Spring Harbor Laboratory Press, CoId Spring Harbor, NY (1989). En general, se utilizan condiciones convencionales o severas de hibridación para sondas homologas, mientras que se usan condiciones de hibridación menos severas para sondas parcialmente homologas que tienen menos del 100% de homología con la secuencia de la molécula del ácido nucleico diana. En este último caso (sondas parcialmente homologas), se pueden realizar una serie de hibridaciones Southern o Northern con diferentes condiciones. A modo ilustrativo, cuando la hibridación se lleva a cabo en un disolvente que contiene formamida, las condiciones preferidas incluyen el empleo de una temperatura y una fuerza iónica constante de, aproximadamente, 42°C con una solución que contiene 6X SSC, 50% de formamida. Condiciones de hibridación menos severas pueden utilizar la misma temperatura y fuerza iónica aunque, en este caso, la

cantidad de formamida en el tampón de anillamiento sería menor (de aproximadamente 45% a 0%). Alternativamente, la hibridación puede llevarse a cabo en soluciones acuosas que no contienen formamida. En general, para la hibridación en medio acuoso, la fuerza iónica de la solución acuosa se mantiene igual, típicamente de aproximadamente Na + 1 M, mientras que la temperatura de anillamiento puede reducirse de 68°C a 42°C.

La secuenciación del cluster completo de genes responsables de la biosín tesis de tiocoralina (SEQ ID NO: 1) reveló la presencia de 36 marcos de lectura abiertos (ORFs) completos y de otros 2 ORFs incompletos (ORFl y ORF38, véase más adelante). En la Tabla 1

(Ejemplo 12) se recoge la posición de los distintos ORFs implicados en la ruta biosintética de producción de tiocoralina, así como las secuencias de aminoácidos codificadas por dichos ORFs.

La molécula completa de ADN cromosómico (genómico) que contiene el cluster de genes responsables de la biosíntesis de tiocoralina, que codifica todas las proteínas biosintéticas esenciales para la producción de tiocoralina, ha sido empaquetada eficientemente en dos plásmidos, concretamente en los cósmidos SuperCosl y pKC505 (Ejemplos 1 y 2). Esos dos cósmidos, que contienen el cluster de genes responsables de la biosíntesis de tiocoralina, son suficientes para regenerar la ruta biosintética completa para la producción de tiocoralina. Por tanto, en una realización particular, la invención proporciona el cluster completo de genes biosintéticos de tiocoralina en dos cósmidos lo que permite disponer de unos medios sustancialmente más eficientes para producir tiocoralina.

En una realización particular, la molécula de ácido nucleico de la invención es una molécula de ácido nucleico aislada, opcionalmente purificada, que comprende una secuencia de nucleótidos que codifica una proteína de la ruta biosintética de producción de tiocoralina, o un

fragmento biológicamente activo de la misma. En una realización concreta, la molécula de ácido nucleico de la invención se selecciona del grupo de genes formado por:

- la molécula de ácido nucleico que comprende los nucleótidos 2- 535 de la SEQ ID NO: 1 {orfl);

- la molécula de ácido nucleico que comprende los nucleótidos 993- 1 130c de la SEQ ID NO: 1 {orf2);

- la molécula de ácido nucleico que comprende los nucleótidos 1517-2131 de la SEQ ID NO: 1 (tio3); - la molécula de ácido nucleico que comprende los nucleótidos

2154-2822c de la SEQ ID NO: 1 (ízo4); la molécula de ácido nucleico que comprende los nucleótidos 2970-379 Ic de la SEQ ID NO: 1 [UoS);

- la molécula de ácido nucleico que comprende los nucleótidos 3794-4777c de la SEQ ID NO: 1 (íio6); la molécula de ácido nucleico que comprende los nucleótidos 4904-561 1 dé la SEQ ID NO: 1 {tio7);

- la molécula de ácido nucleico que comprende los nucleótidos 5701 -6426c de la SEQ ID NO: 1 {tio8); - la molécula de ácido nucleico que comprende los nucleótidos

6426-7688c de la SEQ ID NO: 1 {tio9); la molécula de ácido nucleico que comprende los nucleótidos 7733-8524c de la SEQ ID NO: 1 (tiol O);

- la molécula de ácido nucleico que comprende los nucleótidos 8791-10002 de la SEQ ID NO: 1 {tiol l);

- la molécula de ácido nucleico que comprende los nucleótidos 10002-1 159Oc de la SEQ ID NO: 1 (tiol2);

- la molécula de ácido nucleico que comprende los nucleótidos 11847-13634 de la SEQ ID NO: 1 {tiol3); - la molécula de ácido nucleico que comprende los nucleótidos

13734-15005c de la SEQ ID NO: 1 {tiol4);

- la molécula de ácido nucleico que comprende los nucleótidos 15005-16354c de la SEQ ID NO: 1 (fío J 5);

- la molécula de ácido nucleico que comprende los nucleótidos 16441- 18744c de la SEQ ID NO: 1 (tiol β);

- la molécula de ácido nucleico que comprende los nucleótidos 18774- 19055c de la SEQ ID NO: 1 (izo 17); - la molécula de ácido nucleico que comprende los nucleótidos

19260-20036 de la SEQ ID NO: 1 {tiol8);

- la molécula de ácido nucleico que comprende los nucleótidos 20146-20880c de la SEQ ID NO: 1 (tiol 9);

- la molécula de ácido nucleico que comprende los nucleótidos 21 188-28969 de la SEQ ID NO: 1 {tio20);

- la molécula de ácido nucleico que comprende los nucleótidos 28979-38398 de la SEQ ID NO: 1 [tio21);

- la molécula de ácido nucleico que comprende los nucleótidos 38449-38661 de la SEQ ID NO: 1 {tio22); - la molécula de ácido nucleico que comprende los nucleótidos

38642-41263 de la SEQ ID NO: 1 (tio23);

- la molécula de ácido nucleico que comprende los nucleótidos 41835-42368 de la SEQ ID NO: 1 {tio24);

- la molécula de ácido nucleico que comprende los nucleótidos 42395-43255c de la SEQ ID NO: 1 (tio25); la molécula de ácido nucleico que comprende los nucleótidos 43340-4374 Ic de la SEQ ID NO: 1 (tio26);

- la molécula de ácido nucleico que comprende los nucleótidos 44152-49563 de la SEQ ID NO: 1 (tio27); - la molécula de ácido nucleico que comprende los nucleótidos

49635-53669 de la SEQ ID NO: 1 (tio28); la molécula de ácido nucleico que comprende los nucleótidos 53749-55305c de la SEQ ID NO: 1 (orf29);

- la molécula de ácido nucleico que comprende los nucleótidos 55384-57222c de la SEQ ID NO: 1 (orf30); la molécula de ácido nucleico que comprende los nucleótidos 57895-58467c de la SEQ ID NO: 1 {orf31);

- la molécula de ácido nucleico que comprende los nucleótidos 58535-59206c de la SEQ ID NO: 1 (orf32);

- la molécula de ácido nucleico que comprende los nucleótidos 59298-59564c de la SEQ ID NO: 1 {orf33); - la molécula de ácido nucleico que comprende los nucleótidos

5961 1-601 14c de la SEQ ID NO: 1 (orf34);

- la molécula de ácido nucleico que comprende los nucleótidos 60202-60888 de la SEQ ID NO: 1 {orf35);

- la molécula de ácido nucleico que comprende los nucleótidos 60960-62240 de la SEQ ID NO: 1 {orf36);

- la molécula de ácido nucleico que comprende los nucleótidos 62300-62833 de la SEQ ID NO: 1 {orf37);

- la molécula de ácido nucleico que comprende los nucleótidos 62925-64650 de la SEQ ID NO: 1 [orf38); o fragmentos de las mismas que codifican fragmentos biológicamente activos de proteínas de la ruta biosintética de producción de tiocoralina.

En otra realización particular, la molécula de ácido nucleico de la invención es una molécula de ácido nucleico aislada, opcionalmente purificada, que comprende una secuencia de nucleótidos que codifica dos o más proteínas de la ruta biosintética de producción de tiocoralina, o fragmentos biológicamente activos de las mismas. En una realización concreta, la molécula de ácido nucleico de la invención comprende una secuencia de nucleótidos que comprende dos o más genes seleccionados entre los genes identificados como orfl, orf2, tio3, tio4, tio5, tio6, tio7, tio8, fio 9, fio 10, fio J J, tiol2, tiol3, Ho 14, fio 15, tío 16, tiol 7, tío 18, tiol 9, tio20, tio21, tio22, tio23, tio24, tio25, tio26, tio27, tio28, oτf29, orf30, orβl, orf32, orf33, orf34, orf35, orf36, orf37, orf38 y fragmentos de los mismos que codifican fragmentos biológicamente activos de proteínas de la ruta biosintética de producción de tiocoralina.

En otra realización particular, la molécula de ácido nucleico de la invención es una molécula de ácido nucleico aislada, opcionalmente

1

purificada, que comprende una secuencia de nucleótidos que codifica al menos una proteína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma, o un mutante o variante de la misma, en donde dicha proteína se selecciona del grupo formado por las proteínas identificadas como ORFl (SEQ ID NO: 2), ORF2 (SEQ ID NO: 3), Tio3 (SEQ ID NO: 4), Tio4 (SEQ ID NO: 5), Tio5 (SEQ ID NO: 6), Tioδ (SEQ ID NO: 7), Tio7 (SEQ ID NO: 8), Tio8 (SEQ ID NO: 9), Tio9 (SEQ ID NO: 10), TiolO (SEQ ID NO: 11), Tiol l (SEQ ID NO: 12), Tiol2 (SEQ ID NO: 13), Tiol3 (SEQ ID NO: 14), Tiol4 (SEQ ID NO: 15), Tiol5 (SEQ ID NO: 16), Tiolβ (SEQ ID NO: 17), Tiol7 (SEQ ID NO: 18), Tiolδ (SEQ ID NO: 19), Tiol9 (SEQ ID NO: 20), Tio20 (SEQ ID NO: 21), Tio21 (SEQ ID NO: 22), Tio22 (SEQ ID NO: 23), Tio23 (SEQ ID NO: 24), Tio24 (SEQ ID NO: 25), Tio25 (SEQ ID NO: 26), Tio26 (SEQ ID NO: 27), Tio27 (SEQ ID NO: 28), Tio28 (SEQ ID NO: 29), ORF29 (SEQ ID NO: 30), ORF30 (SEQ ID NO: 31), ORF31 (SEQ ID NO: 32), ORF32 (SEQ ID NO: 33), ORF33 (SEQ ID NO: 34), ORF34 (SEQ ID NO: 35), ORF35 (SEQ ID NO: 36), ORF36 (SEQ ID NO: 37), ORF37 (SEQ ID NO: 38), ORF38 (SEQ ID NO: 39). Dichas proteínas pueden obtenerse a partir de los correspondientes orfs previamente mencionados (orfl, orf2, tio3, tio4, tio5, tioδ, tio7, tio8, tio9, tiol O, tiol l, tio!2, tio!3, tiol4, tio! 5, tiol δ, tio! 7, tiolδ, tiol 9, tio20, tio21, tio22, tio23, tio24, tio25, tio26, tio27, tio28, orf29, orf30, orβl, orf32, orf33, orf34, orf35, orf36, orf37, orf38) del cluster de genes responsables de la biosíntesis de tiocoralina (SEQ ID NO: 1), o de las correspondientes regiones, mutantes o variantes de los mismos.

En otra realización particular, la molécula de ácido nucleico de la invención es una molécula de ácido nucleico aislada, opcionalmente purificada, que comprende una secuencia de nucleótidos que codifica al menos una variante de una pro teína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma, en donde dicha variante es, al menos, un 30%, ventajosamente un 50%, preferentemente un 60%, más preferentemente un 70%, aún

más preferentemente un 80%, particularmente un 90%, más particularmente un 95% o más, idéntica en su secuencia de aminoácidos a la de una proteína seleccionada entre las proteínas cuyas secuencias de aminoácidos se muestran en SEQ ID NO: 2-39, o a fragmentos biológicamente activos de las mismas. Dicha variante conserva, al menos, una de las actividades o funciones biológicas de la correspondiente proteína codificada por cualquiera de los orfs del cluster de genes responsables de la biosíntesis de tiocoralina.

En otro aspecto, la presente invención se relaciona con una composición que comprende, al menos, una molécula de ácido nucleico de la invención, preferentemente una molécula aislada de ácido nucleico. En una realización particular, dicha composición comprende una molécula de ácido nucleico de la invención. En otra realización particular, dicha composición comprende dos o más moléculas de ácido nucleico de la invención. Dichas moléculas de ácido nucleico pueden ser tanto de ADN como de ARN.

La molécula de ácido nucleico de la invención puede ser aislada a partir de cualquier organismo productor de tiocoralina, bien de forma natural o bien de forma recombinante porque se haya insertado el cluster de genes responsables de la biosíntesis de tiocoralina en una célula hospedadora (host) apropiada; no obstante, en una realización particular, dicha molécula de ácido nucleico de la invención ha sido aislada del actinomiceto marino Micromonospora sp. MLl (véase la parte experimental, Etapa 1 , Ejemplos 1-4).

El aislamiento y caracterización del ADN genómico (cromosómico) y del ADN recombinante clonado, a partir de células hospedadoras apropiadas puede realizarse mediante técnicas de hibridación convencionales o severas, utilizando la totalidad o parte de una secuencia de nucleótidos como sonda para rastrear una genoteca apropiada.

Por tanto, en otro aspecto, la invención se relaciona con una sonda que comprende una molécula de ácido nucleico de la invención o un fragmento de la misma. En general, las sondas comprenden convenientemente una secuencia de al menos 5, 10, 15, 20, 25, 30, 40, 50, 60 o más nucleótidos. Las secuencias con una longitud de 20 a 60 nucleótidos son las preferidas. En una realización particular, dicha sonda puede utilizarse para la detección de genes implicados en la biosíntesis de tiocoralina en Micromonospora sp. El empleo de dicha sonda para la detección de un ácido nucleico, e.g., ADNg, ADNc o ARNm, relacionado con la biosíntesis de tiocoralina constituye un aspecto adicional de esta invención.

Alternativamente, el aislamiento y caracterización del ADN genómico (cromo sómico) y del ADN recombinante clonado, a partir de células hospedadoras apropiadas puede realizarse mediante técnicas basadas en la amplificación enzimática de ácidos nucleicos. A modo ilustrativo, se pueden diseñar oligonucleótidos iniciadores (en base a las secuencias conocidas de ADN y de proteínas implicadas en la biosíntesis de tiocoralina) que pueden ser utilizados en reacciones de amplificación enzimática, por ejemplo, PCR, para amplificar e identificar otras secuencias idénticas o relacionadas.

Las moléculas de ácido nucleico de la invención pueden ser aisladas y, si se desea, purificadas, por métodos convencionales.

Aunque, en general, las moléculas de ácido nucleico de la invención se obtendrán por métodos recombinantes o de aislamiento, la invención también contempla la posibilidad de que las moléculas de ácido nucleico de la invención sean obtenidas por síntesis química, las cuales tendrán la misma, o sustancialmente la misma, estructura que las derivadas directamente de los organismos productores de tiocoralina, tanto tipo salvaje (wt) como mutantes.

En otro aspecto, la invención se relaciona con un vector, en adelante vector de la invención, que comprende una molécula de ácido nucleico de la invención que codifica al menos una pro teína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma. En una realización particular, el vector de la invención es un vector o un plásmido biológicamente funcional, tal como un vector de clonación o un vector de expresión.

En una realización concreta, el vector de la invención es un vector de clonación, preferentemente, un cósmido. Los vectores de clonación preferidos se seleccionan por su capacidad para incorporar grandes secuencias de ADN (e.g., clusters completos de genes implicados en la biosíntesis de productos de interés). En general, dichos vectores son vectores convencionales y están disponibles comúnmente. En la presente invención se contempla, además, que el material genético pueda reducirse para finalmente contenerse en un sólo vector o plásmido de clonación (e.g., cósmido) mediante manipulación genética por técnicas conocidas por el experto en la materia. El ensamblaje puede llevarse a cabo mediante clonaje, PCR o genes sintéticos o combinación de cualquiera de estas técnicas conocidas en el estado de la técnica.

En otra realización particular, el vector de la invención es un vector de expresión apropiado para su inserción en una célula hospedadora adecuada. La inserción de dicho vector en dicha célula hospedadora adecuada puede realizarse por cualquier método convencional de transferencia de material genético (e.g., transformación, transfección, etc.).

Por tanto, en otro aspecto, la invención se relaciona con una célula hospedadora, en adelante célula hospedadora de la invención, trasformada o transfectada con un vector de la invención. Dicha célula hospedadora de la invención contiene una o más moléculas de ácido

nucleico de la invención. En una realización particular, la célula hospedadora de la invención contiene una molécula de ácido nucleico de la invención. En otra realización particular, la célula hospedadora de la invención contiene dos o más moléculas de ácido nucleico de la invención; en este caso, dichas moléculas de ácido nucleico de la invención pueden ser iguales o diferentes entre sí.

Una célula hospedadora de la invención preferida es una célula hospedadora trasformada o transfectada establemente con un vector de la invención que comprende una molécula de ácido nucleico (exógeno) de la invención que comprende una secuencia de nucleótidos que codifica al menos una proteína de la ruta biosintética de producción de tiocoralina, o un fragmento biológicamente activo de la misma, de forma suficiente como para dirigir la biosín tesis y/ o ensamblaje de la tiocoralina. Preferentemente, la célula hospedadora es un microorganismo, más preferentemente una bacteria. En una realización particular, dicha célula hospedadora es una bacteria Gram-positiva, tal como un actinomiceto, por ejemplo, un estreptomiceto.

Aunque en los ejemplos de la presente invención se han usado diversas especies de estreptomicetos, tales como Streptomyces coelicolor, Streptomyces lividans, Streptomyces albus y Streptomyces aveimitilis como hospedadores heterólogos, la expresión heteróloga de los genes implicados en la biosíntesis de la tiocoralina se puede realizar en otros estreptomicetos, actinomicetos, etc., siempre y cuando sean capaces de ser transformados, preferentemente de forma estable, con los vectores de la invención. La expresión in υitro de las proteínas puede ser realizada, si se desea, usando métodos convencionales.

En una realización particular, la invención proporciona una célula hospedadora de la invención, tal como, por ejemplo, una bacteria recombinante, en la que, al menos, una región de la molécula de ácido nucleico de la invención ha sido alterada para dar lugar a una célula

hospedadora recombinante, tal como una bacteria recombinante, que produce niveles alterados de tiocoralina con respecto a la correspondiente célula (bacteria) productora de tiocoralina no recombinante, es decir, wt. Para ello, se pueden utilizar técnicas convencionales conocidas por los expertos en la materia que incluyen por ejemplo, aumentar el número de copias de los genes responsables de los dominios más importantes de las NRPSs implicadas en la producción de tiocoralina o aumentar las secuencias reguladoras de la expresión génica de esos genes por técnicas de ingeniería genética conocidas en el estado de la técnica y así aumentar el rendimiento en la producción de tiocoralina.

En otro aspecto, la invención se relaciona con una proteína, en adelante proteína de la invención, codificada por la molécula de ácido nucleico de la invención.

Tal como aquí se utiliza, el término "proteína" significa polipéptidos, enzimas y similares, codificados por la molécula de ácido nucleico de la invención que comprende la ruta biosintética para la producción de tiocoralina. Las proteínas de la invención incluyen cadenas de aminoácidos de longitudes variables, incluyendo cadenas de aminoácidos de longitud completa, en donde los restos de los aminoácidos están unidos por enlaces peptídicos covalentes, así como fragmentos biológicamente activos de dichas proteínas implicadas en la biosíntesis de tiocoralina, así como las variantes biológicamente activas de las mismas. Las proteínas de la invención pueden ser naturales, recombinantes o sintéticas. A modo ilustrativo, dichas proteínas implicadas en la biosíntesis de tiocoralina pueden ser producidas a través de la tecnología del ADN recombinante convencional insertando una secuencia de nucleótidos que codifica la proteína en un vector de expresión apropiado y expresar la proteína en una célula hospedadora apropiada o bien a través de síntesis química convencional de péptidos, por ejemplo, mediante el método de síntesis en fase sólida de Merrifield

(Merrifield, J. Am. Chem. Soc. 85:2149-2154 (1963)) en el que los aminoácidos se unen de forma individual y secuencial a la cadena aminoacídica. Alternativamente, la síntesis de proteínas de la invención puede realizarse utilizando equipos para la síntesis automatizada de proteínas comercializados por distintos fabricantes (e.g., Perkin-Elmer, Inc.).

Las variantes biológicamente activas incluidas dentro del ámbito de la presente invención comprenden, como mínimo, un fragmento biológicamente activo de la secuencia de aminoácidos codificada por la molécula de ácido nucleico de la invención, es decir, una parte de la estructura de la proteína que retiene la función activa de la proteína, por ejemplo, la parte de la tioesterasa codificada por el gen tiol8 que tiene la misma, o sustancialmente la misma, actividad que la proteína Tio 18 codificada por dicho gen tiol 8, es decir, tiene, al menos, una similaridad o potencia de, al menos, aproximadamente un 70%, ventajosamente de, al menos, un 80%, preferentemente de, al menos, un 90%, más preferentemente, de alrededor del 95% aproximadamente.

Las variantes biológicamente activas de las proteínas de la invención incluyen estructuras de aminoácidos activas en las que se han eliminado, sustituido o añadido aminoácidos, alelos que ocurren de forma natural, etc. El fragmento biológicamente activo puede ser identificado fácilmente sometiendo la proteína, longitud completa, a digestión química o enzimática para preparar fragmentos y, a continuación, ensayar dichos fragmentos mediante ensayos convencionales para analizar los fragmentos de la estructura aminoacídica que conservan la misma, o sustancialmente la misma, actividad biológica que la proteína longitud completa.

En una realización particular, la proteína de la invención es una proteína aislada, opcionalmente purificada, implicada en la biosíntesis de tiocoralina, codificada por un gen seleccionado del grupo formado

por los genes identificados como orfl, orf2, tio3, tio4, tio5, tioβ, tio7, tio8, tio9, tiol O, tiol l, tiol2, tiol3, tiol4, tiol δ, tiol 6, tiol 7, tiol 8, tiol 9, tio20 s tio21, tio22, tio23, tio24, tio25, tio26, tio27, tio28, orf29, orf30, oφl, orf32, orf33, orf34, orf35, orf36, or/37y orf38.

En otra realización particular, la proteína de la invención es una proteína aislada, opcionalmente purificada, implicada en la biosíntesis de tiocoralina, seleccionada del grupo formado por las proteínas identificadas como ORFl (SEQ ID NO: 2), ORF2 (SEQ ID NO: 3), Tio3 (SEQ ID NO: 4), Tio4 (SEQ ID NO: 5), Tio5 (SEQ ID NO: 6), Tio6 (SEQ ID NO: 7), Tio7 (SEQ ID NO: 8), Tio8 (SEQ ID NO: 9), Tio9 (SEQ ID NO: 10), TiolO (SEQ ID NO: 11), Tiol l (SEQ ID NO: 12), Tiol2 (SEQ ID NO: 13), Tiol3 (SEQ ID NO: 14), Tiol4 (SEQ ID NO: 15), Tiol5 (SEQ ID NO: 16), Tiol6 (SEQ ID NO: 17), Tiol7 (SEQ ID NO: 18), Tiolβ (SEQ ID NO: 19), Tiol9 (SEQ ID NO: 20), Tio20 (SEQ ID NO: 21), Tio21 (SEQ ID NO: 22), Tio22 (SEQ ID NO: 23), Tio23 (SEQ ID NO: 24), Tio24 (SEQ ID NO: 25), Tio25 (SEQ ID NO: 26), Tio26 (SEQ ID NO: 27), Tio27 (SEQ ID NO: 28), Tio28 (SEQ ID NO: 29), ORF29 (SEQ ID NO: 30), ORF30 (SEQ ID NO: 31), ORF31 (SEQ ID NO: 32), ORF32 (SEQ ID NO: 33), ORF33 (SEQ ID NO: 34), ORF34 (SEQ ID NO: 35), ORF35 (SEQ ID NO: 36), ORF36 (SEQ ID NO: 37), ORF37 (SEQ ID NO: 38), ORF38 (SEQ ID NO: 39), y combinaciones de las mismas, o fragmentos biológicamente activos de las mismas. Las funciones hipotéticas de dichas proteínas se recogen en la Tabla 1.

Los orfs del cluster de genes responsable de la biosíntesis de tiocoralina, que codifican las proteínas implicadas en la biosíntesis de dicho compuesto, pueden ser identificados utilizando técnicas convencionales. Ejemplos ilustrativos, no limitativos, de dichas técnicas incluyen el análisis computacional para localizar los codones de inicio y parada, las localizaciones putativas de los marcos de lectura basadas en las frecuencias de los codones, alineamientos por similitud a genes expresados en otros actinomicetos y similares. De esta manera, las

proteínas de la invención pueden ser identificadas utilizando la secuencia de nucleótidos de la presente invención y los orfs o las proteínas codificadas por los mismos pueden ser aisladas y, si se desea, purificadas, o, alternativamente, sintetizadas por métodos químicos. Se pueden diseñar construcciones génicas para la expresión de dichos productos en base a los orfs e incluir los elementos de regulación de expresión (promotores, terminadores, etc.) apropiados y dichas construcciones génicas pueden ser introducidas en células hospedadoras apropiadas para expresar la proteína o proteínas codificadas por una o más orfs.

Las proteínas de la invención pueden ser aisladas y, si se desea, purificadas, por métodos convencionales. Preferentemente, las proteínas se obtienen en una forma sustancialmente pura, aunque también puede ser aceptable un grado inferior de pureza, típicamente del 80% al 90% aproximadamente. La invención también contempla la posibilidad de que las proteínas de la invención sean obtenidas por síntesis química, las cuales tendrán la misma, o sustancialmente la misma, estructura que las derivadas directamente de los organismos productores de tiocoralina, tanto tipo salvaje (wt) como mutantes.

En otro aspecto, la invención se relaciona con un procedimiento para producir una proteína de la invención implicada en la biosíntesis de tiocoralina que comprende crecer, bajo condiciones (nutrientes y ambientales) apropiadas, un organismo productor de tiocoralina, y, si se desea, aislar una o más de dichas proteínas implicadas en la biosíntesis de tiocoralina. Si se desea, dicha proteína de la invención puede ser aislada y purificada por métodos convencionales, tales como los descritos previamente.

En otro aspecto, la invención se relaciona con un método para producir tiocoralina que comprende crecer, bajo condiciones apropiadas para producir dicho compuesto, un organismo productor de tiocoralina

en el que se ha aumentado el número de copias de genes que codifican proteínas implicadas en la biosíntesis de tiocoralina, y, si se desea, aislar la tiocoralina.

En una realización particular, el organismo productor de tiocoralina es un actinomiceto, tal como, por ejemplo, Micromonospora sp, en el que se ha aumentado el número de copias de genes que codifican proteínas implicadas en la biosíntesis de tiocoralina. El aumento en el número de copias de genes que codifican proteínas implicadas en la biosíntesis de tiocoralina puede realizarse por métodos convencionales conocidos por los expertos en la materia. En este caso, el método descrito previamente comprende fermentar dicho organismo bajo condiciones nutrientes y ambientales adecuadas para la expresión de los genes implicados en la producción de tiocoralina. Si se desea, la tiocoralina producida puede ser aislada y purificada del medio de cultivo por métodos convencionales.

En otro aspecto, la invención se relaciona con un método para producir tiocoralina que comprende crecer, bajo condiciones apropiadas para producir dicho compuesto, un organismo productor de tiocoralina en el que la expresión de los genes que codifican las proteínas responsables de la biosíntesis de tiocoralina ha sido modulada mediante manipulación o reemplazo de uno o más genes que codifican proteínas implicadas en la biosíntesis de tiocoralina o bien mediante la manipulación de las secuencias responsables de regular la expresión de dichos genes, y, si se desea, aislar la tiocoralina. Preferentemente, la expresión de los genes que codifican para dichas proteínas responsables de la biosíntesis de tiocoralina ha sido mejorada. Para ello, se pueden eliminar las secuencias génicas no esenciales en el proceso de biosíntesis de tiocoralina, o bien se puede aumentar la eficiencia de las secuencias reguladoras de la expresión génica de dichos genes por técnicas de ingeniería genética conocidas por los expertos en la materia. De este modo se puede aumentar el rendimiento en la producción de

tiocoralina. La manipulación genética para eliminar las secuencias génicas no esenciales en el proceso de biosíntesis de tiocoralina, o bien para aumentar la eficiencia de las secuencias reguladoras de la expresión génica de dichos genes puede llevarse a cabo por técnicas de ingeniería genética conocidas por los expertos en la materia.

En una realización particular, el organismo productor de tiocoralina es un actinomiceto, tal como, por ejemplo, Micromonospora sp, en el que la expresión de los genes que codifican las proteínas responsables de la biosíntesis de tiocoralina ha sido modulada mediante manipulación o reemplazo de uno o más genes que codifican proteínas implicadas en la biosíntesis de tiocoralina o bien mediante la manipulación de las secuencias responsables de regular la expresión de dichos genes, lo que puede llevarse a cabo por métodos convencionales conocidos por los expertos en la materia. En este caso, el método descrito previamente comprende fermentar dicho organismo bajo condiciones nutrientes y ambientales adecuadas para la expresión de los genes implicados en la producción de tiocoralina. Si se desea, la tiocoralina producida puede ser aislada y purificada del medio de cultivo por métodos convencionales.

En otro aspecto, la invención se relaciona con un método para producir tiocoralina que comprende crecer, bajo condiciones apropiadas para producir dicho compuesto, una célula hospedadora de la invención transformada o transfectada con un vector de la invención que comprende el cluster de genes responsable de la biosíntesis de tiocoralina, y, si se desea, aislar la tiocoralina. Las condiciones (nutrientes, ambientales, etc.) se seleccionarán en función de la naturaleza de la células hospedadora.

En una realización particular, la célula hospedadora de la invención se selecciona entre un organismo productor de tiocoralina de forma nativa, un organismo no-productor de tiocoralina de forma nativa

y un organismo manipulado genéticamente para producir tiocoralina. En una realización particular, dicha célula hospedadora de la invención es un actinomiceto o un estreptomiceto.

En otro aspecto, la invención se relaciona con un procedimiento, basado en la utilización de genes responsables de la biosíntesis de tiocoralina de Micromonospora sp. MLl , para la producción de dicho compuesto en otro actinomiceto, que comprende:

(1) la obtención de mutantes afectados en genes específicos de la ruta de biosíntesis de tiocoralina;

(2) el aislamiento de la región del cromosoma de Micromonospora sp. MLl que contiene el cluster de genes responsables de la biosíntesis de tiocoralina;

(3) la obtención y análisis de la secuencia de nucleótidos del cluster de genes responsables de la biosíntesis de tiocoralina; y

(4) la producción heteróloga de tiocoralina en otros actinomicetos.

La identificación y el aislamiento de la región del cromosoma de Micromonospora sp. MLl que contiene el cluster de genes responsables de la biosíntesis de tiocoralina, así como el análisis de la secuencia de nucleótidos de dicho cluster puede llevarse a cabo en base a las enseñanzas proporcionadas por esta invención, ilustrada, de forma no limitativa, en los Ejemplos que acompañana a esta descripción.

Los mutantes afectados en genes específicos de la ruta de biosíntesis de tiocoralina pueden ser identificados por métodos convencionales. En una realización particular, dichos mutantes pueden

ser identificados mediante cultivo y medida de la producción de tiocoralina por métodos convencionales, por ejemplo, por HPLC-MS, tal como se menciona en el Ejemplo 5.

La totalidad o una parte del cluster de genes responsables de la biosíntesis de tiocoralina puede ser introducida en un actinomiceto por métodos convencionales, e.g., por transformación o transfección, para la producción heteróloga de tiocoralina por fermentación de un medio nutriente apropiado, bajo las condiciones apropiadas para la producción de tiocoralina y, si se desea, la tiocoralina así obtenida puede ser aislada y/o purificada por métodos convencionales.

La determinación del cluster de genes responsable de la biosíntesis de la tiocoralina es de gran importancia comercial. El aislamiento y descripción completa del cluster de genes responsables de la biosíntesis de tiocoralina proporcionado por esta invención permite aumentar la producción de la tiocoralina y manipular organismos para que produzcan tiocoralina. En este sentido, se puede aumentar el número de copias de los genes responsables de los dominios más importantes de las NRPSs implicadas en la producción de tiocoralina o aumentar la eficiencia de las secuencias reguladoras de la expresión génica de esos genes por técnicas de ingeniería genética conocidas en el estado de la técnica y así aumentar el rendimiento en su producción.

Otra ventaja asociada con la identificación y clonaje del cluster completo de genes de la tiocoralina proporcionado por la presente invención se relaciona con la producción eficiente de tiocoralina. De hecho, permite obtener un compuesto de gran interés en un menor número de pasos. La eliminación de secuencias no esenciales en el proceso de biosíntesis en mutantes del cluster reduce considerablemente el tiempo necesario para producir el compuesto de interés. Las secuencias restantes son suficientes y mantienen su funcionalidad para producir tiocoralina.

PARTE EXPERIMENTAL

Los procedimientos experimentales de la presente invención incluyen métodos de Biología Molecular convencionales en el actual estado de la técnica. Pueden encontrarse descripciones detalladas de las técnicas no explicadas aquí en los manuales de Kieser et al.

(Practical Streptomyces genetics. The John Innes Foundation, Norwich,

Gran Bretaña, 2000) y Sambrook et al. (Molecular cloning: a laboratory manual. CoId Spring Harbor Laboratory Press, CoId Spring Harbor,

Nueva York, EE. UU, 2001). Las siguientes etapas describen en detalle, sin limitación, la presente invención.

Etapa 1. Aislamiento de la región del cromosoma de Micromonospora sp. MLl que contiene los genes de la ruta de biosíntesis de tiocoralina

Ejemplo 1. Construcción de una genoteca en SuperCosl a partir de ADN cromosómico de Micromonospora sp. MH A partir de un cultivo de Micromonospora sp. MLl (Espliego, F.

Tesis Doctoral, 1996, Universidad de León; de la Calle, F. Tesis Doctoral, 1998, Universidad Autónoma de Madrid), disponible en la colección de cultivos de Pharma Mar, S. A., en medio MIAM2 (5 g/L de extracto de levadura, 3 g/L de extracto de carne, 5 g/L de triptona, 5 g/L de glucosa, 20 g/L de dextrina, 4 g/L de CaCü3, 10 g/L de sales marinas. pH 6,8) se obtuvo ADN cromosómico utilizando el protocolo "salting out" (Kieser et al. 2000). Este ADN cromosómico fue sometido a digestión parcial con la endonucleasa BarήHl y los fragmentos obtenidos fueron utilizados para generar una genoteca en el cósmido SuperCos 1 (Stratagene), digerido con BamHl. La generación de esta genoteca en E. coli XL-I Blue MR (Stratagene) se realizó siguiendo procedimientos ya descritos (Sambrook et al. 2001) y el kit de

empaquetamiento in vitro Gigapack III GoId Packaging Extract Kit (Stratagene) .

1.000 colonias transductantes de E. coli fueron depositadas sobre membranas de nylon para realizar un análisis de hibridación de colonia in situ mediante los protocolos habituales (Sambrook et al. 2001).

Ejemplo 2. Construcción de una genoteca en pKC505 a partir de ADN cromosómico de Micromonospora sp. MLl

A partir de un cultivo de Micromonospora sp. MLl en medio MIAM2 se obtuvo ADN cromosómico utilizando el protocolo "salting out" (Kieser et al. 2000). Este ADN cromosómico fue sometido a digestión parcial con la endonucleasa Sau3Al y los fragmentos obtenidos fueron utilizados para generar una genoteca en el cósmido bifuncional Escherichia coli/ Streptomy ees pKC505 (Richardson at al. 1987, Gene 61, 231-241), digerido con BamHl. La generación de esta genoteca en E. coli ED8767 se realizó siguiendo procedimientos ya descritos (Sambrook et al. 2001) y el kit de empaquetamiento in vitro Gigapack III GoId Packaging Extract Kit (Stratagene).

3.300 colonias transductantes de E. coli fueron depositadas sobre placas de microtitulación de 96 pocilios conteniendo medio TSB (Merck) con 25 μg/ml de apramicina e incubadas a 30°C durante 24 horas. Estos clones fueron replicados a placas de TSA (Tryptic Soy Agar) con 25 μg/ml de apramicina, y tras una noche a 30°C, las colonias fueron transferidas a membranas de nylon para realizar un análisis de hibridación de colonia in situ mediante los protocolos habituales (Sambrook et al. 2001).

Ejemplo 3. Diseño de oligonucleótidos específicos para dominios de adenilación en NRPS y su amplificación por PCR a partir de ADN cromosómico de Micromonospora sp. MLl

En base a la estructura de la tiocoralina se esperaba que las

NRPSs encargadas de su biosíntesis poseyeran de uno a tres dominios de adenilación que activasen L-cisteína y un dominio que activase glicina. En base a esto se diseñaron oligonucleótidos degenerados, basados en regiones conservadas dentro de los dominios de adenilación de NRPSs, capaces de amplificar específicamente fragmentos de ADN codificantes de dominios de adenilación de NRPSs que se combinaron con oligonucleótidos descritos en la bibliografía para la amplificación de dominios de adenilación de NRPSs.

La amplificación por PCR con los oligonucleótidos iniciadores: MTF2 (5 ' - GCNGGYGGYGCNTAYGTNCC-3 ' ; Neilan et al. 1999. J. Bacteriol. 181(13):4089-4097) y PSV-4 (5 ' -SAGSAGGSWGTGGCCGCCSAGCTCGAAGAA-S ' ) dio como resultado una banda de 1 ,3 kb que fue clonada en un vector pGEM-T Easy (Promega). El programa de PCR utilizado fue de un ciclo inicial de 95°C-2 min; 60°C- 15 min; 72°C-6 min seguido de 20 ciclos de 95°C- 1 min; 60°C-2 min; 72°C-2 min. Como molde se utilizó ADN cromosómico de Micromonospora sp. MLl .

El análisis de los clones por la longitud de los fragmentos de restricción (RFLP) demostró que había tres tipos de clones diferentes correspondientes a péptido sintetasas, pGPSVl, pGPSV2 y pGPSV3, que contenían los fragmentos de los dominios de adenilación denominados

PSVl, PS V2 y PS V3, respectivamente.

Posteriormente, el inserto de los clones fue liberado con una digestión EcoRI y el fragmento fue clonado en pBBRl-MCS2 (Kovach, M. E. et al. 1995. Gene. 166: 175-176), para construir los plásmidos pBPSVl, pBPSV2 y pBPSV3, respectivamente, que contenían los fragmentos de los dominios de adenilación denominados PSVl, PSV2 y PSV3, respectivamente.

A partir de la banda de PCR obtenida con los oligonucleótidos iniciadores MTF2 y PS4 se realizó una PCR anidada o "nested-PCR" (30 ciclos de 95°C-1 min; 6O 0 C- I min; 72°C-1 min) con los oligonucleótidos iniciadores PS2-TG: δ ' -ACNGGNMRNCCNAARGG-S' y MTR: 5 ' - CCNCGDATYTTNACY-3 ' (Neilan et al. 1999. J. Bacteriol. 181 (13):4089- 4097) para obtener una banda de 750 pb que fue clonado en un vector pGEM-T Easy (Promega). El análisis de los clones por RFLP demostró que había dos nuevos tipos de clones diferentes correspondientes a péptido sintetasas, pGPSV4 y pGPSV5 respectivamente, que contenían los fragmentos de los dominios de adenilación denominados PSV4 y PSV5, respectivamente.

La amplificación por PCR con los oligonucleótidos iniciadores PS2M: 5 ' - TACACSGGCWSSACSGG-3 ' y PSV-4 dio como resultado una banda de 1 ,3 kb que fue clonada en un vector pGEM-T Easy (Promega).

El programa utilizado fue un Touch-down empezando con 5 ciclos a la temperatura de anillamiento de 72°C, seguido de 10 ciclos a 70 0 C de anillamiento para terminar con 20 ciclos a 68°C (96°C-1 min; 72°C- 68°C-2 min; 72°C-3 min). El análisis de los clones por RFLP demostró que había un nuevo tipo de clon correspondiente a una péptido sintetasa, pGPSVδ que contenía el fragmento del dominio de adenilación denominado PSV6.

Ejemplo 4. Análisis de las genotecas por hibridación en colonia

Las genotecas construidas en SuperCosl y en pKC505 (Ejemplos

1 y 2) fueron sometidas a sendos análisis de hibridación de colonias in situ (Sambrook et al. 2001) utilizando el sistema DIG DNA Labeling and Detection Kit (Roche). Como sondas se utilizaron los 6 fragmentos de los dominios de adenilación denominados PSVl- PSV6.

A partir de la genoteca construida en SuperCosl se obtuvieron:

- 3 cósmidos (clones) positivos que hibridaban con el fragmento PSVl , denominados pCTla, pCTlb y pCTlc;

- 3 cósmidos (clones) positivos que hibridaban con el fragmento PSV2, denominados pCT2a, pCT2b y ρCT2c; de éstos, ρCT2c hibridaba también con el fragmento PS V5;

- 2 cósmidos (clones) positivos que hibridaban con el fragmento PSV3, denominados pCT3a y pCT3b; además, ambos hibridaban también con el fragmento PS V6; y

- 1 cósmido (clon) positivo que hibridaba con PSV4, denominado pCT4a.

A partir de la genoteca construida en pKC505 se obtuvieron 55 cósmidos positivos:

- 10 cósmidos (clones) positivos que hibridaban con el fragmento PSV2, denominados cosVl-F8, cosV7-D2, cosV7-D 12, cosV14-H4, cosV19-B4, cosV29-B9, cosV31-B l l , cosV31-H 10, cosV33-D12, cosV33-F7;

- 7 cósmidos positivos que hibridaban con el fragmento PSV5, denominados cosVl-B6, cosV6-H8, cosVl l-FlO, cosV20-F8, cosV22-F7, cosV25-B3, cosV32-B4; y

- 38 cósmidos positivos que hibridaban con los fragmentos PSVl , PSV3, PSV4 o PSV6, denominados cosVl-B7, cosVl-F5, cosV2-E5, cosV2-Fl l, cosV3-D9, cosV4-D2, cosV5-D7, cosV5-G6, cosV6-A7, cosV6-A12, cosV7-E7, cosV8-F8, cosV9-H7, cosV10-A3, cosVl l-B4, cosVl l-G2, cosV12-B12, cosV13-B2, cosV16-Hl l, cosV17-A3, cosV19- F4, cosV20-B3, cosV20-H5, cosV21-H6, cosV22-B l l, cosV23-F8, cosV26-Hl l, cosV28-Gl , cosV29-El , cosV29-G6, cosV30-G5, cosV31- A12, cosV31-E10, cosV32-A7, cosV32-D 10, cosV33-A8, cosV33-D10, cosV33-F10.

Etapa 2. Generación de imitantes en seis regiones de adenilación aisladas

Los seis fragmentos de los dominios de adenilación amplificados previamente a partir de ADN cromosómico de Micromonospora sp. MLl (PSVl , PSV2, PSV3, PSV4, PSV5 y PSV6) fueron utilizados para experimentos independientes de interrupción génica con el fin de evaluar las regiones implicadas en la biosíntesis de tiocoralina (Ejemplos 6-1 1).

El plásmido conjugativo E. coli/ Streptomyces pOJ260 (Bierman et al. 1992, Gene 1 16, 43-49) fue utilizado para generar las construcciones pFL903, pFL904, pFL905, pFL906, pFL940 y pFL941 que contenían las regiones PSVl a PSV6, respectivamente. Estas construcciones fueron introducidas en la cepa conjugativa E. coli ET12567 (pUB307) (Kieser et al. 2000) y desde aquí, por conjugación, en la cepa Micromonospora sp. MLl , utilizando procedimientos descritos (Kieser et al. 2000). Los clones transconjugantes se seleccionaron con apramicina y la integración en la región cromo sómica apropiada fue comprobada mediante hibridación Southern utilizando como sondas las regiones de los fragmentos de los dominios de adenilación PSVl a PSV6 correspondientes. Los transconjugantes seleccionados de cada región de los dominios de adenilación PSV (PSV1-PSV6) se crecieron en medio MT4 de producción de tiocoralina y posteriormente su micelio extraído con acetonitrilo y analizado por HPLC-MS (Ejemplo 5). Solo los mutantes afectados en los dominios de adenilación PSV2 y PSV5 poseían un fenotipo no-productor de tiocoralina (Ejemplos 7 y 10). La producción de tiocoralina en mutantes con deleciones en PSVl , PSV3, PSV4 y PSV6 fue similar a la de la cepa wt (Ejemplos 6, 8, 9 y 1 1). Estos experimentos pusieron de manifiesto que los dominios de adenilación PSV2 y PSV5 estaban implicados en la biosíntesis de tiocoralina.

Ejemplo 5. Detección por HPLC de la producción de tiocoralina

Los extractos con acetonitrilo de las diferentes cepas analizadas fueron concentrados en rotavapor y resuspendidos en DMSO antes de ser utilizados para análisis por HPLC-MS.

Las muestras (10 μl) se analizaron por HPLC, utilizando una columna de fase reversa (Symmetry Cis, 2.1 X 150 mm, Waters), usando como disolventes acetonitrilo y una mezcla de 0, 1% de ácido trifluoroacético en agua. Durante los primeros 4 minutos se mantiene un concentración de la fase móvil con 10% de acetonitrilo de forma isocrática. Después, hasta los 30 minutos, se inicia un gradiente lineal desde el 10% hasta el 100% de acetonitrilo. El flujo utilizado es de 0,25 mL/min. La detección y caracterización espectral de los picos se llevaron a cabo utilizando un detector de fotodiodos y mediante el empleo del software informático Millennium (Waters). Los cromatogramas se extrajeron a una absorbancia de 230 nm.

Ejemplo 6. Interrupción génica en la región PSVl

A partir del plásmido pBPSVl se obtuvo la región PSVl como una banda EcoRI de 1,3 kb y se clonó en el sitio EcoRI del plásmido conjugativo E. coli/ Streptomy ees pOJ260, generándose pFL903. pOJ260 contiene un gen que confiere resistencia a apramicina en Streptomyces y en estas células es un plásmido suicida.

La construcción pFL903 fue introducida en la cepa conjugativa E. coli ETl 2567 (pUB307) y desde ahí, por conjugación, en la cepa Micromonospora sp. MLl, utilizando procedimientos descritos (Kieser et al. 2000). Los clones transconjugantes se seleccionaron con 25 μg/ml de apramicina y a partir de ADN cromosómico de los mismos se comprobó mediante hibridación Southern que efectivamente la región PSVl había sido interrumpida. La sonda utilizada en este caso fue la banda PSVl .

El muíante Micromonospora sp. δPSV1 fue crecido en medio MT4 de producción de tiocoralina y posteriormente su micelio fue extraído con acetonitrilo y analizado por HPLC-MS (véase el Ejemplo 5), resultando ser productor de tiocoralina. La composición del medio de cultivo MT4 por litro es la siguiente: 6 g de harina de soja, 2,5 g de extracto de malta, 2,5 g de peptona, 5 g de dextrosa, 20 g de dextrina, 4 g de CaCü3, 10 g de sales marinas, ajustar el pH hasta 6,8.

Ejemplo 7. Interrupción génica en la región PSV2

A partir del plásmido pBPSV2 se obtuvo la región PSV2 como una banda EcoRl de 1 ,3 kb y se clonó en el sitio EcoRI del plásmido pOJ260, generándose pFL904.

La construcción pFL904 fue introducida en la cepa conjugativa E. coli ET 12567 (pUB307) y desde ahí, por conjugación, en la cepa Micromonospora sp. MLl . Los clones transconjugantes se seleccionaron con 25 μg/ml de apramicina y a partir de ADN cromosómico de los mismos se comprobó mediante hibridación Southern que efectivamente la región PSV2 había sido interrumpida. La sonda utilizada en este caso fue la banda PSV2.

El muíante Micromonospora sp. δPSV2 fue crecido en medio MT4 de producción de tiocoralina y posteriormente su micelio fue extraído con acetonitrilo y analizado por HPLC-MS (Ejemplo 5), dando como resultado que esta cepa no producía tiocoralina.

Ejemplo 8. Interrupción génica en la región PSV3

A partir del plásmido pBPSV3 se obtuvo la región PSV3 como una banda EcoRI de 1 ,4 kb y se clonó en el sitio EcoRI del plásmido pOJ260, generándose pFL905.

La construcción pFL905 fue introducida en la cepa conjugativa E. coli ET 12567 (pUB307) y desde ahí, por conjugación, en la cepa Micromonospora sp. MLl . Los clones transconjugantes se seleccionaron con 25 μg/ml de apramicina y a partir de ADN cromosómico de los mismos se comprobó mediante hibridación Southern que efectivamente la región PSV3 había sido interrumpida. La sonda utilizada en este caso fue la banda PS V3.

El mutante Micromonospora sp. δPSV3 fue crecido en medio MT4 de producción de tiocoralina y posteriormente su micelio fue extraído con acetonitrilo y analizado por HPLC-MS (Ejemplo 5), resultando ser productor de tiocoralina.

Ejemplo 9. Interrupción génica en región PSV4

A partir del plásmido pGPSV4 se obtuvo la región PSV4 como una banda EcoRl de 1,2 kb y se clonó en el sitio EcoRϊ del plásmido pOJ260, generándose pFL906.

La construcción pFL906 fue introducida en la cepa conjugativa E. coli ETl 2567 (pUB307) y desde ahí, por conjugación, en la cepa Micromonospora sp. MLl . Los clones transconjugantes se seleccionaron con 25 μg/ml de apramicina y a partir de ADN cromosómico de los mismos se comprobó mediante hibridación Southern que efectivamente la región PSV4 había sido interrumpida. La sonda utilizada en este caso fue la banda PS V4.

El mutante Micromonospora sp. δPSV4 fue crecido en medio MT4 de producción de tiocoralina y posteriormente su micelio fue extraído con acetonitrilo y analizado por HPLC-MS (Ejemplo 5), resultando ser productor de tiocoralina.

Ejemplo IQ. Interrupción génica en región PSV5

A partir del plásmido pGPSV5 se obtuvo la región PSV5 como una banda EcoRl de 1, 1 kb y se clonó en el sitio EcoRI del plásmido pOJ260, generándose pFL940.

La construcción pFL940 fue introducida en la cepa conjugativa JEC. coli ET12567 (pUB307) y desde ahí, por conjugación, en la cepa Micromonospora sp. MLl . Los clones transconjugantes se seleccionaron con 25 μg/ml de apramicina y a partir de ADN cromosómico de los mismos se comprobó mediante hibridación Southern que efectivamente la región PSV5 había sido interrumpida. La sonda utilizada en este caso fue la banda PS V5.

El mutante Micromonospora sp. δPSV5 fue crecido en medio MT4 de producción de tiocoralina y posteriormente su micelio fue extraído con acetonitrilo y analizado por HPLC, dando como resultado que esta cepa no producía tiocoralina.

Ejemplo 11. Interrupción gέnica en región PSV6

A partir del plásmido pGPSVó se obtuvo la región PSV6 como una banda EcoRI de 1 , 1 kb y se clonó en el sitio EcoRI del plásmido pOJ260, generándose pFL941.

La construcción pFL941 fue introducida en la cepa conjugativa E. coli ET12567 (pUB307) y desde ahí, por conjugación, en la cepa Micromonospora sp. MLl . Los clones transconjugantes se seleccionaron con 25 μg/ml de apramicina y a partir de ADN cromosómico de los mismos se comprobó mediante hibridación Southern que efectivamente la región PSV6 había sido interrumpida. La sonda utilizada en este caso fue la banda PSV6.

El mutante Micromonospora sp. δPSV6 fue crecido en medio MT4 de producción de tiocoralina y posteriormente su micelio fue extraído con acetonitrilo y analizado por HPLC, resultando ser productor de tiocoralina.

Etapa 3. Obtención y análisis de la secuencia nucleotídica del agrupamiento génico responsable de la biosíntesis de Tiocoralina

En base a los resultados anteriores, en los que las zonas amplificadas de los dominios de adenilación PSV2 y PSV5 habían sido las únicas cuya interrupción génica causaba un fenotipo no productor de tiocoralina, se eligieron dos cósmidos solapantes para ser secuenciados, cosV33-D12 (que contiene la región del dominio de adenilación PSV2) y pCT2c (que contiene las regiones de los dominios de adenilación PSV2 y PS V5). El análisis de las 64.650 pb obtenidas a partir de dichos cósmidos reveló la presencia de 36 ORFs completos y 2 incompletos cuya organización se muestra en la Figura 1. La comparación con las secuencias de proteínas existentes en bases de datos de los productos deducidos de los diferentes genes permitió deducir las funciones para la mayoría de ellos (Tabla 1).

Ejemplo 12. Determinación y análisis de la secuencia nucleotídica del inserto de los cósmidos cosV33-D12 y pCT2c

La secuenciación de ambos cósmidos se realizó utilizando la metodología habitual y para el análisis informático de la secuencia se empleó el paquete de programas GCG, de Genetics Computer Group de la Universidad de Wisconsin (Devereux et al. 1984, Nucleic Acid Res. 12, 387-395).

Se obtuvo así una secuencia de 64.650 nucleótidos, cuyo análisis informático reveló la existencia de 38 ORFs [36 ORFs completos y 2

incompletos] cuya organización se muestra en la Figura 1. Los productos de expresión génica deducidos de dichas ORFs fueron comparados con proteínas de función conocida presentes en las bases de datos empleando el programa BLAST (Altschul et al. 1997, Nucleic Acid Res. 25, 3389-3402), con lo que se asignaron funciones probables para la mayoría de estas ORFs (Tabla 1).

Tabla 1

ORF incompleta

Algunas de las proteínas identificadas están implicadas en la formación de la estructura peptídica de la tiocoralina, como por ejemplo varias de las NRPSs identificadas, Tiol2, Tiol7, Tiolδ, Tiol9, Tio20, Tio21, Tio22, Tio27 y Tio28. Aparecen también varias proteínas que pueden estar relacionadas con procesos de resistencia, como Tio5, Tio6, y Tio23. Los posibles reguladores de la ruta de tiocoralina identificados en la región secuenciada corresponden a Tio3, Tio4, Tio7, Tio24, Tio25.

Aparecen por último también varias proteínas relacionadas con Ia generación de la unidad iniciadora 3-hidroxi-quinaldato, Tio8, Tio9, TiolO y Tiol l .

Los genes cuya interrupción génica genera un fenotipo no productor de tiocoralina se encuentran señalizados en la Figura 1 mediante un asterisco (tio20, tio27y tio28).

Ejemplo 13. Interrupción génica en tio28

Con el fin de demostrar la implicación o no de la proteína Tio28 en la biosíntesis de tiocoralina se llevó a cabo la inactivación por interrupción génica del gen tio28, y en concreto del único de los dominios de adenilación que posee.

Se diseñaron dos oligonucleótidos iniciadores internos a este dominio de adenilación (FL-T- 102up y FL-T- 102rp) y se utilizaron para amplificar una zona de 1.428 pares de bases en tio28. Las secuencias de dichos oligonucleótidos iniciadores son las siguientes: FL-T-102up: 5'-ACCTGAGGTACTGGGCGCAGC-3' (21 nucleótidos)

FL-T- 102rp: 5'- CCGATCACCACCACCGTGGC-3' (20 nucleótidos)

El programa de PCR utilizado fue: 2 min a 94°C, 30 ciclos (30 s a 94°C, 60 s a 53°C, 90 s a 68°C), 5 min a 68°C y 15 min a 4°C. La mezcla de la reacción de PCR contenía: 1 μL de ADN molde del cósmido pCT2c, 1 μL de cada oligonucleótido a una concentación 30 pmol/μL, 7,5 μL de solución dNTPs (dATP, dTTP, dCTP y dGTP) 2 mM, 1 μL de MgSθ4 50 mM, 5 μL de tampón de reacción para Pfx (Invitrogene), 5 μL de solución Enhancer para Pfx (Invitrogene), 28 μL de agua destilada y 0,5 μL de polimerasa Pfx (Invitrogene).

El producto de PCR obtenido, denominado PSV7, fue clonado en el sitio EcoRV del plásmido pOJ260, generándose pFL971.

La construcción pFL971 fue introducida en la cepa conjugativa E. coli ET12567 (pUB307) y desde ahí, por conjugación, en la cepa Micromonospora sp. MLl . Los clones transconjugantes se seleccionaron con 25 μg/mL de apramicina y a partir de ADN cromosómico de los mismos se comprobó mediante hibridación Southern que efectivamente la región PSV7 había sido interrumpida. La sonda utilizada en este caso fue el producto de PCR PSV7.

El mutante Micromonospora sp. δPSV7 fue crecido en medio MT4 de producción de tiocoralina y posteriormente su micelio extraído con acetonitrilo y analizado por HPLC-MS (Ejemplo 5), dando como resultado que esta cepa no producía tiocoralina.

Etapa 4. Expresión heteróloga de tiocoralina en otros actinomicetos

Para verificar la implicación de los genes identificados en la biosíntesis de tiocoralina, se ensayó la expresión heteróloga del cluster de genes de tiocoralina en varias especies de Streptomyces. Se eligió la región de ADN comprendida entre las posiciones 1.393 (sitio de restricción Msel) y 54.301 (sitio de restricción AcZI) de la SEQ ID NO: 1 como fragmento de ADN a ser clonado en un plásmido replicativo en E. coli y posteriormente en un plásmido replicativo en E. coli/ integrativo en

Streptomyces. Esta región de ADN contiene todas las ORFs situadas entre tio3 y tio28, ambas inclusive y completas (Figura 1). La elección de esta región de ADN fue debida a que las proteínas Tio3 y Tio28 son las más externas dentro de la región secuenciada que mostraban similitudes con proteínas del metabolismo secundario.

Dicha región de ADN, debido a su gran tamaño, fue obtenida por pasos uniendo 3 fragmentos de ADN independientes, los cuales fueron

obtenidos a partir de 3 cósmidos diferentes (cosV33-D12, cosV19-B4 y pCT2c):

- fragmento A (20,2 kb): Msel (posición 1.393 de SEQ ID NO: 1) - Nsü (posición 21.585 de SEQ ID NO: 1); - fragmento B (19 kb): NsU (posición 21.585 de SEQ ID NO: 1) -

EcoRl (posición 40.636 de SEQ ID NO: 1); y

- fragmento C (13,7 kb): EcoRI (posición 40.636 de SEQ ID NO: 1) - AcH (posición 54.301 de SEQ ID NO: 1).

Para facilitar el subclonaje, el fragmento de ADN completo se subclonó primero en el plásmido replicativo en E. coli pOJ260 (Ejemplo 14). El inserto se rescató y subclonó en un vector replicativo en E. co Zi/ in te grati vo de Streptomyces que contenía el promotor de resistencia a eritromicina (ertnEp) (pARP) [Ejemplo 16] o sin dicho promotor (pAR15AT) [Ejemplo 15]. Esta región de ADN seleccionada se clonó en dichos plásmidos integrativos de Streptomyces pAR15AT, en ambas direcciones (Ejemplo 17) y pARP (Ejemplo 18). Finalmente, mediante conjugación intergenérica dichas construcciones se introdujeron en varios estreptomicetos (Ejemplo 19).

Ejemplo 14. Clonación en el plásmido de E. coli pOJ260 de la región de ADN seleccionada

A partir del cósmido pCT2c (Figura 2) se obtuvo mediante procedimientos habituales (Sambrook et al. 2001) la región de ADN situada entre los sitios de restricción EcoRI (posición 40.636 de SEQ ID

NO: 1) y AcR (posición 54.301 de SEQ ID NO: 1). Este fragmento de ADN se clonó en los sitios de restricción únicos EcoRI y CIaI del plásmido de

E. coli pUK21 (Vieira et al. 1991, Gene 100, 189- 194), generándose la construcción pFL1023 (Figura 3).

A partir del cósmido cosV19-B4 se obtuvo, mediante procedimientos habituales (Sambrook et al. 2001), la región de ADN

situada entre los sitios de restricción Nsü (posición 21.585 de SEQ ID NO: 1) y EcoRl (posición 40.636 de SEQ ID NO: 1). Este fragmento de ADN se clonó en los sitios de restricción únicos Nsü y EcoRl del plásmido de E. coli pGEM-HZf (Promega), generándose la construcción pFL 1022 (Figura 3).

Estos dos fragmentos de ADN se unieron a continuación. Para ello, el fragmento de ADN situado entre los sitios de restricción Nsü (posición 21.585 de SEQ ID NO: 1) y EcoRl (posición 40.636 de SEQ ID NO: 1) presente en pFL1022 fue rescatado digiriendo con los enzimas de restricción Hindlll (situado en el sitio de clonación múltiple e inmediatamente antes del sitio de restriccción Nsü) y EcoRl. A continuación, este fragmento fue clonado en los sitios únicos de restricción Hindlll y EcoRl presentes en la construcción pFL1023, generándose así el plásmido pFL1024 (Figura 3).

Toda la región clonada en pFL1024 fue rescatada como una banda Spel (gracias a estos dos sitios de restricción presentes en ambos extremos del sitio de clonación múltiple de pUK21) y clonada en el sitio único Spel del plásmido pOJ260, generando así el plásmido pFL1036

(Figura 3).

Por último, a partir del cósmido cosV33-D12 se obtuvo el fragmento situado entre los sitios de corte Msel (posición 1.393 de SEQ ID NO: 1) y Nsü (posición 21.585 de SEQ ID NO: 1) y se clonó en los sitios Ndel y Nsñ respectivamente de pFL1036, generándose la construcción pFL1041 (Figura 4) que contiene en pOJ260 (Bierman et al. 1992, Gene 1 16, 43-49) toda la región comprendida entre las posiciones 1.393 (sitio de restricción Msel) y 54.301 (sitio de restricción AcH) de SEQ ID NO: 1, es decir, desde la ORF tio3 a tio28, ambas incluidas y completas. Además, en pFL1041, esta región se encuentra flanqueada por dos sitios de restricción Spel. pFL1041 es un plásmido replicativo en E. coli.

Ejemplo 15. Construcción del plásmido integrativo de Streptomyces pAR15AT

El origen de replicación del plásmido pACYC 184 (Rose 1988,

Nucleic Acids Res. 16, 355), orí pl5A, se obtuvo como un fragmento Sgrhl-Xbal y se trató con el fragmento Klenow de la ADN polimerasa de E. coli. Este origen de replicación se clonó en el sitio Smal del plásmido pUKA, obteniéndose así el plásmido pUO15A (Figura 5). pUKA es un derivado del plásmido pUK21 (Vieira et al. 1991, Gene 100, 189- 194) que contiene clonado en sus sitios de resticción Psü-Accl el gen de resistencia a apramicina obtenido del cósmido pKC505 (Richardson at al. 1987, Gene 61 , 231-241) como una banda Pstl-EcoRI.

Por medio de una digestión Bgϊíl-Xhόl sobre pUO15A se obtiene un fragmento de ADN que contiene el ori pl5A junto al gen de resistencia a apramicina aac(3)IV. Este fragmento se clonó, utilizando las mismas enzimas de restricción, en el plásmido pOJ436 (Bierman et al. 1992, Gene 1 16, 43-49), dando lugar a la construcción pOJ15A (Figura 5).

En el sitio de restricción Pvull de pOJ15A se clonó el fragmento Dr(A-BgRl (tratado con Klenow) procedente del plásmido pOJ260, y que contiene el origen de conjugación oriT. Se obtiene así finalmente el plásmido pARl 5AT (Figura 5).

Ejemplo 16. Construcción del plásmido integrativo de Streptomyces pARP

En el sitio de restricción £cZ136II de pSL1 180 (Amersham

Pharmacia) se clonó el gen de la glicosiltransferasa elmGT procedente de la ruta de biosíntesis de elloramicina, como un fragmento de ADN EcoRI-Hi ' ndIII tratado con Klenow obtenido del plásmido pGB15 (Blanco

et al. 2001 , Chem. Biol. 8, 253-263). Se obtuvo así la construcción pSLelmGTa (Figura 6), en la cual el gen elmGT se encuentra bajo el control del promotor constitutivo del gen de resistencia a eritromicina ermE (PeπnE).

Un fragmento Spél-Nhél obtenido de pSLelmGTa que contenía PermE-elmGT fue clonado en el sitio Xbal del plásmido pAR15AT descrito en el ejemplo 15, obteniéndose la construcción pAR15ATG* (Figura 6).

Mediante digestión Xbal sobre el plásmido pAR15ATG* y posterior religación se eliminó el gen elmGT, manteniéndose el promotor PermE, lo que dio origen al plásmido pARP (Figura 6).

Ejemplo 17. Clonación en el plásmido integrativo de Streptomyces pAR15AT de la región de ADN seleccionada, en ambas orientaciones

El fragmento de ADN Spel procedente de pFL1041 (Figura 4) que contiene la región comprendida entre las posiciones 1.393 (sitio de restricción Msel) y 54.301 (sitio de restricción AcR) de SEQ ID NO: 1 se clonó, en ambas orientaciones, en el sitio de restricción Xbal del plásmido pAR15AT (Figura 5). Se generaron así dos nuevos plásmidos, denominados pFL1048 y pFL1048r (Figura 7), con el gen de resistencia a apramicina, replicativos en E. coli e integrativos en Streptomyces mediante el sistema que utiliza la región attP del fago φC31.

Ejemplo 18. Clonación en el plásmido integrativo de Streptomyces pARP de la región de ADN seleccionada tras el promotor del gen ErmE

De una forma similar, el fragmento de ADN Spel procedente de pFL1041 (Figura 4) que contiene la región comprendida entre las posiciones 1.393 (sitio de restricción Msel) y 54.301 (sitio de restricción AcZI) de SEQ ID NO: 1 se clonó en el sitio de restricción Xbcá del

plásmido pARP (Figura 6). Se generó así pFL1049 (Figura 7), en el cual la ORF correspondiente a tio3 (SEQ ID NO:4) se encuentra bajo control del promotor constitutivo Permε presente en pARP. Este plásmido posee el gen de resistencia a apramicina, es replicativo en E. coli e integrativo en Streptomyces mediante el sistema que utiliza la región attP del fago φC31.

Ejemplo 19. Expresión heteróloga de la ruta de biosíntesis de tiocoralina en distintos estreptomicetos

El plásmido pFL1048 (Figura 7) se introdujo por conjugación desde la cepa E. coli ET12567 (pUB307) (Kieser et al. 2000) en las especies Streptomyces lividans TK21 (Kieser et al. 2000) y Streptomyces albus J1074 (Chater et al. 1980, J. Gen. Microbiol. 1 16, 323-334) .

El plásmido pFL1049 (Figura 7) se introdujo por conjugación desde la cepa E. coli ET12567 (pUB307) en las especies Streptomyces coelicolor M145 (Redenbach et al., 1996, Mol. Microbiol., 21, 77-96), Streptomyces lividans TK21, Streptomyces albus J 1074 y Streptomyces avermitilis ATCC 31267.

Por último, el plásmido pFL1048r (Figura 7) se introdujo por conjugación desde la cepa E. coli ETl 2567 (pUB307) en la especie Streptomyces lividans TK21.

Los resultados del cultivo del clon Streptomyces albus (pFL1049) en medio de producción R5A (Fernández et al. 1998, J. Bacteriol. 180, 4929-4937) se muestran en la Figura 8A. En la Figura 8B se muestra el espectro de absorción del pico con tiempo de retención de 27 minutos en este cromatograma, y su espectro de masas (Figura 8C), siendo ambos idénticos a los de Tiocoralina purificada.