Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
POLYPEPTIDES WITH CELLULASE ACTIVITY
Document Type and Number:
WIPO Patent Application WO/2015/132442
Kind Code:
A1
Abstract:
The invention mainly relates to a polypeptide with cellulase activity for using in biomass degradation processes. The invention also relates to functional fragments of the polypeptide, and to the polynucleotides encoding said polypeptides and/or fragments.

Inventors:
SAADEDDIN ANAS (ES)
GÓMEZ DEL PULGAR VILLANUEVA EVA MARÍA (ES)
SANTERO SANTURINO EDUARDO (ES)
TERRÓN GONZÁLEZ LAURA (ES)
Application Number:
PCT/ES2015/070160
Publication Date:
September 11, 2015
Filing Date:
March 06, 2015
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
ABENGOA RES SL (ES)
International Classes:
C12N9/42; C12N1/21; C12N15/74
Domestic Patent References:
WO2012142171A22012-10-18
Foreign References:
US20030096342A12003-05-22
ES2262197T32006-11-16
Other References:
LYKIDIS A. ET AL.: "Genome Sequence and Analysis of the Soil Cellulolytic Actinomycete Thermobifida fusca.", JOURNAL OF BACTERIOLOGY., vol. 189, no. 6, 2007, pages 2477 - 2486, XP055043253
Attorney, Agent or Firm:
CARPINTERO LOPEZ, Mario (ES)
Download PDF:
Claims:
REIVINDICACIONES

1. Un polipéptido aislado con actividad celulasa que comprende la secuencia SEQ I D N01 o que posee un grado de homología o identidad de al menos un 80% con la SEQ ID N01 o que está codificado por un polinucleotido que híbrida bajo condiciones de baja, media, media-alta, alta o muy alta astringencia con la secuencia SEQ ID NO 6 que codifica el polipéptido maduro.

2. Un polipéptido de acuerdo con la reivindicación 1 que posee un grado de homología o identidad de al menos un 85%, preferiblemente de al menos un 90%, más preferiblemente de al menos un 95% y aún más preferiblemente de al menos un 99%.

3. Un polipéptido de acuerdo con cualquiera de las reivindicaciones anteriores que es activo a temperaturas de entre 30 y 65°C.

4. Un fragmento funcional o una variante de un polipéptido de acuerdo con cualquiera de las reivindicaciones anteriores.

5. Un fragmento de acuerdo con la reivindicación 4 que comprende al menos los aminoácidos 41 a 378 de la SEQ ID NO 1.

6. Un fragmento de acuerdo con la reivindicación 4 o 5 seleccionado entre SEQ ID NO 3, SEQ ID NO 4 o SEQ ID NO 5.

7. Una secuencia polinucleotídica que codifica un polipéptido de acuerdo con cualquiera de las reivindicaciones 1 a 3 o un fragmento o una variante de acuerdo con cualquiera de las reivindicaciones 4 a 6.

8. Un secuencia polinucleotídica de acuerdo con la reivindicación 7 cuya se secuencia se selecciona de entre SEQ ID NO 6, SEQ ID NO 8, SEQ ID NO 9 o SEQ ID NO 10.

9. Una construcción génica que comprende una secuencia polinucleotídica de acuerdo con la reivindicación 7 u 8 operativamente unida a una o más secuencias de control que dirigen la expresión de polipéptidos en sistemas de expresión.

10. Un vector de expresión que comprende una construcción génica de acuerdo con la reivindicación 9.

1 1. Una célula huésped que comprende una construcción génica de acuerdo con la reivindicación 9 o un vector de acuerdo con la reivindicación 10 y que expresa el polipéptido de acuerdo con cualquiera de las reivindicaciones 1 a 3 o un fragmento o una variante de acuerdo con cualquiera de las reivindicaciones 4-6.

12. Una célula huésped de acuerdo con la reivindicación 1 1 donde la célula es un organismo unicelular procariota o eucariota.

13. Una célula huésped de acuerdo con cualquiera de las reivindicaciones 1 1 o 12 donde la célula procariota se selecciona del grupo de bacterias de los géneros Bacillus, Clostridium, Esherichia, Klebsiella, Pseudomonas, Streptomyces, Thermoanaerobacterium o Zymomonas y la célula eucariota se selecciona del grupo de hongos de las especies Aspergillus awamori, Aspergillus foetidus, Aspergillus fumigatus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis rivulosa, Ceriporiopsis sufrufa, Ceriporiopsis subvermispora, Coprinus cinereus, Coriolus hirsutus, Fusarium bactridioides, Fusarium cereales, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Phanerochaete chrysosporium, Phlebia radiata, Pleurotus eryngii, Saccharomyces calsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norvensis, Saccharomyces oviformis, Thielavia terrestres, Tra metes villosa, Tra metes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reseii, Trichoderma viride o Yarrowia lipolytica..

14. Un método para producir un polipéptido con actividad celulolítica que comprende:

a) Cultivar una célula huésped de acuerdo con cualquiera de las

reivindicaciones 1 1 a 13 en las condiciones necesarias para la producción del polipéptido,

b) Recuperar el polipéptido producido.

15. Una composición celulolítica que comprende al menos un polipéptido de acuerdo con cualquiera de las reivindicaciones 1 a 3 y/o al menos un fragmento o una variante de acuerdo con cualquiera de las reivindicaciones 4 a 6 y, opcionalmente, al menos un elemento que favorezca o facilite la degradación de biomasa.

16. Una composición de acuerdo con la reivindicación 15 que comprende al menos un elemento adicional que se selecciona de entre una o más endoglucanasas, exoglucanasas, celebiohidrolasas, beta-glucosidasas, glicosil- hidrolasas, hemicelulasas, xylanasas, enzimas ligninolíticas o mezclas de las mismas.

17. Uso del polipéptido de acuerdo con cualquiera de las reivindicaciones 1 a 3, del fragmento o de la variante de acuerdo con cualquiera de las reivindicaciones 4 a 6 o de la composición de acuerdo con cualquiera de las reivindicaciones 15 a 16 para la degradación de biomasa.

18. Uso de acuerdo con la reivindicación 17 donde la degradación de biomasa se lleva a cabo en un procedimiento para la producción de bioproductos.

19. Un procedimiento para producir azúcares fermentables que comprende incubar biomasa con el polipéptido de acuerdo con cualquiera de las reivindicaciones 1 a 3, con el fragmento o una variante de acuerdo con cualquiera de las reivindicaciones 4 a 6 o con la composición de acuerdo con cualquiera de las reivindicaciones 15 a 16.

20. Un procedimiento de acuerdo con la reivindicación 19 que comprende recuperar los azúcares obtenidos después de la incubación con el polipéptido de acuerdo con cualquiera de las reivindicaciones 1 a 3, con el fragmento o una variante de acuerdo con cualquiera de las reivindicaciones 4 a 6 o con la composición de acuerdo con cualquiera de las reivindicaciones 15 a 16.

21. Un procedimiento para producir un bioproducto a partir de biomasa que comprende:

a) producir azúcares fermentables de acuerdo con el procedimiento de la reivindicación 19,

b) llevar a cabo una transformación química de los azúcares obtenidos en la etapa a) para producir al menos un bioproducto,

c) Recuperar el al menos un bioproducto obtenido en la etapa b).

22. Un procedimiento de acuerdo con la reivindicación 21 donde la transformación de los azúcares comprende la fermentación con al menos un microorganismo fermentante.

23. Un procedimiento de acuerdo con la reivindicación 22 donde el al menos un microorganismo fermentante se selecciona entre bacterias como Bacillus thermoglucosidaisus, Clostridium butyricum, Corynebacterium glutamicum, Enterobacter aerogenes, Escherichia coli, Geobacillus themoglucosidasius, Klebsiella oxytoca, Lactobacillus sp. Leunoscoc mesenteroides, Thermoanaerobacter BG1L1, Thermoanaerobacter ethanolicus, Thermoanaerobacter mathranii, Thermoanaerobacter thermosaccharolyticum, Zymobacter palmae, Zymomonas mobilis u hongos como Candida arabinofermentans, Candida boidinii, Candida diddensis, Candida fermentans, Chrysosporium lucknowense, Candida pastoris, Candida shehatae, Candida sonorensis, Candida tropicalis, Hansenula anómala, Hansenula polymorpha, Kluyveromyces fragilis, Kluyveromyces marxianus, Pichia pastoris, Pichia stipitis, Saccharomyces cerevisiae, Saccharomyces bulderi, Saccharomyces barnetti, Saccharomyces exiguus, Saccharomyces diastaticus, Saccharomyces uvarum o Schizosaccharomyces pombe o una combinación de alguno de estos microorganismos.

24. Un procedimiento de acuerdo con cualquiera de las reivindicaciones 21 a 23 donde el bioproducto obtenido se selecciona entre alcoholes como etanol, metanol, butanol, hexanol, octanol, decanol, dodecanol, 1 ,3-butanediol(1 ,3-diol), 1 -alcohol; ácidos orgánicos como ácido cítrico, ácido acético, ácido itacónico, ácido láctico, ácido glutámico, ácido succínico, beta-cetoácido, beta-cetoalcohol, beta- hidroxiácido; cetonas como la acetona; gases como hidrógeno o dióxido de carbono; hidrocarburos como alcanos, alquenos o alquinos; sustancias nitrogenadas como aminas, amida, nitrocompuestos o nitrilos; haluros; aminoácidos como ácido glutámico; antibióticos como penicilina o tetraciclinas; vitamina como riboflavina, vitamina B12 o betacaroteno; ácidos grasos como ácido dodecanoico, ácidos grasos trans-A2 o ácido palmítico; y otros productos como etileno, glicerol, 1 ,3-propano-diol, betalactano, cefalosporinas, ácidos grasos trans o furano.

Description:
POLIPÉPTIDOS CON ACTIVIDAD CELULASA DESCRIPCION

CAMPO DE LA INVENCIÓN

La presente invención pertenece al campo de las enzimas con actividad celulasa para la degradación de biomasa, más concretamente, se refiere a polipéptidos con actividad celulolítica o a fragmentos funcionales o variantes de los mismos, así como a los polinucleótidos que codifican dichos polipéptidos o fragmentos. La presente invención también se relaciona con una construcción génica, un vector de expresión y una célula huésped que comprenden dichos polinucleótidos, así como con un método para producir los polipéptidos, variantes o fragmentos de la invención. Por último, la invención se relaciona con el uso de los polipéptidos de la invención, fragmentos funcionales o variantes de los mismos para la degradación de biomasa, tanto para su aplicación en procedimientos para la producción de azúcares fermentables como para la producción de bioproductos por transformación química de estos azúcares, preferiblemente por fermentación microbiana de los mismos. La presente invención también incluye una composición con capacidad de degradar la biomasa que comprende al menos un polipéptido, al menos un fragmento funcional del mismo o al menos una variante del mismo de acuerdo con la presente invención y al menos algún elemento adicional que favorezca la degradación de biomasa.

ANTECEDENTES DE LA INVENCIÓN

Las fracciones fermentables de la biomasa incluyen la celulosa y hemicelulosa. La celulosa consiste en largas cadenas insolubles de glucosa unidas covalentemente mediante enlaces beta-1 ,4. La hemicelulosa es una fracción heterogénea de biomasa compuesta de xilosa y azúcares menores de 5 y 6 carbonos. Aunque es un biopolímero abundante, la celulosa es altamente cristalina, insoluble en agua y muy resistente a la despolimerización. La degradación enzimática completa de celulosa a glucosa, probablemente la materia prima más deseable para procesos de fermentación, se puede conseguir mediante la acción sinérgica de 3 clases distintas de enzimas: endoglucanasas que catalizan la endohidrólisis de los enlaces (1 ,4)-b-D-glicosídicos de la celulosa; las exoglucanasas que llevan a cabo la hidrólisis de enlaces (1 ,4) en (1 ,4)-b-D glicanos para liberar celobiosa de los términos no reductores; y b-glucosidasas que liberan b-D-glucosa de la celobiosa (ver figura 1).

El desarrollo de un proceso económico de conversión de un producto de poco valor como la biomasa a bioetanol u otro tipo de bioproductos vía transformación química o fermentación, requiere la optimización de varias etapas clave. En especial, una de gran importancia es la de la producción de celulasas. La utilización práctica de celulosa mediante hidrólisis con celulasas para producir glucosa requiere grandes cantidades de celulasas para despolimerizar por completo la celulosa. Además, la producción de celulasas y la hidrólisis enzimática son en proporción las etapas más costosas en este proceso.

Todas estas dificultades técnicas evidencian la necesidad de desarrollar nuevas enzimas que optimicen las tecnologías existentes para la producción de biofuel y otros bioproductos hacia sistemas más competitivos, económicos y que produzcan un menor impacto medioambiental al minimizar las emisiones de dióxido de carbono.

El hábitat del suelo es un ambiente enormemente diverso. Un gramo de suelo puede contener varios millones de bacterias pertenecientes a más de 4000 a 7000 especies diferentes. Sin embargo, solo 1 % de la flora bacteriana del suelo se puede cultivar bajo condiciones estándar de laboratorio.

La metagenómica que consiste en la extracción, clonado y análisis de la totalidad del material genético de un hábitat determinado, ha emergido para explorar el potencial de la información genética de microorganismos no cultivables. Las librerías metagenómicas son una herramienta poderosa para el descubrimiento de nuevas actividades biológicas y ya han sido utilizadas con éxito para aislar nuevas enzimas hidrolíticas como amilasas, celulasas y xilanasas. Por ejemplo, llmberger N. ("Metagenomic cellullases highly tolerant towards the presence of ionic liquids- linking thermostability and halotolerance" Appl. Microbiol. Biotechnol. (2012)95: 135- 146) describe la identificación y el aislamiento de enzimas con actividad celulasa a partir de librerías metagenómicas construidas a partir de diferentes ambientes en los que la actividad celulasa está muy presente como, por ejemplo, extractos del gusano Teredo navalis, muestras provenientes de una planta de biogás o heces de elefante.

El rastreo de librerías metagenómicas, que es un paso crítico en el aislamiento exitoso de actividades biológicas nuevas y mejoradas, se puede llevar a cabo mediante ensayos de actividad. Las librerías metagenómicas se construyen en vectores de expresión para permitir el aislamiento de actividades biológicas de secuencias génicas enteramente nuevas cuando estas se expresan con éxito en un determinado hospedador. Los ensayos cromogénicos de actividad son usados comúnmente para la detección de hidrolasas a partir de librerías metagenómicas. La figura 2 representa esquemáticamente el proceso de identificación y caracterización de actividades enzimáticas mediante la generación de librerías metagenómicas.

Los autores de la presente invención han identificado y aislado a partir de una librería metagenómica de microorganismos del suelo, un polipéptido que muestra una alta actividad celulasa, especialmente endoglucanasa, y que posee unas características funcionales que la hacen muy apropiada para su uso en procesos industriales de degradación de biomasa y producción de bioetanol y otros bioproductos de alto valor añadido.

OBJETO DE LA INVENCIÓN

El objeto principal de la invención es un polipéptido aislado con actividad celulolítica (en adelante el polipéptido de la invención) que comprende la secuencia SEQ ID N01 o que posee un grado de homología o de identidad de al menos un 80% con la SEQ ID N01 o que está codificado por un polinucleótido que híbrida bajo condiciones de baja, media, medio-alta, alta o muy alta astringencia con la secuencia SEQ ID NO 6 que codifica el polipéptido maduro.

Son asimismo un objeto de la invención, los fragmentos funcionales o las variantes del polipéptido de la invención. Otro objeto de la invención son las secuencias polinucleotídicas que codifican el polipéptido de la invención o los fragmentos funcionales o las variantes del mismo (en adelante polinucleótido de la invención).

Otro objeto de la invención viene representado por una construcción génica que comprende la secuencia polinucleotídica antes mencionada operativamente unida a una o más secuencias de control que dirigen la expresión de polipéptidos en sistemas de expresión.

Lógicamente, también es objeto de la invención un vector de expresión que comprende el polinucleótido de la invención o dicha construcción génica y una célula huésped que comprende dicho vector de expresión y que es capaz de producir el polipéptido de la invención o los fragmentos funcionales o las variantes de este.

Un objeto adicional de la invención es un método para producir el polipéptido de la invención que comprende:

a) Cultivar la célula huésped antes mencionada en las condiciones

necesarias para la producción del polipéptido,

b) Recuperar el polipéptido producido.

También es objeto de la presente invención una composición celulolítica que comprende al menos un polipéptido de acuerdo con la invención o al menos un fragmento funcional o una variante del mismo y, opcionalmente, al menos un elemento que favorezca o facilite la degradación de biomasa (en adelante composición de la invención).

Otro objeto fundamental de la invención es el uso del polipéptido de la invención, de los fragmentos funcionales o las variantes del mismo o de la composición de la invención para la degradación de biomasa.

De este objeto general se derivan los siguientes más particulares. El primero es un procedimiento para producir azúcares fermentables que comprende incubar biomasa con el polipéptido de la invención, con fragmentos funcionales o variantes del mismo o con la composición de la invención.

El segundo objeto que se deriva del uso antes mencionado es un procedimiento para producir un bioproducto a partir de biomasa que comprende:

a) producir azúcares fermentables incubando biomasa con el polipéptido de la invención, con fragmentos funcionales del mismo o con la composición de la invención

b) llevar a cabo una transformación química de los azúcares obtenidos en la etapa a) para obtener al menos un bioproducto,

c) Recuperar el al menos un bioproducto obtenido en la etapa b)

BREVE DESCRIPCIÓN DE LAS FIGURAS

Figura 1 : representa la hidrólisis de la celulosa por los tres tipos de celulasas: la endoglucanasa rompe los enlaces no covalentes en la estructura amorfa de la celulosa, la celobiohidrolasa libera celobiosa del final de la cadena y finalmente la celobiosa es hidrolizada por la beta-glucosidasa.

Figura 2: representa las etapas esenciales de la construcción y explotación de una librería metagenómica.

Figura 3: representación del clon 98 que contienen el gen celulasa ce/98. La figura muestra los diferentes dominios del polipéptido de la invención codificado por ce/98. En el extremo N-terminal en la posición 1-32 se encuentra la señal de translocación Twin-arginina (Tat). También se representa el dominio celulasa perteneciente a la familia 5 en la posición 41-378. Dentro del dominio celulasa hay un dominio de tipo fibronectina III. Asimismo se encuentran dos dominios de unión a carbohidratos de tipo 2 (CBM2) en las posiciones 443-570 y 664-780 y un dominio de unión a carbohidratos de tipo 6 (CBM6) en la posición 474-630.

Figura 4: representación de la actividad del polipéptido SEQ ID NO 1 a diferentes temperaturas ensayadas (30°C, 37°C, 45°C, 50°C y 56°C). Figura 5: representación de la disminución de la densidad óptica a diferentes temperaturas ensayadas: (A) 30°C, (B) 37°C, (C) 45°C y (D) 50°C. La disminución de la densidad óptica se asocia a la degradación de la carboximetilcelulosa (CMC).

Figura 6: representación de la disminución de la densidad óptica después de la incubación de la enzima a: (A) 30°C, (B) 37°C, (C) 40°C y (D) 42°C durante diferentes periodos de tiempo. La disminución de la densidad óptica se asocia a la degradación de la CMC.

Figura 7: representación de la actividad del polipéptido SEQ ID NO 1 a diferentes pH ensayados (5, 5.5, 6, 6.5, 7, 7.5 y 8).

Figura 8: representación de la disminución de la densidad óptica a diferentes pH ensayados (5, 5.5, 6, 6.5, 7, 7.5 y 8). La disminución de la densidad óptica se asocia a la degradación de la CMC.

Figura 9: Visualización de un clon positivo para actividad celulasa después del rastreo de la librería metagenómica de bacterias del suelo usando CMC como sustrato y el método rojo congo.

Figura 10: En la imagen de la izquierda se observa resaltada la banda correspondiente al vector linearizado empleado en la clonación. En la imagen del centro se observan los dos pocilios del gel donde se cargó el producto de PCR para obtener el inserto de interés y finalmente en la imagen de la derecha se observan tanto el vector como el inserto antes justo del paso de la ligación, a fin de poder ver la cantidad de que se disponía cada uno y poder ajusfar así las proporciones de vector/inserto para la ligación.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN

Con el fin de facilitar la comprensión y de aclarar el significado de determinados términos en el contexto de la presente invención se aportan las siguientes definiciones: "Polipéptido": es una secuencia de aminoácidos de una longitud de entre aproximadamente 100 y 1000 aminoácidos, preferiblemente entre aproximadamente 200 y 950 y más preferiblemente entre aproximadamente 340 y 930 aminoácidos, que puede ser producido en un sistema de expresión heterólogo o producido sintéticamente. Los aminoácidos que forman el polipéptido pueden estar modificados o no modificados y aunque los aminoácidos que forman el polipéptido son eminentemente aminoácidos proteicos (alanina, arginina, asparagina, aspartato, cisteína, fenilalanina, glicina, glutamato, glutamina, histidina, isoleucina, leucina, lisina, metionina, prolina, serina, tirosina, treonina, triptófano y valina), el polipéptido puede tener algún aminoácido proteico sustituido por alguno no proteico o sintético.

"Polipétido de la invención": es un polipéptido aislado con actividad celulolítica que comprende la secuencia SEQ ID N01 o que posee un grado de homología o de identidad de al menos un 80% con la SEQ ID N01 o que está codificado por un polinucleótido que híbrida bajo condiciones de baja, media, medio-alta, alta o muy alta astringencia con la secuencia SEQ ID NO 6 que codifica el polipéptido maduro.

"Actividad celulolítica o celulasa": hace referencia a la capacidad que tiene el polipétido de la invención, así como los fragmentos funcionales o las variantes del mismo de degradar por hidrólisis los enlaces (1 ,4)-b-D-glicosídicos de la celulosa. La actividad celulolítica o celulasa puede ser endoglucanasa, exoglucanasa, celobiohidrolasa o beta-glucosidasa dependiendo del tipo de sustrato celulósico sobre el que actúe el polipéptido. Aunque el polipéptido de la invención puede mostrar una actividad celulolítica o celulasa variada, su actividad es preferentemente endoglucanasa.

"Grado de homología": se refiere a la correspondencia de secuencia que se da entre una determinada cadena polipeptídica con otra. El término grado de homología implica que la longitud del polipéptido frente al de referencia puede ser mayor, menor o igual. Cuando en el contexto de la invención se menciona, por ejemplo, que un polipéptido tiene un grado de homología de al menos un 80% con una secuencia determinada significa que este polipéptido puede tener una correspondencia de entre un 100% hasta un 80% con dicha secuencia y que su longitud puede ser mayor, menor o igual al de dicha secuencia.

"Grado de identidad": se refiere a la correspondencia de secuencia que se da entre una determinada cadena polipeptídica con otra. El término grado de identidad implica que la longitud del polipéptido siempre es igual frente al de referencia. Cuando en el contexto de la invención se menciona por ejemplo, que un polipéptido tiene un grado de identidad de al menos un 80% con una secuencia determinada significa que este polipéptido puede tener una correspondencia de secuencia de entre un 100% hasta un 80% con dicha secuencia y la longitud del polipéptido de referencia.

"Fragmento funcional": se refiere a aquellos fragmentos que se derivan del polipéptido de la invención y que conservan en mayor o menor medida la actividad celulasa del polipéptido original. El fragmento funcional puede conservar entre el 50% y el 100% de la actividad del polipéptido de la invención. También se refiere a aquellos fragmentos que conservando la actividad celulasa puedan presentar un perfil de actividad celulasa diferente al del polipéptido original.

"Variante del polipéptido de la invención": se refiere a aquellas modificaciones del polipéptido de SEQ ID NO 1 que impliquen sustituciones, deleciones y/o inserciones en una o más posiciones sin afectar sustancialmente a la actividad del polipéptido. Los cambios de aminoácidos pueden ser de naturaleza menor, esto es sustituciones o inserciones conservativas que no afecten significativamente el plegado y o actividad del polipétido; pequeñas deleciones normalmente de 1 a 30 aminoácidos; pequeñas extensiones de los extremos amino y carboxiterminal como pequeños péptidos de unión de 20-25 residuos o pequeñas extensiones que faciliten la purificación mediante el cambio de la carga neta u otra función, colas de polihistidinas, epítopos antigénicos o dominios de unión. También se contemplan variantes que puedan alterar de manera controlada y dirigida propiedades físico químicas del polipéptido. Por ejemplo, estas variantes incluyen cambios de aminoácidos que puedan mejorar la estabilidad térmica del polipéptido de la invención, cambiar su especificidad por el sustrato, su temperatura óptima o el pH óptimo. "Condiciones de muy baja astringencia": para sondas de al menos 100 nucleótidos de longitud implica prehibridación e hibridación a 42°C en SSPE 5X, SDS al 0.3%, 200 μg/ml de DNA fragmentado y desnaturalizado de esperma de salmón y 25% de formamida, siguiendo procedimientos estándar de Southern Blot de 12 a 24 horas. El material soporte se limpia finalmente 3 veces cada una 15 minutos usando SSC 2X y SDS al 0.2% a 45° C.

"Condiciones de baja astringencia": para sondas de al menos 100 nucleótidos de longitud implica prehibridación e hibridación a 42°C en SSPE 5X, SDS al 0.3%, 200 μg/ml de DNA fragmentado y desnaturalizado de esperma de salmón y 25% de formamida, siguiendo procedimientos estándar de Southern Blot de 12 a 24 horas. El material soporte se limpia finalmente 3 veces cada una 15 minutos usando SSC 2X y SDS al 0.2% a 50° C.

"Condiciones de media astringencia": para sondas de al menos 100 nucleótidos de longitud implica prehibridación e hibridación a 42°C en SSPE 5X, SDS al 0.3%, 200 μg/ml de DNA fragmentado y desnaturalizado de esperma de salmón y 35% de formamida, siguiendo procedimientos estándar de Southern Blot de 12 a 24 horas. El material soporte se limpia finalmente 3 veces cada una 15 minutos usando SSC 2X y SDS al 0.2% a 55° C.

"Condiciones de media-alta astringencia": para sondas de al menos 100 nucleótidos de longitud implica prehibridación e hibridación a 42°C en SSPE 5X, SDS al 0.3%, 200 μg/ml de DNA fragmentado y desnaturalizado de esperma de salmón y 35% de formamida, siguiendo procedimientos estándar de Southern Blot de 12 a 24 horas. El material soporte se limpia finalmente 3 veces cada una 15 minutos usando SSC 2X y SDS al 0.2% a 60° C.

"Condiciones de alta astringencia": para sondas de al menos 100 nucleótidos de longitud implica prehibridación e hibridación a 42°C en SSPE 5X, SDS al 0.3%, 200 μg/ml de DNA fragmentado y desnaturalizado de esperma de salmón y 50% de formamida, siguiendo procedimientos estándar de Southern Blot de 12 a 24 horas. El material soporte se limpia finalmente 3 veces cada una 15 minutos usando SSC 2X y SDS al 0.2% a 65° C. "Condiciones de muy alta astringencia": para sondas de al menos 100 nucleótidos de longitud significa prehibridación e hibridación a 42°C en SSPE 5X, SDS al 0.3%, 200 μg/ml de DNA fragmentado y desnaturalizado de esperma de salmón y 50% de formamida, siguiendo procedimientos estándar de Southern Blot de 12 a 24 horas. El material soporte se limpia finalmente 3 veces cada una 15 minutos usando SSC 2X y SDS al 0.2% a 70° C.

"Construcción génica": es una sucesión de información genética codificada en una secuencia polinucleotídica generalmente de ADN de cadena simple o doble cadena, dispuesta de tal forma que potencialmente permite ejecutar el programa genético para el cual fue diseñada. La construcción génica comprende tanto elementos codificantes como no codificantes como por ejemplo secuencias de control. Normalmente, la construcción génica comprende al menos la secuencia que codifica la proteína o polipéptido de interés, así como una o más secuencias promotoras de la expresión y al menos una secuencia de terminación.

"Operativamente unida": implica que los diferentes elementos de la construcción génica están dispuestos de tal forma que actúan de manera operativa para ejecutar correctamente el programa genético para la cual fue diseñada dicha construcción génica.

"Sistemas de expresión": son sistemas uni o pluricelulares que permiten producir proteínas recombinantes cuando son transfectados o transformados con vectores apropiados que comprenden el gen recombinante deseado o manipulados genéticamente para incorporar dicho gen en su propio genoma. Los sistemas unicelulares de expresión pueden ser procariotas como por ejemplo bacterias o eucariotas como levaduras, células de insecto o incluso cultivos de células de mamíferos. Ejemplos de sistemas de expresión pluricelulares son larvas de insectos o plantas modificadas genéticamente. En el contexto de la invención son preferidos los sistemas de expresión unicelulares y más particularmente bacterias del género Bacillus, Clostridium, Esherichia, Klebsiella, Pseudomonas, Streptomyces, Thermoanaerobacterium o Zymomonas o hongos de las especies Aspergillus awamori, Aspergillus foetidus, Aspergillus fumigatus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis rivulosa, Ceriporiopsis sufrufa, Ceriporiopsis subvermispora, Coprinus cinereus, Coriolus hirsutus, Fusarium bactridioides, Fusarium cereales, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Phanerochaete chrysosporium, Phlebia radiata, Pleurotus eryngii, Saccharomyces calsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norvensis, Saccharomyces oviformis, Thielavia terrestres, Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reseii, Trichoderma viride o Yarrowia lipolytica.

"Vector de expresión": es un sistema de transfección o transformación de células que permite incorporar una construcción génica en una célula y cuya finalidad es la expresión por parte de dicha célula de una proteína recombinante. Los tipos de vectores de expresión más habituales son plásmidos y vectores virales aunque en el contexto de la invención incluye cualquier otro tipo de vectores comúnmente usados.

"Célula huésped": es la célula capaz recibir por transfección o transformación material genético externo que es capaz de expresar de forma transitoria o estable. El término célula huésped también se refiere no solo a la célula directamente transfectada o transformada sino también a toda su progenie.

"Biomasa": en el contexto de la presente invención se asimila "biomasa" con "biomasa celulósica" esto es toda materia orgánica que comprenda material lignocelulósico y que sea susceptible de ser transformada a sus componentes más elementales (azúcares fermentables) mediante un proceso industrial de degradación con enzimas celulasas. La biomasa puede ser, por ejemplo, la fracción biodegradable de los productos, residuos y restos de origen biológico procedentes de la agricultura (incluyendo sustancias vegetales, tales como residuos de cultivos, y sustancias animales) industrias forestales (tales como recursos madereros) e industrias relacionadas que incluyen pesquerías y acuicultura, así como la fracción celulósica biodegradable de los residuos industriales y urbanos, tales como residuos sólidos urbanos o residuos de papel. En el contexto de la invención de manera preferente la biomasa es paja o la fracción orgánica de residuos sólidos urbanos y de manera aun más preferente, la biomasa es biomasa vegetal seleccionada a partir de la lista que consiste en: biomasa rica en azúcares fermentables, tales como caña de azúcar; biomasa de almidón, por ejemplo, granos o paja de trigo; o maíz o paja de maíz o grano de maíz o fibra de maíz; o granos o paja de cebada; o granos o paja de sorgo. La biomasa también puede ser, arroz, hierba, ramas, etc.

"Degradación de biomasa": Es el proceso de transformación de la biomasa celulósica en sus componentes elementales (azúcares fermentables), principalmente glucosa, mediante la acción de celulasas.

"Azúcares o azúcares fermentables": es el producto resultante del proceso de degradación de biomasa y comprende todos aquellos azúcares que son susceptibles de ser transformados químicamente o fermentados para dar lugar a bioproductos de alto valor añadido. Aunque no es el único, el principal azúcar fermentable es la glucosa.

"Bioproductos": son los productos de alto valor añadido que pueden obtenerse por transformación química de los azúcares o por fermentación de dichos azúcares con diferentes microorganismos. Sin pretender ser limitativa, una lista de posibles microorganismos fermentantes es la siguiente: Bacillus thermoglucosidaisus, Clostridium butyricum, Corynebacterium glutamicum, Enterobacter aerogenes, Escherichia coli, Geobacillus themoglucosidasius, Klebsiella oxytoca, Lactobacillus sp. Leunoscoc mesenteroides, Thermoanaerobacter BG1L1, Thermoanaerobacter ethanolicus, Thermoanaerobacter mathranii, Thermoanaerobacter thermosaccharolyticum, Zymobacter palmae, Zymomonas mobilis Candida arabinofermentans, Candida boidinii, Candida diddensis, Candida fermentans, Chrysosporium lucknowense, Candida pastoris, Candida shehatae, Candida sonorensis, Candida tropicalis, Hansenula anómala, Hansenula polymorpha, Kluyveromyces fragilis, Kluyveromyces marxianus, Pichia pastoris, Pichia stipitis, Saccharomyces cerevisiae, Saccharomyces bulderi, Saccharomyces barnetti, Saccharomyces exiguus, Saccharomyces diastaticus, Saccharomyces uvarum o Schizosaccharomyces pombe o mezclas de estos. Estos y otros microorganismos pueden proporcionar por fermentación de diferentes azúcares, bioproductos entre los cuales se pueden citar de manera no limitativa los siguientes: alcoholes como etanol, metanol, butanol, hexanol, octanol, decanol, dodecanol, 1 ,3-butanediol(1 ,3- diol), 1 -alcohol; ácidos orgánicos como ácido cítrico, ácido acético, ácido itaconico, ácido láctico, ácido glutámico, ácido succínico, beta-cetoácido, beta-cetoalcohol, beta-hidroxiácido; cetonas como la acetona; gases como hidrógeno o dióxido de carbono; hidrocarburos como alcanos alquenos o alquinos; sustancias nitrogenadas como aminas, amida, nitrocom puestos o nitrilos; haluros; aminoácidos como ácido glutámico; antiobioticos como penicilina o tetraciclinas; vitamina como riboflavina, vitamina B12 o betacaroteno; ácidos grasos como ácido dodecanoico, ácidos grasos trans-A2 o ácido palmítico; y otros productos como etileno, glicerol, 1 ,3- propano-diol, betalactano, cefalosporinas, ácidos grasos trans o furano.

Polipéptidos con actividad celulasa y fragmentos funcionales de los mismos

El aspecto principal de la presente invención se refiere a un polipéptido aislado con actividad celulasa que comprende o consiste en la secuencia SEQ ID N01 o que posee un grado de homología o de identidad de al menos un 80% con la SEQ ID N01 o que está codificado por un polinucleótido que híbrida bajo condiciones de baja, media, media-alta, alta o muy alta astringencia con la secuencia SEQ ID NO 6 que codifica el polipéptido maduro.

En una realización particular de la invención el polipéptido posee un grado de homología o de identidad de al menos un 85%, preferiblemente de al menos un 90%, más preferiblemente de al menos un 95% y aun más preferiblemente de al menos un 99% con la SEQ ID NO 1.

Por ejemplo, un polipéptido que posee un alto grado de homología (de entorno al 92%) con el polipéptido de SEQ ID NO 1 y representa una realización particular de la invención es el polipéptido con la secuencia SEQ ID NO 2. Esta secuencia posee 927 aminoácidos frente a los 928 de la SEQ ID NO 1. El polipéptido de secuencia SEQ ID NO 2 tiene una actividad celulasa comparable a la del polipéptido de SEQ ID NO 1.

No obstante en una realización preferida, el polipéptido de la invención se corresponde con la secuencia SEQ ID NO 1.

El polipéptido de SEQ ID NO 1 fue identificado y aislado a partir del screening de una metagenoteca de microorganismos del suelo. El polipéptido de SEQ ID NO 1 tiene 928 aminoácidos y posee una actividad celulasa muy marcada. Aunque el perfil de actividad indica que el polipéptido de SEQ ID NO 1 exhibe actividad exoglucanasa y beta-glucosidadasa, la actividad principal del mismo es endoglucanasa.

Los ensayos de actividad sobre el polipéptido de la invención demuestran que éste es activo a un amplio rango de temperaturas que va desde alrededor de 30°C hasta alrededor de 65°C. Preferiblemente, el polipéptido es activo a temperaturas de entre 30°C y 60°C, más preferiblemente de entre 30°C y 50°C, más preferiblemente de entre 37°C y 50°C y más preferiblemente de entre 37°C y 45°C. La temperatura óptima de actividad del polipéptido de la invención se encuentra entre los 45 y 50°C (ver figura 4 y 5).

Asimismo, el polipéptido de la invención muestra una gran termorresistencia y es capaz de mantener el mismo grado de actividad después de al menos 5 días de incubación a 30°C, o después de 6 días a 37°C. El grado de actividad se mantiene alto para el polipéptido incubado a 40°C durante dos días y empieza a decrecer a partir del tercero. Finalmente, con una incubación a 42°C el polipéptido pierde su actividad a los dos días, (ver figura 6).

En cuanto al pH óptimo, el polipéptido de la invención trabaja mejor a pH ligeramente ácido y es capaz de mantener la mayor parte de su actividad a pH en el rango de 5 a 7, aunque el pH óptimo de actividad se encuentra en el rango de 5-6,5 (ver figuras 7 y 8). El polipéptido de SEQ ID NO 1 posee 928 aminoácidos que comprenden diferentes dominios. En su extremo N-terminal, de la posición 1 a la 32 se encuentra el péptido señal con la señal de translocación Twin-arginine. El dominio catalítico o dominio con la actividad celulasa (perteneciente a la familia 5) se encuentra entre los aminoácidos 41 y 378. El polipéptido de SEQ ID NO 1 muestra también diferentes dominios de unión a carbohidratos, más concretamente entre las posiciones 443- 570 y 664-780 se encuentran dos dominios de unión a carbohidratos de tipo 2 (CBM2) y en la posición 474-630 un dominio de unión a carbohidratos de tipo 6 (CBM 6). La figura 3 es una representación donde se pueden observar los diferentes dominios y su ubicación en la secuencia del polipéptido de la invención.

El polipéptido de la invención también contempla variantes del polipéptido de SEQ ID NO 1 que comprenden sustituciones, deleciones y/o inserciones en una o más posiciones. Los cambios de aminoácidos pueden ser de naturaleza menor, esto es sustituciones o inserciones conservativas que no afecten significativamente el plegado y o actividad del polipéptido; pequeñas deleciones normalmente de 1 a 30 aminoácidos; pequeñas extensiones de los extremos amino y carboxiterminal como pequeños péptidos de unión de 20-25 residuos o pequeñas extensiones que faciliten la purificación mediante el cambio de la carga neta u otra función, colas de polihistidinas, epítopos antigénicos o dominios de unión.

También forman parte de la invención variantes con cambios del polipéptido de la invención que puedan alterar de manera controlada y dirigida propiedades físico químicas del polipéptido. Por ejemplo, estas variantes incluyen cambios de aminoácidos que puedan mejorar la estabilidad térmica del polipéptido de la invención, cambiar su especificidad por el sustrato, temperatura óptima, el pH óptimo etc.

Otro aspecto adicional de la invención son los fragmentos funcionales del polipéptido de la invención. Así pues, la invención no solo se extiende al polipéptido de SEQ ID N01 o a polipéptidos que posean un grado de homología o de identidad de al menos un 80% con la SEQ ID NO 1 , sino también a los fragmentos funcionales de estos, es decir a aquellos fragmentos que mantienen al menos entre el 50% y el 100% de la actividad celulasa del polipéptido de la invención. La actividad celulasa del polipéptido de la invención se encuentra en el dominio catalítico, entre los aminoácidos 41 y 378, por lo que para que un fragmento del polipéptido de la invención mantenga la actividad celulasa debe contener al menos este fragmento. Por tanto, los fragmentos funcionales de la presente invención comprenden al menos los aminoácidos entre las posiciones 41 y 378 de la SEQ ID NO 1.

En una realización particular dichos fragmentos comprenden o consisten en las secuencias SEQ ID NO 3, SEQ ID NO 4 o SEQ ID NO 5. Todos estos fragmentos mantienen la actividad celulasa del péptido aunque no tienen por qué mantener el mismo perfil de actividad.

Polinucleótidos

Otro aspecto relevante de la invención, viene representado por la secuencia polinucleotídica que codifica el polipéptido de la invención o los fragmentos funcionales del mismo.

El polinucleótido puede ser cualquier tipo de ácido nucleico de cadena doble o simple como por ejemplo ADN o ARN. Se consideran incluidos en el ámbito de la invención tanto el ADN genómico aislado a partir de clon de la librería metagenómica y que codifica el polipéptido de SEQ ID NO 1 , así como el cDNA obtenido por transcripción reversa de este. También son parte de la invención los ARNm que codifican el polipéptido de la invención.

Asimismo, forman parte de la invención las modificaciones del polinucleótido que codifican las posibles variantes del polipéptido de la invención descritas en el apartado relativo al polipéptido con actividad celulasa y sus fragmentos funcionales.

En una realización particular la secuencia nucleotídica comprende o consiste en una de las siguientes secuencias: SEQ ID NO 6, SEQ ID NO 7, SEQ ID NO 8, SEQ ID NO 9 o SEQ ID NO 10.

La SEQ ID NO 6 es la secuencia polinucleotídica que codifica el polipéptido de SEQ ID NO 1. La invención también contempla las secuencias polinucleotídicas que comprendan variaciones en uno o varios nucleótidos pero que no resultan en un cambio de la secuencia polipeptídica que codifica la SEQ ID NO 6.

La SEQ ID NO 7 es la secuencia polinucleotídica que codifica el polipéptido con la secuencia SEQ ID N02. La invención también contempla las secuencias polinucleotídicas que comprendan variaciones en uno o varios nucleótidos pero que no resultan en un cambio de la secuencia polipéptídica que codifica la SEQ ID NO 7.

Las SEQ ID NO 8, 9 y 10 representan la secuencia codificadora de algunos de los fragmentos funcionales preferidos de la invención. La invención también contempla las secuencias polinucleotídicas que comprendan variaciones en uno o varios nucleótidos pero que no resultan en un cambio de la secuencia polipeptídica de estos fragmentos.

Construcción génica

Otro aspecto adicional de la invención es una construcción génica que comprende una secuencia polinucleotídica como las mencionadas más arriba que se encuentra operativamente unida a una o más secuencias de control que dirigen la expresión de polipéptidos en sistemas de expresión.

Las secuencias de control pueden ser un promotor, un polinucleótido que es reconocido por el sistema de expresión (célula huésped) para la expresión del polipéptido de la invención. Los promotores contienen secuencias de control transcripcional que median la expresión del polipéptido. El promotor puede ser cualquier polinucleótido que muestre actividad transcripcional en la célula huésped incluyendo promotores mutantes, truncados e híbridos y pueden ser obtenidos de genes que codifican polipéptidos extracelulares o intracelulares ya sean homólogos o heterólogos a la célula huésped.

Ejemplos de promotores adecuados para dirigir la transcripción de los polipéptidos de la invención en células huésped bacterianas pueden ser los promotores obtenidos del gen alfa-amylasa de Bacillus amyloliquefaciens (amyQ), del gen alfa- amylasa de Bacillus licheniformis (amyL), del gen de la penicilinasa de Bacillus licheniformis (penP), del gen de la amilasa maltogénica de Bacillus stearothermophilus (amyM), del gen de la levansucrasa de Bacillus subtilis (sacB), de los genes xylA and xylB Bacillus subtilis, del gen cryIIIA de Bacillus thuringiensis (Agaisse and Lereclus, 1994, Molecular Microbiology 13: 97-107), del operon lac de E. coli, del promotor trc de E. coli (Egon et al., 1988, Gene 69: 301-315), del gen agarasa de Streptomyces coelicolor (dagA), y del gen beta-lactamase procariotico (Villa-Kamaroff et al., 1978, Proc. Nati. Acad. Sci. USA 75: 3727-3731), así como del promotor tac (DeBoer et al., 1983, Proc. Nati. Acad. Sci. USA 80: 21-25). Promotores adicionales se describen en "Useful proteins from recombinant bacteria" Gilbert et al., 1980, Scientific American 242: 74-94; y en Sambrook, E.F. Fritsch, and T. Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 2d edition, Cold Spring Harbor, New York. Ejemplos de promotores tándem se describen en WO 99/43835.

Ejemplos de promotores adecuados para dirigir la transcripción en células hospedadoras de hongos filamentosos pueden ser los promotores obtenidos de los genes de la acetamidasa de Aspergillus nidulans acetamidase, de la alfa amilasa neutra de Aspergillus niger, de la alfa amilasa acidoestable de Aspergillus niger, de la glucoamilasa de Aspergillus niger o Aspergillus awamori glucoamylase (glaA),de la TAKA amilasa de Aspergillus oryzae, de la proteasa alcalina de Aspergillus oryzae, de la triosa fosfato isomerasa de Aspergillus oryzae, de la proteasa similar a tripsina de Fusarium oxysporum (WO 96/00787), de la aminoglucosidasa de Fusarium venenatum (WO 00/56900), Fusarium venenatum Daría (WO 00/56900), Fusarium venenatum Quinn (WO 00/56900), de la lipasas de Rhizomucor miehei, de la proteinasa aspartica de Rhizomucor miehei, de la beta-glucosidasa de Trichoderma reesei, de la celobiohidrolasa I de Trichoderma reesei, de la celobiohidrolasa II de Trichoderma reesei, de la endoglucanasa I de Trichoderma reesei, de la endoglucanasa II de Trichoderma reesei, de la endoglucanasa III de Trichoderma reesei, de la endoglucanasa V de Trichoderma reesei, de la xilanasa I de Trichoderma reesei, de la xilanasa II de Trichoderma reesei, de la xilanasa III de Trichoderma reesei , de la beta xilosidasa de Trichoderma reesei, y del factor de elongación de la traducción de Trichoderma reesei , así como de promotor NA2-tpi ( un promotor modificado del gen de la alfa amilasa neutra de Aspergillus en la que la secuencia líder no traducida se ha sustituido por una secuencia líder no traducida de un gen de la triosa fosfato isomerasa de Aspergillus; ejemplos no limitativos incluyen promotores modificados del gen de la alfa amilasa neutra de Aspergillus niger en el que la secuencia líder no traducida se ha sustituido por una secuencia líder no traducida del gen de la triosa fosfato isomerasa de Aspergillus nidulans o Aspergillus oryzae); y promotores mutantes, truncados, e híbridos de los mismos. Otros promotores se describen en US601 1147. Otro promotor adecuado es el promotor Pcbh de Myceliophtora termophila.

En células de levaduras los promotores útiles se pueden obtener de los genes de la enolasa de Saccharomyces cerevisiae (ENO-1), de la galactoquinasa de Saccharomyces cerevisiae (GAL1), de la alcohol deshidrogenasa/gliceroaldehido-3- fosfatasa desidrogenasa de Saccharomyces cerevisiae (ADH1 , ADH2/GAP), de la triosa fosfato isomerasa de Saccharomyces cerevisiae (TPI), de la metalotioneina de Saccharomyces cerevisiae (CUP1), y la 3 fosfoglicerato quinasa de Saccharomyces cerevisiae. Otros promotores útiles para levaduras se describen en Romanos et al., 1992, Yeast 8: 423-488.

La secuencia de control puede también ser un terminador de la transcripción, que es reconocido por la célula huésped para terminar la transcripción. El terminador está operativamente unido al término 3' del polinucleótido que codifica el polipéptido. Cualquier terminador que sea funcional en la célula huésped puede usarse en el contexto de la presente invención.

Algunos terminadores apropiados para células huésped bacterianas pueden obtenerse a partir de genes de la proteasa alcalina de Bacillus clausii (aprH), de la alfa amilasa de Bacillus licheniformis (amyL), y Escherichia coli ribosomal RNA (rrnB).

Algunos terminadores adecuados para células huésped de hongos filamentosos se pueden obtener de los genes acetamidasa de Aspergillus nidulans, de la antranilato sintasa de Aspergillus nidulans anthranilate, de la glucoamilasa de Aspergillus niger, de la alfaglucosidasa de Aspergillus niger, de la TAKA amilasa de Aspergillus oryzae, de la proteasa semejante a tripsina de Fusarium oxysporum, de la beta- glucosidasa de Trichoderma reesei, de la celobiohidrolasa I de Trichoderma reesei, de la celobiohidrolasa II de Trichoderma reesei, de la endoglucanasa I de Trichoderma reesei, de la endoglucanasa II Trichoderma reesei, de la endoglucanasa III de Trichoderma reesei, de la endoglucanase V de Trichoderma reesei, de la xilanasa I de Trichoderma reesei, de la xilanasa II de Trichoderma reesei, de la xilanasa III de Trichoderma reesei, de la beta-xilosidasa de Trichoderma reesei y del factor de elongación de traducción de Trichoderma reesei. Otra secuencia terminadora es la secuencia Tcbh.

Algunos terminadores adecuados para células huésped de levaduras se pueden obtener a partir de genes de la enolasa de Saccharomyces cerevisiae, del citocromo C de Saccharomyces cerevisiae (CYC1) y de la gliceraldehido-3-fofato deshidrogenasa de Saccharomyces cerevisiae. Otros terminadores útiles en levaduras se describen en Romanos et al., 1992, Yeast 8: 423-488.

La secuencia control puede ser también una región estabilizadora del RNAm posterior al promotor pero anterior a la secuencia codificante de un gen que incremente la expresión del gen. Ejemplos de secuencias estabilizadoras de RNAm se pueden obtener del gen cryIIIA de Bacillus thuringiensis (WO 9425612) del gen SP82 de Bacillus subtilis (Hue et al., 1995, Journal of Bacteriology MI: 3465-3471).

La secuencia de control puede ser también una secuencia líder, una región no traducida del RNAm que es importante en la traducción por parte de la célula huésped. La secuencia líder está operativamente unida a la región 5' terminal del polinucleótido que codifica el polipéptido. Cualquier secuencia líder funcional en la célula huésped puede usarse.

Secuencias líder adecuadas en hongos filamentosos se pueden obtener de los genes de la TAKA amilasa de Aspergillus oryzae y triosa fosfato isomerasa de Aspergillus nidulans.

Secuencias líder apropiadas para levaduras se pueden obtener de los genes de la enolasa de Sacharomyces cerevisiae (ENO-1), de la 3-fosfogliceratoquinasa de Saccharomyces cerevisiae, del de factor alfa de Saccharomyces cerevisiae, y del de la alcohol deshidrogenasa/Gliceraldehído-3-fosfato deshidrogenasa de Saccharomyces cerevisiae (ADH2/GAP).

La secuencia de control también puede ser una secuencia de poliadenilación una secuencia operativamente unida a término 3' del polinucleótido y que cuando es transcrito la célula huésped la reconoce como una señal para añadir residuos poliadenosina al mRNA transcrito. Cualquier señal de poliadenilación funcional en la célula huésped puede ser usada.

Algunas secuencias de poliadenilación adecuadas para células huésped de hongos filamentosos se pueden obtener a partir de los genes de la antranilato sintasas de Aspergillus nidulans, de la glucoamilasa de Aspergillus niger, de la alfa-glucosidasa de Aspergillus niger, de la TAKA amilasa de Aspergillus oryzae y de la proteasa similar a tripsina de Fusarium oxysporum.

Secuencias de poliadenilación útiles en células huésped de levaduras se describen en Guo and Sherman, 1995, Mol. Cellular Biol. 15: 5983-5990.

La secuencia de control puede ser también un péptido señal que codifica un péptido señal unido al extremo N-terminal del polipétido y dirige al polipéptido a las vías secretoras de señalización celular. La región 5' terminal de la secuencia codificante puede contener una secuencia codificante de un péptido señal naturalmente unido en el fragmento de traducción con el segmento de la secuencia codificante del polipéptido. Alternativamente el termino 5' de la secuencia codificante puede contener una secuencia codificante de un péptido señal que es ajeno a la secuencia codificante. Una secuencia codificante de un péptido señal ajeno puede ser necesario cuando la secuencia codificante no contiene de manera natural una secuencia codificante de un péptido señal. Por otro lado, una secuencia ajena puede estar sencillamente reemplazando una secuencia codificante del péptido secuencia natural con el fin de potenciar la secreción del polipéptido. No obstante, cualquier secuencia codificante de un péptido señal que dirija el polipéptido expresado por las vías de secreción celular puede ser usada.

Secuencias codificantes de péptidos señal adecuadas para bacterias pueden obtenerse de los genes de la amilasa maltogenica de Bacillus NCIB 1 1837, de la subtilisina de Bacillus licheniformis, de la beta-lactamasa de Bacillus licheniformis, de la amilasa de Bacillus stearothermophilus, de las proteasas neutras de Bacillus stearothermophilus (nprT, nprS, nprM) y de la proteasa A de Bacillus subtilis. Otros peptides señal se describen en Simonen and Palva, 1993, Microbiological Reviews 57: 109-137. Otras secuencias señal apropiadas para su uso en bacterias son las secuencias Twin arginine y las secuencia Sec.

Secuencias codificantes de péptidos señal adecuadas para hongos filamentosos pueden obtenerse de los genes de la amilasa neutra de Aspergillus niger, de la glucoamilasa de Aspergillus niger, de la TAKA amilasa de Aspergillus oryzae, de la celulasa de Humicola insolens, de la endoglucanasa V de Humicola insolens, de la lipasas de Humicola lanuginosa lipase y de la proteinasa aspartica de Rhizomucor miehei.

Péptidos señal para levaduras se pueden obtener de los genes del factor alfa de Sacharomyces cerevisiae y de la invertasa de Saccharomyces cerevisiae. Otras secuencias codificantes de péptidos señal se describen en Romanos et al., 1992, Yeast 8: 423-488.

También puede ser deseable añadir secuencias reguladoras que regulen la expresión del polipéptido en función al crecimiento de la célula huésped. Ejemplos de secuencias reguladoras son aquellas que causan que la expresión del gen se active o se inactive en respuesta a estímulos químicos o físicos, incluyendo la presencia de un compuesto regulador. Secuencias reguladoras sistemas procariotas incluyen los sistemas operadores lac, tac y trp. En levaduras se pueden usar los sistemas ADH2 o GAL1. En hongos filamentosos se pueden usar el promotor glucoamilasa de Aspergillus niger, el promotor TAKA alfa amilasa de Aspergillus oryzae, y el promotor glucoamilasa de Aspergillus oryzae, el promotor celobiohidrolasa I de Trichoderma reesei el promotor celobiohidrolasa II de Trichoderma reesei y el promotor Pcbh de Mycelliophthora thermophila.

Otros ejemplos de secuencias reguladoras son aquellas que permiten la amplificación génica. En sistemas eucariotas, estas secuencias reguladoras incluyen las secuencias reguladoras del gen de la dihidrofolato reductasa que se amplifica en presencia de metotrexato y los genes de la metalotioneina que se amplifican con metales pesados. En estos casos el polinucleótido que codifica el polipéptido estaría operativamente unido a la secuencia reguladora.

El vector de expresión

En otro aspecto la invención también se refiere a un vector de expresión que comprende un polinucleótido o una construcción génica como los anteriormente descritos.

El vector de expresión comprende el polinucleótido de la invención, al menos un promotor y señales de terminación transcripcionales y traduccionales. Las diferentes secuencias nucleotídicas y de control pueden estar unidas para producir un vector de expresión recombinante que puede incluir uno o más sitios de restricción para permitir la inserción o sustitución del polinucleótido que codifica el polipéptido de la invención en dichos sitios.

Alternativamente, el polinucleótido puede expresarse mediante la inserción del polinucleótido o la construcción génica de la invención en un vector apropiado para la expresión. Al crear el vector de expresión la secuencia codificante debe estar operativamente unida con las secuencias de control apropiadas para garantizar la expresión. El vector de expresión puede ser cualquier vector (por ejemplo virus o plásmido) que pueda ser sometido a procesos de ADN recombinante y que pueda llevar a cabo la expresión del polinucleótido. La elección del vector depende esencialmente de la compatibilidad del vector con la célula huésped en la cual vaya a ser introducido el vector. El vector puede ser un plásmido linear o circular.

El vector puede ser un vector autónomamente replicante, es decir, un vector que existe como una entidad extracromosomal y cuya replicación es independiente de la replicación del cromosoma como, por ejemplo, un plásmido, un elemento extracromosomal, un minicromosoma, o un cromosoma artificial. El vector puede contener cualquier medio para asegurar su autoreplicación. Asimismo, el vector puede ser uno que al ser introducido en la célula huésped se integra en el genoma y se replica junto con el o los cromosomas en los cuales se inserta. Además se puede usar un vector único o plásmido o más vectores o plásmidos que conjuntamente contengan el ADN total que ha de ser introducido en el genoma de la célula huésped o también un transposón.

El vector contiene preferiblemente uno o más marcadores que permiten la selección sencilla de células transformadas o transfectadas. Un marcador de selección es un gen cuyo producto proporciona resistencia a un producto, un virus, resistencia a metales pesados, prototrofía a auxotrofos etc.

Ejemplos de marcadores de selección adecuados para bacterias son los genes DAL de Bacillus licheniformis o Bacillus subtilis, o marcadores que confieren resistencia a antibióticos como resistencia a ampicillina, cloranfenicol, kanamicina, neomcina, espectinomicina o tetraciclina.

Marcadores apropiados para levaduras incluyen pero no se limitan a ellos, ADE2, HIS3, LEU2, LYS2, MET3, TRP1 y URA3.

Marcadores de selección para uso en hongos filamentosos incluyen pero no se limitan a, adeA (fosforibosilaminoimidazol-succinocarboxamida sintasa), adeB (fosforibosil-aminoimidazol sintasa), amdS (acetamidasa), argB (ornitina carbamoiltransferasa), bar (fosfinotricin acetiltransferasa), hph (higromicina fosfotransferasa), niaD (nitrato reductasa), pyrG (orotidina-5'-fosfato decarboxilasa), sC (sulfato adeniltransferasa) y trpC (antranilato sintasa) y equivalentes de los mismos. Los marcadores preferidos para células de Aspergillus son los genes amdS y Pyr G de Aspergillus nidulans o Aspergillus oryzae y el gen bar de Streptomyces hygroscopicus. Los marcadores preferidos para células de Trichoderma cell son los genes adeA, adeB, amdS, hph, y pyrG. Otros marcadores preferidos son Pyr 4, Pyr 5, CysC y trp.

El vector de la invención debe contener preferiblemente elementos que permitan la integración del vector en el genoma de la célula huésped o la replicación autónoma del vector en la célula de manera independiente al genoma. Para la integración en el genoma el vector puede contener elementos de integración por recombinación homologa o no homologa. Incluso, puede incluir secuencias polinucleotídicas para dirigir la integración por recombinación homologa en locus concretos en el(los) cromosoma(s). El elemento integracional puede ser cualquier secuencia homologa a la secuencia diana en el genoma de la célula huésped. Además los elementos integracionales pueden ser secuencias codificantes o no codificantes.

Para la replicación autónoma, el vector de la invención puede comprender un origen de replicación que le permita al vector autorreplicarse en la célula huésped. El origen de replicación puede ser cualquier replicador plasmídico que funcione en la célula huésped.

Ejemplos de orígenes de replicación bacterianos son los orígenes de replicación de los plásmidos pBR322, pUC19, pACYC177 y pACYC184 que permiten la replicación en E. coli y pUB1 10, pE194, pTA1060 y [rho][Alpha][Mu][beta][lota] que permiten la replicación en Bacillus.

Ejemplos de orígenes de replicación para usar en levaduras son los orígenes de replicación de dos micrones ARS1 , ARS4, la combinación de ARS1 y CEN3, y la combinación de ARS4 y CEN6.

Ejemplos de orígenes de replicación en hongos filamentosos son AMA1 y ANSI (Gems et al., 1991 , Gene 98: 61 -67; Cullen et al., 1987, Nucleic Acids Res. 15: 9163- 9175; WO 0024883). WO0024883 describe como se puede conseguir el aislamiento del gen AMA1 y la construcción de plásmidos o vectores que lo comprenden.

Se puede insertar más de una copia del polinucleótido en la célula huésped para incrementar la producción del polipéptido de la invención. El incremento en el número de copias del polinucleótido se puede conseguir integrando al menos una copia adicional de la secuencia en el genoma de la célula huésped.

Célula huésped

Otro aspecto relevante de la invención se relaciona con una célula huésped que comprende un polinucleótido, una construcción génica o un vector de expresión como los mencionados anteriormente y que expresa el polipéptido de la invención o un fragmento funcional o una variante del mismo.

La célula huésped puede ser una célula eucariota o una célula procariota.

En una realización particular la célula huésped es una célula procariota que se selecciona preferiblemente del grupo de bacterias de los géneros Bacillus, Clostridium, Esherichia, Klebsiella, Pseudomonas, Streptomyces, Thermoanaerobacterium o Zymomonas.

En otra realización particular, la célula huésped es una célula eucariota que se selecciona preferentemente del grupo de hongos de las especies Aspergillus awamori, Aspergillus foetidus, Aspergillus fumigatus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis rivulosa, Ceriporiopsis sufrufa, Ceriporiopsis subvermispora, Coprinus cinereus, Coriolus hirsutus, Fusarium bactridioides, Fusarium cereales, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Phanerochaete chrysosporium, Phlebia radiata, Pleurotus eryngii, Saccharomyces calsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norvensis, Saccharomyces oviformis, Thielavia terrestres, Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reseii, Trichoderma viride o Yarrowia lipolytica.

Cualquier medio comúnmente conocido para introducir material genético en células huésped como transformación de protoplastos, transformación de células competentes, electroporación o conjugación puede ser usado para transformar o transfectar las células huésped. Método de producción del polipéptido de la invención

Otro aspecto importante de la invención es el método para producir un polipéptido con actividad celulolítica de la invención que comprende:

a) Cultivar una célula huésped como la mencionada anteriormente en las condiciones necesarias para la producción del polipéptido,

b) Recuperar el polipéptido producido.

La etapa a) relativa al cultivo de las células huésped se lleva a cabo en un medio nutritivo adecuado para la célula para producir el polipéptido. Los medios nutritivos adecuados para el cultivo están disponibles comercialmente o pueden ser preparados de acuerdo con protocolos bien conocidos por un experto en la materia.

El cultivo se puede llevar a cabo a escala de laboratorio o a escala industrial en termentadores industriales mediante métodos comúnmente conocidos por el experto en la materia. El proceso industrial puede llevarse a cabo en continuo o discontinuo.

En una realización preferida el cultivo de la etapa a) se lleva a cabo a nivel industrial en termentadores industriales bajo condiciones controladas (temperatura, pH, nutrientes etc.). Además preferentemente el proceso se lleva a cabo en continuo.

El polipéptido se puede recuperar mediante cualquier método conocido y convencional. Por ejemplo, el polipéptido de la invención se puede recuperar del medio mediante colección, centrifugación, filtración, extracción, evaporación o precipitación. Asimismo, una vez recuperado el polipéptido de la invención puede ser purificado si fuera necesario por procesos comúnmente conocidos por un experto en la materia.

No obstante, en una realización preferida de la invención, la recuperación comprende la hidrólisis de las células huésped para liberar al medio todo el contenido celular incluido el polipéptido de la invención y el trasvase de la corriente con el sobrenadante, en el cual se encuentra el polipéptido de la invención, directamente al lugar o fermentador donde se llevará a cabo el proceso de digestión o degradación de la biomasa. Composición celulolítica

Otro aspecto de la invención es una composición celulolítica que comprende al menos un polipéptido de acuerdo con la invención o al menos un fragmento funcional o una variante del mismo y, opcionalmente, al menos un elemento que favorezca o facilite la degradación de biomasa.

La composición de la invención comprende como elemento esencial de la misma al menos un polipéptido de acuerdo con la invención o al menos un fragmento funcional o una variante del mismo, así como los elementos esenciales para que este ejerza correctamente su función celulolítica. Estos elementos son básicamente un tampón adecuado (preferiblemente un tampón citrato-fosfato, 50 mM, pH 5) y un medio electrolíticamente adecuado para mantener al máximo la funcionalidad del polipéptido de la invención o de sus fragmentos funcionales o variantes.

La composición de la invención normalmente se presenta en forma líquida aunque puede presentarse en forma sólida reconstituible.

De manera opcional aunque preferida, la composición comprende al menos un elemento adicional que favorece o facilita la degradación de biomasa. Dicho elemento que favorece o facilita la degradación de biomasa puede ser cualquier agente químico, físico o biológico que ayude en la degradación completa del material lignocelulósico de la biomasa.

En una realización preferida la composición comprende como elemento que facilita la degradación de la biomasa una o más enzimas seleccionadas de entre endoglucanasas, exoglucanasas, celobiohidrolasas, beta-glucosidasas, glicosil- hidrolasas, hemicelulasas, xylanasas, enzimas lignolíticas o mezclas de las mismas.

Uso del polipéptido

Otro aspecto general de la invención se refiere al uso del polipéptido de la invención, de un fragmento funcional o una variante del mismo o de la composición celulolítica de la invención de para la degradación de biomasa.

Este aspecto general del uso del polipéptido de la invención, de un fragmento funcional o de una variante del mismo o de la composición celulolítica de la invención para la degradación de biomasa está encuadrado dentro del campo de la invención que es la producción industrial de bioproductos.

En este sentido, un aspecto particular de la invención se refiere a un procedimiento para producir azúcares fermentables que comprende incubar biomasa con el polipéptido de la invención, con un fragmento o variante del mismo o con la composición celulolítica de la invención.

Estos azúcares fermentables obtenidos se encuentran en el sobrenadante obtenido tras la incubación. Dado que la presente invención está enfocada principalmente en el campo de la producción de bioproductos normalmente la corriente con los azúcares fermentables se redirige directamente desde el tanque donde se lleva a cabo la digestión hidrolítica de la biomasa a donde se da la transformación química de este sustrato preferiblemente por fermentación microbiana.

Esto no quita que en una realización particular los azúcares fermentables pueden opcionalmente ser recuperados tras la incubación y ser procesados y purificados para otros usos diferentes. La recuperación de los azúcares en este caso se podría llevar a cabo por cualquier método adecuado para tal fin como por ejemplo centrifugación, filtración o deposición por gravedad.

Otro aspecto particular, relacionado con el anterior, es el procedimiento para producir un bioproducto a partir de biomasa. Este aspecto está relacionado con el anterior ya que implica, en primer lugar, llevar a cabo el procedimiento antes mencionado de degradar la biomasa hacia azúcares fermentables mediante la incubación de biomasa con el polipéptido de la invención, con un fragmento o variante del mismo o con la composición celulolítica de la invención.

Así pues, otro aspecto particular se relaciona con un procedimiento para producir un bioproducto a partir de biomasa que comprende:

a) producir azúcares fermentables de acuerdo con el procedimiento anteriormente descrito,

b) llevar a cabo una transformación química de los azúcares obtenidos en la etapa a) para producir al menos un bioproducto, c) Recuperar el al menos un bioproducto obtenido en la etapa b).

La transformación química de los azúcares puede ser un proceso termoquímico para producir bioproductos, como por ejemplo someterlos a un proceso de isomerización y posterior deshidratación e hidrogenación.

No obstante, en una realización particular y preferida de la invención dicha transformación comprende la fermentación microbiana de los azúcares con microorganismos fermentantes.

Tanto en el procedimiento para producir azúcares fermentables, como en el procedimiento para producir bioproductos, antes de llevar a cabo la etapa de incubación de la biomasa con el polipéptido de la invención, con un fragmento o una variante del mismo o con la composición celulolítica de la invención se puede, opcionalmente, llevar a cabo un pretratamiento de la biomasa celulósica con el fin de facilitar el proceso de digestión posterior. El pretratamiento puede consistir en la disrupción de los componentes de la pared celular de las células vegetales de la biomasa (Chandra et al., 2007, Substrate pretreatment: The key to effective enzymatic hydrolysis of lignocellulosics? Adv. Biochem. Engin. /Biotechnol. 108: 67- 93; Galbe and Zacchi, 2007, Pretreatment of lignocellulosic materials for efficient bioethanol production, Adv. Biochem. Engin. /Biotechnol. 108: 41-65; Hendriks and Zeeman, 2009, Pretreatments to enhance the digestibility of lignocellulosic biomass, Bioresource Technol. 100: 10-18; Mosier et al., 2005, Features of promising technologies for pretreatment of lignocellulosic biomass, Bioresource Technol. 96: 673-686; Taherzadeh and Karimi, 2008, Pretreatment of lignocellulosic wastes to improve ethanol and biogas production: A review, Int. J. of Mol. Sci. 9: 1621-1651 ; Yang and Wyman, 2008, Pretreatment: the key to unlocking low-cost cellulosic ethanol, Biofuels Bioproducts and Biorefining-Biofpr. 2: 26-40).

La biomasa celulósica puede asimismo ser sometida también a una reducción del tamaño de partícula, a baños y lavados y/o condicionamiento antes del pretratamiento opcional.

Los pretratamientos convencionales de la biomasa celulósica incluyen pero no se limitan a pretratamiento con calor, pretratamiento con ácido diluido, pretratamiento con agua caliente, pretratamiento alcalino, pre tratamiento con cal, oxidación en mojado, explosión en mojado AFEX, pretratamiento organosolv y pretratamiento biológico. Otro pretratamientos adicionales incluyen percolación amónica, ultrasonidos, electroporación, microondas, C0 2 supercrítico, H 2 0 supercrítico, ozono, liquido iónico o pretratamiento por irradiación gamma.

La etapa de incubación de la biomasa celulósica (pretratada o no) con el polipéptido de la invención, con un fragmento funcional o variante del mismo o con la composición celulolítica de la invención comprende la hidrólisis del material celulósico y/o hemicelulósico hacia azúcares fermentables como glucosa, celobiosa, xilosa, xilulosa, arabinosa, mañosa, galactosa y/o oligosacaridos solubles.

La hidrólisis enzimática se lleva a cabo preferiblemente en un medio acuoso apropiado y en condiciones que puede determinar fácilmente un experto en la materia.

En una realización preferida la hidrólisis se lleva a cabo a un pH entre 5 y 7, preferiblemente entre 5 y 6.5 y a una temperatura de entre 30°C y 55°C preferiblemente entre 37°C y 50°C.

La hidrólisis puede hacerse en un proceso discontinuo o continuo donde la biomasa se añade gradualmente a la solución de hidrólisis que comprende el polipéptido de la invención, un fragmento funcional o una variante del mismo o la composición celulolítica de la invención.

La producción de azúcares fermentables se lleva a cabo generalmente en tanques o reactores con agitación que controlan las condiciones de pH, temperatura y la mezcla de los componentes de reacción. Los tiempos de reacción pueden ser determinados por un experto en la materia aunque pueden durar hasta 200 horas, pero preferiblemente la etapa de producción de los azúcares fermentables se lleva a cabo entre 12 y 120 horas. La etapa posterior, esto es la etapa b) comprende llevar a cabo una transformación química de los azúcares obtenidos en la etapa anterior siendo esta transformación química mediada de una manera preferentemente con al menos un microorganismo fermentante. Para ello la corriente resultante de la etapa a) (hidrólisis enzimática) se lleva directamente al tanque donde se dará la fermentación bajo condiciones controladas.

La elección del o de los microorganismos fermentantes dependerá del tipo de bioproducto que se desee producir. En una realización particular de la invención el al menos un microorganismo fermentante se selecciona entre bacterias como Bacillus thermoglucosidaisus, Clostridium butyricum, Corynebacterium glutamicum, Enterobacter aerogenes, Escherichia coli, Geobacillus themoglucosidasius, Klebsiella oxytoca, Lactobacillus sp. Leunoscoc mesenteroides, Thermoanaerobacter BG1L1, Thermoanaerobacter ethanolicus,

Thermoanaerobacter mathranii, Thermoanaerobacter thermosaccharolyticum, Zymobacter palmae, Zymomonas mobilis u hongos como Candida arabinofermentans, Candida boidinii, Candida diddensis, Candida fermentans, Chrysosporium lucknowense, Candida pastoris, Candida shehatae, Candida sonorensis, Candida tropicalis, Hansenula anómala, Hansenula polymorpha, Kluyveromyces fragilis, Kluyveromyces marxianus, Pichia pastoris, Pichia stipitis, Saccharomyces cerevisiae, Saccharomyces bulderi, Saccharomyces barnetti, Saccharomyces exiguus, Saccharomyces diastaticus, Saccharomyces uvarum o Schizosaccharomyces pombe o una combinación de alguno de estos microorganismos.

Las condiciones para llevar a cabo la fermentación dependerán principalmente del tipo de microorganismo fermentante. Normalmente, las condiciones se adaptarán a las condiciones óptimas en las que el microorganismo en cuestión lleve a cabo el proceso de fermentación. Aunque no hay unas condiciones fijas, típicamente el tiempo de fermentación varía entre 24 y 96 horas, la temperatura entre 26°C y 60°C, preferentemente entre 32°C y 50°C y el pH entre 3 y 8, preferentemente entre 4 y 5, entre 4 y 6 o entre 4 y 7. La cantidad de inoculo del microorganismo fermentante también dependerá igualmente del tipo de microorganismo aunque típicamente el microorganismo fermentante se puede aplicar en cantidades de entre 10 5 y 10 12 células/ml de caldo de cultivo.

En función de los microorganismos utilizados se obtendrán diferentes bioproductos ya que cada microorganismo tiene un metabolismo característico y propio. En este sentido un experto en la materia seleccionará el microorganismo más conveniente en función del bioproducto que desee obtener. Sin pretender ser una lista limitativa algunos de los bioproductos que se pueden obtener mediante el procedimiento aquí descrito incluyen alcoholes como etanol, metanol, butanol, hexanol, octanol, decanol, dodecanol, 1 ,3-butanediol(1 ,3-diol), 1 -alcohol; ácidos orgánicos como ácido cítrico, ácido acético, ácido itacónico, ácido láctico, ácido glutámico, ácido succínico, beta-cetoácido, beta-cetoalcohol, beta-hidroxiácido; cetonas como la acetona; gases como hidrógeno o dióxido de carbono; hidrocarburos como alcanos, alquenos o alquinos; sustancias nitrogenadas como aminas, amida, nitrocompuestos o nitrilos; haluros; aminoácidos como ácido glutámico; antiobioticos como penicilina o tetraciclinas; vitamina como riboflavina, vitamina B12 o betacaroteno; ácidos grasos como ácido dodecanoico, ácidos grasos trans-A2 o ácido palmítico; y otros productos como etileno, glicerol, 1 ,3-propano-diol, betalactano, cefalosporinas, ácidos grasos trans o furano.

En una realización preferida el bioproducto es un alcohol preferiblemente etanol.

La etapa c) del procedimiento de producción de bioproductos comprende la recuperación del mismo. El o los productos de fermentación pueden recuperarse del medio de fermentación mediante cualquier método conocido incluyendo pero sin limitarse a cromatografía, procesos electroforéticos, solubilidad diferencial, destilación o extracción. Por ejemplo, el alcohol se separa del caldo de fermentación por métodos convencionales de destilación.

EJEMPLOS Ejemplo 1 : Construcción de la librería metagenómica e identificación de los clones de interés a partir de la misma

Construcción de la librería metagenómica

Se construyó una librería metagenómica a partir de bacterias del suelo en un fósmido pMP0579 (Terron-Gonzalez et al., 2013 Sci. Rep. 3: 1 107). La librería metagenómica se construyó de acuerdo con el protocolo del kit CopyControl™ Fosmid Library Production (Epicentre), con alguna modificación como se describe en Terron-Gonzalez et al. 2013. La librería comprende aproximadamente 7,4 Gigabases distribuidas entre aproximadamente 185,000 clones diferentes, con un tamaño medio de aproximadamente 40 kb, y se mantiene en la cepa EPI300-T1 R .

Identificación de clones que confieren actividad celulasa

Se transfirió la librería metagenómica por cruce triparental (Figurski and Helinski, 1979, Proc. Nati. Acad. Sci. USA 76: 1648-1652) a la cepa MP0554, con DH5a/pRK2013 como cepa helper. En presencia de salicilato, la cepa MP0554 produce NahR (el activador del promoter psal) y la proteína N antiterminante del fago lambda, permitiendo la expresión del promotor psal localizado en el fósmido y la antiterminación transcripcional (Terron-Gonzalez et ai, 2013 Sci. Rep. 3: 1107). Los cruces conjugativos se llevaron a cabo en LB-agar sin selección por antibiótico durante toda la noche a 37°C. Las mezclas de cruces se sembraron en placas con LB-agar suplementadas con los antibióticos necesarios para la selección de transconjugantes, arabinosa para incrementar el número de copias del fósmido, salicilato para incrementar los niveles de transcripción y 1 % carboximetilcelulosa (CMC) como sustrato para el rastreo. Las placas se incubaron a 30°C durante 48 h.

Se llevó a cabo un rastreo típico de celulasas usando platos de agar con CMC con tinción Rojo Congo (Teather and Wood, 1982 Appl. And Environ. Microbiol. 43:777- 780). Este método tiene el problema de que las colonias se despegan debido a que las placas se inundan durante la tinción, haciendo difícil la identificación de clones positivos. Para solventar este problema, se hizo una modificación del método que consistió en la inmovilización de las colonias con una capa de cobertura de agar antes de la tinción. Después, cada plato se inundó con una solución de Rojo Congo al 1 % durante 30 minutos y después NaCI 1 M durante 30 minutos. Los clones positivos mostraban un halo claro alrededor de la colonia debido a la falta de tinción por hidrólisis de la CMC por las celulasas secretadas. La Figura 9 muestra una de las placas con un clon con actividad celulasa.

Se hizo el screening de alrededor de 550,000 clones, de tal forma que la probabilidad de que se analizaran todos los clones de la librería fue de 95%. Todos los clones positivos se analizaron mediante digestión con enzimas de restricción, detectándose un total de 8 fósmidos diferentes con actividad celulasa (8 clones con distinto patrón de restricción).

Identificación de los genes de interés

Cada fósmido se secuenció por completo y las secuencias se compararon con aquellas de bases de datos usando los programas Blastx y Blastn (Altschul et al., 1997 Nucleic Acid Res. 25:3389-3402). Se identificaron ORFs potencialmente involucrados en la actividad celulasa.

Ejemplo 2: Construcción del vector y expresión de Cel98 en E.coli DH5a

La secuencia del CLON98 identificado en el rastreo fue analizada mediante el programa ORF Finder para buscar pautas de lectura abiertas y posibles genes que se transcriban y se detectó así "ce/98", una secuencia de ADN de 1787 pb (SEQ ID NO 6) que es la secuencia polinucleotídica que codifica el polipéptido de la invención que se denominó Cel98 y que posee la secuencia SEQ ID NO 1.

Se procedió al estudio y análisis del gen ce/98 mediante el programa motifscan (http://myhits.isb-sib.ch/cgi-bin/motif sean). El fragmento identificado muestra en su extremo amino-terminal, de la posición 1-32, una señal de translocación Twin- arginine (tat). También se observa el dominio celulasa (perteneciente a la familia 5) en la posición 41-378. En las posiciones 443-570 y 644-780 se encuentran dos dominios de unión a carbohidratos de tipo 2 (CBM2) y en la posición 474-630 un dominio de unión a carbohidratos de tipo 6 (CBM6) (ver figura 3).

El vector elegido para subclonar el gen de ce/98 fue el pET23b. Dicho vector contiene un gen de resistencia a ampicilina, el promotor T7, el inicio de transcripción de T7, una secuencia His-tag (en el extremo C-t) y el polilinker (multicloning site). Incluye así también la secuencia de terminación T7 y los orígenes pBR322 y f1.

Para subclonar el fragmento de interés se siguió el siguiente procedimiento:

Diseño de los cebadores para amplificar el fragmento de interés (cel98)

Se procedió a diseñar cebadores empleando la secuencia de dicho gen y se decidió insertar en los cebadores señales de reconocimiento de dos enzimas de restricción diferentes para que la inserción del gen fuera dirigida (Ndel y Xhol) ya que estas no cortaban dentro de la secuencia del gen y tan sólo cortaban una vez cada una en el vector, de forma que este podía abrirse para insertar ce/98.

Los cebadores empleados fueron los siguientes:

- Directo: CAATCATATGAGGACCCACATGAAAACG (Tm=62°C) (SEQ ID NO 11)

- Reverso: GAATCTCGAGCTTGGTGACGGTGAAAGCC (Tm=60°C) (SEQ ID NO 12)

Preparación de los cultivos de la cepa que contiene el vector pMPQ135 y el fragmento de interés

Se prepararon cultivos en medio líquido Luria-Bertani (LB) suplementados con ampicilina (100 μg/mL). Para el cultivo del vector, la cepa DH5a de E. coli (se seleccionó una colonia de la placa) se inoculó en 5 mi de LB suplementado con ampicilina (el vector tiene resistencia a este antibiótico) y para el cultivo del inserto se seleccionó una colonia de UP098 (£. coli MP0554 con el inserto ce/98) en 3 mi de LB con cloranfenicol (el fósmido donde está construida la metagenoteca tiene resistencia a cloranfenicol) y arabinosa para aumentar la expresión (promotor inducible por arabinosa).

Extracción del DNA plasmídico (vector) y cuantificación de ADN por Nano-Drop. Para la extracción del ADN plasmídico se empleó el kit "Núcleo Spin Plasmid (Macherey-Nagel)". Para cuantificar el ADN extraído se empleó el equipo Nano-drop ND-1000. Así las cantidades de ADN obtenidas fueron de 88,5 ng/μΙ para el vector y 354,5 ng/μΙ para el fósmido que contiene el gen de interés. Digestión del vector

Se emplearon para ello 2,5 μg de plásmido. La reacción se llevó a cabo en un volumen final de 35 μΙ.

Se necesitó, en orden de adición al tubo:

1. Agua desionizada: 1 μΙ (hasta completar el volumen final)

2. Tampón H (Roche) (10X): 3,5 μΙ

3. ADN (vector purificado): 28 μΙ

4. Enzimas para la digestión (Ndel (Fermentas) y Xhol (Roche)): 1 ,25 μΙ de cada enzima

La reacción se dejó incubando a 37°C durante dos horas y media.

Gel de agarosa (0,8%) para comprobar que las bandas del vector linearizado son las correctas.

El vector empleado posee unas 4,5 Kb. Al cortar con las enzimas de restricción se liberó un fragmento de 0,9 Kb, quedando un vector de 3,6 Kb linearizado al visualizarse en gel.

El gel se corrió durante 20 minutos a 135V y posteriormente se tiñó durante 20 minutos en bromuro de etidio para visualizar las bandas.

PCR del fragmento de interés

Empleando los cebadores previamente descritos se procedió a la amplificación por PCR del fragmento de interés "ce/98" siguiendo el siguiente programa:

1 o . 5 minutos a 94°C para desnaturalizar las cadenas de ADN

2 o . 35 ciclos:

- 94°C durante 30 segundos para desnaturalizar.

- 56°C durante 30 segundos.

- 72°C durante 5 minutos y medio para que se extienda la polimerasa. Este tiempo depende del tamaño del fragmento que se deba copiar. Se debe poner 2 minutos por Kb a amplificar, y como el inserto de interés era de 2,787 Kb, se configuró para 5' 30".

3 o . 5 minutos a 72°C

La PCR se hizo por duplicado. Se puso también un control negativo (sin DNA para amplificar, sustituyendo su volumen por agua desionizada).

Por cada reacción se pusieron 50 μΙ de volumen final: - ADN molde. Se emplearon 10-40 ng de DNA. Como teníamos a UP098 a 354,5 ng/μΙ, se diluyó 20 veces y de dicha dilución se tomó 1 μΙ de ADN y se adicionó en 19 μΙ de agua desionizada, y de este último stock se puso 2 μΙ para la PCR.

- cebador directo (10μΜ) (SEQ ID NO 11): 1 μΙ

- cebador reverso (10μΜ) (SEQID NO 12): 1 μΙ

- dNTPs (2,5 mM): 4 μΙ

- polimerasa (2,5 U/μΙ): 0,5 μΙ

- tampón (10X): 5 μΙ

- Agua desionizada: lo que falte hasta 50 μΙ de volumen final Gel de agarosa para comprobación de la PCR

Se corrió un gel pequeño al 0,8% de agarosa para visualizar el producto amplificado de PCR. Una vez corrido el gel durante 20 min a 135V se tiñó 20 minutos en bromuro de etidio.

Purificación del producto de PCR por selección de banda en gel de agarosa.

Como la PCR no salió completamente limpia, la forma de purificar el fragmento de interés fue por selección de la banda correspondiente al inserto en un gel de agarosa (0,8%). El vector cortado también se cargó en el mismo gel para coger la banda correspondiente al vector linearizado de ahí.

El gel se corrió a 100V durante una hora y posteriormente se tiñó 30 minutos en bromuro de etidio. Las bandas correspondientes al vector linearizado (3,6 Kb) y al fragmento de interés (2,7 Kb) se cortaron del gel con una cuchilla y se conservaron en tubos a -20°C.

Purificación de bandas del vector e inserto

Se empleó el kit para purificación de los fragmentos de gel (vector e inserto): ILLUSTRA GFX PCR DNA AND GEL BAND PURIFICARON KIT (GE HEALTHCARE).

En el último paso del protocolo a seguir del kit, se eluyó el vector en 15 μΙ para que estuviera lo más concentrado posible ya que este era su último paso de purificación antes de la ligación. El inserto se eluyó en 19 μΙ. Digestión extremos del inserto

Las enzimas que se emplearon para la digestión de los extremos del inserto fueron las mismas que para digerir el vector (Ndel y Xhol). El volumen total de la reacción fueron 20 μΙ. El buffer que se usará será el tampón H (igual que para cortar el vector) y las enzimas serán también Ndel y Xhol. En esta ocasión se tiene menos ADN que en el caso del vector y por eso se necesita mucha menos enzima de restricción. Para 20 μΙ de reacción se emplearon:

-Tampón H (X10): 2 μΙ

-Ndel (Fermentas): 0,5 μΙ

-Xhol (Roche): 0,5 μΙ

-ADN: 17 μΙ de los 19 μΙ recuperados tras la purificación de la banda de gel. La digestión se dejó 2 horas y media a 37°C.

Comprobación de la cantidad de ADN del vector y del inserto antes de proceder con la reacción de ligación

Se purificó el inserto de interés tras la reacción de digestión para liberarlo de las enzimas y tampón empleando el kit de GE HEALTHCARE de nuevo (protocolo de limpieza tras una reacción enzimática). Se preparó un gel de agarosa (0,8%) y se cargó un microlitro tanto de vector como de inserto para observar que cantidad de ADN se tenía y saber qué proporción de vector y de inserto poner en la reacción de ligación. En la figura 10 se observa el gel donde se pude comprobar las bandas con el ADN tanto del vector como del inserto.

Ligación

El volumen final serán 10 μΙ:

- Vector: 1 μΙ

- Inserto: 6 μΙ

- Ligasa: 1 μΙ

- Tampón de ligasa (5X): 2 μΙ

Se puso un control de la religación, una reacción de ligación conteniendo sólo vector (sin inserto) para ver si el vector era capaz de religarse consigo mismo. Para ello se puso la misma cantidad de vector, pero en vez de inserto, se adicionó agua desionizada en su lugar.

Una vez preparadas las reacciones, se incubaron a 16°C durante 16 horas.

Transformación (con células ya competentes, por choque térmico)

Las células competentes son E. coli DH5a. Los 10 μΙ de reacción de ligación se introducen en un tubo conteniendo 100 μΙ de células ya competentes. El proceso se llevó a cabo tanto para la ligación como para la religación:

1) Se mantuvo en hielo el ADN + células durante 30 minutos.

3) Se dio un choque térmico a 42°C durante exactamente 45 segundos.

4) Se retransfirieron los tubos a hielo durante 5 minutos.

5) Se adicionó 1 mi de LB y se dejó incubar a 37°C durante 1 hora y 30 minutos (sin adicionar antibióticos)

6) Se sembró en placa con antibiótico (ampicilina 100 μg/ml) y se dejaron incubando a 37°C las placas hasta el día siguiente. Las células DH5a transformadas son resistentes a ampicilina (100) por el vector que contienen.

Selección de los transformantes

Para seleccionar una colonia transformante del total de colonias que crecieron en la placa tras la transformación en DH5a se hizo una PCR de comprobación de colonias. Para ello se hizo uso de dos cebadores que amplificaran un fragmento que contuviese parte del vector y parte del inserto, para asegurarnos que dicha colonia poseía el vector conteniendo éste el inserto y que no era resistente a ampicilina por contener en su interior un vector religado sin inserto. Los cebadores empleados fueron el T7 forward (amplifica parte del vector) y el UP098intrev (amplifica dentro del inserto): T7 fw: GTAATACGACTCACTATAGGGC (Tm=56) (SEQ ID NO 13)

UP098intrev: TCTGGCTGACCGTGTAGG (Tm=58) (SEQ ID NO 14)

El fragmento esperado para amplificar era de 1 ,3 Kb. El programa diseñado fue el siguiente:

1 o . 5 minutos a 94°C para desnaturalizar las cadenas de ADN

2° 35 ciclos:

- 94°C durante 30 segundos para desnaturalizar.

- 52°C durante 30 segundos.

- 72°C durante 5 minutos y medio para que se extienda la polimerasa. Este tiempo depende del tamaño del fragmento que se deba copiar. En este caso, para amplificar 1 ,3 Kb, se configuró para 1 ' 30".

3 o . 5 minutos a 72°C

Los tubos de reacción de PCR, para cada posible colonia transformante que se analizó por PCR se compuso de (para un volumen final de 25 μΙ):

- Cebador T7 forward (10μΜ): 0,5 μΙ

- Cebador UP098intrv (10μΜ): 0,5 μΙ

- dNTP's (10 mM): 0,5 μΙ

- Tampón (10X): 2,5 μΙ

- Mg 2+ (25 mM): 1 ,5 μΙ

Polimerasa: 0,2 μΙ

- Agua desionizada: 19,3 μΙ

El ADN molde se adicionó tocando la colonia que se deseaba comprobar e inoculando con esta el tubo de PCR. De esa misma colonia se tocó e hizo una raya en una placa de agar LB con ampicilina (100 μΙ/mL), de forma que en caso de resultar positivo el transformante, se tuviera biomasa suficiente para inocular caldo de cultivo y poder crecer dicho transformante. En la PCR de candidatos se puso también un control positivo, es decir, un tubo que contenía el ADN con el que se transformó a DH5a, y en el cual se debe ver amplificación del fragmento de 1 ,3 Kb.

Tras finalizar la PCR, se cargaron 5 μΙ de cada tubo de reacción (28 candidatos) en un gel de agarosa al 0,8% y se corrió durante 20 minutos a 135V. Posteriormente se tiñó con bromuro de etidio durante 20 minutos y se comprobó qué candidatos tenían el inserto de interés.

Se escogió dos candidatos (se denominaron candidato 1 y 6) y de la raya que previamente se había sembrado de cada uno de ellos se puso un inoculo (medio LB suplementado con ampicilina a 100 μΙ/mL) y se llevó a cabo la extracción de ADN de ambos candidatos para poder realizar un análisis por visualización de bandas tras digestión con enzimas de restricción. Así, se digirieron los dos candidatos con Ndel y Xhol (enzimas previamente utilizadas en el clonaje) y también, en una reacción a parte, con BamHI (tiene una única diana, por lo que la construcción se lineariza. El corte con esta enzima permitió ver si se tenía un inserto o más de uno dentro de un vector según la longitud de la banda linearizada visualizada en gel). Se empleó 10 μΙ de la extracción de ADN de cada candidato, para un volumen final de 20 μΙ:

- Agua desionizada: 7 μΙ

- Tampón H (10X): 2 μΙ

- ADN: 10 μΙ de la extracción de ADN (66 ng/ μΙ y 46,4 ng/ μΙ para los candidatos 1 y 6 respectivamente)

Ndel y Xho/BamHII: 0,5 μΙ de cada una

Para la digestión con Ndel y Xhol se incubó 2 horas y media a 37°C y para BamHI una hora.

Tras correr en gel y visualizar las bandas correspondientes se comprobó que ambos candidatos poseían el inserto, por lo que se escogió uno de ellos y se envió a secuenciar para asegurar que no había ninguna mutación en la secuencia. Una vez se hubo comprobado esto, se congeló el subclón que contenía a ce/98 a -80°C (se denominó pMPO1380). Ejemplo 3: Producción de Cel98 (SEQ ID NO 1)

Transformación de la cepa de E.coli NCM631/piz227 con el subclón pMPO1380 Se preparó un inoculo de NCM631/piz227 (cepa que se quiere transformar) el día previo a la transformación y se hizo una extracción de ADN del subclón pMPO1380 (subclón que contiene el ADN plasmídico que se quiere introducir en la NCM631/piz227). El inoculo de la NCM631/piz227 se hizo en medio LB suplementado con cloranfenicol (100 μΙ/mL), ya que dicha cepa contiene resistencia a cloranfenicol en el plásmido piz227 (dicho plásmido permite que la bacteria E.coli NCM631 permanezca en niveles básales de expresión, reprimiendo la misma. Cuando es adicionado isopropil^-D-1-tiogalactopiranósido o IPTG, se activa entonces la superproducción en la bacteria).

Para la transformación se diluyó el inoculo de NCM631/piz227 hasta 0, 1 de densidad óptica en medio LB (sin antibióticos). Se incubó a 37°C hasta DO (600 λ) de 0,35 (fase exponencial temprana). Una vez llegó a dicha densidad óptica se repartió en alícuotas de 1 ml_ y se dejó enfriar en hielo 5 minutos. Se centrifugó 30 segundos y se eliminó el sobrenadante. Se resuspendió suavemente en 75 μΙ de LB frío y se mantuvo en hielo 5 minutos. Se añadió 75 μΙ de TSS 2X y se mezcló suavemente. Se mantuvo posteriormente en hielo 5 minutos. Tras esto, se procedió a añadir el DNA (1-5 μΙ, de forma que se añada a una concentración de 100 ng^L). Se produjo entonces el choque térmico, poniendo las muestras durante 45 segundos en un baño con agua a 42°C. Las muestras fueron retransferidas luego a hielo. Se añadió a cada muestra 1 mL de LB (sin antibióticos) y se incubaron a 37°C (1 hora). Tras pasar ese tiempo, se sembró cada muestra en placas con agar-LB (y antibiótico adecuado como forma de selección, ampicilina y cloranfenicol a 100 μΙ/mL). Se dejó incubar las placas toda la noche a 37°C.

Las colonias transformantes se visualizaron al día siguiente (aquellas capaces de crecer en la placa, puesto que tienen un gen de resistencia a cloranfenicol en el vector piz227 y además un gen de resistencia a ampicilina procedente del vector del clon pMPO1380 con el que se le ha transformado).

Inducción de la expresión de Ce/98 en la cepa NCM631/piz227 Una colonia fue seleccionada y se inoculó con ella medio LB suplementado con ampicilina y cloranfenicol (100 μΙ/mL para cada uno de ellos).

Al día siguiente se diluyó el cultivo a 0,1 (600 λ) de densidad óptica (LB con antibióticos ampicilina y cloranfenicol a 100 μΙ/mL para cada uno de ellos) y se dejó crecer a 37°C hasta que alcanzó 0,3 (600 λ) unidades de densidad óptica. En dicho momento, el matraz con el cultivo se puso a 26°C para atemperarse y reducir la velocidad de crecimiento del cultivo antes de añadir el inductor IPTG. Aproximadamente, a los 15 minutos, se llegó a la densidad óptica de 0,35 (600 λ) y se adicionó IPTG (0,05 mM). Se dejó incubar durante 10-12 horas a 26°C.

Tras la incubación se recogió el sobrenadante producido centrifugando las células a 5000 rpm durante 15 minutos y filtrando el sobrenadante con filtros de 0,22μ, aplicando vacío.

El sobrenadante se distribuyó en alícuotas de 5 mL que se conservaron a -80°C.

Ejemplo 4: caracterización de la actividad enzimática de Cel98 (SEQ ID NO 1)

Se procedió a caracterizar la actividad de la enzima Cel98 con características de enzima celulasa. Para ello se empleó el ensayo de rojo congo (Haft et al., Appl Microbiol Biotechnol. 2012 Apr; 94(1):223-9.). El rojo congo interacciona con la carboximetil celulosa dando un color rojo, de forma que la actividad enzimática por degradación de la CMC se puede visualizar por la disminución de la intensidad de dicho color rojo, mediante medidas de densidad óptica a 580 nm.

En este ensayo se incubaron alícuotas de sobrenadante (diluido 10 veces) a las cuales se adicionó como sustrato carboximetil celulosa (CMC) a una concentración final de 0,05%. Las temperaturas de incubación dependieron de la característica que se deseara evaluar de la enzima. A cada tiempo deseado se tomó una muestra de 875 μΙ de la reacción (sobrenadante con CMC) y se adicionó NaOH (a una concentración final de 40 mM) 8,8 μΙ a cada tubo para parar la reacción enzimática. Posteriormente se adicionó 25 μΙ de rojo congo (a una concentración final de 0,25 mg/mL) y por último 100 μΙ de NaCI (a concentración final de 0,5 M). Se mezcló bien con todo el volumen invirtiendo el tubo y se incubó 30 minutos a temperatura ambiente. Se registraron las densidades ópticas a 580 nm. Ensayos de temperatura óptima

Los ensayos fueron llevados a cabo tal y como se describe previamente, incubando en cada caso el sobrenadante con la CMC a la temperatura que se desea testar. De esta forma se ensayaron 30°C-37 o C-45 o C-50°C y 56°C.

Los resultados de estos ensayos se pueden observar en las figuras 4 y 5.

La figura 4 demuestra que el polipéptido de SEQ ID NO 1 es activo a temperaturas que van desde 30°C a 56°C. También se puede observar en esta figura que la temperatura óptima se encuentra entre los 45 y los 50°C. Aunque la enzima todavía mantiene actividad a los 56°C se observa que esta empieza a decrecer.

La figura 5 muestra la capacidad de degradación de Cel98 a 30°C, 37°C, 45°C y 50°C. Se puede observar que entre 37°C y 50°C la enzima es capaz de degradar prácticamente el 100% de la CMC en 35 minutos (ver figuras 5 B a D). Aunque a 30°C no se consiguen resultados comparables a los de las otras temperaturas la degradación de CMC a esta temperatura es también muy importante (ver figura 5A).

Termorresistencia

La termorresistencia del enzima fue calculada tras la incubación del sobrenadante a la temperatura de 30°C, 37°C, 40°C y 42°C durante diferentes tiempos (días en su mayoría). Se tomaron muestras cada día del sobrenadante incubado y se procedió a realizar un ensayo de rojo congo con cada muestra tomada, para observar la actividad enzimática.

Los resultados se pueden observar en las figuras 6 A a D.

En la figura 6 se puede observar la degradación de CMC llevada a cabo por el polipéptido de la invención después de su incubación a 30°C durante hasta 5 días es comparable a la de la enzima control (t=0) (ver figura 6A). También se observa claramente que la enzima deja de ser activa a partir del séptimo día de incubación a 37°C (ver figura 6B). Al incubarse a 40°C se observa que la enzima va perdiendo actividad a los 3 días y deja de ser activa por completo al 4 día (ver figura 6C). A 42°C la enzima deja de ser activa a partir de los dos días (ver figura 6D). pH óptimo

Los ensayos para detector el pH óptimo de actividad del enzima fueron llevados a cabo diluyendo en estos casos 1/10 el sobrenadante en diferentes tampones (desde pH 5 a pH 8). Se realizaron ensayos de rojo congo con cada tampón y se registraron los datos de DO a 580 nm. pH 5: tampón citrato

pH 5,5-6: tampón 2-(N-morfolino) ácido etanosulfónico (MES)

pH 6,5-7: tampón piperazin-N,N'-bis(2-ácido etanosulfónico) (PIPES)

pH 7,5-8: tampón 2-Amino-2-(hidroximetil)-1 ,3-propanodiol (TRIZMA)

Los resultados se pueden observar en las figuras 7y 8.

La figura 7 demuestra que Cel98 trabaja mejor a un pH ligeramente ácido (pH 5) y que es capaz de mantener la mayor parte de su actividad a pH en el rango de 5 a 7. A pH 7 Cel 98 mantiene aproximadamente el 50% de su actividad, mientras que entre 5.5 y 6.5 mantiene aproximadamente el 75% de su actividad.

La figura 8 muestra claramente el mejor efecto de degradación de CMC de la enzima pH 5. Cel98 trabaja también bien entre 5.5 y 7, preferiblemente entre 5.5 y 6.5. A los pH de 7.5 y 8 Cel98 claramente produce un efecto degradación de la CMC muy inferior al de pH inferiores.

Ejemplo 5: producción de bioetanol a partir biomasa celulósica pretratada mediante el uso de Cel98 o una composición celulolítica que comprende Cel98

Se utilizó paja de maíz como sustrato para la hidrólisis enzimática. Pueden llevarse a cabo pre-tratamientos tales como hidrotermolisis controlada por pH, irradiación, tratamientos ácidos-alcalinos, solventes orgánicos, pretratamientos de filtrado con amonio, oxidación húmeda, etc. En este caso se llevó a cabo el pretratamiento con ácido caliente diluido.

Se llevó a cabo una reacción de hidrólisis con un cóctel enzimático control durante 48 horas. Se partió de una concentración de polisacárido preferiblemente superior al 50% del peso seco del material que lo contiene (preferiblemente, pero no limitado a 25-150 mg/mL) y un cóctel enzimático control con un contenido de Cel98 que puede variar entre 0,001-1 ,0 mg/mL, 0,01-0,1 mg/mL ó 0,05-0,5 mg/mL testada junto con otras enzimas en un cóctel enzimático (Bgl, Cbh1 , Cbh2, Eg).

Esta fase de hidrólisis inicial se llevó a cabo en matraces de 2 L, en medio buffer fosfato-citrato (50 mM) a pH 5 durante 48 horas a 40°C (preferiblemente entre 37- 42°C).

Se estudió de este modo el efecto de Cel 98 y se pudo apreciar que la adición al cóctel mínimo de la enzima Cel 98 analizada supuso un incremento en la capacidad de sacarificación con respecto al control de un 15-30%.

La glucosa producida se determinó empleando el kit "D-Glucose (GOPOD Format) Assay Kit" de Megazyme.