Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
CELLULASES WITH IMPROVED CELLULOLYTIC ACTIVITY
Document Type and Number:
WIPO Patent Application WO/2019/020849
Kind Code:
A1
Abstract:
The present invention relates to cellulase variants which comprise a proteolysis-resistant binding region or linker for binding the cellulose-binding domain (CBD) and the catalytically active domain (CAD), and which also have greater cellulolytic activity. The invention also relates to a gene construct, a host cell and an enzyme composition comprising said variants. The invention further relates to a method for producing fermentable sugar and to a method for producing a bioproduct, such as bioethanol, from cellulose material with the cellulase variants, the host cell or the enzyme composition comprising said variants.

Inventors:
DÍEZ GARCÍA BRUNO (ES)
VALBUENA CRESPO NOELIA (ES)
REYES SOSA FRANCISCO MANUEL (ES)
MORENO PÉREZ ANTONIO JAVIER (ES)
PÉREZ GÓMEZ DOLORES (ES)
PLATERO GÓMEZ ANA ISABEL (ES)
MARTÍN PÉREZ LUCÍA (ES)
GAVALDÁ MARTÍN SANDRA (ES)
PÉREZ COBAS YOLANDA (ES)
SÁNCHEZ ZAMORANO LAURA (ES)
BERMÚDEZ ALCÁNTARA MARÍA DE LOS ÁNGELES (ES)
LEDESMA GARCÍA LAURA (ES)
ROCHA MARTÍN JAVIER (ES)
RAMOS MARTÍN JUAN LUIS (ES)
Application Number:
PCT/ES2018/070498
Publication Date:
January 31, 2019
Filing Date:
July 11, 2018
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
ABENGOA BIOENERGIA NUEVAS TECNOLOGIAS SA (ES)
International Classes:
C12N9/42; C12N15/56; C12P7/10; C12R1/645; C12R1/68
Domestic Patent References:
WO2007118935A12007-10-25
Other References:
ZOGLOWEK, M. ET AL.: "Heterologous expression of cellobiohydrolases in filamentous fungi - An update on the current challenges, achievements and perspectives", PROCESS BIOCHEMISTRY, vol. 50, no. 2, February 2015 (2015-02-01), pages 211 - 220, XP029196822, ISSN: 1359-5113
G USTAVSSON, M. ET AL.: "Stable linker peptides for a cellulose-binding domain-lipase fusion protein expressed in Pichia pastoris", PROTEIN ENGINEERING, vol. 14, no. 9, September 2001 (2001-09-01), pages 711 - 715, XP055498818, ISSN: 0269-2139
FEDOROVA, N. D. ET AL.: "Genomic island s in the pathogenic filamentous fungus Aspergillus fumigatus", PLOS GENETICS, vol. 4, no. 4, April 2008 (2008-04-01), XP002544950, ISSN: 1553-7390
YANG, F. ET AL.: "Enhancing cellulase production in thermophilic fungus Myceliophthora thermophila ATCC42464 by RNA interference of crel gene expression", JOURNAL OF MICROBIOLOGY AND BIOTECHNOLOGY, vol. 25, no. 7, July 2015 (2015-07-01), pages 1101 - 1107, XP055569021, ISSN: 1017-7825, Retrieved from the Internet
VISSER, H. ET AL.: "Development of a mature fungal technology and production platform for industrial enzymes based on a Myceliophthora thermophila isolate, previously known as Chrysosporium lucknowense C1", INDUSTRIAL BIOTECHNOLOGY, vol. 7, no. 3, 1 July 2011 (2011-07-01), pages 214 - 223, XP055569024, Retrieved from the Internet
VOUTILAINEN, S. P. ET AL.: "Cloning, expression, and characterization of novel thermostable family 7 cellobiohydrolases", BIOTECHNOLOGY AND BIOENGINEERING, vol. 101, no. 3, 15 October 2008 (2008-10-15), pages 515 - 528, XP002557681, ISSN: 0006-3592
Attorney, Agent or Firm:
PONS ARIÑO, Angel (ES)
Download PDF:
Claims:
REIVINDICACIONES

Linker que comprende una secuencia de aminoácidos que tiene una identidad de secuencia de al menos un 85%, 90%, 95%, 96%, 97%, 98%, 99 o 100%, con cualquiera de las secuencias seleccionadas de la lista que consiste en: SEQ ID NO: 2, SEQ I D NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 y SEQ ID NO: 36.

Linker según la reivindicación 1 caracterizado por que se selecciona de entre cualquiera de la lista que consiste en: SEQ ID NO: 10, SEQ ID NO: 26 y SEQ ID NO: 30.

Celulasa que comprende al menos un dominio de unión a celulosa (CBD), al menos un dominio catalíticamente activo (CAD) y al menos una región linker, que une los dominios CBD y CAD, según cualquiera de las reivindicaciones 1 a 2.

Celulasa según la reivindicación 3 dónde la celulasa se selecciona de entre cualquiera de la lista que consiste en: endoglucanasas, beta-glucosidasas, celobiohidrolasas, beta-xilosidasas, xiloglucanasas, polisacárido monooxigenasas, xilanasas, arabinofuranosidasas.

Celulasa según la reivindicación 4 donde la celulasa es una celobiohidrolasa o una polisacárido monooxigenasa.

Celulasa según cualquiera de las reivindicaciones 4 a 5 que se selecciona de entre cualquiera de la lista que consiste en: SEQ ID NO: 42; SEQ ID NO:44; SEQ ID NO:46; SEQ ID NO:48; SEQ ID NO:50; SEQ ID NO:52; SEQ ID NO:54; SEQ ID NO:56; SEQ ID NO:58; SEQ ID NO:60; SEQ ID NO:62; SEQ ID NO:64; SEQ ID NO:66; SEQ ID NO:68; SEQ ID NO:70; SEQ ID NO:72; SEQ ID NO:74; SEQ ID NO:76 y SEQ ID NO: 78.

Celulasa según cualquiera de las reivindicaciones 4 a 6 que se selecciona de entre cualquiera de la lista que consiste en: SEQ ID NO: 50; SEQ ID NO: 66; SEQ ID NO: 70 y SEQ ID NO: 78.

Secuencia de ácido nucleico aislada que codifica el linker de acuerdo con cualquiera de las reivindicaciones 1 a 2, o la celulasa de acuerdo con cualquiera de las reivindicaciones 3 a 7.

Secuencia de ácido nucleico aislada complementaria a la secuencia de ácido nucleico de acuerdo con la reivindicación 8. Construcción génica que comprende la secuencia de ácido nucleico de acuerdo con cualquiera de las reivindicaciones 8 o 9.

Construcción génica de acuerdo con la reivindicación 10, dónde la construcción génica es un vector de expresión.

Célula huésped que comprende la construcción génica de acuerdo con cualquiera de las reivindicaciones 10 u 11 , o la celulasa de acuerdo con cualquiera de las reivindicaciones 3 a 7.

Célula huésped según la reivindicación 12, dónde dicha célula es Myceliophthora thermophila C1.

Composición enzimática que comprende una celulasa de acuerdo con cualquiera de las reivindicaciones 3 a 7.

Composición enzimática de la reivindicación 14, que además comprende otras celulasas.

Composición enzimática de acuerdo con la reivindicación 15, donde las otras celulasas se seleccionan de la lista que consiste en: endoglucanasas, beta- glucosidasas, celobiohidrolasas, beta-xilosidasas, xiloglucanasas, polisacárido monooxigenasas, xilanasas, arabinofuranosidasas, y cualquier combinación de las mismas.

Composición enzimática de acuerdo con cualquiera de las reivindicaciones 14 a 16, que además comprende la célula de acuerdo con cualquiera de las reivindicaciones 12 o 13.

Composición enzimática de acuerdo con cualquiera de las reivindicaciones 14 a 17 obtenida por la célula según las reivindicaciones 12 a 13.

Uso de la célula hospedadora de acuerdo con cualquiera de las reivindicaciones 12 o 13, o de la composición enzimática de acuerdo con cualquiera de las reivindicaciones 14 a 18, para la degradación de la biomasa. Uso de acuerdo con la reivindicación 19, para la degradación de la biomasa en un proceso de producción de un bioproducto.

Uso de acuerdo con la reivindicación 20, donde el bioproducto es biocombustible.

Uso de acuerdo con la reivindicación 21 , donde el biocombustible es bioetanol. Procedimiento para producir azúcares fermentables a partir de biomasa celulósica, que comprende:

a) Incubar biomasa celulósica con la celulasa según cualquiera de las reivindicaciones 3 a 7, con la célula huésped de acuerdo con cualquiera de las reivindicaciones 12 o 13, o con la composición enzimática de acuerdo con cualquiera de las reivindicaciones 14 a 18, y

b) Recuperar los azucares fermentables obtenidos tras la incubación en la etapa (a).

Procedimiento para producir un bioproducto a partir de biomasa celulósica que comprende:

a) Incubar biomasa celulósica con la celulasa según con cualquiera de las reivindicaciones 3 a 7, con la célula huésped de acuerdo con cualquiera de las reivindicaciones 12 o 13, o con la composición enzimática de acuerdo con cualquiera de las reivindicaciones 14 a 18, y

b) Fermentar los azúcares fermentables obtenidos tras la incubación de la etapa (a) con al menos un microorganismo termentador, y

c) Recuperar el bioproducto obtenido tras la fermentación en la etapa (b). El procedimiento de acuerdo con la reivindicación 24, donde el bioproducto es etanol.

Description:
Celulasas con actividad celulolítica mejorada.

La presente invención pertenece al campo de las enzimas útiles para la producción de bioproductos, preferiblemente biocombustibles, y más particularmente se refiere a variantes de celulasas que comprenden linkers resistentes a proteólisis y que presentan una actividad celulolítica mejorada respecto a las celulasas nativas que comprenden linkers nativos. Adicionalmente, la invención también se refiere al uso de dichas variantes de celulasas en la producción de azúcares fermentables y de bioproductos a partir de material celulósico.

ESTADO DE LA TÉCNICA

Los biocombustibles suponen una alternativa atractiva a los combustibles fósiles y se pueden obtener mediante la fermentación de azúcares monoméricos derivados del almidón o la celulosa y hemicelulosa.

La biomasa vegetal proporciona una fuente completa de energía potencial en forma de azúcares que se puede utilizar para numerosos procesos industriales y agrícolas, y es por tanto un recurso renovable significativo para la generación de azúcares fermentables que pueden dar como resultado productos finales comercialmente valiosos, tales como los biocombustibles. Sin embargo, la enorme energía potencial de estos hidratos de carbono está actualmente infrautilizada porque los azúcares están formando parte de polímeros complejos que no están fácilmente accesibles para la fermentación.

Cualquier biomasa vegetal se puede considerar como materia prima para la producción de biocombustibles, así se pueden utilizar cultivos herbáceos, otros restos agrícolas o incluso residuos sólidos urbanos. Estos materiales comprenden principalmente celulosa y hemicelulosa. Una vez que la celulosa y la hemicelulosa se convierten en glucosa y xilosa, respectivamente por medio de un proceso de hidrólisis enzimática, éstos compuestos son fácilmente fermentados por otros organismos a etanol. De esta manera, cuánta más cantidad de azúcares complejos permanezca al final del proceso hidrolítico, menor será el rendimiento de la producción de etanol al final del proceso de la fermentación. Por tanto, un área de investigación destinada a disminuir los costes y a potenciar el rendimiento de los procedimientos de producción de biocombustible se centra en la mejora de la eficiencia de las enzimas celulolíticas, así como de las composiciones enzimáticas que comprenden dichas enzimas y que se pueden utilizar para generar azúcares fermentables a partir de biomasa.

Debido a la complejidad de la biomasa, su conversión en azúcares monoméricos implica la acción de diversos tipos de enzimas con diversas actividades enzimáticas, que digieren celulosa, hemicelulosa, así como otros polímeros complejos presentes en la biomasa. Después de la celulosa, la hemicelulosa es la segunda fracción más abundante disponible en la naturaleza. Tanto la celulosa como la hemicelulosa se pueden tratar previamente, de forma mecánica, química, enzimática o de otros modos, para aumentar su susceptibilidad a la hidrólisis. Tras este proceso de pretratamiento tiene lugar una etapa de sacarificación, que es un proceso enzimático por el cual los hidratos de carbono complejos se degradan en sus componentes monosacáridos. El objetivo de cualquier tecnología de sacarificación es alterar o eliminar los impedimentos estructurales y de composición para la hidrólisis con el fin de mejorar la tasa de hidrólisis enzimática y aumentar los rendimientos de azúcares fermentables a partir de la biomasa, que comprende principalmente, celulosa y hemicelulosa (N. Mosier y col., 2005, Bioresource Technology. 96: 673-686). Después de esta etapa de sacarificación se realiza un proceso de fermentación. Las enzimas celulolíticas se han convertido en biocatalizadores debido a su naturaleza compleja y a sus extensas aplicaciones industriales. Hoy en día se presta una considerable atención a la producción de celulasas y a los avances en la investigación, especialmente en la dirección de la mejora de la economía del proceso de varias industrias, con el fin de obtener composiciones enzimáticas que presenten una mayor actividad y mejores propiedades celulolíticas.

Las enzimas individuales han demostrado digerir solo parcialmente la celulosa y la hemicelulosa y, por tanto, se necesita la acción concertada de todas o al menos varias de las enzimas denominadas "celulasas o enzimas celulolíticas" para completar la conversión de los diferentes polímeros complejos, específicamente, celulosa y hemicelulosa, a azúcares monoméricos. Las celulasas (1 ,4-beta-D-glucano-4- glucanohidrolasa, EC 3.2.1.4) comprenden al menos tres actividades enzimáticas, endo-beta-glucanasas (EC 3.2.1.4), exo-beta-glucanasas o celobiohidrolasas (EC 3.2.1.91) y beta-glucosidasas (EC 3.2.1.21), de las que se ha demostrado su actuación sinérgica en la hidrólisis de la celulosa (Woodward, J. 1991 , Bioresource Technology Vol 36, pág. 67-75). Además de estas tres actividades hoy en día se reconocen otras de igual relevancia tales como, xilanasas (E.C. 3.2.1.8), beta- xilosidasas (E.C. 3.2.1.37) y polisacárido mono-oxigenasas (familia AA9).

La eficacia hidrolítica de un complejo multienzimático, formado por una amplia diversidad de enzimas celulolíticas, en el proceso de sacarificación celulósica depende tanto de las propiedades de las enzimas individuales como de la relación de cada enzima respecto al resto, en el complejo.

La mayoría de las celulasas exhiben una organización multimodular que comprende, al menos, tres módulos o dominios: un dominio de unión a celulosa (CBD, carbohydrate binding domain, en sus siglas en inglés) y un dominio catalíticamente activo (CAD, catalytically active domain, en sus siglas en inglés), estando ambos dominios unidos por una región de enlace o linker altamente glicosilado y rico en prolina y residuos de hidroxiaminoácidos (serinas y treoninas) (Fágerstam et al. 1984, FEBS lett. 167: 309-315)).

Se ha descrito que la glicosilación de los residuos de la región linker protege a esta región de la proteólisis, aumentando el ratio de enzimas que conservan su CBD (Langsford et al., 1987, FEBS lett. 225: 163-167). Las secuencias de los CBDs de diferentes enzimas celulolíticas están muy conservadas, por el contrario, las secuencias de los linkers aparte de no estar conservadas, presentan un patrón de glicosilación característico y diferente, lo que les confiere características particulares. El dominio CBD de las celulasas sirve como ancla y la región del linker aporta la flexibilidad necesaria para que el dominio CAD llegue a los sitios de degradación. La organización modular de las celulasas resulta importante para aumentar la sinergia entre los dominios CAD y CBD con su sustrato natural y en consecuencia, dotar de mayor capacidad celulolítica a las enzimas celulasas (Srisodsuk et al. 1993, J.Biol.Chem. 268: 20756-20761). Precisamente, la mayoría de los esfuerzos en el presente campo técnico han ido dirigidos a la generación de celulasas que presentan una mayor capacidad celulolítica y por tanto, mejoren el rendimiento y eficiencia del proceso de degradación de la biomasa. En este sentido, se han diseñado celulasas con mejor actividad hidrolítica debido a la modificación de las regiones modulares, tanto de las regiones CBD y CAD, como de los linkers que las unen. La solicitud de patente internacional WO94/07998 describe variantes de una celulasa clasificada en la familia 45, que comprende un CBD, un dominio catalíticamente activo (CAD) y una región que conecta el CBD con el CAD (linker), en donde se han añadido, eliminado o sustituido uno o más residuos de aminoácidos y/u otro CBD se ha añadido en el otro extremo del CAD. Por otro lado, la solicitud de patente internacional W095/16782 se refiere a la clonación y a la expresión de alto nivel de proteínas celulasas truncadas nuevas o derivadas de las mismas en Trichoderma longibrachiatum que comprenden diferentes regiones catalíticas con varios CBDs. Por otra parte, la patente US8637293B2 describe variantes de la celulasa Cbh1 que comprende mutaciones en el dominio catalítico y/o un incremento en la región de O-glicosilación en los dominios de unión o linkers. Sería, por tanto, de utilidad disponer de celulasas con actividad celulolítica mejorada, capaz de producir azúcares fermentables de forma más eficiente, mejorándose así a su vez el rendimiento hidrolítico global de las mezclas enzimáticas que las contuvieran. DESCRIPCIÓN DE LA INVENCIÓN

La presente invención describe secuencias polinucleotídicas que codifican para regiones o módulos //Mer que son más resistentes a proteólisis que los linkers nativos o silvestres. En general, las celulasas, durante su producción por las células que las sintetizan, pueden sufrir procesos proteolíticos, preferentemente por la zona del linker, que separan los motivos de unión a carbohidratos y catalítico, haciendo así que no se produzca la sinergia entre ellos, disminuyendo drásticamente la actividad celulolítica de cada celulasa sobre su sustrato natural, y por tanto, reduciendo el rendimiento y eficiencia del proceso de degradación de biomasa.

En este sentido, la invención describe variantes de celulasas a las que se le ha intercambiado su linker nativo por uno de los linker descritos aquí, obteniéndose variantes de celulasas que comprenden linker más resistentes a proteólisis que los linkers nativos o silvestres, y que, por lo tanto, dichas variantes de celulasas presentan una mayor actividad celulolítica sobre su propio sustrato. Adicionalmente, también se describe el uso de dichas variantes para la hidrólisis de material celulósico en azúcares fermentables, así como un procedimiento para producir azúcares fermentables y un procedimiento para producir bioproductos, tales como etanol, en los que se emplean dichas variantes.

Por tanto, la presente invención representa una solución a la necesidad de proporcionar celulasas con actividad celulolítica mejorada, útiles para la optimización de la etapa de hidrólisis de material celulósico en azúcares fermentables, gracias a que comprenden un linker más resistente a la proteólisis, respecto al linker nativo que presenta una celulasa parental (nativa). Los inventores han demostrado la mayor resistencia a la hidrólisis de las variantes de las celulasas que comprenden los linkers aquí descritos respecto a celulasas nativas, aumentando significativamente el rendimiento de la etapa de hidrólisis mediante el uso de dichas variantes o de las composiciones enzimáticas que las comprenden, obteniéndose una mayor cantidad de azúcares monosacáridos liberados al final de dicha etapa hidrolítica (fundamentalmente glucosa), lo que conduce a un aumento de la producción del bioproducto, preferiblemente etanol.

Como se muestra en los ejemplos descritos más adelante, las variantes de celulasas que comprenden los linkers de la presente invención se expresaron en una célula fúngica hospedadora y la mezcla enzimática producida por la cepa resultante se evaluó en experimentos de sacarificación de biomasa pretratada (PCS), comprobándose un aumento en el rendimiento del proceso de sacarificación, concretamente un aumento en la concentración de azúcares fermentables (glucosa) liberados al final del proceso, en comparación con la misma mezcla enzimática producida por la cepa control que no expresa ni secreta celulasas que comprenden los linkers de la invención.

Por tanto, un primer aspecto de la presente invención se refiere a secuencias de linkers más resistentes a proteólisis, respecto a linker nativos o silvestres, que comprenden una secuencia de aminoácidos que tiene una identidad de secuencia de al menos un 85%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100% con cualquiera de las secuencias incluidas en la siguiente lista: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 SEQ ID NO: 34 y SEQ ID NO: 36.

En una realización preferida, los linkers de la invención presentan una identidad de secuencia del 100% con las secuencias seleccionadas de la siguiente lista: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 SEQ ID NO: 34 y SEQ ID NO: 36.

El término "identidad" se refiere a la relación de residuos de ácidos nucleicos o aminoácidos que son idénticos entre dos secuencias de ácidos nucleicos o de aminoácidos que se están comparando. Se puede determinar el grado de identidad mediante el método de Clustal, el método de Wilbur-Lipman, el programa GAG, que incluye GAP, BLAST o BLASTN, EMBOSS Needle y FASTA. Además, se puede utilizar el algoritmo de Smith Waterman con el fin de determinar el grado de identidad entre dos secuencias.

En el contexto de la presente invención, el término "dominio de unión a carbohidratos" (CBD) se refiere a la secuencia de polinucleótidos que codifica para la secuencia de aminoácidos capaz de llevar a cabo la unión entre la enzima celulolítica que comprende dicho CBD y su sustrato celulósico. Específicamente, dicho dominio se pretende que se entienda tal y como está definido por Peter Tomme et al. "Cellulose- Binding Domains: Classification and Properties" in "Enzymatic Degradation of Insoluble Carbohydrates", John N. Saddler and Michael H. Penner (Eds.), ACS Symposium Series, No. 618, 1996. Esta definición clasifica más de 120 CBDs en 10 familias (l-X), poniendo de manifiesto que los CBDs se encuentran en diferentes grupos de enzimas celulolíticas, tales como, las endoglucanasas, xilanasas, mananasas, arabinofuranosidasas, acetil esterasas y quitinasas.

A efectos de la presente invención el término "celulosa" se refiere a un polisacárido lineal que comprende de cientos a miles de unidades de D-glucosa unidas por enlaces beta-(1 ,4). Este polisacárido se conoce también como beta-(1 ,4) glucano.

En el contexto de la presente invención, el término "dominio catalíticamente activo" (CAD) se refiere a la región o a la secuencia de polinucleótidos que codifica para la secuencia aminoacídica responsable de catalizar la degradación o hidrólisis de celulosa.

En el contexto de la presente invención, el término "dominio de unión" o "región de unión" o "región Wnke o "Hnker", utilizados indistintamente a lo largo del presente documento, se refiere a la secuencia de polinucleótidos que codifica para la secuencia aminoacídica que sirve de unión entre los dominios CBD y CAD presentes en una celulasa. Los linkers juegan un importante papel a nivel estructural y funcional, bien para unir ambas regiones, bien para mantener una distancia concreta de una región respecto a la otra y así permitir la actividad celulolítica de la celulasa sobre su sustrato, etc. Los linkers también comprenden sitios para la escisión proteolítica. Así, las regiones linker nativas presentes en las celulasas nativas, durante el proceso de obtención de las variantes de las celulasas y/o durante la fase de almacenamiento (entre su síntesis y su uso) y/o durante el proceso de hidrólisis enzimática, pueden sufrir una rotura proteolítica, lo que provoca una disociación entre el dominio CAD y el dominio CBD de la celulasa. El hecho de que una celulasa pierda el dominio CBD impide un reconocimiento y unión eficiente de la misma a la celulosa, lo que conlleva una pérdida o disminución en el rendimiento del procedimiento de hidrólisis enzimática.

A efectos de la presente invención el término "linker nativo" o "linker silvestre" se refiere a la secuencia de polinucleótidos que codifica para la secuencia aminoacídica que sirve de unión entre los dominios CBD y CAD presentes en una celulasa nativa, sin modificar. A efectos de la presente invención, los linkers descritos aquí son linker más resistentes a proteólisis que los linkers nativos o silvestres. A efectos de la presente invención, los términos "procesamiento", "proteólisis", "procesamiento de celulasas", o "proteólisis de celulasas", se pueden utilizar indistintamente a lo largo de la presente invención y hace referencia a la rotura de la cadena peptídica de una celulasa por la actividad proteolítica específica o inespecífica y que da lugar a una celulasa modificada que puede presentar una menor actividad celulolítica como consecuencia de que durante dicho procesamiento pierdan algún fragmento o dominio de su estructura responsable de dicha actividad celulolítica. A efectos de la presente invención, los términos procesamiento", "proteólisis", "procesamiento de celulasas", o "proteólisis de celulasas", hacen referencia preferentemente a pérdida o rotura del dominio o región de unión entre el dominio CBD y el dominio CAD de una celulasa.

A efectos de la presente invención, los términos "más resistente a proteólisis" o "más resistente al procesamiento", en relación tanto a los linker descritos aquí, como a las propias celulasas que comprenden dichos linker, se refiere a aquéllos linker o celulasas que presentan un menor o incluso nulo, procesamiento proteolítico durante su síntesis, almacenamiento y/o secreción, dando lugar a celulasas que muestran una mayor actividad celulolítica frente a celulasas que sufren procesamiento celulolítico y como consecuencia de éste disminuye la sinergia entre los dominios CAD y CBD, impidiendo que el dominio CAD llegue a los sitios diana de degradación celulolítica. A efectos de la presente invención, los linker y celulasas descritas aquí muestran al menos un 10%, al menos un 20%, al menos un 30%, al menos un 40%, al menos un 50%, al menos un 60%, al menos un 70%, al menos un 80%, al menos un 85%, al menos un 90%, al menos un 95%, al menos un 96%, al menos un 97%, al menos un 98%, al menos un 99% o un 100%, menos de procesamiento proteolítico que los linker o celulasas parentales o silvestres.

En una realización preferida de la presente invención, el linker se selecciona de entre cualquiera de los siguientes: SEQ ID NO: 10, 26 o 30. En una realización más preferida aún el linker preferido es el linker de SEQ ID NO: 26. En la Tabla 1 mostrada a continuación se indican las secuencias nucleotídicas y peptídicas de los linkers descritos en la presente invención que presentan una mayor resistencia a proteolísis que los linkers nativos o silvestres.

Secuencia nt Secuencia aa

SEQ ID NO: 1 SEQ ID NO: 2

SEQ ID NO: 3 SEQ ID NO: 4

SEQ ID NO: 5 SEQ ID NO: 6

SEQ ID NO: 7 SEQ ID NO: 8

SEQ ID NO: 9 SEQ ID NO: 10

SEQ ID NO: 1 1 SEQ ID NO: 12

SEQ ID NO: 13 SEQ ID NO: 14

SEQ ID NO: 15 SEQ ID NO: 16

SEQ ID NO: 17 SEQ ID NO: 18

SEQ ID NO: 19 SEQ ID NO: 20

SEQ ID NO: 21 SEQ ID NO: 22

SEQ ID NO: 23 SEQ ID NO: 24

SEQ ID NO: 25 SEQ ID NO: 26

SEQ ID NO: 27 SEQ ID NO: 28

SEQ ID NO: 29 SEQ ID NO: 30 Secuencia nt Secuencia aa

SEQ ID NO: 31 SEQ ID NO: 32

SEQ ID NO: 33 SEQ ID NO: 34

SEQ ID NO: 35 SEQ ID NO: 36

El término "enzima celulolítica" o "celulasa", utilizados indistintamente a lo largo de la presente invención, se refiere a una categoría de enzimas que pueden degradar polímeros complejos, tales como, celulosa y/o hemicelulosa ^-1 ,4-glucano o enlaces beta-D-glucosídicos) a oligosacáridos más cortos, tales como, celobiosa y/o glucosa y xilobiosa y/o xilosa, respectivamente. Dentro de dicha categoría de enzimas se encuentran preferentemente los siguientes grupos: 1 ,4- beta-D-glucano glucanohidrolasa ("endoglucanasa" o "EG"); 1 ,4- beta-D-glucano celobiohidrolasa ("exoglucanasa", "celobiohidrolasa", o "CBH"); beta-D-glucósidoglucohidrolasa ("beta- glucosidasa", "celobiasa" o "BGL"), endoxilanasas o xilanasas ("Xyl"), beta-xilosidasas ("beta-Xyl") y polisacárido mono-oxigenasas ("PMO").

Las endoglucanasas o EGs, rompen enlaces internos y alteran la estructura cristalina de la celulosa, exponiendo cadenas de polisacárido de celulosa individuales ("glucanos"). Dicho término, se refiere a un grupo de enzimas celulasas clasificado como E.C. 3.2.1.4. Estas enzimas hidrolizan los enlaces β-1 ,4 glucosídicos internos de la celulosa. Las celobiohidrolasas o CBHs, acortan gradualmente las moléculas de glucano, liberando principalmente unidades de celobiosa (un dimero de glucosa ligado en β-1 ,4 soluble en agua), además de glucosa, celotriosa y celotetraosa. El término "celobiohidrolasa", tal y como se utiliza en el presente documento, se refiere a una proteína de la clase E.C. 3.2.1.91 , que cataliza la hidrólisis de la celulosa polimérica a celobiosa mediante una actividad exoglucanasa, liberando secuencialmente moléculas de celobiosa desde los extremos reductores o no reductores de la celulosa.

Las beta-glucosidasas o BGL, fraccionan celobiosa en monómeros de glucosa. El término "beta-glucosidasa", tal como se usa en el presente documento, se refiere a un grupo de enzimas celulasas clasificadas como EC 3.2.1.21. Estas enzimas catalizan la hidrólisis de oligómeros de azúcar, incluyendo, pero sin limitarse al dimero de glucosa o celobiosa, con la liberación de un monómero de azúcar correspondiente, utilizada, pero sin limitarse, para la síntesis de etanol. La enzima beta-glucosidasa actúa sobre los enlaces beta-(1 ,4) que unen a dos moléculas de glucosa o glucosa sustituida (es decir, el disacárido celobiosa). Es una exocelulasa con especificidad por una variedad de sustratos de beta-D-glucósido. Cataliza la hidrólisis de residuos no reductores terminales en beta-D-glucósidos con liberación de glucosa.

Las xilanasas o Xyl, catalizan la hidrólisis aleatoria de xilano polimérico, pectina polimérica o hemicelulosa que contiene residuos xilosa que da como resultado la formación de oligómeros de azúcar que contienen xilosa y/o residuos xilosa monoméricos. Tal y como se utilizan en el presente documento, las xilanasas se refieren a un grupo de enzimas (EC 3.2.1.8) que catalizan la endohidrólisis de enlaces 1 ,4- beta-D-xilosídicos en xilanos. Esta enzima también puede denominarse endo-1 ,4- beta-xilanasa o 1 ,4- beta-D-xilano xilanohidrolasa. Las beta-xilosidasas son enzimas con actividad 4- beta-D-xilano xilohidrolasa catalizando la reacción desde los oligómeros de xilosa, incluso xilobiosa, liberando finalmente D-xilosa. Tal y como se utiliza en el presente documento, las beta- xilosidasas se refieren a un grupo de enzimas (EC 3.2.1.37) que cataliza la hidrólisis de 1 ,4-beta-D-xilanos, para eliminar residuos de D-xilosa sucesivos de los extremos no reductores. Esta enzima también puede denominarse xilano 1 ,4-beta-xilosidasa, 1 ,4-beta-D-xilano xilohidrolasa, exo- 1 ,4-beta-xilosidasa o xilobiasa.

Las PMO son metaloproteínas con actividad endocelulolítica que actúan con un mecanismo diferente al que realizan las endoglucanasas, ya que rompen las cadenas de celulosa por oxidación de sus monómeros de glucosa en los carbonos 1 , 4 y/o 6. Los términos "polisacárido monooxigenasa", "PMO", "Glicosil-hidrolasa de la familia 61" o "GH61" o "AA9", todos ellos utilizados para denominar a celulasas de tipo PMO, se refieren a un grupo de enzimas, originalmente clasificadas dentro de la familia de proteínas GH61 , ya que presentan actividad GH61 o PMO, y que al ser incluidas en una reacción de sacarificación resulta en una mayor cantidad (mayor rendimiento) de uno o más azúcares solubles (por ejemplo, glucosa) en comparación con la reacción de sacarificación llevada a cabo bajo las mismas condiciones pero en ausencia de la proteína GH61. Los miembros de esta familia de enzimas actúan como monooxigenasas de cobre que catalizan la rotura de las cadenas de celulosa mediante un mecanismo oxidativo a nivel de varios carbonos (C1 , C4 y/o C6), liberando celodextrinas (Langston et al. Applied and Environmental Microbiology, 2011 , 77:7007-7015).

Otro de los objetos descritos en la presente invención, se refiere a una celulasa que comprende al menos un CBD, al menos un CAD y al menos un linker que le confiere una mayor resistencia a proteólisis según se ha descrito en la presente invención, respecto a los linkers nativos o silvestres de una celulasa parental nativa, no modificada. A efectos de la presente invención, se utiliza indistintamente los términos "celulasa de la invención" o "variante de celulasa de la invención".

El término "variante", como se usa aquí, se refiere a una enzima que procede de una enzima nativa mediante una o más deleciones, inserciones y/o sustituciones de uno o más aminoácidos y, por tanto, tiene una secuencia diferente a la de la enzima nativa. Como se usa aquí, la expresión "variante de celulasa" significa un polipéptido que tiene actividad celulolítica producido, preferiblemente, por un organismo que expresa una secuencia de nucleótidos codificante para una celulasa nativa que ha sido modificada para codificar dicha variante de celulasa. Dicha secuencia de nucleótidos modificada se obtiene por intervención humana mediante modificación de la secuencia de nucleótidos que codifica una celulasa nativa. El término "modificación" significa en el presente documento cualquier modificación de la secuencia de aminoácidos o de ácidos nucleicos de una celulasa nativa. La expresión "celulasa nativa" se refiere a una enzima celulolítica o a su preproteína, expresada por un microorganismo y que comprende su secuencia natural sin modificar. Preferentemente, la enzima celulasa nativa a la que se hace referencia en la presente invención es expresada por un hongo filamentoso, más preferiblemente por un hongo que pertenece al género Myceliophthora, aún más preferiblemente por un hongo de la especie Myceliophthora thermophila.

En una realización preferida la celulasa de la invención se selecciona de entre cualquiera de la siguiente lista: endoglucanasas, beta-glucosidasas, celobiohidrolasas, beta-xilosidasas, xiloglucanasas, polisacárido monooxigenasas, xilanasas y arabinofuranosidasas. En una realización más preferida, la celulasa de la invención se selecciona de entre una celobiohidrolasa o una polisacárido monooxigenasa. En otra realización preferida, la celulasa de la invención, según se describe aquí comprende cualquiera de los linkers seleccionados de entre la siguiente lista: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 SEQ ID NO: 34 y SEQ ID NO: 36. En otra realización preferida, la celulasa de la invención comprende al menos uno de los linker seleccionados de entre cualquiera de los siguientes: SEQ ID NO: 10, SEQ ID NO: 26 o SEQ I D NO: 30. En otra realización más preferida, la celulasa de la invención según se describe aquí comprende el linker de las secuencias SEQ ID NO: 26 o SEQ ID NO: 30. En otra realización aún más preferida, la celulasa de la invención según se describe aquí comprende el linker de la secuencia SEQ ID NO: 26. En otra realización preferida, la celulasa de la invención es una CBH, preferentemente una Cbh1 , que comprende cualquiera de los linkers seleccionados de entre la siguiente lista: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 SEQ ID NO: 34 y SEQ ID NO: 36. En otra realización preferida, la Cbh1 comprende al menos uno de los linker seleccionados de entre cualquiera de los siguientes: SEQ ID NO: 10, SEQ ID NO: 26 o SEQ ID NO: 30. En otra realización más preferida, la Cbh1 comprende el linker de SEQ I D NO: 26 o SEQ ID NO: 30. En una realización aún más preferida, la Cbh1 comprende el linker de SEQ ID NO: 26.

En otra realización preferida, la celulasa de la invención es una CBH, preferentemente una Cbh1 que comprende al menos uno de los linkers descritos en la presente invención. En otra realización más preferida aún la Cbh1 descrita en la presente invención comprende una secuencia de aminoácidos que tienen una identidad de secuencia de al menos un 70%, 75%, 80%, 85%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100%, con la Cbh1 de SEQ ID NO: 38, y que comprende al menos uno de los linkers descritos en la presente invención. En otra realización más preferida, la celulasa de la invención es una PMO, preferentemente una PMO-06230, que comprende cualquiera de los linkers seleccionados de entre la siguiente lista: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 SEQ ID NO: 34 y SEQ ID NO: 36. En otra realización preferida, la PMO-06230 comprende al menos uno de los linker seleccionados de entre cualquiera de los siguientes: SEQ ID NO: 10, SEQ ID NO: 26 o SEQ ID NO: 30. En otra realización más preferida, la PMO-06230 comprende el linker de SEQ ID NO: 26 o SEQ ID NO: 30. En una realización aún más preferida, la PMO-06230 comprende el linker de SEQ ID NO: 26.

En otra realización preferida, la celulasa de la invención es una PMO, preferentemente una PMO-06230 que comprende al menos uno de los linkers descritos en la presente invención. En otra realización más preferida aún la PMO-06230 descrita en la presente invención comprende una secuencia de aminoácidos que tienen una identidad de secuencia de al menos un 70%, 75%, 80%, 85%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100%, con la PMO-06230 de SEQ ID NO: 40, y que comprende al menos uno de los linkers descritos en la presente invención.

En otra realización más preferida, las celulasas con linker más resistentes a proteólisis, respecto a los linker de las celulasas nativas, según se describe en la presente invención se seleccionan de entre cualquiera de las descritas en la Tabla 2.

A efectos de la presente invención, el término "molécula de ácido nucleico aislada", "secuencia de nucleótidos", "secuencia de ácido nucleico" o "polinucleótido", se refiere a una molécula de ácido nucleico (polinucleótido) que se ha extraído de su medio natural (es decir, que se ha sometido a manipulación humana) y puede incluir ADN, ARN o derivados de ADN o ARN, incluyendo ADNc. La secuencia de nucleótidos de la presente invención puede estar o no química o bioquímicamente modificada, y se puede obtener artificialmente por medio de clonación, amplificación y procedimientos de selección o síntesis. La secuencia de ácido nucleico de la invención puede codificar el polipéptido maduro o una preproteína que consiste en un péptido señal unido a la enzima madura que tendrá que procesarse después.

La secuencia de nucleótidos de la presente invención también puede comprender otros elementos, tales como intrones, secuencias no codificantes en los extremos 3' y/o 5', sitios de unión al ribosoma, etc. Esta secuencia de nucleótidos también puede incluir secuencias codificantes para aminoácidos adicionales que son útiles para la purificación o estabilidad del péptido codificado.

Cuando se aplica a una proteína/polipéptido, el término "aislado" indica que la proteína se encuentra en una condición diferente de su entorno nativo. En una forma preferida, la proteína aislada está sustancialmente libre de otras proteínas, originadas por la célula. Se prefiere proporcionar la proteína en una forma superior al 40% pura, más preferiblemente en una forma superior al 60% pura. Incluso más preferiblemente se prefiere proporcionar la proteína en una forma altamente purificada, es decir, más de 80% pura, más preferiblemente superior al 95% pura, e incluso más preferiblemente superior al 99% pura, según se determinó por SDS-PAGE.

El término "proteína/polipéptido aislado" se puede denominar de forma alternativa "proteína/polipéptido purificado".

Otro de los objetos descritos en la presente invención se refiere a una secuencia de ácido nucleico aislada que codifica para los linkers o para la celulasa que comprende al menos uno de dichos linker según se describe en la presente invención.

En una realización preferida, las secuencias de ácido nucleico que codifican para los linkers de la invención se muestran en la Tabla 1. De la misma manera, las secuencias nucleotídicas que codifican para las celulasas de la invención que comprenden al menos uno de los linker más resistentes a proteólisis que los linkers nativos o silvestres aquí descritos, se muestran en la Tabla 2.

Tabla 2. Celulasas nativas y variantes de celulasas con los linker resistentes a proteólisis descritos en la presente invención.

DESCRIPCION Secuencia nt Secuencia proteína

Cbh1 nativa SEQ ID NO: 37 SEQ ID NO: 38

PMO-06230 nativa SEQ ID NO: 39 SEQ ID NO: 40

Variante Cbh1 con linker de SEQ SEQ ID NO: 41 SEQ ID NO: 42 ID NO: 1 o 2

Variante Cbh1 con linker de SEQ SEQ ID NO:43 SEQ ID NO:44 ID NO: 3 o 4

Variante Cbh1 con linker de SEQ SEQ ID NO:45 SEQ ID NO:46 ID NO: 5 o 6

Variante Cbh1 con linker de SEQ SEQ ID NO:47 SEQ ID NO:48 DESCRIPCION Secuencia nt Secuencia proteína

ID NO: 7 u 8

Variante Cbh1 con linker úe SEQ SEQ ID NO:49 SEQ ID NO:50 ID NO: 9 o 10

Variante Cbh1 con linker e SEQ SEQ ID NO:51 SEQ ID NO:52 ID NO: 11 o 12

Variante Cbh1 con linker úe SEQ SEQ ID NO:53 SEQ ID NO:54 ID NO: 13 o 14

Variante Cbh1 con linker úe SEQ SEQ ID NO:55 SEQ ID NO:56 ID NO: 15 o 16

Variante Cbh1 con linker úe SEQ SEQ ID NO:57 SEQ ID NO:58 ID NO: 17 o 18

Variante Cbh1 con linker úe SEQ SEQ ID NO:59 SEQ ID NO:60 ID NO: 19 o 20

Variante Cbh1 con linker úe SEQ SEQ ID NO:61 SEQ ID NO:62 ID NO: 21 o 22

Variante Cbh1 con linker úe SEQ SEQ ID NO:63 SEQ ID NO:64 ID NO: 23 o 24

Variante Cbh1 con linker úe SEQ SEQ ID NO:65 SEQ ID NO:66 ID NO: 25 o 26

Variante Cbh1 con linker úe SEQ SEQ ID NO:67 SEQ ID NO:68 ID NO: 27 o 28

Variante Cbh1 con linker úe SEQ SEQ ID NO:69 SEQ ID NO:70 ID NO: 29 o 30

Variante Cbh1 con linker úe SEQ SEQ ID NO:71 SEQ ID NO:72 ID NO: 31 o 32

Variante Cbh1 con linker úe SEQ SEQ ID NO:73 SEQ ID NO:74 ID NO: 33 o 34

Variante Cbh1 con linker úe SEQ SEQ ID NO:75 SEQ ID NO:76 ID NO: 35 o 36

Variante PMO-06230 con linker úe SEQ ID NO:77 SEQ ID NO:78 SEQ ID NO: 25 o 26

La expresión, "secuencia de ácido nucleico complementaria" de una secuencia de ácido nucleico que codifica para los linkers o las celulasas de la invención hace referencia a la secuencia de ácido nucleico de la hebra complementaria a la que codifica para los linkers y celulasas de la invención. Se apreciará que un ADN bicatenario que codifica una secuencia de aminoácidos dada comprende un ADN monocatenario y su hebra complementaria, que tiene una secuencia que es complementaria al ADN monocatenario.

Otro objeto descrito en la presente invención se refiere, por tanto, a una secuencia de ácido nucleico aislada complementaria a las secuencia de ácido nucleico de los linkers y de las celulasas descritas en la presente invención. La secuencia de ácido nucleico de la invención se puede incluir en una construcción genética, preferiblemente en un vector de expresión. Dicha construcción genética puede comprender además una o más secuencias reguladoras de la expresión génica, tales como promotores, terminadores, etc. Por tanto, en otro aspecto, la invención proporciona una construcción genética que comprende la secuencia de ácido nucleico de la invención o la secuencia de ácido nucleico complementaria a la misma, en lo sucesivo "construcción génica de la invención". En una forma de realización preferida, dicha construcción génica es un vector de expresión. La expresión "construcción génica" o "construcción de ácido nucleico" como se usa aquí hace referencia a una unidad funcional necesaria para la transferencia o la expresión de una secuencia nucleotídica o gen de interés, en el presente documento, la secuencia de ácido nucleico de la invención como se ha descrito, y secuencias reguladoras, incluyendo, por ejemplo, un promotor, operativamente unidas a la secuencia que codifica la proteína. Por tanto, a efectos de la presente invención, la construcción génica se refiere a una molécula de ácido nucleico bicatenario, que se encuentra aislada de un ácido nucleico natural o que se modifica artificialmente para que contenga segmentos de ácidos nucleicos. La expresión construcción de ácido nucleico es sinónima a la expresión "cásete de expresión" cuando la construcción de ácido nucleico contiene las secuencias control requeridas para la expresión de la secuencia codificante.

El término "vector de expresión", también conocido como "construcción de expresión" o "plásmido", hace referencia a una molécula de ADN, lineal o circular, que comprende la secuencia de ácido nucleico de la invención y que está operativamente unida a segmentos adicionales que permiten la transcripción del péptido codificado. Generalmente, un plásmido se usa para introducir un gen específico en una célula diana. Una vez que el vector de expresión está en el interior de la célula, la proteína que está codificada por el gen es producida mediante la maquinaria de transcripción y traducción celular. Con frecuencia el plásmido se somete a ingeniería genética para que contenga secuencias reguladoras que actúan como regiones potenciadoras y promotoras y que conducen a una transcripción eficiente del gen portado en el vector de expresión. El objetivo de un vector de expresión bien diseñado es la producción de grandes cantidades de ARN mensajero estable y, por tanto, de proteína. Los vectores de expresión son herramientas básicas de biotecnología y de la producción de proteínas, tales como enzimas. El vector de expresión de la invención se introduce en una célula huésped de modo que el vector se mantiene como integrante cromosómico o como vector autorreplicante extracromosómico.

El término "expresado recombinante" o "expresado de forma recombinante" usado aquí en relación con la expresión de un polipéptido o proteína se define según la definición estándar de la técnica. La expresión recombinante de una proteína se realiza generalmente usando un vector de expresión como se ha descrito anteriormente. Ejemplos de vectores de expresión son plásmidos, fagos, cósmidos, fagémidos, cromosomas artificiales de levaduras (YAC), cromosomas artificiales bacterianos (BAC), cromosomas artificiales humanos (HAC) o vectores virales, tales como adenovirus, retrovirus o lentivirus. Las construcciones génicas de la presente invención abarcan un vector de expresión, donde el vector de expresión se puede usar para transformar una célula huésped u hospedadora adecuada para que el huésped pueda expresar las variantes de celulasas que comprenden los linkers descritos en la invención. Los procedimientos para la expresión recombinante de proteínas en hongos y otros organismos son bien conocidos en la técnica y se dispone de numerosos vectores de expresión o se pueden construir usando procedimientos de rutina.

La expresión "secuencias control" se define aquí para incluir todos los componentes que son necesarios o ventajosos para la expresión de la secuencia de ácido nucleico de la presente invención. Dichas secuencias control incluyen, pero sin limitarse, un líder, una secuencia de poliadenilación, una secuencia propéptido, un promotor, una secuencia de péptido señal y un terminador de la transcripción. Como mínimo, las secuencias control incluyen un promotor y señales de terminación de la transcripción y de la traducción. Las secuencias control se pueden proporcionar con ligadores con el fin de introducir sitios de restricción específicos que facilitan la unión de las secuencias control con la región codificante de la secuencia de ácido nucleico de la presente invención. La expresión "operativamente unido" indica en el presente documento una configuración en la que una secuencia control se coloca en una posición adecuada respecto a la secuencia de ácido nucleico de la presente invención, de un modo tal que la secuencia control dirige la expresión de la secuencia de ácido nucleico de la presente invención. El vector de expresión de la invención puede ser un vector de replicación autónoma, es decir un vector que existe como entidad extracromosómica, cuya replicación es independiente de la replicación del cromosoma, por ejemplo un plásmido, un elemento extracromosómico, un minicromosoma o un cromosoma artificial. El vector puede contener cualquier medio para garantizar la autoreplicación. Como alternativa, el vector puede ser uno que, cuando se introduce en la célula huésped, se integra en el genoma y se replica junto con el(los) cromosoma(s) en el(los) que se ha integrado. Además se puede usar un único vector o plásmido, o dos o más vectores o plásmidos que juntos contienen el ADN total que se va a introducir en el genoma de la célula huésped, o un transposón.

Los vectores usados en la presente invención contienen, preferiblemente, uno o más marcadores seleccionares que permitan la fácil selección de las células transformadas, transfectadas, transducidas o similares. Un marcador seleccionable es un producto génico que proporciona resistencia a un biocida o a un virus, a metales pesados, prototrofía a los auxótrofos y similares. Los marcadores seleccionares para usar en una célula huésped de un hongo filamentoso incluyen, pero sin limitarse, AmdS (acetamidasa), ArgB (ornitina carbamoiltransferasa), Bar (fosfinotricina acetiltransferasa), Hph (higromicina fosfotransferasa), NiaD (nitrato reductasa), PyrG (orotidina-5'-fosfato descarboxilasa), CysC (sulfato adeniltransferasa), y TrpC (antranilato sintasa), así como equivalentes de los mismos. Los vectores usados en la presente invención contienen, preferiblemente, uno o más elementos que permiten la integración del vector en el genoma de la célula huésped o la replicación autónoma del vector en la célula con independencia del genoma. Para la integración en el genoma de la célula huésped, el vector puede depender de la secuencia de ácido nucleico de la presente invención o de cualquier otro elemento del vector para la integración en el genoma mediante recombinación homologa o no homologa. Como alternativa, el vector puede contener secuencias adicionales de nucleótidos para dirigir la integración mediante recombinación homologa en el genoma de la célula huésped en una o más localización(es) precisas en el(los) cromosoma(s).

Para la replicación autónoma, el vector puede comprender además un origen de replicación que permite que el vector se replique de forma autónoma en la célula huésped en cuestión. El origen de replicación puede ser cualquier replicador plasmídico que participe en la replicación autónoma que funciona en una célula. La expresión "origen de replicación" o "replicador plasmídico" se define aquí como una secuencia de nucleótidos que permite que un plásmido o vector se replique in vivo. Ejemplos de orígenes de replicación útiles en una célula fúngica filamentosa son AMA1 y ANS1 (Verdoes et al., 2007, Ind. Biotechnol., 3: 48-57).

En la célula huésped se puede insertar más de una copia de la secuencia de ácido nucleico de la presente invención para aumentar la producción del producto génico. Se puede obtener un incremento del número de copias del polinucleotido mediante integración de al menos una copia adicional de la secuencia en el genoma de la célula huésped o incluyendo un gen marcador seleccionare amplificable con el polinucleotido, donde las células que contienen copias amplificadas del gen marcador seleccionare y, por consiguiente, copias adicionales del polinucleotido, se pueden seleccionar cultivando las células en presencia del agente seleccionare adecuado. Los procedimientos usados para ligar los elementos descritos anteriormente para construir los vectores de expresión recombinante a los que se hace referencia en la presente invención son bien conocidos por un experto en la técnica. En otro aspecto, la invención proporciona una célula huésped que comprende la construcción génica de la invención, en adelante denominada "célula huésped de la invención". Por tanto, dicha célula huésped expresa la variante de la celulasa de la invención, que comprende al menos un linker más resistente a proteólisis que un linker nativo o silvestre. La "célula huésped", como se usa aquí, incluye cualquier tipo celular que es susceptible de transformación, transfección, transducción y similar con la construcción génica de la invención. La célula huésped puede ser eucariota, tal como una célula de mamífero, insecto, vegetal o fúngica. En una realización preferida, la célula huésped es una célula de hongo filamentoso. Los hongos filamentosos generalmente se caracterizan por una pared micelar compuesta por quitina, celulosa, glucano, quitosano, mañano y otros polisacáridos complejos. En una realización más preferida, la célula huésped de hongo filamentoso es una célula de Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Coprinus, Coriolus, Cryptococcus, Filibasidium, Fusarium, Gibberella, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Trametes, o Trichoderma. En una realización más preferida, la célula huésped de hongo filamentoso es una célula de Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger o Aspergillus oryzae. En otra realización más preferida, la célula huésped de hongo filamentoso es una célula de Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis gilvescens, Ceriporiopsis pannocinta, Ceriporiopsis rivulosa, Ceriporiopsis subrufa, Ceriporiopsis subvermispora, Coprinus cinereus, Coriolus hirsutus, Gibberella zeae, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Phanerochaete chrysosporium, Phlebia radiata, Pleurotus eryngii, Thielavia terrestris, Tra metes villosa, Tra metes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei o Trichoderma viride. En otra realización aún más preferida, la célula huésped de la invención es cualquier cepa de la especie Myceliophthora thermophila. En una realización aún más preferida, la célula huésped de la invención es la cepa C1 de la especie Myceliophthora thermophila.

Se entenderá que, para las especies mencionadas anteriormente, la invención abarca estados tanto perfectos como imperfectos y otros equivalentes taxonómicos, por ejemplo anamorfos, con independencia del nombre de la especie por el que se conocen. Los expertos en la técnica reconocerán fácilmente la identidad de los equivalentes adecuados. Por ejemplo, Myceliophthora thermophila es equivalente a Chrysosporium lucknowense.

El término "expresión" incluye cualquier etapa implicada en la producción de los linker más resistentes a proteólisis que los linker nativos, o en las variantes de celulasas que comprenden los linkers más resistentes a proteólisis de la invención que las celulasas con linker nativos, que incluye, pero no se limita a, transcripción, modificación post- transcripcional, traducción, modificación post-traduccional, y secreción, en el caso de las variantes de las celulasas de la invención.

En otra realización preferida, las células hospedadoras de la invención se caracterizan por que presentan sobre-expresión de al menos una de las variantes de celulasas de la invención y/o de al menos una celulasa homologa y/o heteróloga, según se describe a lo largo de la invención. A efectos de la presente invención, los términos "aumento de la expresión" o "sobreexpresion" pueden utilizarse indistintamente a lo largo del presente documento y se refieren a cualquier forma de expresión que es adicional o mayor al nivel original de expresión en una célula parental o silvestre. A efectos de la presente invención, la sobreexpresion, en orden creciente de preferencia es de al menos, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o 100%, en comparación con la expresión en las células hospedadoras parentales o silvestres. Los métodos para aumentar la expresión de genes o productos génicos están bien documentados en la técnica e incluyen, por ejemplo, sobreexpresion conducida por promotores apropiados, el uso de potenciadores de la transcripción o potenciadores de la traducción. Los ácidos nucleicos aislados pueden servir también como promotores o potenciadores pudiendo introducirse en una posición apropiada de una forma no heterologa de un polinucleótido con el fin de regular por incremento la expresión de un ácido nucleico que codifica el polipéptido de interés. Por ejemplo, los promotores endógenos se pueden alterar in vivo por mutación, deleción, y/o sustitución, o promotores aislados pueden introducirse en una secuencia polinucleotídica que codifique para un gen de interés para controlar la expresión del mismo. A efectos de la presente invención, se pretende que estos términos, abarquen el incremento en la expresión de enzimas tanto homologas, como heterólogas. En algunas realizaciones, el incremento en la expresión incluye una tasa de transcripción elevada y/o un nivel del gen también elevado en comparación con la tasa de transcripción homologa de dicho gen. En algunas otras realizaciones, un gen heterólogo se introduce en una célula hospedadora para inducir un incremento en la expresión de un gen que codifica una enzima homologa. En algunas realizaciones, el gen heterólogo es un gen que ha sido modificado para incrementar la expresión del producto del gen. En algunas realizaciones, el término también abarca la secreción del polipéptido a partir de una célula.

A efectos de la presente invención, los términos "endógeno" u "homólogo" se refieren tanto a genes como a proteínas, que se encuentran de forma natural en una célula hospedadora, es decir, sin que exista ninguna intervención humana. Adicionalmente, dichos términos también hacen referencia a esos mismos genes o proteínas que una vez aislados del organismo pueden volver a reintroducirse (transgen) mediante ingeniería genética. A efectos de la presente invención, el término "heterólogo" se refiere a un ácido nucleico que deriva de una especie diferente o, en caso de que derive de la misma especie, un ácido nucleico que se encuentra sustancialmente modificado de su forma nativa. Por ejemplo, un promotor que se encuentre operativamente ligado a un gen estructural heterólogo pertenece a una especie diferente a partir de la cual el gen estructural fue originalmente obtenido siempre y cuando se origine de una intervención humana deliberada. En caso de pertenecer a la misma especie, uno a varios genes heterologos deben estar sustancialmente modificados de su forma original. Una proteína heteróloga puede originarse a partir de una especie distinta, o de la misma especie siempre y cuando se origine a partir de una intervención humana deliberada.

Tal como se utiliza aquí, el término "recombinante" se refiere a un polinucleótido o polipéptido que no se produce naturalmente en una célula huésped. En algunas realizaciones, las "células recombinantes" expresan genes que no se encuentran en forma idéntica dentro de la forma nativa o silvestre (es decir, no recombinante) de la célula y/o expresan genes nativos que de otro modo su expresión se encontraría aumentada, disminuida o anulada debido a la intervención humana deliberada. Las células recombinantes contienen al menos un polinucleótido o polipéptido recombinante. Una construcción de ácido nucleico que comprende el propio ácido nucleico y los elementos necesarios para su expresión, el ácido nucleico (por ejemplo, un polinucleótido), célula o polipéptido se denominan aquí como "recombinante" cuando es de origen no natural, artificial o procesado. A efectos de la presente invención, el término "disminución", "reducción", "supresión", "inhibición", "deleción", "silenciamiento", "eliminación", se refieren a un descenso en el nivel de expresión de un gen y/o secreción de la proteína respecto al nivel original de expresión del mismo gen y/o secreción de la proteína en el genotipo parental o silvestre. A efectos de la presente invención, la disminución, eliminación, reducción, supresión, inhibición, deleción, silenciamiento o inhibición, de la expresión y/o secreción en orden creciente de preferencia es de al menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o 100%, reducida en comparación con la expresión en las células hospedadoras parentales o silvestres. Una persona experta en la técnica conoce las diferentes herramientas y técnicas de rutina para la eliminación, reducción, supresión, deleción, silenciamiento o inhibición de la expresión de un gen o proteína. A efectos de la presente invención, sirvan como ejemplo, la clonación de un gen o genes diana en forma de repetición invertida (en parte o totalmente), pérdida, sustitución o bloqueo de material genético que resulta en una interrupción completa o parcial de la secuencia del ADN que compone el gen, alteraciones del promotor o cualquier otra reducción del nivel de transcripción, alteración de la expresión de proteínas reguladoras, silenciamiento génico (dsARN, siARN, etc.), modificación de la secuencia de iniciación de la traducción, alteración del marco de lectura, en su caso cambios en la secreción (alteraciones del péptido señal, etc.), mutagénesis, etc. En algunas realizaciones, el silenciamiento génico es preferido. En otras realizaciones, la supresión o eliminación parcial del gen es preferida. En otras realizaciones, la supresión completa o casi completa de la secuencia del gen es preferida.

Un experto en la materia conoce las diferentes herramientas y técnicas de rutina para la eliminación, reducción, supresión o inhibición de la secreción de una proteína. A efectos de la presente invención, sirvan como ejemplo la modificación genética dirigida o al azar de las secuencias señal (péptido señal) que permiten la secreción de una proteína o la modificación genética dirigida o al azar del sistema de secreción de la célula hospedadora en sí mismo. Las modificaciones genéticas pueden consistir en perdida de regiones, modificaciones, sustituciones, integraciones, alteraciones, silenciamiento, alteración del marco de lectura, etc.

A efectos de la presente invención, el término "secreción" se refiere al transporte de una proteína desde el interior de la célula al exterior. A efectos de la presente invención, el término secreción hace referencia, preferentemente a la secreción de enzimas con actividad celulolítica, que por efecto de este transporte aparecen en la composición enzimática producida por dicha célula.

A efectos de la presente invención, los términos "célula hospedadora parental o silvestre" o "célula hospedadora wild-type", se pueden utilizar indistintamente y se refieren a aquélla célula hospedadora que no ha sido modificada para expresar las variantes de celulasas de la invención. Preferiblemente, la célula parental o silvestre de la presente invención es Myceliophtora thermophila, más preferentemente M. thermophila C1. La variante celulasa de la invención presenta una mayor resistencia a la proteólisis gracias a comprender en su secuencia al menos uno de los linker descritos en la presente invención. La variante celulasa de la invención no pierde el dominio CBD manteniéndose intacta su actividad incluso en condiciones donde la celulasa nativa pierde dicho dominio CBD. Una composición enzimática que comprende al menos una de las variantes de celulasas de la invención es más efectiva que una composición enzimática donde las celulasas son nativas, sufren proteólisis y pierden el dominio CBD. Por lo tanto, una composición enzimática que comprende al menos una de las variantes de celulasas descritas en la presente invención, mejora el rendimiento de la etapa de hidrólisis del material celulósico en azúcares fermentables en los procesos para la producción de un bioproducto, preferiblemente etanol, respecto a una composición enzimática que comprende celulasas nativas. Adicionalmente, una composición enzimática que comprende al menos una de las variantes de celulasa de la invención presenta una mayor estabilidad frente a las condiciones de la etapa hidrolítica y/o durante el tiempo transcurrido desde su producción hasta su uso. Por tanto, en otro aspecto de la invención se proporciona una composición enzimática que comprende al menos una de las variantes de celulasas de la invención, de ahora en adelante conocida como "composición enzimática de la invención". En una realización preferida, la composición enzimática de la invención comprende además otras celulasas.

Se debe entender que la variante de celulasa de la invención se puede combinar con una o más de las enzimas celulolíticas descritas en el presente documento o con cualquier otra enzima disponible y adecuada para producir una composición multienzimática destinada a la sacarificación de biomasa celulósica, pudiendo ser tanto una celulasa homologa o heteróloga. Uno o más componentes de la composición multienzimática (aparte de las enzimas descritas en la presente invención) se pueden obtener o derivar de una fuente microbiana, vegetal o de otro tipo o combinación de las mismas, y contendrán enzimas capaces de degradar el material celulósico.

Esta composición de la invención puede comprender además otras actividades enzimáticas, tales como aminopeptidasa, amilasa, carbohidrasa, carboxipeptidasa, catalasa, celulasas tales como endoglucanasas, beta-glucosidasas y/o celobiohidrolasas, polisacárido monooxigenasas, celobiohidrolasas, quitinasa, cutinasa, ciclodextrina glucosiltransferasa, desoxirribonucleasa, esterasa, alfa- galactosidasa, beta-galactosidasa, glucoamilasa, alfa-glucosidasa, haloperoxidasa, invertasa, lacasa, lipasa, manosidasa, oxidasa, reductasa, enzima pectinolítica, peptidoglutaminasa, peroxidasa, fitasa, polifenoloxidasa, proteasa, ribonucleasa, transglutaminasa, o xilanasa, o cualquiera de sus combinaciones. La(s) enzima(s) adicional(es) se puede(n) producir, por ejemplo, mediante un microorganismo que pertenece al género Aspergillus, tal como Aspergillus aculeatus, Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae o Aspergillus terreus; Fusarium, tal como Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium pseudograminearum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sulphureum, Fusarium toruloseum, Fusarium trichothecioides, o Fusarium venenatum; Gibberella, tal como Gibberella zeae; Humicola, tal como Humicola insolens o Humicola lanuginosa; Talaromyces, tal como Talaromyces muroii, Talaromyces aculeatus o Talaromyces atroviride; Trichoderma, tal como Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, o Trichoderma viride; Penicilium, tal como Penicillium brasilianum, Penicillium canescens, Penicillium chrysogenum, Penicillium decumbens, Penicillium ethinulatum, Penicillium funiculosum, Penicillium janthinellum, Penicillium pinophilum o Penicillium purpurogenum o Myceliophthora, tal como Myceliophthora thermophila.

En una realización preferida, la composición enzimática de la invención comprende además la célula huésped de la invención. La composición de la invención se puede preparar de acuerdo con los procedimientos conocidos en la técnica y puede estar en forma líquida o tratarse de una composición seca. Las enzimas que se van a incluir en la composición pueden estabilizarse de acuerdo con los procedimientos conocidos en la técnica. Otro aspecto descrito en la invención se refiere al uso de la célula hospedadora de la invención o de la composición de la invención, para la degradación de biomasa.

El término "biomasa" se refiere en la presente invención a la fracción biodegradable de los productos, residuos y restos de origen biológico procedentes de la agricultura (incluyendo sustancias vegetales, tales como residuos de cultivos, y sustancias animales), industrias forestales (tales como recursos madereros) e industrias relacionadas que incluyen pesquerías y acuicultura, así como la fracción biodegradable de los residuos industriales y urbanos, tales como residuos sólidos urbanos o residuos de papel, y cultivos energéticos. En una realización preferida, la biomasa es paja o la fracción orgánica de residuos sólidos urbanos. En una realización más preferida, la biomasa es biomasa vegetal, más preferiblemente seleccionada a partir de la lista que consiste en: biomasa rica en azúcares fermentables, tales como caña de azúcar, biomasa de almidón, por ejemplo, granos de cereal, paja de maíz, paja de trigo, paja de cebada, paja de sorgo, paja de caña de azúcar, maleza, troncos, rama y hojas.

La célula hospedadora o la composición de la presente invención, se pueden utilizar para producir, a partir de biomasa vegetal, monosacáridos, disacáridos y polisacáridos como materias primas químicas o de la fermentación para la producción de etanol, plásticos, u otros productos o intermedios.

La célula hospedadora de la presente invención se puede utilizar como fuente de las variantes de celulasas de la invención y de otros polipéptidos que tienen actividad celulasa, en procesos de sacarificación o degradación o hidrólisis y fermentación de material lignocelulósico.

Por tanto, en una realización preferida, la composición enzimática de la invención es una composición enzimática obtenida (secretada) mediante la célula huésped de la invención. Esta composición puede obtenerse mediante el cultivo de la célula huésped de la invención en condiciones adecuadas para la producción y secreción de enzimas celulolíticas.

Se puede cultivar la célula hospedadora en un medio nutritivo adecuado, sólido o líquido, para la producción de las variantes de celulasas de la invención, y de toda la composición enzimática de la invención, utilizando procedimientos bien conocidos en la técnica. Por ejemplo, la célula se puede cultivar mediante cultivo en matraz con agitación, y fermentación a pequeña escala o a gran escala (que incluye las fermentaciones continua, discontinua o batch, de alimentación discontinua o fed- batch, o en estado sólido) llevada a cabo en un biorreactor de laboratorio o industrial en un medio adecuado y en condiciones que permitan expresar y/o aislar la variante o la composición. El cultivo tiene lugar en un medio nutritivo adecuado que comprende fuentes de carbono y nitrógeno y sales inorgánicas, utilizando los procedimientos conocidos en la técnica. Si se secreta la variante, junto con otras enzimas celulolíticas en el medio nutritivo, éstas se pueden recuperar directamente del medio.

Las variantes de celulasas de la invención expresadas, junto con otras enzimas celulolíticas expresadas, se pueden detectar utilizando procedimientos conocidos en la técnica específicos para polipéptidos. Estos procedimientos de detección pueden incluir el uso de anticuerpos específicos, la formación de un producto de la enzima, o la desaparición de un sustrato de la enzima. Las variantes de celulasas de la invención resultante, junto con el resto de enzimas celulolíticas secretadas por la célula huésped, se pueden recuperar utilizando procedimientos conocidos en la técnica. Por ejemplo, se pueden recuperar a partir del medio nutritivo mediante procedimientos convencionales que incluyen, pero no se limitan a, centrifugación, filtración, extracción, secado mediante pulverización, evaporación, o precipitación.

Las variantes de celulasas producidas en la presente invención, junto con otras enzimas celulolíticas secretadas por la célula huésped, se pueden purificar mediante una variedad de procedimientos conocidos en la técnica que incluyen, pero no se limitan a, cromatografía (por ejemplo, intercambio iónico, afinidad, hidrófoba, cromatoenfoque, y exclusión por tamaño molecular), procedimientos electroforéticos (por ejemplo, focalización isoeléctrica preparativa), solubilidad diferencial (por ejemplo, precipitación en sulfato de amonio), SDS-PAGE, o extracción, con el fin de obtener las enzimas sustancialmente puras que se puedan incluir en una composición enzimática.

La degradación o hidrólisis del material celulósico en azúcares fermentables, proceso también conocido como "sacarificación", por medio de las variantes de celulasas de la invención, la célula huésped de la invención o la composición de la invención, puede acompañarse después de un proceso de fermentación en el que los azúcares fermentables obtenidos se usan con el fin de obtener finalmente un bioproducto tal como bioetanol.

El término "bioproducto" o "productos biobasados" se refiere a los productos de alto valor añadido que pueden obtenerse por transformación química de los azúcares o por fermentación de dichos azúcares con diferentes microorganismos. Microorganismos fermentativos, dentro del alcance de la presente invención, se incluyen, levaduras, bacterias, hongos, preferentemente hongos filamentosos, microalgas y combinaciones de cualquiera de los anteriores. Los microorganismos fermentativos mencionados anteriormente pueden ser microorganismos silvestres o wild type o microorganismos recombinantes. Entre los microorganismos descritos en la presente invención se incluyen, las microalgas, definidas como microorganismos eucariotas que comprende un cloroplasto o plastidio, y que opcionalmente son capaces de llevar a cabo procesos fotosintéticos, o microorganismos procariotas que son capaces de llevar a cabo procesos fotosintéticos. Las microalgas incluyen obligatoriamente organismos fotoautótrofos que efectúan fotosíntesis para obtener energía. Las microalgas incluyen organismos unicelulares que se separan de las células hermanas poco después de la división celular, tales como Chlamydomonas, mirobios tales como, por ejemplo, Volvox. Las microalgas incluyen células tales como Chlorella, Dunaliella y Prototheca. Las microalgas también incluyen otros organismos fotosintéticos microbianos, tales como Agmenellum, Anabaena, y Pyrobotrys.

Otros microorganismos fermentativos pueden seleccionarse de entre cualquiera de la siguiente lista: Bacillus thermoglucosidaisus, Clostridium butyricum, Clostridium acetobutylicum, Clostridium beijerinckii, Corynebacterium glutamicum, Enterobacter aerogenes, Escherichia coli, Geobacillus themoglucosidasius, Klebsiella oxytoca, Lactobacillus sp. Leunoscoc mesenteroides, Thermoanaerobacter BG1L1, Thermoanaerobacter ethanolicus, Thermoanaerobacter mathranii,

Thermoanaerobacter thermosaccharolyticum, Zymobacter palmae, Zymomonas mobilis Candida arabinofermentans, Candida boidinii, Candida diddensis, Candida fermentans, Chrysosporium lucknowense, Candida pastoris, Candida shehatae, Candida sonorensis, Candida tropicalis, Hansenula anómala, Hansenula polymorpha, Kluyveromyces fragilis, Kluyveromyces marxianus, Pichia pastoris, Pichia stipitis, Saccharomyces cerevisiae, Saccharomyces bulderi, Saccharomyces barnetti, Saccharomyces exiguus, Saccharomyces diastaticus, Saccharomyces uvarum o Schizosaccharomyces pombe, Pseudomonas, Streptomyces, o mezclas de estos. Estos y otros microorganismos pueden proporcionar por fermentación de diferentes azúcares, bioproductos entre los cuales se pueden citar de manera no limitativa los siguientes: alcoholes, ácidos orgánicos, alcanos, alquenos, aromáticos, aldehidos, cetonas, triglicéridos, ácidos grasos, biopolímeros, proteínas, péptidos, aminoácidos, vitaminas, antibióticos, productos farmacéuticos, y sus combinaciones. Ejemplos no limitativos de alcoholes son etanol, metanol, butanol, hexanol, octanol, decanol, dodecanol, 1 ,3-butanediol(1 ,3-diol), propanol, isopropanol, etilenglicol, propanodiol, butanodiol, glicerol, eritritol, xilitol, sorbitol, 1-alcohol, y combinaciones de los mismos. Ejemplos no limitativos de ácidos orgánicos son ácido cítrico, ácido acético, ácido itacónico, ácido láctico, ácido glutámico, ácido succínico, ácido propiónico, ácido 3- hidroxipropiónico, butírico, ácido glucónico, ácido levulínico, beta-cetoácido, beta- cetoalcohol, beta-hidroxiácido y combinaciones de los mismos. Ejemplos no limitativos de cetonas son la acetona; gases como hidrógeno o dióxido de carbono; hidrocarburos como alcanos, alquenos o alquinos; sustancias nitrogenadas como aminas, amida, nitrocompuestos o nitrilos; haluros; aminoácidos como ácido glutámico, ácido aspártico, metionina, lisina, glicina, arginina, treonina, fenilalanina, tirosina, y combinaciones de los mismos; antibióticos como penicilina o tetraciclinas; vitamina como riboflavina, vitamina B12 o betacaroteno; ácidos grasos como ácido dodecanoico, ácidos grasos trans-A2 o ácido palmítico; y otros productos como etileno, glicerol, 1 ,3-propano-diol, betalactano, cefalosporinas, ácidos grasos trans o furano y enzimas industriales.

Se puede producir etanol mediante la degradación enzimática de la biomasa y la conversión de los sacáridos liberados en etanol. Este tipo de etanol se denomina a menudo bioetanol. Se puede usar como un aditivo de combustible o extensor en mezclas de menos del 1 % hasta un 100% (un sustituto del combustible).

En una realización más preferida, el bioproducto es biocombustible. El término "biocombustible", tal como se usa aquí, se refiere a un hidrocarburo, o a una de sus mezclas, que se puede utilizar como combustible y se obtiene utilizando la biomasa fermentable como material de partida. Ejemplos de biocombustibles incluyen, pero no se limitan a, etanol o bioetanol y biodiesel. En una realización más preferida, el biocombustible es bioetanol.

El término "bioetanol" se refiere a un alcohol preparado mediante fermentación, a menudo a partir de biomasa fermentable tal como los hidratos de carbono producidos en cultivos de azúcar o de almidón tales como maíz o caña de azúcar.

Por tanto, en otro aspecto, la presente invención se refiere a un procedimiento para producir azúcares fermentables a partir de biomasa celulósica, en lo sucesivo "primer procedimiento de la invención", que comprende:

a) Incubar biomasa, preferiblemente biomasa pretratada, con la variante de la celulasa de la invención, o con la célula hospedadora de la invención, o con la composición de la invención, y

b) Recuperar los azúcares fermentables obtenidos después de la incubación de la etapa (a). Frecuentemente se requiere un procedimiento de pretratamiento de la biomasa para aumentar el acceso de las enzimas a sus sustratos y la hidrólisis eficaz consiguiente. El pretratamiento utiliza diversas técnicas, que incluyen, pero no se limitan a tratamientos químicos y/o mecánicos, como por ejemplo la explosión de la fibra con amonio, tratamiento con ácido diluido y explosión con vapor a elevadas temperaturas para alterar la estructura de la biomasa celulósica y volver la celulosa más accesible. El uso de la célula hospedadora de la invención o de la composición enzimática de la invención en los procedimientos de la presente invención es ventajoso debido a que no se requieren altas temperaturas en el proceso de pretratamiento de la biomasa. El término "azúcar fermentable" tal como se usa aquí, se refiere a azúcares sencillos, tales como glucosa, xilosa, arabinosa, galactosa, mañosa, ramnosa, sacarosa o fructosa, entre otros.

Otro aspecto descrito en la presente invención se refiere a un procedimiento para producir un bioproducto a partir de biomasa, denominado a partir de ahora "segundo procedimiento de la invención", que comprende:

a) Incubar biomasa, preferiblemente biomasa pretratada, con la célula hospedadora de la invención o con la composición de la invención, b) Fermentar los azúcares fermentables obtenidos después de la etapa de incubación (a) con al menos un microorganismo fermentador, y

c) Recuperar el bioproducto obtenido después de la fermentación de la etapa (b).

Antes (es decir en la etapa (a)) y/o simultáneamente con la fermentación de la etapa (b), la biomasa, preferiblemente biomasa pretratada, se hidroliza para degradar la celulosa y la hemicelulosa en azúcares y/o oligosacáridos. El contenido en sólidos durante la hidrólisis puede estar, pero sin limitación, comprendido entre el 5-40% del peso total, preferiblemente entre el 10-40% del peso total, más preferiblemente entre el 15-25% del peso total. La hidrólisis se realiza como un proceso en el que la biomasa, preferiblemente biomasa pretratada, se incuba con la célula hospedadora de la invención o con la composición de la invención que contiene celulasas y forman así la solución de hidrólisis. El tiempo de proceso adecuado, la temperatura y las condiciones de pH pueden determinarse fácilmente por un experto en la técnica. Preferiblemente, dicha hidrólisis se realiza a una temperatura entre 25 °C y 60 °C, preferiblemente entre 40 °C y 60 °C, específicamente alrededor de 50 °C. El proceso se realiza preferiblemente a un pH en el intervalo de 3-8, preferiblemente pH 4-6, especialmente alrededor de pH 5. Preferiblemente, la hidrólisis se realiza en un tiempo comprendido entre 12 y 144 horas, preferiblemente entre 16 y 120 horas, más preferiblemente entre 24 y 96 horas, incluso más preferiblemente entre 32 y 72 horas.

La hidrólisis (etapa (a)) y la fermentación (etapa (b)) pueden realizarse simultáneamente (proceso SSF) o secuencialmente (proceso SHF). De acuerdo con la invención, la biomasa hidrolizada, y preferiblemente pretratada, se fermenta por al menos un microorganismo fermentador capaz de fermentar azúcares fermentables, tales como glucosa, xilosa, mañosa y galactosa directa o indirectamente en el producto de fermentación deseado. La fermentación se lleva a cabo preferiblemente en un tiempo comprendido entre 8 y 96 horas, preferiblemente entre 12 y 72, más preferiblemente entre 24 y 48 horas. En otra realización preferida, la fermentación se realiza a una temperatura entre 20 °C y 40 °C, preferiblemente de 26 °C a 34 °C, en particular alrededor de 32 °C. En otra realización preferida, el pH es de 3 a 6 unidades, preferiblemente de 4 a 5. Se prefiere para la fermentación etanólica una levadura de la especie Saccharomyces cerevisiae, tanto silvestre como modificada genéticamente. Son preferidas las cepas que sean resistentes a altos niveles de etanol, hasta, por ejemplo, el 5 o el 7% en vol. de etanol o más, tal como el 100% en vol. de etanol. El término "fermentador o fermentación" tal como se usa aquí, se refiere a un proceso de transformación biológica producido por la actividad de algunos microorganismos en los que los azúcares tales como glucosa, fructosa, y sacarosa se convierten en etanol. Los microorganismos usados de este modo son microorganismos fermentadores que tienen capacidad de fermentación, tales como levaduras, preferiblemente S. cerevisiae.

El término "recuperación" tal como se usa aquí, se refiere a la recogida de azúcares fermentables obtenidos después de la incubación de la etapa (a) del primer procedimiento de la invención o del bioproducto obtenido después de la fermentación de la etapa (b) del segundo procedimiento de la invención. Se puede realizar la recuperación mediante cualquier procedimiento conocido en la técnica, incluyendo los mecánicos o los manuales.

En una realización preferida del segundo procedimiento de la invención, el bioproducto es biocombustible, más preferiblemente bioetanol.

A menos que se defina otra cosa, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que el que les daría un experto en la técnica a la que esta invención pertenece. En la práctica de la presente invención se pueden usar procedimientos y materiales similares o equivalentes a los descritos en el presente documento. A lo largo de la descripción y las reivindicaciones la palabra "comprende" y sus variantes no pretenden excluir otras características técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la descripción y en parte de la práctica de la invención. Los siguientes ejemplos y figuras se proporcionan a modo de ilustración, y no se pretende que sean limitativos de la presente invención.

BREVE DESCRIPCIÓN DE LAS FIGURAS

Figura 1. Fotografía de un gel SDS-PAGE donde se observa la pérdida del dominio CBD de la celobiohidrolasa tipo I por procesamiento proteolítico del linker, disminuyendo su tamaño a lo largo del tiempo. (A) Composición enzimática al inicio de la producción de la Cbh1 (72 horas). (B) Composición enzimática al final de la producción de la Cbh1 (120 horas). Se incluye en el primer carril el marcador de peso molecular. Cbhl-CBD(-) se refiere a la Cbh1 que ha perdidio el CBD y Cbh1-CBD(+) se refiere a la enzima Cbh1 intacta.

Figura 2. Gráfica que muestra el rendimiento de una composición enzimática donde la enzima Cbh1 ha perdido el CBD (Cbhl-CBD(-)) frente a otra composición enzimática donde la enzima Cbh1 está intacta (Cbh1-CBD(+)). La caída del rendimiento con la enzima Cbh1 sin CBD es en torno a un 20%.

Figura 3. Esquema del plásmido pBase-5K-4 donde se han clonado las secuencias nucleotídicas que codifican para las variantes de celulasa descritas en la presente invención.

Figura 4. Fotografía de un SDS-PAGE que demuestra la mayor estabilidad de las variantes de Cbh1 de la invención (B y C) frente a la enzima Cbh1 nativa (A). Al final de la producción la celulasa nativa Cbh1 ha perdido su dominio CBD por proteolisis del linker, mientras que las celulasas Cbh1 de la invención (B y C) permanecen intactas. Se incluye en el primer carril el marcador de peso molecular.

Figura 5. Análisis del rendimiento de sacarificación mediante el análisis de la actividad celobiohidrolasa de composiciones enzimáticas obtenidas de cepas de M. thermophila que comprenden las variantes de Cbh1 de SEQ ID NO: 66 y SEQ ID NO: 70 de la invención, respecto a la respectiva cepa de M. thermophila parental que expresa la Cbh1 nativa de SEQ ID NO: 38. El control se reifere a una composición enzimática obtenida de cepa de una cepa de M. thermophila que no expresa Cbhl

EJEMPLOS

A continuación se ilustrará la invención mediante ensayos que pone de manifiesto la efectividad de los objetos de la invención.

Ejemplo 1. Obtención de las variantes de las celulasas de la invención.

Como se ha indicado previamente a lo largo del presente documento, durante el proceso de producción y/o durante la fase de almacenamiento (entre la producción y su uso) y/o durante el proceso de hidrólisis enzimática, la región del linker de las celulasas puede sufrir una proteolisis o procesamiento, lo que provoca una disociación entre el dominio CAD y el dominio CBD. El hecho de que una celulasa pierda el dominio CBD impide un reconocimiento y unión eficiente de la misma a la celulosa, lo que conlleva una pérdida o disminución en el rendimiento de la hidrólisis enzimática. Durante la producción de la composición enzimática generada por Myceliophthora thermophila C1 (Visser et al., 201 1 , Ind. Biotechnol. 7: 214-223) se genera una mezcla enzimática que varía según avanza dicha producción. Como se observa en la Figura 1 , en el caso de la celobiohidrolasa tipo I (Cbh1), la banda correspondiente a la proteína con su dominio CBD desaparece a lo largo del proceso de producción de la composición enzimática. En una fase temprana de la producción (72 horas), la forma de Cbh1 predominante es la que contiene el dominio CBD. A lo largo de la producción, la Cbh1 va sufriendo proteolisis y se disocia del dominio CBD, predominando al final de la producción (120 horas) la forma sin CBD. Adicionalmente, se comparó la liberación de azúcares fermentables de las composiciones enzimáticas que comprenden la enzima Cbh1 con su dominio CBD intacto (carril A, Figura 1) y la composición enzimática que comprende la enzima Cbh1 tras haber perdido el dominio CBD (carril B, Figura 1). Como sustrato para la hidrólisis enzimática se empleó biomasa pretratada de maíz ("pretreated corn stover", o PCS). El pretratamiento se realizó mediante explosión de vapor (Keller et al., 1998, Appl. Biochem. Biotechnol. 70-72: 137-148), y su análisis composicional se efectuó de acuerdo los procedimientos descritos por NREL en "Standard Biomass Analytical Procedures" (http://www.nrel.gov/biomass/analytical_procedures.htmL). Antes de su uso en la hidrólisis, la biomasa fue neutralizada ajustándose a un pH de 5,5. Para el proceso de hidrólisis enzimática se usaron frascos ISO de 100 mi con 20 g de la mezcla de reacción al 20% (p/p) de sólidos totales y suplementada con 12 mg proteína por g de glucano de cada composición enzimática. Los frascos con la mezcla se incubaron durante 72 h a 50 °C con una agitación a 150 rpm en un incubador orbital de 25 mm de diámetro de giro (Infors HT). Una vez realizado el proceso, el contenido de glucosa en las muestras resultantes del hidrolizado (slurry) se analizó con el método GOPOD (K-GLUC Kit, Megazyme). Como se observa en la Figura 2, el rendimiento del procedimiento de liberación de azúcares de la composición enzimática que comprende la enzima Cbh1 sin el dominio CBD (Cbhl-CBD(-)) es un 20% inferior al rendimiento del procedimiento de liberación de azúcares de la composición enzimática que comprende la enzima Cbh1 con su dominio CBD intacto (Cbh1- CBD(+)).

Teniendo en cuenta los resultados anteriores, se procedió a diseñar una celulasa que presentaba la región del linker modificada, respecto a la celulasa parental. A modo de ejemplo y sin ser limitante, se ha tomado como ejemplo para diseñar variantes de celulasas que comprenden los linker descritos en la presente invención y que son más resistentes a la hidrólisis que los linkers nativos de las celulasas, a la celulasa Cbh1 de secuencia nucleotídica SEQ ID NO: 37, que codifica para la celulasa de SEQ ID NO: 38. Por lo tanto, con el objeto de obtener variantes de celulasas más resistentes a la hidrólisis de la rotura del dominio CBD, se partió de la celulasa Cbh1 a la que se le eliminó su linker nativo y se reemplazó por al menos uno de los linker descritos en la presente invención que presentan una mayor resistencia a la hidrólisis que los linker nativos, dando lugar a todas las variantes de la celulasa Cbh1 descritas en la Tabla 2, según comprendan cada uno de los linker aquí descritos. Ejemplo 2. Transformación de M. thermophila con las variantes de la invención: Cada una de las variantes de Cbh1 que comprenden los linker descritos en la presente invención (Tabla 2) fue sintetizada in vitro, eliminándose los sitios de reconocimiento para las principales enzimas de restricción sin alterar su secuencia peptídica. Brevemente, dichas variantes fueron sintetizadas in vitro en el plásmido pBase-5K-4 (Figura 3), que contiene la propia secuencia promotora de la celulasa Cbh1 (Pcbhl), correspondiente a una región de 1796 pb aguas arriba del gen cbhl de M. thermophila (cbhl, NCBI Accession number XP_003660789.1). Este plásmido de expresión también contiene el terminador del gen cbhl que corresponde con una región de 1014pb aguas abajo del gen cbhl. Como marcador de selección contiene el gen pyr4 (NCBI Accession number XP_003660657.1) el cual codifica para una descarboxilasa funcional de orotidina-5 ' -monofosfato, cuya expresión permite la complementación de la auxotrofía de uridina en la correspondiente cepa auxótrofa de M. thermophila C1 (pyr4-). El mapa del vector de expresión pBase-5k-4 se muestra en la Figura 3.

Cada uno de los plásmidos generados que comprenden las secuencias que codifican para las variantes de la enzima Cbhl comprendiendo los linker descritos en la presente invención, fueron transformados y amplificados en células electrocompetentes de XLI BlueMRF de E. coli siguiendo el protocolo descrito por el fabricante (Stratagene).

Cada una de los plásmidos amplificados en E. coli conteniendo las variantes de Cbhl con los linkers descritos en la presente invención, bajo el control del promotor Pcbhl y con el marcador de selección pyr4, fueron transformados en M. thermophila C1 pyr4(-) cbhl{-) (Verdoes et al., 2007, Ind. Biotechnol. 3: 36-47). Se ha usado una cepa delecionada en el gen cbhl (NCBI Accession ni/m£>erXP_003660789.1) con objeto de obtener una composición enzimática que comprenda la variante de Cbhl con los linker descritos en la presente invención, y no comprenda la Cbhl nativa. Las secuencias nucleotídicas que codifican para cada una de las variantes de Cbhl que comprenden los diferentes linker descritos en la presente invención, se introdujeron en la célula huésped M. thermophila usando el método de transformación de protoplastos (US7399627B2). Los transformantes obtenidos fueron plaqueados en placas de agar sin suplementación de uridina. Tras 5 días de incubación a 35°C, se analizaron los transformantes protótrofos obtenidos (que expresan pyr4) en formato de alto rendimiento o high throughput screening (US7794962B2) en placas de 96 pocilios. Aquellos transformantes que presentaban clara expresión de las variantes de linkers de Cbh1 se produjeron a escala matraz (Verdoes et al., 2007, Ind. Biotechnol. 3: 36- 47); Visser et al., 2011 , Ind. Biotechnol. 7: 214-223). Se analizó la presencia de la proteína Cbh1-CBD(+) o Cbhl-CBD(-) en gel SDS-PAGE al final del procedimiento de la producción de las composiciones enzimáticas.

Como se muestra en la Figura 4, algunas de las variantes mostraron mayor resistencia a la proteólisis (Figura 4 carriles B y C) con respecto a la enzima Cbh1 nativa que bajo las mismas condiciones ha perdido su dominio CBD como consecuencia de proteólisis (Figura 4 carril A). La enzima nativa presenta mayor sensibilidad a proteólisis que las variantes de Cbh1 de SEQ ID NO 66 (Figura 4, carril B) y de SEQ ID NO 70 (Figura 4, línea C) que comprenden el linker SEQ ID NO 26 y SEQ ID NO 30 respectivamente, lo que implica una disminución drástica de su actividad celulolítica respecto a las variantes más resistentes descritas en la presente invención, y por tanto, menor rendimiento del proceso de degradación de biomasa.

Resultados similares a los mostrados en la Figura 4 con las variantes Cbh1 de secuencias SEQ ID NO: 66 y 70, se obtuvieron para el resto de variantes de Cbh1 descritas en la presente invención.

Ejemplo 3. Evaluación de las variantes de Cbh1 de SEQ ID NOs: 66 y 70 que comprenden los linkers SEQ ID Nos: 26 y 30 respectivamente, en comparación con la enzima Cbh1 nativa de M. thermophila C1 (SEQ ID NO: 38). Las composiciones enzimáticas que comprenden las variantes de Cbh1 con linker más resistentes a proteólisis, según se describe en la presente invención, y que se han obtenido según se describe en el Ejemplo 2, se analizaron para comprobar que una composición enzimática que comprende dichas variantes de Cbh1 , posee mejor rendimiento de sacarificación con respecto a una composición enzimática que comprende la Cbh1 nativa. Para ello, se midió la actividad celobiohidrolasa de las composiciones enzimáticas nativas y las que contienen las variantes de la invención usando el sustrato Avicel (celulosa microcristalina). Para este ensayo de actividad celobiohidrolasa las mezclas de la reacción enzimática (1 mi volumen final) se prepararon con 200 de tampón acetato sódico (pH 5,0, 200 mM), 10 mg de Avicel, y 50 μg de la composición enzimática. Esta mezcla se incubó a 50 °C durante 120 minutos a 1400 rpm de agitación. La reacción fue detenida incubando la mezcla 10 min a 99 °C. Posteriormente, se procedió al centrifugado de las muestras durante 5 min a 4000xg. Para la medida de la concentración de glucosa producida en la reacción enzimática se empleó el método enzimático GOPOD (Glucosa oxidasa/peroxidasa) (kit GOPOD, Megazyme) según especificaciones del fabricante. Una unidad de actividad de hidrólisis sobre Avicel se definió como la cantidad de enzima equivalente a la liberación de 1 μηιοΙ de celobiosa por minuto. La concentración proteica de las composiciones enzimáticas fue cuantificada mediante el kit BCA AppliChem (Ref. A7787), frente a un patrón de gamma globulina bovina, previo tratamiento de la muestra con el kit "Compat-Able Protein Assay Preparation Reagent Set (Thermo Scientific Ref. 23215)", ambos según especificaciones del fabricante.

Los resultados obtenidos ponen de manifiesto, tal y como se observa en la Figura 5, que las composiciones enzimáticas que comprenden las variantes de Cbh1 con los linkers de la invención, específicamente las variantes Cbh1 de secuencias SEQ ID NO: 66 y 70, muestran un incremento de un 18% en el rendimiento del proceso de degradación de celulosa, respecto al rendimiento obtenido con la composición enzimática que contiene la enzima Cbh1 nativa de SEQ ID NO: 38. Por lo tanto, dichos resultados confirman que una composición enzimática que comprende las variantes de celulasas con los linker descritos en la presente invención muestran una mayor resistencia al procesamiento hidrolítico y a la pérdida de la región CBD y como consecuencia se incrementa el rendimiento y la eficiencia del procedimiento de degradación de la biomasa.




 
Previous Patent: IMPROVED SHOE

Next Patent: ARTIFICIAL CHRISTMAS TREE