Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
PROCESS FOR PRODUCING AT LEAST ONE METABOLITE OF INTEREST BY CONVERSION OF A PENTOSE IN A MICROORGANISM
Document Type and Number:
WIPO Patent Application WO/2016/079440
Kind Code:
A1
Abstract:
The invention relates to a process for producing at least one metabolite of interest by conversion of a pentose in a microorganism, characterized in that said process comprises at least: (i) an operation of culturing a recombinant microorganism expressing a synthetic pathway for pentose assimilation which comprises at least the following steps: a) phosphorylation in position 1 of a pentose chosen from (D)-xylulose and/or (L)-ribulose, b) cleavage of the pentose-1-phosphate obtained at the end of step a), in order to obtain glycolaldehyde and dihydroxyacetone phosphate (DHAP), and (ii) an operation of recovering said at least one metabolite of interest obtained at the end of the culturing operation (i). The invention also relates to an associated microorganism.

Inventors:
WALTHER THOMAS (FR)
CAM YVAN (FR)
FRANCOIS JEAN-MARIE (FR)
ALKIM CEREN (FR)
Application Number:
PCT/FR2015/053138
Publication Date:
May 26, 2016
Filing Date:
November 19, 2015
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
AGRONOMIQUE INST NAT RECH (FR)
INST NAT SCIENCES APPLIQ (FR)
CENTRE NAT RECH SCIENT (FR)
International Classes:
C12P7/18; C12P7/42
Domestic Patent References:
WO2013126721A12013-08-29
WO2010108909A12010-09-30
WO2011130378A12011-10-20
WO2012177983A22012-12-27
WO2006069110A22006-06-29
WO2007140816A12007-12-13
WO2007141336A12007-12-13
WO2010108909A12010-09-30
WO2013126721A12013-08-29
Foreign References:
EP2025759A12009-02-18
EP2025760A12009-02-18
US7445917B22008-11-04
US20090155867A12009-06-18
US20120315682A12012-12-13
Other References:
JOSEFA BADIA ET AL: "Copyright C) 1991, American Society for Microbiology L-Lyxose Metabolism Employs the L-Rhamnose Pathway in Mutant Cells of Escherichia coli Adapted To Grow on L-Lyxose", JOURNAL OF BACTERIOLOGY, vol. 173, no. 16, 1 August 1991 (1991-08-01), pages 5144 - 5150, XP055200009
HUAIWEI LIU ET AL: "Biosynthesis of ethylene glycol in Escherichia coli", APPLIED MICROBIOLOGY AND BIOTECHNOLOGY, vol. 97, no. 8, 1 April 2013 (2013-04-01), pages 3409 - 3417, XP055080314, ISSN: 0175-7598, DOI: 10.1007/s00253-012-4618-7
H. M. JAMES ET AL: "Models for the metabolic production of oxalate from xylitol in humans: A role for fructokinase and aldolase", AUST. J. EXP. BIOL. MED. SCI., vol. 60, 1982, pages 117 - 122, XP002749268
BIOSCI. BIOTECHNOL. BIOCHEM., 2001
LIU H ET AL., APPL. MICROBIOL. BIOTECHNOL, 2012
D. VOET; J.G. VOET: "Biochimie", 2005, DE BOECK & LARCIER
JORGENSEN H ET AL.: "Enzymatic conversion of lignocellulose into fermentable sugars: Challenges and opportunities", BIOFUELS, BIOPROD. BIOREF., vol. 1, 2007, pages 119 - 134
"Escherichia coli and Salmonella: Cellular and Molecular Biology", 1996, AMERICAN SOCIETY FOR MICROBIOLOGY
ASIPU, A.; B. E. HAYWARD; J. O'REILLY; D. T. BONTHRON: "Properties of normal and mutant recombinant human ketohexokinases and implications for the pathogenesis of essential fructosuria", DIABETES, vol. 52, no. 9, 2003, pages 2426 - 32
BABA, T.; T. ARA; M. HASEGAWA; Y. TAKAI; Y. OKUMURA; M. BABA; K. A. DATSENKO; M. TOMITA; B. L. WANNER; H. MORI: "Construction of Escherichia coli K-12 in-frame, single-gene knockout mutants: the Keio collection", MOL SYST BIOL, 2006
BAIS, R.; H. M. JAMES; A. M. ROFE; R. A. CONYERS: "The purification and properties of human liver ketohexokinase. A rôle for ketohexokinase and fructose-bisphosphate aldolase in the metabolic production of oxalate from xylitol.", BIOCHEM J, vol. 230, no. 1, pages 53 - 60, XP055353007, DOI: doi:10.1042/bj2300053
BRAT, D.; E. BOLES; B. WIEDEMANN: "Functional expression of a bacterial xylose isomerase in Saccharomyces cerevisiae", APPL ENVIRON MICROBIOL, vol. 75, no. 8, 2009, pages 2304 - 11, XP009121860, DOI: doi:10.1128/AEM.02522-08
CHEREPANOV, P. P.; W. WACKERNAGEL.: "Gene disruption in Escherichia coli: TcR and KmR cassettes with the option of Flp-catalyzed excision of the antibiotic-resistance determinant.", GENE, vol. 158, no. 1, 1995, pages 9 - 14
DAGERT, M.; S. D. EHRLICH: "Prolonged incubation in calcium chloride improves the compétence of Escherichia coli cells", GENE, vol. 6, no. 1, 1979, pages 23 - 8, XP023545879, DOI: doi:10.1016/0378-1119(79)90082-9
DATSENKO, K. A.; B. L. WANNER: "One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products", PROC NATL ACAD SCI U S A, vol. 97, no. 12, 2000, pages 6640 - 5, XP002210218, DOI: doi:10.1073/pnas.120163297
DAVIS, J. H.; A. J. RUBIN; R. T. SAUER: "Design, construction and characterization of a set of insulated bacterial promoters", NUCLEIC ACIDS RES, vol. 39, no. 3, 2011, pages 1131 - 41
DISCHERT, W.; P. SOUCAILLE.: "Method for producing high amount of glycolic acid by fermentation", GOOGLE PATENTS, 2012
DISCHERT, W.; P. SOUCAILLE: "Method for producing high amount of glycolic acid by fermentation", GOOGLE PATENTS, 2012
DYKXHOORN, D. M.; R. ST PIERRE; T. LINN: "A set of compatible tac promoter expression vectors", GENE, vol. 177, no. 1 -2, 1996, pages 133 - 6, XP004043387, DOI: doi:10.1016/0378-1119(96)00289-2
ELIASSON, A.; C. CHRISTENSSON; C. F. WAHLBOM; B. HAHN-HAGERDAL: "Anaerobic xylose fermentation by recombinant Saccharomyces cerevisiae carrying XYL1, XYL2, and XKS1 in minerai médium chemostat cultures.", APPL ENVIRON MICROBIOL, vol. 66, no. 8, 2000, pages 3381 - 6, XP000973771, DOI: doi:10.1128/AEM.66.8.3381-3386.2000
GIETZ, R. D.; R. A. WOODS: "Transformation of yeast by lithium acetate/single-stranded carrier DNA/polyethylene glycol method", METHODS ENZYMOL, vol. 350, 2002, pages 87 - 96, XP008068319
KLAMT, S.; J. SAEZ-RODRIGUEZ; J. A. LINDQUIST; L. SIMEONI; E. D. GILLES: "A methodology for the structural and functional analysis of signaling and regulatory networks", BMC BIOINFORMATICS, vol. 7, pages 56, XP021013947, DOI: doi:10.1186/1471-2105-7-56
LEE, C.; I. KIM; C. PARK: "Glyoxal detoxification in Escherichia coli K-12 by NADPH dépendent aldo-keto reductases", J MICROBIOL, vol. 51, no. 4, 2013, pages 527 - 30, XP055149649, DOI: doi:10.1007/s12275-013-3087-8
LIU, H.; K. R. RAMOS; K. N. VALDEHUESA; G. M. NISOLA; W. K. LEE; W. J. CHUNG: "Biosynthesis of ethylene glycol in Escherichia coli.", APPL MICROBIOL BIOTECHNOL, vol. 97, no. 8, 2013, pages 3409 - 17, XP055080314, DOI: doi:10.1007/s00253-012-4618-7
SALIS, H. M.: "The ribosome binding site calculator", METHODS ENZYMOL, vol. 498, 2011, pages 19 - 42, XP055515729, DOI: doi:10.1016/B978-0-12-385120-8.00002-4
SOUCAILLE, P.: "Glycolic Acid Production by Fermentation from Renewable Resources", GOOGLE PATENTS, 2009
WINZELER, E. A.; D. D. SHOEMAKER; A. ASTROMOFF; H. LIANG; K. ANDERSON; B. ANDRE; R. BANGHAM; R. BENITO; J. D. BOEKE; H. BUSSEY: "Functional characterization of the S. cerevisiae genome by gene deletion and parallel analysis", SCIENCE, vol. 285, no. 5429, 1999, pages 901 - 6, XP001025980, DOI: doi:10.1126/science.285.5429.901
Attorney, Agent or Firm:
ORSINI, Fabienne et al. (FR)
Download PDF:
Claims:
REVENDICATIONS

1 . Procédé pour la production d'au moins un métabolite d'intérêt par transformation d'un pentose dans un microorganisme, caractérisé en ce que ledit procédé comprend au moins :

(i) une opération de culture d'un microorganisme recombinant exprimant une voie synthétique d'assimilation des pentoses qui comprend au moins les étapes suivantes :

a) phosphorylation en position 1 d'un pentose choisi parmi le (D)-Xylulose et/ou le (L)- Ribulose

b) clivage du pentose-1 -phosphate obtenu à l'issue de l'étape a), pour l'obtention de glycolaldéhyde et de dihydroxyacétone phosphate (DHAP), et

(ii) une opération de récupération dudit au moins un métabolite d'intérêt obtenu à l'issue de l'opération de culture (i).

2. Procédé pour la production d'au moins un métabolite d'intérêt, selon la revendication

1 , caractérisé en ce que :

- l'étape de phosphorylation a) de la voie synthétique d'assimilation des pentoses est catalysée par une enzyme exprimée de façon recombinante choisie parmi le groupe constitué par la kétohexokinase C (KhkC), la rhamnulose kinase (rhaB) et la fuculose kinase (fucK), et/ou

- l'étape de clivage b) de la voie synthétique d'assimilation des pentoses est catalysée par une aldolase choisie parmi le groupe constitué par l'aldolase B (Aldo-B) et la Fructose-1 ,6 bisphosphate aldolase (FbaB).

3. Procédé pour la production d'au moins un métabolite d'intérêt, selon la revendication

2, caractérisé en ce que :

- l'étape a) est catalysée par la kétohexokinase C, et

- l'étape b) est catalysée par l'aldolase B (Aldo-B) et/ou la fructose -1 ,6 bisphosphate aldolase B.

4. Procédé pour la production d'au moins un métabolite d'intérêt, selon l'une des revendications 1 à 3, ledit métabolite d'intérêt étant choisi parmi l'éthylène glycol et/ou l'acide glycolique, caractérisé en ce que la voie synthétique d'assimilation des pentoses comprend en outre les étapes suivantes :

c) réduction du glycolaldéhyde obtenu à l'issue de l'étape b) en éthylène glycol, et/ou

c') oxydation du glycolaldéhyde obtenu à l'issue de l'étape b), en acide glycolique.

5. Procédé pour la production d'au moins un métabolite d'intérêt, selon la revendication 4, pour la production d'éthylène glycol et/ou d'acide glycolique, caractérisé en ce que : - l'étape de réduction c) est catalysée par une glycolaldéhyde réductase choisie dans le groupe constitué par l'aldéhyde réductase (YqhD), la glycérol déshydrogénase (GIdA) et la Propane-1 ,2-diol oxidoréductase (FucO), et/ou

- l'étape d'oxydation c') est catalysée par une glycolaldéhyde déshydrogénase consistant en la lactaldéhyde déshydrogénase (AldA).

6. Procédé pour la production d'au moins un métabolite d'intérêt, selon l'une quelconque des revendications précédentes, caractérisé en ce que le microorganisme est mis en culture sur un milieu carboné contenant du (D)-Xylose et/ou du (L)-Arabinose.

7. Procédé pour la production d'au moins un métabolite d'intérêt, selon la revendication 6, caractérisé en ce que le milieu de culture comprend un hydrolysat de biomasse comprenant de l'hémicellulose.

8. Procédé pour la production d'au moins un métabolite d'intérêt, selon l'une quelconque des revendications précédentes, caractérisé en ce que ladite voie synthétique d'assimilation des pentoses comprend, préalablement à l'étape a) :

- une étape de conversion du (D)-Xylose en (D)-Xylulose et/ou,

- une étape de conversion du (L)-Arabinose en (L)-Ribulose.

9. Procédé pour la production d'au moins un métabolite d'intérêt, selon l'une quelconque des revendications précédentes, caractérisé en ce que le microorganisme recombinant est choisi entre E. coli, S. cerevisiae et Scheffersomyces stipitis.

10. Procédé pour la production d'au moins un métabolite d'intérêt, selon l'une quelconque des revendications précédentes, caractérisé en ce que le microorganisme recombinant consiste en un microorganisme dont les activités (D)-xylulose-5 kinase et/ou (L)- ribulose-5 kinase ont été supprimées.

1 1 . Microorganisme recombinant exprimant une voie synthétique d'assimilation des pentoses et comprenant au moins les acides nucléique codant pour les enzymes suivantes : i) une enzyme apte à phosphoryler en position 1 un pentose choisi parmi le (D)-Xylulose et/ou le (L)-Ribulose.

ii) une enzyme apte à cliver le ou les pentoses- 1 -phosphate obtenus à l'issu de l'étape (i), pour l'obtention de glycolaldéhyde et de dihydroxyacétone phosphate (DHAP),

caractérisé en ce que les activités (D)-xylulose-5 kinase et/ou (L)-ribulose-5 kinase dudit microorganisme ont été supprimées, et/ou le microorganisme est porteur d'au moins une des modifications suivantes : - surexpression d'un gène codant pour une glyoxylate réductase ;

- surexpression d'un gène codant pour une isocitrate lyase accompagné ou non de la délétion de son répresseur transcriptionnel ;

- délétion des gènes codant pour des malate synthases ;

- délétion des gènes codant pour des glyoxylate carboligases ;

- délétion des gènes codant pour des glycolate oxydases et/ou des glycolate déshydrogénases ;

- délétion des gènes codant pour des 2-kéto-4-hydroxyglutarate aldolases, notamment la Entner-Doudouroff Aldolase et pour des phosphogluconate déhydratases ;

- délétion d'un gène codant pour un répresseur des gènes impliqués dans le métabolisme respiratoire, notamment le gène arcA ;

- atténuation et notamment délétion de l'expression de l'isocitrate déhydrogénase ;

- délétion des gènes codants pour des systèmes d'internalisation de l'acide glycolique ;

- atténuation des voies métaboliques qui amènent à la production de produit secondaires comme l'acétate, le lactate ou l'éthanol ;

- surexpression d'au moins un gène codant pour un transporteur des sucres.

12. Microorganisme recombinant, selon la revendication 1 1 , caractérisé en ce qu'il comprend :

- au moins un acide nucléique exogène codant pour la kétohexokinase C et

- au moins un acide nucléique exogène codant pour l'aldolase B.

13. Microorganisme selon l'une des revendications 1 1 ou 12 comprenant en outre au moins l'une des modifications suivantes :

- surexpression du gène codant pour la glycolaldéhyde réductase principale ;

- délétion du gène codant pour la glycolaldéhyde déshydrogénase.

14. Microorganisme selon l'une des revendications 1 1 ou 12 comprenant en outre au moins l'une des modifications suivantes :

- surexpression du gène codant pour la glycolaldéhyde déshydrogénase;

- inactivation d'au moins un des gènes codant pour au moins l'une des sous-unités de la glycolate oxydase.

15. Microorganisme selon la revendication 14 comprenant les modifications suivantes :

- surexpression d'un gène codant pour une glyoxylate réductase ;

- surexpression d'un gène codant pour une isocitrate lyase accompagné ou non de la délétion de son répresseur transcriptionnel ; - délétion des gènes codant pour des malate synthases ;

- délétion des gènes codant pour des glyoxylate carboligases ;

- délétion des gènes codant pour des glycolates oxydases et/ou des glycolates déshydrogénases ;

- délétion des gènes codant pour des 2-kéto-4-hydroxyglutarate aldolases, notamment la Entner-Doudouroff Aldolase et pour des phosphogluconate déhydratases;

- délétion d'un gène codant pour un répresseur des gènes impliqués dans le métabolisme respiratoire, notamment le gène arcA ;

- atténuation et notamment délétion de l'expression de l'isocitrate déshydrogénase ;

- éventuellement la surexpression d'un gène codant pour un transporteur des sucres.

16. Microorganisme selon la revendication 15, comprenant les modifications suivantes :

- la surexpression du gène aldA codant pour une glycolaldéhyde déshydrogénase ;

- la surexpression du gène ghrA

- la surexpression du gène aceA ;

- la délétion du gène icIR ;

- la délétion du gène gel ;

- la délétion des gènes aceB et glcB

- la délétion d'au moins un gène choisi parmi glcD, glcE, glcF ou glcG;

- la délétion des gènes edd-eda ;

- la délétion du gène arcA ;

- la délétion du gène icd ;

- la surexpression du gène galP

Description:
Procédé de production d'au moins un métabolite d'intérêt par transformation d'un pentose dans un microorganisme

DOMAINE DE L'INVENTION

La présente invention se rapporte à un procédé de production d'au moins un métabolite d'intérêt dans un microorganisme. Elle fournit plus particulièrement un procédé de biosynthèse de l'éthylène glycol et/ou de l'acide glycolique dans un microorganisme exprimant une voie métabolique artificielle/synthétique d'assimilation des pentoses provenant avantageusement d'une source carbonée renouvelable.

ETAT DE LA TECHNIQUE

L'éthylène glycol (EG) et l'acide glycolique (AG) sont des composés utilisés dans un large spectre d'applications industrielles dans l'industrie pétrochimique, en tant que précurseurs de polymères à base d'EG, comme le polyéthylène téréphtalate (PET) ou à base d'AG comme certaines résines thermoplastiques, mais aussi en tant que refroidissant dans les antigel pour automobiles pour l'EG ou, pour l'AG, dans l'industrie textile, dans l'industrie des huiles et gaz ainsi que dans un grand nombre de produits de beauté. Ces composés sont encore largement produits de façon pétrochimique. Néanmoins, l'ingénierie métabolique représente un secteur en fort développement depuis plus de 15 ans. Ce procédé comprend la conception de voies de biosynthèses artificielles et/ou l'optimisation de voies naturelles dans un organisme hôte et implique le transfert, l'expression et le couplage fonctionnel de multiples étapes enzymatiques au sein dudit organisme, pour permettre la production de molécules d'intérêt. La conception de voies de biosynthèses totalement artificielles dans le microorganisme hôte permet plus particulièrement de constituer un ensemble métabolique autonome de production de molécules d'intérêt. Ces méthodes de production présentent l'avantage d'utiliser, en tant que substrat, une source carbonée renouvelable, et représentent dorénavant une alternative réelle aux sources d'énergie fossiles. A cet égard, différentes voies métaboliques ont été décrites pour la bioproduction d'EG. Elles impliquent en particuliers des intermédiaires de la glycolyse. La société Genomatica a notamment décrit dans ses demandes de brevets WO2011130378 et WO2012177983 des voies métaboliques, principalement anaérobies, de synthèse de l'EG à partir de la sérine, 3-phosphohydroxypyruvate, du 3-phosphoglycérate ou du glyoxylate. Des techniques pour la bioproduction d'AG ont également été décrites. Ainsi, Mitsui Chemicals Inc. a décrit une méthode utilisant un microorganisme pour produire des acides hydrocarboxyliques à partir d'un alcool polyhydrique aliphatique ayant un groupe hydroxyle à son extrémité (EP 2 025 759 et EP 2 025 760). Il s'agit d'une méthode de . bioconversion, comme celle décrite par Michihiko Kataoka dans un article sur la production d'AG, utilisant des microorganismes oxydant l'éthylène (Biosci. Biotechnol. Biochem., 2001 ). L'AG peut également être produit par bioconversion à partir du glyconitrile, en utilisant des nitrilases mutantes ayant une activité nitrilase augmentée, comme décrit par Dupont de Nemours dans les demandes WO2006/069110 et US7,445,917.

FE ILLE DE REMPLACEMENT RE LE 2 La biomasse lignocellulosique constitue une source de carbone durable et une alternative possible aux sources de carbone fossile. Elle génère un intérêt grandissant pour la biosynthèse de métabolites d'intérêt industriel. Dans ces matériaux carbonés, le D-xylose représente le deuxième sucre le plus abondant après le glucose. Or, les microorganismes n'utilisent pas préférentiellement les pentoses et lorsqu'ils le font, les rendements sont extrêmement faibles. Le développement de voies métaboliques assimilant ce sucre constitue donc un axe important de recherche pour l'industrie.

A l'heure actuelle, les principales sources d'utilisation des pentoses pour la production d'EG ou d'AG par des microorganismes, s'appuient sur l'utilisation de voies naturelles, optimisées pour la production de molécules d'intérêts et/ou sur l'ajout d'enzymes pour utiliser les produits de ces voies naturelles.

Ainsi une méthode de production biologique d'AG en optimisant les voies naturelles d'assimilation des pentoses est décrite dans les demandes WO2007140816 et WO2007141336 déposées par Metabolic Explorer. Ces demandes décrivent des organismes génétiquement modifiés à différents niveaux pour augmenter le flux de la voie glyoxylate, augmenter la conversion de glyoxylate en glycolate et/ou réduire le métabolisme du glycolate et de son intermédiaire, le glyoxylate. Une demande ultérieure de Metabolic Explorer (WO2010108909) décrit la possibilité d'agir en outre, pour optimiser la production d'AG, sur les voies de production du lactate (en atténuant les gènes codant pour la méthylglyoxal synthase et la D- lactate déshydrogénase), sur la transition du métabolisme aérobique/anaérobique en atténuant le gène ArcA régulant le contrôle de la voie respiratoire aérobie et/ou en atténuant les gènes codant pour des protéines important le glycolate.

Plus récemment des voies métaboliques de synthèse d'EG basées sur des voies métaboliques synthétiques d'assimilation des pentoses ont été élaborées. Ainsi Liu H et al. (Appl. Microbiol. Biotechnol, 2012, PMID :23233208), ont décrit des souches E. coli exprimant une voie métabolique de synthèse de l'éthylène glycol à partir de D-xylose et impliquant les enzymes (D)-xylose-déshydrogénase, (D)-xylonic-déshydratase, 2-déhydro-3déoxy-D- pentonate aldolase et glycolaldéhyde réductase. Néanmoins, les rendements en EG obtenus par cette méthode, de l'ordre de 275 mg par gramme de xylose, peuvent être améliorés.

Le Massachusetts Institute of Technology (MIT) a également, décrit dans la demande WO2013126721 , une voie métabolique artificielle de production d'EG à partir de pentose. Cette voie implique la phosphorylation en position 1 du cycle du (D)-Ribulose ou du (L)-xylulose. Une telle voie nécessite cependant, pour l'assimilation des pentoses les plus abondants comme le (D)-Xylose et le (L)-Arabinose, l'expression de plusieurs isomérases et épimérases qui permettent la conversion du D-xylose en (D)-Xylulose puis en (D)-Ribulose et la conversion du (L)-Arabinose en (L)-Ribulose puis en (L)-Xylulose.

Il existe donc un besoin dans l'état de la technique pour de nouveaux procédés performants de production de métabolites d'intérêt par transformation de pentoses, notamment d'EG et/ou d'AG, avantageusement à partir de sources carbonées renouvelables et plus particulièrement basées sur l'assimilation directe des pentoses les plus abondants dans ces ressources naturelles comme le (D)-Xylose et le (L)-Arabinose.

RESUME DE L'INVENTION

L'invention décrite dans la présente demande répond aux objectifs techniques mentionnés ci-dessus. Elle se rapporte à un procédé de transformation d'au moins un pentose dans un microorganisme pour la production d'au moins un métabolite d'intérêt, par assimilation dudit au moins un pentose dans un microorganisme. Elle fournit plus particulièrement un procédé de biosynthèse simple et économique pour produire de façon autonome, dans un microorganisme, un métabolite d'intérêt et notamment de l'éthylène glycol et/ou de l'acide glycolique, à partir d'une source carbonée renouvelable comme par exemple la lignocellulose et en particulier l'hémicellulose.

L'utilisation d'un tel substrat carboné renouvelable fournit une alternative durable à la production de métabolites d'intérêt (comme l'éthylène glycol et l'acide glycolique), qui sont des composés à haute valeur ajoutée pour l'industrie pétrochimique, et restent à ce jour largement produits par voie pétrochimique.

La nouvelle voie d'assimilation des pentoses décrite dans l'invention constitue une voie qui est parallèle aux voies naturelles d'assimilation des pentoses et qui n'existe pas à l'état naturel. Elle est ainsi largement indépendante des contraintes de régulation régissant les voies naturelles des cellules hôtes. Elle permet ainsi de s'affranchir des voies naturelles et de leurs régulations, pour produire des métabolites d'intérêts, comme l'éthylène glycol et/ou l'acide glycolique.

Une telle propriété permet sa portabilité de façon simplifiée vers un large spectre de microorganisme hôtes puisque leur métabolisme endogène n'interfère pas avec la voie synthétique de l'invention.

En outre, les calculs sur les rendements théoriques de la voie synthétique d'assimilation des pentoses décrite dans la présente demande, pour la production d'éthylène glycol et d'acide glycolique, permettent d'estimer une amélioration importante des rendements par rapport aux procédés de biosynthèse basés sur l'optimisation de voies naturelles et/ou une simplification de la mise en œuvre et de la production.

Le procédé de l'invention est ainsi caractérisé en ce qu'il comprend les étapes suivantes:

(i) une opération de culture d'un microorganisme recombinant exprimant une voie synthétique d'assimilation des pentoses qui comprend au moins les étapes réactionnelles suivantes :

a) phosphorylation en position 1 d'un pentose choisi parmi le (D)-Xylulose et/ou le (L)-Ribulose b) clivage du pentose-1 -phosphate obtenu à l'issue de l'étape a), pour l'obtention de glycolaldéhyde et de dihydroxyacétone phosphate (DHAP), et

(ii) une opération de récupération d'au moins métabolite d'intérêt obtenu à l'issu de l'opération de culture (i).

De préférence, l'étape a) de la voie synthétique d'assimilation des pentoses peut être catalysée par une enzyme exprimée de façon recombinante choisie parmi le groupe constitué par la kétohexokinase C (Khk-C), la rhamnulose kinase (rhaB) et la fuculose kinase (fucK).

De préférence également, l'étape b) est catalysée par une aldolase, de préférence de classe I. Une aldolase de classe I selon l'invention est choisie typiquement parmi le groupe constitué par l'aldolase B (Aldo-B) et la Fructose-1 ,6 bisPphosphate aldolase (fructose 1 ,6 bP aldolase ou FbaB).

Selon un mode de réalisation le procédé de production est caractérisé en ce que :

- l'étape a) est catalysée par la KhkC, et

- l'étape b) est catalysée par l'aldolase B (Aldo-B) et/ou la fructose -1 ,6bP aldolase

(FbaB)

Un mode particulier de réalisation du procédé de l'invention permet d'obtenir de l'éthylène glycol (EG) et/ou de l'acide glycolique (AG).

Dans un tel procédé, la voie synthétique d'assimilation des pentoses comprend en outre les étapes suivantes :

c) réduction du glycolaldéhyde obtenu à l'issue de l'étape b) en éthylène glycol, et/ou c') oxydation du glycolaldéhyde obtenu à l'issue de l'étape b), en acide glycolique.

Les modes de réalisation décrits ci-après peuvent être combinés entre eux, sauf précision contraire dans le procédé de l'invention.

L'étape c) peut être catalysée par une glycolaldéhyde réductasenotamment choisie dans le groupe constitué par: l'aldéhyde réductase (YqhD), la glycérol déhydrogénase (GIdA) et la propane-1 ,2-diol oxidoréductase (FucO).

L'étape c') peut être catalysée par une glycolaldéhyde déhydrogénase, notamment la lactaldéhyde déhydrogénase (AldA).

Dans un procédé de l'invention le microorganisme est préférentiellement mis en culture sur un milieu carboné contenant du (D)-Xylose et/ou du (L)-Arabinose.

Dans un mode de réalisation préféré du procédé de l'invention, le milieu de culture comprend un hydrolysat de biomasse comprenant de l'hémicellulose.

Typiquement, la voie synthétique d'assimilation des pentoses du procédé selon l'invention comprend, préalablement à l'étape a) au moins une des étapes suivantes :

- une étape de transport du (D)-xylose et/ou (L)-arabinose dans le microorganisme ;

- une étape de conversion du (D)-Xylose en (D)-Xylulose, et/ou

- une étape de conversion du (L)-Arabinose en (L)-Ribulose. La conversion du (D)-Xylose en (D)-Xylulose peut être catalysée par une (D)-Xylose isomérase et/ou par l'action d'une (D)-xylose réductase et d'une xylitol déshydrogénase.

La conversion du (L)-Arabinose en (L)-Ribulose peut être catalysée par une (L)- arabinose isomérase et/ou par l'action d'une (L)-arabinose réductase et d'une arabitol déshydrogénase.

Selon le procédé de production selon l'invention le microorganisme recombinant peut être une bactérie de préférence choisie parmi le groupe constitué par Enterobacteriaceae, Clostridiaceae, Bacillaceae, Streptomycetaceae, Streptococcaceae, Methylobacteriacae, et Corynebacteriaceae, de préférence Escherichia coli, Bacillus subtilis, Corynebacterium glutamicum, Clostridium acetobutylicum, Methylobacterium extorquens, ou Lactococcus lactis. Le microorganisme peut également être une levure de préférence choisie parmi des Saccharomycetaceae, Pichiaceae, et Schizosaccharomycetaceae, de préférence Saccharomyces cerevisiae, Schizosaccharomyces pombe, Kluyveromyces lactis, Kluyveromyces marxianus, Pichia jadinii, Scheffersomyces stipitis, or Pichia pastoris. Le microorganisme de l'invention peut également être un champignon, de préférence choisi parmi le groupe constitué par Pénicillium, Aspergillus, Chrysosporium ou Trichoderma.

De préférence, les activités (D)-Xylulose-5 kinase et/ou (L)-Ribulose-5 kinase du microorganisme utilisé dans le procédé de l'invention, ont été supprimées.

L'invention se rapporte également à un microorganisme recombinant qui exprime une voie synthétique d'assimilation des pentoses comprenant au moins les acides nucléique codant pour les enzymes suivantes :

i) une enzyme apte à phosphoryler en position 1 les pentoses choisis parmi le (D)-

Xylulose et/ou le (L)-Ribulose.

ii) Une enzyme apte à cliver le dit pentose phosphorylé en position 1 en glycolaldéhyde et

DHAP,

Avantageusement, les voies naturelles d'assimilation des pentoses d'un tel microorganisme ont été supprimées.

Généralement un microorganisme exprimant la voie synthétique d'assimilation de l'invention est en outre caractérisé en ce que les activités (D)-xylulose-5 kinase et/ou (L)- ribulose-5 kinase ont été supprimées, et/ou en ce qu'il porte au moins une des modifications suivantes :

- surexpression d'un gène codant pour une glyoxylate réductase ;

- surexpression d'un gène codant pour une isocitrate lyase ;

- délétion des gènes codant pour des malate synthases ;

- délétion des gènes codant pour des glyoxylate carboligases;

- délétion des gènes codant pour des gènes codant pour des glycolate oxydases et/ou des glycolates déshydrogénases - délétion des gènes codant pour des 2-kéto-4-hydroxyglutarate aldolases, notamment la Entner-Doudouroff Aldolase et/ou des phosphogluconate déhydratases;

- délétion d'un gène répresseur de la réponse aérobie, notamment le gène arcA ;

- atténuation et notamment délétion de l'expression de l'isocitrate déhydrogénase ;

- délétion des gènes codants pour des systèmes d'internalisation de l'acide glycolique ;

- atténuation des voies métaboliques qui amènent à la production de produit secondaires comme l'acétate, le lactate ou l'éthanol ;

- surexpression d'au moins un gène codant pour un transporteur des sucres.

De préférence, le microorganisme recombinant comprend :

- au moins un acide nucléique exogène codant pour la kétohexokinase C et

- au moins un acide nucléique exogène codant pour l'aldolase B.

Avantageusement, ledit microorganisme peut comprendre les modifications suivantes :

- surexpression du gène codant pour la glycolaldéhyde réductase principale ;

- délétion du gène codant pour la glycolaldéhyde déshydrogénase.

En variante, le microorganisme peut comprendre au moins l'une des modifications suivantes pour optimiser la production d'acide glycolique :

- surexpression du gène codant pour la glycolaldéhyde déshydrogénase;

- délétion d'au moins un des gènes codant pour au moins l'une des sous-unités de la glycolate oxydase.

Typiquement un microorganisme adapté pour optimiser la production d'acide glycolique comprend les modifications suivantes :

- surexpression d'un gène codant pour une glyoxylate réductase ;

- surexpression d'un gène codant pour une isocitrate lyase, accompagné ou non de la délétion de son répresseur transcriptionnel ;

- délétion des gènes codant pour des malate synthases ;

- délétion des gènes codant pour des glyoxylate carboligases

- délétion des gènes codant pour des glycolate oxydases et/ou des glycolate

déshydrogénases ;

- délétion des gènes codant pour des 2-kéto-4-hydroxyglutarate aldolases, notamment la Entner-Doudouroff Aldolase et/ou des phosphogluconate déhydratases;

- délétion d'un gène codant pour un répresseur des gènes impliqués dans le métabolisme respiratoire, notamment le gène arcA ;

- atténuation et notamment délétion de l'expression de l'isocitrate déhydrogénase ;

- éventuellement la surexpression d'un gène codant pour un transporteur des sucres. De préférence encore, notamment dans le cas où le microorganisme recombinant pour la production de l'acide glycolique est Escherichia coli, le microorganisme comprend les modifications suivantes : - la surexpression du gène aldA codant pour une glycolaldéhyde déshydrogénase ;

- la surexpression du gène ghrA

- la surexpression du gène aceA éventuellement accompagné de la délétion du gène icIR codant pour un répresseur transcriptionnel de la voie du glyoxylate ;

- la délétion des gènes aceB et glcB

- la délétion d'au moins un des gènes glcDEFG ;

- la délétion du gène glc ;

- la délétion des gènes edd-eda ;

- la délétion du gène arcA ;

- la délétion du gène icd ;

- la surexpression du gène galP

FIGURES

Figure 1 . Voies naturelles et voies synthétiques d'assimilation du (D)-xylose et du (L)- arabinose. Les réactions catalysées par les enzymes naturelles sont représentées en pointillées. Les réactions catalysées par les enzymes synthétiques sont représentées en traits pleins. (1 ) (D)-xylose isomerase, (2) (D)-xylulose-l kinase, (3)(D)- xylulose-1 -phosphate aldolase, (4) glycolaldehyde dehydrogenase, (5) glycolaldehyde reductase, (6) (L)-arabinose isomerase, (7) (L)-ribulose-l kinase, (8) (L)-ribulose-l -phosphate aldolase. Le nom des gènes sous les réactions correspondent aux gènes d 'Escherichia coli codant pour l'enzyme avec l'activité correspondante.

Figure 2. Synthèse in vitro d'éthylène glycol par la voie synthétique d'assimilation du (D)- xylose. Chromatogrammes HPLC de (A) une solution à 10 mM d'éthylène glycol et en (B) d'un mélange réactionnel composé d'une (D)-xylulose-l kinase (Khk-C, 0,005 Unité/ml ), (D)- xylulose-1 -phosphate aldolase (AldoB, 1 Unité/ml (Sigma-Aldrich-A6338)) et d'une glycolaldehyde reductase (GldA, 1 Unité/ml (Sigma-aldrich G3512-250U)) ou en (C) d'une (D)- xylulose-1 kinase (Khk-C, 0,005 Unité/ml) ) et d'une glycolaldehyde reductase (GldA, 1 Unité/ml (Sigma-aldrich G3512-250U)). Les enzymes ont été incubées pendant 3 h à 37 °C dans un tampon de réaction Hépès contenant 100 mM Hepes ; 85 mM KCL ; 7,5 mM MgCI 2 ) à pH = 7 ; 2 mM ATP ; 5 mM ZnCI 2 ; 0,4 mM NADH. Les réactions ont été déclenchées par l'ajout de 5 mM de (D)-xylulose.

Légende : Intensité (ordonnée) en fonction du temps en minutes (abscisse)

Figure 3. Synthèse in vitro d'éthylène glycol par la voie synthétique d'assimilation du (L)- arabinose. Chromatogrammes HPLC de (A) une solution à 1 mM d'éthylène glycol et en (B) d'un mélange réactionnel composé d'une (L)-ribulose-l kinase, (L)-ribulose-l -phosphate aldolase et d'une glycolaldehyde reductase. Les enzymes ont été incubées pendant 3 h à 37 °C dans un tampon de réaction Hépès contenant 55 mM Hepes ; 45 mM KCL ; 4 mM MgCI 2 ) à pH = 7 ; 4 mM ATP ; 0,4 mM NADH. Les réactions sont déclenchées par l'ajout de 20 mM de (L)- ribulose.

Légende : Intensité (ordonnée) en fonction du temps en minutes (abscisse)

Figure 4. Croissance de souches d'E. coli en milieu minimum contenant du (D)-xylose

Légende : DO à 600 nm (ordonnée) en fonction du temps en minutes (abscisse)

Figure 5. Suivi de croissance et de production de métabolites sur xylose d'une souche de E coli MG1655 AxylB pEXT20 khk-C-aldoB.

Légende : DO à 600 nm (ordonnée à gauche) et xylose en mM, éthylène glycol en mM et acide glycolique en mM (ordonnée à droite) en fonction du temps en heures (abscisse)

Figure 6. Production d'éthylène glycol (en mM sur l'ordonnée) par des mutants de glycolaldéhyde réductases candidates après incubation pendent 12 h en présence de 10 mM glycolaldéhyde.

Figure 7. Optimisation de la production d'éthylène glycol dans différents mutants selon l'invention exprimée en rendement en mol/mol de xylose (en ordonnée) via la voie métabolique synthétique d'assimilation du (D)-xylose.

Figure 8. Optimisation de la production d'acide glycolique dans différents mutants selon l'invention exprimée en rendement en mol/mol de xylose (en ordonnée) via la voie métabolique synthétique d'assimilation du (D)-xylose.

Figure 9. Croissance de la souche 905 en milieu minéral en présence de glucose et (D)-xylose. Légende : DO à 600nm (ordonnée à gauche) et glucose, xylose, acide glycolique et acétate en mM en mM (ordonnée à droite) en fonction du temps en heures (abscisse).

Figure 10. Croissance de la souche 979 en milieu minéral en présence de glucose et (D)-xylose. . Légende : DO à 600nm (ordonnée à gauche) et glucose, xylose, acide glycolique et acétate en mM en mM (ordonnée à droite) en fonction du temps en heures (abscisse).

Figure 1 1 . Croissance en milieu minéral en présence de xylose comme seule source de carbone de souches CEN.PK-2-1 . Légende : DO à 600nm (ordonnée à droite) et xylose en mM en mM (ordonnée à gauche) en fonction du temps en heures (abscisse).

Figure 12. Croissance en milieu minéral et xylose comme seule source de carbone de souches TMB3001 . Légende : DO à 600nm en fonction du temps en heures.

Figure 13. Croissance en milieu minéral M9 et (L)-arabinose de souches AaraB avec ou sans voie synthétique. Légende : DO à 600nm en fonction du temps en heures.

DEFINITIONS:

Sauf indication particulière, les termes techniques et scientifiques employés dans la présente demande ont la signification usuelle, entendue par l'homme du métier apte à mettre en œuvre l'invention.

Sauf précision contraire également, les différents modes de réalisation décrits ci-après peuvent être combinés entre eux dans la mise en œuvre de l'invention. Par « voie d'assimilation des pentoses », on entend selon l'invention, une voie métabolique, c'est à dire un ensemble de réactions chimiques se déroulant dans le microorganisme, catalysées par une série d'enzymes qui agissent de manière séquentielle, utilisant les pentoses comme substrat initial et aboutissant à leur transformation pour la formation des métabolites d'intérêts.

Par voie naturelle d'assimilation des pentoses, on entend l'assimilation des pentoses impliquant leur phosphorylation en position 5, puis leur utilisation dans la voie métabolique dite des pentoses phosphates, qui existe de façon naturelle dans la plupart des cellules eucaryotes et procaryotes. Typiquement, le (L)-arabinose est isomérisé en (L)-ribulose, qui est alors phosphorylé en position 5. Le (L)-ribulose-5-phosphate obtenu est épimérisé sur le carbone C3 pour produire du (D)-xylulose-5-phosphate, substrat de la voie des pentoses phosphate.

L'expression « voie synthétique » ou « voie métabolique synthétique » signifie selon l'invention, que ladite voie métabolique n'est pas mise en œuvre naturellement par le microorganisme. Cette condition est typiquement respectée lorsqu'au moins une des enzymes dudit microorganisme catalysant au moins une des étapes a) ou b) de la voie métabolique de l'invention n'est pas exprimée naturellement ou lorsque ladite au moins une enzyme lorsqu'elle est exprimée ne catalyse pas ladite au moins une étape a) ou b).

A titre d'exemples, (i) la voie métabolique impliquant la phosphorylation en position 1 d'un pentose choisi parmi le (D)-xylulose et le (L)-Ribulose, par la Khk-C d'origine humaine dans une cellule non humaine et typiquement dans un microorganisme, (ii) la voie métabolique impliquant la phosphorylation en position 1 d'un pentose choisi parmi le (D)-xylulose et le (L)- Ribulose, par la rhamnulose kinase RhaB dans un microorganisme et (iii) la voie métabolique impliquant la phosphorylation en position 1 d'un pentose choisi parmi le (D)-xylulose et le (L)- Ribulose, par la fuculose kinase FucK dans un microorganisme, sont des voies synthétiques selon l'invention.

L'expression des enzymes RhaB et FucK chez E coli dépend de la présence de leur substrat naturel, soit respectivement le (L)-rhamnulose et le (L)-fucose. En l'absence de leur substrat naturel (ou lorsque celui est présent dans une concentration trop faible), l'expression de ces enzymes dans un microorganisme et notamment chez E. coli peut être obtenue de façon recombinante sous le contrôle d'un promoteur de façon inductible ou constitutive.

Le terme « transformation « ou « transfection » se réfère à l'acquisition de nouveaux gènes fonctionnels dans une cellule, après l'incorporation d'acides nucléiques exogènes.

Le terme « modification » ou « modifier » s'agissant du niveau de protéine ou d'activité enzymatique produit par une cellule hôte se réfère au contrôle des niveaux de protéine ou d'activité enzymatique produite durant la culture, de sorte que ces niveaux soient augmentés ou diminués comme souhaité.

Le terme « modifié », s'agissant d'un acide nucléique ou d'un polynucléotide signifie que l'acide nucléique a été modifié par rapport à la version sauvage contenue dans la cellule hôte, notamment par une mutation de type substitution, insertion, délétion d'une partie ou de la totalité dudit acide nucléique, ou que ledit acide nucléique a été lié de façon fonctionnelle à une région de contrôle de la transcription.

Par « gène », on entend selon l'invention, un segment d'ADN impliqué dans le codage d'ARN ribosomiques, d'ARN régulateurs, d'ARN de transfert, de séquences régulatrices (comprenant typiquement une région promoteur) liées de façon fonctionnelles à l'expression d'un peptide, d'un polypeptide ou d'une protéine, incluant les régions codantes (transcrites en ARN messager) et non codantes précédant ou terminant la région codante ainsi que les introns (régions non codantes séparant les régions codantes ou exons).

Le terme « lié de façon fonctionnelle » se rapporte à une juxtaposition d'éléments de telle sorte que leur disposition leur permette d'être fonctionnellement liés. Une séquence régulatrice, contenant typiquement une région promoteur est fonctionnellement liée à une région codante lorsqu'elle contrôle la transcription de la région codante, et un site de liaison d'un ribosome est fonctionnellement lié à une région codante lorsqu'il est positionné de façon à permettre la translation de l'ARNm.

Le terme « inactivation », ou « suppression » ou « atténuation » se rapporte à l'expression diminuée ou réduite ou significativement réduite d'un gène ou à l'activité diminuée ou réduite d'une protéine, ou du produit d'un gène, typiquement d'une enzyme. Différentes méthodes connues de l'homme du métier peuvent être employées à cette fin, comme :

- l'introduction d'une mutation dans le gène résultant en une expression réduite du gène ou en l'expression d'une protéine dont l'activité est réduite,

- le remplacement du promoteur naturel par un promoteur peu actif résultant en une faible expression du gène,

- l'utilisation d'élément déstabilisant l'ARMm correspondant à la protéine, ou

- la délétion du gène.

Typiquement, l'atténuation d'un gène ou d'une protéine est définie par une activité de la protéine exprimée par ledit gène diminuée d'au moins 50 %, de préférence d'au moins 60 %.

L'inactivation ou la délétion ou la suppression d'un gène ou d'une protéine est définie par une activité résiduelle de la protéine produit dudit gène inférieure à 20 %, notamment inférieure à 10 %, notamment inférieure à 5%.

Le terme « expression » correspond à la transcription et à la translation d'un gène vers une protéine, produit dudit gène.

Le terme « surexpression » correspond à une expression augmentée vis-à-vis de l'expression naturelle dudit gène dans la même cellule hôte. Typiquement la surexpression d'une protéine est définie par une activité d'au moins 200 % de ladite protéine par rapport à son expression naturelle dans la cellule hôte.

La surexpression d'une protéine peut être obtenue selon différentes technique connues de l'homme du métier, comme : - la mutation d'une protéine, visant à obtenir une forme plus active ou résistante à l'inhibition,

- l'augmentation de l'expression du gène codant pour ladite protéine (par exemple par l'introduction d'un promoteur spécifique régulant l'expression du gène),

- l'addition de multiples copies du gène dans la cellule hôte, etc.

Des cellules hôtes compatibles avec l'invention peuvent exprimer une copie endogène d'un ou plusieurs gènes codant pour une protéine d'intérêt selon l'invention, ainsi qu'éventuellement une copie recombinante dudit gène.

Un acide nucléique codant pour une enzyme associée à la présente invention peut être introduite dans une cellule hôte selon toute technique standard connue de l'homme du métier. A titre d'exemple, les acides nucléiques peuvent être introduits par transformation (chimique ou électroporation), transfection, infection, transduction, etc.

Les gènes codant pour des protéines associées à l'invention peuvent être exprimés de façon extra-chromosomique dans un vecteur d'expression recombinant ou peuvent être intégré au sein des chromosomes.

On entend par « vecteur » selon l'invention, un acide nucléique au sein duquel est insérée une séquence d'intérêt, par restriction et ligation de façon à être liée de façon opérante à des séquences de régulation, pour l'expression en tant que transcrit d'ARNm dans une cellule hôte. Les vecteurs sont composés d'ARN ou de préférence d'ADN et incluent de façon non limitative les plasmides, phagemides, génomes viraux, bactériophages et chromosomes bactériens.

Un vecteur selon l'invention peut comprendre une ou plusieurs séquences marqueurs pour l'identification des cellules transformées avec ledit vecteur. De tels marqueurs incluent par exemple des gènes codant pour des protéines augmentant ou diminuant la résistance ou la sensibilité à des composés antibiotiques, des gènes codant pour des enzymes dont l'activité est détectable par des essais standards (par exemple, luciférase, galactosidase, phosphatase alcaline, etc.) ou des gènes modifiant le phénotype des cellules transformées (par exemple codant pour la GFP, i.e. : « green fluorescent protein »).

Les séquences régulatrices (promoteurs) utilisées dans l'expression des protéines recombinantes de l'invention, peuvent être des séquences régulatrices endogènes (c'est-à-dire le promoteur natif du gène auquel il est associé) ou exogènes. Le promoteur peut être inductible ou constitutif.

Par « cellule hôte », ou microorganisme « hôte », on entend tout type de cellule susceptible de subir une transformation, transfection, transduction, etc., avec une construction d'acide nucléique ou un vecteur d'expression comprenant un ou plusieurs polynucléotides, en particulier un ou plusieurs polynucléotide codant pour des enzymes décrites dans la demande.

Les kinases sont des enzymes du groupe des transférases catalysant les réactions de phosphorylation par l'ajout d'un ion phosphate à une molécule cible. Les oxydoréductases sont des enzymes catalysant les réactions d'oxydoréduction en transférant les ions H + et des électrons. Elles sont associées à des coenzymes d'oxydoréduction (NAD, FAD, FMN, etc.)

Une déshydrogénase(ou déhydrogénase) est une enzyme qui oxyde un substrat par le transfert d'un ou plusieurs ions (H+) à un accepteur, généralement un coenzyme type NAD+/NADP+ ou flavine comme le FAD ou le FMN.

Une aldéhyde déshydrogénase est une enzyme de type déshydrogénase qui catalyse l'oxydation des aldéhydes.

Lorsque les enzymes mentionnées dans la présente demande sont identifiées par leur activité spécifique, une telle définition inclut tous les polypeptides ayant la même activité spécifique et qui sont présents dans différentes cellules et notamment différents microorganismes. L'invention se rapporte donc également aux protéines homologues des protéines de références mentionnées dans la présente demande ayant la même activité que les protéines de référence, ainsi qu'aux gènes codant pour lesdites protéines homologues.

En l'absence de précision, les gènes et les protéines mentionnés dans la présente demande sont identifiés en référence à E. coli (notamment à la souche MG1655). La Khk-C et l'aldolase B sont identifiées en référence à H. sapiens. Néanmoins, des protéines et donc des gènes homologues aux protéines (et aux gènes les codants) identifiées dans la présente demande peuvent être retrouvées dans différents microorganismes.

Une protéine homologue d'une protéine de référence selon l'invention possède la même fonction, c'est-à-dire le cas échéant pour une enzyme, catalyse la même réaction que l'enzyme de référence. Un gène homologue d'un gène codant pour une protéine de référence selon la présente invention code pour une protéine homologue telle que définie ci-dessus.

Typiquement, à partir du nom de la protéine et de sa séquence, l'homme du métier est capable d'identifier dans d'autres organismes des équivalents des protéines mentionnées dans la présente demande. Ce travail de routine est usuellement effectué en utilisant des séquences consensus identifiées par des alignements de séquences avec d'autres protéines issues de différents organismes.

De préférence également, une protéine homologue d'une protéine de référence correspond à une enzyme ayant au moins 30 % d'identité de séquence, de préférence 40 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % ou 95 % d'identité avec la séquence de la protéine de référence.

Afin de déterminer le pourcentage d'identité de deux séquences d'acides aminés pour les besoins de l'invention, les séquences seront alignées pour permettre une comparaison optimale. Des espaces (gap) peuvent être introduits dans l'une ou l'autre des séquences à aligner afin de permettre un alignement optimal, et les séquences non homologues peuvent être ignorées pour la comparaison. Le pourcentage d'identité des deux séquences d'acides aminés comparées peut être obtenu comme décrit dans le livre de D. Voet et J.G. Voet, Biochimie (2nd Edition, De Boeck & Larcier, 2005, section 7.4, paragraphe B). Les alignements sont réalisés avec le logiciel CLUSTAL W (version 1 .82) avec les paramètres suivants : (1 ) CPU MODE = ClustalW mp ; (2) ALIGNMENT = « full » ; (3) OUTPUT FORMAT = « aln w/numbers » ; (4) OUTPUT ORDER = « aligned » ; (5) COLOR ALIGNMENT = « no » ; (6) KTUP (word size) = « default » ; (7) WINDOW LENGTH = « default » ; (8) SCORE TYPE = « percent » ; (9) TOPDIAG = « default » ; (10) PAIRGAP = « default » ; (1 1 ) PHYLOGENETIC TREE/TREE TYPE = « none » ; (12) MATRIX = « default » ; (13) GAP OPEN = « default » ; (14) END GAPS = « default » ; (15) GAP EXTENSION = « default » ; (16) GAP DISTANCES = « default » ; (17) TREE TYPE = « cladogram » et (18) TREE GRAP DISTANCES = « hide ».

La lignocellulose est composée de lignines, d'hémicelluloses et de cellulose en proportions variables. Les hémicelluloses sont un des trois composants principaux de la biomasse lignocellulosique, et représentent environ 20-40 % en poids de ladite biomasse.

Par « hémicellulose », on entend selon l'invention, un groupe de polysaccharides complexes qui se caractérisent par leur solubilité dans des solutions alcalines (par exemple KOH 1 M) et leur insolubilité dans l'eau. Les hémicelluloses sont définies structurellement comme des polysaccharides dont le squelette est composé de résidus 3-(1 ,4)-D-pyranose, où Γ04 est en position équatoriale. De courtes chaînes latérales sont fixées sur le squelette. Les hémicelluloses comprennent des xylanes, des arabinoxylanes, des xyloglucanes, des glucuronoxylanes, et des glucomannanes. Leur hydrolysation, par exemple réalisée par la mise en contact d'un matériel lignocellulosique avec de l'acide sulfurique dilué à des pressions et des températures élevées, conduit à la libération des sucres monomériques. Selon la nature de la matière première et les conditions de l'hydrolyse, les pourcentages en xylose, glucose, et arabinose, varient respectivement de 60 à 80%, de 10 à 30 %, et de 10 à 30 % en poids par rapport au poids total de l'hydrolysat de lignocellulose.

Des lignocelluloses issues des bois durs (typiquement les arbres feuillus), des épis de maïs, des herbes, des feuilles, et des journaux sont particulièrement riches en sucres hémicellulosiques (Jorgensen H et al., Enzymatic conversion of lignocellulose into fermentable sugars: Challenges and opportunities. Biofuels, Bioprod. Bioref. 2007, 1, 1 19-134). Ils représentent des sources de matières premières préférées pour la mise en œuvre des microorganismes modifiées selon l'invention. Par « amorce » ou « primer », on entend une courte séquence d'ADN, complémentaire du début d'une matrice, servant de point de départ à la synthèse du brin complémentaire de ladite matrice par une ADN polymérase.

DESCRIPTION DETAILLEE

Voie synthétique d'assimilation des pentoses La présente invention se rapporte à un procédé de transformation d'un pentose dans un microorganisme recombinant exprimant une voie synthétique d'assimilation des pentoses, pour la production d'au moins un métabolite d'intérêt.

Ce procédé selon l'invention comprend :

(i) une opération de culture d'un microorganisme recombinant exprimant une voie synthétique d'assimilation des pentoses, illustrée de manière générale sur la figure 1 , qui comprend au moins les étapes suivantes :

a) la phosphorylation en position 1 d'un pentose choisi parmi le (D)-Xylulose et/ou le (L)-Ribulose, pour l'obtention respectivement de (D)-Xylulose-I P et/ou de (L)- Ribulose-1 P,

b) le clivage du pentose-1 -phosphate obtenu à l'issue de l'étape a) ((D)-Xylulose- 1 P et/ou (L)-Ribulose-I P), pour l'obtention de glycolaldéhyde et de dihydroxyacétone phosphate (DHAP),

ladite voie permettant d'obtenir au moins un métabolite d'intérêt, et

(ii) une opération de récupération dudit au moins un métabolite d'intérêt obtenu à l'issu de l'opération de culture (i).

Par « phosphorylation », on entend avantageusement une addition d'un groupe phosphate, en l'espèce un phosphoryl P0 3 2" .

Par « métabolite d'intérêt », on entend notamment le glycolaldéhyde et le DHAP, mais aussi leurs dérivés susceptibles d'être obtenus par des réactions d'oxydation ou de réduction de ces composés, en particulier l'éthylène glycol (EG), l'acide glycolique (AG) et leurs dérivés.

Par « dérivés de de l'acide glycolique », on entend notamment :

- les esters de glycolate, comme l'éthyl ester glycolate ou le méthyl ester glycolate, ainsi que :

- les polymères contenant du glycolate comme l'acide polyglycolique.

- ainsi que l'acide glyoxylique issu d'une oxydation de l'acide glycolique.

A noter que dans la présente demande, les termes « acide glycolique » et « glycolate » ainsi que les termes « acide glyoxylique » et « glyoxylate » sont utilisés en tant que synonymes.

De préférence, la voie synthétique d'assimilation des pentoses exprimée par le microorganisme comprend donc en outre avantageusement les étapes suivantes :

c) réduction du glycolaldéhyde obtenu à l'issue de l'étape b) en éthylène glycol, ou c') oxydation du glycolaldéhyde obtenu à l'issue de l'étape b), en acide glycolique.

Dans de tels modes de réalisation, les métabolites d'intérêts obtenus à l'issu de la voie synthétique d'assimilation des pentoses selon l'invention sont l'éthylène glycol et/ou l'acide glycolique, et leurs dérivés.

Enzymes de l'invention La voie synthétique d'assimilation des pentoses, représentée sur la figure 1 , est catalysée par un ensemble d'enzymes.

L'enzyme recombinante catalysant l'étape de phosphorylation a) de la voie synthétique d'assimilation des pentoses de l'invention, est une kinase phosphorylant le (D)-Xylulose ou le (L)-Arabinose en position 1 .

Une telle enzyme est par exemple choisie parmi le groupe constitué par :

- la kétohexokinase, de préférence l'isoforme C de la kétohexokinase (KhK-C),

- la rhamnulose kinase (RhaB) et

- la fuculose kinase (FucK).

La kétohexokinase C est codée par le gène khk, typiquement retrouvé chez H. sapiens. Dans un mode de réalisation préféré, on utilise le gène H. sapiens codant pour la Khk-C, de séquence SEQ ID N ° 1 .

La rhamnulose kinase ainsi que la fuculose kinase de l'invention sont codées respectivement par les gènes, rhaB et fucK, typiquement retrouvés chez E coli. Ainsi, dans certains modes de réalisation on utilise le gène E. coli rhaB codant pour la rhamnulose kinase B (RhaB) de séquence SEQ ID N °6 ou le gène E. coli fucK codant pour la fuculose kinase (FucK) de séquence SEQ ID N °5.

L'enzyme catalysant l'étape de clivage b) est une aldolase clivant le (D)-xylulose-I P ou le (L)-ribulose-l P en glycolaldéhyde et DHAP.

Une aldolase selon l'invention peut être choisie parmi l'aldolase B, codée par le gène aldoB, typiquement retrouvé chez Homo sapiens et la fructose-1 ,6 bisphosphate aldolase B de E. coli, codée par le gène fbaB typiquement retrouvé chez E. coli.

Ainsi, dans certains modes de réalisation particuliers, on utilise le gène H. sapiens aldoB codant pour l'aldolase B, de séquence SEQ ID N °2 ou le gène E coli fbaB codant pour la fructose-1 ,6 bisphosphate aldolase B, de séquence SEQ ID N °9.

L'enzyme catalysant l'étape de réduction c) est une glycolaldéhyde réductase.

Une glycolaldéhyde (ou aldéhyde) réductase convenant à l'invention peut par être exemple choisie parmi l'aldéhyde réductase codée par :

- le gène yqhD, typiquement retrouvé chez E coli, codant pour l'aldéhyde réductase YqhD de séquence SEQ ID N°4

- la glycérol déshydrogénase codée par le gène gldA, typiquement retrouvé chez E. coli, codant pour la glycérol déshydrogénase GldA et de séquence SEQ ID N °51 °et

- la L-1 ,2-propanediol oxidoréductase codée par le gène FucO, typiquement retrouvé chez E coli, codant pour la L-1 ,2-propanediol oxidoréductase FucO et de séquence SEQ ID N °52.

L'enzyme catalysant l'étape d'oxydation c') est une glycolaldéhyde déshydrogénase. Une glycolaldéhyde déshydrogénase convenant à l'invention est par exemple la glycolaldehyde déshydrogénase codée par le gène aldA, typiquement retrouvé chez E. coli, codant pour la lactaldéhyde déshydrogénase AldA, de séquence SEQ ID N °3

Les enzymes catalysent respectivement les étapes de réduction et d'oxydation avantageusement en présence de la forme réduite ou oxydée, respectivement, de nicotinamide adénine dinucléotide (phosphate) (NAD(P)H), coenzyme d'oxydoréduction.

Dans certains modes de réalisation, le microorganisme utilisé dans la présente invention exprime avantageusement, de façon native ou recombinante, au moins une des enzymes suivantes :

- une xylose isomérase, convertissant le (D)-Xylose en (D)-Xylulose, comme par exemple l'enzyme codée par le gène xylA de E. coli,

- une xylose réductase et une xylitol déshydrogénase, comme par exemple les enzymes codées par les gènes XYL1 et XYL2 de la levure Scheffersomyces stipitis.

- une L-Arabinose isomérase, convertissant le (L)-Arabinose en (L)-Ribulose, comme par exemple l'enzyme codée par le gène E. coli araA, et/ou

- une arabinose réductase et une arabitol déshydrogénase.

De préférence encore, le microorganisme de l'invention exprime, de façon native ou recombinante, au moins une protéine transportant les pentoses à l'intérieur de la cellule, et notamment :

- des protéines transportant le (L)-Arabinose, comme par exemple les enzymes codées par les gènes araE, araF, araG ou araH de E. coli; et/ou

- des protéines transportant le (D)-xylose, comme par exemple les protéines codées par les gènes xylE, xylF, xylG ou xylH de E. coli ou encore le gène galP codant pour une perméase des sucres, ou le gène gal-2a de S cerevisiae

Microorganisme recombinant :

Par « microorganisme », on entend selon l'invention une cellule hôte choisie parmi les cellules procaryotes notamment les archéobactéries, les bactéries ou les microalgues procaryotes, et les cellules eucaryotes, notamment les champignons, les levures et les cellules végétales et les microalgues eucaryotes.

Par « microorganisme recombinant », ou « microorganisme génétiquement modifié », ou « microorganisme modifié », on entend selon l'invention, une cellule hôte ayant subi une modification de son génome, par exemple par addition d'un acide nucléique exogène (ou recombinant), ou par modification d'un acide nucléique endogène.

Des bactéries adaptées à l'invention peuvent être par exemple choisies parmi les familles des Enterobacteriaceae, Clostridiaceae, Bacillaceae, Streptomycetaceae, Streptococcaceae, Methylobacteriacae, et Corynebacteriaceae. Des bactéries particulièrement adaptées à l'invention peuvent typiquement être choisies parmi le groupe constitué par Escherichia coli, Bacillus subtilis, Corynebacterium glutamicum, Clostridium acetobutylicum, Methylobacterium extorquens, et Lactococcus lactis.

Des levures adaptées à l'invention peuvent être par exemple choisies parmi les familles des Saccharomycetaceae, Pichiaceae, et Schizosaccharomycetaceae.

Des levures particulièrement adaptées à l'invention peuvent typiquement être choisies dans le groupe constitué par Saccharomyces cerevisiae, Schizosaccharomyces pombe, Kluyveromyces lactis, Kluyveromyces marxianus, Pichia jadinii, Scheffersomyces stipitis, et Pichia pastoris.

Des genres de champignons adaptés à l'invention peuvent typiquement être choisis dans le groupe constitué par Pénicillium, Aspergillus, Chrysosporium et Trichoderma.

Dans un mode de réalisation préféré de l'invention, on utilise Escherichia coli, Scheffersomyces stipitis ou Saccharomyces cerevisiae, en tant que microorganisme hôte.

Avantageusement, on utilise un microorganisme naturellement capable d'assimiler le (D)-xylose et/ou le (L)-arabinose.

De préférence, la voie synthétique d'assimilation des pentoses selon l'invention implique qu'au moins une enzyme catalysant l'une des étapes de phosphorylation a), de clivage b), de réduction c) ou d'oxydation c') est exprimée de façon recombinante par le microorganisme.

Typiquement, au moins l'enzyme catalysant l'étape de phosphorylation a), et/ou au moins l'enzyme catalysant l'étape de clivage b), du procédé de l'invention est exprimée de façon recombinante.

Dans un mode de réalisation particulier les enzymes catalysant les étapes de phosphorylation a), de clivage b), et de réduction c) et/ou d'oxydation c') sont des enzymes recombinantes.

Dans certains modes de réalisation, au moins une desdites enzymes recombinantes est une enzyme codée par un gène hétérologue (c'est-à-dire non exprimé naturellement dans l'organisme hôte de référence), en particulier au moins une des enzymes catalysant les étapes a) et b) est codée par un gène hétérologue.

De préférence, le microorganisme exprime au moins la KhkC.

De préférence encore, le microorganisme exprime de façon recombinante :

- la KhkC (notamment KhkC, H. sapiens codée par le gène khkC de séquence SEQ ID N ° 1 ) catalysant l'étape a) de la voie d'assimilation des pentoses, et

- l'aldolase B, codée par le gène aldo-B (notamment par le gène aldoB de séquence SEQ ID N °2) ou la fructose-1 ,6, bis phosphate aldolase, codée par le gène fbaB (notamment le gène fbaB de séquence SEQ ID N °9j.

Dans un mode de réalisation particulier, la glycolaldéhyde réductase et/ou la glycolaldéhyde déshydrogénase catalysant respectivement les étapes c) et c') de la voie synthétique d'assimilation des pentoses de l'invention sont des enzymes endogènes, naturellement exprimées par le microorganisme.

Dans certains modes de réalisation, les enzymes endogènes de la voie synthétique d'assimilation de l'invention peuvent être surexprimées, notamment les enzymes codant les étapes de réduction c) ou d'oxydation c'). En particulier, la glycolaldéhyde déshydrogénase peut être surexprimée pour stimuler l'étape c') d'oxydation. Par exemple chez E coli on peut surexprimer le gène aldA codant pour une glycolaldéhyde déshydrogénase ;

Dans certains modes de réalisation de l'invention, les enzymes convertissant les (D)- xylose ou le (L)-Arabinose en (D)-xylulose ou en (L)-ribulose, respectivement, à savoir des isomérases ou épimérases telles que décrites précédemment, ou encore les protéines important le (D)-Xylose ou le (L)-Arabinose dans la cellule, sont surexprimées dans le microorganisme.

Dans un mode de réalisation de l'invention, les acides nucléiques codant pour les enzymes catalysant les étapes a) et b) sont clonés en opéron dans un vecteur d'expression sous le contrôle d'un même promoteur. Dans certains modes de réalisation les acides nucléiques codant pour les enzymes catalysant les étapes a), b), et c) et/ou c') sont clonées en opéron.

L'expression des protéines recombinantes est contrôlée par un promoteur inductible ou de préférence constitutif.

Optimisation de la voie synthétique d'assimilation des pentoses :

Dans certains modes de réalisation, l'activité d'une ou plusieurs enzymes endogènes de la cellule hôte peut également être modifiée de façon à optimiser la production d'éthylène glycol et/ou d'acide glycolique.

Certaines modifications susceptibles d'être apportées à un microorganisme de l'invention sont décrites ci-dessous.

A) De préférence, le microorganisme utilisé est génétiquement modifié de façon à atténuer ou supprimer l'activité des enzymes endogènes impliquées dans les voies naturelles d'assimilation des pentoses phosphates, et notamment le ou les enzyme(s) catalysant la phosphorylation en position 5 du cycle des pentoses, et plus particulièrement la (L)-ribulose-5- kinase et/ou la (D)-xylulose-5- kinase.

A titre d'exemple, les gènes araB et/ou xylB, codant pour la ribulose-5-kinase et la xylulose-5-kinase respectivement, typiquement retrouvés chez E coli, peuvent être atténués, ou de préférence inactivés.

Une telle modification permet d'orienter le flux carbone préférentiellement vers la voie synthétique d'assimilation des pentoses de l'invention et d'optimiser la production d'éthylène glycol et/ou d'acide glycolique par ladite voie synthétique. Dans un mode de réalisation de l'invention, on utilise un microorganisme dans lequel le gène xylB, et notamment le gène xylB codant pour la xylulose kinase de séquence SEQ ID N °53, est délété.

B) L'activité des enzymes de type glycolaldéhyde réductase et/ou glycolaldéhyde déhydrogénase peut également être modifiée afin d'orienter la voie synthétique d'assimilation de l'invention vers la production d'acide glycolique ou d'éthylène glycol.

A titre d'exemple, les enzymes codées par les gènes aldA, codant pour une glycolaldéhyde déshydrogénase, ainsi que les gènes gldA, fucO et/ou yqhD codant pour une glycolaldéhyde réductase, peuvent notamment être surexprimés pour favoriser la production de l'éthylène glycol ou atténués ou inactivés, pour favoriser la production de l'acide glycolique.

Avantageusement, la production d'éthylène glycol est optimisée en utilisant un microorganisme dans lequel au moins l'une (et de préférence les deux) des modifications suivantes sont en outre apportées quant à l'expression des enzymes endogènes :

- surexpression du gène codant pour au moins une glycolaldéhyde réductase, de préférence la glycolaldéhyde réductase principale, exprimée par le microorganisme ;

- inactivation ou délétion du gène codant pour une glycolaldéhyde déshydrogénase catalysant l'étape c', par exemple le gène aldA.

Avantageusement, la production d'acide glycolique peut être optimisée en utilisant un microorganisme dans lequel au moins une des modifications suivantes (et de préférence au moins les deux premières) sont apportées, quant à l'expression des enzymes endogènes :

- surexpression du gène codant pour la glycolaldéhyde déshydrogénase, par exemple la glycolaldéhyde déshydrogénase codée par le gène aldA ;

- réduction de la dégradation de l'acide glycolique, notamment par atténuation ou inactivation de la glycolate oxydase, par exemple par inactivation d'au moins un des gènes glcDEFG, codant pour au moins l'une des sous-unités de la glycolate oxydase ;

- éventuellement une inactivation du ou des gènes codant pour une glycoladéhyde réductase.

De préférence, un microorganisme selon l'invention comprend, outre les modifications propres à l'expression de la voie synthétiques d'assimilation des pentoses de l'invention, et notamment propres à la catalyse des étapes de phosphorylation a) et de clivage b) de cette voie, au moins une des modifications supplémentaires décrites aux points A) ou B) ci-dessus.

De préférence encore, le microorganisme comprend au moins les modifications décrites au point A). Selon les modes de réalisation, cette modification peut être combinée avec les modifications du point B) pour optimiser la production d'éthylène glycol ou d'acide glycolique.

Les modifications mentionnées ci-dessus peuvent être combinées.

En particulier : - pour optimiser la production d'éthylène glycol, l'inactivation des enzymes catalysant la phosphorylation en position 5 des pentoses, notamment la (L)-ribulose-5-kinase et/ou la (D)-xylulose-5-kinase (comme les gènes xylB ou araB) peut être combinée à l'inactivation de la voie de synthèse de l'acide glycolique (notamment par inactivation du ou des gènes codant pour une glycolaldéhyde déshydrogénase, par exemple le gène aldA). Ces inactivations peuvent être combinées à une surexpression du gène codant pour la glycolaldéhyde réductase catalysant l'étape c) du procédé de l'invention.

Pour optimiser la production d'acide glycolique, l'inactivation des enzymes catalysant la phosphorylation en position 5 des pentoses, notamment la (L)-ribulose-5-kinase et/ou la (D)-xylulose-5-kinase (notamment codées par les gènes xylB ou araB) peut être combinée à l'inactivation de la glycolate oxydase par inactivation d'au moins un des gènes glcDEFG codant pour ses sous-unités et/ou à la surexpression de la glycolaldéhyde déshydrogénase codée par le gène aldA. Eventuellement, le gène codant pour la glycolaldéhyde réductase catalysant l'étape c) du procédé de l'invention est également inactivé.

Par exemple, un microorganisme modifié pour optimiser la production d'éthylène glycol exprime au moins les activités de phosphorylation de clivage et de réduction correspondant aux étapes a), b) et c) décrites précédemment, de préférence les enzymes KhkC, aldolase B (notamment codée par le gène aldoB) ainsi qu'une glycoladéhyde réductase (comme l'aldéhyde réductase YqhD ou la glycérol déshydrogénase GldA ou encore l'enzyme codée par le gène fucO) et comprend en les modifications suivantes :

- la délétion du gène codant pour l'aldéhyde déshydrogénase, notamment du gène aldA ;

- la délétion des gène codant pour le ou les enzyme(s) catalysant la phosphorylation en position 5 du (D)-xylulose et/ou du (L)-ribulose, et plus particulièrement la (D)- xylulose-5-kinase et/ou la (L)-ribulose-5-kinase, notamment les gènes araB et/ou xylB.

C) Il est également possible d'utiliser un microorganisme génétiquement modifié afin de favoriser, en sus de la voie synthétique de l'invention, la production d'acide glycolique par les voies naturelles.

En effet, les inventeurs ont en outre découvert que la production d'acide glycolique peut également être encore augmentée en combinant le fonctionnement de la voie synthétique d'assimilation selon l'invention avec des modifications génétiques qui conduisent en parallèle à la production d'acide glycolique par la voie dite du glyoxylate. Un microorganisme selon l'invention peut donc par exemple présenter des modifications favorisant la production d'acide glycolique à partir du glyoxylate, comme décrit dans la demande WO2010/108909.

Ainsi la dihydroxyacétone phosphate (DHAP ou glycérone phosphate), notamment obtenue à l'issue de l'étape de clivage b) pourrait intégrer les voies naturelles de la glycolyse, du cycle des acides tricarboxyliques (CAT) et de la voie du glyoxylate, un shunt du CAT (voir pour revue Neidhardt, F. C. (Ed. in Chief), R. Curtiss III, J. L. Ingraham, E. C. C. Lin, K. B. Low, B. Magasanik, W. S. Reznikoff, M. Riley, M. Schaechter, and H. E. Umbarger (eds). 1996. Escherichia coli and Salmonella: Cellular and Molecular Biology. American Society for Microbiology).

L'optimisation de la voie du glyoxylate peut donc être obtenue par au moins l'une, et de préférence par une combinaison, des modifications suivantes :

i) surexpression d'un gène codant pour une glyoxylate réductase ;

ii) surexpression d'un gène codant pour une isocitrate lyase, éventuellement accompagnée de la délétion du gène codant pour son répresseur transcriptionnel ; iii) délétion des gènes codant pour des malate synthases ;

iv) délétion des gènes codant pour des glyoxylate carboligases ;

v) délétion des gènes codant pour des gènes codant pour des glycolates oxidases ou des glycolates déshydrogénases

vi) délétion des gènes codant pour des 2-kéto-4-hydroxyglutarate aldolases, notamment la Entner-Doudouroff Aldolase et/ou pour des phosphogluconate déhydratases; vii) délétion d'un gène répresseur de la réponse aérobie (c'est-à-dire un gène codant pour un répresseur des gènes impliqués dans le métabolisme respiratoire), notamment le gène arcA ;

viii) atténuation et notamment délétion de l'expression de l'isocitrate déhydrogénase ; ix) éventuellement délétion des gènes codants pour des systèmes d'internalisation de l'acide glycolique ; et

x) éventuellement, atténuation des voies métaboliques qui amènent à la production de produit secondaires comme l'acétate, le lactate ou l'éthanol.

Dans le cas où le microorganisme recombinant, pour la production de l'acide glycolique, est Escherichia coli, les modifications décrites ci-dessus correspondent à

i) la surexpression du gène ghrA, et/ou du gène ycdW ;

ii) la surexpression du gène aceA accompagné ou non par la délétion de son répresseur transcriptionel, icIR ;

iii) la délétion des gènes aceB et glcB;

iv) la délétion du gène gel ;

v) la délétion d'au moins un gène choisi parmi glcD, glcE, glcF ou glcG

vi) la délétion des gènes edd-eda ; vii) la délétion du gène arcA ;

viii) l'atténuation et de préférence la délétion de l'expression du gène icd ;

ix) la délétion des gènes glcA, HdP, et/ou yjcG ;

x) la délétion des gènes ackA-pta, poxB, IdhA, et/ou adhE. ;

Avantageusement, les modifications suivantes sont apportées pour optimiser la production d'acide glycolique dans un microorganisme selon la présente invention, par exemple chez E.coli :

i) la surexpression du gène ghrA

ii) la surexpression des gènes aceA éventuellement accompagné de la délétion du gène icIR;

iii) la délétion des gènes aceB et glcB

iv) la délétion du gène glc ;

v) la délétion d'au moins un gène choisi parmi glcD, glcE, glcF ou glcG ;

vi) la délétion des gènes edd-eda ;

vii) la délétion du gène arcA

viii) la délétion du gène icd

Dans un mode de réalisation, le microorganisme porteur des modifications ci-dessus n'exprime pas d'enzyme catalysant la phosphorylation en position 5 du (L)-ribulose et/ou du (D)-xylulose, et plus particulièrement la (L)-ribulose-5-kinase et/ou la (D)-xylulose-5- kinase. Ainsi, dans certains modes de réalisation on utilise un microorganisme dans lequel les gènse xylB et/ou araB sont délétés.

En variante, le microorganisme (avantageusement E. coli) exprime un ou plusieurs enzymes catalysant la phosphorylation en position 5 du (L)-ribulose et/ou du (D)-xylulose, et plus particulièrement la (L)-ribulose-5-kinase et/ou la (D)-xylulose-5- kinase. Typiquement, le microorganisme exprime le gène xylB et/ou le gène araB. Un tel microorganisme offre un excellent rendement en acide glycolique, lorsqu'il est cultivé sur un milieu contenant du glucose, notamment contenant au moins du glucose et du xylose ou du xylulose. De préférence le milieu contient majoritairement du glucose.

D) Il est enfin possible, pour augmenter la production en éthylène glycol ou en acide glycolique, d'utiliser un microorganisme dans lequel au moins un gène codant pour un transporteur des sucres (par exemple le gène galP codant pour une perméase des sucres et/ou le gène gal-2a de S cerevisiae) est surexprimé. Avantageusement un tel gène est exprimé de façon constitutive.

Dans un mode de réalisation particulièrement préféré de l'invention, on utilise pour la production d'acide glycolique un microorganisme combinant les modifications décrites aux paragraphes A) à D) ci-dessus. En particulier on utilise un microorganisme combinant les modifications rapportées dans les paragraphes, B), C) et D) ci-dessus pour la production d'acide glycolique.

Avantageusement un tel microorganisme exprime la KhkC et l'aldolase B et comporte les modifications suivantes :

- la surexpression du gène codant pour la glycolaldéhyde déshydrogénase, par exemple la glycolaldéhyde déshydrogénase codée par le gène aldA ;

- la surexpression du gène ghrA

- la surexpression du gène aceA éventuellement accompagné de la délétion du gène icIR;

- la délétion des gènes aceB et glcB

- la délétion du gène glc

- la délétion d'au moins un gène choisi parmi glcD, glcE, glcF, ou glcG ;

- la délétion des gènes edd-eda ;

- la délétion du gène arcA ;

- la délétion du gène icd ;

- la surexpression du gène galP

En fonction du substrat de culture choisi, un tel microorganisme peut également porter ou non une délétion du gène xylB et/ou du gène araB. De préférence l'expression du gène xylB et/ou du gène araB est conservée lorsque le microorganisme est cultivé sur un substrat comprenant du glucose.

De même en fonction du substrat de culture, on utilise un microorganisme exprimant, de façon recombinante ou non, des enzymes convertissant le (D)-xylose ou le (L)-Arabinose en (D)-xylulose ou en (L)-ribulose, respectivement, à savoir des (D)-xylulose isomérases ou des (L- arabinose isomérases, ou des (D)-xylose réductases/(D)-xylitol déshydrogénases, ou des (L)- arabinose réductases/(L)-arabitol déshydrogénases, telles que décrites précédemment.

De façon générale, sans être limitatif, le rendement théorique du procédé de l'invention pour l'éthylène glycol est d'environ 1 mol d'éthylène glycol par mol de xylose ou d'arabinose.

Le rendement théorique du procédé de l'invention pour l'acide glycolique est d'environ 1 mol d'acide glycolique par mol de xylose ou arabinose, sans activation du cycle glyoxylate. Lors d'un fonctionnement parallèle de la voie synthétique et du cycle glyoxylate, le rendement théorique est d'environ 2 mol d'acide glycolique par mol de xylose ou arabinose.

Culture du microorganisme :

Les conditions de culture du microorganisme selon l'invention peuvent être adaptées selon les techniques classiques, connues de l'homme du métier.

Typiquement, les bactéries utilisées comme cellules hôtes dans la présente invention peuvent être cultivées dans des milieux de tous types et de toute composition. Les milieux de culture sont typiquement des milieux carbonés comprenant, ou supplémentés, avec divers composés incluant notamment différentes sources de carbone, et notamment de pentoses, comme le (D)-glucose, le (D)-Xylose, le (L)-Arabinose, et/ou des hydrolysats de biomasse lignocellulosique, notamment de l'hémicellulose, de l'amidon et leurs dérivés.

Dans certains modes de réalisation, le milieu de culture comprend moins de 5 %, notamment moins de 4 %, moins de 3 %, moins de 2 % ou encore moins de 1 % de rhamnulose.

Par « hydrolysat de biomasse », on entend en particulier des hydrolysats lignocellulosiques, en particulier des hydrolysats comprenant au moins 20 % de de xylose et/ou au moins 5%, notamment au moins 10 % d'arabinose, en poids par rapport au poids total de l'hydrolysat. Dans un mode de réalisation préféré, on utilise ainsi des hydrolysats lignocellulosiques de bois durs, d'épis de maïs ou de papier.

D'autres paramètres relatifs aux conditions de culture peuvent être optimisés par des expériences de routine, comme le pH ou la température.

Dans certains modes de réalisation, la température de culture varie de 25 à 43 °C et dépend essentiellement du type de cellule hôte et du milieu de culture. A titre d'exemple lorsque la cellule hôte est E. coli, la température de culture optimale varie généralement entre 30 et 38 °C.

La durée de culture dépend également des paramètres de culture mentionnés ci- dessus. Typiquement, les cellules peuvent être cultivées entre 6 et 300 heures.

De préférence, le ou les métabolites d'intérêt obtenus à l'issu de l'opération de culture du microorganisme selon l'invention sont récupérés dans le milieu de culture.

La présente demande se rapporte également à un microorganisme recombinant tel que décrit dans la présente demande.

En particulier, la présente invention se rapporte à un microorganisme exprimant une voie synthétique d'assimilation des pentoses selon l'invention.

Selon différents modes de réalisation, les voies naturelles d'assimilation des pentoses sont conservées ou sont inactivées (par exemple par délétion des gènes codant pour la xylulose-5-kinase et/ou la ribulose-5-kinase).

Un microorganisme selon l'invention exprime au moins :

- un acide nucléique codant pour une enzyme apte à phosphoryler, en position 1 , un pentose choisi parmi le (D)-Xylulose et/ou le (L)-Ribulose, et

- un acide nucléique codant pour une enzyme de type aldolase, apte à cliver le (D)- xylulose-1 -phosphate et/ou le (L)-Ribulose-I -phosphate en glycolaldéhyde et DHAP, tels que décrit précédemment

De préférence, au moins une de ces enzymes est exprimée de façon recombinante. Dans certains modes de réalisations, au moins une de ces enzymes est codée par un acide nucléique exogène et, de préférence, le microorganisme exprime au moins :

- un acide nucléique codant pour l'isoforme C de la kétohexokinase (typiquement retrouvée chez H. sapiens) et

- au moins un acide nucléique codant pour l'aldolase B.

Dans certains modes de réalisation, le microorganisme est en outre modifié tel que décrit dans les points A) à E) ci-dessus.

Par exemple un microorganisme adapté à la production d'acide glycolique peut avantageusement comprendre les modifications suivantes :

- la surexpression du gène codant pour la glycolaldéhyde déshydrogénase, par exemple la glycolaldéhyde déshydrogénase codée par le gène aldA ;

- la surexpression du gène ghrA

- la surexpression du gène aceA ;

- éventuellement la délétion du gène icIR ;

- la délétion du gène glc ;

- la délétion d'au moins un gène choisi parmi les gènes glcD, glcE, glcF ou glcG ;

- la délétion des gènes aceB et glcB

- la délétion des gènes edd-eda ;

- la délétion du gène ArcA ;

- la délétion du gène icd ;

- éventuellement la délétion des gènes xylB et/ou araB. EXEMPLES

Composition des milieux

Milieu Luria-Bertani (LB)

Pour un litre de milieu: 10 g de tryptone, 5 g d'extrait de levures, 5 g de chlorure de sodium dans un litre d'eau purifiée. Le milieu est autoclavé avant utilisation. Pour être utilisé en milieu solide, 2 % d'agar est rajouté au milieu avant autoclavage.

Milieu minimal M9

Pour un litre de milieu : 18 g Na 2 HP0 4 * 12 H 2 0; 3 g KH 2 P0 4 ; 0,5 g NaCI; 2 g NH 4 CI; 0,5 g MgS0 4 * 7 H 2 0; 0,015 g CaCI 2 * 2 H 2 0; 1 ml d'une solution d'éléments traces (contenant par litre 0,04 g NaEDTA * 2 H 2 0, 0,18 g CoCI 2 * 6 H 2 0; ZnCI 2 S0 4 * 7 H 2 0; 0,04 g Na 2 Mo0 4 * 2 H 2 0, 0.01 g H 3 BO 3 , 0,12 g MnS0 4 * H 2 0, 0,12 g CuCI 2 * H 2 0) ; des quantités de (D)-glucose, (D)- xylose, et (L)-arabinose précisées dans le texte. Le milieu est ajusté à un pH de 7 et filtré.

YPD Le milieu YPD est utilisé comme milieu riche pour la croissance de S. cerevisiae. Pour un litre, 10 g d'extraits de levure, 20 g de bacto-peptone. Le milieu est autoclavé avant utilisation et 20 g de glucose filtré sont ajoutés. Pour être utilisé en milieu solide, 2 % d'agar est rajouté au milieu avant autoclavage.

Milieu minimal SCD pour Saccharomyces cerevisiae

Pour un litre, 1 ,7 g de yeast nitrogen base sans acides aminés, 5 g de sulfate d'ammonium sans acides aminés, drop-out de 0,940 g des acides aminés essentiels exceptés de ceux utilisés pour mettre en évidence une auxotrophie, 900 ml d'eau puis le tout est autoclavé. En cas d'utilisation en milieu solide, 20 g de bacto-agar est rajouté. 100 ml d'une solution de sucres à 20% est rajoutée.

Test de croissance en milieu M9 + xylose

Toutes les cultures ont été réalisées dans des flacons d'Erlenmeyer de 250 ml contenant 50 ml de milieu de culture et en agissant les cultures à 200 RPM.

Les cellules à tester sont mises en culture sur la nuit à 37 °C en milieu LB. Cette préculture est ensuite utilisée pour inoculer à D0 60 onm~0,2 du milieu M9 + 10 g/l glucose. En phase exponentielle de croissance (DO entre 0,6 et 1 ) l'IPTG est ajouté à 1 mM et les cultures sont ainsi incubées pendent 16 à 18 heures. Après cette période d'incubation les cellules sont lavées deux fois à l'eau stérile et réensemencées à D0 6 oonm~0,2 dans du milieu M9 + IPTG 1 mM + glucose et /ou xylose et/ou arabinose en des quantités indiquées dans le texte. La DOeoonm est suivie et des aliquots sont prélevés, centrifugés et injectés en HPLC pour analyse des métabolites.

Méthodes de construction de souches

Transformation bactérienne

Les transformations bactériennes sont réalisées sur des cellules chimiocompétentes commerciales ou préparées au laboratoire. Les cellules rendues chimiocompétentes sont préparées selon le protocole au chlorure de calcium (Dagert and Ehrlich, 1979). La transformation s'effectue ensuite en laissant pendent 20 min l'ADN plasmidique à transformer au contact des bactéries compétentes sur de la glace, puis un choc thermique à 42 °C de 45 secondes est réalisé. Les cellules sont remises 5 minutes sur glace puis 1 ml de milieu LB est rajouté avant de les incuber pendent 1 h à 37 °C. Les cellules sont ensuite étalées sur boite LB solide supplémentée avec le marqueur de sélection correspondant.

De manière générale, outre les plasmides développés dans le cadre de la présente invention, les plasmides suivants ont été utilisés : pACT3 (Dykxhoorn et al., 1996), pEXT20 (Dykxhoorn et al., 1997), pGEM-T (Promega), pET28a (Novagen), pCP20 (Cherepanov & Wackernagel, 1995), peX-A-aldoB (Eurofins) et pET1 1 -KHK-C (Asipu et al., 2003). Délétion de gène par transduction d'une cassette kanamycine à partir d'une souche KEIO

Pour transférer une délétion de gène portée par une souche KEIO d'E. coli vers une souche réceptrice donnée de MG1655 d'E coli, une transduction est réalisée.

A partir d'une souche Keio mise en culture en LB + 50 μΜ kanamycine à 37 °C sur la nuit, un lysat de phage est généré. Sur une pré-culture de 10 ml de LB inoculée le matin à partir de 200 μΙ de la culture sur la nuit en présence de 2 g/L de glucose et 5 mM de CaCI 2 , on ajoute 200 μΙ de phage P1 . La culture est laissée 2 h le temps de la lyse cellulaire due au phage. La réaction est arrêtée avec 200 μΙ de chloroforme. Le tout est centrifugé 10 min à 4500 x g et 9 ml du surnageant contenant les phages récupéré et stocké avec 200 μΙ de chloroforme à 4 °C. La souche réceptrice est mise en préculture sur la nuit. De cette culture, 1 ,5 ml est récupéré et centrifugé. Le culot est repris dans 600 μΙ de MgS0 4 10 mM + CaCI 2 5 mM. La transduction est réalisée en mettant 100 μΙ de cellules en présence de 100 μΙ du lysat de phage. Le tout est incubé 30 minutes à 30 °C sans agitation. Ensuite, 100 μΙ de citrate de sodium 1 M est ajouté ainsi que 1 ml de LB. L'expression phénotypique des souches ayant intégré la cassette kanamycine se fait en laissant les cellules pousser pendant 1 h à 37 °C sous agitation. Les cellules sont ensuite étalées sur boite de milieu LB contenant le marqueur de sélection et laissées à pousser sur la nuit. Le lendemain, les colonies formées sont testées par PCR pour la présence de la cassette de sélection et pour l'absence du gène délété.

Protocole d'excision de cassette de sélection flanquée de séquence FRT

La cassette est excisée du chromosome en utilisant la recombinase FLP portée par le plasmide pCP20 (Cherepanov & Wackernagel, 1995) qui laisse une région cicatricielle contenant un site FRT. pCP20 est un plasmide portant la résistance à l'ampicilline et au chloramphénicol présentant une réplication thermosensible et une expression de la recombinase FLP thermo-induite. Les mutants marqueurs résistants contenant donc la cassette sont transformés avec pCP20 et les transformants ampicilline résistants portant la résistance du plasmide sont sélectionnés à 30 °C. Ils sont ensuite mis en culture à 37 °C sur LB solide puis testé pour la perte de la résistance à l'ampiciline. L'excision de la cassette de sélection est ensuite vérifiée par PCR avec les primers ayant servi pour l'amplifier avec la Taq polymerase (NEB). Les délétions multiples sont obtenues en répétant l'opération.

Clonage de gènes sur plasmide chez S. cerevisiae

Le clonage d'un gène chez S. cerevisiae utilise les capacités de recombinaison génétique de la levure. Le gène à cloner est associé à une séquence promotrice et une séquence terminatrice donnant trois fragments à liguer dans un plasmide préalablement linéarisé. Pour cela, des régions homologues de 40 nucléotides sont désignés sur les primers. Ces 40 nucléotides d'homologie permettent aux systèmes de recombinaison de la levure de liguer l'ensemble des fragments après transformation. Chaque fragment est amplifié par PCR en utilisant la PhusionTM polymérase. L'ensemble des fragments et le vecteur d'accueil linéarisé est transformé dans une souche compétente de S. cerevisiae selon la méthode décrite par Gietz, et Woods (2002). Après croissance des transformants, les plasmides sont extraits selon la méthode décrite par Zeugin et Hartley (1985). Les plasmides sont ensuite utilisés pour transformer une souche DH10B d'E. coli. Les plasmides sont extraits d'E. coli, vérifiés par séquençage et utilisés pour transformer la souche réceptrice de S. cerevisiae.

Extraction de plasmides chez S. cerevisiae

Après transformation, les colonies obtenues sont resuspendues dans de l'eau puis centrifugées en vue d'une extraction de plasmide. Le culot de cellules est resuspendues dans 400 μΙ d'un tampon à 4°C contenant 50 mM glucose, 10 mM EDTA, 25 mM Tris-HCI pH 8 et supplémenté de la RnaseA 0,1 mg/ml. 400 μΙ d'une solution contenant 0,2 M NaOH et 1 % SDS est utilisé pour faire lyser les cellules. Des billes de verre sont ensuite rajoutées à hauteur d'un tiers du volume total et les cellules sont vortexées à 4°C pendant 10 minutes. Cette étape est suivie d'une centrifugation de 60 secondes à 13000 RPM. 700μΙ du surnageant sont prélevés et mis dans un nouveau tube de 2 ml. 325 μΙ d'une solution à 4°C de 3 M KAc à pH 5,5 est ajouté. Le mélange est laissé à incuber 10 min sur glace avant d'être centrifugé pendant 10 min à 13000 RPM à 4°C. 700 μΙ du surnageant est prélevé et déposé dans un nouveau tube. 700 μΙ d'isopropanol est rajouté et le tout est agité intensément avant d'être laissé à incuber 10 min à température ambiante. Une centrifugation est ensuite réalisée à température ambiante pendant 30 min à 13000 RPM. Le surnageant est ensuite éliminé et le culot resuspendu dans 500 μΙ d'éthanol à 70% à -20°C puis centrifugé 5 min. Le surnageant est éliminé. Cette étape est répétée une nouvelle fois puis le culot est séché jusqu'à la disparition de l'éthanol. Ce culot est ensuite repris dans 30 μΙ d'H 2 0.

De façon générale, les amorces utilisées pour l'expression de la voie chez E. coli sont listées dans le tableau 3, et les amorces utilisées pour l'expression de la voie chez S.cerevisiae sont listées dans le tableau 4.

Expression et purification de protéines depuis un plasmide pET28a

La souche d'E.coli BL21 (DE3) contenant le pET28a portant le gène d'intérêt est mise en culture sur la nuit à 37 °C dans 100 ml de milieu LB dans un erlenmeyer de 500 ml sous agitation 200 RPM.

Le lendemain, 10 à 50 ml de cette pré-culture d'E.coli BL21 (DE3) contenant le pET28a portant le gène d'intérêt sont mis en culture dans du milieu LB supplémenté par 50 μg ml de kanamycine à 37 °C.

L'expression protéique est déclenchée par le rajout de 1 mM IPTG aux cultures qui atteignent une DO 6 oonm~0,7. Après 3 h d'incubation à 37 °C les cellules sont centrifugées, et les culots obtenus congelés à -80 °C. Pour la purificaion de la protéine ainsi exprimées, les cellules sont reprises dans 1 ml de tampon de lyse (50 mmol/l Hépès [pH 7,5], 3 mol/L NaCI,

0.25 mmol/l) et gardées une heure dans la glace.

Les cellules sont ensuite soniquées et les débris retirés par centrifugation pendant 10 minutes à 13000 RPM à 4°C. Une résine Talon™ est ensuite préparée avec 0,3 mL de résine dans 3 mL de tampon de lyse. Toute la suspension est ensuite déposée sur la résine et incubés 20 minutes à température ambiante avant d'être centrifugés 5 minutes à 2500 RPM à 4°C. Le culot est lavé avec 10 fois le volume de résine avec du tampon de lyse et incubé pendent 10 minutes à température ambiante. L'opération est répétée avec le tampon de lyse qui contient 15 mM d'imidazole. Puis le culot est lavé avec 500 μΙ d'imidazole à 200 mM. Le tout est recentrifugé pendant 5 minutes à 2500 RPM à 4 °C. Lesurnageant est récupéré donnant l'élution

1 . L'opération est renouvelée donnant une élution 2. Les protéines purifiées se retrouvent dans les différentes élutions qui seront testées.

Méthodes analytiques

Pour doser les produits de la voie synthétique à partir des surnageants de cultures, une HPLC (Ultimate 3000, Dionex) équipée d'un autosampler et d'un four (Shimadzu CTO-20A) et couplés au détecteur RID-10A (Shimadzu) et UV SPD-20A (Shimadzu) a été utilisée. Les composés ont été séparés sur une colonne Aminex HPX-87H (300mm x 7,8 mm) équipée d'une pré-colonne (Aminex). Les analyses ont été réalisées à une température de 35 °C avec un débit de 0,5 ml/min d'H 2 S0 4 à 1 .25 mM. Des échantillons de 20 μΙ ont été injectés dans l'appareil.

Exemple 1 : Démonstration des activités (D)-xylulose-l -kinase et (L)-ribulose-l-kinase.

Clonage des xylulokinases candidates : khkC, rhaB et fucKdans pET28a

Le clonage des gènes khkC (SEQ ID N ° 1 ), rhaB (SEQ ID N °6) el fucK (SEQ ID N °5) dans pET28a a été réalisée comme indiqué ci-dessous. Le gène khk-C a été digéré à partir du pET1 1 a -khk-C (Asipu et al., 2003) par Ndel/EcoRI . Il a été inséré par ligation grâce à la ligase T4 (Biolabs) à la suite du tag-histidine du pET28a préalablement digéré par ces mêmes enzymes. Le clonage de rhaB et fucK a été réalisé en amplifiant par PCR rhaB et fucK à partir de l'ADN génomique d'E. coli avec les primers suivant, respectivement P1 /P2; P3/P4 listés dans tableau 3. Les fragments ont ensuite été clonés dans le vecteur pGEM-T (Invitrogen). Ils ont ensuite été digérés par Ncol et BamHI puis ligué dans le plasmide pET28a au niveau de MCS préalablement digéré par ces mêmes enzymes. Le produit de ligation est transformé dans une souche BL21 (DE3) d'E coli. Les vecteurs pET28-khk-C, pET28-rhaB, et pET28-fucK ainsi obtenus ont été vérifiés par séquençage de contenir les gènes avec les séquences correctes. Détermination des paramètres cinétiques des (D)-xylulokinases et de (L)-ribulokinase candidates

Les protéines ont été exprimées et purifiées comme décrit précédemment et les paramètres cinétiques des enzymes ont été déterminés par la réaction de couplage pyruvate kinase/ lactate déhydrogénase reposant sur le principe suivant (l'exemple donné correspond au dosage d'une activité (D)-xylulose-l P aldolase):

Xylulose kinase : (D)-Xylulose + ATP -» (D)- xylulose-1 P + ADP

Pyruvate kinase: phosphoénolpyruvate + ADP -> pyruvate + ATP

Lactate déhydrogénase: pyruvate + NADH -> lactate + NAD

La réaction a été réalisée dans le mélange suivant : NADH 0, 4 mM (Sigma), PEP 2 mM (Sigma), ATP 4 mM (Sigma) dans un tampon Hépès (90 mM Hepes, 77 mM KCI, 12 mM MgCI 2 , ajusté à pH 7 avec une solution de KOH). Un volume de 1 ,25 μΙ d'un mélange enzymes pyruvate kinase/ lactate déhydrogénase (Sigma) est ajouté dans un mélange réactionnel total de 250 μΙ. La réaction démarre avec l'ajout de 100 μΙ de (D)-xylulose (Carbosynth) ou de (L)- ribulose (Sigma) 10 mM. La consommation du NADH a été suivie par spectrofluorimètre à 340 nm.

Tableau 1 A. Paramètres cinétiques des kinases sur leur substrat naturel et sur (D)- xylulose. Les substrats naturels de Khk-C, RhaB et FucK sont respectivement le fructose, le rhamnulose et le fuculose.

Ces résultats montrent que des kinases ayant la capacité de phosphoryler le (D)- xylulose en position 1 peuvent être identifiées.

La même approche a été utilisée pour caractériser ces paramètres sur (L)-ribulose: Enzyme candidate Substrat naturel (L)-ribulose

Vmax Km Vmax Km

[U/mg] [m M] [U/mg] [m M]

Ketohexokinase, Khk-C, H.

6,59 ± 1 ,4 0,31 ± 0,1

sapiens 3,5 0,55

Tableau 1 B. Paramètres cinétiques des kinases sur son substrat naturel et sur (L)- ribulose.

La Khk-C est fonctionnelle à la fois sur (D)-xylose et sur (L)-ribulose et présente des caractéristiques appropriées pour son utilisation dans la voie synthétique.

Exemple 2 : Démonstration des activités (D)-xylulose-I P-aldolase et (L)-ribulose-l P- aldolase.

Clonage des gènes codant pour les aldolases candidates AldoB, FbaB et AgaY

Le clonage des aldolases candidates s'est fait en amplifiant par PCR aldoB, fbaB et agaY (en utilisant respectivement les paires de primers P5/P6, P7/P8 et P1 1/P12 listés dans le tableau 3). Cette amplification a été réalisée à partir du plasmide peX-A-aldoB portant aldoB avec optimisation de codons (Eurofins) ou de l'ADN génomique d'E. coli pour fbaB et agaY respectivement. Les fragments ont ensuite été clonés dans pGEM (Invitrogen). Ils ont ensuite été digérés par BamHI et Hindlll (pour aldoB) ou Ndel et BamHI (pour fbaB et agaY) puis ligués dans le plasmide pET28a au niveau de MCS préalablement digéré par BamHI et Hindlll ou Ndel et BamHI pour cloner respectivement aldoB (SEQ ID N °2) ou fbaB (SEQ ID N °9) e\ agaY (SEQ ID N °8). Le produit de ligation est transformé dans la souche BL21 (DE3) d'E coli. Les vecteurs pET28-aldoB, pET28-fbaB, et pET28-agaY ainsi obtenues ont été vérifiés par séquençage de contenir les gènes avec les séquences correctes.

Détermination des paramètres cinétiques des (D)-xylulose- l -phosphate aldolases et (L)- ri bu loi-phosphate aldolases candidates

Les protéines ont été exprimées et purifiées comme décrit précédemment et les paramètres cinétiques des enzymes ont été déterminés sur (D)-fructose-l ,6bP, (D)-xylulose-l P et (L)-ribulose-l P reposant sur le principe suivant (l'exemple donné correspond au dosage d'une activité (L)-ribulose-I P aldolase).

(L)-ribulose-l kinase : (L)-ribulose + ATP -> (L)-ribulose-l P + ADP

(L)-ribulose-I P aldolase: (L)-ribulose-l P -> DHAP + glycolaldehyde

Glycerol-3P dehydrogenase: DHAP + NADH Glycerol-3P + NAD La réaction a été réalisée dans le mélange suivant : NADH 0, 4 mM, PEP 2 mM, ATP 4 mM (tous Sigma) dans un tampon Hépès (90 mM Hepes, 77 mM KCI, 6, 8 mM MgCI 2 , ajusté à pH 7 avec une solution de KOH). Les enzymes Khk-C purifiées et GldA (Glycerol déhydrogénase de Cellulomonas sp. Sigma) sont ajoutées à hauteur de 15 μΙ de Khk-C (0,005 U) et 4 μΙ d'une solution concentrée à 84 U/ mg de GldA pour un mélange réactionnel total de 250 μΙ. La réaction a été démarrée avec l'ajout de 100 μΙ de D-xylulose ou du (L)-ribulose (Sigma) 20 mM. La consommation du NADH a été suivie par spectrofluorimètre à 340 nm.

Tableau 2A. Paramètres cinétiques d'aldolases sur (D)-fructose-l ,6 bisphosphate et sur (D)-xylulose-l -phosphate.

Tableau 2B. Paramètres cinétiques d'aldolases sur (D)-fructose-l ,6 bisphosphate et sur (L)-ribulose-l -phosphate.

AldoB possède une activité sur (D)-xylulose-l -P et peut donc être utilisé pour la voie synthétique d'assimilation du xylose. FbaB possède une activité sur (D)-xylulose-l P et (L)- ribulose-1 P et peut donc être utilisée pour la construction d'une voie synthétique pour l'assimilation du (D)-xylose ou du (L)-arabinose. Exemple 3 : Fonctionnement in vitro de la voie métabolique synthétique d'assimilation des pentoses.

Fonctionnement in vitro de la voie métabolique synthétique d'assimilation du (D)-xylose

La voie métabolique d'assimilation du D-xylose a été reconstituée in vitro à partir d'enzymes purifiées (commerciales et exprimées puis purifiées à partir d'E. coli) à partir du (D)- xylulose pour démontrer son fonctionnement par la production de l'éthylène glycol (Figure 1 ).

Les enzymes utilisées pour la mise en œuvre de la voie métabolique synthétique ont été les suivantes :

- Khk-C (Kétohexokinase IH.sapiens), codée par le gène khkC de séquence SEQ ID N ° 1 ou KHK-A (Prospecbio) ;

- Aldolase B (AldoB IH.sapiens), codée par le gène aldoB de séquence SEQ ID N °2 ou aldolase de lapin (Sigma-Aldrich-A2714) ;

- Glycérol déshydrogénase Cellulomonas sp. (Sigma-aldrich/ G3512-250U).

Le milieu réactionnel comprenait le tampon Hepes (90 mM Hepes ; 77 mM KCL ; 6, 8 mM MgCI 2 ) à pH = 7 ; 4 mM ATP ; 0,4 mM NADH ; 0,005 Unité/ml Khk-A (Prospecbio) ou Khk-C (purifiée depuis pET28a); 1 Unité/ml aldolase (AldoB, Sigma A6338), et 1 Unité/ml GldA (Sigma- G3512-250U). La réaction a été démarrée par l'ajout de 5 mM (D)-xylulose (Cabosynth). Après un temps d'incubation de 3 h, l'éthylène glycol produit au cours de la réaction a été quantifié par HPLC (Figure 2).

L'apparition de l'éthylène glycol dans la réaction qui contient la (D)-xylulose-l -kinase, la (D)- xylulose-1 P aldolase et la glycolaldéhyde réductase démontre le fonctionnement de la voie synthétique.

Fonctionnement in vitro de la voie métabolique d'assimilation du (L)-arabinose

La voie métabolique d'assimilation du (L)-arabinose a été reconstituée in vitro à partir d'enzymes purifiées (commerciales et exprimées puis purifiées à partir de E. coli) à partir du (L)- ribulose.

Le fonctionnement de la voie a été vérifié par la mesure en HPLC de l'éthylène glycol produit.

Les enzymes utilisées pour la mise en œuvre de la voie métabolique synthétique ont été les suivantes :

- Khk-C (Kétohexokinase IH.sapiens), codée par le gène khkC de séquence SEQ ID N ° 1 ;

- FbaB (Fructose 1 ,6-bisphosphate aldolase, E. coli) codée par le gène fbaB, de séquence SEQ ID N °9 ;

- GldA (Glycérol déhydrogénase Cellulomonas sp. (Sigma-aldrich/ G3512-250U).

Les enzymes ont été incubées dans le milieu réactionnel contenant: 0.4 mM de NADH, 4 mM d'ATP, un tampon Hépès pH 7 (55 mM Hépès, 45 mM KCI, 4 mM MgCI 2 ajusté à pH 7 avec du KOH) pour un volume final de 500 μΙ. Khk-C a été rajouté à 0,005 Unité/ml tandis que FbaB à 100 ml. GldA a été ajouté à 1 U/ ml. La réaction a été démarrée par ajout de 20 mM de L- ribulose (Sigma-Aldrich). Après un temps d'incubation de 3 h, l'éthylène glycol produit au cours de la réaction a été quantifié par HPLC. Les résultats sont présentés en figure 3.

L'apparition de l'éthylène glycol dans la réaction qui contient la (L)-ribulose-l -kinase, la (L)- ribulose-1 P aldolase et la glycolaldéhyde réductase démontre le fonctionnement de la voie synthétique.

Exemple 4 : Fonctionnement in vivo de la voie métabolique synthétique d'assimilation du (D)-xylose.

Clonage des gènes de la voie synthétique en opéron

Les gènes H. sapiens khk-C, codant pour isoforme C de l'enzyme kétohexokinase (Khk), de séquence SEQ ID N° 1 eX aldoB codant pour l'isoforme B de la fructose -1 ,6 aldolase de séquence SEQ ID N °2 ont été clonés en opéron sur un plasmide pEXT20 (Dykxhoorn, (1996).) sous contrôle d'un promoteur inductible à l'IPTG construit comme suit. Le gène humain khk-C a été fourni par le Dr. Asipu (Asipu et ai, 2003) et amplifié avec les amorces P13 et P14 (Tableau 3). L'aldolase a été synthétisée avec une optimisation de codons pour E. coli par Eurofins™ et amplifiée par PCR avec les amorces P15 et P16 (Tableau 3). Les amorces pour l'amplification des deux gènes ont été conçues pour donner des fragments PCR qui peuvent être utilisés avec le kit In-Fusion de Clonetech par l'addition d'une queue de 17 nt d'homologie avec le fragment adjacent. Un RBS canonique (AGGAGG) a été ajouté aux séquences de khk-C et aldoB. Le plasmide pEXT20 a été digéré par les enzymes de restriction BamHI et Sacl. Le kit In-Fusion de Clonetech a été utilisé pour liguer par recombinaison les deux fragments de PCR et le pEXT20 linéarisé donnant le plasmide pEXT20-/< 7/<-C-a/ctoe. Le vecteur pEXT20-/c ?/i-C-a/c oe ainsi obtenue a été vérifié par séquençage de contenir les gènes avec les séquences correctes. Ce plasmide a été transformé dans une souche AxylB de E. coli MG1655, dans laquelle xylB, de séquence SEQ ID53, codant pour la xylulose-5-kinase était délété. Les deux gènes khk-c et aldoB ont également été clonés individuellement sur le pEXT20 en étant d'abord amplifié par P60 et P61 et P62 et P63 respectivement puis ligué dans pEXT20 par restriction avec les enzymes BamHI et Sali donnant les plasmides pEXT20-/c ?/i-C et pEXT20-a/cfoS.

Test de la voie synthétique par suivi de la croissance d'une souche AxylB sur (D)-xylose

La croissance bactérienne ainsi que la production d'éthylène glycol a été testée en milieu liquide M9 comprenant 120 mM (D)-xylose en tant que seul source carbonée, en présence d'IPTG.

Pour contrôler la capacité de souches ne possédant pas la voie d'assimilation naturelle du (D)-xylose à pousser en présence de (D)-xylose, les souches MG1655, MG1655 AxylB et MG1655 AxylB portant le pEXT20- khk-C, pEXT20-aldoB ou pEXT20- khk-C-aldoB ont été testées. Sans la voie synthétique, seule la souche sauvage pousse dans ces conditions. La perte de XylB ne permet pas la croissance sur xylose. De plus, ni la présence de Khk-C, ni la présence d'AldoB ne permet pas de restaurer une croissance par l'utilisation de la voie naturelle d'assimilation du xylose (Figure 4). En revanche la souche MG1655 AxylB, qui porte le plasmide pEXT20-khkC-aldoB, a été capable de pousser sur xylose.

En suivant la production de métabolites durant la croissance par HPLC, l'éthylène glycol a été identifié comme produit majeur de la fermentation du xylose en passant par la voie synthétique produit avec un rendement de 0,45 mol par mol xylose (0.19 g EG par g xylose) (Figure 5).

La voie synthétique d'assimilation du (D)-xylose est donc fonctionnelle in vivo et restaure la croissance d'un mutant AxylB sur ce même sucre.

Exemple 5 : Identification de la glycolaldéhyde réductase principale

L'optimisation de la production d'éthylène glycol dépend de l'identification et la surexpression de la glycolaldéhyde réductase responsable de la conversion du glycolaldéhyde en éthylène glycol. Plusieurs oxydoréductases ayant une activité sur glycolaldéhyde naturellement présentes chez E. coli, GldA, YqhD, FucO, DkgA, DkgB, YghZ, YeaE, YajO ont été identifiées (Lee et al., 2013). Des mutants de ces gènes récupérés de la collection KEIO pour déterminer si l'un de ces gènes code pour la glycolaldéhyde réductase principale. Pour cela, la capacité de ces mutants à générer de l'éthylène glycol à partir de glycolaldéhyde est testée. Ces souches ont été cultivées en milieu M9 en présence de 133 mM xylose et lorsque la DOeoonm atteint 1 , les cellules ont été exposées à 10 mM de glycolaldéhyde. La quantité d'éthylène glycol a ensuite été mesurée par HPLC après 12 h de culture.

L'absence d'YqhD diminue drastiquement la production d'éthylène glycol à partir du glycolaldéhyde (Figure 6) suggérant qu'elle est la glycolaldéhyde réductase principale chez E coli dans nos conditions de culture.

Exemple 6 : Optimisation de la souche pour la production de l'éthylène glycol par la voie synthétique de l'invention

Pour améliorer la production d'éthylène glycol, la glycolaldéhyde réductase principale est surexprimée sur un plasmide pACT3. Pour cela, yqhD (SEQ ID N °4) a été amplifié avec P1 1 et P12 puis cloné dans le pACT3 par in fusion, préalablement digéré par Pstl et Hindlll. L'insertion d'yqhD dans le pACT3 linéarisé a été effectuée par recombinaison grâce au kit In- Fusion (Clonetech), donnant le plasmide pACT3-yqhD. Le vecteur pACT3-yqhD ainsi obtenu a été vérifié par séquençage. Le produit de ligation a été ensuite transformé dans les souches MG1655 d'intérêt. De la même manière, gldA (SEQ ID 51 ) et fucO (SEQ ID 52) (respectivement amplifiés par P24 et P25 ; et P26 et P27), ont été clonés par In-Fusion dans le pACT3 préalablement digéré par Pstl et Hindlll afin de tester leur effet. Dans nos conditions de culture, la réductase majeure du glycolaldéhyde est YqhD mais ni sa surexpression ni celle des autres réductases GldA et FucO n'augmentent la production d'éthylène glycol. Le rendement n'est en effet que de 0,45 mol/ mol de xylose (0.19 g EG par g xylose), un rendement comparable à celui de la souche MG1655 AxylB qui exprime le plasmide pEXT20- khkC-aldoB (Figure 7).

Pour augmenter la production d'éthylène glycol, la voie de l'oxydation du glycolaldéhyde en acide glycolique doit être bloquée. Pour cela, l'impact de la délétion du gène de l'aldéhyde déhydrogénase AldA (SEQ ID N °3) a été testée. Pour quantifier la procuction résiduelle de l'acide glycolique, la reconsommation de cet acide a été bloquée par l'inactivation de la glycolate déhydrogénase (voir exemple 7) par la délétion de sa sous-unité GIcD (codée par le gène de séquence SEQ ID N °7). Les délétions de aldA et/ ou glcD dans une souche AxylB ont donc été entreprises par transduction depuis une souche KEIO. Ces constructions donnent les souches MG1655 AxylB AaldA et MG1655 AxylB AaldA AglcD qui sont ensuite transformées par pEXT20- khkC-aldoB.

Grâce à la délétion d'aldA, le rendement de l'EG augmente fortement. En effet, la souche MG1655 AxylB AaldA portant le plasmide pEXT20- khkC-aldoB produit de l'éthylène glycol jusqu'à un rendement de 0,88 mol par mol xylose (0.36 g EG par g xylose)(Figure 7). La surexpression de YqhD et FucO dans ces conditions permet d'atteindre un rendement de 0,9 et 0,94 respectivement mol/ mol (0.38 et 0.39 g EG par g xylose, respectivement). Ceci est très proche du rendement théorique maximal attendu qui est de 1 mol/ mol.

Exemple 7 : Optimisation de la souche pour la production de l'acide glycolique par la voie synthétique d'assimilation du D-xylose

Pour augmenter la production de l'acide glycolique via la voie synthétique de l'assimilation de pentoses, la glycolaldéhyde déhydrogénase AldA de E. coli a été surexprimée. Pour cela, aldA a été amplifié depuis de l'ADN génomique de E. coli MG1655 en utilisant la paire de primers (P17 et P18, Tableau 3) et le fragment obtenu a été ligué dans pGEM-T (Promega) selon les instructions du fabricant. Le fragment a été ensuite digéré par les enzymes Kpnl et Hindlll puis ligué dans le pACT3 lui-même linéarisé par les deux mêmes enzymes. Le vecteur pACT3-aldA ainsi obtenue a été vérifié par séquençage de contenir le gène avec la séquence correcte. pACT3-aldA a été ensuite transformé dans la souche MG1655 AxylB pEXT20-khk-C-aldoB donnant la souche AxylB pEXT20-khk-C-aldoB pACT3-aldA. Lors de la mise en culture de cette souche sur un milieu M9 + 10 g/lxylose, la production de l'éthylène glycol a diminuée significativement (rendement de 0,2 mol/mol) mais la production de l'acide glycolique a augmentée seulement transitoirement indiquant la reconsommation de l'acide glycolique produite (Figure 8). Pour empêcher la reconsommation de l'acide glycolique, la glycolate oxydase, codée par glcDEF, a été atténuée. Pour cela, la souche MG1655 AxylB AglcD a été construite par délétion de glcD (SEQ ID N °7) via transduction de la mutation depus une souche de la collection KEIO. La souche MG1655 AxylB AglcD a été transformée avec des plasmides pEXT20-khkC-aldoB, ou pEXT20-aldA-khkC-aldoB. Ce plasmide a été construit à partir du pEXT20-khkC-aldoB clivé par les enzymes de restriction EcoRI et Smal auquel a été cloné par la méthode in fusion le gène aldA avec un RBS en amont. Ce gène a été lui-même amplifié par PCR grâce aux primers P24 et P25. Lors de la mise en culture de cette souche contenant pEXT20-khkC-aldoB sur un milieu M9-xylose (10 g/l), la production de l'acide glycolique a augmentée significativement et atteint un rendement de 0,35 mol/mol (0.19 g AG par g xylose) (Figure 8). Lorsque aldA est surexprimé à partir du pEXT20, le rendement atteint 0,92 mol/ mol de xylose (0.47 g AG par g xylose).

La délétion de glcD permet une accumulation de l'acide glycolique grâce à la surexpression d'aldA en utilisant 92 % du flux de carbone provenant de la partie C2 du xylose.

Exemple 8 : Optimisation de la souche pour la production de l'acide glycolique via le cycle du glyoxylate

La production de l'acide glycolique peut être encore augmentée en combinant le fonctionnement de la voie synthétique optimisée comme décrit ci-dessus avec des interventions génétiques qui conduisent à la production de l'acide glycolique via la voie de glyoxylate comme décrit dans les brevets : US20090155867 (Soucaille, 2009) et US20120315682 (Dischert et al., 2012). En s'appuyant sur ces données publiées, les gènes aceB et glcB, codant pour des malate synthases, le gène glc codant pour glyoxylate carboligase, le gène arcA codant pour un répresseur de la réponse aérobie et le gène icd codant pour une isocitrate deshydrogénase ont été délétés par le protocole de transduction de phage P1 dans la souche MG1655. L'opéron glcDEFG codant pour une glycolate oxidase, edd-eda codant pour respectivement une phosphogluconate dehydratase et la Entner-Doudoroff Aldolase ainsi que icIR, codant pour le répresseur transcriptionel de la voie du glyoxylate, ont été délétés grâce à la méthode de délétion de Datsenko (Datsenko et al., 2000) en utilisant les primers P52 et P53 et P54 et P55 et 64 et 65 respectivement. Des plasmides pour la surexpression parallèle de l'isocitrate lyase, codée par aceA et de la glyoxylate reductase, codée par ghrA (ou ycdW) ont été construits pour améliorer la production d'acide glycolique via les cycles de Krebs et du glyoxylate. Pour cela, un plasmide pACT3 a été digéré par les enzymes BamHI et Hindi II. Le gène ghrA a été amplifié par PCR comme décrit précédemment en utilisant la paire de primer P40 et P41 tandis que le gène aceA a été amplifié par la paire d'amorces P21 et P22. Les deux fragments amplifiés et le plasmide linéarisé ont été ligués ensemble par l'utilisation du kit In-Fusion (Clonetech). Cette construction a donné le plasmide pACJ3-ghrA-aceA. Ce plasmide est ensuite transformé dans la souche qui porte les délétions AaceB AgIcDEFGB Agcl Aedd-eda AicIR AarcA Aicd. La souche résultante est la souche 1054. Lorsque cette souche est mise en culture sur M9 + glucose, 1 ,17 mol/ mol d'acide glycolique (0,49 g AG par g glucose)sont produits sans production d'acétate (Tableau 6).

Tableau 6. Production d'acide glycolique et d'acétate de souches d'E. coli AaceB AgIcDEFGB Agcl Aedd-eda AicIR avec des mutations additionnelles en milieu M9 + 1 % glucose

Exemple 9 : Optimisation de la souche pour la production d'acide glycolique via la co- utilisation du cycle du glyoxylate et de la voie synthétique d'assimilation du (D)-xylose sur glucose et D-xylose

Pour l'application de la voie synthétique d'assimilation de xylose décrite dans ce document, il est préférable de réaliser la production de l'acide glycolique sur des hydrolysats cellulosiques ou hemicellulosiques qui contiennent typiquement du glucose et du xylose en pourcentages différents. Pour démontrer que le rendement de l'acide glycolique sur un substrat qui contient à la fois le sucres glucose et xylose peut être augmenté grâce à la production simultanée de l'acide glycolique via la voie synthétique et via le cycle glyoxylate une souche qui co-exprime les deux voies simultanément a été construite. La souche E. coli AxylB AaceB AgIcDEFGB Agcl Aedd-eda AicIR AarcA Aicd est co-transformée par les plasmides pACT3— ghrA-aceA et pEXT20- khk-c-aldoB-aldA. La souche ainsi obtenue est la souche 905. Le suivi de production d'acide glycolique par HPLC a été réalisé lors d'une croissance de cette souche sur milieu minéral M9 + 0,1 % d'extraits de levures + 0,2% de tryptone et en présence de 0,25% glucose et de 0,5% xylose (Figure 9)

AarcA Aicd pEXT20-khkC-aldoB- aldA

979 AxylB AaceB AglcDEFGB Agcl Aedd-eda AiclR pACT3- aceA ghrA 0,66

AarcA Aicd proD :galP pEXT20-khkC-aldoB- aldA

Tableau 7. Production d'acide glycolique de souches d'E. coli en milieu M9 + 2.5 g/1 glucose + 5 g/1 (D)-xylose + 1 g/l extrait de levures + 2 g/l tryptone. proD :galP - galP surexprimé avec le promoteur proD constitutif (Davis et al., 201 1 )( ** ) Rendement calculé sur la base de sucre total consommé

La souche consomme d'abord le glucose et ensuite le xylose malgré l'absence de xylB montrant ainsi que la voie synthétique est active même dans ces conditions. Après 100 h de culture, 2,35 g/L d'acide glycolique sont produits par la souche avec un rendement sur le sucre utilisé total de 0, 51 g/g (tableau 7). Ce rendement est supérieur à celui obtenu avec une souche quasi-isogénique qui ne possédaient pas la voie synthétique d'assimilation du (D)- xylose (tableau 7, souche 1054), ou qui ne portait pas la délétion du gène xylB qui code pour l'enzyme qui catalyse l'entrée dans la voie naturelle d'assimilation du (D)-xylose (tableau 7, souche 1044).

Le taux d'assimilation de xylose après la consommation totale du glucose restait relativement faible avec une valeur d'environ 0.19 mmol/(l h). Pour accélérer l'assimilation du xylose, l'expression de la perméase de sucres galP a été rendue constitutive en utilisant la méthode suivante : un fragment d'ADN codant pour le promoteur constitutif proD décrit par Davis (Davis et ai, 201 1 ) et synthétisé par Eurofins (SEQ ID 90) à été amplifié avec des amorces P56 et P57. Une cassette d'expression du gène kan à été amplifiée en utilisant les amorces P58 et P59 et le plasmide pKD4 (SEQ ID 95) comme matrice. Les deux fragments de PCR ont été fusionnés par un overlap extension PCR en utilisant les amorces P59 et P57. Le produit de PCR ainsi obtenu a été transformé dans la souche 905 en utilisant la méthode de Datsenko et Wanner (Datsenko et al., 2000). Des clones résistants à la kanamycine ont été récupérés et vérifiés comme contenant le promoteur synthétique et constitutif devant galP.

La nouvelle souche ainsi obtenue est co-transformée par pACT3 aceA-ghrA et pEXT20- khk-C-aldoB-aldA donnant la souche 979. Sa croissance et le suivi de production d'acide glycolique par HPLC ont été réalisés sur un milieu minéral M9 + 0,1 % extrait de levure + 0,2 % tryptone et en présence de 0,25 % glucose et de 0,5 % xylose (Figure 10).

La souche accumule 3,84 g/L d'acide glycolique avec un rendement de 0,66 g/g sur sucre total. Le taux d'assimilation de xylose après la consommation totale du glucose a été augmenté grâce à la surexpression de GalP et il atteint une valeur de 0.32 mmol/ (I h).

Exemple 10 : Expression de la voie synthétique d'assimilation du xylose chez Saccharomyces cerevisiae Pour tester la portabilité de la voie synthétique d'assimilation du xylose, nous avons testé son expression dans un autre micro-organisme d'intérêt, la levure Saccharomyces cerevisiae.

S. cerevisiae ne possède pas de système enzymatique naturel pour convertir le (D)- xylose en (D)-xylulose, et n'est donc pas capable de pousser sur ce sucre. Deux voies métaboliques sont typiquement exprimées de façon hétérologue chez cette levure pour réaliser la conversion du (D)-xylose en (D)-xylulose et pour faciliter sa croissance sur xylose. La xylose isomerase (XI) catalyse la conversion de xylose en xylulose directe et de façon redox-neutre. Comme alternative, l'action séquentielle de la xylose reductase (XR) et de la xylitol déshydrogénase (XDH) permet aussi une conversion de xylose en xylulose, en utilisant les cofacteurs NADPH et NAD, respectivement. Pour montrer le fonctionnement de la voie synthétique d'assimilation du xylose chez la levure, cette voie synthétique a été complétée soit par une xylose isomerase, soit par le système XR/XDH.

Pour compléter la voie synthétique d'assimilation du xylose avec une XI, la XI de Clostridium phytofermentans codon optimisée pour S. cerevisiae conçue par l'équipe d'Eckhard Boles (Brat et al., 2009) a été utilisée. khk-C a été exprimé sous contrôle du promoteur de la triose phosphate isomérase Tpi (Ptpi: SEQ ID N ° 15) et utilisé le terminateur Trk1 (SEQ ID N ° 12).

Le gène de l'aldolase AldoB a été placé sous contrôle du promoteur de l'aldolase naturelle de S. cerevisiae (pFab: SEQ ID N ° 14) et un terminateur Tlk1 (SEQ ID N ° 13) a également été utilisé.

Ces gènes ont été clonés par recombinaison chez la levure dans le plasmide p425 linéarisé par Kpnl et Hindlll donnant p425-khk-aldoB en utilisant les primers suivant (voir également le tableau 4) : P1 ' et P2' pour Ptp\, P3' et P4' pour khk-C, P5' et P6' pour Trk1, P7' et P8' pour pFab, P'9 et ΡΊ 0 pour aldoB et ΡΊ 1 et ΡΊ 2 pour tlkl.

Le plasmide p425-khk-aldoB a ensuite été utilisé dans une souche compétente incapable de pousser sur xylose, car muté pour sa xylulose kinase naturelle, Xks1 (SEQ ID 89).

Une co-transformation avec un plasmide construit par l'équipe d'Eckhard Boles contenant à la fois la xylulose isomérase et un transporteur xylose Gal-2 a ainsi été réalisée dans la souche CEN.PK-2 xks1-.

La capacité de la souche à pousser en milieu minimum contenant uniquement du xylose a été testé (Figure 1 1 ).

Dans ce cas, alors que le mutant xks1 n'est pas capable de pousser sur D-xylose, le mutant xks1 portant la voie synthétique voit sa croissance restaurée indiquant que la voie est fonctionnelle chez la levure.

L'utilisation d'une XI n'est pas le seul moyen possible pour assimiler le xylose en le convertissant en xylulose. En effet, suite à une réaction de réduction catalysée par une xylose réductase (XR) et à une déshydrogénation du xylitol ainsi obtenue catalysée par une xylitol déshydrogénase (XDH), du xylulose est obtenu. Nous avons donc utilisé la souche TMB3001 de (Eliasson et al., 2000) exprimant le système XR/XDH pour tester si la voie synthétique est capable d'être utilisée dans ces conditions pour assimiler le xylose. Un mutant xksV a été construit dans la souche TMB3001 en transformant un fragment PCR contenant des bords flanquants homologues aux extrémités non codantes de xks1 pour générer une délétion par recombinaison homologue. Le fragment PCR est amplifié à partir de la souche BY de la Yeast collection knockout (YKO) (Winzeler et al. 1999) avec les primers P26' et P27' et contient une cassette karM pour la sélection des recombinants. La voie synthétique est éxprimée dans le plasmide pYCP-khk-C-aldoB construit de la façon suivante. Le plasmide pYCP-TPS1 (SEQ ID N °80) a été digéré par Agel et Xbal pour en extraie la cassette TPS1 . Des primers Fw pTpi et rev Tlk1 sont designés pour avoir une queue flottante de 40 nucléotides homologues au plasmide pYCP linéarisé par Agel et Xbal afin de pouvoir se recombiner dans le plasmide. Nous avons ensuite exprimé khk-C codon optimisé pour la levure (SEQ ID N °83) amplifé par P15' et P16' sous contrôle du promoteur de la triose phosphate isomérase Tpi (amplifié par P13' et P14') et du terminateur Trk1 (amplifié par P17' et P18') et exprimé l'aldolase aldoB codon optimisé pour la levure (SEQ ID N °84) amplifé pa P21 ' et P22' sous contrôle du promoteur de l'aldolase naturelle de S. cerevisiae pFbaBI (amplifié par P19' et P20') et du terminateur Tlk1 (amplifié par P23' et P24'). Ces constructions ont été clonées par recombinaison chez la levure dans le plasmide pYCP donnant pYCP-khk-C-aldoB. Ce plasmide a ensuite été utilisé dans la souche TMB3001 xksV incapable de pousser sur xylose car mutée pour la xylulose kinase, Xks1 .

Alors qu'un mutant TMB3001 xksV a perdu sa capacité à pousser sur xylose contrairement à la souche ΤΜΒ30Ό1 , la souche TMB3001 xksV portant pYCP-khk-C-aldoB retrouve une croissance sur xylose (Figure 12). Ceci suggère que la voie synthétique est également fonctionnelle dans une souche assimilant le xylose via le système XR/XDH.

Exemple 11 : Fonctionnement in vivo de la voie métabolique synthétique d'assimilation du (L)-arabinose.

Clonage des gènes de la voie synthétique en opéron

Les gènes H. sapiens khk-C, codant pour isoforme C de l'enzyme kétohexokinase (Khk) de séquence SEQ ID N ° 1 e\fbaB codant pour une fructose- 1 ,6-bisphosphate aldolase isoforme B d'E. coli de séquence SEQ ID N °9 ont été clonées en opéron sur un plasmide pEXT20 (Dykxhoorn et al., 1996) sous contrôle d'un promoteur inductible à l'IPTG construit comme suit. Le gène humain khk-C a été fourni par le Dr. Asipu (Asipu et al., 2003) et amplifié avec les amorces P13 et P14 (Tableau 3). L'aldolase a été amplifiée à partir d'ADN génomique de E. coli de la souche MG1655 avec les primers P28 et P29 (Tableau 3). Les amorces pour l'amplification de ces deux gènes ont été conçues pour donner des fragments PCR qui peuvent être utilisés avec le kit In-Fusion de Clonetech par l'addition d'une queue de 17 nucléotides d'homologie avec le fragment adjacent. Des RBS ont été choisis grâce à logiciel RBS calculator (Salis et ai, 201 1 ). Le gène fbaB est donc précédé d'un RBS de séquence (TTAGGAGGTATACT) prédit pour donner une expression maximale et khk-C est précédé par un RBS de séquence (ACAGCTTTTAATTATACACTTTAAGGAGGACAGAC) prédit pour minimiser l'expression. Les amorces pour l'amplification des deux gènes avec les nouveaux RBS (P30 et P22 pour khk-C et P31 et P32 pour fbaB) ont été conçues pour donner des fragments PCR qui peuvent être utilisés avec le kit de fusion par l'addition d'une queue de 15 nucléotides d'homologie avec le fragment adjacent. Le plasmide pEXT20 a été digéré par les enzymes de restriction BamHI et Sali. Le kit In-Fusion de Clonetech a été utilisé pour liguer par recombinaison les deux fragments de PCR et le pEXT20 linéarisé donnant le plasmide pEXT20-khk-C-RBSmax-fbaB. Le plasmide pEXT20-fcWc-C-RBSmax-/i aS est transformé dans MG1655 AaraB. Le vecteur pEXT20-khk-C-RBSmax-fbaB ainsi obtenue a été vérifié par séquençage. De façon analogue les plasmides pEXT20-/c ?/i-C et pEXT20- ibaS ont été construits, en utilisant les amorces 83/84 et 33/34 (Tableau 3) par In-Fusion. Ces plasmides ont été transformés dans une souche AaraB de E. coli MG1655, dans laquelle araB, de séquence SEQ ID88, codant pour la ribulo-5-kinase est délété.

Test de la voie synthétique par suivi de la croissance d'une souche AaraB sur (L)-arabinose

La croissance bactérienne a été testée en milieu liquide M9 comprenant 60 mM (L)- arabinose en tant que seule source carbonée, en présence d'IPTG. Pour contrôler la capacité des souches ne possédant pas la voie naturelle d'assimilation de l'arabinose à pousser en présence de (L)-arabinose en milieu M9, les souches MG1655 AaraB et MG1655 AaraB portant les plasmides pEXT20-/c ?/c-C, pEXT20-/baS, ou pEXT20-khk-C-RBSmax-fbaB ont été testés. Une pré-culture over-night en LB + 100 μΜ IPTG+ 2 % L-arabinose a été effectuée puis les cellules ont été transférées en milieu M9 + glucose 2 % + arabinose 2 %+ 100 μΜ IPTG à D0 6 oonm=0,2 puis à D0 6 oonm= 1 , les cellules ont été transférées en milieu M9 + L-arabinose 2 %+ 100 μΜ IPTG à D0 60 onm= 0,2. Seule la souche qui exprime simultanément les enzymes KhkC et FbaB, ayant des activités (L)-ribulose-l kinase et (L)-ribulose-l P aldolase, respectivement, pousse dans ces conditions (Figure 13). Ces résultats mettent en évidence le fonctionnement de la voie métabolique synthétique d'assimilation du (L)-arabinose. Tableau 3. Amorces utilisées pour l'expression de la voie chez E. coli

AA Amorces SEQ ID

P1 YC-49 rhaB fw-ndel 16

P2 YC-50 rhaB rev-BamHI 17

P3 FucokinasefwNcol 18

P4 FucokinaserevBamHISall 19

P5 AldoB BamHI Fw 20

P6 AldoB_Hind3_Rv 21

P7 fbaB-Ndel-fw 22

P8 fbaB-BamHI-rev 23

P9 agaY-Ndel-fw 24

P10 agaY-BamHI-rev 25

P1 1 YC73-Fw YqhD 26

P12 YC74-Rev YqhD 27

P13 YC52-fwkhkfu 28

P14 YC53-revkhkfu 29

P15 YC-76 fw AldoB 30

P16 YC-75 fw AldoB 31

P17 aldA_Kpnl_Fw 32

P18 aldA_Hind3_Rv 33

P19 pACT ycdW-Fw 34

P20 pACT ycdW-Rev 35

P21 Operon aceA-Fw 36

P22 pACT aceA-Rev 37

P23 Operon ycdW-Rev 38

P24 gldA_rbs_f 54

P25 gldA_rbs_r 55 P26 fucO_fw_inf 56

P27 fucO_revJnf 57

P28 FbaB oper BamH l_F 58

P29 FbaB_oper_Sall_R 59

P30 khkrbsweak fw 60

P31 fbabrbsmax fw 61

P32 fbabrbsmax rev 62

P33 FbaB inf BamHI F 63

P34 FbaB inf Hind R 64

P40 pACTaceA-Rev 65

P41 Op aceA ghrA-Fw 66

P42 pACT3 ghrA_Xbal-Rev 67

P51 pACTghrA_Xbal-Rev 68

P52 glcDEFGB fw 69

P53 glcDEFGB rev 70

P54 edd edajw 71

P55 edd eda_rev 72

P56 prom galP * fw 73

P57 prom galP * rev 74

P58 disruption k7 fw 75

P59 disruption k7 rev 76

P60 KHK-Cfw 77

P61 KHK-Crev 78

P62 AldoB_RBS_BaHI_F 79

P63 RevAldoB 80

P64 iclR-fw3 81

P65 iclR-rev2 82 Tableau 4. Amorces utilisées pour l'expression de la voie chez S. cerevisiae

Tableau 5 : liste de séquences des gènes

Espèce Gène SEQ ID N °

H. sapiens khkC 1

H. sapiens aldoB 2

E.coli aldA 3

E.coli yqhD 4

E.coli fucK 5

E.coli rhaB 6

E.coli glcD 7

E.coli agaY 8

E.coli fbaB 9

E.coli ghrA 10

E.coli aceA 1 1

S.cerevisiae trk1 12

S.cerevisiae tlkl 13

S.cerevisiae pFab 14

S.cerevisiae pTpi 15

E.coli gldA 51

E.coli fucO 52

E.coli xylB 53

S.cerevisiae Khk-C codon optimisé 97

S.cerevisiae AldoB codon optimisé 98

YCP-Tps1 99

E.coli araB 100

S.cerevisiae xks1 101

E. coli proD 102 Références

Asipu, A., B. E. Hayward, J. O'Reilly, and D. T. Bonthron. 2003. "Properties of normal and mutant recombinant human ketohexokinases and implications for the pathogenesis of essential fructosuria." Diabètes 52 (9):2426-32.

Baba, T., T. Ara, M. Hasegawa, Y. Takai, Y. Okumura, M. Baba, K. A. Datsenko, M.

Tomita, B. L. Wanner, and H. Mori. 2006. "Construction of Escherichia coli K-12 in-frame, single-gene knockout mutants: the Keio collection." Mol Syst Biol

2:2006.0008. doi: 10.1038/msb4100050.

Bais, R., H. M. James, A. M. Rofe, and R. A. Conyers. 1985. "The purification and properties of human liver ketohexokinase. A rôle for ketohexokinase and fructose-bisphosphate aldolase in the metabolic production of oxalate from xylitol." Biochem J 230 (1 ):53-60.

Brat, D., E. Boles, and B. Wiedemann. 2009. "Functional expression of a bacterial xylose isomerase in Saccharomyces cerevisiae." Appl Environ Microbiol 75

(8):2304-1 1 . doi: 10.1 128/aem.02522-08.

Cherepanov, P. P., and W. Wackernagel. 1995. "Gene disruption in Escherichia coli:

TcR and KmR cassettes with the option of Flp-catalyzed excision of the antibiotic-resistance déterminant." Gene 158 (1 ):9-14.

Dagert, M., and S. D. Ehrlich. 1979. "Prolonged incubation in calcium chloride improves the compétence of Escherichia coli cells." Gene 6 (1 ):23-8.

Datsenko, K. A., and B. L. Wanner. 2000. "One-step inactivation of chromosomal gènes in Escherichia coli K-12 using PCR products." Proc Natl Acad Sci U S A 97

(12):6640-5. doi: 10.1073/pnas.120163297.

Davis, J. H., A. J. Rubin, and R. T. Sauer. 201 1 . "Design, construction and characterization of a set of insulated bacterial promoters." Nucleic Acids Res 39

(3) :1 131 -41 . doi: 10.1093/nar/gkq810.

Dischert, W., and P. Soucaille. 2012a. Method for producing high amount of glycolic acid by fermentation. Google Patents.

Dischert, W., and P. Soucaille. 2012b. Method for producing high amount of glycolic acid by fermentation. Google Patents.

Dykxhoorn, D. M., R. St Pierre, and T. Linn. 1996. "A set of compatible tac promoter expression vectors." Gene 177 (1 -2):133-6.

Eliasson, A., C. Christensson, C. F. Wahlbom, and B. Hahn-Hàgerdal. 2000. "Anaerobic xylose fermentation by recombinant Saccharomyces cerevisiae carrying XYL1 ,

XYL2, and XKS1 in minerai médium chemostat cultures." Appl Environ Microbiol

66 (8):3381 -6.

Gietz, R. D., and R. A. Woods. 2002. "Transformation of yeast by lithium acetate/single- stranded carrier DNA/polyethylene glycol method." Methods Enzymol 350:87-96.

Klamt, S., J. Saez-Rodriguez, J. A. Lindquist, L. Simeoni, and E. D. Gilles. 2006. "A methodology for the structural and functional analysis of signaling and regulatory networks." BMC Bioinformatics 7:56. doi: 10.1 186/1471 -2105-7-56.

Lee, C, I. Kim, and C. Park. 2013. "Glyoxal detoxification in Escherichia coli K-12 by NADPH dépendent aldo-keto reductases." J Microbiol 51 (4):527-30. doi: 10.1007/S12275-013-3087-8.

Liu, H., K. R. Ramos, K. N. Valdehuesa, G. M. Nisola, W. K. Lee, and W. J. Chung.

2013. "Biosynthesis of ethylene glycol in Escherichia coli." Appl Microbiol Biotechnol 97 (8):3409-17. doi: 10.1007/s00253-012-4618-7.

Salis, H. M. 201 1 . "The ribosome binding site calculator." Methods Enzymol 498:19-42. doi: 10.1016/B978-0-12-385120-8.00002-4.

Soucaille, P. 2009. Glycolic Acid Production by Fermentation from Renewable Resources. Google Patents.

Stephanopoulos, Gregory (4 Russet Lane, Winchester, MA, 01890, US), Pereira, Brian (1 1 Everett Street, Apt. Ng4Cambridge, MA, 02138, US), DE ME Y, Marjan (Ursulinen Straat 4/1 , Gent, Gent, BE), Dugar, Deepak (69 Chestnut Street, Cambridge, MA, 02139, US), Avalos, José, Luis (65 Walnut Street, Arlington, MA, 02476, US). 2013. Engineering microbes and metabolic pathways for the production of ethylene glycol. Massachusetts Institute of Technology (77 Massachusetts Avenue, Cambridge, MA, 02139, US

Winzeler, E. A., D. D. Shoemaker, A. Astromoff, H. Liang, K. Anderson, B. André, R.

Bangham, R. Benito, J. D. Boeke, H. Bussey, A. M. Chu, C. Connelly, K. Davis, F. Dietrich, S. W. Dow, M. El Bakkoury, F. Foury, S. H. Friend, E. Gentalen, G. Giaever, J. H. Hegemann, T. Jones, M. Laub, H. Liao, N. Liebundguth, D. J. Lockhart, A. Lucau-Danila, M. Lussier, N. M'Rabet, P. Menard, M. Mittmann, C. Pai, C. Rebischung, J. L. Revuelta, L. Riles, C. J. Roberts, P. Ross-MacDonald, B. Scherens, M. Snyder, S. Sookhai-Mahadeo, R. K. Storms, S. Véronneau, M. Voet, G. Voickaert, T. R. Ward, R. Wysocki, G. S. Yen, K. Yu, K. Zimmermann, P. Philippsen, M. Johnston, and R. W. Davis. 1999. "Functional characterization of the S. cerevisiae génome by gene deletion and parallel analysis." Science 285 (5429):901 -6.