Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR THE BIOSYNTHESIS OF CAFFEIC ACID AND FERULIC ACID
Document Type and Number:
WIPO Patent Application WO/2023/094774
Kind Code:
A1
Abstract:
The present invention relates to a recombinant microorganism comprising a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), a heterologous nucleic acid sequence encoding a coumaroyl-CoA 3-hydroxylase (CCoA3H) and a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase. It further relates to a recombinant microorganism comprising a heterologous nucleic acid sequence encoding a caffeic acid O-methyltransferase. The invention also relates to the use of these microorganisms for producing ferulic acid and/or caffeic acid and to methods for producing caffeic acid and/or ferulic acid using said microorganisms.

Inventors:
ROUSSEL CÉLIA (FR)
VARLET SABRINA (FR)
FOJCIK CLÉMENTINE (FR)
PAUTHENIER CYRILLE (FR)
Application Number:
PCT/FR2022/052169
Publication Date:
June 01, 2023
Filing Date:
November 23, 2022
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
ABOLIS BIOTECHNOLOGIES (FR)
International Classes:
C12N9/02; C12N9/00; C12N9/10; C12N9/16; C12N9/88; C12P7/42; C12R1/865
Domestic Patent References:
WO2021089961A12021-05-14
WO2021081222A12021-04-29
WO2020019066A12020-01-30
Foreign References:
US8809028B22014-08-19
Other References:
ZHANG HAORAN ET AL: "Engineering E. coli for caffeic acid biosynthesis from renewable sugars", vol. 97, 1 January 2013 (2013-01-01), pages 3333 - 3341, XP055964668, Retrieved from the Internet
LI YUANZI ET AL: "De Novo Biosynthesis of Caffeic Acid from Glucose by Engineered Saccharomyces cerevisiae", ACS SYNTHETIC BIOLOGY, vol. 9, no. 4, 10 March 2020 (2020-03-10), Washington DC ,USA, pages 756 - 765, XP055963368, ISSN: 2161-5063, DOI: 10.1021/acssynbio.9b00431
ZHOU PINGPING ET AL: "Metabolic engineering of Saccharomyces cerevisiae for enhanced production of caffeic acid", APPLIED MICROBIOLOGY AND BIOTECHNOLOGY, SPRINGER BERLIN HEIDELBERG, BERLIN/HEIDELBERG, vol. 105, no. 14-15, 20 July 2021 (2021-07-20), pages 5809 - 5819, XP037547306, ISSN: 0175-7598, [retrieved on 20210720], DOI: 10.1007/S00253-021-11445-1
SUN-YOUNG KANG ET AL: "Artificial biosynthesis of phenylpropanoic acids in a tyrosine overproducing Escherichia coli strain", MICROBIAL CELL FACTORIES, SPRINGER, vol. 11, no. 1, 3 December 2012 (2012-12-03), pages 1 - 9, XP021136143, ISSN: 1475-2859, DOI: 10.1186/1475-2859-11-153
OKSIK CHOI ET AL: "Biosynthesis of plant-specific phenylpropanoids by construction of an artificial biosynthetic pathway in Escherichia coli", JOURNAL OF INDUSTRIAL MICROBIOLOGY & BIOTECHNOLOGY, SPRINGER, BERLIN, DE, vol. 38, no. 10, 20 March 2011 (2011-03-20), pages 1657 - 1665, XP019955173, ISSN: 1476-5535, DOI: 10.1007/S10295-011-0954-3
LV HUAJUN ET AL: "Ferulic acid production by metabolically engineered Escherichia coli", BIORESOURCES AND BIOPROCESSING, vol. 8, no. 1, 1 December 2021 (2021-12-01), pages 70, XP055878862, Retrieved from the Internet DOI: 10.1186/s40643-021-00423-0
WELCH, M. ET AL., METHODS IN ENZYMOLOGY, vol. 498, 2011, pages 43 - 66
ADEBESIN ET AL., PLANT J., vol. 93, January 2018 (2018-01-01), pages 905 - 916
RAMIREZ-AHUMADA ET AL., PHYTOCHEMISTRY, vol. 67, no. 18, September 2006 (2006-09-01), pages 2017 - 29
ZHONG ET AL., PLANT PHYSIOLOGY, vol. 124, October 2000 (2000-10-01), pages 563 - 578
ADEBESIN ET AL., PLANT J, vol. 93, no. 5, March 2018 (2018-03-01), pages 905 - 916
CHAO ET AL., PLANTA, vol. 245, no. 1, January 2017 (2017-01-01), pages 61 - 75
D'AIGRAIN ET AL., EMBO REPORTS, vol. 10, 2009, pages 742 - 747
GOLD ET AL., MICROB CELL FACT, vol. 14, 2015, pages 73
PANDEY ET AL., BIOTECHNOL ADV., vol. 34, 2016, pages 634 - 662
ELLIS T. ET AL., INTEGRATIVE BIOLOGY, vol. 3, no. 2, 2011, pages 109 - 118
VERDUYN ET AL., YEAST, vol. 8, 1992, pages 501 - 17
VISSER ET AL., BIOTECHNOLOGY AND BIOENGINEERING, vol. 79, 2002, pages 674 - 81
ALFENORE ET AL., APPL MICROBIOL BIOTECHNOL, vol. 60, 2002, pages 67 - 72
MORTIMER RKJOHNSTON JR: "Genealogy of principal strains of the yeast genetic stock center", GENETICS, vol. 113, no. 1, 1986, pages 35 - 43
"GenBank", Database accession no. NP 015385
WAGNER ET AL., FUNGAL GENET BIOL, vol. 89, 2016, pages 126 - 136
TETTELIN ET AL., METHODS IN MOLECULAR GENETICS, vol. 6, 1995, pages 81 - 107
WARGNER ET AL., FUNGAL GENET BIOL, vol. 89, April 2016 (2016-04-01), pages 126 - 136
Attorney, Agent or Firm:
CABINET BECKER & ASSOCIÉS (FR)
Download PDF:
Claims:
REVENDICATIONS

1. Microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H) et une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase.

2. Microorganisme selon la revendication 1, dans lequel ladite 4CL comprend une séquence choisie parmi les séquences SEQ ID NOs : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité 4CL.

3. Microorganisme selon la revendication 1 ou 2, dans lequel ladite CCoA3H comprend une séquence choisie parmi les séquences SEQ. ID NOs : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité CCoA3H.

4. Microorganisme selon l'une quelconque des revendications 1 à 3, dans lequel ladite acyl-coenzyme A thioestérase comprend une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase.

5. Microorganisme selon l'une quelconque des revendications 1 à 4, dans lequel le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT), de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID Nos : 10 à 16, 40 et 41, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité CCoAMT.

6. Microorganisme selon la revendication 5, dans lequel le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH, de préférence ladite CCR comprenant une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR ; et/ou ladite ALDH comprend une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH.

7. Microorganisme selon l'une quelconque des revendications 1 à 6, dans lequel le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue codant pour acide caféique-O-méthyltransférase (COMT), de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NOs : 72 à 92, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité COMT.

8. Microorganisme selon l'une quelconque des revendications 1 à 7, dans lequel le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue codant pour acide caféique-O-méthyltransférase (COMT), de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NOs : 72 à 81, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité COMT.

9. Microorganisme selon l'une quelconque des revendications 1 à 8, dans lequel ledit microorganisme est une bactérie, une levure ou un champignon.

10. Microorganisme selon l'une quelconque des revendications 1 à 8, dans lequel ledit microorganisme est une bactérie, de préférence E. coli.

11. Microorganisme selon l'une quelconque des revendications 1 à 8, dans lequel ledit microorganisme est une levure, de préférence une levure du genre Saccharomyces.

12. Microorganisme selon l'une quelconque des revendications 1 à 11, dans lequel ledit microorganisme recombinant comprend en outre

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), de préférence comprenant une séquence choisie parmi SEQ. ID NO : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19, 30 ou 68 et présentant une activité tyrosine ammonia lyase ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), de préférence une phénylalanine ammonia lyase comprenant une séquence choisie parmi SEQ ID NO : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20, 69, 31 ou 32 et présentant une activité phénylalanine ammonia lyase, et une cinnamate 4-hydroxylase comprenant une séquence choisie parmi SEQ ID NO : 21, 33, 34 et 70 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 21, 33, 34 ou 70 et présentant une activité cinnamate 4-hydroxylase.

13. Microorganisme selon l'une quelconque des revendications 1 à 12, dans lequel le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue codant pour une phospho-2-déhydro-3-déoxyheptonate aldolase résistante au rétrocontrôle par la tyrosine et/ou une séquence d'acide nucléique hétérologue codant pour une chorismate mutase résistante au rétrocontrôle par la tyrosine. 105

14. Microorganisme selon l'une quelconque des revendications 1 à 13, dans lequel, dans ledit microorganisme recombinant, un gène codant pour une phénylpyruvate décarboxylase est inactivé et/ou un gène codant pour une acide férulique décarboxylase est inactivé.

15. Méthode de production d'un phénylpropanoïde choisi parmi l'acide caféique et l'acide férulique, comprenant la culture d'un microorganisme recombinant selon l'une quelconque des revendications 1 à 14, et éventuellement la récolte et/ou la purification dudit phénylpropanoïde.

16. Méthode selon la revendication 15, dans laquelle le phénylpropanoïde est l'acide férulique et le microorganisme recombinant est un microorganisme selon l'une quelconque des revendications 5 à 14 comprenant (i) une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H), une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase et (ii) une séquence d'acide nucléique hétérologue codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT) et/ou une séquence d'acide nucléique hétérologue codant pour acide caféique- O-méthyltransférase (COMT).

17. Utilisation d'un microorganisme recombinant selon l'une quelconque des revendications 1 à 14 pour produire un phénylpropanoïde choisi parmi l'acide férulique et l'acide caféique.

18. Utilisation selon la revendication 17, dans laquelle le microorganisme recombinant est un microorganisme selon l'une quelconque des revendications 5 à 14 qui comprend (i) une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl- CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl- CoA 3-hydroxylase (CCoA3H), une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase et (ii) une séquence d'acide nucléique hétérologue codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT) et/ou une séquence d'acide nucléique hétérologue codant pour acide caféique-O-méthyltransférase (COMT), et dans laquelle le phénylpropanoïde est l'acide férulique.

18. Microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une acide caféique-O-méthyltransférase (COMT), ladite COMT comprenant une séquence choisie parmi les séquences SEQ ID NOs : 73 à 92, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité COMT.

19. Microorganisme selon la revendication 18, dans lequel ladite COMT comprend une séquence choisie parmi les séquences SEQ ID NOs : 74, 76, 79, 80 et 82, et les 106 polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité COMT.

20. Microorganisme selon la revendication 18 ou 19, dans lequel le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB) et une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC).

21. Microorganisme selon la revendication 20, dans lequel ladite HpaB comprend une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, de préférence une séquence choisie parmi SEQ. ID No : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ. ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase.

22. Microorganisme selon la revendication 20 ou 21, dans lequel ladite HpaC comprend une séquence choisie parmi les séquences SEQ ID NO : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, de préférence une séquence choisie parmi SEQ ID No : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase.

23. Microorganisme selon l'une quelconque des revendications 18 à 22, dans lequel le microorganisme recombinant comprend une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase CPR dépendante (C3H), de préférence comprenant une séquence choisie parmi SEQ ID Nos : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant une activité p-coumarate 3 hydroxylase.

24. Microorganisme selon l'une quelconque des revendications 28 à 23, dans lequel le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR).

25. Microorganisme selon la revendication 24, dans lequel ladite CPR comprend une séquence choisie parmi SEQ ID Nos : 22, 35, 36, 37 et 38 et les polypeptides comprenant 107 une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité cytochrome P450 réductase, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 22 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ. ID NO : 22 et présentant une activité cytochrome P450 réductase.

26. Microorganisme selon l'une quelconque des revendications 18 à 25, dans lequel le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL).

27. Microorganisme selon la revendication 26, dans lequel ladite TAL comprend une séquence choisie parmi SEQ ID NOs : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, 30 ou 68 et présentant une activité tyrosine ammonia lyase, de préférence comprend une séquence choisie parmi SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, et présentant une activité tyrosine ammonia lyase.

28. Microorganisme selon l'une quelconque des revendications 18 à Tl, dans lequel le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H).

29. Microorganisme selon la revendication 28, dans lequel ladite PAL comprend une séquence choisie parmi SEQ ID NO : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 20, 69, 31 ou 32 et présentant une activité phénylalanine ammonia lyase, de préférence comprend une séquence choisie parmi SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant une activité phénylalanine ammonia lyase.

30. Microorganisme selon la revendication 28 ou 29, dans lequel ladite C4H comprend une séquence choisie parmi SEQ ID NO : 21, 33, 34 et 70 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 21, 33, 34 ou 70 et présentant une activité cinnamate 4-hydroxylase, de préférence une séquence choisie parmi SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant une activité cinnamate 4- hydroxylase. 108

31. Microorganisme selon l'une quelconque des revendications 18 à 30, dans lequel, dans ledit microorganisme recombinant, un gène codant pour une phénylpyruvate décarboxylase est inactivé et/ou un gène codant pour une acide férulique décarboxylase est inactivé. 32. Microorganisme selon l'une quelconque des revendications 18 à 31, dans lequel ledit microorganisme est une bactérie, une levure ou un champignon.

33. Microorganisme selon l'une quelconque des revendications 18 à 31, dans lequel ledit microorganisme est une bactérie, de préférence E. coli.

34. Microorganisme selon l'une quelconque des revendications 18 à 31, dans lequel ledit microorganisme est une levure, de préférence une levure du genre Saccharomyces

35. Méthode de production d'acide férulique, comprenant la culture d'un microorganisme recombinant selon l'une quelconque des revendications 18 à 34, et éventuellement la récolte et/ou la purification de l'acide férulique produit.

36. Utilisation d'un microorganisme recombinant selon l'une quelconque des revendications 18 à 34 pour produire de l'acide férulique.

Description:
PROCEDE DE BIOSYNTHESE D'ACIDE CAFEIQUE ET D'ACIDE FERULIQUE

DOMAINE DE L'INVENTION

La présente invention concerne l'utilisation d'un microorganisme recombinant pour produire un acide organique via l'hydroxylation puis l'hydrolyse d'un thioester de coenzyme A, et plus particulièrement un microorganisme recombinant capable de produire des composés phénylpropanoïdes. Elle concerne également les méthodes de production utilisant de tels microorganismes.

ARRIERE-PLAN TECHNOLOGIQUE

L'acide férulique est un phénylpropanoïde dérivé de l'acide cinnamique et doté de propriétés antioxydantes et antiradicalaires. L'acide férulique peut être utilisé en tant que précurseur dans la fabrication de substances antimicrobiennes pour les savons, parfums et cosmétiques ainsi que pour la production de vanilline et d'acide sinapique. Il trouve également des applications dans le domaine médical, notamment du fait de ses propriétés antioxydantes.

L'acide férulique est obtenu par biodégradation de biomasse lignocellulosique. Cependant, la quantité de produit obtenu par ce procédé est relativement faible et entraîne, par conséquent, un coût de production de ces produits au kilogramme particulièrement élevé.

Il existe donc un réel besoin pour un procédé de biosynthèse permettant d'obtenir ce type de composés à moindre coûts.

RESUME DE L'INVENTION

Selon un premier aspect, la présente invention concerne un microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl- CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl- CoA 3-hydroxylase (CCoA3H) et une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase.

De préférence, ladite 4CL comprend une séquence choisie parmi les séquences SEQ ID NOs : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité 4CL.

De préférence, ladite CCoA3H comprend une séquence choisie parmi les séquences SEQ. ID NOs : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité CCoA3H.

De préférence, ladite acyl-coenzyme A thioestérase comprend une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase.

Le microorganisme peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT), de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ. ID Nos : 10 à 16, 40 et 41, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité CCoAMT.

En présence d'une CCoAMT, le microorganisme peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH, de préférence ladite CCR comprenant une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR ; et/ou ladite ALDH comprend une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH.

Alternativement ou cumulativement d'une séquence codant pour CcoAMT, le microorganisme peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour acide caféique-O-méthyltransférase (COMT), une COMT comprenant une séquence choisie parmi les séquences SEQ ID NOs : 72 à 92, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité COMT, et de manière plus particulièrement préférée une COMT comprenant une séquence choisie parmi les séquences SEQ ID NOs : 71 à 81, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité COMT.

De préférence, le microorganisme est une bactérie, une levure ou un champignon. En particulier, le microorganisme peut être une bactérie, de préférence E. coli. De préférence, le microorganisme est une levure, en particulier une levure du genre Saccharomyces.

Le microorganisme recombinant selon l'invention peut comprendre en outre

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), de préférence comprenant une séquence choisie parmi SEQ ID NO : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ. ID NO : 19, 30 ou 68 et présentant une activité tyrosine ammonia lyase, et de manière plus particulièrement préférée une séquence choisie parmi SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant une activité tyrosine ammonia lyase ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), de préférence une phénylalanine ammonia lyase comprenant une séquence choisie parmi SEQ ID NO : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 20, 69, 31 ou 32 et présentant une activité phénylalanine ammonia lyase, en particulier une phénylalanine ammonia lyase comprenant une séquence choisie parmi SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant une activité phénylalanine ammonia lyase, et une cinnamate 4-hydroxylase comprenant une séquence choisie parmi SEQ ID NO : 21, 33, 34 et 70 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 21, 33, 34 ou 70 et présentant une activité cinnamate 4-hydroxylase, en particulier une cinnamate 4-hydroxylase comprenant une séquence choisie parmi SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant une activité cinnamate 4-hydroxylase.

Le microorganisme recombinant selon l'invention peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une phospho-2-déhydro-3-déoxyheptonate aldolase résistante au rétrocontrôle par la tyrosine et/ou une séquence d'acide nucléique hétérologue codant pour une chorismate mutase résistante au rétrocontrôle par la tyrosine.

De préférence, dans le microorganisme recombinant selon l'invention, un gène codant pour une phénylpyruvate décarboxylase est inactivé et/ou un gène codant pour une acide férulique décarboxylase est inactivé.

Dans un second aspect, la présente invention concerne une méthode de production d'un phénylpropanoïde choisi parmi l'acide caféique et l'acide férulique, de préférence l'acide férulique, comprenant la culture d'un microorganisme recombinant selon l'invention, et éventuellement la récolte et/ou la purification dudit phénylpropanoïde.

De préférence, le phénylpropanoïde est l'acide férulique et le microorganisme recombinant est un microorganisme selon l'invention comprend (i) une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H), une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase et (ii) une séquence d'acide nucléique hétérologue codant pour une Caféoyl- CoA O-Méthyltransférase (CCoAMT) et/ou une séquence d'acide nucléique hétérologue codant pour acide caféique-O-méthyltransférase (COMT).

Dans un autre aspect, la présente invention concerne l'utilisation d'un microorganisme recombinant selon l'invention pour produire un phénylpropanoïde choisi parmi l'acide férulique et l'acide caféique, de préférence l'acide férulique.

De préférence, le microorganisme recombinant est un microorganisme selon l'invention qui comprend (i) une séquence d'acide nucléique hétérologue codant pour une 4- coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H), une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase et (ii) une séquence d'acide nucléique hétérologue codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT) et/ou une séquence d'acide nucléique hétérologue codant pour acide caféique-O-méthyltransférase (COMT), et le phénylpropanoïde est l'acide férulique.

Dans un autre aspect, la présente invention concerne un microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une acide caféique- O-méthyltransférase (COMT), ladite COMT comprenant une séquence choisie parmi les séquences SEQ ID NOs : 73 à 92, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité COMT, de préférence une séquence choisie parmi les séquences SEQ ID NOs : 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité COMT.

Le microorganisme comprenant une séquence d'acide nucléique hétérologue codant pour une COMT peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), une séquence d'acide nucléique hétérologue codant pour une 4- hydroxyphénylacetate 3-monooxygénase réductase (HpaC), une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase CPR dépendante (C3H), une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR), une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et/ou une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase (HpaC), une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR), une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H).

Un gène codant pour une phényl pyruvate décarboxylase et/ou un gène codant pour une acide férulique décarboxylase peut être inactivé.

Le microorganisme peut être une bactérie, une levure ou un champignon. En particulier, le microorganisme peut être une bactérie, de préférence E. coli. De préférence, le microorganisme est une levure, en particulier une levure du genre Saccharomyces

La présente invention concerne également une méthode de production d'acide férulique, comprenant la culture d'un microorganisme recombinant selon l'invention comprenant une séquence d'acide nucléique hétérologue codant pour une COMT, et éventuellement la récolte et/ou la purification de l'acide férulique produit. Elle concerne aussi l'utilisation dudit microorganisme recombinant pour produire de l'acide férulique.

DESCRIPTION DES FIGURES

Figure 1 : Production d'acide férulique à partir d'acide caféique de levures exprimant la thioestérase de la SEQ ID NO : 1 (Thiol), la thioestérase de la SEQ ID NO : 2 (Thio3), ou la cinnamoyl-CoA réductase de la SEQ ID NO : 4 et l'aldéhyde deshydrogénase de la SEQ ID NO : 3 (CCR ALDH). Le contrôle négatif (0) n'exprime aucune de ces enzymes.

Figure 2 : Production d'acide férulique des souches 339 à 343, 345, 347, 367 à 371, 373, 375, 423 à 427, 429, 431, 451 à 455, 457 et 459 (CcoAMTl : SEQ ID NO : 10, CcoAMT2 : SEQ ID NO : 11, CcoAMT3 : SEQ ID NO : 12, CcoAMT4 : SEQ ID NO : 13, CcoAMT5 : SEQ ID NO : 14, CcoAMT6 : SEQ ID NO : 15, CcoAMT7 : SEQ ID NO : 16, 4CL1 : SEQ ID NO : 5, 4CL5 : SEQ ID NO : 6, 4CLA : SEQ ID NO : 8, 4CLB : SEQ ID NO : 9, Thio3 : SEQ ID NO : 2) et des contrôles négatifs (0 : souches 334, 335, 337 et 338), cultivés en présence d'acide caféique.

Figure 3 : Production d'acide férulique des souches 595, 596 et 597 cultivées en présence d'acide p-coumarique et du contrôle négatif (0 : souche 507).

Figure 4 : Production d'acide férulique des souches 592, 593 et 594 cultivées en présence de glucose et du contrôle négatif (0 : souche 516).

Figure 5 : Une voie de biosynthèse de l'acide férulique à partir du glucose. Figure 6 : Illustration des activités enzymatiques de l'acyl-coenzyme A thioestérase ou de la cinnamoyl-CoA réductase et l'aldéhyde deshydrogénase sur le féruloyl-CoA .

Figure 7 : Production d'acide caféique à partir du glucose en passant par la voie CoA, test de différentes coumaroyl-CoA 3-Hydroxylases (CcoA3H). Le trait noir représente la limite de quantification de l'acide caféique (LLOQ).

Figure 8 : Production d'acide caféique à partir du glucose en passant par la voie CoA, test de la CcoA3H14. Le trait noir représente la limite de quantification de l'acide caféique (LLOQ).

Figure 9 : Production d'acide caféique à partir du glucose en passant par la voie CoA, test de différentes coumaroyl-CoA 3-Hydroxylases (CcoA3H). Le trait noir représente la limite de quantification de l'acide caféique (LLOQ).

Figure 10 : Production d'acide caféique à partir du glucose en passant par la voie acide organique, test de différentes coumaroyl-CoA 3-Hydroxylases (CcoA3H). Le trait noir représente la limite de quantification de l'acide caféique (LLOQ).

Figure 11 : Production d'acide caféique à partir du glucose en passant par la voie acide organique, test de différentes coumaroyl-CoA 3-Hydroxylases (CcoA3H). Le trait noir représente la limite de quantification de l'acide caféique (LLOQ).

Figure 12 : Production d'acide férulique à partir du glucose des souches VAN1622, VAN1624, YSP226 et YSP228.

Figure 13 : Quantités d'acide férulique produites après 72h de culture par les souches exprimant différentes COMT (exprimées en % par rapport à la quantité produite par la souche exprimant la COMT de la SEQ ID NO : 72) et quantités d'acide caféique restant après 72h de culture (exprimées en % par rapport à la quantité d'acide caféique produite par la souche CRTL n'exprimant pas de COMT)

DESCRIPTION DETAILLEE DE L'INVENTION

Les voies de synthèses impliquant des composés liés à la coenzyme A (CoA) sont peu utilisées en biotechnologie. En effet, la difficulté à détecter et mesurer les quantités des intermédiaires de synthèse, ainsi que leur impossibilité de les accumuler dans la cellule (travail en flux uniquement) rend leurs manipulations délicates. Les inventeurs ont cependant exploré ces voies de biosynthèse et développé un microorganisme capable de produire des acides organiques via l'hydrolyse de thioesters de CoA tels que l'acide férulique ou l'acide caféique. Outre des coûts réduits par rapport aux techniques de production actuelles par extraction de biomasse végétale comme le son de riz, la méthode de production utilisant ce microorganisme présente également l'avantage de passer par des intermédiaires liés à la CoA et donc incapables de sortir des cellules avant d'être convertis en la molécule cible. Cela permet donc de réduire la quantité de composés intermédiaires accumulés dans le milieu ou dégradés, et donc d'avoir in-fine un produit plus pur. La méthode de production selon l'invention permet ainsi d'obtenir des phénylpropanoïdes biosourcés via un procédé de biosynthèse plus respectueux de l'environnement que par extraction par hydrolyse des biomasses naturelles, comme le son de riz, qui génère des déchets alcalins difficiles à dégrader.

Les inventeurs ont par ailleurs identifié des enzymes COMT (acide caféique-O- méthyltransférase) particulièrement efficaces pour produire de l'acide férulique à partir d'acide caféique. Ces enzymes permettent ainsi d'améliorer significativement la production d'acide férulique obtenue à partir des microorganismes recombinants.

Définitions

Tel qu'utilisé ici, le terme « microorganisme » se réfère à un microorganisme procaryote ou eucaryote, en particulier une levure, un champignon ou une bactérie.

Par « microorganisme recombinant » est entendu un microorganisme qui ne se trouve pas dans la nature et qui contient un génome modifié suite à une insertion, modification ou délétion d'un ou plusieurs éléments génétiques hétérologues.

Par « acide nucléigue recombinant » est entendu un acide nucléique qui a été modifié et n'existe pas dans la nature. Par exemple, ce terme peut désigner une séquence codante ou un gène qui est lié de manière opérationnelle à un promoteur qui n'est pas le promoteur naturel. Cela peut également désigner une séquence codante dans laquelle les introns ont été supprimés pour des gènes comprenant des exons et des introns.

Par « hétérologue » est entendu une séquence d'acide nucléique ou une protéine qui n'est pas naturellement présente dans la cellule hôte et qui y a été introduite par génie génétique. La séquence hétérologue peut être présente dans la cellule sous forme épisomale ou chromosomique. L'origine de la séquence hétérologue peut être différente de la cellule dans laquelle elle est introduite. Cependant, elle peut également provenir de la même espèce que la cellule dans laquelle elle est introduite mais être considérée comme hétérologue en raison de son environnement qui n'est pas naturel. Par exemple, la séquence nucléique est hétérologue lorsqu'elle est sous le contrôle d'un promoteur autre que son promoteur naturel ou lorsqu'elle est introduite dans un endroit différent de celui où elle est située naturellement. La cellule hôte peut contenir une copie endogène de la séquence nucléique préalablement à l'introduction de la séquence nucléique hétérologue ou elle peut ne pas contenir de copie endogène. Par ailleurs, la séquence d'acide nucléique peut être hétérologue dans le sens où la séquence codante a été optimisée pour l'expression dans la cellule hôte, par exemple par optimisation de l'utilisation des codons. De manière préférée, dans le présent document, le terme « séquence d'acide nucléique hétérologue » se réfère à une séquence d'acide nucléique qui code pour une protéine qui est hétérologue à la cellule hôte, c'est-à-dire qui n'est pas naturellement présente dans la cellule hôte.

Tel qu'utilisé ici, le terme «endogène», par rapport à la cellule hôte, se réfère à un élément génétique ou à une protéine naturellement présente dans ladite cellule.

Le terme « gène » ou « séguence codante » désigne tout acide nucléique codant pour une protéine. Le terme gène englobe l'ADN, comme l'ADNc (ADN complémentaire) ou l'ADNg (ADN génomique), ainsi que l'ARN. Le gène peut d'abord être préparé par des techniques recombinantes, enzymatiques et/ou chimiques, et ensuite répliqué dans une cellule hôte ou un système in vitro. Le gène comprend typiquement un cadre de lecture ouvert codant pour une protéine souhaitée. Le gène peut contenir des séquences supplémentaires telles qu'un terminateur de transcription ou un peptide signal. En raison de la dégénérescence du code génétique, plusieurs acides nucléiques peuvent coder un polypeptide particulier. Ainsi, les codons dans la séquence codante pour un polypeptide donné peuvent être modifiés de telle sorte que l'expression optimale dans une cellule particulière soit obtenue, par exemple en utilisant des tables de traduction de codon appropriées pour cette cellule. Les acides nucléiques peuvent également être optimisés selon une teneur en GC préférable pour ladite cellule et/ou pour réduire le nombre de séquences répétées. Dans certains modes de réalisation, les acides nucléiques hétérologues ont été optimisés par codon pour une expression dans la cellule hôte concernée. L'optimisation des codons peut être effectuée par des procédés de routine connus dans la technique (voir, par exemple, Welch, M., et al. (2011), Methods in Enzymology 498: 43-66).

Le terme « lié de manière opérationnelle » désigne une configuration dans laquelle une séquence de contrôle est placée à une position appropriée par rapport à une séquence codante, de telle sorte que la séquence de contrôle dirige l'expression de la séquence codante.

Le terme « séguences de contrôle » désigne les séquences d'acide nucléique nécessaires à l'expression d'un gène. Les séquences de contrôle peuvent être endogènes ou hétérologues. Des séquences de contrôle bien connues et actuellement utilisées par l'homme du métier seront préférées. De telles séquences de contrôle comprennent, mais sans s'y limiter, un leader, une séquence de polyadénylation, une séquence de propeptide, un promoteur, une séquence de peptide de signal et un terminateur de transcription. De préférence, les séquences de contrôle comprennent un promoteur et un terminateur de transcription.

Le terme « cassette d'expression » désigne une construction d'acide nucléique comprenant une région codante, c'est-à-dire un gène, et une région de régulation, c'est-à-dire comprenant une ou plusieurs séquences de contrôle, liées de manière opérationnelle. De préférence, les séquences de contrôle sont adaptées à la cellule hôte. Tel qu'utilisé ici, le terme « vecteur d'expression » désigne une molécule d'ADN ou d'ARN qui comprend une cassette d'expression. De préférence, le vecteur d'expression est une molécule d'ADN double brin linéaire ou circulaire, de préférence linéaire. Le vecteur peut comprendre en outre une origine de réplication, un marqueur de sélection, etc.

Par « pourcentage d'identité » entre deux séquences d'acide nucléique ou d'acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. Le meilleur alignement ou alignement optimal est l'alignement pour lequel le pourcentage d'identité entre les deux séquences à comparer, comme calculé ci-après, est le plus élevé. Les comparaisons de séquences entre deux séquences d'acide nucléique ou d'acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par fenêtre de comparaison pour identifier et comparer les régions locales de similarité de séquence. L'alignement aux fins de la détermination du pourcentage d'identité de séquence d'acides aminés peut être réalisé de diverses façons qui sont bien connues dans le domaine, par exemple en utilisant des logiciels informatiques disponibles sur le Web sur Internet tels que http://www.clustal.org/omega/ ou http://www.ebi.ac.uk/Tools/emboss/. L'homme du métier peut déterminer les paramètres appropriés pour mesurer l'alignement, y compris tout algorithme nécessaire pour obtenir un alignement maximal sur toute la longueur des séquences comparées. Aux fins de la présente invention, les valeurs de pourcentage d'identité de séquence d'acides aminés se réfère à des valeurs générées à l'aide du programme d'alignement de séquence de paires EMBOSS Needle qui crée un alignement global optimal de deux séquences à l'aide de l'algorithme Needleman-Wunsch, dans lequel tous les paramètres de recherche sont définis par défaut Matrice de notation = BLOSUM62, Gap ouvert = 10, Gap extension = 0,5, pénalité d'intervalle d'extrémité = faux, intervalle d'extrémité ouvert = 10 et écart d'extrémité étendue = 0,5. Dans certains modes de réalisation, tous les pourcentages d'identité mentionnés dans cette demande peuvent être fixés à au moins 60%, au moins 70%, au moins 80%, au moins 85%, de préférence à au moins 90% d'identité, plus préférablement à au moins 95% d'identité. Alternativement, les pourcentages d'identité de séquence mentionnés dans cette demande peuvent être fixés à au moins 96%, au moins 97%, au moins 98% ou au moins 99% d'identité de séquence. En particulier, sont considérés comme décrits les modes de réalisations dans lesquels tous les pourcentages d'identité de séquence des enzymes sont d'au moins 80% ou au moins 85%, de préférence d'au moins 90% ou au moins 95% d'identité de séquence. Sont également considérés comme décrits les modes de réalisations dans lesquels tous les pourcentages d'identité de séquence des enzymes sont d'au moins 96%, au moins 97%, au moins 98% ou au moins 99% d'identité de séquence. Dans un mode de réalisation, les polypeptides peuvent présenter 1, 2, 3, 4, 5, 6, 7 , 8, 9 ou 10 additions, substitutions ou délétions par rapport aux séquences décrites dans les SEQ. ID Nos. En particulier, ces additions, substitutions ou délétions peuvent être introduites à l'extrémité N-terminale, C-terminale ou aux deux extrémités. Les polypeptides peuvent éventuellement se présenter sous forme de protéine de fusion. Dans ce cas, le pourcentage d'identité n'est calculé que sur le domaine de la protéine de fusion présentant l'activité recherchée.

Les termes « surexpression » et « augmentation d'expression » tels qu'utilisés ici, sont utilisés de manière interchangeable et signifient que l'expression d'une séquence codante ou d'une protéine est augmentée par rapport à la cellule hôte non modifiée, par exemple une cellule de type sauvage ou ne comprenant pas les modifications génétiques décrites ici. Par « sauvage » est entendu une cellule non-modifiée existant dans la nature. L'expression accrue d'une protéine est habituellement obtenue en augmentant l'expression du gène codant pour ladite protéine. Dans les modes de réalisation dans lesquels le gène ou la protéine n'est pas naturellement présent dans le microorganisme de l'invention, c'est- à-dire un gène ou une protéine hétérologue, les termes « surexpression » et « expression » peuvent être utilisés de manière interchangeable. Pour augmenter l'expression d'un gène, l'homme du métier peut utiliser toutes les techniques connues telles que l'augmentation du nombre de copies du gène dans la cellule, l'utilisation d'un promoteur induisant un niveau élevé d'expression du gène, c'est-à-dire un promoteur fort, l'utilisation d'éléments stabilisants TARN messager correspondant ou de séquences RBS (site de liaison de ribosome) particulières. En particulier, la surexpression peut être obtenue en augmentant le nombre de copies du gène dans la cellule. Une ou plusieurs copies du gène peuvent être introduites dans le génome par des procédés de recombinaison, connus de l'homme du métier, y compris le remplacement des gènes ou l'insertion multicopie. De préférence, une cassette d'expression comprenant le gène est intégrée au génome. En variante, le gène peut être porté par un vecteur d'expression, de préférence un plasmide, comprenant une cassette d'expression avec le gène d'intérêt placé de préférence sous le contrôle d'un promoteur adapté. Le vecteur d'expression peut être présent dans la cellule hôte en une ou plusieurs copies selon la nature de l'origine de réplication. La surexpression d'un gène peut également être obtenue en utilisant un promoteur induisant un niveau élevé d'expression du gène. Par exemple, le promoteur d'un gène endogène peut être remplacé par un promoteur plus fort, c'est-à-dire un promoteur induisant un niveau d'expression plus élevé. Le gène endogène sous le contrôle d'un promoteur qui n'est pas le promoteur naturel est qualifié d'acide nucléique hétérologue. Les promoteurs appropriés pour être utilisés dans la présente invention sont connus de l'homme du métier et peuvent être constitutifs ou inductibles, et être endogènes ou hétérologues.

Par « comprenant », est également décrit « consistant » ou « consistant essentiellement ». Ainsi, les modes de réalisation dans lesquels le terme « comprenant » est remplacé par le terme « consistant » ou « consistant essentiellement » sont également décrits dans ce document. Par « consistant essentiellement » est entendu que la séquence peut présenter 1, 2, 3, 4, 5, 6, 7 , 8, 9 ou 10 additions, substitutions ou délétions par rapport aux séquences décrites dans les SEQ. ID Nos.

Microorganismes

Le microorganisme selon la présente invention peut être un microorganisme eucaryote ou procaryote.

Selon un premier mode de réalisation, le microorganisme est un microorganisme eucaryote, de préférence choisi parmi les levures et les champignons.

Selon un mode de réalisation préféré, le microorganisme est une levure, en particulier une levure de l'ordre des Saccharomycetales, Sporidiobolales et Schizosaccharomycetales. La levure peut par exemple être sélectionnée parmi les levures du genre Saccharomyces, Pichia, Kluyveromyces, Schizosaccharomyces, Candida, Lipomyces, Rhodotorula, Rhodosporidium, Yarrowia, Debaryomyces, Komagataella, Scheffersomyces, Torulaspora ou Zygosaccharomyces. En particulier, la levure peut être choisie parmi les espèces Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, Saccharomyces oviformis, Pichia pastoris, Kluyveromyces lactis, Kluyveromyces marxianus, Schizosaccharomyces pombe, Candida albicans, Candida tropicalis, Rhodotorula glutinis, Rhodosporidium toruloides, Yarrowia lipolytica, Debaryomyces hansenii et Lipomyces starkeyi.

Selon un mode de réalisation particulièrement préféré, le microorganisme est une levure appartenant au genre Saccharomyces, de préférence une levure choisie parmi les espèces Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis et Saccharomyces oviformis. De manière tout particulièrement préférée, le microorganisme est une levure de l'espèce Saccharomyces cerevisiae.

De manière alternative, le microorganisme peut être un champignon, de préférence un champignon filamenteux, en particulier un champignon choisi parmi les champignons des genres Aspergillus, Trichoderma, Neurospora, Podospora, Endothia, Mucor, Cochiobolus et Pyricularia. De manière plus particulièrement préférée, le champignon est choisi parmi Aspergillus nidulans, Aspergillus niger, Aspergillus awomari, Aspergillus oryzae, Aspergillus terreus, Neurospora crassa, Trichoderma reesei et Trichoderma viride.

Selon un second mode de réalisation, le microorganisme est un microorganisme procaryote, de préférence une bactérie. En particulier, le microorganisme peut être une bactérie choisie parmi les bactéries des phyla Acidobacteria, Actinobacteria, Aguificae, Bacterioidetes, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Fibrobacteres, Firmicutes, Fusobacteria, Gemmatimonadetes, Nitrospirae, Planctomycetes, Proteobacteria, Spirochaetes, Thermodesulfobacteria, Thermomicrobia, Thermotogae, ou Verrucomicrobia. De manière préférée, la bactérie appartient au genre Acaryochloris, Acetobacter, Actinobacillus, Agrobacterium, Alicyclobacillus, Anabaena, Anacystis, Anaerobiospirillum, Aguifex, Arthrobacter, Arthrospira, Azobacter, Bacillus, Brevibacterium, Burkholderia, Chlorobium, Chromatium, Chlorobaculum, Clostridium, Corynebacterium, Cupriavidus, Cyanothece, Enterobacter, Deinococcus, Erwinia, Escherichia, Geobacter, Gloeobacter, Gluconobacter, Hydrogenobacter, Klebsiella, Lactobacillus, Lactococcus, Mannheimia, Mesorhizobium, Methylobacterium, Microbacterium, Microcystis, Nitrobacter, Nitrosomonas, Nitrospina, Nitrospira, Nostoc, Phormidium, Prochlorococcus, Pseudomonas, Ralstonia, Rhizobium, Rhodobacter, Rhodococcus, Rhodopseudomonas, Rhodospirillum, Salmonella, Scenedesmun, Serratia, Shigella, Staphylococcus, Streptomyces, Synechoccus, Synechocystis, Thermosynechococcus, Trichodesmium ou Zymomonas. De manière encore préférée, la bactérie est choisie parmi les espèces Agrobacterium tumefaciens, Anaerobiospirillum succiniciproducens, Actinobacillus succinogenes, Aguifex aeolicus, Aguifex pyrophilus, Bacillus subtilis, Bacillus amyloliguefacines, Brevibacterium ammoniagenes, Brevibacterium immariophilum, Clostridium pasteurianum, Clostridium ljungdahlii, Clostridium acetobutylicum, Clostridium beigerinckii, Corynebacterium glutamicum, Cupriavidus necator, Cupriavidus metallidurans, Enterobacter sakazakii, Escherichia coli, Gluconobacter oxydons, Hydrogenobacter thermophilus, Klebsiella oxytoca, Lactococcus lactis, Lactobacillus plantarum, Mannheimia succiniciproducens, Mesorhizobium loti, Pseudomonas aeruginosa, Pseudomonas mevalonii, Pseudomonas pudica, Pseudomonas putida, Pseudomonas fluorescens, Rhizobium etli, Rhodobacter capsulatus, Rhodobacter sphaeroides, Rhodospirillum rubrum, Salmonella enterica, Salmonella typhi, Salmonella typhimurium, Shigella dysenteriae, Shigella flexneri, Shigella sonnei, Staphylococcus aureus, Streptomyces coelicolor, Zymomonas mobilis, Acaryochloris marina, Anabaena variabilis, Arthrospira platensis, Arthrospira maxima, Chlorobium tepidum, Chlorobaculum sp., Cyanothece sp., Gloeobacter violaceus, Microcystis aeruginosa, Nostoc punctiforme, Prochlorococcus marinus, Synechococcus elongatus, Synechocystis sp., Thermosynechococcus elongatus, Trichodesmium erythraeum et Rhodopseudomonas palustris. Selon un mode de réalisation particulier, le microorganisme est une bactérie Escherichia coli, par exemple choisie parmi E. coli BL21, E. coli BL21 (DE3), E. coli MG1655, E. coli W31 10 et leurs dérivés. Selon un mode de réalisation particulier alternatif, le microorganisme est une bactérie du genre Streptomyces, en particulier Streptomyces venezuelae.

Selon un mode de réalisation préféré, le microorganisme est une levure, une bactérie ou un champignon, de préférence une levure ou une bactérie. En particulier, le microorganisme peut être choisi parmi une bactérie Escherichia coli et une levure Saccharomyces cerevisiae.

Selon un mode de réalisation préféré entre tous, le microorganisme est une levure, de préférence une levure appartenant au genre Saccharomyces, en particulier une levure Saccharomyces cerevisiae.

Production d'acide caféique à partir d'acide p-coumarique

Grâce à la fonction thiol de la cystéamine, la coenzyme A est capable de former avec les fonctions carboxyles de certains composés, tels que l'acide caféique ou l'acide p- coumarique, des thioesters appelés carboxyl-CoA.

Tel qu'utilisé ici, le terme « carboxyl-CoA » se réfère à un thioester de coenzyme A dans lequel l'hydrolyse de la liaison thioester génère un groupe carboxyle. Des exemples de carboxyl-CoA sont le p-coumaroyl-CoA, le caféoyl-CoA et féruloyl-CoA.

Le microorganisme recombinant selon la présente invention est génétiquement modifié pour produire des phénylpropanoïdes, à savoir de l'acide férulique et/ou de l'acide caféique, à partir de l'acide p-coumarique et en passant par des composés intermédiaires qui sont des carboxyl-CoA, à savoir le p-coumaroyl-CoA, le caféoyl-CoA et féruloyl-CoA. (cf. Figures 5 et 6). En particulier, ce microorganisme est capable (i) de produire de l'acide férulique à partir de féruloyl-CoA, de caféoyl-CoA, d'acide caféique, d'acide p-coumarique ou de p-coumaroyl-CoA et/ou (ii) de produire de l'acide caféique à partir de caféoyl-CoA, d'acide p-coumarique ou de p-coumaroyl-CoA.

Chez les plantes, la voie de synthèse de la lignine implique des composés couplés au CoA qui sont ensuite hydrolysés. Ce type d'hydrolyse est réalisé en 2 étapes. La première étape consiste en la libération du substrat sous sa forme aldéhyde. La seconde consiste en l'oxydation du composé aldéhyde vers sa forme acide (Fraser et Chappel, Arabidopsis Book. 2011;9:e0152). Certaines plantes telles que Petunia hybrida ou Curcuma longa L., semblent également capables d'hydrolyser directement les phénylpropanoyl-CoA via des thioestérases qui catalysent l'hydrolyse d'une liaison thioester en libérant un acide carboxylique et un groupement thiol (Adebesin et al, Plant J. 2018 January; 93: 905-916 ; Ramirez-Ahumada et al, Phytochemistry. 2006 Sep;67(18):2017-29) et qui sont surtout décrites dans la voie de biosynthèse des acides gras. Par ailleurs, cette voie de synthèse de la lignine fait également intervenir d'autres enzymes telles que la 4-coumaroyl-CoA ligase ou la coumaroyl-CoA 3-hydroxylase impliquées notamment dans la production des unités hydroxyphényle et guaiacyle de la lignine (Zhong et al. Plant Physiology, Volume 124, Issue 2, October 2000, Pages 563-578).

Les inventeurs ont ici démontré de manière surprenante que ces mécanismes pouvaient être utilisés dans un microorganisme, et en particulier dans une levure, pour produire des phénylpropanoïdes tels que l"acide férulique et/ou l'acide caféique. Le microorganisme recombinant selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H) et une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase.

Tel qu'utilisé ici, le terme « 4-coumaroyl-CoA ligase » ou « 4CL » se réfère à une enzyme capable de produire du caféoyl-CoA à partir de l'acide caféique et de CoA et/ou du p- coumaroyl-CoA à partir de l'acide p-coumarique et de CoA. Cette enzyme appartient à la classe EC 6.2.1.12.

La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. En particulier, pour déterminer s'il y a une activité 4-coumarate CoA ligase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (4-coumarate CoA ligase putative), d'acide caféique ou d'acide p-coumarique, d'ATP et de CoA dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition du caféoyl CoA (en présence d'acide caféique) ou de p-coumaroyl-CoA (en présence d'acide p-coumarique) est observée au spectrophotomètre UV avec une longueur d'onde donnée.

La 4CL peut être une enzyme de plante, de préférence du genre Abies, Arabidopsis, Agastache, Amorpha, Brassica, Citrus, Cathaya, Cedrus, Crocus, Larix, Festuca, Glycine, Jugions, Keteleeria, Lithospermum, Lolium, Lotus, Lycopersicon, Malus, Medicago, Mesembryanthemum, Nicotiana, Nothotsuga, Oryza, Phaseolus, Pelargonium, Petroselinum, Physcomitrella, Picea, Prunus, Pseudolarix, Pseudotsuga, Rosa, Rubus, Ryza, Saccharum, Suaeda, Pinus, Populus, Solanum, Thellungiella, Triticum, Tsuga, Vitis ou Zea. De manière alternative, cette enzyme peut être une enzyme produite par un microorganisme, par exemple du genre Aspergillus, Mycosphaerella, Mycobacterium, Neisseria, Neurospora, Streptomyces, Rhodobacter ou Yarrowia.

De préférence, la 4CL est une enzyme de plante, en particulier une enzyme d'une plante du genre Arabidopsis, Citrus ou Populus. De manière plus spécifique, la 4CL peut être une 4CL de Arabidopsis thaliana, en particulier une 4CL décrite dans l'une des séquences SEQ ID Nos : 5, 7 et 9, une 4CL de Citrus Clementina, en particulier une 4CL décrite dans SEQ. ID NO : 6 ou une 4CL de Populus tomentosa, en particulier une 4CL décrite dans SEQ ID NO : 8.

Selon un mode de réalisation, la 4CL comprend une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL.

Selon un mode de réalisation préféré, la 4CL comprend une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL.

Selon un mode de réalisation tout particulièrement préféré, la 4CL comprend une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL.

Tel qu'utilisé ici, le terme « coumaroyl-CoA 3-hydroxylase» ou « p-coumaroyl-CoA 3- hydroxylase » ou « CCoA3H» se réfère à une enzyme capable de produire du caféoyl-CoA à partir du p-coumaroyl-CoA. Cette enzyme appartient à la classe EC 1.14.13.x. La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. En particulier, pour déterminer s'il y a une activité CCoA3H, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (CCoA3H putative), d'acide p-coumarique, d'une enzyme 4CL, d'ATP et de CoA dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition du caféoyl CoA est observée au spectrophotomètre UV avec une longueur d'onde donnée. L'activité CCoA3H peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité CCoA3H peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. Le substrat de ladite enzyme (le p-coumaroyl-CoA) est synthétisé par le microorganisme à partir de l'acide p-coumarique et d'une enzyme 4CL. Le caféoyl-CoA produit par une enzyme présentant l'activité CcoA3H peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. De manière particulièrement préférée, l'activité CcoA3H peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester et capable de convertir le caféoyl-CoA en acide caféique et dépourvu d'autre voie permettant de produire de l'acide caféique. L'activité CcoA3H est détectée par la production d'acide caféique en présence d'acide p-coumarique, de préférence par une technique d'UPLC (ultra performance liquid chromatrography) couplée à un spectromètre de masse haute résolution.

De préférence, la CCoA3H est une enzyme de plante, en particulier une enzyme d'une plante du genre Vigna, Glycine, Jatropha, Acacia, Populus, Triticum, Salvia, Cosmos, Trifolium, Lonicera, Nyssa, Pyrus, Eucalyptus, Gossypium, Zostera, Aquilegia, Actinidia, Medicago, Malus, Ricinus, Sorghum, Nicotiana, Raphanus ou Ipomoea.

De manière plus spécifique, la CCoA3H peut être une CCoA3H de Vigna angularis, en particulier une CCoA3H décrite dans la séquence SEQ. ID NO : 42, une CCoA3H de Glycine max, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 43, une CCoA3H de Jatropha curcas, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 44, une CCoA3H de Acacia koa, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 45, une CCoA3H de Populus tomentosa, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 46, une CCoA3H de Populus alba x Populus grandidentata, en particulier une CCoA3H décrite dans la séquence SEQ. ID NO : 47, une CCoA3H de Triticum turgidum subsp. durum, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 48, une CCoA3H de Salvia miltiorrhiza, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 49, une CCoA3H de Cosmos sulphureus, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 50, une CCoA3H de Trifolium pratense, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 51, une CCoA3H de Lonicera japonica, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 52, une CCoA3H de Nyssa sinensis, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 53, une CCoA3H de Pyrus ussuriensis x Pyrus communis, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 54, une CCoA3H de Eucalyptus grandis, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 55, une CCoA3H de Gossypium raimondii, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 56, une CCoA3H de Zostera marina, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 57, une CCoA3H de Aguilegia coerulea, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 58, une CCoA3H de Actinidia chinensis var. chinensis, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 59, une CCoA3H de Medicago truncatula, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 60, une CCoA3H de Malus baccata, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 61, une CCoA3H de Ricinus communis, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 62, une CCoA3H de Sorghum bicolor, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 63, une CCoA3H de Populus euphratica, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 64, une CCoA3H de Nicotiana tabacum, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 65, une CCoA3H de Raphanus sativus, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 66, ou une CCoA3H de Ipomoea nil, en particulier une CCoA3H décrite dans la séquence SEQ ID NO : 67.

Selon un mode de réalisation, la CCoA3H comprend une séquence choisie parmi les séquences SEQ ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H.

Selon un mode de réalisation particulier, la CCoA3H comprend une séquence choisie parmi les séquences SEQ ID NO : 42, 45, 46, 47, 48, 49, 51, 52, 54, 59 and 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H.

Selon un mode de réalisation préféré, la CCoA3H comprend une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H. Selon un mode de réalisation tout particulièrement préféré, la CCoA3H comprend une séquence choisie parmi la séquence SEQ. ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H.

Tel qu'utilisé ici, le terme « acyl-coenzyme A thioestérase » ou « Thio » se réfère à une enzyme douée d'une activité acyl-coenzyme A thioestérase, c'est-à-dire une enzyme capable d'hydrolyser la liaison ester d'un carboxyl-CoA et ainsi de libérer d'une part la CoA et d'autre part un acide carboxylique (cf. Figure 6). Ce terme se réfère notamment à une enzyme capable d'hydrolyser la liaison thioester du féruloyl-CoA et ainsi de produire de l'acide férulique et/ou d'hydrolyser la liaison thioester du caféoyl-CoA et ainsi de produire de l'acide caféique.

La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité acyl-coenzyme A thioestérase peut être détectée in vitro, par exemple comme décrit dans l'article de Adebesin et al. (Plant J. 2018 Mar;93(5):905- 916). En particulier, pour déterminer s'il y a une activité acyl-coA thioestérase, un test enzymatique peut être effectué et consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (acyl-CoA thioestérase putative), et d'un substrat carboxyl-CoA dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide carboxylique obtenu par hydrolyse de la liaison ester du substrat carboxyl-CoA peut être est observée soit au spectrophotomètre UV à une longueur d'onde donnée, soit par HPLC. L'activité acyl-coenzyme A thioestérase peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité acyl-coenzyme A thioestérase peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. Le carboxyl-CoA substrat de ladite enzyme est soit synthétisé par le microorganisme, soit apporté dans le milieu de culture. L'acide carboxylique produit par une enzyme présentant l'activité recherchée peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. En particulier, l'activité acyl-coenzyme A thioestérase peut être détectée par la production d'acide férulique en présence de féruloyl-CoA et/ou la production d'acide caféique en présence de caféoyl-CoA. De manière particulièrement préférée, l'activité acyl-coenzyme A thioestérase peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester et capable de convertir l'acide caféique en féruloyl-CoA et/ou de convertir l'acide p- coumarique en caféoyl-CoA. L'activité acyl-coenzyme A thioestérase est alors détectée par la production d'acide férulique et/ou d'acide caféique en présence respectivement d'acide caféique ou d'acide p-coumarique, de préférence par une technique d'HPLC.

L'acyl-coenzyme A thioestérase peut être une enzyme de plante, de préférence une enzyme de plantes du genre Petunia, Oryza, Arabidopsis, Capsella, Camélia, brassica, Raphanus ou Nicotiana, en particulier Petunia hybrida, Oryza meyeriana en particulier Oryza meyeriana var. granulata) Arabidopsis tha liana, Capsella rubella , Camélia sativa, brassica rapa, Raphanus sativus ou Nicotiana tabacum. L'acyl-coenzyme A thioestérase peut aussi être une enzyme de plantes du genre Petunia, Arabidopsis, Capsella, Camélia, brassica, Raphanus ou Nicotiana, en particulier Petunia hybrida, Arabidopsis thaliana, Capsella rubella , Camélia sativa, brassica rapa, Raphanus sativus ou Nicotiana tabacum.

De manière alternative, cette enzyme peut être une enzyme produite par un microorganisme, par exemple par une levure du genre Saccharomyces, en particulier une levure Saccharomyces cerevisiae. Dans certains modes de réalisation, l'enzyme correspond à l'enzyme endogène du microorganisme. Dans ces cas, l'enzyme peut être surexprimée, par exemple en remplaçant le promoteur endogène par un promoteur hétérologue fort et/ou en augmentant le nombre de copie du gène.

De manière plus particulièrement préférée, l'acyl-coenzyme A thioestérase est une enzyme de plante, en particulier de Petunia hybrida, d'Oryza meyeriana en particulier Oryza meyeriana var. granulata) ou d' Arabidopsis thaliana, plus particulièrement de Petunia hybrida ou d’Arabidopsis thaliana. L'acyl-coenzyme A thioestérase peut être une enzyme d’Arabidopsis thaliana, en particulier la thioestérase décrite dans la SEQ ID NO : 1. Alternativement, l'acyl-coenzyme A thioestérase peut être une enzyme de Petunia hybrida, en particulier la thioestérase décrite dans la SEQ. ID NO : 2. Alternativement, l'acyl- coenzyme A thioestérase peut être une enzyme de d'Oryza meyeriana (en particulier Oryza meyeriana var. granulata) en particulier la thioestérase décrite dans la SEQ ID NO : 39.

Selon un mode de réalisation particulier, l'acyl-coenzyme A thioestérase comprend une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase.

Selon un mode de réalisation particulier, l'acyl-coenzyme A thioestérase comprend une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase.

Selon un mode de réalisation particulier, le microorganisme recombinant selon l'invention comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ. ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H; de préférence une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de manière plus particulièrement préférée une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase.

Le microorganisme selon l'invention peut produire l'acide p-coumarique, naturellement ou après modification génétique. Alternativement, ce substrat peut lui être apporté dans le milieu de culture. Selon un mode de réalisation particulier, le microorganisme est capable de produire l'acide p-coumarique, à partir d'un intermédiaire de synthèse, tel que la tyrosine, la phénylalanine ou l'acide cinnamique, ou à partir de glucose via la phénylalanine ou la tyrosine.

Production d'acide férulique à partir d'acide p-coumarique

La production d'acide férulique en utilisant un microorganisme selon l'invention tel que décrit ci-dessus, à savoir un microorganisme exprimant une 4CL, une CCoA3H et une acyl- coenzyme A thioestérase, peut être obtenue :

- par transformation directe de l'acide caféique en acide férulique par une acide caféique- O-méthyltransférase (COMT), ou

- par synthèse de féruloyl-CoA à partir de caféoyl-CoA en utilisant une Caféoyl-CoA O- Méthyltransférase (CCoAMT), l'acide férulique étant ensuite obtenu à partir du féruloyl-CoA via l'activité d'une l'acyl-coenzyme A thioestérase telle que décrite ci-dessus.

Ainsi, le microorganisme selon l'invention peut également comprendre, outre la 4CL, la CCoA3H et l'acyl-coenzyme A thioestérase, une séquence d'acide nucléique hétérologue codant pour une caféoyl-CoA O-méthyltransférase (CCoAMT) et/ou une séquence d'acide nucléique hétérologue codant pour acide caféique-O-méthyltransférase (COMT).

Selon un mode de réalisation, le microorganisme selon l'invention comprend en outre une séquence d'acide nucléique hétérologue codant pour une caféoyl-CoA O-méthyltransférase (CCoAMT).

Tel qu'utilisé ici, le terme « caféoyl-CoA O-méthyltransférase» ou « CCoAMT» se réfère à une enzyme appartenant à la classe EC 2.1.1.104 et qui catalyse la conversion du caféoyl- CoA en féruloyl-CoA.

La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité CCoAMT peut être détectée in vitro, par exemple en utilisant un test in vitro disponible dans le commerce (par exemple le test SAM510 de G- Biosciences, Cat.#786-430). En particulier, pour déterminer s'il y a une activité CoA methyl- transférase, un test enzymatique peut être effectué et consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (CCoAMT putative), de S-adénosylméthionine (SAM), et d'un mélange d'enzymes (5-adénosylhomocyteine nucléosidase (EC 3.2.2.9), adénine déaminase (EC 3.5.4.2) et xanthine oxydase (EC 1.17.3.2) dans les conditions optimales (pH, température, ions...). En présence d'une activité CCoAMT, les produits obtenus sont de l'urate et du péroxyde d'hydrogène. Après un certain temps d'incubation, l'apparition de péroxyde d'hydrogène peut être détectée par réaction avec un agent colorimétrique, à savoir l'acide 3,5-dichloro-2-hydroxybenzènesulfonique (DHBS) et mesuré au spectrophotomètre UV à 510nm. L'activité CCoAMT peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité CCoAMT peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. Le substrat de ladite enzyme (caféoyl-CoA) est soit synthétisé par le microorganisme, soit apporté dans le milieu de culture. Le féruloyl-CoA produit par une enzyme présentant l'activité recherchée peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. De manière particulièrement préférée, l'activité CCoAMT peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester, capable de convertir l'acide p-coumarique en caféoyl-CoA, c'est-à-dire exprimant une 4CL et une CcoA3H telles que définies ci-dessus. L'activité CCoAMT est détectée par la production de féruloyl-CoA en présence d'acide p-coumarique, de préférence par une technique d'HPLC.

La CCoAMT peut être une enzyme de plante, de préférence du genre Vitis, Medicago, Eucalyptus, Nicotiana, Arabidopsis, Panicum, Rauvolfia ou Populus, et de manière plus particulièrement préférée du genre Vitis, Medicago, Eucalyptus, Nicotiana, Arabidopsis ou Populus. En particulier, la CCoAMT peut être une enzyme de Vitis vinifera, Medicago sativa, Eucalyptus globus, Nicotiana tabacum, Arabidopsis thaliana, Panicum virgatum, Rauvolfia serpentina ou Populus trichocarpa, de préférence une enzyme de Vitis vinifera, Medicago sativa, Eucalyptus globus, Nicotiana tabacum, Arabidopsis thaliana ou Populus trichocarpa.

La CCoAMT peut être une enzyme de Vitis vinifera, en particulier la CCoAMT décrite dans la SEQ ID NO : 10, une enzyme de Medicago sativa, en particulier la CCoAMT décrite dans la SEQ. ID NO : 11, une enzyme d' Eucalyptus globus, en particulier la CCoAMT décrite dans la SEQ ID NO : 12, une enzyme de Nicotiana tabacum, en particulier la CCoAMT décrite dans la SEQ ID NO : 13 ou 14, une enzyme d' Arabidopsis thaliana, en particulier la CCoAMT décrite dans la SEQ ID NO : 15, une enzyme de Populus trichocarpa, en particulier la CCoAMT décrite dans la SEQ ID NO :16, une enzyme de Panicum virgatum, en particulier la CCoAMT décrite dans la SEQ ID NO :40 ou une enzyme de Rauvolfia serpentina, en particulier la CCoAMT décrite dans la SEQ ID NO :41.

Selon un mode de réalisation, la CCoAMT comprend une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT.

Selon un mode de réalisation particulier, la CCoAMT comprend une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT.

Selon un mode de réalisation particulier, le microorganisme recombinant selon l'invention comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H; de préférence une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de manière plus particulièrement préférée une CCoA3H comprenant une séquence choisie parmi la séquence SEQ. ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT.

Selon un mode de réalisation préféré, le microorganisme recombinant comprend

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de préférence une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi la séquence SEQ. ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT.

Dans les modes de réalisation dans lesquels le microorganisme selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une CCoAMT, ledit microorganisme peut en outre comprendre une séquence d'acide nucléique hétérologue codant pour une cinnamoyl-CoA réductase (CCR) et une séquence d'acide nucléique hétérologue codant pour une aldéhyde deshydrogénase (ALDH).

La CCR catalyse la réduction des carboxyl-CoA telles que le féruloyl-CoA, formant ainsi des aldéhyldes tels que le coniféraldéhyde. l'ALDH catalyse ensuite l'oxydation des aldéhydes ainsi formés en acides carboxyliques tels que l'acide férulique.

Tel qu'utilisé ici, le terme « cinnamoyl-CoA réductase » ou « CCR » se réfère à une enzyme appartenant à la classe EC 1.2.1.44 et qui catalyse la réduction d'un cinnamoyl-CoA substitué, par exemple le féruloyl-CoA, en un cinnamalhéhyde correspondant, par exemple le coniféraldéhyde. De préférence, ce terme se réfère à une enzyme qui catalyse la réduction du féruloyl-CoA en coniféraldéhyde.

La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité CCR peut être détectée in vitro, par exemple comme décrit dans l'article de Chao et al. (Planta. 2017 Jan;245(l):61-75) En particulier, pour déterminer s'il y a une activité Cinnamoyl-CoA réductase, un test enzymatique peut être effectué et consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (CCR putative), d'un substrat carboxyl-CoA et de NADPH dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de la forme aldéhyde peut être est observée, soit au spectrophotomètre UV avec une longueur d'onde donnée, soit par HPLC. L'activité CCR peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité CCR peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. Le carboxyl-CoA substrat de ladite enzyme est soit synthétisé par le microorganisme, soit apporté dans le milieu de culture. L'aldéhyde produit par une enzyme présentant l'activité recherchée peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. De manière particulièrement préférée, l'activité CCR peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester, capable de convertir l'acide caféique ou l'acide p-coumarique en féruloyl-CoA et capable de convertir le coniféraldéhyde en acide férulique, c'est-à-dire exprimant une enzyme ALDH telle que définie ci-après. L'activité CCR est détectée par la production d'acide férulique en présence d'acide caféique ou d'acide p-coumarique, de préférence par une technique d'HPLC.

La CCR peut être une enzyme de plante, de préférence du genre Populus, Arabidopsis, Oryza, Zea, Medicago ou Sorghum, en particulier Populus tomentosa, Arabidopsis thaliana, Oryza sativa, Zea Mays, Medicago truncatula ou Sorghum bicolor. De préférence, la CCR est une enzyme de Populus tomentosa, en particulier la CCR décrite dans la SEQ ID NO : 4.

Selon un mode de réalisation préféré, la CCR comprend une séquence choisie parmi la séquence SEQ. ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR.

Tel qu'utilisé ici, le terme « aldéhyde déshydrogénase» ou « ALDH » se réfère à une enzyme appartenant à la classe EC 1.2.1.3 et qui catalyse l'oxydation d'un aldéhyde, par exemple le coniféraldéhyde, en acide carboxylique, par exemple en acide férulique. De préférence, ce terme se réfère à une enzyme qui catalyse l'oxydation du coniféraldéhyde en acide férulique.

La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité ALDH peut être détectée in vitro par exemple en utilisant un kit de test in vitro disponible dans le commerce. En particulier, pour déterminer s'il y a une activité aldéhyde déshydrogénase, un test enzymatique peut être effectué et consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (ALDH putative), d'un aldéhyde et de NAD dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de la forme acide et du NADH peut être est observée soit au spectrophotomètre UV à 450nm ou par HPLC. L'activité ALDH peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité ALDH peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. L'aldéhyde substrat de ladite enzyme est soit synthétisé par le microorganisme, soit apporté dans le milieu de culture. L'acide carboxylique produit par une enzyme présentant l'activité recherchée peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. De manière particulièrement préférée, l'activité ALDH peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester, capable de convertir l'acide caféique ou l'acide p-coumarique en féruloyl-CoA et capable de convertir le féruloyl-CoA en coniféraldéhyde, c'est-à-dire exprimant une enzyme CCR telle que définie ci-dessus. L'activité ALDH est détectée par la production d'acide férulique en présence d'acide caféique ou d'acide p- coumarique, de préférence par une technique d'HPLC.

L'ALDH peut être une enzyme de plante, de préférence du genre Arabidopsis, Populus, Oryza, Zea, Medicago ou Sorghum, en particulier Arabidopsis thaliana, Populus tomentosa, Oryza sativa, Zea Mays, Medicago truncatula ou Sorghum bicolor. De manière alternative, cette enzyme peut être une enzyme produite par un microorganisme, par exemple par une levure du genre Saccharomyces, en particulier une levure Saccharomyces cerevisiae. Dans certains modes de réalisation, l'enzyme correspond à l'enzyme endogène du microorganisme. Dans ces cas, l'enzyme peut être surexprimée, par exemple en remplaçant le promoteur endogène par un promoteur hétérologue fort et/ou en augmentant le nombre de copie du gène.

De préférence, l'ALDH est une enzyme de plante, et de manière plus particulièrement préférée, une enzyme d'Arabidopsis thaliana, en particulier l'ALDH décrite dans la SEQ ID NO : 3.

Selon un mode de réalisation particulier, l'ALDH comprend une séquence choisie parmi la séquence SEQ. ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH.

Selon un mode de réalisation particulier, le microorganisme selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH et dans lequel

- ladite CCR comprend une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR ; et

- ladite ALDH comprend une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH.

Selon des modes de réalisation particuliers, le microorganisme selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une 4CL telle que définie ci- dessus, une séquence d'acide nucléique hétérologue codant pour une CCoA3H telle que définie ci-dessus, une séquence d'acide nucléique hétérologue codant pour une acyl- coenzyme A thioestérase telle que définie ci-dessus, une séquence d'acide nucléique hétérologue codant pour une CCoAMT telle que définie ci-dessus et comprend optionnellement une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH telles que définies ci- dessus.

Selon un mode de réalisation particulier, le microorganisme recombinant selon l'invention comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée une 4CL comprenant une séquence choisie parmi les séquences SEQ. ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H; de préférence une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de manière plus particulièrement préférée une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT, et

- une séquence d'acide nucléique hétérologue codant pour une CCR comprenant une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR ; et

- une séquence d'acide nucléique hétérologue codant pour une ALDH comprenant une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 3 et présentant l'activité ALDH.

De manière alternative ou additionnelle à la présence de CCoAMT, le microorganisme selon l'invention peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une acide caféique-O-méthyltransférase (COMT).

Tel qu'utilisé ici, le terme « acide caféique-O-méthyltransférase» ou « COMT» se réfère à une enzyme appartenant à la classe EC 2.1.1.68 et qui catalyse la conversion de l'acide caféique en acide férulique.

La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité COMT peut être détectée in vitro, par exemple en utilisant un test in vitro disponible dans le commerce (par exemple le test Methyltransferase activity kit, Enzo lifes sciences, AFI-907-025). L'activité COMT peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité COMT peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. Le substrat de ladite enzyme (l'acide caféique) est soit synthétisé par le microorganisme, soit apporté dans le milieu de culture. L'acide férulique produit par une enzyme présentant l'activité recherchée peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. De manière particulièrement préférée, l'activité COMT peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester et capable de convertir l'acide p-coumarique en acide caféique et dépourvu d'autre voie permettant de produire de l'acide férulique. L'activité COMT est détectée par la production d'acide férulique en présence d'acide p-coumarique, de préférence par une technique d'HPLC.

La COMT peut être une enzyme de plante, de préférence du genre Panicum, Arabidopsis, Catharanthus, Triticum, Nicotiana, Picea, Zea, Saccharum, Stylosanthes, Cucumis, Tarenaya, Ziziphus, Cucurbita, Ipomoea, Thalictrum, Punica, Brassica, Lycium ou Acer, de manière plus particulièrement préférée du genre Panicum, Arabidopsis, Catharanthus, Triticum, Nicotiana, Picea, Zea, Picea ou Saccharum.

En particulier, la COMT peut être une enzyme de Panicum virgatum, Arabidopsis thaliana, Catharanthus roseus, Triticum aestivum, Nicotiana tabacum, Picea abies, Zea mays, Stylosanthes humilis, Saccharum officinarum, Cucumis sativus, Tarenaya hassleriana, Ziziphus jujuba var. spinosa, Cucurbita maxima, Ipomoea nil, Thalictrum tuberosum, Punica granatum, Brassica cretica, Lycium chinense ou Aceryangbiense, de préférence une enzyme de Panicum virgatum, Arabidopsis thaliana, Catharanthus roseus, Triticum aestivum, Nicotiana tabacum, Picea abies, Zea mays, Stylosanthes humilis ou Saccharum officinarum

En particulier, la COMT peut être une enzyme de Panicum virgatum, en particulier la COMT décrite dans la SEQ ID NO : 71 ou 76, une enzyme d'Arabidopsis thaliana, en particulier la COMT décrite dans la SEQ. ID NO : 72, une enzyme de Catharanthus roseus, en particulier la COMT décrite dans la SEQ ID NO : 73, une enzyme de Triticum aestivum, en particulier la COMT décrite dans la SEQ ID NO : 74 ou 75, une enzyme de Nicotiana tabacum, en particulier la COMT décrite dans la SEQ ID NO : 77, une enzyme de Picea abies, en particulier la COMT décrite dans la SEQ ID NO : 78, une enzyme de Zea mays, en particulier la COMT décrite dans la SEQ ID NO : 79 ou dans la SEQ ID NO : 82, une enzyme de Stylosanthes humilis, en particulier la COMT décrite dans la SEQ ID NO : 80, une enzyme de Saccharum officinarum, en particulier la COMT décrite dans la SEQ ID NO : 81, une enzyme de Cucumis sativus, en particulier la COMT décrite dans la SEQ ID NO :83, une enzyme de Tarenaya hassleriana, en particulier la COMT décrite dans la SEQ ID NO : 84, une enzyme de Ziziphus jujuba var. spinosa, en particulier la COMT décrite dans la SEQ ID NO :85, une enzyme de Cucurbita maxima, en particulier la COMT décrite dans la SEQ ID NO :86, une enzyme de Ipomoea nil, en particulier la COMT décrite dans la SEQ ID NO :87, une enzyme de Thalictrum tuberosum, en particulier la COMT décrite dans la SEQ ID NO :88, une enzyme de Punica granatum, en particulier la COMT décrite dans la SEQ ID NO :89, une enzyme de Brassica cretica, en particulier la COMT décrite dans la SEQ ID NO :90, une enzyme de Lycium chinense, en particulier la COMT décrite dans la SEQ ID NO :91 ou une enzyme de Acer yangbiense, en particulier la COMT décrite dans la SEQ ID NO :92.

De manière plus particulière, la COMT peut être une enzyme de Panicum virgatum, en particulier la COMT décrite dans la SEQ ID NO : 71 ou 76, une enzyme d'Arabidopsis thaliana, en particulier la COMT décrite dans la SEQ ID NO : 72, une enzyme de Catharanthus roseus, en particulier la COMT décrite dans la SEQ ID NO : 73, une enzyme de Triticum aestivum, en particulier la COMT décrite dans la SEQ ID NO : 74 ou 75, une enzyme de Nicotiana tabacum, en particulier la COMT décrite dans la SEQ ID NO : 77, une enzyme de Picea abies, en particulier la COMT décrite dans la SEQ ID NO : 78, une enzyme de Zea mays, en particulier la COMT décrite dans la SEQ ID NO : 79, une enzyme de Stylosanthes humilis, en particulier la COMT décrite dans la SEQ ID NO : 80, ou une enzyme de Saccharum officinarum, en particulier la COMT décrite dans la SEQ ID NO : 81.

Selon un mode de réalisation, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 71 à 92, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un mode de réalisation particulier, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 71 à 81, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un mode de réalisation préféré, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 72 à 74, 76 et 79 à 92 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un mode de réalisation encore préféré, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un mode de réalisation particulier, la COMT comprend une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT.

Selon un mode de réalisation particulier, le microorganisme recombinant selon l'invention comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H; de préférence une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de manière plus particulièrement préférée une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ. ID NO : 71 à 92, de préférence SEQ ID NO : 71 à 81, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 71 à 81, et présentant l'activité COMT, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 72 à 74, 76 et 79 à 92, de préférence les séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et présentant l'activité COMT, et de manière plus particulièrement préférée une COMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT.

Optionnellement, le microorganisme selon l'invention peut également comprendre une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT.

Selon un mode de réalisation préféré, le microorganisme recombinant comprend

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de préférence une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ. ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT, de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT.

Optionnellement, le microorganisme selon l'invention peut également comprendre une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT.

Le microorganisme selon l'invention peut être capable de produire de l'acide p-coumarique à partir d'un intermédiaire de synthèse tel que l'acide cinnamique, la tyrosine ou la phénylalanine, ou à partir de glucose via la phénylalanine ou la tyrosine.

Production d'acide p-coumarique à partir de la tyrosine

La production d'acide p-coumarique à partir de tyrosine implique une enzyme présentant une activité tyrosine ammonia lyase (TAL).

Ainsi, le microorganisme selon l'invention peut comprendre, outre les séquences d'acide nucléique hétérologues décrites ci-dessus codant pour une 4CL, une CCoA3H, une acyl- coenzyme A thioestérase et optionnellement pour une COMT et/ou une CCoAMT (optionnellement en combinaison avec une CCR et une ALDH), une séquence d'acide nucléique hétérologue codant pour une enzyme ayant une activité tyrosine ammonia lyase.

Tel qu'utilisé ici, le terme « tyrosine ammonia lyase» ou « TAL » se réfère à une enzyme catalysant la production d'acide p-coumarique à partir de L-tyrosine (EC 4.3.1.23).

La détection d'une activité tyrosine ammonia lyase peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité TAL peut notamment être détectée via un test enzymatique consistant en l'incubation in vitro d'un mélange composé de l'enzyme à tester et de tyrosine dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide p-coumarique est observée en UPLC-MS en comparaison au standard attendu.

Certaines TAL peuvent également présenter une activité dihydroxyphénylalanine ammonia lyase (DAL) et/ou phénylalanine ammonia lyase (PAL).

La TAL peut être une enzyme produite par une bactérie, en particulier une bactérie du genre Rhodobacter, de préférence Rhodobacter capsulatus ou Rhodobacter sphaeroides, du genre Ralstonia, de préférence Ralstonia metallidurans, ou du genre Flavobacteriaceae, de préférence Flavobacterium johnsoniae. Elle peut également être une enzyme produite par une plante, par exemple par Citrus sinensis, Camellia sinensis, Fragaria x ananassa ou Zea mays. De préférence, la TAL est une enzyme produite par une levure, en particulier une levure du genre Rhodotorula, par exemple Rhodotorula glutinis ou par une plante, en particulier du genre Citrus, par exemple Citrus sinensis.

En particulier, la TAL peut être une enzyme de Flavobacterium johnsoniae, de préférence l'enzyme décrite dans la SEQ ID NO : 30, une enzyme de Rhodotorula glutinis, de préférence l'enzyme décrite dans la SEQ. ID NO : 19 ou une enzyme de Citrus sinensis, de préférence l'enzyme décrite dans la SEQ ID NO : 68.

Dans un mode de réalisation particulier, la TAL comprend une séquence choisie parmi SEQ ID NOs : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité TAL.

Dans un mode de réalisation préférée, la TAL comprend une séquence choisie parmi SEQ ID NOs : 19 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité TAL.

Dans un mode de réalisation encore préférée, la TAL comprend une séquence choisie parmi SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant l'activité TAL.

Selon un mode de réalisation particulier, le microorganisme recombinant selon l'invention comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H; de préférence une CCoA3H comprenant une séquence choisie parmi les séquences SEQ. ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de manière plus particulièrement préférée une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la SEQ ID NO : 19, et présentant l'activité TAL.

Optionnellement, dans ce mode de réalisation, le microorganisme peut également comprendre

- une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT ; et/ou - une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 71 à 92, de préférence SEQ ID NO : 71 à 81, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 71 à 81, et présentant l'activité COMT, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 72 à 74, 76 et 79 à 92, de préférence les séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et présentant l'activité COMT, et de manière plus particulièrement préférée une COMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT.

Selon un mode de réalisation préféré, le microorganisme recombinant comprend

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de préférence une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la SEQ ID NO : 19, et présentant l'activité TAL.

Optionnellement, dans ce mode de réalisation, le microorganisme peut également comprendre - une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ. ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT, de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT.

Production d'acide p-coumarique à partir de la phénylalanine

La production d'acide p-coumarique à partir de phénylalanine fait intervenir des enzymes spécifiques de cette voie, à savoir une phénylalanine ammonia lyase (PAL) capable de produire de l'acide cinnamique à partir de la phénylalanine et une cinnamate 4-hydroxylase (C4H) capable de produire de l'acide p-coumarique à partir de l'acide cinnamique(cf. Figure 6).

Ainsi, le microorganisme selon l'invention peut comprendre, outre les séquences d'acide nucléique hétérologues décrites ci-dessus codant pour une 4CL, une CCoA3H, une acyl- coenzyme A thioestérase et optionnellement pour une COMT et/ou une CCoAMT (optionnellement en combinaison avec une CCR et une ALDH) et/ou une TAL, une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et/ou une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H).

Tel qu'utilisé ici, le terme « phénylalanine ammonia lyase» ou « PAL » se réfère à une enzyme catalysant la production d'acide cinnamique (aussi appelé acide trans-cinnamique) à partir de phénylalanine (EC 4.3.1.24).

La détection d'une activité phénylalanine ammonia lyase peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité PAL peut notamment être détectée via un test enzymatique consistant en l'incubation in vitro d'un mélange composé de l'enzyme à tester et de phénylalanine dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide cinnamique est observée en UPLC-MS en comparaison au standard attendu.

Certaines PAL peuvent également présenter une activité TAL et/ou une activité DAL.

Plusieurs enzymes PAL ont déjà été décrites dans l'art antérieur. De préférence, La PAL provient d'une plante, par exemple une plante du genre Arabidopsis, Agastache, Ananas, Asparagus, Brassica, Bromheadia, Bambusa, Beta, Betula, Citrus, Cucumis, Camellia, Capsicum, Cassia, Catharanthus, Cicer, Citrullus, Coffea, Cucurbita, Cynodon, Daucus, Dendrobium, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Lotus, Lycopersicon, Medicago, Malus, Manihot, Medicago, Mesembryanthemum, Nicotiana, Olea, Oryza, Phaseolus, Pinus, Populus, Pisum, Persea, Petroselinum, Phalaenopsis, Phyllostachys, Physcomitrella, Picea, Pyrus, Prunus, Quercus, Raphanus, Rehmannia, Rubus, Solanum, Sorghum, Sphenostylis, Stellaria, Stylosanthes, Triticum, Trifolium, Vaccinium, Vigna, Vitis, Zea, ou Zinnia.

En particulier, la PAL peut être une enzyme d’ Arabidopsis thaliana, de préférence l'enzyme décrite dans la SEQ ID NO : 20 ou 69, ou une enzyme de Citrus sinensis, de préférence l'une des enzymes décrites dans les SEQ ID NOs : 31 et 32.

Dans un mode de réalisation particulier, la PAL comprend une séquence choisie parmi SEQ. ID NOs : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL.

Dans un mode de réalisation préféré, la PAL comprend une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL.

Dans un mode de réalisation encore préféré, la PAL comprend une séquence choisie parmi la séquence SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant l'activité PAL.

Tel qu'utilisé ici, le terme « cinnamate 4-hydroxylase» ou « C4H » se réfère à une enzyme catalysant la production d'acide p-coumarique à partir d'acide cinnamique (EC 1.14.13.11). Cette enzyme est CPR dépendante.

La détection d'une activité cinnamate 4-hydroxylase peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité C4H peut notamment être détectée via un test enzymatique qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester, d'acide cinnamique, de NADPH, d'H + et d'O? dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide p-coumarique est observée en UPLC-MS en comparaison au standard attendu.

Plusieurs enzymes C4H ont déjà été décrites dans l'art antérieur. De préférence, La C4H provient d'une plante, par exemple une plante du genre Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Panicum, Physcomitreila, Phaseolus, Pinus, Populus, Ruta, Saccharum, Solanum, Vitis, Vigna ou Zea.

En particulier, la C4H peut être une enzyme d'Arabidopsis thaliana, de préférence l'enzyme décrite dans la SEQ ID NO : 21, une enzyme de Citrus sinensis, de préférence l'une des enzymes décrites dans les SEQ. ID NOs : 33 et 34 ou une enzyme de Panicum virgatum, de préférence l'enzyme décrite dans la SEQ. ID NO : 70.

Dans un mode de réalisation particulier, la C4H comprend une séquence choisie parmi SEQ ID NOs : 21, 33, 34 et 70 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H.

Dans un mode de réalisation préféré, la C4H comprend une séquence choisie parmi les séquences SEQ ID NO : 21 et 70 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H.

Dans un mode de réalisation encore préféré, la C4H comprend une séquence choisie parmi la séquence SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant l'activité C4H.

Selon un mode de réalisation, le microorganisme selon l'invention comprend

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69, de préférence SEQ ID NO : 20, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 20, et présentant l'activité PAL ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 21, 70, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ ID NO : 21 et 70, de préférence SEQ ID NO : 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 21, et présentant l'activité C4H. Selon un mode de réalisation particulier, le microorganisme recombinant selon l'invention comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ. ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H; de préférence une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de manière plus particulièrement préférée une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi SEQ ID NOs : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69, de préférence SEQ ID NO : 20, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 20, et présentant l'activité PAL ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi SEQ. ID NOs : 21, 70, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ. ID NO : 21 et 70, de préférence SEQ ID NO : 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 21, et présentant l'activité C4H.

Optionnellement, dans ce mode de réalisation, le microorganisme peut également comprendre

- une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 71 à 92, de préférence SEQ ID NO : 71 à 81, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 71 à 81, et présentant l'activité COMT, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 72 à 74, 76 et 79 à 92, de préférence les séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et présentant l'activité COMT, et de manière plus particulièrement préférée une COMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la séquence SEQ ID NO : 19, et présentant l'activité TAL, de préférence, (i) une séquence d'acide nucléique hétérologue codant pour une CCoAMT et/ou une séquence d'acide nucléique hétérologue codant pour une COMT et (ii) une séquence d'acide nucléique hétérologue codant pour une TAL.

Selon un mode de réalisation préféré, le microorganisme recombinant comprend

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de préférence une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69, de préférence SEQ ID NO : 20, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 20, et présentant l'activité PAL ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi les séquences SEQ ID NO : 21 et 70, de préférence SEQ ID NO : 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 21, et présentant l'activité C4H.

Optionnellement, dans ce mode de réalisation, le microorganisme peut également comprendre - une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ. ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT, de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT et/ou

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la SEQ ID NO : 19, et présentant l'activité TAL, de préférence, (i) une séquence d'acide nucléique hétérologue codant pour une CCoAMT et/ou une séquence d'acide nucléique hétérologue codant pour une COMT et (ii) une séquence d'acide nucléique hétérologue codant pour une TAL.

Production d'acide caféique via des voies non CoA

La production d'acide caféique à partir de tyrosine et via des voies impliquant des composés non couplés à la CoA peut faire intervenir deux voies : la première implique la transformation de la tyrosine en acide p-coumarique puis de l'acide p-coumarique en acide caféique, la seconde implique la transformation de la tyrosine en L-Dopa puis de la L-Dopa en acide caféique (cf. Figure 6).

La production d'acide caféique à partir d'acide p-coumarique ou de L-Dopa à partir de tyrosine peut être le fait d'une enzyme ou d'un complexe enzymatique ayant une activité p-coumarate 3-hydroxylase.

Ainsi, le microorganisme selon l'invention peut comprendre, outre les séquences d'acide nucléique hétérologues décrites ci-dessus codant pour une 4CL, une CCoA3H, une acyl- coenzyme A thioestérase et optionnellement pour une COMT et/ou une CCoAMT (optionnellement en combinaison avec une CCR et une ALDH) et/ou une TAL et/ou une PAL et/ou une C4H, une ou plusieurs séquences d'acide nucléique hétérologues codant pour une enzyme ou un complexe enzymatique ayant une activité p-coumarate 3-hydroxylase.

Tel qu'utilisé ici, le terme « activité p-coumarate 3-hydroxylase » se réfère à une enzyme ou un complexe enzymatique catalysant la transformation de l'acide p-coumarique en acide caféique et/ou de la L-tyrosine en L-Dopa. Pour déterminer s'il y a une activité p-coumarate 3 hydroxylase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro de l'enzyme ou du complexe enzymatique, d'acide p-coumarique ou de L-Tyrosine, et éventuellement de FAD et de NADH, dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide caféique ou de la L-Dopa est observée en HPLC-MS en comparaison au standard attendu.

En particulier, cette activité peut être le fait d'un complexe enzymatique comprenant une 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB) et une 4- hydroxyphénylacetate 3-monooxygénase réductase (HpaC).

Le terme « 4-hydroxyphénylacetate 3-monooxygénase oxygénase » se réfère à une enzyme présentant une activité p-coumarate 3-hydroxylase lorsqu'elle est en présence d'une 4- hydroxyphénylacetate 3-monooxygénase réductase. Le terme « 4-hydroxyphénylacetate 3- monooxygénase réductase » se réfère à une enzyme présentant une activité p-coumarate 3-hydroxylase lorsqu'elle est en présence d'une 4-hydroxyphénylacetate 3-monooxygénase oxygénase.

De préférence, les enzymes HpaB et HpaC sont produites par des bactéries, de préférence Escherichia coli, des bactéries du genre Pseudomonas, en particulier Pseudomonas aeruginosa, ou des bactéries du genre Salmonella, en particulier Salmonella enterica. Les enzymes HpaB et HpaC peuvent être originaires de la même bactérie ou de bactéries différentes.

En particulier, la HpaB peut être une enzyme de Pseudomonas aeruginosa, en particulier la HpaB décrite dans la SEQ ID NO : 17, ou une enzyme d’ Escherichia coli, en particulier la HpaB décrite dans la SEQ. ID NO : 26.

Selon un mode de réalisation, la HpaB comprend une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase.

Selon un mode de réalisation préféré, la HpaB comprend une séquence choisie parmi la séquence SEQ ID NO : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase.

La HpaC peut être une enzyme de Salmonella enterica, en particulier la HpaC décrite dans la SEQ ID NO : 18, ou une enzyme d' Escherichia coli, en particulier la HpaC décrite dans la SEQ ID NO : 27.

Selon un mode de réalisation, la HpaC comprend une séquence choisie parmi les séquences SEQ ID NO : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase. Selon un mode de réalisation préféré, la HpaC comprend une séquence choisie parmi la séquence SEQ ID NO : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 18 et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase.

Selon un mode de réalisation particulier, le microorganisme comprend

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase.

De manière alternative à l'utilisation des HpaB et HpaC ou en combinaison avec celles-ci, il est possible d'utiliser d'une part une enzyme permettant de convertir la tyrosine en L-Dopa, à savoir une 4-méthoxybenzoate O-déméthylase, et d'autre part une enzyme permettant de convertir l'acide p-coumarique en acide caféique, à savoir une p-coumarate 3- hydroxylase (cf. Figure 6). Ces enzymes font partie de la famille des cytochrome P450 (CYP) et sont CPR dépendantes, c'est-à-dire qu'elles sont actives en présence d'une cytochrome P450 réductase (CPR). La cytochrome P450 réductase peut être une enzyme endogène ou une enzyme hétérologue.

Ainsi, le microorganisme selon l'invention peut comprendre une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase CPR dépendante (C3H), c'est-à-dire une enzyme capable de convertir l'acide p-coumarique en acide caféique en présence d'une CPR (EC 1.14.13). L'activité p-coumarate 3-hydroxylase de cette enzyme peut être testée comme indiqué ci-dessus et en présence d'une CPR.

La C3H peut être une enzyme de bactérie, notamment de bactéries du genre Saccharothrix. En particulier, la C3H peut être une enzyme de Saccharothrix espanaensis, de préférence l'enzyme décrite dans la SEQ ID NO : 25.

Dans un mode de réalisation particulier, la C3H comprend une séquence choisie parmi la séquence SEQ. ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase.

Le microorganisme selon l'invention peut également comprendre une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase. c'est-à-dire une enzyme capable de convertir la L-tyrosine en L-Dopa en présence d'une CPR (EC 1.14.99.15). L'activité p-coumarate 3-hydroxylase de cette enzyme peut être testée comme indiqué ci-dessus et en présence d'une CPR et de tyrosine.

La 4-méthoxybenzoate O-déméthylase peut être une enzyme de bactérie, notamment de Rhodopseudomonas palustris, Pseudomonas putida, ou Escherichia coli, de plante, notamment de Beta vulgaris, de mammifère, notamment d'Oryctolagus cuniculus, ou de champignon, notamment de Rhodotorula glutinis. Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase est une enzyme de Rhodopseudomonas palustris, en particulier l'enzyme décrite dans la SEQ ID NO : 28, ou de Beta vulgaris, en particulier l'enzyme décrite dans la SEQ ID NO : 29.

Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase comprend une séquence choisie parmi SEQ ID NOs : 28 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité L-tyrosine hydrolase.

La production d'acide caféique à partir de L-Dopa implique une enzyme présentant une activité dihydroxyphénylalanine ammonia lyase (DAL). Selon un mode de réalisation, le microorganisme selon l'invention peut comprendre une séquence d'acide nucléique hétérologue codant pour une enzyme ayant une activité dihydroxyphénylalanine ammonia lyase.

Tel qu'utilisé ici, le terme « dihydroxyphénylalanine ammonia lyase» ou « DAL » se réfère à une enzyme catalysant la production d'acide caféique à partir de L-Dopa (EC 4.3.1.11).

La détection d'une activité dihydroxyphénylalanine ammonia lyase peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité DAL peut notamment être détectée via un test enzymatique consistant en l'incubation in vitro d'un mélange composé de l'enzyme à tester et de L-Dopa dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide caféique est observée en UPLC-MS en comparaison au standard attendu.

Certaines DAL peuvent également présenter une activité TAL et/ou PAL. Selon un mode de réalisation, le microorganisme selon l'invention comprend

(i) - une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ. ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase ; et/ou

(ii) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase ; et/ou

(iii) une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O- déméthylase, de préférence comprenant une séquence choisie parmi SEQ ID NOs : 28 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité L-tyrosine hydrolase.

Selon un mode de réalisation particulier, le microorganisme recombinant selon l'invention comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ. ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H; de préférence une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de manière plus particulièrement préférée une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

(i) - une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase ; et/ou

(ii) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence comprenant une séquence choisie parmi la séquence SEQ. ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase ; et/ou

(iii) une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O- déméthylase, de préférence comprenant une séquence choisie parmi SEQ ID NOs : 28 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité L-tyrosine hydrolase.

Optionnellement, dans ce mode de réalisation, le microorganisme peut également comprendre

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la SEQ ID NO : 19, et présentant l'activité TAL et/ou

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi SEQ ID NOs : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69, de préférence SEQ ID NO : 20, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 20, et présentant l'activité PAL ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi SEQ ID NOs : 21, 70, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ ID NO : 21 et 70, de préférence SEQ ID NO : 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 21, et présentant l'activité C H ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi les séquences SEQ. ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 71 à 92, de préférence SEQ ID NO : 71 à 81, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 71 à 81, et présentant l'activité COMT, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 72 à 74, 76 et 79 à 92, de préférence les séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et présentant l'activité COMT, et de manière plus particulièrement préférée une COMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT, de préférence, (i) une séquence d'acide nucléique hétérologue codant pour une CCoAMT et/ou une séquence d'acide nucléique hétérologue codant pour une COMT et (ii) une séquence d'acide nucléique hétérologue codant pour une TAL, une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) et une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL).

Selon un mode de réalisation préféré, le microorganisme recombinant selon l'invention comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de préférence une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ. ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase oxygénase comprenant une séquence choisie parmi parmi la SEQ. ID No : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase comprenant une séquence choisie parmi la SEQ ID No : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase.

Optionnellement, dans ce mode de réalisation, le microorganisme peut également comprendre

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la SEQ ID NO : 19, et présentant l'activité TAL et/ou

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69, de préférence SEQ ID NO : 20, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 20, et présentant l'activité PAL ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi les séquences SEQ ID NO : 21 et 70, de préférence SEQ ID NO : 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 21, et présentant l'activité C4H; et/ou

- une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ. ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT, de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT, de préférence, (i) une séquence d'acide nucléique hétérologue codant pour une CCoAMT et/ou une séquence d'acide nucléique hétérologue codant pour une COMT et (ii) une séquence d'acide nucléique hétérologue codant pour une TAL, une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) et une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL).

CPR : cytochrome P450 réductase

Certaines enzymes mentionnées ci-dessus telles que les C3H ou les C4H sont des enzymes CPR-dépendantes. Les activités de ces enzymes nécessitent la présence de NADPH et donc la présence d'une cytochrome P450 réductase (CPR), en particulier une NADPH-cytochrome P450 réductase.

Ainsi, dans les différents modes de réalisation décrits ci-dessus et ci-après concernant le microorganisme selon l'invention, celui-ci peut en outre comprendre un acide nucléique endogène codant pour une cytochrome P450 réductase. Optionnellement, la CPR endogène peut être surexprimée, par exemple en remplaçant le promoteur du gène endogène par un promoteur hétérologue fort et/ou en augmentant le nombre de copies du gène endogène.

Alternativement, ou en plus de cet acide nucléique endogène, le microorganisme selon l'invention peut comprendre une séquence d'acide nucléique hétérologue qui code pour une cytochrome P450 réductase (CPR).

Tel qu'utilisé ici, le terme « cytochrome P450 réductase » ou « CPR » se réfère à une enzyme impliquée dans le transfert d'électrons depuis le NADPH et appartenant à la classe EC 1.6.2.4.

La détection d'une activité CPR peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. Les CPR sont des enzymes qui catalysent le transfert d'électrons du NADPH vers les cytochromes p450 (par exemple C3H ou C4H). Ainsi, l'activité CPR peut notamment être détectée en utilisant un kit enzymatique associant l'oxydation du NADPH par la CPR à la réduction d'un substrat incolore en un produit coloré avec un pic d'absorbance à une longueur d'onde donnée, le taux de génération de couleur étant directement proportionnel à l'activité CPR. Un exemple de kit commercial basé sur ce principe est le kit « CPR activity assay kit » de PromoKine (Cat# PK-CA577-K700).

La CPR provient de préférence d'un eucaryote, notamment d'une levure, par exemple une levure du genre Saccharomyces, ou d'une plante, par exemple une plante du genre Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Phaseolus, Physcomitrella, Pinus, Populus, Ruta, Saccharum, Solanum, Vigna, Vitis ou Zea.

En particulier, la CPR peut être une enzyme de Catharanthus roseus, de préférence l'enzyme décrite dans la SEQ ID NO : 22, une enzyme de Saccharomyces cerevisiae, de préférence l'enzyme décrite dans la SEQ. ID NO : 35, ou une enzyme d'Arabidopsis thaliana, de préférence l'une des enzymes décrites dans les SEQ ID NOs : 36 et 37. La CPR peut également être une protéine chimérique telle que celle décrite dans l'article d'Aigrain et al (2009, EMBO reports, 10, 742-747 ; SEQ ID NO : 38).

Dans un mode de réalisation particulier, la CPR comprend une séquence choisie parmi SEQ ID NOs : 22, 35, 36, 37 et 38 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité CPR.

Dans un mode de réalisation préféré, la CPR comprend une séquence choisie parmi SEQ ID NO : 22 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 22 et présentant l'activité CPR.

Augmentation de la production de tyrosine et/ou de phénylalanine

Dans les différents modes de réalisation décrits ci-dessus et ci-après concernant le microorganisme selon l'invention, celui-ci peut également être modifié pour augmenter la production de tyrosine et/ou de phénylalanine, de préférence de tyrosine. Ainsi, dans des modes de réalisation préférés, le microorganisme selon l'invention produit des quantités importantes de tyrosine et/ou de phénylalanine, en particulier à partir d'une source carbonée simple comme le glucose.

Cette augmentation peut être obtenue par toute méthode connue de l'homme du métier et notamment en exprimant un ou plusieurs variants d'une ou plusieurs enzymes impliquées dans la synthèse de ces acides aminés, lesdits variants étant résistants au rétrocontrôle par la tyrosine et/ou la phénylalanine, de préférence résistants au rétrocontrôle par la tyrosine.

En particulier, le microorganisme peut être modifié pour exprimer un variant de la 3-deoxy- D-arabino-hepturosonate-7-phosphate (DAHP) synthase (EC 2.5.1.54) et/ou de la chorismate mutase (EC 5.4.99.5), résistant au rétrocontrôle par la tyrosine. De tels variants sont bien connues de l'homme du métier (voir par exemple Gold et a!., Microb Cell Fact. 2015;14:73).

Ainsi, selon un mode de réalisation particulier, le microorganisme selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une 3-deoxy-D- arabino-hepturosonate-7-phosphate (DAHP) synthase résistante au rétrocontrôle par la tyrosine et/ou une séquence d'acide nucléique hétérologue codant pour une chorismate mutase résistante au rétrocontrôle par la tyrosine.

Chez la levure 5. cerevisiae, la 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase est codée par le gène ARO4 (NCBI Gene ID: 852551) et la chorismate mutase est codée par le gène ARO7 (NCBI Gene ID: 856173). Des variants résistants au rétrocontrôle par la tyrosine de ces enzymes sont connus, par exemple le mutant ARO4 K229L (SEQ ID NO : 23) et le mutant ARO7 G141S (SEQ ID NO : 24).

Ainsi, selon un mode de réalisation préféré, le microorganisme selon l'invention comprend

- une séquence d'acide nucléique hétérologue codant pour une 3-deoxy-D-arabino- hepturosonate-7-phosphate (DAHP) synthase résistante au rétrocontrôle par la tyrosine et comprenant une séquence choisie parmi SEQ ID NO : 23 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 23, lesdits polypeptides présentant une activité 3-deoxy-D-arabino- hepturosonate-7-phosphate (DAHP) synthase résistante au rétrocontrôle par la tyrosine et, de préférence, une leucine à la position correspondant à la position 229 de la SEQ ID NO : 23 ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une chorismate mutase résistante au rétrocontrôle par la tyrosine et comprenant une séquence choisie parmi SEQ ID NO : 24 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 24, lesdits polypeptides présentant une activité chorismate mutase résistante au rétrocontrôle par la tyrosine et, de préférence, une sérine à la position correspondant à la position 141 de la SEQ ID NO : 24.

De manière alternative ou cumulative, l'augmentation de la production de tyrosine et/ou de phénylalanine peut également être obtenue en redirigeant le flux de carbone d'autres voies métaboliques vers celle de la tyrosine et/ou phénylalanine, de préférence de la tyrosine. Ces modifications et les gènes impliqués sont bien connus de l'homme du métier (voir US 8,809,028 ; Pandey et al, 2016, Biotechnol Adv., 34, 634-662).

Ainsi, selon un mode de réalisation particulier, dans le microorganisme selon l'invention, un ou plusieurs gènes endogènes codant pour une enzyme impliquée dans la voie de dégradation des acides aminés d'Ehrlich, sont inactivés. Le ou les gènes peuvent être inactivés par toute méthode connue de l'homme du métier, en particulier par délétion totale ou partielle, ou par insertion d'une séquence nucléique dans la séquence codante, notamment une séquence décalant le cadre de lecture ou insérant un codon stop. En particulier, dans le microorganisme selon l'invention, un gène endogène codant pour une phénylpyruvate décarboxylase peut être inactivé. Cette enzyme est responsable de la première étape de la voie de dégradation des acides aminés d'Ehrlich. Chez la levure 5. cerevisiae, la phénylpyruvate décarboxylase est codée par le gène ARO10 (NCBI Gene ID: 851987).

Inactivation de l'acide férulique décarboxylase

Dans les différents modes de réalisation décrits ci-dessus concernant le microorganisme selon l'invention, celui-ci peut également être modifié pour inactiver le ou les gènes endogènes codant pour une acide férulique décarboxylase.

Cette enzyme catalyse notamment la décarboxylation de l'acide férulique, de l'acide p- coumarique et de l'acide cinnamique pour produire leurs dérivés vinyliques, à savoir respectivement le 4-vinylguaiacol, le 4-vinylphénol, et le styrène. Elle appartient à la classe EC 4.1.1.102. Son inactivation permet d'augmenter les quantités disponibles d'acide cinnamique et d'acide p-coumarique et les quantités produites d'acide férulique dans le microorganisme selon l'invention.

Le ou les gènes codant pour cette enzyme chez le microorganisme selon l'invention peuvent être aisément identifiés par l'homme du métier. Par exemple, chez la levure Saccharomyces cerevisiae, l'acide férulique décarboxylase est codée par le gène FDC1 (NCBI Gene ID: 852152).

Le ou les gènes peuvent être inactivés par toute méthode connue de l'homme du métier, en particulier par délétion totale ou partielle, ou par insertion d'une séquence nucléique dans la séquence codante, notamment une séquence décalant le cadre de lecture ou insérant un codon stop.

Microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une acide caféique-O-méthyltransférase (COMT)

Les inventeurs ont identifié différentes enzymes COMT particulièrement efficaces pour produire de l'acide férulique à partir d'acide caféique. Ces enzymes permettent ainsi d'améliorer significativement la production d'acide férulique obtenue à partir de microorganismes recombinants, que ces derniers utilisent ou non une voie de synthèse de l'acide caféique impliquant des composés liés à la coenzyme A (CoA).

Ainsi, selon un autre aspect, la présente invention concerne un microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une acide caféique-O-méthyltransférase (COMT).

La COMT est une enzyme de plante du genre Panicum, Catharanthus, Triticum, Nicotiana, Picea, Zea, Saccharum, Stylosanthes, Cucumis, Tarenaya, Ziziphus, Cucurbita, Ipomoea, Thalictrum, Punica, Brassica, Lycium ou Acer, de préférence du genre Panicum, Catharanthus, Triticum, Zea, Saccharum, Stylosanthes, Cucumis, Tarenaya, Ziziphus, Cucurbita, Ipomoea, Thalictrum, Punica, Brassica, Lycium ou Acer, et de manière plus particulièrement préférée du genre Panicum, Triticum, Zea ou Stylosanthes.

En particulier, la COMT peut être une enzyme de Panicum virgatum, Catharanthus roseus, Triticum aestivum, Nicotiana tabacum, Picea abies, Zea mays, Stylosanthes humilis, Saccharum officinarum, Cucumis sativus, Tarenaya hassleriana, Ziziphus jujuba var. spinosa, Cucurbita maxima, Ipomoea nil, Thalictrum tuberosum, Punica granatum, Brassica cretica, Lycium chinense ou Acer yangbiense, de préférence une enzyme de Panicum virgatum, Catharanthus roseus, Triticum aestivum, Zea mays, Stylosanthes humilis, Saccharum officinarum, Cucumis sativus, Tarenaya hassleriana, Ziziphus jujuba var. spinosa, Cucurbita maxima, Ipomoea nil, Thalictrum tuberosum, Punica granatum, Brassica cretica, Lycium chinense ou Acer yangbiense, et de manière plus particulièrement préférée une enzyme de Panicum virgatum, Triticum aestivum, Zea mays ou Stylosanthes humilis

En particulier, la COMT peut être une enzyme de Panicum virgatum, en particulier la COMT décrite dans la SEQ ID NO : 71 ou 76, une enzyme de Catharanthus roseus, en particulier la COMT décrite dans la SEQ ID NO : 73, une enzyme de Triticum aestivum, en particulier la COMT décrite dans la SEQ ID NO : 74 ou 75, une enzyme de Nicotiana tabacum, en particulier la COMT décrite dans la SEQ ID NO : 77, une enzyme de Picea abies, en particulier la COMT décrite dans la SEQ ID NO : 78, une enzyme de Zea mays, en particulier la COMT décrite dans la SEQ ID NO : 79 ou dans la SEQ ID NO : 82, une enzyme de Stylosanthes humilis, en particulier la COMT décrite dans la SEQ ID NO : 80, une enzyme de Saccharum officinarum, en particulier la COMT décrite dans la SEQ ID NO : 81, une enzyme de Cucumis sativus, en particulier la COMT décrite dans la SEQ ID NO :83, une enzyme de Tarenaya hassleriana, en particulier la COMT décrite dans la SEQ ID NO : 84, une enzyme de Ziziphus jujuba var. spinosa, en particulier la COMT décrite dans la SEQ ID NO :85, une enzyme de Cucurbita maxima, en particulier la COMT décrite dans la SEQ ID NO :86, une enzyme de Ipomoea nil, en particulier la COMT décrite dans la SEQ ID NO :87, une enzyme de Thalictrum tuberosum, en particulier la COMT décrite dans la SEQ ID NO :88, une enzyme de Punica granatum, en particulier la COMT décrite dans la SEQ ID NO :89, une enzyme de Brassica cretica, en particulier la COMT décrite dans la SEQ ID NO :90, une enzyme de Lycium chinense, en particulier la COMT décrite dans la SEQ ID NO :91 ou une enzyme de Acer yangbiense, en particulier la COMT décrite dans la SEQ ID NO :92.

De manière plus particulière, la COMT peut être une enzyme de Panicum virgatum, en particulier la COMT décrite dans la SEQ ID NO : 71 ou 76, une enzyme de Catharanthus roseus, en particulier la COMT décrite dans la SEQ ID NO : 73, une enzyme de Triticum aestivum, en particulier la COMT décrite dans la SEQ ID NO : 74, une enzyme de Zea mays, en particulier la COMT décrite dans la SEQ ID NO : 79 ou dans la SEQ ID NO : 82, une enzyme de Stylosanthes humilis, en particulier la COMT décrite dans la SEQ ID NO : 80, une enzyme de Saccharum officinarum, en particulier la COMT décrite dans la SEQ ID NO : 81, une enzyme de Cucumis sativus, en particulier la COMT décrite dans la SEQ ID NO :83, une enzyme de Tarenaya hassleriana, en particulier la COMT décrite dans la SEQ ID NO : 84, une enzyme de Ziziphus jujuba var. spinosa, en particulier la COMT décrite dans la SEQ ID NO :85, une enzyme de Cucurbita maxima, en particulier la COMT décrite dans la SEQ ID NO :86, une enzyme de Ipomoea nil, en particulier la COMT décrite dans la SEQ ID NO :87, une enzyme de Thalictrum tuberosum, en particulier la COMT décrite dans la SEQ ID NO :88, une enzyme de Punica granatum, en particulier la COMT décrite dans la SEQ ID NO :89, une enzyme de Brassica cretica, en particulier la COMT décrite dans la SEQ ID NO :90, une enzyme de Lycium chinense, en particulier la COMT décrite dans la SEQ ID NO :91 ou une enzyme de Acer yangbiense, en particulier la COMT décrite dans la SEQ ID NO :92.

De préférence, la COMT peut être une enzyme de Panicum virgatum, en particulier la COMT décrite dans la SEQ ID NO : 71 ou 76, une enzyme de Triticum aestivum, en particulier la COMT décrite dans la SEQ ID NO : 74, une enzyme de Zea mays, en particulier la COMT décrite dans la SEQ ID NO : 79 ou 82, ou une enzyme de Stylosanthes humilis, en particulier la COMT décrite dans la SEQ ID NO : 80.

Selon un mode de réalisation, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 73 à 92, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un mode de réalisation particulier, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 73 à 81, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un mode de réalisation particulier, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 73 à 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un autre mode de réalisation particulier, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 72 à 74, 76 et 79 à 92 et les polypeptides comprenant une séquence ayant au moins 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un autre mode de réalisation particulier, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 72 à 74, 76, 79 à 89, 91 et 92 et les polypeptides comprenant une séquence ayant au moins 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT. Selon un autre mode de réalisation particulier, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 72 à 74, 76, 79 à 83, 85 à 89, 91 et 92 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un mode de réalisation préféré, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 74, 76, 79, 80 et 82 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un autre mode de réalisation préféré, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 74, 76, 79 et 82 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un autre mode de réalisation préféré, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 74, 76, 79 et 80 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Selon un mode de réalisation particulièrement préféré, la COMT comprend une séquence choisie parmi les séquences SEQ ID NO : 76 et 80 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT.

Le microorganisme recombinant selon l'invention peut comprendre en outre une ou plusieurs enzymes nécessaires à la production d'acide caféique à partir d'acide p- coumarique. Ainsi, le microorganisme peut comprendre en outre (i) une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB) et une séquence d'acide nucléique hétérologue codant pour une 4- hydroxyphénylacetate 3-monooxygénase réductase (HpaC) et/ou (ii) une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase CPR dépendante (C3H).

Ces enzymes peuvent être telles que définies ci-dessus.

Selon un mode de réalisation, le microorganisme recombinant comprend une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB) et une séquence d'acide nucléique hétérologue codant pour une 4- hydroxyphénylacetate 3-monooxygénase réductase (HpaC).

En particulier, l'enzyme HpaB peut comprendre une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase. De préférence, l'enzyme HpaB comprend une séquence choisie parmi SEQ ID No : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase oxygéna se.

L'enzyme HpaC peut comprendre une séquence choisie parmi les séquences SEQ. ID NO : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase. De préférence, l'enzyme HpaC comprend une séquence choisie parmi SEQ ID No : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase.

Selon un mode de réalisation particulier, le microorganisme recombinant comprend

- une séquence d'acide nucléique hétérologue codant pour une COMT telle que définie ci- dessus, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 74, 76, 79, 80 et 82 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT; et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3- monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase. Selon un mode de réalisation préféré, le microorganisme recombinant comprend

- une séquence d'acide nucléique hétérologue codant pour une COMT telle que définie ci- dessus, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 74, 76, 79, 80 et 82 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT; et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase oxygénase comprenant une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase comprenant une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase.

De manière alternative ou additionnelle, le microorganisme recombinant peut comprendre une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase CPR dépendante (C3H). L'enzyme C3H peut comprendre une séquence choisie parmi SEQ ID Nos : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant une activité p-coumarate 3 hydroxylase.

Le microorganisme recombinant selon l'invention peut comprendre en outre une ou plusieurs enzymes nécessaires à la production d'acide p-coumarique à partir de tyrosine. Ainsi, le microorganisme peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL). Cette enzyme peut être telle que définie ci-dessus.

En particulier la TAL peut comprendre une séquence choisie parmi SEQ ID NOs : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, 30 ou 68 et présentant une activité tyrosine ammonia lyase. De préférence, la TAL comprend une séquence choisie parmi SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, et présentant une activité tyrosine ammonia lyase.

Selon un mode de réalisation particulier, le microorganisme recombinant comprend - une séquence d'acide nucléique hétérologue codant pour une COMT telle que définie ci- dessus, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 74, 76, 79, 80 et 82 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT; et

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, 30 ou 68 et présentant une activité tyrosine ammonia lyase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, et présentant une activité tyrosine ammonia lyase ; et

(i) - une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NOs : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO: 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NOs : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3- monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO: 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase ; et/ou

(ii) une séquence d'acide nucléique hétérologue codant une p-coumarate 3-hydroxylase CPR dépendante, de préférence comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant une activité p-coumarate 3 hydroxylase.

Selon un mode de réalisation préféré, le microorganisme recombinant comprend

- une séquence d'acide nucléique hétérologue codant pour une COMT telle que définie ci- dessus, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 74, 76, 79, 80 et 82 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT; et

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, et présentant une activité tyrosine ammonia lyase ; et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase oxygénase comprenant une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase comprenant une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase.

Le microorganisme recombinant selon l'invention peut comprendre en outre une ou plusieurs enzymes nécessaires à la production d'acide p-coumarique à partir de phénylalanine. Ainsi, le microorganisme peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H). Ces enzymes peuvent être telles que définies ci-dessus.

En particulier, la PAL peut comprendre une séquence choisie parmi SEQ ID NO : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 20, 69, 31 ou 32 et présentant une activité phénylalanine ammonia lyase. De préférence, la PAL comprend une séquence choisie parmi SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant une activité phénylalanine ammonia lyase. La C4H peut comprendre une séquence choisie parmi SEQ ID NO : 21, 33, 34 et 70 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ. ID NO : 21, 33, 34 ou 70 et présentant une activité cinnamate 4-hydroxylase. De préférence, la C4H comprend une séquence choisie parmi SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant une activité cinnamate 4-hydroxylase.

Selon un mode de réalisation particulier, le microorganisme recombinant comprend

- une séquence d'acide nucléique hétérologue codant pour une COMT telle que définie ci- dessus, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 74, 76, 79, 80 et 82 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT; et

- une séquence d'acide nucléique hétérologue codant pour phénylalanine ammonia lyase, de préférence comprenant une séquence choisie parmi SEQ ID NOs : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 20, 69, 31 ou 32 et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant une activité phénylalanine ammonia lyase ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase, de préférence comprenant une séquence choisie parmi SEQ ID NO : 21, 33, 34 et 70 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 21, 33, 34 ou 70 et présentant une activité cinnamate 4-hydroxylase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant une activité cinnamate 4-hydroxylase ; et

(i) - une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NOs : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO: 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ. ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NOs : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3- monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO: 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase ; et/ou

(ii) une séquence d'acide nucléique hétérologue codant une p-coumarate 3-hydroxylase CPR dépendante, de préférence comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant une activité p-coumarate 3 hydroxylase.

De préférence, dans ce mode de réalisation, le microorganisme comprend également une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, 30 ou 68 et présentant une activité tyrosine ammonia lyase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, et présentant une activité tyrosine ammonia lyase.

Selon un mode de réalisation préféré, le microorganisme recombinant comprend

- une séquence d'acide nucléique hétérologue codant pour une COMT telle que définie ci- dessus, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 74, 76, 79, 80 et 82 et les polypeptides comprenant une séquence ayant au moins 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT; et

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase comprenant une séquence choisie parmi SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant une activité phénylalanine ammonia lyase ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase comprenant une séquence choisie parmi SEQ. ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant une activité cinnamate 4-hydroxylase ; et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase oxygénase comprenant une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase comprenant une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase.

De préférence, dans ce mode de réalisation, le microorganisme comprend également une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) et comprenant une séquence choisie parmi SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 19, et présentant une activité tyrosine ammonia lyase.

Le microorganisme recombinant selon l'invention comprenant une séquence d'acide nucléique hétérologue codant pour une COMT et optionnellement une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, une séquence d'acide nucléique hétérologue codant pour une 4- hydroxyphénylacetate 3-monooxygénase réductase, une séquence d'acide nucléique hétérologue codant pour C3H, une séquence d'acide nucléique hétérologue codant pour TAL, une séquence d'acide nucléique hétérologue codant pour une PAL, et/ou une séquence d'acide nucléique hétérologue codant pour C4H, peut comprendre en outre un acide nucléique endogène codant pour une cytochrome P450 réductase. Optionnellement, la CPR endogène peut être surexprimée, par exemple en remplaçant le promoteur du gène endogène par un promoteur hétérologue fort et/ou en augmentant le nombre de copies du gène endogène. Alternativement, ou en plus de cet acide nucléique endogène, le microorganisme recombinant peut comprendre une séquence d'acide nucléique hétérologue qui code pour une cytochrome P450 réductase (CPR). Cette enzyme peut être telle que définie ci-dessus.

En particulier, la CPR peut comprendre une séquence choisie parmi SEQ ID Nos : 22, 35, 36, 37 et 38 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec une de ces séquences et présentant l'activité cytochrome P450 réductase. De préférence, la CPR comprend une séquence choisie parmi SEQ. ID Nos : 22 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80, 85, 90 ou 95 %, d'identité de séquence avec la séquence SEQ ID NO : 22 et présentant une activité cytochrome P450 réductase.

Le microorganisme recombinant selon l'invention peut également comprendre les modifications génétiques décrites ci-dessus afin d'augmenter la production de tyrosine et/ou de phénylalanine. En particulier, il peut comprendre une séquence d'acide nucléique hétérologue codant pour une 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase résistante au rétrocontrôle par la tyrosine et/ou une séquence d'acide nucléique hétérologue codant pour une chorismate mutase résistante au rétrocontrôle par la tyrosine. De manière alternative ou additionnelle, un gène endogène codant pour une phénylpyruvate décarboxylase peut être inactivé dans ledit microorganisme.

Le microorganisme recombinant selon l'invention peut également être modifié pour inactiver le ou les gènes endogènes codant pour une acide férulique décarboxylase tel que cela est décrit ci-dessus.

Le microorganisme recombinant selon l'invention peut être un microorganisme eucaryote ou procaryote tel que défini ci-dessus, de préférence une levure ou une bactérie. En particulier, le microorganisme peut être choisi parmi une bactérie Escherichia coli et une levure Saccharomyces cerevisiae.

Acide nucléique recombinant, cassette et vecteur d'expression

Chaque séquence nucléique codant pour une enzyme telle que décrite précédemment est comprise dans une cassette d'expression. De préférence, les séquences nucléiques codantes ont été optimisées pour l'expression dans le microorganisme hôte. La séquence nucléique codante est liée de manière opérationnelle aux éléments nécessaires à l'expression du gène, notamment à la transcription et traduction. Ces éléments sont choisis de sorte à être fonctionnels dans le microorganisme recombinant hôte. Ces éléments peuvent comporter par exemple des promoteurs de transcription, des activateurs de transcription, des séquences terminatrices, des codons d'initiation et de terminaison. Les méthodes pour sélectionner ces éléments en fonction de la cellule hôte dans laquelle l'expression est souhaitée, sont bien connues de l'homme du métier. De préférence, le promoteur est un promoteur fort. Le promoteur peut être constitutif ou inductible, de préférence constitutif. Un promoteur peut contrôler l'expression d'une ou plusieurs séquences nucléiques codant pour une ou plusieurs enzymes telles que décrites ci-dessus.

Par exemple, si le microorganisme est procaryote, le promoteur peut être sélectionné parmi les promoteurs suivants : Lacl, LacZ, pLacT, ptac, pARA, pBAD, les promoteurs d'ARN polymérase de bactériophage T3 or T7, le promoteur de la polyhèdrine, le promoteur PR ou PL du phage lambda. Dans un mode de réalisation particulier, le promoteur est pLac. Si le microorganisme est eucaryote et en particulier une levure, le promoteur peut être sélectionné parmi les promoteurs suivants : le promoteur pTDH3, le promoteur pTEFl, le promoteur pTEF2, le promoteur pCCW12, le promoteur pHHF2, le promoteur pHTB2 et le promoteur pRPL18B. Des exemples de promoteurs inductibles utilisables chez la levure sont les promoteurs tetO-2, GAL10, GAL10-CYC1 et PHO5.

Toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ou une combinaison de certaines de celles-ci peuvent être comprises dans un vecteur d'expression commun ou dans différents vecteurs d'expression.

La présente invention concerne donc également un vecteur comprenant

- une séquence d'acide nucléique codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H) et une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase et/ou

- au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT), une séquence d'acide nucléique codant pour acide caféique-O-méthyltransférase (COMT), une séquence d'acide nucléique codant pour une CCR, une séquence d'acide nucléique codant pour une ALDH, une séquence d'acide nucléique codant pour une p-coumarate 3-hydroxylase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique codant pour une cinnamate 4- hydroxylase (C4H) et une séquence d'acide nucléique codant pour une codant pour une cytochrome P450 réductase (CPR), chacune de ces enzymes étant telles que définies ci- dessus, ainsi que leurs combinaisons.

De préférence, le vecteur comprend

- une séquence d'acide nucléique codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H) et une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase, et

- au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT), une séquence d'acide nucléique codant pour acide caféique-O-méthyltransférase (COMT), une séquence d'acide nucléique codant pour une CCR, une séquence d'acide nucléique codant pour une ALDH, une séquence d'acide nucléique codant pour une p-coumarate 3-hydroxylase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique codant pour une cinnamate 4- hydroxylase (C4H) et une séquence d'acide nucléique codant pour une codant pour une cytochrome P450 réductase (CPR), chacune de ces enzymes étant telles que définies ci- dessus, ainsi que leurs combinaisons.

La présente invention concerne également un vecteur comprenant

- une séquence d'acide nucléique codant pour acide caféique-O-méthyltransférase (COMT), et

- au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une p-coumarate 3-hydroxylase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase réductase, une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H) et une séquence d'acide nucléique codant pour une codant pour une cytochrome P450 réductase (CPR), chacune de ces enzymes étant telles que définies ci-dessus, ainsi que leurs combinaisons.

Le vecteur peut notamment comprendre des combinaisons de séquences codantes particulières telles que décrites ci-dessus.

Par « comprendre une séquence d'acide nucléique », il est de préférence entendu « comprendre une cassette d'expression comprenant la séquence d'acide nucléique ».

Les vecteurs comprennent des séquences codantes hétérologues dans la mesure où les séquences codantes peuvent être optimisées pour le microorganisme hôte, être sous le contrôle de promoteur(s) hétérologue(s) et/ou peuvent combiner des séquences codantes qui ne proviennent pas du même organisme d'origine et/ou qui ne sont pas présentes dans le même arrangement.

Le vecteur peut être toute séquence d'ADN dans laquelle il est possible d'insérer des acides nucléiques étrangers, les vecteurs permettant d'introduire de l'ADN étranger dans le microorganisme hôte. Le vecteur peut être par exemple un plasmide, un phagemide, un cosmide, un chromosome artificiel, notamment un YAC, ou un BAC.

Les vecteurs d'expression peuvent comprendre en outre des séquences nucléiques codant pour des marqueurs de sélection. Les marqueurs de sélection peuvent être des gènes de résistance à un ou plusieurs antibiotiques ou des gènes d'auxotrophie. Le gène d'auxotrophie peut par exemple être HIS5, URA3, LEU2 ou TRP1. Le gène de résistance aux antibiotiques peut par exemple être de préférence un gène de résistance à l'ampicilline, au chloramphénicol, à la spectinomycine, à la streptomycine, à la kanamycine, à l'hygromycine, à la généticine, à la fluoroacétamide, au fluorocitrate, à la phléomycine, à l'amphotéricine- B et/ou la nourséothricine.

L'introduction de vecteurs dans un microorganisme hôte est un procédé largement connu de l'homme du métier. Plusieurs méthodes sont notamment décrites dans « Current Protocols in Molecular Biology», 13.7.1-13.7.10; ou encore dans Ellis T. et al., Integrative Biology, 2011, 3(2), 109- 118.

La microorganisme hôte peut être transformé/transfecté de manière transitoire ou stable et l'acide nucléique, la cassette ou le vecteur selon l'invention peut être contenu dans celui- ci sous forme d'épisome ou sous forme intégré dans le génome de la cellule hôte.

Le vecteur d'expression peut également comprendre une ou plusieurs séquences permettant l'insertion ciblée du vecteur, de la cassette d'expression ou de l'acide nucléique dans le génome de la cellule hôte.

Toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ci-dessus peuvent être insérées dans le/un chromosome du microorganisme recombinant. A contrario, toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites peuvent être conservées sous forme épisomale, notamment sous forme de plasmide.

Eventuellement, le microorganisme peut comprendre plusieurs copies de séquences nucléiques codant pour une enzyme telle que décrite précédemment. Notamment, il peut comprendre 2 à 10 copies, par exemple 2, 3, 4, 5, 6, 7, 8, 9 ou 10 copies d'une séquence nucléique codant pour une enzyme telle que décrite précédemment.

Eventuellement, le microorganisme hôte peut être transformé/transfecté avec plusieurs vecteurs selon l'invention, identiques ou différents. Il peut également être transformé/transfecté avec un ou plusieurs autres vecteurs codant par exemple pour d'autres enzymes nécessaires à la production de l'acide carboxylique.

La présente invention concerne également une méthode de préparation d'un microorganisme recombinant selon la présente invention comprenant l'introduction d'un vecteur tel que défini précédemment dans le microorganisme et la sélection des microorganismes comprenant ledit vecteur.

Elle concerne également une méthode de préparation d'un microorganisme selon la présente invention comprenant l'introduction

- d'une séquence d'acide nucléique codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H) et une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase,

- et optionnellement d'au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT), une séquence d'acide nucléique codant pour acide caféique-O-méthyltransférase (COMT), une séquence d'acide nucléique codant pour une CCR, une séquence d'acide nucléique codant pour une ALDH, une séquence d'acide nucléique codant pour une p-coumarate 3- hydroxylase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3- monooxygénase oxygénase, une séquence d'acide nucléique codant pour une 4- hydroxyphénylacetate 3-monooxygénase réductase, une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H) et une séquence d'acide nucléique codant pour une codant pour une cytochrome P450 réductase (CPR), chacune de ces enzymes étant telles que définies ci-dessus, ainsi que leurs combinaisons, et la sélection des microorganismes comprenant lesdites séquences nucléiques.

De préférence, la méthode de préparation d'un microorganisme selon la présente invention comprend l'introduction

- d'une séquence d'acide nucléique codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H) et une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase

- et optionnellement d'au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT) et une séquence d'acide nucléique codant pour acide caféique-O-méthyltransférase (COMT), ou une combinaison des deux, et la sélection des microorganismes comprenant lesdites séquences nucléiques, chacune de ces enzymes étant telles que définies ci-dessus.

La présente invention concerne également une méthode de préparation d'un microorganisme selon la présente invention comprenant une séquence d'acide nucléique codant pour acide caféique-O-méthyltransférase, la méthode comprenant l'introduction

- d'une séquence d'acide nucléique codant pour acide caféique-O-méthyltransférase (COMT), et - optionnellement, d'au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une p-coumarate 3-hydroxylase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase réductase, une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H) et une séquence d'acide nucléique codant pour une codant pour une cytochrome P450 réductase (CPR), chacune de ces enzymes étant telles que définies ci-dessus, ainsi que leurs combinaisons, et la sélection des microorganismes comprenant lesdites séquences nucléiques.

De préférence, la méthode de préparation d'un microorganisme selon la présente invention comprenant une séquence d'acide nucléique codant pour acide caféique-O- méthyltransférase, comprend l'introduction d'une séquence d'acide nucléique codant pour acide caféique-O-méthyltransférase (COMT), d'une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, d'une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase réductase, d'une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), d'une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), d'une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H) et d'une séquence d'acide nucléique codant pour une codant pour une cytochrome P450 réductase (CPR), chacune de ces enzymes étant telles que définies ci-dessus, ainsi que leurs combinaisons, et la sélection des microorganismes comprenant lesdites séquences nucléiques.

Utilisations du microorganisme recombinant

La présente invention concerne également l'utilisation d'un microorganisme selon l'invention, à savoir un microorganisme recombinant tel que décrit ci-dessus et génétiquement modifié pour produire des phénylpropanoïdes à partir de l'acide p- coumarique et en passant par des composés intermédiaires qui sont des carboxyl-CoA, pour produire un phénylpropanoïde choisi parmi l'acide caféique et l'acide férulique. Elle concerne aussi une méthode de production d'un phénylpropanoïde choisi parmi l'acide caféique et l'acide férulique, comprenant la culture dudit microorganisme selon l'invention et éventuellement la récolte et/ou la purification dudit phénylpropanoïde.

De préférence, le phénylpropanoïde est l'acide férulique.

La présente invention concerne également l'utilisation d'un microorganisme selon l'invention, à savoir un microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une COMT tel que décrit ci-dessus, pour produire de l'acide férulique. Elle concerne aussi une méthode de production d'acide férulique, comprenant la culture dudit microorganisme selon l'invention et éventuellement la récolte et/ou la purification dudit acide férulique.

Le composé produit par la méthode selon l'invention peut être soit le produit final soit un intermédiaire de synthèse ou de biosynthèse pour la préparation d'autres composés.

Les conditions de culture du microorganisme selon l'invention peuvent être adaptées selon les techniques classiques, bien connues de l'homme du métier.

Le microorganisme est cultivé dans un milieu de culture approprié. Le terme « milieu de culture approprié » désigne d'une manière générale un milieu de culture apportant les nutriments essentiels ou bénéfiques à la maintenance et/ou à la croissance dudit microorganisme, tels que les sources carbonées ; les sources azotées telles que le sulfate d'ammonium ; les sources de phosphores, par exemple, le potassium phosphate monobasique ; les oligo-éléments, par exemple, les sels de cuivre, d'iodure, de fer, de magnésium, de zinc ou de molybdate ; les vitamines et autres facteurs de croissance tels que des acides aminés ou autres promoteurs de croissance. Un antimousse peut être ajouté selon les besoins. Selon l'invention, ce milieu de culture approprié peut être chimiquement défini ou « non défini ». Le milieu de culture peut ainsi être de composition identique ou similaire à un milieu synthétique, tel que défini par Verduyn et al., (Yeast. 1992. 8:501-17), adapté par Visser et al., (Biotechnology and bioengineering. 2002. 79:674-81), ou commercialement disponible tel que le milieu YNB (Yeast Nitrogen Base, MP Biomedicals ou Sigma-Aldrich). Notamment, le milieu de culture peut comprendre une source de carbone simple, telle le glucose, le fructose, le xylose, l'éthanol, le glycérol, le galactose, le saccharose, la cellulose, la cellobiose, l'amidon, les polymères de glucose, les mélasses, ou les sous-produits de ces sucres. Le milieu « non défini » peut être un milieu liquide composé d'hydrolysats de micro-organismes et/ou de protéines, par exemple et non exclusivement d'extrait de levure et/ou de peptones. A cette composition s'ajoute généralement une source de carbone simple, telle le glucose, le fructose, le xylose, l'éthanol, le glycérol, le galactose, le saccharose, la cellulose, la cellobiose, l'amidon, les polymères de glucose, les mélasses, ou les sous-produits de ces sucres.

Le microorganisme selon l'invention peut comprendre tout ou partie de la voie de biosynthèse du phénylpropanoïde. Ainsi, la production peut être réalisée en présence d'une source de carbone simple telle que du glucose, ou en présence d'un intermédiaire de synthèse tel que la tyrosine, la phénylalanine, l'acide cinnamique ou l'acide p-coumarique.

Selon un mode de réalisation, le microorganisme selon l'invention est utilisé dans une méthode de production d'acide caféique. De préférence, dans ce mode de réalisation, le microorganisme comprend (i) une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H), une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase.

Le microorganisme peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une C3H, une séquence d'acide nucléique hétérologue codant pour une 4- méthoxybenzoate O-déméthylase, une séquence d'acide nucléique hétérologue codant pour une TAL, une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et/ou une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase réductase.

De préférence, le microorganisme comprend en outre une séquence d'acide nucléique hétérologue codant pour une TAL, une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase. Les enzymes et combinaisons d'enzymes sont telles que décrites ci-dessus.

De préférence, la culture du microorganisme est réalisé sans apport de composé intermédiaire dans le milieu, c'est-à-dire sans apport de tyrosine, phénylalanine, acide cinnamique, acide p-coumarique, L-DOPA et/ou caféoyl-CoA. De préférence, dans ce mode de réalisation, le microorganisme comprend

- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl-CoA 3- hydroxylase (CCoA3H) et une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase, et

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL)et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), chacune de ces enzymes étant telles que définies ci-dessus, ainsi que leurs combinaisons.

Selon un mode de réalisation particulier, le microorganisme selon l'invention utilisé dans une méthode de production d'acide caféique comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ. ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée une 4CL comprenant une séquence choisie parmi les séquences SEQ. ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H; de préférence une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de manière plus particulièrement préférée une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la SEQ ID NO : 19, et présentant l'activité TAL, et

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi SEQ ID NOs : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69, de préférence SEQ ID NO : 20, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 20, et présentant l'activité PAL ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi SEQ ID NOs : 21, 70, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ ID NO : 21 et 70, de préférence SEQ ID NO : 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 21, et présentant l'activité C4H.

Selon un mode de réalisation préféré, le microorganisme selon l'invention utilisé dans une méthode de production d'acide caféique comprend :

- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de préférence une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la SEQ ID NO : 19, et présentant l'activité TAL ; et - une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69, de préférence SEQ. ID NO : 20, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 20, et présentant l'activité PAL ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi les séquences SEQ ID NO : 21 et 70, de préférence SEQ ID NO : 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 21, et présentant l'activité C4H.

Optionnellement ledit microorganisme peut comprendre

(i) - une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase ; et/ou

(ii) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase ; et/ou

(iii) une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O- déméthylase, de préférence comprenant une séquence choisie parmi SEQ ID NOs : 28 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité L-tyrosine hydrolase.

De préférence, ledit microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase et une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase.

Selon un mode de réalisation particulier, le microorganisme selon l'invention est utilisé dans une méthode de production d'acide férulique. De préférence, dans ce mode de réalisation, le microorganisme comprend (i) une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl-CoA 3-hydroxylase (CCoA3H), une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase et (ii) une séquence d'acide nucléique hétérologue codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT) et/ou une séquence d'acide nucléique hétérologue codant pour acide caféique-O- méthyltransférase (COMT).

Le microorganisme peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une C3H, une séquence d'acide nucléique hétérologue codant pour une 4- méthoxybenzoate O-déméthylase, une séquence d'acide nucléique hétérologue codant pour une TAL, une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et/ou une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase réductase.

De préférence, le microorganisme comprend en outre une séquence d'acide nucléique hétérologue codant pour une TAL, une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase. Les enzymes et combinaisons d'enzymes sont telles que décrites ci-dessus.

De préférence, la culture du microorganisme est réalisé sans apport de composé intermédiaire dans le milieu, c'est-à-dire sans apport de tyrosine, phénylalanine, acide cinnamique, l'acide p-coumarique, acide caféique, caféoyl-CoA et/ou féruloyl-CoA.

De préférence, dans ce mode de réalisation, le microorganisme comprend

- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une coumaroyl-CoA 3- hydroxylase (CCoA3H) et une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase ;

- une séquence d'acide nucléique hétérologue codant pour une Caféoyl-CoA 0- Méthyltransférase (CCoAMT) et/ou une séquence d'acide nucléique hétérologue codant pour acide caféique-O-méthyltransférase (COMT) ; et

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), chacune de ces enzymes étant telles que définies ci-dessus, ainsi que leurs combinaisons.

Selon un mode de réalisation particulier, le microorganisme selon l'invention utilisé dans une méthode de production d'acide férulique comprend :

(i) - une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ. ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42 à 67 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H; de préférence une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de manière plus particulièrement préférée une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

(ii) - une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi les séquences SEQ. ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT, et/ou

- une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 71 à 92, de préférence SEQ ID NO : 71 à 81, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 71 à 81, et présentant l'activité COMT, de préférence une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 72 à 74, 76 et 79 à 92, de préférence les séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec l'une des séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et présentant l'activité COMT, et de manière plus particulièrement préférée une COMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT.

Il peut comprendre en outre,

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19, 30 et 68 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la SEQ ID NO : 19, et présentant l'activité TAL, et

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi SEQ ID NOs : 20, 69, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69, de préférence SEQ ID NO : 20, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 20, et présentant l'activité PAL ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi SEQ ID NOs : 21, 70, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi les séquences SEQ ID NO : 21 et 70, de préférence SEQ ID NO : 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 21, et présentant l'activité C4H.

Selon un mode de réalisation préféré, le microorganisme selon l'invention utilisé dans une méthode de production d'acide férulique comprend :

(i) - une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 6 et 8 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL ; et

- une séquence d'acide nucléique hétérologue codant pour une CCoA3H comprenant une séquence choisie parmi les séquences SEQ ID NO : 42, 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoA3H, et de préférence une CCoA3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoA3H ; et

- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase ; et

(ii) - une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi la séquence SEQ ID NO : 40 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité CCoAMT ; et/ou

- une séquence d'acide nucléique hétérologue codant pour une COMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 72, 74, 76, 79, 80 et 82, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité COMT, de préférence comprenant une séquence choisie parmi la séquence SEQ. ID NO : 72 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ladite séquence et présentant l'activité COMT.

Il peut comprend en outre,

- une séquence d'acide nucléique hétérologue codant pour une TAL comprenant une séquence choisie parmi les séquences SEQ ID NO : 19 et 68, de préférence SEQ ID NO : 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences, de préférence avec la SEQ ID NO : 19, et présentant l'activité TAL ; et

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi les séquences SEQ ID NO : 20, 32 et 69, de préférence SEQ ID NO : 20, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 20, et présentant l'activité PAL ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi les séquences SEQ ID NO : 21 et 70, de préférence SEQ ID NO : 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la SEQ ID NO : 21, et présentant l'activité C4H.

Optionnellement ledit microorganisme peut comprendre

(i) - une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et

- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 18 et Tl et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase ; et/ou

(ii) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase ; et/ou

(iii) une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O- déméthylase, de préférence comprenant une séquence choisie parmi SEQ ID NOs : 28 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité L-tyrosine hydrolase.

De préférence, ledit microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase et une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase.

Optionnellement, dans chacun de ces modes de réalisation, le microorganisme comprend en outre une séquence d'acide nucléique hétérologue codant pour une codant pour une cytochrome P450 réductase (CPR), telle que définie ci-dessus.

Selon un autre mode de réalisation, le microorganisme selon l'invention est un microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une COMT tel que décrit ci-dessus et est utilisé dans une méthode de production d'acide férulique.

Les différents modes de réalisation concernant le microorganisme recombinant selon l'invention comprenant une séquence d'acide nucléique hétérologue codant pour une COMT tel que décrit ci-dessus, sont également considérés dans cet aspect.

De préférence, dans ce mode de réalisation, le microorganisme comprend

(i) une séquence d'acide nucléique hétérologue codant pour acide caféique-O- méthyltransférase (COMT),

(ii) a) une séquence d'acide nucléique hétérologue codant pour une C3H et/ou b) une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase réductase,

(iii) une séquence d'acide nucléique hétérologue codant pour une TAL, une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H) et,

(iv) optionnellement, une séquence d'acide nucléique hétérologue codant pour une codant pour une cytochrome P450 réductase (CPR).

Les enzymes et combinaisons d'enzymes sont telles que décrites ci-dessus.

De préférence, la culture du microorganisme est réalisé sans apport de composé intermédiaire dans le milieu, c'est-à-dire sans apport de tyrosine, phénylalanine, acide cinnamique, l'acide p-coumarique et/ou acide caféique.

Selon l'invention, tout mode de culture permettant la production à l'échelle industrielle de molécules d'intérêt peut être envisagé. Avantageusement, la culture se fait en bioréacteurs, notamment en mode batch, fed-batch, chemostat et/ou culture continue. Une alimentation contrôlée en vitamines au cours du procédé peut également être bénéfique à la productivité (Alfenore et al., Appl Microbiol Biotechnol. 2002. 60:67-72).

La culture est généralement conduite en bioréacteurs, avec de possibles étapes de précultures solides et/ou liquides en Erlenmeyers, avec un milieu de culture approprié.

D'une manière générale, les conditions de culture des microorganismes selon l'invention sont aisément adaptables par l'homme du métier, en fonction du microorganisme. Par exemple, la température de culture est notamment comprise pour les levures entre 20°C et 40°C, de préférence entre 28°C et 40°C, et plus particulièrement d'environ 30°C pour 5 cerevisiae.

Le microorganisme selon la présente invention peut être cultivé pendant 1 à 30 jours, et de préférence de 1 à 10 jours.

Toutes les références citées dans cette description sont incorporées par référence dans la présente demande. D'autres caractéristiques et avantages de l'invention apparaîtront mieux à la lecture des exemples suivants donnés à titre illustratif et non limitatif. Tableau 1 : DESCRIPTION DES SEQUENCES

EXEMPLES

Exemple 1

Matériels et méthodes

Souches Les souches de levure utilisées dans les exemples ont été obtenues à partir de Saccharomyces cerevisiae S288C (Mortimer RK and Johnston JR (1986) Genealogy of principal strains of the yeast genetic stock center. Genetics 113(l):35-43). Cette levure possède une auxotrophie pour l'uracile, le tryptophane et la leucine.

Les constructions ont été réalisées dans la souche d’ Escherichia coli MH1 avant leur transfert chez la levure.

Dans toutes les souches construites pour cette étude, les gènes AR010 (YDR380W) et FDC1 (YDR539W) ont été inactivés, c'est à dire par intégration en lieu et place du cadre de lecture ouvert, d'un ADN linéaire comprenant un marqueur de sélection borné par les régions amont et aval du gène. Tableau 2 : Liste des souches construites

Clonage des gènes

Les gènes dont les codons ont été optimisés pour s'exprimer dans la levure ont été synthétisés par Twist Biosciences, San Francisco, USA ou DC Biosciences, Dundee, UK.

Les gènes ARO4 (GenBank accession number : NP_009808) et ARO7 (GenBank accession number : NP_015385) ont été amplifiés par PCR à partir de l'ADN génomique de 5. cerevisiae, puis ont été mutés afin que leur produit soit résistant à la rétro-inhibition (FBR: Feed Back Resistance) (Gold et al., Microb Cell Fact. 2015;14:73).

Les promoteurs et terminateurs (Wagner et al., Fungal Genet Biol. 2016;89:126-136) ont été amplifiés par PCR à partir de l'ADN génomique de 5. cerevisiae.

Les gènes obtenus par synthèse ou par PCR comprennent à l'extrémité 5' et 3', un site de restriction Bbsl (GAAGAC) ou Bsa\ (GGTCTC), compatible avec le système de clonage utilisé. Tous les gènes, les promoteurs et les terminateurs ont été clonés dans les sites de restriction du vecteur pSBK.

Le vecteur pSBK comprend le marqueur de sélection URA3, LEU2 ou TRP1.

Conditions de culture

Les souches de levure ont été cultivées 72h à 30°C, en plaque 24 puits, sous agitation continue (200 RPM), dans 1 ml de milieu SD (Dutscher, Brumath, France) supplémenté ou non par du CSM (Complete Supplement Mixture; Formedium, UK).

Le glucose est ajouté à 20 g/L et, lorsque cela est requis, de l'acide p-coumarique ou de l'acide caféique a été ajouté dans le milieu à une concentration de 100 mg/L.

Chaque souche a été inoculée à DO 0,2 à partir d'une préculture de 24h cultivée dans les mêmes conditions.

Standards

Les standards pour l'acide p-coumarique, l'acide caféique et l'acide férulique ont été obtenus chez le fournisseur Sigma-Aldrich.

Méthode analytique

Préparation des échantillons : Des échantillons de 100 pL sont récupérés pour chaque expérience. 50 pL sont transférés dans une nouvelle plaque, auxquels sont ajoutés 50 pL de la solution d'étalon interne. Chaque échantillon est ensuite homogénéisé par aspiration- refoulement, puis centrifugé pendant 5 min à 3000 rpm à température ambiante. La concentration finale de l'étalon interne (Acide Protocatéchuique) est de 0,5 mg/L.

Analyse par UHPLC-TQ : Les échantillons ont été analysés par une UHPLC Vanquish-H (Thermo) couplée à un triple-quadripôle UHPLC-TQ. (Thermo). La colonne est une colonne Waters Acquity UPLC@ USST3 (8 pm 2,1 X 100 mm) associée à une pré-colonne HSST3 1,8 pm 2,1 X 5 mm.

La phase mobile A est une solution de 0,1 % d'acide formique dans de l'eau de qualité LC/MS et la phase mobile B est une solution de 0,1 % d'acide formique dans de l'acétonitrile pur de qualité LC/MS. La température de la colonne est de 50°C et la température du passeur d'échantillons à 10°C.

Tableau 3 : conditions chromatographiques pour la détection des molécules d'intérêt :

Les paramètres de la source électrospray sont :

- voltage du spray mode positif à 4000V

- gaz rideau : à 50 (unité arbitraire)

- gaz auxiliaire à 15 (unité arbitraire)

- température du tube de transfert à 300°C

- température du vaporisateur à 300°C

Tableau 4 : Les ions suivis et les conditions defragmentation pour les molécules d'intérêt : Résultats

Production d'acide férulique à partir d'acide caféique

Le gène codant pour la thioestérase d’Arabidopsis thaliana (Thiol, SEQ ID NO : 1) ou de Petunia hybrida (Thio3, SEQ. ID NO : 2) a été inséré dans la souche 221 qui exprime la 4CL d’Arabidopsis thaliana (4CL1, SEQ ID NO : 5) et la CCoAMT d’Arabidopsis thaliana (CC0AMT6, SEQ ID NO : 15) et dans laquelle les gènes ArolO et Fdc ont été inactivés (souche 221). Les souches obtenues sont les souches 345 et 239.

Les gènes codant pour la CCR de Populus tomentosa (SEQ ID NO : 4) et pour l'ALDH d’Arabidopsis thaliana (SEQ ID NO : 3) ont également été insérés dans la souche 221 pour obtenir la souche 214.

La production d'acide férulique est testée avec chacune de ces souches en présence de 100 mg/L d'acide caféique. Elle est comparée à celle obtenue avec la souche 221.

Les résultats sont présentés dans la figure 1 et montrent que les thioestérases, CCR et ALDH de plante exprimées de manière hétérologue dans la levure sont actives et capables de convertir le féruloyl-CoA en acide férulique.

De manière similaire, le gène codant pour la thioestérase d'Oryza meyeriana var. granulata (Thio30, SEQ ID NO : 39) a été inséré dans une souche qui exprime la 4CL de Citrus Clementina (4CL5, SEQ ID NO : 6) et la CCoAMT d’Arabidopsis thaliana (CC0AMT6, SEQ ID NO : 15) et dans laquelle les gènes ArolO et Fdc ont été inactivés. La souche obtenue est la souche 806.

La production d'acide férulique est testée en présence de 100 mg/L d'acide caféique. Elle est comparée à celle obtenue avec une souche qui exprime la 4CL de Citrus Clementina (4CL5, SEQ ID NO : 6), la CCoAMT d’Arabidopsis thaliana (CC0AMT6, SEQ ID NO : 15) et la thioestérase de Petunia hybrida (Thio3, SEQ ID NO : 2).

Après 72h de culture, la souche 806 et la souche contrôle ont produit respectivement 40 mg/L et 42 mg/L d'acide férulique. Ce résultat montre que la thioestérase d'Oryza meyeriana var. granulata (Thio30, SEQ ID NO : 39) exprimée de manière hétérologue dans la levure est active et capable de convertir le féruloyl-CoA en acide férulique.

Optimisation de la voie de production d'acide férulique à partir d'acide caféique

Différentes souches de levures ont été construites, toutes exprimant la thioestérase de Petunia hybrida (Thio3, SEQ ID NO : 2) et dans lesquelles les gènes ArolO et Fdc ont été inactivés . Dans ces souches ont été ajoutés cinq 4CL différentes (4CL1, 4CL5, 4CL7, 4CLA et 4CLB). Les 5 souches ainsi obtenues sont les souches 334, 335, 336, 337 et 338.

Ses souches ont ensuite été combinées à sept CCoAMT différentes (CCoAMTl, 2, 3, 4, 5, 6, 7, respectivement SEQ ID NO : 10 à 16)). 35 souches ont ainsi été obtenues : 339 à 343, 345, 347, 367 à 371, 373, 375, 395 à 399, 401, 403, 423 à 427, 429, 431, 451 à 455, 457 et 459. La production d'acide férulique est testée avec chacune de ces souches en présence de 100 mg/L d'acide caféique. Elle est comparée à celle obtenue avec les souches contrôles sans CcoAMT, à savoir les souches 334 à 338. Les résultats sont présentés dans la figure 2.

Les meilleures combinaisons permettant la production d'acide férulique à partir d'acide caféique sont :

- Thio3-4CL5-CCoAMTl (souche 367)

- Thio3-4CL5-CCoAMT6 (souche 373)

- Thio3-4CL5-CCoAMT7 (souche 375)

La mesure de l'activité des CCoAMT seules (en absence de 4CL et Thio3) a été réalisée afin de confirmer que la synthèse d'acide férulique passe bien par les formes CoA et n'est pas obtenue directement à partir de l'acide caféique.

Par ailleurs, la souche 335 a été combinée à deux CCoAMT différentes (CC0AMT8 et 9, respectivement SEQ ID NO : 40 et 41)). Les souches 623 et 912 ont ainsi été obtenues. La production d'acide férulique a été testée avec chacune de ces souches en présence de 100 mg/L d'acide caféique. Après 72h de culture, les souches 623 et 912 ont respectivement produit 42 mg/L et 41 mg/L d'acide férulique.

Ce résultat montre que les CCoAMT de Panicum virgatum (CC0AMT8, SEQ. ID NO : 40) et de Rauvolfia serpentina (CCoAMT9, SEQ ID NO : 41) exprimées de manière hétérologue dans la levure sont actives et capables de convertir le caféoyl-CoA en féruloyl-CoA, lequel est ensuite converti en acide férulique par la thioestérase.

Production d'acide férulique à partir d'acide p-coumarique

Une souche de levure 507 a été construite dans laquelle les gènes ArolO et Fdc ont été inactivés et qui exprime un gène codant pour HpaB de Pseudomonas aeruginosa (SEQ ID NO : 17) et un gène codant pour HpaC de Salmonella enterica (SEQ ID NO : 18). La souche 507 a ensuite été modifiée par insertion des combinaisons 4CL-CCoAMT-Thio les plus performantes :

Souche 595 : insertion de 4CL5 (Citrus sinensis, SEQ ID NO : 6), CCoAMTl (Vitis vinifera, SEQ ID NO : 10) et Thio3 (Petunia hybrida, SEQ ID NO : 2) ;

Souche 596 : : insertion de 4CL5 (Citrus sinensis, SEQ ID NO : 6), CCoAMT7 (Populus trichocarpa, SEQ ID NO : 16) et Thio3 (Petunia hybrida, SEQ ID NO : 2) ; et

Souche 597 : insertion de 4CL5 (Citrus sinensis, SEQ ID NO : 6), CC0AMT6 (Arabidopsis thaliana, SEQ ID NO : 15) et Thio3 (Petunia hybrida, SEQ ID NO : 2).

Ces souches ont ensuite été cultivées en présence d'acide p-coumarique (100mg/L).

La production d'acide férulique de ces souches a été mesurée après 24h. Les résultats sont présentés dans la figure 3. Insertion d'une voie complète de production d'acide férulique chez la levure

Une souche de levure 516 a été construite dans laquelle les gènes ArolO et Fdc ont été inactivés et qui exprime un gène codant pour un allèle d'Aro4 résistant au rétrocontrôle (ARO4 K229L , SEQ ID NO : 23), un gène codant pour un allèle d'Aro7 résistant au rétrocontrôle (ARO7 G141S , SEQ. ID NO : 24), un gène codant pour HpaB de Pseudomonas aeruginosa (SEQ ID NO : 17), un gène codant pour HpaC de Salmonella enterica (SEQ ID NO : 18), un gène codant pour TAL de Rhodotorula glutinis (SEQ ID NO : 19), un gène codant pour PAL d'Arabidopsis thaliana (SEQ ID NO : 20), un gène codant pour C4H d'Arabidopsis thaliana (SEQ ID NO : 21) et un gène codant pour CPR1 de Catharantus roseus (SEQ ID NO : 22).

La souche 516 a ensuite été modifiée par insertion des combinaisons 4CL-CCoAMT-Thio les plus performantes :

Souche 592 : insertion de 4CL5 (Citrus sinensis, SEQ ID NO : 6), CCoAMTl (Vitis vinifera, SEQ ID NO : 10) et Thio3 (Petunia hybrida, SEQ ID NO : 2) ;

Souche 593 : : insertion de 4CL5 (Citrus sinensis, SEQ ID NO : 6), CCoAMT7 (Populus trichocarpa, SEQ ID NO : 16) et Thio3 (Petunia hybrida, SEQ ID NO : 2) ; et

Souche 594 : insertion de 4CL5 (Citrus sinensis, SEQ ID NO : 6), CC0AMT6 (Arabidopsis thaliana, SEQ ID NO : 15) et Thio3 (Petunia hybrida, SEQ ID NO : 2).

Ces souches ont ensuite été cultivées en présence de glucose (20 g/L).

La production d'acide férulique de ces souches a été mesurée après 24h. Les résultats sont présentés dans la figure 4.

Exemple 2

Matériels et méthodes

Souches

Les levures ont été obtenues à partir de la souche Saccharomyces cerevisiae FY1679-28A décrite dans l'article de Tettelin et al. (Methods in Molecular Genetics Volume 6, 1995, Pages 81-107). Cette levure possède une quadruple auxotrophie pour l'uracile, le tryptophane, la leucine et l'histidine.

Les clonages ont été réalisés dans la souche d' Escherichia coli MH1.

Standards

Les standards ont été acquis chez le fournisseur Sigma-Aldrich (acide p-coumarique, acide caféique, acide férulique). Clonage des gènes

Les gènes optimisés pour s'exprimer dans la levure ont été synthétisés par Arurumolecular, Dundee, UK. Les gènes obtenus par synthèse comprennent à l'extrémité 5' et 3', un site de restriction Bbsl (GAAGAC) ou Bsal (GGTCTC).

Tous les gènes, les promoteurs et les terminateurs ont été clonés par restriction dans le vecteur pSBK pour l'expression dans la levure. Les promoteurs et terminateurs (Wargner et al., Fungal Genet Biol. 2016 Apr;89:126-136) ont été récupérés par PCR à partir de l'ADN génomique de la levure 5. cerevisiae.

Le vecteur pSBK comprend un marqueur de sélection de la levure URA, ou LEU ou TRP ou HIS et un marqueur de résistance à la kanamycine.

Conditions de culture

Les souches ont été cultivées dans 1 ml de milieu (base azote minimale pour levures (Dutscher, Brumath, Fr) 6,7 g/L, glucose à 20 g/L, complément CSM à 600 mg/L (Formedium, UK)) à 30°C pendant 72h sous agitation continue à 200 tr/min. Chaque souche a été inoculée à une densité optique (DO) de 0,2 à partir d'une préculture de 24h cultivée dans les mêmes conditions.

Méthode analytique : Méthode UHPLC-DAD-QExactive :

Préparation des échantillons : Dans une plaque de 96 puits , 50 pL d'acétonitrile et 50 pL d'échantillons (dilution par 2) ont été injectés. La plaque a ensuite été agitée pendant 5 minutes à 35 tr/min pour homogénéiser le solvant et l'échantillon. La plaque a ensuite été centrifugée pendant 5 minutes à 3000 tr/min.

Analyse par UHPLC-DAD-QExactive : Les échantillons ont été analysés par une UHPLC Vanquish-H (Thermo) couplée à un détecteur DAD (Thermo). La colonne est une colonne Waters HSST3 C18 (100 X 2.1mm X 1.8pm) associée à une pré-colonne Acquity UPLC HSST3 VanGuard.

La phase mobile A était une solution de 0,1% d'acide formique dans de l'eau de qualité LC/MS et la phase mobile B était une solution de 0,1% d'acide formique dans de l'acétonitrile pur de qualité LC/MS. La température de la colonne était de 50°C et la température du passeur d'échantillons était de 10°C. (Tableaux 5 et 6)

Tableau 5 : Conditions chromatographiques pour la détection des molécules d'intérêt

Tableau 6 : Temps de rétention et gamme de calibration des molécules d'intérêts

Résultats

Hydroxylation du p-coumaroyl-CoA en caféoyl-CoA par des enzymes coumaroyl-CoA 3- hydroxylase

26 coumaroyl-CoA 3-hydroxylase (SEQ ID NO : 42 à 67) ont été testées dans la souche nommée VAN305 correspondant à la souche 5. cerevisiae FY1679-28A exprimant les gènes codant pour les enzymes TAL de Rhodotorula glutinis (SEQ. ID NO : 19), C4H d’Arabidopsis thaliana (SEQ ID NO : 21), PAL d’Arabidopsis thaliana (SEQ ID NO : 69), 4CL5 de Citrus Clementina (SEQ ID NO: 6), CPR1 de Catharantus roseus (SEQ ID NO : 22), Thio3 de Petunia hybrida (SEQ ID NO : 2) et étant délétée du gènefdcl.

La production d'acide caféique a été testée avec chacune de ces coumaroyl-CoA 3- hydroxylases. La production d'acide caféique a été comparée à la production de la souche contrôle VAN305 qui ne possède pas de CcoA3H. La production a été réalisée à partir du glucose (20 g/L) en 72h.

La production d'acide caféique obtenue pour les souches exprimant les différentes enzymes CcoA3H est présentée dans les Figures 7 à 9.

Pour valider l'activité de ces enzymes sur le coumaroyl-CoA et non sur l'acide p- coumarique, les enzymes ont été testées dans la souche nommée VAN311 correspondant à la souche 5. cerevisiae FY1679-28A exprimant les gènes codant pour les enzymes TAL de Rhodotorula glutinis (SEQ ID NO : 19), C4H d’Arabidopsis thaliana (SEQ ID NO : 21), PAL d’Arabidopsis thaliana (SEQ ID NO : 69), CPR1 de Catharantus roseus (SEQ ID NO : 22) et étant délétée du gène fdcl. La production d'acide caféique a ensuite été testée avec chacune des coumaroyl-CoA 3-hydroxylases. La production d'acide caféique a été comparée à la production de la souche contrôle VAN311 qui ne possède pas d'enzyme coumaroyl-CoA 3-hydroxylase.

Aucune des coumaroyl-CoA 3-hydroxylases testées n'est capable d'ajouter un groupement -OH en position 3 de l'acide p-coumarique pour produire directement de l'acide caféique (Figures 10 et 11). Ce résultat confirme donc l'action des CcoA3H sur le p-coumaroyl-CoA.

Insertion d'une voie complète de production d'acide férulique chez la levure passant par la voie CoA

La production d'acide férulique a été testée à partir du glucose (20 g/L). Le test de production d'acide férulique à partir du glucose a été réalisé dans la souche 5. cerevisiae FY1679-28A délétée du gène fdcl (Q Afdcl). Les souches suivantes ont été construites VAN1622, VAN1624, YSP226 et YSP228. Les enzymes exprimées dans chacune de ces souches sont présentées dans le tableau 7.

Tableau 7 : Construction des souches VAN 1622, VAN 1624, YSP226 et YSP228

4CL* : 4CL de Populus tomentose (SEQ ID NO : 8) ; CcoA3H14* de Salvia miltiorrhiza (SEQ ID NO : 49) ; Thio3 : Thio3 de Petunia hybrida (SEQ ID NO : 2), Thio30 d'Oryza meyeriana var. granulata (SEQ ID NO : 39) ; ; CcoAMT8 : CcoAMT de Panicum virgatum (SEQ ID NO : 40), COMT de Zea mays (SEQ ID NO : 82).

La production d'acide férulique de ces souches est présentée dans la Figure 12.

Exemple 3

Matériels et méthodes

Clonage des gènes Les gènes optimisés pour s'exprimer dans la levure ont été synthétisés par Twist Biosciences, San Francisco, USA ou DC Biosciences, Dundee, UK. Les gènes obtenus par synthèse comprennent à l'extrémité 5' et 3', un site de restriction Bbsl (GAAGAC) ou Bsal (GGTCTC) compatible avec le système de clonage utilisé.

Tous les gènes, les promoteurs et les terminateurs ont été clonés par restriction dans le vecteur pSBK pour l'expression dans la levure. Les promoteurs et terminateurs (Wargner et al., Fungal Genet Biol. 2016 Apr;89:126-136) ont été récupérés par PCR à partir de l'ADN génomique de la levure 5. cerevisiae.

Le vecteur pSBK comprend un marqueur de sélection de la levure HIS3, URA3, LEU2 ou TRP1 et un marqueur de résistance à la kanamycine.

Souches

Les levures ont été obtenues à partir de la souche Saccharomyces cerevisiae S288C (Mortimer RK and Johnston JR (1986) Genealogy of principal strains of the yeast genetic stock center. Genetics 113(l):35-43 PMID:3519363). Cette levure possède une quadruple auxotrophie pour l'uracile, le tryptophane, la leucine et I'histidine.

Dans toutes les souches construites, les gènes AR010 (YDR380W) et FDC1 (YDR539W) ont été inactivés, c'est à dire par intégration en lieu et place du cadre de lecture ouvert, d'un ADN linéaire comprenant un marqueur de sélection borné par les régions amont et aval du gène.

Les clonages ont été réalisés dans la souche d' Escherichia coli MH1.

Tableau 8 : Liste des souches construites

Conditions de culture

Les souches ont été cultivées à 30°C pendant 72h sous agitation continue à 200 tr/min dans 1 ml de milieu YNB (Dutscher, Brumath, Fr) supplémenté par du CSM (Complete Supplement Mixture; Formedium, UK). Le glucose est ajouté à 20 g/L.

Standards

Les standards ont été acquis chez le fournisseur Sigma-Aldrich (acide p-coumarique, acide caféique, acide férulique).

Méthode analytique : Méthode UHPLC-TQ:

Préparation des échantillons : Des échantillons de 100 pL sont récupérés pour chaque expérience. 50 pL sont transférés dans une nouvelle plaque, auxquels sont ajoutés 50 pL de la solution d'étalon interne. Chaque échantillon est ensuite homogénéisé par aspiration- refoulement, puis centrifugé pendant 5 min à 3000 rpm à température ambiante. La concentration finale de l'étalon interne (Acide Protocatéchique) est de 0,5 mg/L.

Analyse par UHPLC-TQ: Les échantillons ont été analysés par une UHPLC Vanquish-H (Thermo) couplée à un triple-quadripôle UHPLC-TQ (Thermo). La colonne est une colonne Waters Acquity UPLC@ USST3 (8 pm 2,1 X 100 mm) associée à une pré-colonne HSST3 1 ,8 pm 2,1 X 5 mm.

La phase mobile A est une solution de 0,1 % d’acide formique dans de l’eau de qualité LC/MS et la phase mobile B est une solution de 0,1 % d’acide formique dans de l’acétonitrile pur de qualité LC/MS. La température de la colonne est de 50° C et la température du passeur d'échantillons à 10°C.

Tableau 9 : Conditions chromatographiques pour la détection des molécules d'intérêt

Les paramètres de la source électrospray sont :

- voltage du spray mode positif à 4000V

- gaz rideau : à 50 Arb

- gaz auxiliaire à 15 Arb - température du tube de transfert à 300°C

- température du vaporisateur à 300°C

Tableau 10 : Les ions suivis et les conditions defragmentation pour les molécules d'intérêt :

Résultats Méthylation de l’acide caféique par des enzymes COMT

18 COMT (SEQ ID NO : 71 à 74 et 79 à 92) ont été testées dans la souche 5. cerevisiae S288C exprimant les gènes codant pour les enzymes TAL de Rhodotorula glutinis (SEQ ID NO : 19), PAL d'Arabidopsis thaliana (SEQ ID NO : 20), C4H d'Arabidopsis thaliana (SEQ ID NO : 21), CPR1 de Catharantus roseus (SEQ ID NO : 22), HpaB de Pseudomonas aeruginosa (SEQ ID NO : 17), HpaC de Salmonella enterica (SEQ ID NO : 18) et étant délétée du gènefdcl.

La production d'acide férulique a été testée avec chacune de ces COMT. La production d'acide férulique a été comparée à la production d'une souche contrôle qui comprend les différentes enzymes à l'exception d'une COMT (souche CRTL). La production a été réalisée à partir du glucose (20 g/L) en 72h.

La production d'acide férulique obtenue pour les souches exprimant les différentes enzymes COMT est présentée dans la Figure 13.

La souche sans COMT s'arrête à la production d'acide caféique et n'est pas capable de produire de l'acide férulique. Les souches comprenant une COMT sont capables de convertir l'acide caféique en acide férulique.

La capacité de production d'acide férulique dépend dans l'enzyme COMT utilisée. Les souches 937, 938, 940, 941 et 943 exprimant respectivement les COMT de SEQ ID NO : 74, 76, 79, 80 et 82, montrent une efficacité remarquable à produire de l'acide férulique à partir d'acide caféique. En particulier, ces enzymes permettent une meilleure conversion de l'acide caféique en acide férulique que l'enzyme COMT de référence d'Arabidopsis thaliana.