Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR BIOSYNTHESISING DIOSMETIN AND/OR HESPERETIN IN A MICROORGANISM
Document Type and Number:
WIPO Patent Application WO/2020/165182
Kind Code:
A1
Abstract:
The invention relates to a recombinant microorganism modified to be capable of producing diosmetin and/or hesperetin and to the use thereof to produce diosmetin and/or hesperetin.

Inventors:
PAUTHENIER CYRILLE (FR)
LE JEUNE ANDRÉ (FR)
SCORNEC HÉLÈNE (FR)
ROUSSEL CÉLIA (FR)
JOUBERT LAETITIA (FR)
Application Number:
PCT/EP2020/053493
Publication Date:
August 20, 2020
Filing Date:
February 11, 2020
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
ABOLIS BIOTECHNOLOGIES (FR)
International Classes:
C12N9/10; C12P17/06
Domestic Patent References:
WO2016050656A12016-04-07
WO2015092013A12015-06-25
Foreign References:
JP2015077072A2015-04-23
US8809028B22014-08-19
Other References:
DATABASE UniProt [online] 28 February 2018 (2018-02-28), "SubName: Full=Uncharacterized protein {ECO:0000313|EMBL:GAY62410.1};", XP002798583, retrieved from EBI accession no. UNIPROT:A0A2H5QCN9 Database accession no. A0A2H5QCN9
PANDEY RAMESH PRASAD ET AL: "Microbial production of natural and non-natural flavonoids: Pathway engineering, directed evolution and systems/synthetic biology", BIOTECHNOLOGY ADVANCES, ELSEVIER PUBLISHING, BARKING, GB, vol. 34, no. 5, 3 March 2016 (2016-03-03), pages 634 - 662, XP029637369, ISSN: 0734-9750, DOI: 10.1016/J.BIOTECHADV.2016.02.012
YANG CAO ET AL: "Computational Studies of the Regioselectivities of COMT-Catalyzed Meta -/ Para -O Methylations of Luteolin and Quercetin", JOURNAL OF PHYSICAL CHEMISTRY PART B: CONDENSED MATTER, MATERIALS, SURFACES, INTERFACES & BIOPHYSICAL, vol. 118, no. 2, 2 January 2014 (2014-01-02), US, pages 470 - 481, XP055588377, ISSN: 1520-6106, DOI: 10.1021/jp410296s
PANDEY ET AL., BIOTECHNOL ADV., vol. 34, 2016, pages 634 - 662
KIM ET AL., JOURNAL OF BIOTECHNOLOGY, vol. 119, 2005, pages 155 - 162
WELCH, M. ET AL., METHODS IN ENZYMOLOGY, vol. 498, 2011, pages 43 - 66
"NCBI", Database accession no. WP_011157377.1
"Genbank", Database accession no. NM_001288895.1
AIGRAIN ET AL., EMBO REPORTS, vol. 10, 2009, pages 742 - 747
"N CBI", Database accession no. AMW91729.1
HWANG EL ET AL., APPL ENVIRON MICROBIOL. 2003, vol. 69, no. 5, 2003, pages 2699 - 2706
JIANG HL ET AL., APPL ENVIRON MICROBIOL. 2005, vol. 71, no. 6, 2005, pages 2962 - 9
CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, pages 13.7.1 - 13.7.10
ELLIS T. ET AL., INTEGRATIVE BIOLOGY, vol. 3, no. 2, 2011, pages 109 - 118
VERDUYN ET AL., YEAST, vol. 8, 1992, pages 501 - 17
VISSER ET AL., BIOTECHNOLOGY AND BIOENGINEERING, vol. 79, 2002, pages 674 - 81
ALFENORE ET AL., APPL MICROBIOL BIOTECHNOL., vol. 60, 2002, pages 67 - 72
Attorney, Agent or Firm:
CABINET BECKER ET ASSOCIES (FR)
Download PDF:
Claims:
REVENDICATIONS

1. Utilisation d'un microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une O-méthyl-transférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' pou r la production de diosmétine et/ou d'hespérétine.

2. Microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une O-méthyl-transférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4', le microorganisme étant une levure.

3. Utilisation selon la revendication 1 ou microorganisme selon la revendication 2, caractérisé(e) en ce que la O-méthyl-transférase (OMT) est une O-méthyl-transférase (OMT) de Citrus, en particulier Citrus clementina ou Citrus sinensis.

4. Utilisation selon l'une quelconque des revendications 1 et 3 ou microorganisme selon l'une quelconque des revendications 2-3, caractérisé(e) en ce que la O-méthyl- transférase (OMT) est sélectionnée parmi une enzyme comprenant une séquence choisie parmi SEQ ID NO 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquence et présentant l'activité O- méthyl-transférase.

5. Utilisation selon l'une quelconque des revendications 1 et 3 ou microorganisme selon l'une quelconque des revendications 2-3, caractérisé(e) en ce que la O-méthyl- transférase (OMT) est sélectionnée parmi une enzyme comprenant une séquence choisie parmi SEQ ID NO 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyl- transférase.

6. Utilisation selon l'une quelconque des revendications 1 et 3 ou microorganisme selon l'une quelconque des revendications 2-3, caractérisé(e) en ce que la O-méthyl- transférase (OMT) est sélectionnée parmi une enzyme comprenant une séquence choisie parmi SEQ ID NO 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyl- transférase.

7. Utilisation selon la revendication 1 ou microorganisme selon la revendication 2, caractérisé(e) en ce que la O-méthyl-transférase (OMT) est une O-méthyl-transférase (OMT) d'Homo sapiens.

8. Utilisation selon l'une quelconque des revendications 1 et 7 ou microorganisme selon l'une quelconque des revendications 2 et 7 , caractérisé(e) en ce que la O-méthyl- transférase (OMT) est sélectionnée parmi une enzyme comprenant une séquence SEQ ID NO 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyl-transférase.

9. Utilisation selon la revendication 1 ou microorganisme selon la revendication 2, caractérisé(e) en ce que la O-méthyl-transférase (OMT) est une O-méthyl-transférase (OMT) d’Arabidopsis thaliana.

10. Utilisation selon l'une quelconque des revendications 1 et 9 ou microorganisme selon l'une quelconque des revendications 2 et 9, caractérisé(e) en ce que la O-méthyl- transférase (OMT) est sélectionnée parmi une enzyme est sélectionnée parmi l'enzyme comprenant une séquence SEQ ID NO 87 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyltransférase.

11. Utilisation selon l'une quelconque des revendications 1 et 3-10 ou microorganisme selon l'une quelconque des revendications 2-10, caractérisé(e) en ce que le microorganisme comprend en outre une séquence d'acide nucléique hétérologue ou endogène codant pour une S-adénosylméthionine synthétase (SAMT).

12. Utilisation selon l'une quelconque des revendications 1 et 3-11 ou microorganisme selon l'une quelconque des revendications 2-11, caractérisé(e) en ce que le microorganisme comprend en outre une séquence d'acide nucléique endogène or hétérologue codant pour une flavone synthase (FNS), en particulier une flavone synthase capable de produire la lutéoline à partir de l'ériodictyol et/ou produire l'apigénine à partir de la naringénine, de préférence de Petroselinum crispum, d’Arabidopsis thaliana, Zea mays, de Lonicera japonica, Lonicera macranthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii.

13. Utilisation selon la revendication 12 ou microorganisme selon la revendication 12, caractérisé(e) en ce que la flavone synthase (FNS) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 37, 33, 35, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 37, 33, 35 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase.

14. Utilisation ou microorganisme selon la revendication 12, caractérisé(e) en ce que la flavone synthase (FNS) est sélectionnée parmi les enzymes comprenant la séquence SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

15. Utilisation selon l'une quelconque des revendications 1 et 3-14 ou microorganisme selon l'une quelconque des revendications 2-14, caractérisé(e) en ce que le microorganisme comprend en outre :

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) ;

- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) ;

- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) ; et

- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) ;

16. Utilisation selon la revendication 15 ou microorganisme selon la revendication 15, caractérisé(e) en ce que le microorganisme comprend :

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 41 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces clavuligerus ; une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 97, 99, 43, 45, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; en particulier une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 97, 99 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité 4-coumarate-CoA ligase, et de préférence une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase ;

- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 53, 51, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et

- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 61 et 59 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase, de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase.

17. Utilisation selon la revendication 16 ou microorganisme selon la revendication 16, caractérisé(e) en ce que le microorganisme comprend :

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; et

- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi les SEQ ID NO: 97, 99 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité 4- coumarate-CoA ligase ; et

- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et

- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase.

18. Utilisation selon la revendication 16 ou microorganisme selon la revendication 16, caractérisé(e) en ce que le microorganisme comprend :

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; et

- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase ;

- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et

- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase .

19. Utilisation selon l'une quelconque des revendications 1 et 3-18 ou microorganisme selon l'une quelconque des revendications 2-18, caractérisé(e) en ce que le microorganisme comprend en outre une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H).

20. Utilisation selon la revendication 19 ou microorganisme selon la revendication 19, caractérisé(e) en ce que le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H) de Callistephus chinensis, Perilla frutescens var. crispa, Pétunia x hybrida, Gerbera hybrida, Citrus sinensis, Arabidopsis thaliana, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis ou Pilosella officinarum, en particulier de Callistephus chinensis, Perilla frutescens var. crispa, Pétunia x hybrida, Gerbera hybrida, Citrus sinensis, Arabidopsis thaliana ou Pilosella officinarum, de préférence une enzyme comprenant une séquence choisie parmi SEQ ID NOs: 7, 1, 3, 5, 9, 11, 13, 15, 17, 19, 21 et 95 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité flavonoïde 3'- monooxygénase, de préférence sélectionnée parmi les enzymes de SEQ ID NOs: 7, 11, 17, et 95 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase.

21. Utilisation selon l'une quelconque des revendications 1 et 3-20 ou microorganisme selon l'une quelconque des revendications 2-20, caractérisé(e) en ce que le microorganisme comprend en outre une séquence d'acide nucléique endogène or hétérologue codant pour une cytochrome P450 réductase (CPR).

22. Utilisation selon la revendication 21 ou microorganisme selon la revendication 21, caractérisé(e) en ce que le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d'Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 25, 23, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière particulière parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase.

23. Utilisation selon l'une quelconque des revendications 1 et 3-22 ou microorganisme selon l'une quelconque des revendications 2-22, caractérisé(e) en ce que le microorganisme comprend en outre une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydroxylase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p- coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p-coumarate 3 hydroxylase.

24. Utilisation selon l'une quelconque des revendications 1 et 3-23 ou microorganisme selon l'une quelconque des revendications 2-23, caractérisé(e) en ce que le microorganisme comprend en outre

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine am monia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4- hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4- hydroxylase .

25. Utilisation selon l'une quelconque des revendications 1 et 3-24 ou microorganisme selon l'une quelconque des revendications 2-24, caractérisé(e) en ce que le microorganisme comprend

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ;

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4- hydroxylase ;

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 ou 97 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité 4- coumarate-CoA ligase ;

- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase;

- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ;

- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase ;

- une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; et

- une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité cytochrome P450 réductase ; et

- une séquence d'acide nucléique hétérologue codant pour une O-méthyl-transférase (OMT) comprenant une séquence choisie parmi SEQ ID NO 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité O-méthyl-transférase, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NO 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyl-transférase.

26. Utilisation selon l'une quelconque des revendications 1 et 3-25 ou microorganisme selon l'une quelconque des revendications 2-25, caractérisé(e) en ce que le microorganisme est une levure du genre Saccharomyces, en particulier Saccharomyces cerevisiae.

27. Utilisation d'un microorganisme selon l'une quelconque des revendications 2-26 pour produire de la diosmétine et/ou l'hespérétine.

28. Méthode de production de la diosmétine et/ou l'hespérétine comprenant la culture d'un microorganisme selon l'une quelconque des revendications 2-26 et éventuellement la récolte de la diosmétine et/ou l'hespérétine.

29. Utilisation selon la revendication 27 ou méthode selon la revendication 28, pour la production d'hespérétine.

30. Utilisation selon la revendication 27 ou méthode selon la revendication 28, pour la production de diosmétine.

31. Utilisation selon la revendication 27, 29 ou 30 ou méthode selon la revendication 28-30, caractérisée en ce qu'il n'y a pas d'apport de naringénine, d'apigénine, d'ériodictyol et/ou de lutéoline dans le milieu de culture.

Description:
METHODE DE BIOSYNTHESE DE LA DIOSMETINE ET/OU DE L

HESPERETINE DANS UN MICROORGANISME

DOMAINE DE L'INVENTION

La présente invention est relative à une méthode de production de la diosmétine et de l'hespérétine.

ARRI ERE-PLAN TECHNOLOGIQUE

La diosmétine et l'hespérétine sont, respectivement, une flavone et flavanone O- méthylées. Ces composés présentent un intérêt en tant que tels mais également en tant qu'intermédiaire de biosynthèse pour la production d'autres molécules d'intérêt.

Ainsi, il existe un besoin non satisfait de procédé de biosynthèse de la diosmétine et de l'hespérétine.

RESU ME DE L'INVENTION

Les inventeurs ont mis au point une biosynthèse de la diosmétine et l'hespérétine dans un microorganisme.

La présente invention est donc relative à l'utilisation d'un microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une O-méthyl- transférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' pour la production de diosmétine et/ou d'hespérétine.

Elle est également relative à un microorganisme recombinant comprenant une séquence d'acide nucléique hétérologue codant pour une O-méthyl-transférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4', le microorganisme étant une levure. Dans un mode de réalisation, la O-méthyl-transférase (OMT) est une O-méthyl-transférase (OMT) d'Homo sapiens.

Dans un autre mode de réalisation, la O-méthyl-transférase (OMT) est sélectionnée parmi une enzyme comprenant une séquence SEQ ID NO 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyl-transférase.

Dans un autre mode de réalisation, la O-méthyl-transférase (OMT) est une O-méthyl- transférase (OMT) d’Arabidopsis thaliana.

Dans un autre mode de réalisation, la O-méthyl-transférase (OMT) est sélectionnée parmi une enzyme est sélectionnée parmi l'enzyme comprenant une séquence de SEQ ID NO 87 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyltransférase.

Dans un mode préféré de réalisation, la O-méthyl-transférase (OMT) est une O-méthyl- transférase (OMT) de Citrus, en particulier Citrus clementina ou Citrus sinensis. En particulier, la O-méthyl-transférase (OMT) peut être sélectionnée parmi une enzyme comprenant une séquence choisie parmi SEQ ID NO 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité O-méthyl-transférase. De manière préférée, la O- méthyl-transférase (OMT) est sélectionnée parmi une enzyme comprenant une séquence choisie parmi SEQ ID NO 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyl- transférase. Selon une autre alternative préférée, la O-méthyl-transférase (OMT) est sélectionnée parmi une enzyme comprenant une séquence choisie parmi SEQ ID NO 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyl-transférase.

De préférence, le microorganisme comprend en outre une séquence d'acide nucléique hétérologue ou endogène codant pour une S-adénosylméthionine synthétase (SAMT).

De préférence, le microorganisme comprend en outre une séquence d'acide nucléique endogène or hétérologue codant pour une flavone synthase (FNS), en particulier une flavone synthase capable de produire la lutéoline à partir de l'ériodictyol, de préférence d’Arabidopsis thaüana, Petroselinum crispum, Zea mays, Lonicera japonica, Lonicera mocronthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cordunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii. La flavone synthase (FNS) peut être sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase. Selon un mode préférée, la flavone synthase (FNS) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 37, 33, 35, de préférence la SEQ ID NO : 37, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, de préférence avec la

SEQ ID NO : 37, et présentant une activité flavone synthase.

De préférence, le microorganisme comprenant en outre :

une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) ; et/ou une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une une cinnamate 4-hydroxylase (C4H) ; une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) ;

une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) ;

une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) ;

une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H), et

facultativement, une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p-coumarique en acide caféique.

En particulier, le microorganisme peut comprendre :

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 41 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; - une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces clavuligerus ; une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 97, 99, 43, 45, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; en particulier une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 97, 99 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase, et de préférence une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase ;

- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 53, 51, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité chalcone synthase; et

- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 61 et 59 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase, de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ; et

- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) de Callistephus chinensis, Perilla frutescens var. crispa, Pétunia x hybrida, Gerbera hybrida, Citrus sinensis, Arabidopsis thaliana, Pilosella officinarum, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Citrus clementina ou Streptomyces avermitilis de préférence une enzyme comprenant une séquence choisie parmi SEQ ID NOs: 7 , 1, 3, 5, 9, 11, 13, 15, 17, 19, 21 et 95 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes de SEQ ID NOs: 7, 11, 17, et 95 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase.

De préférence, le microorganisme comprend en outre une séquence d'acide nucléique endogène or hétérologue codant pour une cytochrome P450 réductase (CPR), en particulier une CPR ayant une séquence choisie parmi SEQ ID NOs: 25, 23, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes com prenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière particulière parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase.

Dans un mode de réalisation préféré, le microorganisme est une levure du genre Saccharomyces, en particulier Saccharomyces cerevisiae.

La présente invention est relative à l'utilisation d'un microorganisme tel que défini dans la présente demande pour produire de la diosmétine et/ou l'hespérétine.

Elle est également relative à une méthode de production de la diosmétine et/ou l'hespérétine comprenant la culture d'un microorganisme tel que défini dans la présente demande et éventuellement la récolte de la diosmétine et/ou l'hespérétine.

De préférence, lors de l'utilisation du microorganisme selon l'invention pour produire de la diosmétine et/ou l'hespérétine ou dans la méthode selon l'invention, il n'y a pas d'apport de naringénine, d'apigénine, d'ériodictyol et/ou de lutéoline dans le milieu. DESCRIPTION DETAILLEE DE L'I NVENTION

Les inventeurs ont donc exploré plusieurs voies de biosynthèse et ont réussi à mettre au point la biosynthèse de l'hespérétine et/ou de la diosmétine dans un microorganisme. En effet, l'hespérétine et/ou la diosmétine peuvent être obtenues à partir de l'ériodictyol et/ou de la lutéoline par méthylation en position 4'.

L'ériodictyol et de la lutéoline présente au moins deux hydroxyles susceptibles d'être méthylé, en position 5, 7, 3' et 4'. Ainsi, dans un mode de réalisation préféré, la levure comprend un acide nucléique hétérologue ou endogène codant pour une cytochrome P450 réductase, une NADPH-cytochrome P450 réductase. Cette enzyme appartient à la classe des EC 1.6.2.4. Il est donc nécessaire d'identifier des méthylases capables de méthyler spécifiquement le groupe hydroxyle en position 4', notamment par rapport à ceux en position 5, 7 et 3'.

Les méthylases sont très nombreuses dans la nature et représentent une grande famille d'enzymes dont les substrats sont difficiles à cerner. Beaucoup de méthylases ayant les flavones et flavonones comme substrat introduisent le groupe méthyle en position 7. D'autres aboutissent à la production de mélanges de composés portant des méthylations multiples en position 7, 3' et 4'. Notamment, la spécificité de la position de méthylation des catéchols aromatiques est très souvent en méta (position 3' ou 5') et rarement en para, position 4' (Pandey et al, 2016, Biotechnol Adv., 34, 634-662).

La seule enzyme semblant montrer une spécificité pour la position 4' est une enzyme de Glycine max, SOMT-2, capable dans E. coli de méthyler plusieurs flavonoïdes dont l'apigénine et la naringénine spécifiquement la position 4' (Kim et al, 2005, Journal of Biotechnology 119 :155-162). Cependant, sa capacité d'acceptation de l'ériodictyol et/ou de la lutéoline n'est pas connue. Par ailleurs, les inventeurs ont observé que cette enzyme ne fonctionnait dans une levure.

Il a donc été nécessaire d'identifier des méthylases capables d'introduire un groupe méthyle en position 4' de l'ériodictyol et/ou de la lutéoline et les inventeurs ont réussi à identifier de telles O-méthyl-transférases (OMT).

Définition

Par « microorganisme » est entendu un organisme unicellulaire. De préférence, le microorganisme est une bactérie ou une levure. Par « microorganisme recombinant » est entendu un microorganisme qui ne se trouve pas dans la nature et qui contient un génome modifié suite à une insertion, modification ou délétion d'un ou plusieurs éléments génétiques hétérologues.

Par « acide nucléique recombinant » est entendu un acide nucléique qui a été modifié et n'existe pas dans un microorganisme naturel. Par exemple, ce terme peut désigner une séquence codante ou gène qui est lié de manière opérationnelle à un promoteur qui n'est pas le promoteur naturel. Cela peut également désigner une séquence codante dans laquelle les introns ont été supprimés pour des gènes comprenant des exons et des introns. Par « hétérologue » est entendu que le gène a été introduit par génie génétique dans la cellule. Il peut y être présent sous forme épisomale ou chromosomique. L'origine du gène peut être différente de la cellule dans laquelle il est introduit. Cependant, le gène peut également provenir de la même espèce que la cellule dans laquelle il est introduit mais il est considéré comme hétérologue en raison de son environnement qui n'est pas naturel. Par exemple, le gène ou la séquence nucléique est hétérologue car il/elle est sous le contrôle d'un promoteur autre que son promoteur naturel, il/elle est introduit(e) dans un endroit différent de celui-ci où il/elle est situé(e) naturellement. La cellule hôte peut contenir une copie du gène endogène préalablement à l'introduction du gène hétérologue ou elle peut ne pas contenir de copie endogène. Par ailleurs, la séquence d'acide nucléique peut être hétérologue dans le sens où la séquence codante a été optimisée pour l'expression dans le microorganisme hôte. De manière préférée, dans le présent document, une séquence nucléique hétérologue code pour une protéine qui est hétérologue à la cellule hôte, c'est-à-dire qui n'est pas naturellement présente dans la levure.

Tel qu’utilisé ici, le terme «natif» ou «endogène», par rapport au microorganisme hôte, se réfère à un élément génétique ou à une protéine naturellement présente dans ledit microorganisme.

Le terme « gène » désigne tout acide nucléique codant pour une protéine. Le terme gène englobe l’ADN, comme l’ADNc ou l’ADNg, ainsi que G ARN . Le gène peut d’abord être préparé par des techniques recombinantes, enzymatiques et/ou chimiques, et ensuite répliqué dans une cellule hôte ou un système in vitro. Le gène comprend typiquement un cadre de lecture ouvert codant pour une protéine souhaitée. Le gène peut contenir des séquences supplémentaires telles qu’un terminateur de transcription ou un peptide signal. En raison de la dégénérescence du code génétique, plusieurs acides nucléiques peuvent coder un polypeptide particulier. Ainsi, les codons dans la séquence codante pour un polypeptide donné peuvent être modifiés de telle sorte que l'expression optimale dans un microorganisme particulier soit obtenue, par exemple en utilisant des tables de traduction de codon appropriées pour ce microorganisme. Les acides nucléiques peuvent également être optimisés selon une teneur en GC préférable pour la levure particulière et/ou pour réduire le nombre de séquences répétées. Dans certains modes de réalisation, les acides nucléiques hétérologues ont été optimisés par codon pour une expression dans le microorganisme concerné. L'optimisation des codons peut être effectuée par des procédés de routine connus dans la technique (voir, par exemple, Welch, M., et al. (2011), Methods in Enzymology 498: 43-66).

Le terme « lié de manière opérationnelle » désigne une configuration dans laquelle une séquence de contrôle est placée à une position appropriée par rapport à une séquence codante, de telle sorte que la séquence de contrôle dirige l'expression de la séquence codante.

Le terme « séquences de contrôle » désigne les séquences d'acide nucléique nécessaires à l'expression d'un gène. Les séquences de contrôle peuvent être natives ou hétérologues. Des séquences de contrôle bien connues et actuellement utilisées par l'homme du métier seront préférées. De telles séquences de contrôle comprennent, mais sans s'y limiter, un leader, une séquence de polyadénylation, une séquence de propeptide, un promoteur, une séquence de peptide de signal et un terminateur de transcription. De préférence, les séquences de contrôle comprennent un promoteur et un terminateur de transcription.

Le terme « cassette d'expression » désigne une construction d'acide nucléique comprenant une région codante, c'est-à-dire un gène, et une région de régulation, c'est-à-dire comprenant une ou plusieurs séquences de contrôle, liées de manière opérationnelle. De préférence, les séquences de contrôle conviennent au microorganisme hôte.

Tel qu'utilisé ici, le terme « vecteur d'expression » désigne une molécule d'ADN ou d'ARN qui comprend une cassette d'expression. De préférence, le vecteur d'expression est une molécule d'ADN double brin linéaire ou circulaire. Le vecteur peut comprendre en outre une origine de réplication, un marqueur de sélection, etc.

Par « pourcentage d'identité » entre deux séquences d’acide nucléique ou d’acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. Le meilleur alignement ou alignement optimal est l'alignement pour lequel le pourcentage d'identité entre les deux séquences à comparer, comme calculé ci- après, est le plus élevé. Les comparaisons de séquences entre deux séquences d’acide nucléique ou d’acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par fenêtre de comparaison pour identifier et comparer les régions locales de similarité de séquence. L’alignement aux fins de la détermination du pourcentage d’identité de séquence d’acides aminés peut être réalisé de diverses façons qui sont bien connues dans le domaine, par exemple en utilisant des logiciels informatiques disponibles sur le Web sur Internet tels que http: //blast.ncbi.nlm. Nih.gov/ ou http://www.ebi.ac.uk/Tools/emboss/). L’homme du métier peut déterminer les paramètres appropriés pour mesurer l’alignement, y compris tout algorithme nécessaire pour obtenir un alignement maximal sur toute la longueur des séquences comparées. Aux fins de la présente invention, les valeurs de pourcentage d’identité de séquence d’acides aminés se réfère à des valeurs générées à l’aide du programme d’alignement de séquence de paires EM BOSS Needle qui crée un alignement global optimal de deux séquences à l’aide de l’algorithme Needleman-Wunsch, dans lequel tous les paramètres de recherche sont définis par défaut Matrice de notation = BLOSUM62, Gap ouvert = 10, Gap extension = 0,5, pénalité d’intervalle d’extrémité = faux, intervalle d’extrémité ouvert = 10 et écart d’extrémité étendue = 0,5. Dans certains modes de réalisation, tous les pourcentages d’identité mentionnés dans cette demande peuvent être fixés à au moins 60%, au moins 70%, au moins 80%, au moins 85%, de préférence à au moins 90% d’identité, plus préférablement à au moins 95% d’identité. En particulier, sont considérés comme décrits les modes de réalisations dans lesquels tous les pourcentages d’identité de séquence des enzymes sont d'au moins 80% ou au moins 85%, de préférence d'au moins 90% ou au moins 95% d’identité de séquence.

Dans un mode de réalisation, les polypeptides peuvent présenter 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 additions, substitutions ou délétions par rapport aux séquences décrites dans les SEQ ID Nos. En particulier, ces additions, substitutions ou délétions sont introduites à l'extrémité N-terminale, C-terminale ou aux deux extrémités. Les polypeptides peuvent éventuellement se présenter sous forme de protéine de fusion. Les termes « surexpression » et « augmentation d'expression » tels qu'utilisés ici, sont utilisés de manière interchangeable et signifient que l'expression d'un gène ou d'une enzyme est augmentée par rapport à un microorganisme non modifié, par exemple un microorganisme de type sauvage ou ne comprenant pas les modifications génétiques décrites ici. Par « sauvage » est entendu un microorganisme non-modifié existant dans la nature. L'expression accrue d'une enzyme est habituellement obtenue en augmentant l'expression du gène codant pour ladite enzyme. Dans des modes de réalisation dans lesquels le gène ou l'enzyme n'est pas naturellement présent dans le microorganisme de l'invention, c'est-à-dire un gène ou une enzyme hétérologue, les termes « surexpression » et « expression » peuvent être utilisés de manière interchangeable. Pour augmenter l'expression d'un gène, l'homme du métier peut utiliser toutes les techniques connues telles que l'augmentation du nombre de copies du gène dans le microorganisme, en utilisant un promoteur induisant un niveau élevé d'expression du gène, c'est-à-dire un promoteur fort, en utilisant des éléments stabilisants l'ARN messager correspondant ou les séquences de séquestration du site de liaison de ribosome (RBS) et les séquences qui les entourent. En particulier, la surexpression peut être obtenue en augmentant le nombre de copies du gène dans le microorganisme. Une ou plusieurs copies du gène peuvent être introduites dans le génome par des procédés de recombinaison, connus de l'homme du métier, y compris le remplacement des gènes ou l’insertion multicopie (voir par exemple la demande de brevet international WO 2015/092013). De préférence, une cassette d’expression comprenant le gène, de préférence placé sous le contrôle d’un promoteur fort, est intégrée au génome. En variante, le gène peut être porté par un vecteur d’expression, de préférence un plasmide, comprenant une cassette d’expression avec le gène d’intérêt placé de préférence sous le contrôle d’un promoteur fort. Le vecteur d’expression peut être présent dans le microorganisme en une ou plusieurs copies, selon la nature de l’origine de la réplication. La surexpression du gène peut également être obtenue en utilisant un promoteur induisant un niveau élevé d’expression du gène. Par exemple, le promoteur d’un gène endogène peut être remplacé par un promoteur plus fort, c'est-à-dire un promoteur induisant un niveau d'expression plus élevé. Le gène endogène sous le contrôle d'un promoteur qui n'est pas le promoteur naturel est qualifié d'acide nucléique hétérologue. Les promoteurs appropriés pour être utilisés dans la présente invention sont connus de l'homme du métier et peuvent être constitutifs ou inductibles, et être endogènes ou hétérologues.

Par « comprenant » est également entendu « consistant » ou « consistant essentiellement ». Par « consistant essentiellement » est entendu que la séquence peut présenter 1, 2, 3, 4, 5, 6, 1 , 8, 9 ou 10 additions, substitutions ou délétions par rapport aux séquences décrites dans les SEQ ID Nos.

Microorganismes

Le microorganisme selon la présente invention peut être un microorganisme eucaryote ou procaryote.

Dans un premier mode de réalisation, le microorganisme est un eucaryote. De préférence, il est une levure de l'ordre des Saccharomycetales, Sporidiobolales et Schizosaccharomycetales. La levure peut par exemple être sélectionnée parmi Pichia, Kluyveromyces, Saccharomyces, Schizosaccharomyces, Candida, Lipomyces, Rhodotorula, Rhodosporidium, Yarrowia, ou Debaryomyces. Dans un mode de réalisation, la levure est choisie parmi Pichia pastoris, Kluyveromyces lactis, Kluyveromyces marxianus, Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, Saccharomyces oviformis, Schizosaccharomyces pombe, Candida albicans, Candida tropicalis, Rhodotorula glutinis, Rhodosporidium toruloides, Yarrowia lipolytica, Debaryomyces hansenii et Lipomyces starkeyi. Dans un mode de réalisation préféré, le microorganisme est une levure Saccharomyces, de préférence une levure Saccharomyces cerevisiae. De manière alternative, le microorganisme peut être un champignon, de préférence un champignon filamenteux. De préférence, il est choisi parmi Aspergillus, Trichoderma, Neurospora, Podospora, Endothia, Mucor, Cochiobolus ou Pyricularia. Préférentiellement, le champignon est choisi parmi Aspergillus nidulans, Aspergillus niger, Aspergillus awomari, Aspergillus oryzae, Aspergillus terreus, Neurospora crassa, Trichoderma reesei, et Trichoderma viride.

Dans un deuxième mode de réalisation, le microorganisme est un procaryote. De préférence, il est une bactérie, notamment choisie parmi les phyla Acidobacteria, Actinobacteria, Aguificae, Bacterioidetes, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Fibrobacteres, Firmicutes, Fusobacteria, Gemmatimonadetes, Nitrospirae, Planctomycetes, Proteobacteria, Spirochaetes, Thermodesulfobacteria, Thermomicrobia, Thermotogae, ou Verrucomicrobia. De manière préférée, la bactérie appartient au genre Acaryochloris, Acetobacter, Actinobacillus, Agrobacterium, Alicyclobacillus, Anabaena, Anacystis, Anaerobiospirillum, Aguifex, Arthrobacter, Arthrospira, Azobacter, Bacillus, Brevibacterium, Burkholderia, Chlorobium, Chromatium, Chlorobaculum, Clostridium, Corynebacterium, Cupriavidus, Cyanothece, Enterobacter, Deinococcus, Erwinia, Escherichia, Geobacter, Gioeobacter, Gluconobacter, Hydrogenobacter, Klebsiella, Lactobacillus, Lactococcus, Mannheimia, Mesorhizobium, Methylobacterium, Microbacterium, Microcystis, Nitrobacter, Nitrosomonas, Nitrospina, Nitrospira, Nostoc, Phormidium, Prochlorococcus, Pseudomonas, Ralstonia, Rhizobium, Rhodobacter, Rhodococcus, Rhodopseudomonas, Rhodospirillum, Salmonella, Scenedesmun, Serratia, Shigella, Staphylococcus, Streptomyces, Synechoccus, Synechocystis, Thermosynechococcus, Trichodesmium, ou Zymomonas. De manière encore préférée, la bactérie est choisie parmi les espèces Agrobacterium tumefaciens, Anaerobiospirillum succiniciproducens, Actinobacillus succinogenes, Aguifex aeolicus, Aguifex pyrophilus, Bacillus subtilis, Bacillus amyloliguefacines, Brevibacterium ammoniagenes, Brevibacterium immariophilum, Clostridium pasteurianum, Clostridium ljungdahlii, Clostridium acetobutylicum, Clostridium beigerinckii, Corynebacterium glutamicum, Cupriavidus necator, Cupriavidus metallidurans, Enterobacter sakazakii, Escherichia coli, Gluconobacter oxydons, Hydrogenobacter thermophilus, Klebsiella oxytoca, Lactococcus lactis, Lactobacillus plantarum, Mannheimia succiniciproducens, Mesorhizobium loti, Pseudomonas aeruginosa, Pseudomonas mevalonii, Pseudomonas pudica, Pseudomonas putida, Pseudomonas fluorescens, Rhizobium etli, Rhodobacter capsulatus, Rhodobacter sphoeroides, Rhodospirillum rubrum, Salmonella enterica, Salmonella typhi, Salmonella typhimurium, Shigella dysenteriae, Shigella flexneri, Shigella sonnei, Staphylococcus aureus, Streptomyces coelicolor, Zymomonas mobilis, Acaryochloris marina, Anabaena variabilis, Arthrospira platensis, Arthrospira maxima, Chlorobium tepidum, Chlorobaculum sp., Cyanothece sp., Gioeobacter violaceus, Microcystis aeruginosa, Nostoc punctiforme, Prochlorococcus marinus, Synechococcus elongatus, Synechocystis sp., Thermosynechococcus elongatus, Trichodesmium erythraeum, et Rhodopseudomonas palustris. Dans un mode de réalisation préféré, le microorganisme est une bactérie Escherichia coli, par exemple E. coli BL21, E. coli BL21 (DE3), E. coli MG1655 ou E. coli W31 10 et leurs dérivés. Dans un mode de réalisation alternatif, le microorganisme est une bactérie du genre Streptomyces , en particulier Streptomyces venezuelae.

Les microorganismes peuvent avoir été modifiés pour augmenter la production de tyrosine et/ou de phénylalanine, de préférence de la tyrosine. Notamment, les gènes responsables de la rétro-inhibition de la production de la tyrosine et/ou phénylalanine, de préférence de la tyrosine, peuvent être inactivés. De manière alternative ou cumulative, la voie de la biosynthèse de la tyrosine et/ou phénylalanine, de préférence de la tyrosine, peut être optimisée, notamment en redirigeant le flux de carbone d'autres voies métaboliques vers celle de la tyrosine et/ou phénylalanine, de préférence de la tyrosine. Ces modifications et ces gènes sont bien connus de l'homme du métier (voir US 8,809,028 ; Pandey et al, 2016, Biotechnol Adv., 34, 634-662).

Ainsi, dans un mode de réalisation, le microorganisme produit des quantités importantes de tyrosine et/ou de phénylalanine, en particulier à partir d'une source carbonée simple comme le glucose.

Modifications permettant la production d'hespérétine et/ou de diosmétine

Le microorganisme recombinant selon la présente invention a été modifié pour produire de l'hespérétine et/ou de la diosmétine. Notamment, pour permettre au microorganisme de synthétiser l'hespérétine et/ou la diosmétine à partir de l'ériodictyol et/ou de la lutéoline respectivement, le microoganisme a été modifié pour introduire une enzyme capable de méthyler l'hydroxyle en position 4' de l'ériodictyol et/ou de la lutéoline, de préférence de méthyler spécifiquement l'hydroxyle en position 4' de l'ériodictyol et/ou de la lutéoline.

Dans un premier mode de réalisation, le microorganisme recombinant est capable de produire l'ériodictyol et/ou de la lutéoline, en particulier il a été modifié dans ce but. Dans un mode de réalisation alternatif, l'ériodictyol et/ou de la lutéoline peuvent être apportées au microorganisme, par exemple par ajout de ces composés dans le milieu de culture. Dans un mode de réalisation particulier, le microorganisme produit l'hespérétine. La diosmétine peut alors être préparée à partir de l'hespérétine par conversion chimique, notamment par oxydation, ou biochimique.

Dans un mode de réalisation préféré, le microorganisme produit l'hespérétine et la diosmétine. Ainsi, le microorganisme recombinant comprend une O-méthyl-transférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4', de préférence capable de méthyler spécifiquement l'hydroxyle en position 4' de l'ériodictyol et/ou de la lutéoline de manière à éviter la plus possible une double méthylation des deux hydroxyles ou la méthylation de l'autre hydroxyle.

OMT : O-méthyltransférase

Les O-méthyltransférases (OMT) sont une très large famille d'enzymes présentant des cibles difficiles à cerner. Les inventeurs ont dû identifier et sélectionner des O- méthyltransférases capables de méthyler l'ériodictyol et/ou la lutéoline en position 4' (position para).

De préférence, l'enzyme a été sélectionnée de sorte à présenter une préférence pour une méthylation en position 4' de l'ériodictyol et/ou la lutéoline. Dans un mode de réalisation préféré, l'enzyme est spécifique de la position 4' de l'ériodictyol et/ou la lutéoline. Par spécifique, est entendu que le groupe méthyle introduit par l'enzyme sur l'ériodictyol et/ou la lutéoline se trouve en position 4' dans 60 % des cas, le reste étant introduit en position 3', de préférence dans 70% des cas, et de manière encore préférée dans 80% des cas.

Par « activité 4'O-méthyltransférase » est entendue la transformation d'un 4'- hydroxyflavonoïde en un 4'-méthoxyflavonoïde par une enzyme 4'-0-méthyltransférase. Pour déterminer s'il y a une activité 4'O-méthyltransférase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme 4'-0- méthyltransférase, d'un 4'-hydroxyflavonoïde, de S-adenosyl-L-methionine, dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition du 4'-méthoxyflavonoïde est observée en UPLC-MS en comparaison au standard attendu.

Dans notre cas, le 4'-hydroxyflavonoïde est l'ériodictyol ou la lutéoline et seront transformés respectivement en leur forme 4'-méthoxyflavonoïde c'est-à-dire en hespérétine ou en diosmétine.

Le microorganisme peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase capable de méthyler l'ériodictyol et/ou la lutéoline en position 4'.

Cette enzyme n'est présente que dans des eucaryotes supérieurs, en particulier dans les plantes. Dans un mode de réalisation, la O-méthyltransférase (OMT) est une enzyme d 'Arabidopsis thaliana. Dans un autre mode de réalisation, la O-méthyltransférase (OMT) provient d'un eucaryote supérieur, de préférence d'un mammifère. En particulier, la O- méthyltransférase (OMT) est d'origine humaine (Homo sapiens).

Dans un mode de réalisation particulier, GOMT est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec une de ces séquences et présentant l'activité O-méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4'.

Dans un mode de réalisation, GOMT est sélectionnée parmi l'enzyme comprenant une séquence choisie parmi SEQ ID NO 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyltransférase.

Dans un autre mode de réalisation, GOMT est sélectionnée parmi l'enzyme comprenant une séquence choisie parmi SEQ ID NO 87 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyltransférase.

Ainsi, GOMT peut être d 'Arabidopsis thaliana. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence NM_118755.4 et N P_567739.1, respectivement. La protéine est également décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q9C5D7, et plus particulièrement dans la SEQ ID NO :87.

De manière alternative, GOMT est d’Homo sapiens. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence NM_007310.2 et N P_009294.1, respectivement. La protéine est également décrite dans UniProtKB/Swiss Prot sous le numéro de référence P21964, et plus particulièrement dans la SEQ ID NO :89.

L'OMT d’Homo sapiens présente l'avantage d'accepter l'ériodictyol et la lutéoline comme substrat pour la méthylation alors que GOMT d 'Arabidopsis thaliana présente une forte préférence pour l'ériodictyol. A contrario, si la synthèse d'hespérétine est à favoriser par rapport à celle de la diosmétine, l'OMT d 'Arabidopsis thaliana pourrait présenter un avantage. Dans un mode de réalisation préféré, GOMT est une OMT de Citrus, en particulier Citrus clementina ou Citrus sinensis. Dans un mode de réalisation particulièrement préféré, GOMT est sélectionnée parmi une enzyme comprenant une séquence choisie parmi SEQ ID NO 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité O-méthyl-transférase. De préférence, GOMT est sélectionnée parmi une enzyme comprenant une séquence choisie parmi SEQ ID NO 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyl- transférase.

De manière alternative, GOMT est sélectionnée parmi une enzyme comprenant une séquence choisie parmi SEQ ID NO 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyl-transférase.

Les OMT de Citrus et d’Arabidopsis thaiiana décrites ci-dessus présentent l'avantage de méthyler spécifiquement l'ériodictyol en position 4'.

Lors de la conception du microorganisme, les inventeurs ont constaté que cette étape de méthylation constituait une des étapes limitantes. De manière surprenante, malgré la présence du cofacteur S-adénosyl-L-méthionine dans le microorganisme, en particulier la levure, l'ajout d'une enzyme augmentant la synthèse de ce cofacteur permettait de lever l'aspect limitant de cette étape. Ainsi, dans un mode de réalisation préféré, le microorganisme comprend en outre une séquence hétérologue ou endogène codant pour une enzyme synthétisant la S-adénosyl-L-méthionine, une S-adénosylméthionine synthétase (SAMT). Cette enzyme appartient à la classe des EC 2.5.1.6.

Dans un mode de réalisation, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une O-méthyl-transférase (OMT), en particulier capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' et une séquence d'acide nucléique hétérologue ou endogène codant pour une S-adénosylméthionine synthétase (SAMT).

Dans un mode de réalisation, la SAMT proviennent de levure, en particulier de Saccharomyces cerevisiae, tout particulièrement lorsque le microorganisme est une levure. Dans un mode de réalisation particulier, la S-adénosylméthionine synthétase est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité S-adénosylméthionine synthétase.

Par exemple, la S-adénosylméthionine synthétase peut être de Saccharomyces cerevisiae. Elle est décrite dans la base de données Genbank de NCBI sous le numéro NM_001180810.3 pour la séquence nucléique et sous le numéro NP_010790.3 pour la séquence protéique. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence P19358.

Dans un mode de réalisation, une nouvelle copie d'une séquence codante pour SAMT comme définie ci-dessus est introduite dans le microorganisme. Dans un autre mode de réalisation, lorsque le microorganisme est Saccharomyces cerevisiae, le promoteur du gène endogène codant pour SAMT est remplacé par un promoteur fort. Ainsi, l'expression de la SAMT est augmentée par rapport au microorganisme sauvage ; la SAMT est donc surexprimée dans le microorganisme modifié.

Ainsi, dans un mode de réalisation préféré, le microorganisme comprend donc une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' et une séquence hétérologue ou endogène codant pour une S-adénosylméthionine synthétase (SAMT) capable de produire la S-adénosyl-L-méthionine.

F3'H : Flavonoïde 3'-monooxygénase

Plusieurs stratégies de biosynthèse étaient possibles pour préparer l'hespérétine et/ou de la diosmétine à partir de la naringénine/apigénine. En effet, il est nécessaire de procéder à deux modifications : la méthylation de l'hydroxyle en position 4' et l'hydroxylation de la position 3'. Ainsi, pour augmenter la spécificité de la méthylation de l'hydroxyle en position 4', il semble logique de procéder d'abord à la méthylation du groupe hydroxyle déjà présent avant d'ajouter un second groupe hydroxyle en position 3'. Tout au contraire, les inventeurs ont abouti à la conclusion qu'il était nécessaire de procéder d'abord à l'hydroxylation puis à la méthylation, malgré le risque de problème de spécificité de méthylation dû à l'introduction du deuxième hydroxyle.

Pour cela, les inventeurs ont dû identifier et sélectionner des enzymes capables d'accepter la naringénine et/ou l'apigénine comme substrat et d'ajouter un groupe hydroxyle en position 3' de ces composés. De préférence, l'enzyme est sélectionnée de sorte à présenter une préférence pour une hydroxylation en position 3' de la naringénine et/ou de l'apigénine. Dans un mode de réalisation préféré, l'enzyme est spécifique de la position 3' de la naringénine et/ou de l'apigénine, en particulier afin d'éviter une double hydroxylation en positions 3' et 5', et de préférence éviter également une hydroxylation en position 5'.

La flavonoïde 3'-monooxygénase (F3'H) est une enzyme qui réalise l'addition d'un groupe hydroxyle en position 3' de la naringénine et/ou de l'apigénine. Cette enzyme appartient à la classe des EC 1.14.14.82. Elle est également appelée flavonoïde 3'-hydroxylase.

Par « activité flavonoïde 3'-monooxygénase » est entendue la transformation d'un flavonoïde en flavonoïde 3' hydroxylé par une enzyme F3'H, CPR dépendante. Pour déterminer s'il y a une activité flavonoïde 3'-monooxygénase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro de l'enzyme flavonoïde 3' monooxygénase en présence de NAD(P)H, O2, et d'un flavonoïde, dans des conditions optimales (pH, ions...), et l'observation en UPLC-MS et en comparaison au standard attendu de l'apparition d'un flavonoïde 3'-hydroxylé. De préférence, le flavonoïde est la naringénine ou l'apigénine et le flavonoïde 3'-hydroxylé est leur forme 3’-hydroxylé, c'est-à-dire Eriodictyol ou Lutéoline. Le microorganisme peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine.

Dans un mode de réalisation, la F3'H est une enzyme de plante, notamment de plantes du genre Allium, Arabidopsis, Brassica, Callistephus, Columnea, Citrus, Dianthus, Gentiana, Gerbera, Glycine, Fragaria, Ipomoea, Malus, Matthiola, Osteospermum, Oryza, Phanerochaete, Perilla, Petroselinum , Pélargonium, Pilosella, Pétunia, Sinningia, Sorghum, Torenia, Vitis ou Zea, par exemple de Allium cepa, Arabidopsis thaliana, Brassica napus, Columnea hybrida, Callistephus chinensis, Citrus sinensis, Citrus clementina, Dianthus caryophyllus, Fragaria vesca, Fragaria x ananassa, Gerbera hybrida, Glycine max, Gentiana triflora, Ipomoea nil, Ipomoea purpurea, Ipomoea tricolor, Matthiola incana, Malus domestica, Osteospermum hybrid cultivar, Oryza sativa, Phanerochaete chrysosporium, Pilosella officinarum, Petroselinum crispum, Pélargonium x hortorum, Perilla frutescens var. crispa, Pétunia x hybrida, Sinningia cardinalis, Sorghum bicolor, Torenia sp, Torenia hybrid cultivar, Vitis vinifera ou Zea mays. Dans un mode de réalisation plus spécifique, la F3'H est une enzyme de plantes du genre Allium, Brassica, Callistephus, Columnea, Citrus, Dianthus, Gentiana, Gerbera, Glycine, Fragaria, Ipomoea, Malus, Matthiola, Osteospermum, Oryza, Phanerochaete, Perilla, Petroselinum, Pélargonium, Pilosella, Pétunia, Sinningia, Sorghum, Torenia, Vitis ou Zea, par exemple de Allium cepa, Brassica napus, Columnea hybrida, Callistephus chinensis, Citrus sinensis, Citrus clementina, Dianthus caryophyllus, Fragaria vesca, Fragaria x ananassa, Gerbera hybrida, Glycine max, Gentiana triflora, Ipomoea nil, Ipomoea purpurea, Ipomoea tricolor, Matthiola incana, Malus domestica, Osteospermum hybrid cultivar, Oryza sativa, Phanerochaete chrysosporium, Pilosella officinarum, Petroselinum crispum, Pélargonium x hortorum, Perilla frutescens var. crispa, Pétunia x hybrida, Sinningia cardinalis, Sorghum bicolor, Torenia sp, Torenia hybrid cultivar, Vitis vinifera ou Zea mays.

De préférence, la F3'H est une enzyme de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis, Citrus sinensis, Arabidopsis thaliana ou Pilosella officinarum. En particulier, la F3'H peut être une enzyme de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis et Pilosella officinarum.

Dans un mode de réalisation particulier, la F3'FI est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 et 95, en particulier parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7, 11, 17,19 et 95, en particulier parmi SEQ ID NOs: 1, 5, 7, 11, 17 et 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec une de ces séquences et présentant l'activité flavonoïde 3'- monooxygénase, notamment avec la naringénine et/ou de l'apigénine comme substrat et avec une hydroxylation en position 3'. Dans un mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7, 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'- monooxygénase. Dans un mode de réalisation préféré, la F3'H est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 60, 70, 75, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. De manière tout particulièrement préférée, la F3'H peut être une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7 , 17 et 95 et les polypeptides comprenant une séquence ayant au moins 60, 70, 75, 80, 85, 90 ou 95 %, d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase.

Ainsi, la F3'H peut être de Perilla frutescens var. crispa. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB045593.1 et BAB59005.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 2 et 1.

La F3'H peut être de Phanerochaete chrysosporium. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB597870.1 et BAL05157.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 4 et 3.

La F3'H peut être de Pétunia x hybrida. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AF155332.1 et AAD56282.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 6 et 5.

La F3'H peut être de Callistephus chinensis. Dans un mode de réalisation, les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AF313488.1 et AAG49298.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 8 et 7. Dans un autre mode de réalisation, les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AF313489.1 et AAG49299.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 10 et 9.

La F3'H peut être de Gerbera hybrida. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence DQ218417.1 et ABA64468.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 12 et 11.

La F3'H peut être de Osteospermum hybrid cultivar. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence DQ250711.1 et ABB29899.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 14 et 13.

La F3'H peut être de Citrus clementina. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence XM_006440673.1 et XP_006440736.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 16 et 15.

La F3'H peut être de Citrus sinensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence XM_006477592.2 et XP_006477655.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 18 et 17.

La F3'H peut être de Pilosella officinarum. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence DQ319866.2 et ABC47161.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 20 et 19.

La F3'H peut être de Streptomyces avermitilis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence SAV_4539 et WP_010985964.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 22 et 21.

La F3'H peut être d’Arabidopsis thaliana. Une séquence nucléique codant cette enzyme et la séquence protéique sont décrites dans NCBI sous les numéros de référence NM_120881.2 et N P_196416.1, respectivement et plus particulièrement dans les SEQ ID NOs : 96 et 95.

De préférence, la F3'H est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. De manière tout particulièrement préférée, la F3'H est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase.

Selon un mode de réalisation préféré, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'- monooxygénase. Selon un autre mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 17 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 17, et présentant l'activité flavonoïde 3'- monooxygénase.

Selon un autre mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 95 et les polypeptides comprenant une séquence ayant au moins 70 %, au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 95, et présentant l'activité flavonoïde 3'-monooxygénase.

Selon un autre mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 11 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 11, et présentant l'activité flavonoïde 3'- monooxygénase.

Ainsi, dans un mode de réalisation, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une O-méthyl-transférase (OMT), en particulier capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' et une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H), en particulier capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine.

CPR : cytochrome P450 réductase

La flavonoïde 3'-monooxygénase (F3'H) nécessite la présence de NADPFI pour réaliser l'addition du groupe hydroxyle.

Ainsi, dans un mode de réalisation préféré, le microorganisme comprend un acide nucléique hétérologue ou endogène codant pour une cytochrome P450 réductase, une NADPFI-cytochrome P450 réductase. Cette enzyme appartient à la classe des EC 1.6.2.4. Ainsi, dans un mode de réalisation particulier, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H), en particulier capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine ; et un acide nucléique hétérologue ou endogène codant pour une cytochrome P450 réductase. La cytochrome P450 réductase provient d'un eucaryote, notamment d'une levure, par exemple du genre Saccharomycetales, ou d'une plante, par exemple une plante du genre Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Phoseolus, Physcomitrella, Pinus, Populus, Ruta, Saccharum, Solanum, Vigna, Vitis ou Zea.

Dans un mode de réalisation préféré, la cytochrome P450 réductase provient d'un eucaryote, par exemple de levure, en particulier de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaliana.

Dans un mode de réalisation particulier, la cytochrome P450 réductase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes com prenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase. Dans un mode de réalisation préféré, la cytochrome P450 réductase peut être sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides com prenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase.

Par exemple, la cytochrome P450 réductase peut être de Catharanthus roseus. Elle est décrite dans la base de données Genbank de NCBI sous le numéro X69791.1 pour la séquence nucléique et sous le numéro CAA49446.1 pou r la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 24 et 23, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q05001.

La cytochrome P450 réductase peut être de Saccharomyces cerevisiae. Elle est décrite dans la base de données Genbank de NCBI sous le numéro N M_001179172.1 pour la séquence nucléique et sous le numéro N P_011908.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 26 et 25, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence P16603. La cytochrome P450 réductase peut être chimérique. Elle est décrite dans l'article Aigrain et al (2009, EM BO reports, 10, 742-747. La séquence nucléique codant cette enzyme et la séquence protéique sont décrites dans les SEQ ID Nos : 28 et 27, respectivement.

Par ailleurs, la cytochrome P450 réductase peut être d’Arabidopsis thaliana. Lorsque la cytochrome P450 provient d'Arabidopsis thaliana, on peut la nommer l'ATR. Elle est décrite dans la base de données Genbank de NCBI sous le numéro NM_118585.4 pour la séquence nucléique et sous le numéro N P_194183.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 30 et 29, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q9SB48.

En outre, la cytochrome P450 réductase peut être d’Arabidopsis thaliana et être décrite dans la base de données Genbank de NCBI sous le numéro NM_179141.2 pour la séquence nucléique et sous le numéro N P_849472.2 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 32 et 31, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q9SUM3.

Dans un mode de réalisation, une nouvelle copie d'u ne séquence codante pour CPR comme définie ci-dessus est introduite dans la levure. Dans un autre mode de réalisation, lorsque la levure est Saccharomyces cerevisiae et que la CPR provient de la même levure, le promoteur du gène endogène codant pour CPR est remplacé par un promoteur fort. Ainsi, l'expression de la CPR est augmentée par rapport à la levure sauvage ; la CPR est donc surexprimée dans la levure modifiée.

Dans un mode de réalisation particulier, la F3'H et la CPR proviennent de la même origine, la même espèce.

FNS : Flavone synthase

La diosmétine peut être produite à partir de la lutéoline. Elle peut également être obtenue à partir de l'ériodictyol, soit en le transformant en lutéoline puis en préparant la diosmétine à partir de la lutéoline, soit en le transformant en hespérétine puis en préparant la diosmétine à partir de l'hespérétine. L'enzyme capable de transformer l'ériodictyol en lutéoline et/ou l'hespérétine en diosmétine est une flavone synthase (FNS). Dans un mode de réalisation particulier, la flavone synthase est capable également de transformer l'ériodictyol en lutéoline.

Ainsi, le microorganisme peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une flavone synthase, en particulier une flavone synthase capable de produire la lutéoline à partir de l'ériodictyol et/ou la diosmétine à partir de l'hespérétine.

Par « activité flavone synthase » est entendue la transformation d'une flavanone en flavone par une enzyme FNSI (CPR indépendante) ou une FNSII (CPR dépendante).

Pour déterminer s'il y a une activité flavone synthase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro dans le cas de la FNSI d'un mélange composé de l'enzyme flavone synthase (FNSI), d'une flavanone, de 2-oxoglutarate, d’O , dans les conditions optimales (pH, température, ions...) et dans le cas de la FNSII d'un mélange composé de l'enzyme FNSII, d'une flavanone, de NAD(P)FI, d'02, dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de la flavone correspondante à la flavanone est observée en UPLC-MS en comparaison au standard attendu. De préférence, la flavanone est l'ériodictyol ou l'hespérétine et seront transformés respectivement en leur forme flavone c'est-à-dire en lutéoline ou diosmétine. Ainsi, dans un mode de réalisation particulier, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une O-méthyl-transférase (OMT), en particulier capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; et une séquence d'acide nucléique hétérologue codant pour une flavone synthase, en particulier une flavone synthase capable de produire la lutéoline à partir de l'ériodictyol et/ou la diosmétine à partir de l'hespérétine.

De préférence, la flavone synthase est une enzyme provenant de plante, par exemple du genre Aethusa, Angelica, Antirrhinum, Apium, Arabidopsis, Callistephus, Camellia, Conium, Cuminum, Cynara, Dahlia, Dorcoceras, Erythranthe, Lonicera, Medicago, Oryza, Perilla, Petroseiinum, Plectranthus, Populus, Saussurea, Scutellaria ou Zea, en particulier du genre Arabidopsis, Lonicera, Medicago, Oryza, Petroseiinum, Populus ou Zea, notamment d 'Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroseiinum crispum, Populus deltoïdes, Zea mays, Callistephus chinensis, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier d'Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroseiinum crispum, Populus deltoïdes, ou Zea mays, de préférence de Petroselinum crispum, ou du genre Lonicera comme par exemple Lonicera japonica et Lonicera macranthoides.

Dans un mode de réalisation particulier, la flavone synthase (FNS) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase. En particulier, la flavone synthase (FNS) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase. De préférence, la FNS est sélectionnée parmi les enzymes comprenant une séquence choisie parmi la SEQ ID NO: 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

Il existe deux sortes de flavone synthase (FNS) : la flavone synthase 1 (FNSI) et la flavone synthase 2 (FNSII). A partir d'une flavanone et de 2-oxoglutarate, la FNSI est capable de produire la flavone correspondante. L'enzyme FNSI appartient à la classe des EC 1.14.11.22. La FNSII appartient au groupe de P450 et nécessite la présence d'une cytochrome P450 réductase. L'enzyme FNSII appartient à la classe des EC 1.14.13.

Dans un mode de réalisation, la FNS est une flavone synthase de type I. Dans un autre mode de réalisation, la FNS est une flavone synthase de type II. Dans un mode de réalisation supplémentaire, le microorganisme comprend une flavone synthase de type I et une flavone synthase de type II.

Dans un mode de réalisation préféré, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une flavone synthase de type I (FNSI). L'avantage de la FNSI est qu'elle fonctionne sans cytochrome P450 réductase.

La FNSI peut être une flavone synthase de plante comme Petroselinum crispum, Oryza sativa, Populus deltoïdes, Medicago truncatula, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, ou Conium maculatum, en particulier de Petroselinum crispum, Oryza sativa, Populus deltoïdes, Medicago truncatula, de préférence de Petroselinum crispum. La FNSI peut être une enzyme comprenant une séquence choisie parmi les SEQ ID NOs: 37, 101, 111, 115, 117 et 119 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'un de ces séquences et présentant une activité flavone synthase. Dans un aspect particulier, la FNSI peut être une enzyme comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

Par exemple, la FNSI peut être de Petroselinum crispum. Elle est décrite dans la base de données Genbank de NCBI sous le numéro AY817680.1 pour la séquence nucléique et sous le numéro AAX21541.1 pour la séquence protéique. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q7XZQ8. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 37 et 38, respectivement. La FNSI peut également être d’Angelica archangelica. Elle est décrite dans la base de données Genbank de NCBI sous le numéro DQ683352.1 pour la séquence nucléique et sous le numéro ABG78793.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 101 et 102, respectivement.

La FNSI peut également être d’Apium graveolens. Elle est décrite dans la base de données Genbank de NCBI sous le numéro AY817676.1 pour la séquence nucléique et sous le numéro AAX21537.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 111 et 112, respectivement.

La FNSI peut également être de Cuminum cyminum. Elle est décrite dans la base de données Genbank de NCBI sous le numéro DQ683349.1 pour la séquence nucléique et sous le numéro ABG78790.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 115 et 116, respectivement.

La FNSI peut également être d’Aethusa cynapium. Elle est décrite dans la base de données Genbank de NCBI sous le numéro DQ683350.1 pour la séquence nucléique et sous le numéro DQ683350.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 117 et 118, respectivement.

La FNSI peut également être de Conium moculotum. Elle est décrite dans la base de données Genbank de NCBI sous le numéro DQ683354.1 pour la séquence nucléique et sous le numéro ABG78795.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 119 et 120, respectivement. Dans un autre mode de réalisation, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une flavone synthase de type II (FNSII).

La FNSII peut être une flavone synthase de plante, par exemple d’Arabidopsis thaliana, Zea mays, du genre Lonicera comme par exemple Lonicera japonica et Lonicera mocronthoides, Callistephus chinensis, Medicago truncatula, Camellia sinensis, Cynara cordunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier une flavone synthase d'Arabidopsis thaliana, Zea mays ou du genre Lonicera comme par exemple Lonicera japonica et Lonicera macranthoides. Dans un mode de réalisation particulier, la flavone synthase (FNSII) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 103, 105, 107, 109, 113, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33 et 35 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase.

Dans un mode de réalisation, la flavone synthase FNS est une FNSII provenant de Lonicera japonica. Dans ce mode de réalisation, l'enzyme peut être une enzyme décrite dans la base de données Genbank de NCBI sous le numéro KU127576.1 pour la séquence nucléique et sous le numéro AMQ91109.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 34 et 33, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Lonicera macranthoides. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KU127580.1 et AMQ91113.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 36 et 35, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Cynara cardunculus var scolymus. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence JN825735.1 et AFG31000.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 104 et 103, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Perilla frutescens var crispa. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB045592.1 et BAB59004.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 106 et 105, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Dahlia pinnata. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB769842.1 et BAM72335.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 108 et 107, respectivement. Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Callistephus chinensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AF188612.1 et AAF04115.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 110 et 109, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Medicago truncatula. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence DQ354373.1 et ABC86159.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 114 et 113, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Camellia sinensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence FJ169499.1 et ACH99109.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 122 et 121, respectivement. Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Saussurea médusa. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KF170286.1 et AGV40781.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 124 et 123, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Plectranthus barbatus. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KF606861.1 et AHJ89438.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 126 et 125, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Scutellaria baicalensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KT963454.1 et AMW91729.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 128 et 127, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Dorcoceras hygrometricum. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KV013332.1 et KZV23934.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 130 et 129, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Antirrhinum majus. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB028151.1 et BAA84071.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 132 et 131, respectivement.

Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Erythranthe lewisii. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KX710102.1 et AOR81894.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 134 et 133, respectivement.

Dans un mode de réalisation particulier, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une flavone synthase de type II (FNSII) et une flavone synthase de type I, par exemple une séquence choisie parmi SEQ ID NOs: 33, 35, 103, 105, 107, 109, 113, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase et une enzyme comprenant une séquence choisie parmi SEQ ID NO: 37, 101, 111, 115, 117 et 119 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité flavone synthase, de préférence une séquence choisie parmi SEQ ID NOs: 33 et 35 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase et une enzyme comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

Les FNS de type II, FNSII, nécessite la présence d'une cytochrome P450 réductase (CPR). Si le microorganisme ne comprend pas de cytochrome P450 réductase, il sera donc nécessaire d'introduire une cytochrome P450 réductase hétérologue. Si le microorganisme en comprend déjà une, il est possible d'envisager soit la surexpression d'une cytochrome P450 réductase endogène (par exemple en remplaçant le promoteur par un promoteur fort ou en ajoutant une ou plusieurs copies de la séquence codante) ou d'en introduire également une cytochrome P450 réductase hétérologue.

Dans un mode de réalisation particulier, la FNS de type II et la CPR proviennent de la même origine, la même espèce.

Combinaison d'enzymes

Ainsi, le microorganisme comprend de préférence les enzymes permettant la production de l'hespéritine et/ou la diosmétine à partir de la naringénine et/ou de l'apigénine.

Dans un premier mode de réalisation particulier, le microorganisme recombinant comprend :

une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; en particulier capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, et Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7, 11, 17 et 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, en particulier une F3'H comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7 , 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavonoïde 3'-monooxygénase ;

facultativement, une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaüana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ;

une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT d’Arabidopsis thaiiana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O- méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence sélectionnée parmi l'enzyme comprenant une séquence SEQ ID NO 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase ; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) capable de produire une flavone à partir d'une flavanone, en particulier capable de transformer la naringénine en apigénine, et/ou l'ériodictyol en lutéoline, de préférence de transformer l'ériodictyol en lutéoline ; de préférence une FNS d’Arabidopsis thaiiana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, et Petroselinum crispum ; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

Dans un autre mode de réalisation particulier, le microorganisme recombinant comprend : une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence d’Arabidopsis thaliana, Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis ou Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 et 95 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 7, 11, 17 et 95 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, et de manière très particulière une F3'H comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'- monooxygénase; une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT de Citrus clementina, Citrus sinensis, d’Arabidopsis thaüana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91, 93, 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière particulière parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) capable de produire une flavone à partir d'une flavanone, en particulier capable de transformer la naringénine en apigénine, et/ou l'ériodictyol en lutéoline, de préférence de transformer l'ériodictyol en lutéoline ; de préférence une FNS d’Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, Zea mays, Callistephus chinensis, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cordunculus var scolymus, Saussurea medusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum , Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier d’Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, ou Petroselinum crispum; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

Dans un autre mode de réalisation particulier, le microorganisme recombinant comprend : une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; en particulier capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis ou Pilosella officinarum, en particulier de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis ou Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'- monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7, 11, 17 et 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'- monooxygénase, en particulier une F3'H comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7, 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavonoïde 3'-monooxygénase ;

une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ; une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT d’Arabidopsis thaliana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O- méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence sélectionnée parmi l'enzyme comprenant une séquence SEQ ID NO 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase ; et une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) capable de produire une flavone à partir d'une flavanone, en particulier capable de transformer la naringénine en apigénine, et/ou l'ériodictyol en lutéoline, de préférence de transformer l'ériodictyol en lutéoline ; de préférence une FNS d’Arabidopsis thaüana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, Zea mays, Callistephus chinensis, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cordunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum , Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier d’Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes ou Zea mays de préférence de Lonicera japonica, Lonicera macranthoides, et Petroselinum crispum; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

Dans un autre mode de réalisation particulier, le microorganisme recombinant comprend :

- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7 , 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'- monooxygénase ; et

une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT de Citrus clementina, Citrus sinensis, d’Arabidopsis thaüana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91, 93, 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière très particulière une CPR comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité cytochrome P450 réductase ; et facultativement, une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

Dans un autre mode de réalisation particulier, le microorganisme recombinant comprend :

une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'- monooxygénase ; et

une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT de Citrus clementina, Citrus sinensis, d’Arabidopsis thaüana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91, 93, 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière très particulière une CPR comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité cytochrome P450 réductase ; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

Dans un autre mode de réalisation particulier, le microorganisme recombinant comprend en outre une séquence d'acide nucléique hétérologue ou endogène codant pour une S- adénosylméthionine synthétase (SAMT), en particulier de Saccharomyces cerevisiae, par exemple une SAMT comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité S-adénosylméthionine synthétase.

Chaque enzyme peut être choisie parmi les enzymes décrites ci-dessus.

Jusqu'à Naringénine et Apigénine

Différentes voies de biosynthèses de naringénine et de l'apigénine sont connues dans les plantes, en particulier à partir du glucose, de la tyrosine ou de la phénylalanine. Des microorganismes, notamment E. coli et Saccharomyces cerevisiae, ont été modifiés pour produire de la naringénine et/ou et de l'apigénine (Hwang El, et al. 2003. Appl Environ Microbiol. 2003, 69(5):2699-2706; Jiang Hl, et al. 2005. Appl Environ Microbiol. 2005, 71(6):2962-9 ; Pandey et al, 2016, Biotechnol Adv., 34, 634-662).

Par exemple, la voie de biosynthèse de la naringénine et de l'apigénine peut être celle décrite dans la Figure 1.

Dans un premier mode de réalisation, le microorganisme comprend les enzymes nécessaires pour la synthèse de la naringénine et/ou de l'apigénine à partir de la tyrosine. Dans un deuxième mode de réalisation, le microorganisme comprend les enzymes nécessaires pour la synthèse de la naringénine et/ou de l'apigénine à partir de la phénylalanine.

Dans un troisième mode de réalisation, le microorganisme comprend les enzymes nécessaires pour la synthèse de la naringénine et/ou de l'apigénine à partir de la tyrosine et de la phénylalanine.

TAL : Tyrosine ammonia lyase

La TAL est une tyrosine ammonia lyase. Cette enzyme est capable de produire de l'acide p- coumarique à partir de la tyrosine. Cette enzyme appartient à la classe des EC 4.3.1.23.

Par « activité phénylalanine ammonia lyase » est entendue la transformation de la Phénylalanine en acide frans-cinnamique par une enzyme Phénylalanine ammonia lyase. Pour déterminer s'il y a une activité phénylalanine ammonia lyase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme phénylalanine ammonia lyase et de phénylalanine dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide trans- cinnamique est observée en UPLC-MS en comparaison au standard attendu.

Une tyrosine ammonia lyase (TAL) peut présenter en outre une activité phénylalanine ammonia lyase (PAL) telle que définie ci-dessus et/ou une activité dihydroxyphénylalanine ammonia-lyase (DAL).

Le microorganisme peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase.

De préférence, cette enzyme est une enzyme produite par une bactérie du genre Rhodobacter ou une bactérie du genre Flavobacteriaceae. Dans un mode de réalisation particulier, cette enzyme est produite par une bactérie Rhodobacter capsuiatus, ou Rhodobacter sphaeroides. Dans un autre mode de réalisation particulier, cette enzyme est produite par une bactérie Flavobacterium johnsoniae. Dans un autre mode de réalisation, cette enzyme est une enzyme produite par une levure, en particulier une levure du genre Rhodotorula, par exemple Rhodotorula glutinis. D'autres organismes produisent également une telle enzyme, par exemple Camellia sinensis, Fragaria x ananassa, Ralstonia metallidurans, ou Zea mays.

Dans un mode de réalisation particulier, la tyrosine ammonia lyase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase.

Dans un mode de réalisation particulièr, la TAL est de Flavobacterium johnsoniae. Elle est décrite dans la base de données Genbank de NCBI sous le numéro KR095306.1 pour la séquence nucléique et sous le numéro AKE50827.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos :40 et 39.

Dans un mode de réalisation particulier préféré, la TAL est de Rhodotorula glutinis. Elle est décrite dans la base de données Genbank de NCBI sous le numéro KF765779.1 pour la séquence nucléique et sous le numéro AGZ04575.1 pou r la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 42 et 41, respectivement.

Dans un mode de réalisation particulièrement préféré, la tyrosine ammonia lyase est sélectionnée parmi l'enzyme comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase.

4CL : 4-Coumarate-CoA ligase

La 4CL est une 4-coumarate-CoA ligase. Cette enzyme est capable de produire du 4- coumaroyl-CoA à partir de l'acide p-coumarique et de Coenzyme A et de produire du caffeoyl-CoA à partir de l'acide caféique et de Coenzyme A. Cette enzyme appartient à la classe des EC 6.2.1.12.

Par « activité 4-coumarate CoA ligase » est entendue la transformation de l'acide p- coumarique en p-coumaroyl CoA ou de l'acide caféique en caffeoyl CoA par une enzyme 4- coumarate CoA ligase. Pour déterminer s'il y a une activité 4-coumarate CoA ligase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme 4-coumarate CoA ligase, d'acide p-coumarique ou d'acide caféique, d'ATP et de CoA dans les conditions optimales (pH, température, ions...)· Après un certain temps d'incubation, l'apparition du p-coumaroyl CoA ou du caffeoyl CoA est observée au s pectro photo mètre UV avec une longueur d'onde respectivement de 333 nm et de 346 nm en comparaison au standard attendu.

Le microorganisme peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une 4-coumarate-CoA ligase.

De préférence, cette enzyme est une enzyme produite par une plante, par exemple Abies, Arabidopsis, Agastache, Amorpha, Brassica, Citrus, Cathaya, Cedrus, Crocus, Larix, Festuca, Glycine, Jugions, Keteleeria, Lithospermum, Lolium, Lotus, Lycopersicon, Malus, Medicago, Mesembryanthemum, Nicotiana, Nothotsuga, Oryza, Phaseolus, Pélargonium, Petroselinum, Physcomitrella, Picea, Prunus, Pseudolarix, Pseudotsuga, Rosa, Rubus, Ryza, Saccharum, Suaeda, Pinus, Populus, Solanum, Thellungiella, Triticum, Tsuga, Vitis ou Zea. De manière alternative, cette enzyme est une enzyme produite par un microorganisme, par exemple Aspergillus, Mycosphaerella, Mycobacterium, Neisseria, Neurospora, Streptomyces, Rhodobacter ou Yarrowia.

Dans une mode de réalisation préféré, cette enzyme est une enzyme produite par une plante, de préférence Arabidopsis thaliana, Citrus clementina ou Petroselinum crispum, en particulier Arabidopsis thaliana ou Petroselinum crispum, ou par une bactérie, de préférence du genre Streptomyces, en particulier Streptomyces clavuligerus.

Dans un mode de réalisation particulier, la 4-coumarate-CoA ligase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 43, 45, 47, 49, 97 et 99 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate- CoA ligase.

Dans un autre mode de réalisation particulier, la 4-coumarate-CoA ligase est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 43, 45, 47 et 49, de préférence SEQ ID NOs: 45 et 49, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase.

Dans un premier mode de réalisation particulier, la 4CL est d 'Arabidopsis thaliana. Elle est décrite dans la base de données Genbank de NCBI sous le numéro AY099747.1 pour la séquence nucléique et sous le numéro AAM20598.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID NOs :44 et 43, respectivement.

Dans un deuxième mode de réalisation particulier, la 4CL est de Petroselinum crispum. Elle est décrite dans la base de données Genbank de NCBI sous le numéro X13324.1 ou X13325.1 pour la séquence nucléique et sous le numéro CAA31696.1 ou CAA31697.1 pour la séquence protéique, respectivement. Les protéines sont décrites dans UniProtKB/Swiss Prot sous le numéro de référence P14912 et P14913, respectivement, et plus particulièrement dans les SEQ ID NOs :46 et 45, et 48 et 47, respectivement. De préférence, la 4CL est de Petroselinum crispum et est décrite dans la base de données Genbank de NCBI sous le numéro X13324.1 pour la séquence nucléique et sous le numéro CAA31696.1 pour la séquence protéique, et dans UniProtKB/Swiss Prot sous le numéro de référence P14912, et plus particulièrement dans les SEQ ID NOs :46 et 45, respectivement.

Dans un troisième mode de réalisation particulier, la 4CL est de Streptomyces clavuligerus. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CP016559.1 pour la séquence nucléique et sous le numéro ANW18832.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID NOs :50 et 49, respectivement.

Dans un quatrième mode de réalisation particulier, la 4CL est de Citrus clementino. Une séquence nucléotidique ainsi que la séquence protéique de cette enzyme sont décrites respectivement dans les SEQ ID NO : 100 et 99.

Dans un cinquième mode de réalisation particulier, la 4CL est d’Arabidopsis thaiiana et une séquence nucléotidique ainsi que la séquence protéique de cette enzyme sont décrites respectivement dans les SEQ ID NO : 98 et 97.

Dans un mode de réalisation préféré, la 4CL est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 45, 97 et 99, de préférence SEQ ID NOs: 97 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate- CoA ligase. De manière tout particulièrement préférée, la 4CL est une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase. CHS : Chalcone synthase

La CHS est une chalcone synthase. Cette enzyme est capable de produire de la naringénine- chalcone à partir du 4-coumaroyl-CoA et de malonyl-CoA et de produire de l'ériodictyol- chalcone à partir de caffeoyl-CoA et de malonyl-CoA. Cette enzyme appartient à la classe des EC 2.3.1.74.

Par « activité chalcone synthase » est entendue la transformation de p-coumaroyl-CoA et de malonyl-CoA en naringénine chalcone ou de caffeoyl-CoA et de malonyl-CoA en ériodictyol chalcone par une enzyme chalcone synthase. Pour déterminer s'il y a une activité chalcone synthase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme Chalcone synthase, de p- coumaroyl-CoA ou de caffeoyl-CoA et de malonyl-CoA dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition respectivement de la Naringénine chalcone ou de l'ériodictyol chalcone est observée en HPLC-MS en comparaison au standard attendu.

Le microorganisme comprend donc une séquence d'acide nucléique hétérologue codant pour une Chalcone synthase.

Cette enzyme peut être une enzyme produite par une plante, notamment du genre Arabidopsis, Avena, Cosmos, Citrus, Daucus, Fagopyrum, Freesia, Glycine, Glycyrrhiza, Flumulus, Hypericum, Flordeum, Jugions, Medicago, Phoseolus, Physcomitrella, Plagiochasma, Petroseiinum, Pueraria, Rubus, Secaie, Scuteiiaria, Silene, Sinapis, Spinacia, Steiiaria, Triticum, Tulipa, Verbena, Vitis, ou Xanthisma, par exemple Arabidopsis thaliana, Avena sativa, Cosmos sulphureus, Citrus sinensis, Daucus carota, Fagopyrum esculentum, Freesia hybrid cultivor, Glycine max, Glycyrrhiza echinoto, Flumulus lupulus, Hypericum androsaemum, Hordeum vulgare, Jugions sp., Medicago sativa, Phaseolus vulgaris, Physcomitrella patens, Plagiochasma appendiculatum, Petroseiinum crispum, Pueraria montana var. lobata, Rubus idaeus, Secaie cereale, Scuteiiaria baicalensis, Silene sp., Sinapis olbo, Spinacia oleracea, Steiiaria longipes, Triticum aestivum, Tulipa hybrid cultivor, Verbena sp., Vitis vinifera, ou Xanthisma gracile.

De préférence, cette enzyme est une enzyme produite par une plante, par exemple du genre Citrus, en particuliers Citrus sinensis, ou de Hordeum vulgare ou par une bactérie, de préférence du genre Streptomyces, en particulier Streptomyces clavuligerus. Dans un mode de réalisation particulier, la chalcone synthase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 51, 53, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 53 et 55 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase.

Dans un mode de réalisation particulièrement préféré, la chalcone synthase est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase.

Dans un premier mode de réalisation particulier, la CHS est de Hordeum vulgare. Elle est décrite dans la base de données Genbank de NCBI sous le numéro Y09233.1 pour la séquence nucléique et sous le numéro CAA70435.1 pou r la séquence protéique, et plus particulièrement dans les SEQ ID NOs : 52 et 51, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q96562.

Dans un deuxième mode de réalisation particulier, la CHS est de Citrus sinensis. Elle est décrite dans la base de données Genbank de NCBI sous le numéro AB009351.1 pour la séquence nucléique et sous le numéro BAA81664.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID NOs : 54 et 53, respectivement.

Dans un troisième mode de réalisation particulier, la CHS est de Citrus sinensis. Elle est décrite dans la base de données Genbank de NCBI sous le numéro XM_006489733.1 pour la séquence nucléique et sous le numéro XP_006489796.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID NOs : 56 et 55, respectivement.

Dans un quatrième mode de réalisation particulier, la CHS est d e Streptomyces clavuligerus. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CP016559.1 pour la séquence nucléique et sous le numéro ANW16917.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID NOs : 58 et 57, respectivement.

La réaction catalysée par la chalcone synthase nécessitant la présence de malonyl-CoA, le microorganisme peut être modifié pour augmenter la synthèse de malonyl-CoA. CHI : Chalcone isomérase

La CHI est une chalcone isomérase. Elle est capable de produire la naringénine à partir de la Naringénine chalcone et de produire de l'eriodictyol à partir d'ériodictyol chalcone. Cette enzyme appartient à la classe des EC 5.5.1.6.

Par « activité Chalcone isomérase » est entendue la transformation de naringénine chalcone ou d'ériodictyol chalcone en naringénine ou ériodictyol par une enzyme chalcone isomérase. Pour déterminer s'il y a une activité Chalcone isomérase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme Chalcone isomérase, de naringénine chalcone ou d'ériodictyol chalcone dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition respectivement de la Naringénine ou de l'ériodictyol est observée en H PLC-MS en comparaison au standard attendu.

Le microorganisme comprend donc une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase.

Cette enzyme peut provenir d'une plante, notamment du genre Arabidopsis, Ginkgo, Oncidium, Perilla, Citrus ou Trigonella, par exemple Arabidopsis thaiiana, Ginkgo biloba, Oncidium Gower Ramsey, Perilla frutescens, Citrus Sinensis ou Trigonella foenum-graecum. De préférence, cette enzyme est une enzyme produite par une plante, par exemple Arabidopsis thaiiana ou par une bactérie, de préférence du genre Streptomyces, en particulier Streptomyces clavuligerus.

Dans un mode de réalisation particulier, la chalcone isomérase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 59 et 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase.

Dans un mode de réalisation préféré, la chalcone isomérase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase.

Dans un premier mode de réalisation particulier, la CH I est de Streptomyces clavuligerus. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CP016559.1 pour la séquence nucléique et sous le numéro ANW16918.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID NOs : 60 et 59, respectivement. Dans un deuxième mode de réalisation particulier, la CHI est d’Arabidopsis thaliana. Elle est décrite dans la base de données Genbank de NCBI sous le numéro NM_115370.4 pour la séquence nucléique et sous le numéro NP_191072.1pour la séquence protéique, et plus particulièrement dans les SEQ ID NOs : 62 et 61, respectivement.

FNS: Flavone synthase

L'apigénine peut être préparée à partir de la naringénine à l'aide d'une flavone synthase (FNS). Elle est capable de produire de l'apigénine à partir de la naringénine.

Le microorganisme peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une flavone synthase, en particulier capable de produire de l'apigénine à partir de la naringénine et/ou une séquence d'acide nucléique hétérologue codant pour une flavone synthase, en particulier capable de produire de la lutéoline à partir d'ériodictyol, et/ou une séquence d'acide nucléique hétérologue codant pour une flavone synthase, en particulier capable de produire la diosmétine à partir de l'hespérétine.

La FNS peut être choisie parmi celles décrites précédemment.

A partir de la phénylalanine

Alternativement ou en complément, le microorganisme peut également comprendre les enzymes nécessaires pour la synthèse de l'acide p-coumarique à partir de la phénylalanine. Dans ce contexte, le microorganisme peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H). La PAL appartient à la classe des EC 4.3.1.24. Elle est capable de produire de l'acide cinnamique à partir de la phénylalanine.

Par « activité phénylalanine ammonia lyase » est entendue la transformation de la Phénylalanine en acide frans-cinnamique par une enzyme Phénylalanine ammonia lyase. Pour déterminer s'il y a une activité phénylalanine ammonia lyase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme phénylalanine ammonia lyase et de phénylalanine dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide trans- cinnamique est observée en UPLC-MS en comparaison au standard attendu.

Plusieurs enzymes ont déjà été décrites dans l'art antérieur. De préférence, l'enzyme provient d'une plante, par exemple une plante du genre Arabidopsis, Agastache, Ananas, Asparagus, Brassica, Bromheadia, Bambusa, Beta, Betula, Citrus, Cucumis, Came Ilia, Capsicum, Cassia, Catharanthus, Cicer, Citrullus, Coffea, Cucurbita, Cynodon, Daucus, Dendrobium, Dianthus, Digitalis a Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Lotus, Lycopersicon, Medicago, Malus, Manihot, Medicago, Mesembryanthemum, Nicotiana, Olea, Oryza, Phaseolus, Pinus, Populus, Pisum, Persea, Petroselinum, Phalaenopsis, Phyllostachys, Physcomitrella, Picea, Pyrus, Prunus, Quercus, Raphanus, Rehmannia, Rubus, Solanum, Sorghum, Sphenostylis, Stellaria, Stylosanthes, Triticum, Trifolium, Vaccinium, Vigna, Vitis, Zea, ou Zinnia. Par exemple, on peut citer celles d’Arabidopsis thaliana ou de Petroselinum crispum.

En outre, la phénylalanine ammonia lyase (PAL) peut présenter en outre une activité tyrosine ammonia lyase (TAL) et/ou une activité dihydroxyphénylalanine ammonia-lyase (DAL) telle que décrite ci-dessous.

Dans un mode de réalisation préféré, la PAL est de Citrus sinensis.

Dans un mode de réalisation particulier, la phénylalanine ammonia lyase (PAL) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase.

Dans un mode de réalisation préféré, la PAL est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 65 et 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase. De manière tout particulièrement préférée, la PAL est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité phénylalanine ammonia lyase.

Dans un mode de réalisation particulier, la PAL de Citrus sinensis est décrite dans la base de données Genbank de NCBI sous le numéro XM_006481431.2 pour la séquence nucléique et sous le numéro XP_006481494.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 64 et 63, respectivement.

Dans un autre mode de réalisation particulier, la PAL de Citrus sinensis est décrite dans la base de données Genbank de NCBI sous le numéro XM_006488000.2 pour la séquence nucléique et sous le numéro XP_006488063.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID NOs : 66 et 65, respectivement.

Dans un autre mode de réalisation particulier, la PAL d’Arabidopsis thaliana est décrite dans la base de données Genbank de NCBI sous le numéro NM_115186.4 pour la séquence nucléique et sous le numéro N P_190894.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID NOs : 78 et 77, respectivement.

Éventuellement, si la biosynthèse à partir de la tyrosine et de la phénylalanine est envisagée, la PAL et la TAL peuvent être remplacées ou complétées par une phénylalanine/tyrosine ammonia lyase (PTAL). La PTAL appartient à la classe des EC 4.3.1.25.

La C4H appartient à la classe des EC 1.14.13.11. Elle est capable de produire de l'acide p- coumarique à partir de l'acide cinnamique.

Par « activité trans-cinnamate 4-monooxygénase » est entendue la transformation de l'acide trans-cinnamique en acide p-coumarique par une enzyme trans-cinnamate 4- monooxygénase (CPR dépendante). Pour déterminer s'il y a une activité trans-cinnamate 4-monooxygénase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme trans-cinnamate 4-monooxygénase, d'acide cinnamique, de NADPH, d'H + et d'Ü2 dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de 4-hydroxycinnamate (acide p- coumarique) est observée en UPLC-MS en comparaison au standard attendu.

Plusieurs enzymes ont déjà été décrites dans l'art antérieur. De préférence, l'enzyme provient d'une plante, par exemple une plante du genre Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Physcomitreila , Phoseolus, Pinus, Populus, Ruta, Saccharum, Solanum, Vitis, Vigna ou Zea.

Dans un mode de réalisation préféré, la cinnamate 4-hydroxylase (C4H) est de Citrus sinensis ou d’Arabidopsis thaliana.

Dans un mode de réalisation particulier, la cinnamate 4-hydroxylase (C4H) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4- hydroxylase. Dans un mode de réalisation préféré, la C4H est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase.

Dans un mode de réalisation particulier, la C4H de Citrus sinensis est décrite dans la base de données Genbank de NCBI sous le numéro NM_001288840.1 pour la séquence nucléique et sous le numéro NP_001275769.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 68 et 67, respectivement.

Dans un autre mode de réalisation particulier, la C4H de Citrus sinensis est décrite dans la base de données Genbank de NCBI sous le numéro NM_001288895.1 pour la séquence nucléique et sous le numéro NP_001275824.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 70 et 69, respectivement.

Dans un autre mode de réalisation particulier, la C4H d’Arabidopsis thaiiana est décrite dans la base de données Genbank de NCBI sous le numéro NM_128601.3 pour la séquence nucléique et sous le numéro N P_180607.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 80 et 79, respectivement.

En passant par l'acide caféique

Dans un mode de réalisation supplémentaire, la biosynthèse de l'ériodictyol peut également comprendre la synthèse de la L-DOPA (3,4-dihydroxy-L-phenylalanine) à partir de la tyrosine puis de l'acide caféique à partir de la L-DOPA (3,4-dihydroxy-L- phenylalanine). Pour cela, les enzymes suivantes sont nécessaires. Pour convertir la tyrosine en L-DOPA (3,4-dihydroxy-L-phenylalanine), deux sous-unités sont nécessaires, HpaB et HpaC.

La HpaB est une sous-unité 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB). De préférence, cette enzyme est une enzyme produite par une bactérie, de préférence Escherichia coli.

Dans un mode de réalisation particulier, la 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase. Dans un mode de réalisation particulier, la HpaB est de Escherichia coli. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CAQ34705.1 pour la séquence protéique, et plus particulièrement dans la séquence SEQ ID No : 83. Une séquence nucléique codant pour cette enzyme est décrite dans la séquence SEQ ID No : 84. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence A0A140NG21. La HpaC est une sous-unité 4-hydroxyphénylacetate 3-monooxygénase réductase. Le microorganisme peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC). Par « activité p-coumarate 3 hydroxylase » est entendue la transformation de l'acide p- coumarique en acide caféique et/ou de la L-tyrosine en L-Dopa en utilisant un complexe enzymatique composé de HpaB (4-hydroxyphenylacetate 3-hydroxylase oxydase) et de HpaC (4-hydroxyphenylacetate 3-hydroxylase réductase). Pour déterminer s'il y a une activité p-coumarate 3 hydroxylase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé des enzymes HpaB, HpaC, d'acide p- coumarique ou de L-Tyrosine, de FAD et de NADH dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide caféique ou de la L-Dopa est observée en HPLC-MS en comparaison au standard attendu.

De préférence, cette enzyme est une enzyme produite par une bactérie, de préférence Escherichia coli.

Dans un mode de réalisation particulier, la 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 85 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase.

Dans un mode de réalisation particulier, la HpaC est de Escherichia coli. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CAQ34704.1 pour la séquence protéique, et plus particulièrement dans la séquence SEQ ID No : 85. Une séquence nucléique codant pour cette enzyme est décrite dans la séquence SEQ ID No : 86. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence A0A140NG67. Ensemble, la HpaB et la HpaC sont capables de produire de la L-DOPA (3,4-dihydroxy-L- phenylalanine) à partir de la tyrosine. Ainsi, le microorganisme peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB) et une séquence d'acide nucléique hétérologue codant pour 4- hydroxyphénylacetate 3-monooxygénase réductase (HpaC).

Par ailleurs, cette voie nécessite également la présence d'une enzyme capable de synthétiser l'acide caféique à partir de la L-DOPA (3,4-dihydroxy-L-phenylalanine), une dihydroxyphénylalanine ammonia-lyase (DAL). Cette enzyme appartient à la classe des EC 4.3.1.11.

Par « activité dihydroxyphénylalanine ammonia lyase » est entendue la transformation de la L-Dopa en acide frans-caféique par une enzyme dihydroxyphénylalanine ammonia lyase. Pour déterminer s'il y a une activité dihydroxyphénylalanine ammonia lyase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme dihydroxyphénylalanine ammonia lyase et de L-dopa (levodopa) dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide frans-caféique est observée en UPLC-MS en comparaison au standard attendu,.

En outre, la dihydroxyphénylalanine ammonia-lyase (DAL) peut présenter en outre une activité tyrosine ammonia lyase (TAL) et/ou une activité phénylalanine ammonia lyase (PAL).

Le microorganisme peut ainsi comprendre une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), une séquence d'acide nucléique hétérologue codant pour une sous-unité 4- hydroxyphénylacetate 3-monooxygénase réductase (HpaC) et une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL).

De manière alternative à l'utilisation des HpaB et HpaC ou en combinaison avec celles-ci, il est possible d'utiliser une enzyme permettant de convertir la tyrosine en L-Dopa et une enzyme permettant de convertir l'acide p-coumarique en acide caféique.

Il s'agit respectivement d'une 4-méthoxybenzoate O-déméthylase, également appelée 4- méthoxybenzoate monooxygénase (O-déméthylant) qui possède l'activité L-tyrosine hydroxylase appartenant à la classe des EC 1.14.99.15 et d'une p-coumarate-3-hydroxylase possédant l'activité p-coumarate 3 hydroxylase appartenant à la classe des EC 1.14.13.

Ces différentes enzymes font toutes deux partie de la famille des cytochrome P450 (CYP). Par « activité L-tyrosine hydroxylase » est entendue la transformation de l'acide p- coumarique en acide caféique et/ou de la L-tyrosine en L-Dopa en utilisant une enzyme p- coumarate 3 hydroxylase (CPR dépendante). Pour déterminer s'il y a une activité L-tyrosine hydroxylase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme p-coumarate 3 hydroxylase, d'acide p-coumarique ou de L-Tyrosine, les co-facteurs nécessaires dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide caféique ou de la L- Dopa est observée en HPLC-MS en comparaison au standard attendu.

Par « activité p-coumarate 3 hydroxylase » est entendue la transformation de l'acide p- coumarique en acide caféique et/ou de la L-tyrosine en L-Dopa en utilisant une enzyme p- coumarate 3 hydroxylase (CPR dépendante). Pour déterminer s'il y a une activité p- coumarate 3 hydroxylase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme p-coumarate 3 hydroxylase, d'acide p-coumarique ou de L-Tyrosine, dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide caféique ou de la L- Dopa est observée en HPLC-MS en comparaison au standard attendu.

Le microorganisme recombinant peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase (CYP) capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique.

Dans un mode de réalisation, la 4-méthoxybenzoate O-déméthylase est une enzyme de bactérie, notamment de Rhodopseudomonas paiustris, Pseudomonas putida, ou Escherichia coli, de plante, notamment de Beta vuigaris, de mammifère, notamment d’Oryctolagus cuniculus, ou de champignon, notamment de Rhodotorula glutinis. Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase est une enzyme de Rhodopseudomonas paiustris, de Saccharothrix espanaensis, ou de Beta vuigaris.

Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité L-tyrosine hydrolase.

La 4-méthoxybenzoate O-déméthylase peut également être de Beta vuigaris. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans dans les SEQ ID Nos : 74 et 73, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence P0DKI2.

En outre, la 4-méthoxybenzoate O-déméthylase peut être de Saccharothrix espanaensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence NC_005296.1 et WP_011157377.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 76 et 75. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q6N8N2.

Dans un mode de réalisation, le microorganisme peut comprendre une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase et une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL).

Le microorganisme recombinant peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une coumarate 3-hydroxylase (Coum3H) capable de convertir l'acide p-coumarique en acide caféique.

Dans un mode de réalisation, la coumarate 3-hydroxylase est une enzyme de bactérie, notamment de Saccharothrix.

Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase est sélectionnée l'enzyme comprenant une séquence choisie parmi SEQ ID NOs: 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité coumarate 3- hydroxylase.

La séquence nucléique codant cette enzyme et séquence protéique est décrite dans NCBI sous les numéros de référence DQ357071.1 et ABC88666.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 72 et 71.

Dans un mode de réalisation, le microorganisme peut comprendre une séquence d'acide nucléique hétérologue codant pour une coumarate 3-hydroxylase et une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL). Combinaisons d'enzymes supplémentaires

Ainsi, outre les enzymes nécessaires à la biosynthèse de l'ériodictyol et/ou la lutéoline à partir de la naringénine et/ou de l'apigénine telles que décrites précédemment, le microorganisme comprend de préférence les enzymes permettant la production de la naringénine et/ou de l'apigénine à partir de la tyrosine et/ou de la phénylalanine, de préférence à partir de la tyrosine.

Ainsi, selon des modes de réalisation particuliers, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4', une séquence d'acide nucléique hétérologue codant pour une enzyme F3'H, et optionnellement une séquence d'acide nucléique hétérologue codant pour une enzyme FNS et une séquence d'acide nucléique hétérologue codant pour une enzyme CPR, et comprend en outre une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) et une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I). Dans une mode de réalisation, le microorganisme comprend

une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 41 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces clavuligerus ; en particulier une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 97, 99, 45, 43, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 97, 99 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase, et

une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 53, 51, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et

une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) d’Arabidopsis thaüana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 61 et 59 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ; de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase .

De préférence, dans ce mode de réalisation, le microorganisme comprend l'une des combinaisons d'enzymes OMT et F3'H, et optionnellement FNS et CPR, décrites plus haut, en particulier :

une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT de Citrus clementina, Citrus sinensis, d’Arabidopsis thaliana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91, 93, 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, et manière tout particulièrement préférée une OMT comprenant une séquence choisie parmi SEQ ID NO: 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase; et - une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'-monooxygénase ; et facultativement, une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière particulière parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, en particulier une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

De préférence, dans ce mode de réalisation, le microorganisme comprend en outre

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate

4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase .

Dans un autre mode de réalisation, le microorganisme comprend :

une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi les SEQ ID NO: 97, 99 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ces séquences et présentant une activité 4- coumarate-CoA ligase de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase ; et

une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisi parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase .

De préférence, dans ce mode de réalisation, le microorganisme comprend l'une des combinaisons d'enzymes OMT et F3'H, et optionnellement FNS et CPR, décrites plus haut, en particulier :

une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT de Citrus clementina, Citrus sinensis, d’Arabidopsis thaliana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91, 93, 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, et manière tout particulièrement préférée une OMT comprenant une séquence choisie parmi SEQ ID NO: 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase; et - une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'- monooxygénase ; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière particulière parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, en particulier pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

De préférence, dans ce mode de réalisation, le microorganisme comprend en outre

une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase.

Dans un autre mode de réalisation particulier, le microorganisme comprend :

une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) capable de produire de l'acide p-coumarique à partir de la tyrosine; de préférence de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

une séquence d'acide nucléique hétérologue codant pour une 4-coumarate-CoA ligase (4CL) capable de produire de le coumaryl-CoA à partir de l'acide p- coumarique et de Coenzyme A ; de préférence d’Arabidopsis thaliana, PetroseUnum crispum ou Streptomyces clavuligerus ; une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 43, 45, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase, et de préférence une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase ; une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) capable de produire de la naringénine-chalcone à partir du 4-coumaroyl-CoA et de malonyl-CoA ; de préférence de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 51, 53, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 53 et 55 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, et de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité chalcone synthase ;

une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) capable de produire la naringénine à partir de la naringénine chalcone ; de préférence d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CH I comprenant une séquence choisie parmi SEQ ID NOs: 59 et 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase, et de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ;

une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, et Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7 , 11, 17 et 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, en particulier une F3'H comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7, 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavonoïde 3'-monooxygénase, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase ;

une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, en particulier une CPR comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité cytochrome P450 réductase ;

une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT d’Arabidopsis thaliana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O- méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence sélectionnée parmi l'enzyme comprenant une séquence SEQ ID NO 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase ;

facultativement, une séquence d'acide nucléique hétérologue ou endogène codant pour une S-adénosylméthionine synthétase (SAMT) ; en particulier de Saccharomyces cerevisiae, par exemple une SAMT comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité S-adénosylméthionine synthétase ; et

facultativement, une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) capable de transformer la naringénine en apigénine, l'ériodictyol en lutéoline et/ou l'hespérétine en diosmétine, de préférence de transformer l'ériodictyol en lutéoline; de préférence une FNS d’Arabidopsis thaüana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, Zea mays, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier d’Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, et Petroselinum crispum ; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase.

Dans un mode de réalisation particulier, le microorganisme comprend les séquences d'acides nucléiques hétérologues codant pour les enzymes 4CL, CHS, CHI, F3'H, CPR, OMT, et facultativement pour les enzymes SAMT et FNS, telles que décrites dans le mode de réalisation précédent et comprend en outre :

une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, en particulier une PAL comprenant une séquence choisie parmi SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité phénylalanine ammonia lyase ; et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase, capables de produire de l'acide p-coumarique à partir de la phénylalanine, en particulier une C4H comprenant une séquence choisie parmi SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase. Dans un autre mode de réalisation particulier, le microorganisme comprend les séquences d'acides nucléiques hétérologues codant pour les enzymes 4CL, CHS, CHI, F3'H, CPR, OMT, et facultativement pour les enzymes SAMT et FNS, telles que décrites dans le mode de réalisation précédent et comprend en outre :

une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL) capable de produire de l'acide caféique à partir de la L-DOPA (3,4-dihydroxy-L-phenylalanine); une séquence d'acide nucléique hétérologue codant pour une sous-unité 4- hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), de préférence comprenant une séquence choisie parmi SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC), de préférence comprenant une séquence choisie parmi SEQ ID NO: 85 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase; ou une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydroxylase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p- coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p-coumarate 3 hydroxylase.

Dans un autre mode de réalisation particulier, le microorganisme comprend les séquences d'acides nucléiques hétérologues codant pour les enzymes 4CL, CHS, CHI, F3'H, CPR, OMT, et facultativement pour les enzymes SAMT et FNS, telles que décrites dans le mode de réalisation précédent et comprend en outre :

une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) capable de produire de l'acide p-coumarique à partir de la tyrosine; de préférence de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

facultativement, une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase, capables de produire de l'acide p-coumarique à partir de la phénylalanine;

facultativement, une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), de préférence comprenant une séquence choisie parmi SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3- monooxygénase réductase (HpaC), de préférence comprenant une séquence choisie parmi SEQ ID NO: 85 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase; ou une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydrolase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p-coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p-coumarate 3 hydroxylase ;

facultativement, une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL) capable de produire de l'acide caféique à partir de la L-DOPA (3,4-dihydroxy-L-phenylalanine).

Dans un autre mode de réalisation particulier, le microorganisme comprend :

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ;

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase ;

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 ou 97 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité 4-coumarate-CoA ligase ;

- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase;

- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ;

- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence a ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase ;

- une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; et

- une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ; et

une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' et comprenant une séquence choisie parmi SEQ ID NOs: 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O- méthyltransférase ,et de préférence une OMT comprenant une séquence choisie parmi SEQ ID NO: 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase.

De préférence, le microorganisme comprend en outre une séquence d'acide nucléique hétérologue ou endogène codant pour une S-adénosylméthionine synthétase (SAMT), en particulier une SAMT comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité S-adénosylméthionine synthétase.

L'origine des enzymes ou d'un ensemble d'enzymes pourra être choisie de sorte à ce que leur origine soit la même ou soit proche. Par exemple, les enzymes ou l'ensemble d'enzymes peuvent être issues de bactéries, par exemple de bactéries du même genre ou de la même espèce. Dans un autre exemple, les enzymes ou l'ensemble d'enzymes peuvent être issues de plantes, par exemple de plantes du même genre ou de la même espèce. En effet, ces origines communes permettent que les enzymes fonctionnent entre elles de manière optimale.

Dans un mode de réalisation, les microorganismes comprennent une voie métabolique de biosynthèse de la tyrosine. Notamment, les microorganismes peuvent avoir été modifiées pour avoir une production augmentée de tyrosine par rapport à une souche sauvage. Notamment, les microorganismes peuvent avoir été modifiées pour que le flux de carbone soit redirigé vers la biosynthèse de tyrosine. En outre, les microorganismes peuvent avoir été modifiées pour réduire ou supprimer les rétro-inhibitions de la biosynthèse de tyrosine. Dans un autre mode de réalisation, les microorganismes comprennent une voie métabolique de biosynthèse de la phénylalanine. Notamment, les microorganismes peuvent avoir été modifiées pour avoir une production augmentée de phénylalanine par rapport à une souche sauvage. Notamment, les microorganismes peuvent avoir été modifiées pour que le flux de carbone soit redirigé vers la biosynthèse de phénylalanine. En outre, les microorganismes peuvent avoir été modifiées pour réduire ou supprimer les rétro-inhibitions de la biosynthèse de phénylalanine.

Dans un autre mode de réalisation, les microorganismes comprennent une voie métabolique de biosynthèse de la phénylalanine et de la tyrosine. Notamment, les microorganismes peuvent avoir été modifiées pour avoir une production augmentée de phénylalanine et de tyrosine par rapport à une souche sauvage. Notamment, les microorganismes peuvent avoir été modifiées pour que le flux de carbone soit redirigé vers la biosynthèse de phénylalanine et de tyrosine. En outre, les microorganismes peuvent avoir été modifiées pour réduire ou supprimer les rétro-inhibitions de la biosynthèse de phénylalanine et de tyrosine. Acide nucléique recombinant et Cassette d'expression

Chaque séquence nucléique codant pour une enzyme telle que décrite précédemment est comprise dans une cassette d'expression. De préférence, les séquences nucléiques codantes ont été optimisées pour l'expression dans le microorganisme hôte. La séquence nucléique codante est liée de manière opérationnelle aux éléments nécessaires à l’expression du gène, notamment à la transcription et traduction. Ces éléments sont choisis de sorte à être fonctionnels dans le microorganisme recombinant hôte. Ces éléments peuvent comporter par exemple des promoteurs de transcription, des activateurs de transcription, des séquences terminatrices, des codons d'initiation et de terminaison. Les méthodes pour sélectionner ces éléments en fonction de la cellule hôte dans laquelle l'expression est souhaitée, sont bien connues de l'homme du métier.

De préférence, le promoteur est un promoteur fort. Le promoteur peut éventuellement être inductible.

Par exemple, si le microorganisme est procaryote, le promoteur peut être sélectionné parmi les promoteurs suivants : Lacl, LacZ, pLacT, ptac, pARA, pBAD, les promoteurs d'ARN polymérase de bactériophage T3 or T7, le promoteur de la polyhèdrine, le promoteur PR ou PL du phage lambda. Dans un mode de réalisation particulier, le promoteur est pLac. Si le microorganisme est eucaryote et en particulier une levure, le promoteur peut être sélectionné parmi les promoteurs suivants : le promoteur pTDH3, le promoteur pTEFl, le promoteur pTEF2, le promoteur pCCW12, le promoteur pHHF2, le promoteur pHTB2 et le promoteur pRPL18B. Des exemples de promoteurs inductibles utilisables chez la levure sont les promoteurs tetO-2, GAL10, GAL10-CYC1, PH05.

Toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ou une combinaison de certaines de celles-ci peuvent être comprises dans un vecteur d'expression commun ou dans différents vecteurs d'expression.

La présente invention est donc relative à un vecteur comprenant une séquence d'acide nucléique codant pour une OMT et au moins une séquence d'acide nucléique choisie parmi : une séquence d'acide nucléique codant pour une F3'H, une séquence d'acide nucléique codant pour une CPR, une séquence d'acide nucléique codant pour une FNS, une séquence d'acide nucléique codant pour une SAMT, une séquence d'acide nucléique codant pour une TAL, une séquence d'acide nucléique codant pour une 4CL, une séquence d'acide nucléique codant pour une CHS, une séquence d'acide nucléique codant pour une CH I, une séquence d'acide nucléique codant pour une PAL, une séquence d'acide nucléique codant pour une C4H, une séquence d'acide nucléique codant pour une HpaB, et une séquence d'acide nucléique codant pour une DAL, chacune de ces enzymes étant telles que définies ci-dessus ainsi que leurs combinaisons.

De préférence, le vecteur comprend une séquence d'acide nucléique codant pour une OMT et au moins une séquence d'acide nucléique choisie parmi : une séquence d'acide nucléique codant pour une F3'H une séquence d'acide nucléique codant pour une CPR, une séquence d'acide nucléique codant pour une FNS, une séquence d'acide nucléique codant pour une TAL, une séquence d'acide nucléique codant pour une 4CL, une séquence d'acide nucléique codant pour une CHS, une séquence d'acide nucléique codant pour une CHI, et optionnellement une séquence d'acide nucléique codant pour une PAL et une séquence d'acide nucléique codant pour une C4H.

Selon un mode de réalisation, le vecteur comprend

une séquence d'acide nucléique codant pour une O-méthyltransférase (OMT), en particulier capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT d’Arabidopsis thaliana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O- méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence sélectionnée parmi l'enzyme comprenant une séquence SEQ ID NO 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase ; et

au moins une séquence d'acide nucléique choisie parmi :

o une séquence d'acide nucléique codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine ; en particulier capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis ou Pilosella officinarum, en particulier Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis ou Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7 , 9, 11, 13, 15, 17, 19 et 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7, 11, 17 et 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, en particulier une F3'H comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7, 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavonoïde 3'-monooxygénase ;

une séquence d'acide nucléique codant pour une cytochrome P450 réductase ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d'Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23 et 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ;

une séquence d'acide nucléique codant pour une flavone synthase (FNS), en particulier capable de transformer la naringénine en apigénine, l'ériodictyol en lutéoline et/ou l'hespérétine en diosmétine, de préférence de transformer l'ériodictyol en lutéoline; de préférence une FNS d’Arabidopsis thaliana, Petroselinum crispum, Zea mays, Lonicera japonica, Lonicera macranthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cordunculus var scolymus, Saussurea medusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum , Antirrhinum majus, Perillafrutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier d 'Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, et Petroselinum crispum; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase ; de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ;

une séquence d'acide nucléique codant pour une S-adénosylméthionine synthétase (SAMT) ; en particulier de Saccharomyces cerevisiae, par exemple une SAMT comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité S-adénosylméthionine synthétase ;

une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), en particulier capable de produire de l'acide p-coumarique à partir de la tyrosine; de préférence de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

une séquence d'acide nucléique codant pour une 4-coumarate-CoA ligase (4CL), en particulier capable de produire le 4-coumaroyl-CoA à partir de l'acide p-coumarique et de Coenzyme A et le caffeoyl-CoA à partir d'acide caféique et de Coenzyme A; de préférence d’Arabidopsis thaliana, Petroselinum crispum ou Streptomyces clavuligerus ; une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 43, 45, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 45, 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ;

une séquence d'acide nucléique codant pour une chalcone synthase (CHS), en particulier capable de produire de la naringénine-chalcone à partir du 4- coumaroyl-CoA et de malonyl-CoA et de l'ériodictyol-chalcone à partir de caffeoyl-CoA et de malonyl-CoA; de préférence de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 51, 53, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 53 et 55 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase ; de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité chalcone synthase;

une séquence d'acide nucléique codant pour une chalcone isomérase (CH I), en particulier capable de produire la naringénine à partir de la naringénine chalcone et de l'ériodictyol à partir de l'ériodictyol-chalcone ; de préférence d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 59 et 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ;

une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), en particulier capable de produire de l'acide cinnamique à partir de la phénylalanine, de préférence une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase ;

une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H), en particulier capable de produire de l'acide p-coumarique à partir de l'acide cinnamique, de préférence une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4- hydroxylase ;

une séquence d'acide nucléique codant pour une sous-unité 4- hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), de préférence comprenant une séquence de SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et une séquence d'acide nucléique codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC), de préférence comprenant une séquence choisie parmi SEQ ID NO: 85 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase; ou une séquence d'acide nucléique codant pour une 4-méthoxybenzoate O- déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydrolase; ou une séquence d'acide nucléique hétérologue codant pour une p- coumarate 3-hydroxylase capable de convertir l'acide p-coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p-coumarate 3 hydroxylase, et o une séquence d'acide nucléique codant pour une dihydroxyphénylalanine ammonia-lyase (DAL).

Dans un mode de réalisation préféré, le vecteur comprend

une séquence d'acide nucléique codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT de Citrus clementina, Citrus sinensis, d’Arabidopsis thaliana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91, 93, 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O- méthyltransférase, et manière tout particulièrement préférée une OMT comprenant une séquence choisie parmi SEQ ID NO: 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase; et et au moins une séquence d'acide nucléique choisie parmi :

- une séquence d'acide nucléique codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'-monooxygénase ; et une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, en particulier une CPR comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ; et

une séquence d'acide nucléique hétérologue codant une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, et en particulier pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; et

une séquence d'acide nucléique codant pour une S-adénosylméthionine synthétase (SAMT) ; en particulier de Saccharomyces cerevisiae, par exemple une SAMT comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité S-adénosylméthionine synthétase

une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 41 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl- CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces clavuligerus ; en particulier une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 97, 99, 45, 43, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 97, 99 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase, et

une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 53, 51, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et

une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 61 et 59 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ; de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase .

De préférence, le vecteur comprend chacune de ces séquences.

Optionnellement, dans ce mode de réalisation, le vecteur peut comprendre en outre - une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase .

Dans un autre mode de réalisation préféré, le vecteur comprend :

une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT de Citrus clementina, Citrus sinensis, d’Arabidopsis thaliana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91, 93, 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, et manière tout particulièrement préférée une OMT comprenant une séquence choisie parmi SEQ ID NO: 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase; et au moins une séquence d'acide nucléique choisie parmi :

- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7 , 11, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'- monooxygénase ;

une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; et

une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl- CoA ligase (4CL) comprenant une séquence sélectionnée parmi les SEQ ID NO: 97, 99 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ces séquences et présentant une activité 4-coumarate-CoA ligase ; et

une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et

une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ; une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, en particulier une CPR comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides com prenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ; et

une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase, et

une séquence d'acide nucléique codant pour une S-adénosylméthionine synthétase (SAMT) ; en particulier de Saccharomyces cerevisiae, par exemple une SAMT comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité S-adénosylméthionine synthétase.

De préférence, dans ce mode de réalisation, la séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprend une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase De préférence, dans ce mode de réalisation, le vecteur comprend en outre une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et

une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase.

Dans un mode de réalisation particulier, le vecteur comprend

une séquence d'acide nucléique codant pour une O-méthyltransférase, en particulier capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' et une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H), en particulier capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine ; ou

une séquence d'acide nucléique hétérologue codant pour une O-méthyl- transférase (OMT), en particulier capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H), en particulier capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine ; et une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase ; ou une séquence d'acide nucléique hétérologue codant pour une O-méthyl- transférase (OMT), en particulier capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; et une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS), capable de transformer la naringénine en apigénine, l'ériodictyol en lutéoline et/ou l'hespérétine en diosmétine, de préférence de transformer l'ériotdictyol en lutéoline; ou

une séquence d'acide nucléique hétérologue codant pour une O-méthyltransférase capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase ; et une séquence d'acide nucléique hétérologue codant pour flavone synthase (FNS) capable de transformer la naringénine en apigénine, l'ériodictyol en lutéoline et/ou l'hespérétine en diosmétine, de préférence de transformer l'ériotdictyol en lutéoline.

Le vecteur peut ainsi comprendre plusieurs séquences d'acide nucléique choisies parmi celles-ci, notamment 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 séquences d'acide nucléique choisies parmi celles-ci.

Le vecteur peut notamment comprendre des combinaisons de séquences codantes particulières telles que décrites ci-dessus.

Les vecteurs comprennent des séquences codantes hétérologues dans la mesure où les séquences codantes peuvent être optimisées pour le microorganisme hôte, être sous le contrôle de promoteur hétérologue et/ou peuvent combiner des séquences codantes qui ne proviennent pas du même organisme d'origine et/ou qui ne sont pas présentes dans le même arrangement.

Le vecteur peut être toute séquence d’ADN dans laquelle il est possible d’insérer des acides nucléiques étrangers, les vecteurs permettant d’introduire de l’ADN étranger dans le microorganisme hôte. Le vecteur peut être par exemple un plasmide, un phagemide, un cosmide, un chromosome artificiel, notamment un YAC, ou un BAC.

Les vecteurs d'expression peuvent comprendre des séquences nucléiques codant pour des marqueurs de sélection. Les marqueurs de sélection peuvent être des gènes de résistance à un ou plusieurs antibiotiques ou des gènes d'auxotrophie. Le gène d'auxotrophie peut par exemple être URA3, LEU2, HIS5 ou TRP1. Le gène de résistance aux antibiotiques peut par exemple être de préférence un gène de résistance à rampicilline, à la kanamycine, à rhygromycine, à la généticine et/ou la nourséothricine.

L'introduction de vecteurs dans un microorganisme hôte est un procédé largement connu de l'homme du métier. Plusieurs méthodes sont notamment décrites dans « Current Protocols in Molecular Biology », 13.7.1-13.7.10; ou encore dans Ellis T. et al., Intégrative Biology, 2011, 3(2), 109- 118.

Le microorganisme hôte peut être transformée/transfectée de manière transitoire ou stable et l'acide nucléique, la cassette ou le vecteur peut être contenu dans celui-ci sous forme d'épisome ou sous forme intégré dans le génome du microorganisme hôte.

Le vecteur d'expression peut également comprendre une ou plusieurs séquences permettant l'insertion ciblée du vecteur, de la cassette d'expression ou de l'acide nucléique dans le génome du microorganisme hôte.

Toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ci-dessus ou une combinaison de certaines de celles-ci peuvent être insérées dans le/un chromosome du microorganisme recombinant. A contrario, toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ou une combinaison de certaines de celles-ci peuvent être conservées sous forme épisomale, notamment sous forme de plasmide.

Éventuellement, le microorganisme peut comprendre plusieurs copies de séquences nucléiques codant pour une enzyme telle que décrite précédemment. Notamment, il peut comprendre 2 à 10 copies, par exemple 2, 3, 4, 5, 6, 7, 8, 9 ou 10 copies d'une séquence nucléique codant pour une enzyme telle que décrite précédemment.

La présente invention est relative à une méthode de préparation d'un microorganisme selon la présente invention comprenant l'introduction d'un vecteur tel que défini précédemment dans le microorganisme et la sélection des microorganismes comprenant ledit vecteur. Elle est aussi relative à une méthode de préparation d'un microorganisme selon la présente invention comprenant l'introduction d'une séquence d'acide nucléique codant pour une O-méthyltransférase, en particulier capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' dans le microorganisme et la sélection des microorganismes comprenant lesdites séquences nucléiques. La méthode peut comprendre en outre l'introduction une ou plusieurs séquences d'acide nucléique choisies parmi :

une séquence d'acide nucléique codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine ; en particulier capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis ou Pilosella officinarum, en particulier Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis ou Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7 , 9, 11, 13, 15, 17, 19 et 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'- monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7, 11, 17 et 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'- monooxygénase, en particulier une F3'H comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7, 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavonoïde 3'-monooxygénase, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'- monooxygénase ;

une séquence d'acide nucléique codant pour une cytochrome P450 réductase ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d'Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23 et 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase en particulier une CPR comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité cytochrome P450 réductase ;

une séquence d'acide nucléique codant pour une O-méthyltransférase (OMT), en particulier capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence une OMT d’Arabidopsis thaüana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O- méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence sélectionnée parmi l'enzyme comprenant une séquence choisie parmi SEQ ID NO 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase ; une séquence d'acide nucléique codant pour une flavone synthase (FNS), en particulier capable de transformer la naringénine en apigénine, l'ériodictyol en lutéoline et/ou l'hespérétine en diosmétine, de préférence de transformer l'ériotdictyol en lutéoline; de préférence une FNS d’Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatuia, Oryza sativa, Petroseiinum crispum, Populus deltoïdes, Zea mays, Callistephus chinensis, Apium graveolens, Medicago truncatuia, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier d’Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatuia, Oryza sativa, Petroseiinum crispum, Populus deltoïdes ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, et Petroselinum crispum de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, en particulier une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase; de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ;

une séquence d'acide nucléique codant pour une S-adénosylméthionine synthétase (SAMT) ; en particulier de Saccharomyces cerevisiae, par exemple une SAMT comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité S-adénosylméthionine synthétase ;

une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), en particulier capable de produire de l'acide p-coumarique à partir de la tyrosine; de préférence de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

une séquence d'acide nucléique codant pour une 4-coumarate-CoA ligase (4CL), en particulier capable de produire le 4-coumaroyl-CoA à partir de l'acide p-coumarique et de Coenzyme A et le caffeoyl-CoA à partir d'acide caféique et de Coenzyme A; de préférence d’Arabidopsis thaliana, Petroselinum crispum ou Streptomyces clavuligerus ; une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 43, 45, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 45, 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase, et de préférence une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase ;

une séquence d'acide nucléique codant pour une chalcone synthase (CHS), en particulier capable de produire de la naringénine-chalcone à partir du 4-coumaroyl- CoA et de malonyl-CoA et de l'ériodictyol-chalcone à partir de caffeoyl-CoA et de malonyl-CoA; de préférence de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 51, 53, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 53 et 55 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase ; de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité chalcone synthase;

une séquence d'acide nucléique codant pour une chalcone isomérase (CHI), en particulier capable de produire la naringénine à pa rtir de la naringénine chalcone et de l'ériodictyol à partir de l'ériodictyol-chalcone ; de préférence d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 59 et 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase, et de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ;

une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), en particulier capable de produire de l'acide cinnamique à partir de la phénylalanine, de préférence une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, en particulier une PAL comprenant une séquence choisie parmi SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité phénylalanine ammonia lyase ;

une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H), en particulier capable de produire de l'acide p-cou marique à partir de l'acide cinnamique, de préférence une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase, en particulier une C4H comprenant une séquence choisie parmi SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase ; une séquence d'acide nucléique codant pour une sous-unité 4- hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), de préférence comprenant une séquence de SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et une séquence d'acide nucléique codant pour une sous-unité 4- hydroxyphénylacetate 3-monooxygénase réductase (HpaC), de préférence comprenant une séquence de SEQ ID NO: 85 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase; ou une séquence d'acide nucléique codant pour une 4- méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydrolase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3- hydroxylase capable de convertir l'acide p-coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p- coumarate 3 hydroxylase ; et

une séquence d'acide nucléique codant pour une dihydroxyphénylalanine ammonia-lyase (DAL).

De préférence, la méthode comprend l'introduction de combinaisons de séquences codantes particulières telles que décrites ci-dessus.

Selon un mode de réalisation préféré, la méthode comprend l'introduction :

d'une séquence d'acide nucléique hétérologue codant pour une O- méthyltransférase (OMT) capable de méthyler l'ériodictyol et/ou la lutéoline en position 4' ; de préférence, une OMT de Citrus clementina, Citrus sinensis, d’Arabidopsis thaliana ou d’Homo sapiens, de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91, 93, 87 et 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O- méthyltransférase, notamment avec l'ériodictyol et/ou la lutéoline comme substrat et une méthylation en position 4', de préférence une OMT comprenant une séquence choisie parmi SEQ ID NOs: 91 et 93 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité O-méthyltransférase, et manière tout particulièrement préférée une OMT comprenant u ne séquence choisie parmi SEQ ID NO: 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité O-méthyltransférase;

et d'au moins une séquence d'acide nucléique choisie parmi :

- d'une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 95, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'- monooxygénase ; et

une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, en particulier une CPR comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité cytochrome P450 réductase ; et une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; et

une séquence d'acide nucléique codant pour une S-adénosylméthionine synthétase (SAMT) ; en particulier de Saccharomyces cerevisiae, par exemple une SAMT comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité S-adénosylméthionine synthétase, et

- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 41 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;

- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces clavuligerus ; en particulier, une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 97, 99, 45, 43, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 97, 99 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase, et

- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 53, 51, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides com prenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et

- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 61 et 59 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ; de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase .

De préférence, la méthode comprend l'introduction de toutes ces séquences.

De préférence, la méthode comprend en outre l'introduction :

- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et

- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase.

Production de la diosmétine et/ou de l'hespérétine

La présente invention est relative à l'utilisation d'un microorganisme selon la présente invention pour la production de la diosmétine et/ou de l'hespérétine. Dans un premier mode de réalisation préféré, elle est relative à l'utilisation d'un microorganisme selon la présente invention pour la production de la diosmétine. Dans un deuxième mode de réalisation préféré, elle est relative à l'utilisation d'un microorganisme selon la présente invention pour la production de l'hespérétine. Dans un mode de réalisation préféré, elle est relative à l'utilisation d'un microorganisme selon la présente invention pour la production de la diosmétine et de l'hespérétine.

La présente invention est également relative à une méthode de production de la diosmétine et/ou de l'hespérétine comprenant la mise en culture d'un microorganisme selon la présente invention, notamment dans des conditions permettant ou favorables à la production de la diosmétine et/ou de l'hespérétine et éventuellement la récupération et/ou purification de la diosmétine et/ou de l'hespérétine produite.

La diosmétine et/ou de l'hespérétine peuvent être soit le produit final soit un intermédiaire de synthèse ou de biosynthèse pour la préparation d'autres produits.

Dans un mode de réalisation où la production de l'hespérétine est recherchée, une O- méthyltransférase (OMT) de Citrus clementina, de Citrus sinensis, d’Arabidopsis thaliana ou d'origine mammifère, de préférence humaine {Homo sapiens), sera préférée, de préférence de Citrus clementina, de Citrus sinensis, d’Arabidopsis thaliana, et de manière encore plus préférée de Citrus clementina. En particulier, dans ce mode de réalisation, l'OMT peut être sélectionnée parmi l'enzyme de SEQ ID NOs : 91, 93, 89 et 87 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité O-méthyltransférase, de préférence parmi l'enzyme de SEQ ID NOs : 91, 93 et 87 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité O-méthyltransférase, et de manière tout particulièrement préférée parmi l'enzyme de SEQ ID NO : 91 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O-méthyltransférase.

Dans un mode de réalisation où la production de l'hespérétine est recherchée, la présence d'une flavone synthase, en particulier une flavone synthase capable de produire la lutéoline à partir de l'ériodictyol et/ou la diosmétine à partir de l'hespérétine, n'est pas nécessaire dans le microorganisme.

Dans un mode de réalisation où la production de diosmétine est recherchée, une O- méthyltransférase (OMT) d’Arabidopsis thaüana, de Citrus sinensis, ou d'origine mammifère, de préférence humaine {Homo sapiens), sera préférée, de préférence humaine ou de Citrus sinensis. En particulier dans ce mode de réalisation, GOMT peut être sélectionnée parmi l'enzyme de SEQ ID NOs : 93, 89 et 87 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité O-méthyltransférase, de préférence parmi l'enzyme de SEQ ID NOs : 93 et 89 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité O-méthyltransférase, et de manière tout particulièrement préférée parmi l'enzyme de SEQ ID NO : 93 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité O- méthyltransférase.

Dans un mode de réalisation où la production de diosmétine et de l'hespérétine est recherchée, une O-méthyltransférase (OMT) d'origine mammifère, de préférence humaine {Homo sapiens), de Citrus clementina, de Citrus sinensis ou d’Arabidopsis thaliana sera préférée, de préférence humaine ou de Citrus sinensis. En particulier, dans ce mode de réalisation, GOMT peut être sélectionnée parmi l'enzyme de SEQ ID NO : 91, 93, 87 et 89 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité O-méthyltransférase, de préférence parmi l'enzyme de SEQ ID NO : 93 et 91 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'un de ces séquences et présentant l'activité O-méthyltransférase. Les conditions de culture du microorganisme selon l'invention peuvent être adaptées selon les techniques classiques, bien connues de l'homme du métier.

Le microorganisme est cultivé dans un milieu de culture approprié. Le terme « milieu de culture approprié » désigne d'une manière générale un milieu de culture apportant les nutriments essentiels ou bénéfiques à la maintenance et/ou à la croissance dudit microorganisme, tels que les sources carbonées ; les sources azotées telles que le sulfate d'ammonium ; les sources de phosphores, par exemple, le potassium phosphate monobasique ; les oligo-éléments, par exemple, les sels de cuivre, d'iodure, de fer, de magnésium, de zinc ou de molybdate ; les vitamines et autres facteurs de croissance tels que des acides aminés ou autres promoteurs de croissance. Un antimousse peut être ajouté selon les besoins. Selon l'invention, ce milieu de culture approprié peut être chimiquement défini ou complexe. Le milieu de culture peut ainsi être de composition identique ou similaire à un milieu synthétique, tel que défini par Verduyn et al., (Yeast. 1992. 8:501-17), adapté par Visser et al., (Biotechnology and bioengineering. 2002. 79:674-81), ou commercialement disponible tel que le milieu YNB (Yeast Nitrogen Base, MP Biomedicals ou Sigma-Aldrich). Notamment, le milieu de culture peut comprendre une source de carbone simple, telle le glucose, le fructose, le xylose, l'éthanol, le glycérol, le galactose, le saccharose, la cellulose, la cellobiose, l'amidon, les polymères de glucose, les mélasses, ou les sous-produits de ces sucres.

De préférence, la production d'hespérétine et/ou de diosmétine par le microorganisme selon l'invention est obtenue sans apport de naringénine, d'apigénine, d'ériodictyol et/ou de lutéoline dans le milieu de culture, de préférence sans apport de naringénine, d'apigénine, d'ériodictyol et de lutéoline dans le milieu de culture.

Selon l'invention, tout mode de culture permettant la production à l'échelle industrielle de molécules d'intérêt peut être envisagé. Avantageusement, la culture se fait en bioréacteurs, notamment en mode batch, fed-batch, chemostat et/ou culture continue. Une alimentation contrôlée en vitamines au cours du procédé peut également être bénéfique à la productivité (Alfenore et al., Appl Microbiol Biotechnol. 2002. 60:67-72).

La culture est généralement conduite en bioréacteurs, avec de possibles étapes de précultures solides et/ou liquides en Erlenmeyers, avec un milieu de culture approprié. D'une manière générale, les conditions de culture des microorganismes selon l'invention sont aisément adaptables par l'homme du métier, en fonction du microorganisme. Par exemple, la température de culture est notamment comprise pour les levures entre 20°C et 40°C, de préférence entre 28°C et 35°C, et plus particulièrement d'environ 30°C pour 5 cerevisiae.

Le microorganisme selon la présente invention peut être cultivé pendant 1 à 30 jours, et de préférence de 1 à 10 jours.

Un microorganisme selon la présente invention est de préférence capable de produire de la diosmétine et/ou de l'hespérétine en une quantité minimale de 1 mg/l de milieu de culture, de préférence de 10, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 mg/l de milieu de culture, éventuellement de 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 ou 1000 mg/l de milieu de culture.

DESCRIPTION DES FIGURES

Figure 1 : Description des voies métaboliques de production d'hespérétine et de la diosmétine.

Figure 2 : Production d'ériodictyol à partir de naringénine par la souche FL_405 (F3'H4 + CPR2). Souche témoin : CF235. Observation de la disparition du pic de naringénine et apparition d'un pic d'ériodictyol dans la souche FL-405.

Figure 3 : Production de lutéoline à partir d'apigénine par la souche FL_405 (F3'H4 + CPR2). Souche témoin : CF235. Observation de la disparition du pic d'apigénine et apparition d'un pic de lutéoline dans la souche FL-405. Figure 4 : Production d'Apigénine à partir de naringénine par la souche SC744 (FNSII1 + CPR2). Souche témoin : CF234. Observation de la disparition du pic de naringénine et apparition d'un pic d'apigénine dans la souche.

Figure 5 : Production de lutéoline à partir d'ériodictyol SC744 (FNSII1 + CPR2). Souche témoin : CF234. Observation de la disparition du pic d'ériodictyol et apparition d'un pic de lutéoline dans la souche.

Figure 6 : Production d'ériodictyol et de lutéoline par la souche SC1500. Souche témoin : CF237. Observation des pics d'ériodictyol et de lutéoline.

Figure 7 : Production d'hespérétine à partir d'ériodictyol par les souches SC 1612 (MET + SAM) et SC 1614 (MET + SAM). Souche témoin : CF235. Observation de la disparition du pic d'ériodictyol et apparition d'un pic d'hespérétine dans les souches. Figure 8 : Production de diosmétine à partir de lutéoline par la souche SC 1612 (MET + SAM) et SC 1614 (MET + SAM). Souche témoin : CF235. Observation de la disparition du pic de lutéoline et apparition d'un pic de diosmétine dans les souches.

Figure 9 : Production de diosmétine à partir d'hespérétine par la souche SC744 (FNSII + CPR). Souche témoin : CF234. Observation de la disparition du pic d'hespérétine et apparition d'un pic de diosmétine dans la souche.

Figure 10 : Production d'hespérétine à partir d'ériodictyol par E. coli EC26 (MET + SAM). Souche témoin : E. coli MH1. Observation de la disparition du pic d'ériodictyol et apparition d'un pic d'hespérétine dans la souche.

Figure 11 : Production de diosmétine à partir de lutéoline par E. coli EC26 (MET + SAM). Souche témoin : E. coli MH1. Observation de la disparition du pic de lutéoline et apparition d'un pic de diosmétine dans la souche.

Figure 12 : Production de diosmétine à partir d'hespérétine par E. coli EC30 (FNSII). Souche témoin : E. coli MH1. Observation de la disparition du pic d'hespérétine et apparition d'un pic de diosmétine dans la souche.

Figure 13 : Production d'hespérétine et de diosmétine par la souche SC1508. Souche témoin : CF237. Observation des pics d'hespérétine de de diosmétine.

Figure 14 : Production d'hespérétine à partir d'ériodictyol par E. coli EC41 (MET + SAM). Souche témoin : E. coli MH1. Observation de la disparition du pic d'ériodictyol et apparition d'un pic d'hespérétine dans la souche.

Figure 15 : Production d'hespérétine à partir d'ériodictyol par E. coli EC43 (MET + SAM). Souche témoin : E. coli MH1. Observation de la disparition du pic d'ériodictyol et apparition d'un pic d'hespérétine dans la souche.

Figure 16 : Production de diosmétine à partir de lutéoline par E. coli EC43 (MET + SAM). Souche témoin : E. coli MH1. Observation de la disparition du pic de lutéoline et apparition d'un pic de diosmétine dans la souche.

Figure 17 : Production d'hespérétine et de diosmétine par la souche SC2408. Souche témoin: CF237. Observation des pics d'hespérétine de de diosmétine.

Figure 18 : Production d'hespérétine et de diosmétine par la souche SC2409. Souche témoin: CF237. Observation des pics d'hespérétine de de diosmétine.

Figure 19 : Production d'hespérétine et d'homoériodictyol par les souches SC2147, SC2151, SC1612 et SC1614. Souche témoin: CF235. Figure 20 : Production de diosmétine et de chrysoériol par les souches SC2147, SC2151, SC1612 et SC1614. Souche témoin: CF235.

Figure 21 : Production d'hespérétine et de diosmétine par les souches SC2408, SC2409 et SC1508. Souche témoin: CF237.

Figure 22 : Production d'ériodyctiol et de lutéoline par les souches SC2424, SC2425, SC2426, SC2427, SC2428 et SC1500. Souche témoin: CF237.

Figure 23 : Production de diosmétine à partir de naringénine par les souches SC2429 à SC2434, SC2436 à SC2444, SC2446 à SC2454, SC2456 à SC2464 et SC2466. [Tableau 1] DESCRIPTION DES SEQUENCES

EXEMPLES

Matériels et méthodes

Souches

Les levures utilisées dans les exemples ont été obtenues à partir de Saccharomyces cerevisiae FY1679-28A (Tettelin et al., 1995 https://doi.org/10.1016/S1067-

2389(06)80008-7). Cette levure possède une quadri auxotrophie pour l'uracile, le tryptophane, l'histidine et la leucine.

Les souches de bactéries utilisées dans les exemples ont été obtenues à partir de Escherichia coli M H1. Standards

Les standards ont été acquis chez le fournisseur Extrasynthèse, France (Naringénine, Apigénine, Eriodictyol, Lutéoline, Hespérétine et Diosmétine).

Clonage des gènes

Les gènes optimisés pour s'exprimer dans la levure ont été synthétisés par Eurofins genomics, Ebersberg, Allemagne ou Biomatik, Cambridge, Canada ou Twist Biosciences, San Francisco, USA ou DC Biosciences, Dundee, UK. Par PCR, le gène cpr2 (SEQ ID NO : 26) de S. cerevisiae a été amplifié à partir de l'ADN génomique.

Les gènes obtenus par synthèse ou par PCR comprennent à l'extrémité 5' et 3', un site de restriction Bbsl (GAAGAC) ou Bsal (GGTCTC). Tous les gènes, les promoteurs et les terminateurs ont été clonés restriction dans le vecteur pSBK pour l'expression dans la levure ou dans le vecteur pSBlK3 pour l'expression dans E. coli. Les promoteurs et terminateurs (Wargner et al., 2015 DOI: 10.1016/j.fgb.2015.12.001) ont été récupérés par PCR à partir de l'ADN génomique de la levure 5. cerevisiae ou de E. coli. Le vecteur pSBK comprend un marqueur de sélection de la levure URA, ou LEU ou TRP ou HIS et le vecteur pSBlK3 comprend un marqueur de résistance à la kanamycine. Conditions de culture

Les souches ont été cultivées dans 1 ml de milieu minimum nitrogen base (Dutscher, Brumath, Fr) supplémenté de glucose à 20 g/l pour les levures et dans 1 ml de M9 supplémenté de glucose à 4 g.l 1 pour E. coli en plaque 24 puits (Starlab, Orsay, Fr) à 30°C pendant 72h sous agitation continu à 200 RPM. Dans certains cas, de la naringénine ou de l'apigénine a été ajoutée à une concentration de 100 mg.l 1 pour déterminer l'activité des F3'H, de la naringénine ou de l'ériodictyol a été ajoutée à une concentration de 100 mg.l 1 pour déterminer l'activité des FNSII, de l'ériodictyol ou de la lutéoline a été ajoutée à une concentration de 100 mg.l 1 pour déterminer l'activité des MET. Chaque souche a été inoculée à DO 0,2 à partir d’une pré-culture de 24h cultivée dans les mêmes conditions.

Méthode analytique :

Préparation des échantillons : Les cultures de 1 mL sont congelées à -80°C puis lyophilisées pendant 12h à 0,10 mbar. Les échantillons sont ensuite repris dans 1 mL de diméthylsulfoxide (DMSO), agités pendant 30 secondes à 1000 rpm puis centrifugés pendant 5 min à 3000 rpm à température ambiante. Après centrifugation, un volume connu de surnageant est ajouté à un volume connu d'un mélange d’étalons internes solubilisés dans du méthanol.

Les concentrations finales des étalons internes sont :

Diosmine C13 0,5 mg/L Diosmétine C13 0,015 mg/L.

Analyse par UFIPLC-TQ : Les échantillons ont été analysés par une UHPLC Vanquish-H (Thermo) couplée à un triple-quadripôle Quantis (Thermo). La colonne est une colonne Waters Acquity UPLC@ USST3 (8 miti 2,1 X 100 mm) associée à une pré-colonne HSST3 1,8 miti 2,1 X 5 mm. La phase mobile A est une solution de 0,1 % d'acide formique dans de l'eau de qualité LC/MS et la phase mobile B est une solution de 0,1 % d'acide formique dans de l'acétonitrile pur de qualité LC/MS . La température de la colonne est de 50°C et la température du passeur d’échantillons à 10°C. Deux conditions chromatographiques ont pu être utilisés pour la détection des flavonoïdes d'intérêt :

[Tableau 2] Conditions chromatographiques méthode 1 [Tableau 3] Conditions chromatographiques méthode 2

Les ions suivis et les conditions de fragmentation pour les molécules d'intérêts sont :

[Ta bleau 4] Pour la méthode 1

[Tableau 5] Pour la méthode 2

F3'H Des constructions pour chacune des F3'H ont été réalisées dans un vecteur portant le marqueur de sélection URA (Tableau 6). Des constructions comportant chacune SAM2 et un seul des différents CPR ont été créés dans un vecteur portant le marqueur de sélection LEU (Tableau 7). Deux vecteurs comportant uniquement le marqueur de sélection URA ou LEU ont aussi été créé comme témoin. Les gènes marqueurs permettent de repérer et de sélectionner les cellules ayant intégré le gène d'intérêt.

[Tableau 6] Liste des différentes constructions F3'H testées.

[Tableau 7] Listes des constructions réalisées avec les différents CPR

Plusieurs souches ont été créées avec respectivement toutes les F3'H listées dans le tableau 6 pour qu'elles soient chacune testées avec toutes les constructions du tableau 7.

Ces différents assemblages permettent de vérifier l'activité enzymatique des F3'H et permettent également de déterminer les couples F3'H - CPR les plus efficaces.

Par exemple, la souche FL 405 possède les constructions FL 26 et FL 401.

La souche témoin (sans les gènes) possédant les constructions TT URA et TT LEU est nommée CF235.

FNSII

Pour chacune des FNSII suivantes, des constructions dans un vecteur TRP ont été effectués (Tableau 8). Les mêmes vecteurs avec le marqueur de sélection LEU contenant chacun SAM2 et un CPR différent ont été utilisés pour tester les FNSII (Tableau 9).

[Tableau 8] Constructions comportant les différentes FNSII testées.

[Tableau 9] Listes des constructions réalisées avec les différents CPR

Plusieurs souches ont été créées avec respectivement chacune des constructions des FNSII listées dans le tableau 8 et chacune des constructions des CPR du tableau 9.

Ces différents assemblages permettent de vérifier l'activité enzymatique des FNSII et permettent également de déterminer les FNSII les plus efficaces.

Par exemple, la souche SC 744 possède les constructions FL 620 et FL 401. La souche témoin (sans les gènes) possédant les constructions TT TRP et TT LEU est nommé CF234.

Des constructions similaires ont été réalisées pour tester les FNSII des SEQ ID Nos : 101 7 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133.

LEVURE JUSQU'A ERIODICTYOL/LUTEOLINE

Des souches comportant la voie jusqu'à l'ériodictyol et la lutéoline ont également été testées :

- la souche SC1500 comprend les constructions FL 26, FL 602, FL 808 et FL 822; et - la souche SC2424 comprenant les constructions FL 1031 + FL 602 + FL 822 + TT HIS ;

- la souche SC2425 comprenant les constructions FL 26 + FL 602 + FL 822 + TT HIS ;

- la souche SC2426 comprenant les constructions FL 31 + FL 602 + FL 822 + TT HIS ;

- la souche SC2427 comprend les constructions FL 1031, FL 602, FL 808 et FL 822 ; et

- la souche SC2428 comprenant les constructions FL 31 + FL 602 + FL 808 + FL 822.

[Tableau 10] Listes des constructions utilisées des souches comportant la voie jusqu'à l'ériodictyol et la lutéoline

La souche témoin (sans les gènes) possédant les constructions TT LIRA, TT TRP, TT HIS et TT LEU est nommé CF237.

MET :

Afin de tester chacune des MET, des constructions ont été effectuées et sont présentées dans le tableau 11. Les gènes marqueurs permettent de repérer et de sélectionner les cellules ayant intégré le gène d'intérêt.

[Tableau 11] Listes des constructions réalisées pour tester les différentes MET

Quatre souches SC 1612, SC 1614, SC 2147 et SC 2151 ont été créés, avec FL 121 et FL 266 pour SC 1612, FL 121 et FL 268 pour SC 1614, FL 475 et FL 121 pour SC 2147 et FL 469 et FL 121 pour SC 2151 pour la conversion de l'ériodictyol en hespérétine afin de déterminer quelle MET est la plus efficace. La souche témoin (sans les gènes) possédant les constructions TT LEU et TT URA est nommée CF235.

F3'H, MET, FNS, CPR : PRODUCTION DE DIOSMETINE A PARTIR DE NARINGENINE

[Tableau 12] Liste des constructions utilisées pour tester les enzymes dans Saccharomyces cerevisiae (SC)

Les souches suivantes ont été construites :

SC2429 : FL 1111 + FL 1031 + FL 121 10 SC2441 : FL 1113 + FL 1031 + TT LEU SC2430 : FL 1112 + FL 1031 + FL 121 SC2442 : FL 1114 + FL 1031 + TT LEU SC2431 : FL 1113 + FL 1031 + FL 121 SC2443 : FL 1115 + FL 1031 + TT LEU SC2432 : FL 1114 + FL 1031 + FL 121 SC2434 : FL 1116 + FL 1031 + FL 121 SC2433 : FL 1115 + FL 1031 + FL 121 SC2436 : FL 1118 + FL 1031 + FL 121 SC2439 : FL 1111 + FL 1031 + TT LEU 15 SC2437 : FL 1119 + FL 1031 + FL 121

SC2440 : FL 1112 + FL 1031 + TT LEU SC2438 : FL 1120+ FL 1031 + FL 121 SC2444 : FL 1116 + FL 1031 + TT LEU SC2461 : FL 1113 + FL 26 + TT LEU SC2446 : FL 1118 + FL 1031 + TT LEU SC2462 : FL 1114 + FL 26 + TT LEU SC2447 : FL 1119 + FL 1031 + TT LEU SC2463 : FL 1115 + FL 26 + TT LEU SC2448 : FL 1120 + FL 1031 + TT LEU 15 SC2454 : FL 1116 + FL 26 + FL 121 SC2449 : FL 1111 + FL 26 + FL 121 SC2456 : FL 1118 + FL 26 + FL 121

SC2450 : FL 1112 + FL 26 + FL 121 SC2457 : FL 1119 + FL 26 + FL 121

SC2451 : FL 1113 + FL 26 + FL 121 SC2458 : FL 1120+ FL 26 + FL 121

SC2452 : FL 1114 + FL 26 + FL 121 SC2464 : FL 1116 + FL 26 + TT LEU

SC2453 : FL 1115 + FL 26 + FL 121 20 SC2466 : FL 1118 + FL 26 + TT LEU SC2459 : FL 1111 + FL 26 + TT LEU SC2467 : FL 1119 + FL 26 + TT LEU

SC2460 : FL 1112 + FL 26 + TT LEU SC2468 : FL 1120 + FL 26 + TT LEU

La souche témoin (sans les gènes) possédant les constructions TT U RA, TT TRP, TT HIS et TT LEU est nommé CF237.

E. COU JUSQU'A HESPERETINE/DIOSMETINE

[Tableau 13] Liste des constructions utilisées pour tester les enzymes dans E. coli

LEVURE JUSQU'A HESPERETINE/DIOSMETINE

Trois souches comportant la voie jusqu'à hespérétine/diosmétine ont également été testées. La souche SC1508 comprend les constructions FL 121 + FL 268 + FL 602 + FL 808 du tableau 14. La souche SC 2408 comprend les constructions FL 121 + FL 469 + FL 602 + FL 808 du tableau 14. La souche SC 2409 comprend les constructions FL 121 + FL 475 + FL 602 + FL 808 du tableau 14.

[Tableau 14] Listes des constructions utilisées dans les exemples.

La souche témoin (sans les gènes) possédant les constructions TT LEU, TT URA, TT TRP et

TT HIS est nommée CF237.

RESULTATS

F3'H

Les tableaux 15 et 16 ci-dessous présentent la production d'ériodictyol (tableau 15) et de lutéoline (tableau 16) obtenue en cultivant les souches comprenant les F3'H listées dans le tableau 6 et les constructions du tableau 7 , en présence respectivement de naringénine et d'apigénine. [Tableau 15] Concentration en Eriodictyol (en mg.l 1 )

LQ : inférieur à la limite de quantification.

Les différentes souches sont bien capables de produire de l'ériodictyol à partir de la naringénine, en concentrations différentes suivant les F3'H et le CPR utilisés (voir Figure 2).

[Tableau 16] Concentration en Lutéoline (en mg.l _1 )

LQ : inférieur à la limite de quantification.

Les différentes souches sont bien capables de produire de la lutéoline à partir d'apigénine, en concentrations différentes suivant les F3'H et le CPR utilisés (voir Figure 3). FNS

Les tableaux 17 et 18 ci-dessous présentent la production d'apigénine (tableau 17) et de lutéoline (tableau 18) obtenue en cultivant les souches comprenant les FNSII listées dans le tableau 8 et les constructions du tableau 9, en présence respectivement de naringénine et d'ériodictyol.

[Tableau 17] Concentration en Apigénine (en mg.l -1 )

[Tableau 18] Concentration en Lutéoline (en mg.l 1 )

Les différentes souches sont bien capables de produire de l'apigénine et de la lutéoline à partir de naringénine et d'ériodictyol, en concentrations différentes suivant le FNS utilisé (Figures 4 et 5). Des résultats similaires ont été obtenus avec les FNSII des SEQ ID Nos : 101 7 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 et 133.

F3'H, MET, FNS, CPR : PRODUCTION DE DIOSMETINE A PARTIR DE NARINGENINE

Les résultats pour la production de diosmétine à partir de naringénine par les souches SC2429 à SC2434, SC2436 à SC2444, SC2446 à SC2454, SC2456 à SC2464 et SC2466 à SC2468 sont présentés dans la figure 23.

Toutes les souches sont capables de produire de la diosmétine à partir de naringénine. La production de diosmétine est largement augmentée par l'ajout d'une CPR.

SOUCHE JUSQU'A ERIODICTYOL/LUTEOLINE Les souches SC2424, SC2425, SC2426, SC2427, SC1500 et SC2428 possèdent toutes les enzymes de la voie et sont capables de produire de la lutéoline et de l'ériodictyol à partir de glucose.

Les résultats de la souche SC1500 correspondent à la figure 6, où les pics de l'ériodictyol et de la lutéoline sont observés. Des résultats similaires sont obtenus pour les souches SC2424, SC2425, SC2426, SC2427, et SC2428. La production d'ériodictyol et de lutéoline pour chacune des souches SC2424, SC2425, SC2426, SC2427, SC1500 et SC2428 est présentée sur la figure 22.

Il est à noter que l'ajout des enzymes PAL et C4H à la voie de biosynthèse permet d'obtenir des concentrations d'ériodictyol et de lutéoline nettement plus importantes Celles-ci peuvent être jusqu'à 6 fois plus importantes que les concentrations obtenues avec les souches contenant les mêmes enzymes à l'exception de PAL et C4H (cf. figure 22, par exemple en comparant la souche SC2425 sans PAL/C4H et la souche SC1500 avec PAL/C4H ou la souche SC2426 sans PAL/C4H et la souche SC2428 avec PAL/C4H). MET

Les résultats pour la production de l'hespérétine et de diosmétine à partir d'ériodictyol et de lutéoline par les souches SC1612, SC1614, SC2147 et SC2151 sont présentés respectivement dans les figures 7, 8, 19 et 20. Les souches de levure SC1612, SC1614, SC2147 et SC2151 sont bien capables de produire de l'hespérétine et/ou la diosmétine.

A partir d'ériodictyol, les souches SC2147, SC2151 et SC1612 sont capables de produire spécifiquement de l'hespérétine, c'est-à-dire de méthyler spécifiquement l'hydroxyle en position 4' de l'ériodictyol (Figure 19). La souche SC1614 produit quant à elle un mélange d'hespérétine et d'homoériodictyol.

De manière remarquable, la souche SC2151 est par ailleurs capable de produire de l'ordre de 40 mg/L d'hespérétine (Figure 19). Les souches SC2147, SC1612 et SC1614 sont quant à elles capables de produire de la diosmétine à partir de lutéoline (Figure 20).

FNSII

Les résultats pour la production de la diosmétine à partir de l'hespérétine par la souche SC744 sont présentés sur la figure 9.

La souche de levure SC744 est bien capable de produire de la diosmétine à partir d'hespérétine.

E. COU

Les résultats pour la production de l'hespérétine à partir d'ériodictyol par les souches EC26, EC41 et EC43 sont présentés dans les figures 10, 14 et 15 et la production de diosmétine à partir de lutéoline par les souches EC26 et EC43 sont présentés dans les figures 11 et 16. Les souches E. coli EC26, EC41 et EC43 sont bien capables de produire de l'hespérétine et/ou de la diosmétine.

Les résultats pour la production de diosmétine à partir de l'hespérétine par la souche EC30 sont présentés sur la figure 12. La souche E. coli EC30 est bien capable de produire de la diosmétine à partir d'hespérétine.

SOUCHE JUSQU'A HESPERETINE/DIOSMETINE

Les résultats pour la production de l'hespérétine et de la diosmétine à partir de glucose des souches de levure SC1508, SC2408 et SC2409 sont présentés sur les figures 13, 17 et 18.

Les souches de levure SC1508, SC2408 et SC2409 possédant toutes les enzymes de la voie sont capables de produire de l'hespérétine et/ou de la diosmétine à partir de glucose (Figure 21). De manière remarquable, la souche SC 2408 produit de l'ordre de 25 mg/L d'hespérétine et environ 5 mg/L de diosmétine.