BIOSYNTHESIS OF BENZYLISOQUINOLINE ALKALOIDS AND BENZYLISOQUINOLINE ALKALOID PRECURSORS

Title:

BIOSYNTHESIS OF BENZYLISOQUINOLINE ALKALOIDS AND BENZYLISOQUINOLINE ALKALOID PRECURSORS

Document Type and Number:

WIPO Patent Application WO/2018/029282

Kind Code:

Abstract:

Recombinant microorganisms, plants, and plant cells are disclosed that have been engineered to have reduced levels or activity of one or more alcohol dehydrogenases or aldehyde reductases thereby increasing the production of benzylisoquinoline alkaloids and/or benzylisoquinoline alkaloid precursors.

Inventors:

HANSEN ESBEN HALKJAER (DK)
SCHWAB MARKUS (DE)
BERNINGER PHILIPP (CH)
DELGRANGE FANNY (FR)
GRASSINGER FRANZISKA (CH)

Application Number:

PCT/EP2017/070253

Publication Date:

February 15, 2018

Filing Date:

August 09, 2017

Export Citation:

Click for automatic bibliography generation Help

Assignee:

EVOLVA SA (CH)

International Classes:

C12N9/04; C12P7/24; C12P13/00; C12P17/12; C12P17/18

Domestic Patent References:

WO2011058446A2	2011-05-19
WO2015066642A1	2015-05-07
WO2016179296A1	2016-11-10
WO2016183023A1	2016-11-17

Foreign References:

US5538880A	1996-07-23
US5204253A	1993-04-20
US6329571B1	2001-12-11
US6013863A	2000-01-11

Other References:

"PHD Thesis", 1 January 2009, CaltechTHESIS, article KRISTY HAWKINS: "METABOLIC ENGINEERING OF SACCHAROMYCES CEREVISIAE FOR THE PRODUCTION OF BENZYLISOQUINOLINE ALKALOIDS", pages: 1 - 154, XP055361294
HAGEL; FACCHINI, PLANT CELL PHYSIOL., vol. 54, no. 5, 2013, pages 647 - 672
FOSSATI, PLOS ONE, vol. 10, no. 4, 2015, pages e0124459
NAKAGAWA, NATURE COMMUNICATIONS, vol. 2, 2011, pages 326
THODEY; SMOLKE, NAT CHEM BIOL., vol. 10, no. 10, 2014, pages 837 - 844
THODEY; SMOLKE, HAGEL AND FACCHINI, 2013
NAKAGAWA ET AL., SCI REP., vol. 4, 2014, pages 6695
HAWKINS; SMOLKE, NAT CHEM BIOL., vol. 4, 2008, pages 564 - 573
THODEY ET AL., NAT CHEM BIOL., vol. 10, 2014, pages 837 - 844
FOSSATI ET AL., PLOS ONE, vol. 10, no. 4, 2015, pages e0124459
DATABASE GenBank [O] retrieved from ncbi Database accession no. P54768
DATABASE GENBANK [O] retrieved from ncbi Database accession no. U08597
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AF314150
DATABASE GENBANK [O] retrieved from ncbi Database accession no. NM012740
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AY254101
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AY254102
DATABASE GENBANK [O] retrieved from ncbi Database accession no. NP_010668.3
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AE015451
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AB010716
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AB267399.2
DATABASE GENBANK [O] retrieved from ncbi Database accession no. Q6WUC1
DATABASE GENBANK [O] retrieved from ncbi Database accession no. D29811
DATABASE GENBANK [O] retrieved from ncbi Database accession no. Q948P7
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AY610508
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AY217336
DATABASE GENBANK [O] retrieved from ncbi Database accession no. 064899
DATABASE GENBANK [O] retrieved from ncbi Database accession no. Q9LEL5
DATABASE GENBANK [O] retrieved from ncbi Database accession no. P0DKI7
DATABASE GENBANK [O] retrieved from ncbi Database accession no. EF451150
DATABASE GENBANK [O] retrieved from ncbi Database accession no. DQ316261
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AF339913
DATABASE GENBANK [O] retrieved from ncbi Database accession no. GQ500139
DATABASE GENBANK [O] retrieved from ncbi Database accession no. GQ500141
DATABASE GENBANK [O] retrieved from ncbi Database accession no. T2HEI8
DATABASE GENBANK [O] retrieved from ncbi Database accession no. Q51990
DATABASE GENBANK [O] retrieved from ncbi Database accession no. AF108432
DATABASE GENBANK [O] retrieved from ncbi Database accession no. D4N502
MANIATIS ET AL.: "MOLECULAR CLONING: A LABORATORY MANUAL", 1989, COLD SPRING HARBOR LABORATORY
AUSUBEL ET AL.: "CURRENT PROTOCOLS IN MOLECULAR BIOLOGY", 1989, GREENE PUBLISHING ASSOCIATES AND WILEY INTERSCIENCE
INNIS ET AL.: "PCR Protocols: A Guide to Methods and Applications", 1990, ACADEMIC PRESS
LLARI ET AL., J BIOL CHEM, vol. 284, 2009, pages 897 - 904
LLARI, J BIOL CHEM, vol. 284, 2009, pages 897 - 904
WACH ET AL., YEAST, vol. 10, 1994, pages 1793 - 1808
MNAIMNEH ET AL., CELL, vol. 118, 2004, pages 31 - 44
MORTIMER; JOHNSTON, GENETICS, vol. 113, 1986, pages 35 - 43
CHENNA ET AL., NUCLEIC ACIDS RES., vol. 31, no. 13, 2003, pages 3497 - 500
BODDEKER ET AL., J. MEMBRANE SCI., vol. 137, 1997, pages 155 - 158
BORGES DA SILVA ET AL., CHEM. ENG. DES., vol. 87, 2009, pages 1276 - 1292
CLAUDEL-RENARD ET AL., NUCLEIC ACIDS RES., vol. 31, no. 22, 2003, pages 6633 - 6639
DATABASE GenBank [O] retrieved from ncbi Database accession no. JRIR00000000

Attorney, Agent or Firm:

REES, Kerry (GB)

Download PDF:

View/Download PDF PDF Help

Claims:

What is claimed is:

1 . A recombinant host cell capable of producing one or more benzylisoquinoline alkaloids or benzylisoquinoline alkaloid precursors, or both, comprising:

(a) reduced or eliminated enzymatic activity of a first alcohol dehydrogenase or aldehyde reductase; and, optionally,

(b) reduced or eliminated enzymatic activity of one or more second alcohol dehydrogenases or aldehyde reductases, or a combination thereof, wherein the activity of each of the enzymes in (a) and (b) is reduced or eliminated by having disrupted or deleted one or more genes encoding said enzyme, and whereby the host cell is thereby capable of increased production of one or more benzylisoquinoline alkaloids or benzylisoquinoline alkaloid precursors, or both, than are produced in cells without reduced or eliminated activity of a first or one or more second alcohol dehydrogenase or aldehyde reductase.

2. The recombinant cell according to claim 1 , wherein the cell produces one or more benzylisoquinoline alkaloid precursors.

3. The recombinant cell according to claim 1 or claim 2, wherein the cell produces (S)- reticuline.

4. The recombinant cell according to claim 1 or claim 2, wherein the cell produced (S)- norcoclaurine.

5. The host cell of any one of claims 1-4, wherein the first alcohol dehydrogenase is Alcohol Dehydrogenase 3 (ADH3) (SEQ ID NOs: 29 & 30), Alcohol Dehydrogenase 4 (ADH4) (SEQ ID NOs: 31 & 32), Alcohol Dehydrogenase 5 (ADH5) (SEQ ID NOs:1 & 2), Alcohol Dehydrogenase 6 (ADH6) (SEQ ID NOs: 3 & 4), Alcohol Dehydrogenase 7 (ADH7) (SEQ ID NOs: 5 & 6), Genes de Respuesta a Estres 2 (GRE2) (SEQ ID NOs: 7 & 8), Aryl-alcohol Dehydrogenase 3 (AAD3) (SEQ ID NOs: 25 & 26), Aryl-alcohol Dehydrogenase 4 (AAD4) (SEQ ID NOs: 27 & 28), Butanediol dehydrogenase 1 (BDH1 ) (SEQ ID NOs: 35 & 36), medium-chain alcohol dehydrogenase BDH2 (SEQ ID NOs: 37 & 38), arabinose dehydrogenase ARA1 (SEQ ID NOs: 61 & 62), glycerol dehydrogenase GCY1 (SEQ ID NOs: 41 & 42), 3-hydroxyacyl-CoA dehydrogenase FOX2 (SEQ ID NOs: 39 & 40), Aryl-alcohol Dehydrogenase YPL088W (SEQ ID NOs: 59 & 60), glucose-6-phosphate dehydrogenase ZWF1 (SEQ ID NOs: 57 & 58), Glycerol-3-Phosphate Dehydrogenase (GPD1 ) (SEQ ID NOs: 45 & 46), HIS4 (SEQ ID NOs: 47 & 48), NADP-specific Isocitrate Dehydrogenase (IDP1 ) (SEQ ID NOs: 51 & 52), homo-isocitrate dehyrogenases (LYS12) (SEQ ID NOs: 53 & 54), or a homolog thereof.

6. The host cell of any one of claims 1-4, wherein the first aldehyde reductase is Aldehyde Reductase Intermediate 1 (ARM ) (SEQ ID NOs: 15 & 16), Genes de Respuesta a Estres 3 (GRE3) (SEQ ID NOs: 9 & 10), aldehyde reductase YCR102C (SEQ ID NOs: 19 & 20), aldehyde reductase YDR541 C (SEQ ID NOs: 11 & 12), SER33 (SEQ ID NOs: 55 & 56), aldehyde reductase YGL039W (SEQ ID NOs: 17 & 18), aldehyde reductase YLR460C (SEQ ID NOs: 13 & 14), aldehyde reductase YPR127W (SEQ ID NOs: 21 & 22), aldehyde dehydrogenase 6 (ALD6) (SEQ ID NOs: 33 & 34), GlyOxylate Reductase (GOR1 ) (SEQ ID NOs: 43 & 44), 3-Hydroxy-3- MethylGlutaryl-coenzyme a reductase (HMG1 ) (SEQ ID NOs: 49 & 50), or a homolog thereof.

7. The host cell of claim 5 or claim 6, wherein the one or more second alcohol dehydrogenases or aldehyde reductases, or combination thereof, is ADH3 (SEQ ID NOs: 29 & 30), ADH4 (SEQ ID NOs: 31 & 32), ADH5 (SEQ ID NOs:1 & 2), ADH6 (SEQ ID NOs: 3 & 4), ADH7 (SEQ ID NOs: 5 & 6), GRE2 (SEQ ID NOs: 7 & 8)„ AAD3 (SEQ ID NOs: 25 & 26), AAD4 (SEQ ID NOs: 27 & 28), BDH1 (SEQ ID NOs: 35 & 36, BDH2 (SEQ ID NOs: 37 & 38), ARA1 (SEQ ID NOs: 61 & 62), GCY1 (SEQ ID NOs: 41 & 42), FOX2 (SEQ ID NOs: 39 & 40), Aryl-alcohol Dehydrogenase YPL088W (SEQ ID NOs: 59 & 60), glucose-6-phosphate dehydrogenase ZWF1 (SEQ ID NOs: 57 & 58), GPD1 (SEQ ID NOs: 45 & 46), HIS4 (SEQ ID NOs: 47 & 48), IDP1 (SEQ ID NOs: 51 & 52), LYS12 (SEQ ID NOs: 53 & 54), ARM (SEQ ID NOs: 15 & 16), GRE3 (SEQ ID NOs: 9 & 10), aldehyde reductase YCR102C (SEQ ID NOs: 19 & 20), aldehyde reductase YDR541 C (SEQ ID NOs: 11 & 12), SER33 (SEQ ID NOs: 55 & 56), aldehyde reductase YGL039W (SEQ ID NOs: 17 & 18), aldehyde reductase YLR460C (SEQ ID NOs: 13 & 14), aldehyde reductase YPR127W (SEQ ID NOs: 21 & 22), ALD6 (SEQ ID NOs: 33 & 34), GOR1 (SEQ ID NOs: 43 & 44), HMG1 (SEQ ID NOs: 49 & 50), or a homolog thereof.

8. The host cell of any one of claims 1-7, wherein the recombinant host is a microorganism.

9. The host cell of claim 8, wherein the microorganism is Saccharomyces cerevisiae, Schizosaccharomyces pombe, Escherichia coli, or Yarrowia lipolytica.

10. The host cell of any one of claims 1-8, wherein the recombinant host is a plant, an alga, or a cell thereof.

11. A method for producing of a benzylisoquinoline alkaloid or a benzylisoquinoline alkaloid precursor, comprising:

(a) providing a recombinant host capable of producing one or more benzylisoquinoline alkaloids or benzylisoquinoline alkaloid precursors, or both, that has reduced or eliminated activity of (i) a first alcohol dehydrogenase or aldehyde reductase and, optionally, (ii) one or more second alcohol dehydrogenases or aldehyde reductases, or a combination thereof, wherein the activity of each of the enzymes in (i) and (ii) is reduced or eliminated by disrupting or deleting one or more genes encoding said enzyme,

(b) cultivating said recombinant host for a time sufficient for said recombinant host to produce a benzylisoquinoline alkaloid and/or a benzylisoquinoline alkaloid precursor; and, optionally,

(c) isolating the benzylisoquinoline alkaloid and/or a benzylisoquinoline alkaloid precursor from said recombinant host or from the cultivation supernatant, thereby producing a benzylisoquinoline alkaloid and/or a benzylisoquinoline alkaloid precursor.

12. The method of claim 11 , wherein the cell produces one or more benzylisoquinoline alkaloid precursors.

13. The method of claim 11 or claim 12, wherein the cell produces (S)-reticuline.

14. The method of claim 11 or claim 12, wherein the cell produced (S)-norcoclaurine.

15. The method of any one of claims 11-14, wherein the first alcohol dehydrogenase is ADH3 (SEQ ID NOs: 29 & 30), ADH4 (SEQ ID NOs: 31 & 32), ADH5 (SEQ ID NOs:1 & 2), ADH6 (SEQ ID NOs: 3 & 4), ADH7 (SEQ ID NOs: 5 & 6), GRE2 (SEQ ID NOs: 7 & 8), AAD3 (SEQ ID NOs: 25 & 26), AAD4 (SEQ ID NOs: 27 & 28), BDH1 (SEQ ID NOs: 35 & 36), BDH2 (SEQ ID NOs: 37 & 38), ARA1 (SEQ ID NOs: 61 & 62), GCY1 (SEQ ID NOs: 41 & 42), FOX2 (SEQ ID NOs: 39 & 40), YPL088W (SEQ ID NOs: 59 & 60), ZWF1 (SEQ ID NOs: 57 & 58), GPD1 (SEQ ID NOs: 45 & 46), HIS4 (SEQ ID NOs: 47 & 48), IDP1 (SEQ ID NOs: 51 & 52), LYS12 (SEQ ID NOs: 53 & 54), or a homolog thereof.

16. The method of any one of claims 11-14, wherein the first aldehyde reductase is ARM (SEQ ID NOs: 15 & 16), GRE3 (SEQ ID NOs: 9 & 10), YCR102C (SEQ ID NOs: 19 & 20), YDR541 C (SEQ ID NOs: 11 & 12), SER33 (SEQ ID NOs: 55 & 56), YGL039W (SEQ ID NOs: 17 & 18), YLR460C (SEQ ID NOs: 13 & 14), YPR127W (SEQ ID NOs: 21 & 22), ALD6 (SEQ ID NOs: 33 & 34), GOR1 (SEQ ID NOs: 43 & 44), HMG1 (SEQ ID NOs: 49 & 50), or a homolog thereof.

17. The method of claim 15 or claim 16, wherein the one or more second alcohol dehydrogenases or aldehyde reductases, or a combination thereof, is ADH3 (SEQ ID NOs: 29 & 30), ADH4 (SEQ ID NOs: 31 & 32), ADH5 (SEQ ID NOs:1 & 2), ADH6 (SEQ ID NOs: 3 & 4), ADH7 (SEQ ID NOs: 5 & 6), GRE2 (SEQ ID NOs: 7 & 8)„ AAD3 (SEQ ID NOs: 25 & 26), AAD4 (SEQ ID NOs: 27 & 28), BDH1 (SEQ ID NOs: 35 & 36, BDH2 (SEQ ID NOs: 37 & 38), ARA1 (SEQ ID NOs: 61 & 62), GCY1 (SEQ ID NOs: 41 & 42), FOX2 (SEQ ID NOs: 39 & 40), Aryl-alcohol Dehydrogenase YPL088W (SEQ ID NOs: 59 & 60), glucose-6-phosphate dehydrogenase ZWF1 (SEQ ID NOs: 57 & 58), GPD1 (SEQ ID NOs: 45 & 46), HIS4 (SEQ ID NOs: 47 & 48), IDP1 (SEQ ID NOs: 51 & 52), LYS12 (SEQ ID NOs: 53 & 54), ARM (SEQ ID NOs: 15 & 16), GRE3 (SEQ ID NOs: 9 & 10), aldehyde reductase YCR102C (SEQ ID NOs: 19 & 20), aldehyde reductase YDR541 C (SEQ ID NOs: 11 & 12), SER33 (SEQ ID NOs: 55 & 56), aldehyde reductase YGL039W (SEQ ID NOs: 17 & 18), aldehyde reductase YLR460C (SEQ ID NOs: 13 & 14), aldehyde reductase YPR127W (SEQ ID NOs: 21 & 22), ALD6 (SEQ ID NOs: 33 & 34), GOR1 (SEQ ID NOs: 43 & 44), HMG1 (SEQ ID NOs: 49 & 50), or a homolog thereof.

18. The method of any one of claims 11-17, wherein the recombinant host is a microorganism.

19. The method of claim 18, wherein the microorganism is Saccharomyces cerevisiae, Schizosaccharomyces pombe, Escherichia coli, or Yarrowia lipolytica.

20. The method of any one of claims 11-17, wherein the recombinant host is a plant, an alga, or a cell thereof.

Description:

BIOSYNTHESIS OF BENZYLISOQUINOLINE ALKALOIDS AND BENZYLISOQUINOLINE

ALKALOID PRECURSORS

BACKGROUND OF THE INVENTION

Field of the Invention

[0001] The invention disclosed herein relates generally to the field of genetic engineering. Particularly, the invention disclosed herein provides methods for biosynthetic production of benzylisoquinoline alkaloid compounds and benzylisoquinoline alkaloid precursors in a genetically modified cell.

Description of Related Art

[0001] Benzylisoquinoline alkaloids (BIAs) are a broad class of plant secondary metabolites with diverse pharmaceutical properties including, for example, analgesic, antimicrobial, antitussive, antiparasitic, cytotoxic, and anticancer properties (Hagel & Facchini, 2013, Plant Cell Physiol. 54(5); 647-672). Thousands of distinct BIAs have been identified in plants, each of which derive from a common precursor: (S)-norcoclaurine (see e.g., Hagel & Facchini, 2013, Plant Cell Physiol. 54(5); 647-672; Fossati et ai, 2015, PLoS ONE 10(4): e0124459).

[0002] While BIAs are widely used in human health and nutrition, current production is achieved mainly by extraction from plants. However, extraction of these compounds from plants often provides low yields due, in part, to low levels of the metabolites within the plant cells (Nakagawa et ai, 201 1 , Nature Communications, 2:326; DOI:10.1028/ncomms1327). Extraction of sufficient quantities of just the opiate morphine, a widely-prescribed analgesic BIA, to meet medical needs requires industrial processing of tens to hundreds of thousand tons of Papaver somniferum (opium poppy) biomass per year (Thodey and Smoike, 2014, Nat Chem Biol., 10(10):837-844). Chemical synthesis of BIAs is not a viable alternative for commercial production due to the complex regio- and stereochemistry of BIAs (see e.g., Thodey and Smoike, 2014; Hagel and Facchini, 2013).

[0003] Recently, synthesis of BIA branch point intermediate reticuline has been reported from simple carbon sources in E. coli (Nakagawa et al, 2014, Sci Rep., 4:6695) and from (R,S)-norlaudanosoline in S. cerevisiae (Hawkins and Smoike, 2008, Nat Chem Biol., 4:564- 573), and production of morphine and semi-synthetic opioids from thebaine in S. cerevisiae was also recently reported (Thodey et al., 2014, Nat Chem Biol., 10:837-844). However, low yields of intermediates at the beginning of the BIA pathway and the corresponding inability to reconstitute a complete BIA pathway from a low cost substrate currently prevent BIA synthesis from being a viable microbial process (Fossati et al., 2015, PLoS ONE 10(4): e0124459). One such problem to be resolved is the extreme inefficiency in yeast of the initial conversion of dopamine and 4-HPAA (4-hydroxyphenylacetaldehyde) (or 3,4-DHPAA (3,4- Dihydroxyphenylacetaldehyde) in the alternative pathway) via norcoclaurine synthase (NCS), which results in low yields of intermediate (S)-Norcoclaurine ((S)-Norlaudanosoline in the alternative pathway) (see e.g., Hawkins and Smolke, 2008, Nat Chem Biol., 4:564-573). This inefficiency has resulted in requiring fed dopamine concentrations of approximately 100 mM, or bypassing the reaction altogether in favor of using Norcoclaurine or Norlaudanosoline as the initial substrate for conversion to (S)-Reticuline (see Hawkins and Smolke, 2008, Nat Chem Biol., 4:564-573).

[0004] There is thus a need in this art to increase production of metabolic intermediates at the beginning of the BIA pathway to enable production of valuable products of the BIA pathway more efficiently and economically.

SUMMARY OF THE INVENTION

[0005] It is against the above background that this invention provides certain advantages and advancements over the prior art.

[0006] Although this invention disclosed herein is not limited to specific advantages or functionality, the invention disclosed herein provides recombinant host cells capable of increased production of one or more benzylisoquinoline alkaloids or benzylisoquinoline alkaloid precursors, or both, having:

(a) reduced or eliminated enzymatic activity of a first alcohol dehydrogenase or aldehyde reductase; and, optionally,

[0007] The invention further provides methods for producing a benzylisoquinoline alkaloid or a benzylisoquinoline alkaloid precursor, comprising:

(a) providing a recombinant host that has reduced or eliminated activity of (i) a first alcohol dehydrogenase or aldehyde reductase and, optionally, (ii) one or more second alcohol dehydrogenases or aldehyde reductases, or a combination thereof, wherein the activity of each of the enzymes in (i) and (ii) is reduced or eliminated by disrupting or deleting one or more genes encoding said enzyme, wherein said cell has been genetically engineered to produce a benzylisoquinoline alkaloid and/or a benzylisoquinoline alkaloid precursor;

(b) cultivating said recombinant host for a time sufficient for said recombinant host to produce a benzylisoquinoline alkaloid and/or a benzylisoquinoline alkaloid precursor; and, optionally,

[0008] In certain embodiments of the recombinant host cells or the methods disclosed herein, the cells produce one or more benzylisoquinoline alkaloid precursors. Particular benzylisoquinoline alkaloid precursors produced in said embodiments are (S)-reticuline or (S)-norcoclaurine.

[0009] In some aspects, the first alcohol dehydrogenase is Alcohol Dehydrogenase 3 (ADH3) (SEQ ID NOs: 29 & 30), Alcohol Dehydrogenase 4 (ADH4) (SEQ ID NOs: 31 & 32), Alcohol Dehydrogenase 5 (ADH5) (SEQ ID NOs:1 & 2), Alcohol Dehydrogenase 6 (ADH6) (SEQ ID NOs: 3 & 4), Alcohol Dehydrogenase 7 (ADH7) (SEQ ID NOs: 5 & 6), Genes de Respuesta a Estres 2 (GRE2) (SEQ ID NOs: 7 & 8), Aryl-alcohol Dehydrogenase 3 (AAD3) (SEQ ID NOs: 25 & 26), Aryl-alcohol Dehydrogenase 4 (AAD4) (SEQ ID NOs: 27 & 28), Butanediol dehydrogenase 1 (BDH1 ) (SEQ ID NOs: 35 & 36), medium-chain alcohol dehydrogenase BDH2 (SEQ ID NOs: 37 & 38), arabinose dehydrogenase ARA1 (SEQ ID NOs: 61 & 62), glycerol dehydrogenase GCY1 (SEQ ID NOs: 41 & 42), 3-hydroxyacyl-CoA dehydrogenase FOX2 (SEQ ID NOs: 39 & 40), Aryl-alcohol Dehydrogenase YPL088W (SEQ ID NOs: 59 & 60), glucose-6-phosphate dehydrogenase ZWF1 (SEQ ID NOs: 57 & 58), Glycerol-3-Phosphate Dehydrogenase (GPD1 ) (SEQ ID NOs: 45 & 46), HIS4 (SEQ ID NOs: 47 & 48), NADP-specific Isocitrate Dehydrogenase (IDP1 ) (SEQ ID NOs: 51 & 52), homo- isocitrate dehyrogenases (LYS12) (SEQ ID NOs: 53 & 54), or a homolog thereof.

[0010] In some aspects, the first aldehyde reductase is Aldehyde Reductase Intermediate 1 (ARM ) (SEQ ID NOs: 15 & 16), Genes de Respuesta a Estres 3 (GRE3) (SEQ ID NOs: 9 & 10), aldehyde reductase YCR102C (SEQ ID NOs: 19 & 20), aldehyde reductase YDR541 C (SEQ ID NOs: 1 1 & 12), SER33 (SEQ ID NOs: 55 & 56), aldehyde reductase YGL039W (SEQ ID NOs: 17 & 18), aldehyde reductase YLR460C (SEQ ID NOs: 13 & 14), aldehyde reductase YPR127W (SEQ ID NOs: 21 & 22), aldehyde dehydrogenase 6 (ALD6) (SEQ ID NOs: 33 & 34), GlyOxylate Reductase (GOR1 ) (SEQ ID NOs: 43 & 44), 3- Hydroxy-3-MethylGlutaryl-coenzyme a reductase (HMG1 ) (SEQ ID NOs: 49 & 50), or a homolog thereof. [0011] In some aspects, the one or more second alcohol dehydrogenases or aldehyde reductases, or a combination thereof, is ADH3 (SEQ ID NOs: 29 & 30), ADH4 (SEQ ID NOs: 31 & 32), ADH5 (SEQ ID NOs:1 & 2), ADH6 (SEQ ID NOs: 3 & 4), ADH7 (SEQ ID NOs: 5 & 6), GRE2 (SEQ ID NOs: 7 & 8)„ AAD3 (SEQ ID NOs: 25 & 26), AAD4 (SEQ ID NOs: 27 & 28), BDH1 (SEQ ID NOs: 35 & 36, BDH2 (SEQ ID NOs: 37 & 38), ARA1 (SEQ ID NOs: 61 & 62), GCY1 (SEQ ID NOs: 41 & 42), FOX2 (SEQ ID NOs: 39 & 40), Aryl-alcohol Dehydrogenase YPL088W (SEQ ID NOs: 59 & 60), glucose-6-phosphate dehydrogenase ZWF1 (SEQ ID NOs: 57 & 58), GPD1 (SEQ ID NOs: 45 & 46), HIS4 (SEQ ID NOs: 47 & 48), IDP1 (SEQ ID NOs: 51 & 52), LYS12 (SEQ ID NOs: 53 & 54), ARM (SEQ ID NOs: 15 & 16), GRE3 (SEQ ID NOs: 9 & 10), aldehyde reductase YCR102C (SEQ ID NOs: 19 & 20), aldehyde reductase YDR541 C (SEQ ID NOs: 1 1 & 12), SER33 (SEQ ID NOs: 55 & 56), aldehyde reductase YGL039W (SEQ ID NOs: 17 & 18), aldehyde reductase YLR460C (SEQ ID NOs: 13 & 14), aldehyde reductase YPR127W (SEQ ID NOs: 21 & 22), ALD6 (SEQ ID NOs: 33 & 34), GOR1 (SEQ ID NOs: 43 & 44), HMG1 (SEQ ID NOs: 49 & 50), or a homolog thereof.

[0012] In some aspects of the recombinant host cell or methods disclosed herein, the recombinant host is a microorganism.

[0013] In some aspects of the recombinant host cell or methods disclosed herein, the microorganism is Saccharomyces cerevisiae, Schizosaccharomyces pombe, Escherichia coli, or Yarrowia lipolytica.

[0014] In some aspects of the recombinant host cell or methods disclosed herein, the recombinant host is a plant, an alga, or a cell thereof.

[0015] These and other features and advantages of this invention will be more fully understood from the following detailed description of the invention taken together with the accompanying claims. It is noted that the scope of the claims is defined by the recitations therein and not by the specific discussion of features and advantages set forth in the present description.

BRIEF DESCRIPTION OF THE DRAWINGS

[0016] The following detailed description of the embodiments of this invention can be best understood when read in conjunction with the following drawings.

[0017] Figure 1 is a schematic of biosynthesis of benzylisoquinoline alkaloids and benzylisoquinoline alkaloid precursors from L-tyrosine. FIG. 1 includes biosynthesis of (S)- Reticuline via the natural plant pathway, the alternative pathway in bacteria (with bacterial enzymes italicized and underlined), and yeast, which can utilize both the plant and bacterial pathways. Enzymatic examples (with GenBank accession numbers) and other protein abbreviations within FIG. 1 are as follows: TYDC (Tyrosine decarboxylase) of Papaver somniferum (GenBank accession nos. P54768 or U08597) or Thalictrum flavum (GenBank accession no. AF314150); TYR (Tyrosinase) of Rattus norvegicus (GenBank accession no. NM012740) or Streptomyces castaneoglobisporus (ScTYR containing tyrosinase and adaptor protein, ORF378, GenBank accession nos. AY254101 and AY254102); HPPDC (hydroxyphenylpyruvate decarboxylase) of S. cerevisiae (GenBank accession no. NP_010668.3); DODC (aromatic-L-amino-acid decarboxylase) of Pseudomonas putida (GenBank accession no. AE015451 ); MAO (monoamine oxidase) of Micrococcus luteus (GenBank accession no. AB010716); NCS ((S)-norcoclaurine synthase) of Coptis japonica (GenBank accession no. AB267399.2) and S. cerevisiae codon-optimized (SEQ ID NOs: 23 & 24); 60MT (Norcoclaurine 6-O-methyltransferase) of P. somniferum (GenBank accession no. Q6WUC1 ) or C. japonica (GenBank accession no. D2981 1 ); SAM (S-adenosyl-L-methionine); CNMT (Coclaurine-N-methyltransferase) of C. japonica (GenBank accession no. Q948P7) or T. flavum (GenBank accession no. AY610508) or P. somniferum (GenBank accession no. AY217336); CYP80B (N-methylcoclaurine 3'-monooxygenase) of P. somniferum (GenBank accession no. 064899); 4ΌΜΤ (3'-hydrozy-N-methyl-(S)-coclaurine 4'-0-methyltransferase) of C. japonica (GenBank accession no. Q9LEL5); STORR ((S)-to-(R)-reticuline) of P. somniferum (GenBank accession no. P0DKI7); SAS (salutaridine synthase) of P. somniferum (GenBank accession no. EF451 150); SAR (salutaridine reductase) of P. somniferum (GenBank accession no. DQ316261 ); NADPH (nicotinamide adenine dinucleotide phosphate); SAT (salutaridinol acetyl transferase) with acetyl-CoA of P. somniferum (GenBank accession no. AF339913); T60DM (thebaine 6-O-demethylase) of P. somniferum (GenBank accession no. GQ500139); 2-OG (2-oxoglutarate); CODM (codeine 3-O-demethylase) of P. somniferum (GenBank accession no. GQ500141 ); NADH (nicotinamide adenine dinucleotide); morA (morphine 6-dehydrogenase) of Pseudomonas putida (GenBank accession no. T2HEI8); morB (morphinone reductase) of P. putida (GenBank accession no. Q51990); COR (codeinone reductase) of P. somniferum (GenBank accession no. AF108432); CODM (codeine 3-O-demethylase) of P. somniferum (GenBank accession no. D4N502).

[0018] FIG. 2(A) provides results from a first part of a data set of fold-increase of norcoclaurine over the control strain (EVST25620, MATalpha his3A1 leu2A0 lys2A0 ura3A0 [ARS/CEN/URA3/pPGK1 -Cj_NCS_co-tADH1 ]). Norcoclaurine concentrations were measured in duplicate cultures by LC/MS in cell culture supernatants of norcoclaurine synthase expressing single gene deletion strains. Positives singe gene deletions in this dataset with an increase of norcolaurine biosynthesis of at least 10%: AAAD3, AAAD4, AADH3, AADH4, AADH5, AADH6, AADH7, AARA1 , AARI 1 , AALD6, ABDH1 , ABDH2, AFOX2, AGCY1 , AGRE2, AGRE3. FIG. 2(B) provides results from the remaining part of data set of fold increase of norcoclaurine over the control strain (EVST25620, MATalpha his3A1 leu2A0 lys2A0 ura3A0 [ARS/CEN/URA3/pPGK1 -Cj_NCS_co-tADH1]). Norcoclaurine concentrations were measured in duplicate cultures by LC/MS in cell culture supernatants of norcoclaurine synthase expressing single gene deletion strains and multiple deletion strains. Positives single gene deletions in this dataset with an increase of norcolaurine biosynthesis of at least 10%: ASER33, AYCR102C, AYDR541 C, AYGL039W, AYLR460C, AYPL088W, AYPR127, AZWF1. Positive combinations of gene deletions in this data set: AAD H 6/AAD H 7/AAD H 5/ΔΒ G L 1 /AG RE2/AARI 1 ,

AAAD3/AAAD4/AAAD6/AAAD10/AAAD14/AADH6.

[0019] FIG. 3 provides the fold-increase of norcoclaurine concentration in the cell culture supernatant measured by LC/MS over the control strain (EVST25620, MATalpha his3A1 leu2A0 lys2A0 ura3A0 [ARS/CEN/URA3/pPGK1 -Cj_NCS_co-tADH1]). Norcoclaurine concentrations were measured after 72h of cultivation in two independent experiments, average fold increase of norcoclaurine concentrations was calculated. Positive single gene deletions in this dataset with an increase of norcolaurine biosynthesis of at least 10%: AGOR1 , AGPD1 , AHIS4, AHMG1 , AIDP1 , ALYS12.

DETAILED DESCRIPTION OF THE INVENTION

[0020] All publications, patents and patent applications cited herein are hereby expressly incorporated by reference for all purposes.

[0021] Methods well known to those skilled in the art can be used to construct genetic expression constructs and recombinant cells according to this invention. These methods include in vitro recombinant DNA techniques, synthetic techniques, in vivo recombination techniques, and PCR techniques. See, for example, techniques as described in Maniatis et al., 1989, MOLECULAR CLONING: A LABORATORY MANUAL, Cold Spring Harbor Laboratory, New York; Ausubel et al., 1989, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Greene Publishing Associates and Wiley Interscience, New York, and PCR Protocols: A Guide to Methods and Applications (Innis et al., 1990, Academic Press, San Diego, CA).

[0022] Before describing this invention in detail, a number of terms are defined. As used herein, the singular forms "a", "an", and "the" include plural referents unless the context clearly dictates otherwise. For example, reference to a "nucleic acid" means one or more nucleic acids.

[0023] It is noted that terms like "preferably", "commonly", and "typically" are not utilized herein to limit the scope of the claimed invention or to imply that certain features are critical, essential, or even important to the structure or function of the claimed invention. Rather, these terms are merely intended to highlight alternative or additional features that can or cannot be utilized in a particular embodiment of this invention. [0024] For the purposes of describing and defining this invention it is noted that the terms "reduced", "reduction", "increase", "increases", "increased", "greater", 'higher", and "lower" are utilized herein to represent comparisons, values, measurements, or other representations to a stated reference or control.

[0025] For the purposes of describing and defining this invention it is noted that the term "substantially" is utilized herein to represent the inherent degree of uncertainty that can be attributed to any quantitative comparison, value, measurement, or other representation. The term "substantially" is also utilized herein to represent the degree by which a quantitative representation can vary from a stated reference without resulting in a change in the basic function of the subject matter at issue.

[0026] As used herein, the terms "polynucleotide", "nucleotide", "oligonucleotide", and "nucleic acid" can be used interchangeably to refer to nucleic acid comprising DNA, RNA, derivatives thereof, or combinations thereof.

Synthesis of Benzylisoquinoline Alkaloids

[0027] With reference to the metabolic pathway illustrated in Figure 1 , in plants, BIA synthesis proceeds through condensation of the L-tyrosine derivatives L-dopamine and 4- hydroxyphenylacetaldehyde (4-HPAA) to produce (S)-norcoclaurine, which is catalyzed by the enzyme norcoclaurine synthase (NCS) of Coptis japonica (GenBank accession no. AB267399.2) (S. cerevisiae codon-optimized: SEQ ID NOs: 23 & 24) (see e.g., Fossati et al., 2015, PLoS ONE 10(4): e0124459; llari et al., J Biol C em, 2009, 284:897-904; Figure 1 ). (S)- Norcoclaurine is then converted to (S)-Coclaurine by the enzyme 6-O-methyltransferase (6- OMT) of P. somniferum (GenBank accession no. Q6WUC1 ) or C. japonica (GenBank accession no. D2981 1 ), followed by conversion of (S)-Coclaurine to (S)-N-Methylcoclaurine by (CNMT) of C. japonica (GenBank accession no. Q948P7) or T. flavum (GenBank accession no. AY610508) or P. somniferum (GenBank accession no. AY217336); conversion of (S)-N- Methylcoclaurine to (S)-3'-Hydroxy-N-methylcoclaurine by N-methylcoclaurine 3'-hydroxylase (CYP80B) of P. somniferum (GenBank accession no. 064899); and finally conversion of (S)- 3'-Hydroxy-N-methylcoclaurine to the branch point intermediate (S)-reticuline via 4'-0- methyltransferase (4ΌΜΤ) of C. japonica (GenBank accession no. Q9LEL5). Yeast can also utilize the pathway traditionally used by plants.

[0028] An alternative pathway to biosynthesis of (S)-Reticuline also set forth in Figure 1 has been developed in bacteria, but which yeast are also able to utilize, in which the L- tyrosine derivatives L-dopamine and 3,4-Dihydroxyphenylacetaldehyde (3,4-DHPAA) are condensed by norcoclaurine synthase (NCS) of Coptis japonica (GenBank accession no. AB267399.2) and S. cerevisiae codon-optimized (SEQ ID NOs: 23 & 24) to produce (S)- Norlaudanosoline. This alternative pathway continues to produce (S)-Reticuline via conversion of (S)-Norlaudanosoline to (S)-3'-Hydroxycoclaurine by 6-OMT of P. somniferum (GenBank accession no. Q6WUC1 ) or C. japonica (GenBank accession no. D2981 1 ); conversion of (S)- 3'-Hydroxycoclaurine to (S)-3'-Hydroxy-N-methylcoclaurine by CNMT of C. japonica (GenBank accession no. Q948P7) or T. flavum (GenBank accession no. AY610508) or P. somniferum (GenBank accession no. AY217336); and, finally, conversion of (S)-3'-Hydroxy-N- methylcoclaurine to (S)-Reticuline by 4ΌΜΤ of C. japonica (GenBank accession no. Q9LEL5) (Figure 1 ). In plants and microorganisms, synthesis of BIAs from the intermediate (S)- Reticuline proceeds via known enzymatic reactions (see Figure 1 ).

[0029] As disclosed herein, disrupting or knocking out certain enzymes, including alcohol dehydrogenases, and/or aldehyde reductases, or similar enzymes, decreases the amount of 4-hydroxyphenylacetaldehyde (4-HPAA) that is reduced to the byproduct 4- hydroxyphenylacetalcohol. See Figure 1. This is of commercial importance because retention of 4-HPAA in the plant reticuline pathway, or 3,4-DHPAA in the alternative bacterial reticuline pathway improves conversion of dopamine and 4-HPAA or 3,4-DHPAA to (S)-Norcoclaurine and (S)-Norlaudanosoline, respectively, via norcoclaurine synthase (NCS).

[0030] This invention provides a recombinant host that is capable of producing increased amounts of benzylisoquinoline alkaloids (BIAs) and/or benzylisoquinoline alkaloid (BIA) precursors, as disclosed herein, and does not produce, or has reduced production of, one or more alcohol dehydrogenases and/or, one or more aldehyde reductases. A recombinant host that produces or is capable of producing BIAs and/or BIA precursors as disclosed herein is a host cell that expresses the necessary biosynthetic enzymes to produce BIAs and/or BIA precursor from a primary substrate, e.g., glucose, or from an intermediate molecule, e.g., L- tyrosine. See e.g., Fossati et al., 2015, PLoS ONE 10(4): e0124459; llari et a/., J Biol Chem, 2009, 284:897-904; Hawkins and Smolke, 2008, Nat Chem Biol., 4:564-573; Figure 1.

[0031] As used herein a recombinant host that fails to produce an enzyme, has reduced production of an enzyme, or lacks a functional enzyme, includes an organism that has been recombinantly modified such that the gene encoding the enzyme is knocked out, an organism in which the gene encoding the enzyme contains one or more mutations that reduce or diminish the activity of the enzyme compared to a wild-type organism, or an organism wherein the promoter of the gene encoding the enzyme has been modified or deleted so that the enzyme is expressed at a reduced level compared to a wild-type organism or is not expressed.

[0032] Many methods for genetic modification of target genes are known to one skilled in the art and may be used to create recombinant hosts of this invention. Modifications that may be used to reduce or eliminate expression of a target enzyme are disruptions that include, but are not limited to, deletion of the entire gene or a portion of the gene encoding an enzyme; inserting a DNA fragment into a gene encoding the enzyme (in either the promoter or coding region) so that the enzyme is not expressed or expressed at lower levels; introducing a mutation into the coding region for the enzyme, which adds a stop codon or frame shift such that a functional enzyme is not expressed; and introducing one or more mutations, including insertions and deletions, into the coding region of an enzyme to alter amino acids so that a non-functional or a less enzymatically active enzyme is expressed. In addition, expression of an enzyme can be blocked by expression of an antisense RNA or an interfering RNA, and constructs can be introduced that result in co-suppression. In addition, the synthesis or stability of the transcript can be lessened by mutation. Similarly, the efficiency by which an enzyme is translated from mRNA can be modulated by mutation. All of these methods can be readily practiced by one skilled in the art making use of the known sequences encoding the alcohol dehydrogenases and/or aldehyde reductases of this invention.

[0033] Alcohol dehydrogenase and aldehyde reductase sequences from a variety of organisms are known in the art and selection of target gene(s) is dependent upon the host selected. Representative alcohol dehydrogenase (ADH) and aldehyde reductase sequences, which can be targeted in accordance with this invention are listed in Table 1. One skilled in the art can choose specific modification strategies to eliminate or lower the expression of an alcohol dehydrogenase and/or aldehyde reductase as desired to facilitate production of BIAs and/or BIA precursors.

TABLE 1

[0034] In some aspects, the recombinant host cell disclosed herein has reduced or zero activity of a first alcohol dehydrogenase or aldehyde reductase and, optionally, reduced or zero activity of one or more second alcohol dehydrogenases, one or more aldehyde dehyrogenases, or a combination thereof, wherein the activity of each of the alcohol dehydrogenases or aldehyde reductases is reduced or eliminated by having disrupted or deleted one or more genes encoding the enzyme, and whereby the host cell is capable of increased production of one or more benzylisoquinoline alkaloids or benzylisoquinoline alkaloid precursors, or both, than are produced in wild-type cell capable of producing one or more benzylisoquinoline alkaloids or benzylisoquinoline alkaloid precursors.

[0035] In some aspects, a first alcohol dehydrogenase is ADH6 or a homolog thereof, e.g., CAD9, CAD3 or CAD2 from A. thaliana. In some aspects, one or more second alcohol dehydrogenases are ADH7, GRE2 (Genes de Respuesta a Estres 2), or a homolog thereof, e.g., AT1 G51410 or AT5G19440; and the aldehyde reductase is ARM (Aldehyde Reductase Intermediate 1 ), Aldehyde Reductase YGL039W, or a homolog thereof, e.g., SPAC513.07 or YDR541 C).

[0036] DNA sequences surrounding one or more of the above-referenced sequences are also useful in some modification procedures and are available for yeasts such as for Saccharomyces cerevisiae in the complete genome sequence coordinated by NCBI (National Center for Biotechnology Information) with identifying BioProject Nos. PRJNA128, PRJNA13838, PRJNA43747, PRJNA48559, PRJNA52955, PRJNA48569, PRJNA39317. Additional examples of yeast genomic sequences include that of Schizosaccharomyces pombe, which is included in BioProject Nos. PRJNA127, PRJNA13836, and PRJNA20755. Genomic sequences of plants are also known in the art and the genomic sequence of Arabidopsis thaliana is included in BioProject Nos. PRJNA1 16, PRJNA10719, PRJNA13190, and PRJNA3081 1. Other genomic sequences can be readily found by one of skill in the art in publicly available databases.

[0037] In particular, DNA sequences surrounding an alcohol dehydrogenase or aldehyde reductase coding sequence are useful for modification methods using homologous recombination. For example, sequences flanking the gene of interest are placed on either side of a selectable marker gene to mediate homologous recombination whereby the marker gene replaces the gene of interest. Also partial gene sequences and flanking sequences bounding a selectable marker gene may be used to mediate homologous recombination whereby the marker gene replaces a portion of the target gene. In addition, the selectable marker may be bounded by site-specific recombination sites, so that following expression of the corresponding site-specific recombinase, the resistance gene is excised from the gene of interest without reactivating the latter. The site-specific recombination leaves behind a recombination site which disrupts expression of the alcohol dehydrogenase or aldehyde reductase. A homologous recombination vector can be constructed to also leave a deletion in the gene of interest following excision of the selectable marker, as is well known to one skilled in the art.

[0038] Deletions can be made using mitotic recombination as described in Wach et al. (1994, Yeast 10:1793-1808). This method involves preparing a DNA fragment that contains a selectable marker between genomic regions that may be as short as 20 bp, and which bind a target DNA sequence. This DNA fragment can be prepared by PCR amplification of the selectable marker gene using as primers oligonucleotides that hybridize to the ends of the marker gene and that include the genomic regions that can recombine with the yeast genome. The linear DNA fragment can be efficiently transformed into yeast and recombined into the genome resulting in gene replacement including with deletion of the target DNA sequence.

[0039] Moreover, promoter replacement methods may be used to change endogenous transcriptional control elements allowing another means to modulate expression such as described in Mnaimneh et al. (2004, Cell 1 18:31 -44).

[0040] Hosts cells of use in this invention include any organism capable of producing BIAs and/or BIA precursors as disclosed herein, either naturally or synthetically, e.g., by recombinant expression of one or more genes of the BIA biosynthetic pathway (Figure 1 ). A number of prokaryotes and eukaryotes are suitable for use in constructing the recombinant microorganisms described herein, e.g., gram-negative bacteria, gram-positive bacteria, yeast or other fungi. A species and strain selected for use as a BIA and/or BIA precursor production strain is first analyzed to determine which production genes are endogenous to the strain and which genes are not present. Genes for which an endogenous counterpart is not present in the strain are assembled in one or more recombinant constructs, which are then transformed into the strain in order to supply the missing function(s).

[0041] Exemplary prokaryotic and eukaryotic species are described in more detail below. However, it will be appreciated that other species may be suitable. For example, suitable species may be in a genus Agaricus, Aspergillus, Bacillus, Candida, Corynebacterium, Escherichia, Fusarium/Gibberella, Kluyveromyces, Laetiporus, Lentinus, Phaffia, Phanerochaete, Pichia, Physcomitrella, Rhodoturula, Saccharomyces, Schizosaccharomyces, Sphaceloma, Xanthophyllomyces, Yarrowia and Lactobacillus. Exemplary species from such genera include Lentinus tigrinus, Laetiporus sulphureus, Phanerochaete chrysosporium, Pichia pastoris, Physcomitrella patens, Rhodoturula glutinis 32, Rhodoturula mucilaginosa, Phaffia rhodozyma UBV-AX, Xanthophyllomyces dendrorhous, Fusarium fujikuroilGibberella fujikuroi, Candida utilis and Yarrowia lipolytica. In some aspects, a microorganism can be an Ascomycete such as Gibberella fujikuroi, Kluyveromyces lactis, Schizosaccharomyces pombe, Aspergillus niger, or Saccharomyces cerevisiae. In some aspects, a microorganism can be a prokaryote such as Escherichia coli, Rhodobacter sphaeroides, or Rhodobacter capsulatus. It will be appreciated that certain microorganisms can be used to screen and test genes of interest in a high throughput manner, while other microorganisms with desired productivity or growth characteristics can be used for large-scale production of BIAs and/or BIA precursors.

[0042] In some aspects, the recombinant host used with this invention is S. cerevisiae, which can be genetically engineered as described herein. S. cerevisiae is a widely used organism in synthetic biology, and can be used as the recombinant microorganism platform herein. There are libraries of mutants, plasmids, detailed computer models of metabolism and other information available for S. cerevisiae, permitting rational design of various modules to enhance product yield. Methods are known for making recombinant microorganisms. In some aspects, the S. cerevisiae strain is S288C (Mortimer and Johnston, 1986, Genetics 1 13:35- 43).

[0043] Aspergillus species such as A. oryzae, A. niger and A. sojae are widely used microorganisms in food production, and can also be used as the recombinant microorganism platform. Thus, the recombinant host may be Aspergillus spp. Nucleotide sequences are available for genomes of A. nidulans, A. fumigatus, A. oryzae, A. clavatus, A. flavus, A. niger, and A. terreus, allowing rational design and modification of endogenous pathways to enhance flux and increase product yield. Metabolic models have been developed for Aspergillus, as well as transcriptomic studies and proteomics studies.

[0044] £ coli, another widely used platform organism in synthetic biology, can also be used as the recombinant microorganism platform. Similar to Saccharomyces, there are libraries of mutants, plasmids, detailed computer models of metabolism and other information available for £ coli, allowing for rational design of various modules to enhance product yield. Methods similar to those described above for Saccharomyces can be used to make recombinant £. coli microorganisms.

[0045] Rhodobacter can be used as the recombinant microorganism platform. Similar to £ coli, there are libraries of mutants available as well as suitable plasmid vectors, allowing for rational design of various modules to enhance product yield. Methods similar to those described above for £ coli can be used to make recombinant Rhodobacter microorganisms.

[0046] Physcomitrella mosses, when grown in suspension culture, have characteristics similar to yeast or other fungal cultures. These genera are becoming an important type of cell for production of plant secondary metabolites, which can be difficult to produce in other types of cells. Thus, the recombinant host may be a Physcomitrella spp.

[0047] In some aspects, the recombinant host is a plant or plant cells that includes a sufficient number of genes from the BIA biosynthetic pathway set forth in Figure 1 to produce one or more benzylisoquinoline alkaloids or benzylisoquinoline alkaloid precursors, or both. As disclosed herein, a plant or plant cell modified to express the BIA biosynthetic pathway can also contain a knockout of one or more alcohol dehydrogenases and/or aldehyde reductases to advantageously increase the yield thereof. Plant or plant cells can be stably transformed to retain the introduced nucleic acid with each cell division. A plant or plant cell can also be transiently transformed such that the heterologous nucleic acid is not integrated into its genome. Transiently transformed cells typically lose all or some portion of the introduced nucleic acid with each cell division such that the introduced nucleic acid cannot be detected in daughter cells after a sufficient number of cell divisions. Both transiently transformed and stably transformed transgenic plants and plant cells can be useful in the methods described herein.

[0048] Transgenic plant cells used in methods described herein can constitute part or all of a whole plant. Such plants can be grown in a manner suitable for the species under consideration, either in a growth chamber, a greenhouse, or in a field. Transgenic plants can be bred as desired for a particular purpose, e.g., to introduce a heterologous nucleic acid, for example a recombinant nucleic acid construct into other lines, to transfer a heterologous nucleic acid to other species, or for further selection of other desirable traits. Alternatively, transgenic plants can be propagated vegetatively for those species amenable to such techniques. As used herein, a transgenic plant also refers to progeny of an initial transgenic plant provided the progeny inherits the transgene. Seeds produced by a transgenic plant can be grown and then selfed (or outcrossed and selfed) to obtain seeds homozygous for the nucleic acid construct.

[0049] Certain transgenic plants or plant cells can be grown in suspension culture. For the purposes of this invention, solid and/or liquid culture techniques can be used. When using solid medium, transgenic plant cells can be placed directly onto the medium or can be placed onto a filter that is then placed in contact with the medium. When using liquid medium, transgenic plant cells can be placed onto a flotation device, e.g., a porous membrane that contacts the liquid medium.

[0050] When transiently transformed plant cells are used, a reporter sequence encoding a reporter polypeptide having a reporter activity can be included in the transformation procedure and an assay for reporter activity or expression can be performed at a suitable time after transformation. A suitable time for conducting the assay typically is about 1 -21 days after transformation, e.g., about 1 -14 days, about 1 -7 days, or about 1 -3 days. The use of transient assays is particularly convenient for rapid analysis in different species, or to confirm expression of a heterologous polypeptide whose expression has not previously been confirmed in particular recipient cells.

[0051] Techniques for introducing nucleic acids into monocotyledonous and dicotyledonous plants are known in the art, and include, without limitation, Agrobacterium- mediated transformation, viral vector-mediated transformation, electroporation and particle gun transformation; see U.S. Patent Nos. 5,538,880; 5,204,253; 6,329,571 ; and 6,013,863. If a cell or cultured tissue is used as the recipient tissue for transformation, plants can be regenerated from transformed cultures if desired, by techniques known to those skilled in the art.

[0052] A population of transgenic plants can be screened and/or selected for those members of the population that have a trait or phenotype conferred by expression of the transgene. For example, a population of progeny of a single transformation event can be screened for those plants having a desired level of expression of a polypeptide or nucleic acid described herein. Physical and biochemical methods can be used to identify expression levels. These include Southern analysis or PCR amplification for detection of a polynucleotide; northern blots, S1 RNase protection, primer-extension, or RT-PCR amplification for detecting RNA transcripts; enzymatic assays for detecting enzyme or ribozyme activity of polypeptides and polynucleotides; and protein gel electrophoresis, western blots, immunoprecipitation, and enzyme-linked immunoassays to detect polypeptides. Other techniques such as in situ hybridization, enzyme staining, and immunostaining also can be used to detect the presence or expression of polypeptides and/or nucleic acids. Methods for performing all of the referenced techniques are known.

[0053] As an alternative, a population of plants with independent transformation events can be screened for those plants having a desired trait, such as production of BIAs and/or BIA precursors, and/or lack of conversion of 4-HPAA and/or 3,4-DHPAA to 4- hydroxyphenylacetalcohol and 3,4-Dihydroxyphenylacetalcohol, respectively. Selection and/or screening can be carried out over one or more generations, and/or in more than one geographic location. In some cases, transgenic plants can be grown and selected under conditions which induce a desired phenotype or are otherwise necessary to produce a desired phenotype in a transgenic plant. In addition, selection and/or screening can be applied during a particular developmental stage in which the phenotype is expected to be exhibited by the plant.

[0054] Depending on the particular organism used in this invention, the recombinant host cell can naturally or recombinantly express genes encoding a 6-OMT (6-O-methyltransferase) of P. somniferum (GenBank accession no. Q6WUC1 ) or C. japonica (Gen Bank accession no. D2981 1 ), CNMT (Coclaurine N-methyltransferase) of C. japonica (GenBank accession no. Q948P7) or T. flavum (GenBank accession no. AY610508) or P. somniferum (GenBank accession no. AY217336), CYP80B (N-methylcoclaurine 3'-hydroxylase) of P. somniferum (GenBank accession no. 064899), or 4ΌΜΤ (4'-0-methyltransferase) of C. japonica (GenBank accession no. Q9LEL5) (Figure 1 ).

[0055] As used herein, "recombinant expression" means that the genome of a host cell has been augmented through the introduction of one or more recombinant genes, which include regulatory sequences that facilitate the transcription and translation of a protein of interest. While embodiments include stable introduction of recombinant genes into the host genome, autonomous or replicative plasmids or vectors can also be used within the scope of this invention. Moreover, this invention can be practiced using a low copy number, e.g., a single copy, or high copy number (as exemplified herein) plasmid or vector.

[0056] Generally, the introduced recombinant gene is not originally resident in the host that is the recipient of the recombinant gene, but it is within the scope of the invention to isolate a DNA segment from a given host, and to subsequently introduce one or more additional copies of that DNA into the same host, e.g., to enhance production of the product of a gene or alter the expression pattern of a gene. In some instances, the introduced DNA will modify or even replace an endogenous gene or DNA sequence by, e.g., homologous recombination or site-directed mutagenesis. Suitable recombinant hosts include microorganisms, plant cells, and plants.

[0057] The term "recombinant gene" refers to a gene or DNA sequence that is introduced into a recipient host, regardless of whether the same or a similar gene or DNA sequence may already be present in such a host. "Introduced," or "augmented" in this context, is known in the art to mean introduced or augmented by the hand of man. Thus, a recombinant gene may be a DNA sequence from another species, or may be a DNA sequence that originated from or is present in the same species, but has been incorporated into a host by recombinant methods to form a recombinant host. It will be appreciated that a recombinant gene that is introduced into a host can be identical to a DNA sequence that is normally present in the host being transformed, and is introduced to provide one or more additional copies of the DNA to thereby permit overexpression or modified expression of the gene product of that DNA.

[0058] A recombinant gene encoding a polypeptide described herein includes the coding sequence for that polypeptide, operably linked, in sense orientation, to one or more regulatory regions suitable for expressing the polypeptide. Because many microorganisms are capable of expressing multiple gene products from a polycistronic mRNA, multiple polypeptides can be expressed under the control of a single regulatory region for those microorganisms, if desired. A coding sequence and a regulatory region are considered to be operably linked when the regulatory region and coding sequence are positioned so that the regulatory region is effective for regulating transcription or translation of the sequence. Typically, the translation initiation site of the translational reading frame of the coding sequence is positioned between one and about fifty nucleotides downstream of the regulatory region for a monocistronic gene.

[0059] In many cases, the coding sequence for a polypeptide described herein is identified in a species other than the recombinant host, i.e., is a heterologous nucleic acid. The term "heterologous nucleic acid" as used herein, refers to a nucleic acid introduced into a recombinant host, wherein said nucleic acid is not naturally present in said host or members of the host species. Thus, if the recombinant host is a microorganism, the coding sequence can be from other prokaryotic or eukaryotic microorganisms, from plants or from animals. In some case, however, the coding sequence is a sequence that is native to the host and is being reintroduced into that organism. A native sequence can often be distinguished from the naturally occurring sequence by the presence of non-natural sequences linked to the exogenous nucleic acid, e.g., non-native regulatory sequences flanking a native sequence in a recombinant nucleic acid construct. In addition, stably transformed exogenous nucleic acids typically are integrated at positions other than the position where the native sequence is found.

[0060] "Regulatory region" refers to a nucleic acid having nucleotide sequences that influence transcription or translation initiation and rate, and stability and/or mobility of a transcription or translation product. Regulatory regions include, without limitation, promoter sequences, enhancer sequences, response elements, protein recognition sites, inducible elements, protein binding sequences, 5 ^' and 3 ^' untranslated regions (UTRs), transcriptional start sites, termination sequences, polyadenylation sequences, introns, and combinations thereof. A regulatory region typically includes at least a core (basal) promoter. A regulatory region also may include at least one control element, such as an enhancer sequence, an upstream element or an upstream activation region (UAR). A regulatory region is operably linked to a coding sequence by positioning the regulatory region and the coding sequence so that the regulatory region is effective for regulating transcription or translation of the sequence. For example, to operably link a coding sequence and a promoter sequence, the translation initiation site of the translational reading frame of the coding sequence is typically positioned between one and about fifty nucleotides downstream of the promoter. A regulatory region can, however, be positioned as much as about 5,000 nucleotides upstream of the translation initiation site, or about 2,000 nucleotides upstream of the transcription start site.

[0061] The choice of regulatory regions to be included depends upon several factors, including, but not limited to, efficiency, selectability, inducibility, desired expression level, and preferential expression during certain culture stages. It is a routine matter for one of skill in the art to modulate the expression of a coding sequence by appropriately selecting and positioning regulatory regions relative to the coding sequence. It will be understood that more than one regulatory region may be present, e.g., introns, enhancers, upstream activation regions, transcription terminators, and inducible elements.

[0062] One or more genes, for example one or more heterologous nucleic acids, can be combined in a recombinant nucleic acid construct in "modules" useful for a discrete aspect of BIA and/or BIA precursor production. Combining a plurality of genes or heterologous nucleic acids in a module facilitates the use of the module in a variety of species. For example, a BIA and/or BIA precursor gene cluster can be combined such that each coding sequence is operably linked to a separate regulatory region, to form a BIA and/or BIA precursor module for production in eukaryotic organisms. Alternatively, the module can express a polycistronic message for production of BIAs and/or BIA precursors in prokaryotic hosts such as species of Rodobacter, E. coli, Bacillus or Lactobacillus. In addition to genes useful for production of BIAs and/or BIA precursors, a recombinant construct typically also contains an origin of replication, and one or more selectable markers for maintenance of the construct in appropriate species. [0063] It will be appreciated that because of the degeneracy of the genetic code, a number of nucleic acids can encode a particular polypeptide; i.e., for many amino acids, there is more than one nucleotide triplet that serves as the codon for the amino acid. Thus, codons in the coding sequence for a given polypeptide can be modified such that optimal expression in a particular host is obtained, using appropriate codon bias tables for that host (e.g., microorganism). As isolated nucleic acids, these modified sequences can exist as purified molecules and can be incorporated into a vector or a virus for use in constructing modules for recombinant nucleic acid constructs.

Functional Homologs

[0064] Functional homologs of the polypeptides described herein are also suitable for use in producing benzylisoquinoline alkaloid compounds and benzylisoquinoline alkaloid precursors in a recombinant host. A functional homolog is a polypeptide that has sequence similarity to a reference polypeptide, and that carries out one or more of the biochemical or physiological function(s) of the reference polypeptide. A functional homolog and the reference polypeptide can be a naturally occurring polypeptide, and the sequence similarity can be due to convergent or divergent evolutionary events. As such, functional homologs are sometimes designated in the literature as homologs or orthologs. Variants of a naturally occurring functional homolog, such as polypeptides encoded by mutants of a wild type coding sequence, can themselves be functional homologs. Functional homologs can also be created via site-directed mutagenesis of the coding sequence for a polypeptide, or by combining domains from the coding sequences for different naturally-occurring polypeptides ("domain swapping"). Techniques for modifying genes encoding functional polypeptides described herein are known and include, inter alia, directed evolution techniques, site- directed mutagenesis techniques and random mutagenesis techniques, and can be useful to increase specific activity of a polypeptide, alter substrate specificity, alter expression levels, alter subcellular location, or modify polypeptide-polypeptide interactions in a desired manner. Such modified polypeptides are considered functional homologs. The term "functional homolog" is sometimes applied to the nucleic acid that encodes a functionally homologous polypeptide.

[0065] Functional homologs can be identified by analysis of nucleotide and polypeptide sequence alignments. For example, performing a query on a database of nucleotide or polypeptide sequences can identify homologs of benzylisoquinoline alkaloid compounds and benzylisoquinoline alkaloid precursors. Amino acid sequence similarity allows for conservative amino acid substitutions, such as inter alia substitution of one hydrophobic residue for another or substitution of one polar residue for another. If desired, manual inspection of such candidates can be carried out in order to narrow the number of candidates to be further evaluated. [0066] Typically, polypeptides that exhibit at least about 40% amino acid sequence identity are useful to identify conserved regions. Conserved regions of related polypeptides exhibit at least 45% amino acid sequence identity (e.g., at least 50%, at least 60%, at least 70%, at least 80%, or at least 90% amino acid sequence identity). In some embodiments, a conserved region exhibits at least 92%, 94%, 96%, 98%, or 99% amino acid sequence identity.

[0067] A candidate sequence typically has a length that is from 80% to 200% of the length of the reference sequence, e.g., 82, 85, 87, 89, 90, 93, 95, 97, 99, 100, 105, 1 10, 1 15, 120, 130, 140, 150, 160, 170, 180, 190, or 200% of the length of the reference sequence. A functional homolog polypeptide typically has a length that is from 95% to 125% of the length of the reference sequence, e.g., 90, 93, 95, 97, 99, 100, 105, 1 10, 1 15, or 120% of the length of the reference sequence, or any range between. A % identity for any candidate nucleic acid or polypeptide relative to a reference nucleic acid or polypeptide can be determined as follows. A reference sequence (e.g., a nucleic acid sequence or an amino acid sequence described herein) is aligned to one or more candidate sequences using the computer program ClustalW (version 1 .83, default parameters), which allows alignments of nucleic acid or polypeptide sequences to be carried out across their entire length (global alignment). See, Chenna et al., 2003, Nucleic Acids Res. 31 (13):3497-500.

[0068] ClustalW calculates the best match between a reference and one or more candidate sequences, and aligns them so that identities, similarities and differences can be determined. Gaps of one or more residues can be inserted into a reference sequence, a candidate sequence, or both, to maximize sequence alignments. For fast pairwise alignment of nucleic acid sequences, the following default parameters are used: word size: 2; window size: 4; scoring method: %age; number of top diagonals: 4; and gap penalty: 5. For multiple alignment of nucleic acid sequences, the following parameters are used: gap opening penalty: 10.0; gap extension penalty: 5.0; and weight transitions: yes. For fast pairwise alignment of protein sequences, the following parameters are used: word size: 1 ; window size: 5; scoring method:%age; number of top diagonals: 5; gap penalty: 3. For multiple alignment of protein sequences, the following parameters are used: weight matrix: blosum; gap opening penalty: 10.0; gap extension penalty: 0.05; hydrophilic gaps: on; hydrophilic residues: Gly, Pro, Ser, Asn, Asp, Gin, Glu, Arg, and Lys; residue-specific gap penalties: on. The ClustalW output is a sequence alignment that reflects the relationship between sequences. ClustalW can be run, for example, at the Baylor College of Medicine Search Launcher site on the World Wide Web (searchlauncher.bcm.tmc.edu/multi-align/multi- align.html) and at the European Bioinformatics Institute site on the World Wide Web (ebi.ac.uk/clustalw). [0069] To determine %-identity of a candidate nucleic acid or amino acid sequence to a reference sequence, the sequences are aligned using ClustalW, the number of identical matches in the alignment is divided by the length of the reference sequence, and the result is multiplied by 100. It is noted that the% identity value can be rounded to the nearest tenth. For example, 78.1 1 , 78.12, 78.13, and 78.14 are rounded down to 78.1 , while 78.15, 78.16, 78.17, 78.18, and 78.19 are rounded up to 78.2.

[0070] To demonstrate expression and activity of one or more of the above-referenced enzymes expressed by the recombinant host, levels of products, substrates and intermediates, e.g., 4-HPAA, 3,4-DHPAA, (S)-Norcoclaurine, (S)-Norlaudanosoline, L- Tyrosine, Dopamine, and/or benzylisoquinoline alkaloids produced by the recombinant host can be determined by extracting samples from culture media for analysis according to published methods.

[0071] Recombinant hosts described herein can be used in methods to produce BIAs and/or BIA precursors. For example, if the recombinant host is a microorganism, the method can include growing a recombinant microorganism genetically engineered to produce BIAs and/or BIA precursors in a culture medium under conditions in which biosynthesis genes for BIAs and/or BIA precursors are expressed. The recombinant microorganism may be grown in a batch, fed batch or continuous process or combinations thereof. Typically, the recombinant microorganism is grown in a fermenter at a defined temperature(s) in the presence of a suitable nutrient source, e.g., a carbon source, for a desired period of time to produce a desired amount of BIAs and/or BIA precursors.

[0072] Therefore, this invention also provides an improved method for producing BIAs and/or BIA precursors as disclosed herein by providing a recombinant host that produces BIAs and/or BIA precursors as disclosed herein and has reduced production or activity of at least one alcohol dehydrogenase, at least one aldehyde reductase, or at least one alcohol dehydrogenase and at least one aldehyde reductase; cultivating said recombinant host, e.g., in the presence of a suitable carbon source, for a time sufficient for said recombinant host to produce BIAs and/or BIA precursors as disclosed herein; and isolating BIAs and/or BIA precursors as disclosed herein from said recombinant host or from the cultivation supernatant. In some aspects, the recombinant host produces a reduced amount of 4- hydroxyphenylacetalcohol or 3,4-dihydroxyphenylacetalcohol in comparison to a host that expresses the one or more functional alcohol dehydrogenases or one or more aldehyde reductases.

[0073] The level of 4-hydroxyphenylacetaldehyde (4-HPAA) and 4- hydroxyphenylacetalcohol, and/or 3,4-dihydroxyphenylacetaldehyde (3,4-DHPAA) and 3,4- dihydroxyphenylacetalcohol may be determined by any suitable method useful for detecting these compounds. Such methods include, for example, HPLC. Similarly, the level of a specific BIA and/or BIA precursor, such as but not limited to, Dopamine, 4-HPAA, 3,4-DHPAA, (S)- Norcoclaurine, (S)-Norlaudanosoline, and (S)-Reticuline may be determined using any suitable method useful for detecting these compounds. Such methods include, for example, HPLC.

[0074] Carbon sources of use in the method of this invention include any molecule that can be metabolized by a suitably modified recombinant host cell to facilitate growth and/or production of BIAs and/or BIA precursors as disclosed herein. Examples of suitable carbon sources include, but are not limited to, sucrose {e.g., as found in molasses), fructose, xylose, ethanol, glycerol, glucose, cellulose, starch, cellobiose or other glucose containing polymer. In embodiments employing yeast as a host, for example, carbons sources such as sucrose, fructose, xylose, ethanol, glycerol, and glucose are suitable. The carbon source can be provided to the host organism throughout the cultivation period or alternatively, the organism can be grown for a period of time in the presence of another energy source, e.g., protein, and then provided with a source of carbon only during the fed-batch phase.

[0075] After a suitably modified recombinant host has been grown in culture for the desired period of time, BIAs and/or BIA precursors can then be recovered from the culture using various techniques known in the art, e.g., isolation and purification by extraction, vacuum distillation and multi-stage re-crystallization from aqueous solutions and ultrafiltration (Boddeker, et al. (1997) J. Membrane Sci. 137:155-158; Borges da Silva, et al. (2009) Chem. Eng. Des. 87:1276-1292). If the recombinant host is a plant or plant cells, BIAs and/or BIA precursors can be extracted from the plant tissue using various techniques known in the art.

[0076] In some embodiments, BIAs and/or BIA precursors can be produced using suitably modified whole cells that are fed raw materials that contain precursor molecules. The raw materials may be fed during cell growth or after cell growth. The whole cells may be in suspension or immobilized. The whole cells may be in fermentation broth or in a reaction buffer. In some embodiments a permeabilizing agent may be required for efficient transfer of substrate into the cells.

[0077] In some aspects, a BIA and/or BIA precursor is isolated and purified to homogeneity {e.g., at least 90%, 92%, 94%, 96%, or 98% pure). In some aspects, the BIA and/or BIA precursor is isolated as an extract from a suitably modified recombinant host. In this respect, BIA and/or BIA precursor may be isolated, but not necessarily purified to homogeneity. Desirably, the amount of BIA and/or BIA precursor produced can be from about 1 mg/l to about 20,000 mg/L or higher. For example about 1 to about 100 mg/L, about 30 to about 100 mg/L, about 50 to about 200 mg/L, about 100 to about 500 mg/L, about 100 to about 1 ,000 mg/L, about 250 to about 5,000 mg/L, about 1 ,000 to about 15,000 mg/L, or about 2,000 to about 10,000 mg/L of BIA and/or BIA precursor can be produced. In general, longer culture times will lead to greater amounts of product. Thus, the recombinant microorganism can be cultured for from 1 day to 7 days, from 1 day to 5 days, from 3 days to 5 days, about 3 days, about 4 days, or about 5 days.

[0078] It will be appreciated that the various genes and modules discussed herein can be present in two or more recombinant microorganisms rather than a single microorganism. When a plurality of suitably modified recombinant microorganisms is used, they can be grown in a mixed culture to produce BIAs and/or BIA precursors.

[0079] Extracts of isolated, and optionally purified, BIAs and/or BIA precursors find use in a wide variety of pharmaceutical compositions.

[0080] The invention is further described in the following examples, which do not limit the scope of the invention described in the claims.

EXAMPLES

Example 1 : Identification of Gene Candidates

[0081] Gene candidates shown in Figures 2A and 2B were identified in the S. cerevisiae genome either by annotated information on alcohol- and/or aldehyde dehydrogenases in the Saccharomyces Genome Database (http://www.yeastgenome.org/) or by sequence homology searches against the S. cerevisiae genome. In addition, all RefSeq Protein sequences were downloaded from NCBI on November 13th, 2015 (totally 5915 Sequences). Those sequences were scanned with PRIAM (Claudel-Renard et al. 2003, Nucleic Acids Res. 31 (22):6633-39) for hits to EC 1 .1 .1 in order to identify further candidates (Figure 3). Seventy-two single gene deletions (generated as described in Example 2) were tested and list of the single gene deletions which were shown to work is presented in Table 2 and gene combinations are shown in Table 3.

Table 2. Single gene deletions shown to increase norcoclaurine biosynthesis.

Standard Systematic Strain Annotation

Name Name number

dehydrogenase

ARM YGL157W EVST25577 NADPH-dependent aldehyde

reductase

BDH1 YAL060W EVST25586 NAD-dependent (R,R)-butanediol

dehydrogenase

BDH2 YAL061W EVST25587 Putative medium-chain alcohol

dehydrogenase with similarity to

BDH1

FOX2 YKR009C EVST25593 3-hydroxyacyl-CoA dehydrogenase

and enoyl-CoA hydratase

GCY1 YOR120W EVST25594 Glycerol dehydrogenase

GOR1 YNL274C EVST27673 Glyoxylate reductase

GPD1 YDL022W EVST27687 NAD-dependent glycerol-3-phosphate

dehydrogenase

GRE2 YOL151W EVST25578 3-methylbutanal reductase and

NADPH-dependent methylglyoxal reductase

GRE3 YHR104W EVST25579 Aldose reductase

HIS4 YCL030C EVST27654 Multifunctional enzyme containing

phosphoribosyl-ATP

pyrophosphatase, phosphoribosyl- AMP cyclohydrolase, and histidinol dehydrogenase activities

HMG1 YML075C EVST27685 HMG-CoA reductase

IDP1 YDL066W EVST27690 Mitochondrial NADP-specific

isocitrate dehydrogenase

LYS12 YIL094C EVST27692 Homo-isocitrate dehydrogenase

SER33 YIL074C EVST25600 3-phosphoglycerate dehydrogenase

and alpha-ketoglutarate reductase

ZWF1 YNL241 C EVST25705 Glucose-6-phosphate dehydrogenase

YCR102C EVST25581 Putative protein of unknown function

YDR541 C EVST25582 Aldehyde reductase

YGL039W EVST25583 Aldehyde reductase

YLR460C EVST25584 Member of the quinone

oxidoreductase family

YPL088W EVST25701 Putative aryl alcohol dehydrogenase

YPR127W EVST25698 Putative pyridoxine 4-dehydrogenase

Table 3: Multiple Gene Deletions tested for increase of norcoclaurine biosynthesis.

Standard Name Systematic Name Strain Annotation

AAD3/AAD4/AAD6/A YCR107VWYDL243 EVST25618 Combination of putative AD10/AAD14/ADH6 aryl-alcohol

YFL056C/YJR155 dehydrogenases with W/ YNL331 C alcohol dehydrogenase

Example 2: Construction and Cultivation of Assay Strains

[0082] All single gene deletion strains were constructed from the Yeast MATalpha Collection YSC1054 (GE Dharmacon) which is based on the strain BY4742 with the genotype MAT alpha his3A1 leu2A0 lys2A0 ura3A0 (GenBank accession no. JRIR00000000). Deletion strains were generated using homologous recombination methods, by deletion of the respective target gene, as identified for each strain in Table 2. As an indirect measure for 4- hydroyxphenyl acetaldehyde (4-HPAA), strains overexpressing norcoclaurine synthase from a plasmid were generated. Control strain EVST25620 (MAT alpha his3A1 leu2A0 lys2A0 ura3A0 [ARS/CEN/URA3/pPGK1 -Cj_NCS_co-tADH 1]) was prepared accordingly in the BY4742 background, as described above, that did not carry any additional deletions.

[0083] Multiple deletion strains EVST25618 and EVST25619 were constructed from the previously described strain YSC1054 (based on strain BY4742; genotype MAT alpha his3A1 leu2A0 lys2A0 ura3A0). Deletion strains were generated using homologous recombination methods, with sequential deletion of either the genes: (1 ) AAD3, AAD4, AAD6, (Putative aryl-alcohol dehydrogenase 6; YFL056C), AAD10 (Putative aryl-alcohol dehydrogenase 10), AAD14 (Putative aryl-alcohol dehydrogenase), ADH6; or (2) ADH6, ADH7, ADH5, EXG1 (EXo-1 ,3-beta-Glucanase), GRE2, ARM , respectively.

[0084] Coptis japonica norcoclaurine synthase (GenBank accession number AB267399.2) was codon optimized for S. cerevisiae (SEQ ID NOs: 23 & 24) and synthesized de novo (GeneArt). An open reading frame flanked by Hind\\\ and Sacll restriction enzyme recognition sites was cloned into /-// ^'ndlll/Sacll linearized vector backbone pEVE2120 (SEQ ID NO: 63) resulting in plasmid pEV27735 (SEQ ID NO: 64). Clones were verified by sequencing, and the yeast single deletion mutant strains, as well as the non-deleted control strain, were transformed with plasmid pEV27735 (SEQ ID NO: 64). Single clones grown on selective SC-agar plates lacking uracil were singled out on selective SC-agar plates. One single clone in duplicates was used to inoculate 500 μΙ SC minus uracil selective media, supplemented with 1 mM tyrosine and 9.8 mM dopamine, in single wells of 96-deep well plates. Cultures were grown for 72h at 30°C with shaking at 300 rpm. Optical density of the cultures was measured at 600 nm either by a standard method using a spectrophotometer or a plate reader. For analysis of norcoclaurine biosynthesis the plates were centrifuged for 5 min at 3000 rpm and 100 μΙ of the supernatant were withdrawn. Table 4: Average absorption values (OD ₆₀₀) of duplicate cultures after cultivation time of 72h measured with a standard spectrophotometer.

Gene Average Average

deletion ODeoo Gene deletion ODeoo

AAAD3 12.3 AALD6 13.8

AAAD4 12.5 AARA1 12.8

AADH3 12.0 AARI 1 13.0

AADH4 12.8 ABDH1 1 1.8

AADH5 13.3 ABDH2 13.8

AADH6 13.0 AFOX2 13.8

AADH7 12.3 AGCY1 1 1.5

AGRE2 13.5

AGRE3 12.3

control (BY4742) 13.3

Table 5: Average absorption values (OD600) of duplicate cultures after cultivation time of 72 h measured with a standard spectrophotometer.

Table 6: Absorption values (OD600) of cultures of one of the two independent experiments carried out in this study after a cultivation time of 72 h measured with a standard plate reader.

Genotype Absorption

AGOR1 6.1

AGPD1 9.7

ALYS12 5.5

AHIS4 5.2

AHMG1 5.7

Example 3: Measurement of Norcoclaurine in Cell Culture Media

[0085] Norcoclaurine analysis was carried out on an Acquity UPLC-SQD apparatus (Waters) equipped with an Acquity BEH C18 1 .7μηι 2.1 x100mm reverse phase column (Waters) kept at 35°C. 5μΙ of culture supernatant were loaded onto the column and separated using a gradient from 2% Solvent B to 30% Solvent B in 5 min, then washed with 100% Solvent B for 1 minute and reconditioned at 2% Solvent B for another minute. Solvent A consisted of water with 0.1 % formic acid and Solvent B consisted of acetonitrile with 0.1 % formic acid. The flow rate was 0.4ml/min. Norcoclaurine was quantified by single ion monitoring of m/z 272 [M+H] ⁺ at 2.42 min and a calibration curve prepared in culture medium covering the concentration range of 78 μg L to 10 mg/L.

[0086] Norcoclaurine concentrations were normalized to the optical density (OD ₆oo) of the cultures after cultivation (72 h), and fold increase of norcoclaurine concentrations were calculated from the normalized results. The control strain (EVST25620, MATalpha his3A1 Leu2A0 lys2A0 ura3A0 [ARS/CEN/URA3/pPGK1 -Cj_NCS_co-tADH1]) was set at a fold increase of 1 .0. Positives singe gene deletions with an increase of norcolaurine biosynthesis of at least 10% were shown for: AAAD3, AAAD4, AADH3, AADH4, AADH5, AADH6, AADH7, AARA1 , AARI 1 , AALD6, ABDH1 , ABDH2, AFOX2, AGCY1 , AGRE2, AGRE3, ASER33, AYCR102C, AYDR541 C, AYGL039W, AYLR460C, AYPL088W, AYPR127, AZWF1 , AGOR1 , AGPD1 , AHIS4, AHMG1 , AIDP1 , ALYS12 (Figures 2 and 3).

Table 7: Disclosed Nucleic Acid and Amino Acid Sequences

GAAAATTGGAATATAAAGACGTCACAGTTCCGGAACCTAAGCCTAACGAAATTTTAG

TCCACGTTAAATATTCTGGTGTTTGTCATAGTGACTTGCACGCGTGGCACGGTGATT

GGCCATTTCAATTGAAATTTCCATTAATCGGTGGTCACGAAGGTGCTGGTGTTGTTG

TTAAGTTGGGATCTAACGTTAAGGGCTGGAAAGTCGGTGATTTTGCAGGTATAAAAT

GGTTGAATGGGACTTGCATGTCCTGTGAATATTGTGAAGTAGGTAATGAATCTCAAT

GTCCTTATTTG G ATG GTACTG G CTTCACACATG ATG GTACTTTTCAAG AATACG CAA

CTGCCGATGCCGTTCAAGCTGCCCATATTCCACCAAACGTCAATCTTGCTGAAGTTG

CCCCAATCTTGTGTGCAGGTATCACTGTTTATAAGGCGTTGAAAAGAGCCAATGTGA

TACCAGGCCAATGGGTCACTATATCCGGTGCATGCGGTGGCTTGGGTTCTCTGGCA

ATCCAATACGCCCTTGCTATGGGTTACAGGGTCATTGGTATCGATGGTGGTAATGCC

AAGCGAAAGTTATTTGAACAATTAGGCGGAGAAATATTCATCGATTTCACGGAAGAA

AAAGACATTGTTGGTGCTATAATAAAGGCCACTAATGGCGGTTCTCATGGAGTTATT

AATGTGTCTGTTTCTGAAGCAGCTATCGAGGCTTCTACGAGGTATTGTAGGCCCAAT

GGTACTGTCGTCCTGGTTGGTATGCCAGCTCATGCTTACTGCAATTCCGATGTTTTC

AATCAAGTTGTAAAATCAATCTCCATCGTTGGATCTTGTGTTGGAAATAGAGCTGAT A

CAAGGGAGGCTTTAGATTTCTTCGCCAGAGGTTTGATCAAATCTCCGATCCACTTAG

CTGGCCTATCGGATGTTCCTGAAATTTTTGCAAAGATGGAGAAGGGTGAAATTGTTG

GTAGATATGTTGTTGAGACTTCTAAATGA

Protein sequence from alcohol dehydrogenase 6 (ADH6) of

SEQ ID N0:3

Saccharomyces cerevisiae

MSYPEKFEGIAIQSHEDWKNPKKTKYDPKPFYDHDIDIKIEACGVCGSDIHCAAGHWGN

MKMPLWGHEIVGKVVKLGPKSNSGLKVGQRVGVGAQVFSCLECDRCKNDNEPYCTK

FVTTYSQPYEDGYVSQGGYANYVRVHEHFVVPIPENIPSHLAAPLLCGGLTVYSPLV RN

GCGPGKKVGIVGLGGIGSMGTLISKAMGAETYVISRSSRKREDAMKMGADHYIATLE EG

DWGEKYFDTFDLIWCASSLTDIDFNIMPKAMKVGGRIVSISIPEQHEMLSLKPYGLK AVS

ISYSALGSIKELNQLLKLVSEKDIKIWVETLPVGEAGVHEAFERMEKGDVRYRFTLV GYD

KEFSD

DNA sequence encoding alcohol dehydrogenase 6 (ADH6)

SEQ ID NO:4

Saccharomyces cerevisiae

ATGTCTTATCCTGAGAAATTTGAAGGTATCGCTATTCAATCACACGAAGATTGGAAAA

ACCCAAAGAAGACAAAGTATGACCCAAAACCATTTTACGATCATGACATTGACATTA A

GATCGAAGCATGTGGTGTCTGCGGTAGTGATATTCATTGTGCAGCTGGTCATTGGG

GCAATATGAAGATGCCGCTAGTCGTTGGTCATGAAATCGTTGGTAAAGTTGTCAAGC

TAGGGCCCAAGTCAAACAGTGGGTTGAAAGTCGGTCAACGTGTTGGTGTAGGTGCT

CAAGTCTTTTCATGCTTGGAATGTGACCGTTGTAAGAATGATAATGAACCATACTGC A

CCAAGTTTGTTACCACATACAGTCAGCCTTATGAAGACGGCTATGTGTCGCAGGGTG

GCTATGCAAACTACGTCAGAGTTCATGAACATTTTGTGGTGCCTATCCCAGAGAATA

TTCCATCACATTTGGCTGCTCCACTATTATGTGGTGGTTTGACTGTGTACTCTCCAT T

GGTTCGTAACGGTTGCGGTCCAGGTAAAAAAGTTGGTATAGTTGGTCTTGGTGGTAT

CGGCAGTATGGGTACATTGATTTCCAAAGCCATGGGGGCAGAGACGTATGTTATTTC

TCGTTCTTCGAGAAAAAGAGAAGATGCAATGAAGATGGGCGCCGATCACTACATTG

CTACATTAGAAGAAGGTGATTGGGGTGAAAAGTACTTTGACACCTTCGACCTGATTG

TAGTCTGTGCTTCCTCCCTTACCGACATTGACTTCAACATTATGCCAAAGGCTATGA A

GGTTGGTGGTAGAATTGTCTCAATCTCTATACCAGAACAACACGAAATGTTATCGCT

AAAGCCATATGGCTTAAAGGCTGTCTCCATTTCTTACAGTGCTTTAGGTTCCATCAA A

GAATTGAACCAACTCTTGAAATTAGTCTCTGAAAAAGATATCAAAATTTGGGTGGAA A

CATTACCTGTTGGTGAAGCCGGCGTCCATGAAGCCTTCGAAAGGATGGAAAAGGGT

GACGTTAGATATAGATTTACCTTAGTCGGCTACGACAAAGAATTTTCAGACTAG

Protein sequence from alcohol dehydrogenase 7 (ADH7) of

SEQ ID NO:5

Saccharomyces cerevisiae

MLYPEKFQGIGISNAKDWKHPKLVSFDPKPFGDHDVDVEIEACGICGSDFHIAVGNWGP VPENQILGHEIIGRVVKVGSKCHTGVKIGDRVGVGAQALACFECERCKSDNEQYCTNDH VLTMWTPYKDGYISQGGFASHVRLHEHFAIQIPENIPSPLAAPLLCGGITVFSPLLRNGC GPGKRVGIVGIGGIGHMGILLAKAMGAEVYAFSRGHSKREDSMKLGADHYIAMLEDKG WTEQYSNALDLLVVCSSSLSKVNFDSIVKIMKIGGSIVSIAAPEVNEKLVLKPLGLMGVS IS

SSAIGSRKEIEQLLKLVSEKNVKIWVEKLPISEEGVSHAFTRMESGDVKYRFTLVDY DKK

FHK

DNA sequence encoding alcohol dehydrogenase 7 (ADH7) of

SEQ ID N0:6

Saccharomyces cerevisiae

ATGCTTTACCCAGAAAAATTTCAGGGCATCGGTATTTCCAACGCAAAGGATTGGAAG

CATCCTAAATTAGTGAGTTTTGACCCAAAACCCTTTGGCGATCATGACGTTGATGTT

GAAATTGAAGCCTGTGGTATCTGCGGATCTGATTTTCATATAGCCGTTGGTAATTGG

GGTCCAGTCCCAGAAAATCAAATCCTTGGACATGAAATAATTGGCCGCGTGGTGAA

GGTTGGATCCAAGTGCCACACTGGGGTAAAAATCGGTGACCGTGTTGGTGTTGGTG

CCCAAGCCTTGGCGTGTTTTGAGTGTGAACGTTGCAAAAGTGACAACGAGCAATACT

GTACCAATGACCACGTTTTGACTATGTGGACTCCTTACAAGGACGGCTACATTTCAC

AAGGAGGCTTTGCCTCCCACGTGAGGCTTCATGAACACTTTGCTATTCAAATACCAG

AAAATATTCCAAGTCCGCTAGCCGCTCCATTATTGTGTGGTGGTATTACAGTTTTCT C

TCCACTACTAAGAAATGGCTGTGGTCCAGGTAAGAGGGTAGGTATTGTTGGCATCG

GTGGTATTGGGCATATGGGGATTCTGTTGGCTAAAGCTATGGGAGCCGAGGTTTAT

GCGTTTTCGCGAGGCCACTCCAAGCGGGAGGATTCTATGAAACTCGGTGCTGATCA

CTATATTG CTATGTTG G AG G ATAAAG GCTG G ACAG AACAATACTCTAACG CTTTG GA

CCTTCTTGTCGTTTGCTCATCATCTTTGTCGAAAGTTAATTTTGACAGTATCGTTAA G

ATTATGAAGATTGGAGGCTCCATCGTTTCAATTGCTGCTCCTGAAGTTAATGAAAAG

CTTGTTTTAAAACCGTTGGGCCTAATGGGAGTATCAATCTCAAGCAGTGCTATCGGA

TCTAGGAAGGAAATCGAACAACTATTGAAATTAGTTTCCGAAAAGAATGTCAAAATA T

GGGTGGAAAAACTTCCGATCAGCGAAGAAGGCGTCAGCCATGCCTTTACAAGGATG

GAAAGCGGAGACGTCAAATACAGATTTACTTTGGTCGATTATGATAAGAAATTCCAT A

AATAG

Protein sequence from Genes de Respuesta a Estres 2 (GRE2) of

SEQ ID NO:7

Saccharomyces cerevisiae

MSVFVSGANGFIAQHIVDLLLKEDYKVIGSARSQEKAENLTEAFGNNPKFSMEVVPDISK

LDAFDHVFQKHGKDIKIVLHTASPFCFDITDSERDLLIPAVNGVKGILHSIKKYAAD SVERV

VLTSSYAAVFDMAKENDKSLTFNEESWNPATWESCQSDPVNAYCGSKKFAEKAAWEF

LEENRDSVKFELTAVNPVYVFGPQMFDKDVKKHLNTSCELVNSLMHLSPEDKIPELF GG

YIDVRDVAKAHLVAFQKRETIGQRLIVSEARFTMQDVLDILNEDFPVLKGNIPVGKP GSG

ATHNTLGATLDNKKSKKLLGFKFRNLKETIDDTASQILKFEGRI

DNA sequence encoding Genes de Respuesta a Estres 2 (GRE2) of

SEQ ID NO:8

Saccharomyces cerevisiae

ATGTCAGTTTTCGTTTCAGGTGCTAACGGGTTCATTGCCCAACACATTGTCGATCTC

CTGTTGAAGGAAGACTATAAGGTCATCGGTTCTGCCAGAAGTCAAGAAAAGGCCGA

GAATTTAACGGAGGCCTTTGGTAACAACCCAAAATTCTCCATGGAAGTTGTCCCAGA

CATATCTAAG CTG GACG CATTTG AC CATGTTTTCCAAAAG CACGG CAAG GATATCAA

GATAGTTCTACATACGGCCTCTCCATTCTGCTTTGATATCACTGACAGTGAACGCGA

TTTATTAATTCCTGCTGTGAACGGTGTTAAGGGAATTCTCCACTCAATTAAAAAATA C

GCCGCTGATTCTGTAGAACGTGTAGTTCTCACCTCTTCTTATGCAGCTGTGTTCGAT

ATGGCAAAAGAAAACGATAAGTCTTTAACATTTAACGAAGAATCCTGGAACCCAGCT

ACCTGGGAGAGTTGCCAAAGTGACCCAGTTAACGCCTACTGTGGTTCTAAGAAGTTT

GCTGAAAAAGCAGCTTGGGAATTTCTAGAGGAGAATAGAGACTCTGTAAAATTCGAA

TTAACTGCCGTTAACCCAGTTTACGTTTTTGGTCCGCAAATGTTTGACAAAGATGTG A

AAAAACACTTGAACACATCTTGCGAACTCGTCAACAGCTTGATGCATTTATCACCAG

AGGACAAGATACCGGAACTATTTGGTGGATACATTGATGTTCGTGATGTTGCAAAGG

CTCATTTAGTTGCCTTCCAAAAGAGGGAAACAATTGGTCAAAGACTAATCGTATCGG

AGGCCAGATTTACTATGCAGGATGTTCTCGATATCCTTAACGAAGACTTCCCTGTTC

TAAAAGGCAATATTCCAGTGGGGAAACCAGGTTCTGGTGCTACCCATAACACCCTTG

GTGCTACTCTTGATAATAAAAAGAGTAAGAAATTGTTAGGTTTCAAGTTCAGGAACT T

G AAAG AG AC C ATTG AC G AC ACTG C CTC C C AAATTTTAAAATTTG AG G G C AG AATATA

A Protein sequence from Genes de Respuesta a Estres 3 (GRE3) of

SEQ ID NO:9

Saccharomyces cerevisiae

MSSLVTLNNGLKMPLVGLGCWKIDKKVCANQIYEAIKLGYRLFDGACDYGNEKEVGEGI

RKAISEGLVSRKDIFVVSKLWNNFHHPDHVKLALKKTLSDMGLDYLDLYYIHFPIAF KYVP

FEEKYPPGFYTGADDEKKGHITEAHVPIIDTYRALEECVDEGLIKSIGVSNFQGSLI QDLL

RGCRIKPVALQIEHHPYLTQEHLVEFCKLHDIQWAYSSFGPQSFIEMDLQLAKTTPT LFE

NDVIKKVSQNHPGSTTSQVLLRWATQRGIAVIPKSSKKERLLGNLEIEKKFTLTEQE LKDI

SALNANIRFNDPWTWLDGKFPTFA

DNA sequence encoding Genes de Respuesta a Estres 3 (GRE3) of

SEQ ID NO:10

Saccharomyces cerevisiae

ATGTCTTCACTGGTTACTCTTAATAACGGTCTGAAAATGCCCCTAGTCGGCTTAGGG

TGCTGGAAAATTGACAAAAAAGTCTGTGCGAATCAAATTTATGAAGCTATCAAATTA G

GCTACCGTTTATTCGATGGTGCTTGCGACTACGGCAACGAAAAGGAAGTTGGTGAA

G GTATCAGG AAAGC CATCTC CGAAG GTCTTGTTTCTAG AAAG GATATATTTGTTGTTT

CAAAGTTATGGAACAATTTTCACCATCCTGATCATGTAAAATTAGCTTTAAAGAAGA C

CTTAAGCGATATGGGACTTGATTATTTAGACCTGTATTATATTCACTTCCCAATCGC C

TTCAAATATGTTCCATTTGAAGAGAAATACCCTCCAGGATTCTATACGGGCGCAGAT

GACGAGAAGAAAGGTCACATCACCGAAGCACATGTACCAATCATAGATACGTACCG

GGCTCTGGAAGAATGTGTTGATGAAGGCTTGATTAAGTCTATTGGTGTTTCCAACTT

TCAGGGAAGCTTGATTCAAGATTTATTACGTGGTTGTAGAATCAAGCCCGTGGCTTT

GCAAATTGAACACCATCCTTATTTGACTCAAGAACACCTAGTTGAGTTTTGTAAATT A

CACGATATCCAAGTAGTTGCTTACTCCTCCTTCGGTCCTCAATCATTCATTGAGATG

G ACTTACAGTTG G CAAAAAC CACG CCAACTCTGTTCG AGAATG ATGTAATCAAGAAG

GTCTCACAAAACCATCCAGGCAGTACCACTTCCCAAGTATTGCTTAGATGGGCAACT

CAGAGAGGCATTGCCGTCATTCCAAAATCTTCCAAGAAGGAAAGGTTACTTGGCAAC

CTAGAAATCGAAAAAAAGTTCACTTTAACGGAGCAAGAATTGAAGGATATTTCTGCA

CTAAATGCCAACATCAGATTTAATGATCCATGGACCTGGTTGGATGGTAAATTCCCC

ACTTTTGCCTGA

Protein sequence from carbonyl reductase (NADPH-dependent)

SEQ ID NO:1 1

(YDR541 C) of Saccharomyces cerevisiae

MSNTVLVSGASGFIALHILSQLLKQDYKVIGTVRSHEKEAKLLRQFQHNPNLTLEIVPDI S

HPNAFDKVLQKRGREIRYVLHTASPFHYDTTEYEKDLLIPALEGTKNILNSIKKYAA DTVE

RVWTSSCTAIITLAKMDDPSVVFTEESWNEATWESCQIDGINAYFASKKFAEKAAWE FT

KENEDHIKFKLTTVNPSLLFGPQLFDEDVHGHLNTSCEMINGLIHTPVNASVPDFHS IFID

VRDVALAHLYAFQKENTAGKRLVVTNGKFGNQDILDILNEDFPQLRGLIPLGKPGTG DQV

IDRGSTTDNSATRKILGFEFRSLHESVHDTAAQILKKQNRL

DNA sequence encoding carbonyl reductase (NADPH-dependent)

SEQ ID NO:12

(YDR541 C) of Saccharomyces cerevisiae

ATGTCTAATACAGTTCTAGTTTCTGGCGCTTCAGGTTTTATTGCCTTGCATATCCTGT

CACAATTGTTAAAACAAGATTATAAGGTTATTGGAACTGTGAGATCCCATGAAAAAG A

AGCAAAATTGCTAAGACAATTTCAACATAACCCTAATTTAACTTTAGAAATTGTTCC G

GACATTTCTCATCCAAATGCTTTCGATAAGGTTCTGCAGAAACGTGGACGTGAGATT

AGGTATGTTCTACACACGGCCTCTCCTTTTCATTATGATACTACCGAATATGAAAAA G

ACTTATTGATTCCCGCGTTAGAAGGTACAAAAAACATCCTAAATTCTATCAAGAAAT A

TG CAG CAGACACTGTAG AG CGTGTTGTTGTGACTTCTTCTTGTACTG CTATTATAAC

CCTTG CAAAGATG GACG ATCCCAGTGTG GTTTTTACAG AAGAG AGTTG GAAC GAAG

CAACCTGG G AAAG CTGTCAAATTGATG GG ATAAATG CTTACTTTG CATCC AAGAAGT

TTG CTGAAAAGG CTG CCTG G GAGTTCACAAAAGAG AATGAAGATCACATCAAATTCA

AACTAACAACAGTCAACCCTTCTCTTCTTTTTGGTCCTCAACTTTTCGATGAAGATG T

GCATGGCCATTTGAATACTTCTTGCGAAATGATCAATGGCCTAATTCATACCCCAGT

AAATGCCAGTGTTCCTGATTTTCATTCCATTTTTATTGATGTAAGGGATGTGGCCCT A

GCTCATCTGTATGCTTTCCAGAAGGAAAATACCGCGGGTAAAAGATTAGTGGTAACT

AACGGTAAATTTGGAAACCAAGATATCCTGGATATTTTGAACGAAGATTTTCCACAA T

TAAGAGGTCTCATTCCTTTGGGTAAGCCTGGCACAGGTGATCAAGTCATTGACCGC GGTTCAACTACAGATAATAGTGCAACGAGGAAAATACTTGGCTTTGAGTTCAGAAGT TTACACGAAAGTGTCCATGATACTGCTGCCCAAATTTTGAAGAAGCAGAACAGATTA TGA

SEQ ID NO:13 Protein sequence from YLR460C of Saccharomyces cerevisiae

MQVAIPETMKAWIEDGKAVVKEGIPIPELEEGFVLIKTLAVAGNPTDWAHIDYKIGPQGS I

LGCDAAGQIVKLGPAVNPKDFSIGDYIYGFIHGSSVRFPSNGAFAEYSAISTVVAYK SPN

ELKFLGEDVLPAGPVRSLEGVATIPVSLTTAGLVLTYNLGLDLKWEPSTPQRKGPIL LWG

GATAVGQSLIQLANKLNGFTKIIWASRKHEKLLKEYGADELFDYHDIDVVEQIKHKY NNIS

YLVDCVANQDTLQQVYKCAADKQDATIVELKNLTEENVKKENRRQNVTIDIIRLYSI GGH

EVPFGNITLPADSEARKAAIKFIKFINPKINDGQIRHIPVRVYKNGLCDVPHILKDI KYGKNS

GEKLVAVLN

SEQ ID NO:14 DNA sequence encoding YLR460C of Saccharomyces cerevisiae

ATGCAAGTTG CAATTCC AG AAACCATG AAG G CTGTC GTCATTG AAG ACG GTAAAG C

GGTTGTTAAAGAGGGCATTCCCATTCCTGAATTGGAAGAAGGATTCGTATTGATTAA

GACACTCGCTGTTGCTGGTAACCCCACTGATTGGGCACACATTGACTACAAGATCG

GGCCTCAAGGATCTATTCTGGGATGTGATGCTGCTGGCCAAATTGTCAAATTGGGC

CCAGCTGTCAATCCTAAAGACTTTTCTATCGGTGATTATATTTATGGGTTCATTCAC G

GATCTTCCGTAAGGTTTCCTTCCAATGGTGCTTTTGCTGAATATTCTGCTATTTCAA C

TGTGGTTGCCTACAAATCACCCAATGAACTCAAATTTTTGGGTGAGGATGTTCTACC

TGCCGGCCCTGTCAGGTCTTTGGAAGGTGTAGCCACTATCCCAGTGTCACTGACCA

CAGCCGGCTTGGTGTTGACCTATAACTTGGGCTTGGACCTGAAGTGGGAGCCATCA

ACCCCACAAAGAAAAGGCCCCATCTTATTATGGGGCGGTGCAACTGCAGTAGGTCA

GTCGCTCATCCAATTAGCCAATAAATTGAATGGCTTCACCAAGATCATTGTTGTGGC

TTCTCGGAAGCACGAAAAACTTTTGAAAGAATATGGTGCTGATGAATTATTTGATTA T

CATGATATTGACGTGGTAGAACAAATTAAACACAAGTACAACAATATCTCGTATTTA G

TCGACTGTGTCGCGAATCAAGATACGCTTCAACAAGTGTACAAATGTGCGGCCGATA

AACAGGATGCTACAATTGTTGAATTAAAAAATTTGACAGAAGAAAACGTCAAAAAAG A

GAACAGGAGACAAAACGTTACTATTGACATAATAAGGCTATATTCAATAGGTGGCCA

TG AAGTAC C ATTTG G AAAC ATTACTTTAC C AG C C G ACT C AG AAG CTAG G AAAG CT G C

AATAAAATTTATCAAATTCATCAATCCAAAGATTAATGATGGACAAATTCGCCATAT TC

CAGTAAGGGTCTATAAGAACGGGCTTTGTGATGTTCCTCATATCCTAAAAGACATCA

AATATGGTAAGAACTCTGGTGAAAAACTCGTTGCCGTATTAAACTAG

Protein sequence from carbonyl reductase (NADPH-dependent) (ARM )

SEQ ID NO:15

of Saccharomyces cerevisiae

MTTDTTVFVSGATGFIALHIMNDLLKAGYTVIGSGRSQEKNDGLLKKFNNNPKLSMEIVE

DIAAPNAFDEVFKKHGKEIKIVLHTASPFHFETTNFEKDLLTPAVNGTKSILEAIKK YAADT

VEKVIVTSSTAALVTPTDMNKGDLVITEESWNKDTWDSCQANAVAAYCGSKKFAEKT A

WEFLKENKSSVKFTLSTINPGFVFGPQMFADSLKHGINTSSGIVSELIHSKVGGEFY NYC

GPFIDVRDVSKAHLVAIEKPECTGQRLVLSEGLFCCQEIVDILNEEFPQLKGKIATG EPAT

GPSFLEKNSCKFDNSKTKKLLGFQFYNLKDCIVDTAAQMLEVQNEA

DNA sequence encoding carbonyl reductase (NADPH-dependent)

SEQ ID NO:16

(AR11 ) of Saccharomyces cerevisiae

ATGACTACTGATACCACTGTTTTCGTTTCTGGCGCAACCGGTTTCATTGCTCTACACA

TTATGAACGATCTGTTGAAAGCTGGCTATACAGTCATCGGCTCAGGTAGATCTCAAG

AAAAAAATGATGGCTTGCTCAAAAAATTTAATAACAATCCCAAACTATCGATGGAAA T

TGTGGAAGATATTGCTGCTCCAAACGCCTTTGATGAAGTTTTCAAAAAACATGGTAA

GGAAATTAAGATTGTGCTACACACTGCCTCCCCATTCCATTTTGAAACTACCAATTT T

GAAAAGGATTTACTAACCCCTGCAGTGAACGGTACAAAATCTATCTTGGAAGCGATT

AAAAAATATGCTGCAGACACTGTTGAAAAAGTTATTGTTACTTCGTCTACTGCTGCT C

TGGTGACACCTACAGACATGAACAAAGGAGATTTGGTGATCACGGAGGAGAGTTGG

AATAAGGATACATGGGACAGTTGTCAAGCCAACGCCGTTGCCGCATATTGTGGCTC

G AAAAAGTTTG CTG AAAAAACTG CTTG G GAATTTCTTAAAG AAAACAAGTCTAGTGTC

AAATTCACACTATCCACTATCAATCCGGGATTCGTTTTTGGTCCTCAAATGTTTGCA G

ATTCGCTAAAACATGGCATAAATACCTCCTCAGGGATCGTATCTGAGTTAATTCATT C CAAGGTAGGTGGAGAATTTTATAATTACTGTGGCCCATTTATTGACGTGCGTGACGT

TTCTAAAGCCCACCTAGTTGCAATTGAAAAACCAGAATGTACCGGCCAAAGATTAGT

ATTGAGTGAAGGTTTATTCTGCTGTCAAGAAATCGTTGACATCTTGAACGAGGAATT

CCCTCAATTAAAGGGCAAGATAGCTACAGGTGAACCTGCGACCGGTCCAAGCTTTTT

AGAAAAAAACTCTTG CAAGTTTG ACAATTCTAAGACAAAAAAACTACTG GG ATTC CAG

TTTTACAATTTAAAGGATTGCATAGTTGACACCGCGGCGCAAATGTTAGAAGTTCAA A

ATGAAGCCTAA

Protein sequence from carbonyl reductase (NADPH-dependent)

SEQ ID NO:17

(YGL039W) of Saccharomyces cerevisiae

MTTEKTVVFVSGATGFIALHVVDDLLKTGYKVIGSGRSQEKNDGLLKKFKSNPNLSMEIV

EDIAAPNAFDKVFQKHGKEIKWLHIASPVHFNTTDFEKDLLIPAVNGTKSILEAIKN YAAD

TVEKWITSSVAALASPGDMKDTSFVVNEESWNKDTWESCQANAVSAYCGSKKFAEKT

AWDFLEENQSSIKFTLSTINPGFVFGPQLFADSLRNGINSSSAIIANLVSYKLGDNF YNYS

GPFIDVRDVSKAHLLAFEKPECAGQRLFLCEDMFCSQEALDILNEEFPQLKGKIATG EPG

SGSTFLTKNCCKCDNRKTKNLLGFQFNKFRDCIVDTASQLLEVQSKS

DNA sequence encoding carbonyl reductase (NADPH-dependent)

SEQ ID NO:18

(YGL039VV) of Saccharomyces cerevisiae

ATGACTACTGAAAAAACCGTTGTTTTTGTTTCTGGTGCTACTGGTTTCATTGCTCTAC

ACGTAGTGGACGATTTATTAAAAACTGGTTACAAGGTCATCGGTTCGGGTAGGTCCC

AAGAAAAGAATGATGGATTGCTGAAAAAATTTAAGAGCAATCCCAACCTTTCAATGG

AGATTGTCGAAGACATTGCTGCTCCAAACGCTTTTGACAAAGTTTTTCAAAAGCACG

G CAAAGAGATCAAG GTTGTCTTGCACATAG CTTCTCCG GTTCACTTC AACAC CACTG

ATTTCGAAAAGGATCTGCTAATTCCTGCTGTGAATGGTACCAAGTCCATTCTAGAAG

CAATCAAAAATTATGCCGCAGACACAGTCGAAAAAGTCGTTATTACTTCTTCTGTTG C

TGCCCTTGCATCTCCCGGAGATATGAAGGACACTAGTTTCGTTGTCAATGAGGAAAG

TTGGAACAAAGATACTTGGGAAAGTTGTCAAGCTAACGCGGTTTCCGCATACTGTGG

TTCCAAGAAATTTGCTGAAAAAACTGCTTGGGATTTTCTCGAGGAAAACCAATCAAG

CATCAAATTTACGCTATCAACCATCAACCCAGGATTTGTTTTTGGCCCTCAGCTATT T

GCCGACTCTCTTAGAAATGGAATAAATAGCTCTTCAGCCATTATTGCCAATTTGGTT A

GTTATAAATTAGGCGACAATTTTTATAATTACAGTGGTCCTTTTATTGACGTTCGCG A

TGTTTCAAAAGCTCATTTACTTGCATTTGAGAAACCCGAATGCGCTGGCCAAAGACT

ATTCTTATGTGAAGATATGTTTTGCTCTCAAGAAGCGCTGGATATCTTGAATGAGGA A

TTTCCACAGTTAAAAGGCAAGATAGCAACTGGCGAACCTGGTAGCGGCTCAACCTTT

TTGACAAAAAACTGCTGCAAGTGCGACAACCGCAAAACCAAAAATTTATTAGGATTC

CAATTTAATAAGTTCAGAGATTGCATTGTCGATACTGCCTCGCAATTACTAGAAGTT C

AAAGTAAAAG CTAA

SEQ ID NO:19 Protein sequence from YCR102C of Saccharomyces cerevisiae

MKAVVIEDGKAVVKEGVPIPELEEGFVLIKTLAVAGNPTDWAHIDYKVGPQGSILGCDAA

GQIVKLGPAVDPKDFSIGDYIYGFIHGSSVRFPSNGAFAEYSAISTVVAYKSPNELK FLGE

DVLPAGPVRSLEGAATIPVSLTTAGLVLTYNLGLNLKWEPSTPQRNGPILLWGGATA VG

QSLIQLANKLNGFTKIIWASRKHEKLLKEYGADQLFDYHDIDWEQIKHKYNNISYLV DCV

ANQNTLQQVYKCAADKQDATWELTNLTEENVKKENRRQNVTIDRTRLYSIGGHEVPF G

GITFPADPEARRAATEFVKFINPKISDGQIHHIPARVYKNGLYDVPRILEDIKIGKN SGEKL

VAVLN

SEQ ID NO:20 DNA sequence encoding YCR102C of Saccharomyces cerevisiae

ATGAAGGCTGTCGTCATTGAAGACGGTAAAGCGGTTGTCAAAGAGGGCGTTCCCAT

TCCTGAATTGGAAGAAGGATTCGTATTGATTAAGACACTCGCTGTTGCTGGTAACCC

GACTGATTGGGCACACATTGACTACAAGGTCGGGCCTCAAGGATCTATTCTGGGAT

GTGACGCTGCCGGCCAAATTGTCAAATTGGGCCCAGCCGTCGATCCTAAAGACTTT

TCTATTGGTGATTATATTTATGGGTTCATTCACGGATCTTCCGTAAGGTTTCCTTCC A

ATGGTGCTTTTGCTGAATATTCTGCTATTTCAACTGTGGTTGCCTACAAATCACCCA A

TGAACTCAAATTTTTGGGTGAAGATGTTCTACCTGCCGGCCCTGTCAGGTCTTTGGA

AGGGGCAGCCACTATCCCAGTGTCACTGACCACAGCTGGCTTGGTGTTGACCTATA

ACTTGGGCTTGAACCTGAAGTGGGAGCCATCAACCCCACAAAGAAACGGCCCCATC TTATTATGGGGCGGTGCAACTGCAGTAGGTCAGTCGCTCATCCAATTAGCCAATAAA

TTGAATGGCTTCACCAAGATCATTGTTGTGGCTTCTCGGAAACACGAAAAACTGTTG

AAAGAATATGGTGCTGATCAACTATTTGATTACCATGATATTGACGTGGTAGAACAA A

TTAAACACAAGTACAACAATATCTCGTATTTAGTCGACTGTGTCGCGAATCAAAATA C

GCTTCAACAAGTGTACAAATGTGCGGCCGATAAACAGGATGCTACCGTTGTCGAATT

AACTAATTTG ACAG AAG AAAACGTCAAAAAG GAG AATAG GAG G CAAAATGTCACTAT

TG ACAG AAC AAGACTGTATTCAATAGG CG G CCATG AAGTAC CATTTG GTGG CATTAC

TTTCCCTGCTGACCCAGAAGCCAGGAGAGCTGCCACCGAATTCGTCAAGTTCATCA

ATCCAAAGATTAGTGATGGGCAAATTCACCATATTCCAGCAAGGGTCTATAAGAACG

GGCTTTACGATGTTCCTCGTATCCTGGAAGACATTAAAATCGGTAAGAACTCTGGTG

AAAAACTAGTTGCCGTATTAAACTAG

Protein sequence from pyridoxine 4-dehydrogenase (YPR127W) of

SEQ ID NO:21

Saccharomyces cerevisiae

MSVADLKNNIHKLDTGYGLMSLTWRAEPIPQSQAFEAMHRWELSRERGHKAFFNVGE

FYGPDFINLSYVHDFFAKYPDLRKDVVISCKGGADNATLTPRGSHDDVVQSVKNSVS AI

GGYIDIFEVARIDTSLCTKGEVYPYESFEALAEMISEGVIGGISLSEVNEEQIRAIH KDWGK

FLTCVEVELSLFSNDILHNGIAKTCAELGLSIICYSPLGRGLLTGQLKSNADIPEGD FRKSL

KRFSDESLKKNLTLVRFLQEEIVDKRPQNNSITLAQLALGWVKHWNKVPEYSGAKFI PIP

SGSSISKVNENFDEQKTKLTDQEFNAINKYLTTFHTVGDRYEMA

DNA sequence encoding pyridoxine 4-dehydrogenase (YPR127W) of

SEQ ID NO:22

Saccharomyces cerevisiae

ATGTCTGTCGCCGATTTGAAAAACAACATCCACAAGTTAGATACTGGCTATGGTTTAA

TGAGTTTGACTTGGAGAGCCGAGCCTATCCCTCAGTCGCAGGCTTTCGAGGCCATG

CACAGAGTGGTTGAGTTATCCAGAGAACGTGGGCACAAGGCCTTTTTCAACGTTGG

TGAATTCTATGGTCCCGATTTTATTAATTTGTCGTATGTTCACGACTTCTTTGCGAA AT

ACCCAGATTTGAGAAAGGATGTGGTTATCAGTTGTAAAGGTGGTGCAGACAATGCTA

CCTTAACCCCCAGAGGCAGTCACGATGATGTTGTACAAAGCGTAAAGAATTCAGTTA

GTGCTATTGGTGGCTACATCGACATCTTCGAAGTCGCAAGAATCGACACTTCCCTAT

GCACGAAAGGAGAGGTCTACCCCTACGAATCGTTCGAAGCGCTTGCTGAGATGATC

TCCGAAGGCGTTATTGGCGGTATTTCATTAAGTGAAGTTAATGAAGAGCAAATTAGA

G CTATTCACAAG G ATTG G GG AAAGTTTTTG AC CTGCGTTG AAGTGG AACTTTCTTTG

TTCAGTAATGACATTTTACACAACG G AATTGCTAAAACATGTG CTG AATTGG G GTTGT

CCATCATCTGCTACTCCCCACTGGGCAGAGGATTGTTGACAGGTCAATTGAAGTCAA

ACGCTGATATCCCTGAGGGTGACTTTAGAAAGTCGTTAAAGAGATTTAGCGACGAGT

CTTTGAAAAAAAACCTGACCTTGGTCAGGTTTCTACAGGAAGAAATAGTCGACAAGC

GCCCACAAAACAACTCCATTACTCTTGCACAACTGGCTTTGGGATGGGTTAAGCACT

GGAACAAAGTTCCGGAATACAGTGGCGCCAAATTTATCCCAATTCCAAGTGGCTCTT

CTATTTCCAAGGTTAATGAAAACTTTGATGAACAGAAAACCAAACTTACCGATCAAG A

GTTCAATGCCATTAACAAATATTTGACTACTTTCCATACTGTTGGTGACAGATACGA A

ATGGCGTAA

DNA sequence encoding norcoclaurine synthase of Coptis japonica,

SEQ ID NO:23

codon optimized for S. cerevisiae with Hindi 11 and Sacll cloning sites

AAGCTTAAAATGAGAATGGAAGTCGTCTTGGTCGTTTTCTTGATGTTCATTGGTACT A

TCAACTGCGAAAGATTGATCTTCAATGGTAGACCTTTGTTGCACAGAGTTACCAAAG

AAGAAACCGTTATGTTGTACCACGAATTGGAAGTTGCTGCTTCTGCTGATGAAGTTT

GGTCTGTTGAAGGTTCTCCAGAATTGGGTTTACATTTGCCAGATTTGTTGCCAGCTG

GTATTTTTGCCAAGTTCGAAATTACTGGTGATGGTGGTGAAGGTTCCATTTTGGATA T

GACTTTTCCACCAGGTCAATTCCCACATCATTACAGAGAAAAGTTCGTCTTTTTCGA C

CACAAGAACAGATACAAGTTGGTCGAACAAATCGATGGTGATTTCTTCGATTTGGGT

GTTACTTACTACATGGACACCATTAGAGTTGTTGCTACTGGTCCAGATTCTTGCGTT A

TTAAGTCTACTACTGAATACCACGTCAAGCCAGAATTTGCTAAAATCGTTAAGCCAT T

GATCGATACCGTTCCATTGGCTATTATGTCTGAAGCTATTGCCAAGGTTGTCTTGGA

AAACAAACACAAGTCATCTGAATGAAAGACTCCGCGG

SEQ ID NO:24 Protein sequence from norcoclaurine synthase of Coptis japonica MRMEWLVVFLMFIGTINCERLIFNGRPLLHRVTKEETVMLYHELEVAASADEVWSVEGS PELGLHLPDLLPAGIFAKFEITGDGGEGSILDMTFPPGQFPHHYREKFVFFDHKNRYKLV EQIDGDFFDLGVTYYMDTIRWATGPDSCVIKSTTEYHVKPEFAKIVKPLIDTVPLAIMSE A

lAKVVLENKHKSSE

SEQ ID NO- 25 P ^rote' ^{n sec}l ^uence f ^rom Aryl-alcohol Dehydrogenase 3 (AAD3) of

Sacc aromyces cerevisiae

MIGSASDSSSKLGRLRFLSETAAI KVSPLILGEVSYDGARSDFLKSMNKNRAFELLDTFYE

AGGNFIDAANNCQNEQSEEWIGEWIQSRRLRDQIVIATKFIKSDKKYKAGESNTANY CGN

HKRSLHVSVRDSLRKLQTDWIDILYVHWWDYMSSIEEFMDSLHILVQQGKVLYLGVS DTP

AWVVSAANYYATSYGKTPFSIYQGKWNVLNRDFERDIIPMARHFGMALAPWDVMGGG R

FQSKKAMEERRKNGEGIRSFVGASEQTDAEIKISEALAKIAEEHGTESVTAIAIAYV RSKAK

NFFPSVEGGKIEDLKENIKALSIDLTPDNIKYLESIVPFDIGFPNNFIVLNSLTQKY GTNNV

SEQ ID NO-26 sequence encoding Aryl-alcohol Dehydrogenase 3 (AAD3) of

Saccharomyces cerevisiae

ATGATTGGGTCCGCGTCCGACTCATCTAGCAAGTTAGGACGCCTCCGATTTCTTTCT

GAAACTGCCGCTATTAAAGTATCCCCGTTAATCCTAGGAGAAGTCTCATACGATGGA

GCACGTTCGGATTTTCTCAAATCAATGAACAAGAATCGAGCTTTTGAATTGCTTGAT A

CTTTTTACGAGGCAGGTGGAAATTTCATTGATGCCGCAAACAACTGCCAAAACGAGC

AATCAGAAGAATGGATTGGTGAATGGATACAGTCCAGAAGGTTACGTGATCAAATTG

TCATTGCAACCAAGTTTATAAAAAGCGATAAAAAGTATAAAGCAGGTGAAAGTAACA C

TGCCAACTACTGTGGTAATCACAAGCGTAGTTTACATGTGAGTGTGAGGGATTCTCT

CCGCAAATTGCAAACTGATTGGATTGATATACTTTACGTTCACTGGTGGGATTATAT G

AGTTCAATCGAAGAATTTATGGATAGTTTGCATATTCTGGTCCAGCAGGGCAAGGTC

CTCTATTTGGGTGTATCTGATACACCTGCTTGGGTTGTTTCTGCGGCAAACTACTAC G

CTACATCTTATGGTAAAACTCCCTTTAGTATCTACCAAGGTAAATGGAACGTGTTGA A

CAGAGATTTTGAGCGTGATATTATTCCAATGGCTAGGCATTTCGGTATGGCCCTCGC

CCCATGGGATGTCATGGGAGGTGGAAGATTTCAGAGTAAAAAAGCAATGGAGGAAC

GGAGGAAGAATGGAGAGGGTATTCGTTCTTTCGTTGGCGCCTCCGAACAAACAGAT

GCAGAAATCAAGATTAGTGAAGCATTGGCCAAGATTGCTGAGGAACATGGCACTGAG

TCTGTTACTGCTATTGCTATTGCCTATGTTCGCTCTAAGGCGAAAAATTTTTTTCCG TC

G GTTG AAG GAG GAAAAATTG AG G ATCTC AAAG AG AACATTAAG GCTCTCAGTATC GA

TCTAACGCCAGACAATATAAAATACTTAGAAAGTATAGTTCCTTTTGACATCGGATT TC

CTAATAATTTTATCGTGTTAAATTCCTTGACTCAAAAATATGGTACGAATAATGTTT AG

Protein sequence from Aryl-alcohol Dehydrogenase 4 (AAD4) of

SEQ ID NO:27

Saccharomyces cerevisiae

MGSMNKEQAFELLDAFYEAGGNCIDTANSYQNEESEIWIGEWMKSRKLRDQIVIATKFTG

DYKKYEVGGGKSANYCGNHKHSLHVSVRDSLRKLQTDWIDILYVHWWDYMSSIEEVM D

SLHILVQQGKVLYLGVSDTPAWWSAANYYATSHGKTPFSIYQGKWNVLNRDFERDII PM

ARHFGMALAPWDVMGGGRFQSKKAMEERKKNGEGLRTVSGTSKQTDKEVKISEALAK V

AEEHGTESVTAIAIAYVRSKAKNVFPLVGGRKIEHLKQNIEALSIKLTPEQIEYLES IIPFDVG

FPTNFIGDDPAVTKKASLLTAMSAQISFD

DNA sequence encoding Aryl-alcohol Dehydrogenase 4 (AAD4) of

SEQ ID NO: 28

Saccharomyces cerevisiae

ATGGGCTCTATGAATAAGGAACAGGCTTTTGAACTTCTTGATGCTTTTTATGAAGCAG

GAGGTAATTGCATTGATACTGCAAACAGTTACCAAAATGAAGAGTCAGAGATTTGGA T

AGGTGAATGGATGAAATCAAGAAAGTTGCGTGACCAAATTGTAATTGCCACCAAGTT T

ACCGGAGATTATAAGAAGTATGAAGTAGGTGGCGGTAAAAGTGCCAACTATTGTGGT

AATCACAAGCATAGTTTACATGTGAGTGTGAGGGATTCTCTCCGCAAATTGCAAACT G

ATTGGATTGATATACTTTACGTTCACTGGTGGGATTATATGAGTTCAATCGAAGAAG T

TATGGATAGTTTGCATATTTTAGTTCAGCAGGGCAAAGTCCTCTATTTGGGTGTGTC T

GATACACCTGCTTGGGTTGTTTCTGCGGCAAACTACTACGCCACATCTCATGGGAAA

ACTCCTTTTAGTATCTATCAAGGTAAATGGAATGTGTTGAACAGGGACTTTGAGCGC G ATATCATTCCAATGGCCAGACATTTTGGTATGGCTCTAGCCCCATGGGATGTTATGG G AG GTGG AAG ATTTCAG AGTAAAAAAG CAATG G AG G AACG GAAG AAG AATG GAG AG G GTCTG CGTACTGTTTCG G GTACTTCTAAACAGACG GATAAAGAG GTTAAGATCAGT GAAGCATTGGCCAAGGTTGCTGAGGAACATGGCACTGAGTCTGTTACTGCTATTGCT ATTGCCTATGTTCGCTCTAAGGCGAAAAATGTTTTCCCATTGGTTGGTGGAAGGAAAA TTG AACACCTCAAACAGAACATTG AG G CTTTAAGTATCAAACTG ACAC CAG AACAG AT AGAATACTTAGAAAGTATTATTCCTTTTGATGTTGGTTTTCCTACTAATTTTATCGGTG ATGATCCGGCTGTTACCAAGAAGGCTTCACTTCTCACGGCAATGTCTGCGCAGATTT CCTTCGATTAA

Protein sequence from Mitochondrial alcohol dehydrogenase isozyme

SEQ ID NO: 29

III (ADH3) of Saccharomyces cerevisiae

MLRTSTLFTRRVQPSLFSRNILRLQSTAAIPKTQKGVIFYENKGKLHYKDIPVPEPKPNE IL

INVKYSGVCHTDLHAWHGDWPLPVKLPLVGGHEGAGWVKLGSNVKGWKVGDLAGIK

WLNGSCMTCEFCESGHESNCPDADLSGYTHDGSFQQFATADAIQAAKIQQGTDLAEV A

PILCAGVTVYKALKEADLKAGDWVAISGAAGGLGSLAVQYATAMGYRVLGIDAGEEK EK

LFKKLGGEVFIDFTKTKNMVSDIQEATKGGPHGVINVSVSEAAISLSTEYVRPCGTV VLV

GLPANAYVKSEVFSHVVKSINIKGSYVGNRADTREALDFFSRGLIKSPIKIVGLSEL PKVY

DLMEKGKILGRYVVDTSK

DNA sequence encoding Mitochondrial alcohol dehydrogenase isozyme

SEQ ID NO: 30

III (ADH3) of Saccharomyces cerevisiae

ATGTTGAGAACGTCAACATTGTTCACCAGGCGTGTCCAACCAAGCCTATTTTCTAGA

AACATTCTTAGATTGCAATCCACAGCTGCAATCCCTAAGACTCAAAAAGGTGTCATC T

TTTATGAGAATAAGGGGAAGCTGCATTACAAAGATATCCCTGTCCCCGAGCCTAAGC

CAAATGAAATTTTAATCAACGTTAAATATTCTGGTGTATGTCACACCGATTTACATG C

TTGGCACGGCGATTGGCCATTACCTGTTAAACTACCATTAGTAGGTGGTCATGAAGG

TGCTGGTGTAGTTGTCAAACTAGGTTCCAATGTCAAGGGCTGGAAAGTCGGTGATTT

AGCAGGTATCAAATGGCTGAACGGTTCTTGTATGACATGCGAATTCTGTGAATCAGG

TCATGAATCAAATTGTCCAGATGCTGATTTATCTGGTTACACTCATGATGGTTCTTT C

CAACAATTTGCGACCGCTGATGCTATTCAAGCCGCCAAAATTCAACAGGGTACCGAC

TTGGCCGAAGTAGCCCCAATATTATGTGCTGGTGTTACTGTATATAAAGCACTAAAA

GAGGCAGACTTGAAAGCTGGTGACTGGGTTGCCATCTCTGGTGCTGCAGGTGGCTT

GGGTTCCTTGGCCGTTCAATATGCAACTGCGATGGGTTACAGAGTTCTAGGTATTGA

TG CAG GTGAG GAAAAGG AAAAACTTTTCAAG AAATTGG G GG GTGAAGTATTCATC GA

CTTTACTAAAACAAAGAATATGGTTTCTGACATTCAAGAAGCTACCAAAGGTGGCCC

TCATGGTGTCATTAACGTTTCCGTTTCTGAAGCCGCTATTTCTCTATCTACGGAATA T

GTTAGACCATGTGGTACCGTCGTTTTGGTTGGTTTGCCCGCTAACGCCTACGTTAAA

TCAGAGGTATTCTCTCATGTGGTGAAGTCCATCAATATCAAGGGTTCTTATGTTGGT A

ACAGAGCTGATACGAGAGAAGCCTTAGACTTCTTTAGCAGAGGTTTGATCAAATCAC

CAATCAAAATTGTTG G ATTATCTGAATTACCAAAG GTTTATG ACTTG ATG G AAAAG GG

CAAGATTTTGGGTAGATACGTCGTCGATACTAGTAAATAA

Protein sequence from Alcohol dehydrogenase isoenzyme type IV

SEQ ID NO: 31

(ADH4) of Saccharomyces cerevisiae

MSSVTGFYIPPISFFGEGALEETADYIKNKDYKKALIVTDPGIAAIGLSGRVQKMLEERD L

NVAIYDKTQPNPNIANVTAGLKVLKEQNSEIWSIGGGSAHDNAKAIALLATNGGEIG DYE

GVNQSKKAALPLFAINTTAGTASEMTRFTIISNEEKKIKMAIIDNNVTPAVAVNDPS TMFGL

PPALTAATGLDALTHCIEAYVSTASNPITDACALKGIDLINESLVAAYKDGKDKKAR TDMC

YAEYLAGMAFNNASLGYVHALAHQLGGFYHLPHGVCNAVLLPHVQEANMQCPKAKKR L

GEIALHFGASQEDPEETIKALHVLNRTMNIPRNLKELGVKTEDFEILAEHAMHDACH LTN

PVQFTKEQWAIIKKAYEY

DNA sequence encoding Alcohol dehydrogenase isoenzyme type IV

SEQ ID NO: 32

(ADH4) of Saccharomyces cerevisiae

ATGTCTTCCGTTACTGGGTTTTACATTCCACCAATCTCTTTCTTTGGTGAAGGTGCTTT AGAAGAAACCGCTGATTACATCAAAAACAAGGATTACAAAAAGGCTTTGATCGTTACT GATCCTGGTATTGCAGCTATTGGTCTCTCCGGTAGAGTCCAAAAGATGTTGGAAGAA CGTGACTTAAACGTTGCTATCTATGACAAAACTCAACCAAACCCAAATATTGCCAATG

TCACAG CTG GTTTGAAGGTTTTG AAG GAAC AAAACTCTG AAATTGTTGTTTCCATTG G

TGGTGGTTCTGCTCACGACAATGCTAAGGCCATTGCTTTATTGGCTACTAACGGTGG

G GAAATCG G AG ACTATG AAG GTGTCAATC AATCTAAG AAG GCTG CTTTACCACTATTT

GCCATCAACACTACTGCTGGTACTGCTTCCGAAATGACCAGATTCACTATTATCTCT A

ATGAAGAAAAGAAAATCAAGATGGCTATCATTGACAACAACGTCACTCCAGCTGTTG C

TGTCAACGATCCATCTACCATGTTTGGTTTGCCACCTGCTTTGACTGCTGCTACTGG T

CTAGATGCTTTGACTCACTGTATCGAAGCTTATGTTTCCACCGCCTCTAACCCAATC A

CCGATGCCTGTGCTTTGAAGGGTATTGATTTGATCAATGAAAGCTTAGTCGCTGCAT A

CAAAGACGGTAAAGACAAGAAGGCCAGAACTGACATGTGTTACGCTGAATACTTGGC

AGGTATGGCTTTCAACAATGCTTCTCTAGGTTATGTTCATGCCCTTGCTCATCAACT T

GGTGGTTTCTACCACTTGCCTCATGGTGTTTGTAACGCTGTCTTGTTGCCTCATGTT C

AAGAGGCCAACATGCAATGTCCAAAGGCCAAGAAGAGATTAGGTGAAATTGCTTTGC

ATTTCGGTG CTTCTCAAG AAG ATCC AG AAG AAAC CATCAAG G CTTTG CACGTTTTAAA

CAGAACCATGAACATTCCAAGAAACTTGAAAGAATTAGGTGTTAAAACCGAAGATTT T

GAAATTTTGGCTGAACACGCCATGCATGATGCCTGCCATTTGACTAACCCAGTTCAA T

TCACCAAAGAACAAGTGGTTGCCATTATCAAGAAAGCCTATGAATATTAA

Protein sequence from Cytosolic aldehyde dehydrogenase (ALD6) of

SEQ ID NO:33

Saccharomyces cerevisiae

MTKLHFDTAEPVKITLPNGLTYEQPTGLFINNKFMKAQDGKTYPVEDPSTENTVCEVSSA

TTEDVEYAIECADRAFHDTEWATQDPRERGRLLSKLADELESQIDLVSSIEALDNGK TLA

LARGDVTIAINCLRDAAAYADKVNGRTINTGDGYMNFTTLEPIGVCGQIIPWNFPIM MLA

WKIAPALAMGNVCILKPAAVTPLNALYFASLCKKVGIPAGWNIVPGPGRTVGAALTN DP

RIRKLAFTGSTEVGKSVAVDSSESNLKKITLELGGKSAHLVFDDANIKKTLPNLVNG IFKN

AGQICSSGSRIYVQEGIYDELLAAFKAYLETEIKVGNPFDKANFQGAITNRQQFDTI MNYI

DIGKKEGAKILTGGEKVGDKGYFIRPTVFYDVNEDMRIVKEEIFGPWTVAKFKTLEE GVE

MANSSEFGLGSGIETESLSTGLKVAKMLKAGTVWINTYNDFDSRVPFGGVKQSGYGR E

MGEEVYHAYTEVKAVRIKL

DNA sequence encoding Cytosolic aldehyde dehydrogenase (ALD6) of

SEQ ID NO:34

Saccharomyces cerevisiae

ATGACTAAGCTACACTTTGACACTGCTGAACCAGTCAAGATCACACTTCCAAATGGT

TTGACATACGAGCAACCAACCGGTCTATTCATTAACAACAAGTTTATGAAAGCTCAA

GACGGTAAGACCTATCCCGTCGAAGATCCTTCCACTGAAAACACCGTTTGTGAGGT

CTCTTCTGCCACCACTGAAGATGTTGAATATGCTATCGAATGTGCCGACCGTGCTTT

CCACGACACTGAATGGGCTACCCAAGACCCAAGAGAAAGAGGCCGTCTACTAAGTA

AGTTG G CTGACG AATTG GAAAG CCAAATTG ACTTG GTTTCTTCCATTG AAG CTTTGG

ACAATGGTAAAACTTTGGCCTTAGCCCGTGGGGATGTTACCATTGCAATCAACTGTC

TAAGAGATGCTGCTGCCTATGCCGACAAAGTCAACGGTAGAACAATCAACACCGGT

GACGGCTACATGAACTTCACCACCTTAGAGCCAATCGGTGTCTGTGGTCAAATTATT

CCATGGAACTTTCCAATAATGATGTTGGCTTGGAAGATCGCCCCAGCATTGGCCATG

GGTAACGTCTGTATCTTGAAACCCGCTGCTGTCACACCTTTAAATGCCCTATACTTT

GCTTCTTTATGTAAGAAGGTTGGTATTCCAGCTGGTGTCGTCAACATCGTTCCAGGT

CCTGGTAGAACTGTTGGTGCTGCTTTGACCAACGACCCAAGAATCAGAAAGCTGGC

TTTTACCGGTTCTACAGAAGTCGGTAAGAGTGTTGCTGTCGACTCTTCTGAATCTAA

CTTGAAGAAAATCACTTTGGAACTAGGTGGTAAGTCCGCCCATTTGGTCTTTGACGA

TG CTAACATTAAG AAGACTTTACCAAATCTAGTAAACG GTATTTTCAAG AACG CTG GT

CAAATTTGTTCCTCTGGTTCTAGAATTTACGTTCAAGAAGGTATTTACGACGAACTA T

TGGCTGCTTTCAAGGCTTACTTGGAAACCGAAATCAAAGTTGGTAATCCATTTGACA

AGGCTAACTTCCAAGGTGCTATCACTAACCGTCAACAATTCGACACAATTATGAACT

ACATCGATATCGGTAAGAAAGAAGGCGCCAAGATCTTAACTGGTGGCGAAAAAGTT

GGTGACAAGGGTTACTTCATCAGACCAACCGTTTTCTACGATGTTAATGAAGACATG

AGAATTGTTAAG G AAG AAATTTTTG G AC CAGTTGTCACTGTCG CAAAGTTCAAGACTT

TAGAAGAAGGTGTCGAAATGGCTAACAGCTCTGAATTCGGTCTAGGTTCTGGTATCG

AAACAGAATCTTTGAGCACAGGTTTGAAGGTGGCCAAGATGTTGAAGGCCGGTACC GTCTGGATCAACACATACAACGATTTTGACTCCAGAGTTCCATTCGGTGGTGTTAAG

CAATCTGGTTACGGTAGAGAAATGGGTGAAGAAGTCTACCATGCATACACTGAAGTA

AAAGCTGTCAGAATTAAGTTGTAA

Protein sequence from NAD-dependent (R,R)-butanediol

SEQ ID NO:35

dehydrogenase (BDH1 ) of Saccharomyces cerevisiae

MRALAYFKKGDIHFTNDIPRPEIQTDDEVIIDVSWCGICGSDLHEYLDGPIFMPKDG ECHK

LSNAALPLAMGHEMSGIVSKVGPKVTKVKVGDHVWDAASSCADLHCWPHSKFYNSKP

CDACQRGSENLCTHAGFVGLGVISGGFAEQVWSQHHIIPVPKEIPLDVAALVEPLSV TW

HAVKISGFKKGSSALVLGAGPIGLCTILVLKGMGASKIWSEIAERRIEMAKKLGVEV FNP

SKHGHKSIEILRGLTKSHDGFDYSYDCSGIQVTFETSLKALTFKGTATNIAVWGPKP VPF

QPMDVTLQEKVMTGSIGYVVEDFEEVVRAIHNGDIAMEDCKQLITGKQRIEDGWEKG FQ

ELMDHKESNVKILLTPNNHGEMK

DNA sequence encoding NAD-dependent (R,R)-butanediol

SEQ ID NO:36

dehydrogenase (BDH1 ) of Saccharomyces cerevisiae

ATGAGAGCTTTGGCATATTTCAAGAAGGGTGATATTCACTTCACTAATGATATCCCT A

GGCCAGAAATCCAAACCGACGATGAGGTTATTATCGACGTCTCTTGGTGTGGGATTT

GTGGCTCGGATCTTCACGAGTACTTGGATGGTCCAATCTTCATGCCTAAAGATGGAG

AGTGCCATAAATTATCCAACGCTGCTTTACCTCTGGCAATGGGCCATGAGATGTCAG

GAATTGTTTCCAAGGTTGGTCCTAAAGTGACAAAGGTGAAGGTTGGCGACCACGTGG

TCGTTGATGCTGCCAGCAGTTGTGCGGACCTGCATTGCTGGCCACACTCCAAATTTT

ACAATTCCAAACCATGTGATGCTTGTCAGAGGGGCAGTGAAAATCTATGTACCCACG

CCGGTTTTGTAGGACTAGGTGTGATCAGTGGTGGCTTTGCTGAACAAGTCGTAGTCT

CTCAACATCACATTATCCCGGTTCCAAAGGAAATTCCTCTAGATGTGGCTGCTTTAG T

TG AG CCTCTTTCTGTCACCTG G CATG CTGTTAAG ATTTCTG GTTTCAAAAAAG G CAGT

TCAGCCTTGGTTCTTGGTGCAGGTCCCATTGGGTTGTGTACCATTTTGGTACTTAAG

GGAATGGGGGCTAGTAAAATTGTAGTGTCTGAAATTGCAGAGAGAAGAATAGAAATG

GCCAAGAAACTGGGCGTTGAGGTGTTCAATCCCTCCAAGCACGGTCATAAATCTATA

GAGATACTACGTGGTTTGACCAAGAGCCATGATGGGTTTGATTACAGTTATGATTGT T

CTG GTATTCAAGTTACTTTCG AAACCTCTTTGAAG G CATTAACATTCAAGG G GACAGC

CACCAACATTGCAGTTTGGGGTCCAAAACCTGTCCCATTCCAACCAATGGATGTGAC

TCTCCAAGAGAAAGTTATGACTGGTTCGATCGGCTATGTTGTCGAAGACTTCGAAGA

AGTTGTTCGTGCCATCCACAACGGAGACATCGCCATGGAAGATTGTAAGCAACTAAT

CACTGGTAAGCAAAGGATTGAGGACGGTTGGGAAAAGGGATTCCAAGAGTTGATGG

ATCACAAGGAATCCAACGTTAAGATTCTATTGACGCCTAACAATCACGGTGAAATGA A

GTAA

Protein sequence from Putative medium-chain alcohol dehydrogenase

SEQ ID NO:37

with similarity to BDH2 (BDH2) of Saccharomyces cerevisiae

MRALAYFGKGNIRFTNHLKEPHIVAPDELVIDIEWCGICGTDLHEYTDGPIFFPEDGHTH E

ISHNPLPQAMGHEMAGTVLEVGPGVKNLKVGDKWVEPTGTCRDRYRWPLSPNVDKE

WCAACKKGYYNICSYLGLCGAGVQSGGFAERWMNESHCYKVPDFVPLDVAALIQPLA

VCWHAIRVCEFKAGSTALIIGAGPIGLGTILALNAAGCKDIVVSEPAKVRRELAEKM GARV

YDPTAHAAKESIDYLRSIADGGDGFDYTFDCSGLEVTLNAAIQCLTFRGTAVNLAMW GH

HKIQFSPMDITLHERKYTGSMCYTHHDFEAVIEALEEGRIDIDRARHMITGRVNIED GLDG

AIMKLINEKESTIKIILTPNNHGELNREADNEKKEISELSSRKDQERLRESINEAKL RHT

DNA sequence encoding Putative medium-chain alcohol dehydrogenase

SEQ ID NO:38

with similarity to BDH2 (BDH2) of Saccharomyces cerevisiae

ATGAGAGCCTTAGCGTATTTCGGTAAAGGTAACATCAGATTCACCAACCATTTAAAGG

AGCCACATATTGTGGCGCCCGATGAGCTTGTGATTGATATCGAATGGTGTGGTATTT

GCGGTACGGACCTGCATGAGTACACAGATGGTCCTATCTTTTTCCCAGAAGATGGAC

ACACACATGAGATTAGTCATAACCCATTGCCACAGGCGATGGGCCACGAAATGGCTG

GTACCGTTTTGGAGGTGGGCCCTGGTGTGAAAAACTTGAAAGTGGGAGACAAGGTA

GTTGTCGAGCCCACAGGTACATGCAGAGACCGGTATCGTTGGCCCCTGTCGCCAAA

CGTTGACAAGGAATGGTGCGCTGCTTGCAAAAAGGGCTACTATAACATTTGTTCATA T

TTGGGGCTTTGTGGTGCGGGTGTGCAGAGCGGTGGATTTGCAGAACGTGTTGTGAT GAACGAATCTCACTGCTACAAAGTACCGGACTTCGTGCCCTTAGACGTTGCAGCTTT

GATTCAACCGTTGGCTGTGTGCTGGCATGCAATTAGAGTCTGCGAGTTCAAAGCAGG

CTCTACGGCTTTGATCATTGGTGCTGGCCCCATCGGACTGGGCACGATACTGGCGTT

GAACGCTGCAGGTTGCAAGGACATCGTCGTTTCAGAGCCTGCCAAGGTAAGAAGAG

AACTGGCTGAAAAAATGGGTGCCAGGGTTTACGACCCAACTGCGCACGCTGCCAAG

GAGAGCATTGATTATCTGAGGTCGATTGCTGATGGTGGAGACGGCTTCGATTACACA

TTTGATTGCTCCGGGTTGGAAGTCACATTGAATGCTGCTATTCAGTGTCTCACTTTC A

GAGGCACCGCAGTGAACTTGGCCATGTGGGGCCATCACAAGATACAGTTTTCTCCG

ATGGACATCACATTGCATGAAAGAAAGTACACAGGGTCCATGTGCTACACACACCAC

GATTTTGAGGCAGTAATAGAAGCTTTGGAAGAAGGCAGGATTGACATTGATAGAGCA

AGACATATGATAACGGGCAGAGTCAACATTGAGGACGGCCTTGATGGCGCCATCAT

GAAGCTGATAAACGAGAAGGAGTCTACAATCAAGATTATTCTGACTCCAAACAATCA C

GGAGAGTTGAACAGGGAAGCCGATAATGAGAAGAAAGAAATTTCCGAGCTGAGCAG

TCGGAAAGATCAAGAAAGACTACGAGAATCAATAAACGAGGCTAAACTGCGTCACAC

ATGA

Protein sequence from 3-hydroxyacyl-CoA dehydrogenase and enoyl-

SEQ ID NO:39

CoA hydratase (FOX2) of Saccharomyces cerevisiae

MPGNLSFKDRVVVITGAGGGLGKVYALAYASRGAKVWNDLGGTLGGSGHNSKAADLV

VDEIKKAGGIAVANYDSVNENGEKIIETAIKEFGRVDVLINNAGILRDVSFAKMTER EFASV

VDVHLTGGYKLSRAAWPYMRSQKFGRIINTASPAGLFGNFGQANYSAAKMGLVGLAE T

LAKEGAKYNINVNSIAPLARSRMTENVLPPHILKQLGPEKIVPLVLYLTHESTKVSN SIFEL

AAGFFGQLRWERSSGQIFNPDPKTYTPEAILNKWKEITDYRDKPFNKTQHPYQLSDY ND

LITKAKKLPPNEQGSVKIKSLCNKWVVTGAGGGLGKSHAIWFARYGAKVVVNDIKDP FS

VVEEINKLYGEGTAIPDSHDWTEAPLIIQTAISKFQRVDILVNNAGILRDKSFLKMK DEEW

FAVLKVHLFSTFSLSKAVWPIFTKQKSGFIINTTSTSGIYGNFGQANYAAAKAAILG FSKTI

ALEGAKRGIIVNVIAPHAETAMTKTIFSEKELSNHFDASQVSPLVVLLASEELQKYS GRRV

IGQLFEVGGGWCGQTRWQRSSGYVSIKETIEPEEIKENWNHITDFSRNTINPSSTEE SS

MATLQAVQKAHSSKELDDGLFKYTTKDCILYNLGLGCTSKELKYTYENDPDFQVLPT FA

VIPFMQATATLAMDNLVDNFNYAMLLHGEQYFKLCTPTMPSNGTLKTLAKPLQVLDK NG

KAALVVGGFETYDIKTKKLIAYNEGSFFIRGAHVPPEKEVRDGKRAKFAVQNFEVPH GKV

PDFEAEISTNKDQAALYRLSGDFNPLHIDPTLAKAVKFPTPILHGLCTLGISAKALF EHYG

PYEELKVRFTNVVFPGDTLKVKAWKQGSWVFQTIDTTRNVIVLDNAAVKLSQAKSKL

DNA sequence encoding 3-hydroxyacyl-CoA dehydrogenase and enoyl-

SEQ ID NO:40

CoA hydratase (FOX2) of Saccharomyces cerevisiae

ATGCCTGGAAATTTATCCTTCAAAGATAGAGTTGTTGTAATCACGGGCGCTGGAGGG

GGCTTAGGTAAGGTGTATGCACTAGCTTACGCAAGCAGAGGTGCAAAAGTGGTCGT

CAATGATCTAGGTGGCACTTTGGGTGGTTCAGGACATAACTCCAAAGCTGCAGACTT

AGTGGTGGATGAGATAAAAAAAGCCGGAGGTATAGCTGTGGCAAATTACGACTCTGT

TAATG AAAATG G AG AG AAAATAATTGAAACG G CTATAAAAGAATTCGG CAG GGTTG AT

GTACTAATTAACAACG CTG GAATATTAAG G GATGTTTCATTTG CAAAG ATG ACAG AAC

GTGAGTTTGCATCTGTGGTAGATGTTCATTTGACAGGTGGCTATAAGCTATCGCGTG

CTGCTTGGCCTTATATGCGCTCTCAGAAATTTGGTAGAATCATTAACACCGCTTCCC C

TGCCGGTCTATTTGGAAATTTTGGTCAAGCTAATTATTCAGCAGCTAAAATGGGCTT A

GTTGGTTTGGCGGAAACCCTCGCGAAGGAGGGTGCCAAATACAACATTAATGTTAAT

TCAATTGCGCCATTGGCTAGATCACGTATGACAGAAAACGTGTTACCACCACATATC T

TGAAACAGTTAGGACCGGAAAAAATTGTTCCCTTAGTACTCTATTTGACACACGAAA G

TACGAAAGTGTCAAACTCCATTTTTGAACTCGCTGCTGGATTCTTTGGACAGCTCAG A

TGGGAGAGGTCTTCTGGACAAATTTTCAATCCAGACCCCAAGACATATACTCCTGAA

G C AATTTTAAATAAGTG G AAG G AAATC AC AG ACTATAG G G AC AAG C C ATTTAAC AAAA

CTCAGCATCCATATCAACTCTCGGATTATAATGATTTAATCACCAAAGCAAAAAAAT TA

CCTCCCAATGAACAAGGCTCAGTGAAAATCAAGTCGCTTTGCAACAAAGTCGTAGTA

GTTACGGGTGCAGGAGGTGGTCTTGGGAAGTCTCATGCAATCTGGTTTGCACGGTA

CG GTG CG AAG GTAGTTGTAAATG ACATCAAG G ATCCTTTTTCAGTTGTTG AAG AAATA

AATAAACTATATGGTGAAGGCACAGCCATTCCAGATTCCCATGATGTGGTCACCGAA GCTCCTCTCATTATCCAAACTGCAATAAGTAAGTTTCAGAGAGTAGACATCTTGGTCA

ATAACGCTGGTATTTTGCGTGACAAATCTTTTTTAAAAATGAAAGATGAGGAATGGT TT

GCTGTCCTGAAAGTCCACCTTTTTTCCACATTTTCATTGTCAAAAGCAGTATGGCCA A

TATTTACCAAACAAAAGTCTGGATTTATTATCAATACTACTTCTACCTCAGGAATTT AT

G GTAATTTTG G AC AG G C C AATTATG C C G CTG C AAAAG C C G C C ATTTTAG G ATTC AGT

AAAACTATTG CACTG G AAG GTG CCAAG AGAG GAATTATTGTTAATGTTATCG CTCCTC

ATGCAGAAACGGCTATGACAAAGACTATATTCTCGGAGAAGGAATTATCAAACCACT T

TGATGCATCTCAAGTCTCCCCACTTGTTGTTTTGTTGGCATCTGAAGAACTACAAAA G

TATTCTGGAAGAAGGGTTATTGGCCAATTATTCGAAGTTGGCGGTGGTTGGTGTGGG

CAAACCAGATGGCAAAGAAGTTCCGGTTATGTTTCTATTAAAGAGACTATTGAACCG G

AAGAAATTAAAGAAAATTGGAACCACATCACTGATTTCAGTCGCAACACTATCAACC C

GAGCTCCACAGAGGAGTCTTCTATGGCAACCTTGCAAGCCGTGCAAAAAGCGCACT

CTTCAAAGGAGTTGGATGATGGATTATTCAAGTACACTACCAAGGATTGTATCTTGT A

CAATTTAGGACTTGGATGCACAAGCAAAGAGCTTAAGTACACCTACGAGAATGATCC

AGACTTCCAAGTTTTGCCCACGTTCGCCGTCATTCCATTTATGCAAGCTACTGCCAC A

CTAGCTATGGACAATTTAGTCGATAACTTCAATTATGCAATGTTACTGCATGGAGAA C

AATATTTTAAGCTCTGCACGCCGACAATGCCAAGTAATGGAACTCTAAAGACACTTG C

TAAACCTTTACAAGTACTTGACAAGAATGGTAAAGCCGCTTTAGTTGTTGGTGGCTT C

GAAACTTATGACATTAAAACTAAGAAACTCATAGCTTATAACGAAGGATCGTTCTTC AT

CAGGGGCGCACATGTACCTCCAGAAAAGGAAGTGAGGGATGGGAAAAGAGCCAAGT

TTGCTGTCCAAAATTTTGAAGTGCCACATGGAAAGGTACCAGATTTTGAGGCGGAGA

TTTCTACGAATAAAGATCAAGCCGCATTGTACAGGTTATCTGGCGATTTCAATCCTT T

ACATATCGATCCCACGCTAGCCAAAGCAGTTAAATTTCCTACGCCAATTCTGCATGG

GCTTTGTACATTAGGTATTAGTGCGAAAGCATTGTTTGAACATTATGGTCCATATGA G

GAGTTGAAAGTGAGATTTACCAATGTTGTTTTCCCAGGTGATACTCTAAAGGTTAAA G

CTTGGAAGCAAGGCTCGGTTGTCGTTTTTCAAACAATTGATACGACCAGAAACGTCA T

TGTATTGGATAACGCCGCTGTAAAACTATCGCAGGCAAAATCTAAACTATAA

Protein sequence from Glycerol dehydrogenase (GCY1 ) of

SEQ ID N0:41

Saccharomyces cerevisiae

MPATLHDSTKILSLNTGAQIPQIGLGTWQSKENDAYKAVLTALKDGYRHIDTAAIYRNED

QVGQAIKDSGVPREEIFVTTKLWCTQHHEPEVALDQSLKRLGLDYVDLYLMHWPARL D

PAYIKNEDILSVPTKKDGSRAVDITNWNFIKTWELMQELPKTGKTKAVGVSNFSINN LKDL

LASQGNKLTPAANQVEIHPLLPQDELINFCKSKGIWEAYSPLGSTDAPLLKEPVILE IAKK

NNVQPGHWISWHVQRGYVVLPKSVNPDRIKTNRKIFTLSTEDFEAINNISKEKGEKR W

HPNWSPFEVFK

DNA sequence encoding Glycerol dehydrogenase (GCY1 ) of

SEQ ID NO:42

Saccharomyces cerevisiae

ATGCCTGCTACTTTACATGATTCTACGAAAATCCTTTCTCTAAATACTGGAGCCCAAAT

CCCTCAAATAGGTTTAGGTACGTGGCAGTCGAAAGAGAACGATGCTTATAAGGCTGT

TTTAACCGCTTTGAAAGATGGCTACCGACACATTGATACTGCTGCTATTTACCGTAA T

GAAGACCAAGTCGGTCAAGCCATCAAGGATTCAGGTGTTCCTCGGGAAGAAATCTTT

GTTACTACAAAGTTATG GTGTACACAACACCAC GAAC CTGAAGTAGC GCTG G ATC AA

TCACTAAAGAGGTTAGGATTGGACTACGTAGACTTATATTTGATGCATTGGCCTGCC A

GATTAGATCCAGCCTACATCAAAAATGAAGACATCTTGAGTGTGCCAACAAAGAAGG

ATGGTTCTCGTGCAGTGGATATCACCAATTGGAATTTCATCAAAACCTGGGAATTAA T

G CAG G AACTACCAAAGACTG GTAAAACTAAG GCC GTTG G AGTCTCCAACTTTTCTAT

AAATAACCTG AAAGATCTATTAG CATCTCAAG GTAATAAGCTTACG CCAG CTG CTAAC

CAAGTCGAAATACATCCATTACTACCTCAAGACGAATTGATTAATTTTTGTAAAAGT AA

AGGCATTGTGGTTGAAGCTTATTCTCCGTTAGGTAGTACCGATGCTCCACTATTGAA G

GAACCGGTTATCCTTGAAATTGCGAAGAAAAATAACGTTCAACCCGGACACGTTGTT A

TTAGCTGGCACGTCCAAAGAGGTTATGTTGTCTTGCCAAAATCTGTGAATCCCGATC

GAATCAAAACGAACAGGAAAATATTTACTTTGTCTACTGAGGACTTTGAAGCTATCA A

TAACATATCGAAGGAAAAGGGCGAAAAAAGGGTTGTACATCCAAATTGGTCTCCTTT C

GAAGTATTCAAGTAA Protein sequence from Glyoxylate reductase (GOR1 ) of Saccharomyces

SEQ ID NO:43

MSKKPIVLKLGKDAFGDQAWGELEKIADVITIPESTTREQFLREVKDPQNKLSQVQVITR T

ARSVKNTGRFDEELALALPSSWAVCHTGAGYDQIDVEPFKKRHIQVANVPDLVSNAT A

DTHVFLLLGALRNFGIGNRRLIEGNWPEAGPACGSPFGYDPEGKTVGILGLGRIGRC ILE

RLKPFGFENFIYHNRHQLPSEEEHGCEYVGFEEFLKRSDIVSVNVPLNHNTHHLINA ETIE

KMKDGVVIVNTARGAVIDEQAMTDALRSGKIRSAGLDVFEYEPKISKELLSMSQVLG LPH

MGTHSVETRKKMEELVVENAKNVILTGKVLTIVPELQNEDWPNESKPLV

DNA sequence encoding Glyoxylate reductase (GOR1 ) of

SEQ ID NO:44

Saccharomyces cerevisiae

ATGAGTAAGAAACCAATTGTTTTG AAATTAG G AAAG G ATG CCTTTG GTGACCAAG CC

TGGGGGGAATTGGAAAAGATTGCGGATGTAATTACCATCCCTGAATCCACCACTAGA

GAACAGTTTTTGCGGGAGGTAAAAGACCCACAAAATAAGCTCTCCCAAGTACAAGTC

ATTACTAGAACAGCAAGGAGTGTGAAAAACACCGGTAGATTTGATGAAGAGCTTGCT

CTTGCTTTGCCCTCCTCCGTAGTGGCTGTATGTCATACTGGTGCTGGTTATGACCAA

ATTGATGTTGAGCCATTCAAGAAAAGGCACATCCAGGTTGCCAATGTTCCTGATTTA

GTTAGCAATGCTACCGCTGATACGCATGTATTTTTGCTATTGGGTGCCCTAAGAAAC

TTCGGTATTGGTAACAGAAGGTTGATCGAGGGAAACTGGCCGGAGGCAGGACCCG

CATGTGGTTCTCCCTTTGGATACGACCCTGAAGGGAAAACAGTTGGTATACTGGGTC

TAGGTAGGATTGGTCGTTGTATTTTAGAGAGATTGAAGCCGTTTGGGTTCGAGAATT

TCATATATCATAACAGACACCAGCTTCCTTCCGAAGAAGAGCATGGTTGTGAATATG

TAGGATTCGAGGAGTTTTTGAAGCGTTCTGATATAGTATCTGTAAACGTCCCACTGA

ACCACAATACTCACCATCTAATCAATGCAGAGACTATTGAAAAAATGAAAGATGGTG T

AGTTATTGTTAACACAGCGCGTGGTGCCGTGATAGACGAACAAGCCATGACTGATG

CTTTGCGTTCTGGAAAGATTAGAAGTGCTGGTTTGGACGTTTTCGAATATGAGCCAA

AAATATCCAAAGAGTTATTATCGATGTCCCAAGTCTTAGGACTGCCTCATATGGGCA

CACATAGTGTAGAAACAAGAAAGAAAATGGAAGAACTGGTCGTTGAAAATGCAAAGA

ATGTGATATTGACCGGGAAAGTCTTGACTATTGTTCCGGAATTACAAAATGAAGACT

GGCCCAATGAATCTAAGCCATTAGTTTGA

Protein sequence from NAD-dependent glycerol-3-phosphate

SEQ ID NO:45

dehydrogenase (GPD1 ) of Saccharomyces cerevisiae

MSAAADRLNLTSGHLNAGRKRSSSSVSLKAAEKPFKVTVIGSGNWGTTIAKVVAENCKG

YPEVFAPIVQMWVFEEEINGEKLTEIINTRHQNVKYLPGITLPDNLVANPDLIDSVK DVDII

VFNIPHQFLPRICSQLKGHVDSHVRAISCLKGFEVGAKGVQLLSSYITEELGIQCGA LSGA

NIATEVAQEHWSETTVAYHIPKDFRGEGKDVDHKVLKALFHRPYFHVSVIEDVAGIS ICG

ALKNWALGCGFVEGLGWGNNASAAIQRVGLGEIIRFGQMFFPESREETYYQESAGVA

DLITTCAGGRNVKVARLMATSGKDAWECEKELLNGQSAQGLITCKEVHEWLETCGSV E

DFPLFEAVYQIVYNNYPMKNLPDMIEELDLHED

DNA sequence encoding NAD-dependent glycerol-3-phosphate

SEQ ID NO:46

dehydrogenase (GPD1 ) of Saccharomyces cerevisiae

ATGTCTGCTGCTGCTGATAGATTAAACTTAACTTCCGGCCACTTGAATGCTGGTAGAA

AGAGAAGTTCCTCTTCTGTTTCTTTGAAGGCTGCCGAAAAGCCTTTCAAGGTTACTG T

GATTGGATCTGGTAACTGGGGTACTACTATTGCCAAGGTGGTTGCCGAAAATTGTAA

GGGATACCCAGAAGTTTTCGCTCCAATAGTACAAATGTGGGTGTTCGAAGAAGAGAT

CAATGGTGAAAAATTGACTGAAATCATAAATACTAGACATCAAAACGTGAAATACTT G

CCTGGCATCACTCTACCCGACAATTTGGTTGCTAATCCAGACTTGATTGATTCAGTC A

AGGATGTCGACATCATCGTTTTCAACATTCCACATCAATTTTTGCCCCGTATCTGTA G

CCAATTGAAAGGTCATGTTGATTCACACGTCAGAGCTATCTCCTGTCTAAAGGGTTT T

GAAGTTGGTGCTAAAGGTGTCCAATTGCTATCCTCTTACATCACTGAGGAACTAGGT A

TTCAATGTGGTGCTCTATCTGGTGCTAACATTGCCACCGAAGTCGCTCAAGAACACT

GGTCTGAAACAACAGTTGCTTACCACATTCCAAAGGATTTCAGAGGCGAGGGCAAGG

ACGTCGACCATAAGGTTCTAAAGGCCTTGTTCCACAGACCTTACTTCCACGTTAGTG T

CATCGAAGATGTTGCTGGTATCTCCATCTGTGGTGCTTTGAAGAACGTTGTTGCCTT A

GGTTGTGGTTTCGTCGAAGGTCTAGGCTGGGGTAACAACGCTTCTGCTGCCATCCAA AGAGTCGGTTTGGGTGAGATCATCAGATTCGGTCAAATGTTTTTCCCAGAATCTAGA

GAAGAAACATACTACCAAGAGTCTGCTGGTGTTGCTGATTTGATCACCACCTGCGCT

GGTGGTAGAAACGTCAAGGTTGCTAGGCTAATGGCTACTTCTGGTAAGGACGCCTG

GGAATGTGAAAAGGAGTTGTTGAATGGCCAATCCGCTCAAGGTTTAATTACCTGCAA

AGAAGTTCACGAATGGTTGGAAACATGTGGCTCTGTCGAAGACTTCCCATTATTTGA A

GCCGTATACCAAATCGTTTACAACAACTACCCAATGAAGAACCTGCCGGACATGATT

GAAGAATTAGATCTACATGAAGATTAG

Protein sequence from Multifunctional enzyme containing phosphoribosyl-ATP pyrophosphatase, phosphoribosyl-AMP

SEQ ID NO:47

cyclohydrolase, and histidinol dehydrogenase activities (HIS4) of

Saccharomyces cerevisiae

MVLPILPLIDDLASWNSKKEYVSLVGQVLLDGSSLSNEEILQFSKEEEVPLVALSLPSGK F

SDDEIIAFLNNGVSSLFIASQDAKTAEHLVEQLNVPKERVWEENGVFSNQFMVKQKF SQ

DKIVSIKKLSKDMLTKEVLGEVRTDRPDGLYTTLWDQYERCLGLVYSSKKSIAKAID LGR

GVYYSRSRNEIWIKGETSGNGQKLLQISTDCDSDALKFIVEQENVGFCHLETMSCFG EF

KHGLVGLESLLKQRLQDAPEESYTRRLFNDSALLDAKIKEEAEELTEAKGKKELSWE AA

DLFYFALAKLVANDVSLKDVENNLNMKHLKVTRRKGDAKPKFVGQPKAEEEKLTGPI HL

DVVKASDKVGVQKALSRPIQKTSEIMHLVNPIIENVRDKGNSALLEYTEKFDGVKLS NPV

LNAPFPEEYFEGLTEEMKEALDLSIENVRKFHAAQLPTETLEVETQPGVLCSRFPRP IEK

VGLYIPGGTAILPSTALMLGVPAQVAQCKEIVFASPPRKSDGKVSPEVVYVAEKVGA SKI

VLAGGAQAVAAMAYGTETIPKVDKILGPGNQFVTAAKMYVQNDTQALCSIDMPAGPS EV

LVIADEDADVDFVASDLLSQAEHGIDSQVILVGVNLSEKKIQEIQDAVHNQALQLPR VDIV

RKCIAHSTIVLCDGYEEALEMSNQYAPEHLILQIANANDYVKLVDNAGSVFVGAYTP ESC

GDYSSGTNHTLPTYGYARQYSGANTATFQKFITAQNITPEGLENIGRAVMCVAKKEG LD

GHRNAVKIRMSKLGLIPKDFQ

DNA sequence Multifunctional enzyme containing phosphoribosyl-ATP

SEQ ID NO:48 pyrophosphatase, phosphoribosyl-AMP cyclohydrolase, and histidinol

dehydrogenase activities (HIS4) of Saccharomyces cerevisiae

ATGGTTTTGCCGATTCTACCGTTAATTGATGATCTGGCCTCATGGAATAGTAAGAAG

GAATACGTTTCACTTGTTGGTCAGGTACTTTTGGATGGCTCGAGCCTGAGTAATGAA

GAGATTCTCCAGTTCTCCAAAGAGGAAGAAGTTCCATTGGTGGCTTTGTCCTTGCCA

AGTGGTAAATTCAGCGATGATGAAATCATTGCCTTCTTGAACAACGGAGTTTCTTCT C

TGTTCATTGCTAGCCAAGATGCTAAAACAGCCGAACACTTGGTTGAACAATTGAATG

TACCAAAGGAGCGTGTTGTTGTGGAAGAGAACGGTGTTTTCTCCAATCAATTCATGG

TAAAACAAAAATTCTCGCAAGATAAAATTGTGTCCATAAAGAAATTAAGCAAGGATA T

GTTGACCAAAGAAGTGCTTGGTGAAGTACGTACAGACCGTCCTGACGGTTTATATAC

CACCCTAGTTGTCGACCAATATGAGCGTTGTCTAGGGTTGGTGTATTCTTCGAAGAA

ATCTATAGCAAAGGCCATCGATTTGGGTCGTGGCGTTTATTATTCTCGTTCTAGGAA

TGAAATCTGGATCAAGGGTGAAACTTCTGGCAATGGCCAAAAGCTTTTACAAATCTC

TACTGACTGTGATTCGGATGCCTTAAAGTTTATCGTTGAACAAGAAAACGTTGGATT T

TGCCACTTGGAGACCATGTCTTGCTTTGGTGAATTCAAGCATGGTTTGGTGGGGCTA

G AATCTTTACTAAAAC AAAG G CTAC AG G AC G CTC C AG AG G AATCTTATACTAG AAG A

CTATTCAACGACTCTGCATTGTTAGATGCCAAGATCAAGGAAGAAGCTGAAGAACTG

ACTGAGGCAAAGGGTAAGAAGGAGCTTTCTTGGGAGGCTGCCGATTTGTTCTACTTT

GCACTGGCCAAATTAGTGGCCAACGATGTTTCATTGAAGGACGTCGAGAATAATCTG

AATATGAAGCATCTGAAGGTTACAAGACGGAAAGGTGATGCTAAGCCAAAGTTTGTT

GGACAACCAAAGGCTGAAGAAGAAAAACTGACCGGTCCAATTCACTTGGACGTGGT

GAAGGCTTCCGACAAAGTTGGTGTGCAGAAGGCTTTGAGCAGACCAATCCAAAAGA

CTTCTGAAATTATGCATTTAGTCAATCCGATCATCGAAAATGTTAGAGACAAAGGTA A

CTCTGCCCTTTTGGAGTACACAGAAAAGTTTGATGGTGTAAAATTATCCAATCCTGT T

CTTAATGCTCCATTCCCAGAAGAATACTTTGAAGGTTTAACCGAGGAAATGAAGGAA

GCTTTGGACCTTTCAATTGAAAACGTCCGCAAATTCCATGCTGCTCAATTGCCAACA

GAGACTCTTGAAGTTGAAACCCAACCTGGTGTCTTGTGTTCCAGATTCCCTCGTCCT ATTGAAAAAGTTGGTTTGTATATCCCTGGTGGCACTGCCATTTTACCAAGTACTGCAT

TAATGCTTGGTGTTCCAGCACAAGTTGCCCAATGTAAGGAGATTGTGTTTGCATCTC

CACCAAGAAAATCTGATGGTAAAGTTTCACCCGAAGTTGTTTATGTCGCAGAAAAAG

TTGGCGCTTCCAAGATTGTTCTAGCTGGTGGTGCCCAAGCCGTTGCTGCTATGGCT

TACGGGACAGAAACTATTCCTAAAGTGGATAAGATCTTGGGTCCAGGTAATCAATTT

GTGACTGCCGCCAAAATGTATGTTCAAAATGACACTCAAGCTCTATGTTCCATTGAT A

TGCCAGCTGGCCCAAGTGAAGTTTTGGTTATTGCCGATGAAGATGCCGATGTGGAT

TTTGTTGC AAGTG ATTTG CTATCG CAAG CTG AACACG GTATTG ACTCC CAAGTTATC

CTTGTTGGTGTTAACTTGAGCGAAAAGAAAATTCAAGAGATTCAAGATGCTGTCCAC

AATCAAGCTTTACAACTGCCACGTGTGGATATTGTTCGTAAATGTATTGCTCACAGT A

CGATCGTTCTTTGTGACGGTTACGAAGAAGCCCTTGAAATGTCCAACCAATATGCAC

CAGAACATTTGATTCTACAAATCGCCAATGCTAACGATTATGTTAAATTGGTTGACA A

TG CAG G GTCC GTATTTGTG G GTG CTTACACTC CAG AATCGTGC GGTG ACTATTCAA

GTGGTACTAACCATACATTACCAACCTATGGTTACGCTAGGCAGTACAGTGGTGCCA

ACACTGCAACCTTCCAAAAGTTTATCACTGCCCAAAACATTACCCCTGAAGGTTTAG

AAAACATCGGTAGAGCTGTTATGTGCGTTGCCAAGAAGGAGGGTCTAGACGGTCAC

AGAAACGCTGTGAAAATCAGAATGAGTAAGCTTGGGTTGATCCCAAAGGATTTCCAG

TAG

Protein sequence from HMG-CoA reductase (HMG1 ) of

SEQ ID NO:49

Saccharomyces cerevisiae

MPPLFKGLKQMAKPIAYVSRFSAKRPIHIILFSLIISAFAYLSVIQYYFNGWQLDSNSVF ET

APNKDSNTLFQECSHYYRDSSLDGWVSITAHEASELPAPHHYYLLNLNFNSPNETDS IP

ELANTVFEKDNTKYILQEDLSVSKEISSTDGTKWRLRSDRKSLFDVKTLAYSLYDVF SEN

VTQADPFDVLIMVTAYLMMFYTIFGLFNDMRKTGSNFWLSASTVVNSASSLFLALYV TQ

CILGKEVSALTLFEGLPFIWVVGFKHKIKIAQYALEKFERVGLSKRITTDEIVFESV SEEG

GRLIQDHLLCIFAFIGCSMYAHQLKTLTNFCILSAFILIFELILTPTFYSAILALRL EMNVIHRS

TIIKQTLEEDGVVPSTARIISKAEKKSVSSFLNLSVWIIMKLSVILLFVFINFYNFG ANWVN

DAFNSLYFDKERVSLPDFITSNASENFKEQAIVSVTPLLYYKPIKSYQRIEDMVLLL LRNVS

VAIRDRFVSKLVLSALVCSAVINVYLLNAARIHTSYTADQLVKTEVTKKSFTAPVQK ASTP

VLTNKTVISGSKVKSLSSAQSSSSGPSSSSEEDDSRDIESLDKKIRPLEELEALLSS GNTK

QLKNKEVAALVIHGKLPLYALEKKLGDTTRAVAVRRKALSILAEAPVLASDRLPYKN YDY

DRVFGACCENVIGYMPLPVGVIGPLVIDGTSYHIPMATTEGCLVASAMRGCKAINAG GG

ATTVLTKDGMTRGPWRFPTLKRSGACKIWLDSEEGQNAIKKAFNSTSRFARLQHIQT C

LAGDLLFMRFRTTTGDAMGMNMISKGVEYSLKQMVEEYGWEDMEVVSVSGNYCTDKK

PAAINWIEGRGKSWAEATIPGDVVRKVLKSDVSALVELNIAKNLVGSAMAGSVGGFN A

HAANLVTAVFLALGQDPAQNVESSNCITLMKEVDGDLRISVSMPSIEVGTIGGGTVL EPQ

GAMLDLLGVRGPHATAPGTNARQLARIVACAVLAGELSLCAALAAGHLVQSHMTHNR K

PAEPTKPNNLDATDINRLKDGSVTCIKS

DNA sequence encoding HMG-CoA reductase (HMG1 ) of

SEQ ID NO:50

Saccharomyces cerevisiae

ATGCCGCCGCTATTCAAGGGACTGAAACAGATGGCAAAGCCAATTGCCTATGTTTCA

AGATTTTCGGCGAAACGACCAATTCATATAATACTTTTTTCTCTAATCATATCCGCA TT

CGCTTATCTATCCGTCATTCAGTATTACTTCAATGGTTGGCAACTAGATTCAAATAG T

GTTTTTGAAACTGCTCCAAATAAAGACTCCAACACTCTATTTCAAGAATGTTCCCAT TA

CTACAGAGATTCCTCTCTAGATGGTTGGGTATCAATCACCGCGCATGAAGCTAGTGA

GTTACCAGCCCCACACCATTACTATCTATTAAACCTGAACTTCAATAGTCCTAATGA A

ACTGACTCCATTCCAGAACTAGCTAACACGGTTTTTGAGAAAGATAATACAAAATAT A

TTCTGCAAGAAGATCTCAGTGTTTCCAAAGAAATTTCTTCTACTGATGGAACGAAAT G

GAGGTTAAGAAGTGACAGAAAAAGTCTTTTCGACGTAAAGACGTTAGCATATTCTCT C

TACGATGTATTTTCAGAAAATGTAACCCAAGCAGACCCGTTTGACGTCCTTATTATG G

TTACTGCCTACCTAATGATGTTCTACACCATATTCGGCCTCTTCAATGACATGAGGA A

GACCGGGTCAAATTTTTGGTTGAGCGCCTCTACAGTGGTCAATTCTGCATCATCACT T

TTCTTAGCATTGTATGTCACCCAATGTATTCTAGGCAAAGAAGTTTCCGCATTAACT CT

TTTTG AAG GTTTG CCTTTCATTGTAGTTGTTGTTG GTTTCAAG CACAAAATCAAG ATTG CCCAGTATGCCCTGGAGAAATTTGAAAGAGTCGGTTTATCTAAAAGGATTACTACCGA

TGAAATCGTTTTTGAATCCGTGAGCGAAGAGGGTGGTCGTTTGATTCAAGACCATTT

GCTTTGTATTTTTGCCTTTATCGGATGCTCTATGTATGCTCACCAATTGAAGACTTT GA

CAAACTTCTGCATATTATCAGCATTTATCCTAATTTTTGAATTGATTTTAACTCCTA CAT

TTTATTCTGCTATCTTAGCGCTTAGACTGGAAATGAATGTTATCCACAGATCTACTA TT

ATCAAGCAAACATTAGAAGAAGACGGTGTTGTTCCATCTACAGCAAGAATCATTTCT A

AAGCAGAAAAGAAATCCGTATCTTCTTTCTTAAATCTCAGTGTGGTTGTCATTATCA TG

AAACTCTCTGTCATACTGTTGTTTGTCTTCATCAACTTTTATAACTTTGGTGCAAAT TG

GGTCAATGATGCCTTCAATTCATTGTACTTCGATAAGGAACGTGTTTCTCTACCAGA T

TTTATTACCTCGAATGCCTCTGAAAACTTTAAAGAGCAAGCTATTGTTAGTGTCACC C

CATTATTATATTACAAACCCATTAAGTCCTACCAACGCATTGAGGATATGGTTCTTC TA

TTGCTTCGTAATGTCAGTGTTGCCATTCGTGATAGGTTCGTCAGTAAATTAGTTCTT T

CCGCCTTAGTATGCAGTGCTGTCATCAATGTGTATTTATTGAATGCTGCTAGAATTC A

TACCAGTTATACTGCAGACCAATTGGTGAAAACTGAAGTCACCAAGAAGTCTTTTAC T

GCTCCTGTACAAAAGGCTTCTACACCAGTTTTAACCAATAAAACAGTCATTTCTGGA T

CGAAAGTCAAAAGTTTATCATCTGCGCAATCGAGCTCATCAGGACCTTCATCATCTA G

TGAGGAAGATGATTCCCGCGATATTGAAAGCTTGGATAAGAAAATACGTCCTTTAGA A

GAATTAGAAGCATTATTAAGTAGTGGAAATACAAAACAATTGAAGAACAAAGAGGTC G

CTG CCTTG GTTATTCACG GTAAGTTACCTTTGTACG CTTTG GAGAAAAAATTAG GTG A

TACTACGAGAGCGGTTGCGGTACGTAGGAAGGCTCTTTCAATTTTGGCAGAAGCTCC

TGTATTAGCATCTGATCGTTTACCATATAAAAATTATGACTACGACCGCGTATTTGG C

GCTTGTTGTGAAAATGTTATAGGTTACATGCCTTTGCCCGTTGGTGTTATAGGCCCC T

TGGTTATCGATGGTACATCTTATCATATACCAATGGCAACTACAGAGGGTTGTTTGG T

AGCTTCTGCCATGCGTGGCTGTAAGGCAATCAATGCTGGCGGTGGTGCAACAACTG

TTTTAACTAAGGATGGTATGACAAGAGGCCCAGTAGTCCGTTTCCCAACTTTGAAAA G

ATCTGGTGCCTGTAAGATATGGTTAGACTCAGAAGAGGGACAAAACGCAATTAAAAA

AGCTTTTAACTCTACATCAAGATTTGCACGTCTGCAACATATTCAAACTTGTCTAGC A

GGAGATTTACTCTTCATGAGATTTAGAACAACTACTGGTGACGCAATGGGTATGAAT A

TGATTTCTAAAGGTGTCGAATACTCATTAAAGCAAATGGTAGAAGAGTATGGCTGGG A

AGATATGGAGGTTGTCTCCGTTTCTGGTAACTACTGTACCGACAAAAAACCAGCTGC

CATCAACTGGATCGAAGGTCGTGGTAAGAGTGTCGTCGCAGAAGCTACTATTCCTGG

TGATGTTGTCAGAAAAGTGTTAAAAAGTGATGTTTCCGCATTGGTTGAGTTGAACAT T

G CTAAG AATTTG GTTG G ATCTG CAATG G CTGG GTCTGTTGGTG GATTTAACG CACAT

GCAGCTAATTTAGTGACAGCTGTTTTCTTGGCATTAGGACAAGATCCTGCACAAAAT G

TTGAAAGTTCCAACTGTATAACATTGATGAAAGAAGTGGACGGTGATTTGAGAATTT C

CGTATCCATGCCATCCATCGAAGTAGGTACCATCGGTGGTGGTACTGTTCTAGAACC

ACAAGGTGCCATGTTGGACTTATTAGGTGTAAGAGGCCCGCATGCTACCGCTCCTGG

TACCAACGCACGTCAATTAGCAAGAATAGTTGCCTGTGCCGTCTTGGCAGGTGAATT

ATCCTTATGTGCTGCCCTAGCAGCCGGCCATTTGGTTCAAAGTCATATGACCCACAA

CAGGAAACCTGCTGAACCAACAAAACCTAACAATTTGGACGCCACTGATATAAATCG T

TTGAAAGATGGGTCCGTCACCTGCATTAAATCCTAA

Protein sequence from Mitochondrial NADP-specific isocitrate

SEQ ID N0:51

dehydrogenase (IPD1 ) of Saccharomyces cerevisiae

MSMLSRRLFSTSRLAAFSKIKVKQPVVELDGDEMTRIIWDKIKKKLILPYLDVDLKYYDL S

VESRDATSDKITQDAAEAIKKYGVGIKCATITPDEARVKEFNLHKMWKSPNGTIRNI LGGT

VFREPIVIPRIPRLVPRWEKPIIIGRHAHGDQYKATDTLIPGPGSLELVYKPSDPTT AQPQT

LKVYDYKGSGVAMAMYNTDESIEGFAHSSFKLAIDKKLNLFLSTKNTILKKYDGRFK DIFQ

EVYEAQYKSKFEQLGIHYEHRLIDDMVAQMIKSKGGFIMALKNYDGDVQSDIVAQGF GS

LGLMTSILVTPDGKTFESEAAHGTVTRHYRKYQKGEETSTNSIASIFAWSRGLLKRG ELD

NTPALCKFANILESATLNTVQQDGIMTKDLALACGNNERSAYVTTEEFLDAVEKRLQ KEI

KSIE

DNA sequence encoding Mitochondrial NADP-specific isocitrate

SEQ ID NO:52

dehydrogenase (IPD1 ) of Saccharomyces cerevisiae ATGAGTATGTTATCTAGAAGATTATTTTCCACCTCTCGCCTTGCTGCTTTCAGTAAGAT

TAAGGTCAAACAACCCGTTGTCGAGTTGGACGGTGATGAAATGACCCGTATCATTTG

G GATAAG ATCAAG AAGAAATTG ATTCTACC CTACTTG G AC GTAG ATTTG AAGTACTAC

GACTTATCTGTCGAATCTCGTGACGCCACCTCCGACAAGATTACTCAGGATGCTGCT

GAGGCGATCAAGAAGTATGGTGTTGGTATCAAATGTGCCACCATCACTCCTGATGAA

GCTCGTGTGAAGGAATTCAACCTGCACAAGATGTGGAAATCTCCTAATGGTACCATC

AGAAACATTCTCGGCGGTACAGTGTTCAGAGAGCCCATTGTGATTCCTAGAATTCCT

AGACTGGTCCCACGTTGGGAAAAACCAATCATTATTGGAAGACACGCCCACGGTGAT

CAATATAAAGCTACGGACACACTGATCCCAGGCCCAGGATCTTTGGAACTGGTCTAC

AAGCCATCCGACCCTACGACTGCTCAACCACAAACTTTGAAAGTGTATGACTACAAG

GGCAGTGGTGTGGCCATGGCCATGTACAATACTGACGAATCCATCGAAGGGTTTGCT

CATTCGTCTTTCAAGCTGGCCATTGACAAAAAGCTAAATCTTTTCTTGTCAACCAAG A

ACACTATTTTGAAGAAATATGACGGTCGGTTCAAAGACATTTTCCAAGAAGTTTATG A

AGCTCAATATAAATCCAAATTCGAACAACTAGGGATCCACTATGAACACCGTTTAAT T

GATGATATGGTCGCTCAAATGATAAAATCTAAAGGTGGCTTTATCATGGCGCTAAAG A

ACTATGACGGTGATGTCCAATCTGACATCGTCGCTCAAGGATTTGGCTCCTTAGGTT T

GATGACTTCTATCTTAGTTACACCAGACGGTAAAACTTTCGAAAGTGAAGCTGCTCA T

GGTACCGTGACAAGACATTATAGAAAGTACCAAAAGGGTGAAGAAACTTCTACAAAC

TCCATTGCATCCATTTTCGCGTGGTCGAGAGGTCTATTGAAGAGAGGTGAATTGGAC

AATACTCCTGCTTTGTGTAAATTTGCCAATATTTTGGAATCCGCCACTTTGAACACA GT

TCAGCAAGACGGTATCATGACGAAGGACTTGGCTTTGGCTTGCGGTAACAACGAAAG

ATCTGCTTATGTTACCACAGAAGAATTTTTGGATGCCGTTGAAAAAAGACTACAAAA A

GAAATCAAGTCGATCGAGTAA

Protein sequence from Homo-isocitrate dehydrogenase (LYS12) of

SEQ ID NO:53

Saccharomyces cerevisiae

MFRSVATRLSACRGLASNAARKSLTIGLIPGDGIGKEVIPAGKQVLENLNSKHGLSFNFI D

LYAGFQTFQETGKALPDETVKVLKEQCQGALFGAVQSPTTKVEGYSSPIVALRREMG LF

ANVRPVKSVEGEKGKPIDMVIVRENTEDLYIKIEKTYIDKATGTRVADATKRISEIA TRRIAT

IALDIALKRLQTRGQATLTVTHKSNVLSQSDGLFREICKEVYESNKDKYGQIKYNEQ IVDS

MVYRLFREPQCFDVIVAPNLYGDILSDGAAALVGSLGVVPSANVGPEIVIGEPCHGS APD

IAGKGIANPIATIRSTALMLEFLGHNEAAQDIYKAVDANLREGSIKTPDLGGKASTQ QVVD

DVLSRL

DNA sequence encoding Homo-isocitrate dehydrogenase (LYS12) of

SEQ ID NO:54

Saccharomyces cerevisiae

ATGTTTAGATCTGTTGCTACTAGATTATCTGCCTGCCGTGGGTTAGCATCTAACGCT

GCTCGCAAATCACTCACTATTGGTCTTATCCCCGGTGACGGTATCGGTAAGGAAGTC

ATTCCTGCTGGTAAGCAAGTTTTGGAAAACCTTAACTCCAAGCACGGCCTAAGCTTC

AACTTTATTGATCTCTACGCCGGTTTCCAAACATTCCAAGAAACAGGAAAGGCGTTG

CCTGATGAGACTGTTAAAGTGTTGAAGGAACAATGTCAAGGTGCTCTTTTCGGTGCA

GTTCAGTCTCCAACTACTAAGGTGGAAGGTTACTCCTCACCAATTGTTGCTCTAAGG

AGGGAAATGGGCCTTTTCGCTAATGTTCGTCCTGTTAAGTCTGTAGAGGGAGAAAAG

GGTAAACCAATTGACATGGTTATCGTCAGAGAAAATACTGAGGACCTGTACATTAAA

ATTGAAAAAACATACATTGACAAG GC CACAG GTACAAG AGTTG CTGATG CCACAAAG

AGAATATCCGAAATTGCAACAAGAAGAATTGCAACCATTGCATTAGATATTGCCTTG A

AAAGATTACAAACAAGAGGCCAAGCCACTTTGACAGTGACTCATAAATCAAATGTTC

TATCTCAAAGTGATGGTCTATTCAGAGAAATCTGTAAGGAAGTCTACGAATCTAACA A

GGACAAGTACGGTCAAATCAAATATAACGAACAAATTGTGGATTCCATGGTTTATAG

G CTGTTC AG AG AACCACAATGTTTTG ATGTG ATAGTG G CAC CAAACCTATACG G GG A

TATATTATCTGACGGTGCTGCTGCTTTAGTCGGTTCATTAGGTGTTGTTCCAAGCGC

CAACGTAGGTCCAGAAATTGTCATTGGTGAACCATGCCATGGTTCTGCACCAGATAT

TGCTGGTAAAGGTATTGCTAACCCAATCGCCACTATAAGATCTACTGCTTTGATGTT

GGAATTCTTGGGCCACAACGAAGCTGCCCAAGATATCTACAAGGCTGTTGATGCTAA

CTTAAGAGAGGGTTCTATCAAGACACCAGATTTAGGTGGTAAGGCTTCTACTCAACA

AGTCGTTGACGACGTTTTGTCGAGATTATAG Protein sequence from 3-phosphoglycerate dehydrogenase and alpha-

SEQ ID NO:55

ketoglutarate reductase (SER33) of Saccharomyces cerevisiae

MSYSAADNLQDSFQRAMNFSGSPGAVSTSPTQSFMNTLPRRVSITKQPKALKPFSTGD

MNILLLENVNATAIKIFKDQGYQVEFHKSSLPEDELIEKIKDVHAIGIRSKTRLTEK ILQHAR

NLVCIGCFCIGTNQVDLKYAASKGIAVFNSPFSNSRSVAELVIGEIISLARQLGDRS IELHT

GTWNKVAARCWEVRGKTLGIIGYGHIGSQLSVLAEAMGLHVLYYDIVTIMALGTARQ VST

LDELLNKSDFVTLHVPATPETEKMLSAPQFAAMKDGAYVINASRGTVVDIPSLIQAV KAN

KIAGAALDVYPHEPAKNGEGSFNDELNSWTSELVSLPNIILTPHIGGSTEEAQSSIG IEVA

TALSKYINEGNSVGSVNFPEVSLKSLDYDQENTVRVLYIHRNVPGVLKTVNDILSDH NIEK

QFSDSHGEIAYLMADISSVNQSEIKDIYEKLNQTSAKVSIRLLY

DNA sequence encoding 3-phosphoglycerate dehydrogenase and

SEQ ID NO:56

alpha-ketoglutarate reductase (SER33) of Saccharomyces cerevisiae

ATGTCTTATTCAGCTGCCGATAATTTACAAGATTCATTCCAACGTGCCATGAACTTT TC

TGGCTCTCCTGGTGCAGTCTCAACCTCACCAACTCAGTCATTTATGAACACACTACC T

CGTCGTGTAAGCATTACAAAGCAACCAAAGGCTTTAAAACCTTTTTCTACTGGTGAC A

TGAATATTCTACTGTTGGAAAATGTCAATGCAACTGCAATCAAAATCTTCAAGGATC A

GGGTTACCAAGTAGAGTTCCACAAGTCTTCTCTACCTGAGGATGAATTGATTGAAAA A

ATCAAAGACGTACACGCTATCGGTATAAGATCCAAAACTAGATTGACTGAAAAAATA C

TACAGCATGCCAGGAATCTAGTTTGTATTGGTTGTTTTTGCATAGGTACCAATCAAG T

AGACCTAAAATATGCCGCTAGTAAAGGTATTGCTGTTTTCAATTCGCCATTCTCCAA T

TCAAGATCCGTAGCAGAATTGGTAATTGGTGAGATCATTAGTTTAGCAAGACAATTA G

GTGATAGATCCATTGAACTGCATACAGGTACATGGAATAAAGTCGCTGCTAGGTGTT

G GG AAGTAAG AG G AAAAACTCTCG GTATTATTG G GTATG GTC ACATTG GTTCG CAAT

TATCAGTTCTTGCAGAAGCTATGGGCCTGCATGTGCTATACTATGATATCGTGACAA T

TATGGCCTTAGGTACTGCCAGACAAGTTTCTACATTAGATGAATTGTTGAATAAATC T

GATTTTGTAACACTACATGTACCAGCTACTCCAGAAACTGAAAAAATGTTATCTGCT C

CACAATTCGCTGCTATGAAGGACGGGGCTTATGTTATTAATGCCTCAAGAGGTACTG

TCGTGGACATTCCATCTCTGATCCAAGCCGTCAAGGCCAACAAAATTGCAGGTGCTG

CTTTAGATGTTTATCCACATGAACCAGCTAAGAACGGTGAAGGTTCATTTAACGATG A

ACTTAACAGCTGGACTTCTGAGTTGGTTTCATTACCAAATATAATCCTGACACCACA T

ATTGGTG GCTCTACAGAAGAAG CTCAAAGTTCAATCG GTATTG AG GTG G CTACTGCA

TTGTCCAAATACATCAATGAAGGTAACTCTGTCGGTTCTGTGAACTTCCCAGAAGTC A

GTTTGAAGTCTTTGGACTACGATCAAGAGAACACAGTACGTGTCTTGTATATTCATC G

TAACGTTCCTGGTGTTTTGAAGACCGTTAATGATATCTTATCCGATCATAATATCGA G

AAACAGTTTTCTGATTCTCACGGCGAGATCGCTTATCTAATGGCAGACATCTCTTCT G

TTAATCAAAGTGAAATCAAGGATATATATGAAAAGTTGAACCAAACTTCTGCCAAAG TT

TCCATCAGGTTATTATACTAA

Protein sequence from Glucose-6-phosphate dehydrogenase (ZWF1 )

SEQ ID NO:57

of Saccharomyces cerevisiae

MSEGPVKFEKNTVISVFGASGDLAKKKTFPALFGLFREGYLDPSTKIFGYARSKLSMEED

LKSRVLPHLKKPHGEADDSKVEQFFKMVSYISGNYDTDEGFDELRTQIEKFEKSANV DV

PHRLFYLALPPSVFLTVAKQIKSRVYAENGITRVIVEKPFGHDLASARELQKNLGPL FKEE

ELYRIDHYLGKELVKNLLVLRFGNQFLNASWNRDNIQSVQISFKERFGTEGRGGYFD SIG

IIRDVMQNHLLQIMTLLTMERPVSFDPESIRDEKVKVLKAVAPIDTDDVLLGQYGKS EDGS

KPAYVDDDTVDKDSKCVTFAAMTFNIENERWEGVPIMMRAGKALNESKVEIRLQYKA VA

SGVFKDIPNNELVIRVQPDAAVYLKFNAKTPGLSNATQVTDLNLTYASRYQDFWIPE AYE

VLIRDALLGDHSNFVRDDELDISWGIFTPLLKHIERPDGPTPEIYPYGSRGPKGLKE YMQ

KHKYVMPEKHPYAWPVTKPEDTKDN

DNA sequence encoding Glucose-6-phosphate dehydrogenase (ZWF1 )

SEQ ID NO:58

of Saccharomyces cerevisiae

ATGAGTGAAGGCCCCGTCAAATTCGAAAAAAATACCGTCATATCTGTCTTTGGTGCGT CAGGTGATCTGGCAAAGAAGAAGACTTTTCCCGCCTTATTTGGGCTTTTCAGAGAAG GTTACCTTGATCCATCTACCAAGATCTTCGGTTATGCCCGGTCCAAATTGTCCATGGA GGAGGACCTGAAGTCCCGTGTCCTACCCCACTTGAAAAAACCTCACGGTGAAGCCG ATGACTCTAAGGTCGAACAGTTCTTCAAGATGGTCAGCTACATTTCGGGAAATTACGA

CACAGATGAAGGCTTCGACGAATTAAGAACGCAGATCGAGAAATTCGAGAAAAGTGC

CAACGTCGATGTCCCACACCGTCTCTTCTATCTGGCCTTGCCGCCAAGCGTTTTTTT

GACGGTGGCCAAGCAGATCAAGAGTCGTGTGTACGCAGAGAATGGCATCACCCGTG

TAATCGTAGAGAAACCTTTCGGCCACGACCTGGCCTCTGCCAGGGAGCTGCAAAAAA

ACCTGGGGCCCCTCTTTAAAGAAGAAGAGTTGTACAGAATTGACCATTACTTGGGTA

AAGAGTTGGTCAAGAATCTTTTAGTCTTGAGGTTCGGTAACCAGTTTTTGAATGCCT C

GTGGAATAGAGACAACATTCAAAGCGTTCAGATTTCGTTTAAAGAGAGGTTCGGCAC

CGAAGGCCGTGGCGGCTATTTCGACTCTATAGGCATAATCAGAGACGTGATGCAGAA

CCATCTGTTACAAATCATGACTCTCTTGACTATGGAAAGACCGGTGTCTTTTGACCC G

GAATCTATTCGTGACGAAAAGGTTAAGGTTCTAAAGGCCGTGGCCCCCATCGACACG

GACGACGTCCTCTTGGGCCAGTACGGTAAATCTGAGGACGGGTCTAAGCCCGCCTA

CGTGGATGATGACACTGTAGACAAGGACTCTAAATGTGTCACTTTTGCAGCAATGAC

TTTCAACATCGAAAACGAGCGTTGGGAGGGCGTCCCCATCATGATGCGTGCCGGTA

AGGCTTTGAATGAGTCCAAGGTGGAGATCAGACTGCAGTACAAAGCGGTCGCATCG

GGTGTCTTCAAAGACATTCCAAATAACGAACTGGTCATCAGAGTGCAGCCCGATGCC

GCTGTGTACCTAAAGTTTAATGCTAAGACCCCTGGTCTGTCAAATGCTACCCAAGTC A

CAGATCTG AATCTAACTTACG CAAG CAG GTACCAAG ACTTTTG GATTCCAGAG GCTTA

CGAGGTGTTGATAAGAGACGCCCTACTGGGTGACCATTCCAACTTTGTCAGAGATGA

CGAATTGGATATCAGTTGGGGCATATTCACCCCATTACTGAAGCACATAGAGCGTCC

GGACGGTCCAACACCGGAAATTTACCCCTACGGATCAAGAGGTCCAAAGGGATTGA

AGGAATATATGCAAAAACACAAGTATGTTATGCCCGAAAAGCACCCTTACGCTTGGC

C C GTG ACTAAG C C AG AAG ATAC G AAG G ATAATTAG

Protein sequence from Putative aryl alcohol dehydrogenase (YPL088W)

SEQ ID NO:59

of Saccharomyces cerevisiae

MVLVKQVRLGNSGLKISPIVIGCMSYGSKKWADWVIEDKTQIFKIMKHCYDKGLRTFDTA

DFYSNGLSERIIKEFLEYYSIKRETVVIMTKIYFPVDETLDLHHNFTLNEFEELDLS NQRGL

SRKHIIAGVENSVKRLGTYIDLLQIHRLDHETPMKEIMKALNDVVEAGHVRYIGASS MLAT

EFAELQFTADKYGWFQFISSQSYYNLLYREDERELIPFAKRHNIGLLPWSPNARGML TR

PLNQSTDRIKSDPTFKSLHLDNLEEEQKEIINRVEKVSKDKKVSMAMLSIAWVLHKG CHPI

VGLNTTARVDEAIAALQVTLTEEEIKYLEEPYKPQRQRC

DNA sequence encoding Putative aryl alcohol dehydrogenase

SEQ ID NO:60

(YPL088W) of Saccharomyces cerevisiae

ATGGTTTTAGTTAAGCAGGTAAGACTCGGTAACTCAGGTCTTAAGATATCACCGATA

GTGATAGGATGTATGTCATACGGGTCCAAGAAATGGGCGGACTGGGTCATAGAGGA

CAAGACCCAAATTTTCAAGATTATGAAGCATTGTTACGATAAAGGTCTTCGTACTTT T

GACACAGCAGATTTTTATTCTAATGGTTTGAGTGAAAGAATAATTAAGGAGTTTCTG G

AGTACTACAGTATAAAGAGAGAAACGGTGGTGATTATGACCAAAATTTACTTCCCAG

TTGATGAAACGCTTGATTTGCATCATAACTTCACTTTAAATGAATTTGAAGAATTGG A

CTTGTCCAACCAGCGGGGTTTATCCAGAAAGCATATAATTGCTGGTGTCGAGAACTC

TGTGAAAAGACTGGGCACATATATAGACCTTTTACAAATTCACAGATTAGATCATGA A

ACGCCAATGAAAGAGATCATGAAGGCATTGAATGATGTTGTTGAAGCGGGCCACGT

TAGATAC ATTG G GG CTTCG AGTATGTTG G CAACTG AATTTG CAG AACTG CAGTTCAC

AGCCGATAAATATGGCTGGTTTCAGTTCATTTCTTCGCAGTCTTACTACAATTTGCT C

TATCGTGAAGATGAACGCGAATTGATTCCTTTTGCCAAAAGACACAATATTGGTTTA C

TTCCATGGTCTCCTAACGCACGAGGCATGTTGACTCGTCCTCTGAACCAAAGCACG

GACAGGATTAAGAGTGATCCAACTTTCAAGTCGTTACATTTGGATAATCTCGAAGAA

GAACAAAAGGAAATTATAAATCGTGTGGAAAAGGTGTCGAAGGACAAAAAAGTCTCG

ATGGCTATGCTCTCCATTGCATGGGTTTTGCATAAAGGATGTCACCCTATTGTGGGA

TTGAACACTACAGCAAGAGTAGACGAAGCGATTGCCGCACTACAAGTAACTCTAACA

GAAGAAGAGATAAAGTACCTCGAGGAGCCCTACAAACCCCAGAGGCAAAGATGTTA

Protein sequence NADP+ dependent arabinose dehydrogenase (ARA1 )

SEQ ID NO:61

of Saccharomyces cerevisiae MSSSVASTENIVENMLHPKTTEIYFSLNNGVRIPALGLGTANPHEKLAETKQAVKAAIKA G

YRHIDTAWAYETEPFVGEAIKELLEDGSIKREDLFITTKVWPVLWDEVDRSLNESLK ALG

LEYVDLLLQHWPLCFEKIKDPKGISGLVKTPVDDSGKTMYAADGDYLETYKQLEKIY LDP

NDHRVRAIGVSNFSIEYLERLIKECRVKPTVNQVETHPHLPQMELRKFCFMHDILLT AYS

PLGSHGAPNLKIPLVKKLAEKYNVTGNDLLISYHIRQGTIVIPRSLNPVRISSSIEF ASLTKD

ELQELNDFGEKYPVRFIDEPFAAILPEFTGNGPNLDNLKY

DNA Encoding NADP+ dependent arabinose dehydrogenase (ARA1 ) of

SEQ ID NO:62

Saccharomyces cerevisiae

ATGTCTTCTTCAGTAGCCTCAACCGAAAACATAGTCGAAAATATGTTGCATCCAAAGA

CTACAGAAATATACTTTTCACTCAACAATGGTGTTCGTATCCCAGCACTGGGTTTGG G

GACAGCAAATCCTCACGAAAAGTTAGCTGAAACAAAACAAGCCGTAAAAGCTGCAAT

CAAAGCTGGATACAGGCACATTGATACTGCTTGGGCCTACGAGACAGAGCCATTCGT

AGGTGAAGCCATCAAGGAGTTATTAGAAGATGGATCTATCAAAAGGGAGGATCTTTT

CATAACCACAAAAGTGTGGCCGGTTCTATGGGACGAAGTGGACAGATCATTGAATGA

ATCTTTGAAAGCTTTAGGCTTGGAATACGTCGACTTGCTCTTGCAACATTGGCCGCT A

TGTTTTGAAAAGATTAAGGACCCTAAGGGGATCAGCGGACTGGTGAAGACTCCGGTT

GATGATTCTGGAAAAACAATGTATGCTGCCGACGGTGACTATTTAGAAACTTACAAG C

AATTGGAAAAAATTTACCTTGATCCTAACGATCATCGTGTGAGAGCCATTGGTGTCT C

AAATTTTTCCATTGAGTATTTGGAACGTCTCATTAAGGAATGCAGAGTTAAGCCAAC G

GTGAACCAAGTGGAAACTCACCCTCACTTACCACAAATGGAACTAAGAAAGTTCTGC

TTTATGCACGACATTCTGTTAACAGCATACTCACCATTAGGTTCCCATGGCGCACCA A

ACTTGAAAATCCCACTAGTGAAAAAGCTTGCCGAAAAGTACAATGTCACAGGAAATG A

CTTGCTAATTTCTTACCATATTAGACAAGGCACTATCGTAATTCCGAGATCCTTGAA TC

CAGTTAGGATTTCCTCGAGTATTGAATTCGCATCTTTGACAAAGGATGAATTACAAG A

GTTGAACGACTTCGGTGAAAAATACCCAGTGAGATTCATCGATGAGCCATTTGCAGC

CATCCTTCCAGAGTTTACTGGTAACGGACCAAACTTGGACAATTTAAAGTATTAA

SEQ ID NO:63 | DNA sequence from vector pEVE2120

CCTTGGCCAATTTTAAAATTGGAAAATTCCGGGGCCCCAAAACCGGCCGGCCGGGGG GGGAAGGAAGGGGCCGGTTTGCGTATTGGGCGCT CTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGC GGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACG C AG G AAAG AAC ATGTG AG C AAAAG G C C AG C AAAAG G C C AG G AAC C GTAAAAAG G C CGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATC GACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTT CCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATA CCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTA GGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCC CCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCC G GTAAG AC AC G ACTTATC G C C ACTG G C AG C AG C C ACTG GTAAC AG G ATTAG C AG AG CGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTAC ACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAA AGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTT GTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATC TTTTCTACGG G GTCTGACG CTCAGTG GAACGAAAACTCAC GTTAAG G GATTTTG GTC ATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAA ATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGT GAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCC GTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAAT G ATAC C G C GAG AC C C AC G CTC AC C G G CTC C AG ATTTATC AG C AATAAAC C AG C C AG CCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCT ATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAAC GTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCA TTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAA AAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGT GTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTA

AGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATG

CGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAG

CAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAG

GATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATC

TTC AG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAGG AAG GCAAAA

TGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCT

TTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATT TG

AATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGC

CACCTGGGTCCTTTTCATCACGTGCTATAAAAATAATTATAATTTAAATTTTTTAAT AT

AAATATATAAATTAAAAATAGAAAGTAAAAAAAGAAATTAAAGAAAAAATAGTTTTT GT

TTTCCGAAGATGTAAAAGACTCTAGGGGGATCGCCAACAAATACTACCTTTTATCTT

GCTCTTCCTGCTCTCAGGTATTAATGCCGAATTGTTTCATCTTGTCTGTGTAGAAGA C

CACACACGAAAATCCTGTGATTTTACATTTTACTTATCGTTAATCGAATGTATATCT AT

TTAATCTGCTTTTCTTGTCTAATAAATATATATGTAAAGTACGCTTTTTGTTGAAAT TTT

TTAAACCTTTGTTTATTTTTTTTTCTTCATTCCGTAACTCTTCTACCTTCTTTATTT ACT

TTCTAAAATCCAAATACAAAACATAAAAATAAATAAACACAGAGTAAATTCCCAAAT TA

TTCCATCATTAAAAGATACGAGGCGCGTGTAAGTTACAGGCAAGCGATCCGTCCTAA

GAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTT C

GTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAG

ACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCG

CGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCA

GATTGTACTGAGAGTGCACCATACCACAGCTTTTCAATTCAATTCATCATTTTTTTT TT

ATTCTTTTTTTTGATTTCGGTTTCTTTGAAATTTTTTTGATTCGGTAATCTCCGAAC AG

AAG G AAGAACGAAGG AAG GAG CAC AG ACTTAG ATTG GTATATATACG CATATGTAGT

GTTGAAGAAACATGAAATTGCCCAGTATTCTTAACCCAACTGCACAGAACAAAAACC

TGCAGGAAACGAAGATAAATCATGTCGAAAGCTACATATAAGGAACGTGCTGCTACT

CATCCTAGTCCTGTTG CTG CCAAG CTATTTAATATCATG CAC GAAAAGCAAACAAACT

TGTGTG CTTCATTG GATGTTCGTACCACCAAG GAATTACTG G AGTTAGTTG AAG CAT

TAGGTCCCAAAATTTGTTTACTAAAAACACATGTGGATATCTTGACTGATTTTTCCA T

G GAG G G CAC AG TT AAG C C G CTAAAG G C ATTATC C G C C AAGTAC AATTTTTTACTCTT

CGAAGACAGAAAATTTGCTGACATTGGTAATACAGTCAAATTGCAGTACTCTGCGGG

TGTATACAGAATAGCAGAATGGGCAGACATTACGAATGCACACGGTGTGGTGGGCC

C AG GTATTGTTAG C G GTTTG AAG C AG G C G G C AG AAG AAGTAAC AAAG G AAC CTAG A

G GC CTTTTGATGTTAG CAGAATTGTCATG CAAG GG CTCCCTATCTACTG GAG AATAT

ACTAAGGGTACTGTTGACATTGCGAAGAGCGACAAAGATTTTGTTATCGGCTTTATT

G CTCAAAG AG ACATG G GTGG AAG AG ATG AAG GTTACG ATTG GTTGATTATG ACACC

CGGTGTGGGTTTAGATGACAAGGGAGACGCATTGGGTCAACAGTATAGAACCGTGG

ATGATGTGGTCTCTACAGGATCTGACATTATTATTGTTGGAAGAGGACTATTTGCAA A

GGGAAGGGATGCTAAGGTAGAGGGTGAACGTTACAGAAAAGCAGGCTGGGAAGCA

TATTTGAGAAGATGCGGCCAGCAAAACTAAAAAACTGTATTATAAGTAAATGCATGT A

TACTAAACTCACAAATTAGAGCTTCAATTTAATTATATCAGTTATTACCCTATGCGG TG

TGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGAAATTGTAAACGTT

AATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAA TAG

GCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAATAGACCGAGATAGGGTTGAGT

GTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTCCAACGTCAAA

GGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACCCTAATC

AAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAGCC

C C C G ATTTAG AG CTTG AC G G G G AAAG C C G G C G AAC GTG G C GAG AAAG G AAG G G AA

GAAAGCGAAAGGAGCGGGCGCTAGGGCGCTGGCAAGTGTAGCGGTCACGCTGCG

CGTAACCACCACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTCGCGCCAT

TCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGC

TATTACGCCAGCTGATTTGCCCGGGCAGTTCAGGCTCATCAGGCGCGCCATGCAGG

ATGCATTGATCAGTTAACCCATGGGCATGCGAAGGAAAATGAGAAATATCGAGGGA

GACGATTCAGAGGAGCAGGACAAACTATAACCGACTGTTTGTTGGAGGATGCCGTA CATAACGAACACTGCTGAAGCTACCATGTCTACAGTTTAGAGGAATGGGTACAACTC

ACAGGCGAGGGATGGTGTTCACTCGTGCTAGCAAACGCGGTGGGAGCAAAAAGTA

GAATATTATCTTTTATTCGTGAAACTTCGAACACTGTCATCTAAAGATGCTATATAC TA

ATATAGGCATACTTGATAATGAAAACTATAAATCGTAAAGACATAAGAGATCCGCGG

ATCCCCGGGTCGAGCCTGAACGGCCTCGAGGCCTGAACGGCCTCGACGAATTCAT

TATTTGTAGAGCTCATCCATGCCATGTGTAATCCCAGCAGCAGTTACAAACTCAAGA

AGGACCATGTGGTCACGCTTTTCGTTGGGATCTTTCGAAAGGGCAGATTGTGTCGA

CAGGTAATGGTTGTCTGGTAAAAGGACAGGGCCATCGCCAATTGGAGTATTTTGTTG

ATAATGGTCTGCTAGTTGAACGGATCCATCTTCAATGTTGTGGCGAATTTTGAAGTT A

GCTTTGATTCCATTCTTTTGTTTGTCTGCCGTGATGTATACATTGTGTGAGTTATAG T

TGTACTCGAGTTTGTGTCCGAGAATGTTTCCATCTTCTTTAAAATCAATACCTTTTA AC

TCGATACGATTAACAAGGGTATCACCTTCAAACTTGACTTCAGCACGCGTCTTGTAG

TTCCCGTCATCTTTGAAAGATATAGTGCGTTCCTGTACATAACCTTCGGGCATGGCA

CTCTTGAAAAAGTCATGCCGTTTCATATGATCCGGATAACGGGAAAAGCATTGAACA

CCATAAGAGAAAGTAGTGACAAGTGTTGGCCATGGAACAGGTAGTTTTCCAGTAGTG

CAAATAAATTTAAGGGTAAGCTGGCCCTGCAGGCCAAGCTTTGTTTTATATTTGTTG T

AAAAAGTAGATAATTACTTCCTTGATGATCTGTAAAAAAGAGAAAAAGAAAGCATCT A

AGAACTTGAAAAACTACGAATTAGAAAAGACCAAATATGTATTTCTTGCATTGACCA A

TTTATGCAAGTTTATATATATGTAAATGTAAGTTTCACGAGGTTCTACTAAACTAAA CC

ACCCCCTTGGTTAGAAGAAAAGAGTGTGTGAGAACAGGCTGTTGTTGTCACACGATT

CGGACAATTCTGTTTGAAAGAGAGAGAGTAACAGTACGATCGAACGAACTTTGCTCT

GGAGATCACAGTGGGCATCATAGCATGTGGTACTAAACCCTTTCCCGCCATTCCAG

AACCTTCGATTGCTTGTTACAAAACCTGTGAGCCGTCGCTAGGACCTTGTTGTGTGA

CG AAATTGG AAG CTG CAATCAATAGG AAG ACAG G AAGTC GAG CGTGTCTG G GTTTT

TTCAGTTTTGTTCTTTTTGCAAACAAATCACGAGCGACGGTAATTTCTTTCTCGATA A

GAGGCCACGTGCTTTATGAGGGTAACATCAATTCAAGAAGGAGGGAAACACTTCCTT

TTTCTGGCCCTGATAATAGTATGAGGGTGAAGCCAAAATAAAGGATTCGCGCCCAAA

TCGGCATCTTTAAATGCAGGTATGCGATAGTTCCTCACTCTTTCCTTACTCACGAGT A

ATTCTTGCAAATGCCTATTATGCAGATGTTATAATATCTGTGCGTAGATCTGATATC C

CTGCATGGCGCGCCTGATGAGCCTGAACTGCCCGGGCAAATCAG

SEQ ID NO:64 DNA sequence from vector pEVE27735

CTGATTTGCCCGGGCAGTTCAGGCTCATCAGGCGCGCCATGCAGGGATATCAGATC

TACGCACAGATATTATAACATCTGCATAATAGGCATTTGCAAGAATTACTCGTGAGT A

AGGAAAGAGTGAGGAACTATCGCATACCTGCATTTAAAGATGCCGATTTGGGCGCGA

ATCCTTTATTTTGGCTTCACCCTCATACTATTATCAGGGCCAGAAAAAGGAAGTGTT T

CCCTCCTTCTTGAATTGATGTTACCCTCATAAAGCACGTGGCCTCTTATCGAGAAAG A

AATTACCGTCGCTCGTGATTTGTTTGCAAAAAGAACAAAACTGAAAAAACCCAGACA C

GCTCGACTTCCTGTCTTCCTATTGATTGCAGCTTCCAATTTCGTCACACAACAAGGT C

CTAGCGACGGCTCACAGGTTTTGTAACAAGCAATCGAAGGTTCTGGAATGGCGGGA

AAGGGTTTAGTACCACATGCTATGATGCCCACTGTGATCTCCAGAGCAAAGTTCGTT

CGATCGTACTGTTACTCTCTCTCTTTCAAACAGAATTGTCCGAATCGTGTGACAACA A

CAGCCTGTTCTCACACACTCTTTTCTTCTAACCAAGGGGGTGGTTTAGTTTAGTAGA A

CCTCGTGAAACTTACATTTACATATATATAAACTTGCATAAATTGGTCAATGCAAGA AA

TACATATTTGGTCTTTTCTAATTCGTAGTTTTTCAAGTTCTTAGATGCTTTCTTTTT CTC

TTTTTTACAGATCATCAAGGAAGTAATTATCTACTTTTTACAACAAATATAAAACAA AG

CTTAAAATGAGAATGGAAGTCGTCTTGGTCGTTTTCTTGATGTTCATTGGTACTATC A

ACTGCGAAAGATTGATCTTCAATGGTAGACCTTTGTTGCACAGAGTTACCAAAGAAG A

AACCGTTATGTTGTACCACGAATTGGAAGTTGCTGCTTCTGCTGATGAAGTTTGGTC T

GTTGAAGGTTCTCCAGAATTGGGTTTACATTTGCCAGATTTGTTGCCAGCTGGTATT T

TTG CCAAGTTCG AAATTACTG GTG ATGGTG GTG AAG GTTCCATTTTG G ATATG ACTTT

TCCACCAGGTCAATTCCCACATCATTACAGAGAAAAGTTCGTCTTTTTCGACCACAA G

AACAGATACAAGTTGGTCGAACAAATCGATGGTGATTTCTTCGATTTGGGTGTTACT T

ACTACATGGACACCATTAGAGTTGTTGCTACTGGTCCAGATTCTTGCGTT ATT AAGTC

TACTACTGAATACCACGTCAAGCCAGAATTTGCTAAAATCGTTAAGCCATTGATCGA T ACCGTTCCATTGGCTATTATGTCTGAAGCTATTGCCAAGGTTGTCTTGGAAAACAAAC

ACAAGTCATCTGAATGAAAGACTCCGCGGATCTCTTATGTCTTTACGATTTATAGTT TT

CATTATCAAGTATGCCTATATTAGTATATAGCATCTTTAGATGACAGTGTTCGAAGT TT

CACGAATAAAAGATAATATTCTACTTTTTGCTCCCACCGCGTTTGCTAGCACGAGTG A

ACACCATCCCTCGCCTGTGAGTTGTACCCATTCCTCTAAACTGTAGACATGGTAGCT T

CAGCAGTGTTCGTTATGTACGGCATCCTCCAACAAACAGTCGGTTATAGTTTGTCCT G

CTCCTCTGAATCGTCTCCCTCGATATTTCTCATTTTCCTTCGCATGCCCATGGGTTA A

CTGATCAATGCATCCTGCATGGCGCGCCTGATGAGCCTGAACTGCCCGGGCAAATC

AGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAG

CCTGAATGGCGAATGGCGCGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGT

GTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCC

TTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCT A

AATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAA

AAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTT

CGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGA A

CAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTT CG

GCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAA AT

ATTAACGTTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATT TC

ACACCGCATAGGGTAATAACTGATATAATTAAATTGAAGCTCTAATTTGTGAGTTTA GT

ATACATGCATTTACTTATAATACAGTTTTTTAGTTTTGCTGGCCGCATCTTCTCAAA TA

TGCTTCCCAGCCTGCTTTTCTGTAACGTTCACCCTCTACCTTAGCATCCCTTCCCTT T

GCAAATAGTCCTCTTCCAACAATAATAATGTCAGATCCTGTAGAGACCACATCATCC A

CGGTTCTATACTGTTGACCCAATGCGTCTCCCTTGTCATCTAAACCCACACCGGGTG

TCATAATCAACCAATCGTAACCTTCATCTCTTCCACCCATGTCTCTTTGAGCAATAA AG

CCGATAACAAAATCTTTGTCGCTCTTCGCAATGTCAACAGTACCCTTAGTATATTCT C

CAGTAGATAGGGAGCCCTTGCATGACAATTCTGCTAACATCAAAAGGCCTCTAGGTT

CCTTTGTTACTTCTTCTGCCGCCTGCTTCAAACCGCTAACAATACCTGGGCCCACCA

CACCGTGTGCATTCGTAATGTCTGCCCATTCTGCTATTCTGTATACACCCGCAGAGT A

CTGCAATTTGACTGTATTACCAATGTCAGCAAATTTTCTGTCTTCGAAGAGTAAAAA AT

TGTACTTGGCGGATAATGCCTTTAGCGGCTTAACTGTGCCCTCCATGGAAAAATCAG

TCAAGATATCCACATGTGTTTTTAGTAAACAAATTTTGGGACCTAATGCTTCAACTA AC

TCCAGTAATTCCTTG GTG GTAC GAAC ATCCAATGAAG CACACAAGTTTGTTTG CTTTT

CGTGCATGATATTAAATAGCTTGGCAGCAACAGGACTAGGATGAGTAGCAGCACGTT

CCTTATATGTAGCTTTCGACATGATTTATCTTCGTTTCCTGCAGGTTTTTGTTCTGT GC

AGTTG G GTTAAG AATACTGG G CAATTTCATGTTTCTTCAAC ACTACATATG CGTATATA

TACCAATCTAAGTCTGTGCTCCTTCCTTCGTTCTTCCTTCTGTTCGGAGATTACCGA A

TCAAAAAAATTTCAAAGAAACCGAAATCAAAAAAAAGAATAAAAAAAAAATGATGAA TT

GAATTGAAAAGCTGTGGTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATA

GTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTC

TGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGT

CAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACG

CCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGGACGGATCGCTTGC CT

GTAACTTACACGCGCCTCGTATCTTTTAATGATGGAATAATTTGGGAATTTACTCTG T

GTTTATTTATTTTTATGTTTTGTATTTGGATTTTAGAAAGTAAATAAAGAAGGTAGA AGA

GTTACG G AATG AAG AAAAAAAAATAAACAAAG GTTTAAAAAATTTC AACAAAAAGC GT

ACTTTACATATATATTTATTAGACAAGAAAAGCAGATTAAATAGATATACATTCGAT TAA

CGATAAGTAAAATGTAAAATCACAGGATTTTCGTGTGTGGTCTTCTACACAGACAAG A

TGAAACAATTCGGCATTAATACCTGAGAGCAGGAAGAGCAAGATAAAAGGTAGTATT T

GTTGGCGATCCCCCTAGAGTCTTTTACATCTTCGGAAAACAAAAACTATTTTTTCTT TA

ATTTCTTTTTTTACTTTCTATTTTTAATTTATATATTTATATTAAAAAATTTAAATT ATAAT

TATTTTTATAGCACGTGATGAAAAGGACCCAGGTGGCACTTTTCGGGGAAATGTGCG

CGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAG AC

AATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAAC AT

TTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCAC C

CAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGT TACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAA

CGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGT A

TTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGG

TTG AGTACTCACC AGTCACAG AAAAG CATCTTACG G ATG G CATG ACAGTAAG AG AAT

TATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAA

CGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAA

CTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGT

GACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAA

CTACTTACTCTAG CTTCCCG G CAACAATTAATAG ACTG G ATG G AG G CG GATAAAGTT

GCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCT

GGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTA

AGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAAC

G AAATAG ACAG ATCG CTG AG ATAG GTGC CTCACTG ATTAAG CATTG GTAACTGTCAG

ACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAA GGA

TCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTT C

GTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTT T

TTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTT

TGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGA

GCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAG

AACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCT

GCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGAT

AAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGC

GAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACG

CTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAG

GAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTC

GGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCG

GAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTG

GCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTAT T

ACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCG

AGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGC

GCGTTGGCCGATTCATTAATGCAG

[0086] Having described the invention in detail and by reference to specific embodiments thereof, it will be apparent that modifications and variations are possible without departing from the scope of the invention defined in the appended claims. More specifically, although some aspects of the present invention are identified herein as particularly advantageous, it is contemplated that the present invention is not necessarily limited to these particular aspects of the invention.

Previous Patent: LUMINOUS ELEMENT AND METHOD FOR ILLUMINATING A COMPONENT OF A WIND ENERGY INSTALLATION, AND COMPONEN...

Next Patent: APPARATUS FOR HEATING PLASTICS PREFORMS WITH TRAVELLING TOP EMITTER