Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
VECTOR WITH CODON-OPTIMISED GENES FOR AN ARABINOSE METABOLIC PATHWAY FOR ARABINOSE CONVERSION IN YEAST FOR ETHANOL PRODUCTION
Document Type and Number:
WIPO Patent Application WO/2008/122354
Kind Code:
A1
Abstract:
The invention relates to novel expression cassettes and expression vectors, having three nucleic acid sequences for araA, araB and araD, each coding for a polypeptide of an L-arabinose metabolic pathway, in particular, a bacterial L-arabinose metabolic pathway. The invention particularly relates to expression cassettes and expression vectors, having codon-optimised nucleic acid sequences for araA, araB and araD. The invention further relates to host cells, in particular, modified yeast stem cells containing the expression cassettes or expression vectors and expressing the polypeptides for the L-arabinose metabolic pathway, in particular, for the bacterial L-arabinose metabolic pathway. Arabinose is more effectively fermented by these cells,in particular to give ethanol, by means of said modified host cells. The invention is amongst other things important in the production of biochemicals from biomasses such as, for example, bioethanol.

Inventors:
BOLES ECKHARD (DE)
WIEDEMANN BEATE (DE)
Application Number:
PCT/EP2008/002277
Publication Date:
October 16, 2008
Filing Date:
March 20, 2008
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
UNIV JW GOETHE FRANKFURT MAIN (DE)
BOLES ECKHARD (DE)
WIEDEMANN BEATE (DE)
International Classes:
C12N9/90; C12N15/81; C12P7/10
Domestic Patent References:
WO1998050524A11998-11-12
WO2006096130A12006-09-14
WO2003008593A22003-01-30
Other References:
SEDLAK M ET AL: "EXPRESSION OF E. COLI ARABAD OPERON ENCODING ENZYMES FOR METABOLIZING L-ARABINOSE IN SACCHAROMYCES CEREVISIAE", ENZYME AND MICROBIAL TECHNOLOGY, STONEHAM, MA, US, vol. 28, 1 January 2001 (2001-01-01), pages 16 - 24, XP002950458, ISSN: 0141-0229
DATABASE NCBI 29 September 2004 (2004-09-29), "AraA, Bacillus licheniformis", XP002487029, Database accession no. AAU41894
BENNETZEN J L ET AL: "CODON SELECTION IN YEAST SACCHAROMYCES-CEREVISIAE", JOURNAL OF BIOLOGICAL CHEMISTRY, vol. 257, no. 6, 1982, pages 3026 - 3031, XP009102736, ISSN: 0021-9258
FONSECA C ET AL: "L-Arabinose transport and catabolism in yeast", FEBS JOURNAL, BLACKWELL PUBLISHING, LONDON, GB, vol. 274, 1 January 2007 (2007-01-01), pages 3589 - 3600, XP007903587, ISSN: 1742-464X
Attorney, Agent or Firm:
GRAHN, Sibylla, M. et al. (AnwaltssozietätPettenkoferstrasse 20-22, München, DE)
Download PDF:
Claims:
Johann Wolfgang Goethe-Universität, Frankfurt am Main U30171PCT

Patentansprüche

1. Nukleinsäuremolekül, umfassend drei Nukleinsäuresequenzen, die jeweils für ein Polypeptid eines L-Arabinose-Stoffwechselweges, insbesondere bakteriellen L-Arabinose- Stoffwechselweges, kodieren.

2. Nukleinsäuremolekül nach Anspruch 1, wobei die drei Nukleinsäuresequenzen, die jeweils für ein Polypeptid eines L-Arabinose-Stoffwechselweges, insbesondere bakteriellen L-Arabinose-Stoffwechselweges, kodieren, araA (L-Arabinose-Isomerase), araB (L- Ribulokinase) und araD (L-Ribulose-5-P-4-Epimerase) sind.

3. Nukleinsäuremolekül nach Anspruch 1 oder 2, wobei die Nukleinsäuresequenz mit der natürlich vorkommenden Nukleinsäuresequenz identisch ist oder für eine Verwendung in einer Wirtszelle Codon-optimiert ist.

4. Nukleinsäuremolekül nach einem der Ansprüche 1 bis 3, wobei mindestens zwei der drei Nukleinsäuresequenzen für eine Verwendung in einer Wirtszelle Codon-optimiert sind.

5. Nukleinsäuremolekül nach einem der vorangehenden Ansprüche, wobei die Nukleinsäuresequenz für araB und die Nukleinsäuresequenz für araD aus E. coli abstammt.

6. Nukleinsäuremolekül nach Anspruch 5, wobei die Nukleinsäuresequenz für araB eine Nukleinsäuresequenz mit der SEQ ID NO: 1 umfaßt.

7. Nukleinsäuremolekül nach Anspruch 5, wobei die Nukleinsäuresequenz für araD eine Nukleinsäuresequenz mit der SEQ ID NO: 2 umfaßt.

8. Nukleinsäuremolekül nach einem der vorangehenden Ansprüche, wobei die Nukleinsäuresequenz für araA aus Bacillus licheniformis oder Clostridium acetobutylicum abstammt.

9. Nukleinsäuremolekül nach Anspruch 8, wobei die Nukleinsäuresequenz für araA eine Nukleinsäuresequenz mit der SEQ ID NO: 3, 4 oder 5 umfaßt.

10. Nukleinsäuremolekül nach einem der vorangehenden Ansprüche, umfassend die Nukleinsäuresequenz mit der SEQ ID NO: I 5 die Nukleinsäuresequenz mit der SEQ ID NO: 2 sowie die Nukleinsäuresequenz mit der SEQ ID NO: 3, 4 oder 5.

11. Nukleinsäuremolekül nach einem der vorangehenden Ansprüche, wobei das Nukleinsäuremolekül dsDNA, ssDNA, PNA, CNA, RNA oder mRNA oder Kombinationen davon umfaßt

12. Expressionskassette, umfassend ein Nukleinsäuremolekül nach einem der Ansprüche 1 bis 11.

13. Expressionskassette nach Anspruch 12, weiterhin umfassend Promotor- und Terminatorsequenzen.

14. Expressionskassette nach Anspruch 13, wobei Promotorsequenzen ausgewählt sind aus HXT7, verkürzter HXT7, PFKl, FBAl, PGKl, ADHl und TDH3.

15. Expressionskassette nach Anspruch 13, wobei Terminatorsequenzen ausgewählt sind aus CYCl, FBAl, PGKl, PFKl, ADHl und TDH3.

16. Expressionskassette nach einem der vorangehenden Ansprüche, umfassend jeweils unterschiedliche Paare aus Promotor- und Terminatorsequenzen.

17. Expressionskassette nach Anspruch 16, wobei die Paare aus Promotor- und Terminatorsequenzen ausgewählt sind aus HXT7- oder verkürzter HXT7-Promotor und CYCl -Terminator, PFKl -Promotor und FBAl -Terminator sowie FBAl -Promotor und PGKl -Terminator.

18. Expressionskassette nach einem der vorangehenden Ansprüche, weiterhin umfassend 5' und/oder 3' Erkennungssequenzen.

19. Expressionskassette nach Anspruch 18, umfassend die Erkennungssequenzen der Enzyme Pacl und Ascl.

20. Expressionsvektor, umfassend ein Nukleinsäuremolekül nach einem der Ansprüche 1 bis 11 oder eine Expressionskassette nach einem der Ansprüche 12 bis 19.

21. Expressionsvektor nach Anspruch 20, weiterhin umfassend einen Selektionsmarker.

22. Expressionsvektor nach Anspruch 21, wobei der Selektionsmarker ausgewählt ist aus einem Leucin-Marker, einem Uracil-Marker oder einem dominanten Antibiotika-Marker, insbesondere Geneticin, Hygromycin und Nourseothricin.

23. Expressionsvektor nach einem der Ansprüche 20 bis 22, der ausgewählt ist aus der Gruppe p425H7synthAra, pRS303X, p3RS305X oder p3RS306X.

24. Wirtszelle, die ein Nukleinsäuremolekül nach einem der Ansprüche 1 bis 11, eine Expressionskassette nach einem der Ansprüche 12 bis 19 oder einen Expressionsvektor nach einem der Ansprüche 20 bis 22 enthält.

25. Wirtszelle nach Anspruch 24, die ein Nukleinsäuremolekül nach einem der Ansprüche 1 bis 11, eine Expressionskassette nach einem der Ansprüche 12 bis 19 oder einen Expressionsvektor nach einem der Ansprüche 20 bis 22 genomisch stabil integriert enthält.

26. Wirtszelle nach Anspruch 24 oder 25, die eine Pilzzelle und bevorzugt eine Hefezelle, wie Saccharomyces species, Kluyveromyces sp., Hansenula sp., Pichia sp. oder Yarrowia sp., ist.

27. Wirtszelle nach Anspruch 26, ausgewählt aus BWYl, CEN.PK113-7D, Red Star Ethanol Red, Lalellemand und Fermiol.

28. Verfahren zur Produktion von Bioethanol, umfassend die Expression eines Nukleinsäuremoleküls nach einem der Ansprüche 1 bis 11, einer Expressionskassette nach einem der Ansprüche 12 bis 19 oder eines Expressionsvektors nach einem der Ansprüche 20 bis 22 in einer Wirtszelle.

29. Verfahren nach Anspruch 28, wobei die Wirtszelle eine Wirtszelle nach einem der Ansprüche 24 bis 27 ist.

30. Verwendung eines Nukleinsäuremoleküls nach einem der Ansprüche 1 bis 11, einer Expressionskassette nach einem der Ansprüche 12 bis 19, eines Expressionsvektors nach einem der Ansprüche 20 bis 22 oder einer Wirtszelle nach einem der Ansprüche 24 bis 27 zur Produktion von Bioethanol.

31. Verwendung eines Nukleinsäuremoleküls nach einem der Ansprüche 1 bis 11, einer Expressionskassette nach einem der Ansprüche 12 bis 19, eines Expressionsvektors nach einem der Ansprüche 20 bis 22 oder einer Wirtszelle nach einem der Ansprüche 24 bis 27 zur rekombinanten Fermentation von Pentose-haltigem Biomaterial.

32. Polypeptid, ausgewählt aus der Gruppe von a. einem Polypeptid, das zu mindestens 70%, bevorzugt mindestens 80% identisch zu der Aminosäuresequenz nach SEQ ID NO: 6 oder 7 ist und eine in vitro und/oder in vivo Pentose- Isomerasefunktion aufweist, b. einer natürlich auftretenden Variante eines Polypeptids umfassend die Aminosäuresequenz nach SEQ ID NO: 6 oder 7, die eine in vitro und/oder in vivo Pentose-Isomerasefunktion aufweist, c. einem Polypeptid, das identisch zu der Aminosäuresequenz nach SEQ ID NO: 6 oder 7 ist und eine in vitro und/oder in vivo Pentose-Isomerasefunktion aufweist, und d. einem Fragment des Polypeptids aus a., b. oder c, umfassend ein Fragment von mindestens 100, 200 oder 300 kontinuierlichen Aminosäuren nach SEQ ID NO: 6 oder 7.

33. Polypeptid nach Anspruch 32, umfassend ein Polypeptid das zu mindestens 90%, bevorzugt 95% identisch zu der Aminosäuresequenz nach SEQ ID NO: 6 oder 7 ist und eine in vitro und/oder in vivo Pentose-Isomerasefunktion aufweist.

34. Polypeptid nach einem der Ansprüche 32 oder 33, wobei die Pentose Arabinose, insbesondere L- Arabinose ist

35. Polypeptid nach einem der Ansprüche 32 bis 34, wobei das Polypeptid aus einem Bakterium, bevorzugt aus Bacillus licheniformis oder Clostridium acetobutylicum abstammt.

36. Isoliertes Nukleinsäuremolekül, kodierend für ein Polypeptid nach einem der Ansprüche 32 bis 35.

37. Wirtszelle, die ein Nukleinsäuremolekül nach Anspruch 36 enthält.

38. Wirtszelle nach Anspruch 24 bis 27 oder nach Anspruch 37, die eine oder weitere zusätzliche Modifikationen enthält.

Description:

VEKTOR MIT CODON-OPTIMIERTEN GENEN EINES ARABINOSE-STOFFWECHSELWEGES ZUR ARABINOSE-UMSETZUNG IN HEFE ZUR ETHANOLHERSTELLUNG

1. Zusammenfassung

Die vorliegende Erfindung bezieht sich auf neue Expressionskassetten und Expressionsvektoren, die drei Nukleinsäuresequenzen für araA, araB und araD umfassen, die jeweils für ein Polypeptid eines L-Arabinose-Stoffwechselweges, insbesondere eines bakteriellen L-Arabinose-Stoffwechselweges, kodieren. Die Erfindung bezieht sich insbesondere auf Expressionskassetten und Expressionsvektoren, die Codon-optimierte Nukleinsäuresequenzen für araA, araB und araD umfassen. Die Erfindung bezieht sich des weiteren auf Wirtszellen, insbesondere modifizierte Hefe-Stämme, die die Expressionskassetten oder Expressionsvektoren enthalten und die Polypeptide des L- Arabinose-Stoffwechselweges, insbesondere des bakteriellen L-Arabinose-Stoffwechselweges, exprimieren. Bei der Verwendung dieser modifizierten Wirtszellen wird Arabinose durch diese Zellen effektiver fermentiert, insbesondere zu Ethanol. Die vorliegende Erfindung ist somit unter anderem bedeutsam im Zusammenhang mit der Produktion von Biochemikalien aus Biomasse, wie z.B. Bioethanol.

2. Hintergrund der Erfindung

Die Bier-, Wein- und Bäckerhefe Saccharomyces cerevisiae wird aufgrund ihrer Eigenschaft, Zucker zu Ethanol und Kohlendioxid zu fermentieren, schon seit Jahrhunderten für die Brot-, Wein- und Bierherstellung genutzt. In der Biotechnologie findet S. cerevisiae neben der Produktion von heterologen Proteinen vor allem in der Ethanolproduktion für industrielle Zwecke Verwendung. Ethanol wird in zahlreichen Industriezweigen als Ausgangssubstrat für Synthesen benutzt. Durch die immer knapper werdenden ölvorkommen, die steigenden ölpreise und den stetig steigenden weltweiten Benzinbedarf gewinnt Ethanol als Kraftstoffalternative mehr und mehr an Bedeutung.

Um eine kostengünstige und effiziente Bioethanol-Produktion zu ermöglichen bietet sich die Verwendung von lignozellulosehaltiger Biomasse, wie z.B. Stroh, Abfälle aus der Holz- und Landwirtschaft und der organische Anteil aus dem alltäglichen Hausmüll, als

Ausgangssubstrat an. Diese ist zum einen sehr günstig und zum anderen in großer Menge vorhanden. Die drei größten Bestandteile der Lignozellulose sind Lignin, Zellulose und Hemizellulose. Hemizellulose, nach Zellulose das am zweithäufigsten vorkommende Polymer, ist ein stark verzweigtes Heteropolymer. Es besteht aus Pentosen (L-Arabinose, D-Xylose), Uronsäuren (4-O-Methyl-D-Glucuronsäure, D-Galacturonsäure) und Hexosen (D-Mannose, D-Galactose, L-Rhamnose, D-Glucose) (siehe Figur 1). Hemizellulose lässt sich zwar leichter als Zellulose hydrolysieren, besitzt aber die Pentosen L-Arabinose und D-Xylose, die von der Hefe S. cerevisiae normalerweise nicht umgesetzt werden können.

Um Pentosen für Fermentationen nutzen zu können, müssen diese zuerst über die Plasmamembran in die Zelle hinein gelangen. Obwohl S. cerevisiae nicht in der Lage ist, D- Xylose zu metabolisieren, kann es diese in die Zelle aufnehmen. S. cerevisiae besitzt aber keine spezifischen Transporter. Der Transport findet mit Hilfe der zahlreichen Hexosetransporter statt. Die Affinität der Transporter zu D-Xylose ist aber deutlich niedriger als die zu D-Glucose (Kotter und Ciriacy, 1993). In Hefen, die D-Xylose metabolisieren können, wie z.B. P. stipitis, C. shehatae oder P. tannophilus (Du Preez et al., 1986), gibt es sowohl unspezifische niederaffine Transporter, die D-Glucose transportieren, als auch spezifische hochaffine Protonen-Symporter nur für D-Xylose (Hahn-Hagerdal et al, 2001).

In früheren Versuchen konnten einige Hefen, wie zum Beispiel Candida tropicalis, Pachysolen tannophilus, Pichia stipitis, Candida shehatae gefunden werden, die von Natur aus L-Arabinose fermentieren oder zumindest assimilieren können. Diesen fehlt jedoch die Fähigkeit, L-Arabinose zu Ethanol zu fermentieren ganz oder sie besitzen nur eine sehr geringe Ethanolausbeute (Dien et al., 1996).

Verwertung von L-Arabinose

Damit die Pentose L-Arabinose von S. cerevisiae metabolisiert werden kann, muss sie über Transportproteine in die Zelle aufgenommen und über drei enzymatische Schritte zu dem Metaboliten D-Xylulose-5-Phosphat umgesetzt werden. Diese drei enzymatischen Schritte können der Hefe durch heterolog exprimierte Gene zur Verfügung gestellt werden. D- Xylulose-5 -Phosphat stellt ein Intermediat des Pentosephosphatweges dar und kann in der Zelle unter anaeroben Bedingungen weiter zu Ethanol abgebaut werden kann (siehe Figur 2).

Becker und Boles (2003) beschreiben das Engineering und die Selektion eines Laborstammnes von S. cerevisiae, der in der Lage ist, L-Arabinose zum Wachstum zu verwenden und zu Ethanol zu fermentieren. Dies war möglich durch die überexpression eines bakteriellen L-Arabinose-Stoffwechselweges, bestehend aus Bacillus subtilis AraA and Escherichia coli AraB and AraD and simultaner überrexpression der L-Arabinose- transportierenden Hefe-Galaktose-Permease in dem Hefestamm. Molekulare Analyse des selektierten Stammes zeigte, daß die entscheidende Voraussetzung für eine Verwendung von L-Arabinose eine niedrigere Aktivität von L-Ribulokinase ist. Von diesem Hefestamm wird jedoch unter anderem ein sehr langsames Wachstum berichtet, (siehe Figur 2)

Bisher war es nur möglich, die nativen Gene bakterieller Arabinose-Stoffwechselwege, die für die Arabinose-Umsetzung in S. cerevisiae essentiell sind, auf einzelnen Plasmiden zu exprimieren bzw. einzeln in das Genom der Hefe zu integrieren (Karhumaa et al, 2006). Dass heisst, jede Hefetransformande mit einem funktionellen Arabinose- Stoffwechsel weg enthielt mindestens drei Plasmide oder die Gene im rDNA-Lokus integriert (Becker und Boles, 2003; Karhumaa et al, 2006 ).

Das Vorhandensein der Gene auf unterschiedlichen Plasmiden bringt mehrere Nachteile mit sich. Zum einen stellen gleichzeitig vorhandene Plasmide für die Hefezellen eine zusätzliche Belastung dar („Plasmid-Last", Review zu E. coli von Bailey (1993)). Zum anderen weisen die verwendeten Plasmide starke Homologien in ihren Sequenzen auf, so dass es über homologe Rekombination zu Informationsverlusten innerhalb der Plasmide kommen kann (Wiedemann, 2005). Die Hauptnachteile beim Einsatz von Plasmiden liegen jedoch darin, dass sie ohne Selektionsdruck nicht stabil in den Stämmen vorhanden bleiben und dass sie nicht für den industriellen Einsatz geeignet sind.

Zudem wäre es für industrielle Anwendungen ideal, wenn der verwendete Mikroorganismus alle im Medium vorhanden Zucker umsetzten könnte. Da die zur Zeit industriell eingesetzte Hefen nicht in der Lage sind, die im Medium vorhandene Arabinose umzusetzen, wäre es von großem Vorteil, den Stämmen diese zusätzliche Fähigkeit stabil zu verleihen.

Aufgabe der vorliegenden Erfindung ist es daher, Mittel zur Verfügung zu stellen, die die aus dem Stand der Technik bekannten Nachteile der einzelnen Einbringung der Gene eines

bakteriellen L-Arabinose-Stoffwechselweges in Wirtszellen überwinden und insbesondere für Industriehefestämme verwendet werden können.

Die Aufgabe wird erfindungsgemäß gelöst durch zur Verfügung stellen von Nukleinsäuremolekülen, umfassend drei Nukleinsäuresequenzen, die jeweils für ein Polypeptid eines L-Arabinose-Stoffwechselweges, insbesondere eines bakteriellen L- Arabinose-Stoffwechselweges, kodieren.

Bei einem erfindungsgemäßen Nukleinsäuremolekül handelt es sich um ein rekombinantes Nukleinsäuremolekül. Des weiteren umfassen erfindungsgemäße Nukleinsäuremoleküle dsDNA, ssDNA, PNA, CNA, RNA oder mRNA oder Kombinationen davon.

Der „L-Arabinose-Stoffwechselweg" oder „bakterielle L-Arabinose-Stoffwechselweg", wie er z.B. in E. coli vorkommt, wird in Figur 2 dargestellt. Dieser Stoffwechselweg beinhaltet die 3 Enzyme: L-Arabinose-Isomerase, L-Ribulokinase und L-Ribulose-5-P-4-Epimerase. Die Gene, die für diese Enzyme kodieren, werden araA, araB und araD genannt. Die L-Arabinose- Isomerase setzt L-Arabinose zu L-Ribulose um, welches durch die L-Ribulokinase weiter zu L-Ribulose-5 -Phosphat metabolisiert wird. Die L-Ribulose-5-P-4-Epimerase wandelt schließlich L-Ribulose-5 -Phosphat zu D-Xylulose-5-Phosphat um. Durch die in der Hefezelle heterolog exprimierten Gene des L-Arabinose-Stoffwechselweges, insbesondere des bakteriellen L-Arabinose-Stoffwechselweges, entsteht das Zwischenmetabolit D-Xylulose-5- Phosphat. D-Xylulose-5-Phosphat stellt ein Intermediat des Pentosephosphatweges dar und kann in einer Hefezelle unter anaeroben Bedingungen weiter zu Ethanol abgebaut werden. Enzyme des Xylose-Stoffwechselweges werden auch in Pilzen gefunden, diese und andere aus Eukaryonten isolierte Enzyme können als Enzyme für den L-Arabinose-Stoffwechselweg ebenfalls verwendet werden.

Bei den drei Nukleinsäuresequenzen der erfindungsgemäßen Nukleinsäuremoleküle, die jeweils für ein Polypeptid eines L-Arabinose-Stoffwechselweges, insbesondere eines bakteriellen L-Arabinose-Stoffwechselweges kodieren, handelt es sich bevorzugt um araA (L- Arabinose-Isomerase), araB (L-Ribulokinase) und araD (L-Ribulose-5-P-4-Epimerase).

Die erfindungsgemäßen Nukleinsäuremoleküle umfassen bevorzugt Nukleinsäuresequenzen, die mit der natürlich vorkommenden Nukleinsäuresequenz identisch sind oder für eine Verwendung in einer Wirtszelle Codon-optimiert sind.

Jede Aminosäure wird auf Genebene durch ein Codon verschlüsselt. Jedoch gibt es mehrere verschiedene Codons, die für eine einzelne Aminosäure codieren. Der genetische Code ist folglich degeneriert. Die bevorzugte Codonwahl für eine entsprechende Aminosäure ist von Organismus zu Organismus verschieden. So kann es bei heterolog exprimierten Genen zu Problemen kommen, wenn der Wirtsorganismus bzw. die Wirtszelle einen sehr unterschiedlichen Codon-Gebrauch aufweist. Das Gen kann überhaupt nicht oder nur langsam exprimiert werden. Sogar in Genen von verschiedenen Stoffwechsel wegen innerhalb eines Organismus ist ein unterschiedlicher Codon-Gebrauch festzustellen. Von den Glykolyse- Genen aus S. cerevisiae ist bekannt, daß sie stark exprimiert werden. Sie weisen einen stark restriktiven Codon-Gebrauch auf. Die Anpassung des Codon-Gebrauchs der bakteriellen Gene des Arabinose-Stoffwechselweges an den Codon-Gebrauch der Glykolyse-Gene aus S. cerevisiae führt zu einer Verbesserung des Arabinose-Umsatzes in Hefe.

Bei der Codon-Optimierung haben sich die Erfinder nicht nach den gängigen Plattformen der synthetischen Gene Designer zur heterologen Expression gerichtet (wie beispielsweise Synthetic Gene Designer, wie beschrieben in Wu et al. 2006), sondern die Codon- Optimierung spezifisch an den Codon-Gebrauch der Glykolyse-Gene der Hefe angepasst. Die Glykolyse-Gene der Hefe haben einen sehr restriktiven Codon-Gebrauch, der auf die Häufigkeit der entsprechenden tRNA ausgerichtet ist. Die Glykolyse-Gene benutzen hauptsächlich Codons für die es hohe Konzentrationen der entsprechenden tRNAs gibt, was sich dann in einer erhöhten Translationseffizienz und Genexpression niederschlägt (Bennetzen und Hall, 1982, Hoekema et al, 1987). Die gängigen synthetischen Gene Designer orientieren sich dahingegen mehr an dem durchschnittlichen Codongebrauch aller Gene eines Organismus, nicht nur der hochexprimierten, und berücksichtigen außerdem noch andere Faktoren, wie beispielsweise Stabilität. Entsprechend führt eine Codon-Optimierung mit Hilfe einer solchen elektronischen Plattform, wie beispielsweise in Wu et al. 2006 genannt, zu einer völlig anderen Nukleinsäuresequenz als der in dieser Patentanmeldung offenbarten.

Erfindungsgemäß sind mindestens zwei der drei Nukleinsäuresequenzen, besonders bevorzugt alle drei Nukleinsäuresequenzen für eine Verwendung in einer Wirtszelle Codon-optimiert.

Die Nukleinsäuresequenz für araB (L-Ribulokinase) und die Nukleinsäuresequenz für araD (L-Ribulose-5-P-4-Epimerase) stammt bevorzugt aus E. coli ab. Dabei umfaßt die Nukleinsäuresequenz für araB bevorzugt eine Nukleinsäuresequenz mit der SEQ ID NO: 1 und die Nukleinsäuresequenz für araD bevorzugt eine Nukleinsäuresequenz mit der SEQ ID NO: 2.

Bei der Nukleinsäuresequenz mit der SEQ ID NO: 1 handelt es sich um die Gensequenz des offenen Leserahmens (ORP) von araB""" aus E. coli in einer Codon-optimierten Form.

Bei der Nukleinsäuresequenz mit der SEQ ID NO: 2 handelt es sich um die die Gensequenz des offenen Leserahmens (ORP) von araD aus E. coli in einer Codon-optimierten Form.

Die Nukleinsäuresequenz für araA (L-Arabinose-Isomerase) stammt bevorzugt aus Bacillus licheniformis oder Clostridium acetobutylicum ab.

Diese L-Arabinose-Isomerasen sind vorteilhaft für das Wachstum von Hefetransformanden auf Arabinose-Medium. In Beispiel 1 wird gezeigt (siehe auch Figur 4), daß verglichen mit der Isomerase aus B. subtilis, besonders die Expression der L-Arabinose-Isomerase von C. acetobutylicum und von B. licheniformis signifikant das Wachstum von Hefetransformanden auf Arabinose-Medium verbesserten.

Dabei umfaßt die Nukleinsäuresequenz für araA bevorzugt eine Nukleinsäuresequenz mit der SEQ ID NO: 3, 4 oder 5.

Bei der Nukleinsäuresequenz mit der SEQ ID NO: 3 handelt es sich um die Gensequenz des offenen Leserahmens (ORP) von araA aus Bacillus licheniformis in einer Codon-optimierten Form.

Bei der Nukleinsäuresequenz mit der SEQ ID NO: 4 handelt es sich um die Gensequenz des offenen Leserahmens (ORF) von araA aus Bacillus licheniformis.

Bei der Nukleinsäuresequenz mit der SEQ ID NO: 5 handelt es sich um die Gensequenz des offenen Leserahmens (ORP) von araA aus Clostridium acetobutylicum.

Bei den Nukleinsäuresequenzen mit der SEQ ID NO: 4 und 5 handelt es sich demzufolge um natürlich vorkommende Nukleinsäuresequenzen.

In einer besonders bevorzugten Ausfuhrungsform umfaßt ein erfindungsgemäßes Nukleinsäuremolekül die Nukleinsäuresequenz mit der SEQ ID NO: 1, die Nukleinsäuresequenz mit der SEQ ID NO: 2 sowie die Nukleinsäuresequenz mit der SEQ ID NO: 3, 4 oder 5. Am meisten bevorzugt wird ein erfindungsgemäßes Nukleinsäuremolekül, das die Nukleinsäuresequenz mit der SEQ ID NO: 1, die Nukleinsäuresequenz mit der SEQ ID NO: 2 sowie die Nukleinsäuresequenz mit der SEQ ID NO: 3 umfaßt.

Hefetransformanden mit den zwei Codon-optimierten Genen der Kinase (araB, SEQ ID NO: 1) und Epimerase (araD, SEQ ID NO: 2) sowie Hefetransformanden, bei denen alle drei Gene Codon-optimiert sind (araB: SEQ ID NO: 1, araD: SEQ ID NO: 2 und araA: SEQ ID NO: 3), zeigen in Arabinose-haltigen Medium einen deutlichen Wachstumsvorteil in Arabinose- haltigen Medium gegenüber Hefetransformanden mit nur einem Codon-optimierten Gen. Die Stämme zeigen eine deutlich verkürzte Lag-Phase und wachsen wesentlich schneller zu ihrer maximalen optischen Dichter heran, (siehe Beispiel 2). Die Kombination von drei Codon- optimierten Genen ermöglicht rekombinanten S. cerevisiae Zellen eine wesentlich effizientere L-Arabinose Verwertung.

Die Aufgabe wird weiterhin erfindungsgemäß gelöst durch zur Verfügung stellen von Expressionskassetten, umfassend ein erfindungsgemäßes Nukleinsäuremolekül.

Die erfindungsgemäßen Expressionskassetten umfassen weiterhin bevorzugt Promotor- und Terminatorsequenzen.

Bevorzugterweise sind Promotorsequenzen ausgewählt aus HXT7, verkürzter HXT7, PFKl, FBAl, PGKl, ADHl und TDH3.

Bevorzugterweise sind Terminatorsequenzen ausgewählt aus CYCl, FBAl, PGKl, PFKl, ADHl und TDH3.

Dabei wird es bevorzugt, daß jeweils unterschiedliche Paare aus Promotor- und Terminatorsequenzen die drei Nukleinsäureseuqnzen kontrollieren. Dies ist erforderlich, um eine mögliche homologe Rekombination zwischen den Promotor- bzw. den Terminatorregionen/-sequenzen zu vermeiden.

Die Paare aus Promotor- und Terminatorsequenzen werden erfindungsgemäß bevorzugt ausgewählt aus HXT7- oder verkürzter HXT7 -Promotor und CYCl -Terminator, PFKl- Promotor und FBAl -Terminator sowie FBAl -Promotor und PGKl -Terminator.

Besonders bevorzugt wird eine Nukleinsäuresequenz für araA kontrolliert von dem HXT7- oder verkürzter HXT7-Promotor und dem CYCl -Terminator.

Besonders bevorzugt wird eine Nukleinsäuresequenz für araB kontrolliert von dem PFKl- Promotor und dem FBAl -Terminator.

Besonders bevorzugt wird eine Nukleinsäuresequenz für araD kontrolliert von dem FBAl- Promotor und dem PGKl -Terminator.

Für nähere Ausführungen siehe dazu auch Beispiel 3.

Die erfindungsgemäßen Expressionskassetten umfassen weiterhin bevorzugt 5' und/oder 3' Erkennungssequenzen.

Bevorzugt werden Erkennungssequenzen der Enzyme Päd und Ascl.

Die Aufgabe wird weiterhin erfindungsgemäß gelöst durch zur Verfügung stellen von Expressionsvektoren, umfassend ein erfindungsgemäßes Nukleinsäuremolekül oder eine erfindungsgemäße Expressionskassette.

Die erfindungsgemäßen Expressionsvektoren umfassen weiterhin bevorzugt einen Selektionsmarker.

Bevorzugterweise wird der Selektionsmarker ausgewählt aus einem Leucin-Marker, einem Uracil-Marker oder einem dominanten Antibiotika-Marker. Ein bevorzugter dominanter Antibiotika-Marker wird ausgewählt aus Geneticin, Hygromycin und Nourseothricin.

Ein erfindungsgemäßer Expressionsvektor wird bevorzugt ausgewählt aus der Gruppe p425H7synthAra, pRS303X, p3RS305X oder p3RS306X.

Für nähere Ausfuhrungen siehe dazu auch Beispiel 3.

Für industrielle Anwendungen wäre es ideal, wenn der verwendete Mikroorganismus alle im Medium vorhanden Zucker umsetzten könnte. Da die zur Zeit eingesetzte Hefen nicht in der Lage sind, die im Medium vorhandene Arabinose umzusetzen, wäre es von großem Vorteil, den Stämmen diese zusätzliche Fähigkeit stabil zu verleihen. Um dies zu erreichen, ist ein Expressionsvektor mit Genen eines Arabinose-Stoffwechselweges von großem Nutzen. Dieser kann dann stabil genomisch integriert werden und kann die Umsetzung von Arabinose in Industriestämmen gewährleisten.

Mit dieser Erfindung ist es gelungen (siehe auch Beispiele), einen Vektor zu konstruieren, der eine Expressionskassette mit drei Genen für einen Arabinose-Stoffwechselweg, insbesondere einen bakteriellen Arabinose-Stoffwechselweg codiert. Hiermit kann die Problematik umgangen werden, die entstehen kann, wenn mehrere Plasmide gleichzeitig in einer Zelle vorhanden sind („Plasmid-Last", Review zu E. coli von Bailey (1993)). Zum anderen wird eine stabile genomische Integration der Arabinose-Stoffwechselweg-Gene ermöglicht. Arbeiten von Becker (2003) und Wiedemann (2005) zeigten bereits die Problematik in der Konstruktion einer Expressionskassette der Arabinose-Stoffwechselweg-Gene sowie deren einzelne stabile genomische Integration.

Durch die Auswahl der Promotoren und Terminatoren, in Kombination mit der Verwendung der verbesserten L-Arabinose Isomerase und den Codon-optimierten Versionen der beteiligten Gene, konnte es geschafft werden, diese funktionelle erfindungsgemäße Expressionskassette zu konstruieren.

Die erfindungsgemäße konstruierte Expressionskassette mit den drei Genen stellt einen hervorragenden Ausgangspunkt für eine direkte genomische Integration dar sowie ermöglicht

eine Subklonierung in die integrativen Plasmide der Serie pRS303X, pRS305X und pRS306X (Taxis und Knop, 2006).

Des weiteren waren eine Vielzahl von experimentellen Hürden und Schwierigkeiten beim Klonieren der drei Gene mit den unterschiedlichen Promotoren und Terminatoren zu bewältigen, die sich im größeren Detail auch aus den Beispielen und Figuren ergeben.

- Auffinden einer L-Arabinose Isomerase, die in Hefe besser, wie etwa effizienter, funktioniert.

- Die Klonierung der Isomerase gestaltete sich sehr schwierig und zeitaufwendig.

- Bei dem erfindungsgemäßen Vektor handelt sich um den ersten beschriebenen Vektor, der alle essentiellen Gene für die Arabinose- Verwertung in Hefe enthält.

- Der Vektor enthält alle Gene in funktioneller Form und ermöglicht der rekombinanten Hefe ein sehr gutes Arabinosewachstum. Funktionalität sowie sehr gutes Arabinosewachstum waren nicht unbedingt zu erwarten.

Die Aufgabe wird weiterhin erfindungsgemäß gelöst durch zur Verfügung stellen von Wirtszellen, die ein erfindungsgemäßes Nukleinsäuremolekül, eine erfindungsgemäße Expressionskassette oder einen erfindungsgemäßen Expressionsvektor enthalten.

In einer besonders bevorzugten Ausführungsform ist ein erfindungsgemäßes Nukleinsäuremolekül, eine erfindungsgemäße Expressionskassette oder ein erfindungsgemäßer Expressionsvektor in das Genom der Wirtszelle stabil integriert.

Für industrielle Anwendungen wäre es ideal, wenn der verwendete Mikroorganismus alle im Medium vorhanden Zucker umsetzten könnte. Da die zur Zeit eingesetzte Hefen nicht in der Lage sind, die im Medium vorhandene Arabinose umzusetzen, wäre es von großem Vorteil, den Stämmen diese zusätzliche Fähigkeit stabil zu verleihen. Um dies zu erreichen, kann ein erfindungsgemäßes Nukleinsäuremolekül, eine erfindungsgemäße Expressionskassette oder ein erfindungsgemäßer Expressionsvektor stabil genomisch integriert werden und kann die Umsetzung von Arabinose in Industriestämmen gewährleisten. Die Verwendung der erfindungsgemäßen Nukleinsäuremoleküle gewährleistet eine sehr effiziente Arabinose- Umsetzung in den Industriestämmen. Das einzelne Einführen der Gene des bakteriellen L-

Arabinose-Stoffwechselweges brachte bislang die Schwierigkeit mit sich, dass die Gene nicht in ihrem optimalen Verhältnis zu einander vorlagen. Die Transformationen waren zeitaufwendig und erzielten oft nicht die gewünschte Effizienz der Arabinose-Umsetzung. Zusätzlich waren die verliehenen Eigenschaften oft nicht stabil. Hingegen ermöglicht die erfindungsgemäße Expressionskassette bzw. der erfindungsgemäße Expressionsvektor die schnelle und funktionelle Einbringung des bakteriellen L-Arabinose-Stoffwechselweges. Durch die Auswahl der Promotoren konnten die Gene gemeinsam auf einem Nukleinsäuremolekül, einer Expressionskassette bzw. einem Expressionsvektor vereinigt werden. Die Integration des erfindungsgemäßen Nukleinsäuremoleküls, der erfindungsgemäßen Expressionskassette bzw. des erfindungsgemäßen Expressionsvektors gewährleistet weiterhin eine effiziente Arabinose-Umsetzung.

Eine erfindungsgemäße Wirtszelle ist bevorzugt eine Pilzzelle und weiter bevorzugt eine Hefezelle, wie Saccharomyces species, Kluyveromyces sp., Hansenula sp., Pichia sp. oder Yarrowia sp..

Insbesondere ist eine erfϊndungsgemäße Wirtszelle ausgewählt aus BWYl, CEN.PK113-7D, Red Star Ethanol Red und Fermiol.

Die Aufgabe wird weiterhin erfindungsgemäß gelöst durch zur Verfügung stellen von Verfahren zur Produktion von Bioethanol. Ein erfindungsgemäßes Verfahren umfaßt die Expression eines erfindungsgemäßen Nukleinsäuremoleküls, einer erfindungsgemäßen Expressionskassette oder eines erfindungsgemäßen Expressionsvektors in einer Wirtszelle.

Dabei wird das Verfahren bevorzugt in einer erfindungsgemäßen Wirtszelle durchgeführt.

Die Aufgabe wird weiterhin erfindungsgemäß gelöst durch die Verwendung eines erfindungsgemäßen Nukleinsäuremoleküls, einer erfindungsgemäßen Expressionskassette, eines erfindungsgemäßen Expressionsvektors einer erfindungsgemäßen Wirtszelle zur Produktion von Bioethanol.

Die Aufgabe wird weiterhin erfindungsgemäß gelöst durch die Verwendung eines erfindungsgemäßen Nukleinsäuremoleküls, einer erfϊndungsgemäßen Expressionskassette,

eines erfindungsgemäßen Expressionsvektors einer erfindungsgemäßen Wirtszelle zur rekombinanten Fermentation von Pentose-haltigem Biomaterial.

Für die Verfahren und Verwendungen wird auch auf die Beispiele und Figuren verwiesen. Aus den in Beispiel 2 gezeigten Fermenationsergebnissen geht hervor, dass insbesondere die Codon-optimierten Gene von araA, araB und araD den Hefetranformanden eine effizientere Arabinose-Umsetzung ermöglichen. Das Resultat daraus ist eine schnellere Umsetzung des Zuckers sowie eine deutlich höhere Ethanol-Ausbeute.

Die Aufgabe wird weiterhin erfindungsgemäß gelöst durch zur Verfügung stellen eines Polypeptids, ausgewählt aus der Gruppe von a. einem Polypeptid, das zu mindestens 70%, bevorzugt mindestens 80% identisch zu der Aminosäuresequenz ist, die von SEQ ID NO: 3, 4 oder 5 kodiert wird, und eine in vitro und/oder in vivo Pentose-Isomerasefunktion aufweist, b. einer natürlich auftretenden Variante eines Polypeptids umfassend die Aminosäuresequenz, die von SEQ ID NO: 3, 4 oder 5 kodiert wird, die eine in vitro und/oder in vivo Pentose- Isomerasefunktion aufweist, c. einem Polypeptid, das identisch zu der Aminosäuresequenz ist, die von SEQ ID NO: 3, 4 oder 5 kodiert wird, und eine in vitro und/oder in vivo Pentose-Isomerasefunktion aufweist, und d. einem Fragment des Polypeptids aus a., b. oder c, umfassend ein Fragment von mindestens 100, 200 oder 300 kontinuierlichen Aminosäuren der Aminosäuresequenz, die von SEQ ID NO: 3, 4 oder 5 kodiert wird.

Bevorzugt ist ein solches Polypeptid ausgewählt aus der Gruppe von a. einem Polypeptid, das zu mindestens 70%, bevorzugt mindestens 80% identisch zu der Aminosäuresequenz nach SEQ ID NO: 6 oder 7 ist und eine in vitro und/oder in vivo Pentose- Isomerasefunktion aufweist, b. einer natürlich auftretenden Variante eines Polypeptids umfassend die Aminosäuresequenz nach SEQ ID NO: 6 oder 7, die eine in vitro und/oder in vivo Pentose-Isomerasefunktion aufweist, c. einem Polypeptid, das identisch zu der Aminosäuresequenz nach SEQ ID NO: 6 oder 7 ist und eine in vitro und/oder in vivo Pentose-Isomerasefunktion aufweist, und

d. einem Fragment des Polypeptids aus a., b. oder c, umfassend ein Fragment von mindestens 100, 200 oder 300 kontinuierlichen Aminosäuren nach SEQ ID NO: 6 oder 7.

Bevorzugt umfaßt ein erfindungsgemäßes Polypeptid ein Polypeptid, das zu mindestens 90%, bevorzugt 95% identisch zu der Aminosäuresequenz ist, die von SEQ ID NO: 3, 4 oder 5 kodiert wird, und eine in vitro und/oder in vivo Pentose-Isomerasefunktion aufweist.

Bevorzugt umfaßt ein solches erfindungsgemäßes Polypeptid ein Polypeptid, das zu mindestens 90%, bevorzugt 95% zu der Aminosäuresequenz nach SEQ ID NO: 6 oder 7 ist und eine in vitro und/oder in vivo Pentose-Isomerasefunktion aufweist.

Bei der Aminosäuresequenz mit der SEQ ID NO. 6 handelt es sich um die Aminosäuresequenz der Bacillus licheniformis L-Arabinose-Isomerase (araA). Diese Aminosäuresequenz wird bevorzugt von den Nukleinsäuresequenzen mit den SEQ ID NOs. 3 oder 4 kodiert.

Bei der Aminosäuresequenz mit der SEQ ID NO. 7 handelt es sich um die Aminosäuresequenz der Clostridium acetobutylicum L-Arabinose-Isomerase (araA). Diese Aminosäuresequenz wird bevorzugt von der Nukleinsäuresequenz mit der SEQ ID NO. 5 kodiert.

Die Pentose ist Arabinose, insbesondere L-Arabinose.

Das erfindungsgemäße Polypeptid stammt bevorzugt aus einem Bakterium, weiter bevorzugt aus Bacillus licheniformis oder Clostridium acetobutylicum ab.

Diese L-Arabinose-Isomerasen sind vorteilhaft für das Wachstum von Hefetransformanden auf Arabinose-Medium. Verschiedene Experimente wiesen darauf hin, daß die bisher verwendete L-Arabinose-Isomerase aus B. subtilis einen limitierenden Schritt in dem Arabinose- Abbau in Hefe darstellt (Becker und Boles, 2003; Wiedemann, 2003; Karhumaa et al, 2006; Sedlak und Ho, 2001). In Beispiel 1 wird gezeigt (siehe auch Figur 4), dass verglichen mit der Isomerase aus B. subtilis, besonders die Expression der L-Arabinose- Isomerase von C. acetobutylicum und von B. licheniformis signifikant das Wachstum von Hefetransformanden auf Arabinose-Medium verbessern.

Die Aufgabe wird weiterhin erfindungsgemäß gelöst durch zur Verfügung stellen eines isolierten Nukleinsäuremoleküls, das für ein erfindungsgemäßes Polypeptid kodiert.

Des weiteren wird die Aufgabe weiterhin erfindungsgemäß gelöst durch zur Verfügung stellen einer Wirtszelle, die ein solches isoliertes Nukleinsäuremolekül enthält.

Für bevorzugte Ausführungsformen des isolierten Nukleinsäuremoleküls und der Wirtszellen wird hiermit auf die oben aufgeführten Ausführungsformen Bezug genommne.

Das erfindungsgemäße Polypeptid, isolierte Nukleinsäuremolekül und die erfindungsgemäße Wirtszelle werden bevorzugt verwendet zur Produktion von Bioethanol und zur rekombinanten Fermentation von Pentose-haltigem Biomaterial.

Ein weiterer Aspekt dieser Erfindung sind Wirtszellen, die eine oder mehrere zusätzliche Modifikationen, wie Nukleinsäuremoleküle enthalten.

Bei einer solchen zusätzlichen Modifikation handelt es sich um eine Wirtszelle, die ein TALl (Transaldolase)-Gen überexprimiert, wie beispielsweise von den Erfindern in der EP 1 499 708 Bl beschrieben.

Bei einer weiteren solchen zusätzlichen Modifikation handelt es sich zum anderen um eine Wirtszelle, die eine Nukleinsäure kodierend für ein spezifisches L-Arabinose-Transportergen (araT) enthält, wie insbesondere ein spezifisches L-Arabinose-Transportergen aus dem Genom von P. stipitis, wie von den Erfindern in der deutschen Patentanmeldung DE 10 1006 060 381.8, eingereicht am 20. Dezember 2006, beschrieben.

Weitere Biomasse mit signifikanten Mengen an Arabinose (Quelle der Daten: U.S. Department of Energy http://www.eere.energy.gov/biomass/progs/searchl .cgi): Art der Biomasse L- Arabinose \%]

Switchgras 3,66

Grosses Bartgras 3,55

Hohes Schwingelgras 3,19

Robinie 3

Com Stover 2,69

Weizen Stroh 2,35

Zuckerrohr Bagasse 2,06

Chinesischer Buschklee 1 ,75

Futterhirse 1 ,65

Auch für deren Verwertung sind die erfindungsgemäßen Nukleinsäuren, Expressionskassetten, Expressionsvektoren und Wirtszellen von großer Bedeutung.

Nutzungsmöglichkeiten der erfindungsgemäßen Nukleinsäuren, Expressionskassetten, Expressionsvektoren und Wirtszellen sind zum einen die Produktion von Bioethanol und die Herstellung von hochwertigen Vorläufer-Produkten für weitere chemische Synthesen.

Folgende Auflistung stammt aus der Studie "Top Value Added Chemicals From Biomass" (siehe wwwl.eere.energy.gov/biomass/pdfs/35523.pdf). Hierbei wurden 30 Chemikalien als besonders wertvoll eingestuft, welche aus Biomasse hergestellt werden können.

Sobald diese Chemikalien aus Lignozellulose durch Biokonversion (z.B. Fermentationen mit Hefen) hergestellt werden, ist es wichtig, die erfindungsgemäßen Nukleinsäuren, Expressionskassetten, Expressionsvektoren und Wirtszellen zur Verfügung zu haben.

Die vorliegende Erfindung wird in den folgenden Figuren, Sequenzen und Beispielen weiter verdeutlicht, ohne jedoch darauf beschränkt zu sein. Die zitierten Referenzen sind hiermit durch Bezugnahme vollständig aufgenommen. In den Sequenzen und Figuren wird gezeigt:

SEQ ID NO: 1 zeigt die Gensequenz des offenen Leserahmens (ORF) von araB mut aus E. coli in einer Codon-optimierten Form.

SEQ ID NO: 2 zeigt die Gensequenz des offenen Leserahmens (ORF) von araD aus E. coli in einer Codon-optimierten Form.

SEQ ID NO: 3 zeigt die Gensequenz des offenen Leserahmens (ORF) von araA aus B. licheniformis in einer Codon-optimierten Form.

SEQ ID NO: 4 zeigt die Gensequenz des offenen Leserahmens (ORF) von araA aus B. licheniformis.

SEQ ID NO: 5 zeigt die Gensequenz des offenen Leserahmens (ORF) von araA aus C. acetobutylicum.

SEQ ID NO. 6 zeigt die Aminosäuresequenz der Bacillus licheniformis L-Arabinose- Isomerase (araA). Diese Aminosäuresequenz wird bevorzugt von den Nukleinsäuresequenzen mit den SEQ ID NOs. 3 oder 4 kodiert.

SEQ ID NO. 7 zeigt die Aminosäuresequenz der Clostridium acetobutylicum L-Arabinose- Isomerase (araA). Diese Aminosäuresequenz wird bevorzugt von der Nukleinsäuresequenz mit der SEQ ID NO. 5 kodiert.

Figur 1. Zusammensetzung der Biomasse.

Biomasse besteht aus Zellulose, Hemizellulose und Lignin. Die am zweithäufigsten vorkommende Hemizellulose ist ein aus Pentosen, Uronsäuren und Hexosen bestehendes stark verzweigtes Polymer. Die Hemizellulose besteht zu einem großen Anteil aus den Pentosen Xylose und Arabinose.

Figur 2. Schema für die Umsetzung von L-Arabinose in rekombinantner S. cerevisiae durch Integration eines bakteriellen L-Arabinose-Stofjfwechselweges.

Figur 3 : Verwendete Vektoren und deren Aufbau.

Ausgangsplasmid für die Konstruktion des Vektors p425H7synthAra (Figur 3 A) war das Plasmid p425HXT7-6HIS (Figur 3 B). Die offenen Leserahmen der Codon-optimierten Gene von araA aus B. licheniformis und araB" 1 " 1 und araD aus E. coli wurden amplifϊziert und

hinter verschiedene Promotoren und Terminatoren in das Plasmid p425HXT7-6HIS kloniert. Die Primer wurden so gewählt, daß die entstandene Expressionskassette von den Schnittstellen der Enzyme Päd und Asd flankiert wird. Hierbei entstand das Plasmid p425H7synthAra, welches einen Leucin-Marker besitzt.

Figur 4 Wachstum auf Arabinose unter Verwendung der verschiedenen L-Arabinose- Isomerase-Gene.

Wachstumskurven von rekombinanten S. cerevisiae Stämmen, die den bakteriellen L- Arabinose-Stoffwechsel mit verschiedenen L-Arabinose-Isomerasen enthalten. Wachstumstests wurden in 5 ml SM-Medium mit 2 % Arabinose unter aeroben Bedingungen durchgeführt. Getestet wurde die L-Arabinose-Isomerasen von C. acetobutylicum, B. licheniformis, P. pentosaceus, L. plantarum und L. mesenteroides. Als Vergleich diente die L- Arabinose-Isomerase aus B. subtilis und der leere Vektor p423HXT7-6HIS.

Figur 5 Wachstum auf Arabinose unter Verwendung der Codon-optimierten Arabinose- Stoffwechselweg-Gene.

Wachstumskurven von rekombinanten S. cerevisiae Stämmen, die den bakteriellen L- Arabinose-Stoffwechsel mit unterschiedlichen Kombinationen aus Codon-optimierten Genen sowie den Genen mit Original-Sequenzen enthalten. Wachstumstests wurden in 5 ml SM- Medium mit 2 % Arabinose unter aeroben Bedingungen durchgeführt. Getestet wurden die Kombinationen, indem jeweils eines der Codon-optimierten Gene enthalten war, sowie die Kombination, indem alle drei Codon-optimierten Gene vorhanden waren. Zusätzlich wurde die Kombination getestet, in der das Codon-optimierte Gen der Kinase und der Epimerase vorhanden waren. Als Vergleich diente ein rekombinanter Hefestamm mit den vier Genen mit den Original-Sequenzen.

Figur 6 Ethanolbildung unter Verwendung der Codon-optimierten Arabinose- Stoffwechselweg-Gene.

Gezeigt werden die Ergebnisse von HPLC-Analysen der Medienüberstände zweier Fermentationen. Die eine Fermentation wurde mit Stamm BWYl durchgeführt, der die Plasmide p423H7synthIso, p424H7synthKin, p425H7synthEpi und pHL125 re (3xsynth) besitzt. In der anderen Fermentation wurde Stamm BWYl getestet, welcher die Plasmide p423H7araABs re , P 424H7araB re , p425H7araD re und pHL125 re (3xre) enthält. Die Fermentationen wurden in SFM-Medium mit 3 % L-Arabinose durchgeführt. Die Stämme

wurden bis zum Erreichen einer hohen optischen Dichte aerob im Fermenter angezogen. Anschließend wurde die Fermentation auf anaerobe Bedingungen umgestellt (nach 48 Stunden). In den Kurven sind Arabinose- Verbrauch und Ethanol-Produktion dargestellt.

Figur 7 Wachstum auf Arabinose unter Verwendung des konstruieren Expressionsplasmids p425H7-synthAra.

Wachstumskurven von rekombinanten S. cerevisiae Stämmen, die den bakteriellen L- Arabinose-Stoffwechsel in Form des Vektors p425H7-synthAra enthalten. Wachstumstests wurden in 5 ml SC-Medium mit 2 % Arabinose unter aeroben Bedingungen durchgeführt. Als Vergleich diente ein rekombinanter Hefestamm mit den Plasmiden p423H7araABs re , P 424H7araB re , p425H7araD re und pHL125 re , der in 5 ml SM-Medium mit 2 % Arabinose getestet wurde.

Beispiele

Methoden

1. Stämme und Medien

-Bakterien

- E. coli SURE (Stratagene)

- E. coli DH5α (Stratagene)

- Bacillus licheniformis (DSMZ)

- Clostridium acetobutylicum (DSMZ)

- Leuconostoc mesenteroides (DSMZ)

- Pediococcus pentosaceus (DSMZ)

- Lactobacillus plantarum (DSMZ)

Vollmedium LB 1% Trypton, 0,5 % Hefeextrakt, 0,5% NaCl, pH 7,5 (siehe Maniatis, 1982). Für die Selektion auf eine plasmidkodierte Antibiotikaresistenz wurde dem Medium nach dem Autoklavieren 40μg/ml Ampicillin zugesetzt. Feste Nährmedien enthielten zusätzlich 2% Agar. Die Anzucht erfolgte bei 37°C.

-Hefe

Stamm BWYl :

BWYl basiert auf dem Stamm JBY25 (MATa Ieu2-3,112 ura3-52 trpl-289 his3-δlMAL2-8c SUC2+ unbekannte Mutationen für besseres Wachstum auf Arabinose); der Stamm JBY25 wurde weiter selektioniert und besitzt weitere Mutationen für verbessertes Wachstum auf L- Arabinose unter Sauerstoff-limitierten Bedingungen (Wiedemann, 2005)

-synthetisches Komplettselektivmedium SC:

0,67% Yeast nitrogen base w/o amino acids, pH6,3, Aminosäure/Nukleobase-Lösung, Kohlenstoffquelle in der jeweils angegeben Konzentration

-synthetisches Minimalselektivmedium SM:

0,16% Yeast nitrogen base w/o amino acid and ammonium sulphate, 0,5% Ammoniumsulfat ,2OmM Kalium-dihydrogenphosphat, pH6,3, Kohlenstoffquelle in der jeweils angegeben Konzentration

-synthetisches Fermentationsmedium (Mineralmedium) SFM: (Verduyn et al, 1992), pH 5,5

Salze: (NH 4 ) 2 SO 4 , 5g/l; KH 2 PO 4 , 3g/l; MgSO 4 *7H 2 O, 0,5g/l Spurenelemente: EDTA, 15mg/l, ZnSO 4 *4,5mg/l; MnCl 2 *4H 2 O, 0,lmg/l; CoCl 2 *6H 2 O, 0,3 mg/1; CuSO 4 , 0,192 mg/1; Na 2 MoO 4 *2H 2 O, 0,4 mg/1; CaCl 2 *2H 2 O, 4,5 mg/1; FeSO 4 *7H 2 O, 3 mg/1; H 3 BO 3 , 1 mg/1; KI, 0,1 mg/1 Vitamine: Biotin, 0,05 mg/1; p-Aminobenzoesäure, 0,2 mg/1; Nicotinsäure, 1 mg/1; Calciumpantothenat, 1 mg/1; Pyridoxin-HCL, 1 mg/1; Thiamin-HCL, 1 mg/1; Minositol, 25 mg/1

Konzentration der Aminosäuren und Nukleobasen im synthetischen Komplettmedium (nach Zimmermann, 1975): Adenin (0,08mM), Arginin (0,22mM), Histidin (0,25mM), Isoleucin (0,44mM), Leucin (0,44mM), Lysin (0,35mM), Methionin (0,26mM), Phenylalanin (0,29mM), Tryptophan (0,19mM), Threonin (0,48mM), Tyrosin (0,34mM), Uracil (0,44mM), Valin (0,49mM). Als Kohlenstoffquelle wurden L-Arabinose und D-Glucose eingesetzt.

Feste Voll- und Selektivmedien enthielten zusätzlich 1 ,8 % Agar. Die Anzucht der Hefezellen erfolgte bei 30°C. Das für die Fermentationen eingesetzte synthetische Mineralmedium enthielt Salze, Spurenmetalle und Vitamine in den oben aufgelisteten Konzentrationen und L- Arabinose als Kohlenstoffquelle. Von den Spurenmetallen und den Vitaminen wurde eine

Stammlösung angesetzt. Beide Lösungen wurden sterilfiltriert. Beide wurden bei 4°C gelagert. Für die Herstellung der Spurenmetalllösung war der pH- Wert von entscheidender Rolle. Die verschiedenen Spurenelemente mußten in der obigen Reihenfolge nacheinander in Wasser vollständig gelöst werden. Nach jeder Zugabe mußte der pH- Wert mit KOH auf 6,0 eingestellt werden bevor das nächste Spurenelement zugegeben werden konnte. Am Ende wurde der pH- Wert mit HCL auf 4,0 justiert. Um Schaumbildung zu vermeide, wurde dem Medium 200μl Antischaum (Antifoam2004, Sigma) zugegeben. Da die Versuche unter anaeroben Bedingungen durchgeführt wurden, mußte dem Medium nach dem Autoklaviern noch 2,5 ml/1 einer Tween80-Ergosterol-Lösung zugegeben werden. Diese besteht aus 16,8 g TweenδO und 0,4 g Ergosterol, welche mit Ethanol auf 50 ml aufgefüllt und darin gelöst wurden. Die Lösung wurde sterilfiltriert. Die Salze und der Antischaum wurden gemeinsam mit dem kompletten Fermenter autoklaviert. Die Arabinose wurde getrennt vom restlichen Medium autoklaviert. Nach Abkühlen des Mediums wurden die Spurenelemente sowie die Vitamine hinzugegeben.

2. Plasmide

Plasmid Quelle/Referenz Beschreibung p423HXT7-6HIS Becker und Boles, 2003 2μ-Expressionsplasmid für die überexpression (=p423H7) verschiedener Gene und für die Fusionierung der E. coli L-

Arabinose Isomerase mit einem His 6 -Epitop; HIS3-

Selektionsmarkergen, verkürzter /£Y77-Promotor und

CTC/-Terminator (Hamacher et al., 2002) p424HXT7-6HIS Becker und Boles, 2003 2μ-Expressionsplasmid für die überexpression (=p424H7) verschiedener Gene und für die Fusionierung der mutierten und der Wildtyp E. coli L-Ribulokinase mit einem His 6 -

Epitop; 77?/ > 7-Selektionsmarkergen, verkürzter HXT7-

Promotor und CTCZ-Terminator (Hamacher et al., 2002) p425HXT7-6HIS Becker und Boles, 2003 2μ-Expressionsplasmid für die überexpression (=p425H7) verschiedener Gene; Z£C/2-Selektionsmarkergen, verkürzter /£Y77-Promotor und CYCl -Terminator

(Hamacher et al., 2002) p426HXT7-6HIS Hamacher et al., 2002 2μ-Expressionsplasmid zur überexpression von Genen und (=p426H7) zur Herstellung eines His 6 -Epitop; URA3-

Selektionsmarkergen, verkürzter /£Y77-Promotor und

CyC7-Terminator p423H7araABs re Becker und Boles, 2003 B.subtilis araA in p423HXT7-His, re-isoliert aus JBY25-

4M p424H7araB Becker und Boles, 2003 E. coli araB in p423HXT7-His p424H7araB re Becker und Boles, 2003 E. coli araB in p423HXT7-His; re-isoliert aus JBY25-4M,

Mutation in araB, welche Arabinose- Wachstum ermöglicht p425H7araD re Becker und Boles, 2003 E. coli araD in p425HXT7-His; re-isoliert aus JBY25-4M

p423H7-synthIso B. licheniformis araA Codon-optimiert in p423HXT7-His p424H7-synthKin E.coli araB Codon-optimiert in p424HXT7-His, mit Mutation in araB p425H7-synthEpi E.coli araD Codon-optimiert in p425HXT7-His p425H7-synthAra 2μ-Plasmid mit den Codon-optimierten Genen araA, araPT"' und araD; araA unter Kontrolle des FBAl- Promotor und dem PGKl Terminator, araB""" unter der Kontrolle des PFKl Promotor und dem FBAl Terminator, und araD unter Kontrolle des verkürzten HXT7 Promotor und dem CYCl Terminator, Z,£σ/2-Selektionsmarkergen pHL125 n Liang und Gaber, 1996 2μ-Plasmid mit dem GAL2-Gen exprimiert hinter dem ADHl -Promotor, C/ft43-Selektionsmarkergen; re-isoliert aus JBY25-4M

3. Transformation:

- Transformation von E. coli

Die Transformation der E. coli Zellen erfolgte durch die Elektroporationsmethode nach Dower et al. (1988) und Wirth (1993) mittels eines Easyject prima Geräts (EQUIBO).

- Transformation von S. cerevisiae

Die Transformation von S. cerevisiae Stämmen mit Plasmid-DNA bzw. DNA-Fragmenten erfolgte nach der Lithiumacetat-Methode von Gietz und Woods (1994).

4. Präparation von DNA

- Isolierung von Plasmid-DNA aus E. coli

Die Isolierung von Plasmid-DNA aus E. coli erfolgte nach der Methode der alkalischen Lyse von Birnboim und DoIy (1979), modifiziert nach Maniatis et al. (1982) oder alternativ mit dem „QIAprep Spin Miniprep Kit" der Firma Qiagen.

Hochreine Plasmid-DNA für Sequenzierungen wurde mit dem „Plasmid Mini Kit" der Firma Qiagen nach Angaben des Herstellers präpariert.

- Isolierung von Plasmid-DNA aus S. cerevisiae

Die Zellen einer stationären Hefekultur (5ml) wurden durch Zentrifugation geerntet, gewaschen und in 400μl Puffer Pl (Plasmid Mini Kit, Firma Qiagen) resuspendiert. Nach Zugabe von 400μl Puffer P2 und 2 I$ Volumen Glasperlen (0 0,45mm) erfolgte der Zellaufschluss durch 5-minütiges Schütteln auf einem Vibrax (Vibrax-VXR von Janke & Kunkel oder IKA). Der überstand wurde mit 1 A Volumen Puffer P3 versetzt, gemischt und für 10min auf Eis inkubiert. Nach einer 10-minütigen Zentrifugation bei 13000rpm wurde durch Zugabe von 0,75ml Isopropanol zum überstand die Plasmid-DNA bei Raumtemperatur gefällt. Die durch Zentrifugation für 30min bei 13000rpm pelletierte DNA wurde mit 70%igem Ethanol gewaschen, getrocknet und in 20μl Wasser resuspendiert, lμl der DNA wurde für die Transformation in E. coli eingesetzt.

- Bestimmung der DNA-Konzentration

Die DNA-Konzentration wurde spektralphotometrisch in einem Wellenlängenbereich von 240-3 OOnm gemessen. Liegt die Reinheit der DNA, bestimmt durch den Quotient

E 26 o nm /E 28Onm , bei 1,8, so entspricht die Extinktion E 26 o nm =l,O einer DNA-Konzentration von 50μg dsDNA/ml (Maniatis et al, 1982).

- DNA-Amplifikation mittels PCR

Verwendung des Phusion™ High Fidelity Systems

Die Polymerasekettenreaktion erfolgte in einem Gesamtvolumen von 50μl mit dem „Phusion™ High Fidelity PCR System" der Firma Finnzymes nach Angaben des Herstellers. Jeder Ansatz bestand aus 1-lOng DNA oder 1-2 Hefekolonien als Synthesevorlage, 0,2mM dNTP-Mix, lxPuffer 2 (enthält l,5mM MgCl 2 ), IU Polymerase und je lOOpmol der entsprechenden Oligonukleotidprimer. Die PCR-Reaktion wurde in einem Thermocycler der Firma Techne durchgeführt und die PCR-Bedingungen nach Bedarf wie folgt gewählt:

1. Ix 30sec, 98°C Denaturierung der DNA

2. 30x lOsec, 98°C Denaturierung der DNA

30sec, 56-62°C Annealing/Bindung der Oligonukleotide an die

DNA

0,5- 1min, 72°C DNA-Synthese/Elongation

3. Ix 7min, 72°C DNA-Synthese/Elongation

Nach dem ersten Denaturierungsschritt wurde die Polymerase zugegeben („hot Start PCR"). Die Anzahl der Syntheseschritte, die Annealingtemperatur und die Elongationszeit wurden an die spezifischen Schmelztemperaturen der verwendeten Oligonukleotide bzw. an die Größe des zu erwarteten Produkts angepaßt. Die PCR-Produkte wurden durch eine Agarosegelelektrophorese überprüft und anschließend aufgereinigt.

- DNA-Aufreinigung von PCR-Produkten

Die Aufreinigung der PCR-Produkte erfolgte mit dem „QIAquick PCR Purification Kit" der Firma Qiagen nach Herstellerangaben.

- Gelelektrophoretische Auftrennung von DNA-Fragmenten

Die Auftrennung von DNA-Fragmenten mit einer Größe von 0,15-20kb erfolgte in 0,5- l%igen Agarosegelen mit 0,5μg/ml Ethidiumbromid. Als Gel- und Laufpuffer wurde IxTAE- Puffer (4OmM Tris, 4OmM Essigsäure, 2mM EDTA) verwendet (Maniatis et al, 1982). Als Größenstandard diente eine mit den Restriktionsendonukleasen EcoRI und HmdlII geschnittene Lambda-Phagen-DNA. Die DNA-Proben wurden vor dem Auftragen mit V 10

Volumen Blaumarker (lxTAE-Puffer, 10% Glycerin, 0,004% Bromphenolblau) versetzt und nach der Auftrennung durch Bestrahlung mit UV-Licht (254nm) sichtbar gemacht.

- Isolierung von DNA-Fragmenten aus Agarosegelen

Das gewünschte DNA-Fragment wurde aus dem TAE-Agarosegel unter langwelligem UV- Licht (366nm) ausgeschnitten und mit dem „QIAquick Gel Extraction Kit" der Firma Qiagen nach Angaben des Herstellers isoliert.

5. Enzymatische Modifikation von DNA DNA-Restriktion

Sequenzspezifische Spaltung der DNA mit Restriktionsendonukleasen wurden unter den vom Hersteller empfohlenen Inkubationsbedingungen für 1 Stunde mit 2-5U Enzym pro μg DNA durchgeführt.

Beispiel 1: Screen nach besseren L-Arabinose-Isomerasen A) Durchführung des Screens

Verschiedene Experimente wiesen darauf hin, daß die L-Arabinose-Isomerase aus B. subtilis einen limitierenden Schritt in dem Arabinose-Abbau in Hefe darstellt (Becker und Boles, 2003; Wiedemann, 2003; Karhumaa et al, 2006; Sedlak und Ho, 2001 ). Um eine Verbesserung des Arabinose-Stoffwechselweges zu erzielen, wurden fünf L-Arabinose Isomerasen aus verschiedenen Organismen getestet.

Hierzu wurde genomische DNA aus den Organismen C. acetobutylicum, B. licheniformis, P. pentosaceus, L. plantarum und L. mesenteroides isoliert (siehe dazu „Isolierung von Plasmid- DNA aus S. cerevisiae"). Die Zellen wurden herangezogen, geerntet und in Puffer aufgenommen. Der Zellaufschluss erfolgte mit Hilfe von Glasperlen. Anschließend wurde die DNA gefällt, gewaschen und für die PCR eingesetzt. Der offene Leserahmen (ORF) von araA von den genannten Organismen wurde mit Primern amplifiziert, die zusätzlich homologe Bereiche zum /£Y77-Promotor bzw. CYCl -Terminator aufwiesen. Zusammen mit dem EcoRlIBamHl linearisierten Vektor p423HXT7-6His wurden die erhaltenen PCR-Produkte in Hefe transformiert und über in v/vo-Rekombination in das Plasmid zwischen den HXT7- Promotor bzw. CYCl -Terminator kloniert. Die Sequenz der erhaltenen Plasmide wurde über Restriktionsanalyse verifiziert. Weiterhin sollte von den neuen Isomerasen die Funktionalität und deren Effekt auf den Arabinose-Umsatz untersucht werden.

Hierzu wurden r combinante Hefestämme hergestellt, die eine der neuen Isomerasen enthielten sowie die restlichen bakteriellen Arabinose-Stoffwechselweg-Gene (p424H7araB re , p425H7araD re und pHL125 re ).

B) Wachstumsverhalten

Das Wachstum der Stämme wurde unter aeroben Bedingungen in Arabinose-haltigem Medium getestet. Als Vergleich diente der rekombinante Hefestamm, welcher die Isomerase aus B. subtilis enthielt. Als Negativkontrolle wurde ein Hefestamm konstruiert, der den leeren Vektor p423HXT7-6HIS besaß.

Die Stämme mit den verschiednen Isomerase-Plasmiden wurden in SM-Medium mit 2 % Arabinose herangezogen und mit einer OD 60 o nm = 0,2 in 5 ml SM-Medium mit 2 % Arabinose angeimpft. Die Inkubation erfolgte in Reagenzgläsern auf einem Schüttelkolben unter aeroben Bedingungen bei 30°C. Es wurde mehrfach Proben zur Bestimmung der optischen Dichte genommen.

Die Ergebnisse sind in Figur 4 gezeigt. Es zeigte sich, daß verglichen mit der Isomerase aus B. subtilis, besonders die Expression der L-Arabinose-Isomerase von C. acetobutylicum und von B. licheniformis signifikant das Wachstum der Hefetransformanden auf Arabinose Medium verbesserten.

Beispiel 2: Codon-Optimierung der Gene für den Arabinose- Abbau in Hefe

A) Codon-Optimierung von Genen nach dem Codongebrauch der Glycolysegene aus S. cerevisiae

Der bevorzugte Codongebrauch der Glycolysegene aus S. cerevisiae wurde ermittelt und ist in Tabelle 1 aufgelistet. Es wurde der ORF der Gene araA und araB" 11 " aus E. coli Codon- optimiert, sowie der ORF des Genes araA aus B. licheniformis. Das heißt, die Sequenzen der offenen Leserahmen wurden dem unten angeführten bevorzugten Codon-Gebrauch angepaßt. Die Proteinsequenz der Enzyme blieb unverändert. Die Gene wurden bei einer externen Firma synthetisiert und in getrockneter Form in firmeneigenen Hausvektoren geliefert.

Nähere Angaben zu der Synthese von Genen finden sich unter http://www.sloning.com/.

Tabelle 1 : Bevorzugter Codon-Gebrauch der Glycolysegene aus S. cerevisiae.

Amminosäure bevorzugtes Codon

AIa GCT

Arg AGA

Asn AAC

Asp GAC, (GAT)

Cys TGT

GIn CAA

GIu GAA

GIy GGT

His CAC

He ATT, (ATC)

Leu TTG

Lys AAG

Met ATG

Phe TTC

Pro CCA

Ser TCT, (TCC)

Thr ACC, (ACT)

Trp TGG

Tyr TAC

VaI GTT, (GTC)

Stopp TAA

B) Einführung der Codon-optimierten Gene in den Stamm BWYl

Um die drei Codon-optimierten Gene in den Stamm BWYl zu transformieren und zu testen, mussten die Gene in Hefevektoren subkloniert werden. Hierfür wurden der Codon-optimierte araA-ORF, der araff" ut -ORF und der αraD-ORF mit Primern amplifiziert, bei denen homologe überhänge zu dem verkürzten /£ϊT7-Promotor und dem CYCl -Terminator entstanden. Die 2μ Expressionsplasmide p423HXT7-6HIS, p424HXT7-6HIS, p425HXT7- 6HIS wurden mit Restriktionsendonukleasen im Bereich zwischen /£Y77-Promotor und CYCl -Terminator linearisiert. Das PCR-Produkt von araA wurde mit dem linearisierten p423HXT7-6HIS in Hefe transformiert und über in v/vo-Rekombination zu dem Plasmid p423H7-synthIso kloniert. Ebenso wurde mit dem PCR-Produkt araEF ut und dem linearisierten Vektor p424HXT7-6HIS vorgegangen. Es entstand das Plasmid p424H7synthKin. Durch in v/vo-Rekombination in Hefe von PCR-Produkt araD und dem linearisierten Vektor p425HXT7-6HIS entstand Plasmid p425H7-synthIso. Die Plasmide wurden aus Hefe isoliert und in E. coli amplifiziert. Nach der Isolierung der Plasmide aus E. coli wurden die Plasmide mittels Restriktionsanalyse überprüft. Zum Test auf Funktionalität

und zur weiteren Analyse wurde jeweils eines der Plasmide mit den Codon-optimierten Genen zusammen mit den drei Original -re-isolierten Plasmiden in den Hefestamm BWYl transformiert, so daß alle entstandenen rekombinanten Stämme einen vollständigen Arabinose-Stoffwechselweg enthielten. Zusätzlich wurde die Kombination p424H7synthKin und p42457synthEpi mit den Original- re-isolierten Plasmiden getestet, sowie ein Ansatz, bei der die Hefetransformande alle drei neuen Plasmide besaß. Die Transformation mit den jeweils vier Plasmiden erfolgte gleichzeitig. Die Transformanden wurden auf SM-Medium mit 2 % Glucose ausplattiert. Nach zwei Tagen wurden die erhaltenen Kolonien auf SM- Medium mit 2 %Arabinose ausgestrichen. Als Positivkontrolle diente ein Hefestamm, der die vier Original- re-isolierten Plasmide enthielt.

C) Wachstumsverhalten

Das Wachstum des Stammes BWYl mit den unterschiedlichen Plasmidkombinationen aus Codon-optimierten Genen und Original-Genen wurde in Wachstumstests auf Arabinose- haltigem Medium unter aeroben Bedingungen untersucht.

Die Stämme mit den verschiedenen Plasmidkombinationen wurden in SM-Medium mit 2 % L-Arabinose herangezogen und mit einer OD ό oo nm = 0,2 in 5 ml SM-Medium mit 2 % L- Arabinose angeimpft. Die Inkubation erfolgte in Reagenzgläsern unter aeroben Bedingungen bei 30°C. Es wurden mehrfach Proben zur Bestimmung der optischen Dichte entnommen.

Die Ergebnisse der aeroben Wachstumskurve sind in Figur 5 dargestellt. Es ist deutlich zu erkennen, daß rekombinante Hefestämme, die nur eines der optimierten Gene besitzen, gegenüber dem Stamm mit den vier Originalplasmiden kaum oder nur wenig Wachstumsvorteile in Arabinose-haltigen Medium aufweisen. Jedoch zeigten Hefetransformanden mit den zwei optimierten Genen der Kinase und Epimerase sowohl Hefetransformanden mit drei optimierten Genen einen deutlichen Wachstumsvorteil in Arabinose- haltigen Medium. Die Stämme zeigten eine deutlich verkürzte Lag-Phase und wuchsen wesentlich schneller zu ihrer maximalen optischen Dichter heran.

Damit wird gezeigt, daß die Kombination der drei Codon-optimierten Genen den rekombinanten S. cerevisiae Zellen, eine wesentlich effizientere L-Arabinose Verwertung ermöglicht.

D) Ethanol-Produktion

In Figur 6 (A) und (B) werden die Ergebnisse von HPLC-Analysen zweier Fermentationen gezeigt. Ein rekombinanter Hefestamm enthält die Plasmide p423H7synthIso, p424H7synthKin, p425H7synthEpi und pHL125 re , der andere Stamm die Plasmide p423H7araABs re , p424H7araB re , p425H7araD re und pHL125 re . Die Fermentationen wurden in SFM-Medium mit 3 % L-Arabinose durchgeführt. Figur 6 (A) zeigt den Arabinose- Verbrauch und das Trockengewicht der beiden Stämme. In Figur 6 (B) ist die Ethanol-Produktion beider Stämme dargestellt.

Die Stämme wurden bis zum Erreichen eines Trockengewichts von ca. 2,8 g/l aerob im Fermenter angezogen. Bei Erreichen von genug Zellmasse wurden die Fermentationen auf anaerobe Bedingungen umgestellt. Gezeigt sind die Kurven des Arabinose-Umsatzes sowie die Ethanol-Produktion. Die entstandenen Nebenprodukte Arabitol, Acetat und Glycerin sind nicht aufgeführt, da sie bei beiden Stämmen in vergleichbaren Mengen produziert wurden. Wie aus den Kurven erkennbar ist, setzt bei beiden Stämmen die Ethanol-Produktion direkt nach dem Wechsel auf anaerobe Bedingungen ein (Wechsel zu anaeroben Bedingungen gezeigt in Fig 6 (A) und (B) durch Pfeil). Der schon zu Beginn der Fermentation enthaltene Ethanol im Medium war nicht von den Hefen produziert, sondern stammte aus der Tween80/Ergosterol-Lösung. Unter den am Anfang herrschenden aeroben Bedingungen wurde Ethanol respiratorisch von Hefe abgebaut.

Nach ca. 80 Stunden zeigt der Stamm, der die Arabinose-Stoffwechselweg-Gene in Codon- optimierter Form besitzt, einen deutlich verbesserten Arabinose-Umsatz sowie eine erhöhte Ethanol-Produktion. Die vorhandene Arabinose im Medium ist bereits nach 150 Stunden vollständig verbraucht. Hingegen ist bei dem Stamm mit den Original re-isolierten Plasmiden selbst nach über 180 Stunden noch Arabinose im Medium vorhanden.

Aus den Fermenationsergebnissen geht hervor, daß die Codon-optimierten Gene den Hefetranformanden eine effizientere Arabinose-Umsetzung ermöglichen. Das Resultat daraus ist eine schnellere Umsetzung des Zuckers sowie eine deutlich höhere Ethanol-Ausbeute.

Beispiel 3: Konstruktion einer Expressionskassette mit drei Genen für den Arabinose-Stoffwechselweg

Der Vektor mit der Expressionskassette mit drei Genen für den Arabinose-Stoffwechselweg wurde konstruiert, um zum einen die Problematik zu umgehen, die entstehen kann, wenn mehrere Plasmide gleichzeitig in einer Zelle vorhanden sind („Plasmid-Last", Review zu E. coli von Bailey (1993)), und zum anderen, um eine stabile genomische Integration der Arabinose-Stoffwechselweg-Gene zu ermöglichen. Arbeiten von Becker (2003) und Wiedemann (2005) zeigten bereits die Problematik in der Konstruktion einer Expressionskassette der Arabinose-Stoffwechselweg-Gene sowie deren einzelne stabile genomische Integration. Die nun konstruierte Expressionskassette mit den drei Genen stellt einen hervorragenden Ausgangspunkt für eine direkte genomische Integration dar, sowie ermöglicht eine Subklonierung in die integrativen Plasmide der Serie pRS303X, pRS305X und pRS306X (Taxis und Knop, 2006).

A) Konstruktion der Expressionskassette

Für die Konstruktion der Expressionskassette wurde von dem Plasmid p425H7-synthEpi ausgegangen, in dem die Codon-optimierte Form der Epimerase aus E. coli hinter dem verkürzten HXT7 Promotor und vor dem CYCl Terminator exprimiert wurde. Um eine mögliche homologe Rekombination zwischen identischen Promotor- bzw. Terminatorregionen zu vermeiden, sollte der Codon-optimierte araB mul - ORF aus E. coli zwischen den PFKl -Promotor und dem FBA 1 -Terminator exprimiert werden, der Codon- optimierte araA-ORF aus B. licheniformis zwischen den F&4./ -Promotor und den PGKl- Terminator. Das Plasmid p425H7-synthEpi wurde mit der Restriktionsendonuklease Sacl vor dem 7ωT7-Promotor geöffnet, auf ein Agarosegel aufgetragen und aus dem Gel eluiert. Der araB""" -ORF wurde per PCR amplifiziert. PFKl -Promotor und FBAl -Terminator wurden aus genomischer DNA von S. cerevisiae amplifiziert, wobei die Primer so gewählt wurden, daß zum einen eine 500bp lange Sequenz des Promotors bzw. eine 300bp lange Sequenz des Terminators synthetisiert wurde und gleichzeitig homologe überhänge zum Plasmid p425H7- synthEpi bzw. zum araB"""-OKF entstanden. Zusätzlich enthielt der Primer, welcher den PFKl -Promotor mit den homologen Bereichen zu p425H7-synthEpi amplifizierte eine Sequenz für eine Päd Schnittstelle. Zusammen mit dem linearisierten Vektor wurden die drei PCR-Produkte in Hefe transformiert und über in v/vσ-Rekombination in das Plasmid Moniert. Die erfolgreiche Konstruktion des entstandenen Plasmids p425H7synthEpisynthKin wurde über Restriktionsanalyse verifiziert. Die Funktionalität des Vektors wurde getestet. Hierzu wurden Hefestransformanden hergestellt, die die Plasmide p425H7synthEpisynthKin und p423H7araABs re enthielten. Die Transformanden wurden auf Arabinosewachstum getestet.

Der Stamm war in der Lage, auf Arabinose-haltigem Medium zu wachsen. Als Negativ- Kontrolle diente ein Hefestamm, der die Vektoren p424H7synthEpi sowie p423HXT7-6HIS enthielt. Dieser war nicht in der Lage, auf dem Medium zu wachsen.

Im nächsten Schritt wurde die Codon-optimierte Form der Isomerase aus B. licheniformis in den Vektor integriert. Hierzu wurde Plasmid p425H7synthEpisynthKin mit NgoMWl hinter dem CYCl -Terminator linearisiert, auf ein Agarosegel aufgetragen und aus dem Gel eluiert. Es wurde eine 500bp lange Sequenz des FBA 1 -Promotors aus genomischer DNA von S. cerevisiae amplifiziert, wobei die Primer so gewählt wurden, daß homologe überhänge zu Plasmid p425H7synthEpisynthKin im CYCl -Terminator und zu dem ORF der Codon- optimierten araA entstanden. Zusätzlich wurde ein 300bp lange Sequenz des PGKl- Terminators aus genomischer DNA von S. cerevisiae amplifiziert, bei der ein Primer zu dem ORF der Codon-optimierten araA homologe überhänge besaß und der andere Primer homologe überhänge zu Plasmid p425H7synthEpisynthKin sowie eine AscI Schnittstelle aufwies.

Die erfolgreiche Konstruktion des entstandenen Plasmids p425H7synthAra wurde wieder über Restriktionsanalyse verifiziert und seine Funktionalität überprüft. Der Test auf Funktionalität wurde auf Arabinosewachstum durchgeführt. Hefetransformanden, die das Plasmid p425H7synthAra enthielten, zeigten Wachstum auf Arabinose-haltigem Medium. Wachstumskurven in 5 ml SC-Medium mit 2 % Arabinose wurden durchgeführt. In Figur 7 ist zu erkennen, daß die Transformanden mit Vektor p425H7synthAra vergleichbares Wachstum zeigen wie ein Stamm mit den vier Original reisolierten Plasmiden.

B) Rolle der Promotoren und Terminatoren

Um eine mögliche homologe Rekombination zwischen den Promotor bzw. den Terminatorregionen zu vermeiden, wurden die drei Gene hinter unterschiedliche Promotoren und Terminatoren kloniert. Besonders wichtig war dabei die Auswahl der Promotoren. Aus vorangehenden Arbeiten (Becker und Boles, 2003) zeigte sich, daß die Gendosis der drei Gene zu einander von entscheidender Bedeutung war. Zusätzlich sollten alle Gene stark exprimiert werden. Aus diesen Gründen fiel die Wahl zum einen auf den verkürzten HXT7- Promotor, der konstitutiv und stark exprimiert wird, sowie die Promotoren PFKl und FBAl, von denen bekannt ist, daß sie eine starke Expression der Gene bewirken.

C) Beispiele für Vektoren für die Expressionskassette

Ausgangsplasmid für die Konstruktion von p425H7synthAra war das Plasmid p425H7synthEpi, welches auf dem Plasmid p425HXT7-6HIS basiert. Bei dem Vektor handelt es sich um ein 2μ Expressionsplasmid, welches einen Leucin-Marker besitzt.

Die drei Arabinose- Stoffwechsel weg Gene wurden hintereinander unter die Kontrolle von unterschiedlichen Promotoren und Terminatoren in einen Vektor kloniert. Die Expressionskassette ist von den Erkennungssequenzen der Enzyme Päd und Ascl flankiert.

Weitere mögliche Expressionsvektoren sind aus der Serie pRS303X, p3RS305X und p3RS306X. Hierbei handelt es sich um integrative Vectoren, die einen dominanten Antibiotika-Marker besitzen. Nähere Angaben zu diesen Vektoren finden sich bei Taxis und Knop (2006).

Referenzen

Becker, J. (2003)

Konstruktion und Charakterisierung eines L-Arabinose fermentierenden Saccharomyces cerevisiae Hefestammes.

Dissertation, Heinrich-Heine-Universität Düsseldorf

Becker, J. und Boles, E. (2003)

A modified Saccharomyces cerevisiae strain that consumes L-arabinose and produces ethanol. Appl. Environ. Microbiol. 69:4144-4150

Bailey, J.E. (1993)

Host-vector interactions in Escherichia coli. Adv. Biochem Eng. 48.29-52

Bennetzen, J.L. und Hall, B.D. (1982)

Codon selection in yeast. JBiol Chem. 257(6):3026-2031.

Birnboim, H.C. und J. DoIy (1979)

A rapid alkaline extraction procedure for Screening recombinant plasmid DNA. Nucl. Acids Res. 7: 1513-1523

Dower, W.J., Miller, J.F. und Ragsdale, C.W. (1988)

High efficiency transformation of E. coli by high voltage electroporation. Nucl. Acids Res. 16: 6127-6145

Gietz, R.D. und Woods, R.A. (1994)

High efficiency transformation in yeast.

In: Molecular Genetics of Yeast: Practical Approaches, J. A. Johnston (Ed.).

Oxford University Press pp. 121-134

Hamacher, T., Becker, J., Gärdonyi, M., Hahn-Hägerdal, B. und Boles., E. (2002)

Characterization of the xylose-transporting properties of yeast hexose transportes and their influence on xylose utilization.

Microbiology 148:2783-2788.

Hoekema A, Kastelein RA, Vasser M, de Boer HA. (1987)

Codon replacement in the PGKl gene of Saccharomyces cerevisiae: experimental approach to study the role of biased codon usage in gene expression.

Mol Cell Biol. 7(8):2914-2924.

Karhumaa, K., Wiedemann, B., Hahn-Hägerdal, B., Boles, E. and Gorwa-Grauslund, MF. (2006)

Co-utilisation of L-arabinose and D-xylose by laboratory and industrial Saccharomyces cerevisiae strains.

Microbial Cell Factories 5(1): 18

Maniatis T, Fritsch, E.F und Sambrook, J. (1982)

Molecular cloning. A laboratory manual. CoId Spring Harbor Laboratory, New York.

Sedlak, M. und Ho, N.W. Y. (2001)

Expression of E. coli araBAD operon encoding enzymes for metabolizing L-arabinose in Saccharomyces cerevisiae. Enz. Microbiol. 28: 16-24

Taxis, C. und Knop, M. (2006)

System of centromeric, episomal, and integrative vectors based on drug resistance markers for Saccharomyces cerevisiae. BioTechniques 40, No. 1

Verduyn, C, Postma, E., Scheffers, W.A. und Van Dijken, J.P. (1992)

Effect of benzoic acid on metabolic fluxes in yeasts: a continuous-culture study on the regulation of respiration and alcoholic fermentation. Yeast S (7), 501-17

Wiedemann, B.(2005)

Molekulargenetische und physiologische Charakterisierung eines rekombinanten Pentose- vergärenden Hefestammes. Diplomarbeit. Johann Wolfgang Goethe-Universität, Frankfurt am Main.

Wirth;R. (1993)

Elektroporation: Eine alternative Methode zur Transformation von Bakterien mit Plasmid-

DNA.

Forum Mikrobiologie 11 (507-515).

Wu G, Bashir-Bello N, Freeland SJ. (2006)

The Synthetic Gene Designer: a flexible web platform to explore sequence manipulation for heterologous expression.

Protein Expr Purif. 47(2) :441-445.

Zimmermann, F. K. (1975)

Procedures used in the induction of mitotic recombination and mutation in the yeast Saccharomyces cerevisiae. Mutation Res. 31:71-81