A POLYPEPTIDE HAVING XYLANASE ACTIVITY

Title:

A POLYPEPTIDE HAVING XYLANASE ACTIVITY

Document Type and Number:

WIPO Patent Application WO/2019/162516

Kind Code:

A1

Abstract:

The present invention relates to an isolated polypeptide having xylanase activity. Also disclosed are isolated polynucleotides encoding the polypeptide, recombinant host cells expressing the polypeptide, and methods for degrading lignocellulosic biomass using the polypeptide. The invention finds utility in the production of biofuels, in the paper and pulp industry, in clothing or leather softening, in the food industry such as baking, etc.

Inventors:

GAFFNEY DARRAGH (IE)
DWYER KELLY (IE)
WALSH GARY (IE)
WINGER ALISON (IE)

Application Number:

PCT/EP2019/054636

Publication Date:

August 29, 2019

Filing Date:

February 25, 2019

Export Citation:

Click for automatic bibliography generation Help

Assignee:

UNIV LIMERICK (IE)
MONAGHAN MUSHROOMS IRELAND (IE)

International Classes:

C12P19/00; C12N9/24; C12P7/06

Domestic Patent References:

WO2014202616A2	2014-12-24
WO2014138983A1	2014-09-18
WO2007091231A1	2007-08-16
WO1996000787A1	1996-01-11

Foreign References:

EP0238023A2

1987-09-23

Other References:

DATABASE UniProt [online] 24 June 2015 (2015-06-24), "RecName: Full=Beta-xylanase {ECO:0000256|RuleBase:RU361174}; EC=3.2.1.8 {ECO:0000256|RuleBase:RU361174};", XP055470219, retrieved from EBI accession no. UNIPROT:A0A0F4YIA9 Database accession no. A0A0F4YIA9
TUOHY M G ET AL: "CHARACTERIZATION OF THE INDIVIDUAL COMPONENTS OF THE XYLANOLYTIC ENZYME SYSTEM OF TALAROMYCES EMERSONII", BIORESOURCE TECHNOLOGY, ELSEVIER, AMSTERDAM, NL, vol. 50, no. 1, 1 January 1994 (1994-01-01), pages 37 - 42, XP000876865, ISSN: 0960-8524, DOI: 10.1016/0960-8524(94)90218-6
TUOHY M G ET AL: "THE XYLAN-DEGRADING ENZYME SYSTEM OF TALAROMYCES EMERSONII: NOVEL ENZYMES WITH ACTIVITY AGAINST ARYL BETA-D-XYLOSIDES AND UNSUBSTITUTED XYLANS", BIOCHEMICAL JOURNAL, PORTLAND PRESS LTD, GB, vol. 290, no. 2, 1 March 1993 (1993-03-01), pages 515 - 523, XP000876862, ISSN: 0264-6021
HOUBRAKEN; FRISVAD, RASAMSONIA EMERSONII (STOLK, 2012
HOUBRAKEN; FRISVAD: "Rasamsonia emersonii (Stolk", ANTONIE VAN LEEUWENHOEK, pages: 101
"Talaromyces emersonii Stolk", vol. 31, 1965, ANTONIE VAN LEEUWENHOEK, pages: 262
HAWKSWORTH ET AL.: "Ainsworth and Bisby's Dictionary of The Fungi", 1995, CAB INTERNATIONAL, UNIVERSITY PRESS
"Soc. App. Bacterial. Symposium Series", 1980, article "Biology and Activities of Yeast"
YELTON ET AL., PROC. NATL. ACAD. SCI. USA, vol. 81, 1984, pages 1470 - 1474
CHRISTENSEN ET AL., BIO/TECHNOLOGY, vol. 6, 1988, pages 1419 - 1422
MALARDIER ET AL., GENE, vol. 78, 1989, pages 147 - 156
BECKER; GUARENTE: "Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology", vol. 194, ACADEMIC PRESS, INC., pages: 182 - 187
ITO ET AL., J. BACTERIAL., vol. 153, 1983, pages 163
HINNEN ET AL., PROC. NATL. ACAD. SCI. USA, vol. 75, 1978, pages 1920

Attorney, Agent or Firm:

FRKELLY (IE)

Download PDF:

View/Download PDF PDF Help

Claims:

Claims

1. An isolated polypeptide having xylanase activity and comprising the amino acid sequence defined in SEQ ID NO:1 , a fragment of at least 344 amino acids in length comprising at least amino acid residues 19-362 of the amino acid sequence of the isolated polypeptide, or an analogue thereof having at least 70% sequence identity to the amino acid sequence of the isolated polypeptide.

2. An isolated polypeptide according to Claim 1 , wherein the isolated polypeptide fragment has a molecular weight of at least 47.5kDa.

3. An isolated polypeptide according to Claim 1 or 2, wherein the isolated polypeptide or

fragment or analogue thereof is, or is derived, from R. emersonii strain IMI 116815.

4. An isolated polypeptide according to any one of Claims 1-3, wherein the isolated polypeptide or fragment or analogue thereof has at least one of xylan from beechwood degradation activity, azo-wheatarabinoxylan degradation activity, wheatarabinoxylan degradation activity, xylopranoside degradation activity and p-nitrophenyl xylopranoside degradation activity.

5. An isolated polypeptide according to any one of Claims 1-4, wherein the isolated polypeptide or fragment or analogue thereof has limited or no cellulase activity.

6. An isolated polypeptide according to any one of Claims 1-5, wherein the isolated polypeptide analogue has at least 85% sequence identity to the amino acid sequence.

7. An isolated polynucleotide comprising the nucleic acid sequence defined in SEQ ID NO:2, or a variant thereof having at least 70% sequence identity to the nucleic acid sequence to the isolated polynucleotide.

8. An isolated polynucleotide according to Claim 7, wherein the isolated polynucleotide variant has at least 85% sequence identity to the nucleic acid sequence.

9. A vector comprising the isolated polynucleotide according to Claim 7 or 8.

10. A host cell comprising the vector according to Claim 9.

11. A method of preparing a host cell, the method comprising the steps of:

(a) providing a host cell; and

(b) introducing into the host cell the vector according to Claim 9.

12. A method of preparing the isolated polypeptide according to any one of Claims 1-6; the method comprising the steps of:

(a) providing a host cell;

(b) introducing into the host cell the vector according to Claim 9;

(c) transcribing the vector to obtain a ribonucleic acid; and

(d) translating the ribonucleic acid to obtain the isolated polypeptide.

13. A method of degrading lignocellulose biomass, the method comprising the steps of:

(a) providing a lignocellulose biomass; and

(b) contacting the lignocellulose biomass with the isolated polypeptide according to any one of Claims 1-6.

14. A method according to Claim 13, wherein the contacting step (b) comprises contacting the lignocellulose biomass with the host cell according to Claim 10.

15. A method according to Claim 13 or 14, wherein the contacting step (b) of the method of degrading lignocellulose biomass is conducted at a pH of 3.0 - 6.0.

16. A method according to any one of Claims 13-15, wherein the contacting step (b) of the method of degrading lignocellulose biomass is conducted at a temperature of 45 - 90°C.

Description:

Title of the Invention

A polypeptide having xylanase activity.

Field of the Invention

The present invention relates to an isolated polypeptide having xylanase activity. Also disclosed are isolated polynucleotides encoding the polypeptide, recombinant host cells expressing the polypeptide, and methods for degrading lignocellulosic biomass using the polypeptide.

Background to the Invention

Lignocellulose biomass is the most abundantly available raw material on Earth for the production of biofuels, such as cellulosic bioethanol, which is a renewable transport fuel that can be produced, for example, from agricultural waste. The widespread deployment of biofuels is highly desirable to reduce greenhouse gas emissions, improve energy security, support economic growth and job creation, and is in line with global and European renewable energy strategy and policies.

The production of biofuels from lignocellulose biomass is however technically challenging. The process involves a number of steps including enzymatic hydrolysis of the cellulose and hemicellulose components of the lignocellulose biomass in order to release sugars for subsequent fermentation. Organisms that produce enzyme systems capable of degrading lignocellulose biomass are widely distributed in nature and include higher plants, fungi, and bacteria.

The enzymes typically used in production of biofuels from lignocellulose biomass include cellulases and hemicellulases, with pH and temperature optima usually at or near the hydrolysis conditions. Hydrolysis is usually undertaken at pH of 4.5 - 5.5 and a temperature of 45 - 55°C. However, conducting hydrolysis at temperatures above 55°C could increase product solubility, facilitate higher substrate loadings, and reduce process liquid viscosity - which could contribute to the feasibility of the production of biofuels from lignocellulose biomass on an industrial scale.

In the baking industry, xylanase enzymes are used to alter the properties of dough. Wheat flour contains up to 4% arabinoxylans (a highly-branched hemicellulose found in both the primary and secondary cell walls of plants such as wheat, barley, oat, and rye - and comprising copolymers of arabinose and xylose). Some arabinoxylans are soluble, while the majority are coupled to wheat proteins (in an insoluble fraction), which is believed to reduce the elasticity of the gluten (and hence the dough). Xylanases added to the flour can improve the handling and stability of the dough by acting on the insoluble arabinoxylan fraction. Moreover, xylanase enzymes find similar utility in the paper and pulp industry, and animal feed sector. A major disadvantage of current commercial enzymatic hydrolysis is reduced enzyme performance due to heat inactivation. As xylan is the single most abundant hemicellulose fraction in lignocellulose biomass, and the inclusion of xylanase enzyme is important in most hydrolysis reactions, the isolation and development of new thermo-active and thermostable xylanase enzymes is important for the development of feasible industrial hydrolysis reactions.

Summary of the Invention

According to a first aspect of the present invention, there is provided an isolated polypeptide comprising the amino acid sequence:

MRLSPSLIFVPLVTPAFTLLFNSNLTSPPWLNDLAQRRGKLWFGTAADIPGPEQQDTNYM TI LNDTKIFGELTPANYMKFEYTEPSPNVFNYSGGDTILAIAENHGKRVRCHNLIWVSQLPD WV VNGSWTAASLTAVMKTHITNLITHWGGRCYSWDVVNEALAANGSWASSIWYDTIGPEYFF L AYRFAQEAVEKTGQDIKLYYNDYGIEAPGPKTTAAYNLVKELQARGIRIDGVGLESHFEV GA TPSKDAQVEAKQGFLDLGVDVVVTELDVRFPEGPFYTAAGEKQQAQDYYDTVASCVEVGP

RCVGITVWDFDDAYSWVPSSFPGQGAADLYNGTLQRKPAYYAVAEALQGVSCSVC, or a fragment or analogue thereof.

Optionally, the isolated polypeptide comprises the amino acid sequence defined in SEC ID NO:1 , or a fragment or analogue thereof.

Optionally, the isolated polypeptide is encoded by a polynucleotide comprising the nucleic acid sequence:

ATGCGTCTCTCTCCGTCTTTAATATTCGTACCGCTGGTCACACCAGCCTTTACATTGCTA TT CAACTCG AACCT CACAT CT CCTCCAT GGCT CAAT GAT CTCGCACAG AGGCGTGGCAA

GCTGTGGTTTGGCACGGCAGCTGACATCCCCGGTCCAGAGCAGCAGGATACGAACTA CATGACCATCCTGAATGATACGAAGATATTTGGGGAATTGACGCCTGCGAATTATATGA AGTTCG AAT AC ACT GAACCATCGCCCAAT GT CTT CAACTACT CT GGCGGCGACACCAT C CT GGCC AT CGCCG AAAACCACGGCAAGCGCGTT CGCT GCCACAACCT CAT CTGGGTCA GCCAGCTGCCCGACTGGGTGGTGAACGGCAGCTGGACAGCGGCGAGCCTCACAGCG

GT GAT GAAGACGCACAT CACGAACCTGAT CACGCACT GGGGAGGGCGGT GCTACT CG TGGGACGTGGTCAACGAGGCGCTGGCGGCGAACGGGTCGTGGGCGTCCAGCATCTG GTACGACACCATCGGGCCCGAGTACTTCTTCCTCGCGTACCGGTTTGCGCAGGAGGC GGTCG AAAAGACCGGCCAGGACAT CAAGCT GT ACTACAAT GACT ACGGG ATCG AGGCG CCCGGTCCCAAGACGACGGCGGCGTACAACCTGGTCAAGGAGCTGCAGGCGCGAGG

CATCCGGATCGATGGCGTGGGGTTGGAGTCGCATTTCGAAGTGGGCGCGACGCCATC CAAGGACGCGCAGGTTGAGGCCAAGCAGGGGTTTTTGGATCTGGGGGTCGATGTTGT CGTCACGGAGCTGGATGTCAGATTCCCGGAGGGGCCGTTCTACACGGCGGCGGGTGA GAAGCAGCAGGCGCAGGACTATTATGATACGGTGGCGAGCTGCGTGGAGGTTGGTCC TCGGTGTGTGGGCATCACGGTGTGGGATTTTGACGATGCGTATTCGTGGGTGCCGTCA TCGTTTCCTGGACAGGGAGCGGCTGATCTGTATAATGGGACGTTGCAGCGGAAGCCG GCGTACTATGCGGTGGCAGAGGCATTGCAGGGGGTGAGTTGTAGTGTGTGCTAA, or a fragment or variant thereof. Optionally, the isolated polypeptide is encoded by a polynucleotide comprising the nucleic acid sequence defined in SEQ ID NO:2, or a fragment or variant thereof.

Optionally, the isolated polypeptide is encoded by a polynucleotide comprising the nucleic acid sequence:

ATG AGG CTG TO A CCA TOO CTA ATA TTC GTA COT CTT GTG ACA CCC GOT TTC ACC TTA CTG TTC AAT TCC AAC CTA ACG TCC CCC CCT TGG CTT AAT GAT CTG GCA CAG AGG AGG GGT AAG TTA TGG TTT GGT ACC GCC GCA GAT ATT CCC GGT CCT GAG CAA CAA GAC ACA AAC TAT ATG ACG ATA CTT AAT GAT ACA AAG ATT TTC GGA GAA CTA ACT CCA GCC AAC TAC ATG AAA TTT GAG TAC ACG GAG CCC AGT CCC AAT GTC TTC AAT TAC AGT GGC GGT GAT ACT ATT CTG GCA ATT GCA GAA AAT CAT GGT AAA AGG GTT AGG TGT CAT AAT CTT ATT TGG GTT TCA CAA CTT CCC GAT TGG GTT GTG AAC GGT TCT TGG ACT GCC GCT TCC CTA ACT GCT GTA ATG AAG ACA CAT ATT ACG AAT TTA ATC ACA CAT TGG GGA GGT CGT TGT TAC AGT TGG GAT GTC GTT AAC GAA GCT CTG GCA GCC AAC GGT TCA TGG GCT AGT TCA ATC TGG TAC GAC ACC ATA GGA CCA GAG TAT TTC TTC CTA GCA TAC AGA TTC GCT CAG GAG GCT GTT GAG AAA ACC GGC CAA GAT ATC AAA TTG TAC TAT AAC GAC TAT GGC ATT GAA GCT CCT GGT CCC AAG ACA ACT GCA GCC TAT AAT CTG GTC AAG GAA CTT CAA GCA AGA GGA ATC CGT ATC GAC GGC GTC GGT TTG GAG TCT CAT TTT GAG GTG GGA GCA ACC CCT TCC AAG GAT GCT CAG GTT GAA GCT AAA CAA GGT TTT CTT GAC CTG GGA GTA GAC GTT GTC GTT ACG GAG TTG GAT GTC CGT TTC CCC GAG GGC CCT TTT TAC ACC GCA GCT GGA GAG AAG CAA CAG GCC CAA GAC TAT TAC GAC ACA GTT GCA AGT TGC GTA GAA GTC GGC CCC AGG TGC GTG GGC ATT ACT GTC TGG GAC TTC GAC GAC GCT TAC TCT TGG GTC CCT TCC TCC TTT CCC GGC CAA GGT GCC GCA GAC CTA TAC AAT GGT ACT TTA CAG AGG AAG CCT GCT TAC TAT GCT GTG GCA GAG GCA CTA CAA GGC GTG TCA TGC AGT GTC TGC TAA,

or a fragment or variant thereof.

Optionally, the isolated polypeptide is encoded by a polynucleotide comprising the nucleic acid sequence defined in SEQ ID NO:3, or a fragment or variant thereof.

According to a second aspect of the present invention, there is provided an isolated polynucleotide comprising the nucleic acid sequence:

ATGCGTCTCTCTCCGTCTTTAATATTCGTACCGCTGGTCACACCAGCCTTTACATTGCTA TT CAACTCG AACCT CACAT CTCCTCCATGGCT CAAT GAT CTCGCACAG AGGCGTGGCAA GCTGTGGTTTGGCACGGCAGCTGACATCCCCGGTCCAGAGCAGCAGGATACGAACTA CATGACCATCCTGAATGATACGAAGATATTTGGGGAATTGACGCCTGCGAATTATATGA AGTTCG AAT AC ACT GAACCATCGCCCAAT GT CTT CAACTACT CT GGCGGCGACACCAT C CTGGCCATCGCCGAAAACCACGGCAAGCGCGTTCGCTGCCACAACCTCATCTGGGTCA GCCAGCTGCCCGACTGGGTGGTGAACGGCAGCTGGACAGCGGCGAGCCTCACAGCG GTGATGAAGACGCACATCACGAACCTGATCACGCACTGGGGAGGGCGGTGCTACTCG

TGGGACGTGGTCAACGAGGCGCTGGCGGCGAACGGGTCGTGGGCGTCCAGCATCTG GTACGACACCATCGGGCCCGAGTACTTCTTCCTCGCGTACCGGTTTGCGCAGGAGGC GGTCGAAAAGACCGGCCAGGACATCAAGCTGTACTACAATGACTACGGGATCGAGGCG CCCGGTCCCAAGACGACGGCGGCGTACAACCTGGTCAAGGAGCTGCAGGCGCGAGG CATCCGGATCGATGGCGTGGGGTTGGAGTCGCATTTCGAAGTGGGCGCGACGCCATC

CAAGGACGCGCAGGTTGAGGCCAAGCAGGGGTTTTTGGATCTGGGGGTCGATGTTGT CGTCACGGAGCTGGATGTCAGATTCCCGGAGGGGCCGTTCTACACGGCGGCGGGTGA GAAGCAGCAGGCGCAGGACTATTATGATACGGTGGCGAGCTGCGTGGAGGTTGGTCC TCGGTGTGTGGGCATCACGGTGTGGGATTTTGACGATGCGTATTCGTGGGTGCCGTCA TCGTTTCCTGGACAGGGAGCGGCTGATCTGTATAATGGGACGTTGCAGCGGAAGCCG

GCGTACTATGCGGTGGCAGAGGCATTGCAGGGGGTGAGTTGTAGTGTGTGCTAA, or a fragment or variant thereof.

Optionally, the isolated polynucleotide comprises the nucleic acid sequence defined in SEQ ID NO:2, or a fragment or variant thereof.

Optionally, the isolated polynucleotide comprises the nucleic acid sequence:

ATG AGG CTG TCA CCA TCC CTA ATA TTC GTA CCT CTT GTG ACA CCC GCT TTC ACC TTA CTG TTC AAT TCC AAC CTA ACG TCC CCC CCT TGG CTT AAT GAT CTG GCA CAG AGG AGG GGT AAG TTA TGG TTT GGT ACC GCC GCA GAT ATT CCC GGT

CCT GAG CAA CAA GAC ACA AAC TAT ATG ACG ATA CTT AAT GAT ACA AAG ATT TTC GGA GAA CTA ACT CCA GCC AAC TAC ATG AAA TTT GAG TAC ACG GAG CCC AGT CCC AAT GTC TTC AAT TAC AGT GGC GGT GAT ACT ATT CTG GCA ATT GCA GAA AAT CAT GGT AAA AGG GTT AGG TGT CAT AAT CTT ATT TGG GTT TCA CAA CTT CCC GAT TGG GTT GTG AAC GGT TCT TGG ACT GCC GCT TCC CTA ACT GCT

GTA ATG AAG ACA CAT ATT ACG AAT TTA ATC ACA CAT TGG GGA GGT CGT TGT TAC AGT TGG GAT GTC GTT AAC GAA GCT CTG GCA GCC AAC GGT TCA TGG GCT AGT TCA ATC TGG TAC GAC ACC ATA GGA CCA GAG TAT TTC TTC CTA GCA TAC AGA TTC GCT CAG GAG GCT GTT GAG AAA ACC GGC CAA GAT ATC AAA TTG TAC TAT AAC GAC TAT GGC ATT GAA GCT CCT GGT CCC AAG ACA ACT GCA GCC TAT

AAT CTG GTC AAG GAA CTT CAA GCA AGA GGA ATC CGT ATC GAC GGC GTC GGT TTG GAG TCT CAT TTT GAG GTG GGA GCA ACC CCT TCC AAG GAT GCT CAG GTT GAA GCT AAA CAA GGT TTT CTT GAC CTG GGA GTA GAC GTT GTC GTT ACG GAG TTG GAT GTC CGT TTC CCC GAG GGC CCT TTT TAC ACC GCA GCT GGA GAG AAG CAA CAG GCC CAA GAC TAT TAC GAC ACA GTT GCA AGT TGC GTA GAA GTC GGC CCC AGG TGC GTG GGC ATT ACT GTC TGG GAC TTC GAC GAC GCT TAC TCT TGG GTC CCT TCC TCC TTT CCC GGC CAA GGT GCC GCA GAC CTA TAC AAT GGT ACT TTA CAG AGG AAG CCT GCT TAC TAT GCT GTG GCA GAG GCA CTA CAA GGC GTG TCA TGC AGT GTC TGC TAA,

or a fragment or variant thereof.

Optionally, the isolated polynucleotide comprises the nucleic acid sequence defined in SEQ ID NO:3, or a fragment or variant thereof.

According to a third aspect of the present invention, there is provided a vector comprising the nucleic acid sequence:

ATGCGTCTCTCTCCGTCTTTAATATTCGTACCGCTGGTCACACCAGCCTTTACATTGCTA TT CAACTCG AACCT CACAT CT CCTCCAT GGCTCAAT GAT CTCGCACAGAGGCGT GGCAA GCTGTGGTTTGGCACGGCAGCTGACATCCCCGGTCCAGAGCAGCAGGATACGAACTA CATGACCATCCTGAATGATACGAAGATATTTGGGGAATTGACGCCTGCGAATTATATGA AGTTCG AAT AC ACT GAACCATCGCCCAAT GT CTT CAACTACT CT GGCGGCGACACCAT C

CT GGCCAT CGCCG AAAACCACGGCAAGCGCGTT CGCT GCC ACAACCT CAT CTGGGTCA GCCAGCTGCCCGACTGGGTGGTGAACGGCAGCTGGACAGCGGCGAGCCTCACAGCG GTGATGAAGACGCACATCACGAACCTGATCACGCACTGGGGAGGGCGGTGCTACTCG TGGGACGTGGTCAACGAGGCGCTGGCGGCGAACGGGTCGTGGGCGTCCAGCATCTG GTACGACACCATCGGGCCCGAGTACTTCTTCCTCGCGTACCGGTTTGCGCAGGAGGC

GGTCGAAAAGACCGGCCAGGACATCAAGCTGTACTACAATGACTACGGGATCGAGGC G CCCGGTCCCAAGACGACGGCGGCGTACAACCTGGTCAAGGAGCTGCAGGCGCGAGG CATCCGGATCGATGGCGTGGGGTTGGAGTCGCATTTCGAAGTGGGCGCGACGCCATC CAAGGACGCGCAGGTTGAGGCCAAGCAGGGGTTTTTGGATCTGGGGGTCGATGTTGT CGT CACGGAGCT GGAT GTCAGATT CCCGGAGGGGCCGTTCTACACGGCGGCGGGT GA

GAAGCAGCAGGCGCAGGACTATTATGATACGGTGGCGAGCTGCGTGGAGGTTGGTCC TCGGTGTGTGGGCATCACGGTGTGGGATTTTGACGATGCGTATTCGTGGGTGCCGTCA TCGTTTCCTGGACAGGGAGCGGCTGATCTGTATAATGGGACGTTGCAGCGGAAGCCG GCGTACTATGCGGTGGCAGAGGCATTGCAGGGGGTGAGTTGTAGTGTGTGCTAA, or a fragment or variant thereof.

Optionally, the vector comprises the nucleic acid sequence defined in SEQ ID NO:2, or a fragment or variant thereof. Optionally, the vector comprises the nucleic acid sequence:

ATG AGG CTG TCA CCA TCC CTA ATA TTC GTA CCT CTT GTG ACA CCC GCT TTC ACC TTA CTG TTC AAT TCC AAC CTA ACG TCC CCC CCT TGG CTT AAT GAT CTG GCA CAG AGG AGG GGT AAG TTA TGG TTT GGT ACC GCC GCA GAT ATT CCC GGT CCT GAG CAA CAA GAC ACA AAC TAT ATG ACG ATA CTT AAT GAT ACA AAG ATT TTC GGA GAA CTA ACT CCA GCC AAC TAC ATG AAA TTT GAG TAC ACG GAG CCC AGT CCC AAT GTC TTC AAT TAC AGT GGC GGT GAT ACT ATT CTG GCA ATT GCA GAA AAT CAT GGT AAA AGG GTT AGG TGT CAT AAT CTT ATT TGG GTT TCA CAA CTT CCC GAT TGG GTT GTG AAC GGT TCT TGG ACT GCC GCT TCC CTA ACT GCT GTA ATG AAG ACA CAT ATT ACG AAT TTA ATC ACA CAT TGG GGA GGT CGT TGT TAC AGT TGG GAT GTC GTT AAC GAA GCT CTG GCA GCC AAC GGT TCA TGG GCT AGT TCA ATC TGG TAC GAC ACC ATA GGA CCA GAG TAT TTC TTC CTA GCA TAC

AGA TTC GCT CAG GAG GCT GTT GAG AAA ACC GGC CAA GAT ATC AAA TTG TAC TAT AAC GAC TAT GGC ATT GAA GCT CCT GGT CCC AAG ACA ACT GCA GCC TAT AAT CTG GTC AAG GAA CTT CAA GCA AGA GGA ATC CGT ATC GAC GGC GTC GGT TTG GAG TCT CAT TTT GAG GTG GGA GCA ACC CCT TCC AAG GAT GCT CAG GTT GAA GCT AAA CAA GGT TTT CTT GAC CTG GGA GTA GAC GTT GTC GTT ACG GAG

TTG GAT GTC CGT TTC CCC GAG GGC CCT TTT TAC ACC GCA GCT GGA GAG AAG CAA CAG GCC CAA GAC TAT TAC GAC ACA GTT GCA AGT TGC GTA GAA GTC GGC CCC AGG TGC GTG GGC ATT ACT GTC TGG GAC TTC GAC GAC GCT TAC TCT TGG GTC CCT TCC TCC TTT CCC GGC CAA GGT GCC GCA GAC CTA TAC AAT GGT ACT TTA CAG AGG AAG CCT GCT TAC TAT GCT GTG GCA GAG GCA CTA CAA GGC GTG

TCA TGC AGT GTC TGC TAA,

or a fragment or variant thereof.

Optionally, the vector comprises the nucleic acid sequence defined in SEQ ID NO:3, or a fragment or variant thereof.

Optionally, the vector further comprises the nucleic acid sequence:

AGCACCACCT ACAT CAT CT CGCCG ACG ACGT CT GT CGG AACGGGCACGACGACCT CGA GCGGCGGAAGCGGCGGCACGACTGGCGTGGCCCAGCATTGGGAGCAGTGCGGTGGA CTGGGCTGGACTGGTCCGACGGTTTGCGCAAGTGGCTACACTTGCACTGTCATCAATG

AGT ATT ACTCGCAGT GTCTG ,

or a fragment or variant thereof.

Optionally, the vector comprises the nucleic acid sequence defined in SEQ ID NO:5, or a fragment or variant thereof.

Optionally, the vector further comprises a promoter operatively linked to the nucleic acid sequence:

ATGCGTCTCTCTCCGTCTTTAATATTCGTACCGCTGGTCACACCAGCCTTTACATTG CTATTCAA

CTCGAACCTCACATCTCCTCCATGGCTCAATGATCTCGCACAGAGGCGTGGCAAGCT GTGGTTT

GGCACGGCAGCTGACATCCCCGGTCCAGAGCAGCAGGATACGAACTACATGACCATC CTGAAT

GATACGAAGATATTTGGGGAATTGACGCCTGCGAATTATATGAAGTTCGAATACACT GAACCAT

CGCCCAATGTCTTCAACTACTCTGGCGGCGACACCATCCTGGCCATCGCCGAAAACC ACGGCA

AGCGCGTTCGCTGCCACAACCTCATCTGGGTCAGCCAGCTGCCCGACTGGGTGGTGA ACGGC

AGCTGGACAGCGGCGAGCCTCACAGCGGTGATGAAGACGCACATCACGAACCTGATC ACGCA

CTGGGGAGGGCGGTGCTACTCGTGGGACGTGGTCAACGAGGCGCTGGCGGCGAACGG GTCG

TGGGCGTCCAGCATCTGGTACGACACCATCGGGCCCGAGTACTTCTTCCTCGCGTAC CGGTTT GCGCAGGAGGCGGTCGAAAAGACCGGCCAGGACATCAAGCTGTACTACAATGACTACGGG AT

CGAGGCGCCCGGTCCCAAGACGACGGCGGCGTACAACCTGGTCAAGGAGCTGCAGGC GCGA

GGCATCCGGATCGATGGCGTGGGGTTGGAGTCGCATTTCGAAGTGGGCGCGACGCCA TCCAA

GGACGCGCAGGTTGAGGCCAAGCAGGGGTTTTTGGATCTGGGGGTCGATGTTGTCGT CACGG

AGCTGGATGTCAGATTCCCGGAGGGGCCGTTCTACACGGCGGCGGGTGAGAAGCAGC AGGCG

CAGGACTATTATGATACGGTGGCGAGCTGCGTGGAGGTTGGTCCTCGGTGTGTGGGC ATCACG

GTGTGGGATTTTGACGATGCGTATTCGTGGGTGCCGTCATCGTTTCCTGGACAGGGA GCGGCT

GATCTGTATAATGGGACGTTGCAGCGGAAGCCGGCGTACTATGCGGTGGCAGAGGCA TTGCAG

GGGGTGAGTTGTAGTGTGTGCTAA; or the nucleic acid sequence defined in SEQ ID NO:2; or the nucleic acid sequence defined in SEQ ID NO:3; or the fragment or variant each thereof.

Optionally, the promoter comprises the nucleic acid sequence:

AGATCTAACAT CCAAAG ACGAAAGGTT G AAT GAAACCTTTTT GCCAT CCGACATCCACA GGTCCATT CT CACACAT AAGTGCCAAACGC AACAGG AGGGGATACACT AGCAGCAGAC CGTTGCAAACGCAGGACCT CCACTCCT CTT CTCCT CAAC ACCCACTTTTGCCATCGAAA AACCAGCCCAGTTATTGGGCTTGATTGGAGCTCGCTCATTCCAATTCCTTCTATTAGGC TACTAACACCATGACTTTATTAGCCTGTCTATCCTGGCCCCCCTGGCGAGGTTCATGTT TGTTTATTTCCGAATGCAACAAGCTCCGCATTACACCCGAACATCACTCCAGATGAGGG CTTTCTGAGTGTGGGGTCAAATAGTTTCATGTTCCCCAAATGGCCCAAAACTGACAGTT TAAACGCTGTCTTGGAACCTAATATGACAAAAGCGTGATCTCATCCAAGATGAACTAAG TTTGGTTCGTTGAAATGCTAACGGCCAGTTGGTCAAAAAGAAACTTCCAAAAGTCGGCA TACCGTTTGTCTTGTTTGGTATTGATTGACGAATGCTCAAAAATAATCTCATTAATGCTT A GCGCAGTCTCTCTATCGCTTCTGAACCCCGGTGCACCTGTGCCGAAACGCAAATGGGG AAACACCCGCTTTTTGGATGATTATGCATTGTCTCCACATTGTATGCTTCCAAGATTCTG GTGGGAATACTGCTGATAGCCTAACGTTCATGATCAAAATTTAACTGTTCTAACCCCTAC TT GACAGC AAT AT ATAAAC AG AAGGAAGCT GCCCTGT CTT AAACCTTTTTTTTT AT CAT C ATT ATT AGCTT ACTTT CATAATTGCG ACTGGTTCCAATT GACAAGCTTTT GATTTTAACGA CTTTT AACG ACAACTT GAG AAG AT CAAAAAACAACT AATT ATT CGAAACG A, or a fragment or variant thereof.

Optionally, the promoter comprises the nucleic acid sequence defined in SEQ ID NO:4, or a fragment or variant thereof.

According to a fourth aspect of the present invention, there is provided a host cell comprising a vector comprising the nucleic acid sequence:

ATGCGTCTCTCTCCGTCTTTAATATTCGTACCGCTGGTCACACCAGCCTTTACATTGCTA TT CAACTCG AACCT CACAT CT CCTCCAT GGCT CAAT GAT CTCGCACAG AGGCGTGGCAA GCTGTGGTTTGGCACGGCAGCTGACATCCCCGGTCCAGAGCAGCAGGATACGAACTA CATGACCATCCTGAATGATACGAAGATATTTGGGGAATTGACGCCTGCGAATTATATGA AGTTCGAATACACTGAACCATCGCCCAATGTCTTCAACTACTCTGGCGGCGACACCATC CT GGCC AT CGCCG AAAACCACGGCAAGCGCGTT CGCT GCCACAACCT CAT CTGGGTCA GCCAGCTGCCCGACTGGGTGGTGAACGGCAGCTGGACAGCGGCGAGCCTCACAGCG GTGATGAAGACGCACATCACGAACCTGATCACGCACTGGGGAGGGCGGTGCTACTCG TGGGACGTGGTCAACGAGGCGCTGGCGGCGAACGGGTCGTGGGCGTCCAGCATCTG GTACGACACCATCGGGCCCGAGTACTTCTTCCTCGCGTACCGGTTTGCGCAGGAGGC GGTCG AAAAGACCGGCCAGGACAT CAAGCT GT ACTACAAT GACT ACGGG ATCG AGGCG

CCCGGTCCCAAGACGACGGCGGCGTACAACCTGGTCAAGGAGCTGCAGGCGCGAGG CATCCGGATCGATGGCGTGGGGTTGGAGTCGCATTTCGAAGTGGGCGCGACGCCATC CAAGGACGCGCAGGTTGAGGCCAAGCAGGGGTTTTTGGATCTGGGGGTCGATGTTGT CGTCACGGAGCTGGATGTCAGATTCCCGGAGGGGCCGTTCTACACGGCGGCGGGTGA GAAGCAGCAGGCGCAGGACTATTATGATACGGTGGCGAGCTGCGTGGAGGTTGGTCC

TCGGTGTGTGGGCATCACGGTGTGGGATTTTGACGATGCGTATTCGTGGGTGCCGTC A TCGTTTCCTGGACAGGGAGCGGCTGATCTGTATAATGGGACGTTGCAGCGGAAGCCG GCGTACTATGCGGTGGCAGAGGCATTGCAGGGGGTGAGTTGTAGTGTGTGCTAA, or a fragment or variant thereof.

Optionally, the vector comprises the nucleic acid sequence defined in SEC ID NO:2, or a fragment or variant thereof.

Optionally, the vector comprises the nucleic acid sequence:

ATG AGG CTG TO A CCA TCC CTA ATA TTC GTA CCT CTT GTG ACA CCC GCT TTC

ACC TTA CTG TTC AAT TCC AAC CTA ACG TCC CCC CCT TGG CTT AAT GAT CTG GCA CAG AGG AGG GGT AAG TTA TGG TTT GGT ACC GCC GCA GAT ATT CCC GGT CCT GAG CAA CAA GAC ACA AAC TAT ATG ACG ATA CTT AAT GAT ACA AAG ATT TTC GGA GAA CTA ACT CCA GCC AAC TAC ATG AAA TTT GAG TAC ACG GAG CCC AGT CCC AAT GTC TTC AAT TAC AGT GGC GGT GAT ACT ATT CTG GCA ATT GCA

GAA AAT CAT GGT AAA AGG GTT AGG TGT CAT AAT CTT ATT TGG GTT TCA CAA CTT CCC GAT TGG GTT GTG AAC GGT TCT TGG ACT GCC GCT TCC CTA ACT GCT GTA ATG AAG ACA CAT ATT ACG AAT TTA ATC ACA CAT TGG GGA GGT CGT TGT TAC AGT TGG GAT GTC GTT AAC GAA GCT CTG GCA GCC AAC GGT TCA TGG GCT AGT TCA ATC TGG TAC GAC ACC ATA GGA CCA GAG TAT TTC TTC CTA GCA TAC

AGA TTC GCT CAG GAG GCT GTT GAG AAA ACC GGC CAA GAT ATC AAA TTG TAC TAT AAC GAC TAT GGC ATT GAA GCT CCT GGT CCC AAG ACA ACT GCA GCC TAT AAT CTG GTC AAG GAA CTT CAA GCA AGA GGA ATC CGT ATC GAC GGC GTC GGT TTG GAG TCT CAT TTT GAG GTG GGA GCA ACC CCT TCC AAG GAT GCT CAG GTT GAA GCT AAA CAA GGT TTT CTT GAC CTG GGA GTA GAC GTT GTC GTT ACG GAG

TTG GAT GTC CGT TTC CCC GAG GGC CCT TTT TAC ACC GCA GCT GGA GAG AAG CAA CAG GCC CAA GAC TAT TAC GAC ACA GTT GCA AGT TGC GTA GAA GTC GGC CCC AGG TGC GTG GGC ATT ACT GTC TGG GAC TTC GAC GAC GCT TAC TCT TGG GTC CCT TCC TCC TTT CCC GGC CAA GGT GCC GCA GAC CTA TAC AAT GGT ACT TTA CAG AGG AAG CCT GCT TAC TAT GCT GTG GCA GAG GCA CTA CAA GGC GTG TCA TGC AGT GTC TGC TAA, or a fragment or variant thereof.