Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
STREPTOCOCCUS THERMOPILUS OPERONS INVOLVED IN EXOPOLYSACCHARIDE (EPS) SYNTHESIS
Document Type and Number:
WIPO Patent Application WO/2001/079500
Kind Code:
A2
Abstract:
The invention concerns eps operons involved in the biosynthesis of exopolysaccharides in lactic acid bacteria, and in particular in S. thermopilus. Sequences of said operons are useful in particular for constructing novel eps operons, and for detecting, in lactic acid bacteria, the presence of genes or gene combinations involved in the synthesis of an exopolysaccharide.

Inventors:
RALLU FABIEN (FR)
BESANCON-YOSHPE IRIS (FR)
FREMAUX CHRISTOPHE (FR)
MENGAUD JEROME (FR)
RENAULT PIERRE (FR)
Application Number:
PCT/FR2001/001199
Publication Date:
October 25, 2001
Filing Date:
April 18, 2001
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
AGRONOMIQUE INST NAT RECH (FR)
GERVAIS DANONE SA (FR)
RHODIA CHIMIE SA (FR)
RALLU FABIEN (FR)
BESANCON YOSHPE IRIS (FR)
FREMAUX CHRISTOPHE (FR)
MENGAUD JEROME (FR)
RENAULT PIERRE (FR)
International Classes:
C12N15/31; C12N15/52; C12P19/04; (IPC1-7): C12N15/31; C07H21/00; C12N15/62; C12N15/74; C12P19/04; C12Q1/68
Domestic Patent References:
WO1999062316A21999-12-09
Other References:
VAN KRANENBURG, R. ET AL.: "Functional Analysis of Glycosyltransferase Genes from Lactococcus lactis and Other Gram-Positive Cocci: Complementation, Expression, and Diversity" JOURNAL OF BACTERIOLOGY, vol. 181, 1999, pages 6347-6353, XP002182262
BOURGOIN, F. ET AL.: "Are horizontal transfers involved in the evolution of the Streptococcus thermophilus exopolysaccaride synthesis loci?" GENE, vol. 233, no. 1-2, 11 juin 1999 (1999-06-11), pages 151-161, XP004173075
XU, Y. ET AL.: "A Cluster of Genes Involved in Polysaccharide Biosynthesis from Enterococcus faecalis OG1RF" INFECTION AND IMMUNITY, vol. 66, no. 9, septembre 1998 (1998-09), pages 4313-4323, XP002182238 -& DATABASE EMBL, HEIDELBERG, R.F.A. [en ligne] 1 novembre 1998 (1998-11-01) XU, Y. ET AL.: "PUTATIVE GLYCOSYL TRANSFERASE" retrieved from ENTEROCOCCUS FAECALIS (STREPTOCOCCUS FAECALIS) Database accession no. O88080 XP002182240
PARKHILL, J. ET AL.: "The genome sequence of the food-borne pathogen Campylobacter jejuni reveals hypervariable sequences" NATURE, vol. 403, no. 6770, 10 février 2000 (2000-02-10), pages 665-668, XP000906767 -& DATABASE EMBL, HEIDELBERG, R.F.A. [en ligne] gène: Cj1438c, 10 février 2000 (2000-02-10) PARKHILL, J. ET AL.: "Campylobacter jejuni NCTC11168 complete genome; segment 5/6" Database accession no. AL139078 XP002182241
MUNOZ, R. ET AL.: "First molecular characterization of a uridine diphosphate galacturonate 4-epimerase: an enzyme required for capsular biosynthesis in Streptococcus pneumoniae type 1" MOLECULAR MICROBIOLOGY, vol. 31, no. 2, janvier 1999 (1999-01), pages 703-713, XP002182239 -& DATABASE EMBL, HEIDELBERG, R.F.A. [en ligne] 1 mai 1997 (1997-05-01) MUNOZ, R. ET AL.: "HYPOTHETICAL 40.3 KDA PROTEIN" retrieved from STREPTOCOCCUS PNEUMONIAE Database accession no. P96481 XP002182242
STINGELE, F. ET AL.: "Identification and Characterization of the eps (Exopolysaccharide) Gene Cluster from Streptococcus thermophilus Sfi6" JOURNAL OF BACTERIOLOGY, vol. 178, no. 6, mars 1996 (1996-03), pages 1680-1690, XP000579179 cité dans la demande
Attorney, Agent or Firm:
Vialle-presles, Marie-josé (6 avenue de Messine, Paris, FR)
Download PDF:
Claims:
REVENDICATIONS 1) Fragment d'acide nucléique constituant un opéron eps fonctionnel chez S. thermophilus, et caractérisé en ce qu'il comprend au moins : a) un gène epsA constitué par l'ORF epsllA de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 86% d'identité avec le produit de traduction dudit ORF ; b) un gène epsB constitué par l'ORF eps 11 B de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 94% d'identité avec le produit de traduction dudit ORF ; c) un gène epsC constitué par l'ORF epsllC de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 83% d'identité avec le produit de traduction dudit ORF ; d) un gène epsD constitué par l'ORF eps I I D de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95% d'identité avec le produit de traduction dudit ORF ; e) au moins un gène codant une undécaprényl glycosyl-
1. phosphate transférase, constitué par l'ORF epsllE de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 96% d'identité avec le produit de traduction dudit ORF. g) au moins un gène codant une glycosyltransférase choisi parmi : . l'ORF eps 1F de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 62% d'identité avec le produit de traduction dudit ORF ; . l'ORF eps 1K de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité avec le produit de traduction dudit ORF ; . l'ORF epsl 1M de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité avec le produit de traduction dudit ORF . l'ORF epsl 1Q de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.
2. Fragment d'acide nucléique selon la revendication 1, caractérisée en ce que ledit opéron eps comprend en outre au moins un gène choisi parmi : . l'ORF epsi 1 G de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité avec le produit de traduction dudit ORF ; . l'ORF eps 1H de la séquence SEQ ID N0 : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins d'identité avec le produit de traduction dudit ORF ; . l'ORF epsl 1I de la séquence SEQ ID N0 : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 50% d'identité avec le produit de traduction dudit ORF ; . l'ORF eps I I J de la séquence SEQ ID N0 : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 25% d'identité avec le produit de traduction dudit ORF. l'ORF epsl IL de la séquence SEQ ID N0 : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 35% d'identité avec le produit de traduction dudit ORF. l'ORF epsl 1N de la séquence SEQ ID N0 : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 45% d'identité avec le produit de traduction dudit ORF. l'ORF epsl 10 de la séquence SEQ ID N0 : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 25% d'identité avec le produit de traduction dudit ORF. l'ORF epsl 1P de la séquence SEQ ID N0 : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité avec le produit de traduction dudit ORF. l'ORF eps 1Q de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 50% d'identité avec le produit de traduction dudit ORF. l'ORF eps11R de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité avec le produit de traduction dudit ORF. l'ORF eps11S de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95% d'identité avec le produit de traduction dudit ORF. 1'ORF epsllT de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité avec le produit de traduction dudit ORF.
3. Fragment d'acide nucléique selon une quelconque des revendications 1 ou 2, représenté par la séquence SEQ ID NO : 16.
4. Fragment d'acide nucléique comprenant au moins une ORF telle que définie dans une quelconque des revendications 1 ou 2.
5. Utilisation d'au moins un fragment d'acide nucléique selon la revendication 4, pour l'obtention d'un opéron eps chimérique fonctionnel.
6. Vecteur recombinant, comprenant au moins un fragment d'acide nucléique selon une quclconque des revendications 1 à @ 5.
7. Cellule transformée par au moins un fragment d'acide nucléique selon une quelconque des revendications 1 à 7.
8. Utilisation d'au moins un fragment d'acide nucléique selon une quelconque des revendications) a 4 pour la production d'un EPS.
9. Procédé de sélection d'au moins un oligonucléotide permettant la détection n spécifique d'un gène d'un opéron eps présent dans une souche de S. thermophilus. caractérisé en ce qu'il comprend : a) l'alignement des ORFs présentes sur la séquence SEQ ID NO:16 avec les ORFs présentes sur les séquences SEQ ID NO : 9 à 15, entre elles et, éventuellement avec des ORFs des opérons eps de types I, II et VIII; b) l'identificatic on, dans au moins une des ORFs alignées, d'au moins une portio de taille supérieure à 12 pb, et de préférence comprise entre 15 et 50 pb, présentant titic homologie inféricure à 80%, et de préférence inférieure à 50% avec les autres séquences.
10. Oligonucléotide spécifique d'un gène d'un opéron eps, susceptible d'être obtenu par le procédé selon la revendication 9, 11) Procédé de sélection d'un couple d'amorces oligonucléotidiques permettant la détection spécifique du type d'opéron eps présent dans une souche de S. thermophilus, earactérisé en ce qu'il comprend : a) l'alignement des séquences idetifiées dans la liste de séquences en annexe sous les numéros éseq id no:1 à 8 ou SEQ ID NO:9 à 16, entre elles et, éventuellement avec des séquences d'autres opérons eps ; b) l'idendficatton, dans la séquence représentant le type d'opéron eps que l'on souhaite détecter d'au moins une région spécifique, par sa taille et/ou sa séquence, dudit operon ; C l'identification d'amorces permettant d'obtenir l'amplification spécifique de ladite région.
11. Couple d'amorces nucléotidiques permettant la détection du type d'opéron eps présent dans uuc souche de S. thermophilus, susceptibles d'être obtenucs par un procède selon la a revendication 11.
12. Utilisation d'au moins un oligonucléotide selon la revendication 10, ou d'un couple d'amorces selon la revendication 12, pour la détermination du type d'EPS produit par une souche de S. thermophilus.
Description:
OPERONS DE STREPTOCOCCUS THERMOPHILUS IMPLIQUES DANS LA SYNTHESE DES EPS L'invention est relative au contrôle et à l'optimisation de la production d'exopolysaccharides par des bactéries lactiques.

Les exopolysaccharides (EPS) sont des polysaccharides extracellulaires, produits et relargués dans le milieu par de nombreuses espèces bactériennes. Ils résultent de la polymérisation d'une unité répétitive de sucres.

Les exopolysaccharides produits par les bactéries lactiques jouent un rôle majeur dans l'élaboration de la texture, de la perception en bouche et de la rhéologie des produits fermentes. Par exemple, dans le cadre de la fabrication des yaourts, des EPS produits par Streptococcus thermophilus jouent un rôle d'épaississant, et permettent en outre de conférer au produit final un caractère filant et/ou une texture crémeuse, appréciés des consommateurs.

En outre, il a été observé que certains EPS possédaient des activités biologiques par lesquelles ils pourraient exercer divers effets bénéfiques sur la santé.

Toutefois, la production des EPS par les bactéries lactiques est très variable quantitativement et/ou qualitativement, non seulement d'une espèce à l'autre, mais également d'une souche à l'autre au sein d'une même espèce. En outre, même dans le cas des souches productrices d'EPS, cette production est très instable, et peut varier considérablement au cours de la culture et de la fermentation, ce qui aboutit. à une variation qualitative et/ou quantitative du contenu en EPS des produits fermentes, rendant problématique l'obtention d'une qualité constante. Ceci oblige les industriels à effectuer des contrôles permanents de la capacité des souches qu'ils utilisent à produire des EPS.

Il apparaît donc souhaitable de disposer d'outils permettant de mieux contrôler et d'optimiser la production d'EPS par les bactéries lactiques. Dans ce but différentes équipes ont entrepris de rechercher les fonctions enzymatiques impliquées dans la synthèse des EPS, et les gènes correspondants.

Les observations effectuées jusqu'à présent par montrent que les gènes impliqués dans la synthèse d'un polysaccharide extracellulaire sont regroupés au sein d'un opéron (opéron eps).

Plusieurs opérons eps ont précédemment été mis en évidence chez des bactéries lactiques [pour revue, cf. DE VUYST, et DEGEEST, FEMS Microbiology Reviews, 23, 153-177, (1999)]. Par exemple, dans le cas de S thermophilus, on citera notamment l'opéron de S. tliermophilus Sfi6 [STINGELE et al., J. Bacteriol., 178, 1680- 1690, (1996) ; Demande EP 750043 au nom de SOCIETE DES PRODUITS NESTLE], celui de S. thermophilus CNRZ368 [BOURGOIN et al., Gene, 233, 151-161, (1999)], ou celui de S. thermophilus Sfi39 [Demande EP 9575168 au nom de SOCIETE DES PRODUITS NESTLE].

La comparaison des différents opérons eps connus fait apparaître une organisation très conservée.

Le groupe de gènes dénomme epsABCD situé au début de l'opéron code des protéines (EpsA, EpsB, EpsC, et EpsD) fortement homologues d'un opéron eps à un autre. La protéine EpsA possède vraisemblablement une fonction de régulation de la production d'EPS ; les protéines EpsC et EpsD apparaissent impliquées dans la polymérisation des unités répétitives de base et leur exportation ; la fonction de la protéine EpsB n'a pour l'instant pas été élucidée. Le groupe epsABCD est suivi d'une séquence au niveau de laquelle on observe également une très forte homologie entre les différents opérons eps connus ; cette séquence code une protéine qui est vraisemblablement une glycosyl-1-phosphate transférase, impliquée dans la première étape de la synthèse de l'unité de base. La région suivante de l'opéron est plus variable ; elle comprend des ORFs codant probablement les différentes glycosyltransfërases impliquées dans l'assemblage des sucres formant l'unité répétitive de base. A la fin de certains opérons eps ont été localisés des ORFs codant des protéines potentiellement impliquées dans le transport de l'unité répétitive dans le milieu extracellulaire.

Les Inventeurs ont maintenant mis en évidence et isolé huit nouveaux opérons impliqués dans la biosynthèse d'EPS chez S. thermophilus. L'analyse structurale de ces opérons montre qu'ils possèdent une organisation similaire à celle des opérons eps déjà connus, et qu'ils comprennent : a) des ORFs (open reading frame = cadre ouvert de lecture) dont le produit de traduction possède une homologie importante (identité supérieure ou égale à 80%) avec celui d'ORFs impliqués dans la synthèse des exopolysaccharides ou de polysaccharides de capsule chez des bactéries gram+, notamment les protéines EpsA-D de S. tlzermophilus, la protéine EpsE de S. salivarius ; b) des ORFs dont le produit de traduction est apparenté (identité supérieure ou égale à 20% et inférieure à 80%) avec celui d'ORFs impliqués dans la synthèse des exopolysaccharides ou de polysaccharides de capsule chez des bactéries gram+ ; il s'agit principalement d'ORFs codant pour des glycosyltransférases. c) des ORFs dont le produit de traduction possède une homologie importante (identité supérieure ou égale à 80%) avec des transposases connues de Streptococcus thermophilus.

Le pourcentage d'identité d'une séquence avec une séquence de référence est défini ici comme le pourcentage de résidus de cette séquence qui sont identiques avec ceux de la séquence de référence lorsque les 2 séquences sont alignées pour une correspondance maximale entre les positions des résidus. Un polypeptide dont la séquence en acides aminés possède au moins X% d'identité avec une séquence de référence peut ainsi comprendre jusqu'à 100-X modifications pour 100 acides aminés de la

séquence de référence. Ces modifications incluent la délétion, la substitution, ou l'insertion de résidus d'acides aminés, consécutifs ou non.

Les caractéristiques respectives de chacun des opérons eps de S thermophilus caractérisés par les Inventeurs sont décrites plus en détail ci-après. Les tableaux I à IX résument les caractéristiques des ORFs identifiés sur chaque opéron. Dans chaque tableau, la dénomination donnée à chaque ORF est mentionnée dans la lere colonne (ORF) ; la position de la région comprenant cet ORF (par rapport à la séquence de l'opéron telle qu'indiquée dans la liste de séquences) est mentionnée dans les deuxième et troisième colonnes (Position) ; la fonction putative de la protéine correspondante est mentionnée dans la quatrième colonne (Fonction putative).

La figure 1 schématise la structure des opérons conformes à l'invention (Types III, IV, V, VI, VII, IX, X, et XI) ainsi que la structure de 3 opérons de S thermophilus décrits dans l'art antérieur, dans la Demande PCT WO 99/62316 (dénommé ici « opéron de Type I »), par STINGELE et al. (dénommé ici « opéron de Type II »), et par BOURGOIN et al. (dénommé ici « opéron de Type VIII ») L'opéron dénommé « opéron de type III » est localisé sur une séquence de environ d'ADN chromosomique de la souche de Streptococcus thermophilus déposée selon le traité de Budapest le 5 avril 2000 par la société RHODIA FOOD S. A. S., Z. A. de Buxières, 86220 DANGE-SAINT-ROMAIN, auprès de la C. N. C. M. (Collection Nationale de Cultures de Microorganismes, 28 rue du Docteur Roux, 75724 Paris CEDEX 15, France), sous le numéro 1-2425.

Une séquence partielle de ce fragment de 13 kb est représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO : I ; la séquence complète de l'opéron de type III porté par ce fragment est représentée sous le numéro SEQ ID NO : 9.

Les positions et les caractéristiques des ORFs identifiés sur cette séquence sont indiqués dans le tableau I ci-après.

Tableau I ORF Position sur Position sur Fonction putative SEQ ID NO : 1 SEQ ID NO : 9 eps3A 2-622 828-2288 Régulation eps3B637-13622289-3020inconnue eps3C 1366-2823 3029-3721 Polymérisation/export eps3D 3162-3650 3731-4489 Polymerisation/export eps3E 3806-4556 4546-5913 Undecaprenyl P-glucosyl transférase eps3F 4679-5878 6275-7644 Glycosyltransférase (Codon stop à 7262 eps3G 6569-7018 7682-8131 beta-1, 4-galactosyltransferase enhancer eps3H 7024-7299 8131-8637 Galactosyl transferase eDs31 7606-8076 8633-9358 Inconnue eps3J 8313-8878 9374-10474 Biosynthèse des polysaccharides de capsule eps3K 8929-9416 10669-11166 Glucosyl transférase eps3L 11191-12093 Inconnue eps3M 12109-13179 Undécaprényl-phosphate galactosyl transferase eps3N 13208-14446 Polysaccharide polymérase eps30 14439-15479 Inconnue orf14. 9 9443-9880 17075-16503 Inconnue

L'opéron dénommé < opéron de type IV » est localisé sur une séquence de 16 kb environ d'ADN chromosomique de la souche de Streptococcus thermophilus déposée selon le traité de Budapest le 5 avril 2000 par la société RHODIA FOOD S. A. S., Z. A. de Buxières, 86220 DANGE-SAINT-ROMAIN, auprès de la C. N. C. M. (Collection Nationale de Cultures de Microorganismes, 28 rue du Docteur Roux, 75724 Paris CEDEX 15, France), sous le numéro 1-2432.

Une séquence partielle de ce fragment de 16 kb est représentée dans la liste de séquences en annexe sous le numéro SEQIDNO : 2 ; la séquence complète de l'opéron de type IV porté par ce fragment est représentée sous le numéro SEQ ID NO : 10.

Les positions et les caractéristiques des ORFs identifiés sur cette séquence sont indiqués dans le tableau II ci après.

Tableau II Position sur Position sur SEQ ID NO : 2 SEQ ID NO : 10 eps4A 825-2210 841-2319 Régulation eps4B 2285-3010 2320-3051 Inconnue eps4C 3022-3714 3060-3752 Polymérisation/export eps4D 3727-4362 3762-4499 Polymerisation/export eps4E 4381-5097 4558-5925 Undécapréyl-P glucosyl transférase eps4F 5100-5586 6733-7905 Glycosyl transférase eps4G 6063-6432 8000-8731 Glycosyl transférase eps4H 6458-6887 8750-9475 Sucre nucléotide phosphorylase eps4I 6902-7873 9486-10541 Sucre nucléotide déhydratase eps4J 8273-9106 10555-11499 Glucosyl transférase eps4K 10032-10424 11524-12678 Inconnue eps4L 10942-11448 12680-13837 Inconnue eps4M 11483-11803 14342-14770 Inconnue eps4N 11852-12518 14797-15981 Polymerase IS1194 17145-16129 Transposase eps40 17945-19375 Transporteur eps4P 19731-20654 _ Inconnue eps4Q 21569-20679 Inconnue IS1191 12543-12969 21592-22767 Transposase ISS1S 14307-14753 23709-24023 Transposase orf14. 9 14905-15204 24741-2416 Inconnue L'opéron dénommé « opéron de type V » est localisé sur une séquence de 14 kb environ d'ADN chromosomique de la souche de Streptococcus thermophilus déposée selon le traité de Budapest le 5 avril 2000 par la société RHODIA FOOD S. A. S., Z. A. de Buxières, 86220 DANGE-SAINT-ROMAIN, auprès de la C. N. C. M. (Collection Nationale de Cultures de Microorganismes, 28 rue du Docteur Roux, 75724 Paris CEDEX 15, France), sous le numéro I-2431.

Une séquence partielle de ce fragment de 14 kb est représentée dans la liste de séquences en annexe sous le numéro SEQ ID N0 : 3 ; la séquence complète de l'opéron de type V porté par ce fragment est représentée sous le numéro SEQ ID NO : 11.

Les positions et les caractéristiques des ORFs identifiés sur cette séquence sont indiqués dans le tableau III ci après.

Tableau III Position sur Position sur SEQ ID NO:3 SEQ ID NO:11 eps5A 845-2302 863-2323 Regulation eps5B 2306-3031 2324-3055 Inconnue eps5C 3043-3735 3064-3756 Polymerisation/export eps5D 3738-4376 3766-4506 Polymérisation/export eps5E 4545-5639 4564-5931 Undécaprenyl P-lucosyl transferase eps5F 5937-7112 5964-7136 Rhamnosyl transferase eps5G 7112-7330 7139-8284 Glycosyl transférase eps5H 8225-9088 8396-8947 Inconnue eps51 10742-11568 8972-9946 Glycosyl transférase eps5J 10127-10855 Galactosyl transferase eps5K 11107-12036 Rhamnosyl transférase eps5L 12138-13517 Polymérase eps5M 13653-14714 Undécaprényl P-galactosyl transférase eps5N 14711-16135 Transporteur eps50 16379-17248 Glucose-1-phosphate thymidylyl transférase IS1193 11924-13240 18526-17417 Transposase orf14. 9 13321-14100 18822-19394 Inconnue L'opéron dénommé « opéron de type VI » est localisé sur une séquence de 20 kb environ d'ADN chromosomique de la souche de Streptococcus thermophilus déposée le 24 février 1999 selon le traité de Budapest auprès de la C. N. C. M. (Collection Nationale de Cultures de Microorganismes, 28 rue du Docteur Roux, 75724 Paris CEDEX 15, France), sous le numéro 1-2130.

Une séquence partielle de ce fragment de 20 kb est représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO : 4 ; la séquence complète de l'opéron de type VI porté par ce fragment est représentée sous le numéro SEQ ID NO : 12.

Les positions et les caractéristiques des ORFs identifiés sur cette séquence sont indiqués dans le tableau IV ci après.

Tableau IV

ORF Position sur Position sur Fonction putative SEQ ID NO : 4 SEQ ID NO:12 eps6A 843-2300 869-2329 Regulation eps6B 2304-3032 2330-3061 Inconnue eps6C 3041-3730 3070-3762 Polymerisation/export eps6D 3746-4483 3772-4512 Polymérisation/export eps6E 4543-5907 4569-5936 Undécaprényl P-glucosyl transférase eps6F 5943-7118 5969-7141 Rhamnosyl transferase eps6G 7328-8473 7144-8496 Rhamnosyl transférase eps6H 8473-9561 8499-9647 N-acétylglucosamine transférase eps6I 11217-12110 10111-10746 Inconnue eps6J 1221j3-12974 11216-12202 N-acétylglucosamine transférase eps6K 14475-15887 1221j2-13204 N-acétylglucosamine transférase eps6L 15889-16971 13383-14399 Inconnue eps6M 171131-18060 14449-15864 Transporteur eps6N 15875-16972 UDP-galactopyranose mutase eps60 16988-18040 Galf transférase orf14. 9 18162-18443 18138-18447 lnconnue L'opéron dénommé « opéron de type VII » est localisé sur une séquence de 16 kb environ d'ADN chromosomique de la souche de Streptococcus thermophilus

déposée selon le traité de Budapest le 5 avril 2000 par la société RHODIA FOOD S. A. S., Z. A. de Buxières, 86220 DANGE-SAINT-ROMAIN, auprès de la C. N. C. M. (Collection Nationale de Cultures de Microorganismes, 28 rue du Docteur Roux, 75724 Paris CEDEX 15, France), sous le numéro I-2429 ; d'autres souches de Streptococcus thermophilus contenant cet opéron ont également été déposées selon le traité de Budapest par la société RHODIA FOOD S. A. S., Z. A. de Buxières, 86220 DANGE-SAINT-ROMAIN, auprès de la C. N. C. M. le 5 avril 2000, sous les numéros I-2430 et I-2437.

Une séquence partielle de ce fragment de 16 kb est représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO : 5 ; la séquence plus complète de l'opéron de type VII porté par ce fragment est représentée sous le numéro SEQ ID NO : 13.

Les positions et les caractéristiques des ORFs identifiés sur cette séquence sont indiqués dans le tableau V ci après.

Tableau V ORF Position sur Position sur Fonction putative SEQ ID NO:5 SEQ ID NO:13 eps7A 886-2320 846-2306 Regulation eps7B 2327-3052 2307-3038 Inconnue eps7C 3064-3756 3047-3739 Polymérisation/export eps7D 3769-4410 3749-4507 Polymérisationlexport eps7E 4502-5056 4564-5931 Undécaprényl P-lucosyl transférase ISS1S 6564-6193 Transposase IS1163 7515-8399 Transposase eps7F 5569-5573 8866-9849 Glycosyl transferase IS1163 10232-11000 Transposase eps7U 11854-112269 Inconnue IS1193 13956-14285 113686-112631 Transposase orf14. 9 Inconnue L'opéron dénommé « opéron de type IX » est localisé sur une séquence de 12, 5 kb environ d'ADN chromosomique de la souche de Streptococcus thermophilus déposée selon le traité de Budapest le 5 avril 2000 par la société RHODIA FOOD S. A. S., Z. A. de Buxières, 86220 DANGE-SAINT-ROMAIN, auprès de la C. N. C. M. (Collection Nationale de Cultures de Microorganismes, 28 rue du Docteur Roux, 75724 Paris CEDEX 15, France), sous le numéro 1-2427.

Une séquence partielle de ce fragment de 12, 5 kb est représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO : 6 ; la séquence complète de l'opéron de type IX porté par ce fragment est représentée sous le numéro SEQ ID NO : 14.

Les positions et les caractéristiques des ORFs identifiés sur cette séquence sont indiqués dans le tableau VI ci après.

Tableau VI Position sur Position sur SEQ ID NO : 6 SEQ ID NO : 14 eps9A 831-2287 865-2325 Régulation eps9B 2291-3017 2326-3057 Inconnue eps9C 3029-3721 3066-3758 Polymérisation/export eps9D 3734-4470 3768-4514 Polymerisation/export eps9E 4534-5106 4566-5933 Undécaprényl P-glucosyl transférase eps9F 6319-6999 5965-7137 Rhamnosyl transferase eps9G 7025-7519 7140-8288 N-acétylglucosamine transférase eps9H 8293-9260 8953-9927 Glucosyl transférase eps91 9421-10529 10109-10435 Glucosyl transferase eps91'10499-10837 (codon stop dans le gène) eps9J 10623-11027 11089-12027 Rhamnosyi transférase eps9K 11057-11959 12024-13100 Undécaprényl P-galactosyl transférase eps9L 13102-14214 Polymérase eps9M 14256-15683 Transporteur eps9N 15724-16593 Glucose-1-P thymidil l transférase IS1193 17282-16656 Transposase orf14. 9 Inconnue L'opéron dénommé « opéron de type X » est localisé sur une séquence de 15, 5 kb environ d'ADN chromosomique de la souche de Streptococcus thermophilus déposée selon le traité de Budapest le 5 avril 2000 par la société RHODIA FOOD S. A. S., Z. A. de Buxières, 86220 DANGE-SAINT-ROMAIN, auprès de la C. N. C. M. (Collection Nationale de Cultures de Microorganismes, 28 rue du Docteur Roux, 75724 Paris CEDEX 15, France), sous le numéro 1-2428.

Une séquence partielle de ce fragment de 15, 5 kb est représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO : 7 ; la séquence complète de l'opéron de type X porté par ce fragment est représentée sous le numéro SEQ ID NO : 15.

Les positions et les caractéristiques des ORFs identifiés sur cette séquence sont indiqués dans le tableau VII ci après.

Tableau VII Position sur Position sur ORF Fonction putative SEQ ID NO:7 SEQ ID NO:15 eps10A 1152-2572 868-2328 Régulation eps10B 2576-3292 2329-3060 Inconnue eps10C 3313-4005 3069-3761 Polymerisation/export eps10D 4037-4661 3771-4511 Polymerisation/export eps10E 4822-6080 4569-5936 Undécaprényl P-lucosyi transférase eps10F 6116-6679 5969-7141 Rhamnosyl transferase eps10G7180-82867138-8409tnconnue eps10H 8369-9470 8893-9894 Galactosyl transférase eps101 9508-10482 9913-10890 Inconnue eps10J 10903-11931 Inconnue eps10K 11928-13148 Polysaccharide polymérase eps10L 13145-14560 Transporteur eps10M 14571-15641 UDP-galactopyranose mutase eps10N 15715-16671 Galactosyl transférase IS1191 11479-11703 16803-17978 Transposase eps100 18062-19069 Transporteur IS153 12875-13503 19142-19405 Transposase eps10P 19583-20713 Glucosyl transferase eps10Q 20800-21201 iNCONNUE eps10R 22308-21754 Inconnue eps10S23168-22680inconnue IS1221 24358-25299 Transposase IS1193 14221-14975 27064-25985 Transposase orf14. 9 27798-27223 Inconnue L'opéron dénommé « opéron de type XI » est localisé sur une séquence de 14, 5 kb environ d'ADN chromosomique de la souche de Streptococcus thermophilus déposée le 22 septembre 1994 selon le traité de Budapest auprès de la C. N. C. M. (Collection Nationale de Cultures de Microorganismes, 28 rue du Docteur Roux, 75724 Paris CEDEX 15, France), sous le numéro 1-1477.

Une séquence partielle de ce fragment de 14, 5 kb est représentée dans la liste de séquences en annexe sous le numéro SEQIDNO : 8 ; la séquence complète de l'opéron de type XI porté par ce fragment est représentée sous le numéro SEQ ID NO : 16.

Les positions et les caractéristiques des ORFs identifiés sur cette séquence sont indiqués dans le tableau VIII ci après.

Tableau VIII Position sur Position sur SEQ ID NO : 8 SEQ ID NO:16 eps11 A 793-1985 862-2322 Regulation eps11 B 2002-2670 2323-3054 Inconnue eps11 C 2670-2852 3063-3755 Polymérisation/export eps11 D 3498-3538 3765-4508 Polymerisation/export eps11E 3660-4694 4566-5933 Undécaprényl P-glucosyl transférase eps11 F 5171-5773 5966-6409 Rhamnosyl transferase eps11G 5901-6046 6531-7454 Epimérase eps11H 7767-8093 7483-8757 UDP-Glucose-6-déhydratase eps111 8612-9055 9132-9971 Hexose-epimerase eps11J 11470-12637 9988-10980 Inconnue eps11K 11552-12307 Glycosyl transférase eps11L 12361-12852 Acétyl transférase eps11 M 12849-13562 Glucosyl transférase eps11 N 13587-14432 Inconnue eps11 0 14395-15579 Polvmérase eps11P 15592-16527 Inconnue eps11 Q 16466-17830 Glycosyl transférase eps11 R 17846-19348 Transporteur IS1194 13984-14226 20519-19521 Transposase eps11S 21266-21637 Inconnue eps11T21996-21652tnconnue IS1191 14226-14378 Transposase

La présente invention fournit donc de nouveaux gènes et/ou de nouvelles combinaisons de gènes impliqués dans la biosynthèse des EPS chez les bactéries lactiques, et notamment chez S. thermophilus. Ces gènes et/ou combinaisons de gènes peuvent être utilisés pour optimiser la production d'EPS chez des bactéries lactiques, en particulier chez S thermophilus. Par exemple, on peut exprimer chez une bactérie hôte un ou plusieurs des nouveaux opérons eps de S. thermophilus décrits ci-dessus, afin de produire le ou les EPS associé (s) à cet ou ces opéron (s). On peut également, à partir des nouveaux gènes impliqués dans la synthèse des EPS mis en évidence par les Inventeurs, construire par recombinaison génétique des opérons eps fonctionnels permettant la synthèse de nouveaux EPS.

Au sens de la présente invention on entend par opéron eps fonctionnel, une séquence d'acide nucléique constituant une unité de transcription comprenant au moins, : -un groupe de gènes epsABCD, tel que défini ci-dessus ; -au moins un gène codant une undécaprényl glycosyl-1-phosphate transférase ; -un ou plusieurs gènes codant une glycosyltransférase ; -généralement, un ou plusieurs gènes codant une protéine impliquée dans le transport d'un EPS dans le milieu extracellulaire.

Eventuellement, ledit opéron EPS peut comprendre en outre un ou plusieurs gènes codant une protéine intervenant dans la modification des sucres précurseurs d'un l'EPS.

La présente invention a pour objet un fragment d'acide nucléique constituant un opéron eps fonctionnel chez S. thermophillls, et caractérisée en ce qu'elle comprend au moins : a) un gène epsA choisi parmi : -l'ORF eps3A de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 87% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4A de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 92% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epsSA de la séquence SEQ ID NO : 3 ou de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 87% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6A de la séquence SEQ ID NO : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 87% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps7A de la séquence SEQ ID NO : 5 ou de la séquence SEQ ID NO : 13 ou tout fragment d'acide nucléique codant une protéine présentant au moins 87% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9A de la séquence SEQ ID NO : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 86% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOA de la séquence SEQ ID NO : 7 ou de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 86%

d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epsl 1A de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 86% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; et/ou un gène epsB choisi parmi : -l'ORF eps3B de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 92% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4B de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 92% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epsSB de la séquence SEQ ID NO : 3 ou de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 92% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6B de la séquence SEQ ID NO : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 92% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps7B de la séquence SEQ ID NO : 5 ou de la séquence SEQ ID NO : 13 ou tout fragment d'acide nucléique codant une protéine présentant au moins 92% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9B de la séquence SEQ ID NO : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 91% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOB de la séquence SEQ ID NO : 7 ou de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 91% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ;

-l'ORF epsl 1B de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 91% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; et/ou un gène epsC choisi parmi : -l'ORF eps3C de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 88% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4C de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 89% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epsSC de la séquence SEQ ID NO : 3 ou de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 88% d'identité, de de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6C de la séquence SEQ ID NO : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 88% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps7C de la séquence SEQ ID NO : 5 ou de la séquence SEQ ID NO : 13 ou tout fragment d'acide nucléique codant une protéine présentant au moins 88% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9C de la séquence SEQ ID NO : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 77% d'identité, de préférence au moins 80% d'identité, avantageusement au moins 90% d'identité, et de manière tout à fait préférée au moins de 95% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOC de la séquence SEQ ID NO : 7 ou de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 77%

d'identité, de préférence au moins 80% d'identité, avantageusement au moins 90% d'identité, et de manière tout à fait préférée au moins de 95% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps 1C de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 77% d'identité, de préférence au moins 80% d'identité, avantageusement au moins 90% d'identité, et de manière tout à fait préférée au moins de 95% à 99% d'identité, avec le produit de traduction dudit ORF ; et/ou un gène epsD choisi parmi : -l'ORF eps3D de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 86% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4D de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 90% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epsSD de la séquence SEQ ID N0 : 3 ou de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 86% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6D de la séquence SEQ ID NO : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 86% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps7D de la séquence SEQ ID NO : 5 ou de la séquence SEQ ID NO : 13 ou tout fragment d'acide nucléique codant une protéine présentant au moins 86% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9D de la séquence SEQ ID NO : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ;

-l'ORF epslOD de la séquence SEQ ID NO : 7 ou de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; -1'ORF eps ID de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; et/ou au moins un gène codant une glycosyl-1-phosphate transférase choisi parmi : -l'ORF eps3E de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 87% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps3M de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4E de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 94% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epsSE de la séquence SEQ ID NO : 3 ou de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 96% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps5M de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -1'ORF eps6E de la séquence SEQ ID NO : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 93% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps7E de la séquence SEQ ID NO : 5 ou de la séquence SEQ ID NO : 13 ou tout fragment d'acide nucléique codant une protéine présentant au moins 93%

d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9E de la séquence SEQ ID NO : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 96% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9K de la séquence SEQ ID NO : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 65% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epsIOE de la séquence SEQ ID NO : 7 ou de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 96% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps I I E de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 96% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; et/ou au moins un gène codant une glycosyltransférase choisi parmi : -l'ORF eps3F de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 82% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps3H de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité, au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps3K de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 32% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4F de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 92%

d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4G de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 92% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4J de la séquence SEQ ID N0 : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps5F de la séquence SEQ ID N0 : 3 ou de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 74% d'identité, de préférence au moins 80% d'identité, avantageusement au moins 90% d'identité, et de manière tout à fait préférée au moins de 95% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps5G de la séquence SEQ ID N0 : 3 ou de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 38% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps51 de la séquence SEQ ID N0 : 3 ou de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 87% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps5J de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps5K de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps50 de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ;

-l'ORF eps6F de la séquence SEQ ID N0 : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 78% d'identité, de préférence au moins 80% d'identité, avantageusement au moins 90% d'identité, et de manière tout à fait préférée au moins de 95% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6G de la séquence SEQ ID N0 : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 74% d'identité, de préférence au moins 80% d'identité, avantageusement au moins 90% d'identité, et de manière tout à fait préférée au moins de 95% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6H de la séquence SEQ ID N0 : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6J de la séquence SEQ ID N0 : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6K de la séquence SEQ ID N0 : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, de préférence au moins 80% d'identité, avantageusement au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -1'ORF eps60 de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps7F de la séquence SEQ ID NO : 5 ou de la séquence SEQ ID NO : 13 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9F de la séquence SEQ ID N0 : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 54% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ;

-l'ORF eps9G de la séquence SEQ ID N0 : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 38% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9H de la séquence SEQ ID N0 : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 81% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps91 de la séquence SEQ ID N0 : 6 ou l'ORF eps91 + I'de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9J de la séquence SEQ ID NO : 6 ou de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 77% d'identité, de préférence au moins 80% d'identité, avantageusement au moins 90% d'identité, et de manière tout à fait préférée au moins de 95% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9N de la séquence SEQ ID N0 : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOF de la séquence SEQ ID NO : 7 ou de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 77% d'identité, de préférence au moins 80% d'identité, avantageusement au moins 90% d'identité, et de manière tout à fait préférée au moins de 95% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOH de la séquence SEQ ID N0 : 7 ou de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 94% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslON de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -1'ORF epslOP de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au

moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF cps I I F de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 62% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 95% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps 11 K de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF eps 11 L de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 35% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF epsl 1M de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF epsllQ de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

Selon un mode de réalisation préféré de la présente invention, ledit opéron eps comprend en outre au moins un gène choisi parmi : -l'ORF eps3G de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 67% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps3I de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 27% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps3J de la séquence SEQ ID NO : 1 ou de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 46% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80%

d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps3L de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps3N de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps30 de la séquence SEQ ID NO : 9 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -1'ORF eps4H de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 90% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps41 de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 96% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4K de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4L de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 28% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4M de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 84% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4N de la séquence SEQ ID NO : 2 ou de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95%

d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps40 de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4P de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps4Q de la séquence SEQ ID NO : 10 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps5H de la séquence SEQ ID N0 : 3 ou de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 36% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -1'ORF epsSL de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 87% d'identité, de préférence au moins 90% d'identité, avantageusement au moins 95% d'identité, et de manière tout à fait préférée au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps5N de la séquence SEQ ID NO : 11 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -I'ORF eps61 de la séquence SEQ ID N0 : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 40% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6L de la séquence SEQ ID N0 : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 93% d'identité, de préférence au moins 95% d'identité, et avantageusement au moins 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6M de la séquence SEQ ID N0 : 4 ou de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 40%

d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps6N de la séquence SEQ ID NO : 12 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière'tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps7U de la séquence SEQ ID NO : 13 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9L de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps9M de la séquence SEQ ID NO : 14 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOG de la séquence SEQ ID NO : 7 ou de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 57% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOI de la séquence SEQ ID NO : 7 ou de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 32% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -1'ORF epslOJ de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOK de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ;

-l'ORF epslOL de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOM de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps 100 de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps 1 OQ de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -1'ORF eps I OR de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epslOS de la séquence SEQ ID NO : 15 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epsl 1G de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF epsl 1H de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 60% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ; -l'ORF eps I I I de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 50% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF ;

-l'ORF eps 11 J de la séquence SEQ ID NO : 8 ou de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 25% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF epsl 1N de la séquence SEQ ID N0 : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 45% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF eps 110 de la séquence SEQ ID N0 : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 25% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF epsl 1P de la séquence SEQ ID N0 : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF eps 1Q de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 50% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF eps 11 R de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 30% d'identité, de préférence au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF eps 11 S de la séquence SEQ ID NO : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 95% d'identité, de préférence au moins 99% d'identité, avec le produit de traduction dudit ORF.

-l'ORF epsl 1T de la séquence SEQ ID N0 : 16 ou tout fragment d'acide nucléique codant une protéine présentant au moins 70% d'identité, avantageusement au moins 80% d'identité, et de manière tout à fait préférée au moins 90% à 99% d'identité, avec le produit de traduction dudit ORF.

La présente invention englobe en particulier tout opéron eps porté par l'un des fragments d'acide nucléique identifiés dans la liste de séquences sous les numéros SEQ ID NO : 1 à SEQ ID NO : 8 ou SEQ ID NO : 9 à SEQ ID NO : 16.

La présente invention a également pour objet : -tout fragment d'acide nucléique isolé essentiellement constitué par un ORF choisi parmi eps3A, eps3B, eps3C, eps3D, eps3E, eps3F, eps3G, eps3H, eps31, eps3J,

eps3K, eps3L, eps3M, eps3N, eps30, eps4A, eps4B, eps4C, eps4D, eps4E, eps4F, eps4H, eps4I, eps4J, eps4K, eps4L, eps4M, eps4N, eps40, eps4P, eps4Q, eps5A, epsSB, eps5C, epsSD, eps5E, eps5F, eps5G, eps5H, eps51, eps5J, eps5K, eps5L, eps5M, eps5N, eps50. eps6A, eps6B, eps6C, eps6D, eps6E, eps6F, eps6G, eps6H, eps6I, eps6J, eps6K, eps6L, eps6M, eps6N, eps60, eps7A, eps7B, eps7C, eps7D, eps7E, eps7F, eps7U, eps9A, eps9B, eps9C, eps9D, eps9E"eps9F, eps9G, eps9H, eps91, eps9J, eps9K,, eps9L, eps9M, eps9N, <BR> <BR> <BR> epsiOA, epslOB, epslOC, epslOD, epslOE, epslOF, epslOG, epslOH, epslOI, epslOJ, epslOK, epslOL, epslOM, epslON, epslOO, epslOP, epslOQ, epslOR, epslOS, epsllA. eps11B, eps11C, eps11D, eps11E, eps11F, eps11G, eps11H, eps11I, eps11J, eps11K, epsllL, epsllM, epsllN, epsllO, epsllP, epsllQ, epsllR, epsllS, epsllT, définis ci- dessus, ou une séquence codant une protéine présentant avec le produit de traduction dudit ORF, le pourcentage d'identité défini ci-dessus, et impliquée dans la synthèse des EPS ; -l'utilisation d'au moins un fragment d'acide nucléique tel que défini ci dessus, pour l'obtention d'un opéron eps chimérique fonctionnel. Dans ce cadre, ledit fragment sera utilisé en combinaison avec d'autres ORFs provenant d'un ou plusieurs opéron (s) eps. Il peut s'agir de fragments d'acide nucléique conformes à l'invention, et/ou de fragments d'acide nucléiques portant des ORFs provenant d'autres opérons eps.

L'expression, dans une cellule-hôte, par exemple dans une bactérie lactique, et notamment chez S. thermophilus, d'un opéron eps conforme à l'invention, permet de produire l'EPS correspondant. On peut également, si on le souhaite, exprimer au lieu d'un opéron eps complet, seulement un ou plusieurs des gènes intervenant dans la synthèse de 1'EPS, notamment parmi ceux codant les glycosyltransférases, notamment afin de produire par génie génétique les protéines correspondantes, qui peuvent ensuite être utilisées, par exemple, pour la synthèse de polysaccharides.

Dans tous les cas 1'expression d'un fragment d'acide nucléique conforme à l'invention peut s'effectuer selon les méthodes classiques, connues en elles-même de l'homme de l'art.

De manière générale, on construira un vecteur recombinant comprenant un fragment d'acide nucléique associé à des séquences de contrôle de la transcription et de la traduction appropriées. Le vecteur dans lequel on effectue l'insertion du fragment d'acide nucléique conforme à l'invention, ainsi que les séquences permettant de contrôler son expression seront choisis par exemple en fonction de la cellule-hôte sélectionnée et/ou du type (par exemple expression constitutive ou expression conditionnelle) et du niveau d'expression que l'on souhaite obtenir ; de nombreux vecteurs, et de nombreuses séquences de contrôle de l'expression, utilisables dans une variété de cellules-hôtes, sont connues en elles-mêmes.

Avantageusement, ces séquences de contrôle de 1'expression peuvent être celles d'un opéron eps, et notamment les séquences des promoteurs des opérons eps de

type III, IV, V, VI, VII, IX, X, et XI conformes à l'invention. En effet, les Inventeurs ont constaté que la quantité d'EPS produit variait d'une souche à l'autre, et on émis l'hypothèse que cette variation pourrait être due, au moins en partie, à la transcription de l'opéron eps. Ils ont d'autre part constaté que le promoteur situé en amont du gène epsA varie d'un type d'opéron à l'autre. Notamment, il existe une zone de forte variabilité (insertions ou délétions) quelques bases en amont de la boîte-35. Cette insertion peut avoir des effets sur la régulation de la transcription des gènes de l'opéron.

La localisation des promoteurs des opérons eps sur les séquences SEQ ID NO : 1 à SEQ ID NO : 8 est la suivante : -Type III : de 488 à 827 de la séquence SEQ ID NO : 1 -Type IV : de 485 à 825 de la séquence SEQ ID NO : 2 -Type V : de 499 à 844 de la séquence SEQ ID NO : 3 -Type VI : de 496 à 844 de la séquence SEQ ID NO : 4 -Type VII : de 530 à 880 de la séquence SEQ ID NO : 5 -Type IX : de 490 à 831 de la séquence SEQ ID NO : 6 -Type X : de 736 à 1104 de la séquence SEQ ID NO : 7 -Type XI : de 470 à 820 de la séquence SEQ ID NO : 8 Les promoteurs des opérons eps conformes à l'invention sont utilisables notamment pour réguler l'expression, soit des gènes auxquels ils sont respectivement naturellement associés, soit des gènes de tout autre opéron eps.

Le vecteur ainsi obtenu est utilisé pour transformer la cellule-hôte choisie. Celle-ci peut être une cellule eucaryote, par exemple une cellule de levure, ou une cellule procaryote ; dans ce dernier cas, il peut s'agir en particulier d'une bactérie lactique, et notamment de S. thermophilus.

La présente invention englobe également tout vecteur recombinant comprenant un fragment conforme à l'invention, ainsi que toute cellule-hôte transformée par un fragment d'acide nucléique conforme à l'invention.

Des cellules transformées par un fragment d'acide nucléique conforme à l'invention peuvent notamment être utilisées pour la biosynthèse d'EPS, ou, en particulier dans le cas des bactéries lactiques, pour la préparation de produits fermentes comprenant un EPS ayant la structure souhaitée.

Il est donc maintenant possible de modifier le type d'EPS produit par S. thermophilus en introduisant tout ou partie des gènes décrit dans cette invention. En particulier, il est envisageable d'utiliser des gènes appartenant à différents opérons (notamment les gènes codant pour les glycosyltransférases) afin de construire un nouvel opéron permettant la synthèse d'un EPS ayant des propriétés nouvelles pour des applications dans le domaine de la texture ou des probiotiques.

En outre, en procurant les séquences de nouveaux opérons eps, la présente invention fournit des outils permettant de déterminer le type d'EPS produit par une souche de bactérie lactique, notamment une souche de S. thermophilus, par détection, chez ladite souche, de la présence de gènes ou de combinaison de gènes impliqués dans la synthèse dudit EPS.

Jusqu'à présent, la détermination de l'EPS produit par une souche de S. thermophilus nécessitait l'isolement puis l'analyse biochimique de l'EPS produit. Cette technique est très consommatrice de temps et de main d'oeuvre, et n'est pas applicable en pratique, au typage d'un grand nombre de souches.

Grâce à la présente invention, il est désormais possible de déterminer la nature de l'EPS grâce aux gènes intervenant dans sa biosynthèse, et notamment d'établir une relation entre les propriétés d'une souche de S. theryfzophilus et la présence d'un opéron eps déterminé, ou de certains gènes de cet opéron.

Notamment, il est possible, en procédant à l'alignement des séquences SEQ ID NO : 1 à SEQ ID NO : 8, ou SEQ ID NO : 9 à SEQ ID NO : 16, représentant les opérons de types III, IV, V, VI, VII, IX, X, et XI, entre elles et avec des séquences d'autres opérons (notamment les opérons eps de types I, II et VIII), d'identifier facilement les régions spécifiques de chaque opéron, ainsi que les régions communes à différents opérons, et d'en dériver des oligonucléotides utilisables par exemple comme sondes spécifiques de détection de la présence dudit opéron, et/ou comme amorces permettant l'amplification d'un fragment spécifique dudit opéron.

La présente invention a en conséquence pour objet un procédé de sélection d'au moins un oligonucléotide permettant la détection spécifique d'un gène d'un opéron eps présent dans une souche de S thermophilus, caractérisé en ce qu'il comprend : a) l'alignement des ORFs présentes sur les séquences identifiées dans la liste de séquences en annexe sous les numéros SEQ ID NO : 1 à 8, ou SEQ ID NO : 9 à 16, entre elles et, éventuellement avec des ORFs de séquences d'autres opérons eps, notamment des opérons eps de types I, II et VIII ; b) l'identification, dans au moins une desdites ORFs, d'au moins une portion de taille supérieure à 12 pb, et de préférence comprise entre 15 et 50 pb, présentant une homologie inférieure à 80%, et de préférence inférieure à 50% avec les autres séquences.

On peut ensuite facilement préparer un ou plusieurs oligonucléotides de séquence identique ou de séquence complémentaire à celle (s) de la ou des portion (s) de séquence ainsi identifiées.

La présente invention a également pour objet tout oligonucléotide spécifique d'un gène d'un opéron eps, susceptible d'être obtenu par le procédé défini ci-

dessus, et notamment tout oligonucléotide spécifique d'un gène d'un opéron eps choisi parmi les opérons de Type I à XI.

On définit ici comme « oligonucléotide spécifique d'un gène d'un opéron eps », tout oligonucléotide pour lequel il est possible de définir des conditions d'hybridation dans lesquelles, en présence des opérons eps des types I à XI, ledit oligonucléotide ne s'hybride qu'avec un seul gène porté par un seul desdits opérons.

Des oligonucléotides conformes à l'invention peuvent notamment être obtenus à partir de la séquence d'au moins un ORF choisi parmi eps3F, eps3G, eps3H, eps3I, eps3J, eps3K, eps4L, eps5F, eps5G, eps5H, epsSI, eps6F, eps6G, eps6H, eps61, eps6J, eps6K, eps6L, eps6M, eps7F, eps9F, eps9G, eps9H, eps9I, eps9J, eps9K, epslOF, <BR> <BR> <BR> epslOG, epslOH, epslOI, epsllF, epsllG, epsllH, epsllI, epsllJ, et avantageusement à partir de la séquence d'au moins un ORF choisi parmi eps3F, eps5F, eps6F, eps6G, eps6I, eps6J, eps9G, eps9J, epslOF, epsllF, epsllG.

La présente invention a également pour objet toute paire d'amorces oligonucléotidiques permettant l'amplification d'un fragment d'acide nucléique spécifique d'un gène d'un opéron eps, et notamment toute paire d'amorces oligonucléotidiques spécifique d'un gène d'un opéron eps choisi parmi les opérons de Type I à XI.

Ceci englobe en particulier : -tout couple d'oligonucléotides comprenant au moins un oligonucléotide spécifique d'un gène d'un opéron eps, tel que défini ci-dessus ; -tout couple d'oligonucléotides pour lequel il est possible de définir des conditions d'amplification dans lesquelles, en présence des opérons eps des types I à XI, ils ne s'hybrident conjointement qu'avec un seul gène de l'un desdits opérons, permettant donc uniquement l'amplification de séquences dudit gène ; -tout couple d'oligonucléotides qui, bien que pouvant s'hybrider conjointement avec un ou plusieurs gènes d'un ou plusieurs opérons eps des types I à XI, génèrent pour chacun de ces gènes, un produit d'amplification de taille différente.

De même, il est possible d'identifier des oligonucléotides utilisables comme amorces pour l'amplification d'une séquence d'acide nucléique spécifique d'un opéron eps, notamment d'un opéron eps choisi parmi les opérons de Type I à XI.

On définit par : « séquence d'acide nucléique spécifique d'un opéron eps » tout gène, portion de gène, ou combinaison de gènes, présents uniquement sur cet opéron.

La présente invention a également pour objet toute paire d'amorces oligonucléotidiques permettant l'amplification d'un fragment d'acide nucléique spécifique d'un opéron eps, et notamment toute paire d'amorces oligonucléotidiques permettant l'amplification d'un fragment d'acide nucléique spécifique d'un opéron eps choisi parmi les opérons de Type I à XI.

Ceci englobe en particulier : -tout couple d'oligonucléotides comprenant au moins un oligonucléotide spécifique d'un gène d'un opéron eps, tel que défini ci-dessus ; -tout couple d'oligonucléotides pour lequel il est possible de définir des conditions d'amplification dans lesquelles, en présence des opérons eps des types I à XI, ils ne s'hybrident conjointement qu'avec un seul desdits opérons, permettant donc uniquement l'amplification de séquences dudit opéron ; -tout couple d'oligonucléotides qui, bien que pouvant s'hybrider conjointement avec plusieurs opérons eps, génèrent pour chacun de ces opérons, un produit d'amplification de taille différente.

De telles amorces nucléotidiques sont susceptibles d'être obtenues par un procédé comprenant : a) l'alignement des séquences identifiées dans la liste de séquences en annexe sous les numéros SEQ ID NO : I à 8, ou SEQIDNO : 9 à 16, entre elles et, éventuellement avec des séquences d'autres opérons eps ; b) l'identification, dans la séquence représentant le type d'opéron eps que l'on souhaite détecter d'au moins une région spécifique, par sa taille et/ou sa séquence, dudit opéron ; c) l'identification d'amorces permettant d'obtenir l'amplification spécifique de ladite région.

La présente invention a également pour objet l'utilisation d'au moins un oligonucléotide ou d'au'moins un couple d'amorces tels que définis ci-dessus pour la détermination du type d'EPS produit par une souche de S. thermophilus.

La présente invention a aussi pour objet un kit permettant la détermination du type d'EPS produit par une souche de S. tlzermophilus, caractérisé en ce qu'il comprend au moins un oligonucléotide spécifique d'un gène d'un opéron eps, et/ou au moins une paire d'amorces oligonucléotidiques permettant l'amplification d'un fragment d'acide nucléique spécifique d'un opéron eps, conformes à l'invention.

Les oligonucléotides conformes à l'invention permettent de cribler rapidement une collection de souches de S. thermophilus pour connaître le type d'EPS produit par ces souches. Ils permettent de déterminer, sans qu'il soit nécessaire de purifier et d'analyser l'EPS concerné, la relation entre la présence d'un type d'EPS et les caractéristiques d'un produit, par exemple les qualités organoleptiques, la texture, les effets probiotiques éventuels, etc. Ils permettent également de sélectionner les ferments en fonction de leur capacité à produire un EPS déterminé.

La présente invention englobe également les souches de Streptococcus thermophillls comprenant au moins un opéron eps conforme à l'invention, et notamment des souches de Streptococcus thermophilus comprenant :

-un opéron eps de type III, représentées par la souche CNCM I-2425 ; -un opéron eps de type IV, représentées par la souche CNCM 1-2432 ; -un opéron eps de type V, représentées par la souche CNCM I-2431 ; -un opéron eps de type VI, représentées par la souche CNCM I-2130 ; -un opéron eps de type IX, représentées par la souche CNCM I-2427 ; La présente invention sera mieux comprise à l'aide du complément de description qui va suivre, qui se réfère à des exemples non-limitatifs illustrant l'utilisation de séquences d'acide nucléique conformes à l'invention pour la détermination du type d'opéron eps contenu dans différentes souches de S thermophilus.

EXEMPLE 1 : KITS DE TYPAGE GENETIQUE 2 kits de typage permettant d'amplifier spécifiquement les opérons de type I, II, III, IV, VI VIII et X (kit 1) ou de type V, IX et XI (kit 2) sont décrits ci-après à titre d'exemple..

Le kit 1 comprend : -une amorce 364 (GGGCACATTTGCCATTAGTG) spécifique de l'orfl4. 9, présente dans tous les types d'opéron connus, mis à part le Type XI ; -une amorce 525 (GGAGATGAACCATACTACCC) spécifique du Type I et VI ; -une amorce 526 (GGTGATTCAGATTAAGTGGCG) spécifique du Type II : -une amorce 532 (GCACTACTATTAATGATTCCG) spécifique du Type III ; -une amorce 366 (GCTACGTAGGCTATAGAAGC) spécifique du Type IV et VIII ; -une amorce 442 (CTCACGGATAAACTCTGG) spécifique du Type X ; -les amorces 523 (GACGACTACTCCACGTGATCC), et 524 (GAGAGGCACTTTCCACACTCG) spécifiques du gène epsA présent dans tous les types d'opérons eps de S. thermophilus connus.

Le kit 2 comprend les amorces 364, 523, et 524, ainsi que : -une amorce 304 (GCAGCCTGCTGGGAGAC) spécifique du Type V ; -une amorce 543 (CGTCACCTCGTGGAGAGTTGG) spécifique des Types V et XI ; -les amorces 517 (GAACGCATCTTCCGGTGGC) et 519 (GTACCATCATCTTCGCCAGC) spécifiques du Type XI.

Ces amorces sont utilisées dans la technique de multiplex PCR [SOROKIN et al., Genome Res., 6, 448-453, (1996)] selon le protocole suivant : La PCR est effectuée sur de 1'ADN total de Streptococcus thermophilus en présence de l'ensemble des amorces du kit 1 ou de l'ensemble des amorces du kit 2,

dans les conditions suivantes : 94°C 5 min, suivi de 30 cycles d'amplification (94°C 30 sec, 50°C 30 sec, 72°C 3 min) puis d'une conservation à 4°C jusqu'au dépôt sur gel d'agarose à 1%.

Les amorces 523 et 524 servent de témoin d'amplification et permettent d'obtenir une bande de 600 bp (fragment interne à epsA) quelque soit le type de l'opéron.

Dans le cas du kit 1, on observe une bande supplémentaire à 1. 5 kb, 0. 5 kb, 2. 8 lcb, 2. 51cb, 1. 4 kb, 2. 1 kb ou 0. 3kb si la souche de S. thermophilus contient un opéron eps de type I, II, III, IV, VI, VIII ou X.

Dans le cas du kit 2, on observe deux bandes à 2, 1 kb et 1, 9 kb pour un opéron de Type V, une seule bande à 1, 9 kb dans le cas du Type X et une bande à 2, 5 kb dans le cas du Type XI.

EXEMPLE 2 : CORRELATION ENTRE LA PRESENCE D'UN TYPE D'OPERON EPS ET LA TEXTURE D'UN PRODUIT FERMENTE.

Des laits fermentes par des souches de S. thermophilus possédant différents opérons eps de type I à XI ont été préparés comme suit : Un litre de lait demi-écrémé a été enrichi avec 3% de poudre de lait écrémé (extrait sec 14%). Après pasteurisation (10 min à 90°C) le lait est refroidi à 43°C et inoculé avec 20g de concentré bactérien congelé pour 100 litres de lait.

Le lait est incubé à 43°C jusqu'à pH 4, 75. La fermentation est arrêtée par refroidissement à +4°C.

Le produit est caractérisé après stockage de 24h à +6°C.

Temps de fermentation : Pour évaluer le temps de fermentation, le pH est mesuré en continu (CINAC) Rhéologie : La viscosité est appréciée par Viscosimètre BROOKFIELD, Vitesse 10, aiguille C, à la température de +8°C. Les résultats sont illustrés dans le Tableau X ci-après.

Tableau X Souche Type des Temps de Temps de pH j1 PH j14 Viscosité Viscosite séquences fermentation fermentation J1 CPS J14 CPS des pour pour operons atteindre pH atteindre pH EPS 4, 75 4, 6 CNCM 1-1477 Xl 5h35 7hO5 4, 75 4, 54 16000 18000 CNCM !-2425 IIl 4h00 5h15 4, 65 4, 42 20000 27000 CNCM 1-2432 IV 6h50 8h50 4|76 4, 52 37000 41000 CNCM 1-2426 5h35 7h25 4, 75 4, 50 39000 44000 CNCM 1-2423 I 5h05 7h00 4, 75 4, 40 40000 46000 CNCMf-2429 V)) 9h0013h45 4, 70 4, 53 50000 54000 Ces résultats montrent qu'il existe une corrélation entre le type d'opéron eps présent dans une souche de Streptococcus thermophilus, et les propriétés des. EPS produits, reflétées ici par la viscosité du produit fermenté obtenu.