Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
NOVEL PROMOTERS FOR EXPRESSING PROTEINS OF INTEREST IN YEAST
Document Type and Number:
WIPO Patent Application WO/1996/031611
Kind Code:
A1
Abstract:
Novel nucleic acid fragments isolated from the genomic DNA of yeast and having transcription promoter activity, as well as expression cassettes, vectors and host cells containing same, are disclosed. The use of said fragments for producing commercially or therapeutically useful polypeptides is also disclosed.

Inventors:
NACKEN VALERIE (FR)
ACHSTETTER TILMAN (DE)
Application Number:
PCT/FR1996/000523
Publication Date:
October 10, 1996
Filing Date:
April 05, 1996
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
TRANSGENE SA (FR)
NACKEN VALERIE (FR)
ACHSTETTER TILMAN (DE)
International Classes:
C12N15/09; C12N1/19; C12N15/81; C12P21/02; C12R1/865; (IPC1-7): C12N15/81; C12N1/19
Other References:
SKELTON ET AL.: "S. cerevisiae chromosome IX cosmid 3299", EMBL- SEQUENCE DATABASE, 5 December 1994 (1994-12-05), XP002009324
A.C. MAARSE ET AL.: "Subunit IV of yeast chromosome c oxidase: cloning and nucleotide sequencing of the gene and partial amino acid sequencing of the mature protein", EMBL-SEQUENCE DATABASE, 7 November 1985 (1985-11-07), XP002009325
K. WEINSTOCK: "EST 103186 Saccharomyces cerevisiae cDNA 3' end", EMBL-SEQUENCE DATABASE, 27 January 1995 (1995-01-27), XP002009326
B.G. BARRELL ET AL.: "S. cerevisiae chromosome IX complete sequence", EMBL-SEQUENCE DATABASE, 22 December 1994 (1994-12-22) - 7 April 1995 (1995-04-07), XP002009327
T. ACHSTETTER ET AL.: "A new signal peptide useful for secretion of heterologous proteins from yeast and its application for synthesis of hirudin", GENE, vol. 110, no. 1, 2 January 1992 (1992-01-02), ELSEVIER SCIENCE PUBLISHERS,B.V.,AMSTERDAM,NL;, pages 25 - 31, XP002009328
V. NACKEN ET AL.: "Direct plasmid shuffling from yeast into Escherichia coliby electroduction", NUCLEIC ACIDS RESEARCH, vol. 22, no. 8, 25 April 1994 (1994-04-25), IRL PRESS LIMITED,OXFORD,ENGLAND, pages 1509-1510, XP002009329
A. GATIGNOL ET AL.: "Phleomycin resistance encoded by the ble gene from transposon Tn 5 as a dominant selectable marker in Saccharomyces cerevisiae", MOLECULAR & GENERAL GENETICS, vol. 207, 1987, SPRINGER INTERNATIONAL, AMSTERDAM, NL, pages 342 - 348, XP002009330
DEGRYSE E ET AL: "In vivo cloning by homologous recombination in yeast using a two-plasmid-based system.", YEAST 11 (7). 1995. 629-640. ISSN: 0749-503X, 15 June 1995 (1995-06-15), XP002009331
V. NACKEN AND T. ACHSTETTER: "Cloning of new yeast promoters useful for heterologous gene expression", EMBL-SEQUENCE DATABASE, 30 May 1995 (1995-05-30), XP002009332
Download PDF:
Claims:
Revendications
1. Fragment d'acide nucléique isolé comprenant tout ou partie d'une séquence nucléotidique homologue à la séquence montrée dans l'identificateur de séquence NO: 2 ou une partie seulement de la séquence nucléotidique montrée dans l'identificateur de séquence NO: 1 ou 3, ou homologue à son complémentaire, ledit fragment présentant une activité de promoteur transcriptionnel.
2. Fragment d'acide nucléique isolé selon la revendication 1, comprenant tout ou partie d'une séquence nucléotidique telle que montrée dans l'identificateur de séquence NO: 2 ou une partie seulement de la séquence nucléotidique montrée dans l'identificateur de séquence NO: 1 ou 3 ou son complémentaire.
3. Fragment d'acide nucléique isolé selon la revendication 1 ou 2, ayant une séquence telle que montrée dans : (i) l'identificateur de séquence NO: 1, débutant au nucléotide en position 462 et se terminant au nucléotide en position 1016, ou (ii) l'identificateur de séquence NO: 1, débutant au nucléotide en position 197 et se terminant au nucléotide en position 1016, ou (iii) l'identificateur de séquence NO: 3, débutant au nucléotide en position 5 et se terminant au nucléotide en position 523.
4. Fragment d'acide nucléique d'origine hybride, caractérisé en ce qu'il comprend (i) un fragment d'acide nucléique selon l'une des revendications 1 à 3, comprenant une région promotrice minimale ; ladite région promotrice minimale étant placée en aval d'une ou plusieurs séquence(s) modulatrice(s) hétérologue(s) à ladite région promotrice minimale, ou (ii) un fragment d'acide nucléique selon l'une des revendications 1 à 3, comprenant au moins une séquence modulatrice ; ladite séquence modulatrice étant placée en amont d'une région promotrice minimale hétérologue à ladite séquence modulatrice.
5. Cassette d'expression comprenant un gène d'intérêt placé sous le contrôle dudit fragment d'acide nucléique selon l'une des revendications 1 à 4 ou un fragment d'acide nucléique comprenant la totalité de la séquence nucléotidique montrée dans l'identificateur de séquence NO: 1 ou 3 ou d'une séquence homologue ou complémentaire ou homologue de son complémentaire..
6. Cassette d'expression selon la revendication 5, caractérisée en ce que le gène d'intérêt code pour un produit d'expression sélectionné parmi les cytokines, facteurs de croissance, récepteurs, anticoagulants, enzymes ou leurs inhibiteurs, hormones, anticorps, polypeptides possédant des propriétés immunogènes, protéines structurales et marqueur de sélection.
7. Vecteur d'expression comprenant une cassette d'expression selon la revendication 5 ou 6.
8. Vecteur plasmidique selon la revendication 7, multicopie ou centromérique.
9. Cellule hôte comprenant une cassette d'expression selon la revendication 5 ou 6 ou un vecteur selon la revendication 7 ou 8.
10. Cellule hôte eucaryote inférieure selon la revendication 9.
11. Levure hôte selon la revendication 10.
12. Cellule hôte selon la revendication 11, sélectionnée parmi les levures du genre Saccharomyces, Schizosaccharomyces, Pichia, Kluyveromyces, Hansenula, Phafβa et Yarrowia.
13. Cellule hôte selon la revendication 12, caractérisée en ce qu'il s'agit de Saccharomyces cere l 'isiae .
14. Procédé de production d'un polypeptide d'intérêt comprenant (i) la culture d'une cellule hôte selon l'une des revendications 9 à 13, dans des conditions de culture appropriées permettant la production dudit polypeptide d'intérêt et (ii) la récupération dudit polypeptide d'intérêt dans la culture de ladite cellule hôte.
15. Procédé de production selon la revendication 14, caractérisé en ce que la cellule hôte est une levure Saccharomyces cerevisiae.
16. Procédé de production selon la revendication 14 ou 15, caractérisé en ce que la culture de la cellule hôte est effectuée dans un milieu de culture défini comprenant du glucose comme source de carbone.
Description:
NOUVEAUX PROMOTEURS POUR L'EXPRESSION DE PROTEINES

D'INTÉRÊT DANS LA LEVURE

La présente invention se rapporte au domaine des biotechnologies, notamment à un perfectionnement apporté à la production d'un polypeptide d'intérêt commercial ou thérapeutique dans la levure et, en particulier, dans Saccharomyces cerevisiae. Elle concerne, en premier lieu, de nouveaux fragments d'acide nucléique isolés de l'ADN génomique de Saccharomyces cerevisiae et présentant une activité de promoteur transcriptionnel et, en second lieu, des cassettes d'expression, vecteurs d'expression et cellules hôtes les contenant ainsi que leur utilisation pour la production de polypeptides d'intérêt.

La levure Saccharomyces cerevisiae est considérée comme l'un des hôtes préférés pour la production de protéines recombinantes pour de nombreuses raisons. D'une part, cet organisme est non pathogène et il est couramment utilisé dans l'industrie agroalimentaire. D'autre part, il peut être cultivé à grande échelle et à haute densité dans un milieu relativement bon marché et peut être facilement adapté à un environnement industriel. De plus, il a été particulièrement étudié de sorte que de multiples données concernant sa génétique et sa physiologie sont disponibles. Enfin, il est capable d'effectuer certaines modifications typiquement eucaryotes (glycosylation, ponts disulfure...).

Bien que de nombreux promoteurs transcriptionnels fonctionnels dans les levures aient été décrits dans la littérature, seuls quelques uns d'entre eux s'avèrent efficaces pour la production de polypeptides par voie recombinante. On peut citer notamment les promoteurs des gènes PGK (3-phosphoglycérate kinase ; Hitzeman et al., 1983, Science, 2 9, 620-625), TDH codant pour la GAPDH (glycéraldéhyde phosphate deshydrogénase ; Holland et Holland, 1979, J. Biol. Chem., 254, 9839- 9845), TEF1 (Facteur d'élongation 1 ; Cottrelle et al , 1985, J. Biol. Chem., 260, 3090-3096), MF al (précurseur de la phéromone sexuelle α ; Inokuchi et al., 1987, Mol. Cell. Biol., 7, 3185-3193) qui sont considérés comme des promoteurs constitutifs forts ou encore le promoteur régulable CYCl réprimé en présence de glucose (Guarente et Ptashne, 1981, Proc Natl. Acad. Sci USA, 78, 2199-2203) ou PH05 régulable par la thiamine (Meyhack et al., 1982, EMBO J., 1, 675-680) Cependant, pour des raisons souvent inexpliquées, ils ne permettent pas toujours l'expression efficace des gènes qu'ils contrôlent et donc la production de polypeptides à des niveaux importants. Dans ce contexte, il est toujours avantageux de pouvoir disposer de nouveaux promoteurs afin de générer de nouveaux systèmes hôtes/vecteurs efficaces pour la production de grande quantité de protéines d'intérêt De plus, avoir un choix de promoteurs efficaces dans une cellule donnée permet également d'envisager la production de multiples protéines dans cette même cellule (par exemple plusieurs enzymes d'une même chaîne métabolique) tout en évitant les problèmes de recombinaison entre séquences homologues.

D'une manière générale, une région promotrice est située dans la région 5' des gènes et comprend l'ensemble des éléments permettant la transcription d'un fragment d'ADN placé sous leur dépendance, notamment :

(1 ) une région promotrice dite minimale comprenant la TATA box et le site d'initiation de la transcription, qui détermine la position du site d'initiation ainsi que le niveau basai de la transcription. Chez Saccharomyces

cerevisiae, la longueur de la région promotrice minimale est relativement variable. En effet, la localisation exacte de la TATA box varie d'un gène à l'autre et peut se situer de -40 à -120 nucléotides en amont du site d'initiation (Chen et Struhl, 1985, EMBO J.; 4, 3273-3280)

(2) des séquences situées en amont de la TATA box (immédiatement en amont jusqu'à plusieurs centaines de nucléotides) qui permettent d'assurer un niveau efficace de transcription soit de manière constitutive (niveau de transcription relativement constant tout au long du cycle cellulaire, quelles que soient les conditions de culture) soit de manière régulable (activation de la transcription en présence d'un activateur et/ou répression en présence d'un répresseur). Ces séquences désignées par la suite modulatrices, peuvent être de plusieurs types : activatrice, inhibitrice, enhancer, inductible, répressible et répondre à des facteurs cellulaires ou des conditions de culture variés.

On a maintenant isolé et caractérisé trois séquences génomiques de Saccharomyces cerevisiae et mis en évidence leur fonction de promoteur de la transcription. Placée en amont d'un gène reporteur (gène de la résistance à la phléomycine ou gène GUS codant pour la β-glucuronidase), chacune de ces séquences permet son expression chez la levure Saccharomyces cerevisiae et, dans le cas de deux d'entre elles, à un niveau élevé puisque supérieur ou à peu près équivalent à celui détecté avec des régions promotrices réputées fortes, comme celles des gènes PGK et MF al. La comparaison avec les banques de données indiquent que deux des séquences clonées sont nouvelles et ne figurent pas dans les banques de données accessibles au public (SEQ ID NO: 1 et 2). En ce qui concerne la troisième (SEQ ID NO: 3), eue correspond à une séquence localisée en 3' du gène de levure COX 4 dans une région où la présence d'un promoteur est inattendue La présente invention apporte une solution avantageuse au problème de la production de protéines d'intérêt par voie recombinante.

Par conséquent, la présente invention a pour objet un fragment d'acide nucléique isolé comprenant tout ou partie d'une séquence nucléotidique homologue à la séquence montrée dans l'identificateur de séquence NO: 1, 2 ou 3 ou homologue à son complémentaire, ledit fragment présentant une activité de promoteur transcriptionnel

Par "fragment d'acide nucléique", on entend un polymère de nucléotides pouvant être de type ADN ou ARN. Ces termes sont définis dans tous les ouvrages de base de biologie moléculaire. Préférentiellement, un fragment d'acide nucléique selon l'invention est un fragment d'ADN double brin.

D'une façon générale, tout ou partie de l'une des séquences nucléotidiques spécifiées dans les SEQ ID NO: 1, 2 et 3, son complémentaire ou un de ses homologues peut être utilisé dans le cadre de la présente invention. Le terme "partie" désigne un fragment comportant une portion d'au moins 17 nucléotides continus identiques à une portion d'une longueur équivalente de l'une des séquences nucléotidiques indiquées dans les identificateurs de séquence ou de son complémentaire Mais, bien entendu, un fragment d'acide nucléique selon l'invention n'est pas limité aux séquences décrites et peut s'étendre au delà

Le terme "homologue" signifie une séquence capable de s'hybrider dans des conditions stringentes avec tout ou partie de la séquence reportée dans la SEQ ID NO: 1, 2 ou 3. Il fait plus particulièrement référence à tout acide nucléique retenant la fonction promotrice et présentant une ou plusieurs modification(s) de séquence par rapport à une de ces séquences. Ces modifications peuvent être obtenues par mutation, délétion et/ou addition d'un ou plusieurs nucléotide(s) par rapport à la séquence native. Elles peuvent être introduites notamment pour améliorer l'activité promotrice, supprimer une région inhibitrice de la transcription, rendre un promoteur constitutif régulable ou vice versa, introduire un site de restriction facilitant les étapes de clonage ultérieures, éliminer les séquences non essentielles à l'activité transcriptionnelle...etc Dans ce contexte, on préférera un degré

d'homologie de 70% par rapport à la séquence native, avantageusement de 80% et, de préférence, de 90%. L'homme du métier sait où effectuer les modifications afin de ne pas altérer de manière drastique la fonction de promoteur de la transcription et il évitera en particulier le site d'initiation de la transcription et la TATA box. Il connaît également les techniques permettant d'évaluer si l'homologue généré a une activité promotrice, par exemple par insertion en amont d'un gène reporter dont l'expression est facilement détectable (β-galactosidase, cathéchol- oxygénase, luciférase ou encore un gène conférant la résistance à un antibiotique). Mais tout autre technique conventionnelle peut également être employée.

Suivant un mode de réalisation préféré, un fragment d'acide nucléique selon l'invention est identique à tout ou partie de l'une des séquences nucléotidiques montrées dans l'identificateur de séquence NO: 1, 2 ou 3 ou de son complémentaire.

A titre d'exemples préférés mais non limitatifs, on peut envisager d'employer un fragment d'acide nucléique ayant une séquence telle que montrée dans :

(i) l'identificateur de séquence NO: 1 , débutant au nucléotide en position 462 et se terminant au nucléotide en position 1016, ou

(ii) l'identificateur de séquence NO: I, débutant au nucléotide en position 197 et se terminant au nucléotide en position 1016, ou (iii) l'identificateur de séquence NO: 3, débutant au nucléotide en position 5 et se terminant au nucléotide en position 523.

Aux fins de la présente invention, un fragment d'acide nucléique selon l'invention peut être constitué par l'assemblage d'éléments d'origines diverses pour former un promoteur dit hybride fonctionnel dans la cellule hôte considérée. En particulier, un tel promoteur hybride peut comprendre :

(i) un fragment d'acide nucléique selon l'invention, comprenant une

région promotrice minimale ; ladite région promotrice minimale étant placée en aval d'une ou plusieurs séquence(s) modulatrice(s) hétérologue(s) à ladite région promotrice minimale, ou

(ii) un fragment d'acide nucléique selon l'invention, comprenant au moins une séquence modulatrice ; ladite séquence modulatrice étant placée en amont d'une région promotrice minimale hétérologue à ladite séquence modulatrice.

Selon un mode de réalisation de la première variante, on peut avoir recours à une ou plusieurs séquence(s) modulatrice(s) régulable(s) afin de générer un promoteur hybride régulable à partir duquel la transcription peut être induite ou réprimée selon les conditions mises en oeuvre. Ce mode de réalisation spécifique est particulièrement avantageux dans le cadre de la production de protéines d'intérêt présentant une certaine toxicité vis à vis de la cellule hôte. On choisira de préférence des séquences modulatrices régulables permettant de faire varier la transcription en fonction des conditions de culture ou de la phase de croissance. D'une manière générale, de telles séquences sont issues ou dérivent de gènes régulables et sont connues de l'homme de l'art. A titre indicatif, on peut citer celles issues du gène CYCJ régulable par le glucose, du gène PH05 régulable par la thiamine, ou des gènes GAL1 , GAL7 et GAL10 régulables par le galactose. Il va de soi que ces séquences peuvent comporter des modifications (mutation, délétion et/ou substitution d'un ou plusieurs nucléotides) par rapport à la séquence native, du moment qu'elles n'altèrent pas leur fonction modulatrice de manière drastique.

On indique également qu'un fragment d'acide nucléique selon l'invention peut être employé à titre de promoteur bi-directionnel capable d'exercer sa fonction indépendamment de son orientation vis à vis du gène à transcrire (dans une orientation sens de 5' vers 3' comme indiqué dans les SEQ ID ou inversée).

Bien entendu, un fragment d'acide nucléique selon l'invention peut être obtenu par

toute technique en usage dans le domaine de l'art, par exemple par clonage, hybridation à l'aide d'une sonde appropriée, par PCR (Polymerase Chain Reaction) à l'aide d'amorces adéquates ou encore par synthèse chimique.

Conformément aux buts poursuivis par la présente invention, un fragment d'acide nucléique selon l'invention est destiné à permettre l'expression d'un gène d'intérêt dans une cellule hôte et, à cet effet, est lié d'une manière opérationnelle à celui-ci dans une cassette d'expression. C'est pourquoi la présente invention s'étend également à une cassette d'expression comprenant un fragment d'acide nucléique selon l'invention et un gène d'intérêt placé sous son contrôle. Il va de soi qu'une cassette d'expression selon l'invention peut contenir plusieurs gènes d'intérêt soit dans le cadre d'une cassette multicistronique (schématisée par l'agencement "promoteur-gène 1-gène 2...") dans laquelle les différents gènes sont placés en aval d'un fragment d'acide nucléique selon l'invention et sont séparés les uns des autres par des séquences adéquates, comme les éléments IRES (pour Internai Ribosome Entry Site en anglais) permettant la réinitiation de la traduction ou encore dans le cadre d'une cassette bidirectionnelle ("gène 1 -promoteur-gène 2") dans laquelle un fragment d'acide nucléique selon l'invention est inséré entre deux gènes d'intérêt pour gouverner simultanément leur expression.

Aux fins de la présente invention, un gène d'intérêt peut être issu d'un organisme eucaryote, procaryote ou d'un virus. Il peut être isolé par toute technique conventionelle de biologie moléculaire ou peut être synthétisé par voie chimique. Par ailleurs, il peut coder pour une protéine d'intérêt (i) intracellulaire, (ii) membranaire ou ancrée à la membrane cellulaire ou (iii) sécrétée dans le milieu de culture. Il peut donc comprendre des éléments additionnels comme, par exemple, une séquence codant pour un signal de sécrétion. A titre d'exemples, on indique la séquence signal BGL2 (EP 0 423 302), les séquences pré ou pré-pro MF al (Kurjan et Herskowitz, 1982, Cell, 30, 933-943) et encore la séquence pro de la défensine A (EP 0 607 080). On peut également avoir recours aux signaux de sécrétion endogènes du gène considéré. Le choix des signaux de sécrétion

envisageables dans le cadre de la présente invention est à la portée de l'homme de l'art.

Par ailleurs, un gène d'intérêt peut coder pour un polypeptide d'intérêt correspondant à tout ou partie d'une protéine telle que trouvée dans la nature (protéine native ou tronquée). Il peut également s'agir d'une protéine chimérique, par exemple provenant de la fusion de polypeptides d'origines diverses ou d'un mutant présentant des propriétés biologiques améliorées et/ou modifiées. Un tel mutant peut être obtenu par les techniques conventionnelles de biologie moléculaire. Parmi les protéines ou polypeptides d'intérêt, on peut citer à titre d'exemples non limitatifs :

les cytokines et notamment les interleukines (IL-2, 4, 5, 6, 12...), les interférons α, β et γ, les facteurs de stimulation des colonies (GM-CSF, C- CSF, M-CSF) ;

les facteurs de croissance (hormone de croissance, érythropoïétine, insuline....) ou les récepteurs cellulaires ou nucléaires ;

- les anticoagulants, de préférence l'hirudine et, notamment les variants de l'hirudine décrits dans la demande européenne EP 273 800 et, de manière tout à fait préférée le variant HV2 Lys47 ;

les enzymes (trypsine, ribonucléases, P450 cytochromes, lipases, amylases....) ;

les protéines de structure (albumine...) ;

les inhibiteurs d'enzymes (c -1 antitrypsine, antithrombine III, inhibiteurs de protéases virales...) ;

les polypeptides capables d'inhiber l'initiation ou la progression de tumeurs ou

cancers (inhibiteurs agissant au niveau de la division cellulaire ou des signaux de transduction, produits d'expression des gènes suppresseurs de tumeur, par exemple p53 ou Rb....) ; et

- les polypeptides capables d'inhiber une infection virale, bactérienne ou parasitaire et/ou son développement (polypeptides antigéniques ayant des propriétés immunogènes, anticorps, variants trans-dominants susceptibles d'inhiber l'action de la protéine native par compétition..).

Bien entendu, une cassette d'expression selon l'invention peut, en outre, comprendre des éléments additionnels nécessaires à l'expression du gène d'intérêt (séquence intronique, séquence terminatrice de la transcription...) ou encore à sa maintenance dans la cellule hôte considérée (origine de replication telle que ARS ou 2μ, gène codant pour un marqueur de sélection phénotypique tel que URA3 ou LEU2, gène codant pour un produit conférant une résistance à un antibiotique par exemple à l'hygromycine, la cycloheximide, la néomycine, la phléomycine....). De tels éléments sont connus de l'homme de l'art.

L'invention concerne également un vecteur d'expression comprenant une ou plusieurs cassette(s) d'expression selon l'invention. II peut s'agir d'un vecteur plasmidique multicopie ou centromérique, d'un cosmide ou d'un vecteur de type YAC. Enfin, il peut être intégratif ou autoréplicatif.

La présente invention a également trait à une cellule hôte comprenant une cassette d'expression ou un vecteur selon l'invention. Elle peut être générée par toute méthode permettant d'introduire un ADN étranger dans une cellule (transformation, transfection, microinjection, électroporation, liposomes....). On indique que toute cellule hôte, eucaryote ou procaryote, peut être utilisée dans le cadre de la présente invention dans la mesure où elle possède les facteurs appropriés pour permettre à un fragment d'acide nucléique selon l'invention d'exercer sa fonction de promoteur. Il est à la portée de l'homme de l'art de vérifier

si une cellule particulière peut être employée comme hôte en mesurant l'activité promotrice comme indiqué précédemment.

Une cellule hôte selon l'invention peut être dérivée d'une cellule animale (CHO, Véro, BHK..) ou d'une bactérie comme Escherichia coli mais on préférera avoir recours à un eucaryote inférieur et, notamment, une levure. A cet égard, on peut utiliser une levure du genre Saccharomyces, Schizosaccharomyces, Pichia, Kluyveromyces, Hansemtla, Phafβa ou Yarrowia Avantageusement, elle est choisie parmi les espèces Schizosaccharomyces pombe, Pichia pastons, Kluyλ'eromyces lactis, Hansenula po/ymorpha, Yarrowia hpolylica et, de manière préférée, Saccharomyces cerevisiae. On préfère tout particulièrement mettre en oeuvre une levure déficiente en protéase(s) comme TGY73 4 ou celle décrite dans la demande européenne EP 390 676. Un grand nombre de ces souches sont disponibles commercialement dans des organismes tels que l'AFRC (Agriculture and Food Research Council, Norfolk, UK) et l'ATCC (Rockville, MA, USA).

Enfin, la présente invention a également pour objet un procédé de production d'un polypeptide d'intérêt comprenant la culture d'une cellule hôte selon l'invention dans des conditions de culture appropriées permettant la production dudit polypeptide d'intérêt et sa récupération dans la culture cellulaire On utilise de préférence un milieu de culture défini comprenant du glucose comme source de carbone

Dans le cadre de la présente invention, ce procédé est de préférence applicable à la production d'une protéine d'intérêt thérapeutique et, notamment de l'hirudine, dans une levure Saccharomyces cerevisiae. La protéine peut être récupérée directement dans le milieu de culture ou après lyse des cellules selon la méthodologie classique. Elle peut être purifiée en appliquant les techniques standards connues de l'homme de l'art, par exemple la chromatographie échangeuse d'ions, la précipitation différentielle, l'immunopurification ou encore la filtration sur gel à haute ou basse pression.

EXEMPLES

Les exemples ci-après permettront de mettre en évidence d'autres caractéristiques et avantages de la présente invention. Ces exemples sont illustrés par référence aux figures suivantes :

La Figure 1 est une représentation schématique du vecteur pTG9852 pour la sélection de fragments d'ADN présentant une activité de promoteur transcriptionnel. Il comprend le gène URA3-d, un site multiple de clonage (issu de M13tgl31 ; Kieny et al., 1983, Gène, 26, 91-99), le gène b/e conférant la résistance à la phléomycine, le terminateur de transcription du gène PGK (PGKt), un fragment de pBR322 portant une origine de replication bactérienne et le gène Amp conférant la résistance à l'ampicilline et l'origine de replication 2μ (indiquée 2m).

La Figure 2 est une représentation schématique du vecteur pTG 10231 (vecteur multicopie) comprenant le gène UJiΛ3-d, le promoteur du gène CYCl (pCYCl), la partie codante du gène GUS, le terminateur PGK, un fragment de pBR322 et les origines de replication phagique F.ori et de levure 2μ.

La Figure 3 est une représentation schématique du vecteur pTG8795 (vecteur monocopie) similaire à pTG10231, mis à part que le gène marqueur est constitué par le gène URA3 complet et que l'origine ARSH4-CEN6 remplace la plus grande partie du fragment 2μ inclu dans ce vecteur.

La Figure 4 est un diagramme schématisant les activités promotrices des inserts D64, R13, Jl, et leurs sous-fragments (J1.2, R13.2 et R13.3) par rapport au promoteur du gène KEX2. Les barres représentent le niveau d'activité de la protéine GUS dans la souche Saccharomyces cerevisiae TGY74.3 testée en système multicopie.

La Figure 5 est un diagramme schématisant les activités promotrices des inserts D64, R13, Jl, et leurs sous-fragments (J1.2, R13.2 et R13.3) par rapport aux promoteurs des gènes KEX2, PGK, MF al (pMFl) et CYCl. Les barres représentent le niveau d'activité de la protéine GUS dans la souche Saccharomyces cerevisiae TGY74.3 testée en système monocopie.

La Figure 6 est un diagramme schématisant l'influence du milieu de culture sur les activités promotrices des inserts D64, J1.2, RI 3 et, à titre de contrôle, du promoteur TEFl . Les valeurs indiquées représentent une moyenne de deux prélèvements effectués en phase de croissance.

La Figure 7 est une représentation schématique des sous-fragments RI 3 générés par délétion de la région 5' et de l'activité GUS mesurée pour chacun d'entre eux en système d'expression monocopie et en début de croissance.

Les techniques décrites ci-après sont réalisées selon les techniques générales de génie génétique et de clonage moléculaire détaillées dans Maniatis et al. (1989, Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) ou selon les recommandations du fabriquant lorsqu'on utilise un kit commercial. Les étapes de clonage en bactérie sont effectuées dans la souche Escherichia coli (E. coli) 5K (Hubacek et Glover, 1970, J. Mol. Biol., 50, 1 11- 127). Les techniques d'amplification par PCR sont connues de l'homme de l'art (voir par exemple PCR Protocols, A Guide to Methods and Applications, 1990, ed Innis, Gelfand, Sninsky et White, Académie Press Inc). S'agissant de la réparation des sites de restriction, la technique employée consiste en un remplissage des extrémités 5' protubérantes à l'aide du grand fragment de l'ADN polymérase I d'E. coli (Klenow ).

En ce qui concerne la technologie appliquée aux levures, celle-ci est abondamment décrite dans Rose et al. (1990, Methods in Yeast Genetics : A Laboratory Course

Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY). Les

souches de Saccharomyces cerevisiae sont transformées par électroporation. Mais toute autre technique standard peut être utilisée. Quant aux conditions de culture, les levures non transformées sont généralement cultivées à 28°C en milieu YPG non sélectif (Yeast Extract 1%, Bactopeptone 1% et Glucose 2%) alors que les cellules transformées sont maintenues en conditions sélectives selon la nature du gène de sélection contenu dans la construction. Par exemple lorsque le marqueur de sélection est constitué par le gène ble conférant la résistance à la phléomycine, la culture est effectuée en milieu YEG (Yeast Extract 0,5%, Glucose 2%) tamponné à pH7 par addition de MOPS 0, 1 M et en présence de phléomycine à une concentration minimale de 50 μg/ml. Lorsqu'on utilise le gène UHA3 ou U11A3-J (complémentation de l'auxotrophie à l'uracile), le milieu de culture est composé par du YNBG+cas (Yeast nitrogen base 0,675%, Glucose 1% et casaminoacides 0,5%).

EXEMPLE 1 - Clonage de fragments d'ADN de levure présentant une activité promoteur.

A. Prépara/ion 'ADN chromosomique IX.

Une banque d'ADN enrichie en fragments d'ADN provenant du chromosome IX est constituée à partir de la levure Saccharomyces cerevisiae TGY73.4 {MA Ta, wa3, his3, pral, prbl, prcl, cpsl) traitée par la technique dite en agarose solide (Rose et al; 1990, supra, Préparation of chromosome-size yeast DNA molécules in soϋd agarose). Brièvement les levures traitées à la zymolyase sont incluses dans de l'agarose qui est ensuite solidifié. Puis, les chromosomes sont séparés par électrophorèse en champs puisés (CHEF-DRII, Biorad) sur gel d'agarose 1% (Biorad chromosomal grade agarose) dans du tampon TBE 0,5x (Tris-HCl 45 mM, Borate 45 mM et EDTA 2 mM). L'électrophorèse se déroule pendant une durée totale de 24 heures (h) en appliquant les paramètres suivants : puises de 40 sec pendant 16 h puis de 90 sec pendant 8 h avec un voltage de 200 volts. Ces

conditions sont optimales pour la séparation des chromosomes de petite taille (I, VI, III et IX). La bande correspondant au chromosome IX (le quatrième en partant du bas) est découpée du gel et l'ADN extrait de l'agarose (kit Gène Clean, Bio 101 Inc). Il a été nécessaire de réaliser plusieurs éléctrophorèses de ce type afin de pouvoir disposer d'environ 1 μg d'ADN chromosomique.

L'analyse par Southern (Southern, 1974, J. Mol. Biol., 98, 503-517) en testant une aliquote marquée de cette préparation (kit DIG DNA labelling and détection, Boehringer) sur une réplique du gel de chromosomes de levure confirme l'enrichissement en chromosome IX.

B. Construction d'une banque d'ADN chromosomique IX de levure.

La préparation enrichie en chromosome IX est digérée partiellement par l'enzyme &7./3A (10 digestions de 100 ng d'ADN par 0,2 unité d'enzyme pendant 1 h à 37°C dans un volume réactionnel de 50 μl). La réaction enzymatique est arrêtée par addition de 1 μl d'EDTA 0,5 M à pH8. Après précipitation alcoolique, les fragments d'une taille comprise entre 0,5 et 1 ,5 kb sont isolés sur gel d'agarose LMP 1% (Low Melting Point, BRL) et élues par la méthode du Gène Clean.

Les fragments isolés sont clones dans le plasmide pTG9852 (Figure 1) linéarisé par BamHl et traité par la phosphatase alcaline de veau (Boehringer). Ce dernier dérive des plasmides pTG6888 et pUT332 (Gatignol et al., 1987, Mol. Gen. Genêt., 207, 342-348). Le premier correspond au vecteur pTG3828 (Achstetter et al., 1992, Gène, 110, 25-31) modifié par suppression du site Xbal contenu dans l'origine 2μ (par digestion partielle Xbal et traitement à la Klenow). En parallèle, la partie codante du gène ble est purifiée de pUT332 sous forme d'un fragment BamHl- EcoRI lequel est soumis à l'action de la Klenow avant d'être introduit dans le site BgHl (rendu franc par traitement à la Klenow) du vecteur pTG6888. L'insertion de fragments d'ADN dans pTG9852 au niveau du site BamHl unique placé en amont des séquences codantes du gène ble, permettra de sélectionner ceux qui présentent

une activité de promoteur transcriptionnel (par sélection des levures transformées sur phléomycine).

Quinze séries de transformations par électroporation de la souche E. coli 5K ont été réalisées et ont permis de générer 10930 clones résistants à l'ampicilline donc transformés. Etant donné la taille des inserts sélectionnés (0,5 à 1,5 kb) et la taille du chromosome IX (450 kb), le nombre de clones obtenus est largement représentatif de la banque d'ADN (facteur d'environ 20 fois). Un échantillon de colonies est analysé par PCR. On met en oeuvre les amorces oTG5427 et oTG5428 (SEQ ID NO: 4 et 5) dans les conditions suivantes (30 cycles : dénaturation 30 sec à 90°C, hybridation 2 min à 54°C et élongation 2 min à 72°C). En absence d'insert (vecteur parental pTG9852), l'amplification génère une bande de 269 pb. En revanche, après insertion d'un fragment de levure, la taille de la bande amplifiée est augmentée de la taille de l'insert. Les résultats indiquent une fréquence d'insertion de 90% et une taille moyenne des inserts voisine de 700 pb.

Une banque est constituée par extraction du contenu plasmidique de l'ensemble des clones générés.

C. Sélection de promoteurs potentiels fonctionnels dans la levure Saccharomyces cerevisiae.

La banque obtenue à l'étape précédente est transformée dans la souche de levure

TGY74.3 par électroporation dans des cuves de 2 mm d'interface (système Cellject, Eurogentec ; voltage 1000 V, résistance 412Ω et capacité 40μF en puise unique).

Les cellules électroporées sont étalées en parallèle sur deux milieux différents afin d'évaluer, d'une part, si elles sont transformées (étalement sur milieu YNBG + cas pour la sélection du phénotype Ura + ) et, d'autre part, si l'insert présente une activité de promoteur transcriptionnel (étalement sur milieu YEG additionné de 250 μg/ml de phléomycine). On indique que la souche TGY73.4 non transformée

ou transformée par le vecteur pTG9852 (portant le gène ble dépourvu de promoteur) est incapable de croître au delà d'une concentration en phléomycine de 20 μg/ml A titre de comparaison, le vecteur pTG9851 comprenant une cassette d'expression fonctionnelle du gène ble (sous le contrôle du promoteur TEF1) peut résister à une concentration en antibiotique de 2 mg/ml Celui-ci est obtenu par introduction du fragment BamHl isolé du vecteur pUT332 dans le site Bglïl de pTG6888 Par contre, lorsque le promoteur utilisé est faible (pTG9895 comportant le gène ble sous le contrôle du promoteur du gène KEX2 , voir exemple 2), les cellules poussent jusqu'à 50 μg/ml Ainsi la concentration retenue de 250 μg/ml est intermédiaire afin de pouvoir sélectionner des fragments promoteurs de force variable

On génère 9300 transformants (Ura~) dont environ 1% présentent une résistance a une concentration de phléomycine de 250 μg/ml (106 clones) L'analyse par PCR avec les amorces précédentes indique une fréquence d'inserts de 80%, leur taille variant de 0,5 à 1 ,6 kb avec une moyenne vers 0,7-0,8 kb

Des répliques de ces 106 candidats ont été réalisées sur milieu sélectif à concentration croissante en phléomycine et 20 clones résistent a 2 mg/ml Afin de vérifier que leur résistance n'est pas due a une mutation spontanée, le contenu plasmidique des 20 transformants retenus est électroducte dans E. coli 5K (Nacken et al , 1994, Nucleic, Acids Res , 22, 1509-1510) avant d'être reintroduit dans la levure TGY73 4 Quatre clones présentent encore une bande amplifiable par PCR et une capacité de croissance en présence de phléomycine Trois d'entre eux ont été caractérisés II s'agit des clones transformés par les plasmides pTG8732, pTG8733 et pTG8734 portant respectivement les inserts D64, RI 3 et Jl

L'analyse par Southern d'une réplique d'un gel de chromosomes de levure (exemple 1A) à l'aide des inserts marqués indique que RI 3 est issu du chromosome IX

D. Analyse des inserts sélectionnés.

Leur séquence a été déterminée directement sur les plasmides double brin selon la technique de Sanger et al. (1977, Proc. Natl. Acad. Sci. USA, 74, 5463-5467). L'analyse des données montre la présence d'éléments consensus transcriptionnels (voir Tableau 1).

Tableau 1

Légende : Les positions sont données pai l appoi t au piemiei nucléotide (dans la duection 5' • 3') de la SI.Q ID coπcspondante, ou, loisque c est indiqué, du brin complémentaiic

1 ' Pour plus de détails siu les motifs CΛΛT bo\, TΛTΛ bo\, riches en C et T, CΛΛG et CΛSΛCΛ, se référer a Dobson et al ( 1982, Nucleic Λcids Res , / 0, 2625-2637)

La comparaison avec les séquences de la banque de données Genbank montre que les inserts D64 et R13 portent une séquence jusqu'alors non répertoriée. En ce qui concerne Jl, il correspond à des séquences situées en 3' du gène COX4 de Saccharomyces cerevisiae, dans une région où la présence d'un promoteur est inattendue puisque située en aval de séquences codantes.

S'agissant de rechercher les cadres de lecture putatifs (ORF), on note la présence d'un ORF de 96 acides aminés (aa) dans la première moitié 5' de D64 et de deux ORFs de petite taille (57 et 25 aa) couvrant respectivement les extrémités 5' et 3' de Jl .

EXEMPLE 2 : Vecteur d'expression du gène GUS sous le contrôle des inserts précédents.

L'activité de promoteur transcriptionnel est évaluée vis à vis du gène GUS dont le produit d'expression est facilement mesurable. En effet, son activité enzymatique peut être détectée par colorimétrie, dosage fluorométrique sur des extraits cellulaires (Jefferson et al., 1987, Molecular Biology Reporter, 5, 387-405) ou par test histochimique sur filtres Nylon (Hirt, 1991,Current Genetics, 20, 437-439).

A. Isolement des inserts sélectionnés.

Les inserts sont isolés par PCR à partir des vecteurs pTG8732 (portant D64), pTG8733 (RI 3) et pTG8734 (Jl) et à l'aide d'amorces munies d'un site de restriction Clal en 5' de l'amorce sens et Sali en 5' de l'antisens. Celles-ci sont indiquées dans les identificateurs de séquence 6 à 9 (oTG6302 et oTG6293 pour D64 ; oTG6292 et oTG6293 pour R13 et oTG6298 et oTG6293 pour J 1).

B. Caractérisât ion de sons-fragments des inscris sélectionnés.

L'insert RI 3 dépassant 1 kb, il peut être utile de disposer de sous-fragments de taille réduite donc plus facilement manipulables et retenant néanmoins une activité de promoteur transcriptionnel. Les régions 5' et 3' de RI 3 sont isolées de pTG8733 à l'aide des amorces oTG6292 et oTG6294 (SEQ ID NO: 10) et oTG6301 (SEQ ID NO: 1 1) et oTG6293 respectivement. Le fragment de 416 pb recouvrant la partie 5' est désigné RI 3.2 alors que celui correspondant à la moitié 3' d'une longueur de 599 pb est nommé R13.3. D'autres sous-fragments ont été crées par délétion progressive de la région 5' (voir exemple 5 ci-après).

Dans le cas de Jl, l'insert est délété en 3' afin d'éliminer l'ORF putatif de 25 aa et, notamment, son ATG initiateur susceptible d'interférer avec la traduction de la protéine d'intérêt. On isole un fragment de 547 pb (J1.2) dépourvu de séquences codantes putatives par amplification à partir de pTG8374 et des amorces oTG6298 et oTG6299 (SEQ ID NO: 12).

C. l 'ecteurs d'expressio multicυpies

Le vecteur de base désigné pTG10231 (Figure 2 , Degryse et al., Yeast, sous presse) est issu de pTG3828 (Achstetter et al., 1992, supra). Il comprend trois origines de replication, de levure (2μ), bactérienne (ori) et enfin phagique (f.ori permettant la production d'ADN simple brin) ainsi que deux marqueurs de sélection

(gènes URA3-d et Amp). A titre indicatif, le gène URA3-d correspond au gène

URA3 délété de son promoteur assurant de ce fait un grand nombre de copies de plasmide dans le cellule. Enfin, il porte une cassette d'expression dans laquelle les séquences codant pour la protéine GUS (Jefferson et al., 1986, Proc. Natl. Acad.

Sci. USA, 83, 8447-8451) sont placées sous le contrôle du promoteur du gène

CYC1 et du terminateur PGK (Hitzeman et al., 1983, supra). Il est à la portée de l'homme de l'art de générer un tel vecteur à partir des données de la littérature.

Le vecteur pTG10231 est digéré par Clal et Sali afin d'éliminer le fragment portant

le promoteur CYCl. Les fragments amplifiés (correspondant aux inserts et leurs sous-fragments respectifs) sont clones dans le vecteur linéarisé. On sélectionne des clones présentant des plasmides ayant un profil de restriction correct nommés respectivement pTG8784 (portant D64), pTG8781 (RI 3), pTG8785 (Jl), pTG8782 (R13.2), pTG8783 (R13.3) et pTG8786 (Jl .2).

Un témoin négatif est généré par digestion de pTG 10231 par Clal et Sali, traitement à la Klenow et religation. Ce témoin dépourvu de promoteur est désigné pTG8793.

Il est également utile de comparer les séquences promotrices de la présente invention à d'autres promoteurs, soit réputés forts comme ceux des gènes MF al et PGK ou plus faibles comme le promoteur du gène KEX2 (Fuller et al., 1989, Proc. Natl. Acad. Sci. USA, 86, 1434-1438). Les séquences correspondantes sont obtenues par PCR :

pour le promoteur du gène KEX2 : amplification d'un fragment de 524 pb à partir de pTG9895 et des amorces oTG6304 (SEQ ID NO: 13) et oTG6293. A titre indicatif, pTG9895 est obtenu par insertion dans le site BamHl de pTG9852 (exemple 1 ) d'un fragment PCR portant le promoteur du gène KEX2. Ce dernier est amplifié à partir de la matrice pTG4812 (décrite dans EP 396 436) et des oligonucléotides oTG5739 et oTG5740 (SEQ ID NO: 14 et 15),

pour le promoteur du gène MF al : amplification d'un fragment de 974 pb à partir d'une préparation d'ADN génomique de la souche de levure FL 100 (ATCC 28383) et des amorces oTG6929 et oTG6930 (SEQ ID NO: 16 et 17), et

pour le promoteur du gène PGK : amplification d'un fragment de 779 pb à partir d'une préparation d'ADN génomique de la souche de levure FL 100 et des amorces oTG7002 et oTG6928 (SEQ ID NO: 18 et 19).

Les fragments amplifiés sont ensuite insérés entre les sites Clal et Sa/l du vecteur pTG10231 à la place du promoteur CYCl, pour donner respectivement pTG8780 (KEX2), pTG8789 (MFα l) et pTG8791 (PGK).

D. Vecteurs d'expression monocopies.

Le vecteur pTG8795 (Figure 3) est l'équivalent du vecteur pTG10231 mis à part qu'il comprend une unité de replication autonome ARSH6-CEN4 (Sikorski et Hieter, 1989, Genetics, 122, 19-27) à la place de l'origine 2μ et le gène UPA3 à la place de UM3-d.

Les fragments promoteurs sont introduits dans pTG8795 par recombinaison homologue en remplacement du promoteur CYCl. Pour ce faire, la souche E. coli BJ5183 (endA, sbcBC, galK, met, thi-1, bioï, hsdR, strR) est co-transformée par un des plasmides obtenus à l'étape précédente (plasmides donneurs pTG8781 à pTG8786) digérés par S αl et, d'autre part, le vecteur de base pTG8795 (plasmide receveur) linéarisé par Notl. Une première analyse du profil de restriction est faite sur les clones générés afin de sélectionner ceux présentant le profil attendu (désignés pTG9704 (D64), pTG9701 (R13), pTG9705 (Jl), pTG9702 (R13.2), pTG9703 (RI 3.3) et pTG9706 (J1.2)). Leur contenu plasmidique est ensuite transféré dans la souche 5K afin d'obtenir des quantités supérieures d'ADN plasmidique.

On procède de même pour générer les témoins positifs en utilisant les vecteurs témoins précédents (pTG8780...) à titre de vecteurs donneurs. On génère pTG9700 (KΕX2), pTG8799 (PGK) et pTG971 1 (MFα). Le témoin négatif pTG9713 provient de pTG8795 clivé par les enzymes Clal et Sal , traité par la Klenow et religué sur lui-même.

EXEMPLE 3 Evaluation de l'expression du gène GUS.

Les constructions de l'exemple 2C et D sont utilisées pour transformer la souche TGY73.4 ou W303α (MATa, ιιra3, leu2, his3, trpl, ade2 ; Crivellone et al., 1988, J. Biol. Chem., 263, 14323-14333). On peut évaluer l'expression du gène GUS directement sur les colonies résultant de la transformation par une technique semi- quantitative décrite par Hirt ( 1991, supra) dont le protocole a été modifié comme indiqué ci-après. Une portion de colonie est prélevée au cure-dent et déposée sur membrane Nylon N (Amersham). Après congélation 10 min à -80°C, les colonies sont décongelées sur papier 3M Whatman imbibé de tampon Na,HPO 50 mM pH7 contenant du réactif 5-bromo-4-chloro-3-indolylglucuronide (X-gluc) à 50 μg/ml (dilution d'une solution stock à 5 mg/ml dans du DMSO, diméthylsulfoxide). La réaction se déroule dans l'obscurité à 37°C. Les colonies produisant la protéine GUS apparaissent en bleu, l'intensité et la rapidité d'apparition de la coloration étant d'autant plus fortes que le niveau d'expression est élevé.

Afin de disposer de mesures plus quantitatives, les levures transformées sont cultivées en milieu liquide (YNBG + cas) à 28°C. On prélève un échantillon de culture (10 ml) au cours de la croissance, les cellules sont récupérées par centrifugation et reprises dans 500 μl de tampon d'extraction GUS additionné de 1 mM de Péfabloc (Jefferson et al., 1987, supra), avant d'être broyées pendant 15 min (broyeur Retsch). Le broyât est ensuite centrifugé 10 min à 10000 rpm à 4°C. La concentration protéique est dosée sur le surnageant (kit Biorad) et l'activité enzymatique de la protéine GUS déterminée par fluorimétrie en utilisant le substrat méthyl umbelliferyl β-glucuronide. On note généralement une différence dans les rendements d'extraction en protéines entre les souches TGY73.4 et W303α. Cependant les activités GUS ramenées à la quantité de protéines sont comparables dans les deux souches.

La Figure 4 présente les niveaux d'activité de la protéine GUS produite dans la souche TGY73.4 transformée par les vecteurs multicopies de l'exemple 2C. A titre indicatif, les prélèvements sont effectués en phase stationnaire de croissance et

l'activité GUS est donnée en nmoles de méthyl umbelliférone (MU) produite par min et mg de protéine. L'insert RI 3 a une activité promotrice nettement supérieure à celle mesuré avec tous les fragments testés ainsi que le promoteur KEX2 (facteur 58). L'insert D64 peut également être considéré comme un promoteur fort aux vues des niveaux de protéine GUS produits sous son contrôle (28 fois supérieurs à ceux obtenus avec le promoteur KEX2). En revanche, les capacités promotrices de l'insert complet J 1 sont du même ordre de grandeur que KEX2 (à un facteur 2 près). Cependant la délétion de l'ORF de 25 aa situé en son extrémité 3' s'avère avantageuse puisque l'activité promotrice du sous-fragment J 1.2 est nettement améliorée. Quant au sous fragment R13.3, il conserve une activité promotrice importante bien qu'inférieure à l'insert complet dont il dérive alors que le sous- fragment R13.2 constitue un promoteur très faible. Bien que les données ne soient pas représentées, aucune activité GUS n'est mesurée avec les témoins négatifs (souche TGY73.4 non transformée ou transformée par le plasmide pTG8793).

La Figure 5 résume les données concernant les vecteurs monocopies de l'exemple 2D (prélèvement à une DO600nm d'environ 1). On retrouve un profil à peu près comparable. Les niveaux d'activité GUS obtenus sous le contrôle de l'insert R13 complet dépassent largement ceux produits à partir des clones testés ainsi que des promoteurs PGK et MF al réputés forts. L'activité promotrice des inserts D64 et J 1.2 est du même ordre de grandeur que celle des promoteurs de référence PGK et MF al. Enfin, la capacité transcriptionnelle de RI 3.3, bien que notable, est inférieure à celle déterminée avec l'insert complet. Dans cette expérience, la faible activité du promoteur CYCl s'explique par la quantité importante de glucose dans le milieu de culture car les prélèvements sont effectués en phase exponentielle.

La caractérisation de la protéine GUS produite par les différentes levures transformées a été réalisée par gel SDS PAGE 7,5% (système mini-protéan II dual slab cell, Biorad). On met en évidence dans les levures contenant pTG8784, pTG8781 et pTG8786, après coloration au bleu de Comassie, une bande d'un poids moléculaire attendu (68 kDa) correspondant au produit d'expression du gène GUS,

qui représente environ 5% des protéines totales de l'extrait.

La capacité de régulation de ces fragments promoteurs peut être étudiée en fonction des conditions de croissance et de culture (mesure de l'activité à différents temps de culture, addition de nutriments spécifiques dans le milieu de culture, comme le glucose, la thiamine...). En particulier, le niveau d'activité GUS produit par des souches TGY73.4 transformées par les vecteurs monocopies a été déterminé en fonction de la croissance des levures en milieu minimum. L'insert RI 3 est actif en tout début de phase exponentielle et son activité décroit au fur et à mesure que la DO 600 nm augmente. Le sous-fragment J.12 présente un comportement similaire. S'agissant de D64, son activité promotrice est également moindre en phase stationnaire mais le profil observé est légèrement différent dans le sens où l'activité maximale se situe au milieu de la phase exponentielle (profil en cloche). Par contre, l'activité promotrice du sous-fragment RI 3.3 est augmentée en phase stationnaire (comme cela est observé avec le promoteur CYCl).

En conclusion, ces expériences ont permis d'isoler et de caractériser des promoteurs de levure de force et de régulation variables capables de promouvoir l'expression de gènes hétérologues

EXEMPLE 4 - Influence du milieu de culture sur les activités promotrices

Les vecteurs monocopies pTG9704 (D64), pTG9706 (J1.2) et pTG9701 (RI 3) ont été cultivés dans 3 milieux différents, en parallèle avec le plasmide pTG9707 équivalent aux précédents mis à part que c'est le promoteur TEF1 (Cottrelle et al., 1985, supra) qui dirige l'expression du gène GUS. L'étude est réalisée sur milieu défini YNBG+cas à base de glucose, milieu riche YPG et milieu défini oxydatif YNBGly+cas dont la source de carbone est le glycerol. Deux prélèvements sont effectués en phase exponentielle de croissance (DO^- 1). Les activités GUS sont mesurées en fluorimétrie sur les extraits protéiques acellulaires de chaque

échantillon (Figure 6)

Les extraits protéiques des clones correspondant aux trois inserts promoteurs de l'invention présentent tous une activité GUS réduite de 50% sur milieu YNBGly+cas, en comparaison avec le milieu glucose YNBG+cas En revanche, l'activité GUS contrôlée par le pTEFl est identique sur les milieux YNBG+cas et YNBGly+cas, confirmant que ce promoteur est efficace sur les deux sources de carbone contenues dans ces milieux de culture En outre, indépendamment de la construction (y compris pTG9707), l'activité GUS est moindre sur YPG que sur YNBG+cas

L'activité optimale des fragments promoteurs D64, Jl 2 et RI 3 semble être obtenue en milieu défini avec du glucose comme source de carbone Cependant, comme indiqué précédemment (exemple 3), l'activité décroît régulièrement au cours de la croissance au fur et à mesure que le glucose disparait du milieu de culture, (réduction du niveau de production GUS d'un facteur 2 en phase stationnaire) On indique que sur milieu défini glycerole (YNBGly+cas), une telle vaπation d'activité n'est pas observée durant la croissance cellulaire (niveau GUS constant)

EXEMPLE S Etude de sous-fragments de l'insert R 1

Des délétions progressives en 5' ont été réalisées à partir du fragment RI 3 dans le but d'identifier un insert promoteur de taille minimale et d'activité optimale Le fragment RI 3 9 est amplifié par PCR à partir du pTG9701 (Exemple 2D) à l'aide des oTG 7659 et 7234 (SEQ ID No 20 et 21) et permet de générer pTG9754 après clonage sous forme d'un fragment Clal-Sall dans le vecteur d'expression monocopie du gène GUS. RI 3 9 correspond à RI 3 délété de 80 pb en 5' L'insert R13.5 est également amplifié par PCR à partir de la matrice pTG9701 à l'aide des oligonucléotides oTG7422 (SEQ ID No. 22) et oTG7234, et donne lieu au vecteur

d'expression GUS pTG9719. R13.5 correspond à une délétion de 190 pb en 5' de l'insert R13. Le sous-fragment RI 3.6, qui est obtenu à l'aide des amorces oTG7423 (SEQ ID NO: 23) et oTG7234 résulte d'une délétion de 300 pb en 5' du RI 3. Son clonage dans le plasmide d'expression monocopie GUS génère pTG9720. Enfin, le fragment R13.3, déjà décrit, comprend une délétion de 450 pb en 5' de R13.

Les levures TGY73.4, respectivement transformées par les plasmides pTG9701 (RI3), pTG9754 (R13.9), pTG9719 (R13.5), pTG9720 (R13.6) et pTG9703 (R13.3), sont cultivées en milieu défini YNBG+cas et récoltées à DO Λ ) - l . La Figure 7 représente les activités GUS correspondant aux moyennes des mesures fluorimétriques à DO^,- 1 (trois clones testés par contruction).

L'insert d'origine RI 3 présente une activité GUS de 225 U/mg en phase exponentielle de croissance. La délétion d'environ 100 pb en 5' générant R13.9 s'accompagne d'une perte d'activité d'environ 40% (140 U/mg). Par contre, l'activité promotrice augmente de manière significative après une délétion supplémentaire d'environ 100 pb (R13.5) (activité GUS de 290 U/mg dépassant celle obtenue avec RI 3 et RI 3.9), ce qui laisse supposer que la région délétée comprend un élément potentiel de régulation négative de l'expression génique. Enfin, des delétions supplémentaires en 5' (R13.6 et R13.3) réduisent considérablement l'activité promotrice (95% de perte par rapport à RI 3.5). En effet, la zone délétée contient les motifs de séquences consensus de fixation du produit activateur / répresseur codé par le gène RAP1 de S. cerevisiae. En conclusion, le fragment R13.5 présente une activité promotrice maximale qui peut être utilisée pour l'expression du gène d'intérêt.

LISTE DE SEQUENCES

(1) INFORMATION GENERALE:

(i) DEPOSANT:

(A) NOM: Transgene S.A.

(B) RUE: 11 rue de Molsheim

(C) VILLE: Strasbourg

(E) PAYS: France

(F) CODE POSTAL: 67082

(G) TELEPHONE: (33) 88 27 91 00 (H) TELECOPIE: (33) 88 22 58 07

(ii) TITRE DE L' INVENTION: Nouveaux promoteurs pour l'expression de protéines d'intérêt dans la levure

(iii) NOMBRE DE SEQUENCES: 23

(iv) FORME LISIBLE PAR ORDINATEUR:

(A) TYPE DE SUPPORT: Tape

(B) ORDINATEUR: IBM PC compatible

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS

(D) LOGICIEL: Patentin Release #1.0, Version #1.25 (OEB)

(2) INFORMATION POUR LA SEQ ID NO: 1:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 1016 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(iî) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(A) ORGANISME: Saccharomyces cerevisiae (C) INDIVIDUEL ISOLE: R13

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1:

GATCAATTGT GATTCCATGA ACTCAGAAAC AACTCGCCTA AGAAACTGTC TAAATTTTTA 60

TGCACTAAAT AGACCACAAA TGAGAACGTA AAGAGAAGCT TTTATCATTT TATTTCTCTT 120

CTCCTTAGGA GGAAATACAA ATATCTTTTC TACATTTAAT TCAATCTGAC AGTCAAAGTT 180

A ACATATAC ATTATACCGA TTACCAAGTT TTCAGACTAG AACCCATACA TTATTTTACA 240

AACCCAGACA GTACACTATA CAAAAACCCA AGCAATTGCA ATCAATTTTT TTGCACGAAA 300

ATTTTATTCG AAATCGCCAA CCCGCTAGGA GAAAAAGAAG GAATTCTCAA AGGAGAGGCT 360

GGACAGAGAG GTCGTCCCAG TCTACCGCCT ACGAGTAATG TTGGATACTA AGCAGTTCCC 420

AGCCTGAACG CTCTGCTGGA TGGGTGGAGA TTTCCCTCCA GGCGGGAACA CTCCTGGTGG 480

ATTCTGCTCT GGAAACTATG CCTGTGCATG CTACCAGGTT CAAATAATCT TTCAATACTT 540

GACAAAAGTA GATATACATA TTTTAAAAGA TTAGATTACT ATTGATAAAT CTACTATTTG 600

TCATAAACTC ACCAAGAAAC CACAAAGTTA TTGAACAATG GGTATGTTTT TATTATATCG 660

CATAATTATG GCAAATGTTA TGAAGGATTC CTCTATGACT TAGATGTTTT GAATCGGTAC 720

ATTTTATTTT CAGTATCCTT CTGCATATTA CAAGGCAACA TAGCAGCGGA CAAGAAAGCG 780

TTTTTTGATG TTCGTCTTCG AAACGATTAC TATCAGGGTC TTTTAAATGC TATATCGGGA 840

CTTATTGAAA TTGACATATT ACACTTATGA ATGACGTTGG CTATCAAAGT ATGAGAATAA 900

GCCTTTCCTA CTATTTTGTA TCATGACAAC AGGGTTCTGT CGCTTTGAAT GCGGCCTTTT 960

ACTTTGCCAT ATTTTGATAA TGAAAAAACT TTCGAGAAAT ATTTACTAAC AGGATC 1016

(2) INFORMATION POUR LA SEQ ID NO: 2:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 617 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

( i) ORIGINE:

(A) ORGANISME: Saccharomyces cerevisiae (C) INDIVIDUEL ISOLE: D64

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2:

GATCTTGATG TCTATACCAA CCATGCATGA TTTCCTATTG TGCGTGCCTT ATTTACGCAC 60

GTTTTTCAAC ATACGGCTCT ATCACCGAAG GCGCTCAAGA GCAGAATAAT ATGACCGTCA 120

TTCATTTCAA ACCCATACAC AATGAACCTT ATCACACCCA AACATATGAT ATGGTATTAA 180

AAAATGAAAA AAATTCATTA TTCTTTAGCG TAATTATTGA AGAAAAAACA GTGCGCGCGG 240

TAATTTTTTG TCACTCAGTA ACTAGAGAGA AGCCGAATGT ACTCCCCCGG CTAGCTGGAG 300

ACCATGGCTC TGCCTAGGAT TTCTCTTATG CTTTCCTTTC ACCAATCACT TTGTTCCGGC 360

GAGGCTCCGC GGAGCTCGCT TTCTTTCAGC CTAGCAATCA TGTTCTTGCC AGCGTCGTAG 420

ACTACTGTAT GGCAGTTGCT GCACTTGCCA TGAATATCCT AGTGAAGCCT CTATGCAATA 480

ATCCAGTTAC TGCGTTAGAA TCCTGGTAAA ATGTCTAATC TTATTACATT ACAGCAACGT 540

ATTAGATTTT GATTGAAAAT TAGTCCTTGC GACTTGGTAT ATATCTTATT TTAAGAAAGC 600

TGAAAGGAAG AAAGATC 617

(2) INFORMATION POUR LA SEQ ID NO: 3 :

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 609 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(A) ORGANISME: Saccharomyces cerevisiae (C) INDIVIDUEL ISOLE: Jl

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 3:

GATCGAGAAA AGGTCGAGAT ATATTTTTAT TTAAAAATTC TTATTAATAT TAGTACTATT 60

CATGTCATAA CTGATTACTA TTTCTATCTC TGTCAGAGAT GGCTAGCTAG AGGTTGTTGC 120

GAAGTTACTT CCAAAAGATT CTAGACTGTG CTTACAGCAT CCATACACCC ACCCATACAT 180

ACTGATTTCT TTTTTTAAAG ACGTCGATTT TTCGAAAAAA GTAAATTCTC GGCACAGGGA 240

GTTGAATTGA ACTTCCCTGC CCCGACGGTA AGCAGCTTAC CGGTATTGCT TCGTTCTCCT 300

TGGGAGATGT TCTCGGCTCT GGAAGGAAAA AACCTTCGTG GGGGGAGGGC TCATATCCAG 360

TAACATAGGC GGAACTCGAA GTGTCAGCTT ACACCGCTTC GTTCTCATTG AGTGTTGAGG 420

GATTACTTGG TATTTGAAAT ACCTACTAGA TTTAATGTTC GTTATAGTAA ATGATTTAAT 480

TTGTTCGCTA TTACAGATAA AAGAACCATA GTCTTAAGTA GTATGTTAAC GACACAAAAG 540

TGTGAAAGTA GAGAAGGGAA GAACGATGAG ATCCGTCGAC CTGCAGATCA ATTCGAAATG 600

ACCGAGATC 609

j_-

(2) INFORMATION POUR LA SEQ ID NO: 4:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 30 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG5427

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4:

GGAAGCATAT TTGAGAAGAT GCGGCCAGCA 30

(2) INFORMATION POUR LA SEQ ID NO: 5:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 30 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: OUI

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG5428

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5:

ATTCCGAAGC CCAACCTTTC ATAGAAGGCG 30

(2) INFORMATION POUR LA SEQ ID NO: 6:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 35 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(ni) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6302

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6:

GAAGCTATCG ATTTTGATGT CTATACCAAC CATGC 35

(2) INFORMATION POUR LA SEQ ID NO: 7:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 32 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: OUI

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6293

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7:

TGGTCGGTCG ACTCGAATTG ATCTGCAGGT CG 32

(2) INFORMATION POUR LA SEQ ID NO: 8:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 32 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6292

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8:

CTTGGCATCG ATTTGTGATT CCATGAACTC AC 32

(2) INFORMATION POUR LA SEQ ID NO: 9:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 35 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6298

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9:

GAAGCTATCG ATTGAGAAAA GGTCGAGATA TATTT 35

(2) INFORMATION POUR LA SEQ ID NO: 10:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 34 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: OUI

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6294

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10:

TTAGTAGTCG ACATTACTCG TAGGCGGTAG ACTG 34

(2) INFORMATION POUR LA SEQ ID NO: 11:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 36 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

( i) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6301

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11:

ATTTCCATCG ATGCGGAACA CTCCTGGTGG ATTCTG 36

(2) INFORMATION POUR LA SEQ ID NO: 12:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 35 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: OUI

(v ) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6299

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12:

TGTGTCGTCG ACTTACTACT TAAGACTATG GTTCT 35

(2) INFORMATION POUR LA SEQ ID NO: 13:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 35 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi ) ORIGINE :

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6304

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13:

GTAGCTATCG ATACGTAATA TATTTCCTCA CTTTC 35

(2) INFORMATION POUR LA SEQ ID NO: 14:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 35 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG5739

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14:

TCTTCGGATC CTTTTATTTT TACTATACAT ACATA 35

(2) INFORMATION POUR LA SEQ ID NO: 15:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 34 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

( ii ) TYPE DE MOLECULE : ADN ( génomique )

( iii ) HYPOTHETIQUE : NON

(iii) ANTI-SENS: OUI

(Vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG5740

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15:

TACTTGGATC CGTAATATAT TTCCTCACTT TCAT 34

(2) INFORMATION POUR LA SEQ ID NO: 16:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 39 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(lli) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6929

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16:

GAATTCTATC GATAAGATTT AAAGGTATTT GACAAGTAG 39

(2) INFORMATION POUR LA SEQ ID NO: 17:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 37 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: OUI

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6930

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17:

GGAAATGTCG ACCTTTTAAT CGTTTATATT GTGTATG 37

(2) INFORMATION POUR LA SEQ ID NO: 18:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 40 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG7002

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18:

CCTGACATCG ATTCAAGACG CACAGATATT ATAACATCTG 40

(2) INFORMATION POUR LA SEQ ID NO: 19:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 38 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: OUI

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG6928

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19:

GATAAAGTCG ACGTTTTTAT ATTTGTTGTA AAAAGTAG

(2) INFORMATION POUR LA SEQ ID NO: 20:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 28 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG7659

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20:

GACCACAAAT CGATACGTAA AGAGAAGC 28

(2) INFORMATION POUR LA SEQ ID NO: 21:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 25 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: OUI

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG7234

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21:

CACGGGTTGG GGTTTCTACA GGACG 25

(2) INFORMATION POUR LA SEQ ID NO: 22:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 31 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG7422

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22:

CAT ATATCG ATTACCAAGT TTTCAGACTA G 31

(2) INFORMATION POUR LA SEQ ID NO: 23:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 36 paires de bases

(B) TYPE: acide nucléique

(C) NOMBRE DE BRINS: simple

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(iii) ANTI-SENS: NON

(vi) ORIGINE:

(C) INDIVIDUEL ISOLE: oligonucleotide de synthèse OTG7423

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23:

ATTCGAAATC GATAACCCGC TAGGAGAAAA AGAAGG 36