Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
ARCHAEBACTERIUM INTEIN OF THE $i(THERMOCOCCUS FUMICOLANS) SPECIES
Document Type and Number:
WIPO Patent Application WO/1998/049275
Kind Code:
A2
Abstract:
The invention concerns an intein derived from an archaebaterium of the $i(Thermococcus fumicolans) species and a nucleic acid sequence of its recognition sequence and their use in particular in genetic engineering processes.

Inventors:
MASSON JEAN-MICHEL (FR)
SAVES ISABELLE (FR)
OZANNE VALERIE (FR)
QUERELLOU JOEL (FR)
DIETRICH JACQUES (FR)
Application Number:
PCT/FR1998/000868
Publication Date:
November 05, 1998
Filing Date:
April 29, 1998
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
APPLIGENE ONCOR S A (FR)
MASSON JEAN MICHEL (FR)
SAVES ISABELLE (FR)
OZANNE VALERIE (FR)
QUERELLOU JOEL (FR)
DIETRICH JACQUES (FR)
International Classes:
C12N9/12; C12N15/54; (IPC1-7): C12N9/12
Foreign References:
EP0701000A21996-03-13
EP0602899A21994-06-22
Other References:
CAMBON M, QUERELLOU J.: "Gene organization of DNA polymerase of the Archaeon Thermococcus fumicolans" EMBL DATABASE,31 octobre 1996, XP002086312 HEIDELBERG, DE
HODGES R. A. ET AL: "PROTEIN SPLICING REMOVES INTERVENING SEQUENCES IN AN ARCHAEA DNA POLYMERASE" NUCLEIC ACIDS RESEARCH, vol. 20, no. 23, 1992, pages 6153-6157, XP002033279 cité dans la demande
PIETROKOVSKI S: "A new intein in cyanobacteria and its significance for the spread of inteins" TRENDS IN GENETICS, vol. 12, no. 8, août 1996, page 287-288 XP004037128
GODFROY A. ET AL.: "Thermococcus fumicolans sp. nov.: a new hyperthermophilic archaeon isolated from a deep-sea hydrothermal vent in the north Fiji basin" INTERNATIONAL JOURNAL OF SYSTEMATIC BACTERIOLOGY, vol. 46, no. 4, octobre 1996, pages 1113-1119, XP002049496 WASHINGTON US cité dans la demande
PERLER F. B. ET AL: "INTERVENING SEQUENCES IN AN ARCHAEA DNA POLYMERASE GENE" PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF USA, vol. 89, juin 1992, pages 5577-5581, XP002033280
Attorney, Agent or Firm:
Breese-majerowicz (Paris, Paris, FR)
Download PDF:
Claims:
REVENDICATIONS
1. Intéine de l'archæbactérie Thermococcus fumicolans.
2. Intéine selon la revendication 1 ayant une activité endonucléasique et/ou une activité protéasique et ses dérivés fonctionnellement équivalents.
3. Intéine selon l'une quelconque des revendications précédentes, dont la séquence en acides aminés est représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO : 1.
4. Protéine constituée par ou comprenant la séquence d'acides aminés formant une intéine selon l'une quelconque des revendications 1 à 3.
5. Séquence d'ADN codant pour une intéine ou une protéine selon les revendications 1 à 4.
6. Séquence d'ADN selon la revendication 5, caractérisée en ce qu'elle répond à la séquence d'acides nucléiques donnée dans la liste de séquences en annexe sous le numéro SEQ ID NO : l.
7. Vecteur comprenant une séquence d'ADN selon l'une des revendications 5 ou 6.
8. Hôte cellulaire transformé par un vecteur selon la revendication 7.
9. Procédé de production d'une intéine de l'archaebactérie Thermococcus fumicolans, consistant à : a) transférer une séquence d'acides nucléiques selon la revendication 5 ou 6 ou un vecteur selon la revendication 7 pour obtenir un hôte cellulaire selon la revendication 8, b) cultiver l'hôte cellulaire obtenu à l'étape a) dans des conditions permettant la production de l'intéine désirée, c) isoler et purifier par tout moyen approprié l'intéine produite à l'étape b).
10. Procédé de production d'une intéine de l'archæbactérie Thermococcus fumicolans consistant à isoler et purifier par tout moyen approprié une intéine issue de l'épissage catalytique de l'ADN polymérase de Thermococcus fumicolans.
11. Utilisation d'une intéine ou d'une protéine selon les revendications 1 à 4 comme endonucléase.
12. Utilisation d'une intéine ou d'une protéine selon les revendications 1 à 4 comme protéase.
13. Séquence nucléotidique constituant un site de reconnaissance et de coupure d'une intéine ou d'une protéine selon l'une quelconque des revendications 1 à 4, caractérisée en ce qu'elle répond à la séquence donnée dans la liste de séquences en annexe sous le numéro SEQ ID NO : 2.
14. Acide nucléique, éventuellement recombinant, caractérisé en ce qu'il comprend une ou plusieurs séquences nucléotidiques selon la revendication 13.
15. Utilisation d'une séquence nucléotidique selon la revendication 13 pour la préparation d'un vecteur destiné au clonage de gènes.
16. Utilisation d'un acide nucléique selon la revendication 14 pour la préparation d'une banque gnomique ou d'un chromosome artificiel.
17. Procédé de transformation d'un hôte par un fragment polynucléotidique hétérologue consistant à : a) introduire dans le génôme hôte une séquence nucléotidique selon la revendication 13, b) provoquer une coupure dans ledit génôme à l'aide d'une intéine selon l'une des revendications 1 à 4, c) introduire au niveau de la coupure un fragment polynucléotidique hétérologue dont les extrémités sont homologues à celles qui entourent le site de coupure.
Description:
INTÉINE D'ARCHAEBACTERIE DE L'ESPECE THERMOCOCCUS FUMICOLANS La présente invention concerne une intéine provenant d'une archæbactérie-de l'espèce Thermococcus fumicolans ainsi que la séquence en acides nucléiques de son site de reconnaissance et leur utilisation, notamment dans des procédés de génie génétique.

L'intéine de l'invention provient d'une archaebactérie de l'espèce Thermococcus fumicolans Cette bactérie produit deux intéines : I-Tfu-l et I-Tfu-2. La séquence nucléotidique de ces deux intéines est insérée dans celle de 1'ADN polymérase de Thermococcus fumicolans, au niveau de sites conservés, impliqués après traduction, dans les réactions catalytiques. Ces séquences sont transcrites et traduites en même temps que celle de 1'ADN polymérase et l'épissage autocatalytique des intéines produit alors trois enzymes : deux intéines, I-Tfu-1 et I-Tfu-2, et une ADN polymérase.

On trouve des intéines également au sein d'autres protéines, telles l'ATPase vacuolaire chez S. cerevisiae (1), GyrA chez Mycobacterium leprae (2), Rec A chez Mycobacterium tuberculosis (3,4).

Comme indiqué précédemment, les intéines sont définies comme des introns protéiques qui sont épissés, non pas au niveau de l'ARN messager, mais au niveau d'une maturation protéique. Elles relèvent donc d'un seul gène traduit et transcrit en une seule étape, et constituent des sous-produits de la maturation de la protéine codée par ce gène (5).

Les Inventeurs ont de plus mis en évidence chez les intéines de Thermococcus fumicolans et notamment chez I-Tfu-2, une activité dendonucléase de restriction thermostable.

Un premier objet de la présente invention concerne donc une intéine de l'archæbactérie Thermococcus fumicolans L'objet de l'invention consite plus particulièrement en une interne de l'archagbactérie Thermococcus fumicolans. ayant une activité endonucléasique et/ou protéasique et ses dérivés fonctionnellement équivalents.

L'invention est en conséquence aussi relative : -à une intéine dont la séquence en acides aminés est identique ou équivalente à la séquence représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO : 1 et, -à une protéine constituée ou comprenant la séquence d'acides aminés formant une intéine selon la présente invention.

L'invention concerne également une séquence d'ADN constituée par ou comprenant la séquence codant pour une intéine de l'invention.

Une séquence d'ADN codant pour l'intéine I-Tfu- 2 et la séquence en acides aminés correspondante sont représentés dans la séquence SEQ ID NO : 1 en annexe. I- Tfu-2 présente un poids moléculaire de 44 765 Da déduit de la séquence de 389 acides aminés de la séquence SEQ ID NO : 1.

L'invention concerne autant ces intéines thermostables isolées et purifiées de la souche Thermococcus fumicolans que des intéines préparées par synthèse chimique ou encore par les méthodes du génie génétique.

Dans le cadre des méthodes de biologie moléculaire, l'invention a aussi pour objet un vecteur comprenant une séquence d'ADN définie précédemment, un hôte cellulaire transformé par un tel vecteur, ainsi

qu'un procédé de production ou d'expression dans un hôte cellulaire des intéines de l'invention.

Un procédé de production d'une intéine conforme à l'invention consiste à : -transférer une séquence d'acides nucléiques codant pour l'intéine ou un vecteur contenant ladite séquence dans un hôte cellulaire, -cultiver l'hôte cellulaire obtenu à l'étape précédente dans des conditions permettant la production de l'intéine, -isoler et purifier par tout moyen approprié ladite intéine.

Le vecteur utilisé est choisi en fonction de l'hôte dans lequel il sera transféré.

L'hôte cellulaire mis en oeuvre dans le procédé précédent peut être choisi parmi les procaryotes ou les eucaryotes et notamment parmi les bactéries, les levures, les cellules de mammifères, de plantes ou d'insectes.

Un procédé supplémentaire de production d'une intéine de l'archæbactérie Thermococcus fumicolans consiste à isoler et purifier par tout moyen approprié une intéine issue de l'épissage catalytique de l'ADN polymérase de Thermococcus fumicolans.

La présente invention concerne en outre l'utilisation de l'intéine de l'invention comme endonucléase.

La présente invention concerne également la séquence d'acide nucléique reconnue et coupée par une intéine et notamment par I-Tfu-2. Le site de restriction de I-Tfu-2 se compose de 21 paires de bases et est coupé de manière spécifique pour générer des extrémités protubérantes de 4 bases en 3'comme illustré ci-dessous

5'A C G C G G A T A C A G A C G G C T T T T 3' GCGCCTATGTCTGCCGAAAA5'3'T Le site de restriction reconnu par I-Tfu-2 est représenté dans la liste de séquences en annexe sous le numéro SEQ ID NO : 2.

Les produits de la digestion par I-Tfu-2 peuvent être religués par la T4 DNA ligase, ce qui permet l'utilisation de I-Tfu-2 en génie génétique.

La présente invention concerne donc aussi un acide nucléique éventuellement recombinant comprenant le site de reconnaissance spécifique de I-Tfu-2. et l'utilisation de ladite séquence pour la préparation d'un vecteur destiné au clonage de gène.

La taille exceptionnelle du site de reconnaissance de I-Tfu-2 fait que ce site est représenté statistiquement 1 fois toutes les 4400 milliards de paires de bases. L'endonucléase I-Tfu-2 est donc particulièrement adaptée à l'étude des grands génômes.

Elle devrait avoir au plus entre 0 et 1 site dans le génôme humain ou des mammifères. Le clonage d'une banque d'ADN gnomique par ce site de restriction, via des linkers I-Tfu-2 permettrait donc de cloner des fragments de n'importe quelle taille sans risquer que ces fragments ne comportent dans leur séquence interne la séquence du site de clonage. Ils ne seront donc pas recoupés par 1'enzyme de clonage, même s'il s'agit de chromosomes artificiels. On peut donc imaginer des vecteurs de clonage spécifiquement conçus pour la réalisation de banques gnomiques et de chromosomes artificiels grâce à la présence de la séquence de reconnaissance de I-Tfu-2 qui servirait de site spécifique de clonage.

La présente invention porte donc encore sur l'utilisation d'une séquence d'acide nucléique constituant un vecteur, comportant le site de restriction

de I-Tfu-2 pour la préparation d'une banque gnomique ou de chromosomes artificiels.

De la même manière, l'introduction d'un site de reconnaissance I-Tfu-2 dans un génôme devrait aboutir à une coupure unique dans ce génome, situation très favorable pour la transgénèse par exemple. Une fois cette séquence introduite, dans un génôme par des méthodes génétiques, l'utilisation de I-Tfu-2, parallèlement à l'introduction du fragment d'ADN à transduire, provoquera une coupure unique dans le génôme, ce qui stimulera fortement la recombinaison homologue à ce site spécifique, évitant une insertion au hasard de l'ADN transformant.

Un objet supplémentaire de la présente invention consiste par conséquent à utiliser le site de restriction de I-Tfu-2 dans un procédé de transformation d'un hôte par un fragment polynucléotidique hétérologue.

Un tel procédé consiste à : a) introduire dans le génôme hôte par tout moyen approprié une séquence d'acide nucléique constituant un site de reconnaissance et de coupure d'une intéine selon l'invention, b) provoquer une coupure dans ledit génôme à l'aide d'une intéine selon l'invention, c) introduire au niveau de la coupure un fragment polynucléotidique hétérologue dont les extrémités sont homologues à celles qui entourent le site de coupure.

Il convient par ailleurs de remarquer que lorsque E. coli est transformée par un vecteur contenant la séquence nucléotidique codant pour l'ADN polymérase de Tfu et comprenant les gènes de I-Tfu-l et I-Tfu-2, cette séquence est transcrite et traduite dans son intégralité. Puis, l'épissage autocatalytique des intéines produit trois enzymes : deux intéines et une ADN polymérase. Cela signifie que les intéines de Tfu n'ont pas de toxicité

pour l'hôte, à la différence de l'une des intéines de Thermococcus litoralis (6), et en conséquence leur utilisation dans des kits utiles en génie génétique est aisée.

Les intéines possèdent donc dans leur séquence toute l'information nécessaire à leur propre épissage protéique puisqu'elles s'épissent dans E. coli.

La présente invention concerne en outre l'utilisation de l'intéine de l'invention comme protéase.

D'autres avantages et caractéristiques de l'invention apparaitront à la lecture des exemples qui suivent, donnés à titre non limitatifs et concernant le clonage, l'expression, la caractérisation et l'activité de la protéine thermostable de l'invention, et se référant aux dessins annexés dans lesquels : -la figure 1 montre différents substrats d'ADN synthétiques pour I-Tfu-2.

-la figure 2 montre le produit de la réaction de I-Tfu-2 sur des substrats d'ADN synthétiques.

-les figures 3-a à 3-f illustrent l'optimisation de l'activité endonucléase de I-Tfu-2.

-les figures 4-a et 4-b illustrent la détermination du site minimal de reconnaissance de I-Tfu- 2.

-la figure 5 montre la confirmation du site minimal de reconnaissance.

-la figure 6 montre l'abolition de l'activité "star"de I-Tfu-2 : 100 ng de chaque substrat ADN est incubé avec 1 ul de I-Tfu-2 dans 10 ul (volume final) de tampon 50 mM Tris acetate pH 8,75 mM Mg (OAc) 2 et 10 mM NH40Ac, pendant 10 minutes à 70°C.

-la figure 7 illustre l'utilisation de I-Tfu-2 pour la création d'une banque de chromosomes artificiels dans la levure.

1-MATÉRIEL ET METHODES.

1) Clonage, production et purification de I- Tfu-2.

La séquence codant pour l'intéine I-Tfu-2 a été amplifiée par PCR à partir de 100 ng d'ADN gnomique de Thermococcus fumicolans. La réaction comprenait 10 pi de tampon 10X Vent Thermopol (NEB), 10 ul de 2mM dNTP (Pharmacia), 2 unités de Vent polymérase (NEB) et 2 pi de chacun des oligonucléotides à 20 pM (TFUInt2-5' : 5'ctgtacgcatatgagtgttacaggggacacag3'et TFUInt2-3' : 5'agcgtcgacctagttgtgaacgagtattccg3') dans un volume final de 100 pl. L'amplification a été réalisée par une incubation de 2 min à 94°C puis 25 cycles (30 sec à 94°C, 30 sec à 48°C, 45 sec à 72°C) et enfin 5 min à 72°C.

Le produit d'amplification (1189 bp) comprend un site de restriction Nde I et un codon ATG insérés en phase à l'extrémité 5'du gène, et un codon TAG et un site de restriction Sal I à l'extrémité 3'. Après digestion du produit d'amplification par Nde I et Sal I (Appligene Oncor), le fragment a été inséré dans le vecteur pET26b (Novagen) coupé par les mêmes enzymes.

Pour l'expression, 50 ng du plasmide pET26b- Int2 ont servi à transformer des bactéries BL21 (DE3) pLys S électrocompétentes. Les bactéries transformées sont cultivées dans 1 litre de milieu LB complémenté avec 50 mg/1 de Kanamycine jusqu'à une absorbance à 600 nm de 0,4. On ajoute alors 0,5 mM d'IPTG (Sigma) pour induire l'expression du gène dintéine. Les bactéries sont récoltées par centrifugation (5000g, 10 min) lorsque la culture atteint une absorbance de 2 à 600 nm. Le culot bactérien est resuspendu dans du tampon 20 mM phosphate de sodium pH 7,5 et soumis à 6 cycles de congélation- décongélation dans l'azote liquide. Le lysat est centrifugé pendant 15 minutes à 10.000g et le surnageant est récupéré (Fraction I).

La fraction I est soumise à une chromatographie sur colonne d'échange d'ions Q Fast Flow (Pharmacia).

L'élution est réalisée par un gradient de Chlorure de Sodium de 0 à 1 M dans du phosphate de sodium 20 mM pH 7,5, avec un débit de 5 ml/miri. L'intéine I-Tfu-2 est éluée à 0,7 M NaCl. Les fractions contenant l'intéine sont dialysées contre un tampon 10 mM Tris-HC1, pH 7,5 ; 0,1 mM EDTA ; 1 mM DTT ; 50 mM NaCl ; 50% glycerol. De la sérum albumine bovine (BSA) est ajoutée pour atteindre une concentration finale de 200 ug/ml.

2) Séquençage des ADN.

Les séquences d'ADN ont été obtenues par la méthode de terminaison de chaine (7) en utilisant un système d'analyses automatiques d'ADN Applied Biosystems.

Les deux brins des gènes codant pour l'intéine ont été séquences en utilisant des amorces universelles localisées sur des vecteurs ainsi que des amorces internes.

L'analyse de séquence a été réalisée avec le logiciel DNASTAR (Madison, Wis., USA) et le programme de Genetic Computer Group (University of Wisconsin Biotechnology Center, Wis., USA) accessible en ligne sur INFOBIOGEN. Les recherches informatisées de similitude ont été réalisées avec le programme BLAST, les alignements multiples avec CLUSTAL V, et les arbres phylogénétiques ont été établis selon la méthode dite de "Neighbour-joining" (8).

II-Résultats.

1) Caractérisation de l'activité endonucléase de I-Tfu-2.

Pour tester l'activité endonucléase de I-Tfu-2, un substrat de 43 bp comprenant les 22 paires de bases en 5'du site d'insertion de la séquence intéine dans le

gène de la polymérase de Tfu et les 21 paires de bases en 3'de ce site (homing site) a été synthétisé chimiquement puis clone au site de restriction Xba I du vecteur pUCl9.

Cette construction est dénommée N22C21.

De la même façon, les-plasmides-N7C13, N8C13, N8C12, N8C14, N9C13 et N12C10 ont été construits (Figure 1).

100 ng (lui) du plasmide N22C21 purifié sur colonne Qiagen puis linéarise par ScaI (Appligene Oncor) sont utilisés par réaction, dans un tampon de réaction 50 mM Tris-acétate pH 8,100 mM acétate d'ammonium, 75 mM acétate de magnésium, 10% de glycerol, dans un volume réactionnel de 10 ou 20 ul. Le mélange réactionnel est incubé à 70°C pendant 30 minutes.

La figure 2 montre le produit de la réaction de I-Tfu-2 sur le plasmide N22C21 synthétiques. Un gel d'agarose 1% en tampon Tris Borate-EDTA (TBE) met en évidence la coupure du substrat N22C21 (S) en produits (P) en présence de I-Tfu-2 (ligne +), alors que le même substrat ADN n'est pas clivé en absence de I-Tfu-2 (ligne -). Le produit de la réaction montre que l'ADN est clivé spécifiquement en deux fragments de 940 et 1790 bp.

Une analyse des conditions opérationnelles est montrée sur les figures 3-a à 3-f qui illustrent l'optimisation de l'activité endonucléase de I-Tfu-2 à partir de 100 ng de substrat ADN N22C21 qui sont incubés avec 1 pi de I-Tfu-2 purifiée, dans différentes conditions, dans un volume total de 10 ul.

* la figure 3-a montre l'effet de la concentration en Mg (OAc) 2 sur la réaction qui est réalisée à 60°C pendant 30 min dans un tampon 50 mM Tris-acetate pH 8 contenant 25 mM de NH40Ac et des concentrations croissantes de Mg (OAc) 2. la figure 3-b montre l'effet de la concentration en NH40Ac sur la réaction qui est réalisée à 60°C pendant 30 min dans un tampon 50 mM Tris-acetate

pH 8 contenant 75 mM de Mg (OAc) 2 et des concentrations croissantes de NH40Ac. la figure 3-c montre l'effet du pH sur la réaction qui est réalisée à 60°C pendant 30 min, dans différents tampons 50 mM Tris-acetate dont le pH est ajusté entre 7 et 9, et contenant 75 mM de Mg (OAc) 2 et 100 mM de NH40Ac.

* la figure 3-d montre l'effet de la concentration en glycérol sur la réaction qui est réalisée à 60°C pendant 30 min dans un tampon 50 mM Tris-acetate pH 8 contenant 75 mM de Mg (OAc) 2,100 mM de NH40Ac et des concentrations croissantes de glycérol.

* la figure 3-e montre 1'effet de la température sur la réaction qui est réalisée à différentes températures entre 60 et 80°C, pendant 30 minutes dans un tampon 50 mM Tris-acetate pH 8 contenant 75 mM de Mg (OAc) 2 et 100 mM de NH40Ac.

* la figure 3-f montre la cinétique de coupure de la réaction qui est réalisée à 70°C dans un tampon 50 mM Tris-acétate pH 8 contenant 75 mM de Mg (OAc) 2 et 100 mM de NH40Ac. Elle est arrêtée dans la glace après différents temps d'incubation puis les produits de coupure sont analysés sur gel.

Dans les conditions optimum, 80 % de la réaction a lieu au cours des 10 premières minutes. Pour obtenir une coupure complète, il faut rajouter de 1'enzyme, ce qui laisse fortement soupçonner une inhibition de la réaction par les produits de coupure.

2) Détermination du site de coupure.

Le site de coupure a été déterminé par la méthode d'extension d'amorces (9). Le plasmide N22C21 est séquence par la méthode de Sanger (1977) avec un Kit de séquençage à la T7 polymérase (Pharmacia) en utilisant des amorces universelles (directe et réverse). Après la réaction de séquençage, les échantillons sont extraits au

phénol-chloroforme, précipités et resuspendus dans 10 ul d'eau. 5 pi sont utilisés dans une réaction de coupure par I-Tfu-2 avec 2 pi d'enzyme, dans un volume réactionnel final de 10 ul, dont 1 pi de tampon de coupure 10X. Après une incubation de 10 minutes à 70°C, l'échantillon est extrait au phénol chloroforme, précipité à l'éthanol, séché puis repris dans 5 pi d'eau.

Tous les échantillons (traités par I-Tfu-2 ou non) sont additionnés de 4 ul de solution stop puis déposés sur un gel de polyacrylamide dénaturant à 6% (gel de séquençage).

Après migration et révélation du gel par autoradiographie, la comparaison des pistes des échantillons traités par I-Tfu-2 avec les pistes des échantillons non traités permet de déterminer la séquence du site nécessaire à la coupure ainsi que la nature de la coupure comme montré sur les figures 4-a et 4-b : la figure 4-a montre la délimitation du site minimal de reconnaissance. L'autoradiogramme du gel de séquençage montre la séquence obtenue avec les oligonucléotides SeqPuc (à gauche) et M13Rev (à droite).

Les réactions incubées (lignes +) et non incubées avec I-Tfu-2 (lignes-) ont été déposées côte à côte de façon à déterminer le site minimal de reconnaissance de 1'enzyme. Le site de coupure pour chacun des deux brins d'ADN est repéré par une flèche. Dans l'encadré se trouve la séquence des nucléotides appartenant au site minimal. dans chaque direction. la figure 4-b montre la séquence nucléotidique minimale nécessaire pour la reconnaissance et la coupure par I-Tfu-2. La flèche indique le"homing site" (HS) de l'intéine dans le gène de la polymérase de Thermococcus fumicolans. Les pointillés délimitent le site de reconnaissance minimal.

3) Nature de la coupure.

L'incubation de 100 ng de plasmide N22C21 avec 1 ul d'enzyme I-Tfu-2 donne un produit linéaire qui peut être recircularisé par incubation avec 20 unités de T4 DNA ligase (NEB) dans un tampon de ligation pendant 16 h à 16°C. Ceci prouve que l'enzyme I-Tfu-2-coupe l'ADN en générant des extrémités 5'phosphate et 3'hydroxyle.

4) Confirmation du site de coupure.

Pour vérifier la taille de la séquence d'ADN nécessaire à la reconnaissance et à la coupure, nous avons utilisé une série de plasmides pUC19 contenant chacun un site de longueur donnée (Figure 1) : dans une réaction standard de coupure par I-Tfu-2, on voit que lorsque le site est plus court que N8C13 (cas de N8C12, N7C13 et N12C10), l'efficacité de la coupure est fortement réduite, sans être toutefois totalement abolie (Figure 5). Cette activité"star"est totalement abolie dans un tampon ne contenant que 10 mM d'acétate d'ammonium (au lieu de 100), tampon dans lequel 1'enzyme I-Tfu-2 conserve 50% de son activité de coupure pour son site complet (Figure 6).

III. EXEMPLES.

1) Préparation d'un chromosome artificiel comprenant au moins un site de reconnaissance et de coupure de I-Tfu-2.

Un vecteur de type pYAC2 est transformé de manière à porter un site de reconnaissance et de coupure I-Tfu-2 au sein du gène SUP4 par introduction de la séquence selon une procédure connue (10). Ce vecteur est préparé par coupure par BamHI et déphosphorylation selon la procédure classiquement employée. Parallèlement, une banque gnomique est préparée par hydrolyse ménagée d'un ADN gnomique avec une enzyme de restriction générant des extrémités franches. Ces fragments sont séparés selon

leur taille par centrifugation sur un gradient de saccharose puis ligués à de petits adaptateurs synthétiques (figure 7).

Le vecteur préalablement coupé par I-Tfu-2 est ensuite mélangé aux fragments d'ADN et ligué-par la T4 ADN ligase. A la fin de la réaction de ligation, le mélange est chauffé à 70°C pendant 10 minutes, en présence d'I-Tfu-2, ce qui permet de recouper tout vecteur s'étant religué sur lui-même, sans affecter les vecteurs qui ont intégré un fragment de la banque. Ceci permet aussi d'inactiver la T4 ADN ligase. Après une étape de dessalage du mélange, celui-ci est utilisé pour transformer une souche de Saccharomyces cerevisiae ade2- ochre, ura3, trpl et les clones autotrophes colorés en rouge sont sélectionnés sur milieu syntéthique sans uracile ni tryptophane.

Par rapport à la méthode décrite par Burke et al. (11), l'introduction, du site I-Tfu-2 permet d'améliorer considérablement l'efficacité de la construction des chromosomes artificiels, d'une part en améliorant l'étape de clonage qui se fait avec des extrémités protubérantes et non plus avec des exrémités à bout franc, et d'autre part en éliminant le bruit de fond provoqué par le vecteur religué sur lui-même. Cette amélioration est notamment sensible lorsque l'on veut faire des chromosomes artificiels de grande taille (>1000 Kpb).

Alternativement, un vecteur modifié pYAC2 dans lequel les sites NotI situés de part et d'autre du gène SUP4o ont été remplacés par des sites I-Tfu-2 permet, après clonage d'une banque gnomique dans ce vecteur par la procédure classique décrite par Burke et al, d'exciser et de purifier les fragments clones dans les chromosomes artificiels après coupure desdits chromosomes artificiels par 1'enzyme I-Tfu-2, et ce quelle que soit la taille des fragments, ce qui n'est pas le cas avec 1'enzyme Not I par exemple.

2) Construction d'un vecteur comprenant le site de reconnaissance et de coupure de I-Tfu-2.

Le vecteur N8C13 est un dérivé de pUC19 dans lequel le site de reconnaissance et de coupure-de I-Tfu-2 a été introduit au niveau du site SmaI. Lors du clonage d'un fragment d'ADN dans ce vecteur, au moyen de deux sites quelconques situés de part et d'autre du site de reconnaissance et de coupure I-Tfu-2, par exemple BamH I et Eco RI, l'étape de ligation est suivie d'une étape de chauffage à 70°C en présence de 1'enzyme I-Tfu-2. De cette façon, la ligase est inactivée et tout vecteur n'ayant pas intégré le fragment à cloner est simultanément clivé au site I-Tfu-2, ce qui permet d'éliminer les"faux positifs"lors de l'étape de transformation.

Un autre vecteur dans lequel deux sites de reconnaissance et de coupure de I-Tfu-2 ont été introduits de part et d'autre de la cassette comprenant les sites multiples de clonage permet d'extraire les fragments hétérologues intacts quelle que soit leur taille ou leur séquence, après clonage des fragments dans ce vecteur par un ou plusieurs sites conventionnels de clonage, puis coupure du vecteur recombinant par I- Tfu-2.

REFERENCES BIBLIOGRAPHIQUES.

1. Chong, S. R., Y. Shao, H. Paulus, J.

Benner, F. B. Perler, and M. Q. Xu. 1996. Protein splicing involving the Saccharomyces cerevisiae VMA intein-The steps in the splicing pathway, side reactions leading to protein cleavage, and establishment of an in vitro splicing system. Journal of Biological Chemistry. 271 (36) : 22159-22168.

2. Fsihi, H., V. Vincent, and S. T. Cole.

1996. Homing events in the gyrA gene of some mycobacteria. Proceedings of the National Academy of Sciences of the United States of America. 93 (8) : 3410- 3415.

3. Davis, E. O., S. G. Sedgwick, and M. J.

Colston. 1991. Novel structure of the recA locus of Mycobacterium tuberculosis implies processing of the gene product. Journal of Bacteriology. 173 (18) : 5653-5662.

4. Davis, E. O., S. G. Sedgwick, and J.

Colston. 1991. Novel structure of Mycobacterium tuberculosis implies processing of the gene product.

Journal of Bacteriology. 173 (18) : 5653-5662.

5. Xu, M. G., Comb, D. G., Paulus H., Noren C. J., Shao Y., Perler, F., 1994, Protein splicing : an analysis of the branched intermediate and its resolution by succinimidine formation. EMBO J. 13,5517-5522.

6. Hodges, R. A., F. B. Perler, C. J. Noren, and W. E. Jack. 1992. Protein Splicing Removes Intervening Sequences in an Archaea DNA Polymerase.

Nucleic Acids Res. 20 (23) : 6153-6157.

7. Sanger, F., S. Nicklen, and A. R. Coulson.

1977. DNA sequencing with chain terminating inhibitors.

Proc. Natl. Acad. Sci. USA. 74 : 5467-5473.

8. Saitou, N., and M. Nei. 1987. The neighbor-joining method : a new method for reconstructing phylogenetic trees. Mol. Biol. Evol. 4 (4) : 406-425.

9. Wenzlau, J. M., Saldanha, R. J., Butow, R. A., Pelman, P. S. Cell, 1989,56,421-430.

10. Masson et al., Proc. Natl. Acad. Sci., 1987,84,6815-6819.

11. Burke et al., Science, 1987,236,806 LISTE DE SÉQUENCES (1) INFORMATION GÉNÉRALES : (i) DEPOSANT : APPLIGENE-ONCOR (ii) TITRE DE L'INVENTION : Intéine d'archaebacterie de 1'Espece Thermococcus fumicolans (iii) NOMBRE DE SEQUENCES : 2 (2) INFORMATION POUR LA SEQ ID NO : 1 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 1177 paires de bases (B) TYPE : nucléotide (C) NOMBRE DE BRIN : double (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : ADN (ix) CARACTERISTIQUES (A) NOM/CLE : séquence codante de l'intéine de Thermococcus fumicolans I-Tfu-2 (xi) DESCRIPTION DE LA SEQUENCES : SEQ ID NO : 1 : AGT GTT ACA GGG GAC ACA GAG GTA ACC ATC AGA AGA AAC GGC AGG ATT 48 Ser Val Thr Gly Asp Thr Glu Val Thr Ile Arg Arg Asn Gly Arg Ile 1 5 10 15 GAG TTC GTT CCA ATC GAG AAA CTC TTT GAG CGC GTT GAT CAC CGT GTT 96 Glu Phe Val Pro Ile Glu Lys Leu Phe Glu Arg Val Asp His Arg Val 20 25 30 GGT GAG AAG GAG TAC TGC GTT CTT GGA GGG GTT GAG GCA CTG ACA CTC 144 Gly Glu Lys Glu Tyr Cys Val Leu Gly Gly Val Glu Ala Leu Thr Leu 35 40 45 GAC AAC AGG GGC AGG CTC GTG TGG AAG AAG GTT CCG TAC GTC ATG AGA 192 Asp Asn Arg Gly Arg Leu Val Trp Lys Lys Val Pro Tyr Val Met Arg 50 55 60 CAT AAA ACG GAC AAA AGA ATC TAT AGG GTA TGG TTC ACC AAC TCT TGG 240 His Lys Thr Asp Lys Arg Ile Tyr Arg Val Trp Phe Thr Asn Ser Trp 65 70 75 80 TAC CTT GAC GTG ACG GAG GAT CAC TCG CTA ATA GGC TAC CTG AAC ACA 288 Tyr Leu Asp Val Thr Glu Asp His Ser Leu Ile Gly Tyr Leu Asn Thr 85 90 95 AGC AAA GTC AAA CCC GGA AAG CCC TTG AAA GAG CGT CTC GTC GAG GTC 336 Ser Lys Val Lys Pro Gly Lys Pro Leu Lys Glu Arg Leu Val Glu Val 100 105 110 AAG CCA GAA GAA TTG GGG GGT AAG GTC AAG TCT CTC ATT ACG CCC AAT 384 Lys Pro Glu Glu Leu Gly Gly Lys Val Lys Ser Leu Ile Thr Pro Asn 115 120 125 CGG CCA ATT GCC CGT ACC ATC AAG GCC AAC CCC ATT GCC GTC AAG CTC 432 Arg Pro Ile Ala Arg Thr Ile Lys Ala Asn Pro Ile Ala Val Lys Leu 130 135 140 TGG GAG TTA ATT GGC CTG CTG GTG GGA GAT GGC AAC TGG GGT GGA CAA 480 Trp Glu Leu Ile Gly Leu Leu Val Gly Asp Gly Asn Trp Gly Gly Gln 145 150 155 160 TCG AAC TGG GCC AAA TAC TAC GTT GGC CTC TCC TGT GGG CTG GAT AAA 528 Ser Asn Trp Ala Lys Tyr Tyr Val Gly Leu Ser Cys Gly Leu Asp Lys 165 170 175 GCC GAA ATA GAG AGA AAA GTC CTG AAC CCT TTA AGA GAG GCA AGC GTC 576 Ala Glu Ile Glu Arg Lys Val Leu Asn Pro Leu Arg Glu Ala Ser Val 180 185 190 ATC TCC AAC TAC TAC GAC AAG AGC AAG AAG GGC GAC GTT TCC ATA CTC 624 Ile Ser Asn Tyr Tyr Asp Lys Ser Lys Lys Gly Asp Val Ser Ile Leu 195 200 205 TCC AAG TGG CTC GCC GGA TTC ATG GTC AAA TAC TTC AAA GAT GAA AAT 672 Ser Lys Trp Leu Ala Gly Phe Met Val Lys Tyr Phe Lys Asp Glu Asn 210 215 220 GGG AAC AAG GCC ATT CCC AGC TTC ATG TTC AAC CTT CCA AGG GAA TAC 720 Gly Asn Lys Ala Ile Pro Ser Phe Met Phe Asn Leu Pro Arg Glu Tyr 225 230 235 240 ATA GAG GCC TTT CTA CGG GGG CTG TTT TCA GCG GAC GGA ACG GTA AGC 768 Ile Glu Ala Phe Leu Arg Gly Leu Phe Ser Ala Asp Gly Thr Val Ser 245 250 255 TTG CGT AGA GGA ATC CCA GAA ATT AGA CTG ACA AGC GTT AAC AGA GAG 816 Leu Arg Arg Gly Ile Pro Glu Ile Arg Leu Thr Ser Val Asn Arg Glu 260 265 270 CTT AGT GAT GCC GTG AGA AAG TTG CTG TGG CTG GTT GGG GTC TCC AAC 864 Leu Ser Asp Ala Val Arg Lys Leu Leu Trp Leu Val Gly Val Ser Asn 275 280 285 TCA CTA TTC ACC GAA ACC AAG CCA AAC CGG TAC CTG GAG AAA GAA AGT 912 Ser Leu Phe Thr Glu Thr Lys Pro Asn Arg Tyr Leu Glu Lys Glu Ser 290 295 300 GGA ACG CAT TCG ATT CAC GTG AGG ATA AAG AAC AAG CAT CGC TTT GCC 960 Gly Thr His Ser Ile His Val Arg Ile Lys Asn Lys His Arg Phe Ala 305 310 315 320 GAT AGA ATA GGC TTT CTC ATA GAC AGA AAA TCC ACC AAA CTC TCC GAG 1008 Asp Arg Ile Gly Phe Leu Ile Asp Arg Lys Ser Thr Lys Leu Ser Glu 325 330 335 AAC CTG GGG GGA CAT ACA AAC AAG AAG AGG GCT TAC AAA TAT GAT TTT 1056 Asn Leu Gly Gly His Thr Asn Lys Lys Arg Ala Tyr Lys Tyr Asp Phe 340 345 350 GAC TTG GTA TAC CCC AGA AAA ATC GAA GAG ATA ACC TAC GAC GGC TAC 1114 Asp Leu Val Tyr Pro Arg Lys Ile Glu Glu Ile Thr Tyr Asp Gly Tyr 355 360 365 GTC TAT GAC ATC GAG GTT GAG GGA ACC CAC AGG TTC TTC GCC AAC GGA 1162 Val Tyr Asp Ile Glu Val Glu Gly Thr His Arg Phe Phe Ala Asn Gly 370 375 380 ATA CTC GTT CAC AAC 1177 Ile Leu Val His Asn 385 2) INFORMATION POUR LA SEQ ID NO : 2 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 21 paires de bases (B) TYPE : nucléotide (C) NOMBRE DE BRIN : double (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : ADN (ix) CARACTERISTIQUES (A) NOM/CLE : site de reconnaissance et de coupure de 1'intéine I-Tfu-2 de THERMOCOCCUS fumicolans (xi) DESCRIPTION DE LA SEQUENCES : SEQ ID NO : 2 : ACGCGGATAC AGACGGCTTT T 21