Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR MODIFYING A TARGET NUCLEIC ACID OF A HOST CELL
Document Type and Number:
WIPO Patent Application WO/2019/239042
Kind Code:
A1
Abstract:
The invention relates to a method for modifying, by cutting and/or total or partial degradation, a target nucleic acid sequence of a host cell, comprising bringing said host cell into contact in vitro or ex vivo with a biological system comprising: a first component comprising at least one protein selected from the proteins R350 and R354 of giant virus group A Mimivirus or at least one expression vector of at least one nucleic acid sequence of the genes R350 and/or R354 respectively encoding for at least one of said proteins R350 and/or R354; and a second component comprising at least one nucleic acid sequence, called an affinity sequence, said affinity sequence comprising at least one complementary sequence of a specific sequence of said target sequence, said specific sequence comprising at least 10 nucleotides, preferably 15 nucleotides, of said target sequence, said specific sequence being flanked at 3' and 5' by adjacent sequences surrounding a sequence of 15 nucleotides of the Zamilon virophage contained and repeated four times in the R349 gene of giant virus Mimivirus.

Inventors:
RAOULT DIDIER (FR)
AZZA SAID (FR)
LA SCOLA BERNARD (FR)
CHABRIERE ERIC (FR)
LEVASSEUR ANTHONY (FR)
PERRIN PIERRE (FR)
Application Number:
PCT/FR2019/051372
Publication Date:
December 19, 2019
Filing Date:
June 07, 2019
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
FOND MEDITERRANEE INFECTION (FR)
UNIV AIX MARSEILLE (FR)
International Classes:
C12N15/10; C12N9/22
Domestic Patent References:
WO2013098244A12013-07-04
WO2012139866A12012-10-18
Foreign References:
EP2800811A12014-11-12
Other References:
ANTHONY LEVASSEUR ET AL: "MIMIVIRE is a defence system in mimivirus that confers resistance to virophage", NATURE, vol. 531, no. 7593, 29 February 2016 (2016-02-29), London, pages 249 - 252, XP055553919, ISSN: 0028-0836, DOI: 10.1038/nature17146
CHAO DOU ET AL: "Structural and Mechanistic Analyses Reveal a Unique Cas4-like Protein in the Mimivirus Virophage Resistance Element System", ISCIENCE, 25 May 2018 (2018-05-25), United States, pages 1 - 10, XP055553947, Retrieved from the Internet DOI: 10.1016/j.isci.2018.04.001
CALLAWAY EWEN: "CRISPR-like 'immune' system discovered in giant virus : Nature News & Comment", 29 February 2016 (2016-02-29), XP055554104, Retrieved from the Internet [retrieved on 20190208]
MERIEM BEKLIZ ET AL: "MIMIVIRE, un système de défense chez mimivirus qui illustre l'hypothèse de la Reine Rouge", M/S MEDECINE SCIENCES., vol. 32, no. 10, 1 October 2016 (2016-10-01), FR, pages 818 - 819, XP055555948, ISSN: 0767-0974, DOI: 10.1051/medsci/20163210009
TUHIN K. GUHA ET AL: "Applications of Alternative Nucleases in the Age of CRISPR/Cas9", INTERNATIONAL JOURNAL OF MOLECULAR SCIENCES, vol. 18, no. 12, 29 November 2017 (2017-11-29), pages 2565, XP055554937, DOI: 10.3390/ijms18122565
EUGENE V KOONIN ET AL: "Polintons, virophages and transpovirons: a tangled web linking viruses, transposons and immunity", CURRENT OPINION IN VIROLOGY, vol. 25, 30 June 2017 (2017-06-30), United Kingdom, pages 7 - 15, XP055553939, ISSN: 1879-6257, DOI: 10.1016/j.coviro.2017.06.008
CLAVERIE JEAN-MICHEL ET AL: "CRISPR-Cas-like system in giant viruses: why MIMIVIRE is not likely to be an adaptive immune system", VIROLOGICA SINICA, SPRINGER, DE, vol. 31, no. 3, 13 June 2016 (2016-06-13), pages 193 - 196, XP035991872, ISSN: 1674-0769, [retrieved on 20160613], DOI: 10.1007/S12250-016-3801-X
MORGAN GAIA ET AL: "Zamilon, a Novel Virophage with Mimiviridae Host Specificity", PLOS ONE, vol. 9, no. 4, 18 April 2014 (2014-04-18), pages e94923, XP055554478, DOI: 10.1371/journal.pone.0094923
BERNARD LA SCOLA ET AL: "The virophage as a unique parasite of the giant mimivirus", NATURE, vol. 455, no. 7209, 6 August 2008 (2008-08-06), London, pages 100 - 104, XP055554483, ISSN: 0028-0836, DOI: 10.1038/nature07218
SCIENCE, vol. 343, 3 January 2014 (2014-01-03), pages 84 - 87
BARRANGOU RMARRAFFINI LA: "CRISPR-Cas systems: prokaryotes upgrade to adaptive immunity", MOL CELL, vol. 54, 2014, pages 234 - 244, XP055190330, DOI: doi:10.1016/j.molcel.2014.03.011
DESNUES CLA SBYUTIN N ET AL.: "Provirophages and transpovirons as the diverse mobilome of giant viruses", PROC NATL ACAD SCI USA, vol. 109, 2012, pages 18078 - 18083
FILEE JCHANDLER M: "Gene exchange and the origin of giant viruses", INTERVIROLOGY, vol. 53, 2010, pages 354 - 361
FORTERRE P: "Giant viruses: conflicts in revisiting the virus concept", INTERVIROLOGY, vol. 53, 2010, pages 362 - 378
GAIA MBENAMAR SBOUGHALMI M ET AL.: "Zamilon, a novel virophage with Mimiviridae host specificity", PLOS ONE, vol. 9, 2014, pages e94923
LA SCOLA BAUDIC SROBERT C ET AL.: "A giant virus in amoebae", SCIENCE, vol. 299, 2003, pages 2033
LA SCOLA BDESNUES CPAGNIER IROBERT CBARRASSI L ET AL.: "The virophage as a unique parasite of the giant Mimivirus", NATURE 2008, vol. 455, 2008, pages 100 - 104, XP055554483, DOI: doi:10.1038/nature07218
LEVASSEUR ABEKLIZ MCHABRIÈRE E ET AL.: "MIMIVIRE is a defence system in Mimivirus that confers résistance to virophage", NATURE, vol. 531, 2016, pages 249 - 252, XP055553919, DOI: doi:10.1038/nature17146
MAKAROVA KSWOLF YIKOONIN EV: "Comparative genomics of defense systems in archaea and bacteria", NUCLEIC ACIDS RES, vol. 41, 2013, pages 4360 - 4377, XP002784020
RAOULT D.: "How the virophage compels the need to readdress the classification of microbes", VIROLOGY, vol. 477, 2015, pages 119 - 124, XP029176796, DOI: doi:10.1016/j.virol.2014.11.014
SHARMA VCOLSON PPONTAROTTI PRAOULT D: "Mimivirus inaugurated in the 21st century the beginning of a reclassification of viruses", CURR OPIN MICROBIOL, vol. 31, 2016, pages 16 - 24, XP029571906, DOI: doi:10.1016/j.mib.2015.12.010
J. M. CLAVERIEC. ABERGEL: "CRISPR-Cas-like system in giant viruses: why MIMIVIRE is not likely to be an adaptive immune system", VIROL. SIN., vol. 31, no. 3, 2016, pages 193, XP035991872, DOI: doi:10.1007/s12250-016-3801-x
YUTIN NRAOULT DKOONIN EV: "Virophages, polintons, and transpovirons: a complex evolutionary network of diverse selfish genetic elements with différent reproduction stratégies", VIROL J, vol. 10, 2013, pages 158, XP021152425, DOI: doi:10.1186/1743-422X-10-158
CASANE DLAURENTI P.: "Le cas CRISPR, mutations « ready-made » et évolution lamarckienne d'un système immunitaire adaptatif", MED SCI (PARIS, vol. 32, 2016, pages 640 - 645
TREMBLAY JP: "CRISPR, un système qui permet de corriger ou de modifier l'expression de gènes responsables de maladies héréditaires", MED SCI (PARIS, vol. 31, 2015, pages 1014 - 1022
LA GILGENKRANTZ H.: "révolution des CRISPR est en marche", MED SCI (PARIS, vol. 30, 2014, pages 1066 - 1069
CHAO DOU ET AL.: "structural and mechanistic analyses reveal a unique cas4-like proetin in the Mimivirus virophage résistant elemnt system", ISCIENCE, 2018
PETROV AWU TPUGLISI EV: "Purification d'ARN de Puglisi JD. RNA purification by preparative polyacrylamide gel electrophoresis", METHODS ENZYMOL, vol. 530, 2013, pages 315 - 30
Attorney, Agent or Firm:
CABINET BEAU DE LOMÉNIE (FR)
Download PDF:
Claims:
REVEN DICATIONS

1. Méthode de modification par coupure et/ou dégradation totale ou partielle d'une séquence cible d'acide nucléique d'une cellule hôte comprenant la mise en contact de la dite cellule hôte in vitro ou ex vivo avec un système biologique comprenant :

- un premier composant comprenant au moins une protéine choisie parmi les protéines R350 et R354 de virus géant Mimivirus de lignée A ou au moins un vecteur d'expression d'au moins une séquence d'acide nucléique des gènes R350 et/ou R354 codant pour respectivement au moins une dite protéine R350 et/ou R354, et

- un deuxième composant comprenant au moins une séquence d'acide nucléique, dénommée séquence d'affinité, la dite séquence d'affinité comprenant au moins une séquence complémentaire d'une séquence spécifique de ladite séquence cible, la dite séquence spécifique de ladite séquence cible comprenant au moins 10 nucléotides, de préférence 15 nucléotides.

2. Méthode selon la revendication 1, caractérisé en ce que le dit deuxième composant comprend la dite la séquence d'affinité sous forme d'ADN ou de préférence sous forme d'ARN.

3. Méthode selon la revendication 1 ou 2, caractérisé en ce que la dite la séquence d'affinité comprend au moins 2 mêmes dites séquences complémentaires d'une même séquence spécifique, de préférence de 2 à 4, de préférence encore 4 mêmes d ites séquences complémentaires d'une même séquence spécifique, répétées de façon espacée.

4. Méthode selon l'une des revendications 1 à 3, caractérisé en ce que la dite ou chaque dite séquence complémentaire de la même dite séquence spécifique de la séquence d'affinité est flanquée en 3' et 5' de séquences adjacentes encadrant une séquence de 15 nucléotides du virophage zamilon contenue et répétée 4 fois dans le gène R349 de virus géant Mimivirus.

5. Méthode selon l'une des revendications 1 à 4, caractérisé en ce que les dites mêmes séquences complémentaires de la même séquence spécifique de la séquence cible sont flanquées en 3' et 5' de séquences flanquantes différentes les unes des autres entre les différentes mêmes séquences complémentaires et les dites séquences flanquantes correspondant respectivement aux séquences flanquantes des différentes mêmes séquences répétées du virophage zamilon contenues dans ledit gène R349 de Mimivirus.

6. Méthode selon l'une des revendications 1 à 5, caractérisé en ce que la dite séquence d'affinité comprend le gène R349 modifié dans lequel seules les 4 séquences répétées de 15 nucléotides du virophage zamilon sont remplacées aux même localisations par les dites 4 mêmes séquences complémentaires dune dite séquence spécifique de la dite séquence cible.

7. Méthode selon l'une des revendications 1 à 6, caractérisé en ce que la dite séquence d'affinité est intégrée dans un vecteur de clonage de la dite séquence d'affinité apte à transformer ou transfecter une dite cellule hôte et y répliquer la dite séquence d'affinité.

8. Méthode selon la revendication 7, caractérisé en ce que la dite séquence d'affinité est intégrée sous forme d'ADN placée sous le contrôle d'un promoteur de transcription apte à transcrire de la dite séquence d'affinité d'ADN en ARN dans la dite cellule hôte.

9. Méthode selon l'une des revendications 1 à 8, caractérisé en ce que la dite cellule hôte est une bactérie ou une cellule eucaryote.

10. Méthode selon l'une des revendications 1 à 9, caractérisé en ce que le dit premier composant comprend un vecteur d'expression d'au moins une séquence d'acide nucléique de gène R350 et/ou R354 codant pour et apte à exprimer respectivement au moins une dite protéine R350 et/ou R354 dans une dite cellule hôte.

11 Méthode selon l'une des revendications 1 à 10, caractérisé en ce que les dits premier et deuxième composants sont intégrés dans un même dit vecteur, de préférence un plasmide.

12. Méthode selon l'une des revendications 1 à 11, pour au moins couper en un site spécifique la dite séquence cible, caractérisé en ce que le dit premier composant comprend au moins la protéine R350 ou au moins un vecteur d'expression d'au moins une séquence d'acide nucléique du gène R350 codant pour respectivement au moins une dite protéine R350.

13. Méthode selon l'une des revendications 1 à 12, pour au moins couper en un site spécifique et dégrader au moins partiellement la dite séquence cible, caractérisé en ce que le dit premier composant comprend au moins la protéine R350 et la protéine R354 ou au moins un vecteur d'expression d'au moins des séquences d'acides nucléiques des gènes R350 et R354 codant pour respectivement au moins les dites protéines R350 et R354.

14. Méthode selon l'une des revendications 10 à 12, caractérisé en ce que les dits premier et deuxième composants sont intégrés dans un même dit vecteur comprenant les séquences de Mimivirus de lignée A incluant :

- au moins une partie modifiée du gène R349, de préférence le gène R349 modifié complet, ladite partie modifiée du gène R349 incluant une partie du gène 349 incluant au moins une des 4 séquences répétées de 15 nucléotides du virophage zamilon du gène R349, de préférence les 4 séquences répétées, la dite modification de la dite partie modifiée du gène R349 consistant en ce que la (ou les ) dite(s) séquence(s) répétée(s) de 15 nucléotides du virophage zamilon du gène R349 est (ou sont) remplacée(s) par une même dite séquence complémentaire d'une séquence spécifique de la dite séquence cible, et - une séquence permettant la transcription en ARN de ladite partie modifiée du gène R349, de préférence du gène R349 modifié complet dans une dite cellule hôte, et

- les gènes R350 et 354, ainsi que des séquences permettant l'expression des gènes R350 et R354 dans une dite cellule hôte.

15. Système biologique utile pour la mise en œuvre d'un procédé de modification par coupure et/ou dégradation totale ou partielle d'une séquence cible d'acide nucléique d'une cellule hôte comprenant la mise en contact de la dite cellule hôte in vitro ou ex vivo, tel que défini dans l'une des revendications 1 à 14 comprenant :

- un premier composant comprenant au moins une protéine choisie parmi les protéines R350 et R354 de virus géant Mimivirus de lignée A ou au moins un vecteur d'expression d'au moins une séquence d'acide nucléique des gènes R350 et/ou R354 codant pour respectivement au moins une dite protéine R350 et/ou R354, et

- un deuxième composant comprenant une séquence d'acide nucléique, dénommée séquence d'affinité, la dite séquence d'affinité comprenant au moins une séquence complémentaire d'une séquence spécifique de ladite séquence cible, la dite séquence spécifique de ladite séquence cible comprenant au moins 10 nucléotides, de préférence 15 nucléotides, de préférence la ou chaque dite séquence complémentaire d'une séquence spécifique de ladite séquence cible étant flanquée en 3' et 5' de séquences adjacentes encadrant une séquence de 15 nucléotides du virophage zamilon contenue et répétée 4 fois dans le gène R349 de virus géant Mimivirus de lignée A.

Description:
Méthode de modification d'une séquence cible d'acide nucléique d'une cellule hôte.

La présente invention concerne une méthode de modification d'une séquence cible d'acide nucléique d'une cellule hôte comprenant la mise en contact de la dite cellule hôte in vitro ou ex vivo avec un système biologique.

Les procaryotes sont capables d'acquérir une immunité adaptative contre l'invasion d'éléments génétiques, tels que les plasmides ou les phages, via l'incorporation dans leur génome de courtes séquences d'ADN étranger (de 21 à 72 nucléotides [nt]), système appelé CRISPR- Cas (courtes répétitions palindromiques groupées et régulièrement espacée) [1, 2] . L'acquisition de ces séquences d'ADN étranger survient de façon adjacente aux gènes Cas qui ont pour rôle de cliver l'ADN étranger en fragments de petites tailles. CRISPR-Cas confère ainsi une résistance face à une seconde infection [ 14, 15]

À ce jour, le système CRISPR-Cas n'avait été observé que chez les bactéries et les archées [ 16], mais pas chez des virus [1, 2] .

La découverte des virus géants d'amibes, vivant en compétition avec d'autres microbes, a contesté la définition classique d'un virus [4, 5] . Depuis leur découverte, les virus géants ont révélé des caractéristiques phénotypiques et génotypiques uniques qui vont à l'encontre de la définition classique d'un virus, les plaçant à proximité de certains microbes. Les Mimivirus au diamètre supérieur à 0,5 micromètre, sont aisément visibles avec un simple microscope optique. Ils possèdent un génome large et complexe qui contient des séquences provenant d'autres organismes [6]. En outre, leur infection possible par des virus, les virophages, qui se multiplient dans l'usine à virus des Mimivirus, et la présence des éléments mobiles (transpovirons, polintons) ont suscité de vifs débats sur l'origine de ces virus [7]. De plus, les virophages, comme les bactériophages, peuvent s'intégrer au génome de Mimivirus sous la forme de provirophage [9] . Un des virophages qui parasite la famille des Mimivirus a été baptisé zamilon

[ 10] .

Dans cette étude publiée dans le journal Nature [8], les chercheurs ont observé qu'un groupe parmi les Mimivirus (appelé lignées A) a développé une résistance contre l'infection par un virophage nommé zamilon, alors que les virus géants des lignées B et C sont sensibles à l'infection par ce virophage. Les chercheurs ont trouvé la présence d'une séquence répétée d'ADN de zamilon qui sert à accrocher le virophage uniquement dans la lignée A. Ce complexe a ainsi été nommé MIMIVIRE (Mimivirus Virophage Résistance Elément) et présente des similarités fonctionnelles avec le système de défense CRISPR-Cas existant jusqu'alors uniquement chez les bactéries et les archées et comportant une enzyme déroulant l'ADN (hélicase R350) et une autre le coupant (nucléase R354). L'inactivation du complexe MIMIVIRE a permis de restaurer la susceptibilité de Mimivirus à l'infection par le virophage. Les protéines partenaires comprises dans ce complexe MIMIVIRE sont impliquées dans la dégradation spécifique de l'ADN étranger. Le système de défense virale, MIMIVIRE, confère ainsi une immunité aux virus géants qui ont pu intégrer dans leur génome l'ADN du virophage infectant.

Plus précisément, 59 souches de la collection des virus géants de la famille des Mimiviridae d'Acanthamoeba polyphaga (dont 28 de la lignée A, 8 de la lignée B et 23 de la lignée C), ont été infectées par les virophages zamilon ou Sputnik, un autre virophage [ 11] . Après 24 heures, une augmentation de l'ADN de Sputnik a été observée dans l'ensemble des trois lignées de Mimiviridae. En revanche, zamilon a été capable de se répliquer uniquement avec les souches des lignées B et C de Mimiviridae, mais aucune souche de la lignée A. Une séquence de 28 nucléotides (nt), spécifique de zamilon, et trois répétitions de 15 nt ont été retrouvées dans l'ensemble des génomes de la lignée A contrairement aux deux autres lignées (B et C). Ces séquences sont localisées dans un gène codant une transposase-A chez zamilon, et sont intégrées dans le gène R349 de Mimivirus et dans les gènes orthologues, chez tous les Mimivirus de la lignée A. Ces séquences répétées sont séparées par des séquences de 9,48 et 63 nt respectivement. L'étude de l'environnement génomique au voisinage des séquences répétées de zamilon a mis en évidence des ORF (open reading frame, cadre de lecture ouvert) conservés chez les Mimiviruses. Ces ORF possèdent une similarité distante avec les Cas protéines qui sont de type hélicase et nucléase. Silencés par RNA interférence, l'inactivation des ORF contenant la séquence répétée d'ADN de zamilon, ou des ORF proche des Cas protéines, a permis de restaurer la susceptibilité de la lignée A des Mimivirus à l'infection par zamilon. En outre, l'expression des gènes a confirmé qu'ils codent une hélicase R350 et une nucléase R354.

Désormais, les virus géants des lignée B et C sont dénommés respectivement Momovirus pour la lignée B et Mégavirus pour la lignée C, Mimivirus étant réservé à la lignée A. Dans la suite de la présente demande de brevet lorsqu'il est indiqué Mimivirus, il s'agit donc de virus géant Mimivirus de la lignée A dont la séquence du génome est déposée dans Genebank sous la référence AY653733.1 et/ou qui a été déposé à la Collection Nationale de Cultures de Microorganismes de l'Institut Pasteur (Paris) selon le traité de Budapest sous le numéro d'enregistrement CNCM 1-5322 le 31 Mai 2018 sous la référence APBC1.

Dans un article récent [17] la structure et l'activité nucléase de la protéine R354 ont été étudiées.

Les protéines R350 et R354 de Mimivirus sont connues de l'homme de l'art et ont été décrite [8, 17] et reproduites dans les séquences SEQ. ID. N° : 1 et 2 du listage de séquences.

Ce système de défense virale confère ainsi une immunité adaptative aux virus géants qui ont pu intégrer dans leur génome l'ADN du virophage infectant. C'est pourquoi ce complexe a été nommé Mimivire (Mimivirus virophage résistance element) [ 11]. Suite à l'étude de Nature 2016 (8), il a été toutefois contesté que Mimivirus puisse être également capable de développer un outil de type ciseaux biologiques analogue à celui de CRISPR-Cas [ 12] .

Toutefois, selon la présente invention, on a démontré que le système MIMIVIRE peut être adapté - mais différemment que le système CRISPR-Cas tel que décrit par exemple dans EP 2 800 811- pour offrir un nouvel outil biologique du type « ciseaux biologiques » comparable au système CRISPR-Cas pour des gènes étrangers autres que zamilon.

Le but de la présente invention est donc de rechercher les modalités selon lesquelles le système Mimivire peut être adapté pour fournir un système de « ciseaux biologiques » analogue au système CRISPR-Cas pour cibler des gènes autres que le gène zamilon dans Mimivirus et ainsi pour modifier des gènes ou séquences non codantes de bactéries ou cellules eucaryotes notamment.

Pour ce faire, la présente invention fournit une méthode de modification par coupure et/ou dégradation totale ou partielle d'une séquence cible d'acide nucléique d'une cellule hôte comprenant la mise en contact de la dite cellule hôte in vitro ou ex vivo avec un système biologique comprenant :

- un premier composant comprenant au moins une protéine choisie parmi les protéines R350 et R354 de virus géant Mimivirus de lignée A ou au moins un vecteur d'expression d'au moins une séquence d'acide nucléique des gènes R350 et/ou R354 codant pour respectivement au moins une dite protéine R350 et/ou R354, et

- un deuxième composant comprenant au moins une séquence d'acide nucléique, dénommée séquence d'affinité, la dite séquence d'affinité comprenant au moins une séquence complémentaire d'une séquence spécifique de ladite séquence cible, la dite séquence spécifique de ladite séquence cible comprenant au moins 10 nucléotides, de préférence 15 nucléotides. La séquence cible peut être une séquence d'ADN ou une séquence d'ARN transcrite du génome d'une dite cellule hôte. On comprend que ladite séquence spécifique de ladite séquence cible est autre qu'une séquence répétée du virophage zamilon contenue dans ledit gène R349.

La cellule hôte peut être une cellule de bactérie ou d'archée ou une cellule eucaryote unicellulaire ou pluricellulaire, notamment de plante ou d'animal.

Les protéines R350 et R354 de Mimivirus sont connues de l'homme de l'art et ont été décrites ci-après dans les séquences SEQ. ID. N° : 1 et 2 du listage de séquences.

Ces protéines R350 et R354 sont connues comme ayant des propriétés d'hélicase et respectivement nucléase comprenant des activités d'exonucléase et d'endonucléase de sorte que la modification de la dite séquence cible peut comprendre une coupure en un site spécifique et/ou une dégradation totale ou partielle de la dite séquence cible.

On entend par « séquence complémentaire d'une séquence spécifique de 15 nucléotides de ladite séquence cible », une séquence d'ADN ou d'ARN qui s'hybride avec la dite séquence cible et qui ne s'hybride avec aucune autre séquence d'une dite cellule hôte et desdits gènes R349, R350 ou R354.

En revanche on comprend que les dites séquences flanquantes sont tirées dudit gène R349.

Le gène R349 de Mimivirus est connu de l'homme de l'art et a été décrit ci-après dans la séquence SEQ. ID. N° : 5 du listage de séquences.

Des séquences des gènes R350 et 354 codant pour les protéines 350 et 354 de Mimivirus sont connues de l'homme de l'art et ont été décrites dans les séquences SEQ. ID. N° : 3 et 4 du listage de séquences.

Plus particulièrement, ledit deuxième composant comprend la dite séquence d'affinité sous forme d'ADN ou de préférence sous forme d'ARN .

De préférence, ladite séquence d'affinité comprend au moins 2 mêmes dites séquences complémentaires d'une même séquence spécifique, de préférence de 2 à 4, de préférence encore 4 mêmes dites séquences complémentaires d'une même séquence spécifique, répétées de façon espacée.

De préférence encore, la dite ou chaque dite séquence complémentaire de la même dite séquence spécifique de la séquence d'affinité comprend est flanquée en 3' et 5' de séquences adjacentes encadrant une séquence de 15 nucléotides du virophage zamilon contenue et répétée 4 fois dans le gène R349 de virus géant Mimivirus.

De préférence encore, les dites même séquences complémentaires de la même séquence spécifique de la séquence cible sont flanquées en 3' et 5' de séquences flanquantes différentes les unes des autres entre les différentes mêmes séquences complémentaires et les dites séquences flanquantes correspondant respectivement aux séquences flanquantes des différentes mêmes séquences répétées du virophage zamilon contenues dans ledit gène R349 de Mimivirus.

On comprend que les dites séquences flanquantes sont tirées de la séquence de 28 nucléotides (SEQ.ID. N 24) incluant la dite séquence répétée de 15 nucléotides du virophage zamilon (SEQ. ID. N 6) dans le gène R349 ou tirées des séquences de 9, 48 et respectivement 63 nucléotides (SEQ. ID. N°26-28) qui séparent les séquences répétées du virophage zamilon dans le gène R349, ou une séquence flanquante en 3' de la dernière séquence spécifique répétée en 3' de 15 nucléotides du virophage zamilon dans le gène R349. Plus particulièrement, ladite séquence d'affinité comprend le gène R349 modifié dans lequel seules les 4 séquences répétées de 15 nucléotides du virophage zamilon sont remplacées aux mêmes localisations par les dites 4 mêmes séquences complémentaires d'une dite séquence spécifique de la dite séquence cible.

Un tel gène R349 modifié est illustré par la séquence SEQ.ID N° 7 incluant une séquence spécifique de 15 nucléotides du gène de résistance à la tétracycline de la séquence SEQ.ID N°23.

Plus particulièrement encore, ladite séquence d'affinité est intégrée dans un vecteur de clonage de la dite séquence d'affinité apte à transformer ou transfecter une dite cellule hôte et y répliquer la dite séquence d'affinité.

Plus particulièrement encore, ladite séquence d'affinité est intégrée sous forme d'ADN placée sous le contrôle d'un promoteur de transcription apte à transcrire la dite séquence d'affinité d'ADN en ARN dans la dite cellule hôte.

Plus particulièrement encore, ladite cellule hôte est une bactérie ou une cellule eucaryote.

Plus particulièrement encore, ledit premier composant comprend un vecteur d'expression d'au moins une séquence d'acide nucléique R350 et/ou R354 codant pour et apte à exprimer respectivement au moins une dite protéine R350 et/ou R354 dans une dite cellule hôte.

Plus particulièrement, les séquences d'acides nucléiques codant pour les protéines R350 et/ou R354 sont intégrés dans un plasmide, sous le contrôle d'un promoteur d'expression, par exemple le promoteur T7 pour une bactérie et le promoteur CMV pour une cellule eucaryote, et encadrés des séquences de localisation nucléaire (NLS) afin d'adresser les protéines dans le noyau de la cellule eucaryote le cas échéant. Plus particulièrement encore, les dits premier et deuxième composants sont intégrés dans un même dit vecteur, de préférence un plasmide.

Selon la présente invention, on a en particulier découvert que la protéine R350 n'est pas une simple hélicase mais présente une activité d'endonucléase spécifique qui coupe spécifiquement les dites séquences spécifiques répétées au sein de la séquence cible de la cellule hôte.

Dans un mode préféré de réalisation, la présente invention fournit une méthode pour au moins couper en un site spécifique la dite séquence cible, caractérisé en ce que le dit premier composant comprend au moins la protéine R350 ou au moins un vecteur d'expression d'au moins une séquence d'acide nucléique du gène R350 codant pour respectivement au moins une dite protéine R350.

Plus particulièrement, la présente invention fournit une méthode pour au moins couper en un site spécifique et dégrader au moins partiellement la dite séquence cible, caractérisé en ce que le dit premier composant comprend au moins la protéine R350 et la protéine R354 ou au moins un vecteur d'expression d'au moins des séq uences d'acides nucléiques des gènes R350 et R354 codant pour respectivement au moins les dites protéines R350 et R354.

Plus particulièrement encore, les dits premier et deuxième composants sont intégrés dans un même dit vecteur comprenant les séquences de Mimivirus de lignée A incluant :

- au moins une partie modifiée du gène R349, de préférence le gène R349 modifié complet, ladite partie modifiée du gène R349 incluant une partie du gène 349 incluant au moins une des 4 séquences répétées de 15 nucléotides du virophage zamilon du gène R349, de préférence les 4 séquences répétées, la dite modification de la dite partie modifiée du gène R349 consistant en ce que la (ou les) dite(s) séquence(s) répétée(s) de 15 nucléotides du virophage zamilon du gène R349 est (ou sont) remplacée(s) par une même dite séquence complémentaire d'une séquence spécifique de la dite séquence cible, et

- une séquence permettant la transcription en ARN dans une dite cellule hôte de ladite partie modifiée du gène R349, de préférence du gène R349 modifié complet, et

- les gènes R350 et 354, ainsi que des séquences permettant l'expression des gènes R350 et R354 dans une dite cellule hôte.

Plus particulièrement encore, pour une cellule hôte de bactérie, les dits premier et deuxième composants sont intégrés dans un même dit vecteur comprenant les séquences de Mimivirus de lignée A incluant l'une des séquences SEQ.ID. N°22 ou SEQ.IDN°25 dans laquelle la séquence répétée 4 fois spécifique du gène de résistance à la tétracycline SEQ. ID. N°23 est remplacée par une dite séquence complémentaire d'une séquence spécifique de 15 nucléotides de la séquence cible.

Plus particulièrement encore, pour une cellule hôte de bactérie, les dits premier et deuxième composants sont intégrés dans un même dit vecteur comprenant les séquences de Mimivirus de lignée A incluant l'une des séquences SEQ. ID. N°37 ou SEQ.ID N°40 dans laquelle la séquence répétée 4 fois spécifique du gène de résistance à la tétracycline SEQ. ID. N°39 est remplacée par une dite séquence complémentaire d'une séquence spécifique de 15 nucléotides de la séquence cible.

La présente invention fournit aussi un système biologique utile pour la mise en œuvre d'une méthode selon l'invention de modification par coupure et/ou dégradation totale ou partielle d'une séquence cible d'acide nucléique d'une cellule hôte comprenant la mise en contact de la dite cellule hôte in vitro ou ex vivo, tel que définie ci-dessus comprenant : - un premier composant comprenant au moins une protéine choisie parmi les protéines R350 et R354 de virus géant Mimivirus de lignée A ou au moins un vecteur d'expression d'au moins une séquence d'acide nucléique de(s) gène(s) R350 et/ou R354 codant pour respectivement au moins une dite protéine R350 et/ou R354, et

- un deuxième composant comprenant une séquence d'acide nucléique, dénommée séquence d'affinité, la dite séquence d'affinité comprenant au moins une séquence complémentaire d'une séquence spécifique de ladite séquence cible, la dite séquence spécifique de ladite séquence cible comprenant au moins 10 nucléotides, de préférence 15 nucléotides, de préférence la ou chaque dite séquence complémentaire d'une séquence spécifique de ladite séquence cible étant flanquée en 3' et 5' de séquences adjacentes encadrant une séquence de 15 nucléotides du virophage zamilon contenue et répétée 4 fois dans le gène R349 de virus géant Mimivirus.

Plus particulièrement, la dite ou chaque dite séquence complémentaire de la même dite séquence spécifique de la séquence d'affinité est flanquée en 3' et 5' de séquences adjacentes encadrant une séquence de 15 nucléotides du virophage zamilon contenue et répétée 4 fois dans le gène R349 de virus géant Mimivirus.

Le système biologique selon la présente invention comprend évidemment l'ensemble des caractéristiques énoncées en amont pour ledit système lors de la description de la méthode selon l'invention.

La présente invention couvre également des dites méthodes et systèmes biologiques selon l'invention mis en œuvre avec des dites séquences d'acides ou de protéines qui sont homologues voire orthologues à celles des dites séquences, et/ou présentant des similarités notamment avec au moins 90% d'identité de dites séquences.

D'autres caractéristiques et avantages de la présente invention ressortiront mieux à la lecture de la description qui va suivre, faite de manière illustrative et non limitative, en référence aux dessins annexés sur lesquels :

Les figures 1A-1 B et 2A-2B représentent des gels d'électrophorèse d'agarose de diverses séquences d'acides nucléiques en présence ou non des protéines R350 et/ou R354.

La figure 3 est un schéma du mode d'action hypothétique de l'hél icase R350 et la nucléase R354.

La figure 4 représente un gel d'électrophorèse de polyacrylamide (15%) montrant l'effet de l'ARN.

La figure 5 est un schéma illustrant le mode d'action de l'ARN sur la réplication de l'ADN en présence d'ADN polymérase.

La figure 6 montre les constructions des plasmides PP20 et PP21 d'expression des protéines R350 et R354.

Les figures 7A-7B représentent des gels SDS-PAGE et analyse par Western-blot des protéines extraites des cellules eucaryotes transfectées ou non par les plasmides PP20 et/ou PP21 sur une membrane de nitrocellulose hybridée avec un anticorps anti-FLAG.

La figure 8A représente le vecteur PP14 comprenant la séquence SEQ.ID. N°25 incluant le système Mimivire modifié de la séquence SEQ. ID. N°22 comprenant une séquence dirigée contre le gène de résistance à la tétracycline de la séquence SEQ.ID. N°23.

La figure 8B représente le vecteur pACYC184 portant une séquence spécifique du gène de résistance à la tétracycline (SEQ.ID. N°23).

Les figures 9 à 11 et 13 montrent des résultats comparatifs de culture de bactéries avec abolition de la résistance à la tétracycline pour les bactéries transformées par le vecteur PP14. La figure 12 montre les résultats de l'action du système Mimivire testée à l'aide d'une amplification (PCR) du gène de résistance à la tétracycline à partir de la culture bactérienne.

Les figures 14 et 15 montrent des résultats comparatifs de culture de bactéries avec abolition de la résistance à la tétracycline pour les bactéries transformées par le vecteur PP37.

La figure 16 montre des résultats comparatifs relatifs à la capacité du système Mimivire à abolir la résistance des bactéries à la tétracycline pour les bactéries transformées par le vecteur PP37, en milieu liquide.

La figure 17 montre les résultats mettant en évidence que l'action du système Mimivire n'est pas due à l'expression de protéines létales mais à l'abolition du gène de la résistance à la tétracycline.

Les résultats des exemples d'expériences réalisées sont rapportés ci-après (paragraphes I.A, I. B, I.C) et les matériels et méthodes sont explicités en fin de description (Paragraphe II). Un listage de séquences reprend des séquences SEQ. ID. N°1 à 40 mentionnées ci-après.

On a réalisé ci-après deux séries d'expériences. La première série d'expériences (I.A) vise à expliciter la compréhension du mécanisme d'action du système Mimivire. La deuxième série d'expériences (I. B, I.C) vise à confirmer les résultats mis en évidence précédemment en utilisant le système MIMIVIRE pour modifier un gène rapporteur dans des cellules eucaryotes (I. B) en réalisant l'inactivation d'un gène rapporteur qui sera facilement identifiable, pour modifier une séquence spécifique du gène de résistance à la tétracycline dans un système procrayote ( E.coli ) (I.C. l), pour vérifier la capacité du système Mimivire à abolir la résistance des bactéries à la tétracycline en milieu liquide (I.C.2), pour vérifier si la mort d'un système procaryote ( E.coli ) en présence de tétracycline est due à la modification d'une séquence spécifique du gène de résistance à la tétracycline dans ledit système par le système Mimivire (I.C.3) sans médiation protéique. I.A) Première série d'expériences vise à expliciter la compréhension du mécanisme d'action du système Mimivire.

1) On a utilisé les 2 protéines recombinantes R354 (Nucléase) et R350 (Hélicase) sur différents substrats nucléiques notamment (a) IORF4 du virophage zamilon de 594 nucléotides (produit amplifié par les amorces SEQ. ID. N° 12 et 13 du tableau 1 ci-après) qui porte la séquence répétée de 15 nucléotides du virophage zamilon (SEQ. ID. N°6) ainsi que (b) le gène R349 (SEQ. ID. N°5), tous 2 obtenus par PCR avec les amorces de séquences SEQ.ID.N 0 10 à 13 du tableau 1). Les figures IA et IB représentent des gels d'électrophorèse d'agarose (1%) de séquences d'ADN des gènes amplifiés par PCR de la séquence ORF4 de zamilon (fig.lA) et du gène R349 de Mimivire (fig.lB) traités avec une protéine R354 (N), une protéine R350 (N), les deux protéines (N + H) et un contrôle sans protéine (C).

Seule une activité exonucléasique de la protéine R354 a été observée avec dégradation totale non spécifique de l'ADN (Figures IA et IB).

2) On a recherché si l'action du système Mimivire impliquerait l'assistance de l'ARN correspondant à la séquence répétée, qui formerait ainsi un hétéroduplexe avec le simple brin de IORF4 notamment lors de la réplication de l'ADN du virophage et provoquerait ainsi l'arrêt de la réplication de l'ADN virophage.

Pour ce faire, on a réalisé des tests in vitro utilisant une matrice d'ADN synthétique correspondant à (a) une zone de 130 nucléotides de IORF4 de zamilon incluant la séquence répétée (séquence sens ou « forward » SEQ. ID. N° 8 et séquence anti-sens ou« reverse SEQ. ID. N° 9) et (b) un ARN de 15 nucléotides correspondant la séquence répétée (séquence sens ou « forward » SEQ. ID. N° 18 et séquence anti-sens ou « reverse » SEQ. ID. N° 19). Après hybridation, l'action de la nucléase R354, hélicase R350ou nucléase + hélicase a été testée. La figure 2A représente des gels d'électrophorèse de polyacrylamide (15%) de séquences d'acides nucléiques comprenant l'ADN simple brin du gène ORF4 de zamilon et une séquence d'ARN de 15 nucléotides complémentaires à la séquence répétées du virophage zamilon, avec une protéine R354 (N), une protéine R350 (N), les deux protéines (N + H) et un contrôle sans protéine (C).

La figure 2B représente des gels d'électrophorèse de polyacrylamide (15%) de séquences d'acides nucléiques comprenant l'ADN double brin du gène ORF4 de zamilon et une séquence d'ARN de 15 nucléotides complémentaires à la séquence répétées du virophage zamilon, avec une protéine R354 (colonnes N), une protéine R350 (N), les deux protéines (N + H) et un contrôle sans protéine (C).

Le résultat montre de façon surprenante que l 'hé I i case coupe au niveau du l'héteroduplexe alors que le nucléase dégrade totalement la matrice ADN (Figure 2A). Parallèlement, aucune action des deux protéines n'a été observée sur le double brin (Figure 2B).

Ces résultats suggèrent que la protéine codée par le gène R350 a une fonction d'endonucléase contrairement aux prédictions bioinformatique (hélicase). Afin de déterminer le site de coupure de manière exacte, les fragments issus de cette digestion ont été séquencés. Le séquençage nous a permis de situer entre la 8ieme et 9ieme nucléotide de la séquence répétée le site de coupure (TGATAATG vAATCTGA).

Ceci suggère que son action n'intervient que sur l'hétéroduplexe ADN/ARN retrouvé notamment lors de la réplication de l'ADN. Le mécanisme de résistance de Mimivirus envers zamilon pourrait s'opérer à travers l'introduction de cette coupure au niveau de IORF4 de zamilon par la protéine codée par le gène R350 suivie par la dégradation par la nucléase R354 comme illustré sur le schéma de la figure 3 sur laquelle l'ARN est référencé par A, la protéine R350 par B, et la protéine R354 par C. La figure 3 illustre le mode d'action de l'hélicase et la nucléase sur IORF4 de zamilon in vivo.

De plus, on a observé que la présence de cet ARN de séquence répétée bloque la polymérisation d'une zone de IORF4 de zamilon incluant la séquence répétée et génère des formes tronquées (Figure 4). On peut donc en inférer qu'à l'échelle de la réplication de zamilon, la réplication est stoppée comme illustré dans la figure 5 au niveau de IORF4.

La Figure 4 représente un gel d'électrophorèse de polyacrylamide (15%) montrant l'effet de l'ARN de séquence complémentaire (SEQ. ID. N° 18 et 19) à l'unité de séquence répétée sur la réplication d'un oligonucléotide de 130 bases (SEQ. ID. N° 8 et 9) correspondant la séquence de IORF4. On a réalisé l'electrophorèse sur gel de polyacrylamide dénaturant (15 % PAGE) d'un ADN synthétique (sens (SEQ. ID. N° 8) ou anti-sens (SEQ. ID. N° 9) utilisé comme matrice par l'ADN polymérase ADN dépendante (Klenow) après une hybridation préalable avec un ARN complémentaire correspondant à l'unité de séquence répétée (SEQ. ID. N° 18 et 19). Les contrôles ont été réalisés dans les mêmes conditions en absence de Klenow (C= sans Klenow) ou d'ARN ( + = avec ARN ou - = sans ARN).

La figure 5 est un schéma illustrant le mode d'action de l'ARN complémentaire à l'unité de séquence répétée (1) sur la réplication de l'ADN (2) en présence d'ADN polymérase (3) montrant l'importance cruciale de cet ARN dans le processus d'action du système Mimivire.

I.B) Utilisation du système MIMIVIRE dans des cellules eucaryotes.

On a cherché à confirmer les résultats précédemment mis en évidence en utilisant le système MIMIVIRE dans un système eucaryote en effectuant l'inactivation d'un gène rapporteur facilement identifiable. On a choisi d'inactiver le gène de la Green Fluorescent Protein (GFP) dans la lignée de cellules humaines HEK293. Dans un premier temps, on a cloné respectivement les gènes R350 et R354 étiquetés FLAG et flanqués des séquences NLS dans les plasmides pcDNA3.1/Hygro ou pcDNA3.1/Zeo comme illustré dans la figure 6.

La figure 6 montre les constructions des plasmides de transfection PP20 et PP21 utilisées dans cette étude pour valider le système MIMIVIRE dans lesquels les gènes MIMI_R354 (nucléase) et MIMI_R350 (hélicase) sont sous le contrôle du promoteur CMV et encadrés des séquences de localisation nucléaire (NLS) afin d'adresser l'hélicase et la nucléase dans le noyau de la cellule.

On a transfecté les cellules 293GFP avec ces plasmides afin d'établir une nouvelle lignée de cellules HEK293 GFP qui exprime les protéines R350 et R354. L'expression de la nucléase et de l'hélicase a été confirmée par Western Blot avec un anticorps monoclonal anti-FLAG (figures 7A-7B). Cet anticorps anti-FLAG reconnaît les bandes a 101.6 KDa pour l'hélicase et 70.8 KDa pour la nucléase.

Les Figures 7A-7B représentent des gels SDS-PAGE et analyse par Western-blot des protéines extraites des cellules 293GFP. On a réalisé des électrophorèses sur gel 10% SDS-PAGE de 50 pg d'un extrait protéique provenant des cellules 293GFP transfectées ou non par les plasmides PP20 et/ou PP21(Fig.7A) sur une membrane de nitrocellulose hybridée avec un anticorps anti-FLAG au 1:1000 (Fig.7B). Les tailles sont indiquées à gauche en KDa.

Dans un second temps, on a fait synthétiser un ARN de 45 nucléotides (séquences sens et antisens SEQ.ID.N°20-21, tableau 1) comprenant 2 unités de séquence spécifique répétées de 15 nucléotides provenant de la GFP (séquences sens et antisens SEQ.ID.N°29-30, tableau 1) et encadrée de la même séquence que l'on peut trouver dans le gène R349 de Mimivirus (tableau 1, séquences sens SEQ.ID.N°20 incluant la séquence SEQ.ID. N°29 et séquences antisens SEQ.ID.N°21 incluant la séquence SEQ.ID. N°30). Cette séquence 15 nucléotides est une partie du guide ARN utilisé pour inactiver le gène de la GFP avec le système CRISPR/Cas9 tel que décrit dans l'article Science. 2014 Jan 3;343:84-87. On a transfecté cet ARN dans les cellules HEK293 GFP qui expriment les gènes R350 et R354. La lecture de ces expérimentations a permis de suivre l'extinction relative de la fluorescence de la GFP par FACS.

I.C) Utilisation du système MIMIVIRE dans des cellules procaryotes.

I.C.l. Modification d'une séquence spécifique du gène de résistance à la tétracycline chez la bactérie E.coli

On a vectorisé le système dans un vecteur d'expression PP14 (SEQ. ID. N°25) pour procaryote sous contrôle du promoteur T7 inductible par l'IPTG. La séquence du gène R349 a été modifiée (SEQ.

ID. N°7) afin d'agir contre le gène de la résistance à la tétracycline en remplaçant les 15 nucléotides de la séquence répétée de zamilon par 15 nucléotides spécifique du gène de résistance à la tétracycline (SEQ. ID. N°23 : CACCCTGGATGCTGT). Les gènes R350 et R354 ont été ajoutés à la suite du R349 et sont organisés en opéron sous contrôle du promoteur inductible T7 (annexe 1, SEQ. ID. N°22).

Les figures 8A-8B représentent le vecteur Mimivire (PP14-figure 8A) portant la séquence SEQ. ID. N°25 incluant la séquence SEQ.ID.N°22 avec le gène R349 modifié (SEQ. ID. N°7) par une séquence dirigée contre le gène de résistance à la tétracycline (SEQ. ID. N°23) ainsi que des gènes R350 (SEQ. ID. N°3) et R354 (SEQ. ID. N°4) sous la commande d'un même promoteur T7 (SEQ. ID. N°31) avec une organisation en « opéron » à l'aide de séquences d'opéron Lac (SEQ. ID. N°32), séquence de Shine-Dalgarno et terminateur T7 (SEQ. ID. N°33). Le vecteur PP14 dans lequel sont clonés les gènes R349, R350 et R354 fait partie de la famille des vecteurs pET qui sont des vecteurs d'expression chez les bactéries. Ces vecteurs embarquent entres autres, un promoteur T7 inductible c'est-à-dire que l'expression ne se fait qu'en présence d'un certain composé dans le milieu de culture à savoir l'IPTG (Isopropyl b-D-l-thiogalactopyranoside). Ce vecteur permet de synthétiser de manière constitutive une protéine appelée lacl qui se fixe sur la séquence Lac operator et ainsi bloque la transcription du gène cloné en aval du promoteur T7 du fait que la T7 ARN polymérase fixée au préalable sur le promoteur T7 ne peut pas transcrire le gène à cause de l'encombrement stérique que lui crée la présence de la protéine lacl. Néanmoins, en présence d'IPTG, la protéine lacl se complexe avec cette molécule IPTG entraînant un changement de conformation de la protéine lacl la rendant incapable de se fixer sur la séquence lac operator, ce qui permet à la T7 RNA polymérase de transcrire le gène cloné en aval du promoteur T7. Et, le terminateur T7 stoppe la T7 RNA polymérase à la fin de la transcription.

La séquence Shine-Dalgarno est reconnue par le ribosome de la bactérie. Chez les bactéries il est possible de faire traduire un ARN messager dit « polycistronique » c'est-à-dire qui contient la transcription de plusieurs gènes à la suite selon une organisation en « opéron ». Pour ce faire, chaque partie de TARN messager qui contient la transcription d'un gène doit être précédée d'une séquence Shine- Dalgarno reconnue par le ribosome qui pourra donc se fixer dessus et initier la traduction de l'ARN messager.

En présence de l'IPTG dans le milieu, on réalise la transcription en ARN du R349 modifié qui embarque les 4 unités repeat correspondant à la tétracycline d'une part et d'autre part, on réalise la transcription d'un autre ARN messager qui embarque les gènes R350 (hélicase) et R354 (nucléase). Les 2 transcriptions sont indépendantes l'une de l'autre.

Ce vecteur PP14 est ensuite transféré par électroporation dans des bactéries E.coli BL21 préalablement transformées par le vecteur pACYC184 (figure 8B) permettant l'expression du gène de la résistance à la tétracycline. Les bactéries sont établies selon différentes dilutions sur boite LB/agar contenant soit Ampiciline/Tetracycline/IPTG (50pg/ml ; 12pg/ml ; O.lmM respectivement) soit Ampiciline/IPTG (50pg/ml ; ImM respectivement).

Les figures 9 à 11 et 13 montrent des résultats comparatifs de culture de bactéries avec abolition de la résistance à la tétracycline pour les bactéries transformées par le vecteur PP14.

La Figure 9 montre les résultats de le la première expérience. Sur les boites Amp/IPTG on dénombre (de gauche à droite) 16 ; 3 et 48 bactéries pour des dilutions étalées correspondantes respectivement au 1/10 ; 1/50 ; et au reste de la transformation. Sur les boites

Amp/Tet/IPTG, on dénombre respectivement 0 ; 0 et 8 bactéries.

La Figure 10 montre les résultats de la seconde expérience. Sur les boites Amp/IPTG on dénombre (de gauche à droite) 5 et 28 bactéries pour des dilutions étalées correspondantes respectivement au 1/5 et au reste de la culture. Volume de départ de 1ml. Sur les boites

Amp/Tet/IPTG, on dénombre respectivement 9 et 4 bactéries. Ces résultats montrent que le système Mimivire permet bien d'abolir la résistance à la tétracycline. Ces résultats ont été confirmés par d'autres expériences assurant de la présence ou l'absence du vecteur conférant la résistance à la tétracycline.

Dans un premier temps, on a testé l'induction de l'expression des gènes du système Mimivire par l'IPTG sur la croissance d'E. coli BL21- DE3 doublement transformée (pACYC184 et PP14).

La Figure 11 montre l'effet de l'induction du système Mimivire : Les bactéries contenant le vecteur pACYC184 sont électroporées avec le vecteur PP14 contenant le système Mimivire et étalées à volume égal sur des boites LB/Agar Ampicilline/Tétracycline +ou- IPTG. Sur la figure 11, on voit clairement que l'induction de l'expression des gènes du système Mimivire se traduit par la diminution drastique du nombre de colonies quel que soit l'antibiotique.

Suite à ces résultats, on a voulu caractériser des clones bactériens doublement transformés du système Mimivire. Pour ce faire, on a mis en culture les clones bactériens issus des boites LB/Agar Ampicilline/Tétracycline sans IPTG, en milieu Ampicilline +IPTG dans le but d'activer le système Mimivire et en parallèle, les mêmes clones sont mis en culture en milieu Ampicilline sans IPTG comme control négatif. L'action du système Mimivire est testée à l'aide d'une amplification (PCR) du gène de résistance à la Tétracycline à partir de la culture bactérienne. Dans l'hypothèse d'une action du système Mimivire, cette amplification devrait être impossible.

Un test de l'action du système Mimivire par PCR a été réalisé à partir de la culture bactérienne de 10 clones issus de la boite LB/Agar Ampicilline/Tétracycline et poussé 16h en Ampicilline seul ou Ampicilline + IPTG.

Le résultat de la PCR montre l'amplification d'un fragment de 1.3 kb correspondant au gène de résistance de la tétracycline.

Dans les conditions expérimentales utilisées pour l'amplification du gène de résistance à la tétracycline, ce résultat ne permet pas de visualiser une absence totale ou partielle du vecteur pACYC184 portant le gène de résistance à la Tétracycline. Une faible présence de vecteur intact peut engendrer un fragment lors de l'amplification et expliquer ainsi les résultats obtenus dans la figure 12. Une amplification en temps réel (q PCR) a permis une meilleure interprétation de l'action du système Mimivire.

Il est à noter que sur les 10 clones, 2 seulement ont poussé en milieu Ampicilline/IPTG (clone 7 et 10) alors que les 10 clones ont poussé en milieu Ampicilline seul . Ce dernier résultat montre majoritairement que l'induction du système Mimivire à un effet sur la pousse des bactéries tout comme le résultat issu de la figure 11.

La Figure 13 montre l'étalement du clone 7 sur boite Tétracycline (284 bactéries) avec IPTG et sur boite Tétracycline (402 bactéries) sans IPTG à une dilution correspondante à 103 CFU théorique.

Le clone 7 répond à l'induction du système Mimivire via l'IPTG car on passe de 346 (boites Ampicilline/IPTG) à 284 bactéries (boites Tétracycline/IPTG) soit une diminution d'environ 18%, alors que l'on ne montre pas de différence notable sur le contrôle sans IPTG (passage de 393 à 402 bactéries).

L'absence de colonies sur tétracycline confirme une action du système Mimivire sur l'inhibition de la résistance à la Tétracycline.

I.C.2. Etude de la capacité du système Mimivire à abolir la résistance des bactéries à la tétracycline en milieu liquide

Des bactéries E.coli ont été transformées avec le plasmide pACYC184 contenant le gène de résistance à la tétracycline (SEQ. ID. N°35).

Le vecteur Mimivire PP37 porte la séquence SEQ. ID. N°40 incluant la séquence SEQ.ID.N°37 avec le gène R349 modifié (SEQ. ID. N°38) par une séquence dirigée contre le gène de résistance à la tétracycline (SEQ. ID. N°39) ainsi que des gènes R350 (SEQ. ID. N°3) et R354 (SEQ. ID. N°4) sous la commande d'un même promoteur T7 (SEQ. ID. N°31) inductible par l'IPTG, avec une organisation en « opéron » à l'aide de séquences d'opéron Lac (SEQ. ID. N°32), séquence de Shine-Dalgarno et terminateur T7 (SEQ. ID. N°33).

Le vecteur PP37Vector (SEQ ID n° 40) dans lequel sont clonés les gènes R349, R350 et R354 fait partie de la famille des vecteurs pET qui sont des vecteurs d'expression chez les bactéries. Ces vecteurs embarquent entres autres, un promoteur T7 inductible c'est-à-dire que l'expression ne se fait qu'en présence d'un certain composé dans le milieu de culture à savoir l'IPTG (Isopropyl b-D-l- thiogalactopyranoside). Ce vecteur est le même que celui du vecteur PP14 mais avec les 15 nucléotides spécifiques du gène de résistance à la tétracycline correspondant à la SEQ. ID. N°39 : CGGCTCTTACCAGCC.

Les bactéries E.coli BL21 préalablement transformées avec le plasmide pACYC184 ont été transformées avec le vecteur PP37Vector. Les bactéries ont été étalées sur des boîtes contenant 100 mg/L d'ampicilline et 12 mg/L de tétracycline supplémenté ou non avec ImM d'IPTG.

La Figure 14 montre les résultats de la première expérience. Sur les boites Amp/Tet on dénombre (de gauche à droite) 1597 et 259 bactéries pour des dilutions étalées correspondant respectivement au 1/1 et 1/10. On constate que sur les boites Amp/Tet/IPTG, on n'obtient aucune bactérie.

La Figure 15 montre les résultats de la seconde expérience. Sur les boites Amp/Tet on dénombre (de gauche à droite) 562 et 60 bactéries pour des dilutions étalées correspondant respectivement au 1/1 et 1/10. Volume de départ de 1ml . On constate que sur les boites Amp/Tet/IPTG, on n'obtient aucune bactérie.

Les résultats obtenus (figure 14 et 15) montrent l'absence de colonies sur l'agar contenant de la tétracycline en présence d'IPTG qui induit l'expression des protéines du système Mimivire. Ces résultats mettent en évidence la capacité du système Mimivire à abolir la résistance des bactéries à la tétracycline causant la mort des bactéries.

L'induction du système MIMIVIRE a été testée dans u n milieu liquide. Pour ce faire, deux colonies d'Escherichia coli présentant les plasmides PP37Vector et pACYC184, ont été sélectionnées sur des boîtes contenant de l'ampicilline (100 mg/L) et de la tétracycline (12 mg/l) et cultivées dans 2 mL de milieu contenant de l'ampicilline (100 ug/L) et (12 ug/mL) à 37°C sous agitation à 200 rpm. Après 2 heures, chaque culture a été divisée en deux tubes dans lesquels un tube a été supplémenté avec ImM d'IPTG pour induire l'expression des protéines du système Mimivire. A intervalle de temps régulier, 10 pl ont été dilué dans 1 ml_ à partir duquel 100 pL ont été étalé sur des boîtes d'agar contenant 100 pg/L d'ampicilline et 12 pg/mL de tétracycline.

Tel que présenté en figure 16, l'induction de l'expression des protéines du système Mimivire par l'IPTG induit la mort des bactéries 4 heures après induction. On constate en effet que 30 et 20 fois moins de colonies ont été obtenues pour le clone 1 et le clone 2 respectivement après addition d'IPTG. Ces résultats mettent en évidence la capacité du système Mimivire à abolir la résistance des bactéries à la tétracycline en milieu liquide, causant la mort des bactéries.

I.C.3. Vérification de l'implication de protéines médiatrices dans l'activité du système Mimivire

Pour exclure l'expression de protéines létales par le système Mimivire dans les bactéries E.coli, leur viabilité a été testée sur différents milieux. Pour ce faire, 4 colonies d 'E.coli présentant les plasmides PP37Vector et pACYC184 ont été collectées et cultivées dans lmL de milieu contenant de l'ampicilline et de la tétracycline à 37°C sous agitation à 200 rpm. Après deux heures, chaque culture a été supplémentée avec 1 mM d'IPTG pour induire l'expression des protéines du système Mimivire. Après 4 heures, 10 pL ont été dilués dans 1 ml_, puis 100 pL ont été étalé sur des boîtes d'agar contenant de l'ampicilline et de la tétracycline ou contenant de l'ampicilline mais pas de tétracycline.

Les résultats présentés en figure 17 confirment que la mort des bactéries n'est pas due à l'expression de protéines létales mais à l'abolition de la résistance à la tétracycline. Ces résultats permettent de prouver que l'activité Mimivire peut être transférée dans E. coli pour agir contre un gène cible en incluant 15 séquences spécifiques répétées de nucléotides de ladite séquence. La substitution de 15 nucléotides de la séquence Zamilon par 15 nucléotides spécifiques du gène de résistance à la tétracycline n'a pas créé de protéine abortive. Seuls les acides aminés codant pour la séquence répétée DN ES du Zamilon ayant été mutés. Ces résultats excluent la possibilité que le système Mimivire soit médié par des interactions protéiques.

II) Matériels et Méthodes

1) Traitement enzymatique

Les réactions enzymatiques ont été effectuées en incubant chaque produit de PCR, de transcription in vitro (IVT) ou d'amorce avec la nucléase (R354), l'hélicase (R350) ou les deux enzymes. Les réactions enzymatiques ont été conduites dans du tampon CutSmart® (Ref: B7204S) de New England Biolabs (acétate de potassium 50 mM, acétate de trisium 20 mM, acétate de magnésium 10 mM, 100 ug ml-1 de BSA, pH 7,9) à 32° C pendant 2 heures, en utilisant une concentration de protéine de 0,5 mg . ml-1 pour chaque enzyme. Après incubation, toutes les réactions ont été traitées par la protéinase K pour éviter que l'ADN ou l'ARN ne se répande dans les puits des gels. Après incubation, les produits des réactions enzymatiques ont été soumis à une électrophorèse sur gel d'agarose (1,5%) ou de PolyAcrylamide dénaturant (d PAGE) à 15%. Les contrôles ont été effectués avec les mêmes conditions, en absence de l'enzyme R354 ou R350.

2) Conditions de cultures.

2.1) Dans des cellules eucaryotes :

Les amibes Acanthamoeba castellanii (ATCC 30010) ont été ensemencées à 5 x 10 6 dans le milieu salin amibien (PAS) de Page comme décrit précédemment (7). La lignée H EK293 GFP (cellules humaine de rein embryonnaire, Clinisciences) a été cultivée à 37°C dans un incubateur à C0 2 à 5% dans du milieu Eagle modifié par Dulbecco (DM EM) additionné de 10% de FBS (Gibco), GlutaMAX 2 mM (Life Technologies), 100 U / ml de pénicilline, 100 ug / ml . Streptomycine et 100 pg / ml d'acide aminé non essentiel.

2.2) Dans des cellules procaryotes :

Les bactéries Escherichia Coli One Shot™ BL21 (DE3) chimiquement compétente (Thermo Fischer, Réf: C600003) ont été cultivées dans du milieu Luria-Bertani (LB) avec un antibiotique approprié. Les bactéries ont été étalées sur LB-agar avec un antibiotique approprié (12pg / ml pour la tétracycline et 50pg / ml pour l'ampicilline). Le système Mimivire a été induit par l'ajout de 0,2 mM d'isopropyl b-D-l-thigalactopyranoside (IPTG) sur des plaques de LB- agar.

3) Test d'infection et de transfection.

Les amibes A. Castellanii ont été infectées ou co-infectées respectivement avec Mimivirus ou Mimivirus et le virophage zamilon en utilisant une MOI de 10. Les cellules ont ensuite été incubées à 32 ° C et à des points réguliers post-infection, les cellules ont été recueillies pour l'extraction d'ARN avec le Kit d'isolation mirRena™ miRNA (Ambion). Les cellules 293GFP ont été ensemencées sur des plaques 6 puits (Corning) 48 h avant la transfection à une densité de 300 000 cellules/puits. Les cellules ont été transfectées à 80-90% de confluence en utilisant la Lipofectamine 2000 (Life Technologies) en suivant le protocole recommandé par le fabricant. Un total de 4 ug de PP20vector/PP21vector (hébergeant respectivement la séquence NLS- R350-NLS et N LS-R354-N LS) ont été utilisés pour la transfection. MIMI_R354 (Nucléase) et MIMI_R350 (Hélicase) sont marqués par 3 séquences FLAG à l'extrémité N-terminale (3xDYKDDDDK) pour confirmer l'expression des protéines correspondantes par des expériences de Western Blot avec un anticorps monoclonal anti-FLAG (Clone M2, Sigma). Le lendemain, ces cellules sont ensemencées dans une flask T75. Une sélection avec de l'hygromycine (100 ug / ml) et de la zéocine (100 ug / ml) a été appliquée au jour 3 après la transfection. Ces cellules ont été cultivées dans ces conditions pendant 3 semaines afin d'isoler des cellules doublement transfectée stables (lignée 293GFP [PP20 / PP21]).

4) Test de transformation.

Les plasmides utilisés dans ces expériences sont le PP14 synthétisé par Genscript hébergeant une expression inductible du système Mimivire sous le contrôle du promoteur T7 (voir l'annexe 1 et la figure 8 A), le vecteur PP37 hébergeant une expression inductible du système Mimivire sous le contrôle du promoteur T7 (voir l'annexe 2), et le vecteur pACYC184 (société Mo Bi Tec Ref: V32402). Les bactéries Escherichia Coli One Shot™ BL21 (DE3) a été transformé par le plasmide pACYC184 selon le protocole et les instructions du fabricant. Les bactéries ont été étalées sur une plaque de LB-agar tétracycline (Tet) (jour 1). Le lendemain, un clone a été prélevé et cultivé dans 10 ml de milieu LB sélectif Tet pendant une nuit à 37° C sous agitation à 200 tr/min. Au jour 3, 200 pl de la culture ont été inoculés dans 20 ml de milieu LB+Tet frais jusqu'à ce que la DO à 600 nm atteigne 0,7. Les bactéries ont été récoltées par centrifugation à 7000 tr / min pendant 1 minute à 4° C et lavées trois fois avec du glycérol 10%. Après la première centrifugation, toutes les étapes ont été réalisées sur glace et en chambre froide. Les bactéries ont été remises en suspension dans 50 ul de glycérol 10% et 200 ng de vecteur PP14 ont été ajoutés. Le mélange a été transféré dans une cuvette Gene Puiser® avec un espace de 0, 1 cm (Bio-Rad, Réf 165-2089) et une impulsion électrique a été produite avec le MicroPulser Electroporator (Bio-Rad, Réf: 165-2100) en utilisant le programme Ecl . Le temps d'électroporation indiqué par le dispositif après l'impulsion était de 5,8 ms. Après électroporation, 1 ml de LB a été ajouté immédiatement et incubé pendant 1 heure à 37° C sous agitation à 200 tr/min. Plusieurs dilutions ont été étalées sur des plaques de LB-agar sélectif Tet / Amp/IPTG ou Amp/IPTG et incubées pendant une nuit à 37° C. Le lendemain, les colonies ont été comptées.

5) Clonage, expression et purification. Les séquences des gènes codant pour la protéine R350 et R354 de Mimivirus ont été optimisées pour maximiser l'expression dans E.coli et synthétisé par GenScript. La protéine R354 inclut u ne étiquette polyhistidine (SEQ. ID. N°34) à l'extrémité C-terminale. La séquence du R349 reste inchangée à l'exception de l'unité repeat de 15 nucléotides qui correspond à une séquence de la tétracycline (SEQ.ID. N°7 incluant SEQ.ID. N°23 répétée 4 fois ou SEQ. ID. N°38 incluant SEQ. ID. N°39 répétée 4 fois). Ces gènes ont été inséré entre les sites de coupure Xbal et Xhol du plasmide pET22b ( + ) (annexe 1, SEQ.ID. N°22).

Les protéines recombinantes ont été exprimées dans E. coli BL21 (DE3) -pGro7 / GroEL (TaKaRa) en utilisant un milieu ZYP-5052. Chaque culture a été cultivée à 37° C jusqu'à obtention d'une absorbance à 600 nm de 0,8 suivie de l'addition de L-arabinose (0,2% m / v) et d'une induction avec une transition de température à 18° C pendant 20 h. Les cellules ont été récoltées par centrifugation (5 000 g, 30 min, 4° C) et les culots résultants ont été remis en suspension dans du tampon de charge (20 mM M ES pH 6,0) et conservés à -80° C pendant une nuit. Les cellules congelées ont été décongelées et incubées sur de la glace pendant 1 h après addition de lysozyme et de fluoru re de phénylméthylsulfonyle (PMSF) à des concentrations finales respectives de 0,25 mg ml-1 et 0, 1 mM. Les cellules partiellement lysées ont ensuite été perturbées par trois cycles consécutifs de sonication (30 s, amplitude 45) effectués sur un système de sonication Q700 (QSonica). Les débris cellulaires ont été jetés après une étape de centrifugation (11 000 g, 20 min, 4° C).

La protéine recombinante a été purifiée en utilisant une colonne échangeuse de cations à partir de 6 ml de RESOURCE S (GE Heathcare) en utilisant un tampon MES 20 mM pH 6,0 et un gradient linéaire à 0,5 M de NaCI dans 10 volumes de colonne. Les fractions ont été analysées par SDS-PAGE colorée au bleu de Coomassie (10%) et les activités d'hélicase ont été évaluées sur une électrophorèse sur gel de Polyacrylamide dénaturant comme décrit précédemment (15% de d PAGE). Les fractions actives (générant un clivage au niveau de l'unité répétée de 15 nucléotides de zamilon) ont été regroupées et purifiées davantage en utilisant une Chromatographie d'affinité sur métal immobilisé (tampon de chargement et de lavage: Tris 50 mM pH 8, NaCI 300 mM, imidazole 20 mM, tampon d'élution : Tris 50 mM pH 8, NaCI 300 mM, imidazole 250 et 500 mM) sur une colonne de 5 ml d'HisTrap FF brut (GE Healthcare). Les fractions ont été analysées en utilisant SDS- PAGE à 10% (coloration de Coomassie) et évaluées en utilisant l'activité hélicase comme décrit précédemment.

6) Extraction ARN et caractérisation

Les cultures obtenues ont été traitées avec le kit mirVana™ miRNA (Ambion). Des fractions enrichies de petits ARN (<200 nt), ainsi que de l'ARN total ont été obtenus. Les échantillons d'ARN ont été caractérisés en utilisant des puces RNA 6000 Pico Total RNA (Agilent) combinées avec le Bioanalyzer Agilent 2100 ou une électrophorèse sur gel de polyacrylamide dénaturant (d PAGE-15% acrylamide) pour les petits ARN .

7) Analyse par Northern Blot

Pour confirmer l'expression et la taille de "l'ARN repeat", des hybridations par Northern Blot ont été effectuées en utilisant 10 ug d'ARN total ou 2 ug de petit ARN. Les échantillons d'ARN ont été dénaturés pendant 5 minutes à 95° C dans un tampon de charge contenant 50% de formamide suivi d'un refroidissement immédiat sur de la glace. Des échantillons d'ARN ont été passés sur des gels de Polyacrylamide dénaturants à 15% d'urée (d PAGE), électrobiotés sur des membranes Hybond N + (GE Helathcare) à 20 V pendant 1 heure en utilisant un transfert semi-sec (Hoefer TE 77, GE Healthcare). La membrane est ensuite cross-linked aux UV pendant 2min.

Les sondes (LNA), par ex. 5'-TCA-GAT-TCA-TTA-TCA-G-3 'et 5'- CTG-ATA-ATG-AAT-CTG-A-3', avec de la digoxigénine (DIG) aux deux extrémités, ont été acheté auprès d'Eurogentec. La pré-hybridation et l'hybridation ont été réalisées en utilisant un tampon Easy Hybridization (Roche Applied Science) à 37° C. Après hybridation, les membranes ont été lavées deux fois en utilisant une solution tampon de faible stringence (2X SSC, 0, 1% SDS) et une solution tampon de stringence élevée (0, 1X SSC, 0, 1% SDS), pendant dix minutes à température ambiante et quinze minutes à 60°C, respectivement.

Les membranes ont ensuite été hybridées avec une sonde marquée au DIG comme recommandé par le fabricant (DIG-System, Roche Diagnostics), à l'exception de la détection de la sonde hybridée qui a été réalisée en utilisant un anti-digoxine monoclonal conjugué à la peroxydase de raifort (Jackson Immunoresearch, 1 : 5000). Après plusieurs lavages, des transferts ont été révélés par des tests de chimioluminescence (ECL, GE Healthcare). Le signal résultant a été détecté sur Hyperfilm™ ECL (GE Healthcare) en utilisant un processeur de film automatisé (Hyperprocessor™, GE Healthcare).

8) Transcription in vitro

Toutes les transcriptions in vitro ont été réalisées selon les instructions et les recommandations du fabricant (Kit MegashortscriptTM de Thermofisher, ref: AM 1354). Brièvement, les matrices ADN ont été hybridées avec des amorces incluant les promoteur T7 et opéron lac (SEQ.ID. N°14-15 et 16-17) et mélangées avec le tampon de réaction T7 (1 x), une solution de T7 NTP (7,5 mM), l'enzymes T7 (2 ul pour une réaction de 20 ul) pendant 4 heures à 37° C. Les matrices d'ADN ont été dégradées par TURBO DNase (2 U) pendant 15 minutes à 37° C. Les transcrits d'ARN ont été précipités à l'éthanol . Les culots finaux ont été remis en suspension dans de l'eau exempte de nucléase.

9) PCR avortée

Les matrices ADN ont été incubées avec les ARN complémentaire correspondant à l'unité repeat de zamilon de 15 nucléotides (SEQ.ID. N°18-19) ainsi qu'une amorce d'élongation à 95°C pendant 5 minutes puis en les refroidissant progressivement jusqu'à 25°C. Tous les mélanges ont été incubés avec 5 U de Klenow exo-, provenant de ThermoFisher ( réf : EP0422) pendant 1 heure à 37°C. Les contrôles ont été effectués avec les mêmes conditions à sans l'ARN ou Klenow.

10) Purification des ARNs ou ADNs à partir de gel de polyacrylamide

La récupération d'acide nucléique à partir de bandes de polyacrylamide excisées à partir de gels a été réal isée par la méthode d'écrasement et de trempage comme décrit précédemment (18).

11) Séquençage des ARN et ADN

Les échantillons d'ADN simple brin de 65 nucléotides ont été séquencés sur la technologie MiSeq (Illumina Inc., San Diego, CA, USA). L'approche RNAseq a été choisie et les banques ont été construites en utilisant Truseq stranded mRNA strategy et ont été barre-codé avec un autre projet RNAseq.

Les échantillons ont été mesurés sur le Nanodrop et le volume maximum de 16,5 pL, compris entre 36 et 160ng, a été impliqué pour synthétiser l'ADN du second brin. La procédure d'ARNm brin Truseq a été suivie à partir de là et toutes les étapes de purifications d'Ampure ont été remplacées par une précipitation alcoolique en raison de la petite taille des fragments d'ADN . Les profils de bibliothèques ont été visualisés par bioanalyseur DNA1000 (Agilent Technologies Inc, Santa Clara, CA, USA) à 71, 78, 130 paire de bases. La concentration finale des banques ont été de 143 et 333 nmol/l pour les 6 échantillons.

Les banques ont été normalisées à 2 nM et regroupées. Après une étape de dénaturation et une dilution à 15 pM, le pool a été chargé sur la cartouche de réactif, puis sur l'instrument avec la cellule d'écoulement. La génération automatisée de grappe et l'exécution de séquençage ont été effectuées sur le kit MiSeq Reagent V3 en 150 cycles. Une information totale de 5 Gb a été obtenue à partir d'une densité de grappe de 1618 K / mm2 avec un filtre de contrôle de qualité passant de 85,6% (18644000 lectures de paires appariées). Au sein de cette série, les représentations de l'indice ont été déterminées comme étant respectivement de 0,69%, 0,47%, 0,84%, 0,65%, 0,76% à 0,94%. Le minimum de 152 675 au maximum de 302 220 lectures appariées en fonction des échantillons conduit à un nombre global de 1 407 155 lectures appariées qui ont été ajustées puis analysées.

12) Test Mimivire

Les cellules 293GFP [PP20 / PP21] ont été ensemencées sur des plaques à 6 puits à 150000 cellules/puits 24h avant la transfection. Les cellules ont été transfectées en utilisant la lipofectamine RNAiMAX (Life Technologies) en suivant le protocole recommandé par le fabricant. Un total de 30 pmol d'ARN a été utilisé pour la transfection. Les cellules transfectées ont été analysées par FACS trois jours après la transfection.

13) SDS-PAGE et Western Blot

Les cellules transfectées ou non ont été lysées par sonication dans un tampon de solubilisation (urée 7 M, thiourée 2 M, Tris 30 mM, CHAPS 4% (p / v) et centrifugées à 10 000 g, 20 min, 4 ° C. Les protéines solubles ont été collectées et la concentration a été déterminée en utilisant le Bio-Rad De Protein Assay (Bio-rad).

Cinquante microgrammes de protéines solubles ont été fractionnés sur une électrophorèse sur gel de polyacrylamide à 10% puis révélés par InstantBIue Protein Stain (Expedeon). De plus, des protéines résolues ont été transférées sur une membrane de nitrocellulose (Trans-blot

Transfer Medium, Biorad, Hercules, CA, USA) à 100 V pendant 1 h en utilisant une unité de transfert semi-sèche (Hoefer TE 77, GE

Healthcare, Vél izy-Vi I la cou bl ay, France). Les membranes ont ensuite été bloquées dans du PBS additionné de 0,3% de Tween-20 et de 5% de lait écrémé en poudre (PBS-Tween-Milk) pendant 1,5 h et incubées avec des anticorps anti-FLAG monoclonaux de souris (1 : 1000). Les bandes immunoréactives ont été détectées en utilisant une immunoglobuline de chèvre anti-souris conjuguée à de la peroxydase (GE Healthcare, Vélizy- Villacoublay, France) diluée à 1 : 5000 dans le tampon de blocage pendant 1 h à température ambiante. Trois lavages de 15 min ont été appliqués entre chaque étape. Les bandes immunocolorées ont été visualisées avec le kit à base de chimioluminescence, tel que décrit par le fabricant (GE Healthcare, Vél izy-Vi I la co u bl ay, France). Le signal résultant a été capturé par un système d'imagerie Fusion FX7 (Vilber Lourmat, France).

14) Prédiction de structure secondaire pour l'ARN hébergeant deux séquences répétées de GFP de 15 nucléotides

Les structures secondaires ont été prédites en utilisant le serveur web Mfold. Nous avons conservé la structure secondaire avec l'énergie libre minimale.

15) Digestion sur gel et spectrométrie MALDI-TOF

Les bandes excisées des gels ont été décolorées et soumises à une digestion dans le gel avec de la trypsine (Proteomics grade trypsine, Agilent Technologies, Cedar Creek, TX). Les peptides tryptiques ont ensuite été extraits du gel par des traitements successifs avec de l'eau et de l'acétonitrile (qualité H PLC). Les extraits ont été regroupés et concentrés dans un évaporateur Speedvac. La solution de peptides a ensuite été déposée sur la cible d'ionisation par désorption laser assistée par matrice (MALDI). Les analyses de masse ont été effectuées sur un spectromètre de vitesse Brüker Autoflex Speed MALDI- temps de vol (MALDI-TOF) (Brüker Daltonique, Wissembourg, France). Les spectres de masse ont été calibrés de manière externe en utilisant des peptides de digestion trypsique de sérum albumine bovine (Brüker). Des listes de masse de peptides tryptiques ont été utilisées pour identifier les protéines, en utilisant le logiciel Mascot (Matrixscience). Les recherches ont été effectuées contre une base de données interne contenant la séquence étiquetée de MIMI_R350 (Helicase like), y compris une Étiquette de polyhistidine à l'extrémité amino-N-terminale.

Tableau 1 :

Annexe 1 :

SEQ.ID. N°22 =insert synthétisé et cloné par genscript dans pET- 22b( + ) aux sites de restriction Xba I/Xho I comprenant successivement les séquences des : a) promoteur T7 (SEQ.ID. N°31) TAATACGACTCACTATAG ; b)opéronLac(SEQ.ID. N°32) G AA TTGTGA G CG G A T AA CAA TTCQ

c) site de restriction Xba 1= TCTAGA ;

d) séquence Shine-Dalgarno: AAGGAGA ; e) première séquence soulignée= SEQ.ID. N°7 du gène 349 modifié incluant l'unité répétée 4 fois tirée du gène de résistance à la tétracycline SEQ.ID. N°23 = CACCCTGGATGCTGT_avec les 3 séquences de spacer intercalées SEQ.ID. N°26,27 et 28, f) premier spacer entre les première et deuxième séquences soulignées incluant le terminateur T7 SEQ.ID. N°33 CTA GCA T AA CCCCTT GGGGCCTCTAAA CGGGTCTTGA GGGG / / / / / IG, la séquence du Promoteur T7, SEQ.ID. N 0 31 TAATACGACTCACTATAG e. t la séquence du Lac operator, SEQ.ID. N°32 : GAATTGTGAGCGGATAACAATTCC et une Séquence Shine-Dalgarno; g) deuxième séquence soulignée= Séquence du gène R350 ; h) deuxième spacer entre les deuxième et troisième séquences soulignées incluant une séquence Shine-Dalgarno, et i) troisième séquence soulignée = Séquence du gène R354 ; j) site de restriction Xho I = CTCGAG ; k) séquence de l'étiquette poly histidine

SEQ.ID. N°34 : CACCACCACCACCACCAQ i) le terminateur T7 SEQ.ID.N°33 :

CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG

SEQ.ID.N°22 : séquences organisées en opéron incluant le gène R349 modifié avec séquence spécifique de 15 nucléotides du gène de résistance à la tétracycline (SEQ ID N°23) et les gènes R350 et 354.

TAA TACGACTCACTA 771 GGG GAA TTGTGA GCGGA T AA CAA TTCCCCX CT AG AAAT AATTTT GT TT AACTTT NKG AA GGA GAT AT AG AT ATGG AATT AATT AGT CGT GT CTTT ACT CAT GG AG AAAA T ATPT ACTT GTT AGTT CT ACAAAT AAGTT AT AT ATT ATGGGT AAT AAT G AAT ATGGTT CAT GT GGTTT CAAAAT AGGT ACAG AT AAAACTT AT ATT G AAAGT CCAGT AT AT ATT G ACATT AAATT A GAT GAT GAT GATT CT GTT AAAGCGTTTT ATT CTT GT AATTT ATT CACG AT G ATTCAT ACAT CCA AAGG AAAAATTT AT CT ATCAAG AT CATTT ATTT GT GGTGG AGGT G AAAT CG AT GCAT AT GAT A GTGAAAGTGATGTTGGAAGTGATGCTGAGTCTGATGCTGAGTCTGATGCTGAATCAGATT CA G A AA AT CAT ACT CAAAAT AAT ACAAAT ACT CCC AT AAAT AAT AT CACACT AATT AATTT G GATT CAT CAAAT AATT CCACT CAAT CCACCCTGG AT GCT GTT AAT G AAT CCACCCT GG AT GCT GT CA AT G AAT CTG AT CAAT CAT GT AGT G ATPT G ACT GT GG ACCT CG AT CCACCCT GGATGCTGTTG AAGAAG I I I I I GTTG ATCGT AAT GAT AAT AATT CAG AT AAT ATT GGT AATT CAAAT AGT AT CA CCCT G G ATGCTGTATCTAT G ACT G AAAAAG CT G G AAT AATTTT GTT AAACG AAATT AAAACC A TGGTAG AT G AAATPT GTCT CAAAAAAAT ATT AATT CTGTT GG AATT AACG AT ATT GTT ATT C GT CCAAG CG G ACAGT ATGTG AGT AAT ATGG GATAT ATT ACAG AAT CAG GTAGTGTAT CATTT C AT ACCAAT AAAAAT GGTTT CTT ATT ATT CAAGT CCAAT GTT CAT G AAAT CCTTTT CGTT G AAG A AAT GTTT ATGT ACT CT AAAAAT AATTTT ATTT ATTTGGCCAT ACCATTT AAAAAAT ACCAGGCA TCTCT AAG AG AT ATT GCT CCTTTT CAT ACAATT AAT AAAACAAAAAAT GGT ATT AAAT G G AAGT ATTT CAAAAT AGT GTTT CCATTT G ACACT G AAAAAAT AG AATTTT GTG ATAA I I ICI I I IATAC TT AT G AAT CCAAT ACTT GTTAT CAT CAT GTT ATTT CATT CT AC AAAAAT GT AAATT ATT AT CCT T CTT GG AT AT ATTT CAAAT CT G AG ATT GAT ATT AAT AGT AAAAAT AT GTT CTTTT CAAGT GATA CT AAT AGT GTGTAT GTT AAAG AT AAT AACAACGT GT AT AAAT ACCAT AATTT CAAT AATT CT CT T G AAAAAT ACAT CG AT AACAAACT CG ACTT G G ATGTCGT AATT GTG CCT G ATAGTT AT AG ACC AAT GG AAAT G AG ACT ACT ATT AAAGTT AGGTAT AACATT GT AT AGCG ATT ACAATTTT AAT GG AT GT G AGG AT GAT G AAG AACAT ATPT CG AAATT AT G AAAAAT CAAT ATGT ACCT CAT ATT AT CGGT CT G AATT ATPT G AAAGTTT CATT GT AGTT ATT GT CAAT AAT CCAAAT ATGTT G ACG AT AACAACTGACGATGGTAAAATTTTCTTTAACATTCATGATATTAC I I I I I ACAAAAGATTTTAT AAT GG AAT CGTTT ATCTTG AT AATGGTT CGTT ATPT AT CT CACAG AT AGT G AAATTT CAG AT CAAAAT GT ATGG AAACT AACTGG AT GT CAATT GTGT G AGCT AGCTG ATT CT ACCAT AT AT AGT T ACCT ATTT AATTT ACCGG ACAAAATT G AT G AAATTT ACT CTT CGTCT G AATTT ATT GTT CT AA AATT AATT G G A MCA AAT A I I I I I ATTATCCGGTTGAAAATTTTGATACTGCTCAAGATTTTAA G ACAAG AT GT GGGG AAATTT CATT G AAAAAT AATTCAGTT CTT G AACT CGTT AAT ACT AGT AT T ATT AACAG ACAAT CT AAAAGTT AT CAT ACT ACAGT AT CT ATT AAT ATT G AT ACGG ATT GT ACT ACT CAT AATT CTTT CG AG AG ATT GTTT AT CCT G ACACAAT CT CTT AGTT ATT CCGCAG AAT ATT CT ATT CG AATT GT AG ACG ACAAAAAT ATTGGTTTT GGT G ATGGGCCT AAAATT G AATPT GTG AAT CG GCT ATT AT G CAATTTT ATT AT AAGT ATTT AATT G CT CAT AATPT C ACACAG AGTTT AA TTT ACAAG A ATTT G CCAA ACT G A AACCCACCG A AATT AA AT ATTT G GG AT C AAT GTTT CAT AT GGTTATCTGT CAAAAT AATT CTT CGTTACCG ATT AG ATT ACCT CT AGCTTTT GCTGT AG AAAT TT AT GG AAAAG AACCCACAATT G AT G AATT GG AAT ATTTTGCTTGT AAT G AAG AT G AAACT GG ATT CAAACAT ATTT AT CCAGCCAAAT ACAAT CCCG AATT AGTT AAAG AATT CGGTTAT G AAT CT T AT G AACATT GTCT AAAAACTTT GTGT AAAT AT AATT AT G AAG AT G AT ACT G AT AAAAAT AT CT T G ACG AAAAAAT ATT GCG AGCAATT AGCTGCCGGTTTT AAAAG AT ACGGCAAT AT CAAG AACA T AAAACAAAT G AATTT ACCCACATT GG ACT ATT ACATTT CT GGCCCAT ACAAAATT AAT AG AAC CAT ATT AATT AAT AAT CTT GTTTT AT CGGG AGGT AAGG AT AAAAAT AAT AATT ATTT GG AAAT GTT CAAAG AATTT ATT AACT CTTT GTCT G AAAAT G AATT AAAAAT CTT GCT AAAAAATT GG ACA GCAT CAACTT GTGT AAG ACCAG AT AACAAAT AT AG AATT AT CATT ATTT CCAAAT CT AAAAACG CT AAAGC AG GT ATT CG ATTT GGT ACTT GT AATTT AG AAATT CAT AT CG ACG AAAAAAT GTTG G AT G AACAT AAT ATT G AT ACAGT CAAAG AGGTTTT AATT ACACCTGCTCAAGG ATT CAAAG ATT AAG AT CCGGCTGCTAACAAAGCCCG AAAGG AAGCT G AGTTGGCT GCT GCCACCGCT G AGCAA T AA CTA GCA TA A CCCCTTGGGGCCTCTAAA CGGGTCTTGA GGGG / l l l l / GAG AT CTCG ATCC CGCGAAAT TAA TA CG A CTCA CTA TA GGG GAA TTGTGA GCGGA TA AC AA 7TÛXCACT AG AAAT AATPT GTTT AACTTT NKG AA GG A G AT AT AGCAAT G AACCGT CGT AACCGT AGCAACG ACCT G AACCCGGAGCCGAGCATCGAAAACCCGAACAACCAGATTGCGGAGGAATTCCCGGGTAAC AA CAGCGTGTATAAAAGCGACGGCTACGTTGATCTGAAGAACAACGGTCGTCTGTTCCCGAT CT GG ATT CT G AAG AACTTT AAACAAT ACAAGCTGCCGG AG AT CATT CGT AAAG AG AACG AAG ACC CGTGCAACGTGCAGGTTAAGCTGGAGCTGCGTAAATATCAGGAATTCGTGGGCCAATACC TG AACCCGCAGGGTCCGTATACCAGCATCCTGCTGTACCATGGTCTGGGTAGCGGCAAGACC GC G AGCGCG AT CAACCT G AT G AACATT CTGT ACAACT AT G ACAACGGCACCAACTTT AT CGTT CT GATTAAAGCGAGCCTGCACAACGACCCGTGGATGCAGGACCTGAAGGAGTGGCTGGGTCG TG AT CCGAGCG AACAG AACGT GG ACAACGTT ACCAAGCTGG AT CGTT ACAAAAACAT CCACTT CG T GCACT AT G ACAGCCCGTT CGCGG AT AGCAGCTTTAT G AGCGTT ATT AAG ACCCTGG ACCT GA GCAAACCG ACCAT GT ACAT CATT G AT G AGGCGCACAACTTT AT CCGT AACGT GT AT AGCAACA TT AACAGCAAACT GGGCAAGCGT GCG AAAGTT AT CT ACG AGT ACAT CAT G AAGG ACAAGCGT G AAAACAAG AACACCCGT AT CGTGCT GATT AGCGCG ACCCCGGCG AT CAACACCCCGTT CG AA CTGGCGCTGATGTTTAACCTGCTGCGTCCGGGTATTTTCCCGAGCAGCGAGCTGGATTTC AA CCGT ACCTTT GT G ACCG AAAGCAGCTACCCG AT CCT G AACCCG AT G AAG AAAAACAT GTTT G A GCGTCGTATCCTGGGCCTGGTTAGCTACTATATTGGTGCGACCCCGGACCTGTATGCGCG TC AAG AACT G AAGT ACAT CAACCTGCCG AT G AGCGCGT ACCAGT AT G AT AT CT ACCGT ATPT CG AGAAACTGGAGGCGGAAATTCAAGAACGTGCGCGTCGTCGTGGCAAGCAGAGCCAACTGT AC CGT ACCT AT ACCCGT CAGGCGT GCAACTT CGT GTTT CCGT ACGTT AACAT G AACGT G AACGGT GAACTGCGTCCGCGTCCGGGCAAGTTCCGTCTGAGCGAAAAACTGGCGGACGATTTTAGC AA GGGCAAAAACCTGGACGTTCCGGATACCGAGAAAGAAATCCTGAACAAGTATACCAAAGC GA TT G AG AACT ACCT G AACG AG ACCG AACGTT ATPT CAG AACAT CAACAAG AAAG ACGCGG AG A ACGGTCGT ACCAT CATT AACG ACCTGG AT G AATT CAAG AAAGGCTTT GGT ACCAAGTT CAACA GCTTT CT GCAGT ACT AT CAAAGCG AGGGT CCGCGT AGCAGCCT GCT G ACCG AAAT GT ACAAC T GCAGCCCG AAAAT GCTGGCG AT CGCGTT CAT G ACCT AT ATT AGCCCGGGCAAGGT G AT G AT CT ACAGCAACT AT GTGGTT ATGG AAGGCAT CG ACGTT AT G AAAATTT ACTTT CGTCTG ATCGG TTT CAACG ATPT ACG ATCGCGCGT G AGT ACATGGGCTATT GCG AAT ACCACGGT CGT AT CG A CCCG AAGG AT CGT GT GCGT AT CAAG AACAT GTT CAACG ACAAG AACAACGT GT ACGGCAACAA GTGCAAAGTT AT CATGCTGAGCCCG AGCGCG ACCG AGGGT ATT CAACT GCT GG AT AT CCGT C AGG AGCACATT AT GG AACCGT ATT GG ACCG AAGTT CGT AT CCAGCAAGT G ATTGGCCGTGGT GTT CGT CAAT GCAGCCACCGT G ACCTGCCG AT G AGCG AGCGT ATCGTGG AT ATTT ACCGTT A T AAGGTT AT CAAACCGG AAAACCT GG ACCCGG ACG AT ACCGTGCGT CAAAGCACCG ACG AGT ACGTTGAAGATCAGGCGAAGAGCAAAGCGAACCTGATTGAGAGCTTCCTGGGCGCTATGA AA GAAGCGGCGGTTGATTGCGAGCTGTTTAAGGAACACAACATGATGAGCCAGAGCTACTAT TG CTTCAAATTTCCGGAGAGCGCGGTGACCAAGACCAACGTTGGCCCGGCGTACCGTGAAGA CA TCAAGGACGATGTGAAATATGATAGCGGTCTGAACAGCAAAAACAGCATCGTTGAGCGTA TTC GTGTGGTT AAGGT G AACGCGGTTT ACCAAAT CAACACCG ACAACAACAACCCGGT GT AT AGCA GCCCG ACCAAGT ACTGGT AT AACAAG AAAACCGGCAT GGTTT AT G ACTT CG AG ACCCACT ACC CGGTGGGT CAGGTT G AATTT AT CG AT AACCTGCCG AACAAGCT GG ACAAAG AT ACCT ACAT CA T GCGT ATT G AT GT G AT CATT CCG AGCATT ACCGGT AGCGTT AACACCT AACACT AG AAAT AAT TTT GTTT AACTTT AAG AAG G AG AT AT AGCG AT G ACCG ACATT AG CT ACT AT AACAACG AG AT C G AT AAAATT CT GTGG AACAT CCT GGGT G ACG ATT ATTT CACCCAAG ACG AATTT G ACG AT CT G GT G AACAGCGTTGCG AACACCATTT ACCAGT AT G ACAACG AAGT G AGCAT CG AT AAGCTG AAA GT G AT CAT CG AATT CGTT AT CCT G AACAAGTT CAAGCT GTGCT ACAT CT ACG AT AACG ACAGC AT CCT G AACCAAGT G AAAT ACG AG AAG AAAAGCGTT GGT AGCAAAACCAT CGGCAAG AACAG CACCAACGACGATGAGGACGATGACGAAGATATCGCGGTGATTAAGCTGAGCGATATTGA GG CGGGCGAAAACTGGTTCAAGAAAAGCCCGAAAATCAGCAGCAAGCAGTTTCAAAGCGTTG AC AAAGTT G AGGT GGCG ACCT ACG AAG ACCT G AT CAGCCACAAGCACG ATT ACCCG AAAG AG AT TT AT AAGG AAAGCCACT ACAT CCGT CGT AACACCCGT CTGG AT GT G AT CAAG AAAATT CCGCA ATTCGAGCAGAAGAGCAAAGAATGGCTGAAACAACGTACCGAGAGCCTGACCGCGACCGC GA

GTCGTGGCCTGCCGTTCGTGGAGAACAAATTTGTTCACCACGGTAACAAGTATGAAC AAATCG GCACCATGTTCTACAGCTTTCGTAACAACGTTGAGGTGGGTGAGTACGGCCTGCTGCAGC AC AGCGGTCACAAGTTTATCGCGGCGAGCCCGGATGGCATCTGCAGCAAGAAAGCGAACACC GG TGGCCTGAGCAAACTGGTGGGTCGTCTGCTGGAGATTAAGTTCCCGTTTAGCCGTGAAAT CA ACAACAGCGGT G AT CTGG ACGGCG AT AT CT GCCCGCACT ACT ATPT CT GCAGGT GCAAACCC

AGCTGTATGTT ACCG AG AT GG ACG AATGCG ACTT CCTGCAGTGCAAAATT G ACG AGT ACG AT AGCTGGG AAG ACTTT GTG AAGG AT AGCAACCCG AT CGTT CCGGGT CT G AGCAAAACCACCAA CCT GG AG AAGGGCT GCCT GATT CAGCT G AGCG ACAAAAACCT G AT CGGCAGCG ACG ACAAGG AAAAATGCCTGTATAACAGCAAATACATCTATCCGCCGAAGCTGCACATGACCAACGAGG AAA T CG AG AAGTGG ATT AGCAGCG AAAT CAT G AACT ACCACAACAACG ACCT G AGCG AG AACT AT A

T GATT G AT CGT GT G AT CT ACTGGCGT CT G AGCCAAGTT ACCTGCAACCT GATT AAGCTG AACA AAGAAGCGTTCGAGGAAAAAATCCCGCTGCTGCAGCAATTCTGGGACTACGTTCTGTTTT ATC GTCAGCACAGCGACAAGCTGGATAAACTGATTAAGTTTGTGGAGAAGGTTAAAGAAGATA AC AGCGCGGAGATTTTCAGCTACATCAACGAAGACTTTCTGAGCCTGAACAAAGATAGCAAG TAC G AGCCGCTGT AT CAGG AAG AG ACCG AAT GGCGT AAG AAAT AT AACCAAAT CAAGGCG AAG AA

AGCGCAGATGT ACAAG AACAAG AGCTACAACAAGT ACACCAAGTTCAGCAACCTCGAG CA CCA

CCA CCA CCA CCA CT G AG AT CCGGCT GCT AACAAAGCCCG AAAGG AAGCT G AGTTGGCT GCTG CCACCGCTG AGCAAT AA CTA GCA T AA CCCCTTGGGGCCT C

TG.

Annexe 2 :

SEQ.ID. N°37 = insert synthétisé et cloné par genscript dans pET- 22b( + ) aux sites de restriction Xba I/Xho I comprenant successivement les séquences des : a) promoteur T7 (SEQ.ID. N°31) TAATACGACTCACTATAG ; b)opéronLac(SEQ.ID. N°32) G AA TTGTGA G CG G A T AA CAA TTCC;

c) site de restriction Xba 1= TCTAGA ;

d) séquence Shine-Dalgarno: AAGGAGA ; e) première séquence soulignée= SEQ.ID. N°38 du gène 349 modifié incluant l'unité répétée 4 fois tirée du gène de résistance à la tétracycline SEQ.ID. N°39= CGGCTCTTACCAGCC_avec les 3 séquences de spacer intercalées SEQ.ID. N°26,27 et 28, f) premier spacer entre les première et deuxième séquences soulignées incluant le terminateur T7 SEQ.ID. N°33 CTA GCA TAA CCCCTTGGGGCCTCTAAA CGGGTCTTGA GGGGTTTTTTG, la séquence du

Promoteur T7, SEQ.ID. N 0 31 TAATACGACTCACTATAG e. t la séquence du Lac operator, SEQ.ID. N°32 : GAATTGTGAGCGGATAACAATTCC et une Séquence Shine-Dalgarno; g) deuxième séquence soulignée= Séquence du gène R350 ; h) deuxième spacer entre les deuxième et troisième séquences soulignées incluant une séquence Shine-Dalgarno, et i) troisième séquence soulignée = Séquence du gène R354 ; j) site de restriction Xho I = CTCGAG ; k) séquence de l'étiquette poly histidine SEQ.ID. N°34 \ CAC CAC CAC CAC CAC CAC; i) le terminateur T7 SEQ.ID.N°33 :

CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG

SEQ.ID.N°37 : séquences organisées en opéron incluant le gène R349 modifié avec séquence spécifique de 15 nucléotides du gène de résistance à la tétracycline (SEQ ID N°39) et les gènes R350 et 354.

T AAT ACG ACT CACT AT AGGGG AATT GT G AGCGG AT AACAATT CCCCT CT AG AAAT AATPT GT TT AACTTT AAG AAGG AG AT AT AG AT ATGG AATT AATT AGT CGT GT CTTT ACT CAT GG AG AAAA T ATPT ACTT GTT AGTT CT ACAAAT AAGTT AT AT ATT ATGGGT AAT AAT G AAT ATGGTT CAT GT

GGTTT CAAAAT AGGT ACAG AT AAAACTT AT ATT G AAAGT CCAGT AT AT ATT G ACATT AAATT A

G AT G AT G AT GATT CT GTT AAAGCGTTTT ATT CTT GT AATTT ATT CACG AT G ATTCAT ACAT CCA

AAGG AAAAATTT AT CT ATCAAG AT CATTT ATTT GT GGTGG AGGT G AAAT CG AT GCAT AT G AT A

GTGAAAGTGATGTTGGAAGTGATGCTGAGTCTGATGCTGAGTCTGATGCTGAATCAG ATTCA G A AA AT CAT ACT CAAAAT AAT ACAAAT ACT CCC AT AAAT AAT AT CACACT AATT AATTT G GATT

CAT CAAAT AATT CCACT CAAT CCGGCT CTT ACCAGCCT AAT G AAT CCGGCTCTT ACCAGCCCAA

T G AAT CT G AT CAAT CAT GT AGT G ATPT G ACT GT GG ACCT CG AT CCGGCT CTT ACCAGCCT GA

AGAAG I I I I I GTT G AT CGT AAT G AT AAT AATT CAG AT AAT ATT GGT AATT CAAAT AGT AT CGG

CT CTT ACCAGCCAT CT AT G ACT G AAAAAGCTGG AAT AATTTT GTT AAACG AAATT AAAACCAT GGTAG AT G AAATTTT GT CT CAAAAAAAT ATT AATT CT GTTGG AATT AACG AT ATT GTT ATT CG

T CCAAGCGG ACAGT ATGTG AGT AAT ATGGG ATAT ATT ACAG AAT CAGGT AGT GTAT CATTT CA

T ACCAAT AAAAATGGTTTCTT ATT ATT CAAGTCCAAT GTTCAT G AAAT CCTTTT CGTT G AAG AA

AT GTTT AT GT ACT CT AAAAAT AATTTT ATTT ATTT GGCCAT ACCATTT AAAAAAT ACCAGGCAT

CT CT AAG AG AT ATT GCT CCTTTT CAT ACAATT AAT AAAACAAAAAAT GGT ATT AAAT GG AAGT A TTT CAAAAT AGT GTTT CCATTT G ACACT G AAAAAAT AG AATTTT GT G AT AATTTCTTTT AT ACT

T AT G AAT CCAAT ACTT GTT AT CAT CAT GTT ATTT CATT CT ACAAAAAT GT AAATT ATT AT CCTT

CTT GG AT AT ATTT CAAATCT G AG ATT G AT ATT AAT AGT AAAAAT AT GTT CTTTT CAAGT G AT AC

T AAT AGT GT GT AT GTT AAAG AT AAT AACAACGT GTAT AAAT ACCAT AATTT CAAT AATT CT CTT

G AAAAAT ACAT CG AT AACAAACT CG ACTT GG ATGT CGT AATT GTGCCT G AT AGTT AT AG ACCA AT GG AAAT G AG ACT ACT ATT AAAGTT AGGT AT AACATT GTAT AGCG ATT ACAATTTT AAT GG A

T GT G AGG AT G AT G AAG AACAT ATPT CG AAATT AT G AAAAAT CAAT AT GT ACCT CAT ATT AT C

GGTCT G AATT ATTTT G AAAGTTT CATT GT AGTT ATTGT CAAT AAT CCAAAT AT GTT G ACG AT A

ACAACTGACGATGGTAAAA I I I I CTTTAACATTCATGATATTAC I I I I I ACAAAAGATTTTATA

AT GG AAT CGTTT AT CTT G AT AAT GGTT CGTT ATTTT AT CT CACAG AT AGT G AAATTT CAG AT C AAAAT GT AT GG AAACT AACTGG AT GT CAATT GTGT G AGCT AGCTG ATT CT ACCAT AT AT AG I I ACCT ATTT A ATTT ACCG G AC AA AATT G AT G A AATTT ACT CTT CGT CT G A ATTT ATT GTTCT A AA ATT AATT GG AAACAAAT A I I I I I ATTATCCGGTTGAAAATTTTGATACTGCTCAAGATTTTAAG ACAAG AT GTGGGG AAATTT CATT G AAAAAT AATT CAGTT CTT G AACT CGTT AAT ACT AGT ATT ATT AACAG ACAAT CT AAAAGTT AT CAT ACT ACAGT AT CT ATT AAT ATT G AT ACGG ATT GT ACT A CT CAT AATT CTTT CG AG AG ATT GTTT AT CCT G ACACAAT CT CTT AGTT ATT CCGCAG AAT ATT C T ATT CG AATT GT AG ACG ACAAAAAT ATT GGTTTTGGT G AT GGGCCT AAAATT G AATPT GTG A ATCGG CT ATT AT GC AATPT ATT AT AAGT ATTT AATT G CT CAT AATTTT C ACACAG AGTTT AAT TT ACAAG AATTT GCCAAACT G AAACCCACCG AAATT AAAT ATTT GGG AT CAAT GTTT CAT AT G GTT AT CT GT CAAAAT AATT CTT CGTT ACCG ATT AG ATT ACCT CT AGCTTTT GCTGT AG AAATTT AT GG AAAAG AACCCACAATT G AT G AATTGG AAT ATTTT GCTT GT AAT G AAG AT G AAACTGG AT T CAAACAT ATTT AT CCAGCCAAAT ACAAT CCCG AATT AGTT AAAG AATT CGGTT AT G AAT CTT A T G AACATT GT CT AAAAACTTT GTGT AAAT AT AATT AT G AAG AT G AT ACT G AT AAAAAT AT CTT G ACG AAAAAAT ATT GCG AGCAATT AGCT GCCGGTTTT AAAAG AT ACGGCAAT AT CAAG AACAT A AAACAAAT G AATTT ACCCAC ATT G G ACT ATT ACATTT CT G GCCC AT ACAAAATT AAT AG AACCA T ATT AATT AAT AAT CTT GTTTT AT CGGG AGGT AAGG AT AAAAAT AAT AATT ATTT GG AAAT GT T CAAAG AATTT ATT AACT CTTT GT CT G AAAAT G AATT AAAAAT CTTGCTAAAAAATT GG ACAGC AT CAACTT GTGT AAG ACCAG AT AACAAAT AT AG AATT AT CATT ATTT CCAAAT CT AAAAACG CT AAAGCAGGT ATT CG ATTT GGT ACTT GT AATTT AG AAATT CAT AT CG ACG AAAAAAT GTTGG AT G AACAT AAT ATT G AT ACAGT CAAAG AGGTTTT AATT ACACCT GCT CAAGG ATT CAAAG ATT AA GATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAA TA ACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGG I I I I I I G AG AT CT CG AT CCC G CG A AATT AAT ACG ACTCACTAT AG GG G A ATT GTG AG CG G AT AACA ATT CCCCACT AG AA AT A ATTTT GTTT AACTTT AAG AAGG AG AT AT AGCAAT G AACCGT CGT AACCGT AGCAACG ACCT GA ACCCGGAGCCGAGCATCGAAAACCCGAACAACCAGATTGCGGAGGAATTCCCGGGTAACA AC AGCGT GT AT AAAAGCG ACGGCT ACGTT G AT CT G AAG AACAACGGT CGT CT GTT CCCG AT CT G GATT CT G AAG AACTTT AAACAAT ACAAGCT GCCGG AG AT CATT CGT AAAG AG AACG AAG ACCC GTGCAACGTGCAGGTTAAGCTGGAGCTGCGTAAATATCAGGAATTCGTGGGCCAATACCT GA ACCCGCAGGGTCCGTATACCAGCATCCTGCTGTACCATGGTCTGGGTAGCGGCAAGACCG CG AGCGCG AT CAACCT G AT G AACATT CT GT ACAACT AT G ACAACGGCACCAACTTT AT CGTT CT G ATTAAAGCGAGCCTGCACAACGACCCGTGGATGCAGGACCTGAAGGAGTGGCTGGGTCGT GA T CCGAGCG AACAG AACGT GG ACAACGTT ACCAAGCTGG AT CGTT ACAAAAACATCCACTT CGT GCACT ATG ACAGCCCGTTCGCGG AT AGCAGCTTTATG AGCGTT ATT AAG ACCCTGGACCTGA GCAAACCG ACCAT GT ACAT CATT G AT G AGGCGCACAACTTT AT CCGT AACGT GT AT AGCAACA TT AACAGCAAACT GGGCAAGCGT GCG AAAGTT AT CT ACG AGT ACAT CAT G AAGG ACAAGCGT G AAAACAAG AACACCCGT AT CGTGCT GATT AGCGCG ACCCCGGCG AT CAACACCCCGTT CG AA CTGGCGCTGATGTTTAACCTGCTGCGTCCGGGTATTTTCCCGAGCAGCGAGCTGGATTTC AA CCGT ACCTTT GT G ACCG AAAGCAGCTACCCG AT CCT G AACCCG AT G AAG AAAAACAT GTTT G A GCGTCGTATCCTGGGCCTGGTTAGCTACTATATTGGTGCGACCCCGGACCTGTATGCGCG TC AAG AACT G AAGT ACAT CAACCTGCCG AT G AGCGCGT ACCAGT AT G AT AT CT ACCGT ATPT CG AGAAACTGGAGGCGGAAATTCAAGAACGTGCGCGTCGTCGTGGCAAGCAGAGCCAACTGT AC CGT ACCT AT ACCCGT CAGGCGT GCAACTT CGT GTTT CCGT ACGTT AACAT G AACGT G AACGGT GAACTGCGTCCGCGTCCGGGCAAGTTCCGTCTGAGCGAAAAACTGGCGGACGATTTTAGC AA GGGCAAAAACCTGGACGTTCCGGATACCGAGAAAGAAATCCTGAACAAGTATACCAAAGC GA TT G AG AACT ACCT G AACG AG ACCG AACGTT ATPT CAG AACAT CAACAAG AAAG ACGCGG AG A ACGGTCGT ACCAT CATT AACG ACCTGG AT G AATT CAAG AAAGGCTTT GGT ACCAAGTT CAACA GCTTT CT GCAGT ACT AT CAAAGCG AGGGT CCGCGT AGCAGCCT GCT G ACCG AAAT GT ACAAC T GCAGCCCG AAAAT GCTGGCG AT CGCGTT CAT G ACCT AT ATT AGCCCGGGCAAGGT G AT G AT CT ACAGCAACT AT GTGGTT ATGG AAGGCAT CG ACGTT AT G AAAATTT ACTTT CGTCTG ATCGG TTT CAACG ATPT ACG ATCGCGCGT G AGT ACATGGGCTATT GCG AAT ACCACGGT CGT AT CG A CCCG AAGG AT CGT GT GCGT AT CAAG AACAT GTT CAACG ACAAG AACAACGT GT ACGGCAACAA GTGCAAAGTT AT CATGCTGAGCCCG AGCGCG ACCG AGGGT ATT CAACT GCT GG AT AT CCGT C AGG AGCACATT AT GG AACCGT ATT GG ACCG AAGTT CGT AT CCAGCAAGT G ATTGGCCGTGGT GTT CGT CAAT GCAGCCACCGT G ACCTGCCG AT G AGCG AGCGT ATCGTGG AT ATTT ACCGTT A T AAGGTT AT CAAACCGG AAAACCT GG ACCCGG ACG AT ACCGTGCGT CAAAGCACCG ACG AGT ACGTTGAAGATCAGGCGAAGAGCAAAGCGAACCTGATTGAGAGCTTCCTGGGCGCTATGA AA GAAGCGGCGGTTGATTGCGAGCTGTTTAAGGAACACAACATGATGAGCCAGAGCTACTAT TG CTTCAAATTTCCGGAGAGCGCGGTGACCAAGACCAACGTTGGCCCGGCGTACCGTGAAGA CA TCAAGGACGATGTGAAATATGATAGCGGTCTGAACAGCAAAAACAGCATCGTTGAGCGTA TTC GTGTGGTT AAGGT G AACGCGGTTT ACCAAAT CAACACCG ACAACAACAACCCGGT GT AT AGCA GCCCG ACCAAGT ACTGGT AT AACAAG AAAACCGGCAT GGTTT AT G ACTT CG AG ACCCACT ACC CGGTGGGT CAGGTT G AATTT AT CG AT AACCTGCCG AACAAGCT GG ACAAAG AT ACCT ACAT CA T GCGT ATT G AT GT G AT CATT CCG AGCATT ACCGGT AGCGTT AACACCT AACACT AG AAAT AAT TTT GTTT AACTTT AAG AAG G AG AT AT AGCG AT G ACCG ACATT AG CT ACT AT AACAACG AG AT C G AT AAAATT CT GTGG AACAT CCT GGGT G ACG ATT ATTT CACCCAAG ACG AATTT G ACG AT CT G GT G AACAGCGTTGCG AACACCATTT ACCAGT AT G ACAACG AAGT G AGCAT CG AT AAGCTG AAA GT G AT CAT CG AATT CGTT AT CCT G AACAAGTT CAAGCT GTGCT ACAT CT ACG AT AACG ACAGC AT CCT G AACCAAGT G AAAT ACG AG AAG AAAAGCGTT GGT AGCAAAACCAT CGGCAAG AACAG CACCAACGACGATGAGGACGATGACGAAGATATCGCGGTGATTAAGCTGAGCGATATTGA GG CGGGCGAAAACTGGTTCAAGAAAAGCCCGAAAATCAGCAGCAAGCAGTTTCAAAGCGTTG AC AAAGTT G AGGT GGCG ACCT ACG AAG ACCT G AT CAGCCACAAGCACG ATT ACCCG AAAG AG AT TT AT AAGG AAAGCCACT ACAT CCGT CGT AACACCCGT CTGG AT GT G AT CAAG AAAATT CCGCA ATTCGAGCAGAAGAGCAAAGAATGGCTGAAACAACGTACCGAGAGCCTGACCGCGACCGC GA

GTCGTGGCCTGCCGTTCGTGGAGAACAAATTTGTTCACCACGGTAACAAGTATGAAC AAATCG GCACCATGTTCTACAGCTTTCGTAACAACGTTGAGGTGGGTGAGTACGGCCTGCTGCAGC AC AGCGGTCACAAGTTTATCGCGGCGAGCCCGGATGGCATCTGCAGCAAGAAAGCGAACACC GG TGGCCTGAGCAAACTGGTGGGTCGTCTGCTGGAGATTAAGTTCCCGTTTAGCCGTGAAAT CA ACAACAGCGGT G AT CTGG ACGGCG AT AT CT GCCCGCACT ACT ATPT CT GCAGGT GCAAACCC

AGCTGTATGTT ACCG AG AT GG ACG AATGCG ACTT CCTGCAGTGCAAAATT G ACG AGT ACG AT AGCTGGG AAG ACTTT GTG AAGG AT AGCAACCCG AT CGTT CCGGGT CT G AGCAAAACCACCAA CCT GG AG AAGGGCT GCCT GATT CAGCT G AGCG ACAAAAACCT G AT CGGCAGCG ACG ACAAGG AAAAATGCCTGTATAACAGCAAATACATCTATCCGCCGAAGCTGCACATGACCAACGAGG AAA T CG AG AAGTGG ATT AGCAGCG AAAT CAT G AACT ACCACAACAACG ACCT G AGCG AG AACT AT A

T GATT G AT CGT GT G AT CT ACTGGCGT CT G AGCCAAGTT ACCTGCAACCT GATT AAGCTG AACA AAGAAGCGTTCGAGGAAAAAATCCCGCTGCTGCAGCAATTCTGGGACTACGTTCTGTTTT ATC GTCAGCACAGCGACAAGCTGGATAAACTGATTAAGTTTGTGGAGAAGGTTAAAGAAGATA AC AGCGCGGAGATTTTCAGCTACATCAACGAAGACTTTCTGAGCCTGAACAAAGATAGCAAG TAC G AGCCGCTGT AT CAGG AAG AG ACCG AAT GGCGT AAG AAAT AT AACCAAAT CAAGGCG AAG AA

AGCGCAGATGTACAAGAACAAGAGCTACAACAAGTACACCAAGTTCAGCAACCTCGA GCACCA CCACCACCACCACT G AG AT CCGGCT GCT AACAAAGCCCG AAAGG AAGCT G AGTTGGCT GCTG CCACCGCTG AGCAAT AACT AGCAT AACCCCTTGGGGCCTCT AAACGGGTCTT GAGGGG I I I I I TG

LISTAGE DE SEQUENCE

SEQ. ID. N°1 : protéine R350 de Mimivirus

MNRRNRSNDLNPEPSIENPNNQIAEEFPGNNSVYKSDGYVDLKNNGRLFPIWILKN FKQYKLPEIIRKENEDPCNVQVKLELRKYQEFVGQYLNPQGPYTSILLYHGLGSGKT ASAINLMNILYNYDNGTNFIVLIKASLHNDPWMQDLKEWLGRDPSEQNVDNVTKL DRYKNIHFVHYDSPFADSSFMSVIKTLDLSKPTMYIIDEAHNFIRNVYSNINSKLGK RAKVIYEYIMKDKRENKNTRIVLISATPAINTPFELALMFNLLRPGIFPSSELDFNRT FVTESSYPILNPMKKNMFERRILGLVSYYIGATPDLYARQELKYINLPMSAYQYDIY RIFEKLEAEIQERARRRGKQSQLYRTYTRQACNFVFPYVNMNVNGELRPRPGKFRL SEKLADDFSKGKNLDVPDTEKEILNKYTKAIENYLNETERYFQNINKKDAENGRTII NDLDEFKKGFGTKFNSFLQYYQSEGPRSSLLTEMYNCSPKMLAIAFMTYISPGKVMI YSNYVVMEGIDVMKIYFRLIGFNDFTIAREYMGYCEYHGRIDPKDRVRIKNMFNDK NNVYGNKCKVIMLSPSATEGIQLLDIRQEHIMEPYWTEVRIQQVIGRGVRQCSH RD LPMSERIVDIYRYKVIKPENLDPDDTVRQSTDEYVEDQAKSKANLIESFLGAMKEAA VDCELFKEHNMMSQSYYCFKFPESAVTKTNVGPAYREDIKDDVKYDSGLNSKNSIV ERIRVVKVNAVYQINTDNNNPVYSSPTKYWYNKKTGMVYDFETHYPVGQVEFIDN LPNKLDKDTYIMRIDVIIPSITGSVNT

SEQ. ID. N°2: protéine R354 de Mimivirus

MTDISYYNNEIDKILWNILGDDYFTQDEFDDLVNSVANTIYQYDNEVSIDKLKVIIE FVILNKFKLCYIYDNDSILNQVKYEKKSVGSKTIGKNSTNDDEDDDEDIAVIKLSDIE AGENWFKKSPKISSKQFQSVDKVEVATYEDLISHKH DYPKEIYKESHYIRRNTRLDV IKKIPQFEQKSKEWLKQRTESLTATAISVVFDEDPYKHPIVILLDKCGRGLPFVENKF VHHGNKYEQIGTMFYSFRNNVEVGEYGLLQHSGHKFIAASPDGICSKKANTGGLSK LVGRLLEIKFPFSREINNSGDLDGDICPHYYFLQVQTQLYVTEMDECDFLQCKIDEY DSWEDFVKDSNPIVPGLSKTTNLEKGCLIQLSDKNLIGSDDKEKCLYNSKYIYPPKL HMTNEEIEKWISSEIMNYHNNDLSENYMIDRVIYWRLSQVTCNLIKLNKEAFEEKI PLLQQFWDYVLFYRQHSDKLDKLIKFVEKVKEDNSAEIFSYINEDFLSLNKDSKYEP LYQEETEWRKKYNQIKAKKAQMYKNKSYNKYTKFSN

SEQ. ID. N°3: gène R350 de Mimivirus ATGAACCGTCGTAACCGTAGCAACGACCTGAACCCGGAGCCGAGCATCGAAAAC CCGAACAACCAGATTGCGGAGGAATTCCCGGGTAACAACAGCGTGTATAAAAGC GACGGCTACGTTGATCTGAAGAACAACGGTCGTCTGTTCCCGATCTGGATTCTG AAGAACTTTAAACAATACAAGCTGCCGGAGATCATTCGTAAAGAGAACGAAGACC CGTGCAACGTGCAGGTTAAGCTGGAGCTGCGTAAATATCAGGAATTCGTGGGCC AATACCTGAACCCGCAGGGTCCGTATACCAGCATCCTGCTGTACCATGGTCTGG GTAGCGGCAAGACCGCGAGCGCGATCAACCTGATGAACATTCTGTACAACTATG ACAACGGCACCAACTTTATCGTTCTGATTAAAGCGAGCCTGCACAACGACCCGTG GATGCAGGACCTGAAGGAGTGGCTGGGTCGTGATCCGAGCGAACAGAACGTGG ACAACGTTACCAAGCTGGATCGTTACAAAAACATCCACTTCGTGCACTATGACAG CCCGTTCGCGGATAGCAGCTTTATGAGCGTTATTAAGACCCTGGACCTGAGCAA ACCGACCATGTACATCATTGATGAGGCGCACAACTTTATCCGTAACGTGTATAGC AACATTAACAGCAAACTGGGCAAGCGTGCGAAAGTTATCTACGAGTACATCATGA AGGACAAGCGTGAAAACAAGAACACCCGTATCGTGCTGATTAGCGCGACCCCGG CGATCAACACCCCGTTCGAACTGGCGCTGATGTTTAACCTGCTGCGTCCGGGTA TTTTCCCGAGCAGCGAGCTGGATTTCAACCGTACCTTTGTGACCGAAAGCAGCT ACCCGATCCTGAACCCGATGAAGAAAAACATGTTTGAGCGTCGTATCCTGGGCC TGGTTAGCTACTATATTGGTGCGACCCCGGACCTGTATGCGCGTCAAGAACTGA AGTACATCAACCTGCCGATGAGCGCGTACCAGTATGATATCTACCGTATTTTCGA GAAACTGGAGGCGGAAATTCAAGAACGTGCGCGTCGTCGTGGCAAGCAGAGCCA ACTGTACCGTACCTATACCCGTCAGGCGTGCAACTTCGTGTTTCCGTACGTTAAC ATGAACGTGAACGGTGAACTGCGTCCGCGTCCGGGCAAGTTCCGTCTGAGCGAA AAACTGGCGGACGATTTTAGCAAGGGCAAAAACCTGGACGTTCCGGATACCGAG AAAGAAATCCTGAACAAGTATACCAAAGCGATTGAGAACTACCTGAACGAGACCG AACGTTATTTTCAGAACATCAACAAGAAAGACGCGGAGAACGGTCGTACCATCAT TAACGACCTGGATGAATTCAAGAAAGGCTTTGGTACCAAGTTCAACAGCTTTCTG CAGTACTATCAAAGCGAGGGTCCGCGTAGCAGCCTGCTGACCGAAATGTACAAC TGCAGCCCGAAAATGCTGGCGATCGCGTTCATGACCTATATTAGCCCGGGCAAG GTGATGATCTACAGCAACTATGTGGTTATGGAAGGCATCGACGTTATGAAAATT TACTTTCGTCTGATCGGTTTCAACGATTTTACGATCGCGCGTGAGTACATGGGCT ATTGCGAATACCACGGTCGTATCGACCCGAAGGATCGTGTGCGTATCAAGAACA TGTT CAACG ACAAG AACAACGT GT ACGGCAACAAGTGCAAAGTT AT CATGCT G A GCCCGAGCGCGACCGAGGGTATTCAACTGCTGGATATCCGTCAGGAGCACATTA TGGAACCGTATTGGACCGAAGTTCGTATCCAGCAAGTGATTGGCCGTGGTGTTC GTCAATGCAGCCACCGTGACCTGCCGATGAGCGAGCGTATCGTGGATATTTACC GTTATAAGGTTATCAAACCGGAAAACCTGGACCCGGACGATACCGTGCGTCAAA GCACCGACGAGTACGTTGAAGATCAGGCGAAGAGCAAAGCGAACCTGATTGAGA GCTTCCTGGGCGCTATGAAAGAAGCGGCGGTTGATTGCGAGCTGTTTAAGGAAC ACAACATGATGAGCCAGAGCTACTATTGCTTCAAATTTCCGGAGAGCGCGGTGA CCAAGACCAACGTTGGCCCGGCGTACCGTGAAGACATCAAGGACGATGTGAAAT ATGATAGCGGTCTGAACAGCAAAAACAGCATCGTTGAGCGTATTCGTGTGGTTA AGGTGAACGCGGTTTACCAAATCAACACCGACAACAACAACCCGGTGTATAGCA GCCCG ACCAAGTACTGGTAT AACAAG AAAACCGGCATGGTTT ATG ACTTCG AG A CCCACTACCCGGTGGGTCAGGTTGAATTTATCGATAACCTGCCGAACAAGCTGG ACAAAGATACCTACATCATGCGTATTGATGTGATCATTCCGAGCATTACCGGTAG CGTT AACACCT AA

SEQ. I D. N °4 : gène R354 de M i m ivi rus ATGACCGACATTAGCTACTATAACAACGAGATCGATAAAATTCTGTGGAACATCC TGGGTGACGATTATTTCACCCAAGACGAATTTGACGATCTGGTGAACAGCGTTG CGAACACCATTTACCAGTATGACAACGAAGTGAGCATCGATAAGCTGAAAGTGAT CATCGAATTCGTTATCCTGAACAAGTTCAAGCTGTGCTACATCTACGATAACGAC AGCAT CCT G AACCAAGTG AAAT ACG AG AAG AAAAGCGTTGGT AGCAAAACCAT C GGCAAGAACAGCACCAACGACGATGAGGACGATGACGAAGATATCGCGGTGATT AAGCTGAGCGATATTGAGGCGGGCGAAAACTGGTTCAAGAAAAGCCCGAAAATC AGCAGCAAGCAGTTTCAAAGCGTTGACAAAGTTGAGGTGGCGACCTACGAAGAC CT GATCAGCCACAAGCACGATT ACCCGAAAGAG ATTT AT AAGGAAAGCCACT ACA TCCGTCGTAACACCCGTCTGGATGTGATCAAGAAAATTCCGCAATTCGAGCAGAA GAGCAAAGAATGGCTGAAACAACGTACCGAGAGCCTGACCGCGACCGCGATTAG CGTGGTTTTTGATGAAGACCCGTATAAACACCCGATCGTTATTCTGCTGGACAAG TGCGGTCGTGGCCTGCCGTTCGTGGAGAACAAATTTGTTCACCACGGTAACAAG TATGAACAAATCGGCACCATGTTCTACAGCTTTCGTAACAACGTTGAGGTGGGT GAGTACGGCCTGCTGCAGCACAGCGGTCACAAGTTTATCGCGGCGAGCCCGGAT GGCATCTGCAGCAAGAAAGCGAACACCGGTGGCCTGAGCAAACTGGTGGGTCGT CTGCTGG AG ATT AAGTTCCCGTTT AGCCGTG AAAT CAACAACAGCGGTG AT CT G GACGGCGATATCTGCCCGCACTACTATTTTCTGCAGGTGCAAACCCAGCTGTAT GTTACCGAGATGGACGAATGCGACTTCCTGCAGTGCAAAATTGACGAGTACGAT AGCTGGGAAGACTTTGTGAAGGATAGCAACCCGATCGTTCCGGGTCTGAGCAAA ACCACCAACCTGGAGAAGGGCTGCCTGATTCAGCTGAGCGACAAAAACCTGATC GGCAGCGACGACAAGGAAAAATGCCTGTATAACAGCAAATACATCTATCCGCCG AAGCTGCACATGACCAACGAGGAAATCGAGAAGTGGATTAGCAGCGAAATCATG AACTACCACAACAACGACCTGAGCGAGAACTATATGATTGATCGTGTGATCTACT GGCGTCTGAGCCAAGTTACCTGCAACCTGATTAAGCTGAACAAAGAAGCGTTCG AGGAAAAAATCCCGCTGCTGCAGCAATTCTGGGACTACGTTCTGTTTTATCGTCA GCACAGCGACAAGCTGGATAAACTGATTAAGTTTGTGGAGAAGGTTAAAGAAGA TAACAGCGCGGAGATTTTCAGCTACATCAACGAAGACTTTCTGAGCCTGAACAAA GATAGCAAGTACGAGCCGCTGTATCAGGAAGAGACCGAATGGCGTAAGAAATAT AACCAAATCAAGGCGAAGAAAGCGCAGATGTACAAGAACAAGAGCTACAACAAG TACACCAAGTTCAGCAAC

S EQ . I D . N ° 5 : gène R349 d e M i m ivi ru s

ATGG AATT AATT AGTCGTGTCTTT ACT CATGG AG AAAAT ATTTT ACTTGTT AGTT CTACAAATAAGTTATATATTATGGGTAATAATGAATATGGTTCATGTGGTTTCAA AAT AGGT ACAG AT AAAACTT AT ATTG AAAGTCCAGTAT AT ATTG ACATT AAATT A G ATG ATG AT GATT CT GTT AAAG CGTTTT ATT CTTGTAATTT ATT C ACG ATG ATT C AT ACATCCAAAG G AAAAATTT AT CT AT C AAG AT CATTT ATTTGTG GTG G AG GT G A AATCGATGCATATGATAGTGAAAGTGATGTTGGAAGTGATGCTGAGTCTGATGC TG AGT CT G ATGCTG AAT CAG ATT CAG AAAAT CAT ACT CAAAAT AAT ACAAAT ACT CCCAT AAAT AAT AT CACACT AATT AATTT G G ATT CAT CAAAT AATTCC ACT CAAT C TG AT AAT G AAT CT G AT AATG AAT CTG AT AAT G AAT CTG ACAATG AAT CTG AT CAA TCATGTAGTGATTTTGACTGTGGACCTCGATCTGATAATGAATCTGATGAAGAAG TTTTTGTT G AT CGT AATG AT AAT AATT CAG AT AAT ATTGGTAATT CAAAT AGT AT TG AT AAT G AAT CT G AAT CT ATG ACTG AAAAAG CT G G AAT AATTTTGTT AAACG AA ATT AAAACCATGGT AG ATG AAATTTTGTCT CAAAAAAAT ATT AATT CTGTTGG AA TT AACG AT ATT GTT ATTCGTCCAAGCGG ACAGT ATGTG AGT AAT ATGG GATAT AT T ACAG AAT CAG GT AGTGTAT CATTT CAT ACC AAT AAAAAT G GTTT CTT ATT ATT C AAGT CCAAT GTT CAT G AAAT CCTTTT CGTTG AAG AAATGTTT ATGTACT CT AAAA AT AATTTT ATTT ATTTGGCCAT ACCATTT AAAAAAT ACCAGGCAT CT CT AAG AG A T ATTGCTCCTTTT C AT ACAATT AAT AAAAC AAAAAAT G GT ATT AAAT G G AAGT AT TT CAAAAT AGTGTTTCCATTTG ACACT G AAAAAAT AG AATTTTGTG AT AATTT CT TTT AT ACTT ATG AATCCAAT ACTTGTT AT CAT CATGTT ATTT CATT CT ACAAAAAT GT AAATT ATT ATCCTT CTTGG AT AT ATTT CAAAT CTG AG ATTG AT ATT AAT AGT A AAAAT AT GTT CTTTT C AAGT G AT ACT AAT AGTGTGTATGTT AAAG AT AAT AACAA CGTGT AT AAAT ACCAT AATTT CAAT AATT CT CTTG AAAAAT ACAT CG AT AACAAA CTCGACTTGGATGTCGTAATTGTGCCTGATAGTTATAGACCAATGGAAATGAGA CT ACT ATT AAAGTT AGGTAT AACATTGT AT AGCG ATT ACAATTTT AATGG AT GTG AGG ATG AT G AAG AACAT ATTTT CG AAATT AT G AAAAAT CAAT ATGT ACCT CAT AT T AT CGGT CTG AATT ATTTTG AAAGTTT CATTGTAGTT ATTGTCAAT AATCCAAAT AT GTTG ACG AT AACAACTG ACG ATGGT AAAATTTT CTTT AACATT CATG AT ATT A CTTTTT ACAAAAG ATTTT AT AATGG AATCGTTT AT CTTG AT AATGGTTCGTT ATT TT AT CT CACAG AT AGTG AAATTT CAG AT CAAAATGT ATGG AAACT AACTGG AT GT CAATT GT GTG AGCT AGCTG ATT CT ACCAT AT AT AGTT ACCT ATTT AATTT ACCGG ACAAAATT G AT G AAATTT ACT CTTCGT CTG AATTT ATTGTT CT AAAATT AATTGG AAACAAAT ATTTTT ATT AT CCG GTTG AAAATTTTG AT ACT G CT C AAG ATTTT AAG ACAAG AT GTG G GG AAATTT C ATTG AAAAAT AATT CAGTT CTTG AACTCGTT AAT A CT AGT ATT ATT AACAG ACAAT CT AAAAGTT AT CAT ACT ACAGT AT CT ATT AAT ATT GATACGGATTGTACTACTCATAATTCTTTCGAGAGATTGTTTATCCTGACACAAT CT CTT AGTT ATTCCGCAG AAT ATT CT ATTCG AATTGT AG ACG ACAAAAAT ATTGG TTTTGGTGATGGGCCTAAAATTGAATTTTGTGAATCGGCTATTATGCAATTTTAT T AT AAGT ATTT AATT G CT CAT AATTTT C ACAC AG AGTTT AATTT AC AAG AATTT G CCAAACT G AAACCCACCG AAATT AAAT ATTTGGG AT CAATGTTT CAT ATGGTT AT CTGTCAAAATAATTCTTCGTTACCGATTAGATTACCTCTAGCTTTTGCTGTAGAA ATTTATGGAAAAGAACCCACAATTGATGAATTGGAATATTTTGCTTGTAATGAAG AT G AAACTGG ATT CAAACAT ATTT AT CCAGCCAAAT ACAATCCCG AATT AGTT AA AG AATTCG GTT ATG AAT CTT ATG AACATTGTCT AAAAACTTTGT GT AAAT AT AAT T AT G AAG ATG AT ACTG AT AAAAAT AT CTTG ACG AAAAAAT ATTGCG AGCAATT AG CTGCCGGTTTT AAAAG AT ACGGCAAT AT CAAG AACAT AAAACAAATG AATTT ACC CACATTGG ACT ATT ACATTT CTGGCCCAT ACAAAATT AAT AG AACCAT ATT AATT AATAATCTTGTTTTATCGGGAGGTAAGGATAAAAATAATAATTATTTGGAAATGT T CAAAG AATTT ATT AACT CTTTGTCTG AAAATG AATT AAAAAT CTTGCT AAAAAA TTGG ACAGCAT CAACTTGTGTAAG ACCAG AT AACAAAT AT AG AATT AT CATT ATT TCCAAAT CT AAAAACGCT AAAGCAGGTATTCG ATTTGGTACTTGTAATTT AG AAA TT CAT AT CG ACG AAAAAATGTTGG ATG AACAT AAT ATTG AT ACAGTCAAAG AGGT TTT AATT AC ACCT G CT CAAG G ATT CAAAG ATT AA

SEQ. I D . N °6 : séq uence répétée d u virophage za m i lon

TGATAATGAATCTGA SEQ. I D. N °7 : Gène R349 mod ifié avec des séq uences répétées d u gène de résista nce à la tétracycl ine (SEQ I D N °23)

ATGG AATT AATT AGTCGTGTCTTT ACT CATGG AG AAAAT ATTTT ACTTGTT AGTT CTACAAATAAGTTATATATTATGGGTAATAATGAATATGGTTCATGTGGTTTCAA AAT AGGT ACAG AT AAAACTT AT ATTG AAAGTCCAGTAT AT ATTG ACATT AAATT A G ATG ATG AT GATT CT GTT AAAG CGTTTT ATT CTTGTAATTT ATT C ACG ATG ATT C AT ACATCCAAAG G AAAAATTT AT CT AT CAAG AT CATTT ATTTGTG GTG G AG GT GA AATCGATGCATATGATAGTGAAAGTGATGTTGGAAGTGATGCTGAGTCTGATGC TG AGTCTG ATGCTG AAT CAG ATT CAG AAAAT CAT ACT CAAAAT AAT ACAAAT ACT CCCAT AAAT AAT AT CAC ACT AATT AATTT G G ATT CAT CAAAT AATTCC ACT CAAT C CACCCTGGATGCTGTTAATGAATCCACCCTGGATGCTGTCAATGAATCTGATCAA TCATGTAGTGATTTTGACTGTGGACCTCGATCCACCCTGGATGCTGTTGAAGAA GTTTTT GTTG ATCGT AATG AT AAT AATT CAG AT AAT ATT G GT AATT CAAAT AGTA T CACCCT G G ATG CTGTATCT ATG ACTG AAAAAGCT G G AAT AATTTTGTT AAACG A AATT AAAACCATGGTAG ATG AAATTTTGTCT CAAAAAAAT ATT AATT CTGTTGG A ATTAACGATATTGTTATTCGTCCAAGCGGACAGTATGTGAGTAATATGGGATATA TT ACAG AAT CAGGTAGTGT AT CATTT CAT ACCAAT AAAAATGGTTT CTT ATT ATT CAAGTCCAATGTT C ATG AAATCCTTTTCGTTG AAG AAATGTTT ATGT ACT CT AAA AAT AATTTT ATTT ATTTGGCCAT ACCATTT AAAAAAT ACCAGGCATCT CT AAGAG AT ATT G CTCCTTTT CAT AC AATT AAT AAAACAAAAAAT G GT ATT AAAT G G AAGT A TTT CAAAAT AGTGTTT CCATTTGACACTG AAAAAAT AG AATTTTGT G AT AATTT C TTTT AT ACTT ATG AAT CCAAT ACTTGTT AT CAT CATGTT ATTT CATT CT ACAAAAA TGT AAATT ATT ATCCTT CTTGG AT AT ATTT CAAAT CTG AG ATTG AT ATT AAT AGT AAAAAT ATGTT CTTTT CAAGTG AT ACT AAT AGTGTGT ATGTT AAAG AT AAT AACA ACGT GT AT AAAT ACCAT AATTT CAAT AATT CT CTTG AAAAAT ACATCG AT AACAA ACTCGACTTGGATGTCGTAATTGTGCCTGATAGTTATAGACCAATGGAAATGAG ACT ACT ATT AAAGTT AGGT AT AACATT GT AT AGCG ATT ACAATTTT AATGG AT GT GAGGATGATGAAGAACATATTTTCGAAATTATGAAAAATCAATATGTACCTCATA TT AT CGGTCTG AATT ATTTTG AAAGTTT CATTGT AGTT ATTGTCAAT AATCCAAA T AT GTTG ACG AT AACAACTG ACG ATGGTAAAATTTT CTTT AACATT CATG AT ATT ACTTTTTACAAAAGATTTTATAATGGAATCGTTTATCTTGATAATGGTTCGTTAT TTTATCTCACAGATAGTGAAATTTCAGATCAAAATGTATGGAAACTAACTGGATG T CAATTGTGTG AG CT AG CT GATT CT ACCAT AT AT AGTT ACCT ATTT AATTT ACCG G ACAAAATTG ATG AAATTT ACT CTTCGTCTG AATTT ATTGTT CT AAAATT AATT G G AAAC AAAT ATTTTT ATT AT CCG GTTG AAAATTTTG AT ACT G CT C AAG ATTTT AA G ACAAGATGTGGGG AAATTT CATTG AAAAAT AATT CAGTT CTTG AACT CGTT AAT ACT AGT ATT ATT AACAG ACAAT CT AAAAGTT AT CAT ACT ACAGT AT CT ATT AAT AT TGATACGGATTGTACTACTCATAATTCTTTCGAGAGATTGTTTATCCTGACACAA T CT CTT AGTT ATTCCG CAG AAT ATT CT ATTCGAATTGTAG ACG AC AAAAAT ATT G GTTTTGGTGATGGGCCTAAAATTGAATTTTGTGAATCGGCTATTATGCAATTTTA TT AT AAGTATTT AATTGCT CAT AATTTT CACACAG AGTTT AATTT ACAAG AATTT GCCAAACTGAAACCCACCG AAATT AAAT ATTTGGG AT CAATGTTT CAT ATGGTT A T CT GTCAAAAT AATT CTTCGTT ACCG ATT AG ATT ACCT CT AGCTTTT G CTGTAG A AATTT ATGG AAAAG AACCCACAATTG ATG AATTGG AAT ATTTTGCTT GT AAT G AA G ATG AAACT G G ATT C AAAC AT ATTT ATCC AG CCAAAT AC AATCCCG AATT AGTT A AAG AATT CGGTT ATG AAT CTT ATG AACATTGTCT AAAAACTTTGT GT AAAT AT AA TTATGAAGATGATACTGATAAAAATATCTTGACGAAAAAATATTGCGAGCAATTA GCTGCCGGTTTT AAAAG AT ACGGCAAT ATCAAGAACAT AAAACAAATG AATTT AC CC AC ATT G G ACT ATT ACATTT CTG G CCCAT AC AAAATT AAT AG AACC AT ATT AAT T AAT AAT CTTG TTTT ATCG G G AG GT AAG G AT AAAAAT AAT AATT ATTT G G AAAT G TT CAAAG AATTT ATT AACT CTTTGTCTG AAAATG AATT AAAAAT CTTGCT AAAAA ATTGG ACAGCAT CAACTTGTGT AAG ACCAG AT AACAAAT AT AG AATT AT CATT AT TT CCAAAT CT AAAAACG CT AAAG C AG GTATT CG ATTT G GTACTTGTAATTT AG AA ATTCATATCGACGAAAAAATGTTGGATGAACATAATATTGATACAGTCAAAGAGG TTTT AATT AC ACCTGCT C AAG G ATT CAAAG ATT AA

SEQ. ID. N°8 séq uence sens de 130 nu cléotides de I O RF4 de za mi lon AT AG AACAACCAAAAAAAT AT CAAAAT CT AG AG ATG AAT CAAGT G AAT CAG AAG A ATCTGATAATGAATCTGATAATGAATCCGATGAGGAAGTTGAATCAGAAACTGAG ATAGAACCAGTCAAATCTAA

SEQ. ID. N°9 séquence anti sens de 130 nucléotides de IORF4 de zamilon

TT AG ATTTG ACTGGTT CT AT CT CAGTTT CTG ATT CAACTT CCT CATCGG ATT CAT T AT CAG ATT CATT AT CAG ATT CTT CTG ATT CACTTG ATT CAT CT CT AG ATTTTG A T ATTTTTTTGGTTGTT CT AT

SEQ.ID.N°10 : amorce du gène R349 de mimivirus

ATGGAATTAATTAGTCGTGTC

SEQ.ID.N°11 : amorce du gène R349 de mimivirus

TT AAT CTTTG AATCCTTG AG C

SEQ.ID.N°12 : amorce du gène de IORF4 du virophage zamilon

ATGTCTGTTCTAGAAAACCT

SEQ.ID.N°13 : amorce du gène de IORF4 du virophage zamilon TT AAGTT AT AATTTTGTAT A

SEQ.ID.N°14 : amorce d'une séquence sens incluant les séquences des promoteur T7 et opéron Lac

T AAT ACG ACT CACT AT AGGGT ACT CCCAT AAAT AAT AT CAC

SEQ.ID.N°15 : amorce d'une séquence sens incluant les séquences des promoteur T7 et opéron Lac

G AG AC AAAATTT CAT CT ACC

SEQ.ID.N°16 : amorce d'une séquence antisens incluant les séquences des promoteur T7 et opéron Lac

T AAT ACG ACT CACT AT AG G G AG AC AAAATTT CAT CT ACC

SEQ.ID.N°17 : amorce d'une séquence antisens incluant les séquences des promoteur T7 et opéron Lac

T ACT CCCAT AAAT AAT AT CAC

SEQ.ID.N°18 : séquence sens de l'ARN de la séquence répétée du virophage zamilon

UGAUAAUGAAUCUGA

SEQ.ID.N°19 : séquence anti sens de l'ARN de la séquence répétée du virophage zamilon UCAGAU UCAU UAUCA

SEQ . I D. N °20 : séq uence sens de l 'ARN de la séq uence répétée d u gène G FP

AAUCGCUGGACGGCGACG U UAAUGAAUCGCUGGACGGCGACGUCA SEQ . I D. N °21 : séq uence a nti sens de l 'ARN de la séq uence répétée d u gène G FP

UGACG UCGCCGUCCAGCGAU UCAU UAACG UCGCCG UCCAGCGAU U

SE D. I D. N 0 22 : séq uences orga n isées en opéron i ncl ua nt le gène R349 mod ifié avec séq uence spécifiq ue de 15 n ucléotides d u gène de résista nce à la tétracycl i ne (SEQ I D N °23) et les gènes R350 et 354.

TAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCTAGAAAT AATTTTGTTT AACTTT AAG AAGG AG AT AT AG AT ATGG AATT AATT AGTCGTGT CT TT ACT CATGG AG AAAAT ATTTT ACTTGTT AGTT CT ACAAAT AAGTT AT AT ATT AT GGGTAATAATGAATATGGTTCATGTGGTTTCAAAATAGGTACAGATAAAACTTAT ATTGAAAGTCCAGTATATATTGACATTAAATTAGATGATGATGATTCTGTTAAAG CGTTTT ATT CTTGT AATTT ATT CACG ATG ATT CAT ACATCCAAAGG AAAAATTT A TCTATCAAGATCATTTATTTGTGGTGGAGGTGAAATCGATGCATATGATAGTGAA AGTGATGTTGGAAGTGATGCTGAGTCTGATGCTGAGTCTGATGCTGAATCAGAT T CAG AAAAT CAT ACT C AAAAT AAT ACAAAT ACTCCC AT AAAT AAT AT C ACACT AAT T AATTTGG ATT CAT CAAAT AATTCCACT CAATCCACCCTGG ATGCTGTT AATG AA TCCACCCTGGATGCTGTCAATGAATCTGATCAATCATGTAGTGATTTTGACTGTG GACCTCGATCCACCCTGGATGCTGTTGAAGAAGTTTTTGTTGATCGTAATGATAA T AATT CAG AT AAT ATTGGT AATT CAAAT AGT AT CACCCTGG ATGCTGTAT CT AT G ACTG AAAAAGCTGG AAT AATTTTGTT AAACG AAATT AAAACCATGGTAG ATG AAA TTTTGTCT CAAAAAAAT ATT AATT CTGTTGG AATT AACG AT ATTGTT ATT CGTCC AAGCGGACAGTATGTGAGTAATATGGGATATATTACAGAATCAGGTAGTGTATC ATTT CAT ACCAAT AAAAAT G GTTT CTT ATT ATT CAAGTCCAATGTT C ATG AAAT C CTTTTCGTTG AAG AAATGTTT ATGTACT CT AAAAAT AATTTT ATTT ATTTGGCCA T ACCATTT AAAAAAT ACCAGGCAT CT CT AAG AG AT ATTGCTCCTTTT CAT ACAAT T AAT AAAAC AAAAAAT G GT ATT AAAT G G AAGTATTT C AAAAT AGTGTTTCCATTT G ACACTG AAAAAAT AG AATTTTGT G AT AATTT CTTTT AT ACTT ATG AAT CCAAT A CTTGTT AT CAT CATGTT ATTT CATT CT ACAAAAATGTAAATT ATT ATCCTT CTTGG AT AT ATTT CAAAT CTG AG ATTG AT ATT AAT AGTAAAAAT ATGTT CTTTT CAAGTG AT ACT AAT AGTGT GT ATGTT AAAG AT AAT AACAACGTGT AT AAAT ACCAT AATTT CAAT AATT CT CTTG AAAAAT ACATCG AT AACAAACTCG ACTTGG ATGTCGT AATT GTGCCTG AT AGTT AT AG ACCAATGG AAATG AG ACT ACT ATT AAAGTT AGGT AT AA CATTGTATAGCGATTACAATTTTAATGGATGTGAGGATGATGAAGAACATATTTT CG AAATT ATG AAAAAT CAAT ATGTACCT CAT ATT ATCGGTCTG AATT ATTTTG AA AGTTT CATTGT AGTT ATTGTCAAT AATCCAAAT ATGTTG ACG AT AACAACTG ACG ATGGT AAAATTTT CTTT AACATT CATG AT ATT ACTTTTT ACAAAAG ATTTT AT AAT GG AATCGTTT AT CTTG AT AATGGTTCGTT ATTTT AT CT CACAG AT AGTG AAATTT CAGATCAAAATGTATGGAAACTAACTGGATGTCAATTGTGTGAGCTAGCTGATTC T ACCAT AT AT AGTT ACCT ATTT AATTT ACCGGACAAAATTG ATG AAATTT ACT CT T CGTCTG AATTT ATTGTT CT AAAATT AATTGG AAACAAAT ATTTTT ATT ATCCGG TTG AAAATTTTG AT ACTGCT CAAG ATTTT AAG ACAAG AT GTGGGG AAATTT CATT G AAAAAT AATT CAGTT CTTG AACT CGTT AAT ACT AGTATT ATT AACAG ACAAT CT AAAAGTT AT CAT ACT ACAGT AT CT ATT AAT ATTG AT ACGG ATTGT ACT ACT CAT A ATT CTTT CG AG AG ATT GTTT AT CCTG ACACAAT CT CTT AGTT ATTCCGCAG AAT A TTCTATTCGAATTGTAGACGACAAAAATATTGGTTTTGGTGATGGGCCTAAAATT G AATTTTGTG AATCGGCT ATT ATGCAATTTT ATT AT AAGT ATTT AATTGCT CAT A ATTTTCACACAGAGTTTAATTTACAAGAATTTGCCAAACTGAAACCCACCGAAAT T AAAT ATTTGGG AT CAATGTTT CAT ATGGTT AT CTGTCAAAAT AATT CTT CGTT A CCG ATT AG ATT ACCT CT AGCTTTTGCTGTAG AAATTT ATGG AAAAG AACCCACAA TTG ATG AATTGG AAT ATTTTGCTTGTAATG AAG AT G AAACTGG ATT CAAACAT AT TT ATCCAGCCAAAT ACAAT CCCG AATT AGTT AAAG AATT CGGTT ATG AAT CTT AT G AACATTGTCT AAAAACTTTGTGT AAAT AT AATT ATG AAG ATG AT ACT G AT AAAA AT AT CTTG ACG AAAAAAT ATTGCG AGCAATT AGCTGCCGGTTTT AAAAG AT ACGG CAAT AT CAAG AACAT AAAACAAAT G AATTT ACCCACATTGG ACT ATT ACATTT CT GGCCCAT ACAAAATT AAT AG AACCAT ATT AATT AAT AAT CTTGTTTT ATCGGG AG GT AAGG AT AAAAAT AAT AATT ATTTGG AAATGTT CAAAG AATTT ATT AACT CTTT GTCTG AAAATG AATT AAAAAT CTTGCT AAAAAATTGG ACAGCAT CAACTTGTGT A AG ACCAG AT AACAAAT AT AG AATT AT CATT ATTT CCAAAT CT AAAAACGCT AAAG CAGGT ATTCG ATTTGGT ACTTGTAATTT AG AAATT CAT ATCG ACG AAAAAATGTT GG AT G AACAT AAT ATTG AT ACAGTCAAAG AGGTTTT AATT ACACCTGCT CAAGG A TTCAAAGATTAAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCT GCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTC TTG AGGGGTTTTTTG AG AT CT CG AT CCCGCG AAATT AAT ACG ACT CACT AT AGG GG AATTGTG AGCGG AT AACAATTCCCCACT AG AAAT AATTTTGTTT AACTTT AAG AAGGAGATATAGCAATGAACCGTCGTAACCGTAGCAACGACCTGAACCCGGAGC CGAGCATCGAAAACCCGAACAACCAGATTGCGGAGGAATTCCCGGGTAACAACA GCGTGTATAAAAGCGACGGCTACGTTGATCTGAAGAACAACGGTCGTCTGTTCC CGATCTGGATTCTGAAGAACTTTAAACAATACAAGCTGCCGGAGATCATTCGTAA AGAGAACGAAGACCCGTGCAACGTGCAGGTTAAGCTGGAGCTGCGTAAATATCA GGAATTCGTGGGCCAATACCTGAACCCGCAGGGTCCGTATACCAGCATCCTGCT GTACCATGGTCTGGGTAGCGGCAAGACCGCGAGCGCGATCAACCTG ATG AACAT TCTGTACAACTATGACAACGGCACCAACTTTATCGTTCTGATTAAAGCGAGCCTG CACAACGACCCGTGGATGCAGGACCTGAAGGAGTGGCTGGGTCGTGATCCGAGC GAACAGAACGTGGACAACGTTACCAAGCTGGATCGTTACAAAAACATCCACTTCG TGCACT ATG ACAGCCCGTTCGCGG AT AGCAGCTTT ATG AGCGTT ATT AAG ACCCT GGACCTGAGCAAACCGACCATGTACATCATTGATGAGGCGCACAACTTTATCCGT AACGTGTAT AGCAACATT AACAGCAAACTGGGCAAGCGTGCGAAAGTT ATCT AC GAGTACATCATGAAGGACAAGCGTGAAAACAAGAACACCCGTATCGTGCTGATT AGCGCGACCCCGGCGATCAACACCCCGTTCGAACTGGCGCTGATGTTTAACCTG CTGCGTCCGGGTATTTTCCCGAGCAGCGAGCTGGATTTCAACCGTACCTTTGTG ACCGAAAGCAGCTACCCGATCCTGAACCCGATGAAGAAAAACATGTTTGAGCGT CGTATCCTGGGCCTGGTTAGCTACTATATTGGTGCGACCCCGGACCTGTATGCG CGTCAAGAACTGAAGTACATCAACCTGCCGATGAGCGCGTACCAGTATGATATCT ACCGTATTTTCG AG AAACTGG AGGCGGAAATTCAAGAACGTGCGCGTCGTCGTG GCAAGCAGAGCCAACTGTACCGTACCTATACCCGTCAGGCGTGCAACTTCGTGT TTCCGTACGTTAACATGAACGTGAACGGTGAACTGCGTCCGCGTCCGGGCAAGT TCCGTCTGAGCGAAAAACTGGCGGACGATTTTAGCAAGGGCAAAAACCTGGACG TTCCGGATACCGAGAAAGAAATCCTGAACAAGTATACCAAAGCGATTGAGAACTA CCTGAACGAGACCGAACGTTATTTTCAGAACATCAACAAGAAAGACGCGGAGAA CGGT CGTACCAT CATT AACGACCTGG ATG AATT CAAG AAAGGCTTTGGTACCAA GTTCAACAGCTTTCTGCAGTACTATCAAAGCGAGGGTCCGCGTAGCAGCCTGCT GACCGAAATGTACAACTGCAGCCCGAAAATGCTGGCGATCGCGTTCATGACCTA TATTAGCCCGGGCAAGGTGATGATCTACAGCAACTATGTGGTTATGGAAGGCAT CGACGTTATGAAAATTTACTTTCGTCTGATCGGTTTCAACGATTTTACGATCGCG CGTGAGTACATGGGCTATTGCGAATACCACGGTCGTATCGACCCGAAGGATCGT GTGCGTATCAAGAACATGTTCAACGACAAGAACAACGTGTACGGCAACAAGTGC AAAGTTATCATGCTGAGCCCGAGCGCGACCGAGGGTATTCAACTGCTGGATATC CGTCAGGAGCACATTATGGAACCGTATTGGACCGAAGTTCGTATCCAGCAAGTG ATTGGCCGTGGTGTTCGTCAATGCAGCCACCGTGACCTGCCGATGAGCGAGCGT ATCGTGG AT ATTT ACCGTT AT AAGGTT AT CAAACCGG AAAACCTGG ACCCGG AC GATACCGTGCGTCAAAGCACCGACGAGTACGTTGAAGATCAGGCGAAGAGCAAA GCGAACCTGATTGAGAGCTTCCTGGGCGCTATGAAAGAAGCGGCGGTTGATTGC G AGCTGTTT AAGG AACACAACAT G ATG AGCCAG AGCT ACT ATTGCTT CAAATTT C CGGAGAGCGCGGTGACCAAGACCAACGTTGGCCCGGCGTACCGTGAAGACATCA AGGACGATGTGAAATATGATAGCGGTCTGAACAGCAAAAACAGCATCGTTGAGC GTATTCGTGTGGTTAAGGTGAACGCGGTTTACCAAATCAACACCGACAACAACAA CCCGGTGTATAGCAGCCCGACCAAGTACTGGTATAACAAGAAAACCGGCATGGT TTATGACTTCGAGACCCACTACCCGGTGGGTCAGGTTGAATTTATCGATAACCTG CCGAACAAGCTGGACAAAGATACCTACATCATGCGTATTGATGTGATCATTCCGA GCATT ACCGGTAGCGTT AACACCT AACACT AG AAAT AATTTTGTTT AACTTT AAG AAGG AG AT AT AGCG ATG ACCG ACATT AGCT ACT AT AACAACG AG AT CG AT AAAAT TCTGTGGAACATCCTGGGTGACGATTATTTCACCCAAGACGAATTTGACGATCTG GTGAACAGCGTTGCGAACACCATTTACCAGTATGACAACGAAGTGAGCATCGAT AAGCTGAAAGTGATCATCGAATTCGTTATCCTGAACAAGTTCAAGCTGTGCTACA TCTACGATAACGACAGCATCCTGAACCAAGTGAAATACGAGAAGAAAAGCGTTG GTAGCAAAACCATCGGCAAGAACAGCACCAACGACGATGAGGACGATGACGAAG ATATCGCGGTGATTAAGCTGAGCGATATTGAGGCGGGCGAAAACTGGTTCAAGA AAAGCCCGAAAATCAGCAGCAAGCAGTTTCAAAGCGTTGACAAAGTTGAGGTGG CGACCTACGAAGACCTGATCAGCCACAAGCACGATTACCCGAAAGAGATTTATAA GGAAAGCCACTACATCCGTCGTAACACCCGTCTGGATGTGATCAAGAAAATTCCG CAATTCGAGCAGAAGAGCAAAGAATGGCTGAAACAACGTACCGAGAGCCTGACC GCGACCGCGATTAGCGTGGTTTTTGATGAAGACCCGTATAAACACCCGATCGTT ATTCTGCTGGACAAGTGCGGTCGTGGCCTGCCGTTCGTGGAGAACAAATTTGTT CACCACGGTAACAAGTATG AACAAATCGGCACCAT GTT CT ACAGCTTT CGTAACA ACGTTGAGGTGGGTGAGTACGGCCTGCTGCAGCACAGCGGTCACAAGTTTATCG CGGCGAGCCCGGATGGCATCTGCAGCAAGAAAGCGAACACCGGTGGCCTGAGCA AACTGGTGGGTCGTCTGCTGGAGATTAAGTTCCCGTTTAGCCGTGAAATCAACA ACAGCGGTGATCTGGACGGCGATATCTGCCCGCACTACTATTTTCTGCAGGTGC AAACCCAGCTGTATGTTACCGAGATGGACGAATGCGACTTCCTGCAGTGCAAAA TTGACGAGTACGATAGCTGGGAAGACTTTGTGAAGGATAGCAACCCGATCGTTC CGGGTCTGAGCAAAACCACCAACCTGGAGAAGGGCTGCCTGATTCAGCTGAGCG ACAAAAACCTGATCGGCAGCGACGACAAGGAAAAATGCCTGTATAACAGCAAATA CATCTATCCGCCGAAGCTGCACATGACCAACGAGGAAATCGAGAAGTGGATTAG CAGCGAAATCATGAACTACCACAACAACGACCTGAGCGAGAACTATATGATTGAT CGTGTGATCTACTGGCGTCTGAGCCAAGTTACCTGCAACCTGATTAAGCTGAAC AAAGAAGCGTTCGAGGAAAAAATCCCGCTGCTGCAGCAATTCTGGGACTACGTT CT GTTTT ATCGT CAGCACAGCG ACAAGCTGG AT AAACT GATT AAGTTTGTGG AG AAGGTTAAAGAAGATAACAGCGCGGAGATTTTCAGCTACATCAACGAAGACTTTC TGAGCCTGAACAAAGATAGCAAGTACGAGCCGCTGTATCAGGAAGAGACCGAAT GGCGTAAGAAATATAACCAAATCAAGGCGAAGAAAGCGCAGATGTACAAGAACA AGAGCTACAACAAGTACACCAAGTTCAGCAACCTCGAGCACCACCACCACCACCA CTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCAC

CGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGG

TTTTTTG .

SEQ . I D. N °23 : séq uence spécifiq ue de 15 n u cléotides d u gène de résista nce à la tétracycl i ne

CACCCTGGATGCTGT

SEQ . I D. N °24 : séq uence de 28 nt d u virophage za m i lon

AAT CT G AT AAT G AAT CTG AT AAT G AAT C SEQ . I D. N °25 : vecteu r PP 14

CCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGG AGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGT CGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGG GCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTT TTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGAT AACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACC GAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTATTTT CTCCTTACGCATCTGTGCGGTATTTCACACCGCATATATGGTGCACTCTCAGTAC AATCTGCTCTGATGCCGCATAGTTAAGCCAGTATACACTCCGCTATCGCTACGTG ACTGGGTCATGGCTGCGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGAC GGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGA GCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGGCAGCTGC GGTAAAGCTCATCAGCGTGGTCGTGAAGCGATTCACAGATGTCTGCCTGTTCAT CCGCGTCCAGCTCGTTGAGTTTCTCCAGAAGCGTTAATGTCTGGCTTCTGATAAA GCGGGCCATGTTAAGGGCGGTTTTTTCCTGTTTGGTCACTGATGCCTCCGTGTA AGGGGGATTTCTGTTCATGGGGGTAATGATACCGATGAAACGAGAGAGGATGCT CACGATACGGGTTACTGATGATGAACATGCCCGGTTACTGGAACGTTGTGAGGG TAAACAACTGGCGGTATGGATGCGGCGGGACCAGAGAAAAATCACTCAGGGTCA ATGCCAGCGCTTCGTTAATACAGATGTAGGTGTTCCACAGGGTAGCCAGCAGCA TCCTGCGATGCAGATCCGGAACATAATGGTGCAGGGCGCTGACTTCCGCGTTTC CAGACTTTACGAAACACGGAAACCGAAGACCATTCATGTTGTTGCTCAGGTCGCA GACGTTTTGCAGCAGCAGTCGCTTCACGTTCGCTCGCGTATCGGTGATTCATTC TGCTAACCAGTAAGGCAACCCCGCCAGCCTAGCCGGGTCCTCAACGACAGGAGC ACGATCATGCGCACCCGTGGGGCCGCCATGCCGGCGATAATGGCCTGCTTCTCG CCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAA GATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCG GTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCAT GATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCG GAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGC CTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAG TCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGA GGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGG CAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTC CACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGG GATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCA CCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGA TCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATG GTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCT GAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCG AGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGA CCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTT GATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGC AGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCA CTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCG CTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATT TAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAA CGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAA TGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAAC GTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATA CTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTC TCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTG TCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAG TAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGA GATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAA ACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTC GGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGAT GCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACT AT AGGGG AATTGT G AGCGG AT AACAATT CCCCT CT AG AAAT AATTTTGTTT AACT TTAAGAAGGAGATATAGATATGGAATTAATTAGTCGTGTCTTTACTCATGGAGAA AAT ATTTT ACTTGTT AGTT CT AC AAAT AAGTT AT AT ATT ATG G GT AAT AATG AAT ATG GTT C ATGTG GTTT C AAAAT AG GT AC AG AT AAAACTT AT ATTG AAAGTCC AGT AT AT ATTG ACATT AAATT AG ATG ATG AT GATT CTGTT AAAGCGTTTT ATT CTTGT AATTT ATT CACG AT GATT CAT ACATCCAAAGG AAAAATTT AT CT AT CAAG AT CAT TTATTTGTGGTGGAGGTGAAATCGATGCATATGATAGTGAAAGTGATGTTGGAA GTGATGCTGAGTCTGATGCTGAGTCTGATGCTGAATCAGATTCAGAAAATCATA CT CAAAAT AAT ACAAAT ACTCCCAT AAAT AAT AT CACACT AATT AATTTGG ATT CA T CAAAT AATTCCACT C AAT CC ACCCT G G ATG CTGTT AATG AATCCACCCT G G ATG CTGTCAATGAATCTGATCAATCATGTAGTGATTTTGACTGTGGACCTCGATCCAC CCTGGATGCTGTTGAAGAAGTTTTTGTTGATCGTAATGATAATAATTCAGATAAT ATTGGT AATT CAAAT AGTAT CACCCTGG ATGCTGTAT CT AT G ACT G AAAAAGCT G G AAT AATTTTGTT AAACG AAATT AAAACCATGGT AG ATG AAATTTTGTCT CAAAA AAATATTAATTCTGTTGGAATTAACGATATTGTTATTCGTCCAAGCGGACAGTAT GTG AGT AAT ATGGG AT AT ATT ACAG AAT CAGGTAGTGTAT CATTT CAT ACCAAT A AAAATGGTTT CTT ATT ATT CAAGTCCAATGTT CATG AAATCCTTTTCGTTG AAG A AATGTTT ATGT ACT CT AAAAAT AATTTT ATTT ATTTGG CCAT ACC ATTT AAAAAAT ACCAG G CAT CT CT AAG AG AT ATTGCTCCTTTT CAT AC AATT AAT AAAAC AAAAAA TGGTATTAAATGGAAGTATTTCAAAATAGTGTTTCCATTTGACACTGAAAAAATA G AATTTTGTG AT AATTT CTTTT AT ACTT ATG AATCCAAT ACTTGTT AT CAT CAT G TT ATTT C ATT CT AC AAAAATGTAAATT ATT ATCCTT CTT G GATAT ATTT CAAAT CT GAGATTGATATTAATAGTAAAAATATGTTCTTTTCAAGTGATACTAATAGTGTGT ATGTT AAAG AT AAT AACAACGTGT AT AAAT ACCAT AATTT CAAT AATT CT CTTG A AAAATACATCGATAACAAACTCGACTTGGATGTCGTAATTGTGCCTGATAGTTAT AG ACCAATGG AAATG AG ACT ACT ATT AAAGTT AGGT AT AACATTGT AT AGCG ATT ACAATTTT AATGG ATGTG AGG ATG ATG AAG AACAT ATTTTCG AAATT ATG AAAAA T CAAT ATGT ACCT CAT ATT ATCGGTCTG AATT ATTTTG AAAGTTT CATTGTAGTT ATTGTCAAT AATCCAAAT ATGTTG ACG AT AACAACT G ACG ATGGT AAAATTTT CT TT AACATT CATG AT ATT ACTTTTT ACAAAAG ATTTT AT AATGG AATCGTTT AT CTT G AT AAT G GTTCGTT ATTTT AT CT CACAG AT AGTG AAATTT C AG AT C AAAAT GTAT GG AAACT AACTGG AT GTCAATTGTGTG AGCT AGCTG ATT CT ACCAT AT AT AGTT A CCT ATTT AATTT ACCGG ACAAAATT G ATG AAATTT ACT CTTCGTCTG AATTT ATT GTT CT AAAATT AATT G G AAACAAAT ATTTTT ATT ATCCG GTTG AAAATTTT GATA CTGCT CAAG ATTTT AAGACAAGATGTGGGG AAATTT CATTG AAAAAT AATT CAGT T CTT G AACT CGTT AAT ACT AGTATT ATT AACAG ACAAT CT AAAAGTT AT CAT ACT ACAGT AT CT ATT AAT ATTG AT ACGG ATT GT ACT ACT CAT AATT CTTTCG AG AG AT TGTTT AT CCTG ACACAAT CT CTT AGTT ATT CCGCAG AAT ATT CT ATTCG AATT GT AGACGACAAAAATATTGGTTTTGGTGATGGGCCTAAAATTGAATTTTGTGAATCG G CT ATT AT G CAATTTT ATT AT AAGT ATTT AATTGCT CAT AATTTT C AC ACAG AGT TT AATTT ACAAG AATTTGCCAAACT G AAACCCACCG AAATT AAAT ATTTGGG AT C AATGTTT CAT ATG GTT AT CTGTC AAAAT AATT CTT CGTT ACCG ATT AG ATT ACCT CT AGCTTTTGCTGTAG AAATTT ATGG AAAAG AACCCACAATTG AT G AATT G G AAT ATTTTGCTT GT AATG AAG AT G AAACTGG ATT CAAACAT ATTT ATCCAGCCAAAT A CAAT CCCG AATT AGTT AAAG AATTCG GTT ATG AAT CTT ATG AACATT GTCT AAAA ACTTTGT GT AAAT AT AATT ATG AAG AT G AT ACTG AT AAAAAT AT CTTG ACG AAAA AAT ATTGCG AGCAATT AGCTGCCGGTTTT AAAAG AT ACGG CAAT AT CAAG AACAT AAAACAAATG AATTT ACCC ACATT G G ACT ATT AC ATTT CT G GCCCAT ACAAAATT AAT AG AACCAT ATT AATT AAT AAT CTTGTTTT AT CGGG AGGT AAGG AT AAAAAT A AT AATT ATTTGG AAATGTT CAAAG AATTT ATT AACT CTTTGT CTG AAAATG AATT AAAAAT CTTGCT AAAAAATTGG ACAGCAT CAACTTGTGTAAG ACCAG AT AACAAA T AT AG AATT AT C ATT ATTTCCAAAT CT AAAAACGCT AAAG CAG GT ATTCG ATTT G GT ACTT GT AATTT AG AAATT CAT ATCG ACG AAAAAATGTTGG ATG AACAT AAT AT TG AT ACAGT CAAAG AGGTTTT AATT ACACCTGCT CAAGG ATT CAAAG ATT AAG AT CCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAG CAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG AGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGA T AACAATT CCCCACT AG AAAT AATTTTGTTT AACTTT AAG AAGG AG AT AT AGCAA TGAACCGTCGTAACCGTAGCAACGACCTGAACCCGGAGCCGAGCATCGAAAACC CGAACAACCAGATTGCGGAGGAATTCCCGGGTAACAACAGCGTGTATAAAAGCG ACGGCTACGTTGATCTGAAGAACAACGGTCGTCTGTTCCCGATCTGGATTCTGA AGAACTTTAAACAATACAAGCTGCCGGAGATCATTCGTAAAGAGAACGAAGACCC GTGCAACGTGCAGGTTAAGCTGGAGCTGCGTAAATATCAGGAATTCGTGGGCCA ATACCTGAACCCGCAGGGTCCGTATACCAGCATCCTGCTGTACCATGGTCTGGG TAGCGGCAAGACCGCGAGCGCGATCAACCTGATGAACATTCTGTACAACTATGA CAACGGCACCAACTTTATCGTTCTGATTAAAGCGAGCCTGCACAACGACCCGTGG ATGCAGG ACCTG AAGG AGTGGCTGGGTCGTG ATCCG AGCG AACAG AACGTGG AC AACGTTACCAAGCTGGATCGTTACAAAAACATCCACTTCGTGCACTATGACAGCC CGTTCGCGGATAGCAGCTTTATGAGCGTTATTAAGACCCTGGACCTGAGCAAAC CGACCATGTACATCATTGATGAGGCGCACAACTTTATCCGTAACGTGTATAGCAA CATT AACAGCAAACTGGGCAAGCGTGCG AAAGTT AT CT ACG AGT ACAT CAT G AA GGACAAGCGTGAAAACAAGAACACCCGTATCGTGCTGATTAGCGCGACCCCGGC GATCAACACCCCGTTCGAACTGGCGCTGATGTTTAACCTGCTGCGTCCGGGTAT TTTCCCG AGCAGCG AGCTGG ATTTCAACCGTACCTTTGTG ACCG AAAGCAG CTA CCCG ATCCTGAACCCG ATG AAG AAAAACATGTTTGAGCGTCGTATCCTGGGCCT GGTTAGCTACTATATTGGTGCGACCCCGGACCTGTATGCGCGTCAAGAACTGAA GT ACAT CAACCTGCCG ATG AGCGCGTACCAGT ATG AT AT CT ACCGTATTTTCG AG AAACTGG AGGCGGAAATTCAAGAACGTGCGCGTCGTCGTGGCAAGCAGAGCCAA CTGTACCGTACCTATACCCGTCAGGCGTGCAACTTCGTGTTTCCGTACGTTAACA TGAACGTGAACGGTGAACTGCGTCCGCGTCCGGGCAAGTTCCGTCTGAGCGAAA AACTGGCGGACGATTTTAGCAAGGGCAAAAACCTGGACGTTCCGGATACCGAGA AAGAAATCCTGAACAAGTATACCAAAGCGATTGAGAACTACCTGAACGAGACCGA ACGTTATTTTCAGAACATCAACAAGAAAGACGCGGAGAACGGTCGTACCATCATT AACGACCTGGATGAATTCAAGAAAGGCTTTGGTACCAAGTTCAACAGCTTTCTGC AGTACTATCAAAGCGAGGGTCCGCGTAGCAGCCTGCTGACCGAAATGTACAACT GCAGCCCGAAAATGCTGGCGATCGCGTTCATGACCTATATTAGCCCGGGCAAGG TGATGATCTACAGCAACTATGTGGTTATGGAAGGCATCGACGTTATGAAAATTTA CTTTCGTCTGATCGGTTTCAACGATTTTACGATCGCGCGTGAGTACATGGGCTAT TGCGAATACCACGGTCGTATCGACCCGAAGGATCGTGTGCGTATCAAGAACATG TTCAACGACAAGAACAACGTGTACGGCAACAAGTGCAAAGTTATCATGCTGAGCC CGAGCGCGACCGAGGGTATTCAACTGCTGGATATCCGTCAGGAGCACATTATGG AACCGTATTGGACCGAAGTTCGTATCCAGCAAGTGATTGGCCGTGGTGTTCGTC AATGCAGCCACCGTGACCTGCCGATGAGCGAGCGTATCGTGGATATTTACCGTT ATAAGGTTATCAAACCGGAAAACCTGGACCCGGACGATACCGTGCGTCAAAGCA CCGACGAGTACGTTGAAGATCAGGCGAAGAGCAAAGCGAACCTGATTGAGAGCT TCCTGGGCGCTATGAAAGAAGCGGCGGTTGATTGCGAGCTGTTTAAGGAACACA ACATGATGAGCCAGAGCTACTATTGCTTCAAATTTCCGGAGAGCGCGGTGACCA AGACCAACGTTGGCCCGGCGTACCGTGAAGACATCAAGGACGATGTGAAATATG ATAGCGGTCTGAACAGCAAAAACAGCATCGTTGAGCGTATTCGTGTGGTTAAGG TGAACGCGGTTTACCAAATCAACACCGACAACAACAACCCGGTGTATAGCAGCCC GACCAAGTACTGGTATAACAAGAAAACCGGCATGGTTTATGACTTCGAGACCCAC TACCCGGTGGGTCAGGTTGAATTTATCGATAACCTGCCGAACAAGCTGGACAAA GATACCTACATCATGCGTATTGATGTGATCATTCCGAGCATTACCGGTAGCGTTA ACACCT AACACT AG AAAT AATTTTGTTT AACTTT AAG AAGG AG AT AT AGCG ATG A CCG ACATT AGCT ACT AT AACAACG AG ATCG AT AAAATT CT GTGG AACATCCTGGG TGACGATTATTTCACCCAAGACGAATTTGACGATCTGGTGAACAGCGTTGCGAAC ACCATTT ACCAGT ATG ACAACG AAGT G AGCATCG AT AAGCT G AAAGTG AT CAT CG AATTCGTTATCCTGAACAAGTTCAAGCTGTGCTACATCTACGATAACGACAGCAT CCTGAACCAAGTGAAATACGAGAAGAAAAGCGTTGGTAGCAAAACCATCGGCAA GAACAGCACCAACGACGATGAGGACGATGACGAAGATATCGCGGTGATTAAGCT GAGCGATATTGAGGCGGGCGAAAACTGGTTCAAGAAAAGCCCGAAAATCAGCAG CAAGCAGTTTCAAAGCGTTGACAAAGTTGAGGTGGCGACCTACGAAGACCTGAT CAGCCACAAGCACG ATT ACCCGAAAG AGATTT AT AAGGAAAGCCACT ACAT CCGT CGTAACACCCGTCTGGATGTGATCAAGAAAATTCCGCAATTCGAGCAGAAGAGC AAAGAATGGCTGAAACAACGTACCGAGAGCCTGACCGCGACCGCGATTAGCGTG GTTTTTGATGAAGACCCGTATAAACACCCGATCGTTATTCTGCTGGACAAGTGCG GTCGTGGCCTGCCGTTCGTGGAGAACAAATTTGTTCACCACGGTAACAAGTATG AACAAATCGGCACCATGTTCTACAGCTTTCGTAACAACGTTGAGGTGGGTGAGT ACGGCCTGCTGCAGCACAGCGGTCACAAGTTTATCGCGGCGAGCCCGGATGGCA TCTGCAGCAAGAAAGCGAACACCGGTGGCCTGAGCAAACTGGTGGGTCGTCTGC TGGAGATTAAGTTCCCGTTTAGCCGTGAAATCAACAACAGCGGTGATCTGGACG GCG AT AT CTGCCCGCACT ACT ATTTT CTGCAGGTGCAAACCCAGCT GT ATGTT AC CGAGATGGACGAATGCGACTTCCTGCAGTGCAAAATTGACGAGTACGATAGCTG GGAAGACTTTGTGAAGGATAGCAACCCGATCGTTCCGGGTCTGAGCAAAACCAC CAACCTGGAGAAGGGCTGCCTGATTCAGCTGAGCGACAAAAACCTGATCGG CAG CG ACG ACAAGG AAAAATGCCT GT AT AACAGCAAAT ACAT CT ATCCGCCG AAGCT G CACAT G ACCAACG AGG AAAT CG AG AAGTGG ATT AGCAGCG AAAT CATG AACT AC CACAACAACGACCTGAGCGAGAACTATATGATTGATCGTGTGATCTACTGGCGT CTGAGCCAAGTTACCTGCAACCTGATTAAGCTGAACAAAGAAGCGTTCGAG GAA AAAATCCCGCTGCTGCAGCAATTCTGGGACTACGTTCTGTTTTATCGTCAGCACA GCG ACAAGCTGG AT AAACTG ATT AAGTTTGTGG AG AAGGTT AAAG AAG AT AACA GCGCGGAGATTTTCAGCTACATCAACGAAGACTTTCTGAGCCTGAACAAAGATA GCAAGTACGAGCCGCTGTATCAGGAAGAGACCGAATGGCGTAAGAAATATAACC AAATCAAGGCGAAGAAAGCGCAGATGTACAAGAACAAGAGCTACAACAAGTACA CCAAGTTCAGCAACCTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAA CAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGC ATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGG AACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCG GCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCG CCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCC GTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGC ACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGC CCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGG ACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGAT TTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAAC AAAAATTT AACGCG AATTTT AACAAAAT ATT AACGTTT ACAATTT CAGGTGGCAC TTTTCGGGG AAATGTGCGCGG AACCCCT ATTTGTTT ATTTTT CT AAAT ACATT CA AAT ATGTAT CCG CT C ATG AG AC AAT AACCCT G AT AAATGCTT C AAT AAT ATTG AA AAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGC GGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGAT GCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGC GGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTT TTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGC AACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGT CACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGC CATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGA CCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTT GATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACC ACGATGCCTGCAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTAC TTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTG CAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAAT CTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATG GTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGG AT G AACG AAAT AG ACAG ATCGCT G AG AT AGGTGCCT CACTG ATT AAGCATTGGT AACTGTCAG ACCAAGTTT ACT CAT AT AT ACTTT AG ATTG ATTT AAAACTT CATTT TT AATTT AAAAGG AT CT AGGTG AAG ATCCTTTTTG AT AAT CT CATG ACCAAAAT C CCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAG G AT CTT CTTG AG AT CCTTTTTTT CTGCGCGTAAT CTGCTGCTTGCAAACAAAAAA ACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTT CCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTG T AGCCGTAGTT AGGCCACCACTT CAAG AACT CTGTAGCACCGCCT ACAT ACCT CG CTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTA CCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAA CGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGA GATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTT

SEQ . I D. N °26 : séq uence d u premier spacer d u gène R349 mod ifié (N . B. : ne pas teni r compte d u premier nu cléotide A ajouté u n iq uement pour faire un total de 10 nt comme requis par le logiciel de listage de séquence)

ATAATGAATC

SEQID°27 : séquence du deuxième spacer du gène R349 modifié

CAATGAATCTGATCAATCATGTAGTGATTTTGACTGTGGACCTCGATC

SEQ. ID. N°28 : séquence du troisième spacer du gène R349 modifié

TG AAG AAGTTTTTGTTG AT CGTAATG AT AAT AATT CAG AT AAT ATTGGT AATT CA A AT AG T AT

SEQ. ID. N°29 : séquence sens d'ARN spécifique du gène GFP

GCUGGACGGCGACGA

SEQ. ID. N°30 : séquence anti sens d'ARN spécifique du gène GFP ACGUCGCCGUCCAGC

SEQ.ID.N°31: séquence du Promoteur T7

T AAT ACG ACT CACT AT AG SEQ.ID.N°32: séquence de l'opéron Lac

GAATTGTGAGCGGATAACAATTCC.

SEQ.ID.N°33 : séquence du terminateur T7

CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG SEQ.ID.N°34 :séquence de l'étiquette polyhistidine

CACCACCACCACCACCAC

SEQ.ID. N°35 : Séquence du plasmide pACYC184 portant le gène de résistance à la tétracycline

GAATTCCGGATGAGCATTCATCAGGCGGGCAAGAATGTGAATAAAGGCCGGATA AAACTTGTGCTT ATTTTT CTTT ACG GT CTTT AAAAAGG CCGT AAT ATCCAG CTG A ACG GTCT G GTTATAG GT ACATTG AG C AACTG ACTG AAATGCCT CAAAATGTT CTT T ACG ATGCCATTGGG AT AT AT CAACGGTGGTAT AT CCAGTG ATTTTTTT CT CCAT TTTAGCTTCCTTAGCTCCTGAAAATCTCGATAACTCAAAAAATACGCCCGGTAGT GATCTTATTTCATTATGGTGAAAGTTGGAACCTCTTACGTGCCGATCAACGTCTC ATTTTCGCCAAAAGTTGGCCCAGGGCTTCCCGGTATCAACAGGGACACCAGGAT TTATTTATTCTGCGAAGTGATCTTCCGTCACAGGTATTTATTCGGCGCAAAGTGC GTCGGGTGATGCTGCCAACTTACTGATTTAGTGTATGATGGTGTTTTTGAGGTG CTCCAGTGGCTTCTGTTTCTATCAGCTGTCCCTCCTGTTCAGCTACTGACGGGGT GGTGCGTAACGGCAAAAGCACCGCCGGACATCAGCGCTAGCGGAGTGTATACTG GCTTACTATGTTGGCACTGATGAGGGTGTCAGTGAAGTGCTTCATGTGGCAGGA GAAAAAAGGCTGCACCGGTGCGTCAGCAGAATATGTGATACAGGATATATTCCG CTTCCTCGCTCACTGACTCGCTACGCTCGGTCGTTCGACTGCGGCGAGCGGAAA TGGCTTACGAACGGGGCGGAGATTTCCTGGAAGATGCCAGGAAGATACTTAACA GGGAAGTGAGAGGGCCGCGGCAAAGCCGTTTTTCCATAGGCTCCGCCCCCCTGA CAAGCATCACGAAATCTGACGCTCAAATCAGTGGTGGCGAAACCCGACAGGACT ATAAAGATACCAGGCGTTTCCCCCTGGCGGCTCCCTCGTGCGCTCTCCTGTTCCT GCCTTTCGGTTTACCGGTGTCATTCCGCTGTTATGGCCGCGTTTGTCTCATTCCA CGCCTGACACTCAGTTCCGGGTAGGCAGTTCGCTCCAAGCTGGACTGTATGCAC GAACCCCCCGTTCAGTCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGT CCAACCCGGAAAGACATGCAAAAGCACCACTGGCAGCAGCCACTGGTAATTGAT TTAGAGGAGTTAGTCTTGAAGTCATGCGCCGGTTAAGGCTAAACTGAAAGGACA AGTTTTGGTGACTGCGCTCCTCCAAGCCAGTTACCTCGGTTCAAAGAGTTGGTA GCTCAGAGAACCTTCGAAAAACCGCCCTGCAAGGCGGTTTTTTCGTTTTCAGAG CAAGAGATTACGCGCAGACCAAAACGATCTCAAGAAGATCATCTTATTAATCAGA T AAAAT ATTT CT AG ATTT C AGTG CAATTT AT CT CTT CAAATGTAG C ACCTG AAGT CAGCCCCAT ACG AT AT AAGTTGTAATT CT CATGTTTG ACAGCTT AT CAT CG AT AA GCTTTAATGCGGTAGTTTATCACAGTTAAATTGCTAACGCAGTCAGGCACCGTGT ATGAAATCTAACAATGCGCTCATCGTCATCCTCGGCACCGTCACCCTGGATGCTG TAGGCATAGGCTTGGTTATGCCGGTACTGCCGGGCCTCTTGCGGGATATCGTCC ATTCCGACAGCATCGCCAGTCACTATGGCGTGCTGCTAGCGCTATATGCGTTGA TGCAATTTCTATGCGCACCCGTTCTCGGAGCACTGTCCGACCGCTTTGGCCGCC GCCCAGTCCTGCTCGCTTCGCTACTTGGAGCCACTATCGACTACGCGATCATGG CGACCACACCCGTCCTGTGGATCCTCTACGCCGGACGCATCGTGGCCGGCATCA CCGGCGCCACAGGTGCGGTTGCTGGCGCCTATATCGCCGACATCACCGATGGGG AAGATCGGGCTCGCCACTTCGGGCTCATGAGCGCTTGTTTCGGCGTGGGTATGG TGGCAGGCCCCGTGGCCGGGGGACTGTTGGGCGCCATCTCCTTGCATGCACCAT TCCTTGCGGCGGCGGTGCTCAACGGCCTCAACCTACTACTGGGCTGCTTCCTAA TGCAGGAGTCGCATAAGGGAGAGCGTCGACCGATGCCCTTGAGAGCCTTCAACC CAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGCCGCACTTATGA CTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCGCTCTGGGTCA TTTTCGGCGAGGACCGCTTTCGCTGGAGCGCGACGATGATCGGCCTGTCGCTTG CGGTATTCGGAATCTTGCACGCCCTCGCTCAAGCCTTCGTCACTGGTCCCGCCAC CAAACGTTTCGGCGAGAAGCAGGCCATTATCGCCGGCATGGCGGCCGACGCGCT GGGCTACGTCTTGCTGGCGTTCGCGACGCGAGGCTGGATGGCCTTCCCCATTAT GATTCTTCTCGCTTCCGGCGGCATCGGGATGCCCGCGTTGCAGGCCATGCTGTC CAGGCAGGTAGATGACGACCATCAGGGACAGCTTCAAGGATCGCTCGCGGCTCT TACCAGCCTAACTTCGATCACTGGACCGCTGATCGTCACGGCGATTTATGCCGCC TCGGCGAGCACATGGAACGGGTTGGCATGGATTGTAGGCGCCGCCCTATACCTT GTCTGCCTCCCCGCGTTGCGTCGCGGTGCATGGAGCCGGGCCACCTCGACCTGA ATGGAAGCCGGCGGCACCTCGCTAACGGATTCACCACTCCAAGAATTGGAGCCA ATCAATTCTTGCGGAGAACTGTGAATGCGCAAACCAACCCTTGGCAGAACATATC CATCGCGTCCGCCATCTCCAGCAGCCGCACGCGGCGCATCTCGGGCAGCGTTGG GTCCTGGCCACGGGTGCGCATGATCGTGCTCCTGTCGTTGAGGACCCGGCTAGG CTGGCGGGGTTGCCTTACTGGTTAGCAGAATGAATCACCGATACGCGAGCGAAC GTG AAGCGACTGCTGCTGCAAAACGTCTGCG ACCTG AGCAACAACATGAATGGT CTTCGGTTTCCGTGTTTCGTAAAGTCTGGAAACGCGGAAGTCCCCTACGTGCTG CTGAAGTTGCCCGCAACAGAGAGTGGAACCAACCGGTGATACCACGATACTATG ACTGAGAGTCAACGCCATGAGCGGCCTCATTTCTTATTCTGAGTTACAACAGTCC GCACCGCTGTCCGGTAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGCC GCACTTATGACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCG CCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCG CCCTGCACCATTATGTTCCGGATCTGCATCGCAGGATGCTGCTGGCTACCCTGT GG AACACCT ACAT CT GT ATT AACG AAGCGCT AACCGTTTTT AT CAGGCT CTGGG A GGCAGAATAAATGATCATATCGTCAATTATTACCTCCACGGGGAGAGCCTGAGC AAACTGGCCTCAGGCATTTGAGAAGCACACGGTCACACTGCTTCCGGTAGTCAA TAAACCGGTAAACCAGCAATAGACATAAGCGGCTATTTAACGACCCTGCCCTGAA CCGACGACCGGGTCGAATTTGCTTTCGAATTTCTGCCATTCATCCGCTTATTATC ACTTATTCAGGCGTAGCACCAGGCGTTTAAGGGCACCAATAACTGCCTTAAAAAA ATTACGCCCCGCCCTGCCACTCATCGCAGTACTGTTGTAATTCATTAAGCATTCT GCCGACATGGAAGCCATCACAGACGGCATGATGAACCTGAATCGCCAGCGGCAT CAGCACCTTGTCGCCTTGCGTATAATATTTGCCCATGGTGAAAACGGGGGCGAA GAAGTTGTCCATATTGGCCACGTTTAAATCAAAACTGGTGAAACTCACCCAGGGA TTGGCTGAGACGAAAAACATATTCTCAATAAACCCTTTAGGGAAATAGGCCAGGT TTTCACCGTAACACGCCACATCTTGCGAATATATGTGTAGAAACTGCCGGAAATC GT CGTGGTATT CACT CCAG AGCG ATG AAAACGTTT CAGTTTGCT CATGG AAAAC GGTGTAACAAGGGTGAACACTATCCCATATCACCAGCTCACCGTCTTTCATTGCC ATACG

SEQ.ID. N°36 : séquence du gène de résistance à la tétracycline

AT G AAAT CT AACAAT GCGCT CAT CGT CAT CCT CGGCACCGT CACCCT GG ATGCTGT AGGCAT A GGCTTGGTTATGCCGGTACTGCCGGGCCTCTTGCGGGATATCGTCCATTCCGACAGCATC GC CAGTCACTATGGCGTGCTGCTAGCGCTATATGCGTTGATGCAATTTCTATGCGCACCCGT TCT CGGAGCACTGTCCGACCGCTTTGGCCGCCGCCCAGTCCTGCTCGCTTCGCTACTTGGAGC CA CT AT CG ACT ACGCG AT CATGGCG ACCACACCCGT CCT GTGG AT CCT CT ACGCCGG ACGCAT CG TGGCCGGCATCACCGGCGCCACAGGTGCGGTTGCTGGCGCCTATATCGCCGACATCACCG AT GGGGAAGATCGGGCTCGCCACTTCGGGCTCATGAGCGCTTGTTTCGGCGTGGGTATGGTG G CAGGCCCCGTGGCCGGGGGACTGTTGGGCGCCATCTCCTTGCATGCACCATTCCTTGCGG CG GCGGTGCTCAACGGCCTCAACCTACTACTGGGCTGCTTCCTAATGCAGGAGTCGCATAAG GG AGAGCGTCGACCGATGCCCTTGAGAGCCTTCAACCCAGTCAGCTCCTTCCGGTGGGCGCG GG G CAT G ACT AT CGT CGCCGCACTT AT G ACT GT CTT CNT AT CAT GCAACT CGT AGG ACAGGT GC CGGCAGCGCTCTGGGTCATTTTCGGCGAGGACCGCTTTCGCTGGAGCGCGACGATGATCG GC CTGTCGCTTGCGGTATTCGGAATCTTGCACGCCCTCGCTCAAGCCTTCGTCACTGGTCCC GCC ACCAAACGTTTCGGCGAGAAGCAGGCCATTATCGCCGGCATGGCGGCCGACGCGCTGGGC TA CGTCTTGCTGGCGTTCGCGACGCGAGGCTGGATGGCCTTCCCCATTATGATTCTTCTCGC TTC CGGCGGCATCGGGATGCCCGCGTTGCAGGCCATGCTGTCCAGGCAGGTAGATGACGACCA TC AGGG ACAGCTTCAAGG AT CGCT CGCGGCT CTT ACCAGCCT AACTT CG AT CACT GG ACCGCTG ATCGTCACGGCGATTTATGCCGCCTCGGCGAGCACATGGAACGGGTTGGCATGGATTGTA GG CGCCGCCCTATACCTTGTCTGCCTCCCCGCGTTGCGTCGCGGTGCATGGAGCCGGGCCAC CT CGACCTGA SEQ.ID. N°37 : séquences organisées en opéron incluant le gène R349 modifié avec séquence spécifique de 15 nucléotides du gène de résistance à la tétracycline (SEQ ID N°39) et les gènes R350 et 354.

TAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCTAGAAAT AATTTTGTTT AACTTT AAG AAGG AG AT AT AG AT ATGG AATT AATT AGTCGTGT CT TT ACT CATGG AG AAAAT ATTTT ACTTGTT AGTT CT ACAAAT AAGTT AT AT ATT AT GGGTAATAATGAATATGGTTCATGTGGTTTCAAAATAGGTACAGATAAAACTTAT ATTGAAAGTCCAGTATATATTGACATTAAATTAGATGATGATGATTCTGTTAAAG CGTTTT ATT CTTGT AATTT ATT CACG ATG ATT CAT ACATCCAAAGG AAAAATTT A TCTATCAAGATCATTTATTTGTGGTGGAGGTGAAATCGATGCATATGATAGTGAA AGTGATGTTGGAAGTGATGCTGAGTCTGATGCTGAGTCTGATGCTGAATCAGAT T CAG AAAAT C AT ACT C AAAAT AAT AC AAAT ACTCCC AT AAAT AAT AT C ACACT AAT T AATTTGG ATT CAT CAAAT AATTCC ACT C AATCCG G CT CTT ACC AG CCT AAT G AA TCCGGCTCTTACCAGCCCAATGAATCTGATCAATCATGTAGTGATTTTGACTGTG GACCTCGATCCGGCTCTTACCAGCCTGAAGAAGTTTTTGTTGATCGTAATGATAA T AATT CAG AT AAT ATT G GT AATT CAAAT AGT ATCG GCT CTT ACCAG CCAT CT AT G ACTG AAAAAGCTGG AAT AATTTTGTT AAACG AAATT AAAACCATGGTAG ATG AAA TTTTGTCT CAAAAAAAT ATT AATT CTGTTGG AATT AACG AT ATTGTT ATT CGTCC AAGCGGACAGTATGTGAGTAATATGGGATATATTACAGAATCAGGTAGTGTATC ATTT CAT ACCAAT AAAAAT G GTTT CTT ATT ATT CAAGTCCAATGTT C ATG AAAT C CTTTT CGTTG AAG AAATGTTT ATGTACT CT AAAAAT AATTTT ATTT ATTTGGCCA T ACCATTT AAAAAAT ACCAGGCAT CT CT AAG AG AT ATTGCTCCTTTT CAT ACAAT T AAT AAAAC AAAAAAT G GT ATT AAAT G G AAGTATTT C AAAAT AGTGTTTCCATTT G ACACTG AAAAAAT AG AATTTTGT G AT AATTT CTTTT AT ACTT ATG AAT CCAAT A CTT GTT AT CAT CATGTT ATTT C ATT CT AC AAAAATGTAAATT ATT ATCCTT CTT G G AT AT ATTT CAAAT CTG AG ATTG AT ATT AAT AGTAAAAAT ATGTT CTTTT CAAGT G AT ACT AAT AGTGT GT ATGTT AAAG AT AAT AACAACGTGT AT AAAT ACCAT AATTT CAAT AATT CT CTTG AAAAAT ACATCG AT AACAAACTCG ACTTGG ATGTCGT AATT GTGCCTG AT AGTT AT AG ACCAATGG AAATG AG ACT ACT ATT AAAGTT AGGT AT AA CATTGTATAGCGATTACAATTTTAATGGATGTGAGGATGATGAAGAACATATTTT CG AAATT ATG AAAAAT CAAT ATGTACCT CAT ATT ATCGGTCTG AATT ATTTTG AA AGTTT CATTGT AGTT ATTGTC AAT AATCC AAAT ATGTTG ACG AT AAC AACTG ACG ATGGT AAAATTTT CTTT AACATT CATG AT ATT ACTTTTT ACAAAAG ATTTT AT AAT GG AATCGTTT AT CTTG AT AATGGTTCGTT ATTTT AT CT CACAG AT AGTG AAATTT CAGATCAAAATGTATGGAAACTAACTGGATGTCAATTGTGTGAGCTAGCTGATTC T ACCAT AT AT AGTT ACCT ATTT AATTT ACCGGACAAAATTG ATG AAATTT ACT CT TCGTCTG AATTT ATTGTT CT AAAATT AATTGG AAACAAAT ATTTTT ATT AT CCGG TTG AAAATTTTG AT ACTGCT CAAG ATTTT AAG ACAAG AT GTGGGG AAATTT CATT G AAAAAT AATT CAGTT CTTG AACT CGTT AAT ACT AGTATT ATT AACAG ACAAT CT AAAAGTT AT CAT ACT ACAGT AT CT ATT AAT ATTG AT ACGG ATTGT ACT ACT CAT A ATT CTTT CG AG AG ATT GTTT AT CCTG ACACAAT CT CTT AGTT ATTCCGCAG AAT A TTCTATTCGAATTGTAGACGACAAAAATATTGGTTTTGGTGATGGGCCTAAAATT G AATTTTGTG AATCGGCT ATT ATGCAATTTT ATT AT AAGT ATTT AATTGCT CAT A ATTTTCACACAGAGTTTAATTTACAAGAATTTGCCAAACTGAAACCCACCGAAAT T AAAT ATTTGGG AT CAATGTTT CAT ATGGTT AT CTGTCAAAAT AATT CTT CGTT A CCG ATT AG ATT ACCT CT AGCTTTTGCTGTAG AAATTT ATGG AAAAG AACCCACAA TTG ATG AATTGG AAT ATTTTGCTTGTAATG AAG AT G AAACTGG ATT CAAACAT AT TT AT CCAGCCAAAT ACAAT CCCG AATT AGTT AAAG AATT CGGTT ATG AAT CTT AT G AACATTGTCT AAAAACTTTGTGT AAAT AT AATT ATG AAG ATG AT ACT G AT AAAA ATATCTTGACGAAAAAATATTGCGAGCAATTAGCTGCCGGTTTTAAAAGATACGG CAAT AT CAAG AACAT AAAACAAAT G AATTT ACCCACATTGG ACT ATT ACATTT CT GGCCCAT ACAAAATT AAT AG AACCAT ATT AATT AAT AAT CTTGTTTT ATCGGG AG GT AAGG AT AAAAAT AAT AATT ATTTGG AAATGTT CAAAG AATTT ATT AACT CTTT GT CTG AAAATG AATT AAAAAT CTTGCT AAAAAATTGG ACAGCAT CAACTTGTGT A AG ACC AG AT AAC AAAT AT AG AATT AT CATT ATTT CC AAAT CT AAAAACG CT AAAG CAGGT ATTCG ATTTGGT ACTTGTAATTT AG AAATT CAT ATCG ACG AAAAAAT GTT GG AT G AACAT AAT ATTG AT ACAGTCAAAG AGGTTTT AATT ACACCTGCT CAAGG A TTCAAAGATTAAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCT GCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTC TTG AGGGGTTTTTTG AG AT CT CG AT CCCGCG AAATT AAT ACG ACT CACT AT AGG GG AATTGTG AGCGG AT AACAATTCCCCACT AG AAAT AATTTTGTTT AACTTT AAG AAGGAGATATAGCAATGAACCGTCGTAACCGTAGCAACGACCTGAACCCGGAGC CGAGCATCGAAAACCCGAACAACCAGATTGCGGAGGAATTCCCGGGTAACAACA GCGTGTATAAAAGCGACGGCTACGTTGATCTGAAGAACAACGGTCGTCTGTTCC CGATCTGGATTCTGAAGAACTTTAAACAATACAAGCTGCCGGAGATCATTCGTAA AGAGAACGAAGACCCGTGCAACGTGCAGGTTAAGCTGGAGCTGCGTAAATATCA GGAATTCGTGGGCCAATACCTGAACCCGCAGGGTCCGTATACCAGCATCCTGCT GTACCATGGTCTGGGTAGCGGCAAGACCGCGAGCGCGATCAACCTGATGAACAT T CT GT ACAACT AT G ACAACGGCACCAACTTT ATCGTT CTG ATT AAAGCG AGCCT G CACAACGACCCGTGGATGCAGGACCTGAAGGAGTGGCTGGGTCGTGATCCGAGC GAACAGAACGTGGACAACGTTACCAAGCTGGATCGTTACAAAAACATCCACTTCG TGCACT ATG ACAGCCCGTTCGCGG AT AGCAGCTTT ATG AGCGTT ATT AAG ACCCT GGACCTGAGCAAACCGACCATGTACATCATTGATGAGGCGCACAACTTTATCCGT AACGTGTATAGCAACATTAACAGCAAACTGGGCAAGCGTGCGAAAGTTATCTAC GAGTACATCATGAAGGACAAGCGTGAAAACAAGAACACCCGTATCGTGCTGATT AGCGCGACCCCGGCGATCAACACCCCGTTCGAACTGGCGCTGATGTTTAACCTG CTGCGTCCGGGTATTTTCCCGAGCAGCGAGCTGGATTTCAACCGTACCTTTGTG ACCGAAAGCAGCTACCCGATCCTGAACCCGATGAAGAAAAACATGTTTGAGCGT CGTATCCTGGGCCTGGTTAGCTACTATATTGGTGCGACCCCGGACCTGTATGCG CGTCAAGAACTGAAGTACATCAACCTGCCGATGAGCGCGTACCAGTATGATATCT ACCGTATTTTCGAGAAACTGGAGGCGGAAATTCAAGAACGTGCGCGTCGTCGTG GCAAGCAGAGCCAACTGTACCGTACCTATACCCGTCAGGCGTGCAACTTCGTGT TTCCGTACGTTAACATGAACGTGAACGGTGAACTGCGTCCGCGTCCGGGCAAGT TCCGTCTGAGCGAAAAACTGGCGGACGATTTTAGCAAGGGCAAAAACCTGGACG TTCCGGATACCGAGAAAGAAATCCTGAACAAGTATACCAAAGCGATTGAGAACTA CCTGAACGAGACCGAACGTTATTTTCAGAACATCAACAAGAAAGACGCGGAGAA CGGT CGT ACCAT CATT AACG ACCTGG ATG AATT CAAG AAAGGCTTTGGTACCAA GTTCAACAGCTTTCTGCAGTACTATCAAAGCGAGGGTCCGCGTAGCAGCCTGCT GACCGAAATGTACAACTGCAGCCCGAAAATGCTGGCGATCGCGTTCATGACCTA TATTAGCCCGGGCAAGGTGATGATCTACAGCAACTATGTGGTTATGGAAGGCAT CGACGTTATGAAAATTTACTTTCGTCTGATCGGTTTCAACGATTTTACGATCGCG CGTGAGTACATGGGCTATTGCGAATACCACGGTCGTATCGACCCGAAGGATCGT GTGCGTATCAAGAACATGTTCAACGACAAGAACAACGTGTACGGCAACAAGTGC AAAGTTATCATGCTGAGCCCGAGCGCGACCGAGGGTATTCAACTGCTGGATATC CGTCAGGAGCACATTATGGAACCGTATTGGACCGAAGTTCGTATCCAGCAAGTG ATTGGCCGTGGTGTTCGTCAATGCAGCCACCGTGACCTGCCGATGAGCGAGCGT ATCGTGGATATTTACCGTTATAAGGTTATCAAACCGGAAAACCTGGACCCGGAC GATACCGTGCGTCAAAGCACCGACGAGTACGTTGAAGATCAGGCGAAGAGCAAA GCGAACCTGATTGAGAGCTTCCTGGGCGCTATGAAAGAAGCGGCGGTTGATTGC GAGCTGTTTAAGGAACACAACATGATGAGCCAGAGCTACTATTGCTTCAAATTTC CGGAGAGCGCGGTGACCAAGACCAACGTTGGCCCGGCGTACCGTGAAGACATCA AGGACGATGTGAAATATGATAGCGGTCTGAACAGCAAAAACAGCATCGTTGAGC GTATTCGTGTGGTTAAGGTGAACGCGGTTTACCAAATCAACACCGACAACAACAA CCCGGTGTATAGCAGCCCGACCAAGTACTGGTATAACAAGAAAACCGGCATGGT TTATGACTTCGAGACCCACTACCCGGTGGGTCAGGTTGAATTTATCGATAACCTG CCGAACAAGCTGGACAAAGATACCTACATCATGCGTATTGATGTGATCATTCCGA GCATT ACCGGTAGCGTT AACACCT AACACT AG AAAT AATTTTGTTT AACTTT AAG AAGG AG AT AT AGCG ATG ACCG ACATT AGCT ACT AT AACAACG AG AT CG AT AAAAT TCTGTGGAACATCCTGGGTGACGATTATTTCACCCAAGACGAATTTGACGATCTG GTGAACAGCGTTGCGAACACCATTTACCAGTATGACAACGAAGTGAGCATCGAT AAGCTGAAAGTGATCATCGAATTCGTTATCCTGAACAAGTTCAAGCTGTGCTACA TCTACGATAACGACAGCATCCTGAACCAAGTGAAATACGAGAAGAAAAGCGTTG GTAGCAAAACCATCGGCAAGAACAGCACCAACGACGATGAGGACGATGACGAAG ATATCGCGGTGATTAAGCTGAGCGATATTGAGGCGGGCGAAAACTGGTTCAAGA AAAGCCCGAAAATCAGCAGCAAGCAGTTTCAAAGCGTTGACAAAGTTGAGGTGG CGACCTACGAAGACCTGATCAGCCACAAGCACGATTACCCGAAAGAGATTTATAA GGAAAGCCACTACATCCGTCGTAACACCCGTCTGGATGTGATCAAGAAAATTCCG CAATTCGAGCAGAAGAGCAAAGAATGGCTGAAACAACGTACCGAGAGCCTGACC GCGACCGCGATTAGCGTGGTTTTTGATGAAGACCCGTATAAACACCCGATCGTT ATTCTGCTGGACAAGTGCGGTCGTGGCCTGCCGTTCGTGGAGAACAAATTTGTT CACCACGGTAACAAGTATG AACAAATCGGCACCAT GTT CT ACAGCTTT CGTAACA ACGTTGAGGTGGGTGAGTACGGCCTGCTGCAGCACAGCGGTCACAAGTTTATCG CGGCGAGCCCGGATGGCATCTGCAGCAAGAAAGCGAACACCGGTGGCCTGAGCA AACTGGTGGGTCGTCTGCTGGAGATTAAGTTCCCGTTTAGCCGTGAAATCAACA ACAGCGGTGATCTGGACGGCGATATCTGCCCGCACTACTATTTTCTGCAGGTGC AAACCCAGCTGTATGTTACCGAGATGGACGAATGCGACTTCCTGCAGTGCAAAA TTGACGAGTACGATAGCTGGGAAGACTTTGTGAAGGATAGCAACCCGATCGTTC CGGGTCTGAGCAAAACCACCAACCTGGAGAAGGGCTGCCTGATTCAGCTGAGCG ACAAAAACCTGATCGGCAGCGACGACAAGGAAAAATGCCTGTATAACAGCAAATA CATCTATCCGCCGAAGCTGCACATGACCAACGAGGAAATCGAGAAGTGGATTAG CAGCGAAATCATGAACTACCACAACAACGACCTGAGCGAGAACTATATGATTGAT CGTGTGATCTACTGGCGTCTGAGCCAAGTTACCTGCAACCTGATTAAGCTGAAC AAAGAAGCGTTCGAGGAAAAAATCCCGCTGCTGCAGCAATTCTGGGACTACGTT CTGTTTTATCGTCAGCACAGCGACAAGCTGGATAAACTGATTAAGTTTGTGGAG AAGGTTAAAGAAGATAACAGCGCGGAGATTTTCAGCTACATCAACGAAGACTTTC TGAGCCTGAACAAAGATAGCAAGTACGAGCCGCTGTATCAGGAAGAGACCGAAT GGCGTAAGAAATATAACCAAATCAAGGCGAAGAAAGCGCAGATGTACAAGAACA AGAGCTACAACAAGTACACCAAGTTCAGCAACCTCGAGCACCACCACCACCACCA CTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCAC CGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGG TTTTTTG SEQ . I D. N °38 : Gène R349 mod ifié avec des séq uences répétées d u gène de résista nce à la tétra cycl ine (SEQ I D N°39)

ATGG AATT AATT AGTCGTGTCTTT ACT CATGG AG AAAAT ATTTT ACTTGTT AGTT CTACAAATAAGTTATATATTATGGGTAATAATGAATATGGTTCATGTGGTTTCAA AAT AGGTACAG AT AAAACTT AT ATTG AAAGTCCAGTAT AT ATTG ACATT AAATT A G ATG ATG AT GATT CT GTT AAAG CGTTTT ATT CTTGTAATTT ATT C ACG ATG ATT C AT ACATCCAAAG G AAAAATTT AT CT AT C AAG AT CATTT ATTTGTG GTG G AG GT GA AATCGATGCATATGATAGTGAAAGTGATGTTGGAAGTGATGCTGAGTCTGATGC TG AGTCTG ATGCTG AAT CAG ATT CAG AAAAT CAT ACT CAAAAT AAT ACAAAT ACT CCCAT AAAT AAT AT CAC ACT AATT AATTT G G ATT CAT CAAAT AATTCC ACT CAAT C CGGCTCTTACCAGCCTAATGAATCCGGCTCTTACCAGCCCAATGAATCTGATCAA TCATGTAGTGATTTTGACTGTGGACCTCGATCCGGCTCTTACCAGCCTGAAGAA GTTTTTGTTG ATCGT AATG AT AAT AATT CAG AT AAT ATT G GT AATT CAAAT AGTA TCGGCTCTTACCAGCCATCTATGACTGAAAAAGCTGGAATAATTTTGTTAAACGA AATT AAAACCATGGTAG ATG AAATTTTGTCT CAAAAAAAT ATT AATT CTGTTGG A ATTAACGATATTGTTATTCGTCCAAGCGGACAGTATGTGAGTAATATGGGATATA TT ACAG AAT CAGGTAGTGT AT CATTT CAT ACCAAT AAAAATGGTTT CTT ATT ATT CAAGTCCAATGTT C ATG AAATCCTTTTCGTTG AAG AAATGTTT ATGT ACT CT AAA AAT AATTTT ATTT ATTTGGCCAT ACCATTT AAAAAAT ACCAGGCATCT CT AAGAG AT ATTGCTCCTTTT C AT AC AATT AAT AAAACAAAAAAT G GT ATT AAAT G G AAGT A TTT CAAAAT AGTGTTT CCATTTGACACTG AAAAAAT AG AATTTTGT G AT AATTT C TTTT AT ACTT ATG AAT CCAAT ACTTGTT AT CAT CATGTT ATTT CATT CT ACAAAAA TGT AAATT ATT ATCCTT CTTGG AT AT ATTT CAAAT CTG AG ATTG AT ATT AAT AGT AAAAAT ATGTT CTTTT CAAGTG AT ACT AAT AGTGTGT ATGTT AAAG AT AAT AACA ACGT GT AT AAAT ACCAT AATTT CAAT AATT CT CTTG AAAAAT ACATCG AT AACAA ACTCGACTTGGATGTCGTAATTGTGCCTGATAGTTATAGACCAATGGAAATGAG ACT ACT ATT AAAGTT AGGT AT AACATT GT AT AGCG ATT ACAATTTT AATGG ATGT GAGGATGATGAAGAACATATTTTCGAAATTATGAAAAATCAATATGTACCTCATA TT ATCGGTCTG AATT ATTTTG AAAGTTT CATTGT AGTT ATTGTCAAT AATCCAAA T ATGTTG ACG AT AACAACTG ACG ATGGTAAAATTTT CTTT AACATT CATG AT ATT ACTTTTTACAAAAGATTTTATAATGGAATCGTTTATCTTGATAATGGTTCGTTAT TTTATCTCACAGATAGTGAAATTTCAGATCAAAATGTATGGAAACTAACTGGATG T CAATTGTGTG AG CT AG CT GATT CT ACCAT AT AT AGTT ACCT ATTT AATTT ACCG G ACAAAATTG ATG AAATTT ACT CTTCGTCTG AATTT ATTGTT CT AAAATT AATT G G AAAC AAAT ATTTTT ATT AT CCG GTTG AAAATTTTG AT ACT G CT C AAG ATTTT AA G ACAAGATGTGGGG AAATTT CATTG AAAAAT AATT CAGTT CTTG AACT CGTT AAT ACT AGTATT ATT AACAG ACAAT CT AAAAGTT AT CAT ACT ACAGT AT CT ATT AAT AT TGATACGGATTGTACTACTCATAATTCTTTCGAGAGATTGTTTATCCTGACACAA T CT CTT AGTT ATTCCG CAG AAT ATT CT ATTCGAATTGTAG ACG AC AAAAAT ATT G GTTTTGGTGATGGGCCTAAAATTGAATTTTGTGAATCGGCTATTATGCAATTTTA TT AT AAGTATTT AATTGCT CAT AATTTT CACACAG AGTTT AATTT ACAAG AATTT GCCAAACTGAAACCCACCG AAATT AAAT ATTTGGG AT CAATGTTT CAT ATGGTT A T CTGTCAAAAT AATT CTTCGTT ACCG ATT AG ATT ACCT CT AGCTTTTGCTGTAG A AATTT ATGG AAAAG AACCCACAATTG ATG AATTGG AAT ATTTTGCTT GT AATG AA G ATG AAACT G G ATT C AAAC AT ATTT ATCC AG CCAAAT AC AATCCCG AATT AGTT A AAG AATT CGGTT ATG AAT CTT ATG AACATTGTCT AAAAACTTTGT GT AAAT AT AA TTATGAAGATGATACTGATAAAAATATCTTGACGAAAAAATATTGCGAGCAATTA GCTGCCGGTTTT AAAAG AT ACGGCAAT ATCAAGAACAT AAAACAAATG AATTT AC CC AC ATT G G ACT ATT ACATTT CTG G CCC AT AC AAAATT AAT AG AACC AT ATT AAT T AAT AAT CTTG TTTT ATCG G G AG GT AAG G AT AAAAAT AAT AATT ATTT G G AAAT G TT CAAAG AATTT ATT AACT CTTTGTCTG AAAATG AATT AAAAAT CTTGCT AAAAA ATTGG ACAGCAT CAACTTGTGT AAG ACCAG AT AACAAAT AT AG AATT AT CATT AT TT CCAAAT CT AAAAACG CT AAAG C AG GTATT CG ATTT G GTACTTGTAATTT AG AA ATTCATATCGACGAAAAAATGTTGGATGAACATAATATTGATACAGTCAAAGAGG TTTT AATT AC ACCTGCT C AAG G ATT CAAAG ATT AA

SEQ . I D. N °39 : séq uence spécifiq ue de 15 n u cléotides d u gène de résista nce à la tétracycl i ne

CGGCTCTTACCAGCC SEQ . I D . N °40 : vecteu r PP37 CCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGG AGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGT CGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGG GCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTT TTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGAT AACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACC GAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTATTTT CTCCTTACGCATCTGTGCGGTATTTCACACCGCATATATGGTGCACTCTCAGTAC AATCTGCTCTGATGCCGCATAGTTAAGCCAGTATACACTCCGCTATCGCTACGTG ACTGGGTCATGGCTGCGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGAC GGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGA GCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGGCAGCTGC GGTAAAGCTCATCAGCGTGGTCGTGAAGCGATTCACAGATGTCTGCCTGTTCAT CCGCGTCCAGCTCGTTGAGTTTCTCCAGAAGCGTTAATGTCTGGCTTCTGATAAA GCGGGCCATGTTAAGGGCGGTTTTTTCCTGTTTGGTCACTGATGCCTCCGTGTA AGGGGGATTTCTGTTCATGGGGGTAATGATACCGATGAAACGAGAGAGGATGCT CACGATACGGGTTACTGATGATGAACATGCCCGGTTACTGGAACGTTGTGAGGG TAAACAACTGGCGGTATGGATGCGGCGGGACCAGAGAAAAATCACTCAGGGTCA ATGCCAGCGCTTCGTTAATACAGATGTAGGTGTTCCACAGGGTAGCCAGCAGCA TCCTGCGATGCAGATCCGGAACATAATGGTGCAGGGCGCTGACTTCCGCGTTTC CAGACTTTACGAAACACGGAAACCGAAGACCATTCATGTTGTTGCTCAGGTCGCA GACGTTTTGCAGCAGCAGTCGCTTCACGTTCGCTCGCGTATCGGTGATTCATTC TGCTAACCAGTAAGGCAACCCCGCCAGCCTAGCCGGGTCCTCAACGACAGGAGC ACGATCATGCGCACCCGTGGGGCCGCCATGCCGGCGATAATGGCCTGCTTCTCG CCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAA GATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCG GTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCAT GATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCG GAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGC CTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAG TCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGA GGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGG CAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTC CACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGG GATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCA CCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGA TCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATG GTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCT GAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCG AGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGA CCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTT GATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGC AGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCA CTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCG CTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATT TAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAA CGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAA TGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAAC GTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATA CTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTC TCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATG GTG TCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAG TAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGA GATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAA ACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTC GGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGAT GCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACT AT AGGGG AATTGT G AGCGG AT AACAATT CCCCT CT AG AAAT AATTTTGTTT AACT TTAAGAAGGAGATATAGATATGGAATTAATTAGTCGTGTCTTTACTCATGGAGAA AAT ATTTT ACTTGTT AGTT CT AC AAAT AAGTT AT AT ATT ATG G GT AAT AATG AAT ATG GTT C ATGTG GTTT C AAAAT AG GT AC AG AT AAAACTT AT ATTG AAAGTCC AGT AT AT ATTG ACATT AAATT AG ATG ATG AT GATT CTGTT AAAGCGTTTT ATT CTTGT AATTT ATT CACG AT GATT CAT ACATCCAAAGG AAAAATTT AT CT AT CAAG AT CAT TTATTTGTGGTGGAGGTGAAATCGATGCATATGATAGTGAAAGTGATGTTGGAA GTGATGCTGAGTCTGATGCTGAGTCTGATGCTGAATCAGATTCAGAAAATCATA CT CAAAAT AAT ACAAAT ACTCCCAT AAAT AAT AT CACACT AATT AATTTGG ATT CA T CAAAT AATTCCACT C AAT CCG G CT CTT ACC AGCCT AATG AAT CCG G CT CTT ACC AGCCCAATGAATCTGATCAATCATGTAGTGATTTTGACTGTGGACCTCGATCCGG CT CTT ACC AG CCTG AAG AAGTTTTTGTTG ATCGT AAT G AT AAT AATT CAG AT AAT ATTGGT AATT CAAAT AGTATCGGCT CTT ACCAGCCAT CT ATG ACTG AAAAAGCT G G AAT AATTTTGTT AAACG AAATT AAAACCATGGT AG ATG AAATTTTGTCT CAAAA AAATATTAATTCTGTTGGAATTAACGATATTGTTATTCGTCCAAGCGGACAGTAT GTG AGT AAT ATGGG AT AT ATT ACAG AAT CAGGTAGTGTAT CATTT CAT ACCAAT A AAAATGGTTT CTT ATT ATT CAAGTCCAATGTT CATG AAATCCTTTTCGTTG AAG A AATGTTT ATGT ACT CT AAAAAT AATTTT ATTT ATTTGG CCAT ACC ATTT AAAAAAT ACCAG G CAT CT CT AAG AG AT ATTGCTCCTTTT CAT AC AATT AAT AAAAC AAAAAA TGGTATTAAATGGAAGTATTTCAAAATAGTGTTTCCATTTGACACTGAAAAAATA G AATTTTGTG AT AATTT CTTTT AT ACTT ATG AATCCAAT ACTTGTT AT CAT CAT G TT ATTT C ATT CT AC AAAAATGTAAATT ATT ATCCTT CTT G GATAT ATTT CAAAT CT GAGATTGATATTAATAGTAAAAATATGTTCTTTTCAAGTGATACTAATAGTGTGT ATGTT AAAG AT AAT AACAACGTGT AT AAAT ACCAT AATTT CAAT AATT CT CTTG A AAAATACATCGATAACAAACTCGACTTGGATGTCGTAATTGTGCCTGATAGTTAT AG ACCAATGG AAATG AG ACT ACT ATT AAAGTT AGGT AT AACATTGT AT AGCG ATT ACAATTTT AATGG ATGTG AGG ATG ATG AAG AACAT ATTTTCG AAATT ATG AAAAA T CAAT ATGT ACCT CAT ATT ATCGGTCTG AATT ATTTTG AAAGTTT CATTGTAGTT ATTGTCAAT AATCCAAAT ATGTTG ACG AT AACAACT G ACG ATGGT AAAATTTT CT TT AACATT CATG AT ATT ACTTTTT ACAAAAG ATTTT AT AATGG AATCGTTT AT CTT G AT AATGGTTCGTT ATTTT AT CT CACAG AT AGTG AAATTT CAG AT CAAAATGTAT GGAAACTAACTGGATGTCAATTGTGTGAGCTAGCTGATTCTACCATATATAGTTA CCT ATTT AATTT ACCGG ACAAAATT G ATG AAATTT ACT CTTCGTCTG AATTT ATT GTT CT AAAATT AATTGG AAACAAAT ATTTTT ATT ATCCGGTTG AAAATTTTG AT A CT G CT CAAG ATTTT AAG AC AAG ATGTG G G G AAATTT C ATTG AAAAAT AATT CAGT T CTTG AACT CGTT AAT ACT AGTATT ATT AACAG ACAAT CT AAAAGTT AT CAT ACT AC AGT AT CT ATT AAT ATTG AT ACGG ATT GT ACT ACT CAT AATT CTTTCG AG AG AT TGTTT AT CCTG ACACAAT CT CTT AGTT ATT CCGCAG AAT ATT CT ATTCG AATTGT AG ACG ACAAAAATATTGGTTTTGGTG ATGGGCCTAAAATTG AATTTTGTG AATCG GCT ATT ATGCAATTTT ATT AT AAGT ATTT AATTGCT CAT AATTTT CACACAG AGT TT AATTT ACAAG AATTTGCCAAACT G AAACCCACCG AAATT AAAT ATTTGGG AT C AATGTTT CAT ATGGTT AT CTGTC AAAAT AATT CTT CGTT ACCG ATT AG ATT ACCT CT AGCTTTTGCTGTAG AAATTT ATGG AAAAG AACCCACAATTG AT G AATTGG AAT ATTTTGCTTGTAATG AAG AT G AAACTGG ATT CAAACAT ATTT ATCCAGCCAAAT A CAAT CCCG AATT AGTT AAAG AATTCG GTT ATG AAT CTT ATG AAC ATT GTCT AAAA ACTTTGT GT AAAT AT AATT ATG AAG AT G AT ACTG AT AAAAAT AT CTTG ACG AAAA AAT ATTGCG AGCAATT AGCTGCCGGTTTT AAAAG AT ACGGCAAT AT CAAG AACAT AAAACAAATG AATTT ACCC ACATT G G ACT ATT AC ATTT CT G GCCCAT AC AAAATT AAT AG AACCAT ATT AATT AAT AAT CTTGTTTT AT CGGG AGGT AAGG AT AAAAAT A AT AATT ATTTGG AAATGTT CAAAG AATTT ATT AACT CTTTGT CTG AAAATG AATT AAAAAT CTTGCT AAAAAATTGG ACAGCAT CAACTTGTGTAAG ACCAG AT AACAAA T AT AG AATT AT C ATT ATTTCCAAAT CT AAAAACGCT AAAG CAG GT ATTCG ATTT G GT ACTT GT AATTT AG AAATT CAT ATCG ACG AAAAAATGTTGG ATG AACAT AAT AT TG AT ACAGTCAAAG AGGTTTT AATT ACACCTGCT CAAGG ATT CAAAG ATT AAG AT CCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAG CAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG AGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGA T AACAATT CCCCACT AG AAAT AATTTTGTTT AACTTT AAG AAGG AG AT AT AGCAA TGAACCGTCGTAACCGTAGCAACGACCTGAACCCGGAGCCGAGCATCGAAAACC CGAACAACCAGATTGCGGAGGAATTCCCGGGTAACAACAGCGTGTATAAAAGCG ACGGCTACGTTGATCTGAAGAACAACGGTCGTCTGTTCCCGATCTGGATTCTGA AGAACTTTAAACAATACAAGCTGCCGGAGATCATTCGTAAAGAGAACGAAGACCC GTGCAACGTGCAGGTTAAGCTGGAGCTGCGTAAATATCAGGAATTCGTGGGCCA ATACCTGAACCCGCAGGGTCCGTATACCAGCATCCTGCTGTACCATGGTCTGGG TAGCGGCAAGACCGCGAGCGCGATCAACCTGATGAACATTCTGTACAACTATGA CAACGGCACCAACTTTATCGTTCTGATTAAAGCGAGCCTGCACAACGACCCGTGG ATGCAGGACCTGAAGGAGTGGCTGGGTCGTGATCCGAGCGAACAGAACGTGGAC AACGTTACCAAGCTGGATCGTTACAAAAACATCCACTTCGTGCACTATGACAGCC CGTTCGCGGATAGCAGCTTTATGAGCGTTATTAAGACCCTGGACCTGAGCAAAC CGACCATGTACATCATTGATGAGGCGCACAACTTTATCCGTAACGTGTATAGCAA CATT AACAGCAAACTGGGCAAGCGTGCG AAAGTT AT CT ACG AGT ACAT CAT G AA GGACAAGCGTGAAAACAAGAACACCCGTATCGTGCTGATTAGCGCGACCCCGGC GATCAACACCCCGTTCGAACTGGCGCTGATGTTTAACCTGCTGCGTCCGGGTAT TTTCCCGAGCAGCGAGCTGGATTTCAACCGTACCTTTGTGACCGAAAGCAG CTA CCCG ATCCTGAACCCG ATG AAG AAAAACATGTTTGAGCGTCGTATCCTGGGCCT GGTTAGCTACTATATTGGTGCGACCCCGGACCTGTATGCGCGTCAAGAACTGAA GT ACAT CAACCTGCCG ATG AGCGCGTACCAGT ATG AT AT CT ACCGTATTTTCG AG AAACTGG AGGCGGAAATTCAAGAACGTGCGCGTCGTCGTGGCAAGCAGAGCCAA CTGTACCGTACCTATACCCGTCAGGCGTGCAACTTCGTGTTTCCGTACGTTAACA TGAACGTGAACGGTGAACTGCGTCCGCGTCCGGGCAAGTTCCGTCTGAGCGAAA AACTGGCGGACGATTTTAGCAAGGGCAAAAACCTGGACGTTCCGGATACCGAGA AAGAAATCCTGAACAAGTATACCAAAGCGATTGAGAACTACCTGAACGAGACCGA ACGTTATTTTCAGAACATCAACAAGAAAGACGCGGAGAACGGTCGTACCATCATT AACG ACCTGG ATG AATT CAAG AAAGGCTTTGGTACCAAGTTCAACAGCTTTCTGC AGTACTATCAAAGCGAGGGTCCGCGTAGCAGCCTGCTGACCGAAATGTACAACT GCAGCCCGAAAATGCTGGCGATCGCGTTCATGACCTATATTAGCCCGGGCAAGG TG ATG AT CT ACAGCAACT ATGTGGTT ATGG AAGGCATCG ACGTT ATG AAAATTT A CTTTCGTCTGATCGGTTTCAACGATTTTACGATCGCGCGTGAGTACATGGGCTAT TGCGAATACCACGGTCGTATCGACCCGAAGGATCGTGTGCGTATCAAGAACATG TTCAACGACAAGAACAACGTGTACGGCAACAAGTGCAAAGTTATCATGCTGAGCC CGAGCGCGACCGAGGGTATTCAACTGCTGGATATCCGTCAGGAGCACATTATGG AACCGTATTGGACCGAAGTTCGTATCCAGCAAGTGATTGGCCGTGGTGTTCGTC AATGCAGCCACCGTGACCTGCCGATGAGCGAGCGTATCGTGGATATTTACCGTT ATAAGGTTATCAAACCGGAAAACCTGGACCCGGACGATACCGTGCGTCAAAGCA CCGACGAGTACGTTGAAGATCAGGCGAAGAGCAAAGCGAACCTGATTGAGAGCT TCCTGGGCGCTATGAAAGAAGCGGCGGTTGATTGCGAGCTGTTTAAGGAACACA ACATGATGAGCCAGAGCTACTATTGCTTCAAATTTCCGGAGAGCGCGGTGACCA AGACCAACGTTGGCCCGGCGTACCGTGAAGACATCAAGGACGATGTGAAATATG ATAGCGGTCTGAACAGCAAAAACAGCATCGTTGAGCGTATTCGTGTGGTTAAGG TGAACGCGGTTTACCAAATCAACACCGACAACAACAACCCGGTGTATAGCAGCCC GACCAAGTACTGGTATAACAAGAAAACCGGCATGGTTTATGACTTCGAGACCCAC TACCCGGTGGGTCAGGTTGAATTTATCGATAACCTGCCGAACAAGCTGGACAAA GATACCTACATCATGCGTATTGATGTGATCATTCCGAGCATTACCGGTAGCGTTA ACACCT AACACT AG AAAT AATTTTGTTT AACTTT AAG AAGG AG AT AT AGCG ATG A CCG ACATT AGCT ACT AT AACAACG AG ATCG AT AAAATT CT GTGG AACATCCTGGG TGACGATTATTTCACCCAAGACGAATTTGACGATCTGGTGAACAGCGTTGCGAAC ACCATTT ACCAGT ATG ACAACG AAGT G AGCATCG AT AAGCT G AAAGTG AT CAT CG AATTCGTTATCCTGAACAAGTTCAAGCTGTGCTACATCTACGATAACGACAGCAT CCTGAACCAAGTGAAATACGAGAAGAAAAGCGTTGGTAGCAAAACCATCGGCAA GAACAGCACCAACGACGATGAGGACGATGACGAAGATATCGCGGTGATTAAGCT GAGCGATATTGAGGCGGGCGAAAACTGGTTCAAGAAAAGCCCGAAAATCAGCAG CAAGCAGTTTCAAAGCGTTGACAAAGTTGAGGTGGCGACCTACGAAGACCTGAT CAGCCACAAGCACG ATT ACCCG AAAG AG ATTT AT AAGG AAAGCCACT ACAT CCGT CGTAACACCCGTCTGGATGTGATCAAGAAAATTCCGCAATTCGAGCAGAAGAGC AAAGAATGGCTGAAACAACGTACCGAGAGCCTGACCGCGACCGCGATTAGCGTG GTTTTTGATGAAGACCCGTATAAACACCCGATCGTTATTCTGCTGGACAAGTGCG GTCGTGGCCTGCCGTTCGTGGAGAACAAATTTGTTCACCACGGTAACAAGTATG AACAAATCGGCACCATGTTCTACAGCTTTCGTAACAACGTTGAGGTGGGTGAGT ACGGCCTGCTGCAGCACAGCGGTCACAAGTTTATCGCGGCGAGCCCGGATGGCA TCTGCAGCAAGAAAGCGAACACCGGTGGCCTGAGCAAACTGGTGGGTCGTCTGC TGGAGATTAAGTTCCCGTTTAGCCGTGAAATCAACAACAGCGGTGATCTGGACG GCG AT AT CTGCCCGCACT ACT ATTTT CTGCAGGTGCAAACCCAGCT GT ATGTT AC CGAGATGGACGAATGCGACTTCCTGCAGTGCAAAATTGACGAGTACGATAGCTG GGAAGACTTTGTGAAGGATAGCAACCCGATCGTTCCGGGTCTGAGCAAAACCAC CAACCTGGAGAAGGGCTGCCTGATTCAGCTGAGCGACAAAAACCTGATCGGCAG CG ACG ACAAGG AAAAATGCCT GT AT AACAGCAAAT ACAT CT ATCCGCCG AAGCT G CACAT G ACCAACG AGG AAAT CG AG AAGTGG ATT AGCAGCG AAAT CATG AACT AC CACAACAACGACCTGAGCGAGAACTATATGATTGATCGTGTGATCTACTGGCGT CTGAGCCAAGTTACCTGCAACCTGATTAAGCTGAACAAAGAAGCGTTCGAGGAA AAAATCCCGCTGCTGCAGCAATTCTGGGACTACGTTCTGTTTTATCGTCAGCACA GCG ACAAGCTGG AT AAACTG ATT AAGTTTGTGG AG AAGGTT AAAG AAG AT AACA GCGCGGAGATTTTCAGCTACATCAACGAAGACTTTCTGAGCCTGAACAAAGATA GCAAGTACGAGCCGCTGTATCAGGAAGAGACCGAATGGCGTAAGAAATATAACC AAATCAAGGCGAAGAAAGCGCAGATGTACAAGAACAAGAGCTACAACAAGTACA CCAAGTTCAGCAACCTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAA CAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGC ATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGG AACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCG GCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCG CCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCC GTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGC ACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGC CCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGG ACT CTTGTTCCAAACT G G AACAACACT CAACCCT ATCTCG GTCT ATT CTTTT G AT TTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAAC AAAAATTT AACGCG AATTTT AACAAAAT ATT AACGTTT ACAATTT CAGGTGGCAC TTTTCGGGG AAATGTGCGCGG AACCCCT ATTTGTTT ATTTTT CT AAAT ACATT CA AAT ATGTAT CCG CT C ATG AG AC AAT AACCCT G AT AAATGCTT C AAT AAT ATTG AA AAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGC GGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGAT GCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGC GGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTT TTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGC AACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGT CACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGC CATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGA CCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTT GATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACC ACGATGCCTGCAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTAC TTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTG CAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAAT CTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATG GTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGG ATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGT AACTGTCAG ACCAAGTTT ACT CAT AT AT ACTTT AG ATTG ATTT AAAACTT CATTT TT AATTT AAAAGG AT CT AGGTG AAG ATCCTTTTTG AT AAT CT CATG ACCAAAAT C CCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAG G AT CTT CTTG AG AT CCTTTTTTT CTGCGCGTAAT CTGCTGCTTGCAAACAAAAAA ACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTT CCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTG T AGCCGTAGTT AGGCCACCACTTCAAG AACT CTGTAGCACCGCCT ACAT ACCTCG CTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTA CCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAA CGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGA GATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTT

Références Bibliographiques

1. Barrangou R, Marraffini LA. CRISPR-Cas Systems: prokaryotes upgrade to adaptive immunity. Mol Cell 2014 ; 54 : 234-244.

2. Desnues C, La SB, Yutin N, et al. Provirophages and transpovirons as the diverse mobilome of giant viruses. Proc Natl Acad Sci USA 2012 ; 109 : 18078-18083.

3. Filee J, Chandler M. Gene exchange and the origin of giant viruses. Intervirology 2010 ; 53 : 354-361.

4. Forterre P. Giant viruses: conflicts in revisiting the virus concept.

Intervirology 2010 ; 53 : 362-378.

5. Gaia M, Benamar S, Boughalmi M, et al. Zamilon, a novel virophage with Mimiviridae host specificity. PLoS One 2014 ; 9 : e94923.

6. La Scola B, Audic S, Robert C, et al. A giant virus in amoebae.

Science 2003 ; 299 : 2033.

7. La Scola B, Desnues C, Pagnier I, Robert C, Barrassi L, et al.

(2008) The virophage as a unique parasite of the giant Mimivirus, Nature 2008 ; 455 : 100-104.

8. Levasseur A, Bekliz M, Chabrière E, et al. MIMIVIRE is a defence System in Mimivirus that confers résistance to virophage. Nature 2016 ; 531 : 249-252.

9. Makarova KS, Wolf YI, Koonin EV. Comparative genomics of defense Systems in archaea and bacteria. Nucleic Acids Res 2013

; 41 : 4360-4377. Raoult D. How the virophage compels the need to readdress the classification of microbes. Virology 2015 ; 477 : 119-124

Sharma V, Colson P, Pontarotti P, Raoult D. Mimivirus inaugurated in the 21st century the beginning of a reclassification of viruses. Curr Opin Microbiol 2016 ; 31 : 16-24.

J. M. Claverie and C. Abergel, "CRISPR-Cas-like System in giant viruses : why MIMIVIRE is not likely to be an adaptive immune System," Virol. Sin. 31(3), 193 (2016).

Yutin N, Raoult D, Koonin EV. Virophages, polintons, and transpovirons: a complex evolutionary network of diverse selfish genetic éléments with different reproduction strategies. Virol J 2013 ; 10 : 158. [CrossRef] [PubMed] [Google Scholar]

Casane D, Laurenti P. Le cas CRISPR, mutations « ready- made » et évolution lamarckienne d'un système immunitaire adaptatif. Med Sci (Paris) 2016 ; 32 : 640-645. [CrossRef] [EDP

Sciences] [PubMed] [Google Scholar]

Tremblay JP. CRISPR, un système qui permet de corriger ou de modifier l'expression de gènes responsables de maladies héréditaires. Med Sci (Paris) 2015 ; 31 : 1014-1022. [CrossRef] [EDP Sciences] [PubMed] [Google Scholar]

La Gilgenkrantz H . révolution des CRISPR est en marche. Med Sci (Paris) 2014 ; 30 : 1066-1069. [CrossRef] [EDP Sciences] [PubMed] [Google Scholar] Chao Dou et al « structural and mechanistic analyses reveal a unique cas4-like proetin in the Mimivirus virophage résistant elemnt System", ISCIENCE (2018), 10.1016/j. isci 2018.04.01.

Petrov A, Wu T, Puglisi EV, Purification d'ARN de Puglisi JD.

RNA purification by préparative polyacrylamide gel electrophoresis, Methods Enzymol 2013, 530 : 315- 30.