Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR PRODUCING DNA VECTORS FROM MOLECULAR BRICKS CONTAINING SEQUENCES OF INTEREST
Document Type and Number:
WIPO Patent Application WO/2016/128679
Kind Code:
A1
Abstract:
The present invention relates to a method for producing, in one step, "made to measure" double-stranded DNA vectors from molecular bricks comprising sequences of interest in the presence of a one and only type IIs restriction enzyme.

Inventors:
DE BETTIGNIES GEOFFROY (FR)
DE BETTIGNIES CARINE (FR)
JULIEN SYLVAIN (FR)
Application Number:
PCT/FR2016/050305
Publication Date:
August 18, 2016
Filing Date:
February 10, 2016
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
UNIV DES SCIENCES ET TECH DE LILLE-LILLE 1 (FR)
CENTRE NAT RECH SCIENT (FR)
International Classes:
C12N15/10; C12N15/64; C12N15/66
Domestic Patent References:
WO2008095927A12008-08-14
WO2008095927A12008-08-14
Foreign References:
EP2395087A12011-12-14
US20140038240A12014-02-06
Other References:
ERNST WEBER ET AL: "A Modular Cloning System for Standardized Assembly of Multigene Constructs", PLOS ONE, vol. 6, no. 2, 18 February 2011 (2011-02-18), pages e16765, XP055110994, ISSN: 1932-6203, DOI: 10.1371/journal.pone.0016765
WERNER S ET AL: "Fast track assembly of multigene constructs using Golden Gate cloning and the MoClo system", BIOENGINEERED BUGS, LANDES BIOSCIENCE, US, vol. 3, no. 1, 1 January 2012 (2012-01-01), pages 38 - 43, XP002722591, ISSN: 1949-1018, [retrieved on 20120101], DOI: 10.1371/JOURNAL.PONE.0016765
WANG T. ET AL., APPL MICROBIOL BIOTECHNOL, vol. 93, 2012, pages 1853 - 1863
WEBER E., PLOS ONE, vol. 6, no. 2, 2011, pages E16765
SARRION-PERDIGONES A., PLOS ONE, vol. 6, no. 7, 2012, pages E21622
ENGLER ET AL., PLOS ONE, vol. 4, 2009, pages E5553
LIPPOW ET AL., NUCLEIC ACIDES RES, vol. 37, 2009, pages 3061 - 3073
ZHIJUN WANG A; LI JIN A,B; ZHENGHONG YUAN C; GRZEGORZ WE.GRZYN D; ALICJA WE.GRZYN: "Classification of plasmid vectors using replication origin, selection marker and promoter as criteria", PLASMID, vol. 61, 2009, pages 47 - 51
CORMACK, B.: "Directed Mutagenesis Using the Polymerase Chain Reaction", CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 37, 2001, pages 8.5.1 - 8.5.10
PROBER JM; TRAINOR GL; DAM RJ; HOBBS FW; ROBERTSON CW; ZAGURSKY RJ ET AL.: "A system for rapid DNA sequencing with fluorescent chain-terminating dideoxynucleotides", SCIENCE, vol. 238, no. 4825, 16 October 1987 (1987-10-16), pages 336 - 4
LANGER-SAFER PR; LEVINE M; WARD DC: "Immunological method for mapping genes on Drosophila polytene chromosomes", PROC. NATL. ACAD. SCI. U.S.A., vol. 79, no. 14, July 1982 (1982-07-01), pages 4381 - 5
PRIGODICH, A. E.; RANDERIA, P. S.; BRILEY, W.; KIM, N.; DANIEL, W. L.; GILJOHANN, D. A.; MIRKIN, C. A.: "Multiplexed Nanoflares: mRNA Detection in Live Cells", ANAL. CHEM., vol. 84, 2012, pages 2062 - 2066
Attorney, Agent or Firm:
GROSSET-FOURNIER, Chantal et al. (FR)
Download PDF:
Claims:
REVENDICATIONS

1. Procédé de fabrication d'un vecteur circulaire d'ADN double brin comportant au moins deux séquences d'intérêt, comprenant :

a) une étape de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, en présence d'une seule enzyme de restriction, ladite seule enzyme de restriction étant une enzyme de restriction de type Ils,

chaque brique moléculaire étant une molécule d'ADN linéaire double brin7 et contenant :

(i) une séquence d'intérêt dépourvue de site de reconnaissance spécifique de la susdite enzyme de restriction de type Ils et comprenant au moins une unité, ladite unité étant une unité fonctionnelle ou une unité non fonctionnelle, ladite unité comprenant au moins un module, ledit module étant un module fonctionnel ou un module non fonctionnel,

(ii) deux adaptateurs d'ADN double brin, flanqués en amont et en aval de ladite séquence d'intérêt, chaque adaptateur d'ADN double brin consistant en une séquence d'au moins 12 nucléotides, laquelle contient:

un seul et unique site de reconnaissance de la susdite enzyme de restriction de type Ils,

le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur en amont de ladite séquence d'intérêt et le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur en aval de ladite séquence spécifique étant convergents, laquelle étape conduit :

- à l'élimination par coupure des sites de reconnaissance de l'enzyme de restriction de type Ils utilisée,

- la formation d'une suture monobrin cohésive d'au moins 2 nucléotides à chacune des extrémités de ladite séquence d'intérêt,

ladite suture monobrin cohésive d'au moins 2 nucléotides en amont d'une des au moins deux séquences d'intérêt étant complémentaire à ladite suture monobrin cohésive d'au moins 2 nucléotides en aval d'une autre séquence d'intérêt,

-à l'appariement par complémentarité nucléotidique des susdites sutures monobrins cohésives d'au moins 2 nucléotides et

- au positionnement des séquences d'intérêt, de façon contigue les unes aux autres, selon un ordre et un sens unique et déterminé, b) une étape de ligation des susdites sutures monobrins cohésives d'au moins 2 nucléotides, pour obtenir un vecteur circulaire d'ADN double brin.

2. Procédé selon la revendication précédente comprenant :

a) une étape de mise en contact simultanée de n briques moléculaires, chaque brique moléculaire étant une molécule d'ADN linéaire double brin, et contenant :

(i) Une séquence d'intérêt (Sl)i dépourvue de site de reconnaissance spécifique de la susdite enzyme de restriction de type Ils et comprenant au moins une unité, ladite unité étant une unité fonctionnelle ou une unité non fonctionnelle, ladite unité comprenant au moins un module, ledit module étant un module fonctionnel ou un module non fonctionnel, et

(ii) deux adaptateurs d'ADN double brin A(i-l,i) et A(i,i+1), différents l'un de l'autre, flanqués respectivement en amont et en aval de ladite séquence d'intérêt (Sl)i, chaque adaptateur d'ADN double brin consistant en une séquence d'au moins 12 nucléotides, la séquence d'au moins 12 nucléotides de l'adaptateur d'ADN double brin A(i-l,i) contenant

un seul et unique site de reconnaissance de la sus-dite enzyme de restriction de type Ils, et une suture d'au moins 2 nucléotides, s(i-l, i) en aval du site de reconnaissance de ladite enzyme de restriction de type Ils, la séquence d'au moins 12 nucléotides de l'adaptateur d'ADN double brin A(i,i+1) contenant

un seul et unique site de reconnaissance de la susdite enzyme de restriction de type Ils, et une suture d'au moins 2 nucléotides, s(i,i+l), en amont du site de reconnaissance de ladite enzyme de restriction de type Ils, le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur d'ADN double brin A(i-l,i) en amont de ladite séquence d'intérêt et le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur d'ADN double brin A(i,i+1) en aval de ladite séquence spécifique étant convergents,

(Sl)l étant la séquence d'intérêt (Sl)i dans laquelle i=l

(Sl)n étant la séquence d'intérêt (Sl)i dans laquelle i=n

n étant un nombre entier allant de 2 à 100, i allant de 1 à n, i étant différent de n quand i=l, et quand i=n alors i+1 est 1, et lorsque i=l, alors i-l=n, de sorte que la suture monobrin cohésive d'au moins 2 nucléotides générée en amont de (Sl)l, si-1, est la séquence complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides générée en aval de (Sl)n, sn +1,

et lorsque i=n alors la suture monobrin cohésive d'au moins 2 nucléotides générée en aval de (Sl)n, sn+1, est la séquence complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides générée en amont de (Sl)l, si-1,

laquelle étape conduit :

- à l'élimination des sites de reconnaissance de l'enzyme de restriction de type Ils utilisée,

- à la formation d'une extrémité cohésive constituée par une suture monobrin d'au moins 2 nucléotides, à chacune des extrémités amont et aval de chacune des (Sl)i et

- à l'appariement par complémentarité nucléotidique de la susdite suture monobrin cohésive d'au moins 2 nucléotides en aval de (Sl)i avec la suture monobrin cohésive d'au moins 2 nucléotides en amont de la (Sl)i+1, et de la susdite suture monobrin cohésive d'au moins 2 nucléotides en amont de la (Sl)i avec la susdite suture monobrin cohésive d'au moins 2 nucléotides en aval de (Sl)i-l

et au positionnement des susdites (Sl)i de façon contigûe les unes aux autres, selon un ordre et un sens unique et déterminé, b) une étape de ligation des susdites sutures monobrins cohésives d'au moins 2 nucléotides pour obtenir un vecteur circulaire d'ADN double brin.

3. Procédé selon la revendication 1 ou 2 dans lequel

l'étape (a) de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, en présence d'une seule enzyme de restriction de type Ils,

est effectuée à une température allant de 20°C à une température de 55°C, pendant une période allant de 2 minutes à une période de 30 minutes,

l'étape (b) de ligation est effectuée à une température allant de 10°C à une température de 40°C pendant une période allant de 2 min à un période de 30 min,

(a) et (b) pouvant être répétées de 1 à 49 fois,

ledit procédé comprenant en outre,

(c) au moins une étape d'incubation à une température de 41 à 60°C pendant une période allant de 0.5 à 15 min et, éventuellement, (d) une étape d'incubation à une température de 61 à 90°C pendant une période allant de 0.5 à 15 minutes.

4. Procédé de fabrication d'un vecteur circulaire d'ADN double brin selon l'une quelconque des revendications précédentes dans lequel l'une des au moins deux séquences d'intérêt comprend au moins une unité non fonctionnelle.

5. Procédé selon l'une quelconque des revendications précédentes dans lequel l'enzyme de restriction de type Ils est une enzyme de restriction de type Ils choisie parmi Bsa l, Eco31l, Bbsl, Bpil, BsmBI, Esp3l, BspMI, BfuAI et Bvel.

6. Procédé selon l'une quelconque des revendications précédentes dans lequel l'adaptateur d'ADN double brin en aval ou en amont de ladite séquence d'intérêt, comprend au moins un site de reconnaissance d'une enzyme de restriction de type llp, avantageusement au moins un site de reconnaissance d'une enzyme de restriction rare telles que Notl, Pacl, Pmel, Swal, Smil, Sgsl, SgrDI, SgrAI, Sbfl, Fsel, Ascl, AsiSI, Mrel, MssI et plus avantageusement deux sites de reconnaissance d'enzymes de restriction choisis parmi Kpnl et Agel, EcoRI et BstBI, Sali et Mlul.

7. Procédé selon l'une quelconque des revendications précédentes dans lequel les adaptateurs d'ADN double brin en amont et en aval de ladite séquence d'intérêt ne comprennent aucun site de reconnaissance d'une enzyme de restriction de type Ils autre que celui de l'enzyme de restriction de type Ils, présente dans l'étape de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre. 8. Procédé selon l'une quelconque des revendications précédentes dans lequel la suture monobrin cohésive d'au moins 2 nucléotides à chacune des extrémités amont et aval de la séquence d'intérêt, comprend de 2 à 10 nucléotides, de préférence de 2 à 5 nucléotides, et plus particulièrement 4 nucléotides. 9. Procédé selon l'une quelconque des revendications précédentes dans lequel chaque suture monobrin cohésive d'au moins 2 nucléotides générée à partir d'une brique moléculaire s'apparie avec une suture monobrin cohésive d'au moins 2 nucléotides générée à partir d'une autre brique moléculaire.

10. Procédé selon l'une quelconque des revendications précédentes dans lequel la suture monobrin cohésive d'au moins 2 nucléotides générée à chacune des extrémités amont et ava l de la séquence d'intérêt, comprend une séquence de 4Z combinaisons possibles excluant les z * z combinaisons qui résultent en un palindrome d'ADN dans laquelle z est compris de 2 à 10 et z est le nombre de nucléotides de la suture mono brin .

11. Procédé selon l'une quelconque des revendications précédentes dans lequel la sutu re mono brin cohésive d'au moins 2 nucléotides en amont et aval de la séquence d'intérêt, est conçue à l'a ide d'une matrice de score,

12. Procédé selon l'une quelconque des revendications précédentes dans lequel ladite enzyme de restriction de type Ils coupe i'ADN à une distance allant de 2 à 15 nucléotides, 2 à 14, 2 à 13, 2 à 12, 2 à 11, 2 à 10, 2 à 9, 2 à 8, 2 à 7, 2 à 6, 2 à 5, 2 à 4, 2 à 3 nucléotides du site de reconnaissance spécifique de ladite enzyme de type Ils.

13. Procédé selon l'une quelconque des revendications précédentes dans leq uel la séquence complémentaire de la sutu re monobrin cohésive d'au moins 2 nucléotides générée en amont n'est pas complémentaire de la sutu re monobrin cohésive d'au moins 2 nucléotides générée en aval, à l'exception de la séquence complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides générée en a mont de la (S 1)1, (si-1), qui est complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides en aval de la séquence (Sl)n, (sn+1).

14. Procédé selon l'une quelconque des revendications précédentes comprenant, avant l'étape de mise en contact simultanée d'au moins deux briques moléculaires, une étape de préparation de chacune des briques moléculaires, pa r synthèse chimique ou par une étape d'amplification pa r PCR de la séquence d'intérêt contenue dans une brique à l'a ide d'une amorce sens comprenant, de 5' en 3', une séquence correspondant à la séquence de l'adaptateur, et au moins 14 nucléotides de la séquence d'intérêt et d'une amorce anti-sens comprenant de 5' en 3' au moins 14 nucléotides de la séquence d'intérêt et au moins une séquence correspondant à la séquence de l'adaptateur.

15. Vecteur circulaire d'ADN double brin tel qu'obtenu par mise en œuvre selon l'une quelconque des revendications 1 à 14 .

16. Vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant l'expression simultanée de multiples transgènes et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, nxU2a et mxU2b,

Ul représentant une unité fonctionnelle bactérienne,

U2a représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéine,

U2b représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant,

n étant supérieur ou égal à 0,

m étant supérieur ou égal à 0, sous réserve que n+m>2,

l'unité Ul pouvant être contiguë aux unités nxU2a, elles-mêmes pouvant être contiguës aux unités mxU2b,

l'unité Ul étant de préférence contiguë aux unités nxU2a, elles-mêmes étant de préférence contiguës aux unités mxU2b.

17. Vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant de sélectionner l'intégration des transgènes par recombinaison non homologue dans le génome cible et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, nxU2a, mxU2b et U3a,

Ul représentant une unité fonctionnelle bactérienne,

U2a représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéine,

U2b représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant,

n étant supérieur ou égal à 0,

m étant supérieur ou égal à 0, sous réserve que n+m>2,

U3a représentant une cassette de sélection positive,

l'unité Ul pouvant être contiguë aux unités nxU2a, elles-mêmes pouvant être contiguës aux unités mxU2b, elles-mêmes pouvant être contiguës à U3a, l'unité Ul étant de préférence contiguë aux unités nxU2a, elles-mêmes étant de préférence contiguës aux unités mxU2b, elles-mêmes étant de préférence contiguës à U3a.

18. Vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant de sélectionner l'intégration simultanée de multiples de transgènes par recombinaison homologue dans le génome cible et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U3b, nxU2a, mxU2b, U3a et U3c,

Ul représentant une unité fonctionnelle bactérienne,

U3b représentant motif 5' d'une séquence de recombinaison homologue X

U2a représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéine,

U2b représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant,

n étant supérieur ou égal à 0,

m étant supérieur ou égal à 0, sous réserve que n+m>2,

U3a représentant une cassette de sélection positive,

U3c représentant motif 3' d'une séquence de recombinaison homologue X,

l'unité Ul étant contiguë à U3b, elle-même étant contiguë aux unités nxU2a, elles-mêmes étant contiguës aux unités mxU2b, elles-mêmes étant contiguës à l'unité U3a, elle-même étant contiguë à l'unité U3c.

19. Vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant d'éliminer les cellules hôtes ayant intégré un ou des transgènes par recombinaison non-homologue et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U3b, nxU2a, mxU2b, U3a, U3c et U3d,

Ul représentant une unité fonctionnelle bactérienne,

U3b représentant motif 5' d'une séquence de recombinaison homologue X

U2a représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéine,

U2b représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant,

n étant supérieur ou égal à 0, m étant supérieur ou égal à 0, sous réserve que n+m>2,

U3a représentant une cassette de sélection positive,

U3c représentant motif 3' d'une séquence de recombinaison homologue X,

U3d représentant une cassette de sélection négative,

l'unité Ul étant contiguë à l'unité U3b, elle-même étant contiguë aux unités nxU2a, elles-mêmes étant contiguës aux unités mxU2b, elles-mêmes étant contiguës à l'unité U3a, elle-même étant contiguë à l'unité U3c, elle-même étant contiguë à l'unité U3d.

20. Vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant d'exprimer un ou plusieurs transgènes de façon inductible et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U2c, nxU2d, et mxU2e,

Ul représentant une unité fonctionnelle bactérienne,

U2c représentant un gène codant un transactivateur transcriptionel,

U2d représentant un gène dont le promoteur est dépendant du transactivateur codé par le gène U2c, U2e représentant un gène dont le promoteur n'est pas dépendant du transactivateur codé par le gène U2c,

n étant supérieur ou égal à 1,

m étant supérieur ou égal à 0,

l'unité Ul pouvant être contiguë à l'unité U2c, elle-même pouvant être contiguë aux unités nxU2d, elles- mêmes pouvant être contiguës aux unités mxU2e,

l'unité Ul étant de préférence contiguë à l'unité U2c, elle-même étant de préférence contiguë aux unités nxU2d, elles-mêmes étant de préférence contiguës aux unités mxU2e.

21. Vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant de réaliser de la complémentation génétique sous contrôle inductible et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U2f, U2c, et U2g,

Ul représentant une unité fonctionnelle bactérienne,

U2c représentant un gène codant un transactivateur transcriptionelle,

U2f représentant un gène dont le promoteur est un promoteur à ARN polymérase III et dont le produit d'expression est un petit ARN en épingle à cheveux (shRNA) précurseur d'un petit ARN interférant ciblant un gène X, U2g représentant un gène dont le promoteur est dépendant du transactivateur codé par le gène U2c et dont le produit d'expression est une version mutée du produit du gène X de sorte à être insensible au produit du gène U2f,

l'unité Ul pouvant être contiguë à l'unité U2f, elle-même pouvant être contiguë à l'unité U2c, elle- 5 même pouvant être contiguë à l'unité U2g,

l'unité Ul étant de préférence contiguë à l'unité U2f, elle-même étant de préférence contiguë à l'unité U2c, elle-même étant de préférence contiguë à l'unité U2g.

10 22. Vecteur d'ADN double brin dépourvu de site de clonage multiple et permettant de sélectionner des cellules dont le génome a été édité par recombinaison homologue ciblée et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U3a, U3b et U3c,

Ul représentant une unité fonctionnelle bactérienne,

U3a représentant une cassette de sélection positive,

15 U3b représentant motif 5' d'une séquence de recombinaison homologue X

U3c représentant motif 3' d'une séquence de recombinaison homologue X,

l'unité Ul étant contiguë à l'unité U3b, , elles-mêmes étant contiguës à l'unité U3a, elle-même étant contiguë à l'unité U3c.

20

Description:
Procédé de fabrication de vecteurs d'ADN à partir de briques moléculaires contenant des séquences d'intérêt

DOMAINE TECHNIQUE

La présente invention porte sur un procédé de fabrication de vecteurs « sur mesure » d'ADN double brin, à partir de briques moléculaires comportant des séquences d'intérêt.

ETAT DE LA TECHNIQUE

A l'heure actuelle, les manipulations d'ADN sont largement toujours basées sur l'utilisation de vecteurs de clonage ou d'expression. L'insertion ou l'extraction de fragments d'ADN correspondants à des éléments fonctionnels (gènes de résistance aux antibiotiques, sites de clonage, étiquettes moléculaires, promoteurs, origines de réplication dans d'autres organismes, cassettes de sélection, etc..) dans des plasmides, molécules d'ADN circulaire naturellement présentes chez certaines bactéries, a permis le développement d'une multitude de vecteurs différents, adaptés à diverses utilisations, chaque vecteur étant développé pour une application particulière et spécifique. L'utilisateur final choisit donc un vecteur adapté à ses besoins et introduit dans celui-ci son propre fragment d'ADN d'intérêt, par des méthodes de clonage de l'ADN. Ces méthodes sont traditionnellement basées sur l'utilisation d'une part d'enzymes de restriction, le plus souvent de type llp (c'est-à-dire des enzymes qui reconnaissent et coupent l'ADN au niveau de courtes séquences palindromiques) et d'autre part d'ADN ligases, qui sont capables de recoller des fragments d'ADN générés par les enzymes de restriction. Ces méthodes nécessitent des étapes multiples, dont le nombre augmente le risque d'exposition à des contaminants exogènes susceptibles de dégrader l'ADN, le risque d'auto appariement ou d'appariements erronés. De même, ces méthodes nécessitent l'utilisation d'enzymes multiples et plus ou moins performantes, ce qui constitue un inconvénient difficile à contourner. Des difficultés peuvent aussi être rencontrées selon la compatibilité des plasmides donneurs et accepteurs. En effet, de très nombreux vecteurs différant par leurs composants fonctionnels sont commercialement disponibles pour répondre à la grande variété d'utilisations possibles. Cependant chaque vecteur n'est pas nécessairement compatible avec les autres et en particulier l'existence ou l'absence de sites de restriction dans la séquence plasmidique peut rendre les transferts de séquence d'un vecteur à un autre relativement complexe. Le transfert de fragments d'ADN d'un plasmide à un autre plasmide présente un certain nombre d'inconvénients et engendre une forte réduction des rendements de réaction et un coût important en temps et en réactifs.

Les activités de clonages basées sur les méthodes de restriction ligation et les méthodes en dérivant sont basées sur l'utilisation d'un vecteur d'arrivée, le plus souvent d'origine commerciale, ce qui entraine un manque de contrôle sur la nature et le nombre de composants fonctionnels des vecteurs d'arrivée. De plus, l'utilisation de la méthode de restriction ligation nécessite de disposer de sites de restriction utilisables de part et d'autre du fragment à insérer dans le vecteur ainsi que de ces mêmes sites dans le vecteur lui-même. Il faut donc s'assurer pour pouvoir introduire un fragment d'ADN par restriction-ligation qu'aucune des enzymes utilisées ne coupe à l'intérieur du fragment d'ADN d'intérêt et que chacune de ces enzymes ne coupe qu'a un seul endroit dans le vecteur qui est l'endroit auquel le fragment doit être inséré. C'est pour cette raison que les vecteurs développés contiennent des sites de clonage multiples (MCS). La présence et l'utilisation de ces MCS pour insérer des fragments d'ADN dans des vecteurs laissent des traces dans la séquence d'ADN hybride obtenue, il s'agit de séquences pouvant aller de quelques nucléotides à plusieurs dizaines de nucléotides avant et après l'insert. Ces 'cicatrices' nucléotidiques ne sont pas nécessaires à la fonction du plasmide et sont parfois même délétères (par exemple dans le cas de deux séquences contenant des protéines que l'on souhaite fusionner).

Le système Gateway est présenté comme une solution aux problèmes de transfert d'insert d'un plasmide à l'autre. Cependant, le système Gateway peut également être perçu comme un système clos, peu compatible avec les autres outils moléculaires disponibles. De plus, dans le système Gateway, la séquence de recombinaison est fixe et laissera toujours des traces dans le vecteur final. L'assemblage Golden Gâte est également basé sur un plasmide donneur et un plasmide receveur, très comparable au système Gateway.

Certaines des méthodes décrites dans l'art antérieur sont proposées comme des solutions pour pallier ces limitations. Par exemple, les méthodes de clonage indépendante de la ligation ou indépendante de la séquence et de la ligation (LIC/SLIC) ou de Gibson Assembly permettent aux utilisateurs de ne pas avoir à utiliser de multiples enzymes de restriction et de lever ainsi un certain nombre de limitations techniques liées à ces dernières (compatibilité, présence de sites dans les séquences ou plasmides d'intérêt). Elles ne permettent pas cependant un plus grand contrôle des fonctionnalités du vecteur final qui dépend toujours des outils moléculaires commercialement disponibles. Pour s'affranchir d'un vecteur de départ et d'un vecteur final, Wang T. et al. (2012), Appl Microbiol Biotechnol 93: 1853-1863, ou encore Weber E. (201 1), PLoS ONE 6 (2): el6765 et EP2395087, et Sarrion-Perdigones A. (2012), PLoS ONE 6 (7): e21622) ont proposé de nouvelles méthodes de clonage modulaire comme le GoldenBraid (ou le Golden Gâte. La méthode Golden Gâte est décrite dans le document WO 2008/095927 incorporé ici, dans sa totalité, par référence ainsi que l'article d'Engler et al. PLoS ONE 4 (2009) e5553. Cette méthode est compatible avec de nombreux outils moléculaires (plasmides) commercialement disponibles et repose sur l'utilisation d'un type d'enzyme de restriction disponible chez de nombreux fournisseurs. Les utilisateurs de cette méthode ne sont donc pas captifs d'une gamme de produit dédiés. Le revers de cette versatilité est le travail à réaliser pour vérifier que tous les éléments des constructions souhaitées soient compatibles avec la méthode. Autrement dit, ils doivent être naturellement dépourvus de site de restriction d'enzymes de type Ils, ou être modifiés pour éliminer les sites potentiellement présents.

Pour fabriquer un vecteur selon les besoins, un squelette plasmidique 'modulaire' a été développé par la société Oxford Genetics (http://oxfordgenetics.com/). Ce squelette, baptisé SnapFast ® , contient des sites de restriction introduits dans la séquence de sorte à flanquer les composants fonctionnels du plasmide. Ainsi, chaque composant peut être remplacé par un autre de la même catégorie (ex : promoteur, étiquette) en appliquant la méthode de restriction-ligation pour chaque modification souhaitée par l'expérimentateur. Cependant cette technique nécessite une relativement grande quantité d'ADN. Même si le système SnapFast ® est probablement l'outil de biologie moléculaire qui propose aux utilisateurs la plus grande marge de manœuvre concernant le contrôle des fonctionnalités du vecteur d'arrivée, des défauts subsistent. Cette alternative présente les inconvénients inhérents à l'usage des enzymes de restriction multiples (ex : présence éventuelle des sites dans les séquences d'intérêt, cicatrices nucléotidiques) et un coût de prestation élevé. Autre limitation, la modularité demeure restreinte aux substitutions rendues possibles par le squelette défini de ce vecteur.

D'autres approches ont été développées pour surmonter cette limitation. Il s'agit notamment de clonage basé sur l'activité recombinase. Cette technique réduit les problèmes provenant de la présence de plusieurs sites de restriction dans les grandes constructions, mais est limitée par le fait que les sites de recombinaison sont laissés dans le produit d'assemblage final, ce qui empêche l'assemblage sans soudure de séquences codant pour des protéines (Weber E. (2011), PLoS ONE 6 (2): el6765 et EP2395087). De plus, seul un petit nombre de fragments peuvent être assemblés dans une construction selon cette méthode. En outre, le contrôle total de la composition du vecteur final (séquence d'intérêt et modules fonctionnels) n'est pas atteint. La technologie de synthèse de gène le permettrait. Cependant cette technologie nécessite de son utilisateur qu'il effectue le design complet de son vecteur avant sa préparation, la moindre erreur étant synonyme de perte totale et irréversible de l'investissement. De plus, cette fabrication à façon est très coûteuse et un processus long.

Le document US 2014 0038240 décrit un procédé d'assemblage réalisé en plusieurs étapes successives. Cette méthode nécessite l'utilisation soit d'une agrafe d'ADN simple brin soit d'un adaptateur. Les inconvénients liés aux agrafes sont qu'elles peuvent adopter une structure secondaire, s'auto apparier ou encore être masquées par des protéines. Cela peut entraîner des difficultés d'assemblage et des rendements faibles. Selon un autre mode de réalisation, le document US2014 0038240 décrit un procédé d'assemblage réalisé à l'aide d'un adaptateur. Ce mode de réalisation requiert l'utilisation de plusieurs enzymes de restriction pour générer des extrémités simple brin

De manière générale, toutes les techniques de clonage par recombinaison laissent des séquences qui ne sont pas voulues dans le vecteur final, qui sont les séquences utilisées pour la recombinaison.

Aucune des méthodes ou technologie existantes ne permet aux utilisateurs de générer facilement, (en une seule étape) à faible coût (en présence d'une seule enzyme) et en peu de temps, des vecteurs d'expression entièrement modulaires à façon.

II existe donc un réel besoin de proposer une méthode permettant d'assembler des molécules d'ADN complexes et d'obtenir facilement, avec un bon rendement, et sans erreur, une construction que l'on aura choisie entièrement, c'est-à-dire dont on pourra contrôler la nature et le nombre des composants, en particulier de composants fonctionnels.

Il est donc nécessaire de mettre au point un nouveau procédé permettant de résoudre tous ces problèmes qui soit plus efficace, moins coûteux, et plus rapide.

La présente invention propose de résoudre ces problèmes. EXPOSE DE L'INVENTION

La présente invention porte sur un procédé de fabrication d'un vecteur circulaire d'ADN double brin comportant au moins deux séquences d'intérêt, comprenant :

a) une étape de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, en présence d'une seule enzyme de restriction, ladite seule enzyme de restriction étant une enzyme de restriction de type Ils,

chaque brique moléculaire étant une molécule d'ADN linéaire double brin, et contenant :

(i) une séquence d'intérêt dépourvue de site de reconnaissance spécifique de la sus-dite enzyme de restriction de type Ils et comprenant au moins une unité, ladite unité étant une unité fonctionnelle ou une unité non fonctionnelle, ladite unité comprenant au moins un module, ledit module étant un module fonctionnel ou un module non fonctionnel,

(ii) deux adaptateurs d'ADN double brin, flanqués en amont et en aval de ladite séquence d'intérêt, chaque adaptateur d'ADN double brin consistant en une séquence d'au moins 12 nucléotides, laquelle contient un seul et unique site de reconnaissance de la susdite enzyme de restriction de type Ils,

le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur en amont de ladite séquence d'intérêt et le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur en aval de ladite séquence spécifique étant convergents,

laquelle étape conduisant :

- à l'élimination par coupure des sites de reconnaissance de l'enzyme de restriction de type Ils utilisée,

- la formation d'une suture monobrin cohésive d'au moins 2 nucléotides à chacune des extrémités de ladite séquence d'intérêt,

ladite suture monobrin cohésive d'au moins 2 nucléotides en amont d'une des au moins deux séquences d'intérêt étant complémentaire à ladite suture monobrin cohésive d'au moins 2 nucléotides en aval d'une autre séquence d'intérêt,

ladite étape du procédé selon l'invention conduisant :

-à l'appariement par complémentarité nucléotidique des susdites sutures monobrins cohésives d'au moins 2 nucléotides et

- au positionnement des séquences d'intérêt, de façon contigue les unes aux autres, selon un ordre et un sens unique et déterminé,

ledit procédé comprenant en outre,

b) une étape de ligation des susdites sutures monobrins cohésives d'au moins 2 nucléotides, pour obtenir un vecteur circulaire d'ADN double

Selon un mode de réalisation, le procédé selon l'invention porte sur un procédé de fabrication d'un vecteur circulaire d'ADN double brin comportant au moins deux séquences d'intérêt, comprenant :

a) une étape de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, en présence d'une seule enzyme de restriction, ladite seule enzyme de restriction étant une enzyme de restriction de type Ils,

chaque brique moléculaire étant une molécule d'ADN linéaire double brin à extrémités non cohésives, et contenant :

(i) une séquence d'intérêt dépourvue de site de reconnaissance spécifique de la sus-dite enzyme de restriction de type Ils et comprenant au moins une unité, ladite unité étant une unité fonctionnelle ou une unité non fonctionnelle, ladite unité comprenant au moins un module, ledit module étant un module fonctionnel ou un module non fonctionnel,

(ii) deux adaptateurs d'ADN double brin, flanqués en amont et en aval de ladite séquence d'intérêt, chaque adaptateur d'ADN double brin consistant en une séquence d'au moins 12 nucléotides, laquelle contient un seul et unique site de reconnaissance de la sus dite enzyme de restriction de type Ils,

le site de reconnaissance de la sus dite enzyme de restriction de type Ils de l'adaptateur en amont de ladite séquence d'intérêt et le site de reconnaissance de la sus dite enzyme de restriction de type Ils de l'adaptateur en aval de ladite séquence spécifique étant convergents,

laquelle étape conduisant :

- à l'élimination par coupure des sites de reconnaissance de l'enzyme de restriction de type Ils utilisée,

- la formation d'une suture monobrin cohésive d'au moins 2 nucléotides à chacune des extrémités de ladite séquence d'intérêt,

ladite suture monobrin cohésive d'au moins 2 nucléotides en amont d'une des au moins deux séquences d'intérêt étant complémentaire à ladite suture monobrin cohésive d'au moins 2 nucléotides en aval d'une autre séquence d'intérêt,

-à l'appariement par complémentarité nucléotidique des susdites sutures monobrins cohésives d'au moins 2 nucléotides et

- au positionnement des séquences d'intérêt, de façon contigue les unes aux autres, selon un ordre et un sens unique et déterminé,

b) une étape de ligation des susdites sutures monobrins cohésives d'au moins 2 nucléotides, pour obtenir un vecteur circulaire d'ADN double brin.

Le procédé selon l'invention ne requiert l'utilisation que d'une seule enzyme de restriction, qui est une enzyme de restriction de type Ils.

Selon un aspect particulier de l'invention, les vecteurs selon l'invention, obtenus en particulier selon le procédé de l'invention, sont dépourvus de site de clonage multiple.

Les conventions selon lesquelles un ADN double brin est lu de 5' en 3' sont respectées dans la présente invention.

L'invention décrite permet d'abolir totalement l'usage des enzymes de restriction classiques dans la fabrication de vecteurs et donc de l'ensemble de leurs inconvénients. Il en résulte un temps de réalisation des vecteurs beaucoup plus court et une diminution dramatique des risques d'erreur. Le coût de fabrication donc devrait être fortement réduit ; la constitution et le maintien d'un stock d'enzymes de restriction variées dans chaque laboratoire devenant aussi moins nécessaire.

On entend par enzyme de restriction classique une enzyme de restriction de type llp. L'invention permet de s'affranchir d'utiliser des vecteurs d'arrivée pour les techniques de sous- clonage. Cela veut dire qu'il n'est plus besoin d'acquérir ou d'entretenir une collection de multiples vecteurs pour procéder à des activités de sous-clonage. Cela représente une économie en temps (culture bactérienne et purification de plasmides) conséquente. Par ailleurs, la méthode selon l'invention permet de concevoir des vecteurs comprenant des cassettes d'expression multiples. Dans un contexte de modification génétique de cellules ou d'organisme cela permet aux utilisateurs de n'utiliser qu'un seul vecteur, et donc une seule étape de sélection pour transférer plusieurs gènes d'intérêt simultanément dans leur système d'intérêt. L'invention permet aussi de restreindre le contenu des vecteurs aux seules séquences d'intérêt choisies par le demandeur. Il n'y a aucune séquence plasmidique résiduelle, ou cicatrice nucléotidique, due à l'utilisation des enzymes de restriction classiques et à la nécessité d'utiliser des sites de clonage multiples. L'invention permet donc aux utilisateurs d'exercer un contrôle total sur les composants du vecteur produit.

L'invention est appropriée pour générer des gènes chimères par appariements combinatoires, et est tout à fait compatible avec des applications basées sur ces approches (ex : étiquetage intramoléculaire ou analyse de promoteur). Dans ces contextes, l'invention permet la création simultanée de nombreux vecteurs d'expression différents en une seule étape. Elle permet donc de produire rapidement (en parallèle) une gamme de vecteurs se différenciant par l'un ou l'autre des composants choisis (ex : gène de résistance, marqueur moléculaire), sans modifier l'ensemble de l'architecture du vecteur.

Pour l'ensemble de ces raisons, l'invention décrite constitue une méthode techniquement et économiquement attractive comparée aux méthodes les plus performantes connues. On entend par vecteur selon l'invention, une molécule d'ADN comportant des informations génétiques, susceptible de transmettre lesdites informations génétiques. Un vecteur peut également être une molécule d'origine plasmidique, ou un plasmide, modifié par génie génétique et destiné à transférer des séquences d'ADN dans une cellule ou un organisme de choix. Selon l'invention, un plasmide est une molécule d'ADN, distincte de l'ADN chromosomique, capable de réplication autonome. Les plasmides sont généralement circulaires et bicaténaires (d'ADN double brin).

Une molécule d'origine plasmidique selon l'invention est une molécule constituée au moins en partie d'acide nucléique provenant d'un plasmide.

On entend par vecteur d'expression tout vecteur utilisé pour comprendre, et/ou permettre l'expression de l'information génétique d'un gène dans une cellule ou un organisme de choix.

Selon l'invention, la fonctionnalité de chaque vecteur est définie selon la combinaison des fonctions basiques portées par le ou les module(s) constituant le vecteur et/ou l'utilisation qui en est faite. En général on entend par séquence d'intérêt une séquence d'acides nucléiques que l'expérimentateur souhaite utiliser et/ou assembler à une autre séquence d'intérêt.

On entend aussi par séquence d'intérêt selon l'invention, une séquence d'acides nucléiques qui contient l'information génétique correspondant à un ou plusieurs modules fonctionels.

Le terme unité définit l'ensemble des informations contenues dans une séquence d'ADN qui confère à cette séquence une fonctionnalité génétique intégrée correspondant à l'une des fonctions primordiales d'un vecteur. Par définition, une unité est composée d'un ensemble de modules dont la combinaison produit la fonction de cette unité.

Une unité bactérienne ou unité de maintien en bactérie a pour fonction d'assurer la réplication et la sélection du vecteur dans un système procaryote. L' unité d'expression a pour fonction de permettre l'expression d'un produit génétique dans un système d'intérêt (eucaryote ou procaryote).

L'unité d'intégration en cellule eucaryote ou procaryote a pour fonction de permettre le maintien du ou des transgènes dans le génome d'un système d'intérêt.

Un vecteur doit contenir à minima une unité fonctionnelle bactérienne et peut en outre contenir une ou plusieurs unité d'expression et/ ou une ou plusieurs unités d'intégration.

Un vecteur d'expression doit donc contenir une unité bactérienne et une unité d'expression. Un vecteur d'expression peut contenir en outre une ou plusieurs autres unités d'expression et une ou plusieurs unités d'intégration.

Du point de vue physique, une unité peut être apportée au vecteur par une ou plusieurs séquences d'intérêt. Si l'unité est contenue dans une seule séquence, l'unité est, de facto, fonctionnelle.

Selon l'invention, une unité fonctionnelle (bactérienne, d'expression, d'intégration) en général, comprend un ensemble de modules (au moins un module) nécessaires à une fonction décrite. Une unité fonctionnelle selon l'invention se suffit à elle-même pour conférer une fonction biologique au vecteur.

Selon l'invention, une unité fonctionnelle comprend au moins un module, ledit module étant un module fonctionnel ou un module non fonctionnel.

En général, on entend par module fonctionnel une séquence d'acides nucléiques qui confère une fonction au vecteur en participant à la fonction d'une unité fonctionnelle. Un module fonctionnel est une entité physique, représentée par une séquence qui participe, en combinaison avec d'autres modules, à la fonction de l'unité.

Le terme "module" définit ainsi une information contenue dans une séquence d'ADN qui confère à cette séquence une fonctionnalité génétique minimale utile à la fonction d'un vecteur. Les informations répondant à ce critère minimal sont par exemple :

- les promoteurs,

les séquences codantes,

les terminateurs,

les séquences non codantes correspondant à des A N fonctionnels (introns, ARN en épingle à cheveux, longs ARN non codant),

- les enhancers,

les insulateurs,

les séquences 1RES,

les séquences cibles de recombinases,

les origines de réplication,

- les séquences homologues à des loci génétiques.

Selon l'invention, un module fonctionnel est une séquence qui contient une information génétique nécessaire et suffisante à la réalisation d'une fonction basique impliquée dans la fonctionnalité du vecteur, en particulier une origine de réplication, un promoteur, un terminateur, une séquence de recombinaison, une séquence codante ou non codante, une séquence régulatrice de traduction, etc..

Un module non fonctionnel selon l'invention n'a pas de fonction dans un contexte (dans une cellule hôte particulière par exemple) déterminé, mais peut en avoir s'il est combiné à d'autres modules fonctionnels ou non fonctionnels ou s'il est utilisé dans un contexte approprié. Par exemple, dans une unité d'expression (ou cassette d'expression) fonctionnelle, les modules minimum nécessaires sont un promoteur, une séquence codant un produit d'expression et un terminateur. D'autres modules peuvent intervenir dans cette unité afin d'en modifier la fonction.

En d'autres termes, lorsque l'information définie par le module se suffit à elle-même pour supporter la fonctionnalité, le module est dit fonctionnel : Par exemple une séquence codante entière (de l'ATG au codon stop) ou un promoteur défini (site de reconnaissance de facteur de transcription et présence d'une initiation de transcription) constituent des modules fonctionnels. Si l'information présente ne permet pas cette fonctionnalité minimale le module sera dit non fonctionnel. Par exemple une séquence codante incomplète (absence d'un ATG ou d'un codon stop), ou un promoteur tronqué (absence ou mutation de site de reconnaissance de facteur de transcription) sont par définitions des modules "non fonctionnels". Les modules ont donc des fonctions singulières et définies qui, par combinaison produisent les fonctions biologiques des unités.

Un vecteur d'expression peut contenir plusieurs unités, dont au moins une unité fonctionnelle bactérienne et une unité fonctionnelle d'expression.

On entend par brique moléculaire une séquence d'ADN double brin linéaire. Selon un mode de réalisation avantageux, une brique moléculaire est une séquence d'ADN double brin linéaire ayant un nucléotide (Adénine) débordant en 3' sur chacun des deux brins d'ADN. Selon un mode de réalisation plus avantageux, une brique moléculaire est une séquence d'ADN double brin linéaire à bout franc.

Une brique moléculaire selon l'invention est composée d'une séquence d'intérêt flanquée de part et d'autre d'un adaptateur.

Selon l'invention, une brique est incapable de former un vecteur per se. En d'autres termes, une brique seule ne peut constituer un vecteur.

De manière non limitative, la figure 30 présente un exemple de construction selon l'invention. Dans cet exemple, l'assemblage ordonné des séquences d'intérêt (SI) produit un vecteur contenant 4 unités fonctionnelles distinctes : - L'unité bactérienne est composée de deux SI : A et G. La SI A contient un module fonctionnel (1) et la SI G contient deux modules fonctionnels (9 et 10). Par définition, les SI A et G contiennent chacune une unité (bactérienne) non fonctionnelle.

- L'unité d'intégration est composée de trois SI : B, E et F. Les SI B et F contiennent chacune un 5 module non fonctionnel (respectivement 2a et 2b). La présence simultanée de ces deux modules non fonctionnels dans le même vecteur constitue un module fonctionnel. Dans le cas présent ce module fonctionnel reconstitué permet l'intégration de la séquence d'ADN C+D+E à un locus ciblé par la séquence B+F. La SI E contient trois modules fonctionnels (6, 7 et 8) qui codent un gène de sélection positive. Dans le cas présent ce gène permet de sélectionner les cellules cibles qui 10 auront intégré la séquence C+D+E de façon stable dans leur génome par traitement avec l'antiobiotique correspondant au gène de sélection choisi. Par définition, et dans le contexte décrit dans l'exemple, les SI B, E et F contiennent chacune une unité d'intégration non fonctionnelle.

- L'unité d'expression 1 est composée de deux SI : C et D. Les SI C et D contiennent chacune un 15 module fonctionnel et un module non fonctionnel : 3 et 4a pour la SI C, 5 et 4b pour la SI D. Dans cet exemple, l'assemblage produit un module fonctionnel à partir des modules 4a et 4b qui, une fois reliés constituent une séquence codante complète. Par définition, les SI C et D contiennent chacune une unité d'expression non fonctionnelle.

- L'unité d'expression 2 est contenue par la SI H. la SI H contient trois modules fonctionnels : 11, 20 12 et 13. Par définition la SI H contient une unité (d'expression) fonctionnelle.

De manière non limitative, le tableau 1 présente une liste d'unités et de modules selon l'invention.

UNITES TYPES DE MODULES EXEMPLES

Origine de réplication des plasmides pMBl, pUC, CoIEl, pl5A, pSClOl, RI,

Origine de réplication bactérienne RK2, R6K, Fl, M13, Lambda , pA81, pRAS3.1, pTi, pBPSl, pUOl, pKH9, pWKSl, pCDl, pMAK3, pBL63.1,

Unité

pTA1060, p4M, pHT926, pCD6, pJBOl, fonctionnelle

plME300, pMD5057, pTE44, pDPl, bactérienne :

pT38

gène de résitance à l'ampicilline, à la néomycine, à la kanamycine, au gène de résistance à un

Marqueur de chloramphénicol, à la streptomycine, antibiotique

sélection bactérien à la gentamicine, à la tétracycline, à l'érythromycine, à la vancomycine gène de criblage lacZct Promoteur de l'ARN- pCMV, pEFlct, ρβ-actin, Ubiquitine polymerase II:

promoteurs inductibles par la

Promoteur Promoteur ARN- tétracycline (ex : pTRE3G), pGALl, Polymerase II inductible:

pGALlO

promoteur de l'ARN-

U6, Hl

polymérase III :

séquence codante ou non

codante décrite dans un

Séquence codant un

Unité génome

produit d'expression

fonctionnelle

d'expression: gène rapporteur Luciférase, β-galactosidase

Amplificateur

HACNS1/CENTG2, GADD45g

Séquence de

Terminateur BGHpolyA, HSV TKterm, SV40polyA polyadénylation

tag HA, Myc, Flag

Tag protéine d'affinité GST, MBP, TAPTag

protéine fluorescentes GFP, Mcherry et variantes

(PPT19)4, KMI 1, KMI1, KMI2, KMI2,

Séquence 1RES

KMIX, XI, X2.

Gène de résistance à l'Hygromycine B gène de sélection positive , au G418, à la tétracycline, à la

Gène de sélection

puromycine, ou à la zeocine...

gène de sélection négative Gène codant la thymidine kinase

Séquence de maintien Origine de réplication levure (ARS), en cellule eucaryote séquence de centromère

Unité

fonctionnelle locus Rosa26 ou HRPT (cellules de d'intégration Séquence

souris)

en cellule d'intégration

séquences d'intégration au génome eucaryote homologue

de levure

Séquences impliquées

dans l'édition d'ADN séquence reconnue par une

séquence LoxP ou FRT.

(recombinaison recombinsase

homologue ciblée)

Tableau 1. Exemples d'unités et de modules selon l'invention.

Selon un mode de réalisation particulier, la présente invention porte sur une brique moléculaire comprenant une séquence d'intérêt flanquée de part et d'autre d'une suture monobrin.

Selon l'information contenue dans la séquence d'intérêt, une brique moléculaire utilisée dans l'assemblage selon l'invention apporte une ou plusieurs fonctions au vecteur final, par exemple ;

Plusieurs unités fonctionnelles

Une unité fonctionnelle Une unité non fonctionnelle

Un module fonctionnel

Un module non fonctionnel

Plusieurs modules fonctionnels On entend par enzyme de restriction, une protéine pouvant se lier à, et couper un acide nucléique.

En général, les enzymes de restriction de type Ils sont des enzymes qui se lient de façon spécifique à l'ADN double brin, au niveau d'un site de reconnaissance non palindromique, donc orienté, et clivent les deux brins de l'ADN double brin à une distance fixe du site de reconnaissance. Les séquences nucléotidiques du site de reconnaissance et du site de clivage sont donc différentes.

Par convention, le site d'une enzyme de type Ils est orienté de sorte que son site de coupure soit situé après son site de reconnaissance.

Selon l'invention, une enzyme de type Ils se lie à l'ADN et coupe en aval du site de liaison.

La longueur de l'extrémité cohésive générée -ou la distance entre le site de reconnaissance de l'enzyme de type Ils et le site de clivage- dépend de l'enzyme de type Ils utilisée.

Les nucléotides du site de clivage ne faisant pas partie du site de reconnaissance, ils peuvent être choisis parmi les 4 bases nucléotidiques qui composent l'ADN. L'enzyme de type Ils utilisée dans le procédé selon l'invention est choisie parmi l'une quelconque des enzymes de type Ils référencées dans http://rebase.neb.com/rebase/rebase.html.

Avantageusement, des enzymes de type Ils ayant un site de reconnaissance à une distance de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, ou 18 nucléotides du site de clivage de l'un des brins d'ADN telles que décrites dans Lippow et al, 2009, Nucleic Acides es, 37:. 3061-3073 sont utilisées. Le site de clivage, selon l'invention, est défini comme la séquence comprise entre les coupures réalisées sur chacun des deux brins d'ADN. Selon l'invention, les séquences d'intérêt sont entièrement définies et ne contiennent aucun site de restriction (site de reconnaissance) reconnu par l'enzyme de type Ils utilisée dans l'étape (a) du procédé selon l'invention. Selon l'invention, on entend par sites convergents, des sites permettant à l'enzyme de type Ils de générer une suture monobrin en amont et en aval de la séquence d'intérêt.

Selon un mode de réalisation avantageux, on entend par sites de reconnaissance de l'enzyme de type Ils convergents, deux sites de reconnaissance de l'enzyme de type Ils convergents et localisés sur l'un et l'autre des deux brins complémentaires d'ADN de telle façon que l'enzyme de type Ils se lie de part et d'autre de l'ADN et coupe l'ADN en amont et en aval de la séquence d'intérêt (voir figure 1) pour générer une extrémité simple brin en amont et en aval.

On entend par adaptateur selon l'invention une séquence d'ADN d'au moins 8 nucléotides ou plus, en particulier de 8 à 100 nucléotides, de préférence 12 nucléotides, flanquant de part et d'autre une séquence d'intérêt dans une brique moléculaire.

En particulier, un adaptateur selon l'invention est une séquence d'ADN d'au moins 12 nucléotides ou plus, en particulier de 12 à 100 nucléotides, de préférence 12 nucléotides, flanquant de part et d'autre une séquence d'intérêt dans une brique moléculaire.

Un adaptateur contient au moins :

une séquence de 5,6, 7 ou plus nucléotides correspondant au site de fixation de l'enzyme à activité de type Ils utilisée pour l'assemblage selon l'invention,

- une séquence de 1 à 8 et plus nucléotides correspondant à l'espacement entre le site de fixation et le site de coupure de l'enzyme utilisée. La longueur de cette séquence dépend des caractéristiques intrinsèques de l'enzyme de type Ils utilisée,

une séquence de 2 à 5 ou plus nucléotides correspondant à l'extrémité simple brin générée par l'action de l'enzyme de type Ils utilisée. Cette séquence permettant l'appariement des fragments à assembler, elle correspond de facto à la définition de suture.

Selon l'invention, les adaptateurs contiennent un seul site de restriction (site de reconnaissance) reconnu par l'enzyme de type Ils utilisée dans l'étape (a) du procédé selon l'invention. On entend par suture une séquence simple brin (ou monobrin) de 2 à 5, ou plus, nucléotides.

Selon l'invention, une suture est une séquence de 2 à 5, ou plus, nucléotides correspondant à l'extrémité simple brin générée par l'action de l'enzyme de type Ils utilisée pour l'assemblage, ladite séquence simple brin étant générée en amont et aval de la séquence d'intérêt.

Cette séquence de 2 à 5, ou plus, nucléotides, appariée à sa séquence complémentaire, est présente dans les adaptateurs, et donc dans les briques moléculaires, ainsi que dans le produit de réaction final (le vecteur).

Complémentaire ou complémentarité signifie que 100%, des bases nucélotidiques de deux séquences s'apparient. Selon l'invention, 100% de la séquence de la suture monobrin en aval de la brique n-1 s'apparie avec 100% de la séquence de la suture monobrin en amont de la brique n et les sutures sont donc complémentaires.

L'appariement des deux séquences de sutures monobrins va constituer une suture double brin.

On entend aussi par suture selon l'invention, une séquence monobrin en aval de la brique n-1 appariée à la séquence monobrin en amont de la brique n.

Selon l'invention, une suture est une séquence d'ADN double brin dans le vecteur obtenu par le procédé.

La séquence des sutures générées au cours de l'invention est entièrement définie pour permettre d'une part le bon ordonnancement des séquences d'intérêt lors de l'assemblage et leur fonctionnement, et d'autre part un rendement optimum. Par conséquent, la séquence des sutures générées est une caractéristique de chaque brique moléculaire (choix intra-brique de la séquence des sutures) et dépend également de l'ordre dans lequel chacune des briques moléculaires sont agencées les unes par rapport aux autres (choix inter-brique de la séquence des sutures).

Les sutures ne sont pas des cicatrices, en particulier des cicatrices introduisant des dysfonctionnements dans le vecteur. Selon l'invention, les sutures font donc partie intégrante de chacune des briques moléculaires et peuvent, en outre entièrement ou partiellement faire partie de l'information génétique constitutive d'un module. Les sutures sont choisies de façon raisonnée, avec une assistance informatique, pour assurer le bon ordonnancement des séquences d'intérêt lors de l'assemblage et un rendement optimum.

Selon l'invention, la suture monobrin cohésive d'au moins 2 nucléotides générée à chacune des extrémités amont et aval de la séquence d'intérêt, comprend une séquence choisie parmi « 4 Z combinaisons possibles excluant les z * z combinaisons qui résultent en un palindrome d'ADN dans laquelle z est compris de 2 à 10 et z est le nombre de nucléotides de la suture mono brin».

Le procédé selon l'invention comprend une réaction enzymatique combinant l'action d'une enzyme de restriction de type Ils définie selon l'invention et d'une ligase définie selon l'invention. Selon un mode de réalisation, le procédé selon l'invention est un procédé d'assemblage. Le produit de la réaction est une molécule d'ADN, de préférence circulaire contenant le nombre de briques moléculaires voulu, assemblées de façon ordonnée, sur la base des complémentarités des sutures. Le bon ordonnancement des briques assure de facto le bon ordonnancement des modules quel que soit le nombre de modules contenus dans chaque brique.

Selon un mode avantageux de réalisation, le procédé selon l'invention est un procédé d'assemblage sans cicatrice.

Selon un mode de réalisation, l'adaptateur selon l'invention comprend au moins un autre site de reconnaissance d'une enzyme de type Ils, ledit site est reconnu par une enzyme de type Ils différente de celle utilisée dans le procédé selon l'invention et n'est pas reconnu par l'enzyme de type Ils utilisée dans le procédé selon l'invention.

Selon un mode avantageux, l'adaptateur selon l'invention comprend, en outre, au moins un site de restriction, et plus avantageusement au moins un site de restriction choisi parmi les sites rares de restriction, et plus avantageusement encore, un site de restriction parmi les sites rares de restriction choisis parmi Notl, Pacl, Pmel, Swal, Smil, Sgsl, SgrDI, SgrAI, Sbfl, Fsel, Ascl, AsiSI, Mrel, Mssl. Dans tous les modes de réalisation selon l'invention, le site de reconnaissance de l'enzyme de type lis qui est utilisée dans le procédé selon l'invention, présent dans chaque adaptateur, consiste en un site unique et se localise uniquement dans les adaptateurs, les séquences d'intérêt selon l'invention n'en comprenant aucun.

Le procédé selon l'invention ne met en œuvre qu'une seule enzyme de type Ils, ladite enzyme de type lis reconnaissant une séquence d'ADN, en particulier une séquence d'ADN unique.

L'invention ne saurait se limiter à une seule enzyme de type lis reconnaissant une séquence unique.

Toute enzyme de type Ils présentant l'activité de restriction voulue, c'est-à-dire pouvant se lier à ladite séquence unique et générer les séquences d'ADN monobrin attendues, fait partie de la présente invention.

De même, toute séquence présentant une variation n'affectant pas ou peu la reconnaissance et /ou l'activité de l'enzyme de type lis fait partie de l'invention.

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori-AmpR Bsal B (SEQ ID NO : 36), pCMV Bsal B (SEQ ID NO : 37), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), et shB3Galt6 Bsal A

(SEQ ID NO : 40), pour obtenir le vecteur VI (SEQ ID NO : 41). Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori-AmpR Bsal B (SEQ ID NO :36), pCMV Bsal B (SEQ ID NO : 37), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), shB3GALT6 Bsal B (SEQ ID NO : 46), et HygroR Bsal B (SEQ ID NO : 47), pour obtenir le vecteur Vl.l (SEQ ID NO : 48).

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori-AmpR Bsal B (SEQ ID NO : 36), rosa26-5' Bsal A B (SEQ I D NO : 39), shB3GALT6 Bsal B (SEQ !D NO : 46), HygroR Bsal C (SEQ I D NO : 51), et rosa26- 3' Bsal A (SEQ I D NO : 52), pour obtenir le vecteur VI.2 (SEQ I D NO : 53).

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur 5 circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori-AmpR Bsal B (SEQ I D NO : 36), rosa26-5' Bsal A (SEQ I D NO : 49), pCMV Bsal C (SEQ I D NO : 50), hFUT3 Bsal A (SEQ I D NO : 38), BGHpA Bsa l B(SEQ I D NO : 39), shB3GALT6 Bsal B (SEQ I D NO : 46), HygroR Bsal C (SEQ ID NO : 51), rosa26-3' Bsal B (SEQ I D NO : 54), pEFla Bsa l A (SEQ ID NO : 55), TK Bsal A (SEQ I D NO : 56), et Tkter Bsal A (SEQ I D 10 NO : 57), pour obtenir le vecteur V1.3 (SEQ I D NO : 58).

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori-AmpR Bsal B (SEQ I D NO : 36), pCMV Bsal B (SEQ 15 I D NO : 37), T03G Bsa l A (SEQ I D NO : 59), BGHpA Bsal B (SEQ ID NO : 39), pTRE3G Bsal A (SEQ I D NO : 60), mB3Galt6 Bsal B(SEQ I D NO : 63), et Tkter Bsal A (SEQ I D NO : 57), pour obtenir le vecteur V2 (SEQ I D NO : 62).

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur 20 circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori-AmpR Bsal B (SEQ I D NO : 36), pCMV Bsal B (SEQ I D HO : 37), T03G Bsal A (SEQ I D NO : 59), BGHpA Bsal B (SEQ ID NO : 39), pTRE3G Bsal A (SEQ D HO : 60), mb3GALT6 Bsal B (SEQ I D NO :63), Tkter Bsal B (SEQ I D NO :64), et shB3Ga!t6 Bsal C (SEQ I D NO :65), pour obtenir le vecteur V3 (SEQ ID NO : 66).

25

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori Bsal A (SEQ I D NO : 104), AmpR Bsal A (SEQ I D NO : 105), pCMV Bsal B (SEQ I D NO : 37), T03G Bsal A (SEQ I D NO : 59), BGHpA Bsal B (SEQ I D NO : 30 39), pTRE3G Bsa l A (SEQ I D NO : 60), mB3Galt6 Bsal B (SEQ I D NO : 63), et Tkter Bsa l A (SEQ ID NO : 57), pour obtenir le vecteur V2b (SEQ I D NO : 149).

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori Bsal A (SEQ ID NO : 104), Amp Bsal A (SEQ ID NO : 105), pC V Bsal B (SEQ !D NO : 37), T03G Bsal A (SEQ ID NO : 59), BGHpA Bsal B (SEQ ID NO : 39), pTRE3G Bsal A (SEQ ID NO : 60), mb3GALT6 Bsal B (SEQ ID NO :63), Tkter Bsal B (SEQ ID NO : 64), et shB3Gait6 Bsal C (SEQ ID NO : 65), pour obtenir le vecteur V3b (SEQ !D NO : 150).

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori Bsal B (SEQ ID NO : 106), AmpR Bsal B (SEQ ID NO : 107), pEFlaL Bsal B (SEQ ID NO : 108), EGFP-CAAX Bsal A (SEQ ID NO : 109), BGHpA Bsal C (SEQ ID NO : 110), pCMV Bsal D (SEQ ID NO : 111), SiaT Bsal B (SEQ ID NO : 112), mCherry Bsal B (SEQ ID NO : 113), TKter Bsal B (SEQ ID NO : 64) et HygroR Bsal D (SEQ ID NO : 114), pour obtenir le vecteur VI. lb (SEQ ID NO : 151).

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d'ADN double brin tel que défini précédemment comprenant une étape de mise en contact simultanée des briques moléculaires Ori-2 Bsal C (SEQ ID NO : 115), AmpR Bsal C (SEQ ID NO : 116), MNNIO-Lrec Bsal A (SEQ ID NO : 117), KanMX Bsal A (SEQ ID NO : 119), MNNIO-Rrec Bsal A (SEQ ID NO : 118), pour obtenir le vecteur V4 (SEQ ID NO : 152). Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d ' ADN double brin tel que défini précédemment pour obtenir un vecteur choisi parmi le groupe de vecteurs de séquence SEQ ID NO : 30, 31, 32, 33, 34 et 35.

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d ' ADN double brin tel que défini précédemment pour obtenir un vecteur choisi parmi le groupe de vecteurs de séquence SEQ D NO : 41, 48, 53, 58, 62 et 66.

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d ' ADN double brin tel que défini précédemment pour obtenir un vecteur choisi parmi le groupe de vecteurs de séquence SEQ ID NO : 149, 150, 151 et 152.

Selon un mode de réalisation, l'invention concerne un procédé de fabrication d'un vecteur circulaire d'ADN double brin tel que défini précédemment pour obtenir un vecteur choisi parmi le groupe de vecteurs de séquence SEQ ID O : 30, 31, 32, 33, 34, 35, 41, 48, 53, 58, 62, 66, 149, 150, 151 et 152.

Selon un aspect particulier, la présente invention porte sur un procédé tel que celui décrit ci- dessus comprenant :

a) une étape de mise en contact simultanée de n briques moléculaires, chaque brique moléculaire étant une molécule d'ADN linéaire double brin, en particulier une molécule d'ADN linéaire double brin à extrémités non cohésives, et contenant : (i) Une séquence d'intérêt (Sl)i dépourvue de site de reconnaissance spécifique de la susdite enzyme de restriction de type Ils et comprenant au moins une unité, ladite unité étant une unité fonctionnelle ou une unité non fonctionnelle, ladite unité fonctionnelle comprenant au moins un module, ledit module étant un module fonctionnel ou un module non fonctionnel, et (ii) deux adaptateurs d'ADN double brin A(i-l,i) et A(i,i+1), différents l'un de l'autre, flanqués respectivement en amont et en aval de ladite séquence d'intérêt (Sl)i, chaque adaptateur d'ADN double brin consistant en une séquence d'au moins 12 nucléotides,

la séquence d'au moins 12 nucléotides de l'adaptateur d'ADN double brin A(i-l,i) contenant un seul et unique site de reconnaissance de la susdite enzyme de restriction de type Ils, et une suture d'au moins 2 nucléotides, s(i-l, i) en aval du site de reconnaissance de ladite enzyme de restriction de type Ils,

la séquence d'au moins 12 nucléotides de l'adaptateur d'ADN double brin A(i,i+1) contenant un seul et unique site de reconnaissance de la susdite enzyme de restriction de type Ils, et une suture d'au moins 2 nucléotides, s(i,i+l), en amont du site de reconnaissance de ladite enzyme de restriction de type Ils,

le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur d'ADN double brin A(i-l,i) en amont de ladite séquence d'intérêt et le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur d'ADN double brin A(i,i+1) en aval de ladite séquence spécifique étant convergents,

(Sl)l étant la séquence d'intérêt (Sl)i dans laquelle i=l

(Sl)n étant la séquence d'intérêt (Sl)i dans laquelle i=n

n étant un nombre entier allant de 2 à 100, i allant de 1 à n, i étant différent de n quand i=l et quand i=n alors i+1 est 1 et lorsque i=l, alors i-1 =n, de sorte que la suture monobrin cohésive d'au moins 2 nucléotides générée en amont de (SI) 1, si-1, est la séquence complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides générée en aval de (Sl)n, sn +1,

et lorsque i=n alors la suture monobrin cohésive d'au moins 2 nucléotides générée en aval de (Sl)n, sn+1, est la séquence complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides générée en amont de (Sl)l, si-1,

laquelle étape conduit :

- à l'élimination des sites de reconnaissance de l'enzyme de restriction de type Ils utilisée,

- à la formation d'une extrémité cohésive constituée par une suture monobrin d'au moins 2 nucléotides, à chacune des extrémités amont et aval de chacune des (Sl)i et

- à l'appariement par complémentarité nucléotidique de la susdite suture monobrin cohésive d'au moins 2 nucléotides en aval de (Sl)i avec la suture monobrin cohésive d'au moins 2 nucléotides en amont de la (Sl)i+1, et de la susdite suture monobrin cohésive d'au moins 2 nucléotides en amont de la (Sl)i avec la susdite suture monobrin cohésive d'au moins 2 nucléotides en aval de (Sl)i-l - et au positionnement des susdites (Sl)i de façon contigue les unes aux autres, selon un ordre et un sens unique et déterminé, b) une étape de ligation des susdites sutures monobrins cohésives d'au moins 2 nucléotides pour obtenir un vecteur circulaire d'ADN double brin.

Selon l'invention, le site de reconnaissance de l'enzyme de type Ils de l'adaptateur en aval de la séquence d'intérêt, est localisé et orienté de sorte que l'enzyme coupe l'ADN de telle façon que le site de reconnaissance est éliminé, et une suture monobrin est générée (figure 1). Selon l'invention le procédé est mis en œuvre en présence d'une ligase.

On entend par ligase, une enzyme de la classe des ligases (EC6) qui lie les brins d'acides nucléiques, en particulier les ADN ligase (EC 6.5.1.1). Une ligase selon l'invention lie des extrémités d'ADN, d'oligonucléotides, d'A N et d'hybride ARN-ADN. De préférence, une ligase selon l'invention lie des molécules d'acides nucléiques à extrémités cohésives.

La ligase utilisée dans le procédé selon l'invention est une ligase choisie parmi une ligase T3, T4 T7 ou Taq ligase, préférentiellement une ligase T3 et plus préférentiellement une ligase T7 (T7 DNA ligase) et encore plus avantageusement, une T4 ligase. Selon un mode de réalisation avantageux, le procédé selon l'invention est un procédé dans lequel l'étape (a) de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, en présence d'une seule enzyme de restriction de type Ils, est effectuée à une température allant de 20°C à une température de 55°C, pendant une période allant de 2 minutes à une période de 30 minutes,

l'étape (b) de ligation est effectuée à une température allant de 10°C à une température de 40°C pendant une période allant de 2 min à un période de 30 min,

(a) et (b) pouvant être répétées de 1 à 49 fois,

ledit procédé comprenant en outre,

(c) au moins une étape d'incubation à une température de 41 à 60°C pendant une période allant de 0.5 à 15 min, et éventuellement,

(d) une étape d'incubation à une température de 61 à 90°C pendant une période allant de 0.5 à 15 minutes. Selon un mode de réalisation avantageux, le procédé selon l'invention est un procédé dans lequel l'étape (a) de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, en présence d'une seule enzyme de restriction de type Ils, est effectuée à une température allant de 20°C à une température de 55°C, pendant une période allant de 2 minutes à une période de 30 minutes,

l'étape (b) de ligation est effectuée à une température allant de 10°C à une température de 40°C pendant une période allant de 2 min à un période de 30 min,

(a) et (b) pouvant être répétées de 1 à 49 fois,

ledit procédé comprenant en outre,

(c) au moins une étape d'incubation à une température de 41 à 60°C pendant une période allant de 0.5 à 15 min et

(d) une étape d'incubation à une température de 61 à 90°C pendant une période allant de 0.5 à 15 minutes.

Selon un mode de réalisation particulier, le procédé selon l'invention est un procédé dans lequel l'étape

(a) de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, en présence d'une seule enzyme de restriction de type Ils, est effectuée à une température allant de 20°C à une température de 55°C, pendant une période allant de 2 minutes à une période de 30 minutes, l'étape (b) de ligation s'effectue à une température supérieure à 40°C en présence de TAq Ligase. Selon ce mode de réalisation particulier, l'étape (b) de ligation s'effectue à une température inférieure à 95°C, de préférence inférieure à 65 °C.

L'étape (b) de ligation est effectuée pendant une période allant de 2 min à un période de 30 min, 5 et (b) pouvant être répétées de 1 à 49 fois,

ledit procédé comprenant en outre,

(c) au moins une étape d'incubation à une température de 41 à 60°C pendant une période allant de 0,5 à 15 min, et éventuellement,

(d) une étape d'incubation à une température de 61 à 90°C pendant une période allant de 0.5 à 10 15 minutes.

Selon un mode de réalisation particulier, le procédé selon l'invention est un procédé dans lequel l'étape

(a) de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de 15 l'autre, en présence d'une seule enzyme de restriction de type Ils, est effectuée à une température allant de 20°C à une température de 55°C, pendant une période allant de 2 minutes à une période de 30 minutes, l'étape

(b) de ligation s'effectue à une température supérieure à 40°C en présence de TAq Ligase. Selon ce mode de réalisation particulier, l'étape (b) de ligation s'effectue à une température inférieure à

20 95°C, de préférence inférieure à 65 °C.

L'étape (b) de ligation est effectuée pendant une période allant de 2 min à un période de 30 min, et (b) pouvant être répétées de 1 à 49 fois,

ledit procédé comprenant en outre,

(c) au moins une étape d'incubation à une température de 41 à 60°C pendant une période allant 25 de 0,5 à 15 min et

(d) une étape d'incubation à une température de 61 à 90°C pendant une période allant de 0.5 à 15 minutes.

Selon un autre mode de réalisation, le procédé de fabrication d'un vecteur circulaire d'ADN 30 double brin selon l'invention est un procédé dans lequel l'une des au moins deux séquences d'intérêt comprend au moins une unité non fonctionnelle.

Selon un autre mode de réalisation, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé comportant au moins deux séquences d'intérêt, dans lequel lesdites au moins deux séquences d'intérêt sont constituées d'une unité non fonctionnelle et dans lequel le positionnement desdites séquences d'intérêt de façon contigue les unes aux autres conduit à une entité fonctionnelle d'ADN double brin. Selon un mode de réalisation, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé de fabrication d'un vecteur circulaire d'ADN double brin dans lequel l'une des au moins deux séquences d'intérêt comprend au moins une unité fonctionnelle.

Selon l'invention, une unité fonctionnelle peut être une unité fonctionnelle d'expression ou un gène, une unité fonctionnelle d'intégration en cellule eucaryote ou procaryote, une unité fonctionnelle bactérienne.

Selon l'invention, une unité fonctionnelle d'expression ou un gène comprend une séquence codante et des éléments non codants tels qu'un promoteur, un terminateur, chacun pouvant être considéré individuellement comme un module fonctionnel.

Un gène selon l'invention est une séquence d'acide désoxyribonucléique (ADN) qui spécifie la synthèse d'une chaîne de polypeptides ou d'un acide ribonucléique (ARN). On peut également définir un gène comme une unité d'information génétique. Un gène comprend une séquence de nucléotides appelée promoteur, dont le rôle est de permettre l'initiation mais surtout la régulation de la transcription de l'ADN en ARN. Dans le cas d'ARN dit codant, la molécule d'ARN ainsi produite peut être traduite en protéine. La séquence d'ADN correspondant à l'information qui sera traduite en protéine est appelée cadre ouvert de lecture. Un ARN non traduit peut également être fonctionnel (ex : ARN ribosomaux, ARN de transfert, ARN interférant). Un gène peut se terminer par une séquence terminatrice appelée terminateur, qui marque la fin de la transcription.

Selon un mode de réalisation le vecteur selon l'invention permet d'apporter au moins une information génétique à la cellule hôte, en permettant l'expression ou l'inhibition d'au moins un gène, la fabrication ou le blocage d'au moins un ARN, d'au moins une protéine.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel au moins une unité fonctionnelle est une unité fonctionnelle choisie parmi les éléments suivants : (i) une unité fonctionnelle bactérienne,

(ii) une unité fonctionnelle d'expression,

(iii) une unité fonctionnelle d'intégration en cellule eucaryote ou procaryote,

(iv) ou une combinaison.

Selon l'invention, un vecteur d'expression peut contenir au moins trois éléments fonctionnels, 1. Origine de réplication bactérienne, 2. Un marqueur de sélection bactérien, 3. Une cassette d'expression. Le procédé de fabrication d'un vecteur circulaire d'ADN double brin selon l'invention est un procédé dans lequel l'une des au moins deux séquences d'intérêt comprend au moins une unité non fonctionnelle.

On entend par unité fonctionnelle bactérienne, une unité fonctionnelle comprenant une origine de réplication bactérienne et un marqueur de sélection bactérien.

Une origine de réplication selon l'invention peut être d'origine bactérienne ou artificielle (aussi appelée « ori »). C'est une séquence unique d'ADN permettant l'initiation de la réplication unidirectionnelle ou bidirectionnelle, en particulier dans une cellule bactérienne. La réplication est le processus au cours duquel l'ADN est synthétisé grâce à l'ADN polymérase. Ce mécanisme permet d'obtenir, à partir d'une molécule d'ADN, deux molécules d'ADN identiques à la molécule initiale, sauf erreur de l'enzyme. La structure de l'origine de réplication varie d'une espèce à l'autre. Dans l'unité fonctionnelle de réplication bactérienne, l'origine de réplication est d'origine bactérienne.

Des exemples d'origine de réplication incorporés ici par référence sont ceux décrits dans la Table 1 page 49 de l'article de Wang et al., 2009 (Zhijun Wang a„ Li Jin a,b, Zhenghong Yuan c, Grzegorz We t grzyn d, Alicja We t grzyn. Classification of plasmid vectors using réplication origin, sélection marker and promoter as criteria. Plasmid, 61 (2009) 47-51). Selon un aspect de l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'unité fonctionnelle bactérienne contient au moins une origine de réplication bactérienne choisie parmi les éléments figurant dans la publication de Wang et al., 2009 qui est incorporée dans sa totalité, ici par référence. Selon un autre aspect avantageux de l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'unité fonctionnelle bactérienne contient au moins une origine de réplication choisie parmi toutes les origines de réplication procaryotes de la Table 1 de Wang et al., 2009. De préférence les plasmides sont pMBl, pUC, CoIEl, pl5A, pSClOl, RI, RK2, R6K, pA81, pRAS3.1, pTi, pBPSl, pUOl, pKH9, pWKSl, pCDl, pMAK3, pBL63.1, pTA1060, p4M, pHT926, pCD6, pJBOl, plME300, pMD5057, pTE44, pDPl, ou pT38.

Un marqueur de sélection selon l'invention est un gène dont l'expression confère à son hôte une propriété mesurable comme par exemple la capacité à fabriquer un pigment ou à résister à un antibiotique.

Un marqueur de sélection bactérien est un gène dont l'expression confère à des bactéries transformées (qui ont incorporé le vecteur permettant l'expression du marqueur d'intérêt) une propriété mesurable.

Un marqueur de sélection bactérien permet par exemple de sélectionner des bactéries selon un crible défini. Il peut s'agir d'un gène de résistance à un antibiotique, d'un gène permettant la complémentation d'une auxotrophie, d'un gène codant l'expression d'une molécule détectable optiquement (colorant, marqueur chimio-luminescent, fluorochrome) ou de tout autre gène dont le produit permettrait de discriminer les colonies bactériennes.

Par définition, un marqueur de sélection bactérien est donc par exemple un gène de résistance à un antibiotique, ou un gène de criblage. Selon encore un autre aspect de l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'unité fonctionnelle bactérienne comporte au moins un module fonctionnel, le module fonctionnel étant un marqueur, en particulier un marqueur de sélection, et de préférence un marqueur de sélection qui est un gène de résistance à un antibiotique ou un gène de criblage.

Des exemples de marqueurs de sélection bactériens sont des gènes codant des éléments permettant une résistance à un antibiotique tels que:

gène bla (AmpR) permettant la résistance à l'ampicilline,

gène neo permettant la résistance à la néomycine, gène aph (kan ) permettant la résistance à la kanamycine,

gène cat permettant la résistance au chloramphénicol,

gène aad l permettant la résistance à la spectinomycine,

gène aacCl permettant la résistance à la gentamicine,

- gène tetA permettant la résistance à la tétracycline,

gène erm permettant la résistance à l'érythromycine,

gène van permettant la résistance à la vancomycine

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel le gène de résistance à un antibiotique est choisi parmi les gènes Ampicillin bla, Ampicillin blaA, Ampicillin blaZ, Kanamycin aph, Neomycin neo, Chloramphénicol cat, Chloramphénicol cmIA, Chloramphénicol catAIII, Chloramphénicol catB2, Chloramphénicol cmx, Gentamycin aacCl, Gentamycin aacC2, Tetracycline tetA(A), Tetracycline tetA(C), Tetracycline tetA(D), Tetracycline tetA(E), Tetracycline tetA(G), Tetracycline tetA(H), Tetracycline tetA(L), Tetracycline tetA(Q), Tetracycline tetA(S), Tetracycline tetA(Y)Tetracycline tetA(Z), Erythromycin erm, Vancomycin van, Spectinomycin aadA7, Streptomycin str. (Table 2, Wang et al., 2009).

De préférence, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel le gène de résistance à un antibiotique est choisi parmi les gènes permettant une résistance à l'ampicilline, à la kanamycine, à la néomycine, à la gentamycine, à la spectinomycine.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel le gène de criblage est le gène lac la.

Une unité fonctionnelle d'expression selon le procédé de l'invention est une unité qui comprend au moins un module fonctionnel, ledit module fonctionnel étant constitué par l'un des éléments suivants.

(i) une séquence régulatrice de l'expression des gènes ou séquence régulatrice de l'activité des séquences régulatrices des gènes, choisie parmi :

un promoteur, un terminateur, une séquence « Internai ribosome entry site » (1RES), (ii) une séquence nucléotidique codant un produit, en particulier une séquence nucléotidique codant un produit d'expression, et plus particulièrement une séquence nucléotidique codant une protéine,

(iii) une séquence codant une étiquette moléculaire ou

(iv) une combinaison de ces éléments.

Selon l'invention, un promoteur, ou séquence promotrice, est une région d'ADN constituante d'un gène et indispensable à la transcription de l'ADN en ARN. Le promoteur est la zone de l'ADN sur laquelle se fixent initialement les facteurs de transcriptions et l'ARN polymérase, avant de démarrer la synthèse de l'ARN. Les séquences promotrices sont en général situées en amont du site de démarrage de la transcription. Les promoteurs utilisés dans le procédé selon l'invention sont constitutifs ou inductibles.

Selon l'invention une séquence codante ou cadre de lecture est une séquence d'ADN qui, lorsqu'elle est transcrite par une enzyme qui est une ARN polymérase, correspond à un ARN, en particulier un ARN messager (ARNm). Ladite séquence codante se situe en aval du promoteur et en amont du terminateur dans le sens de lecture de la molécule.

L'ARNm transcrit peut aussi correspondre, sans être limité à une ou plusieurs phases ouvertes de lecture (ARN traductible en peptide ou protéine), à un ou plusieurs ARN non codant (ex : petit ARN interférant, micro-ARN, ARN catalytique).

Selon l'invention un terminateur ou terminateur de transcription est une séquence d'ADN qui marque la fin de la transcription d'un ARN par l'enzyme responsable de la transcription. Selon l'invention un terminateur est un terminateur procaryote ou eucaryote.

Selon l'invention une séquence 1RES (de l'anglais Internai ribosome entry site), est une séquence qui, dans les cellules eucaryotes, permet le démarrage de la traduction d'un ARN messager de manière interne. Le processus conventionnel de la traduction des ARNm eucaryotes repose sur un mécanisme de balayage par le ribosome à partir de la coiffe située à l'extrémité 5', qui scrute l'ARNm jusqu'au premier codon de démarrage. Les 1RES permettent le recrutement direct du ribosome au niveau de ce codon de démarrage, indépendamment de la présence de la coiffe et du mécanisme de balayage. Les 1RES sont des régions structurées de l'ARNm qui interagissent directement avec le ribosome ou avec les facteurs d'initiation de la traduction. Selon l'invention une étiquette moléculaire est une séquence d'ADN, en particulier codant un peptide ou une protéine qui sera fusionné à une protéine d'intérêt.

La séquence de l'étiquette est insérée, ou assemblée selon l'invention, en phase, en amont du premier codon de la protéine d'intérêt ou bien en aval du dernier codon de la protéine d'intérêt, ou à l'intérieur du cadre ouvert de lecture de la protéine d'intérêt. Les propriétés intrinsèques de l'étiquette permettent de visualiser et ou de purifier la protéine d'intérêt soit directement (fluorochrome) soit indirectement (épitope reconnu par un anticorps ou par une autre protéine, activité enzymatique,... ). Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'unité fonctionnelle d'expression comprend au moins un module fonctionnel, ledit module fonctionnel comprenant un promoteur, une séquence nucléotidique codant une protéine et un terminateur. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'unité fonctionnelle d'expression comprend au moins un module fonctionnel, ledit module fonctionnel comprenant un promoteur, une séquence nucléotidique codant une protéine ou un terminateur. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'unité fonctionnelle d'expression comprend au moins un module fonctionnel d'expression, ledit module fonctionnel comprenant un promoteur, une séquence nucléotidique codant une protéine, une étiquette moléculaire et un terminateur. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'unité fonctionnelle d'expression comprend au moins un module fonctionnel d'expression, ledit module fonctionnel comprenant un promoteur, une séquence nucléotidique codant une protéine, une étiquette moléculaire ou un terminateur. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'unité fonctionnelle d'expression comprend au moins un module fonctionnel d'expression, ledit module fonctionnel d'expression comprenant un promoteur, une séquence nucléotidique codant une protéine, une séquence 1RES, une seconde séquence nucléotidique codant une protéine et un terminateur. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'unité fonctionnelle d'expression comprend au moins un module fonctionnel d'expression, ledit module fonctionnel d'expression comprenant un promoteur, une séquence nucléotidique codant une protéine, une séquence 1RES, une seconde séquence nucléotidique codant une protéine ou un terminateur.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel au moins un module fonctionnel est un module fonctionnel d'expression contenant une séquence nucléotidique codant une protéine de fusion.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel un module fonctionnel est un promoteur.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel un module fonctionnel est un promoteur et ledit promoteur est un promoteur du cytomégalovirus (CMV), un promoteur EFla, un promoteur du virus SV40, un promoteur de la béta-actine ou un promoteur de l'ubiquitine C. De préférence, le promoteur selon l'invention est un promoteur choisi parmi les promoteurs décrits table 3 de Wang et al., 2009.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel un module fonctionnel est un gène codant un produit d'expression.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel un module fonctionnel est un gène codant un produit d'expression choisi parmi les gènes référencés dans la base de données « Gene » du NCBI (National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/gene/) et ledit gène codant un produit d'expression est un gène dont la séquence peut appartenir aux espèces, Homo sapiens, Mus musculus, Rattus norvegicus, Danio rerio, Caenorhabditis elegans, Saccharomyces Cerevisiae, Arabidopsis thaliana, rosophila melanogaster, ou à toute autre espèce référencée.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel un module fonctionnel est un terminateur. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel un module fonctionnel est un terminateur et ledit terminateur est une séquence de polyadénylation. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel au moins un module fonctionnel est un marqueur ou étiquette moléculaire choisi parmi la séquence AviTag, Calmodulin-tag, polyglutamate tag, E-tag, FLAG-tag, HA-tag, His- tag, Mc-tag, S-tag, SBP-tag, Softag 1, Softag 3, Strep-tag, TC tag, V5 tag, VSV-tag, Xpress tag, Isopeptag , SpyTag, BCCP (Biotin Carboxyl Carrier Protein), Glutathione-S-transferase-tag, Green fluorescent protein-tag, Maltose binding protein-tag, Nus-tag, Thioredoxin-tag, Fc-tag, Designed Intrinsically Disordered tags containing disorder promoting amino acids (P,E,S,T,A,Q,G,...) and Ty tag.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel au moins un module fonctionnel est un marqueur moléculaire (ou étiquette moéluculaire) ledit marqueur moléculaire étant une protéine d'affinité, choisie parmi la Maltose Binding Protein (MBP), la Glutathione-S-Transferase (GST), la protéine Tandem Affinity Purification (TAP)-Tag, TAP-Tag, ou une séquence codant une protéine fluorescente, de préférence la GFP ou l'un de ses nombreux variants (BFP, CFP, YFP, mCherry...).

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est en particulier un procédé dans lequel au moins une unité fonctionnelle est une unité fonctionnelle d'intégration en cellule eucaryote. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel ladite unité fonctionnelle d'intégration en cellule eucaryote comprend au moins un module fonctionnel comprenant au moins un élément choisi parmi :

-un gène de sélection,

-une séquence de maintien en cellule eucaryote,

-une séquence d'intégration, en particulier une séquence d'intégration homologue

-une ou plusieurs séquences impliquées dans l'édition d'ADN et/ou une ou plusieurs séquences impliquées dans la recombinaison homologue ciblée,

- ou une combinaison de ces éléments. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel le gène de sélection est un gène de sélection positive ou un gène de sélection négative. Selon un mode avantageux, un gène de sélection est un gène de sélection positive ou un gène de sélection négative et peut dépendre ou non de la présence de substrats externes.

Selon l'invention, un gène de sélection positive est un gène qui permet la survie voire la croissance de la cellule ou de l'hôte dont le génome a été génétiquement modifié en présence d'agents normalement toxiques pour la cellule ou l'hôte (par exemple un antibiotique, un herbicide ou un médicament). Certains gènes de sélection positive ne sont pas conditionnés à des substrats extérieurs, mais modifient des processus physiologiques régissant le développement des cellules (bactéries, champignons , animaux ou plantes le cas échéant). Selon l'invention, un gène de sélection négative provoque la mort des cellules ou de l'hôte génétiquement modifiés dans certaines conditions, contrôlables et connues de l'expérimentateur. Selon l'invention une séquence de maintien en cellule eucaryote est une séquence d'ADN utilisable dans le cas où le vecteur est destiné à se maintenir dans la descendance cellulaire de la cellule récipiendaire, en absence d'intégration au génome hôte. Il peut s'agir d'origine de réplication propre à l'espèce de la cellule modifiée (exemple séquence Autonomous eplicating Séquence (ARS) pour la levure), de séquence de centromère permettant la ségrégation des molécules d'ADN dupliquées dans chacune des cellules filles.

Selon l'invention, une séquence homologue au génome eucaryote est une séquence permettant l'intégration par recombinaison homologue. Le vecteur d'expression peut contenir des séquences d'ADN correspondant à l'ADN génomique de l'organisme ou de la cellule ciblée. Ces séquences sont déterminées expérimentalement et peuvent correspondre à des loci connus pour leur susceptibilité à la recombinaison homologue. Selon l'invention une séquence impliquée dans l'édition d'ADN est une séquence d'ADN spécifiquement reconnue par une recombinase qui permet la modification ciblée de la molécule d'ADN. Par exemple la séquence LoxPl reconnues par la recombinase Cre, ou la séquence FRT reconnues par la recombinase Flp. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel le gène de sélection et un gène de sélection positive, en particulier un gène de sélection positive en cellule eucaryote. Selon un mode de réalisation, un gène de sélection positive est un gène de résistance aux antibiotiques choisi parmi : les gènes de résistance à l'hygromycine B ou à ses dérivés, les gènes de résistance au G418 ou à ses dérivés, les gènes de résistance à l'ampicilline ou à ses dérivés , les gènes de résistance à la tétracycline ou à ses dérivés, les gènes de résistance à la puromycine ou à ses dérivés, ou les gènes de résistance à la zéocine ou à ses dérivés.

Selon un autre mode de réalisation, un gène de sélection positive en cellule eucaryote est un gène de résistance aux antibiotiques choisi parmi les gènes de résistance à l'hygromycine B ou à ses dérivés, les gènes de résistance au G418 ou à ses dérivés, les gènes de résistance à la puromycine ou à ses dérivés, ou les gènes de résistance à la zéocine ou à ses dérivés.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel le gène de sélection négative est un gène de sélection négative codant la thymidine kinase dans la levure. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel la séquence de maintien en cellule eucaryote est une séquence de réplication autonome (Autonomous eplicating Séquence- ARS) ou une séquence de centromère telle que définie pour la levure. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel la séquence d'intégration homologue est un locus Rosa 26 ou un locus hypoxanthine phosphoribosyltransferase (HPRT).

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel la séquence impliquée dans l'édition d'ADN et/ou la séquence impliquée dans la recombinaison homologue ciblée est une séquence de 34 nucléotides du bactériophage PI « locus of X over PI » (LoxPl) de séquence générique ATAACTTCGTATA -NNNTANNN- TATACGAAGTTAT (SEQ ID NO : 67) dans laquelle N est A, T, G ou C, de préférence une séquence Cre recombinase-LoxP. Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel la séquence impliquée dans l'édition d'ADN et/ou la séquence impliquée dans la recombinaison homologue ciblée est une séquence F T Fip-FRT en particulier une séquence GAAGÏTCCTATTCtctagaaaGLATAGGAACTTC (5EQ ID NO : 68),

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'enzyme de restriction de type Ils est une enzyme de restriction de type Ils choisie parmi Bsal, Eco31l, Bbsl, Bpil, BsmBI, Esp3l, BspMI, BfuAI et Bvel.

De préférence, la seule enzyme de restriction de type Ils utilisée dans le procédé selon l'invention est Bbsl et plus préférentiellement la seule enzyme de type Ils utilisée dans le procédé selon l'invention est Bsal.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel l'adaptateur d'ADN double brin en aval ou en amont de ladite séquence d'intérêt, comprend en outre au moins un site de reconnaissance d'une enzyme de restriction de type llp, avantageusement au moins un site de reconnaissance d'une enzyme de restriction rare telles que Notl, Pacl, Pmel, Swal, Smil, Sgsl, SgrDI, SgrAI, Sbfl, Fsel, Ascl, AsiSI, Mrel, Mssl et plus avantageusement deux sites de reconnaissance d'enzymes de restriction choisis parmi Kpnl, Agel, EcoRI et BstBI, Sali et Mlul.

En général, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel les adaptateurs d'ADN double brin en amont et en aval de ladite séquence d'intérêt comprennent au moins un site de reconnaissance d'une enzyme de restriction de type Ils dont un seul et unique site de reconnaissance de l'enzyme de restriction de type Ils présente dans l'étape (a) de mise en contact simultanée d'au moins deux briques moléculaires, enzyme qui coupe l'ADN des adaptateurs et génère des extrémités simple brin d'au moins deux nucléotides de part et d'autre des séquences d'intérêt, (ou l'enzyme de type Ils utilisée dans le procédé selon l'invention à l'étape a).

Selon un mode de réalisation particulier, le procédé selon l'invention est un procédé dans lequel les adaptateurs d'ADN double brin en amont et en aval de ladite séquence d'intérêt ne comprennent aucun site de reconnaissance d'une enzyme de restriction de type Ils autre que celui de l'enzyme de restriction de type Ils, présente dans l'étape de mise en contact simultanée d'au moins deux briques moléculaires différentes l'une de l'autre.

Selon un mode de réalisation avantageux, le procédé de fabrication d'un vecteur circulaire d'ADN double brin selon l'invention est un procédé dans lequel chaque adaptateur d'ADN double brin, en amont et en aval de ladite séquence d'intérêt, ne comprend qu'un seul (et unique) site de reconnaissance de l'enzyme de restriction de type Ils présente dans l'étape (a) de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, et chaque adaptateur ne comprend aucun autre site de reconnaissance d'une enzyme de restriction de type Ils.

Plus précisément, le procédé de fabrication d'un vecteur circulaire d'ADN double brin selon l'invention est un procédé dans lequel chaque adaptateur d'ADN double brin en amont et en aval de ladite séquence d'intérêt, ne comprend qu'un seul (et unique) site de reconnaissance d'une seule enzyme de restriction de type Ils qui est l'enzyme de restriction de type Ils présente dans l'étape (a) de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, enzyme qui coupe l'ADN des adaptateurs et génère des extrémités simple brin d'au moins deux nucléotides de part et d'autre des séquences d'intérêt ou encore l'enzyme de type Ils utilisée dans le procédé selon l'invention.

Selon un mode de réalisation avantageux, le procédé de fabrication d'un vecteur circulaire d'ADN double brin selon l'invention est un procédé dans lequel le site de reconnaissance d'une enzyme de restriction de type Ils présent dans chaque adaptateur consiste en un site unique de reconnaissance de l'enzyme de type Ils utilisée dans le procédé selon l'invention.

En particulier, le site unique de reconnaissance de l'enzyme de type Ils utilisé dans le procédé selon l'invention, est un site reconnu par Bbsl et plus préférentiellement par Bsal.

Selon un mode de réalisation particulier, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel les adaptateurs d'ADN double brin en amont et en aval de ladite séquence d'intérêt comprennent un seul (et unique) site de reconnaissance de l'enzyme de restriction de type Ils présente dans l'étape (a) de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, et au moins un site de reconnaissance d'une enzyme de restriction de type Ils, ladite enzyme de type Ils étant une enzyme, autre que celle présente dans l'étape a) de mise en contact simultanée d'au moins deux briques moléculaires différentes l'une de l'autre.

Selon l'invention, la suture monobrin cohésive d'au moins 2 nucléotides à chacune des extrémités amont et aval de la séquence d'intérêt, comprend 2 à 10 nucléotides, de préférence 2 à 5 nucléotides, et plus particulièrement 4 nucléotides.

Le procédé selon l'invention est un procédé dans lequel la suture monobrin cohésive d'au moins 2 nucléotides à chacune des extrémités amont et aval de la séquence d'intérêt comprend 2 à 10 nucléotides, de préférence 2 à 5 nucléotides, et plus particulièrement 4 nucléotides.

Selon un mode de réalisation particulier, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel les sutures monobrin cohésives d'au moins 2 nucléotides à chacune des extrémités amont et aval de la séquence d'intérêt comprennent indépendamment l'une de l'autre, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, ou 12 nucléotides.

Dans le procédé selon l'invention, chaque suture monobrin cohésive d'au moins 2 nucléotides générée à partir d'une brique moléculaire s'apparie avec une seule suture monobrin cohésive d'au moins 2 nucléotides générée à partir d'une autre brique moléculaire.

Selon encore un autre aspect de l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel la suture monobrin cohésive d'au moins 2 nucléotides ne peut s'apparier qu'avec une seule autre suture monobrin cohésive d'au moins 2 nucléotides présente dans le mélange réactionnel.

Selon l'invention le milieu réactionnel est un milieu dans lequel le procédé selon l'invention est mis en œuvre.

Selon un mode de réalisation particulier, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel la suture mono brin cohésive d'au moins 2 nucléotides, en amont et en aval de la séquence d'intérêt, est conçue à l ' aide d'une matrice de score.

Selon l'invention, le procédé de fabrication d'un vecteur circulaire d'ADN double brin est un procédé dans lequel ladite enzyme de restriction de type Ils coupe l'ADN à une distance allant de 2 à 15 nuciéotides, 2 à 14. 2 à 13, 2 à 12, 2 à 11, 2 à 10, 2 à 9,. 2 à 8, 2 à 7, 2 à 6, 2 à 5, 2 à 4, 2 à 3 nucléotides du site de reconnaissance spécifique de ladite enzyme de type Ils,

Avantageusement, ladite enzyme de restriction de type Ils coupe l'un des deux brins d'ADN à une distance de 2 nucléotides, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, ou 15 nuciéotides du site de reconnaissance spécifique de ladite enzyme de type Ils.

Selon le procédé de l'invention, la séquence complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides générée en amont n'est pas complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides générée en aval d'une même brique, la séquence complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides générée en amont de la (Sl)l, (si-1), (de la première brique) est complémentaire de la suture monobrin cohésive d'au moins 2 nucléotides en aval de la séquence (Sl)n, (sn+1) (de la dernière brique). Selon l'invention, le procédé comprend, avant l'étape de mise en contact simultanée d'au moins deux briques moléculaires, une étape de préparation de chacune des briques moléculaires, par synthèse chimique ou par une étape d'amplification par PC de la séquence d'intérêt contenue dans une brique à l'aide d'une amorce sens comprenant, de 5' en 3', une séquence correspondant à la séquence de l'adaptateur, et au moins 14 nucléotides de la séquence d'intérêt et d'une amorce anti-sens comprenant de 5' en 3' au moins 14 nucléotides de la séquence d'intérêt et au moins une séquence correspondant à la séquence de l'adaptateur.

Dans un mode de réalisation, le procédé comprend, avant l'étape de mise en contact simultanée d'au moins deux briques moléculaires, une étape de préparation de chacune des briques moléculaires, par synthèse chimique ou par une étape d'amplification par PCR de la séquence d'intérêt contenue dans une brique à l'aide d'une amorce sens comprenant, de 5' en 3', une séquence correspondant à la séquence de l'adaptateur, et au moins 14 à 20 nucléotides de la séquence d'intérêt et d'une amorce anti-sens comprenant de 5' en 3' au moins 14 à 20 nucléotides de la séquence d'intérêt et au moins une séquence correspondant à la séquence de l'adaptateur.

Dans un mode de réalisation, le procédé comprend, avant l'étape de mise en contact simultanée d'au moins deux briques moléculaires, une étape de préparation de chacune des briques moléculaires, par synthèse chimique ou par une étape d'amplification par PCR de la séquence d'intérêt contenue dans une brique à l'aide d'une amorce sens comprenant, de 5' en 3', une séquence correspondant à la séquence de l'adaptateur, et au moins 14, 15, 16, 17, 18, 19 ou 20 nucléotides de la séquence d'intérêt et d'une amorce anti-sens comprenant de 5' en 3' au moins 14, 15, 16, 17, 18, 19 ou 20 nucléotides de la séquence d'intérêt et au moins une séquence correspondant à la séquence de l'adaptateur.

La PC est une réaction en chaîne par polymérase et permet de reproduire l'ADN en quantité.

La présente invention porte également sur un procédé de fabrication d'un vecteur circulaire d'ADN double brin comprenant une étape de préparation de chacune des briques moléculaires, laquelle étape étant constituée par une étape d'amplification par réaction en chaîne par polymérase (PCR) d'une séquence d'intérêt contenue dans une matrice à l'aide d'une amorce sens comprenant de 5' en 3', au moins une séquence correspondant à un adaptateur et au moins 14 nucléotides de la séquence d'intérêt et d'une amorce anti-sens comprenant de 5' en 3' au moins une séquence correspondant à un adaptateur et au moins 14 nucléotides de la séquence d'intérêt , une étape de mise en contact simultanée d'au moins deux briques moléculaires, différentes l'une de l'autre, en présence d'une seule enzyme de restriction, ladite seule enzyme de restriction étant une enzyme de restriction de type Ils, chaque brique moléculaire étant une molécule d'ADN linéaire double brin à extrémités non cohésives, et contenant :

(i) une séquence d'intérêt dépourvue de site de reconnaissance spécifique de la susdite enzyme de restriction de type Ils et comprenant au moins une unité, ladite unité étant une unité fonctionnelle ou une unité non fonctionnelle, ladite unité comprenant au moins un module, ledit module étant un module fonctionnel ou un module non fonctionnel,

(ii) deux adaptateurs d'ADN double brin, flanqués en amont et en aval de ladite séquence d'intérêt, chaque adaptateur d'ADN double brin consistant en une séquence d'au moins 12 nucléotides, laquelle contient:

un seul et unique site de reconnaissance de la susdite enzyme de restriction de type Ils,

le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur en amont de ladite séquence d'intérêt et le site de reconnaissance de la susdite enzyme de restriction de type Ils de l'adaptateur en aval de ladite séquence d'intérêt étant convergents, laquelle étape conduit :

- à l'élimination par coupure des sites de reconnaissance de l'enzyme de restriction de type Ils utilisée, - la formation d'une suture monobrin cohésive d'au moins 2 nucléotides à chacune des extrémités de ladite séquence d'intérêt,

ladite suture monobrin cohésive d'au moins 2 nucléotides en amont d'une des au moins deux séquences d'intérêt étant capable de s'apparier à ladite suture monobrin cohésive d'au moins 2 nucléotides en aval d'une autre séquence d'intérêt,

- à l'appariement par complémentarité nucléotidique des susdites sutures monobrins cohésives d'au moins 2 nucléotides et

- au positionnement des séquences d'intérêt, de façon contigue les unes aux autres, selon un ordre et un sens unique et déterminé,

b) une étape de ligation des susdites sutures monobnns cohésives d'au moins 2 nucléotides, pour obtenir un vecteur circulaire d'ADN double brin.

La PCR est une réaction en chaîne par poiymérase et permet de reproduire i'AD en quantité. MODES DE REALISATION PARTICULIERS DE L'INVENTION

Il existe de nombreuses variantes potentielles de l'invention. Plusieurs enzymes de restriction peuvent être utilisées pour réaliser l'assemblage. Cela inclut des enzymes de restriction de type Ils comme Bsal, Bpil, BsmBI, Esp3l, BspMI. En fait n'importe quelle enzyme de type Ils qui possède un site de coupure éloigné de son site de reconnaissance et qui génère une séquence débordante de 2 ou 3 nucléotides ou plus peut être utilisée pour l'assemblage. Selon l'enzyme utilisée, les conditions d'incubation pour l'assemblage (tampon, température, temps, nature de l'ADN ligase) sont optimisables. Pour chaque enzyme utilisée dans l'assemblage, une collection de fragments d'ADN et de séquences d'intérêt dépourvus de sites de reconnaissance de cette enzyme est générée.

1. Préparation des briques d'ADN.

La préparation de briques d'ADN à partir d'une matrice est faite par la technique de Polymerase Chain Reaction (PCR), en utilisant des amorces oligonucléotidiques soigneusement choisies. La synthèse de gène (synthèse chimique) peut également être utilisée comme méthode alternative d'obtention de brique.

Par PCR, les amorces permettent l'amplification du fragment d'ADN par une poiymérase à haute- fidélité, afin de limiter au maximum le nombre de mutations qui pourraient être introduites aléatoirement par l'ADN polymérase. D'autre part, ces amorces permettent d'introduire les adaptateurs contenant notamment le(s) site(s) de reconnaissance de l'enzyme de type Ils utilisée pour l'assemblage ainsi que les sutures qui permettront d'obtenir un assemblage orienté. Une brique contiendra donc une séquence d'intérêt flanquée de deux adaptateurs (en 5' et 3' de ladite séquence d'intérêt). Les sites de reconnaissance de l'enzyme de restriction de type Ils utilisée pour l'assemblage, potentiellement présents dans la séquence d'intérêt, sont indésirables et doivent au préalable être éliminés par mutagenèse dirigée ou par tout autre méthode appropriée.

1.1. Définition des amorces

Les amorces oligonucléotidiques utilisées pour la création de briques, contiennent 2 parties essentielles.

En partie 5' ces amorces contiennent la séquence d'un adaptateur. L'adaptateur contient une séquence comprenant :

une séquence de 2 nucléotides minimum, pouvant contenir ou participer à 1 ou plusieurs sites de restriction d'endonucléase de type II ,

une séquence de 5, 6, 7 ou plus nucléotides correspondant au site de fixation de l'enzyme à activité de type Ils utilisée pour l'assemblage,

- une séquence de 1 à 8 et plus nucléotides correspondant à l'espacement entre le site de fixation et le site de coupure de l'enzyme utilisée. La longueur de cette séquence dépend des caractéristiques intrinsèques de l'enzyme de type Ils utilisée,

une séquence de 2 à 5 ou plus, nucléotides correspondant à l'extrémité simple brin générée par l'action de l'enzyme de type Ils utilisée. Cette séquence permettant l'appariement des fragments à assembler, elle correspond de facto à la définition de suture.

En partie 3', les amorces contiennent une séquence de 14 à 100 nucléotides correspondant aux extrémités 5' de la séquence d'intérêt, qui permettra l'hybridation des amorces à des zones complémentaires de la matrice et l'amplification de la séquence d'intérêt. Cette séquence est de taille variable mais supérieure ou égale à 14 nucléotides. De plus elle est choisie de manière à i) respecter des Tm (température de fusion) assez proches pour deux amorces conçues pour la fabrication d'une brique donnée et ii) dans la mesure du possible finir l'amorce sur au moins un G ou un C et pas plus de 2 G ou C consécutifs.

On entend par matrice selon l'invention une molécule d'ADN contenant la séquence d'intérêt à amplifier. Il peut s'agir par exemple d'ADN génomique, d'ADN complémentaire obtenu par transcription inverse d'un A Nm ou d'un plasmide.

Selon un autre mode de réalisation, des séquences supplémentaires peuvent être insérées entre la séquence de l'adaptateur et la séquence complémentaire de la matrice. Il peut s'agir par exemple d'une séquence codant des acides aminés supplémentaires qui seront fusionnés au produit protéique codé par la séquence d'intérêt.

1.2. PCR (haute fidélité) avec protocole et contrôle des produits obtenus

Chaque brique est amplifiée avec une ADN polymérase à haute-fidélité. La phusion taq DNA polymérase (Thermo Scientific), est utilisée selon le protocole du fournisseur, mais n'importe quelle DNA polymérase à haute-fidélité pourrait être utilisée. La quantité de matrice utilisée est réduite au minimum (lOpg à 2ng/ μΙ, selon la brique). Les produits de PCR sont purifiés à l'aide d'un kit (ex : Macherey Nagel PCR and gel cleanup kit ® )soit directement (PCR cleanup), soit en passant par une étape de dépôt sur un gel d'agarose en Tampon TAE ( Tris 40mM pH8, Acétate 20mM, EDTA ImM) où après migration, les morceaux de gel d'agarose contenant les produits de PCR sont découpés puis purifiés (gel cleanup) L'ADN est alors quantifié en utilisant un Nanospectrophotomètre (ex : nanodrop ® )

1.3. Stratégie d'élimination de sites d'enzymes de type Ils (exemple Bsal) potentiellement présents :

Pour que l'assemblage des briques puisse être mis en œuvre, et que le procédé selon l'invention soit effectif, il ne faut pas qu'il y ait de site de l'enzyme de restriction de type Ils utilisée dans le procédé selon l'invention, (pour l'assemblage) à l'intérieur des séquences d'intérêt. Pour cela la technique de mutagenèse par Golden Gâte a été utilisée telle qu'elle a été décrite par Engler et al., 2008 mais n'importe quelle technique de mutagenèse dirigée peut être employée. (Cormack, B. 2001. Directed Mutagenesis Using the Polymerase Chain Reaction. Current Protocols in Molecular Biology. 37:8.5:8.5.1-8.5.10.) Le cas échéant, les mutations nécessaires sont introduites de sorte à conserver la(les) fonction(s) biologique(s) de la séquence d'intérêt (ex : sites de fixation à l'ADN, structures secondaires, produit d'expression).

1.4 Méthode de choix des sutures

Grâce à l'utilisation des adaptateurs selon l'invention, l'assemblage des briques moléculaires peut se faire à la base nucléotidique près. Ce niveau de précision permet d'éliminer toute cicatrice nucléotidique.

On entend par cicatrice, tout nucléotide ou groupe de nucléotides dont la présence dans le vecteur final serait rendue obligatoire de par l'utilisation de la technique d'assemblage sans toutefois assurer de fonction au sein du vecteur lui-même.

Le choix des sutures est crucial pour favoriser un assemblage correct. Il doit respecter plusieurs critères simples. Tout d'abord une suture ne doit pas être palindromique : en effet une suture palindromique peut se lier avec ou sur elle-même ce qui pourrait conduire à des difficultés d'assemblages, à la formation de dimères de briques liés tête bêche.

Selon l'invention, la suture ne doit pas être palindromique (ex : ACGT dont la séquence antiparallèle ACGT est identique) pour éviter un auto-appariement correspondant à un assemblage de plusieurs exemplaires de la même brique , tête-bêche, pour former des chaînes. On appelle une séquence palindromique une séquence qui se lit de la même manière de 5' vers 3' sur chacun des deux brins d'ADN.

Dans le procédé selon l'invention, il ne peut y avoir « d'auto-circularisation » puisque les sutures en 5' et 3' sont choisies pour ne pas être complémentaires entre elles. La séquence anti-parallèle résultant d'un clivage est l'extrémité non cohésive de l'adaptateur libéré.

Ensuite le choix d'une suture à une position de l'assemblage élimine la possibilité de l'utiliser à une autre position. Enfin le choix de sutures trop similaires (ne différant que d'un seul nucléotide) à deux positions dans un assemblage est évité car pourrait conduire à des assemblages et ligations illégitimes. En effet un appariement partiellement complémentaire (3/4 nucléotides seulement interagissant) ou 'mismatch' ou mésappariement peut être suffisant pour l'activité de certaines ADN ligases et donc conduire à l'apparition de constructions aberrantes.

5 Ce critère diminue la fréquence d'obtention de constructions aberrantes.

Afin de respecter ces consignes, un programme simple a été développé qui, en fonction des sutures déjà choisies, élimine des sutures jugées incompatibles. Le programme est basé sur l'utilisation d'une matrice de combinaisons de sutures : pour chacune des 240 combinaisons non 10 palindromiques possibles, un score de compatibilité est calculé avec chacune des 239 autres. Le mode de calcul de ce score est indiqué dans le schéma (figure. 2) :

Par conséquent chaque appariement de deux séquences de 4 nucléotides non palindromiques (soit 57 600 combinaisons) se voit attribué un score allant de 0 à 10 où 0 correspond à une 15 absence totale de complémentarité (0%) et 10 indique une complémentarité totale (100%).

Complémentarité signifie complémentarités inter-sutures. Ces scores sont intégrés à une matrice illustrée (figure. 3). Pour un vecteur donné, l'ensemble des sutures nécessaire est choisi de sorte à ce que chaque suture ait un score de complémentarité minimale avec chacune des autres sutures nécessaires à l'assemblage.

20

2. Protocole général d'assemblage

Afin d'assembler les briques entre elles pour obtenir le vecteur désiré, il faut les mélanger à des ratios équimolaires en présence d'une seule enzyme de restriction de type Ils et d'une ligase.

25

Avantageusement, les briques sont mélangées à des ratios équimolaires en présence d'une seule enzyme de restriction de type Ils et d'une ligase, dans un tampon approprié.

La quantité en ng de chaque brique moléculaire est calculée comme suit : Q (ng ) = taille ( p b ) x 30 649 ( ng.nmoi ^.pb Χ ) x (20 à 100).10-6 ( nmoi) et le volume est calculé comme suit : ν ΐ) = Q (ng ) / concentration (ng ^i

Le mélange s'effectue à une température allant de 0 à 6°C, de préférence à 4°C. Le mélange est ensuite soumis à une température de 37°C pendant une période allant de 30' à 6 heures, pour un nombre de briques moléculaires à assembler inférieur à 5,

Le mélange est soumis à des cycles d'incubation de 2' à 37°C puis 3' à 16°C (25 à 50 cycles) si le nombre de briques moléculaires est supérieur à 4.

Le mélange est ensuite incubé à 50°C pendant 5' (coupure des sites d'endonucléase de type Ils subsistants (non coupés) puis à 80°C pendant 5' (inactivation des enzymes). Le mélange réactionnel est ensuite utilisé pour transformer des bactéries compétentes qui sont ensuite sélectionnées.

3. Vérifications des constructions

Deux niveaux de vérifications peuvent être considérés :

1) - la vérification de la molécule produite en termes de séquence

2) - la vérification du vecteur en termes de fonctionnalité

1)- Parallèlement à l'assemblage in vitro, un assemblage virtuel des fragments est effectué informatiquement pour reconstituer la séquence du vecteur souhaité. Ceci permet l'établissement d'une carte de restriction du vecteur. Afin de vérifier les clones obtenus, les mini préparations d'ADN circulaire sont digérées par une ou plusieurs enzymes choisies de sorte à générer au moins trois fragments de taille distincte. De préférence le choix des enzymes se fait de sorte qu'il y ait au moins un site présent dans chacun des fragments assemblés. L'analyse du profil de restriction après électrophorèse en gel d'agarose permet de vérifier que les fragments ont tous été assemblés dans l'ordre souhaité.

D'autres procédés de vérification des clones obtenus peuvent être envisagés, notamment une vérification par PCR pour vérifier, par des mesures de taille de fragments, les constructions. De plus l'intégralité du vecteur ou une partie de celui-ci peut être séquencée (Prober JM, Trainor GL, Dam RJ, Hobbs FW, Robertson CW, Zagursky RJ et al. (16 Oct 1987). "A System for rapid DNA sequencing with fluorescent chain-terminating dideoxynucleotides". Science 238 (4825): 336-4.). 2)- Selon les séquences d'inétrêt intégrées dans les vecteurs selon l'invention, il est possible également de mesurer et ou quantifier directement ou indirectement la fonctionnalité des unités et/ou modules composant le vecteur. Par exemple, l'extraction d'un vecteur à partir d'une culture de bactéries transformées réalisée en présence d'un antibiotique approprié (ex : kanamycine, ampicilline, chloramphénicol) permet de valider la fonctionnalité de modules composant l'unité bactérienne. De même, l'obtention de clones eucaryotes issus d'une sélection effectuée par une drogue appropriée (ex : G418, hygromycine, puromycine) permet de valider la fonctionnalité de modules composant une unité d'intégration en cellule eucaryote. Enfin, la présence d'un produit d'expression (ARNm, micro-ARN, long ARN non codant) peut être détectée à partir des ARN totaux extraits de la cellule cible ayant reçu le vecteur, par PCR ou par toute méthode permettant de mesurer la présence d'ARN dans une cellule comme le RNA-Fish (Langer-Safer PR, Levine M, Ward DC (July 1982). "Immunological method for mapping gènes on Drosophila polytene chromosomes". Proc. Natl. Acad. Sci. USA. 79 (14): 4381-5. doi:10.1073/pnas.79.14.4381) ou le SmartFlare (Prigodich, A. E.; Randeria, P. S.; Briley, W. ; Kim, N.; Daniel, W. L; Giljohann, D. A.; Mirkin, C. A. "Multiplexed Nanoflares: mRNA Détection in Live Cells," Anal. Chem. 2012, 84 , 2062- 2066, doi: 10.1021/ac202648w). Le cas échéant l'expression d'un ARN interférant peut être détectée en mesurant la diminution de l'expression (ARNm) du gène endogène ciblé par ledit ARN interférant. Selon un aspect avantageux, l'invention porte sur un vecteur sélectionné parmi un vecteur VI, Vl.l, V1.2, V1.3, V2 et V3.

Selon un aspect avantageux, l'invention porte sur un vecteur sélectionné parmi un vecteur VI, Vl.l, VI.2, V1.3, V2, V3, V2b, V3b, Vl.lb, V4.

Avantageusement, l'invention porte sur un vecteur sans site de clonage multiple et sans cicatrice, et encore plus avantageusement un vecteur sans cicatrice et sans site de restriction de l'enzyme de type Ils ayant servi à son assemblage. Selon un aspect avantageux, l'invention porte sur un groupe de vecteurs VI, en particulier un groupe de vecteurs VI obtenu selon le procédé de l'invention.

Selon un aspect avantageux, l'invention porte sur un groupe de vecteurs Vl.l, en particulier un groupe de vecteurs Vl.l obtenu selon le procédé de l'invention. Selon un aspect avantageux, l'invention porte sur un groupe de vecteurs VI.2, en particulier un groupe de vecteurs VI.2 obtenu selon le procédé de l'invention. Selon un aspect avantageux, l'invention porte sur un groupe de vecteurs VI.3, en particulier un groupe de vecteurs VI.3 obtenu selon le procédé de l'invention.

Selon un aspect avantageux, l'invention porte sur un groupe de vecteurs V2, en particulier un groupe de vecteurs V2 obtenu selon le procédé de l'invention.

Selon un aspect avantageux, l'invention porte sur un groupe de vecteurs V3, en particulier un groupe de vecteurs V3 obtenu selon le procédé de l'invention.

Selon un aspect avantageux, l'invention porte sur un groupe de vecteurs V4, en particulier un groupe de vecteurs V4 obtenu selon le procédé de l'invention.

Un vecteur VI (SEQ ID NO : 41) selon l'invention est construit à partir d'une combinaison des briques Ori Amp Bsal B (SEQ ID NO : 36), pCMV Bsal B (SEQ ID NO : 37), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), et shB3Galt6 Bsal A (SEQ ID NO : 40).

Un vecteur VI.1 (SEQ ID NO : 48) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal B (SEQ ID NO :36), pCMV Bsal B (SEQ ID NO : 37), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), shB3GALT6 Bsal B (SEQ ID NO : 46), etHygroR Bsal B (SEQ ID NO : 47).

Un vecteur VI.2 (SEQ ID NO : 53) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal B (SEQ ID NO : 36), rosa26-5' Bsal A (SEQ ID NO : 49), pCMV Bsal C (SEQ ID NO : 50), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), shB3GALT6 Bsal B (SEQ ID NO : 46), HygroR Bsal C (SEQ ID NO : 51), et rosa26-3' Bsal A (SEQ ID NO : 52).

Un vecteur VI.3 (SEQ ID NO : 58) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal B (SEQ ID NO : 36), rosa26-5' Bsal A (SEQ ID NO : 49), pCMV Bsal C (SEQ ID NO : 50), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), shB3GALT6 Bsal B (SEQ ID NO : 46), HygroR Bsal C (SEQ ID NO : 51), rosa26-3' Bsal B (SEQ ID NO : 54), pEFla Bsal A (SEQ ID NO : 55), TK Bsal A (SEQ ID NO : 56), et Tkter Bsal A (SEQ ID NO : 57).

Un vecteur V2 (SEQ ID NO : 62) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal B (SEQ ID NO : 36), pCMV Bsal B (SEQ ID NO : 37), T03G Bsal A (SEQ ID NO : 59), BGHpA Bsal B (SEQ ID NO : 39), pTRE3G Bsal A (SEQ ID NO : 60), mB3Galt6 Bsal B (SEQ ID NO : 63), et Tkter Bsal A (SEQ ID NO : 57).

Un vecteur V3 (SEQ ID NO : 66) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal B (SEQ ID NO : 36), pCMV Bsal B (SEQ ID NO : 37), T03G Bsal A (SEQ ID NO : 59), BGHpA Bsal B (SEQ ID NO : 39), pTRE3G Bsal A (SEQ ID NO : 60), mb3GALT6 Bsal B (SEQ ID NO :63), Tkter Bsal B (SEQ ID NO :64), et shB3Galt6 Bsal C (SEQ ID NO :65).

Un vecteur V2b (SEQ ID NO : 149) selon l'invention est construit à partir d'une combinaison des briques Ori Bsal A (SEQ ID NO : 104), AmpR Bsal A (SEQ ID NO : 105), pCMV Bsal B (SEQ ID NO : 37), T03G Bsal A (SEQ ID NO : 59), BGHpA Bsal B (SEQ ID NO : 39), pTRE3G Bsal A (SEQ ID NO : 60), mB3Galt6 Bsal B (SEQ ID NO : 63), et Tkter Bsa IA (SEQ ID NO : 57).

Un vecteur V3b (SEQ ID NO : 150) selon l'invention est construit à partir d'une combinaison des briques Ori Bsal A (SEQ ID NO : 104), AmpR Bsal A (SEQ ID NO : 105), pCMV Bsal B (SEQ ID NO : 37), T03G Bsal A (SEQ ID NO : 59), BGHpA Bsal B (SEQ ID NO : 39), pTRE3G Bsal A (SEQ ID NO : 60), mb3GALT6 Bsal B (SEQ ID NO :63), Tkter Bsal B (SEQ ID NO : 64), et shB3Galt6 Bsal C (SEQ ID NO : 65). Un vecteur VI. lb (SEQ ID NO : 151) selon l'invention est construit à partir d'une combinaison des briques Ori Bsal B (SEQ ID NO : 106), AmpR Bsal B (SEQ ID NO : 107), pEFlaL Bsal B (SEQ ID NO : 108), EGFP-CAAX Bsal A (SEQ ID NO : 109), BGHpA Bsal C (SEQ ID NO : 110), pCMV Bsal D (SEQ ID NO : 111), SiaT Bsal B (SEQ ID NO : 112), mCherry Bsal B (SEQ ID NO : 113), TKter Bsal B (SEQ ID NO : 64) et HygroR Bsal D (SEQ ID NO : 114).

Un vecteur V4 (SEQ ID NO : 152) selon l'invention est construit à partir d'une combinaison des briques Ori-2 Bsal C (SEQ ID NO : 115), AmpR Bsal C (SEQ ID NO : 116), MNNIO-Lrec Bsal A (SEQ ID NO : 117), KanMX Bsal A (SEQ ID NO : 119), MNNIO-Rrec Bsal A (SEQ ID NO : 118). Un vecteur selon l'invention est un vecteur ayant une séquence choisie parmi les séquences SEQ ID NO : 41, 48, 53, 58, 62 et 66.

Un vecteur selon l'invention est un vecteur ayant une séquence choisie parmi les séquences SEQ ID NO : 149, 150, 151 et 152.

Un vecteur selon l'invention est un vecteur ayant une séquence choisie parmi les séquences SEQ ID NO : 41, 48, 53, 58, 62, 66, 149, 150, 151 et 152. Un autre vecteur selon l'invention est un vecteur ayant une séquence choisie parmi les séquences SEQ ID NO : 30, 31, 32, 33, 34 et 35.

Les vecteur obtenus selon le procédé de l'invention sont les vecteurs de séquence SEQ ID NO : 30 31, 32, 33, 34 et 35.

Les vecteurs obtenus selon le procédé de l'invention sont les vecteurs de séquence SEQ ID NO : 30, 31, 32, 33, 34, 35, 41, 48, 53, 58, 62, 66, 149, 150, 151 et 152.

Selon un autre mode de réalisation, l'invention a pour objet un vecteur circulaire d'ADN double brin tel qu'obtenu par mise en œuvre selon le procédé de l'invention.

L'invention a aussi pour objet un vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant l'expression simultanée de multiples transgènes et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, nxU2a et mxU2b,

Ul représentant une unité fonctionnelle bactérienne,

U2a représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'A N polymerase II et dont le produit d'expression est une protéine,

U2b représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant,

n étant supérieur ou égal à 0,

m étant supérieur ou égal à 0, sous réserve que n+m>2,

l'unité Ul pouvant être contiguë aux unités nxU2a, elles-mêmes pouvant être contiguës aux unités mxU2b; l'unité Ul étant de préférence contiguë aux unités nxU2a, elles-mêmes étant de préférence contiguës aux unités mxU2b.

Ces vecteurs constituent un groupe de vecteurs VI.

Ce groupe de vecteurs VI peut être préparé selon le procédé de l'invention.

Selon encore un autre aspect , l'invention a pour objet un groupe de vecteurs VI tels qu'obtenus par mise en oeuvre du procédé de l'invention.

L'invention a également pour objet un vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant de sélectionner l'intégration des transgènes par recombinaison non homologue dans le génome cible et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, nxU2a, mxll2b et U3a,

Ul représentant une unité fonctionnelle bactérienne,

U2a représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'A N polymerase II et dont le produit d'expression est une protéine,

U2b représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant,

n étant supérieur ou égal à 0,

m étant supérieur ou égal à 0, sous réserve que n+m>2,

U3a représentant une cassette de sélection positive,

l'unité Ul pouvant être contiguë aux unités nxU2a, elles-mêmes pouvant être contiguës aux unités mxU2b, elles-mêmes pouvant être contiguës à U3a;

l'unité Ul étant de préférence contiguë aux unités nxU2a, elles-mêmes étant de préférence contiguës aux unités mxU2b, elles-mêmes étant de préférence contiguës à U3a.

Ces vecteurs constituent un groupe de vecteurs VI.1.

Ce groupe de vecteurs VI.1 peut être préparé selon le procédé de l'invention.

Selon encore un autre aspect, l'invention a pour objet un groupe de vecteurs VI.1 tels qu'obtenus par mise en oeuvre du procédé de l'invention. L'invention a également pour objet un vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant de sélectionner l'intégration simultanée de multiples transgènes par recombinaison homologue dans le génome cible et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U3b, nxU2a, mxU2b, U3a et U3c,

Ul représentant une unité fonctionnelle bactérienne, U3b représentant un motif 5' d'une séquence de recombinaison homologue X

U2a représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'A N polymerase II et dont le produit d'expression est une protéine,

U2b représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant,

n étant supérieur ou égal à 0,

m étant supérieur ou égal à 0, sous réserve que n+m>2,

U3a représentant une cassette de sélection positive,

U3c représentant motif 3' d'une séquence de recombinaison homologue X,

l'unité Ul étant contiguë à U3b, elle-même étant contiguë aux unités nxU2a, elles-mêmes étant contiguës aux unités mxU2b, elles-mêmes étant contiguës à l'unité U3a, elle-même étant contiguë à l'unité U3c.

Ces vecteurs constituent un groupe de vecteurs VI.2.

Ce groupe de vecteurs VI.2 peut être préparé selon le procédé de l'invention.

Selon encore un autre aspect, l'invention a pour objet un groupe de vecteurs VI.2 tels qu'obtenus par mise en oeuvre du procédé de l'invention.

L'invention a également pour objet un vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant d'éliminer les cellules hôtes ayant intégré un ou des transgènes par recombinaison non-homologue et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U3b, nxU2a, mxU2b, U3a, U3c et U3d,

Ul représentant une unité fonctionnelle bactérienne,

U3b représentant motif 5' d'une séquence de recombinaison homologue X

U2a représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéine,

U2b représentant une unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant,

n étant supérieur ou égal à 0,

m étant supérieur ou égal à 0, sous réserve que n+m>2,

U3a représentant une cassette de sélection positive,

U3c représentant un motif 3' d'une séquence de recombinaison homologue X,

U3d représentant une cassette de sélection négative, l'unité Ul étant contiguë à l'unité U3b, elle-même étant contiguë aux unités nxU2a, elles-mêmes étant contiguës aux unités mxU2b, elles-mêmes étant contiguës à l'unité U3a, elle-même étant contiguë à l'unité U3c, elle-même étant contiguë à l'unité U3d.

Ces vecteurs constituent un groupe de vecteurs VI.3.

Ce groupe de vecteurs VI.3 peut être préparé selon le procédé de l'invention.

Selon encore un autre aspect, l'invention a pour objet un groupe de vecteurs VI.3 tels qu'obtenus par mise en oeuvre du procédé de l'invention.

L'invention a également pour objet un vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant d'exprimer un ou plusieurs transgènes de façon inductible et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U2c, nxU2d, et mxU2e, Ul représentant une unité fonctionnelle bactérienne,

U2c représentant un gène codant un transactivateur transcriptionel,

U2d représentant un gène dont le promoteur est dépendant du transactivateur codé par le gène U2c,

U2e représentant un gène dont le promoteur n'est pas dépendant du transactivateur codé par le gène U2c,

n étant supérieur ou égal à 1,

m étant supérieur ou égal à 0,

l'unité Ul pouvant être contiguë à l'unité U2c, elle-même pouvant être contiguë aux unités nxU2d, elles-mêmes pouvant être contiguës aux unités mxU2e;

l'unité Ul étant de préférence contiguë à l'unité U2c, elle-même étant de préférence contiguë aux unités nxU2d, elles-mêmes étant de préférence contiguës aux unités mxU2e.

Ces vecteurs constituent un groupe de vecteurs V2.

Ce groupe de vecteurs V2 peut être préparé selon le procédé de l'invention.

Selon encore un autre aspect, l'invention a pour objet un groupe de vecteurs V2 tels qu'obtenus par mise en oeuvre du procédé de l'invention.

L'invention a également pour objet un vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant de réaliser de la complémentation génétique sous contrôle inductible et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U2f, U2c, et U2g, Ul représentant une unité fonctionnelle bactérienne,

U2c représentant un gène codant un transactivateur transcriptionel, U2f représentant un gène dont le promoteur est un promoteur à A N polymérase III et dont le produit d'expression est un petit ARN en épingle à cheveux (shRNA) précurseur d'un petit ARN interférant ciblant un gène X,

U2g représentant un gène dont le promoteur est dépendant du transactivateur codé par le gène U2c et dont le produit d'expression est une version mutée du produit du gène X de sorte à être insensible au produit du gène U2f ;

l'unité Ul pouvant être contiguë à l'unité U2f, elle-même pouvant être contiguë à l'unité U2c, elle-même pouvant être contiguë à l'unité U2g;

l'unité Ul étant de préférence contiguë à l'unité U2f, elle-même étant de préférence contiguë à l'unité U2c, elle-même étant de préférence contiguë à l'unité U2g.

Ces vecteurs constituent un groupe de vecteurs V3.

Ce groupe de vecteurs V3 peut être préparé selon le procédé de Γ invention.

Selon encore un autre aspect , l'invention a pour objet un groupe de vecteurs V3 tels qu'obtenus par mise en oeuvre du procédé de l'invention.

L'invention a également pour objet un vecteur d'ADN double brin, dépourvu de site de clonage multiple et permettant de sélectionner des cellules dont le génome a été édité par recombinaison homologue ciblée et consistant en une séquence comprenant les unités fonctionnelles suivantes : Ul, U3b , U3a, et U3c,

Ul représentant une unité fonctionnelle bactérienne,

U3a représentant une cassette de sélection positive,

U3b représentant un motif 5' d'une séquence de recombinaison homologue X

U3c représentant un motif 3' d'une séquence de recombinaison homologue X,

l'unité Ul étant contiguë à l'unité U3b, elle-même étant contiguë à l'unité U3a, elle-même étant contiguë à l'unité U3c.

Ces vecteurs constituent un groupe de vecteurs V4.

Ce groupe de vecteurs V4 peut être préparé selon le procédé de l'invention.

Selon encore un autre aspect, l'invention a pour objet un groupe de vecteurs V4 tels qu'obtenus par mise en œuvre du procédé de l'invention. LEGENDES DES FIGURES

Figure 1

A : Schéma représentant une brique moléculaire sur laquelle une enzyme de type Ils (rond) liée à un adaptateur (A) de part et d'autre d'une séquence d'intérêt (SI) est liée à l'ADN au niveau de son site de reconnaissance et coupe l'ADN à distance du site de reconnaissance (flèche) pour générer une SI ayant deux extrémités simple brin d'au moins 2 nucléotides (sutures) qui permettront un assemblage ordonné.

B. Exemple de coupure induite par une enzyme de type Ils produisant une extrémité monobrin pouvant s'apparier avec une autre extrémité monobrin et s'assembler sans cicatrice.

Figure 2 : Schéma représentant le mode de calcul de score de compatibilité de choix des sutures (choix intersutures). Figure 3 : Matrice des scores obtenus pour l'ensemble des combinaisons possibles

Figure 4 : Schéma de représentation des plasmides réalisés selon l'invention (réalisation 1) et des sutures d'assemblage des briques Figure 5 : Carte de restriction du plasmide pHCsiaT-EGFP de la réalisation 1 et vérification de l'assemblage

Figure 6 : Schéma du vecteur VI (SEQ ID NO : 41) selon l'invention et des sutures permettant l'assemblage des brique Ori-Amp Bsal B (SEQ ID NO : 36), pCMV Bsal B (SEQ ID NO : 37), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), et shB3Galt6 Bsal A (SEQ ID NO : 40).

Où 1= Ori-AmpR Bsal B (SEQ ID NO : 36), 2 = pCMV Bsal B (SEQ ID NO : 37), 3= hFUT3 Bsal A (SEQ ID NO : 38), 4= BGHpA Bsal B (SEQ ID NO : 39) et 5 = shB3Galt6 Bsal A (SEQ ID NO : 40).

Figure 7 : Empreinte de restriction par triple digestion EcoRV/Pvul/Sall du vecteur VI.

La digestion produit 5 fragments de 1705, 992, 602, 561 et 357 paires de bases respectivement. 1 : 1 705 pb, de Sali [3821] à Pvul [1305]

2 : 992 pb, de EcoRV [2829] à Sali [3821]

3 : 606 pb, de Sali [1866] à Sali [2472]

4 : 561 pb, de Pvul [1305] à Sali [1866] 5 : 357 pb, de Sali [2472] à Eco V [2829]

Figure 8 : Schéma du vecteur VI.1 (SEQ ID NO : 48) selon l'invention et des sutures permettant l'assemblage des briques Ori-AmpR Bsal B (SEQ ID NO :36), pCMV Bsal B (SEQ ID NO : 37), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), shB3Galt6 Bsal B (SEQ ID NO : 46), et HygroR Bsal B (SEQ ID NO : 47).

Où 1= Ori-AmpR Bsal B (SEQ ID NO : 36), 2 = pCMV Bsal B (SEQ ID NO : 37), 3= hFUT3 Bsal A (SEQ ID NO : 38), 4= BGHpA Bsal B (SEQ ID NO : 39), 5 = shB3Galt6 Bsal B (SEQ ID NO : 46) et 6= HygroR Bsal B (SEQ ID NO : 47)

Figure 9 : Empreinte de restriction par triple digestion EcoRV/Pvul/Sall du vecteur VI.1.

La digestion produit 6 fragments de 2217, 1104, 992, 606, 561 et 357 paires de bases respectivement.

1 : 2 217 pb, de Pvul [4925] à Pvul [1305]

2 : 1 104 pb, de Sali [3821] à Pvul [4925]

3 : 992 pb, de EcoRV [2829] à Sali [3821]

4 : 606 pb, de Sali [1866] à Sali [2472]

5 : 561 pb, de Pvul [1305] à Sali [1866]

6 : 357 pb, de Sali [2472] à EcoRV [2829]

Figure 10 : Vérification fonctionnelle du vecteur VI.1 (SEQ ID NO : 48): profil d'expression de hFUT3 et mB3GALT6 mesurés par qRT-PCR à partir d'ARN totaux extraits d'un clone de cellules de souris 4T1 stablement transfectées par le vecteur VI.1. Figure 11 : Schéma du vecteur VI.2 (SEQ ID NO : 53) selon l'invention et des sutures permettant l'assemblage des briques Ori-AmpR Bsal B (SEQ ID NO : 36), rosa26-5' Bsal A (SEQ ID NO : 49), pCMV Bsal C (SEQ ID NO : 50), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), shB3Galt6 Bsal B (SEQ ID NO : 46), Hygro Bsal C (SEQ ID NO : 51), et rosa26-3' Bsal A (SEQ ID NO : 52).

Où 1= Ori-AmpR Bsal B (SEQ ID NO : 36), 2 = rosa26-5' Bsal A (SEQ ID NO : 49), 3 = pCMV Bsal C (SEQ ID NO : 50), 4 = hFUT3 Bsal A (SEQ ID NO : 38), 5 = BGHpA Bsal B (SEQ ID NO : 39), 6 = shB3Galt6 Bsal B (SEQ ID NO : 46), 7 = HygroR Bsal C (SEQ ID NO : 51) et 8 = rosa26-3' Bsal A (SEQ ID NO : 52). Figure 12 : Empreinte de restriction par triple digestion Eco V/Pvul/Sall du vecteur VI.2.

La digestion produit 6 fragments de 6492, 1649, 1104, 992, 606 et 357 paires de bases respectivement.

1 : 6 492 pb, de Pvul [6009] à Pvul [1301]

2 : 1 649 pb, de Pvul [1301] à Sali [2950]

3 : 1 104 pb, de Sali [4905] à Pvul [6009]

4 : 992 pb, de EcoRV [3913] à Sali [4905]

5 : 606 pb, de Sali [2950] à Sali [3556]

6 : 357 pb, de Sali [3556] à EcoRV [3913]

Figure 13 : Schéma du vecteur VI.3 (SEQ ID NO : 58) selon l'invention et des sutures permettant l'assemblage des briques Ori-AmpR Bsal B (SEQ ID NO : 36), rosa26-5' Bsal A (SEQ ID NO : 49), pCMV Bsal C (SEQ ID NO : 50), hFUT3 Bsal A (SEQ ID NO : 38), BGHpA Bsal B (SEQ ID NO : 39), shB3Galt6 Bsal B (SEQ, ID NO : 46), HygroR Bsal C (SEQ ID NO : 51), rosa26-3' Bsal B (SEQ ID NO : 54), pEFla Bsal A (SEQ ID NO : 55), TK Bsal A (SEQ ID NO : 56), et Tkter Bsal A (SEQ ID NO : 57).

Où 1= Ori-AmpR Bsal B (SEQ ID NO : 36), 2 = rosa26-5' Bsal A (SEQ ID NO : 49), 3 = pCMV Bsal C (SEQ ID NO : 50), 4 = hFUT3 Bsal A (SEQ ID NO : 38), 5 = BGHpA Bsal B (SEQ ID NO : 39), 6 = shB3Galt6 Bsal B (SEQ ID NO : 46), 7 = HygroR Bsal C (SEQ ID NO : 51), 8 = rosa26-3' Bsal B (SEQ ID NO : 54), 9 = pEFla Bsa I A (SEQ ID NO : 55), 10 = TK Bsal A (SEQ ID NO : 56) et 11 = Tkter Bsal A (SEQ ID NO : 57).

Figure 14 : Empreinte de restriction par triple digestion EcoRV/Pvul/Sall du vecteur VI.3.

La digestion produit 10 fragments de 5206, 2379, 1649, 1104, 992, 606, 357, 302, 252 et 104 paires de bases respectivement.

1 : 5 206 pb, de Pvul [6009] à Sali [11215]

2 : 2 379 pb, de EcoRV [11873] à Pvul [1301]

3 : 1 649 pb, de Pvul [1301] à Sali [2950]

4 : 1 104 pb, de Sali [4905] à Pvul [6009]

5 : 992 pb, de EcoRV [3913] à Sali [4905]

6 : 606 pb, de Sali [2950] à Sali [3556]

7 : 357 pb, de Sali [3556] à EcoRV [3913]

8 : 302 pb, de Sali [11215] à Sali [11517]

9 : 252 pb, de Sali [11517] à EcoRV [11769] 10 : 104 pb, de EcoRV [11769] à EcoRV [11873]

Figure 15 : Schéma du vecteur V2 (SEQ ID NO : 62) selon l'invention et des sutures permettant l'assemblage des briques Ori-AmpR Bsal B (SEQ I D NO : 36), pCMV Bsal B (SEQ ID NO : 37), T03G Bsa l A (SEQ I D NO : 59), BGHpA Bsal B (SEQ I D NO : 39), pTRE3G Bsa l A (SEQ I D NO : 60), mB3Galt6 Bsal B (SEQ I D NO : 63), et Tkter Bsal A (SEQ ID NO : 57).

Où 1= Ori-AmpR Bsal B (SEQ I D NO : 36), 2 = pCMV Bsal B (SEQ I D NO : 37), 3= T03G Bsal A (SEQ I D NO : 59), 4= BGHpA Bsal B (SEQ I D NO : 39), 5 = pTRE3G Bsal A (SEQ I D NO : 60), 6 = mB3Galt6 Bsal B (SEQ I D NO : 63) et 7 = Tkter Bsal A (SEQ I D NO : 57).

Figure 16 : Empreinte de restriction par triple digestion Ndel/Sall/Xhol du vecteur V2.

La digestion produit 6 fragments de 2334, 1132, 602, 472, 361 et 245 paires de bases respectivement.

1 : 2 334 pb, de Xhol [4678] à Sali [1866]

2 : 1 132 pb, de Ndel [3074] à Xhol [4206]

3 : 602 pb, de Sali [2472] à Ndel [3074]

4 : 472 pb, de Xhol [4206] à Xhol [4678]

5 : 361 pb, de Ndel [2111] à Sali [2472]

6 : 245 pb, de Sali [1866] à Ndel [2111]

Figure 17 : Schéma du vecteur V3 (SEQ ID NO : 66) selon l'invention et des sutures permettant l'assemblage des briques Ori-AmpR Bsal B (SEQ I D NO : 36), pCMV Bsal B (SEQ ID NO : 37), T03G Bsal A (SEQ I D NO : 59), BG HpA Bsal B (SEQ I D NO : 39), pTRE3G Bsal A (SEQ I D HO : 60), mB3Ga!t6 Bsa l B (SEQ I D NO :63), Tkter Bsa l B (SEQ I D NO :64), et shB3Gait6 Bsal C (SEQ I D HO :65).

Où 1= Ori-AmpR Bsal B (SEQ I D NO : 36), 2 = pCMV Bsal B (SEQ I D NO : 37), 3= T03G Bsal A (SEQ I D NO : 59), 4= BGHpA Bsal B (SEQ I D NO : 39), 5 = pTRE3G Bsal A (SEQ I D NO : 60), 6 = mB3Galt6 Bsal B (SEQ I D NO : 63), 7 = Tkter Bsal B (SEQ I D NO : 64) et 8 = shB3Gaït6 Bsal C (SEQ ID NO :65).

Figure 18 : Empreinte de restriction par triple digestion Ndel/Sal l/Xhol du vecteur V3.

La digestion produit 8 fragments de 2110, 1107, 602, 478, 472, 361, 245 et 146 paires de bases respectivement.

1 : 2 110 pb, de Ndel [5308] à Sal i [1862]

2 : 1 132 pb, de Ndel [3070] à Xhol [4202] 3 : 602 pb, de Sali [2468] à Ndel [3070]

4 : 478 pb, de Xhol [4674] à Sali [5152]

5 : 472 pb, de Xhol [4202] à Xhol [4674]

6 : 361 pb, de Ndel [2107] à Sali [2468]

5 7 : 245 pb, de Sali [1862] à Ndel [2107]

8 : 156 pb, de Sali [5152] à Ndel [5308]

Figure 19 : Schéma du vecteur V2b (SEQ ID NO : 149) selon l'invention et des sutures permettant l'assemblage des briques Ori Bsal A (SEQ ID NO : 104), Amp Bsal A (SEQ ID NO : 10 105), pCMV Bsal B (SEQ ID NO : 37), T03G Bsal A (SEQ ID NO : 59), BGHpA Bsal B (SEQ ID NO :

39), pTRE3G Bsal A (SEQ ID NO : 60), mB3Galt6 Bsal B (SEQ ID NO : 63), et Tkter Bsal A (SEQ ID NO : 57)

Figure 20 : Empreinte de restriction par triple digestion Ndel/Sall/Xhol du vecteur V2b.

15 La digestion produit 6 fragments de 2334, 1132, 602, 472, 361 et 245 paires de bases respectivement.

1 : 2 334 pb, de Xhol [4678] à Sali [1866]

2 : 1 132 pb, de Ndel [3074] à Xhol [4206]

3 : 602 pb, de Sali [2472] à Ndel [3074]

20 4 : 472 pb, de Xhol [4206] à Xhol [4678]

5 : 361 pb, de Ndel [2111] à Sali [2472]

6 : 245 pb, de Sali [1866] à Ndel [2111]

Figure 21 : Expression relative de mB3GALT6 mesurée par PCR quantitative après transfert du 25 vecteur V2b en cellule 4T1 par électroporation. 1 : cellules électroporées en absence de vecteur.

2 : cellules électroporées en présence de V2.b non traitées à la doxocycline. 3 : cellules électroporées, puis traitées 24 heures à la doxocycline. L'expérience montre que l'expression du transcrit mB3Galt6, codé par le vecteur V2b, est augmentée en cellule 4T1 uniquement en présence de doxocycline, démontrant la présence concomitante d'un transgène inductible et de 30 son co-activateur dans le vecteur V2b.

Figure 22 : Schéma du vecteur V3b (SEQ ID NO : 150) selon l'invention et des sutures permettant l'assemblage des briques Ori Bsal A (SEQ ID NO : 104), AmpR Bsal A (SEQ ID NO : 105), pCMV Bsal B (SEQ ID NO : 37), T03G Bsal A (SEQ ID NO : 59), BGHpA Bsal B (SEQ ID NO : 39), pT RE3G Bsal A (SEQ ! D NO : 60), mb3Gaiî6 Bsal B (SEQ I D NO :63), Tkter Bsal B (SEQ I D NO : 64), et shB3Gait6 Bsal C (SEQ D NO : 65).

Figure 23 : Empreinte de restriction par triple digestion Ndel/Sal l/Xhol du vecteur V3b.

La digestion produit 8 fragments de 2110, 1132, 602, 478, 472, 361, 245 et 156 paires de bases respectivement.

1 : 2 110 pb, de Ndel [5312] à Sali [1866]

2 : 1 132 pb, de Ndel [3074] à Xhol [4206]

3 : 602 pb, de Sali [2472] à Ndel [3074]

4 : 478 pb, de Xhol [4678] à Sali [5156]

5 : 472 pb, de Xhol [4206] à Xhol [4678]

6 : 361 pb, de Ndel [2111] à Sali [2472]

7 : 245 pb, de Sali [1866] à Ndel [2111]

8 : 156 pb, de Sali [5156] à Ndel [5312]

Figure 24 : Schéma du vecteur VI. lb (SEQ I D NO : 151) selon l'invention et des sutures permettant l'assemblage des briques Ori Bsal B (SEQ I D NO : 106), AmpR Bsal B (SEQ I D NO : 107), pEFlaL Bsal B (SEQ I D NO : 108), EGFP-CAAX Bsal A (SEQ I D NO : 109), BG HpA Bsal C (SEQ I D NO : 110), pCMV Bsal D (SEQ I D NO : 111), SiaT Bsal B (SEQ ID NO : 112), mCherry Bsal B (SEQ I D NO : 113), TKter Bsal B (SEQ I D NO : 64) et HygroR Bsal D (SEQ I D NO : 114).

Figure 25 : Empreinte de restriction par triple digestion EcoRV/Pstl/Scal du vecteur VI. lb.

La digestion produit 7 fragments de 2281, 1723, 1309, 757, 635, 505 et 360 paires de bases respectivement.

1 : 2 281 pb, de EcoRV [3036] à Pstl [5317]

2 : 1 723 pb, de Seal [7261] à Seal [1414]

3 : 1 309 pb, de Pstl [5317] à Pstl [6626]

4 : 757 pb, de Seal [1414] à Pstl [2171]

5 : 635 pb, de Pstl [6626] à Seal [7261]

6 : 505 pb, de Pstl [2171] à Pstl [2676]

7 : 360 pb, de Pstl [2676] à EcoRV [3036]

Figure 26 : Observation microscopique de cellules 4T1 24 heures après électroporation avec le vecteur VI. lb. A : groupe de cellules visibles en microscopie en lumière blanche.

B : même champs optique que A observé en microscopie à fluorescence verte (visualisation GFP).

C : même champs optique que A observé en microscopie à fluorescence rouge (visualisation mCherry).

D : superposition des champs observés en B et C.

Figure 27 : Schéma du vecteur V4 (SEQ ID NO : 152) selon l'invention et des sutures permettant l'assemblage des briques Ori-2 Bsal C (SEQ ID NO : 115), Amp Bsal C (SEQ ID NO : 116), MNNIO-Lrec Bsal A (SEQ ID NO : 117), KanMX Bsal A (SEQ ID NO : 119) et MNNIO-Rrec Bsal A (SEQ ID NO : 118).

Figure 28 : Empreinte de restriction par double digestion Pmel/Hindlll du vecteur V4.

La digestion produit 5 fragments de 1280, 1012, 856, 631 et 567 paires de bases respectivement. 1 : 1 280 pb, de Pmel [1857] à Hindlll [3137]

2 : 1 012 pb, de Pmel [845] à Pmel [1857]

3 : 856 pb, de Pmel [4335] à Pmel [845]

4 : 631 pb, de Hindlll [3137] à Hindlll [3768]

5 : 567 pb, de Hindlll [3768] à Pmel [4335]

Figure 29 : Vérification de l'invalidation du gène MNN10 de levure par analyse du profil de glycosylation de l'invertase.

A : profil de migration d'une souche inactivée pour le gène Pmrl, gène dont la mutation entraîne un net défaut de glycosylation de l'invertase.

B : profil de migration de l'invertase d'une souche sauvage.

C :profil de glycosylation de l'invertase d'une souche dont le gène MNN10 a été invalidé par recombinaison homologue avec la cassette de délétion du plasmide V4.

Figure 30 : Schéma représentant la construction d'un vecteur d'expression par la méthode décrite. A : Représentation de 8 briques d'ADN. Chaque brique contient une séquence d'intérêt (SI) annotées de A à H (en gris) qui elle-même peut contenir plusieurs modules (nuances de gris) numérotés de 1 à 13. Les modules non fonctionnels sont annotés a et b en sus de la numérotation. Les briques contiennent en outre des adaptateurs en amont et aval des SI, dont la partie 'suture' est représentée en blanc et la partie la plus externe en noir. Sur ce schéma, les sutures complémentaires les unes des autres sont reliées par des lignées pointillées. B : Représentation linéaire d'un vecteur circulaire contenant les SI illustrées en A (x étant contigu à y) obtenu selon la méthode décrite. Les lignes en gras délimitent les SI qui sont maintenant contiguës et reliées par les sutures ( blanc) dont chacun des deux brins cohésifs a été apporté par une SI voisine. La structuration du vecteur selon les unités fonctionnelles telles que définies dans le texte est illustrée sous forme de rectangles en dessous de la molécule schématisée. Lorsque les combinaisons de modules constituant les unités correspondent à une séquence d'ADN destinée à être transcrite, le sens de transcription est représenté sous forme de flèche.

Dans l'exemple représenté par les figures A et B, les modules sont définis comme suit :

Module 1 : origine de réplication

Module 2a : séquence bipartite d'intégration génomique, partie gauche

Module 3 : terminateur de transcription

Module 4a : séquence codante incomplète (partie 3' qui contient un codon stop)

Module 4b : séquence codante incomplète (partie 5' qui contient un ATG)

Module 5 : promoteur eucaryote

Module 6 : promoteur eucaryote

Module 7 : séquence codant un marqueur de sélection positive eucaryote

Module 8 : terminateur de transcription

Module 2b : séquence bipartite d'intégration génomique, partie droite

Module 9 : séquence codante d'un marqueur de sélection procaryote

Module 10 : promoteur bactérien

Module 11 : promoteur eucaryote

Module 12 : séquence codante complète

Module 13 : terminateur de transcription

EXEMPLES

1. Exemples de briques fabriquées

Tableau 2 : Exemple de briques fabriquées selon l'invention, les matrices initiales ont été génétiquement modifiées afin de pouvoir être utilisées selon le procédé décrit par la présente invention (non représenté dans le tableau). BGH-PolyA signal : bovine growth hormone polyadenylation signal CMV: Cytomegalovirus

EGFP: enhanced green fluorescent protein

EYFP : enhanced yellow fluorescent protein

Tableau 3. Briques construites selon l'invention.

Les exemples suivants illustreront mieux l'invention, sans pour autant en limiter sa portée.

Exemple de protocole d'assemblage selon l'invention : 20 à 100 fmol de chaque brique moléculaire sélectionnée pour réaliser un vecteur sont mélangés dans un volume de 20 μΙ d'une solution comprenant:

- 2 μΙ de tampon de ligation 10X,

- 10U (1 μΙ) d'enzyme de restriction de type Ils e Bsal ,

- 3U (1 μΙ) de ligase si le nombre de fragments est inférieur ou égal à 4 ou de 20U (1 μΙ) de ligase Haute Concentration (HC) si le nombre de fragments est supérieur à 4.

qsp : eau distillée ultrapure

Le mélange est réalisé sur glace, c'est à dire à une température de 4°C environ.

Le mélange est ensuite soit incubé à 37°C (30' à 6h), si le nombre de briques à assembler est inférieur à 5, soit soumis à des cycles d'incubation de 2' à 37°C et de 3' à 16°C (25 à 50 cycles) si le nombre de fragments est supérieur à 4.

A la fin de cette période d'incubation, les réactions sont incubées à 50°C pendant 5' (coupure des sites Bsal subsistants) puis à 80°C pendant 5' (inactivation des enzymes).

2 à 10 μΙ de chaque assemblage sont ensuite utilisés pour transformer 50 à 100 μΙ de bactéries compétentes, et l'intégralité des bactéries transformées sont étalées sur une ou deux boîtes de pétri contenant une gélose LB complémentée de l'antibiotique de sélection (correspondant au module de résistance antiobiotique de l'unité bactérienne).

Réalisation 1

Dans ce premier exemple, le but est de réaliser 6 constructions permettant d'exprimer des protéines fluorescentes de différentes couleurs dans le compartiment Golgien de cellules de mammifères (figure 4). Les vecteurs doivent pouvoir être utilisés pour créer des lignées stables, ce qui impose l'introduction d'un module de sélection dans l'unité d'intégration. Afin de repérer visuellement les plasmides où l'assemblage est correct et d'estimer la proportion de contaminants ou de clones incorrects, une cassette bactérienne exprimant lac Z est également ajoutée.

Les vecteurs souhaités contiennent :

o Une unité de réplication bactérienne :

■ un module contenant une origine de réplication suivie du gène de résistance bla (AmpR)

■ un module (en deux fragments) permettant le criblage bleu blanc par l'activité du gène lacZct

o Une cassette d'expression des protéines de fusion contenant :

■ un module promoteur (CMV),

■ un module d'adressage au compartiment Golgien (première partie de l'ORF) constitué des 111 premiers acides aminés codés par le cDNA du gène humain ST6GAL1,

■ un module codant une protéine fluorescente fusionnée à la séquence d'adressage en C- terminal (six modules interchangeables),

■ un module correspondant à un terminateur de transcription (BGHpolyA)

o Une unité d'intégration en cellule eucaryote :

■ Un module contenant le gène de résistance à l'Hygromycine B sous le contrôle du promoteur SV40. Le choix de chaque suture a été fait selon l'invention, et le plasmide reconstitué est représenté figure. 4. Préparation des briques moléculaires

NOM SEQUENCE ID

BGHpA TGAT Bsa l GAGGTACCGGTCTCATGATCGACTGTGCCTTCTAGTTGCC SEQ ID NO : CW 1

BGHpA AGAA Bsa l GAGGTACCGGTCTCCAGAAGCCATAGAGCCCACCGC SEQ ID NO : CCW 2

lacZ-up TTCT Bsal CW GAG GTACCG GTCTCGTTCTCCCTG CAG GTG CG CCCAATACG CAAA SEQ ID NO :

CCGCC 3

lacZ-up TGTC Bsa l GAG GTACCG GTCTCCTGTCCGTAATCATG GTCATAG CTGTTTCC SEQ ID NO : CCW 4 lacZ-down GACA Bsa l GAG GTACCG GTCTCG G AC AG CCTG G CCGTCGTTTTACAACG SEQ ID NO : CW 5 lacZ-down CTGG Bsa l GAGGTACCGGTCTCACTGGCCCTGCAGGTCTATGCGGCATCAGA SEQ ID NO : CCW GCAGATTGTAC 6

SV40pori CCAG Bsa l GAG GTACCG GTCTCCCCAG CAG G CAG AAGTATG CAAAG C SEQ ID NO : CW 7

SV40term ATAA Bsa l GAGGTACCGGTCTCGATAAGATACATTGATGAGTTTGGAC SEQ ID NO : CCW 8

ColEl-ori TTAT Bsa l GAGGTACCGGTCTCATTATGCGTCTTCTAGGGTTAAGGTTAGTGT SEQ ID NO : CW AGAGAAGCAACCG 9

AmpR TCCT Bsa l CCW GAGGTACCGGTCTCGTCCTTGAGACGCTAGTCCTCGTTCCCGATG SEQ ID NO :

CTCTCGTCCTATCC 10 pENprom AGGA Bsa l GAGGTACCGGTCTCAAGGAACCAATTCAGTCGACTGG SEQ ID NO : CW 11 pENprom GGTG Bsa l GAGGTACCGGTCTCAGGTGGCGGCCCTGTTATCCCTAGTCGACTA SEQ ID NO : CCW G 12

SiaT CACC Bsa l CW GAGGTACCGGTCTCCCACCATGATTCACACCAACCTGAAG SEQ ID NO :

13

SiaT CCCC Bsa l CCW GAGGTACCGGTCTCACCCCTTTTGCAGCCTAGGGATAAGG SEQ ID NO :

14

XFP-Ctag GGGG Bsa l GAGGTACCGGTCTCCGGGGTCGGGGGTGAGCAAGGGCGAGGA SEQ ID NO : CW G 15

XFP-Ctag ATCA Bsa l GAG GTACCG GTCTCCATCACTTGTACAG CTCGTCCATG C SEQ ID NO : CCW 16 tagBFP-Ctag GGGG GAGGTACCGGTCTCCGGGGTCGGGGAGCGAGCTGATTAAGGAG SEQ ID NO : Bsal CW AACATGC 69 tagBFP-Ctag ATCA GAG GTACCG GTCTCCATCATCCG G AATTAAG CTTGTG CCCCAG SEQ ID NO : Bsal CCW 70

ColEl-ori-2 TATT Bsa l GAG GTACCG GTCTCGTATTGTAATACG GTTATCCACAG AATCAG G SEQ ID NO : CW 71

AmpR-2 TCCT Bsa l GAG GTACCG GTCTCGTCCTTG G CACTTTTCG G G G AAATGTG C SEQ ID NO : CCW 72

CMVp AGGA Bsa l CW GAGGTACCGGTCTCAAGGAACCAATTCAGTCGACTGG SEQ ID NO :

73

CMVp GGTG Bsa l GAGGTACCGGTCTCGGGTGCCCTGTTATCCCTAGTCGACTAG SEQ ID NO : CCW 74 hFUT3 CACC Bsa l CW GAGGTACCGGTCTCACACCATGGATCCCCTGGGTGCAGC SEQ ID NO :

75 h FUT3 ATCA Bsa l GAG GTACCG GTCTCG ATC AG GTG AACCAAG CCG CTATG CTG SEQ ID NO : CCW 76

BG H polyA CGAA Bsal GAGGTACCGGTCTCGCGAAGCCATAGAGCCCACCGC SEQ ID NO : CCW 77 shB3Galt6 TTCG Bsa l GAG GTACCG GTCTCATTCGACAG G GTCG ACAAG CTTTTCC SEQ ID NO : CW 78 shB3Galt6 AATA Bsa l GAGGTACCGGTCTCGAATACAAAACGCACCACGTGACG SEQ ID NO : CCW 79 shB3Galt6 CTGG Bsa l GAGGTACCGGTCTCGCTGGCAAAACGCACCACGTGACG SEQ ID NO : CCW 80

Hygro CCAG Bsa l CW GAG GTACCG GTCTCACCAG CAG G CAG AAGTATG CAAAG C SEQ ID NO :

81

Hygro AATA Bsa l GAGGTACCGGTCTCGAATAGATACATTGATGAGTTTGGACAAAC SEQ ID NO : CCW CAC 82 rosa26-5' AGGA Bsa l GAGGTACCGGTCTCAAGGACCCCGCGGCAGGCCCTCC SEQ ID NO : CW 83 rosa26-5' TTGT Bsa l GAGGTACCGGTCTCGTTGTAAGACTGGAGTTGCAGATCACGAG SEQ ID NO : CCW 84

CMVp ACAA Bsal CW GAG GTACCG GTCTCAACAAACCAATTCAGTCG ACTG G SEQ ID NO :

85

Hygro CTAC Bsa l GAGGTACCGGTCTCGCTACGATACATTGATGAGTTTGGACAAACC SEQ ID NO : CCW AC 86 rosa26-3' GTAG Bsa l GAGGTACCGGTCTCAGTAGAGATGGGCGGGAGTCTTCTG SEQ ID NO : CW 87 rosa26-3' AATA Bsa l GAG GTACCG GTCTCG AATAG ATAAG CTAG ATGTCCTAAATATTTC SEQ ID NO : CCW TATC 88 rosa26-3' GCAT Bsa l GAG GTACCG GTCTCG G CATG ATAAG CTAG ATGTCCTAAATATTTC SEQ ID NO : CCW TATC 89

EFla ATGC Bsa l CW GAGGTACCGGTCTCAATGCAAGGAACCAATTCAGTCGACTGGAT SEQ ID NO :

C 90

EFla GGGC Bsa l CCW GAGGTACCGGTCTCGGGGCCCCTGTTATCCCTAGTCGACTAG SEQ ID NO :

91

TK GCCC Bsa l CW GAG GTACCG GTCTCAG CCCATG G CTTCGTACCCCTG C SEQ ID NO :

92 TKGCGG Bsal CCW GAG GTACCG GTCTCG G CG GTCAGTTAG CCTCCCCCATCTCC SEQ ID NO :

93

HSVTKterm CCGC GAG GTACCG GTCTCACCG CGGGGGAGG CTAACTG AAACAC SEQ ID NO : Bsal CW 94

HSVTKterm AATA GAG GTACCG GTCTCG AATAG G CTATG GCAGGGCCTGC SEQ ID NO : Bsal CCW 95

TetOn3G CACC Bsal GAGGTACCGGTCTCACACCATGTCTAGACTGGACAAGAGCAAAG SEQ ID NO : CW 96

TetOn3G ATCA Bsal GAG GTACCG GTCTCAATCATTACCCG G G GAG CATGTCAAG SEQ ID NO : CCW 97 pTet3G TTCG Bsal GAGGTACCGGTCTCATTCGTCTTCAAGAATTCCTCGAGTTTACTCC SEQ ID NO : CW 98 pTet3G CTGG Bsal GAGGTACCGGTCTCGCTGGTTTACGAGGGTAGGAAGTGGTACG SEQ ID NO : CCW 99 mB3Galt6 CCAG Bsal GAG GTACCG GTCTCACCAGAG CATG AAG GTATTCCG G CG CG CTT SEQ ID NO : CW G 100 mB3Galt6 GCGG Bsal GAGGTACCGGTCTCGGCGGTGACATCAGGGAACGCCCTCCTTG SEQ ID NO : CCW 101

HSVTKterm TTGT GAG GTACCG GTCTCGTTGTG G CTATG GCAGGGCCTGC SEQ ID NO : Bsal CCW 102 shB3Galt6 ACAA Bsal GAG GTACCG GTCTCAACAAACAG G GTCG ACAAG CTTTTCC SEQ ID NO : CW 103

ColEl-ori TAAA Bsal GAGGTACCGGTCTCATAAAACTCATATATACTTTAGATTGATTTA SEQ ID NO : CCW AAAC 120

AmpRTTTA Bsal CW GAGGIACCGGICICI 11 IAI IGGICIGACAGI IACCAAIGCI IAAI SEQ ID NO :

C 121

ColEl-ori GTTT Bsal GAG GTACCG GTCTCG GTTTACTCATATATACTTTAG ATTG ATTTAA SEQ ID NO : CCW AAC 122

ColEl-ori 2 ATTA Bsal GAG GTACCG GTCTCT ATT ACG GTAATACG GTTATCCACAG SEQ ID NO : CW 123

AmpR 2 GCAT Bsal GAG GTACCG GTCTCAG C ATTG G CACTTTTCG G G G AAATGTG C SEQ ID NO : CCW 124

AmpR AAAC Bsal CW GAGGTACCGGTCTCAAAACTTGGTCTGACAGTTACCAATGCTTAA SEQ ID NO :

TC 125

EFlap GATA Bsal GAGGTACCGGTCTCGGATATCACGACACCTGAAATGGAAG SEQ ID NO : CCW 126 EFlapL ATGC Bsa l GAGGTACCGGTCTCAATGCGTGAGGCTCCGGTGCCCGTC SEQ ID NO : CW 127

EGFP-CAAX ACTC GAGGTACCGGTCTCCACTCTTACATAATTACACACTTTGTCTTTGA SEQ ID NO : Bsal CCW CTTC 1 1 1 1 1 CTTCTTCTTGTACAG CTCGTCCATG C 128

EGFP TATC Bsa l CW GAG GTACCG GTCTCCTATCATG GTG AG CAAG G G CG AG G SEQ ID NO :

129

BGHpA CTAC Bsa l GAGGTACCGGTCTCGCTACCCATAGAGCCCACCGCATCC SEQ ID NO : CCW 2 130

BGHpA GAGT Bsa l GAGGTACCGGTCTCAGAGTCGACTGTGCCTTCTAGTTGCC SEQ ID NO : CW 131

CMVp CGAA Bsa l GAGGTACCGGTCTCGCGAAGATCTGACGGTTCACTAAACCAG SEQ ID NO : CCW 132

CMVp GTAG Bsa l CW GAG GTACCG GTCTCAGTAGTTATTAATAGTAATCAATTACG G G GT SEQ ID NO :

C 133

SiaT TCAC Bsa l CCW GAG GTACCG GTCTCATCACCCCCG ACCCCTTTTG CAG SEQ ID NO :

134

SiaT TTCG Bsa l CW GAGGTACCGGTCTCCTTCGATGATTCACACCAACCTGAAGAAAAA SEQ ID NO :

G 135

XFP-Ctag GCGG Bsa l GAGGTACCGGTCTCAGCGGTTACTTGTACAGCTCGTCCATGC SEQ ID NO : CCW 136

XFP-Ctag GTGA Bsa l GAGGTACCGGTCTCAGTGAGCAAGGGCGAGGAG SEQ ID NO : CW 137

Hygro TAAT Bsa l GAGGTACCGGTCTCGTAATGATACATTGATGAGTTTGGACAAAC SEQ ID NO : CCW CAC 138

Hygro ACAA Bsa l CW GAG GTACCG GTCTCAACAACAG G CAG AAGTATG CAAAG C SEQ ID NO :

139

ColEl-ori 2 GTTT Bsa l GAGGTACCGGTCTCAGTTTAAACTCATATATACTTTAGATTGATTT SEQ ID NO : CCW AAAAC 140

ColEl-ori 2 GGGG GAG GTACCG GTCTCTGG GG CG GTAATACG GTTATCCACAG SEQ ID NO : Bsal CW 141

AmpR 2 TCAC Bsa l GAG GTACCG GTCTCATCACTG G CACTTTTCG G G G AAATGTG C SEQ ID NO : CCW 142

MN N lOLrec CGCA GAGGTACCGGTCTCACGCAATTGTATAGTTGTACATGCACAATTA SEQ ID NO : Bsal CCW TTCC 143

MN N lOLrec GTGA GAGGTACCGGTCTCTGTGAGTTTAAACATGCATTCAAAGGTCATA SEQ ID NO : Bsal CW ATTGCTG 144 MNNlORrec CCCC GAGGTACCGGTCTCTCCCCGTTTAAACTGCCCAGTTTTTCATTATT SEQ ID NO : Bsal CCW AGTGTG 145

MNNlORrec TCGT GAGGTACCGGTCTCTTCGTAATGGAAGTTATCAATATTGTAAAGA SEQ ID NO : Bsal CW GAAGC 146

KanMX ACGA Bsa l GAGGTACCGGTCTCTACGACACTAGTGGATCTGATATCACC SEQ ID NO : CCW 147

KanMX TGCG Bsa l GAGGTACCGGTCTCGTGCGGTACGCTGCAGGTCGACAACC SEQ ID NO : CW 148

Tableau 4 : Liste des amorces utilisées pour amplifier les briques indiquées (site de reconnaissance Bsal souligné et sutures en gras)

Tableau 5: Exemple de composition du mix réactionnel pour la réalisation des PCR

Tableau 6: Cycles d'Amplification

* Les modules fluorescents ont tous été ajustés à la même concentration Nom de la brique Taille Température Temps Concentration

(Pb) d'hybridation d'élongation après

purification (ng/μΙ)

Ori-AmpR Bsal A (SEQ ID NO : 2005 60 l' 42

17) pCMV Bsal A (SEQ ID NO : 18) 677 65 20" 24

SiaT Bsal A (SEQ ID NO : 19) 370 61 10" 104

E1GFP Bsal A (SEQ ID NO : 20) 758 63 20" 75*

ou EGFP Bsal A (SEQ ID NO : 21)

ou ECFP Bsal A (SEQ ID No: 22)

ou EYFP Bsal A (SEQ ID NO: 23)

ou mCherry Bsal A (SEQ ID NO:

24) ou TagBFP Bsal A (SEQ ID

NO: 25)

BGHpA Bsal A (SEQ ID NO : 26) 267 63 8" 52

LacZa-up Bsal A (SEQ ID NO : 27) 278 67 8" 38

LacZa-down Bsal A (SEQ ID NO : 299 65 8" 36

28)

HygroR Bsal A (SEQ ID NO : 29) 1650 63 45" 60

Tableau 7 : Caractéristiques des briques et des conditions de PCR A la fin de la PCR les produits sont soumis à une électrophorèse en gel d'agarose et les bandesdécoupées du gel sont purifiées et quantifiées, selon les techniques bien connues de l'homme du métier. Protocole d'assemblage des différentes briques moléculaires / construction du vecteur

Tableau 8 : Composition d'un mix d'assemblage :

L'assemblage a été réalisé par 50 cycles d'incubation à 37°C pendant 2' puis 16°C pendant 3', suivis d'une incubation à 50°C pendant 5' et enfin d'une incubation à 80°C pendant 5'.

Pour chaque construction, l'ADN de 3 colonies obtenues après transformation a été extrait et analysé par restriction par les enzymes Pvu lHF et ScalHF (figure. 5). Le procédé selon l'invention permet d'assembler en une seule étape et en présence d'une seule enzyme au moins 6 briques moléculaires (et plus préférentiellement au moins 8 briques) sans aucune erreur. Le procédé selon l'invention permet d'assembler en une seule étape et en présence d'une seule enzyme au moins 6 briques moléculaires avec un rendement de 100%

Le procédé selon l'invention permet d'assembler en une seule étape et en présence d'une seule enzyme au moins 6 briques et jusqu'à 30 briques.

La présente invention permet donc, selon un procédé, la fabrication d'un vecteur circulaire d'ADN double brin à pa rtir de modules fonctionnels linéaires d'ADN double brin comprenant une seule étape d'assemblage des dits modules, en présence d'une seule enzyme de restriction, ladite seule enzyme de restriction étant une enzyme de type Ils.

Séquences des briques utilisées pour les différentes constructions de la réalisation 1 : Brique Ori-AmpR Bsal A (2005 bp) (SEQ ID NO : 17)

GAGGTACCGGTCTCATTATGCGTCTTCTAGGGTTAAGGTTAGTGTAGAGAAGCAACCGAA GATTGAGAAGACATG G CG GTAATACG GTTATCCACAG AATCAG G G G ATAACG CAG G AAAG AACATGTG AG CAAAAG G CCAG CAAAAG G C CAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCAC AAAAATCG A CGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCT GGAAGCTCCCTCGTGC G CTCTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG GGAAGCGTGGCG CTTTCTCATA G CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTCA GCCCGACCGCTGCG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCACTG G CA G CAG CCACTG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG CTACAG AGTTCTTG AAGTGGTGG CCTAAC T ACG G CTACACTAG AAG AACAGTATTTG GTATCTG CG CTCTG CTG AAG CCAGTTACCTTCG G AAAAAG AGTTG GTA G CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAA AGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAA CTCACGTTAAGGGATT TTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGT TTTAAATCAATCTAAAGT ATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCA GCGATCTGTCTATTTCG TTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACC ATCTGGCCCCAGTGCTG CAATGATACCGCGTGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAG CCGGAAGGGCCGAGC G CAG AAGTG GTCCTG CAACTTTATCCG CCTCCATCCAGTCTATTAATTGTTG CCG G G AAG CTAG AGTAAGTAGTTCG CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTC ATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAA AGCGGTTAGCTCCTTCG GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCA TCATG GTTATG G CAG CACTG CATAATTCT TT ACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTC TGAGAATAGTGTATGCG GCGACCGAGTTG CT TTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG TCATC ATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT TCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG C CG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG CATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCGAAAAGTGCCACCTATGAGACGTGAGGCTAGGGATAGGACGAGAGCATCGGG AACGAGGACTAGCG TCTCAAGGACGAGACCGGTACCTC

Brique pCMV Bsal A (677pb) (SEQ ID NO : 18)

GAGGTACCGGTCTCAAGGAACCAATTCAGTCGACTGGATCCTAGTTATTAATAGTAATCA ATTACGGGGTCATTAG TTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATG G CCCG CCTG G TG ACCG CCCAACG ACCCC CG CCCATTG ACGTCAATAATG ACGTATGTTCCCATAGTAACG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTCAAT G ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTC TACTTG G CAGTACATCTACGT ATTAGTCATCG CTATTACCATG GTG ATG CG GTTTTG G CAGTACATCAATG G G CGTG G ATAG CG GTTTG ACTCACG G G G ATTTCCAAGT TCCACCCCATTG ACGTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATG TCGTAACAACTCCG CCCCATTG ACG CAAATG G G CG GTAG G CGTGTACG GTG G G AG GTCTATATAAG CAG AG CTG G TTTAGTGAACCGTCAGATCACTAGTCGACTAGGGATAACAGGGCCGCCACCTGAGACCGG TACCTC

Brique SiaT Bsal A (370pb) (SEQ ID NO : 19)

GAGGTACCGGTCTCCCACCATGATTCACACCAACCTGAAGAAAAAGTTCAGCTGCTGCGT CCTGGTCTTTCTTCTGT TTG CAGTCATCTGTGTGTG G AAG G AAAAG AAG AAAG GG AGTTACTATG ATTCCTTTAAATTGCAAACCAAGG AATT CCAGGTGTTAAAGAGTCTGGGGAAATTGGCCATGGGGTCTGATTCCCAGTCTGTATCCTC AAGCAGCACCCAGGAC CCCCACAG G G G CCG CCAG ACCCTCG G CAGTCTCAG AG G CCTAG CCAAG G CCAAACCAG AG G CCTCCTTCCAG GTG TGGAACAAGGACAGCTCTTCCAAAAACCTTATCCCTAGGCTGCAAAAGGGGTGAGACCGG TACCTC Brique EGFP Bsal A (758pb) (SEQ ID NO : 20)

GAGGTACCGGTCTCCGGGGTCGGGGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGT GCCCATCCTGGTCG AGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATG CCACCTACGGCAAG CTG ACCCTG AAGTTCATCTG CACCACCG G CAAG CTG CCCGTG CCCTG G CCCACCCTCGTG ACCACCCTgtccTACG G C GTG CAGTG TTCAG CCG CTACCCCG ACCACATG AAG CAG CACG ACTTCTTCAAGTCCG CCATG CCCG AAG G CTACG TCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGA AGTTCGAGGGCGACA CCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGG GGCACAAGCTGGAG TACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAG GTGAACTTCAAGATCC GCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCA TCGGCGACGGCCCCG TGCTGCTGCCCGACAACCACTACCTGAGctacCAGTCCGCCCTGAGCAAAGACCCCAACG AGAAGCGCGATCACATG GTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAG TGATGGAGACCGGTA CCTC

Brique EGFP Bsal A (758pb) (SEQ ID NO : 21)

GAGGTACCGGTCTCCGGGGTCGGGGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGT GCCCATCCTGGTCG AGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATG CCACCTACGGCAAG CTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTG ACCACCCTGACCTACGG CGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGC CATGCCCGAAGGCTAC GTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTG AAGTTCGAGGGCGAC ACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTG GGGCACAAGCTGGA GTACAACTACAACAG CCACAACGTCTATATCATG G CCG ACAAG CAG AAG AACG G CATCAAG GTG AACTTCAAG AT CCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCC CATCGGCGACGGCCC CGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAA CGAGAAGCGCGATCAC ATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTAC AAGTGATGGAGACCG GTACCTC

Brique ECFP Bsal A (758pb) (SEQ ID NO : 22)

GAGGTACCGGTCTCCGGGGTCGGGGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGT GGTGCCCATCCTGGTCG AGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATG CCACCTACGGCAAG CTGACCCTG AAGTTCATCTG CACCACCG G CAAG CTG CCCGTG CCCTG G CCCACCCTCGTG ACCACCCTG ACCTG G G GCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCG CCATGCCCGAAGGCTA CGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGT GAAGTTCGAGGGCGA CACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCT GGGGCACAAGCTGG AGTACAACTACATCAGCCACAACGTCTATATCACCGCCGACAAGCAGAAGAACGGCATCA AGGCCAACTTCAAGAT CCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCC CATCGGCGACGGCCC CGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAA CGAGAAGCGCGATCAC

ATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTG TACAAGTGATGGAGACCG

GTACCTC Brique EYFP Bsal A (758pb) (SEQ ID NO : 23)

GAGGTACCGGTCTCCGGGGTCGGGGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGT GCCCATCCTGGTCG AGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATG CCACCTACGGCAAG CTG ACCCTG AAGTTCATCTG CACCACCG G CAAG TG CCCGTG CCCTG G CCCACCCTCGTG ACCACCTTCG G CTACG G CCTG CAGTG CTTCG CCCG CTACCCCG ACCACATG AAG CAG CACG ACTTCTTCAAGTCCG CCATG CCCG AAG G CTAC GTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTG AAGTTCGAGGGCGAC ACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTG GGGCACAAGCTGGA GTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAA GGTGAACTTCAAGAT CCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCC CATCGGCGACGGCCC CGTGCTGCTGCCCGACAACCACTACCTGAGCTACCAGTCCGCCCTGAGCAAAGACCCCAA CGAGAAGCGCGATCAC ATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTAC AAGTGATGGAGACCG GTACCTC

Brique mCherry Bsal A (749pb) (SEQ ID NO : 24)

GAGGTACCGGTCTCCGGGGTCGGGGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCAT CAAGGAGTTCATGC GCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGG GCGAGGGCCGCCCC TACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCC TGGGACATCCTGTCC CCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTAC TTGAAGCTGTCCTTCCC CGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGAC CCAGGACTCCTCCCT GCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGG CCCCGTAATGCAGAA GAAAACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAA GGGCGAGATCAAGC AGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGG CCAAGAAGCCCGTG CAG TGCCCGGCG C TACAACGTCAACATCAAGTTG G ACATCACCTCCCACAACG AG G ACTACACCATCGTG G AAC AGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTGAT GGAGACCGGTACCT C

Brique TagBFP Bsal A (746pb) (SEQ ID NO : 25) GAGGTACCGGTCTCCGGGGTCGGGGAGCGAGCTGATTAAGGAGAACATGCACATGAAGCT GTACATGGAGGGCA CCGTG G ACAACCATCACTTCAAGTG CACATCCG AG G G CG AAG G CAAG CCCTACG AG G G CACCCAG ACCATG AG AA TCAAG GTGGTCGAGGGCGG CCCT TCCCCTTCG C TTCG ACATCCTG G CTACTAG CTTCCTCTACG G CAG CAAG ACC TTCATCAACCACACCCAGGGCATCCCCGACTTCTTCAAGCAGTCCTTCCCTGAGGGCTTC ACATGGGAGAGAGTCAC CACATACG AGGACGGGGGCGTG CTG ACCG CTACCCAG G ACACCAG CCTCCAG G ACG G CTG CCTCAT TACAACGT CAAGATCAGAGGGGTGAACTTCACATCCAACGGCCCTGTGATGCAGAAGAAAACACTCGG CTGGGAGGCCTTCAC CGAAACGCTGTACCCCGCTGACGGCGGCCTGGAAGGCAGAAACGACATGGCCCTGAAGCT CGTGGGCGGGAGCC AT TG ATCG CAAACATCAAG ACCACATATAG ATCCAAG AAACCCG CTAAG AACCTCAAG ATG CCTG G CGTCTACTA TGTGGACTACAGACTGGAAAGAATCAAGGAGGCCAACAACGAAACCTACGTCGAGCAGCA CGAGGTGGCAGTGG CCAGATACTGCGACCTCCCTAGCAAACTGGGGCACAAGCTTAATTCCGGATGATGGAGAC CGGTACCTC

Brique BGHpA Bsal A (267pb) (SEQ ID NO : 26)

GAGGTACCGGTCTCATGATCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCC TCCCCCGTGCCTTCCTTG ACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCAT TGTCTGAGTAGGTGTCA TTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAG CAGGCATGCTGGG GATGCGGTGGGCTCTATGGCTTCTGGAGACCGGTACCTC

Brique LacZ -up Bsal A (278) (SEQ ID NO : 27)

G AG GTACCG GTCTCGTTCTCCCTG CAG GTG CG CCCAATACG CAAACCG CCTCTCCCCGCGCGTTGG CCG ATTCATTA ATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAA TGTGAGTTAGCTCAC TCATTAG G CACCCCAG G CTTTACACTTTATG CTTCCG G CTCGTATGTTGTGTG G AATTGTG AG CG G ATAACAATTTC ACACAGGAAACAGCTATGACCATGATTACGGACAGGAGACCGGTACCTC

Brique LacZ -down Bsal A (299pb) (SEQ ID NO : 28)

GAGGTACCGGTCTCGGACAGCCTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAAC CCTGGCGTTACCCAACTTA ATCG CCTTG CAG CACATCCCCCTTTCG CCAG CTG G CGTAATAG CGAAGAGGCCCG CACCG ATCG CCCTTCCCAACA GTTG CG CAG CCTG AATG G CG AATG GCGCCTGATGCG GTATTTTCTCCTTACG CATCTGTG CG GTATTTCACACCG CA TATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGACCTGCAGGGCCAGTGAGA CCGGTACCTC Brique HygroR Bsal A (1650pb) (SEQ ID NO : 29)

GAG GTACCG GTCTCCCCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAG TCCCCAG G CTCCCCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAA CTCCG CCCATCCCG CCCCTAACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G TG ACTAATTTTTTTTATTTATG C AGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGG AGGCCTAGGCTTTTGC AAAAAGCTCCCGGGAGCTTGTATATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAG CCTGAACTCACCGCGA CGTCTGTCGAGAAGTTTCTGATCGAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCT CGGAGGGCGAAGAAT CTCGTGCTTTCAGCTTCGATGTAGGAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCG CCGATGGTTTCTACAA AGATCGTTATGTTTATCGGCACTTTGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGA CATTGGGGAATTCAGC GAGAGCCTGACCTATTGCATCTCCCGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCT GAAACCGAACTGCCCG CTGTTCTGCAGCCGGTCGCGGAGGCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGA CGAGCGGGTTCGGCC CATTCGGACCGCAAGGAATCGGTCAATACACTACATGGCGTGATTTCATATGCGCGATTG CTGATCCCCATGTGTAT CACTGGCAAACTGTGATGGACGACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAG CTGATGCTTTGGGCC GAGGACTGCCCCGAAGTCCGGCACCTCGTGCACGCGGATTTCGGCTCCAACAATGTCCTG ACGGACAATGGCCGC ATAACAGCGGTCATTGACTGGAGCGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCC AACATCTTCTTCTGGA GGCCGTGGTTGGCTTGTATGGAGCAGCAGACGCGCTACTTCGAGCGGAGGCATCCGGAGC TTGCAGGATCGCCGC G G CTCCG G G CGTATATG TCCG CATTG GTCTTG ACCAACT TATCAG AG CTTG GTTG ACG G CAATTTCG ATG ATG C AGCTTGGGCGCAGGGTCGATGCGACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCG TACACAAATCGCCC GCAGAAGCGCGGCCGTCTGGACCGATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACC GACGCCCCAGCACTC GTCCGAGGGCAAAGGAATAGCACGTGCTACGAGATTTCGATTCCACCGCCGCCTTCTATG AAAGGTTGGGCTTCG GAATCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGT TCTTCGCCCACCCCAA CTTGTTTATTG CAG TTATAATG GTTACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACT GCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCGAGACCGGTACCTC

Séquence des vecteurs obtenus dans la réalisation 1

Un vecteur pHCsiaT-EiGFP (SEQ ID NO : 30) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal A (SEQ ID N O : 17), pCMV Bsal A (SEQ ID NO : 18), SiaT Bsa l A (SEQ I D NO : 19), BG HpA Bsa l A (SEQ ID NO : 26), LacZa-up Bsal A (SEQ ID NO : 27), LacZa-down Bsal A (SEQ ID NO : 28), HygroR Bsa l A (SEQ ID NO : 29) et E1G FP Bsa l A (SEQ I D NO : 20),

Vecteur pHCsiaT-E^FP (SEQ ID NO : 30)

TGAGGCTAGGGATAGGACGAGAGCATCGGGAACGAGGACTAGCGTCTCAAGGAACCA ATTCAGTCGACTGGATC CTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACG TATGTTCCCATAGTAA CG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAA TG CCCACTTG G CAGTACATCAAGT GTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG AC TTATG G G A TTTCCTA TTG G CAGTACATCTACGTATTAGTCATCG T ATTACCATG GTG ATG CG GTTTTG G CA GTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCAT TGACGTCAATGGGAGT TTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAACTCCG CCCCATTG ACG CAAATG G G CG GTA GGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCACTA GTCGACTAGGGATAA CAG G G CCG CCACCATG ATTCACACCAACCTG AAG AAAAAGTTCAG CTG TG CGTCCTG GTCTTTCTTCTGTTTG CAG TCATCTGTGTGTGGAAGGAAAAGAAGAAAGGGAGTTACTATGATTCCTTTAAATTGCAAA CCAAGGAGTTCCAGGT GTTAAAGAGTCTGGGGAAATTGGCCATGGGGTCTGATTCCCAGTCTGTATCCTCAAGCAG CACCCAGGACCCCCAC AGGGGCCG CCAG ACCCTCG G CAGTCTCAG AG G CCTAG CCAAG G CCAAACCAG AG G C TCCTTCCAG GTGTG G AAC AAG G ACAG TCTTCCAAAAACCTTATCCCTAG G CTG CAAAAG GGGTCGGGGGTGAG CAAG G G CG AG G AG CTGTTC ACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGC GTGTCCGGCGAGGG CGAGGGCGATG CCACCTACG G CAAG CTG ACCCTG AAGTTCATCTG CACCACCG G CAAG CTGCCCGTGCCCTGGCCC ACCCTCGTG ACCACCCTGTCCTACG G CGTG CAGTG CTTCAG CCG CTACCCCG ACCACATG AAG CAG CACG ACTTCTT CAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGG CAACTACAAGACCCGC GCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGAC TTCAAGGAGGACGG CAACATCCTG G G G CACAAG CTG G AGTACAACTACAACAG CCACAACGTCTATATCATG G CCG ACAAG CAG AAG AA CGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGC CGACCACTACCAGCA GAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCTACCA GTCCGCCCTGAGCAAA GACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATC ACTCTCGGCATGGAC GAGCTGTACAAGTGATCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCC CCCGTGCCTTCCTTGACC CTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGT CTGAGTAGGTGTCATTC TATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCAG GCATGCTGGGGAT GCGGTGGG CTCTATG G CTTCTCCCTG CAG GTG CG CCCAATACG CAAACCG CCTCTCCCCGCGCGTTGG CCG ATTCA TTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAAT TAATGTGAGTTAGCT CACTCATTAG G CACCCCAG G CTTTACACTTTATG CTTCCG G CTCGTATGTTGTGTG G AATTGTG AG CG G ATAACAAT TTCACACAGGAAACAGCTATGACCATGATTACGGACAGCCTGGCCGTCGTTTTACAACGT CGTGACTGGGAAAACC CTG G CGTTACCCAACTTAATCG CCTTG CAG CACATCCCCCTTTCG CCAG CTG G CGTAATAG CG AAG AG G CCCG CAC CG ATCG CCCTTCCCAACAGTTG CG CAG CCTG AATG G CG AATG G CG CCTG ATG CG GTATTTTCTCCTTACG CATCTGT G CG GTATTTCACACCG CATATG GTG CACTCTCAGTACAATCTG CTCTG ATG CCG CATAG ACCTG CAG G G CCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCA G G CTCCCCAG CAG G CA G AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAACTCCG CCCATCCCG CCCCTAACT CCG CCCAGTTCCG CCCATT TCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG CAGAGGCCGAGGCCG CCTCTG CC TCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAG CTCCCGGGAGCTTGTA TATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAGCCTGAACTCACCGCGACGTCTG TCGAGAAGTTTCTGATC GAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTCGTGCT TTCAGCTTCGATGTAG GAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCGCCGATGGTTTCTACAAAGATCGTT ATGTTTATCGGCACTT TGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAGAGCCT GACCTATTGCATCTCC CGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCTGAAACCGAACTGCCCGCTGTTCTG CAGCCGGTCGCGGAG GCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGACGAGCGGGTTCGGCCCATTCGGA CCGCAAGGAATCGGT CAATACACTACATGGCGTGATTTCATATGCGCGATTGCTGATCCCCATGTGTATCACTGG CAAACTGTGATGGACG ACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAGGACT GCCCCGAAGTCCGGC AC TCGTGCACGCGG ATTTCG G CTCCAACAATGTCCTG ACG G ACAATG G CCG CATAACAG CG GTCATTG ACTG G AG CGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCCAACATCTTCTTCTGGAGGCCGTG GTTGGCTTGTATGGAG CAGCAGACGCG CTACTTCG AG CG G AG G CATCCG G AG CTTG CAG G ATCG CCG CG G CTCCG G G CGTATATG CTCCG C ATTGGTCTTGACCAACTCTATCAGAGCTTGGTTGACGGCAATTTCGATGATGCAGCTTGG GCGCAGGGTCGATGCG ACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCGTACACAAATCGCCCGCAGAAGCG CGGCCGTCTGGACCG ATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACCGACGCCCCAGCACTCGTCCGAGGG CAAAGGAATAGCACG TGCTACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTT TCCGGGACGCCGGCTG G ATG ATCCTCCAG CG CG G G G AT TCATG TG G AGTT TTCG CCCACCCCAA TTGTTTATTG CAG CTTATAATG GTT ACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACTG CATTCTAGTTGTG GTTTGTCCAAAC TCATCAATGTATCTTATGCGTCTTCTAGGGTTAAGGTTAGTGTAGAGAAGCAACCGAAGA TTGAGAAGACATGGCG GTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGC CAGCAAAAGGCCAG GAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCA TCACAAAAATCGACGC TCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGA AGCTCCCTCGTGCGCT CTCCTGTTCCG ACCCTG CCG TTACCG G ATAC TGTCCG CCTTTCTCCCTTCG G G AAG CGTG G CG CTTTCTCATAG CT CACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTCAG CC CGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTT ATCGCCACTGGCAGCA G CCA TG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG TACAG AGTTCTTG AAGTG GTG G CCTAACTAC GGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGA AAAAGAGTTGGTAGCT CTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAAAG G ATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTC ACGTTAAGGGATTTTG GTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTT AAATCAATCTAAAGTAT ATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGC GATCTGTCTATTTCGTT CATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCAT CTGGCCCCAGTGCTGC AATG ATACCG CGTGACCCACGCTCACCGG CTCCAG ATTTATCAG CAATAAACCAG CCAG CCG G AAG GGCCGAGCG CAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGC TAGAGTAAGTAGTTCGC CAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCA TTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTC TCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCA TCATG GTTATG G CAG CACTG CATAATTCT TT ACTGTCATG CCATCCGTAAG ATG TTTTCTGTG A TG GTG AGTACTCAACCAAGTCATTCTG AG AATAGTGTATG CG GCGACCGAGTTG CT TTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AA TTTAAAAGTG TCATC ATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT TCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG C CGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCA ATATTATTGAAGCATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCG AAAAGTG CCACCTATG AG ACG Un vecteur pHCsiaT-EGFP (SEQ ID NO : 31) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal A (SEQ ID N O : 17), pCMV Bsal A (SEQ ID NO : 18), SiaT Bsa l A (SEQ I D NO : 19), BG HpA Bsa l A (SEQ ID NO : 26), LacZa-up Bsal A (SEQ ID NO : 27), LacZa-down Bsal A (SEQ ID NO : 28), HygroR Bsa l A (SEQ ID NO : 29) et EGFP Bsa l A (SEQ ID NO : 21). Vecteur pHCsiaT-EGFP (SEQ ID NO : 31)

TGAGGCTAGGGATAGGACGAGAGCATCGGGAACGAGGACTAGCGTCTCAAGGAACCAATT CAGTCGACTGGATC CTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACG TATGTTCCCATAGTAA CG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGT GTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTACGTATTAGTCATCG CTATTACCATG GTG ATG CG GTTTTG G CA GTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCAT TGACGTCAATGGGAGT TTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAACTCCG CCCCATTG ACG CAAATG G G CG GTA GGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCACTA GTCGACTAGGGATAA CAG G G CCG CCACCATG ATTCACACCAACCTG AAG AAAAAGTTCAG CTG CTG CGTCCTG GTCTTTCTTCTGTTTG CAG TCATCTGTGTGTGGAAGGAAAAGAAGAAAGGGAGTTACTATGATTCCTTTAAATTGCAAA CCAAGGAATTCCAGGT GTTAAAGAGTCTGGGGAAATTGGCCATGGGGTCTGATTCCCAGTCTGTATCCTCAAGCAG CACCCAGGACCCCCAC AGGGGCCG CCAG ACCCTCG G CAGTCTCAG AG G CCTAG CCAAG G CCAAACCAG AG G C TCCTTCCAG GTGTG G AAC AAG G ACAG TCTTCCAAAAACCTTATCCCTAG G CTG CAAAAG GGGTCGGGGGTGAG CAAG G G CG AG G AG CTGTTC ACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGC GTGTCCGGCGAGGG CGAGGGCGATG CCACCTACG G CAAG CTG ACCCTG AAGTTCATCTG CACCACCG G CAAG CTGCCCGTGCC TGGCCC ACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATG AAGCAGCACGACTTCTT CAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGG CAACTACAAGACCCGC GCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGAC TTCAAGGAGGACGG CAACATCCTG G G G CACAAG CTG G AGTACAACTACAACAG CCACAACGTCTATATCATG G CCG ACAAG CAG AAG AA CGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGC CGACCACTACCAGCA GAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCA GTCCGCCCTGAGCAAA GACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATC ACTCTCGGCATGGAC GAGCTGTACAAGTGATCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCC CCCGTGCCTTCCTTGACC CTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGT CTGAGTAGGTGTCATTC TATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCAG GCATGCTGGGGAT GCGGTGGG CTCTATG G CTTCTCCCTG CAG GTG CG CCCAATACG CAAACCG CCTCTCCCCGCGCGTTGG CCG ATTCA TTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAAT TAATGTGAGTTAGCT CACTCATTAG G CACCCCAG G CTTTACACTTTATG CTTCCG G CTCGTATGTTGTGTG G AATTGTG AG CG G ATAACAAT TTCACACAGGAAACAGCTATGACCATGATTACGGACAGCCTGGCCGTCGTTTTACAACGT CGTGACTGGGAAAACC CTG G CGTTACCCAACTTAATCG CCTTG CAG CACATCCCCCTTTCG CCAG CTG G CGTAATAG CG AAG AG G CCCG CAC CG ATCG CCCTTCCCAACAGTTG CG CAG CCTG AATG G CG AATG G CG CCTG ATG CG GTATTTTCTCCTTACG CATCTGT G CG GTATTTCACACCG CATATG GTG CACTCTCAGTACAATCTG CTCTG ATG CCG CATAG ACCTG CAG G G CCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCA G G CTCCCCAG CAG G CA G AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAACTCCG CCCATCCCG CCCCTAACT CCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG CAGAGGCCGAGGCCG CCTCTG CC TCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAG CTCCCGGGAGCTTGTA TATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAGCCTGAACTCACCGCGACGTCTG TCGAGAAGTTTCTGATC GAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTCGTGCT TTCAGCTTCGATGTAG GAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCGCCGATGGTTTCTACAAAGATCGTT ATGTTTATCGGCACTT TGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAGAGCCT GACCTATTGCATCTCC CGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCTGAAACCGAACTGCCCGCTGTTCTG CAGCCGGTCGCGGAG GCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGACGAGCGGGTTCGGCCCATTCGGA CCGCAAGGAATCGGT CAATACACTACATGGCGTGATTTCATATGCGCGATTGCTGATCCCCATGTGTATCACTGG CAAACTGTGATGGACG ACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAGGACT GCCCCGAAGTCCGGC ACCTCGTGCACGCGG ATTTCG G TCCAACAATGTCCTG ACG G ACAATG G CCG CATAACAG CG GTCATTG ACTG G AG CGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCCAACATCTTCTTCTGGAGGCCGTG GTTGGCTTGTATGGAG CAGCAGACGCG CTA TTCG AG CG G AG G CATCCG G AG CTTG CAG G ATCG CCG CG G CTCCG G G CGTATATG CTCCG C ATTGGTCTTGACCAACTCTATCAGAGCTTGGTTGACGGCAATTTCGATGATGCAGCTTGG GCGCAGGGTCGATGCG ACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCGTACACAAATCGCCCGCAGAAGCG CGGCCGTCTGGACCG ATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACCGACGCCCCAGCACTCGTCCGAGGG CAAAGGAATAGCACG TGCTACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTT TCCGGGACGCCGGCTG G ATG ATCCTCCAG CG CG G G G AT TCATG TG G AGTT TTCG CCCACCCCAA TTGTTTATTG CAG CTTATAATG GTT ACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACTG CATTCTAGTTGTG GTTTGTCCAAAC TCATCAATGTATCTTATGCGTCTTCTAGGGTTAAGGTTAGTGTAGAGAAGCAACCGAAGA TTGAGAAGACATGGCG GTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGC CAGCAAAAGGCCAG GAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCA TCACAAAAATCGACGC TCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGA AGCTCCCTCGTGCGCT CTCCTGTTCCG ACCCTG CCG TTACCG G ATACCTGTCCG CCTTTCTCCCTTCG G G AAG CGTG G CG CTTTCTCATAG CT CACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTCAG CC CGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTT ATCGCCACTGGCAGCA G CCA TG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG CTACAG AGTTCTTG AAGTG GTG G CCTAACTAC GGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGA AAAAGAGTTGGTAGCT CTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAAAG G ATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTC ACGTTAAGGGATTTTG GTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTT AAATCAATCTAAAGTAT ATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGC GATCTGTCTATTTCGTT CATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCAT CTGGCCCCAGTGCTGC AATG ATACCG CGTGACCCACGCTCACCGG CTCCAG ATTTATCAG CAATAAACCAG CCAG CCG G AAG GGCCGAGCG CAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGC TAGAGTAAGTAGTTCGC CAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCA TTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTC TCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCTT ACTGTCATG CCATCCGTAAG ATG TTTTCTGTG A TG GTG AGTACTCAACCAAGTCATTCTG AG AATAGTGTATG CG GCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AA TTTAAAAGTG TCATC ATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT TCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTT TG G GTG AG CAAAAACAG G AAG G CAAAATG C CGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCA ATATTATTGAAGCATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCG AAAAGTG CCACCTATG AG ACG

Un vecteur pHCsiaT-ECFP (SEQ I D NO : 32) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal A (SEQ ID N O : 17), pCMV Bsal A (SEQ ID NO : 18), SiaT Bsa l A (SEQ I D NO : 19), BG HpA Bsa l A (SEQ ID NO : 26), LacZa-up Bsal A (SEQ ID NO : 27), LacZa-down Bsal A (SEQ ID NO : 28), HygroR Bsa l A (SEQ ID NO : 29) et ECFP Bsa l A (SEQ ID NO : 22).

Vecteur pHCsiaT-ECFP (SEQ ID NO : 32)

TGAGGCTAGGGATAGGACGAGAGCATCGGGAACGAGGACTAGCGTCTCAAGGAACCAATT CAGTCGACTGGATC CTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACG TATGTTCCCATAGTAA CG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGT GTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTACGTATTAGTCATCG CTATTACCATG GTG ATG CG GTTTTG G CA GTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCAT TGACGTCAATGGGAGT TTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAACTCCG CCCCATTG ACG CAAATG G G CG GTA GGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCACTA GTCGACTAGGGATAA CAG G G CCG CCACCATG ATTCACACCAACCTG AAG AAAAAGTTCAG CTG CTG CGTCCTG GTCTTTCTTCTGTTTG CAG TCATCTGTGTGTGGAAGGAAAAGAAGAAAGGGAGTTACTATGATTCCTTTAAATTGCAAA CCAAGGAATTCCAGGT GTTAAAGAGTCTGGGGAAATTGGCCATGGGGTCTGATTCCCAGTCTGTATCCTCAAGCAG CACCCAGGACCCCCAC AGGGGCCG CCAG ACCCTCG G CAGTCTCAG AG G CCTAG CCAAG G CCAAACCAG AG G CCTCCTTCCAG GTGTG G AAC AAG G ACAG CTCTTCCAAAAACCTTATCCCTAG G CTG CAAAAG GGGTCGGGGGTGAG CAAG G G CG AG G AG CTGTTC ACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGC GTGTCCGGCGAGGG CGAGGGCGATG CCACCTACG G CAAG CTG ACCCTG AAGTTCATCTG CACCACCG G CAAG CTGCCCGTGCCCTGGCCC ACCCTCGTGACCACCCTGACCTGGGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATG AAGCAGCACGACTTCT TCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACG GCAACTACAAGACCCG CGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGA CTTCAAGGAGGACG G CAACATCCTG G G G CACAAG CTG G AGTACAACTACATCAG CCACAACGTCTATATCACCG CCG ACAAG CAG AAG A ACG G CATCAAG G CCAACTTCAAG ATCCG CCACAACATCG AG G ACG G CAG CGTG CAG CTCG CCG ACCACTACCAG C AGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCC AGTCCGCCCTGAGCAA AGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGAT CACTCTCGGCATGGA CGAGCTGTACAAGTGATCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTC CCCCGTGCCTTCCTTGAC CCTG G AAG GTG CCACTCCCACTGTC TTTCCTAATAAAATG AG G AAATTG CATCG CATTGT TG AGTAG GTGTCATT CTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCA GGCATGCTGGGG ATG CG GTG G G CTCTATG G TTCTCCCTG CAG GTG CG CCCAATACG CAAACCG CCT TCCCCGCGCGTTGGCCG ATT CATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCA ATTAATGTGAGTTAG CTCACTCATTAG G CACCCCAG G TTTACACTTTATG CTTCCG G CTCGTATGTTGTGTG G AATTGTG AG CG G ATAACA ATTTCACACAG G AAACAG CTATG ACCATG ATTACG G ACAG CCTG G CCGTCGTTTTACAACGTCGTG ACTG G G AAAA CCCTG G CGTTACCCAACTTAATCG C TTG CAG CACATCCCCCTTTCG CCAG TG G CGTAATAG CGAAGAGGCCCGC ACCG ATCG CC TTCCCAACAGTTG CG CAG CCTG AATG G CG AATG GCGCCTGATGCG GTATTTTCTCCTTACG CATCT GTG CG GTATTTCACACCG CATATG GTG CACTCTCAGTACAATCTG CTCTG ATG CCG CATAG ACCTG CAG G G CCAG C AG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCAG G CTCCCCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAACTCCG CCCATCCCG CCCCTAA CTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG CAGAGGCCGAGGCCG CCTCTG CCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAA AGCTCCCGGGAGCTTG TATATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAGCCTGAACTCACCGCGACGTC TGTCGAGAAGTTTCTGA TCGAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTCGTG CTTTCAGCTTCGATGT AG G AG G G CGTG G ATATGTCCTG CG G GTAAATAG CTG CG CCG ATG GTTTCTACAAAG ATCGTTATGTTTATCG G CAC TTTGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAGAGC CTGACCTATTGCATCT CCCGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCTGAAACCGAACTGCCCGCTGTTC TGCAGCCGGTCGCGGA GGCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGACGAGCGGGTTCGGCCCATTCGG ACCGCAAGGAATCGG TCAATACACTACATGGCGTGATTTCATATGCGCGATTGCTGATCCCCATGTGTATCACTG GCAAACTGTGATGGACG ACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAGGACT GCCCCGAAGTCCGGC ACCTCGTGCACGCGG ATTTCG G CTCCAACAATGTCCTG ACG G ACAATG G CCG CATAACAG CG GTCATTG ACTG GAG CGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCCAACATCTTCTTCTGGAGGCCGTG GTTGGCTTGTATGGAG CAGCAGACGCG CTACTTCG AG CG G AG G CATCCG G AG CTTG CAG G ATCG CCG CG G CTCCG G G CGTATATG CTCCG C ATTGGTCTTGACCAACTCTATCAGAGCTTGGTTGACGGCAATTTCGATGATGCAGCTTGG GCGCAGGGTCGATGCG ACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCGTACACAAATCGCCCGCAGAAGCG CGGCCGTCTGGACCG ATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACCGACGCCCCAGCACTCGTCCGAGGG CAAAGGAATAGCACG TGCTACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTT TCCGGGACGCCGGCTG G ATG ATCCTCCAG CG CG G G G ATCTCATG CTG G AGTTCTTCG CCCACCCCAACTTGTTTATTG CAG CTTATAATG GTT ACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACTG CATTCTAGTTGTG GTTTGTCCAAAC TCATCAATGTATCTTATGCGTCTTCTAGGGTTAAGGTTAGTGTAGAGAAGCAACCGAAGA TTGAGAAGACATGGCG GTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGC CAGCAAAAGGCCAG GAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCA TCACAAAAATCGACGC TCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGA AGCTCCCTCGTGCGCT CTCCTGTTCCG ACCCTG CCG TTACCG G ATAC TGTCCG CCTTTCTCCCTTCG G G AAG CGTG G CG CTTTCTCATAG CT CACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTCAG CC CGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTT ATCGCCACTGGCAGCA G CCA TG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG TACAG AGTTCTTG AAGTG GTG G CCTAACTAC GGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGA AAAAGAGTTGGTAGCT CTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAAAG G ATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTC ACGTTAAGGGATTTTG GTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTT AAATCAATCTAAAGTAT ATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGC GATCTGTCTATTTCGTT CATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCAT CTGGCCCCAGTGCTGC AATG ATACCG CGTGACCCACGCTCACCGG CTCCAG ATTTATCAG CAATAAACCAG CCAG CCG G AAG GGCCGAGCG CAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGC TAGAGTAAGTAGTTCGC CAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCA TTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTC TCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCTT ACTGTCATG CCATCCGTAAG ATG TTTTCTGTG A TG GTG AGTACTCAACCAAGTCATTCTG AG AATAGTGTATG CG GCGACCGAGTTG CT TTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCATC ATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT TCGATGTAACCCACTC GTG CACCCAA TG ATCTTCAG CATCTTTTA TTTCACCAG CGTTT TG G GTG AG CAAAAACAG G AAG G CAAAATG C CGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCA ATATTATTGAAGCATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCG AAAAGTG CCACCTATG AG ACG

Un vecteur pHCsiaT-EYGFP (SEQ ID NO : 33) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal A (SEQ ID N O : 17), pCMV Bsal A (SEQ ID NO : 18), SiaT Bsa l A (SEQ I D NO : 19), BG HpA Bsa l A (SEQ ID NO : 26), LacZa-up Bsal A (SEQ ID NO : 27), LacZa-down Bsal A (SEQ !D NO : 28), HygroR Bsa l A (SEQ ID NO : 29) et EYFP Bsa l A (SEQ ID NO : 23). Vecteur pHCsiaT-EYFP (SEQ ID NO : 33)

TGAGGCTAGGGATAGGACGAGAGCATCGGGAACGAGGACTAGCGTCTCAAGGAACCAATT CAGTCGACTGGATC CTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACG TATGTTCCCATAGTAA CG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAA TG CCCACTTG G CAGTACATCAAGT GTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG AC TTATG G G A TTTCCTA TTG G CAGTACATCTACGTATTAGTCATCG T ATTACCATG GTG ATG CG GTTTTG G CA GTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCAT TGACGTCAATGGGAGT TTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAACTCCG CCCCATTG ACG CAAATG G G CG GTA GGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCACTA GTCGACTAGGGATAA CAG G G CCG CCACCATG ATTCACACCAACCTG AAG AAAAAGTTCAG CTG TG CGTCCTG GTCTTTCTTCTGTTTG CAG TCATCTGTGTGTGGAAGGAAAAGAAGAAAGGGAGTTACTATGATTCCTTTAAATTGCAAA CCAAGGAATTCCAGGT GTTAAAGAGTCTGGGGAAATTGGCCATGGGGTCTGATTCCCAGTCTGTATCCTCAAGCAG CACCCAGGACCCCCAC AGGGGCCG CCAG ACCCTCG G CAGTCTCAG AG G CCTAG CCAAG G CCAAACCAG AG G C TCCTTCCAG GTGTG G AAC AAG G ACAG TCTTCCAAAAACCTTATCCCTAG G CTG CAAAAG GGGTCGGGGGTGAG CAAG G G CG AG G AG CTGTTC ACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGC GTGTCCGGCGAGGG CGAGGGCGATG CCACCTACG G CAAG CTG ACCCTG AAGTTCATCTG CACCACCG G CAAG CTGCCCGTGCCCTGGCCC ACCCTCGTG ACCACCTTCG G CTACG G CCTG CAGTG CTTCG CCCG CTACCCCG ACCACATG AAG CAG CACG ACTTCTT CAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGG CAACTACAAGACCCGC GCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGAC TTCAAGGAGGACGG CAACATCCTG G G G CACAAG CTG G AGTACAACTACAACAG CCACAACGTCTATATCATG G CCG ACAAG CAG AAG AA CGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGC CGACCACTACCAGCA GAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCTACCA GTCCGCCCTGAGCAAA GACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATC ACTCTCGGCATGGAC GAGCTGTACAAGTGATCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCC CCCGTGCCTTCCTTGACC CTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGT CTGAGTAGGTGTCATTC TATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCAG GCATGCTGGGGAT GCGGTGGG CTCTATG G CTTCTCCCTG CAG GTG CG CCCAATACG CAAACCG CCTCTCCCCGCGCGTTGG CCG ATTCA TTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAAT TAATGTGAGTTAGCT CACTCATTAG G CACCCCAG G CTTTACACTTTATG CTTCCG G CTCGTATGTTGTGTG G AATTGTG AG CG G ATAACAAT TTCACACAGGAAACAGCTATGACCATGATTACGGACAGCCTGGCCGTCGTTTTACAACGT CGTGACTGGGAAAACC CTG G CGTTACCCAACTTAATCG CCTTG CAG CACATCCCCCTTTCG CCAG CTG G CGTAATAG CG AAG AG G CCCG CAC CG ATCG CCCTTCCCAACAGTTG CG CAG CCTG AATG G CG AATG G CG CCTG ATG CG GTATTTT TCCTTACG CATCTGT G CG GTATTTCACACCG CATATG GTG CA TCTCAGTACAATCTG CTCTG ATG CCG CATAG ACCTG CAG G G CCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCA G G CTCCCCAG CAG G CA G AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAACTCCG CCCATCCCG CCCCTAACT CCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG CAGAGGCCGAGGCCG CCTCTG CC TCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAG CTCCCGGGAGCTTGTA TATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAGCCTGAACTCACCGCGACGTCTG TCGAGAAGTTTCTGATC GAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTCGTGCT TTCAGCTTCGATGTAG GAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCGCCGATGGTTTCTACAAAGATCGTT ATGTTTATCGGCACTT TGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAGAGCCT GACCTATTGCATCTCC CGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCTGAAACCGAACTGCCCGCTGTTCTG CAGCCGGTCGCGGAG GCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGACGAGCGGGTTCGGCCCATTCGGA CCGCAAGGAATCGGT CAATACACTACATGGCGTGATTTCATATGCGCGATTGCTGATCCCCATGTGTATCACTGG CAAACTGTGATGGACG ACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAGGACT GCCCCGAAGTCCGGC ACCTCGTGCACGCGG ATTTCG G CTCCAACAATGTCCTG ACG G ACAATG G CCG CATAACAG CG GTCATTG ACTG G AG CGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCCAACATCTTCTTCTGGAGGCCGTG GTTGGCTTGTATGGAG CAGCAGACGCG CTACTTCG AG CG G AG G CATCCG G AG CTTG CAG G ATCG CCG CG G CTCCG G G CGTATATG CTCCG C ATTGGTCTTGACCAACTCTATCAGAGCTTGGTTGACGGCAATTTCGATGATGCAGCTTGG GCGCAGGGTCGATGCG ACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCGTACACAAATCGCCCGCAGAAGCG CGGCCGTCTGGACCG ATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACCGACGCCCCAGCACTCGTCCGAGGG CAAAGGAATAGCACG TGCTACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTT TCCGGGACGCCGGCTG G ATG ATCCTCCAG CG CG G G G ATCTCATG CTG G AGTTCTTCG CCCACCCCAACTTGTTTATTG CAG CTTATAATG GTT ACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACTG CATTCTAGTTGTG GTTTGTCCAAAC TCATCAATGTATCTTATGCGTCTTCTAGGGTTAAGGTTAGTGTAGAGAAGCAACCGAAGA TTGAGAAGACATGGCG GTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGC CAGCAAAAGGCCAG GAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCA TCACAAAAATCGACGC TCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGA AGCTCCCTCGTGCGCT CTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG G G AAG CGTG G CG CTTTCTCATAG CT CACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTCAG CC CGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTT ATCGCCACTGGCAGCA G CCACTG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG CTACAG AGTTCTTG AAGTG GTG G CCTAACTAC GGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGA AAAAGAGTTGGTAGCT CTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAAAG G ATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTC ACGTTAAGGGATTTTG GTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTT AAATCAATCTAAAGTAT ATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGC GATCTGTCTATTTCGTT CATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCAT CTGGCCCCAGTGCTGC AATG ATACCG CGTGACCCACGCTCACCGG CTCCAG ATTTATCAG CAATAAACCAG CCAG CCG G AAG GGCCGAGCG CAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGC TAGAGTAAGTAGTTCGC CAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCA TTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTC TCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCTT ACTGTCATG CCATCCGTAAG ATG CTTTTCTGTG ACTG GTG AGTACTCAACCAAGTCATTCTG AG AATAGTGTATG CG GCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCATC ATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT TCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG C CGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCA ATATTATTGAAGCATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCG AAAAGTG CCACCTATG AG ACG Un vecteur pHCsiaT-mCherry (SEQ ID NO : 34) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal A (SEQ ID NO : 17), pCMV Bsa l A (SEQ ID NO : 18), SiaT Bsal A (SEQ ID NO : 19), BG HpA Bsal A (SEQ ID NO : 26), LacZa-up Bsal A (SEQ I D NO : 27), LacZa-down Bsal A (SEQ ID NO : 28), HygroR Bsa l A (SEQ ID NO : 29) et mCherry Bsa l A (SEQ ID NO : 24). Vecteur pHCsiaT-mCherry (SEQ ID NO : 34)

TGAGGCTAGGGATAGGACGAGAGCATCGGGAACGAGGACTAGCGTCTCAAGGAACCAATT CAGTCGACTGGATC CTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACG TATGTTCCCATAGTAA CG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGT GTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTACGTATTAGTCATCG CTATTACCATG GTG ATG CG GTTTTG G CA GTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCAT TGACGTCAATGGGAGT TTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAACTCCG CCCCATTG ACG CAAATG G G CG GTA GGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCACTA GTCGACTAGGGATAA CAG G G CCG CCACCATG ATTCACACCAACCTG AAG AAAAAGTTCAG CTG CTG CGTCCTG GTCTTTCTTCTGTTTG CAG TCATCTGTGTGTGGAAGGAAAAGAAGAAAGGGAGTTACTATGATTCCTTTAAATTGCAAA CCAAGGAATTCCAGGT GTTAAAGAGTCTGGGGAAATTGGCCATGGGGTCTGATTCCCAGTCTGTATCCTCAAGCAG CACCCAGGACCCCCAC AGGGGCCG CCAG ACCCTCG G CAGTCTCAG AG G CCTAG CCAAG G CCAAACCAG AG G CCTCCTTCCAG GTGTG G AAC AAG G ACAG TCTTCCAAAAACCTTATCCCTAG G CTG CAAAAG GGGTCGGGGGTGAG CAAG GGCGAGGAGG ATAA CATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGG CCACGAGTTCGAGAT CGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGAC CAAGGGTGGCCCC CTG CCCTTCG CCTG G G ACATCCTGTCCC TCAGTTCATGTACG G CTCCAAG G CCTACGTG AAG CACCCCG CCG ACAT CCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTT CGAGGACGGCGGCGT GGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCT GCGCGGCACCAACTT CCCCTCCGACGGCCCCGTAATGCAGAAGAAAACCATGGGCTGGGAGGCCTCCTCCGAGCG GATGTACCCCGAGGA CGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGA CGCTGAGGTCAAG ACCACCTACAAG G CCAAG AAG CCCGTG CAG CTG CCCG G CG CCTACAACGTCAACATCAAGTTG G ACATCACCTCCC ACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCG GCGGCATGGACGAG CTGTACAAGTGATCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCC GTGCCTTCCTTGACCCTG G AAG GTG CCACTCCCACTGTCCTTTCCTAATAAAATG AG G AAATTG CATCG CATTGTCTG AGTAG GTGTCATTCTAT TCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCAGGCA TGCTGGGGATGC G GTG G G CTCTATG G CTTCTCCCTG CAG GTG CG CCCAATACG CAAACCG CCTCTCCCCGCGCGTTGG CCG ATTCATTA ATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAA TGTGAGTTAGCTCAC TCATTAG G CACCCCAG G CTTTACACTTTATG CTTCCG G CTCGTATGTTGTGTG G AATTGTG AG CG G ATAACAATTTC ACACAGGAAACAGCTATGACCATGATTACGGACAGCCTGGCCGTCGTTTTACAACGTCGT GACTGGGAAAACCCTG G CGTTACCCAACTTAATCG CCTTG CAG CACATCCCCCTTTCG CCAG CTG G CGTAATAG CGAAGAGGCCCGCACCGA TCG CCCTTCCCAACAGTTG CG CAG CCTG AATG G CG AATG G CG CCTG ATG CG GTATTTTCTCCTTACG CATCTGTG CG GTATTTCACACCG CATATG GTG CACTCTCAGTACAATCTG CTCTG ATG CCG CATAG ACCTG CAG G G CCAG CAG G CA G AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCAG G CTCCCCA G CAG G CAG AA GTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAACTCCG CCCATCCCG CCCCTAACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG CAGAGGCCGAGGCCGCCTCTGCCTCT GAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTC CCGGGAGCTTGTATAT CCATTTTCGGATCTGATCAGCACGTGATGAAAAAGCCTGAACTCACCGCGACGTCTGTCG AGAAGTTTCTGATCGA AAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTCGTGCTTT CAGCTTCGATGTAGGA G G G CGTG G ATATGTCCTG CG G GTAAATAG CTG CG CCG ATG GTTTCTACAAAG ATCGTTATGTTTATCG G CACTTTG CATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAGAGCCTGA CCTATTGCATCTCCCG CCGTGCACAGGGTGTCACGTTGCAAGACTTGCCTGAAACCGAACTGCCCGCTGTTCTGCA GCCGGTCGCGGAGGC CATGGATGCGATCGCTGCGGCCGATCTTAGCCAGACGAGCGGGTTCGGCCCATTCGGACC GCAAGGAATCGGTCA ATACACTACATG G CGTG ATTTCATATG CG CG ATTG CTG ATCCCCATGTGTATCACTG G CAAACTGTG ATG G AC G AC ACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAGGACTGC CCCGAAGTCCGGCAC CTCGTG CACG CG G ATTTCG G CTCCAACAATGTCCTG ACG G ACAATG G CCG CATAACAG CG GTCATTG ACTG G AG C GAG G CG ATGTTCG G G G ATTCCCAATACG AG GTCG CCAACATCTTCTTCTG G AG G CCGTG GTTG G CTTGTATG G AG C AGCAGACGCG CTACTTCG AG CG G AG G CATCCG G AG CTTG CAG G ATCG CCG CG G CTCCG G G CGTATATG CTCCG CA TTGGTCTTGACCAACTCTATCAGAGCTTGGTTGACGGCAATTTCGATGATGCAGCTTGGG CGCAGGGTCGATGCGA CG CAATCGTCCG ATCCG G AG CCG G G ACTGTCG G G CGTACACAAATCG CCCG CAG AAG CG CG G CCGTCTG G ACCG A TGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACCGACGCCCCAGCACTCGTCCGAGGGC AAAGGAATAGCACGT G CTACGAG ATTTCG ATTCCACCG CCG CCTTCTATG AAAG GTTG G G CTTCG G AATCGTTTTCCG GGACGCCGGCTGG ATG ATCCTCCAG CG CG G G G ATCTCATG CTG G AGTTCTTCG CCCACCCCAACTTGTTTATTG CAG CTTATAATG GTTA CAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACTG CATTCTAGTTGTG GTTTGTCCAAACT CATCAATGTATCTTATGCGTCTTCTAGGGTTAAGGTTAGTGTAGAGAAGCAACCGAAGAT TGAGAAGACATGGCG GTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGC CAGCAAAAGGCCAG GAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCA TCACAAAAATCGACGC TCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGA AGCTCCCTCGTGCGCT CTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG G G AAG CGTG G CG CTTTCTCATAG CT CACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTCAG CC CGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTT ATCGCCACTGGCAGCA G CCACTG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG CTACAG AGTTCTTG AAGTG GTG G CCTAACTAC GGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGA AAAAGAGTTGGTAGCT CTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAAAG G ATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTC ACGTTAAGGGATTTTG GTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTT AAATCAATCTAAAGTAT ATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGC GATCTGTCTATTTCGTT CATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCAT CTGGCCCCAGTGCTGC AATG ATACCG CGTGACCCACGCTCACCGG CTCCAG ATTTATCAG CAATAAACCAG CCAG CCG G AAG GGCCGAGCG CAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGC TAGAGTAAGTAGTTCGC CAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCA TTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTC TCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCA TCATG GTTATG G CAG CACTG CATAATTCTCTT ACTGTCATG CCATCCGTAAG ATG TTTTCTGTG A TG GTG AGTACTCAACCAAGTCATTCTG AG AATAGTGTATG CG GCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAAC TTTAAAAGTGCTCATC ATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT TCGATGTAACCCACTC GTG CACCCAA TG ATCTTCAG CATCTTTTA TTTCACCAG CGTTT TG G GTG AG CAAAAACAG G AAG G CAAAATG C CGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCA ATATTATTGAAGCATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCG AAAAGTG CCACCTATG AG ACG

Un vecteur pHCsiaT-TagBFP (SEQ ID NO : 35) selon l'invention est construit à partir d'une combinaison des briques Ori-AmpR Bsal A (SEQ ID NO : 17), pCMV Bsa l A (SEQ ID NO : 18), SiaT Bsal A (SEQ ID NO : 19), BG HpA Bsal A (SEQ ID NO : 26), LacZa-up Bsal A (SEQ I D NO : 27), LacZa-down Bsal A (SEQ ID NO : 28), HygroR Bsa l A (SEQ ID NO : 29) et TagBFP Bsal A (SEQ ID NO : 25).

Vecteur pHCsiaT-TagBFP (SEQ ID NO : 35)

TGAGGCTAGGGATAGGACGAGAGCATCGGGAACGAGGACTAGCGTCTCAAGGAACCAATT CAGTCGACTGGATC CTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACG TATGTTCCCATAGTAA CG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGT GTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTACGTATTAGTCATCG CTATTACCATG GTG ATG CG GTTTTG G CA GTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCAT TGACGTCAATGGGAGT TTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAACTCCG CCCCATTG ACG CAAATG G G CG GTA GGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCACTA GTCGACTAGGGATAA CAG G G CCG CCACCATG ATTCACACCAACCTG AAG AAAAAGTTCAG CTG CTG CGTCCTG GTCTTTCTTCTGTTTG CAG TCATCTGTGTGTGGAAGGAAAAGAAGAAAGGGAGTTACTATGATTCCTTTAAATTGCAAA CCAAGGAATTCCAGGT GTTAAAGAGTCTGGGGAAATTGGCCATGGGGTCTGATTCCCAGTCTGTATCCTCAAGCAG CACCCAGGACCCCCAC AGGGGCCG CCAG ACCCTCG G CAGTCTCAG AG G CCTAG CCAAG G CCAAACCAG AG G CCTCCTTCCAG GTGTG G AAC AAGGACAGCTCTTCCAAAAACCTTATCCCTAGGCTGCAAAAGGGGTCGGGGAGCGAGCTG ATTAAGGAGAACATG CACATGAAGCTGTACATGGAGGGCACCGTGGACAACCATCACTTCAAGTGCACATCCGAG GGCGAAGGCAAGCCC TACGAGGGCACCCAGACCATGAGAATCAAGGTGGTCGAGGGCGGCCCTCTCCCCTTCGCC TTCGACATCCTGGCTA CTAG CTTCCTCTACG G CAG CAAG ACCTTCATCAACCACACCCAG G G CATCCCCG ACTTCTTCAAG CAGTC TTCCCT GAGGGCTTCACATGGGAGAGAGTCACCACATACGAGGACGGGGGCGTGCTGACCGCTACC CAGGACACCAGCCT CCAG G ACG G TG CCTCAT TACAACGTCAAG ATCAG AG G G GTG AACTTCACATCCAACG GCC TGTGATG CAG AA GAAAACACTCGGCTGGGAGGCCTTCACCGAAACGCTGTACCCCGCTGACGGCGGCCTGGA AGGCAGAAACGACAT G G CCCTG AAG TCGTGGGCGGGAG CCATCTG ATCG CAAACATCAAG ACCACATATAG ATCCAAG AAACCCG CTAA GAACCTCAAGATGCCTGGCGTCTACTATGTGGACTACAGACTGGAAAGAATCAAGGAGGC CAACAACGAAACCTA CGTCGAGCAGCACGAGGTGGCAGTGG CCAG ATACTG CG ACCTCCCTAG CAAACTG G G G CACAAG CTTAATTCCG G ATG ATCG ACTGTG CCTTCTAGTTG CCAG CCAT TGTTGTTTG CCCCTCCCCCGTG CCTTCCTTG ACCCTG G AAG GTG C CA TCCCACTGTCCTTTCCTAATAAAATG AG G AAATTG CATCG CATTGTCTG AGTAG GTGTCATTCTATTCTG G G G G GTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCAGGCATGCTGGGG ATGCGGTGGGCT CTATG G CTTCTCCCTG CAG GTG CG CCCAATACG CAAACCG CCTCTCCCCG CG CGTTG G CCG ATTCATTAATG CAG CT GGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTT AGCTCACTCATTAGG CACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGAT AACAATTTCACACAGGA AACAG CTATG ACCATG ATTACG G ACAG CCTG G CCGTCGTTTTACAACGTCGTG ACTG G G AAAACCCTG G CGTTACC CAACTTAATCG CCTTG CAG CACATCCCCCTTTCG CCAG CTG G CGTAATAG CG AAG AG G CCCG CACCG ATCG CCCTTC CCAACAGTTG CG CAG CCTG AATG G CG AATG GCGCCTGATGCG GTATTTTCTCCTTACG CATCTGTG CG GTATTTCAC ACCG CATATG GTG CACTCTCAGTACAATCTG CTCTG ATG CCG CATAG ACCTG CAG G G CCAG CAG G CAG AAGTATG C AAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCAG G CTCCCCAG CA G G CAG AAGTATG CAAA G CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAACTCCG CCCATCCCG CCCCTAACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG CAGAGGCCGAGGCCG CCTCTG CCTCTG AG CTATTCC AGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCCGGGAGCTT GTATATCCATTTTCGG ATCTGATCAGCACGTGATGAAAAAGCCTGAACTCACCGCGACGTCTGTCGAGAAGTTTCT GATCGAAAAGTTCGAC AGCGTGTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTCGTGCTTTCAGCTTCGAT GTAGGAGGGCGTGGA T ATGTCCTG CG G GTAAATAG CTG CG CCG ATG GTTTCTACAAAG ATCGTTATGTTTATCG G CACTTTG CATCG G CCG C GCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAGAGCCTGACCTATTGCAT CTCCCGCCGTGCACAG G GTGTCACGTTG CAAG ACTTG CCTG AAACCG AACTG CCCG CTGTTCTG CAG CCGGTCGCGGAGG CCATG G ATG CG ATCG CTG CG G CCG ATCTTAG CCAGACGAGCGGGTTCGG CCCATTCG G ACCG CAAG G AATCG GTCAATACACTACA TGGCGTGATTTCATATGCGCGATTGCTGATCCCCATGTGTATCACTGGCAAACTGTGATG GACGACACCGTCAGTG CGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAGGACTGCCCCGAAGTCC GGCACCTCGTGCACG CGGATTTCGGCTCCAACAATGTCCTGACGGACAATGGCCGCATAACAGCGGTCATTGACT GGAGCGAGGCGATGT TCG G G G ATTCCCAATACG AG GTCG CCAACATCTTCTTCTG G AG GCCGTGGTTGG CTTGTATG G AG CAG CAG ACG C GCTACTTCGAGCGGAGGCATCCGGAGCTTGCAGGATCGCCGCGGCTCCGGGCGTATATGC TCCGCATTGGTCTTG ACCAACTCTATCAGAGCTTGGTTGACGGCAATTTCGATGATGCAGCTTGGGCGCAGGGTC GATGCGACGCAATCGT CCGATCCGGAGCCGGGACTGTCGGGCGTACACAAATCGCCCGCAGAAGCGCGGCCGTCTG GACCGATGGCTGTGT AGAAGTACTCGCCGATAGTGGAAACCGACGCCCCAGCACTCGTCCGAGGGCAAAGGAATA GCACGTGCTACGAG ATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTTTCCGGGACG CCGGCTGGATGATCCTC CAG CG CG G G G ATCTCATG TG G AGTTCTTCG CCCACCCCAACTTGTTTATTG CAG CTTATAATG GTTACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACTG CATTCTAGTTGTG GTTTGTCCAAACTCATCAATGT ATCTTATGCGTCTTCTAGGGTTAAGGTTAGTGTAGAGAAGCAACCGAAGATTGAGAAGAC ATGGCGGTAATACGG TTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAG GCCAGGAACCGTAA AAAG G CCG CGTTG CTG G CGTTTTTCCATAG G TCCG CCCCCCTG ACG AG CATCACAAAAATCG ACG TCAAGTCAG AGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTC GTGCGCTCTCCTGTTC CG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG GGAAGCGTGGCG CTTT TCATAG CTCACG CTGT AGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCC GTTCAGCCCGACCGCT G CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCACTG G CAG CAG CCACTG G TAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCC TAACTACGGCTACAC TAG AAG AACAGTATTTG GTATCTG CG CTCTG CTG AAG CCAGTTACCTTCG G AAAAAG AGTTG GTAG CTCTTG ATCC G G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAAAG G ATCTCAA GAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAA GGGATTTTGGTCATGA GATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAA TCTAAAGTATATATGAGT AAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTC TATTTCGTTCATCCATAG TTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCA GTGCTGCAATGATACC GCGTGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGC CGAGCGCAGAAGTGG TCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAG TAGTTCGCCAGTTAATA GTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCATTCAG CTCC G GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTCCTCCG A TCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCTTACTGTCATG CCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAG TGTATGCGGCGACCGA GTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCATCATTG G AAA ACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTA ACCCACTCGTGCACCCA ACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG CCG CAAAAAA GGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTG AAGCATTTATCAGGGTT ATTGTCTCATG AG CG G ATACATATTTG AATGTATTTAG AAAAATAAACAAATAG G G GTTCCG CG CACATTTCCCCG A AAAGTG CCACCTATG AG ACG Dans les exemples suivants l'objectif est de créer un vecteur permettant d'exprimer un transgène humain (cDNA) de façon stable dans une lignée cancéreuse de souris et/ou d'inhiber l'expression d'un second gène (shRNA) de souris, toujours de façon stable. La série de vecteurs décrite ci-dessous illustre l'implémentation de différents modules fonctionnels permettant de développer les fonctionnalités d'intégration à partir d'une architecture princeps (vecteur VI) qui se caractérise par la présence des deux unités d'expression décrites ci-dessus et par l'absence d'un site de clonage multiple (inhérente au procédé décrit). Les briques décrites ci-dessous ont été obtenues par PCR selon un protocole usuel tel que celui décrit pour la réalisation 1. Les assemblages ont été réalisés à l'aide de l'enzyme Bsal (NEB) et de la ligase T4 HC (Promega) dans le tampon de la ligase T4 HC, conformément au protocole décrit plus haut.

Réalisation 2

Groupe de vecteurs VI : vecteurs permettant l'expression simultanée de multiples transgènes (et ne contenant pas de site de clonage multiple)

Ul + nxU2a + mxU2b

Ul : Unité fonctionnelle bactérienne

U2a : Unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéine

U2b : Unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant

n≥0, m≥0 et n+m≥2

Exemple : Vecteur permettant d'exprimer l'enzyme h FUT3 tout en réprimant l'expression de mB3Galt6

Ul ori-Amp

U2a promoteur CMV

hFUT3 cDNA

Terminateur BPA

U2b cassette shRNA mB3Galt6 Liste des briques utilisées pour la construction du vecteur VI (figure 6) Brique Ori-AmpR Bsal B (SEQ ID NO : 36)

GAGGTACCGGTCTCATATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAA GAACATGTGAGCAAA AG G CCAG CAAAAG G CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG A G CATCACAAAAATCG ACG CTCAAGTCAG AG GTG G CG AAACCCG ACAG G ACTATAAAG ATACCAG G CGTTTCCCCC TG G AAG CTCCCTCGTG CG CTCTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG G G AA GCGTGGCG CTTTCTCATAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTGGGCTGTGT G CACG AACCCCCCGTTCAG CCCG ACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACAC G ACTTATCG CCACTG G CAG CAG CCACTG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG CTACAG AGTTC TTG AAGTGGTGG CCTAACTACG G CTACACTAG AAG AACAGTATTTG GTATCTG CG CTCTG CTG AAG CCAGTTACCT TCG G AAAAAG AGTTG GTAG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CA GATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGA CGCTCAGTGGAACGAA AACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTT TTAAATTAAAAATGAAG TTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAAT CAGTGAGGCACCTATCT CAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTA CGATACGGGAGGGCTTA CCATCTG G CCCCAGTG CTG CAATG ATACCG CGTG ACCCACG CTCACCG G CTCCAG ATTTATCAG CAATAAACCAG CC AGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTAT TAATTGTTGCCGGGAA G CTAG AGTAAGTAGTTCG CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CT CGTCGTTTG GTATG G CTTCATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCC CCATGTTGTG CAAA AAAG CG GTTAG CTCCTTCG GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G C AGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGA GTACTCAACCAAGTCATT CTG AG AATAGTGTATG CG G CG ACCG AGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCATCATTG G AAAACGTTCTTCG G G G CG AAAACTCTCAAG G ATCTTACCG CTGTTG AG ATCCA GTTCG ATGTAACCCACTCGTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAA ACAG G AAG G CAAAATG CCG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTC AATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTA TTTAGAAAAATAAACAA ATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCAAGGACGAGACCGGTACCTC Brique pCMV Bsal B (SEQ ID NO : 37 )

GAGGTACCGGTCTCAAGGAACCAATTCAGTCGACTGGATCCTAGTTATTAATAGTAATCA ATTACGGGGTCATTAG TTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATG G CCCG CCTG G CTG ACCG CCCAACG ACCCC CGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCAT TGACGTCAATGGGTGG AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTCAAT G ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTC TACTTG G CAGTACATCTACGT ATTAGTCATCG CTATTACCATG GTG ATG CG GTTTTG G CAGTACATCAATG G G CGTG G ATAG CG GTTTG ACTCACG G GGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAA CGGGACTTTCCAAAATG TCGTAACAA TCCG CCCCATTG ACG CAAATG G G CG GTAG G CGTGTACG GTG G G AG GTCTATATAAG CAG AG CTG G TTTAGTGAACCGTCAGATCACTAGTCGACTAGGGATAACAGGGCACCCGAGACCGGTACC TC

Brique hFUT3 Bsal A (SEQ ID NO : 38)

GAG GTACCG GTCTCACACCATG G ATCCCCTG G GTG CAG CCAAG CCACAATG G CCATG G CG CCG CTGTCTG G CCG C ACTGCTATTTCAGCTGCTGGTGGCTGTGTGTTTCTTCTCCTACCTGCGTGTGTCCCGAGA CGATGCCACTGGATCCC CTAG G G CTCCCAGTG G GTCCTCCCG ACAG G ACACCACTCCCACCCG CCCCACCCTCCTG ATCCTG CTATG G ACATG G CCTTTCCACATCCCTGTG G CTCTGTCCCG CTGTTCAG AG ATG GTG CCCG G CACAG CCG ACTG CCACATCACTG CCG A CCG CAAG GTGTACCCACAG G CAG ACACG GTCATCGTG CACCACTG G G ATATCATGTCCAACCCTAAGTCACG CCTC CCACCTTCCCCG AG G CCG CAG G G G CAG CG CTG G ATCTG GTTCAACTTG G AG CCACCCCCTAACTG CCAG CACCTG G AAG CCCTG G ACAG ATACTTCAATCTCACCATGTCCTACCG CAG CG ACTCCG ACATCTTCACG CCCTACG G CTG G CTG GAGCCGTGGTCCGGCCAGCCTGCCCACCCACCGCTCAACCTCTCGGCCAAGACCGAGCTG GTGGCCTGGGCGGTG TCCAACTGGAAGCCGGACTCAGCCAGGGTGCGCTACTACCAGAGCCTGCAGGCTCATCTC AAGGTGGACGTGTAC G G ACG CTCCCACAAG CCCCTG CCCAAG G G G ACCATG ATG G AG ACG CTGTCCCG GTACAAGTTCTACCTG G CCTTCG AGAACTCCTTGCACCCCGACTACATCACCGAGAAGCTGTGGAGGAACGCCCTGGAGGCCT GGGCCGTGCCCGTGG TGCTGGGCCCCAGCAGAAGCAACTACGAGAGGTTCCTGCCACCCGACGCCTTCATCCACG TGGACGACTTCCAGAG CCCCAAGGACCTGGCCCGGTACCTGCAGGAGCTGGACAAGGACCACGCCCGCTACCTGAG CTACTTTCGCTGGCG GGAGACGCTGCGGCCTCGCTCCTTCAGCTGGGCACTGGATTTCTGCAAGGCCTGCTGGAA ACTGCAGCAGGAATC CAGGTACCAGACGGTGCGCAGCATAGCGGCTTGGTTCACCTGATCGAGACCGGTACCTC

Brique BGHpA Bsal B (SEQ ID NO : 39)

GAGGTACCGGTCTCATGATCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCC TCCCCCGTGCCTTCCTTG ACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCAT TGTCTGAGTAGGTGTCA TTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAG CAGGCATGCTGGG GATGCGGTGGGCTCTATGGCTTCGCGAGACCGGTACCTC

Brique shB3Galt6 Bsal A (SEQ ID NO : 40) G AG GTACCG GTCTCATTCG ACAG G GTCG ACAAG TTTTCCAAAAAAAAAG CATG AG GTGCAGTTGCG CCTTTC TA TCTCTTGAATAGGAAAGGCGCAACTGCACCTCATGCTGGATCCCGCGTCCTTTCCACAAG ATATATAAACCCAAGAA ATCGAAATACTTTCAAGTTACGGTAAGCATATGATAGTCCATTTTAAAACATAATTTTAA AACTGCAAACTACCCAA GAAATTATTACTTTCTACGTCACGTATTTTGTACTAATATCTTTGTGTTTACAGTCAAAT TAATTCTAATTATCTCTCTA ACAG CCTTGTATCGTATATG CAAATATG AAG G AATCATG G G AAATAG G CCCTCTTCCTG CCCG ACCTTG G CG CG CG CTCGGCGCGCGGTCACGCTCCGTCACGTGGTGCGTTTTGTATTCGAGACCGGTACCTC

Vecteur VI (SEQ ID NO : 41, exemple de vecteur du groupe VI)

TATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAA AGGCCAGCAAAAGG CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCACAAAAATCG ACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCC TGGAAGCTCCCTCGT G CG CTCTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG C TTT TCC TTCG GGAAGCGTGGCG CTTTCTCA TAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTC AGCCCGACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCACTG G C AG CAG CCACTG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG CTACAG AGTTCTTG AAGTGGTGG CCTAA CTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTT CGGAAAAAGAGTTGGT AG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAA AAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAA ACTCACGTTAAGGGAT TTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAG TTTTAAATCAATCTAAAG TATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTC AGCGATCTGTCTATTTC GTTCATCCATAGTTG CCTG ACTCCCCGTCGTGTAG ATAACTACG ATACG G GAG G G CTTACCATCTG GCCCCAGTGCT G CAATG ATACCG CGTG ACCCACG CTCACCG G CTCCAG ATTTATCAG CAATAAACCAG CCAGCCGGAAGGGCCGAG CG CAG AAGTG GTCCTG CAACTTT ATCCG CCTCCATCCAGTCTATTAATTGTTG CCG G G AAG CTAG AGTAAGTAGTTC G CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTT CATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTC G GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCT TACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATT CTGAGAATAGTGTATGC GGCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCAT CATTG G AAAACGTTCTTCG G G G CG AAAACTCTCAAG G ATCTTACCG CTGTTG AG ATCCAGTTCG ATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG C CG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG CATTT ATCAG G GTTATTGTCTCATG AG CG G ATACATATTTG AATGTATTTAG AAAAATAAACAAATAG G G GTTCCG CG CAC ATTTCCCCG AAAAGTG CCAAG G AACCAATTCAGTCG ACTG G ATCCTAGTTATTAATAGTAATCAATTACG G G GTCAT TAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATG G CCCG CCTG G CTG ACCG CCCAACG A CCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTT CCATTGACGTCAATGGG TG G AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTC AATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACAT TA CGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGG ATAGCGGTTTGACTCA CG G G G ATTTCCAAGT TCCACCCCATTG ACGTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAA ATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGT CTATATAAGCAGAGC TG GTTTAGTG AACCGTCAG ATCACTAGTCG ACTAG G G ATAACAG G G CACCATG G ATCCCCTG G GTG CAG CCAAG C CACAATG G CCATG G CG CCG CTGTCTG G CCG CACTG CTATTTCAG CTG CTG GTG G CTGTGTGTTTCTTCTCCTACCTG CGTGTGTCCCGAGACGATGCCACTGGATCCCCTAGGGCTCCCAGTGGGTCCTCCCGACAG GACACCACTCCCACCC G CCCCACCCTCCTG ATCCTG CTATG G ACATG G CCTTTCCACATCCCTGTG G CTCTGTCCCG CTGTTCAGAGATGGTG CCCGGCACAGCCGACTGCCACATCACTGCCGACCGCAAGGTGTACCCACAGGCAGACACG GTCATCGTGCACCACT G G G ATATCATGTCCAACCCTAAGTCACG CCTCCCACCTTCCCCG AG GCCGCAGGGGCAGCG CTG G ATCTG GTTCAA CTTG G AG CCACCCCCTAACTG CCAG CACCTG G AAG CCCTG G ACAG ATACTTCAATCTCACCATGTCCTACCG CAG CG ACTCCG ACATCTTCACG CCCTACG G CTG GCTGGAGCCGTGGTCCGG CCAG CCTG CCCACCCACCG CTCAACCTCTCG GCCAAGACCGAGCTGGTGGCCTGGGCGGTGTCCAACTGGAAGCCGGACTCAGCCAGGGTG CGCTACTACCAGAG CCTG CAG G CTCATCTCAAG GTGGACGTGTACGGACG CTCCCACAAG CCCCTG CCCAAG G G G ACCATG ATG G AG AC G CTGTCCCG GTACAAGTTCTACCTG G CCTTCG AG AACTCCTTG CACCCCG ACTACATCACCG AG AAG CTGTGGAGG AACGCCCTGGAGGCCTGGGCCGTGCCCGTGGTGCTGGGCCCCAGCAGAAGCAACTACGAG AGGTTCCTGCCACCC GACGCCTTCATCCACGTGGACGACTTCCAGAGCCCCAAGGACCTGGCCCGGTACCTGCAG GAGCTGGACAAGGAC CACG CCCG CTACCTG AG CTACTTTCG CTGGCGGGAGACGCTGCGGCCTCG CTCCTTCAG CTG G G CACTG G ATTTCT G CAAG G CCTG CTG G AAACTG CAG CAG G AATCCAG GTACCAG ACG GTG CG CAG CATAG CG G CTTG GTTCACCTG AT CG ACTGTG CCTTCTAGTTG CCAG CCATCTGTTGTTTG CCCCTCCCCCGTG CCTTCCTTG ACCCTG G AAG GTG CCACTC CCACTGTCCTTTCCTAATAAAATG AG G AAATTG CATCG CATTGTCTG AGTAG GTGTCATTCTATTCTG GGGGGTGGG GTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCAGGCATGCTGGGGATGCG GTGGGCTCTATGG CTTCG ACAG G GTCG ACAAG CTTTTCCAAAAAAAAAG CATG AG GTG CAGTTG CG CCTTTCCTATCTCTTG AATAG G A AAG G CG CAACTG CACCTCATG CTG G ATCCCG CGTCCTTTCCACAAG ATATATAAACCCAAG AAATCG AAATACTTTC AAGTTACG GTAAG CATATG ATAGTCCATTTTAAAACATAATTTTAAAACTG CAAACTACCCAAG AAATTATTACTTTC TACGTCACGTATTTTGTACTAATATCTTTGTGTTTACAGTCAAATTAATTCTAATTATCT CTCTAACAGCCTTGTATCG T AT ATG CAAATATG AAG G AATCATG G G AAATAG G CCCTCTTCCTG CCCG ACCTTG G CG CG CG CTCG GCGCGCGGTC ACGCTCCGTCACGTGGTGCGTTTTG. L'analyse de restriction pa r triple digestion (va lidation structurelle), EcoRV, Pvul, Sal i de la réalisation 2 est illustrée Figure 7. Vérification fonctionnelle de la réalisation 2 : Des cellules eucaryotes (ex : cellules cancéreuses mammaires de souris 4T1) sont transfectées avec le vecteur VI selon un protocole usuel (exemple lipotransfection ou électroporation). Les cellules sont collectées 24 à 48h après transfection et lysées pour en extraire les ARN totaux puis générer des ADN complémentaires (ADNc) par transcription inverse selon un protocole usuel. Ces ADNc sont ensu ite utilisés comme matrice pour une analyse en PCR quantitative selon un protocole usuel.

Conditions spécifiques de la PCR quantitative:

40 cycles des trois éta pes suivantes sont réalisés : dénatu ration 94°C-30s ; hybridation 60°C-30s ; extension 72°C-30s.

Amorces utilisées:

mBSGaiiS

BETA3Ga !t6ms2-s ACCACTCTGTTGTACCTGGC (SEQ ID NO : 42).

BETA3Ga !t6ms2-as CACACGT CCTCG G GTCC (SEQ ID NO : 43).

HFUT3

FUT35 : CACTAGTCGACTAGGGATAACAGG (SEQ ID NO :44).

FUT33 : ATGTCCATAGCAGGATCAGGAG (SEQ I D NO :45).

Réalisation 3

Groupe de vecteurs VI.1 : Vecteurs VI permettant de sélectionner l'intégration des transgènes par recombinaison non homologue dans le génome cible

U l + nxU2a + mxU2b + U3a

U l : Unité fonctionnelle bactérienne

U2a : Unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéine U2b : Unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase I II et dont le produit d'expression est un ARN non codant

U3a est une cassette de sélection positive

n≥0, m≥0 et n+m≥2

Exemple : Vecteur permettant d'exprimer l'enzyme h FUT3 tout en réprimant l'expression de mB3Galt6

U l ori-Amp

U2a promoteur CMV

h FUT3 cDNA

Terminateur BPA

U2b cassette sh RNA mB3Ga lt6

U3a Hygomicin résistance

Listes des briques utilisées pour construire le vecteur VI.1 (Figure 8 )

Brique Ori-AmpR Bsal B (SEQ ID NO : 36)

Brique pCMV Bsal B (SEQ ID NO : 37)

Brique hFUT3 Bsal A (SEQ ID NO : 38)

Brique BGHpA Bsal B (SEQ I D NO : 39)

Brique shB3Galt6 Bsal B (SEQ ID NO : 46)

G AG GTACCG GTCTCATTCG ACAG G GTCG ACAAG CTTTTCCAAAAAAAAAG CATG AG GTGCAGTTGCG CCTTTCCTA TCTCTTGAATAGGAAAGGCGCAACTGCACCTCATGCTGGATCCCGCGTCCTTTCCACAAG ATATATAAACCCAAGAA ATCGAAATACTTTCAAGTTACGGTAAGCATATGATAGTCCATTTTAAAACATAATTTTAA AACTGCAAACTACCCAA GAAATTATTACTTTCTACGTCACGTATTTTGTACTAATATCTTTGTGTTTACAGTCAAAT TAATTCTAATTATCTCTCTA ACAG CCTTGTATCGTATATG CAAATATG AAG G AATCATG G G AAATAG G CCCTCTTCCTG CCCG ACCTTG G CG CG CG CTCGGCGCGCGGTCACGCTCCGTCACGTGGTGCGTTTTGCCAGCGAGACCGGTACCTC

Brique HygroR Bsal B {SEQ ID NO : 47}

GAGGTACCGGTCTCACCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCA GCAACCAGGTGTGGAAAG TCCCCAG G CTCCCCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAA CTCCG CCCATCCCG CCCCTAACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G TG ACTAATTTTTTTTATTTATG C AGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGG AGGCCTAGGCTTTTGC AAAAAGCTCCCGGGAGCTTGTATATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAG CCTGAACTCACCGCGA CGTCTGTCGAGAAGTTTCTGATCGAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCT CGGAGGGCGAAGAAT CTCGTGCTTTCAGCTTCGATGTAGGAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCG CCGATGGTTTCTACAA AGATCGTTATGTTTATCGGCACTTTGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGA CATTGGGGAATTCAGC GAGAGCCTGACCTATTGCATCTCCCGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCT GAAACCGAACTGCCCG CTGTTCTGCAGCCGGTCGCGGAGGCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGA CGAGCGGGTTCGGCC CATTCGGACCGCAAGGAATCGGTCAATACACTACATGGCGTGATTTCATATGCGCGATTG CTGATCCCCATGTGTAT CACTGGCAAACTGTGATGGACGACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAG CTGATGCTTTGGGCC GAGGACTGCCCCGAAGTCCGGCACCTCGTGCACGCGGATTTCGGCTCCAACAATGTCCTG ACGGACAATGGCCGC ATAACAG CG GTCATTG ACTG G AG CG AG G CG ATGTTCG G G G ATTCCCAATACG AG GTCG CCAACATCTTCTTCTG G A GGCCGTGGTTGGCTTGTATGGAGCAGCAGACGCGCTACTTCGAGCGGAGGCATCCGGAGC TTGCAGGATCGCCGC G G CTCCG G G CGTATATG CTCCG CATTG GTCTTG ACCAACT TATCAG AG CTTG GTTG ACG G CAATTTCG ATG ATG C AGCTTGGGCGCAGGGTCGATGCGACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCG TACACAAATCGCCC GCAGAAGCGCGGCCGTCTGGACCGATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACC GACGCCCCAGCACTC GTCCGAGGGCAAAGGAATAGCACGTGCTACGAGATTTCGATTCCACCGCCGCCTTCTATG AAAGGTTGGGCTTCG GAATCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGT TCTTCGCCCACCCCAA CTTGTTTATTG CAG CTTATAATG GTTACAAATAAAG CAATAG CATCACAA ATTTCACAAATAAAG CATTTTTTTCACT GCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTATTCGAGACCGGTACCTC

VI.1 (SEQ ID NO : 48, exemple de vecteur du groupe VI.1)

TATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAA AGGCCAGCAAAAGG CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCACAAAAATCG ACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCC TGGAAGCTCCCTCGT GCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGG AAGCGTGGCGCTTTCTCA TAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTC AGCCCGACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCACTG G C AGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTT GAAGTGGTGGCCTAA CTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTT CGGAAAAAGAGTTGGT AG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAA AAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAA ACTCACGTTAAGGGAT TTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAG TTTTAAATCAATCTAAAG TATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTC AGCGATCTGTCTATTTC GTTCATCCATAGTTG CCTG ACTCCCCGTCGTGTAG ATAACTACG ATACG G GAG G G CTTACCAT TG GCCCCAGTGCT GCAATGATACCGCGTGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCA GCCGGAAGGGCCGAG CG CAG AAGTG GTCCTG CAACTTTATCCG CCTCCATCCAGT TATTAATTGTTG CCG G G AAG CTAG AGTAAGTAGTTC G CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTT CATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAA AAG CG GTTAG CTCCTTC G GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCT TACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATT CTGAGAATAGTGTATGC GGCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCAT CATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG TTCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG C CG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG CATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCG AAAAGTG CCAAG G AACCAATTCAGTCG ACTG G ATCCTAGTTATTAATAGTAATCAATTACG G G GTCAT TAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATG G CCCG CCTG G CTG ACCG CCCAACG A CCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTT CCATTGACGTCAATGGG TG G AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTC AATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTA CGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGG ATAGCGGTTTGACTCA CG G G G ATTTCC AAGTCTCCACCCCATTG ACGTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAA ATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGT CTATATAAGCAGAGC TG GTTTAGTG AACCGTCAG ATCACTAGTCG ACTAG G G ATAACAG G G CACCATG G ATCCCCTG G GTG CAG CCAAG C CACAATG G CCATG GCGCCGCTGTCTGGCCGCACTG CTATTTCAG CTG CTG GTG G CTGTGTGTTTCTTCTCCTACCTG CGTGTGTCCCGAGACGATGCCACTGGATCCCCTAGGGCTCCCAGTGGGTCCTCCCGACAG GACACCACTCCCACCC G CCCCACCCTCCTG ATCCTG CTATG G ACATG G CCTTTCCACATCCCTGTG G CTCTGTCCCG CTGTTCAGAGATGGTG CCCG G CACAG CCG ACTG CCACATCACTG CCG ACCG CAAG GTGTACCCACAG G CAG ACACG GTCATC GTG CACCACT G G G ATATCATGTCCAACCCTAAGTCACG CCTCCCACCTTCCCCG AG GCCGCAGGGGCAGCG CTG G ATCTG GTTCAA CTTG G AG CCACCCCCTAACTG CCAG CACCTG G AAG CCCTG G ACAG ATACTTCAATCTCACCATGTCCTACCG CAG CG ACTCCG ACATCTTCACG CCCTACG G CTG GCTGGAGCCGTGGTCCGG CCAG CCTG CCCACCCACCG CTCAACCTCTCG GCCAAGACCGAGCTGGTGGCCTGGGCGGTGTCCAACTGGAAGCCGGACTCAGCCAGGGTG CGCTACTACCAGAG CCTG CAG G CTCATCTCAAG GTGGACGTGTACGGACG CTCCCACAAG CCCCTG CCCAAG G G G ACCATG ATG G AG AC G CTGTCCCG GTACAAGTTCTACCTG G CCTTCG AG AACTC TTG CACCCCG ACTACATCACCG AG AAG TGTGGAGG AACGCCCTGGAGGCCTGGGCCGTGCCCGTGGTGCTGGGCCCCAGCAGAAGCAACTACGAG AGGTTCCTGCCACCC GACGCCTTCATCCACGTGGACGACTTCCAGAGCCCCAAGGACCTGGCCCGGTACCTGCAG GAGCTGGACAAGGAC CACG CCCG CTACCTG AG TACTTTCG TGGCGGGAGACGCTGCGGC TCG CTCCTTCAG CTG G G CACTG G ATTTCT G CAAG G CCTG CTG G AAACTG CAG CAG G AATCCAG GTACCAG ACG GTG CG CAG CATAG CG G CTTG GTTCACCTG AT CG ACTGTG CCTTCTAGTTG CCAG CCAT TGTTGTTTG CCCCTCCCCCGTG CCTTCCTTG ACCCTG G AAG GTG CCACTC CCACTGTC TTTCCTAATAAAATG AG G AAATTG CATCG CATTGTCTG AGTAG GTGTCATTCTATT TG GGGGGTGGG GTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCAGGCATGCTGGGGATGCG GTGGGCTCTATGG CTTCG ACAG G GTCG ACAAG CTTTTCCAAAAAAAAAG CATG AG GTGCAGTTGCG CCTTTCCTATCTCTTG AATAG G A AAG G CG CAACTG CACCTCATG CTG G ATCCCG CGTCCTTTCCACAAG ATATATAAACCCAAG AAATCG AAATACTTTC AAGTTACG GTAAG CATATG ATAGTCCATTTTAAAACATAATTTTAAAACTG CAAACTACCCAAG AAATTATTACTTTC TACGTCACGTATTTTGTACTAATATCTTTGTGTTTACAGTCAAATTAATTCTAATTATCT CTCTAACAGCCTTGTATCG T ATATG CAAATATG AAG G AATCATG G G AAATAG G CCCTCTTCCTG CCCG ACCTTG G CG CG CG CTCG GCGCGCGGTC ACG CTCCGTCACGTG GTG CGTTTTG CCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG G TGTG G AAAGTCCCCAG G CTCCCCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCC CG CCCCTAACTCCG CCCATCCCG CCCCTAACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTT TATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGG CTTTTTTGGAGGCCTA GGCTTTTGCAAAAAGCTCCCGGGAGCTTGTATATCCATTTTCGGATCTGATCAGCACGTG ATGAAAAAGCCTGAAC TCACCGCGACGTCTGTCGAGAAGTTTCTGATCGAAAAGTTCGACAGCGTGTCCGACCTGA TGCAGCTCTCGGAGGG CGAAGAATCTCGTGCTTTCAGCTTCGATGTAGGAGGGCGTGGATATGTCCTGCGGGTAAA TAGCTGCGCCGATGG TTTCTACAAAG ATCGTTATGTTTATCG G CACTTTG CATCG G CCG CG CTCCCG ATTCCG G AAGTG CTTG ACATTG G G G AATTCAGCGAGAGCCTGACCTATTGCATCTCCCGCCGTGCACAGGGTGTCACGTTGCAAG ACTTGCCTGAAACCGA ACTGCCCGCTGTTCTGCAGCCGGTCGCGGAGGCCATGGATGCGATCGCTGCGGCCGATCT TAGCCAGACGAGCGG GTTCG G CCCATTCG G ACCG CAAG G AATCG GTCAATACACTACATG G CGTG ATTTCATATG CG CG ATTG CTG ATCCC CATGTGTATCACTG G CAAACTGTG ATG G ACG ACACCGTCAGTG CGTCCGTCGCGCAGG CTCTCG ATG AG CTG ATG C TTTGGGCCGAGGACTGCCCCGAAGTCCGGCACCTCGTGCACGCGGATTTCGGCTCCAACA ATGTCCTGACGGACAA TGGCCGCATAACAGCGGTCATTGACTGGAGCGAGGCGATGTTCGGGGATTCCCAATACGA GGTCGCCAACATCTT CTTCTGGAGGCCGTGGTTGGCTTGTATGGAGCAGCAGACGCGCTACTTCGAGCGGAGGCA TCCGGAGCTTGCAGG ATCG CCG CG G CTCCG G G CGTATATG CTCCG CATTG GTCTTG ACCAACTCTATCAG AG CTTG GTTG ACG G CAATTTCG ATGATGCAGCTTGGGCGCAGGGTCGATGCGACGCAATCGTCCGATCCGGAGCCGGGACTG TCGGGCGTACACAA ATCGCCCGCAGAAGCGCGGCCGTCTGGACCGATGGCTGTGTAGAAGTACTCGCCGATAGT GGAAACCGACGCCCC AGCACTCGTCCGAGGGCAAAGGAATAGCACGTGCTACGAGATTTCGATTCCACCGCCGCC TTCTATGAAAGGTTGG GCTTCGGAATCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGC TGGAGTTCTTCGCCCA CCCCAA TTGTTTATTG CAG CTTATAATG GTTACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTT TTCACTG CATTCTAGTTGTG GTTTGTCCAAACTCATCAATGTATC L'analyse de restriction pa r triple digestion, EcoRV, Pvu l, Sa li (1 μg de D'ADN digéré par 10 unités de chaque enzyme 15 minutes à 37°C) de la réalisation 3 est illustrée figure 9.

Vérification fonctionnelle de la réalisation 3: des cellules eucaryotes (ex : cellules cancéreuses mammaires de souris 4T1) sont transfectées avec le vecteur VI.1 selon un protocole usuel (exemple lipotransfection ou électroporation). Après transfection les cellules sont traitées avec de l'hygromycine (50μg-mL-l pendant 7 jou rs). Les cellules sont ensuite collectées et lysées pour en extraire les ARN totaux puis générer des ADN complémentaires (ADNc) pa r transcription inverse selon un protocole usuel. Ces ADNc sont ensuite utilisés comme matrice pour une analyse en PCR quantitative selon un protocole usuel (Figure 10 ).

Conditions spécifiques de la PCR quantitative:

40 cycles des trois éta pes suivantes sont réalisés : dénatu ration 94°C-30s ; hybridation 60°C-30s ; extension 72°C-30s. Amorces utilisées

mB3Ga!i6

BETA3Ga !t6ms2-s ACCACTCTGTTGTACCTGGC (SEQ ID NO : 42).

BETA3Ga lt6ms2-as CACACGTCCTCGGGTCC (SEQ I D NO : 43).

HFUT3

FUT35 CACTAGTCG ACTAG G G ATAACAG G (SEQ I D NO : 44).

FUT33 ATGTCCATAGCAGGATCAGGAG (SEQ I D NO : 45).

Réalisation 4

Groupe de vecteurs VI.2 : Vecteurs VI.1 permettant de sélectionner l'intégration simultanée de multiples de transgènes par recombinaison homologue dans le génome cible

U l + U3b + U2 + U3a + U3c Ul : Unité fonctionnelle bactérienne

U2 : nxU2a + mxU2b, n≥0, m≥0 et n+m≥2

U2a : Unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéine

U2b : Unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase III et dont le produit d'expression est un ARN non codant

U3a = cassette de sélection positive

U3b = motif 5' d'une séquence de recombinaison homologue X

U3c = motif 3' de la séquence de recombinaison homologue X

Exemple : Vecteur permettant d'exprimer l'enzyme h FUT3 tout en réprimant l'expression de mB3Galt6

Listes des briques utilisées pour la construction du vecteur VI.2 (figure 11) Brique Ori-AmpR Bsal B (SEQ ID NO : 36)

Brique rosa26-5' Bsal A (SEQ ID NO : 49)

GAGGTACCGGTCTCAAGGACCCCGCGGCAGGCCCTCCGAGCGTGGTGGAGCCGTTCTGTG AGACAGCCGGGTAC GAGTCGTGACGCTGGAAGGGGCAAGCGGGTGGTGGGCAGGAATGCGGTCCGCCCTGCAGC AACCGGAGGGGGA GGGAGAAGGGAGCGGAAAAGTCTCCACCGGACGCGGCCATGGCTCGGGGGGGGGGGGGCA GCGGAGGAGCGC TTCCG G CCG ACGTCTCGTCG CTG ATTG G CTTCTTTTCCTCCCG CCGTGTGTG AAAACACAAATG G CGTGTTTTG GTT G G CGTAAG G CG CCTGTCAGTTAACG GCAGCCGGAGTGCGCAGCCGCCGG CAG CCTCG CTCTG CCCACTGGGTGG GGCGGGAGGTAGGTGGGGTGAGGCGAGCTGGACGTGCGGGCGCGGTCGGCCT TGGCGGGGCGGGGGAGGGG AGGGAGGGTCAGCGAAAGTAGCTCGCGCGCGAGCGGCCGCCCACCCTCCCCTTCCTCTGG GGGAGTCGTTTTACC CGCCGCCGGCCGGG CCTCGTCGTCTG ATTG GCTCTCGGGG CCCAG AAAACTG G CCCTTG CCATTG G CTCGTGTTCG TGCAAGTTGAGTCCATCCGCCGGCCAGCGGGGGCGGCGAGGAGGCG TCCCAGGTTCCGGCCCTCCCCTCGGCCC CGCGCCGCAGAGTCTGGCCGCGCGCCC TGCGCAACGTGGCAGGAAGCGCGCGCTGGGGGCGGGGACGGGCAG TAGGGCTGAGCGGCTGCGGGGCGGGTGCAAGCACGTTTCCGACTTGAGTTGCCTCAAGAG GGGCGTGCTGAGCC AGACCTCCATCGCGCACTCCGGGGAGTGGAGGGAAGGAGCGAGGGCTCAGTTGGGCTGTT TTGGAGGCAGGAAG CACTTGCTCTCCCAAAGTCGCTCTGAGTTGTTATCAGTAAGGGAGCTGCAGTGGAGTAGG CGGGGAGAAGGCCGC ACCCTTCTCCGGAGGGGGGAGGGGAGTGTTGCAATACCTTTCTGGGAGTTCTCTGCTGCC TCCTGGCTTCTGAGGA CCG CCCTG G G CCTG G G AG AATCCCTTG CCCCCTCTTCCCCTCGTG ATCTG CAACTCCAGTCTTACAACG AG ACCG GT ACCTC Brique pCMV Bsal C (SEQ ID NO : 50}

GAGGTACCGGTCTCAACAAACCAATTCAGTCGACTGGATCCTAGTTATTAATAGTAATCA ATTACGGGGTCATTAGT TCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATG GCCCGC TGGCTGACCG CCCAACG ACCCCC GCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATT GACGTCAATGGGTGGA GTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCC TATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTC TACTTG G CAGTACATCTACGTA TTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAG CGGTTTGACTCACGGG G ATTTCCAAGTCTCCACCCCATTG ACGTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G A TTTCCAAAATGT CGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTAT ATAAGCAGAGCTGGT TTAGTGAACCGTCAGATCACTAGTCGACTAGGGATAACAGGGCACCCGAGACCGGTACCT C

Brique hFUT3 Bsal A (SEQ ID NO : 38)

Brique BGHpA Bsal B (SEQ ID NO : 39)

Brique shB3Galt6 Bsal B (SEQ ID NO : 46) Brique HygroR Bsal C (SEQ ID NO : 51)

G AG GTACCG GTCTCACCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAG TCCCCAG G CTCCCCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAA CTCCG CCCATCCCG CCCCTAACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG C AGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGG AGGCCTAGGCTTTTGC AAAAAGCTCCCGGGAGCTTGTATATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAG CCTGAACTCACCGCGA CGTCTGTCGAGAAGTTTCTGATCGAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCT CGGAGGGCGAAGAAT CTCGTGCTTTCAGCTTCGATGTAGGAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCG CCGATGGTTTCTACAA AGATCGTTATGTTTATCGGCACTTTGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGA CATTGGGGAATTCAGC GAGAGCCTGACCTATTGCATCTCCCGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCT GAAACCGAACTGCCCG CTGTTCTGCAGCCGGTCGCGGAGGCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGA CGAGCGGGTTCGGCC CATTCGGACCGCAAGGAATCGGTCAATACACTACATGGCGTGATTTCATATGCGCGATTG CTGATCCCCATGTGTAT CACTGGCAAACTGTGATGGACGACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAG CTGATGCTTTGGGCC GAGGACTGCCCCGAAGTCCGGCACCTCGTGCACGCGGATTTCGGCTCCAACAATGTCCTG ACGGACAATGGCCGC ATAACAGCGGTCATTGACTGGAGCGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCC AACATCTTCTTCTGGA GGCCGTGGTTGGCTTGTATGGAGCAGCAGACGCGCTACTTCGAGCGGAGGCATCCGGAGC TTGCAGGATCGCCGC G G CTCCG G G CGTATATG CTCCG CATTG GTCTTG ACCAACT TATCAG AG CTTG GTTG ACG G CAATTTCG ATG ATG C AGCTTGGGCGCAGGGTCGATGCGACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCG TACACAAATCGCCC GCAGAAGCGCGGCCGTCTGGACCGATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACC GACGCCCCAGCACTC GTCCGAGGGCAAAGGAATAGCACGTGCTACGAGATTTCGATTCCACCGCCGCCTTCTATG AAAGGTTGGGCTTCG GAATCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGT TCTTCGCCCACCCCAA CTTGTTT ATTG CAG CTTATAATG GTTACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACT G CATTCTAGTTGTG GTTTGTCCAAA TCATCAATGTATCGTAG CG AG ACCG GTAC TC

Brique rosa26-3' Bsal A (SEQ ID NO : 52)

GAGGTACCGGTCTCAGTAGAGATGGGCGGGAGTCTTCTGGGCAGGCTTAAAGGCTAACCT GGTGTGTGGGCGTT GTCCTGCAGGGGAATTGAACAGGTGTAAAATTGGAGGGACAAGACTTCCCACAGATTTTC GGTTTTGTCGGGAAG TTTTTTAATAGGGGCAAATAGGAAAATGGAGGATAGGAGTCATCTGGGGTTTATGCAGCA AAACTACAGGTATATT GCTTGTATCCGCCTCGGAGATTTCCATGAGGAGATAAAGACATGTCACCCGAGTTTATAC TCTCCTGCTTAGATCCT ACTACAGTATGAAATACAGTGTCGCGAGGTAGACTATGTAAGCAGATTTAATCATTTTAA AGAGCCCAGTACTTCAT ATCCATTTCTCCCG CTCCTTCTG CAG CCTTATCAAAAG GTATTTAG AACA TCATTTTAG CCCCATTTTCATTTATTAT ACTGGCTTATCCAACCCCTAGACAGAGCATTGGCATTTTCCCTTTCCTGATCTTAGAAGT CTGATGACTCATGAAACC AG ACAG ATTAGTTACATACACCACAAATCG AG G CTGTAG CTG G G G CCTCAACACTG CAGTTCTTTTATAACTCCTTA GTACACTTTTTGTTGATCCTTTGCCTTGATCCTTAATTTTCAGTGTCTATCACCTCTCCC GTCAGGTGGTGTTCCACAT TTGGGCCTATTCTCAGTCCAGGGAGTTTTACAACAATAGATGTATTGAGAATCCAACCTA AAGCTTAACTTTCCACT CCCATGAATGCCTCTCTCCTTTTTCTCCATTATAACTGAGCTATAACCATTAATGGTTTC AGGTGGATGTCTCCTCCCC CAATATACCTGATGTATCTACATATTGCCAGGCTGATATTTTAAGACATAAAAGGTATAT TTCATTATTGAGCCACAT G GTATTG ATTACTG CTACTAAAATTTTGTCATTGTACACATCTGTAAAAG GTG GTTCCTTTTG G AATG CAAAGTTCA G GTGTTTGTTGTCTTTCCTG ACCTAAG GTCTTGTG AG CTTGTATTTTTT TATTTAAG CAGTG CTTTCTCTTG G ACTG G CTTG ACTCATG G CATTCTACACGTTATTG CTG GTCTAAATGTG ATTTTG CCAAG CTTCTTCAG G ACCTATAATTTTG C TTG ACTTGTAG CCAAACACAAGTAAAATG ATTAAG CAACAAATGTATTTGTG AAG CTTG GTTTTTAG GTTGTTGTGT TGTGTGTGCTTGTGCTCTATAATAATACTATCCAGGGGCTGGAGAGGTGGCTCGGAGTTC AAGAGCACAGACTGCT CTTCCAGAAGTCCTGAGTTCAATTCCCAGCAACCACATGGTGGCTCACAACCATCTGTAA TGGGATCTGATGCCCTC TTCTGGTGTGTCTGAAGACCACAAGTGTATTCACATTAAATAAATAATCCTCCTTCTTCT TCTTTTTTTTTTTTTAAAG AG AATACTGTCTCCAGTAG AATTACTG AAGTAATG AAATACTTTGTGTTTGTTCCAATATG G AAG CCAATAATCAAA TACTCTTAAGCACTGGAAATGTACCAAGGAACTATTTTATTTAAGTGAACTGTGGACAGA GGAGCCATAACTGCAG ACTTGTGGGATACAGAAGACCAATGCAGACTTAATGTCTTTTCTCTTACACTAAGCAATA AAGAAATAAAAATTGAA CTTCTAGTATCCTATTTGTTAAACTG CTAG TTTACTAACTTTTGTG CTTCAT TATACAAAG CTG AAAG CTAAGTCTG CAG CCATTA TAAACATG AAAG CAAGTAATG ATAATTTTG G ATTTCAAAAATGTAG G G CCAG AGTTTAG CCAG CCA GTGGTGGTGCTTGCCTTTATGCCTTAATCCCAGCACTCTGGAGGCAGAGACAGGCAGATC TCTGAGTTTGAGCCCA G CCTG GTCTACACATCAAGTT TAT TAG G ATAG CCAG G AATACACACAG AAACC TGTTG G G G AG G G G G G CTCT GAGATTTCATAAAATTATAATTGAAGCATTCCCTAATGAGCCACTATGGATGTGGCTAAA TCCGTCTACCTTTCTGA TG AG ATTTG G GTATTATTTTTTCTGT TCTG CTGTTG GTTG G GTCTTTTG ACACTGTG G G TTT TTAAAG CCTCCTTC CCTG CCATGTG G A TCTTGTTTG CTACTAACTTCCCATG G CTTAAATG G CATG G CTTTTTG CCTTCTAAG G G CAG CTG CTG AG ATTTG CAG CCTG ATTTCCAG G GTG G G GTTG G G AAATCTTTCAAACACTAAAATTGTC TTTAATTTTTTTTTA AAAAATGGGTTATATAATAAACCTCATAAAATAGTTATGAGGAGTGAGGTGGACTAATAT TAATGAGTCCCTCCCC T ATAAAAG AG CT ATT AAG G rTTTTGTCTTATACTAACTTTTTTTTTAAATGTG GTATCTTTAG AACCAAG G GTCTTA GAGTTTTAGTATACAGAAACTGTTGCATCGCTTAATCAGATTTTCTAGTTTCAAATCCAG AGAATCCAAATTCTTCAC AGCCAAAGTCAAATTAAGAATTTCTGACTTTAATGTTATTTGCTACTGTGAATATAAAAT GATAGCTTTTCCTGAGG CAGGGTATCACTATGTATCTCTGCCTGATCTGCAACAAGATATGTAGACTAAAGTTCTGC CTGCTTTTGTCTCCTGAA T ACTAAG GTTAAAATGTAGTAATACTTTTG G AACTTG CAG GTCAG ATTCTTTTATAG G G G ACACACTAAG G G AG CT TGGGTGATAGTTGGTAAATGTGTTTAAGTGATGAAAACTTGAATTATTATCACCGCAACC TACTTTTTAAAAAAAAA AGCCAGGCCTGTTAGAGCATGCTAAGGGATCCCTAGGACTTGCTGAGCACACAAGAGTAG TACTTGGCAGGCTCC TGGTGAGAG CATATTTCAAAAAACAAG G CAG ACAACCAAG AAACTACAGTAAG GTTAC TGTCTTTAACCAT rG C ATATACACAG G G ATATTAAAATATTCCAAATAATATTTCATTCAAGTTTTCCCCCATCAAATTG G G ACATG G ATTTCT CCGGTGAATAGGCAGAGTTGGAAACTAAACAAATGTTGGTTTTGTGATTTGTGAAATTGT TTTCAAGTGATAGTTA AAGCCCATGAGATACAGAACAAAGCTGCTATTTCGAGGTCACTTGGTTATACTCAGAAGC ACTTCTTTGGGTTTCCC TG CACTATCCTG ATCATGTG CTAG G CCTACCTTAG G CTG ATTGTTGTTCAAATAACTTAAGTTTCCTGTCAG GTG ATG TCATATGATTTCATATATCAAGGCAAAACATGTTATATATGTTAAACATTTGGACTTAAT GTGAAAGTTAGGTCTTTG TGGGTTTTGATTTTAATTTCAAAACCTGAGCTAAATAAGTCATTTTACATGTCTTACATT TGGTGAATTGTATATTGT GGTTTGCAGGCAAGACTCTCTGACCTAGTAACCCTCCTATAGAGCACTTTGCTGGGTCAC AAGTCTAGGAGTCAAG CATTTCACCTTGAAGTTGAGACGTTTTGTTAGTGTATACTAGTTATATGTTGGAGGACAT GTTTATCCAGAAGATAT TCAGGACTATTTTTGACTGGGCTAAGGAATTGATTCTGATTAGCACTGTTAGTGAGCATT GAGTGGCCTTTAGGCTT G AATTG G AGTCACTTGTATATCTCAAATAATG CTG G C TTTTTTAAAAAG CCCTTGTTCTTTATCACCCTGTTTTCTAC ATAATTTTTGTTCAAAGAAATACTTGTTTGGATCTCCTTTTGACAACAATAGCATGTTTT CAAGCCATATTTTTTTTCC TTTTTTTTTTTTTTTTTGGTTTTTCGAGACAGGGTTTCTCTGTATAGCCCTGGCTGTCCT GGAACTCACTTTGTAGACC AG G CTG G C TCG AA TCAG AAATCCG C TG CCTCTG CCTCCTG AGTG CCG G G ATTAAAG G CGTG CACCACCACG CC TG G CTAAGTTG G ATATTTTGTATATAACTATAACCAATA TAACTCCACTG G GTG G ATTTTTAATTCAGTCAGTAGTC TTAAGTG GT TTTATTG G CC TTATTAAAATCTACTGTTCACTCTAACAG AG G CTGTTG G ACTAGTG G G ACTAAG CA ACTTCCTACG G ATATACTAG CAG ATAAG G GTCAG G G ATAG AAACTAGTCTAG CGTTTTGTATAC TACCAG CTTATA CTACCTTGTTCTGATAGAAATATTTAGGACATCTAGCTTATCTATTCGAGACCGGTACCT C

VI.2 (SEQ ID NO : 53, exemple de vecteur du groupe VI.2)

TATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAA AGGCCAGCAAAAGG CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCACAAAAATCG ACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCC TGGAAGCTCCCTCGT GCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGG AAGCGTGGCGCTTTCTCA TAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTC AGCCCGACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCACTG G C AG CAG CCACTG GTAACAG G ATTAG CAG AG CG AG GTATGTAG G CG GTG CTACAG AGTTCTTG AAGTG GTG G CCTAA CTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTT CGGAAAAAGAGTTGGT AG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAA AAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAA ACTCACGTTAAGGGAT TTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAG TTTTAAATCAATCTAAAG TATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTC AGCGATCTGTCTATTTC GTTCATCCATAGTTG CCTG ACTCCCCGTCGTGTAGATAACT ACG ATACG G GAG G G CTTACCATCTG GCCCCAGTGCT G CAATG ATACCG CGTGACCCACGCTCACCGG CTCCAG ATTTATCAG CAATAAACCAG CCAG CCG G AAG G G CCG AG CG CAG AAGTG GTCCTG CAACTTT ATCCG CCTCCATCCAGTCTATTAATTGTTG CCG G G AAG CTAG AGTAAGTAGTTC G CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTT CATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTC G GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCT TACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATT CTGAGAATAGTGTATGC GGCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCAT CATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG TTCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTT TG G GTG AG CAAAAACAG G AAG G CAAAATG C CG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG CATTT ATCAG G GTTATTGTCTCATG AG CG G ATACATATTTG AATGTATTTAG AAAAATAAACAAATAG G G GTTCCG CG CAC ATTTCCCCGAAAAGTGCCAAGGACCCCGCGGCAGGCCCTCCGAGCGTGGTGGAGCCGTTC TGTGAGACAGCCGGG TACGAGTCGTGACGCTGGAAGGGGCAAGCGGGTGGTGGGCAGGAATGCGGTCCGCCCTGC AGCAACCGGAGGG GGAGGGAGAAGGGAGCGGAAAAGTCTCCACCGGACGCGGCCATGGCTCGGGGGGGGGGGG GCAGCGGAGGAG CG CTTCCG G CCG ACGTCTCGTCG CTG ATTG G CTTCTTTTCCTCCCG CCGTGTGTG AAAACACAAATG G CGTGTTTTG GTTG G CGTAAG G CG CCTGTCAGTTAACG GCAGCCGGAGTGCG CAG CCGCCGGCAGC TCG CTCTG CCCACTG G GT GGGGCGGGAGGTAGGTGGGGTGAGGCGAGCTGGACGTGCGGGCGCGGTCGGCCT TGGCGGGGCGGGGGAGG GGAGGGAGG GTCAG CG AAAGTAG CTCG CGCGCGAGCGGCCG CCCACCCTCCCCTTCCT TG G G G G AGTCGTTTTA CCCGCCGCCGGCCGGG C TCGTCGTCTG ATTG G CTCTCG G G G CCCAG AAAACTG G CCCTTG CCATTG G CTCGTGTT CGTGCAAGTTGAGTCCATCCGCCGGCCAGCGGGGGCGGCGAGGAGGCGCTCCCAGGTTCC GGCC TCCC TCGGC CCCGCGCCGCAGAGTCTGGCCGCGCGCCC TGCGCAACGTGGCAGGAAGCGCGCGCTGGGGGCGGGGACGGGC AGTAGGGCTGAGCGGCTGCGGGGCGGGTGCAAGCACGTTTCCGACTTGAGTTGCCTCAAG AGGGGCGTGCTGAG CCAGACCTCCATCGCGCACTCCGGGGAGTGGAGGGAAGGAGCGAGGGCTCAGTTGGGCTG TTTTGGAGGCAGGA AGCACTTGCTCTCCCAAAGTCGCTCTGAGTTGTTATCAGTAAGGGAGCTGCAGTGGAGTA GGCGGGGAGAAGGCC GCACCCTTCTCCGGAGGGGGGAGGGGAGTGTTGCAATACCTTTCTGGGAGTTCTCTGCTG CCTCCTGGCTTCTGAG GACCGCCCTGGG CCTG G G AG AATCCCTTG CCCCCTCTTCCCCTCGTG ATCTG CAACTCCAGTCTTACAAACCAATTC AGTCG ACTG G ATCCTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATATG G AGTTCCG CGT TACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGAC GTCAATAATGACGTAT GTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGG TAAACTGCCCACTTGG CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATTAT G CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTACGTATTAGTCATCG CTATTACCATG GTG AT G CG GTTTTG G CAGTACATCAATG G G CGTG G ATAG CG GTTTG ACTCACG G G G ATTTCCAAGTCTCCACCCCATTG AC GTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAACTCCG CCCCATTG ACG C AAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACC GTCAGATCACTAGTC G ACTAG G G ATAACAG G G CACCATG G ATCCCCTG G GTG CAG CCAAG CCACAATG G CCATG G CG CCG CTGTCTG G CC GCACTGCTATTTCAGCTGCTGGTGGCTGTGTGTTTCTTCTCCTACCTGCGTGTGTCCCGA GACGATGCCACTGGATC CCCTAG G G CTCCCAGTG G GTCCTCCCG ACAG G ACACCACTCCCACCCG CCCCACCCTCCTG ATCCTG CTATG G ACAT G G CCTTTCCACATCCCTGTG G CTCTGTCCCG CTGTTCAG AG ATG GTG CCCG G CACAG CCG ACTG CCACATCACTG CC G ACCG CAAG GTGTACCCACAG G CAG ACACG GTCATCGTG CACCACTG G G ATATCATGTCCAACCCTAAGTCACG CC TCCCACCTTCCCCGAGGCCGCAGGGGCAGCGCTGGATCTGGTTCAACTTGGAGCCACCCC CTAACTGCCAGCACCT GGAAGCCCTGG ACAG ATACTTCAATCTCACCATGTCCTACCG CAG CG ACTCCG ACATCTTCACG CCCTACG G CTG G C TGGAGCCGTGGTCCGGCCAGCCTGCCCACCCACCGCTCAACCTCTCGGCCAAGACCGAGC TGGTGGCCTGGGCGG TGTCCAACTG GAAGCCGGACTCAGCCAGGGTGCG CTACTACCAG AG CCTG CAG G TCATCTCAAG GTG G ACGTGT ACGGACGCTCCCACAAGCCCCTGCCCAAGGGGACCATGATGGAGACGCTGTCCCGGTACA AGTTCTACCTGGCCTT CGAGAACTCCTTGCACCCCGACTACATCACCGAGAAGCTGTGGAGGAACGCCCTGGAGGC CTGGGCCGTGCCCGT GGTGCTGGGCCCCAGCAGAAGCAACTACGAGAGGTTCCTGCCACCCGACGCCTTCATCCA CGTGGACGACTTCCA GAGCCCCAAGGACCTGGCCCGGTACCTGCAGGAGCTGGACAAGGACCACGCCCGCTACCT GAGCTACTTTCGCTG GCGGGAGACGCTGCGGCCTCGCTCCTTCAGCTGGGCACTGGATTTCTGCAAGGCCTGCTG GAAACTGCAGCAGGA ATCCAG GTACCAGACGGTGCGCAG CATAG CG G CTTG GTTCACCTG ATCG ACTGTG C TTCTAGTTG CCAG CCATCT GTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTT TCCTAATAAAATGAGGAA ATTG CATCG CATTGTCTG AGTAG GTGTCATTCTATTCTG GGGGGTGGGGTGGGGCAGG ACAG CAAG GGGGAGGA TTGGGAGGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCGACAGGGTC GACAAGCTTTTCCAA AAAAAAAG CATG AG GTG CAGTTG CG C TTTCCTATCTCTTG AATAG G AAAG G CG CAACTG CACCTCATG CTG G ATC CCGCGTCCTTTCCACAAGATATATAAACCCAAGAAATCGAAATACTTTCAAGTTACGGTA AGCATATGATAGTCCAT TTTAAAACATAATTTTAAAACTGCAAACTACCCAAGAAATTATTACTTTCTACGTCACGT ATTTTGTACTAATATCTTT GTGTTTACAGTCAAATTAATTCTAATTATCTCTCTAACAGCCTTGTATCGTATATGCAAA TATGAAGGAATCATGGG AAATAG G CCCTCTTCCTG CCCG ACCTTG GCGCGCGCTCGGCGCGCG GTCACG CTCCGTCACGTG GTG CGTTTTG CC AG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCAG G CTCCCCAG C AG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAACTCCG CCCATCCCG CCCC T AACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG CAG AG G CCG AG G CCG CCT CTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCA AAAAGCTCCCGGGAGC TTGTATATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAGCCTGAACTCACCGCGAC GTCTGTCGAGAAGTTTC TGATCGAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTC GTGCTTTCAGCTTCGA TGTAG G AG G G CGTG G ATATGTCCTG CG G GTAAATAG CTGCGCCGATG GTTTCTACAAAG ATCGTTATGTTTATCG G CACTTTGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAG AGCCTGACCTATTGCA TCTCCCGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCTGAAACCGAACTGCCCGCTG TTCTGCAGCCGGTCGC GGAGGCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGACGAGCGGGTTCGGCCCATT CGGACCGCAAGGAA TCGGTCAATACACTACATGGCGTGATTTCATATGCGCGATTGCTGATCCCCATGTGTATC ACTGGCAAACTGTGATG GACGACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAG GACTGCCCCGAAGTC CG G CACCTCGTG CACG CG G ATTTCG G CTCCAACAATGTCCTG ACG G ACAATG G CCG CATAACAG CG GTCATTG ACT GGAGCGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCCAACATCTTCTTCTGGAGGC CGTGGTTGGCTTGTAT GGAGCAGCAGACGCGCTACTTCGAGCGGAGGCATCCGGAGCTTGCAGGATCGCCGCGGCT CCGGGCGTATATGC TCCG CATTG GTCTTG ACCAACTCTATCAG AG CTTG GTTG ACG G CAATTTCG ATG ATG CAG CTTG GGCGCAGGGTCG ATGCGACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCGTACACAAATCGCCCGCAG AAGCGCGGCCGTCTG GACCGATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACCGACGCCCCAGCACTCGTCC GAGGGCAAAGGAATA G CACGTG TACG AG ATTTCG ATTCCACCG CCG CCTTCTATG AAAG GTTG G G CTTCG G AATCGTTTTCCG G G ACG CC G G CTG G ATG ATCCTCCAG CG CG G G G ATCTCATG CTG G AGTTCTTCG CCCACCCCAACTTGTTTATTG CAG CTTATAA TG GTTACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACTG CATTCTAGTTGTG GTTTGTC CAAACTCATCAATGTATCGTAG AG ATG G G CG G G AGTCTTCTG G G CAG G CTTAAAG G CTAACCTG GTGTGTG G G CG TTGTCCTGCAGGGGAATTGAACAGGTGTAAAATTGGAGGGACAAGACTTCCCACAGATTT TCGGTTTTGTCGGGAA GTTTTTTAATAG G G G CAAATAG G AAAATG G AG G ATAG G AGTCATCTG G G GTTTATG CAG CAAAACTACAG GTATA TTGCTTGTATCCGCCTCGGAGATTTCCATGAGGAGATAAAGACATGTCACCCGAGTTTAT ACTCTCCTGCTTAGATC CTACTACAGTATGAAATACAGTGTCGCGAGGTAGACTATGTAAGCAGATTTAATCATTTT AAAGAGCCCAGTACTTC ATATCCATTTCTCCCG CTCCTTCTG CAG CCTTATCAAAAG GTATTTAG AACACTCATTTTAG CCCCATTTTCATTTATT ATACTGGCTTATCCAACCCCTAGACAGAGCATTGGCATTTTCCCTTTCCTGATCTTAGAA GTCTGATGACTCATGAAA CCAG ACAG ATTAGTTACATACACCACAAATCG AG G CTGTAG CTG G G G CCTCAACACTG CAGTTCTTTTATAACTCCT TAGTACACTTTTTGTTGATCCTTTGCCTTGATCCTTAATTTTCAGTGTCTATCACCTCTC CCGTCAGGTGGTGTTCCAC ATTTGGGCCTATTCTCAGTCCAGGGAGTTTTACAACAATAGATGTATTGAGAATCCAACC TAAAGCTTAACTTTCCA CTCCCATG AATG CCTCTCTCCTTTTTCTCCATTATAACTG AG CTATAACCATTAATG GTTTCAG GTG G ATGTCTCCTCC CCCAATATACCTG ATGTATCTACATATTG CCAG G CTG ATATTTTAAG ACATAAAAG GTATATTTCATTATTG AG CCAC ATG GTATTG ATTACTG CTACTAAAATTTTGTCATTGTACACATCTGTAAAAG GTG GTTCCTTTTG G AATG CAAAGTTC AG GTGTTTGTTGTCTTTCCTG ACCTAAG GTCTTGTG AG CTTGTATTTTTTCTATTTAAG CAGTG CTTTCTCTTG G ACTG G CTTG ACTCATG G CATTCTACACGTTATTG CTG GTCTAAATGTG ATTTTG CCAAG CTTCTTCAG G ACCTATAATTTTG CTTGACTTGTAGCCAAACACAAGTAAAATGATTAAGCAACAAATGTATTTGTGAAGCTTG GTTTTTAGGTTGTTGTG TTGTGTGTGCTTGTGCTCTATAATAATACTATCCAGGGGCTGGAGAGGTGGCTCGGAGTT CAAGAGCACAGACTGC TCTTCCAGAAGTCCTGAGTTCAATTCCCAGCAACCACATGGTGGCTCACAACCATCTGTA ATGGGATCTGATGCCCT CTTCTGGTGTGTCTGAAGACCACAAGTGTATTCACATTAAATAAATAATCCTCCTTCTTC TTCTTTTTTTTTTTTTAAA GAGAATACTGTCTCCAGTAGAATTACTGAAGTAATGAAATACTTTGTGTTTGTTCCAATA TGGAAGCCAATAATCAA ATACTCTTAAGCACTGGAAATGTACCAAGGAACTATTTTATTTAAGTGAACTGTGGACAG AGGAGCCATAACTGCA G ACTTGTG G G ATACAG AAG ACCAATG CAG ACTTAATGTCTTTTCTCTTACACTAAG CAATAAAG AAATAAAAATTG AACTTCTAGTATCCTATTTGTTAAACTG CTAG CTTTACTAACTTTTGTG CTTCATCTATACAAAG CTG AAAG CTAAGT CTGCAG CCATTACTAAACATG AAAG CAAGTAATG ATAATTTTG G ATTTCAAAAATGTAG G G CCAG AGTTTAG CCAG CCAGTGGTGGTGCTTGCCTTTATGCCTTAATCCCAGCACTCTGGAGGCAGAGACAGGCAG ATCTCTGAGTTTGAGC CCAGCCTGGTCTACACATCAAGTTCTATCTAGGATAGCCAGGAATACACACAGAAACCCT GTTGGGGAGGGGGGC TCTGAGATTTCATAAAATTATAATTGAAGCATTCCCTAATGAGCCACTATGGATGTGGCT AAATCCGTCTACCTTTCT GATGAGATTTGGGTATTATTTTTTCTGTCTCTGCTGTTGGTTGGGTCTTTTGACACTGTG GGCTTTCTTAAAGCCTCC TTCCCTG CCATGTG G ACTCTTGTTTG CTA TAACTTCCCATG G CTTAAATG G CATG G CTTTTTG CCTTCTAAG G G CAG CTGCTGAGATTTGCAGCCTGATTTCCAGGGTGGGGTTGGGAAATCTTTCAAACACTAAAA TTGTCCTTTAATTTTTTT TTAAAAAATGGGTTATATAATAAACCTCATAAAATAGTTATGAGGAGTGAGGTGGACTAA TATTAATGAGTCCCTC CCCTATAAAAG AG CTATTAAG G TTTTTGTCTTATACTAACTTTTTTTTTAAATGTG GTATCTTTAG AACCAAG G GTC TTAGAGTTTTAGTATACAGAAACTGTTGCATCGCTTAATCAGATTTTCTAGTTTCAAATC CAGAGAATCCAAATTCTT CACAGCCAAAGTCAAATTAAGAATTTCTGACTTTAATGTTATTTGCTACTGTGAATATAA AATGATAGCTTTTCCTGA G G CAG G GTATCACTATGTATCTCTG CCTG ATCTG CAACAAG ATATGTAG ACTAAAGTT TG CCTG TTTTGTCTCCT GAATACTAAGGTTAAAATGTAGTAATACTTTTGGAACTTGCAGGTCAGATTCTTTTATAG GGGACACACTAAGGGA G CTTG G GTG ATAGTTG GTAAATGTGTTTAAGTG ATG AAAACTTG AATTATTATCACCG CAAC TACTTTTTAAAAAA AAAAGCCAGGCCTGTTAGAGCATGCTAAGGGATCCCTAGGACTTGCTGAGCACACAAGAG TAGTACTTGGCAGGC TCCTGGTGAGAGCATATTTCAAAAAACAAGGCAGACAACCAAGAAACTACAGTAAGGTTA CCTGTCTTTAACCATC TG CATATACACAG G G ATATTAAAATATTCCAAATAATATTTCATTCAAGTTTTCCCCCATCAAATTG G G ACATG G ATT TCTCCGGTGAATAGGCAGAGTTGGAAACTAAACAAATGTTGGTTTTGTGATTTGTGAAAT TGTTTTCAAGTGATAGT T AAAG CCCATG AG ATACAG AACAAAG TG CTATTTCG AG GTCACTTG GTTATACTCAG AAG CA TTCTTTG G GTTTC CCTG CACTATCCTG ATCATGTG CTAG G CCTACCTTAG G CTG ATTGTTGTTCAAATAACTTAAGTTTCCTGTCAG GTG A TGTCATATGATTTCATATATCAAGGCAAAACATGTTATATATGTTAAACATTTGGACTTA ATGTGAAAGTTAGGTCTT TGTGGGTTTTGATTTTAATTTCAAAACCTGAGCTAAATAAGTCATTTTACATGTCTTACA TTTGGTGAATTGTATATT GTGGTTTGCAGGCAAGACTCTCTGACCTAGTAACCCTCCTATAGAGCACTTTGCTGGGTC ACAAGTCTAGGAGTCA AGCATTTCACCTTGAAGTTGAGACGTTTTGTTAGTGTATACTAGTTATATGTTGGAGGAC ATGTTTATCCAGAAGAT ATTCAGGACTATTTTTGACTGGGCTAAGGAATTGATTCTGATTAGCACTGTTAGTGAGCA TTGAGTGGCCTTTAGGC TTG AATTG G AGTCACTTGTATATCTCAAATAATG CTG G CCTTTTTTAAAAAG CCCTTGTTCTTTATCACCCTGTTTTCT ACATAATTTTTGTTCAAAGAAATACTTGTTTGGATCTCCTTTTGACAACAATAGCATGTT TTCAAGCCATATTTTTTTT CCTTTTTTTTTTTTTTTTTG GTTTTTCG AG ACAG G GTTTCTCTGTATAG CCCTG G CTGTCCTG G AACTCACTTTGTAG A CCAG G CTG G CCTCG AACTCAG AAATCCG CCTG CCTCTG CCTCCTG AGTG CCG G G ATT AAAG G CGTG CACCACCACG CCTG G CTAAGTTG G ATATTTTGTATATAACTATAACCAATACTAACTCCACTG G GTG G ATTTTTAATTCAGTCAGTAG TCTTAAGTG GTCTTTATTG G CCCTTATTAAAATCTACTGTTCACTCTAACAG AG G CTGTTG G ACTAGTG G G ACTAAG CAACTTCCTACG G ATATACTAG CAG AT AAG G GTCAG G G ATAG AAACTAGTCTAG CGTTTTGTATACCTACCAG CTTA TACTACCTTGTTCTGATAGAAATATTTAGGACATCTAGCTTATC

L'analyse de restriction par triple digestion EcoRV, Pvu l, Sal i de la réalisation 4 est illustrée figure 12. Vérification fonctionnelle de la réalisation 4 : des cellules eucaryotes (ex : cellules cancéreuses mammaires de souris 4T1) sont transfectées avec le vecteur VI.2 selon un protocole usuel (exemple lipotransfection ou électroporation). Après transfection les cellules sont traitées avec de l'hygromycine (5C^g-mL-l pendant 7-14 jours). Les cellules sont ensuite collectées et lysées pour en extraire les ARN totaux puis générer des ADN complémentaires (ADNc) pa r transcription inverse selon un protocole usuel. Ces ADNc sont ensuite utilisés comme matrice pour une analyse en PCR quantitative selon un protocole usuel. Conditions spécifiques de la PCR quantitative:

40 cycles des trois éta pes suivantes sont réa lisés : dénatu ration 94°C-30s ; hybridation 60°C-30s ; extension 72°C-30s.

mBSGaîtS

BETA3Ga !t6ms2-s ACCACTCTGTTGTACCTGGC (SEQ ID NO : 42).

BEÎA3Ga !t6ms2-as CACACGTCCTCGGGTCC (SEQ ID NO : 43).

HFUT3

FUT35 CACTAGÎCGACTAGGGATAACAGG (SEQ ID NO : 44).

FUT33 ATGTCCATAGCAGGATCAGGAG (SEQ ID NO : 45).

Réalisation 5

Groupe de vecteurs VI.3 : Vecteurs V1.2 permettant d'éliminer les cellules hôtes ayant intégré un ou des transgènes par recombinaisons non-homologue

U l + U3b + U2 + U3a + U3c + U3d

U l : Unité fonctionnelle bactérienne

U2 : nxU2a + mxU2b, n≥0, m≥0 et n+m≥2

U2a : Unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéine

U2b : Unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase I II et dont le produit d'expression est un ARN non codant U3a = cassette de sélection positive

U3b = motif 5' d'une séquence de recombinaison homologue X

U3c = motif 3' de la séquence de recombinaison homologue X

U3d est un cassette de sélection négative.

Exemple : Vecteur permettant d'exprimer l'enzyme h FUT3 tout en réprimant l'expression de mB3Galt6.

Ul ori-Amp

U3b Rosa26 5'

U2a promoteur CMV

hFUT3 cDNA

Terminateur BPA

U2b cassette shRNA mB3Galt6

U3a Hygomicin résistance

U3c Rosa26 3'

U3d promotor efla

Thimidine kinase

HSV Tk terminator

Liste des briques utilisées pour construire le vecteur V1.3 (Figure 13)

Brique Ori-AmpR Bsal B (SEQ ID NO : 36)

Brique rosa26-5' Bsal A (SEQ ID NO : 49)

Brique pCMV Bsal C (SEQ ID NO : 50)

Brique hFUT3 Bsal A (SEQ ID NO : 38)

Brique BGHpA Bsal B (SEQ ID NO : 39)

Brique shB3Galt6 Bsal B (SEQ ID NO : 46)

Brique HygroR Bsal C (SEQ ID NO : 51)

Brique rosa26-3' Bsal B (SEQ ID NO : 54)

GAGGTACCGGTCTCAGTAGAGATGGGCGGGAGTCTTCTGGGCAGGCTTAAAGGCTAACCT GGTGTGTGGGCGTT GTCCTGCAGGGGAATTGAACAGGTGTAAAATTGGAGGGACAAGACTTCCCACAGATTTTC GGTTTTGTCGGGAAG TTTTTTAATAGGGGCAAATAGGAAAATGGAGGATAGGAGTCATCTGGGGTTTATGCAGCA AAACTACAGGTATATT GCTTGTATCCGCCTCGGAGATTTCCATGAGGAGATAAAGACATGTCACCCGAGTTTATAC TCTCCTGCTTAGATCCT ACTACAGTATGAAATACAGTGTCGCGAGGTAGACTATGTAAGCAGATTTAATCATTTTAA AGAGCCCAGTACTTCAT ATCCATTTCTCCCG CTCCTTCTG CAG C TTATCAAAAG GTATTTAG AACACTCATTTTAG CCCCATTTTCATTTATTAT ACTGGCTTATCCAACCCCTAGACAGAGCATTGGCATTTTCCCTTTCCTGATCTTAGAAGT CTGATGACTCATGAAACC AG ACAG ATTAGTTACATACACCACAAATCG AG G CTGTAG TG G G G C TCAACACTG CAGTTCTTTTATAACTCCTTA GTACACTTTTTGTTGATCCTTTGCCTTGATCCTTAATTTTCAGTGTCTATCACCTCTCCC GTCAGGTGGTGTTCCACAT TTGGGCCTATTCTCAGTCCAGGGAGTTTTACAACAATAGATGTATTGAGAATCCAACCTA AAGCTTAACTTTCCACT CCCATGAATGCCTCTCTCCTTTTTCTCCATTATAACTGAGCTATAACCATTAATGGTTTC AGGTGGATGTCTCCTCCCC CAATATACCTGATGTATCTACATATTGCCAGGCTGATATTTTAAGACATAAAAGGTATAT TTCATTATTGAGCCACAT G GTATTG ATTACTG CTACTAAAATTTTGTCATTGTACACATCTGTAAAAG GTG GTTCCTTTTG G AATG CAAAGTTCA G GTGTTTGTTGTCTTTCCTG ACCTAAG GTCTTGTG AG CTTGTATTTTTT TATTTAAG CAGTG TTT TCTTG G ACTG G CTTG ACTCATG G CATTCTACACGTTATTG CTG GTCTAAATGTG ATTTTG CCAAG CTTCTTCAG G ACCTATAATTTTG C TTG ACTTGTAG CCAAACACAAGTAAAATG ATTAAG CAACAAATGTATTTGTG AAG CTTG GTTTTTAG GTTGTTGTGT TGTGTGTGCTTGTGCTCTATAATAATACTATCCAGGGGCTGGAGAGGTGGCTCGGAGTTC AAGAGCACAGACTGCT CTTCCAGAAGTCCTGAGTTCAATTCCCAGCAACCACATGGTGGCTCACAACCATCTGTAA TGGGATCTGATGCCCTC TTCTGGTGTGTCTGAAGACCACAAGTGTATTCACATTAAATAAATAATCCTCCTTCTTCT TCTTTTTTTTTTTTTAAAG AGAATACTGTCTCCAGTAGAATTACTGAAGTAATGAAATACTTTGTGTTTGTTCCAATAT GGAAGCCAATAATCAAA TACTCTTAAGCACTGGAAATGTACCAAGGAACTATTTTATTTAAGTGAACTGTGGACAGA GGAGCCATAACTGCAG ACTTGTGGGATACAGAAGACCAATGCAGACTTAATGTCTTTTCTCTTACACTAAGCAATA AAGAAATAAAAATTGAA CTTCTAGTATCCTATTTGTTAAACTG CTAG TTTACTAACTTTTGTG CTTCAT TATACAAAG CTG AAAG CTAAGTCTG CAG CCATTACTAAACATG AAAG CAAGTAATG ATAATTTTG G ATTTCAAAAATGTAG G G CCAG AGTTTAG CCAG CCA GTGGTGGTGCTTGCCTTTATGCCTTAATCCCAGCACTCTGGAGGCAGAGACAGGCAGATC TCTGAGTTTGAGCCCA G CCTG GTCTACACATCAAGTT TAT TAG G ATAG CCAG G AATACACACAG AAACC TGTTG G G G AG G G G G G CTCT GAGATTTCATAAAATTATAATTGAAGCATTCCCTAATGAGCCACTATGGATGTGGCTAAA TCCGTCTACCTTTCTGA TG AG ATTTG G GTATTATTTTTTCTGT TCTG CTGTTG GTTG G GT TTTTG ACACTGTG G G CTTTCTTAAAG CCTCCTTC CCTG CCATGTG G A TCTTGTTTG CTACTAACTTCCCATG G CTTAAATG G CATG G CTTTTTG CCTTCTAAG G G CAG CTG CTG AG ATTTG CAG CCTG ATTTCCAG G GTG G G GTTG G G AAATCTTTCAAACACTAAAATTGTC TTTAATTTTTTTTTA AAAAATGGGTTATATAATAAACCTCATAAAATAGTTATGAGGAGTGAGGTGGACTAATAT TAATGAGTCCCTCCCC T ATAAAAG AG CT ATT AAG G rTTTTGTCTTATACTAACTTTTTTTTTAAATGTG GTATCTTTAG AACCAAG G GTCTTA GAGTTTTAGTATACAGAAACTGTTGCATCGCTTAATCAGATTTTCTAGTTTCAAATCCAG AGAATCCAAATTCTTCAC AGCCAAAGTCAAATTAAGAATTTCTGACTTTAATGTTATTTGCTACTGTGAATATAAAAT GATAGCTTTTCCTGAGG CAGGGTATCACTATGTATCTCTGCCTGATCTGCAACAAGATATGTAGACTAAAGTTCTGC CTGCTTTTGTCTCCTGAA T ACTAAG GTTAAAATGTAGTAATACTTTTG G AACTTG CAG GTCAG ATT TTTTATAG G G G ACACACTAAG G G AG CT TGGGTGATAGTTGGTAAATGTGTTTAAGTGATGAAAACTTGAATTATTATCACCGCAACC TACTTTTTAAAAAAAAA AGCCAGGCCTGTTAGAGCATGCTAAGGGATCCCTAGGACTTGCTGAGCACACAAGAGTAG TACTTGGCAGGCTCC TGGTGAGAG CATATTTCAAAAAACAAG G CAG ACAACCAAG AAACTACAGTAAG GTTAC TGTCTTTAACCAT TG C ATATACACAG G G ATATTAAAATATTCCAAATAATATTTCATTCAAGTTTTCCCCCATCAAATTG G G ACATG G ATTTCT CCGGTGAATAGGCAGAGTTGGAAACTAAACAAATGTTGGTTTTGTGATTTGTGAAATTGT TTTCAAGTGATAGTTA AAGCCCATGAGATACAGAACAAAGCTGCTATTTCGAGGTCACTTGGTTATACTCAGAAGC ACTTCTTTGGGTTTCCC TG CACTATCCTG ATCATGTG CTAG G CCTACCTTAG G TG ATTGTTGTTCAAATAACTTAAGTTTCCTGTCAG GTG ATG TCATATGATTTCATATATCAAGGCAAAACATGTTATATATGTTAAACATTTGGACTTAAT GTGAAAGTTAGGTCTTTG TGGGTTTTGATTTTAATTTCAAAACCTGAGCTAAATAAGTCATTTTACATGTCTTACATT TGGTGAATTGTATATTGT GGTTTGCAGGCAAGACTCTCTGACCTAGTAACCCTCCTATAGAGCACTTTGCTGGGTCAC AAGTCTAGGAGTCAAG CATTTCACCTTGAAGTTGAGACGTTTTGTTAGTGTATACTAGTTATATGTTGGAGGACAT GTTTATCCAGAAGATAT TCAGGACTATTTTTGACTGGGCTAAGGAATTGATTCTGATTAGCACTGTTAGTGAGCATT GAGTGGCCTTTAGGCTT G AATTG G AGTCACTTGTATATCTCAAATAATG CTG G C TTTTTTAAAAAG CCCTTGTTCTTTATCACCCTGTTTTCTAC ATAATTTTTGTTCAAAGAAATACTTGTTTGGATCTCCTTTTGACAACAATAGCATGTTTT CAAGCCATATTTTTTTTCC TTTTTTTTTTTTTTTTTGGTTTTTCGAGACAGGGTTTCTCTGTATAGCCCTGGCTGTCCT GGAACTCACTTTGTAGACC AG G CTG G C TCG AA TCAG AAATCCG C TG CCTCTG CCTCCTG AGTG CCG G G ATTAAAG G CGTG CACCACCACG CC TG G CTAAGTTG G ATATTTTGTATATAACTATAACCAATA TAACTCCACTG G GTG G ATTTTTAATTCAGTCAGTAGTC TTAAGTG GT TTTATTG G CC TTATTAAAATCTACTGTTCACTCTAACAG AG G CTGTTG G ACTAGTG G G ACTAAG CA ACTTCCTACG G ATATACTAG CAG ATAAG G GTCAG G G ATAG AAACTAGTCTAG CGTTTTGTATACCTACCAG CTTATA CTACCTTGTTCTGATAGAAATATTTAGGACATCTAGCTTATCATGCCGAGACCGGTACCT C

Brique pEFla Bsal A (SEQ ID NO : 55)

G AG GTACCG GTCTCAATG Ca a G G AACCAATTCAGTCG ACTG G ATCCCG ATG G CTCCG GTG CCCGTCAGTG G G CAG AGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTG CCTAGAGAAGGTGG CGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGG GGAGAACCGTATATA AGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTC CGCGGCCCCGAACTAG GCCTAGGCGTCTGATCACTAGTGACTCTAGTCCTAGTCGACTAGGGATAACAGGGGCCCC GAGACCGGTACCTC Brique TK Bsal A (SEQ ID NO : 56)

GAG GTACCG GTCTCAG CCCATG G CTTCGTACCCCTG CCATCAACACG CGTCTG CGTTCGACCAGGCTGCG CGTTCTC GCGGCCATAGCAACCGACGTACGGCGTTGCGCCCTCGCCGGCAGCAAGAAGCCACGGAAG TCCGCCTGGAGCAG AAAATG CCCACG CTACTG CG G GTTTATATAG ACG GTCCTCACG G G ATG G G G AAAACCACCACCACG CAACTG CTG GTGGCCCTGGGTTCGCGCGACGATATCGTCTACGTACCCGAGCCGATGACTTACTGGCAG GTGCTGGGGGCTTCC GAGACAATCGCGAACATCTACACCACACAACACCGCCTCGACCAGGGTGAGATATCGGCC GGGGACGCGGCGGT G GTAATG ACAAG CG CCCAG ATAACAATG G G CATG CCTTATG CCGTGACCGACG CCGTTCTG G CTCCTCATATCG G G G G G G AG G CTG G GAG CTCACATG CCCCGCCCCCGG CCCTCACCCTCATCTTCG ACCG CCATCCCATCG CCG CCCTCCT GTG CTACCCG G CCG CG CG ATACCTTATG G G CAG CATG ACCCCCCAG G CCGTG CTG G CGTTCGTG G CCCTCATCCCG CCGACCTTGCCCGGCACAAACATCGTGTTGGGGGCCCTTCCGGAGGACAGACACATCGAC CGCCTGGCCAAACGC CAGCGCCCCGGCGAGCGG CTTG ACCTG G CTATG CTG G CCG CG ATTCG CCG CGTTTACG G G CTG CTTG CCAATACG GTGCGGTATCTGCAGGGCGGCGGGTCGTGGCGGGAGGATTGGGGACAGCTTTCGGGGACG GCCGTGCCGCCCCA GGGTGCCGAGCCCCAGAGCAACGCGGGCCCACGACCCCATATCGGGGACACGTTATTTAC CCTGTTTCGGGCCCCC GAGTTGCTGGCCCCCAACGGCGACCTGTACAACGTGTTTGCCTGGGCCTTGGACGTCTTG GCCAAACGCCTCCGTC CCATG CACGTCTTTATCCTG G ATTACG ACCAATCG CCCG CCG G CTG CCG G G ACG CCCTG CTG CAACTTACCTCCG G G ATGGTCCAGACCCACGTCACCACCCCCGGCTCCATACCGACGATCTGCGACCTGGCGCGC ACGTTTGCCCGGGAGA TGGGGGAGG CTAACTG ACCG CCG AG ACCG GTACCTC

Brique Tkter Bsal A (SEQ ID NO : 57)

GAGGTACCGGTCTCACCGCGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAA GGAACCCGCGCTAT G ACG G CAATAAAAAG ACAG AATAAAACG CACG GTGTTG G GTCGTTTGTTCATAAACG CGGGGTTCGGTCCCAGGG CTG G CACTCTGTCG ATACCCCACCG AG G CCCCATTG G G G CCAATACG CCCG CGTTTCTTCCTTTTCCCCACCCCACCC CCCAAGTTCG GGTGAAGGCCCAGGGCTCGCAG CCAACGTCG G G G CG G CAG G CCCTG CCATAG CCTATTCG AG ACC G GTACCTC

VI.3 (SEQ ID NO : 58, exemple de vecteur du groupe VI.3)

TATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAA AGGCCAGCAAAAGG CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCACA AAAATCG ACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCC TGGAAGCTCCCTCGT GCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGG AAGCGTGGCGCTTTCTCA TAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTC AGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACG ACTTATCGCCACTGGC AGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTT GAAGTGGTGGCCTAA CTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTT CGGAAAAAGAGTTGGT AG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAA AAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAA ACTCACGTTAAGGGAT TTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAG TTTTAAATCAATCTAAAG TATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTC AGCGATCTGTCTATTTC GTTCATCCATAGTTG CCTG ACTCCCCGTCGTGTAG ATAACTACG ATACG G GAG G G CTTACCATCTG GCCCCAGTGCT G CAATG ATACCG CGTG ACCCACG CTCACCG G CTCCAG ATTTATCAG CAATAAACCAG CCAG CCG G AAG G G CCG AG CG CAG AAGTG GTCCTG CAACTTTATCCG CCTCCATCCAGT TATTAATTGTTG CCG G G AAG CTAG AGTAAGTAGTTC G CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTT CATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTC G GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCT TACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATT CTGAGAATAGTGTATGC GGCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCAT CATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG TTCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG C CG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG CATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCGAAAAGTGCCAAGGACCCCGCGGCAGGCCCTCCGAGCGTGGTGGAGCCGTTC TGTGAGACAGCCGGG TACGAGTCGTGACGCTGGAAGGGGCAAGCGGGTGGTGGGCAGGAATGCGGTCCGCCCTGC AGCAACCGGAGGG GGAGGGAGAAGGGAGCGGAAAAGTCTCCACCGGACGCGGCCATGGCTCGGGGGGGGGGGG GCAGCGGAGGAG CG CTTCCG G CCG ACGTCTCGTCG CTG ATTG G CTTCTTTTCCTCCCG CCGTGTGTG AAAACACAAATG G CGTGTTTTG GTTG G CGTAAG G CG CCTGTCAGTTAACG G CAG CCG G AGTG CG CAG CCG CCG G CAG CCTCG CTCTG CCCACTG G GT GGGGCGGGAGGTAGGTGGGGTGAGGCGAGCTGGACGTGCGGGCGCGGTCGGCCTCTGGCG GGGCGGGGGAGG GGAGGGAGGGTCAGCGAAAGTAGCTCGCGCGCGAGCGGCCGCCCACCCTCCCCTTCCTCT GGGGGAGTCGTTTTA CCCGCCGCCGGCCGGG CCTCGTCGTCTG ATTG G CTCTCG G G G CCCAG AAAACTG G CCCTTG CCATTG G CTCGTGTT CGTGCAAGTTGAGTCCATCCGCCGGCCAGCGGGGGCGGCGAGGAGGCGCTCCCAGGTTCC GGCCCTCCCCTCGGC CCCGCGCCGCAGAGTCTGGCCGCGCGCCCCTGCGCAACGTGGCAGGAAGCGCGCGCTGGG GGCGGGGACGGGC AGTAGGGCTGAGCGGCTGCGGGGCGGGTGCAAGCACGTTTCCGACTTGAGTTGCCTCAAG AGGGGCGTGCTGAG CCAGACCTCCATCGCGCACTCCGGGGAGTGGAGGGAAGGAGCGAGGGCTCAGTTGGGCTG TTTTGGAGGCAGGA AGCACTTGCTCTCCCAAAGTCGCTCTGAGTTGTTATCAGTAAGGGAGCTGCAGTGGAGTA GGCGGGGAGAAGGCC G CACCCTTCTCCG G AG G G G G G AG G G G AGTGTTG CAATACCTTTCTG GGAGTTCTCTGCTG CCTCCTG G CTTCTG AG GACCGCCCTGGG CCTG G G AG AATCCCTTG CCCCCTCTTCCCCTCGTG ATCTG CAACTCCAGTCTTACAAACCAATTC AGTCG ACTG G ATCCTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATATG G AGTTCCG CGT TACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGAC GTCAATAATGACGTAT GTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGG TAAACTGCCCACTTGG CAGTACATCAAGTGTATCATATG CCAAGTACG CCCC TATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATTAT G CCCAGTACATG ACCTTATG G G ACTTTCCTA TTG G CAGTACAT TACGTATTAGTCATCG T ATTACCATG GTG AT G CG GTTTTG G CAGTACATCAATG G G CGTG G ATAG CG GTTTG ACTCACG G G G ATTTCCAAGTCTCCACCCCATTG AC GTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAACTCCG CCCCATTG ACG C AAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACC GTCAGATCACTAGTC G ACTAG G G ATAACAG G G CACCATG G ATCCCCTG G GTG CAG CCAAG CCACAATG G CCATG GCGCCGCTGTCTGGCC GCACTGCTATTTCAGCTGCTGGTGGCTGTGTGTTTCTTCTCCTACCTGCGTGTGTCCCGA GACGATGCCACTGGATC CCCTAGGGCTCCCAGTGGGTCCTCCCGACAGGACACCACTCCCACCCGCCCCACCCTCCT GATCCTGCTATGGACAT G G CCTTTCCACATCCCTGTG G CT TGTCCCG CTGTTCAG AG ATG GTGCCCGGCACAGCCGACTG CCACATCA TG CC G ACCG CAAG GTGTACCCACAG G CAG ACACG GTCATCGTG CACCACTG G G ATATCATGTCCAACCCTAAGTCACG CC TCCCACCTTCCCCG AG GCCGCAGGGGCAGCG CTG G ATCTG GTTCAACTTG G AG CCACCCCCTAACTG CCAG CACCT GGAAGCCCTGGACAGATACTTCAATCTCACCATGTCCTACCGCAGCGACTCCGACATCTT CACGCCCTACGGCTGGC TGGAGCCGTGGTCCGGCCAGCCTGCCCACCCACCGCTCAACCTCTCGGCCAAGACCGAGC TGGTGGCCTGGGCGG TGTCCAACTGGAAGCCGGACTCAGCCAGGGTGCGCTACTACCAGAGCCTGCAGGCTCATC TCAAGGTGGACGTGT ACGGACGCTCCCACAAGCCCCTGCCCAAGGGGACCATGATGGAGACGCTGTCCCGGTACA AGTTCTACCTGGCCTT CGAGAACTCCTTGCACCCCGACTACATCACCGAGAAGCTGTGGAGGAACGCCCTGGAGGC CTGGGCCGTGCCCGT GGTGCTGGGCCCCAGCAGAAGCAACTACGAGAGGTTCCTGCCACCCGACGCCTTCATCCA CGTGGACGACTTCCA GAGCCCCAAGGACCTGGCCCGGTACCTGCAGGAGCTGGACAAGGACCACGCCCGCTACCT GAGCTACTTTCGCTG GCGGGAGACG CTG CG G CCTCG CTCCTTCAG CTG G G CACTG G ATTTCTG CAAG G CCTG CTG G AAACTG CAG CAG G A ATCCAG GTACCAGACGGTGCGCAG CATAG CG G CTTG GTTCACCTG ATCG ACTGTG CCTTCTAGTTG CCAG CCATCT GTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTT TCCTAATAAAATGAGGAA ATTG CATCG CATTGTCTG AGTAG GTGTCATTCTATTCTG GGGGGTGGGGTGGGGCAGGACAG CAAG GGGGAGGA TTGGGAGGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCGACAGGGTC GACAAGCTTTTCCAA AAAAAAAG CATG AG GTG CAGTTG CG CCTTTCCTATCTCTTG AATAG G AAAG G CG CAACTG CACCTCATG CTG G ATC CCGCGTCCTTTCCACAAGATATATAAACCCAAGAAATCGAAATACTTTCAAGTTACGGTA AGCATATGATAGTCCAT TTTAAAACATAATTTTAAAACTGCAAACTACCCAAGAAATTATTACTTTCTACGTCACGT ATTTTGTACTAATATCTTT GTGTTTACAGTCAAATTAATTCTAATTATCTCTCTAACAGCCTTGTATCGTATATGCAAA TATGAAGGAATCATGGG AAATAG G CCCTCTTCCTG CCCG ACCTTG G CG CG CG CTCG GCGCGCGGTCACG CTCCGTCACGTG GTG CGTTTTG CC AG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCAG G CTCCCCAG C AG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAACTCCG CCCATCCCG CCCC T AACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTT ATG CAGAGGCCGAGGCCGCCT CTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCA AAAAGCTCCCGGGAGC TTGTATATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAGCCTGAACTCACCGCGAC GTCTGTCGAGAAGTTTC TGATCGAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTC GTGCTTTCAGCTTCGA TGTAGGAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCGCCGATGGTTTCTACAAAGA TCGTTATGTTTATCGG CACTTTGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAG AGCCTGACCTATTGCA TCTCCCGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCTGAAACCGAACTGCCCGCTG TTCTGCAGCCGGTCGC GGAGGCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGACGAGCGGGTTCGGCCCATT CGGACCGCAAGGAA TCGGTCAATACACTACATGGCGTGATTTCATATGCGCGATTGCTGATCCCCATGTGTATC ACTGGCAAACTGTGATG GACGACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAG GACTGCCCCGAAGTC CG G CACCTCGTG CACG CG G ATTTCG G CTCCAACAATGTCCTG ACG G ACAATG G CCG CATAACAG CG GTCATTG ACT GGAGCGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCCAACATCTTCTTCTGGAGGC CGTGGTTGGCTTGTAT GGAGCAGCAGACGCGCTACTTCGAGCGGAGGCATCCGGAGCTTGCAGGATCGCCGCGGCT CCGGGCGTATATGC TCCG CATTG GTCTTG ACCAACTCTATCAG AG CTTG GTTG ACG G CAATTTCG ATG ATG CAG CTTG GGCGCAGGGTCG ATGCGACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCGTACACAAATCGCCCGCAG AAGCGCGGCCGTCTG GACCGATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACCGACGCCCCAGCACTCGTCC GAGGGCAAAGGAATA G CACGTG TACG AG ATTTCG ATTCCACCG CCG CCTTCTATG AAAG GTTG G G CTTCG G AATCGTTTTCCG G G ACG CC G G CTG G ATG ATCCTCCAG CG CG G G G ATCTCATG CTG G AGTTCTTCG CCCACCCCAACTTGTTTATTG CAG CTTATAA TG GTTACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACTG CATTCTAGTTGTG GTTTGTC CAAACTCATCAATGTATCGTAG AG ATG G G CG G G AGTCTTCTG G G CAG G CTTAAAG G CTAACCTG GTGTGTG G G CG TTGTCCTGCAGGGGAATTGAACAGGTGTAAAATTGGAGGGACAAGACTTCCCACAGATTT TCGGTTTTGTCGGGAA GTTTTTTAATAG G G G CAAATAG G AAAATG G AG G ATAG G AGTCATCTG G G GTTTATG CAG CAAAACTACAG GTATA TTGCTTGTATCCGCCTCGGAGATTTCCATGAGGAGATAAAGACATGTCACCCGAGTTTAT ACTCTCCTGCTTAGATC CTACTACAGTATGAAATACAGTGTCGCGAGGTAGACTATGTAAGCAGATTTAATCATTTT AAAGAGCCCAGTACTTC ATATCCATTTCTCCCG CTCCTTCTG CAG CCTTATCAAAAG GTATTTAG AACACTCATTTTAG CCCCATTTTCATTTATT ATACTGGCTTATCCAACCCCTAGACAGAGCATTGGCATTTTCCCTTTCCTGATCTTAGAA GTCTGATGACTCATGAAA CCAG ACAG ATTAGTTACATACACCACAAATCG AG G CTGTAG CTG G G G CCTCAACACTG CAGTTCTTTTATAACTCCT TAGTACACTTTTTGTTGATCCTTTGCCTTGATCCTTAATTTTCAGTGTCTATCACCTCTC CCGTCAGGTGGTGTTCCAC ATTTG G G CCTATTCTCAGTCCAG G G AGTTTTACAACAATAG ATGTATTG AG AATCCAACCTAAAG CTTAACTTTCCA CTCCCATG AATG CCTCTCTCCTTTTTCTCCATTATAACTG AG CTATAACCATTAATG GTTTCAG GTG G ATGTCTCCTCC CCCAATATACCTGATGTATCTACATATTGCCAGGCTGATATTTTAAGACATAAAAGGTAT ATTTCATTATTGAGCCAC ATG GTATTG ATTACTG CTACTAAAATTTTGTCATTGTACACATCTGTAAAAG GTG GTTCCTTTTG G AATG CAAAGTTC AG GTGTTTGTTGTCTTTCCTG ACCTAAG GTCTTGTG AG CTTGTATTTTTTCTATTTAAG CAGTG CTTTCTCTTG G ACTG G CTTG ACTCATG G CATTCTACACGTTATTG CTG GT TAAATGTG ATTTTG CCAAG CTT TTCAG G ACCTATAATTTTG CTTG ACTTGTAG CCAAACACAAGTAAAATG ATTAAG CAACAAATGTATTTGTG AAG CTTG GTTTTTAG GTTGTTGTG TTGTGTGTGCTTGTGCTCTATAATAATACTATCCAGGGGCTGGAGAGGTGGCTCGGAGTT CAAGAGCACAGACTGC TCTTCCAGAAGTCCTGAGTTCAATTCCCAGCAACCACATGGTGGCTCACAACCATCTGTA ATGGGATCTGATGCCCT CTTCTGGTGTGTCTGAAGACCACAAGTGTATTCACATTAAATAAATAATCCTCCTTCTTC TTCTTTTTTTTTTTTTAAA GAGAATACTGTCTCCAGTAGAATTACTGAAGTAATGAAATACTTTGTGTTTGTTCCAATA TGGAAGCCAATAATCAA ATACTCTTAAGCACTGGAAATGTACCAAGGAACTATTTTATTTAAGTGAACTGTGGACAG AGGAGCCATAACTGCA G ACTTGTG G G ATACAG AAG ACCAATG CAG ACTTAATGTCTTTTCTCTTACACTAAG CAAT AAAG AAATAAAAATTG AA TTCTAGTATCCTATTTGTTAAA TG CTAG TTTACTAACTTTTGTG CTTCATCTATACAAAG CTG AAAG CTAAGT CTG CAG CCATTACTAAACATG AAAG CAAGTAATG ATAATTTTG G ATTTCAAAAATGTAG G G CCAG AGTTTAG CCAG CCAGTGGTGGTGCTTGCCTTTATGCCTTAATCCCAGCACTCTGGAGGCAGAGACAGGCAG ATCTCTGAGTTTGAGC CCAG CCTG GTCTACACATCAAGTTCTATCTAG G ATAG CCAG G AATACACACAG AAACCCTGTTG GGGAGGGGGGC TCTGAGATTTCATAAAATTATAATTGAAGCATTCCCTAATGAGCCACTATGGATGTGGCT AAATCCGTCTACCTTTCT GATGAGATTTGGGTATTATTTTTTCTGTCTCTGCTGTTGGTTGGGTCTTTTGACACTGTG GGCTTTCTTAAAGCCTCC TTCCCTG CCATGTG G ACTCTTGTTTG CTACTAA TTCCCATG G CTTAAATG G CATG G CTTTTTG CCTTCTAAG G G CAG CTG CTG AG ATTTG CAG CCTG ATTTCCAG GGTGGGGTTG G G AAAT TTTCAAACACTAAAATTGTCCTTTAATTTTTTT TTAAAAAATGGGTTATATAATAAACCTCATAAAATAGTTATGAGGAGTGAGGTGGACTAA TATTAATGAGTCCCTC CCCTATAAAAG AG CTATTAAG G CTTTTTGTCTTATACTAACTTTTTTTTTAAATGTG GT ATCTTTAG AACCAAG G GTC TTAGAGTTTTAGTATACAGAAACTGTTGCATCGCTTAATCAGATTTTCTAGTTTCAAATC CAGAGAATCCAAATTCTT CACAGCCAAAGTCAAATTAAGAATTTCTGACTTTAATGTTATTTGCTACTGTGAATATAA AATGATAGCTTTTCCTGA G G CAG G GTATCACTATGTATCTCTG CCTG ATCTG CAACAAG ATATGTAG ACTAAAGTTCTG CCTG CTTTTGTCTCCT GAATACTAAGGTTAAAATGTAGTAATACTTTTGGAACTTGCAGGTCAGATTCTTTTATAG GGGACACACTAAGGGA G CTTG G GTG ATAGTTG GTAAATGTGTTTAAGTG ATG AAAACTTG AATTATTATCACCG CAACCTACTTTTTAAAAAA AAAAGCCAGGCCTGTTAGAGCATGCTAAGGGATCCCTAGGACTTGCTGAGCACACAAGAG TAGTACTTGGCAGGC TCCTG GTG AG AG CATATTTCAAAAAACAAG G CAG ACAACCAAG AAACTACAGTAAG GTTACCTGTCTTTAACCATC TG CATATACACAG G G ATATTAAAATATTCCAAATAATATTTCATTCAAGTTTTCCCCCATCAAATTG G G ACATG G ATT TCTCCGGTGAATAGGCAGAGTTGGAAACTAAACAAATGTTGGTTTTGTGATTTGTGAAAT TGTTTTCAAGTGATAGT TAAAGCCCATGAGATACAGAACAAAGCTGCTATTTCGAGGTCACTTGGTTATACTCAGAA GCACTTCTTTGGGTTTC CCTG CACTATCCTG ATCATGTG CTAG G CCTACCTTAG G CTG ATTGTTGTTCAAATAACTTAAGTTTCCTGTCAG GTG A TGTCATATGATTTCATATATCAAGGCAAAACATGTTATATATGTTAAACATTTGGACTTA ATGTGAAAGTTAGGTCTT TGTGGGTTTTGATTTTAATTTCAAAACCTGAGCTAAATAAGTCATTTTACATGTCTTACA TTTGGTGAATTGTATATT GTGGTTTGCAGGCAAGACTCTCTGACCTAGTAACCCTCCTATAGAGCACTTTGCTGGGTC ACAAGTCTAGGAGTCA AGCATTTCACCTTGAAGTTGAGACGTTTTGTTAGTGTATACTAGTTATATGTTGGAGGAC ATGTTTATCCAGAAGAT ATTCAGGACTATTTTTGACTGGGCTAAGGAATTGATTCTGATTAGCACTGTTAGTGAGCA TTGAGTGGCCTTTAGGC TTG AATTG G AGTCACTTGTATAT TCAAATAATG CTG G C TTTTTTAAAAAG CC TTGTTCTTTATCACCCTGTTTTCT ACATAATTTTTGTTCAAAGAAATACTTGTTTGGATCTCCTTTTGACAACAATAGCATGTT TTCAAGCCATATTTTTTTT CCTTTTTTTTTTTTTTTTTG GTTTTTCG AG ACAG G GTTTCTCTGTATAG CCCTG G CTGTCCTG G AACTCACTTTGTAG A CCAG G CTG G CCTCG AACTCAG AAATCCG CCTG CCTCTG C TCCTG AGTG CCG G G ATTAAAG G CGTG CACCACCACG CCTG G CTAAGTTG G ATATTTTGTATATAACTATAACCAATACTAACTCCACTG G GTG G ATTTTTAATTCAGTCAGTAG T TTAAGTG GTCTTTATTG G CCCTTATTAAAATCTACTGTTCACT TAACAG AG G CTGTTG G A TAGTG G G ACTAAG CAACTTCCTACGGATATACTAGCAGATAAGGGTCAGGGATAGAAACTAGTCTAGCGTTTT GTATACCTACCAGCTTA TACTACCTTGTTCTGATAGAAATATTTAGGACATCTAGCTTATCATGCAAGGAACCAATT CAGTCGACTGGATCCCG ATGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGG GGGGAGGGGTCGGC AATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTAC TGGCTCCGCCTTTTT CCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGC AACGGGTTTGCCGCC AGAACACAGGTCCGCGGCCCCGAACTAGGCCTAGGCGTCTGATCACTAGTGACTCTAGTC CTAGTCGACTAGGGAT AACAG G G G CCCATG G CTTCGTACCCCTG CCATCAACACG CGTCTG CGTTCG ACCAG G CTG CG CGTTCTCG CG G CCA TAGCAACCGACGTACGGCGTTGCGCCCTCGCCGGCAGCAAGAAGCCACGGAAGTCCGCCT GGAGCAGAAAATGCC CACG TACTG CG G GTTTATATAG ACG GTCCTCACG G G ATG G G G AAAACCACCACCACG CAACTG CTG GTG G CCCT GGGTTCGCGCGACGATATCGTCTACGTACCCGAGCCGATGACTTACTGGCAGGTGCTGGG GGCTTCCGAGACAAT CGCGAACATCTACACCACACAACACCGCCTCGACCAGGGTGAGATATCGGCCGGGGACGC GGCGGTGGTAATGAC AAG CG CCCAG ATAACAATG G G CATG CCTTATG CCGTGACCGACG CCGTTCTG G CTCCTCATATCG GGGGGGAGGC TGGGAGCTCACATGCCCCGCCCCCGGCCCTCACCCTCATCTTCGACCGCCATCCCATCGC CGCCCTCCTGTGCTACCC G G CCG CG CG ATACCTTATG G G CAG CATG ACCCCCCAG G CCGTG CTG G CGTTCGTG G CCCTCATCCCG CCG ACCTTG CCCG G CACAAACATCGTGTTG G G G G CCCTTCCG G AG G ACAG ACACATCG ACCG CCTG G CCAAACG CCAGCGCCCC GGCGAGCGGCTTGACCTGGCTATGCTGGCCGCGATTCGCCGCGTTTACGGGCTGCTTGCC AATACGGTGCGGTATC TGCAGGGCGGCGGGTCGTGGCGGGAGGATTGGGGACAGCTTTCGGGGACGGCCGTGCCGC CCCAGGGTGCCGA GCCCCAGAGCAACGCGGGCCCACGACCCCATATCGGGGACACGTTATTTACCCTGTTTCG GGCCCCCGAGTTGCTG G CCCCCAACG G CG ACCTGTACAACGTGTTTG CCTG G G CCTTG G ACGTCTTG G CCAAACG CCTCCGTCCCATG CACG TCTTTATCCTGGATTACGACCAATCGCCCGCCGGCTGCCGGGACGCCCTGCTGCAACTTA CCTCCGGGATGGTCCA GACCCACGTCACCACCCCCGGCTCCATACCGACGATCTGCGACCTGGCGCGCACGTTTGC CCGGGAGATGGGGGA GGCTAACTGACCGCGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAAC CCGCGCTATGACGG CAATAAAAAG ACAG AATAAAACG CACG GTGTTG G GTCGTTTGTTCATAAACG CG G G GTTCG GTCCCAGGGCTGGC ACTCTGTCG ATACCCCACCG AG G CCCCATTG G G G CCAATACG CCCG CGTTTCTTCCTTTTCCCCACCCCACCCCCCAA GTTCG G GTG AAG G CCCAG G G CTCG CAG CCAACGTCG GGGCGGCAGG CCCTG CCATAG CC

L' analyse de restriction par triple digestion EcoRV, Pvu l, Sali de la réalisation 5 est illustrée figure 14.

5

Vérification fonctionnelle de la réalisation 5 : des cellules eucaryotes (par exemple des cellules cancéreuses mammaires de souris 4T1) sont transfectées avec le vecteur V1.3 selon un protocole usuel (par exemple par lipotransfection ou électroporation). Après transfection, les cellules sont traitées avec de l'hygromycine (5C^g-mL-l pendant 7-14 jou rs), puis avec du Ganciclovir (3-6 jours 5-40μΜ). Les 10 cellules sont ensu ite collectées et lysées pour en extraire les ARN totaux puis générer des ADN complémentaires (ADNc) pa r transcription inverse selon un protocole usuel. Ces ADNc sont ensuite utilisés comme matrice pour une ana lyse en PCR quantitative selon un protocole usuel.

Conditions spécifiques de la PCR quantitative:

15 40 cycles des trois éta pes suivantes sont réalisés : dénatu ration 94°C-30s ; hybridation 60°C-30s ; extension 72°C-30s.

Amorces utilisés:

rrtB3Gaiî6

20 BETA3Ga !t6ms2-s ACCACTCTGTTGTACCTGGC (SEQ ID NO : 42).

BETA3Ga !t6ms2-as CACACGTCCTCGGGTCC (SEQ I D NO : 43).

HFUT3

FUT35 CACTAGTCGACTAGGGATAACAGG (SEQ I D NO : 44).

FUT33 ATGTCCATAG CAG G ATCAG G AG (SEQ I D NO : 45).

25

Réalisation 6

Groupe de vecteurs V2 : Vecteur permettant d'exprimer un ou plusieurs transgènes de façon inductible.

U l + U2c + nxU2d + mxU2e

30 U l : Unité fonctionnelle bactérienne

U2c = gène codant un transactivateur transcriptionelle (exemple protéine TAT).

U2d = gène(s) dont le promoteur est dépendant du transactivateur codé par le gène U2c, n >1 U2e = gène(s) dont le promoteur n'est pas dépendant du tran sactivateur codé par le gène U2c, m >0

Exemple : vecteur permettant l'expression inductible de l'enzyme mB3Galt6

U l ori-Amp

U2c promoteur CMV

Teton3G

Terminateur BPA

U2d promoteur TRE3G

mB3Galt6

HSV Tk terminator

Liste des briques utilisées pour la construction du vecteur V2 (Figure 15)

Brique Ori-AmpR Bsal B (SEQ ID NO : 36)

Brique pCMV Bsal B (SEQ ID NO : 37)

Brique T03G Bsal A (SEQ ID NO : 59)

GAGGTACCGGTCTCACACCATGTCTAGACTGGACAAGAGCAAAGTCATAAACTCTGCTCT GGAATTACTCAATGGA GTCGGTATCGAAGGCCTGACGACAAGGAAACTCGCTCAAAAGCTGGGAGTTGAGCAGCCT ACCCTGTACTGGCAC GTGAAGAACAAGCGGGCCCTGCTCGATGCCCTGCCAATCGAGATGCTGGACAGGCATCAT ACCCACTCCTGCCCCC TGGAAGGCGAGTCATGGCAAGACTTTCTGCGGAACAACGCCAAGTCATACCGCTGTGCTC TCCTCTCACATCGCGA CG G G G CTAAAGTG CATCTCG G CACCCG CCCAACAG AG AAACAGTACG AAACCCTG G AAAATCAG CTCG CGTTCCT GTGTCAG CAAG G CTTCTCCCTG G AG AACG CACTGTACG CTCTGTCCGCCGTGGG CCACTTTACACTG G G CTG CGTA TTGGAGGAACAGGAGCATCAAGTAGCAAAAGAGGAAAGAGAGACACCTACCACCGATTCT ATGCCCCCACTTCTG AAACAAGCAATTGAGCTGTTCGACCGGCAGGGAGCCGAACCTGCCTTCCTTTTCGGCCTG GAACTAATCATATGTG GCCTGGAGAAACAGCTAAAGTGCGAAAGCGGCGGGCCGACCGACGCCCTTGACGATTTTG ACTTAGACATGCTCC CAGCCGATGCCCTTGACGACTTTGACCTTGATATGCTGCCTGCTGACGCTCTTGACGATT TTGACCTTGACATGCTCC CCGGGTAATGATCGAGACCGGTACCTC

Brique BGHpA Bsal B (SEQ ID NO : 39)

Brique pTRE3G Bsal A (SEQ ID NO : 60) GAGGTACCGGTCTCATTCGCTTTCGTCTTCAAGAATTCCTGGAGTTTACTCCCTATCAGT GATAGAGAACGTATGAA GAGTTTACTCCCTATCAGTGATAGAGAACGTATGCAGACTTTACTCCCTATCAGTGATAG AGAACGTATAAGGAGT TTACTCCCTATCAGTGATAGAGAACGTATGACCAGTTTACTCCCTATCAGTGATAGAGAA CGTATCTACAGTTTACT CCCTATCAGTGATAGAGAACGTATATCCAGTTTACTCCCTATCAGTGATAGAGAACGTAT AAGCTTTAGGCGTGTAC GGTGGGCG CCTATAAAAG CAG AG CTCGTTTAGTG AACCGTCAG ATCG CCTG G AG CAATTCCACAACACTTTTGTCT TATACCAACTTTCCGTACCACTTCCTACCCTCGTAAACCAGCGAGACCGGTACCTC

Brique mB3Galt6 Bsal A (SEQ ID NO : 61)

CCAGATGAAGGTATTCCGGCGCGCTTGGCGGCACCGGGTGGCGCTGGGCCTAGGCGGCCT GGCGTTCTGCGGCA CCACTCTGTTGTACCTGGCGCGCTGCGCTTCCGAGGGCGAGACGCC TCCG TTCCGGAGCCGCTCGGCCCCGCGC TAAGGCCTTCCTGGCGGTGCTGGTGGCCAGTGCGCCCCGCGCGGTCGAGCGCCGCACCGC AGTGCGCAGCACGTG GCTGGCACCGGAGAGGCGTGGCGGACCCGAGGACGTGTGGGCGCG TTCGCCGTGGGCACTGGCGG TTAGGCT CGGAGGAGCGGCGCGCT TTGAGCTCGAGCAGGCGCAGCACGGGGACCTGCTG TGCTGCCCGCC TGCGCGAC GCCTACGAGAACCTCACGGCCAAGGTCCTGGCCATGCTGACCTGGCTGGATGAGCGCGTG GACTTCGAGTTCGTG CTCAAGGCGGACGACGACTCCTTTGCGCGCCTGGACGCTATCCTGGTGGACCTACGCGCA CGGGAGCCCGCACGC CG CCG G CG CCTCTACTG G G G CTTCTTTTCCG GGCGCGGGCG CGTCAAG CCGGGAGGTCG CTG G CG AG AAG CAG CC TG G CAACTCTG CG ACTA TAC TG CCCTACG CGTTG GGCGGTGG CTATGTCCTTTCTG CG G ACCTG GTG CATTACCT GCGCCTCAGCCGCGAGTACCTGCGCGCGTGGCACAGTGAAGACGTATCGCTGGGCACCTG GCTGGCACCAGTGGA TGTGCAACGGGAGCACGACCCACGCTTCGACACGGAGTACAAATCTCGAGGCTGCAACAA TCAGTATCTGGTGAC ACACAAGCAAAGCCCAGAGGACATGTTGGAGAAGCAACAGATGTTGCTGCATGAGGGCCG GTTGTGCAAGCATG AGGTGCAGTTGCGCCTTTCCTATGTCTATGACTGGTCAGCTCCACCCTCCCAGTGCTGCC AGCGCAAGGAGGGCGT TCCCTGACCGC

Brique Tkter Bsal A (SEQ ID NO : 57)

V2 (SEQ ID NO : 62, exemple de vecteur du groupe V2)

TATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAA AGGCCAGCAAAAGG CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCACAAAAATCG ACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCC TGGAAGCTCCCTCGT GCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGG AAGCGTGGCGCTTTCTCA TAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTC AGCCCGACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCACTG G C AGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTT GAAGTGGTGGCCTAA CTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTT CGGAAAAAGAGTTGGT AG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAA AAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAA ACTCACGTTAAGGGAT TTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAG TTTTAAATCAATCTAAAG TATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTC AGCGATCTGTCTATTTC GTTCATCCATAGTTG CCTG ACTCCCCGTCGTGTAG ATAACTACG ATACG G GAG G G CTTACCATCTG GCCCCAGTGCT GCAATGATACCGCGTGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCA GCCGGAAGGGCCGAG CG CAG AAGTG GTCCTG CAACTTT ATCCG CCTCCATCCAGT TATTAATTGTTG CCG G G AAG CTAG AGTAAGTAGTTC G CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTT CATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAA AAG CG GTTAG CTCCTTC G GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCT TACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATT CTGAGAATAGTGTATGC GGCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCAT CATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG TTCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG C CG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG CATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCG AAAAGTG CCAAG G AACCAATTCAGTCG ACTG G ATCCTAGTTATTAATAGTAATCAATTACG G G GTCAT TAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATG G CCCG CCTG G CTG ACCG CCCAACG A CCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTT CCATTGACGTCAATGGG TG G AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTC AATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTA CGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGG ATAGCGGTTTGACTCA CG G G G ATTTCC AAGTCTCCACCCCATTG ACGTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAA ATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGT CTATATAAGCAGAGC TGGTTTAGTGAACCGTCAGATCACTAGTCGACTAGGGATAACAGGGCACCATGTCTAGAC TGGACAAGAGCAAAG TCATAAACTCTGCTCTGGAATTACTCAATGGAGTCGGTATCGAAGGCCTGACGACAAGGA AACTCGCTCAAAAGCT GGGAGTTGAGCAGCCTACCCTGTACTGGCACGTGAAGAACAAGCGGGCCCTGCTCGATGC CCTGCCAATCGAGAT G CTG G ACAG G CATCATACCCACTCCTG CCCCCTG G AAG G CG AGTCATG G CAAG ACTTTCTG CG G AACAACG CCAA GTCATACCG CTGTG CTCTCCTCTCACATCG CGACGGGG CTAAAGTG CATCTCG G CACCCG CCCAACAG AG AAACAG TACGAAACCCTGGAAAATCAGCTCGCGTTCCTGTGTCAGCAAGGCTTCTCCCTGGAGAAC GCACTGTACGCTCTGT CCGCCGTGGGCCACTTTACACTGGGCTGCGTATTGGAGGAACAGGAGCATCAAGTAGCAA AAGAGGAAAGAGAG ACACCTACCACCGATTCTATGCCCCCACTTCTGAAACAAGCAATTGAGCTGTTCGACCGG CAGGGAGCCGAACCTG CCTTCCTTTTCGGCCTGGAACTAATCATATGTGGCCTGGAGAAACAGCTAAAGTGCGAAA GCGGCGGGCCGACCG ACGCCCTTGACGATTTTGACTTAGACATGCTCCCAGCCGATGCCCTTGACGACTTTGACC TTGATATGCTGCCTGCT GACGCTCTTGACGATTTTGACCTTGACATGCTCCCCGGGTAATGATCGACTGTGCCTTCT AGTTGCCAGCCATCTGT TGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTC CTAATAAAATGAGGAAAT TG CATCG CATTGTCTG AGTAG GTGTCATT TATTCTG GGGGGTGGGGTGGGG CAG G ACAG CAAG G G G GAG GATT G G GAG G ACAATAG CAG G CATG CTGGGGATGCGGTGGG CTCTATG G CTTCG CTTTCGTCTTCAAG AATTCCTG G AG TTTACTCCCTATCAGTGATAGAGAACGTATGAAGAGTTTACTCCCTATCAGTGATAGAGA ACGTATGCAGACTTTAC TCCCTATCAGTGATAGAGAACGTATAAGGAGTTTACTCCCTATCAGTGATAGAGAACGTA TGACCAGTTTACTCCCT ATCAGTGATAGAGAACGTATCTACAGTTTACTCCCTATCAGTGATAGAGAACGTATATCC AGTTTACTCCCTATCAG TG ATAG AG AACGTATAAG CTTTAG GCGTGTACGGTGGGCG CCTATAAAAG CAG AG CTCGTTTAGTG AACCGTCAG ATCGCCTGGAGCAATTCCACAACACTTTTGTCTTATACCAACTTTCCGTACCACTTCCTA CCCTCGTAAACCAGAGCA TG AAG GTATTCCG G CG CG CTTG GCGGCACCGGGTGGCG TGGG CCTAG G CG G CCTG G CGTTCTG CG G CACCACTC TGTTGTACCTGGCGCGCTGCGCTTCCGAGGGCGAGACGCCCTCCGCTTCCGGAGCCGCTC GGCCCCGCGCTAAGG CCTTCCTGGCGGTG TGGTGGCCAGTGCGCCCCGCGCGGTCGAGCGCCGCACCGCAGTGCGCAGCACGTGGCTGG CACCGGAGAGGCGTGGCGGACCCGAGGACGTGTGGGCGCGCTTCGCCGTGGGCACTGGCG GCTTAGGCTCGGAG GAGCGGCGCGCTCTTGAGCTCGAGCAGGCGCAGCACGGGGACCTGCTGCTGCTGCCCGCC CTGCGCGACGCCTAC GAGAACCTCACGGCCAAGGTCCTGGCCATGCTGACCTGGCTGGATGAGCGCGTGGACTTC GAGTTCGTGCTCAAG GCGGACGACGACTCCTTTGCGCGCCTGGACGCTATCCTGGTGGACCTACGCGCACGGGAG CCCGCACGCCGCCGG CGCCTCTACTGGGGCTTCTTTTCCGGGCGCGGGCGCGTCAAGCCGGGAGGTCGCTGGCGA GAAGCAGCCTGGCAA CTCTG CG ACTACTACCTG CCCTACG CGTTGGGCGGTGG CTATGTCCTTTCTG CGGACCTGGTG CATTACCTG CG CCT CAGCCGCGAGTACCTGCGCGCGTGGCACAGTGAAGACGTATCGCTGGGCACCTGGCTGGC ACCAGTGGATGTGCA ACGGGAGCACGACCCACGCTTCGACACGGAGTACAAATCTCGAGGCTGCAACAATCAGTA TCTGGTGACACACAA GCAAAGCCCAGAGGACATGTTGGAGAAGCAACAGATGTTGCTGCATGAGGGCCGGTTGTG CAAGCATGAGGTGC AACTTCG CCTTTCCTATGTCTATG ACTG GTCAG CTCCACCCTCCCAGTG CTG CCAG CG CAAG GAG G G CGTTCCCTG A TGTCACCGCGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAACCCGCG CTATGACGGCAATA AAAAG ACAG AATAAAACG CACG GTGTTG G GTCGTTTGTTCATAAACG CG G G GTTCG GTCCCAG G G CTG G CACTCT GTCG ATACCCCACCG AG G CCCCATTG G G G CCAATACG CCCG CGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTC G G GTG AAG G CCCAG G G CTCG CAG CCAACGTCG G G G CG G CAG G CCCTG CCATAG CC

L'analyse de restriction par triple digestion Ndel, Sal i, Xhol de la réalisation 6 est illustrée figure 16. Vérification fonctionnelle de la réalisation 6 : des cellules eucaryotes (ex : cellules cancéreuses mammaires de souris 4T1) sont transfectées avec le vecteur V2 selon un protocole usuel (exemple lipotransfection ou électroporation). Après transfection les cellules sont traitées avec de 100-1000 ng.mL "1 de Doxycycline pendant 24 à 48 heures. Les cellules sont ensuite collectées et lysées pour en extraire les ARN totaux puis générer des ADN complémentaires (ADNc) par transcription inverse selon un protocole usuel. Ces ADNc sont ensuite utilisés comme matrice pour une analyse en PCR quantitative selon un protocole usuel. Conditions spécifiques de la PCR quantitative:

40 cycles des trois éta pes suivantes sont réalisés : dénatu ration 94°C-30s ; hybridation 60°C-30s ; extension 72°C-30s.

Amorces utilisées:

BETA3Ga lt6ms2-s ACCACTCTGTTGTACCTGGC (SEQ ID NO : 42).

BETA3Ga !t6ms2-as CACACGTCCTCG G GTCC (SEQ I D NO : 43).

Réalisation 7

Groupe de vecteurs V3 : Vecteur permettant de réaliser de la complémentation génétique sous contrôle inductible.

U l + U2f + U2c +U2g

U l : Unité fonctionnelle bactérienne

U2f = gène dont le promoteur est un promoteur à ARN polymérase II I et dont le produit d'expression est un petit ARN en épingle à cheveux (shRNA) précurseur d'un petit ARN interférant ciblant un gène X. U2c = gène codant un transactivateur transcriptionel (exemple : protéine TAT du VIH-1 ou-2).

U2g = gène dont le promoteur est dépendant du transactivateur codé par le gène U2c et dont le produit d'expression est une version mutée du produit du gène X de sorte à être insensible au produit du gène U2f

Exemple : Vecteur permettant de réprimer l'expression de l'enzyme mB3Galt6 tout en surexprimant de façon inductible l'expression de cette enzyme (complémentation possible). U l ori-Amp

U2c promoteur CMV

Teton3G

Terminateur BPA

U2g promoteur TRE3G

mB3Galt6 - muté

HSV Tk terminator

U2f cassette shRNA mB3GALT6

Liste des briques utilisées pour la construction du vecteur V3 (figure 17)

Brique Qri-AmpR Bsaî B (SEQ ID NO : 36)

Brique pCSVlV Bsaî B (SEQ ID NO : 37)

Brique T03G Bsa! A (SEQ ID NO : 59)

Brique BGH A Bsai B (SEQ ID NO : 39)

Brique pTF G Bsaî A (SEQ ID NO : 60)

Brique mB3GaitS Bsai B (SEQ ID NO : 63)

G AG GTACCG GTCTCACCAG AG CATG AAG GTATTCCG G CG CG CTTG GCGGCACCGGGTGGCGCTGGG CCTAG G CG G CCTG GCGTTCTGCGG CACCACTCTGTTGTACCTG GCGCGCTGCG CTTCCG AG GGCGAGACG CCCTCCG CTTCCG G AGCCG TCGGCCCCGCG TAAGGCCTTCCTGGCGGTG rGGTGGCCAGTGCGCCCCGCGCGGTCGAGCGCCGCAC CGCAGTGCGCAGCACGTGGCTGGCACCGGAGAGGCGTGGCGGACCCGAGGACGTGTGGGC GCGCTTCGCCGTG G G CACTG G CG G CTTAG GCTCGGAGGAGCGGCGCG CTCTTG AG CTCG AG CAG GCGCAGCACGG G G ACCTG TG CT GCTGCCCGCCCTGCGCGACGCCTACGAGAACCTCACGGCCAAGGTCCTGGCCATGCTGAC CTGGCTGGATGAGCG CGTGGACTTCGAGTTCGTGCTCAAGGCGGACGACGACTCCTTTGCGCGCCTGGACGCTAT CCTGGTGGACCTACGC GCACGGGAGCCCGCACGCCGCCGGCG CCTCTACTG G G G CTTCTTTTCCG G G CG CG G G CG CGTCAAG CCGGGAGGT CG CTG G CG AG AAG CAG CCTG G CAACTCTG CG ACTACTACCTG CCCTACG CGTTG GGCGGTGG CTATGTCCTTTCTG CGGACCTGGTG CATTACCTG CGCCTCAGCCG CG AGTACCTG CG CG CGTG G CACAGTG AAG ACGTATCG CTG G G CA CCTGGCTGGCACCAGTGGATGTGCAACGGGAGCACGACCCACGCTTCGACACGGAGTACA AATCTCGAGGCTGCA ACAATCAGTATCTGGTGACACACAAGCAAAGCCCAGAGGACATGTTGGAGAAGCAACAGA TGTTGCTGCATGAGG G CCG GTTGTG CAAG CATG AG GTG CAACTTCG CCTTTCCTATGTCTATG ACTG GTCAGCTCCACCCTCCCAGTGCTGC CAGCGCAAGGAGGGCGTTCCCTGATGTCACCGCCGAGACCGGTACCTC Brique Tkter Bsal B (SEQ ID NO : 64)

GAGGTACCGGTCTCACCGCGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAA GGAACCCGCGCTAT G ACG G CAATAAAAAG ACAG AATAAAACG CACG GTGTTG G GTCGTTTGTTCATAAACG CGGGGTTCGGTCCCAGGG CTG G CACTCTGTCG ATACCCCACCG AG G CCCCATTG G G G CCAATACG CCCG CGTTTCTTCCTTTTCCCCACCCCACCC CCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCAT AGCCACAACGAGAC CGGTACCTC

Brique shB3Gait8 Bsaî C (SEQ ID NO : 65)

GAGGTACCGGTCTCAACAAACAGGGTCGACAAGCTTTTCCAAAAAAAAAGCATGAGG TGCAGTTGCGCCTTTCCTA TCTCTTG AÂTAG G AAAG G CG CAACTG CACCTCATG CTG G ATCCCG CGTCCTTTCCACA AG ATATATA AACCCAAG A A ATCGAAATACTTTCAAGTÎACGGTAAGCAÏAÏGATAGTCCATTTTAAAACATAATTT ÎAAAACTGCAAACTACCCAA GAAATTATTACTTTCTACGTCACGTATTTTGTACTAATATCTTTGTGTTTACAGTCAAAT TAATTCTAATTATCTCTCTA ACAGCCTTGTATCGTATATGCAAATATGAAGGAATCATGGGAAATAGGCCCTCTTCCTGC CCGACCTTGGCGCGCG CTCGGCGCGCGGTCACGCTCCGTCACGTGGTGCGTTTTGTATTCGAGACCGGTACCTC

V3 (SEQ ID NO : 66, exemple de vecteur du groupe V3)

TATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAA AGGCCAGCAAAAGGC CAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG GCTCCGCCCCCCTGACGAG CATCACAAAAATCG AC GCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTG GAAGCTCCCTCGTGCG CTCTC TGTTCCG ACC TG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG GGAAGCGTGGCG CTTTCTCATAG C TCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCAC GAACCCCCCGTTCAGCC CGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTT ATCGCCACTGGCAGCAG CCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGT GGTGGCCTAACTACGG CTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAA AAGAGTTGGTAGCTCTT G ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAAAG G ATC TCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACG TTAAGGGATTTTGGTCA TGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAAT CAATCTAAAGTATATATG AGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCT GTCTATTTCGTTCATCCA TAGTTG CCTG ACTCCCCGTCGTGTAG ATAACTACG ATACG G GAG G G CTTACCATCTG GCCCCAGTGCTG CAATG ATA CCGCGTGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGG GCCGAGCGCAGAAGTG GTCCTG CAACTTTATCCG CCTCCATCCAGTCTATTAATTGTTG CCG G G AAG CTAG AGTAAGTAGTTCG CCAGTTAATA GTTTG CG CAACGTTGTTG CCATTG TACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAA AAG CG GTTAG CTCCTTCG GTCCTCCG ATC GTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCT TTA TGTCATG CCA TCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT ATGCGGCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCATCATTG G AAA ACGTT CTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCA CTCGTGCACCCAACTGA TCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG CCG CAAAAAAG G G AAT AAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG CATTTATCAG G GTTATTGTCTC ATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACA TTTCCCCGAAAAGTGCC AAG G AACCAATTCAGTCG ACTG G ATCCTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATAT GGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCC CCGCCCATTGACGTCAA T AATG ACGTATGTTCCCATAGTAACG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAACT G CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG C CTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTACGTATTAGTCATCG CTATTACC ATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGA TTTCCAAGTCTCCACCC CATTG ACGTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAACTCCG CCCCATT GACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGT GAACCGTCAGATCAC TAGTCGACTAGGGATAACAGGGCACCATGTCTAGACTGGACAAGAGCAAAGTCATAAACT CTGCTCTGGAATTACTC AATGGAGTCGGTATCGAAGGCCTGACGACAAGGAAACTCGCTCAAAAGCTGGGAGTTGAG CAGCCTACCCTGTACT G G CACGTG AAG AACAAG CGGGCCCTGCTCGATG CCCTG CCAATCG AG ATG CTG G ACAG G CATCATACCCACTCCTG CCCCCTG G AAG G CG AGTCATG G CAAG ACTTTCTG CG G AACAACG CCAAGTCATACCG CTGTG CTCTCCTCTCACATC GCGACGGGG CTAAAGTG CATCTCG G CACCCG CCCAACAG AG AAACAGTACG AAACCCTG G AAAATCAG CTCG CGTT CCTGTGTCAG CAAG G CTTCTCCCTG G AG AACG CACTGTACG CTCTGTCCG CCGTG G G CCACTTTACACTG G G CTG CG TATTGGAGGAACAGGAGCATCAAGTAGCAAAAGAGGAAAGAGAGACACCTACCACCGATT CTATGCCCCCACTTCT GAAACAAGCAATTGAGCTGTTCGACCGGCAGGGAGCCGAACCTGCCTTCCTTTTCGGCCT GGAACTAATCATATGTG GCCTGGAGAAACAGCTAAAGTGCGAAAGCGGCGGGCCGACCGACGCCCTTGACGATTTTG ACTTAGACATGCTCCC AGCCGATGCCCTTGACGACTTTGACCTTGATATGCTGCCTGCTGACGCTCTTGACGATTT TGACCTTGACATGCTCCC CGGGTAATGATCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGT GCCTTCCTTGACCCTGGA AG GTG CCACTCCCACTGTCCTTTCCTAATAAAATG AG G AAATTG CATCG CATTGTCTG AGTAG GTGTCATTCTATTCT GGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCAGGCATGC TGGGGATGCGGT GGGCTCTATGGCTTCGCTTTCGTCTTCAAGAATTCCTGGAGTTTACTCCCTATCAGTGAT AGAGAACGTATGAAGAGT TTACTCCCTATCAGTGATAGAGAACGTATGCAGACTTTACTCCCTATCAGTGATAGAGAA CGTATAAGGAGTTTACTC CCTATCAGTGATAGAGAACGTATGACCAGTTTACTCCCTATCAGTGATAGAGAACGTATC TACAGTTTACTCCCTATC AGTGATAGAGAACGTATATCCAGTTTACTCCCTATCAGTGATAGAGAACGTATAAGCTTT AGGCGTGTACGGTGGGC GCCTATAAAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGCAATTCCACAACA CTTTTGTCTTATACCAAC TTTCCGTACCACTTCCTACCCTCGTAAACCAG AGCATG AAG GTATTCCG G CG CG CTTG G CG G CACCG GGTGGCGCTG G G CCTAG G CG G CCTG GCGTTCTGCGG CACCACT TGTTGTACCTG GCGCG TGCG CTTCCG AG GGCGAGACG CCCT CCG CTTCCG G AG CCG CTCG G CCCCG CG CTAAG G CCTTCCTG GCGGTGCTGGTGGCCAGTGCGCCCCGCGCGGTCGA GCGCCGCACCGCAGTGCGCAGCACGTGGCTGGCACCGGAGAGGCGTGGCGGACCCGAGGA CGTGTGGGCGCGCT TCGCCGTGGGCACTGGCGGCTTAGGCTCGGAGGAGCGGCGCGCTCTTGAGCTCGAGCAGG CGCAGCACGGGGACC TGCTGCTGCTGCCCGCCCTGCGCGACGCCTACGAGAACCTCACGGCCAAGGTCCTGGCCA TGCTGACCTGGCTGGAT GAGCGCGTGGACTTCGAGTTCGTGCTCAAGGCGGACGACGACTCCTTTGCGCGCCTGGAC GCTATCCTGGTGGACC T ACG CG CACG GGAGCCCGCACGCCGCCGGCG CCTCTACTG G G G CTTCTTTTCCG GGCGCGGGCG CGTCAAG CCG G G AG GTCG CTG GCGAGAAGCAGCCTGG CAACTCTG CG ACTACTACCTG CCCTACG CGTTGGGCGGTGG CTATGTCCTTT CTGCGGACCTGGTGCATTACCTGCGCCTCAGCCGCGAGTACCTGCGCGCGTGGCACAGTG AAGACGTATCGCTGGG CACCTGGCTGGCACCAGTGGATGTGCAACGGGAGCACGACCCACGCTTCGACACGGAGTA CAAATCTCGAGGCTGC AACAATCAGTATCTGGTGACACACAAGCAAAGCCCAGAGGACATGTTGGAGAAGCAACAG ATGTTGCTGCATGAG GGCCGGTTGTG CAAG CATG AG GTG CAACTTCG CCTTTCCTATGTCTATG ACTG GTCAG CTCCACCCTCCCAGTG CTG C CAGCGCAAGGAGGGCGTTCCCTGATGTCACCGCGGGGGAGGCTAACTGAAACACGGAAGG AGACAATACCGGAA GGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGTGTTGGGTCGTTT GTTCATAAACGCGGG GTTCG GTCCCAG G G CTG G CACTCTGTCG ATACCCCACCG AG G CCCCATTG G G G CCAATACG CCCG CGTTTCTTCCTTT TCCCCACCCCACCCCCCAAGTTCG G GTG AAG G CCCAG G G CTCG CAG CCAACGTCG GGGCGGCAGG CCCTG CCATAG CCACAAACAG G GTCG ACAAG CTTTTCCAAAAAAAAAG CATG AG GTG CAGTTG CG CCTTTCCTATCTCTTG AATAG G A AAG G CG CAACTG CACCTCATG CTG G ATCCCG CGTCCTTTCCACAAG ATATATAAACCCAAG AAATCG AAATACTTTCA AGTTACG GTAAG CATATG ATAGTCCATTTTAAAACATAATTTTAAAACTG CAAACTACCCAAG AAATTATTACTTTCTA CGTCACGTATTTTGTACTAATATCTTTGTGTTTACAGTCAAATTAATTCTAATTATCTCT CTAACAGCCTTGTATCGTAT ATG CAAATATG AAG G AATCATG G G AAATAG G CCCTCTTCCTG CCCG ACCTTG GCGCGCGCTCGGCGCGCG GTCACG CTCCGTCACGTG GTG CGTTTTG

L'analyse de restriction par triple digestion Ndei, SaH, Xhoi de la reaiisation 7 est illustrée figure 18. Vérification fonctionnelle de la construction N°7: des cellules eucaryotes (ex : cellules cancéreuses mammaires de souris 4T1) sont transfectées avec le vecteur V3 selon un protocole usuel (exemple par lipotransfection ou électroporation). Après transfection les cellules sont traitées ou non avec de 100- 1000 ng.mL "1 de Doxycycline pendant 24 à 48 heures. Les cellules sont ensuite collectées lysées pour en extraire les ARN totaux puis générer des ADN complémentaires (ADNc) par transcription inverse selon un protocole usuel. Ces ADNc sont ensuite utilisés comme matrice pour une analyse en PCR quantitative selon un protocole usuel.

Conditions spécifiques de la PCR quantitative:

40 cycles des trois éta pes suivantes sont réalisés : dénatu ration 94°C-30s ; hybridation 60°C-30s ; extension 72°C-30s. Amorces utilisées:

BETA3Ga !t6ms2-s ACCACTCTGTTGTACCTGGC (SEQ ID NO : 42).

BETA3Ga !t6ms2-as CACACGTCCTCGGGTCC (SEQ I D NO : 43).

Réalisation 8

V2b (appartient au groupe de vecteurs V2) : Vecteur permettant d'exprimer un ou plusieurs transgènes de façon inductible. V2b se distingue de V2 par la structuration de son unité fonctionnelle bactérienne en deux briques au lieu d'une.

U l + U2c + nxU2d + mxU2e

U l : Unité fonctionnelle bactérienne

U2c = gène codant un transactivateur transcriptionel.

U2d = gène(s) dont le promoteur est dépendant du transactivateur codé par le gène U2c, n >1

U2e = gène(s) dont le promoteur n'est pas dépendant du transactivateur codé par le gène U2c, m >0 Exemple : vecteur permettant l'expression inductible de l'enzyme mB3Ga lt6

U l ori-Amp

U2c promoteur CMV

Teton3G

Terminateur BPA

U2d promoteur TRE3G

mB3Ga lt6

HSV Tk terminator Liste des briques utilisées pour la construction du vecteur V2b (figure 19)

Brique Ori Bsal A (SEQ ID NO : 104)

GAGGTACCGGTCTCATATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGG AAAGAACATGTGAGCAAA AG G CCAG CAAAAG G CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG A G CATCACAAAAATCG ACG CTCAAGTCAG AG GTG G CG AAACCCG ACAG G ACTATAAAG ATACCAG G CGTTTCCCCC TG G AAG CTCCCTCGTG CG CTCTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG G G AA GCGTGGCG CTTTCTCATAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTGGGCTGTGT G CACG AACCCCCCGTTCAG CCCG ACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACAC G ACTTATCG CCACTG G CAG CAG CCACTG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG CTACAG AGTTC TTG AAGTGGTGG CCTAACTACG G CTACACTAG AAG AACAGTATTTG GTATCTG CG CTCTG CTG AAG CCAGTTACCT TCG G AAAAAG AGTTG GTAG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CA GATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGA CGCTCAGTGGAACGAA AACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTT TTAAATTAAAAATGAAG TTTTAAATCAATCTAAAGTATATATGAGTTTTATGAGACCGGTACCTC

Brique AmpR Bsal A (SEQ ID NO : 105)

GAGGTACCGGTCTCTTTTATTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTA TCTCAGCGATCTGTCTA TTTCGTTCATCCATAGTTG CCTG ACTCCCCGTCGTGTAG ATAACTACG ATACG G GAG G G CTTACCATCTG G CCCCAG TG CTG CAATG ATACCG CGTG ACCCACG CTCACCG G CTCCAG ATTTATCAG CAATAAACCAG CCAGCCGGAAGGGCC GAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGG GAAGCTAGAGTAAGTA GTTCG CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTC CTTCG GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATT CTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGT CATTCTGAGAATAGTGT ATG CG G CG ACCG AGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG C TCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGAT CCAGTTCGATGTAACCC ACTCGTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAA TG CCG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG C ATTTATCAG G GTTATTGTCTCATG AG CG G ATACATATTTG AATGTATTTAG AAAAATAAACAAATAG G G GTTCCG C GCACATTTCCCCGAAAAGTGCCAAGGACGAGACCGGTACCTC Brique pCMV Bsal B (SEQ ID NO : 37)

Brique T03G Bsal A (SEQ ID NO : 59)

Brique BGHpA Bsal B (SEQ ID NO : 39)

Brique pTRE3G Bsal A (SEQ ID NO : 60)

Brique mb3Galt6 Bsal B (SEQ ID NO : 63)

Brique Tkter Bsal A (SEQ ID NO : 57)

Vecteur V2b (SEQ ID NO : 149, , exemple de vecteur du groupe V2)

TATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGC AAAAGGCCAGCAAAAGG CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCACAAAAATCG ACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCC TGGAAGCTCCCTCGT GCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGG AAGCGTGGCGCTTTCTCA TAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTC AGCCCGACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCACTG G C AGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTT GAAGTGGTGGCCTAA CTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTT CGGAAAAAGAGTTGGT AG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAA AAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAA ACTCACGTTAAGGGAT TTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAG TTTTAAATCAATCTAAAG T ATATATG AGTTTTATTG GTCTG ACAGTTACCAATG CTTAATCAGTG AG G CACCTATCTCAG CG ATCTGTCTATTTCG TTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACC ATCTGGCCCCAGTGCTG CAATGATACCGCGTGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAG CCGGAAGGGCCGAGC G CAG AAGTG GTCCTG CAACTTTATCCG CCTCCATCCAGTCTATTAATTGTTG CCG G G AAG CTAG AGTAAGTAGTTCG CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTC ATTCAG CTCCG GTTCCCAACGATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCTT ACTGTCATG CCATCCGTAAG ATG CTTTTCTGTG ACTG GTG AGTACTCAACCAAGTCATTCTG AG AATAGTGTATG CG GCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCATC ATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT TCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG C CG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG CATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCG AAAAGTG CCAAG G AACCAATTCAGTCG ACTG G ATCCTAGTTATTAATAGTAATCAATTACG G G GTCAT TAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATG G CCCG CCTG G CTG ACCG CCCAACG A CCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTT CCATTGACGTCAATGGG TG G AGTATTTACG GTAAA TG CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTC AATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTA CGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGG ATAGCGGTTTGACTCA CG G G G ATTTCC AAGTCTCCACCCCATTG ACGTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAA ATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGT CTATATAAGCAGAGC TGGTTTAGTGAACCGTCAGATCACTAGTCGACTAGGGATAACAGGGCACCATGTCTAGAC TGGACAAGAGCAAAG TCATAAACTCTGCTCTGGAATTACTCAATGGAGTCGGTATCGAAGGCCTGACGACAAGGA AACTCGCTCAAAAGCT GGGAGTTGAGCAGCCTACCCTGTACTGGCACGTGAAGAACAAGCGGGCCCTGCTCGATGC CCTGCCAATCGAGAT G CTG G ACAG G CATCATACCCACTCCTG CCCCCTG G AAG G CG AGTCATG G CAAG ACTTTCTG CG G AACAACG CCAA GTCATACCG CTGTG CTCTCCTCTCACATCG CGACGGGG CTAAAGTG CATCTCG G CACCCG CCCAACAG AG AAACAG TACGAAACCCTGGAAAATCAGCTCGCGTTCCTGTGTCAGCAAGGCTTCTCCCTGGAGAAC GCACTGTACGCTCTGT CCGCCGTGGGCCACTTTACACTGGGCTGCGTATTGGAGGAACAGGAGCATCAAGTAGCAA AAGAGGAAAGAGAG ACACCTACCACCGATTCTATGCCCCCACTTCTGAAACAAGCAATTGAGCTGTTCGACCGG CAGGGAGCCGAACCTG CCTTCCTTTTCGGCCTGGAACTAATCATATGTGGCCTGGAGAAACAGCTAAAGTGCGAAA GCGGCGGGCCGACCG ACGCCCTTGACGATTTTGACTTAGACATGCTCCCAGCCGATGCCCTTGACGACTTTGACC TTGATATGCTGCCTGCT GACGCTCTTGACGATTTTGACCTTGACATGCTCCCCGGGTAATGATCGACTGTGCCTTCT AGTTGCCAGCCATCTGT TGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTC CTAATAAAATGAGGAAAT TG CATCG CATTGTCTG AGTAG GTGTCATTCTATTCTG GGGGGTGGGGTGGGG CAG G ACAG CAAG G G G GAG GATT G G GAG G ACAATAG CAG G CATG CTGGGGATGCGGTGGG CTCTATG G CTTCG CTTTCGTCTTCAAG AATTCCTG G AG TTTACTCCCTATCAGTGATAGAGAACGTATGAAGAGTTTACTCCCTATCAGTGATAGAGA ACGTATGCAGACTTTAC TCCCTATCAGTGATAGAGAACGTATAAGGAGTTTACTCCCTATCAGTGATAGAGAACGTA TGACCAGTTTACTCCCT ATCAGTGATAGAGAACGTATCTACAGTTTACTCCCTATCAGTGATAGAGAACGTATATCC AGTTTACTCCCTATCAG TG ATAG AG AACGTATAAG CTTTAG GCGTGTACGGTGGGCG CCTATAAAAG CAG AG CTCGTTTAGTG AACCGTCAG ATCGCCTGGAGCAATTCCACAACACTTTTGTCTTATACCAACTTTCCGTACCACTTCCTA CCCTCGTAAACCAGAGCA TG AAG GTATTCCG G CG CG CTTG GCGGCACCGGGTGGCGCTGGG CCTAG G CG G CCTG G CGTTCTG CG G CACCACTC TGTTGTACCTGGCGCGCTGCGCTTCCGAGGGCGAGACGCCCTCCGCTTCCGGAGCCGCTC GGCCCCGCGCTAAGG CCTTCCTGGCGGTGCTGGTGGCCAGTGCGCCCCGCGCGGTCGAGCGCCGCACCGCAGTGC GCAGCACGTGGCTGG CACCGGAGAGGCGTGGCGGACCCGAGGACGTGTGGGCGCGCTTCGCCGTGGGCACTGGCG GCTTAGGCTCGGAG GAGCGGCGCGCTCTTGAGCTCGAGCAGGCGCAGCACGGGGACCTGCTGCTGCTGCCCGCC CTGCGCGACGCCTAC GAGAACCTCACGGCCAAGGTCCTGGCCATGCTGACCTGGCTGGATGAGCGCGTGGACTTC GAGTTCGTGCTCAAG GCGGACGACGACTCCTTTGCGCGCCTGGACGCTATCCTGGTGGACCTACGCGCACGGGAG CCCGCACGCCGCCGG CGCCTCTACTGGGGCTTCTTTTCCGGGCGCGGGCGCGTCAAGCCGGGAGGTCGCTGGCGA GAAGCAGCCTGGCAA

5 CTCTG CG ACTACTACCTG CCCTACG CGTTGGGCGGTGG CTATGTC TTT TG CGGAC TGGTG CATTACCTG CG CCT CAGCCGCGAGTACCTGCGCGCGTGGCACAGTGAAGACGTATCGCTGGGCACCTGGCTGGC ACCAGTGGATGTGCA ACGGGAGCACGACCCACGCTTCGACACGGAGTACAAATCTCGAGGCTGCAACAATCAGTA TCTGGTGACACACAA GCAAAGCCCAGAGGACATGTTGGAGAAGCAACAGATGTTGCTGCATGAGGGCCGGTTGTG CAAGCATGAGGTGC AACTTCG C TTTCCTATGTCTATG ACTG GTCAG CTCCACCCTCCCAGTG CTG CCAG CG CAAG G AG G G CGTTCCCTG A

10 TGTCACCGCGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAACCCGCG CTATGACGGCAATA AAAAG ACAG AATAAAACG CACG GTGTTG G GTCGTTTGTTCATAAACG CG G G GTTCG GTCCCAG G G CTG G CACTCT GTCG ATACCCCACCG AG G CCCCATTG G G G CCAATACG CCCG CGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTC G G GTG AAG G CCCAG G G CTCG CAG CCAACGTCG G G G CG G CAG G CCCTG CCATAG CC

15 L'Empreinte de restriction par triple digestion (validation structurelle), Ndel, Sal i, Xhol, de la réalisation 8 est illustrée Figure 20.

Vérification fonctionnelle de la réalisation 8 : des cellules eucaryotes (ex : cellules cancéreuses mammaires de souris 4T1) sont transfectées avec le vecteur V2b selon un protocole usuel (exemple

20 lipotransfection ou électroporation). Après transfection les cellules sont traitées avec 100-1000 ng.mL "1 de Doxycycline pendant 24 à 48 heures. Les cellules sont ensuite collectées et lysées pour en extraire les ARN totaux puis générer des ADN complémentaires (ADNc) pa r transcription inverse selon un protocole usuel. Ces ADNc sont ensuite utilisés comme matrice pour une analyse en PCR quantitative selon un protocole usuel. (Figure 21)

25 L'expérience montre que l'expression du transcrit m B3Galt6, codé par le vecteur V2b, est augmentée en cellule 4T1 uniquement en présence de doxocycline, démontrant les présences concomitantes d'un transgène inductible et de son co-activateur dans le vecteur V2b.

Conditions spécifiques de la PCR quantitative:

30 40 cycles des trois éta pes suivantes sont réalisés : dénatu ration 94°C-30s ; hybridation 60°C-30s ; extension 72°C-30s. Amorces utilisées:

BETA3Ga!t6ms2-s ACCACTCTGTTGTACCTGGC (SEQ ID NO : 42).

BETA3Gait6ms2-as C ACACGTCCTCG G GTCC (SEQ I D NO : 43). Réalisation 9

V3b : (appartient au groupe de vecteurs V3) Vecteur permettant de réaliser de la complémentation génétique sous contrôle inductible. V3b se distingue de V3 par la structuration de son unité fonctionnelle bactérienne en deux briques au lieu d'une. U l + U2f + U2c +U2g

U l : Unité fonctionnelle bactérienne

U2f = gène dont le promoteur est un promoteur à ARN polymérase II I et dont le produit d'expression est un petit ARN en épingle à cheveux (shRNA) précurseur d'un petit ARN interférant ciblant un gène X. U2c = gène codant un transactivateur transcriptionel (exemple : protéine TAT du VI H-1 ou-2).

U2g = gène dont le promoteur est dépendant du transactivateu r codé par le gène U2c et dont le produit d'expression est une version mutée du produit du gène X de sorte à être insensible au produit du gène U2f

Exemple : Vecteur permettant de réprimer l'expression de l'enzyme mB3Galt6 tout en surexprimant de façon inductible l'expression de cette enzyme (complémentation possible).

U l Ori

AmpR

U2c promoteur CMV

Teton3G

Terminateur BPA

U2g promoteur TRE3G

mB3Ga lt6 - muté

HSV Tk terminator

U2f cassette sh RNA mB3Ga lt6

Liste des briques utilisées pour la construction du vecteur V3b (figure 22) Brique Ori Bsal A (SEQ ID NO : 104) Brique AmpR Bsal A (SEQ ID NO : 105)

Brique pCMV Bsaî B (SEQ iD : 37)

Brique T03G Bsal A (SEQ ID NO : 59)

Brique BGHpA Bsal B (SEQ ID NO : 39)

Brique pTF G Bsaî A (SEQ ÎD IMO : 60)

Brique mbSGaitS Bsal B (SEQ ÎD HO : 63)

Brique Tkter Bsal B (SEQ ID NO : 64)

Brique shB3GaÊt6 Bsaî C (SEQ ID IMO : 65) Vecteur V3b (SEQ ÎD IMG : 150, exemple de vecteur du groupe V3)

TATTGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAA AGGCCAGCAAAAGG CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCACAAAAATCG ACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCC TGGAAGCTCCCTCGT GCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGG AAGCGTGGCGCTTTCTCA TAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTC AGCCCGACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCACTG G C AGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTT GAAGTGGTGGCCTAA CTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTT CGGAAAAAGAGTTGGT AG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAA AAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAA ACTCACGTTAAGGGAT TTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAG TTTTAAATCAATCTAAAG T ATATATG AGTTTTATTG GTCTG ACAGTTACCAATG CTTAATCAGTG AG G CACCTATCTCAG CG ATCTGTCTATTTCG TTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACC ATCTGGCCCCAGTGCTG CAATGATACCGCGTGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAG CCGGAAGGGCCGAGC G CAG AAGTG GTCCTG CAACTTTATCCG CCTCCATCCAGTCTATTAATTGTTG CCG G G AAG CTAG AGTAAGTAGTTCG CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTC ATTCAG CTCCG GTTCCCAACGATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCTT ACTGTCATG CCATCCGTAAG ATG CTTTTCTGTG ACTG GTG AGTACTCAACCAAGTCATTCTG AG AATAGTGTATG CG GCGACCGAGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCATC ATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT TCGATGTAACCCACTC GTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG C CG CAAAAAAG G G AATAAG G G CG ACACG G AAATGTTG AATACTCATACTCTTCCTTTTTCAATATTATTG AAG CATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCG AAAAGTG CCAAG G AACCAATTCAGTCG ACTG G ATCCTAGTTATTAATAGTAATCAATTACG G G GTCAT TAGTTCATAG CCCATATATG G AGTTCCG CGTTACATAACTTACG GTAAATG G CCCG CCTG G CTG ACCG CCCAACG A CCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTT CCATTGACGTCAATGGG TG G AGTATTTACG GTAAA TG CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTC AATG ACG GTAAATG G CCCG CCTG G CATTATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTA CGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGG ATAGCGGTTTGACTCA CG G G G ATTTCC AAGTCTCCACCCCATTG ACGTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAA ATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGT CTATATAAGCAGAGC TGGTTTAGTGAACCGTCAGATCACTAGTCGACTAGGGATAACAGGGCACCATGTCTAGAC TGGACAAGAGCAAAG TCATAAACTCTGCTCTGGAATTACTCAATGGAGTCGGTATCGAAGGCCTGACGACAAGGA AACTCGCTCAAAAGCT GGGAGTTGAGCAGCCTACCCTGTACTGGCACGTGAAGAACAAGCGGGCCCTGCTCGATGC CCTGCCAATCGAGAT G CTG G ACAG G CATCATACCCACTCCTG CCCCCTG G AAG G CG AGTCATG G CAAG ACTTTCTG CG G AACAACG CCAA GTCATACCG CTGTG CTCTCCTCTCACATCG CGACGGGG CTAAAGTG CATCTCG G CACCCG CCCAACAG AG AAACAG TACGAAACCCTGGAAAATCAGCTCGCGTTCCTGTGTCAGCAAGGCTTCTCCCTGGAGAAC GCACTGTACGCTCTGT CCGCCGTGGGCCACTTTACACTGGGCTGCGTATTGGAGGAACAGGAGCATCAAGTAGCAA AAGAGGAAAGAGAG ACACCTACCACCGATTCTATGCCCCCACTTCTGAAACAAGCAATTGAGCTGTTCGACCGG CAGGGAGCCGAACCTG CCTTCCTTTTCGGCCTGGAACTAATCATATGTGGCCTGGAGAAACAGCTAAAGTGCGAAA GCGGCGGGCCGACCG ACGCCCTTGACGATTTTGACTTAGACATGCTCCCAGCCGATGCCCTTGACGACTTTGACC TTGATATGCTGCCTGCT GACGCTCTTGACGATTTTGACCTTGACATGCTCCCCGGGTAATGATCGACTGTGCCTTCT AGTTGCCAGCCATCTGT TGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTC CTAATAAAATGAGGAAAT TG CATCG CATTGTCTG AGTAG GTGTCATTCTATTCTG GGGGGTGGGGTGGGG CAG G ACAG CAAG G G G GAG GATT G G GAG G ACAATAG CAG G CATG CTGGGGATGCGGTGGG CTCTATG G CTTCG CTTTCGTCTTCAAG AATTCCTG G AG TTTACTCCCTATCAGTGATAGAGAACGTATGAAGAGTTTACTCCCTATCAGTGATAGAGA ACGTATGCAGACTTTAC TCCCTATCAGTGATAGAGAACGTATAAGGAGTTTACTCCCTATCAGTGATAGAGAACGTA TGACCAGTTTACTCCCT ATCAGTGATAGAGAACGTATCTACAGTTTACTCCCTATCAGTGATAGAGAACGTATATCC AGTTTACTCCCTATCAG TG ATAG AG AACGTATAAG CTTTAG GCGTGTACGGTGGGCG CCTATAAAAG CAG AG CTCGTTTAGTG AACCGTCAG ATCGCCTGGAGCAATTCCACAACACTTTTGTCTTATACCAACTTTCCGTACCACTTCCTA CCCTCGTAAACCAGAGCA TG AAG GTATTCCG G CG CG CTTG GCGGCACCGGGTGGCGCTGGG CCTAG G CG G CCTG G CGTTCTG CG G CACCACTC TGTTGTACCTGGCGCGCTGCGCTTCCGAGGGCGAGACGCCCTCCGCTTCCGGAGCCGCTC GGCCCCGCGCTAAGG CCTTCCTGGCGGTGCTGGTGGCCAGTGCGCCCCGCGCGGTCGAGCGCCGCACCGCAGTGC GCAGCACGTGGCTGG CACCGGAGAGGCGTGGCGGACCCGAGGACGTGTGGGCGCGCTTCGCCGTGGGCACTGGCG GCTTAGGCTCGGAG GAGCGGCGCGCTCTTGAGCTCGAGCAGGCGCAGCACGGGGACCTGCTGCTGCTGCCCGCC CTGCGCGACGCCTAC GAGAACCTCACGGCCAAGGTCCTGGCCATGCTGACCTGGCTGGATGAGCGCGTGGACTTC GAGTTCGTGCTCAAG GCGGACGACGACTCCTTTGCGCGCCTGGACGCTATCCTGGTGGACCTACGCGCACGGGAG CCCGCACGCCGCCGG CGCCTCTACTGGGGCTTCTTTTCCGGGCGCGGGCGCGTCAAGCCGGGAGGTCGCTGGCGA GAAGCAGCCTGGCAA CTCTG CG ACTACTACCTG CCCTACG CGTTGGGCGGTGG CTATGTC TTT TG CGGACCTGGTG CATTACCTG CG CCT CAGCCGCGAGTACCTGCGCGCGTGGCACAGTGAAGACGTATCGCTGGGCACCTGGCTGGC ACCAGTGGATGTGCA ACGGGAGCACGACCCACGCTTCGACACGGAGTACAAATCTCGAGGCTGCAACAATCAGTA TCTGGTGACACACAA GCAAAGCCCAGAGGACATGTTGGAGAAGCAACAGATGTTGCTGCATGAGGGCCGGTTGTG CAAGCATGAGGTGC AA TTCG C TTTCCTATGTCTATG ACTG GTCAG CTCCACCCTCCCAGTG CTG CCAG CG CAAG G AG G G CGTTCCCTG A TGTCACCGCGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAACCCGCG CTATGACGGCAATA AAAAG ACAG AATAAAACG CACG GTGTTG G GTCGTTTGTTCATAAACG CG G G GTTCG GTCCCAG G G CTG G CACTCT GTCG ATACCCCACCG AG G CCCCATTG G G G CCAATACG CCCG CGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTC G G GTG AAG G CCCAG G G CTCG CAG CCAACGTCG GGGCGGCAGG CCCTG CCATAG CCACAAACAG G GTCG ACAAG C TTTTCCAAAAAAAAAG CATG AG GTG CAGTTG CG CCTTTCCTATCTCTTG AATAG G AAAG G CG CAACTG CACCTCAT GCTGGATCCCGCGTCCTTTCCACAAGATATATAAACCCAAGAAATCGAAATACTTTCAAG TTACGGTAAGCATATGA TAGTCCATTTTAAAACATAATTTTAAAACTGCAAACTACCCAAGAAATTATTACTTTCTA CGTCACGTATTTTGTACTA ATATCTTTGTGTTTACAGTCAAATTAATTCTAATTATCTCTCTAACAGCCTTGTATCGTA TATGCAAATATGAAGGAA TCATGGGAAATAGGCCCTCTTCCTGCCCGACCTTGGCGCGCGCTCGGCGCGCGGTCACGC TCCGTCACGTGGTGCG TTTTG

L'Empreinte de restriction par triple digestion (validation structurelle), Ndel, Sali, Xhol, de la réalisation 9 est illustrée Figure 23 Réalisation 10

VI. lb : (appartient au groupe de vecteurs VI.1) Vecteur permettant de sélectionner l'intégration des transgènes par recombinaison non homologue dans le génome cible.

Ce vecteur se distingue du vecteur VI.1 par la structuration de son unité fonctionnelle bactérienne en deux briques au lieu d'une.

U 1+ U2 + U3a

U l : Unité fonctionnelle bactérienne U2 : nxU2a + mxU2b, n≥0, m≥0 et n+m≥2

U2a : Unité fonctionnelle d'expression dont le promoteur est dépendant de l'ARN polymerase II et dont le produit d'expression est une protéineU3a : cassette de sélection positive Exemple : Vecteur permettant d'exprimer deux protéines de fusions constituées d'un domaine fluorescent et d'un domaine d'adressage à un compartiment cellulaire spécifique (ici membrane cellulaire et appareil de Golgi).

U l Ori

AmpR

U2a-1 promoteur EFlalpha

protéine de fusion EGFP-CAAX

terminateur BPA

U2a-2 promoteur CMV

domaine N-terminal de protéine de fusion : SiaT

domaine C-terminal de protéine de fusion mCherry

terminateur HSV-TK

U3a Hygomicin résistance Liste des briques utilisées pour la construction du vecteur VI. lb (Figure 24)

Brique Ori Bsal B (SEQ ID NO : 106)

GAGGTACCGGTCTCTATTACGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGA AAGAACATGTGAGCA AAAG G CCAG CAAAAG G CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTGAC GAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGA TACCAGGCGTTTCCC CCTG GAAGCTCCCTCGTGCG CTCTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG G G A AGCGTGGCG CTTTCTCATAG CTCACG CTGTAG GTATCTCAGTTCG GTGTAGGTCGTTCG CTCCAAG CTGGGCTGTG TG CACG AACCCCCCGTTCAG CCCG ACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACAC GACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGC GGTGCTACAGAGTTC TTG AAGTGGTGG CCTAACTACG G CTACACTAG AAG AACAGTATTTG GTATCTG CG CTCTG CTG AAG CCAGTTACCT TCG G AAAAAG AGTTG GTAG CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CA GATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGA CGCTCAGTGGAACGAA AACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTT TTAAATTAAAAATGAAG TTTTAAATCAATCTAAAGTATATATGAGTAAACCGAGACCGGTACCTC Brique AmpR Bsal B (SEQ ID NO : 107)

GAGGTACCGGTCTCAAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTA TCTCAGCGATCTGTCTA TTTCGTTCATCCATAGTTG CCTG ACTCCCCGTCGTGTAG ATAACTACG ATACG G GAG G G CTTACCATCTG G CCCCAG TG CTG CAATG ATACCG CGTG ACCCACG CTCACCG G CTCCAG ATTTATCAG CAATAAACCAG CCAGCCGGAAGGGCC GAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGG GAAGCTAGAGTAAGTA GTTCG CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTGCT ACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTC CTTCG GTC TCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATT CTCTTACTGTCATG CCATCCGTAAG ATG CTTTTCTGTG ACTG GTG AGTACTCAACCAAGTCATTCTG AG AATAGTGT ATG CG G CG ACCG AGTTG TCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG C TCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGAT CCAGTTCGATGTAACCC ACTCGTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAA TGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTT TCAATATTATTGAAGC ATTTATCAG G GTTATTGTCTCATG AG CG G ATACATATTTG AATGTATTTAG AAAAATAAACAAATAG GGGTTCCGC G CACATTTCCCCG AAAAGTG CCAATG CTGAGACCG GTACCTC

Brique pEFlaL Bsal B (SEQ ID NO : 108)

GAGGTACCGGTCTCAATGCGTGAGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGC CCACAGTCCCCGAGA AGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACT GGGAAAGTGATGT CGTGTACTG G CTCCG CCTTTTTCCCG AG G GTG G G G G AG AACCGTATATAAGTG CAGTAGTCG CCGTG AACGTTCTT TTTCG CAACG G GTTTGCCG CCAG AACACAG GTAAGTG CCGTGTGTGGTTCCCGCGGG CCTG G CCTCTTTACG G GTT ATG G CCCTTG CGTG CCTTG A ATT ACTTCCACCTG G CTG CAGTACGTG ATTCTTG ATCCCG AG CTTCG G G TTG G AAGT GGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAG GCCTGGCCTGGGCGC TGGGGCCGCCGCGTG CG AATCTG GTG G C ACCTTCG CG CCTGTCTCG CTG CTTTCG ATAAGTCTCTAG CCATTTAAAA TTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCA AGATCTGCACACTGGTA TTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGG CGAGGCGGGGCCTG CGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTG CCTGGCCTCGCGCCG CCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCG GAAAGATGGCCGCTT CCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGT GAGTCACCCACACA AAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGC GCCGTCCAGGCACCTC GATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCG ATGGAGTTTCCCCACA CTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAAT TTGCCCTTTTTGAGTTT GGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAG GTGTCGTGATATCCGAGA CCGGTACCTC Brique EGFP-CAAX Bsal A (SEQ ID NO : 109)

GAGGTACCGGTCTCCTATCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCC CATCCTGGTCGAGCT GGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCAC CTACGGCAAGCTGA CCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCA CCCTGACCTACGGCGT GCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCAT GCCCGAAGGCTACGTC CAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAG TTCGAGGGCGACACC CTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGG CACAAGCTGGAGTA CAACTACAACAG CCACAACGTCTATATCATG G CCG ACAAG CAG AAG AACG G CATCAAG GTG AACTTCAAG ATCCG CCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCAT CGGCGACGGCCCCGT GCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGA GAAGCGCGATCACAT GGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAA GAAGAAGAAAAAGAA GTCAAAGACAAAGTGTGTAATTATGTAAGAGTGGAGACCGGTACCTC

Brique BGHpA Bsal C (SEQ ID NO : 110)

GAGGTACCGGTCTCAGAGTCG ACTGTG CCTTCTAGTTG CCAG CCATCTGTTGTTTG CCC TCCCCCGTG CCTTCCTTG ACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCAT TGTCTGAGTAGGTGTCA TTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAG CAGGCATGCTGGG GATGCGGTGGGCTCTATGGGTAGCGAGACCGGTACCTC

Brique pCMV Bsal D (SEQ ID NO : 111)

G AG GTACCG GTCTCAGTAGTTATTAATAGTAATCAATTACG G G GTCATT AGTTCATAG CCCATATATG G AGTTCCG C GTTACATAA TTACG GTAAATG G CCCG CCTG G CTG ACCG CCCAACG ACCCCC G CCCATTG ACGTCAATAATG ACGT ATGTTCCCATAGTAACG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAACTG CCCACTTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATT ATG CCCAGTACATG ACCTTATG G G ACTTTCCTACTTG G CAGTACATCTACGTATTAGTCATCG CT ATTACCATG GTG ATG CG GTTTTG G CAGTACATCAATG G G CGTG G ATAG CG GTTTG ACTCACG G G G ATTTCCAAGTCTCCACCCCATTG ACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACA ACTCCGCCCCATTGAC G CAAATG GGCGGTAGGCGTGTACGGTGGGAG GTCTATATAAG CAG AG CTG GTTTAGTG AACCGTCAG ATCTTCG C GAGACCGGTACCTC

Brique SiaT Bsal B (SEQ ID NO : 112)

GAGGTACCGGTCTCCTTCGATGATTCACACCAACCTGAAGAAAAAGTTCAGCTGCTG CGTCCTGGTCTTTCTTCTGT TTGCAGTCATCTGTGTGTGGAAGGAAAAGAAGAAAGGGAGTTACTATGATTCCTTTAAAT TGCAAACCAAGGAATT CCAGGTGTTAAAGAGTCTGGGGAAATTGGCCATGGGGTCTGATTCCCAGTCTGTATCCTC AAGCAGCACCCAGGAC CCCCACAGGGGCCGCCAGACCCTCGGCAGTCTCAGAGGCCTAGCCAAGGCCAAACCAGAG GCCTCCTTCCAGGTG TGGAACAAGGACAGCTCTTCCAAAAACCTTATCCCTAGGCTGCAAAAGGGGTCGGGGGTG ATGAGACCGGTACCT C

Brique mCherry Bsal B (SEQ ID NO : 113)

GAGGTACCGGTCTCAGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTC ATGCGCTTCAAGGT GCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCG CCCCTACGAGGGC ACCCAGACCG CCAAG CTG AAG GTG ACCAAG G GTG G CCCCCTG CCCTTCG CCTG G G ACATC T GTCCCCTCAGTTCA TGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGT CCTTCCCCGAGGGCTT CAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTC CTCCCTGCAGGACG GCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAA TGCAGAAGAAAACCAT GGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGAT CAAGCAGAGGCTGA AGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGC CCGTGCAGCTGCCC GGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATC GTGGAACAGTACGAAC GCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAACCGCTGAGAC CGGTACCTC

Brique TKter Bsal B (SEQ ID NO : 64)

Brique HygroR Bsal D (SEQ ID NO : 114)

G AG GTACCG GTCTCAACAACAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAG TCCCCAG G CTCCCCAG CAG G CAG AAGTATG CAAAG CATG CAT TCAATTAGTCAG CAACCATAGTCCCG CCC TAA CTCCG CCCATCCCG CCCCTAACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG C AGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGG AGGCCTAGGCTTTTGC AAAAAGCTCCCGGGAGCTTGTATATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAG CCTGAACTCACCGCGA CGTCTGTCGAGAAGTTTCTGATCGAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCT CGGAGGGCGAAGAAT CTCGTGCTTTCAGCTTCGATGTAGGAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCG CCGATGGTTTCTACAA AGATCGTTATGTTTATCGGCACTTTGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGA CATTGGGGAATTCAGC GAGAGCCTGACCTATTGCATCTCCCGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCT GAAACCGAACTGCCCG CTGTTCTGCAGCCGGTCGCGGAGGCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGA CGAGCGGGTTCGGCC CATTCGGACCGCAAGGAATCGGTCAATACACTACATGGCGTGATTTCATATGCGCGATTG CTGATCCCCATGTGTAT CACTGGCAAACTGTGATGGACGACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAG CTGATGCTTTGGGCC GAGGACTGCCCCGAAGTCCGGCACCTCGTGCACGCGGATTTCGGCTCCAACAATGTCCTG ACGGACAATGGCCGC ATAACAGCGGTCATTGACTGGAGCGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCC AACATCTTCTTCTGGA GGCCGTGGTTGGCTTGTATGGAGCAGCAGACGCGCTACTTCGAGCGGAGGCATCCGGAGC TTGCAGGATCGCCGC GGCTCCGGG CGTATATG CTCCG CATTG GTCTTG ACCAACT TATCAG AG CTTG GTTG ACG G CAATTTCG ATG ATG C AGCTTGGGCGCAGGGTCGATGCGACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCG TACACAAATCGCCC GCAGAAGCGCGGCCGTCTGGACCGATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACC GACGCCCCAGCACTC GTCCGAGGGCAAAGGAATAGCACGTGCTACGAGATTTCGATTCCACCGCCGCCTTCTATG AAAGGTTGGGCTTCG G A ATCGTTTTCCG G G ACG CCG G CTG G ATG ATCCTCCAG CG CG G G G ATCTC ATG CTG G AGTTCTTCG CCCACCCCAA CTTGTTT ATTG CAG CTTATAATG GTTACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACT G CATTCTAGTTGTG GTTTGTCCAAACTCATCAATGTATCATTACG AG ACCG GTACCTC

VI. lb (SEQ ID NO : 151, exemple de vecteur du groupe VI.1)

CGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAG GCCAGCAAAAGGCC AG G AACCGTAAAAAG GCCGCGTTGCTGG CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCACAAAAATCG AC GCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTG GAAGCTCCCTCGTGC G CTCTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG GGAAGCGTGGCG CTTTCTCATA G CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTCA GCCCGACCGCTGCG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCACTG G CA G CAG CCACTG GTAACAG G ATTAG CAGAGCGAG GTATGTAG G CG GTG CTACAG AGTTCTTG AAGTGGTGG CCTAAC TACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTC GGAAAAAGAGTTGGTA G CTCTTG ATCCG G CAAACAAACCACCG CTG GTAGCG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAA AGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAA CTCACGTTAAGGGATT TTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGT TTTAAATCAATCTAAAGT ATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCA GCGATCTGTCTATTTCG TTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACC ATCTGGCCCCAGTGCTG CAATGATACCGCGTGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAG CCGGAAGGGCCGAGC GCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAG CTAGAGTAAGTAGTTCG CCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCG TCGTTTGGTATGGCTTC ATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTC TCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCTT ACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTC TGAGAATAGTGTATGCG GCGACCGAGTTG CT TTG CCCG G CGTCAATACG G G ATAAT ACCG CG CCACATAG CAG AACTTTAAAAGTGCTCATC ATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT TCGATGTAACCCACTC GTG CACCCAA TG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAA ACAG G AAG G CAAAATG C CGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCA ATATTATTGAAGCATTT ATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAA TAGGGGTTCCGCGCAC ATTTCCCCGAAAAGTGCCAATGCGTGAGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACA TCGCCCACAGTCCCC GAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTA AACTGGGAAAGTG ATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAG TAGTCGCCGTGAACGT T TTTTTCG CAACG G GTTTG CCG CCAG AACACAG GTAAGTG CCGTGTGTGGTTCCCGCGGGCCTGG CCTCTTTACG GGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGAT CCCGAGCTTCGGGTTGG AAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGT TGAGGCCTGGCCTGG GCGCTGGGGCCGCCGCGTG CG AATCTG GTG G CACCTTCGCG CCTGTCTCG TG CTTTCG ATAAGT TCTAG CCATTT AAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGG GCCAAGATCTGCACACT GGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGT TCGGCGAGGCGGGG CCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCT GGTGCCTGGCCTCGC G CCG CCGTGTATCG CCCCGCCCTGGGCGG CAAG G CTG GCCCGGTCGG CACCAGTTG CGTG AG CG G AAAG ATG G C CG CTTCCCG GCC TGCTGCAGGGAG CTCAAAATG G AG G ACG CG G CG CTCG GGAGAGCGGGCGG GTG AGTCACCC ACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTAC CGGGCGCCGTCCAGGC ACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTT ATGCGATGGAGTTTCC CCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTT GGAATTTGCCCTTTTTG AGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCAT TTCAGGTGTCGTGATATC ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGAC GGCGACGTAAACGG CCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCT GAAGTTCATCTGCAC CACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCA GTGCTTCAGCCGCTAC CCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAG GAGCGCACCATCTTCT TCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGG TGAACCGCATCGAG CTG AAG G G CATCG ACTTCAAG G AG G ACG G CAACATCCTG G G G CACAAG CTG G AGTACAACTACAACAG CCACAAC GTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCAC AACATCGAGGACGGC AGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTG CTGCCCGACAACCACT ACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCC TGCTGGAGTTCGTGA CCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGAAGAAGAAAAAGAAGTCAA AGACAAAGTGTGTA ATTATGTAAGAGTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCC GTGCCTTCCTTGACCCTG G AAG GTG CCACTCCCACTGTCCTTTCCTAATAAAATG AG G AAATTG CATCG CATTGT TG AGTAG GTGTCATTCTAT TCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAGGACAATAGCAGGCA TGCTGGGGATGC G GTG G G TCTATG G GTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATAT ATG G AGTTCCG C GTTACATAACTTACG GTAAATG GCCCGC TGGCTGACCG CCCAACG ACCCCCG CCCATTG ACGTCAATAATG ACGT ATGTTCCCATAGTAACG CCAATAG G G ACTTTCCATTG ACGTCAATG G GTG G AGTATTTACG GTAAACTG CCCA TTG G CAGTACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCTG G CATT ATG CCCAGTACATG ACCTTATG G G ACTTTC TACTTG G CAGTACATCTACGTATTAGTCATCG T ATT ACCATG GTG ATG CG GTTTTG G CAGTACATCAATG G G CGTG G ATAG CG GTTTG ACTCACG G G G ATTTCCAAGTCTCCACCCCATTG ACGTCAATG G G AGTTTGTTTTG G CACCAAAATCAACG G G ACTTTCCAAAATGTCGTAACAA TCCG CCCCATTG AC GCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAA CCGTCAGATCTTCGA TG ATTCACACCAACCTG AAG AAAAAGTTCAG CTG CTG CGTCCTG GTCTTTCTTCTGTTTG CAGTCATCTGTGTGTG G AAG G AAAAG AAG AAAG G G AGTTACTATG ATTCCTTTAAATTG CAAACCAAG G AATTCCAG GTGTTAAAG AGTCTG G G G AAATTG G CCATG G G GTCTG ATTCCCAGTCTGTATCCTCAAG CAG CACCCAG G ACCCCCACAG GGGCCGCCAG ACCCTCG G CAGTCTCAG AG G CCTAG CC AAG G CCAAACCAG AG G CCTCCTTCCAG GTGTG G AACAAG G ACAG CTCT TCCAAAAACCTTATCCCTAGGCTGCAAAAGGGGTCGGGGGTGAGCAAGGGCGAGGAGGAT AACATGGCCATCAT CAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGA GATCGAGGGCGAGG GCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCC CCCTGCCCTTCGCCT G G G ACATCCTGTCCCCTCAGTTCATGTACG G CTCCAAG G CCTACGTG A AG CACCCCG CCG ACATCCCCG ACTACTTG AAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGC GTGGTGACCGTGACC CAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAAC TTCCCCTCCGACGGCC CCGTAATGCAGAAGAAAACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGG ACGGCGCCCTGAAG GGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAG ACCACCTACAAGGC CAAG AAGCCCGTGCAGCTGCCCGGCG CCTACAACGTCAACATCAAGTTG G ACATCACCTCCCACAACG AG G ACTAC ACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAG CTGTACAAGTAACCG CGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACG GCAATAAAAAGACA G AATAAAACG CACG GTGTTG G GTCGTTTGTTCATAAACG CGGGGTTCGGTCCCAGGGCTGGCACTCTGTCG ATACC CCACCGAGGCCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCC CCAAGTTCGGGTGAAGG CCCAG G G CTCG CAGCCAACGTCG GGGCGGCAGGCC TG CCATAG ACAACAG G CAG AAGTATG CAAAG CATG CAT CTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCAG G CTCCCCAG CAG G CAG AAGTATG CAAAG CATG CATCTCA ATTAGTCAG CAACCATAGTCCCG CCC TAA TCCG CCCATCCCG CCCCTAACTCCG CCCAGTTCCG CCCATTCTCCG C CCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGC TATTCCAGAAGTAGTGA

5 GGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCCGGGAGCTTGTATATCCATT TTCGGATCTGATCAGCA CGTGATGAAAAAGCCTGAACTCACCGCGACGTCTGTCGAGAAGTTTCTGATCGAAAAGTT CGACAGCGTGTCCGAC CTGATGCAGCTCTCGGAGGGCGAAGAATCTCGTGCTTTCAGCTTCGATGTAGGAGGGCGT GGATATGTCCTGCGG GTAAATAG CTG CG CCG ATG GTTTCTACAAAG ATCGTTATGTTTATCG G CA TTTG CATCG GCCGCGCTCCCG ATTCC GGAAGTGCTTGACATTGGGGAATTCAGCGAGAGCCTGACCTATTGCATCTCCCGCCGTGC ACAGGGTGTCACGTTG

10 CAAG ACTTG CCTG AAACCG AACTG CCCG CTGTT TG CAG CCG GTCG CG G AG G CCATG G ATG CG ATCG CTG CG G CC GATCTTAGCCAGACGAGCGGGTTCGGCCCATTCGGACCGCAAGGAATCGGTCAATACACT ACATGGCGTGATTTCA TATGCGCGATTGCTGATCCCCATGTGTATCACTGGCAAACTGTGATGGACGACACCGTCA GTGCGTCCGTCGCGCA GGCTCTCGATGAGCTGATGCTTTGGGCCGAGGACTGCCCCGAAGTCCGGCACCTCGTGCA CGCGGATTTCGGCTCC AACAATGTCCTG ACG G ACAATG G CCG CATAACAG CG GTCATTG ACTG G AG CG AG G CG ATGTTCG G G G ATTCCCAA

15 TACGAGGTCGCCAACATCTTCTTCTGGAGGCCGTGGTTGGCTTGTATGGAGCAGCAGACG CGCTACTTCGAGCGG AG G CATCCG G AG CTTG CAG G ATCG CCG CG G CTCCG G G CGTATATG CTCCG CATTG GTCTTG ACCAACTCTATCAG A GCTTGGTTGACGGCAATTTCGATGATGCAGCTTGGGCGCAGGGTCGATGCGACGCAATCG TCCGATCCGGAGCCG GGACTGTCGGGCGTACACAAATCGCCCGCAGAAGCGCGGCCGTCTGGACCGATGGCTGTG TAGAAGTACTCGCCG ATAGTGGAAACCGACGCCCCAGCACTCGTCCGAGGGCAAAGGAATAGCACGTGCTACGAG ATTTCGATTCCACCG

20 CCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTTTCCGGGACGCCGGCTGGATGATCC TCCAGCGCGGGGATCT CATG CTG G AGTTCTTCG CCCACCCCAACTTGTTTATTG CAG CTTATAATG GTTACAAATAAAG CAATAG CATCACAA ATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCA ATGTATCATTA

L'Empreinte de restriction par triple digestion (validation structurelle), EcoRV, Pstl, Sea l, de la réalisation 25 10 est illustrée figure 25.

Vérification fonctionnelle de la réalisation 10 : Des cellules eucaryotes (ex : cellules cancéreuses mammaires de souris 4T1) sont transfectées avec le vecteur VI. lb selon un protocole usuel (exemple lipotransfection ou électroporation). Vingt-quatre heures après transfection, les cellules sont observées 30 sous microscope optique à lumièe blanche et fluorescence. (Figure 26)

Les cellules visibles en fluorescence GFP montrent un marquage dessinant les contours membranaires de chaque cellule. Les cellules visibles en fluorescence mCherry montrent un marquage ponctiforme, correspondant à l'appareil de golgi. Lorsque l'on supperpose les marquages GFP et mCherry, toutes les cellules visibles expriment les deux marquages simultanément, les cellules non fluorescentes étant celles qui n'ont pas reçu de vecteur suite à l'électroporation. Ceci démontre bien la co-expression de deux marqueurs fluorescents correctement exprimés dans des compartiments cellulaires d istincts suite à l'introduction d'un vecteur unique dans les cellules.

Réalisation 11

Groupe de vecteurs V4 : Vecteurs permettant de sélectionner des cellules dont le génome a été édité par recombinaison homologue ciblée.

U l + U3b + U3a + U3c

U l : Unité fonctionnelle bactérienne

U3a = cassette de sélection positive

U3b = motif 5' d'une séquence de recombinaison homologue X

U3c = motif 3' de la séquence de recombinaison homologue X

Exemple : vecteur permettant de sélectionner une souche de levure S. cerevisiae dont le gène MN N 10 a été délété

Liste des briques utilisées pour la construction du vecteur V4 (Figure 27) Brique Ori-2 Bsal C (SEQ ID NO : 115)

GAGGTACCGGTCTCTGGGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGA AAGAACATGTGAGC AAAAG G CCAG CAAAAG G CCAG G AACCGTAAAAAG G CCG CGTTG CTG G CGTTTTTCCATAG GCTCCGCCCCCCTGA CGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAG ATACCAGGCGTTTCC CCCTG G AAG CTCCCTCGTG CG CTCTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG G G AAG CGTG G CG CTTTCTCATAG CTCACG CTGTAG GTAT TCAGTTCG GTGTAG GTCGTTCG CTCCAAG TG G G CTGT GTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAG TCCAACCCGGTAAGAC ACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAG GCGGTGCTACAGAGT T TTG AAGTGGTGG CCTAACTACG G TACA TAG AAG AACAGTATTTG GTATCTG CG CTCTG CTG AAG CCAGTTAC CTTCG G AAAAAG AGTTG GTAG CT TTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCT GACGCTCAGTGGAACG AAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCC TTTTAAATTAAAAATGA AGTTTTAAATCAATCTAAAGTATATATGAGTTTAAACTGAGACCGGTACCTC Brique AmpR Bsal C (SEQ ID NO : 116)

GAGGTACCGGTCTCAAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTA TCTCAGCGATCTGTCTA TTTCGTTCATCCATAGTTG CCTG ACTCCCCGTCGTGTAG ATAACTACG ATACG G G AG G G CTTACCATCTG G CCCCAG TG CTG CAATG ATACCG CGTG ACCCACG TCACCG G CTCCAG ATTTATCAG CAATAAACCAG CCAGCCGGAAGGGCC GAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGG GAAGCTAGAGTAAGTA GTTCG CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTC CTTCG GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATT CTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGT CATTCTGAGAATAGTGT ATG CG G CG ACCG AGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG C TCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGAT CCAGTTCGATGTAACCC ACTCGTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAA TGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTT TCAATATTATTGAAGC ATTTATCAG G GTTATTGTCTCATG AG CG G ATACATATTTG AATGTATTTAG AAAAATAAACAAATAG G G GTTCCG C GCACATTTCCCCGAAAAGTGCCAGTGATGAGACCGGTACCTC

Brique MNNIO-Lrec Bsal A (SEQ ID NO : 117)

GAGGTACCGGTCTCTGTGAGTTTAAACATGCATTCAAAGGTCATAATTGCTGCTCTATTT ACAGTCGTCCATAATGA CATTTCTCTTTGATTATTTTCTTGTTTTTTCGCTCTTCTCAAGTGGATGTTACATAACAA ACAAAACAGAAAAAATTGT TTAAATATAAAGTTTAAAAGTTATCTTTG ATTCCG CACCTG AATTTTTG G ATTG AAG G CCAAAG G AG GTTTATCAG G GAGAGAAAAGCTCTCTATTTATTTTTATAAGGAATAATTGTGCATGTACAACTATACAAT TGCGTGAGACCGGTACC TC Brique KanMX Bsal A (SEQ ID NO : 119)

GAGGTACCGGTCTCGTGCGGTACGCTGCAGGTCGACAACCCTTAATATAACTTCGTATAA TGTATGCTATACGAAG TTATTAG GTCTAG AG ATCTGTTTAG CTTG CCTCGTCCCCG CCG G GTCACCCG G CCAG CG ACATG G AG G CCCAG AAT ACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTAC ATTTAGCCCATACATCC CCATGTATAATCATTTG CATCCATACATTTTG ATG GCCGCACGGCG CG AAG CAAAAATTACG G CTCCTCG CTG CAG A CCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCC TGTAGAGAAATATAAA AG GTTAG G ATTTG CCACTG AG GTTCTT TTTCATATACTTCCTTTTAAAATCTTG CTAG G ATACAGTTCTC AC ATCAC ATCCGAACATAAACAACCATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAAT TCCAACATGGATGCTG ATTTATATG G GTATAAATG G G CTCG CG ATAATGTCG G G CAATCAG GTG CG ACAAT TATCG ATTGTATG G G AAG CC CGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGA TGAGATGGTCAGACT AAA TG G TG ACG G AATTTATG CCTCTTCCG ACCATCAAG CATTTTATCCGTACTCCTG ATG ATG CATG GTTACTCAC CACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGA AAATATTGTTGATGCG CTG G CAGTGTTC TG CG CCG GTTG CATTCG ATTC TGTTTGTAATTGTCCTTTTAACAG CG ATCG CGTATTTCGTCTC GCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAG CGTAATGGCTGGCCT GTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTC ACTCATGGTGATTTCTC ACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGT CGGAATCGCAGACCGA TACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAA CGGCTTTTTCAAAAATAT GGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTC TAATCAGTACTGACAATA AAAAGATTCTTGTTTTCAAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTC TATTTTAATCAAATGTTAG CGTGATTTATATTTTTTTTCGCCTCGACATCATCTGCCCAGATGCGAAGTTAAGTGCGCA GAAAGTAATATCATGCG TCAATCGTATGTGAATGCTGGTCGCTATACTGCTGTCGATTCGATACTAACGCCGCCATC CAGTGTCGAAAACGAG CTCTCGAGAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTGAT ATCAGATCCACTAGTGT CGTAG AG ACCG GTACCTC Brique MNNIO-Rrec Bsal A (SEQ ID NO : 118)

GAGGTACCGGTCTCTTCGTAATGGAAGTTATCAATATTGTAAAGAGAAGCATTTACAAGC TTTTATTTTTCTTTTTAA TTTCCACTACTGGTTCTGCTTTAAAATGTTGTTTTATAATTTATGTACATTTAGGCCTAT AGAAGATTCTTTCAATAAT ATGCTACACATTCTTTTATTTTTCCATCATATGTTGGAGTTTATGCCTCCTCGGCAGGAG TTGGGCGGTGCGAAGAG AAG AAAAAG AGTG AAACTAAAAAAAG G AATCTG CCTTTG CATAAGTTCAAAAGTG CAATTTTAGTGTTG G ATTTAA ACG G G A AAAATTG AAATG G CCATCG AAACAATACTTGTAATAAACAAATCAG G CG G ACTAATCTATCAG CG G AATT TTACCAACGACGAACAGAAATTGAACAGCAATGAATACTTAATTCTTGCTAGTACACTGC ACGGTGTATTCGCCATC GCGAGCCAGCTGACTCCGAAGGCATTACAGCTAACTCAACAAACGAACATCGAAAATACC ATCCCATATATACCTT ACGTG G G CATGTCCAG CAATAG G AG CG ATAC AAG AAATG G AG GTG G CAATAACAACAAACACACTAATAATG AAA AACTGGGCAGTTTAAACGGGGAGAGACCGGTACCTC

Vecteur V4 (SEQ ID NO : 152, exemple de vecteur du groupe V4)

CG GTAATACG GTTATCCACAG AATCAG G G G ATAACG CAG G AAAG AACATGTG AG CAAAAG G CCAG CAAAAG G CC AGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAG CATCACAAAAATCGAC GCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTG GAAGCTCCCTCGTGC G CTCTCCTGTTCCG ACCCTG CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG GGAAGCGTGGCG CTTTCTCATA G CTCACG CTGTAG GTATCTCAGTTCG GTGTAG GTCGTTCG CTCCAAG CTG G G CTGTGTG CACG AACCCCCCGTTCA G CCCG ACCG CTG CG CCTTATCCG GTAACTATCGTCTTG AGTCCAACCCG GTAAG ACACG ACTTATCG CCA TG G CA GCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTG AAGTGGTGGCCTAAC T ACG G CTACACTAG AAG AACAGTATTTG GTATCTG CG CTCTG CTG AAG CCAGTTACCTTCG G AAAAAG AGTTG GTA G CTCTTG ATCCG G CAAACAAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAA AGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAA CTCACGTTAAGGGATT TTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGT TTTAAATCAATCTAAAGT ATATATG AGTTAAAACTTG GTCTG ACAGTTACCAATG CTTAATCAGTG AG G CACCTATCTCAG CG ATCTGTCTATTT CGTTCATCCATAGTTG CCTG ACTCCCCGTCGTGTAG ATAACTACG ATACG G GAG G G CTTACCATCTG G CCCCAGTG C TG CAATG ATACCG CGTG ACCCACG CTCACCG G CTCCAG ATTTATCAG CAATAAACCAG CCAG CCGGAAGGGCCGA GCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGA AGCTAGAGTAAGTAGTT CG CCAGTTAATAGTTTG CG CAACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CT TCATTCAG CTCCG GTTCCCAACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAA AAG CG GTTAG CTCCTT CG GTCCTCCG ATCGTTGTCAG AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTC TTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCAT TCTGAGAATAGTGTATG CG G CG ACCG AGTTG CTCTTG CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCA TCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCA GTTCGATGTAACCCACT CGTG CACCCAACTG ATCTTCAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG CCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTC AATATTATTGAAGCATT T ATCAG G GTTATTGTCTCATG AG CG G ATACATATTTG A ATGTATTTAG AAAAATAAACAAATAG G G GTTCCG CG CA CATTTCCCCG AAAAGTG CCAGTG AGTTTAAACATG CATTCAAAG GTCATAATTG CTG CTCTATTTACAGTCGTCCAT AATG ACATTTCTCTTTG ATTATTTTCTTGTTTTTTCG CTCTTCTCAAGTG G ATGTTACATAACAAACAAAACAG AAAA AATTGTTTAAATATAAAGTTTAAAAGTTATCTTTGATTCCGCACCTGAATTTTTGGATTG AAGGCCAAAGGAGGTTT ATCAG G G AG AG AAAAG CTCTCTATTTATTTTTATAAG G AATAATTGTG CATGTACAACTATACAATTG CG GTACG CT GCAGGTCGACAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTC TAGAGATCTGTTTAGCT TGCCTCGTCCCCGCCGGGTCACCCGGCCAGCGACATGGAGGCCCAGAATACCCTCCTTGA CAGTCTTGACGTGCGC AG CTCAG G G GCATG ATGTG A TGTCG CCCGTACATTTAG CCCATACATCCCCATGTATAATCATTTG CATCCATACA TTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCA GGGAAACGCTCCCCT CACAG ACG CGTTG AATTGTCCCCACG CCG CG CCCCTGTAG AG AAATATAAAAG GTTAG G ATTTG CCACTG AG GTTC TTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCACATCCGAA CATAAACAACCATGGGTA AG G AAAAG ACTCACGTTTCG AG G CCG CG ATTAAATTCCAACATG G ATG CTG ATTTATATG G GTATAAATG G G CTCG CGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCGATGCGCC AGAGTTGTTTCTGAAA CATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTG ACGGAATTTATGCCTC TTCCG ACCATCAAG CATTTTATCCGTA TCCTG ATG ATG CATG GTTACTCACCACTG CG ATCCCCG G CAAAACAG CA TTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTG TTCCTGCGCCGGTTGC ATTCG ATTCCTGTTTGTAATTGTC TTTTAACAG CG ATCG CGTATTTCGT TCG CTCAG G CG CAATCACG AATG AATA ACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAG TCTGGAAAGAAATGC ATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATA ACCTTATTTTTGACGAGG GGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATC TTGCCATCCTATGGAA CTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGA TAATCCTGATATGAATAA ATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAATAAAAAGATT CTTGTTTTCAAGAACTTG TCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTTAGCGTGATT TATATTTTTTTTCGCCTCGA CATCAT TG CCCAG ATG CG AAGTTAAGTG CG CAG AAAGTAATATCATG CGTCAATCGTATGTG AATG TG GTCG CT ATACTGCTGTCGATTCGATACTAACGCCGCCATCCAGTGTCGAAAACGAGCTCTCGAGAA CCCTTAATATAACTTCG TATAATGTATGCTATACGAAGTTATTAGGTGATATCAGATCCACTAGTGTCGTAATGGAA GTTATCAATATTGTAAA GAGAAGCATTTACAAGCTTTTATTTTTCTTTTTAATTTCCACTACTGGTTCTGCTTTAAA ATGTTGTTTTATAATTTATG T ACATTTAG G CCTATAG AAG ATT TTTCAATAATATG CTACACATT TTTTATTTTTCCATCATATGTTG G AGTTTATG CCTCCTCGGCAGGAGTTGGGCGGTGCGAAGAGAAGAAAAAGAGTGAAACTAAAAAAAGGA ATCTGCCTTTGCAT AAGTTCAAAAGTG CAATTTTAGTGTTG G ATTTAAACG G G AAAAATTG AAATG G CCATCG AAACAATACTTGTAATA AACAAATCAGGCGGACTAATCTATCAGCGGAATTTTACCAACGACGAACAGAAATTGAAC AGCAATGAATACTTAA TTCTTG TAGTACACTG CACG GTGTATTCG CCATCG CG AG CCAG CTG ACTCCG AAG G CATTACAG T AA TCAACAA ACG AACATCG AAAATACCATCCCATATATACCTTACGTG G G CATGTCCAG CAATAG G AG CG ATACAAG AAATG G A G GTG G CAATAACAACAAACACACTAATAATG AAAAACTG G G CAGTTTAAACG G G G

L'Empreinte de restriction par double digestion (va lidation structurelle), Hind lll et Pmel de la réa lisation 11 est illustrée Figure 28. Vérification fonctionnelle de la réa lisation 11 : Le vecteur V4 a été utilisé pour inactiver le gène MN N10 de la levure pa r recombinaison homologue. Pour cela la cassette de délétion du vecteur a été libérée par digestion avec l'enzyme Pmel et transformée dans une souche de levure BY4741. Des colonies obtenues après 72h de croissance sur milieu sélectif contenant du G418 ont été repiquées et l'invalidation du gène M N N 10 a été vérifiée par PCR. Afin de valider la fonctionnalité de la construction, le profil de migration sur gel natif de l'invertase du mutant MN N 10 ainsi obtenu a été analysé et comparé à celui d'une souche sauvage et à celui d'une souche mutante pmrl, qui présente un sévère défaut de glycosylation.

Comme le montre la figure 29, le profil de migration de l'invertase du mutant MN N10 (piste C) est nettement d ifférent du profil de migration de l'invertase de la souche sauvage (piste B) révélant un défaut de glycosylation de l'enzyme chez le mutant MN N 10. Ce défaut n'est pas aussi sévère que celui observé pour le mutant pmrl (piste A), conformément à ce qui est connu du rôle des produits de ces gènes dans la N-glycosylation. Séquences des Matrices utilisées pour la fabrication des différentes briques de l'invention.

Matrice eZ-Ori-AmpR (SEQ ID NO : 153)

GCGTCTTCTAGGGTTAAGGTTAGTGTAGAGAAGCAACCGAAGATTGAGAAGACATGGCGG TAATACGGTTATCCA CAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGA ACCGTAAAAAGGC CG CGTTG CTG G CGTTTTTCCATAG G CTCCG CCCCCCTG ACG AG CATCACAAAAATCG ACG CTCAAGTCAG AG GTG G CGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGC TCTCCTGTTCCGACCCT G CCG CTTACCG G ATACCTGTCCG CCTTTCTCCCTTCG G G AAG CGTG G CG CTTTCTCATAG CTCACG CTGTAG GTATC TCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGC CCGACCGCTGCGCCTT ATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGC AGCCACTGGTAACAGG ATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTAC GGCTACACTAGAAGA ACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGC TCTTGATCCGGCAAAC AAACCACCG CTG GTAG CG GTTTTTTTGTTTG CAAG CAG CAG ATTACG CG CAG AAAAAAAG G ATCTCAAG AAG ATCC TTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTT GGTCATGAGATTATCAA AAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTA TATATGAGTAAACTTGG TCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGT TCATCCATAGTTGCCTGA CTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCA ATGATACCGCGTGACC CACG CTCACCG G CTCCAG ATTTATCAG CAATAAACCAG CCAG CCG G AAG G G CCG AG CG CAG AAGTG GTCCTG CAA CTTTATCCG CCTCCATCCAGTCTATTAATTGTTG CCG G G AAG TAG AGTAAGTAGTTCG CCAGTTAATAGTTTG CGC AACGTTGTTG CCATTG CTACAG G CATCGTG GTGTCACG CTCGTCGTTTG GTATG G CTTCATTC AG CTCCG GTTCCCA ACG ATCAAG G CG AGTTACATG ATCCCCCATGTTGTG CAAAAAAG CG GTTAG CTCCTTCG GTCCTCCG ATCGTTGTCA G AAGTAAGTTG G CCG CAGTGTTATCACTCATG GTTATG G CAG CACTG CATAATTCTCTTACTGTCATG CCATCCGTA AGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGG CGACCGAGTTGCTCTT G CCCG G CGTCAATACG G G ATAATACCG CG CCACATAG CAG AACTTTAAAAGTG CTCATCATTG G AAAACGTTCTTC G G G G CG AAAACTCTCAAG G ATCTTACCG CTGTTG AG ATCCAGTTCG ATGTAACCCACTCGTG CACCCAACTG ATCTT CAG CATCTTTTACTTTCACCAG CGTTTCTG G GTG AG CAAAAACAG G AAG G CAAAATG CCG CAAAAAAG G G AATAA GGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTT ATCAGGGTTATTGTCTCA TGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACAT TTCCCCGAAAAGTGCC ACCTATGAGACGTGAGGCTAGGGATAGGACGAGAGCATCGGGAACGAGGACTAGCGTCTC A

Matrice BGH polyA (SEQ ID NO : 154):

TCG ACTGTG CCTTCTAGTTG CCAG CCATCTGTTGTTTG CCCCTCCCCCGTG CCTTCCTTG ACCCTG G AAG GTG CCACT CCCACTGTCCTTTCCTAATAAAATG AG G AAATTG CATCG CATTGTCTG AGTAG GTGTCATTCTATTCTG GGGGGTGG GGTGGGGCAGG ACAG CAAG G G G GAG G ATTG G G AG G ACAATAG CAG G CATG CTG G G G ATG CG GTG G G CTCTATG GCTTCTG

Matrice eZ-ElGFP (SEQ ID NO : 155)

ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTG GACGGCGACGTAAACGG CCACAAGTTCAG CGTGTCCGGCGAGGGCGAGGGCGATG CCACCTACG G CAAG CTG ACCCTG AAGTTCATCTG CAC CACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGTCCTACGGCGTGCA GTGCTTCAGCCGCTAC CCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAG GAGCGCACCATCTTCT TCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGG TGAACCGCATCGAG CTG AAG G G CATCG ACTTCAAG G AG G ACG G CAACATCCTG G G G CACAAG CTG G AGTACAACTACAACAG CCACAAC GTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCAC AACATCGAGGACGGC AGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTG CTGCCCGACAACCACT ACCTGAGCTACCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCC TGCTGGAGTTCGTGA CCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAA

Matrice EGFP (SEQ ID NO : 156) ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGAC GGCGACGTAAACGG CCACAAGTTCAG CGTGTCCGGCGAGGGCGAGGGCGATG CCACCTACG G CAAG CTG ACCCTG AAGTTCATCTG CAC CACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCA GTGCTTCAGCCGCTAC CCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAG GAGCGCACCATCTTCT TCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGG TGAACCGCATCGAG CTG AAG G G CATCG ACTTCAAG G AG G ACG G CAACATCCTG G G G CACAAG CTG G AGTACAACTACAACAG CCACAAC GTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCAC AACATCGAGGACGGC AGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTG CTGCCCGACAACCACT ACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCC TGCTGGAGTTCGTGA CCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAA

Matrice ECFP (SEQ ID NO : 157)

ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGAC GGCGACGTAAACGG CCACAAGTTCAG CGTGTCCGGCGAGGGCGAGGGCGATG CCACCTACG G CAAG CTG ACCCTG AAGTTCATCTG CAC CACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTGGGGCGTGCA GTGCTTCAGCCGCTAC CCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAG GAGCGCACCATCTTCT TCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGG TGAACCGCATCGAG CTG AAG G G CATCG ACTTCAAG GAG G ACG G CAACATCCTG G G G CACAAG CTG G AGTACAACTACATCAG CCACAAC GTCTATATCACCGCCGACAAGCAGAAGAACGGCATCAAGGCCAACTTCAAGATCCGCCAC AACATCGAGGACGGC AGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTG CTGCCCGACAACCACT ACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCC TGCTGGAGTTCGTGA CCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTCC

Matrice EYFP (SEQ ID NO : 158)

ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTG GACGGCGACGTAAACGG CCACAAGTTCAG CGTGTCCGGCGAGGGCGAGGGCGATG CCACCTACG G CAAG CTG ACCCTG AAGTTCATCTG CAC CACCG G CAAG CTGCCCGTGCCCTGG CCCACCCTCGTG ACCACCTTCG G CTACG G CCTG CAGTG CTTCG CCCG CTACC CCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGG AGCGCACCATCTTCTT CAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGT GAACCGCATCGAGC TG AAG G G CATCG ACTTCAAG G AG G ACG G CAACATCCTG G G G CACAAG CTG G AGTACAACTACAACAG CCACAAC GTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCAC AACATCGAGGACGGC AGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTG CTGCCCGACAACCACT ACCTGAGCTACCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCC TGCTGGAGTTCGTGA CCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTAC

Matrice mCherry (SEQ ID NO : 159)

ATGGTCGGGGGTGAG CAAG G G CG AG G AG G ATAACATG G CCATCATC AAG G AGTTCATG CG CTTCAAG GTG CACA TGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCT ACGAGGGCACCCA GACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTC CCCTCAGTTCATGTAC G G CTCCAAG G CCTACGTG AAG CACCCCG CCG ACATCCCCG ACTA TTG AAG TGTCCTTCCCCG AG G G CTTCAAGT GGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCC TGCAGGACGGCGAG TTCATCTACAAG GTG AAG CTG CG CG G CACCAACTTCCCCTCCG ACG G CCCCGTAATG CAG AAG AAAACCATG G G CT GGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGC AGAGGCTGAAGCTG AAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTG CAGCTGCCCGGCGC CTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGA ACAGTACGAACGCGCC GAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTGA

Matrice hFUT3 cDNA (SEQ ID NO : 160)

ATG G ATCCCCTG G GTG CAG CCAAG CCACAATG G CCATG G CG CCG CTGTCTG G CCG CACTG CTATTTCAG CTG CTG G TGGCTGTGTGTTTCTTCTCCTACCTGCGTGTGTCCCGAGACGATGCCACTGGATCCCCTA GGGCTCCCAGTGGGTCC TCCCG ACAG G ACACCACTCCCACCCG CCCCACCCTC TG ATC TG CTATG G ACATG G CCTTTCCACATCCCTGTG G CT CTGTCCCGCTGTTCAGAGATGGTGCCCGGCACAGCCGACTGCCACATCACTGCCGACCGC AAGGTGTACCCACAGG CAG ACACG GTCATCGTG CACCACTG G G ATATCATGTCCAACC TAAGTCACG CCTCCCACCTTCCCCG AG G CCG CA GGGGCAGCGCTGGAT TG GTTCAACTTG G AG CCACCCCCTAACTG CCAG CACCTG G AAG CCCTG G ACAG ATACTTC AATCTCACCATGTCCTACCG CAG CG ACTCCG ACATCTTCACG CCCTACG G CTG G CTG GAG CCGTGGTCCGGCCAGC CTG CCCACCCACCG CTCAACCTCTCG G CCAAG ACCG AG CTG GTGGCCTGGG CG GTGTCCAACTG G AAG CCG G ACT CAGCCAGGGTGCGCTACTACCAGAGCCTGCAGGCTCATCTCAAGGTGGACGTGTACGGAC GCTCCCACAAGCCCC TGCCCAAGGGGACCATGATGGAGACGCTGTCCCGGTACAAGTTCTACCTGGCCTTCGAGA ACTCCTTGCACCCCGA CTACATCACCGAGAAGCTGTGGAGGAACGCCCTGGAGGCCTGGGCCGTGCCCGTGGTGCT GGGCCCCAGCAGAA GCAACTACGAGAGGTTCCTGCCACCCGACGCCTTCATCCACGTGGACGACTTCCAGAGCC CCAAGGACCTGGCCCG GTACCTGCAGGAGCTGGACAAGGACCACGCCCGCTACCTGAGCTACTTTCGCTGGCGGGA GACGCTGCGGCCTCG CTCCTTCAGCTGGGCACTGGATTTCTGCAAGGCCTGCTGGAAACTGCAGCAGGAATCCAG GTACCAGACGGTGCG CAG CATAG CG G CTTG GTTCACCTG A Matrice eZ-HygromycinR K7 (SEQ ID NO : 161)

CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCAG GTGTG G AAAGTCCCCAG G CTCCCCAG CAG G CAG AAGTATG CAAAG CATG CATCTCAATTAGTCAG CAACCATAGTCCCG CCCCTAACTCCG CCCATCCCG CCC TA ACTCCG CCCAGTTCCG CCCATTCTCCG CCCCATG G CTG ACTAATTTTTTTTATTTATG CAG AG G CCG AG G CCG CCTCT G CCTCTG AG CTATTCCAG AAGTAGTG AG G AG G CTTTTTTG G AG G CCTAG G TTTTG CAAAAAG CTCCCG G G AG CTT GTATATCCATTTTCGGATCTGATCAGCACGTGATGAAAAAGCCTGAACTCACCGCGACGT CTGTCGAGAAGTTTCT GATCGAAAAGTTCGACAGCGTGTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTCG TGCTTTCAGCTTCGAT GTAGGAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCGCCGATGGTTTCTACAAAGAT CGTTATGTTTATCGGC ACTTTGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAGA GCCTGACCTATTGCAT CTCCCGCCGTGCACAGGGTGTCACGTTGCAAGACTTGCCTGAAACCGAACTGCCCGCTGT TCTGCAGCCGGTCGCG GAGGCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGACGAGCGGGTTCGGCCCATTC GGACCGCAAGGAATC GGTCAATACACTACATGGCGTGATTTCATATGCGCGATTGCTGATCCCCATGTGTATCAC TGGCAAACTGTGATGG ACGACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAGG ACTGCCCCGAAGTCC G G CACCTCGTG CACG CG G ATTTCG G CTCCAACAATGTCCTG ACG G ACAATG G CCG CATAACAG CG GTCATTG A TG GAGCGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCCAACATCTTCTTCTGGAGGCC GTGGTTGGCTTGTATG G AG CAG CAG ACG CG CTACTTCG AG CG G AG G CATCCG G AG CTTG CAG G ATCG CCG CG G CTCCG G G CGTATATG CTC CG CATTG GTCTTG ACCAACTCTATCAG AG CTTG GTTG ACG G CAATTTCG ATG ATG CAG CTTG GGCGCAGGGTCGAT GCGACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCGTACACAAATCGCCCGCAGAA GCGCGGCCGTCTGG ACCGATGGCTGTGTAGAAGTACTCGCCGATAGTGGAAACCGACGCCCCAGCACTCGTCCG AGGGCAAAGGAATAG CACGTGCTACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATC GTTTTCCGGGACGCCG G CTG G ATG ATCCTCCAG CG CG G G G ATCTCATG CTG G AGTTCTTCG CCCACCCCAACTTGTTTATTG CAG CTTATAAT G GTTACAAATAAAG CAATAG CATCACAAATTTCACAAATAAAG CATTTTTTTCACTG CATTCTAGTTGTG GTTTGTCC AAACTCATCAATGTATC Matrice KanMX4 K7 (SEQ ID NO : 162)

GTACGCTGCAGGTCGACAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTA TTAGGTCTAGAGATCTG TTTAGCTTGCCTCGTCCCCGCCGGGTCACCCGGCCAGCGACATGGAGGCCCAGAATACCC TCCTTGACAGTCTTGA CGTG CG CAGCTCAG G G G CATG ATGTG ACTGTCG CCCGTACATTTAG CCCATACATCCCCATGTATAATCATTTG CAT CCATACATTTTG ATG G CCG CACG G CG CG AAG CAAAAATTACG G CTCCTCG CTGCAGACCTGCGAGCAGGG AAACG CTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAG GTTAGGATTTGCCACT GAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCAC ATCCGAACATAAACAACC ATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAATTCCAACATGGATGCTGAT TTATATGGGTATAAAT GGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCG ATGCGCCAGAGTTGT TTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAA ACTGGCTGACGGAAT TTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCA CCACTGCGATCCCCGGCA AAACAG CATTCCAG GTATTAG AAG AATATCCTG ATTCAG GTG AAAATATTGTTG ATG CG CTG G CAGTGTTCCTG CG CCG GTTG CATTCG ATTCCTGTTTGTAATTGTCCTTTTAACAG CG ATCG CGTATTTCGTCTCG CTCAG G CG CAATCACG AATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGT TGAACAAGTCTGGAA AGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTC ACTTGATAACCTTATTTT TGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATA CCAGGATCTTGCCAT CCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATA TGGTATTGATAATCCTGA TATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAAT AAAAAGATTCTTGTTTTC AAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTT AGCGTGATTTATATTTTTTT TCG C TCG ACATCATCTG CCCAG ATG CG AAGTTAAGTG CG CAG AAAGTAATATCATG CGTCAATCGTATGTG AATG CTGGTCGCTATACTGCTGTCGATTCGATACTAACGCCGCCATCCAGTGTCGAAAACGAGC TCTCGAGAACCCTTAAT ATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTGATATCAGATCCACTAGTG

Matrice LacZ (SEQ ID NO : 163)

G CCCAATACG CAAACCG CCTCTCCCCG CGCGTTGGCCG ATTCATTAATG CAG CTG G CACG ACAG GTTTCCCG ACTG G AAAG CGGGCAGTGAGCG CAACG CAATTAATGTG AGTTAG CTCACTCATTAG G CACCCCAG G CTTTACACTTTATG CTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGC TATGACCATGATTACG G ACAG CCTG G CCGTCGTTTTACAACGTCGTG A TG G G AAAACCCTG G CGTTACCCAACTTAATCG CCTTG CAG CAC ATCCCCCTTTCG CCAG CTG G CGTAATAG CGAAGAGGCCCG CACCG ATCG CCCTTCCCAACAGTTG CG CAG CCTG AA TG G CG AATG G CG CCTG ATG CG GTATTTT TCCTTACG CATCTGTG CG GTATTTCACACCG CATATG GTG CACTCTCA GTACAATCTGCTCTGATGCCGCATAGAC Matrice mB3Galt6 cDNA (SEQ ID NO : 164)

ATG AAG GTATTCCG G CG CG CTTG GCGGCACCGGGTGGCGCTGGG CCTAG G CG G CCTG GCGTTCTGCGG CACCACT CTGTTGTACCTGGCGCGCTGCGCTTCCGAGGGCGAGACGCCCTCCGCTTCCGGAGCCGCT CGGCCCCGCGCTAAG GCCTTCCTGGCGGTGCTGGTGGCCAGTGCGCCCCGCGCGGTCGAGCGCCGCACCGCAGTG CGCAGCACGTGGCTG GCACCGGAGAGGCGTGGCGGACCCGAGGACGTGTGGGCGCGCTTCGCCGTGGGCACTGGC GGCTTAGGCTCGGA GGAGCGGCGCGCTCTTGAGCTCGAGCAGGCGCAGCACGGGGACCTGCTGCTGCTGCCCGC CCTGCGCGACGCCTA CGAGAACCTCACGGCCAAGGTCCTGGCCATGCTGACCTGGCTGGATGAGCGCGTGGACTT CGAGTTCGTGCTCAA GGCGGACGACGACTCCTTTGCGCGCCTGGACGCTATCCTGGTGGACCTACGCGCACGGGA GCCCGCACGCCGCCG G CG CCTCTACTG G G G CTTCTTTTCCG G G CG CG G G CG CGTCAAG CCGGGAGGTCGCTGG CG AG AAG CAG CCTG G CA ACTCTG CG ACTA TAC TG CCCTACG CGTTG G G CG GTG G CTATGTCCTTTCTG CG G ACCTG GTG CATTACCTG CG CC TCAGCCGCGAGTACCTGCGCGCGTGGCACAGTGAAGACGTATCGCTGGGCACCTGGCTGG CACCAGTGGATGTGC AACGGGAGCACGACCCACGCTTCGACACGGAGTACAAATCTCGAGGCTGCAACAATCAGT ATCTGGTGACACACA AGCAAAGCCCAGAGGACATGTTGGAGAAGCAACAGATGTTGCTGCATGAGGGCCGGTTGT GCAAGCATGAGGTG CAGTTG CG CCTTTCCTATGTCTATG ACTG GTCAG CTCCACC TCCCAGT G CTG CCAG CG CAAG G AG G G CGTTCCCTG ATGTCA

Matrice eZ-mB3Galt6 cDNA shRNA insensible (SEQ ID NO : 165)

ATG AAG GTATTCCG G CG CG CTTG GCGGCACCGGGTGGCGCTGGG CCTAG G CG G CCTG GCGTTCTGCGG CACCACT CTGTTGTACCTGGCGCGCTGCGCTTCCGAGGGCGAGACGCCCTCCGCTTCCGGAGCCGCT CGGCCCCGCGCTAAG GCCTTCCTGGCGGTGCTGGTGGCCAGTGCGCCCCGCGCGGTCGAGCGCCGCACCGCAGTG CGCAGCACGTGGCTG GCACCGGAGAGGCGTGGCGGACCCGAGGACGTGTGGGCGCGCTTCGCCGTGGGCACTGGC GGCTTAGGCTCGGA GGAGCGGCGCGCTCTTGAGCTCGAGCAGGCGCAGCACGGGGACCTGCTGCTGCTGCCCGC CCTGCGCGACGCCTA CGAGAACCTCACGGCCAAGGTCCTGGCCATGCTGACCTGGCTGGATGAGCGCGTGGACTT CGAGTTCGTGCTCAA GGCGGACGACGACTCCTTTGCGCGCCTGGACGCTATCCTGGTGGACCTACGCGCACGGGA GCCCGCACGCCGCCG G CG CCTCTACTG G G G CTTCTTTTCCG G G CG CG G G CG CGTCAAG CCGGGAGGTCG CTG G CG AG AAG CAG CCTG G CA ACTCTG CG ACTACTACCTG CCCTACG CGTTG G G CG GTG G CTATGTCCTTTCTG CG G ACCTG GTG CATTACCTG CG CC TCAGCCGCGAGTACCTGCGCGCGTGGCACAGTGAAGACGTATCGCTGGGCACCTGGCTGG CACCAGTGGATGTGC AACGGGAGCACGACCCACGCTTCGACACGGAGTACAAATCTCGAGGCTGCAACAATCAGT ATCTGGTGACACACA AGCAAAGCCCAGAGGACATGTTGGAGAAGCAACAGATGTTGCTGCATGAGGGCCGGTTGT GCAAGCATGAGGTG CAACTTCG CCTTTCCTATGTCTATG ACTG GTCAG CTCCACCCTCCCAGTG CTG CCAG CG CAAG GAG G G CGTTCCCTG ATGTCA Matrice Yeast S.cerevisiae MNN10 gene (SEQ ID NO : 166)

AAACATG CATTCAAAG GTCATAATTG CTG CTCTATTTACAGTCGTCCATAATG ACATTTCTCTTTG ATTATTTTCTTGT TTTTTCGCTCTTCTCAAGTGGATGTTACATAACAAACAAAACAGAAAAAATTGTTTAAAT ATAAAGTTTAAAAGTTAT CTTTGATTCCGCACCTGAATTTTTGGATTGAAGGCCAAAGGAGGTTTATCAGGGAGAGAA AAGCTCTCTATTTATTT TTATAAGGAATAATTGTGCATGTACAACTATACAATATGTCTAGTGTACCTTATAATTCC CAACTTCCTATATCCAAC CATCTAGAGTACGATGAAGATGAAAAGAAGAGCAGAGGCTCAAAACTAGGCCTGAAATAT AAAATGATATACTGG AGGAAAACTTTATGCAGTTCGCTAGCGAGATGGAGAAAGCTAATACTATTAATATCTTTA GCTTTGTTTTTATTCAT ATG G AT AAG CG ATTCCACCATAAG CAG AAATCCATCTACCACAAGTTTTCAAG G CCAAAATAGTAACG ATAATAAG TTGAGTAATACTGGTTCTAGCATCAACTCCAAAAGATATGTACCACCATATTCTAAGAGA TCAAGATGGTCGTTTTG GAATCAAGATCCTAGGATTGTCATTATATTAGCGGCAAACGAAGGTGGTGGTGTATTGAG GTGGAAAAATGAGCA AGAATGGGCTATCGAAGGCATATCAATAGAAAATAAGAAGGCCTATGCGAAGAGACATGG ATATGCGTTGACTAT CAAGGATTTGACAACGTCCAAAAGATACTCTCACGAATACAGAGAGGGTTGGCAAAAAGT AGATATATTGAGACA GACGTTCAGGGAGTTTCCTAATGCAGAATGGTTCTGGTGGTTGGACCTGGATACTATGAT AATGGAGCCTTCTAAA TCATTAGAAGAACATATTTTCGACAGATTGGAAACTCTGGCTGACAGAGAATTGAAAAGT TTTAATCCCCTAAACCT AAGAGACGACATACCCTATGTCGATTATTCAGAGGAAATGGAGTTTCTAATAACACAAGA TTGTGGAGGCTTCAAT TTGGGCTCATTTCTGATAAAAAATAGCGAATGGTCTAAGCTGCTTCTAGATATGTGGTGG GACCCCGTTCTGTATGA ACAAAAACATATGGTTTGGGAACATAGAGAACAAGATGCGTTAGAGGCATTATATGAAAA CGAACCGTGGATTCG TTCGAGAATAGGATTTTTGCCCTTAAGAACGATCAATGCATTCCCACCGGGAGCATGCTC TGAATACAGTGGTGAC TCAAGATACTTTTACAGTGAGAAAGACCATGATTTTGTTGTGAATATGGCCGGATGCAAT TTTGGCAGAGATTGCT GGGGCGAGATGCAGTACTACACCACTTTAATGGAAAAACTGAATAGGAAATGGTACACGA GATTTTTCTTCCCATA AAATG G AAGTTATCAATATTGTAAAG AG AAG CATTTACAAG CTTTTATTTTT TTTTTAATTTCCACTACTG GTT TG CTTTAAAATGTTGTTTTATAATTTATGTACATTTAG G CCTAT AG AAG ATT TTTCAATAATATG CTACACATTCTTTTA TTTTTCCATCATATGTTGGAGTTTATGCCTCCTCGGCAGGAGTTGGGCGGTGCGAAGAGA AGAAAAAGAGTGAAA CTAAAAAAAG G AATCTG CCTTTG CATAAGTTCAAAAGTG CAATTTTAGTGTTG G ATTTAAACG G G AAAAATTG AAA TGGCCATCGAAACAATACTTGTAATAAACAAATCAGGCGGACTAATCTATCAGCGGAATT TTACCAACGACGAACA GAAATTGAACAGCAATGAATACTTAATTCTTGCTAGTACACTGCACGGTGTATTCGCCAT CGCGAGCCAGCTGACTC CG AAG G CATTACAG CTAACTCAACAAACG AACATCG AAAATACCATCCCATATATACCTTACGTG G G CATGTCCAG CAATAGGAGCGATACAAGAAATGGAGGTGGCAATAACAACAAACACACTAATAATGAAAA ACTGGGCAGTTT

Matrice promoteur CMV (SEQ ID NO : 167)

ACCAATTCAGTCG ACTG G ATCCTAGTTATTAATAGTAATCAATTACG G G GTCATTAGTTCATAG CCCATATATG G AG TTCCG CGTTACATAACTTACG GTAAATG GCCCGC TGG TGACCG CCCAACG ACCCCCG CCCATTG ACGTCAATAAT GACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTA TTTACGGTAAACTGCC CACTTG G CAGT ACATCAAGTGTATCATATG CCAAGTACG CCCCCTATTG ACGTCAATG ACG GTAAATG G CCCG CCT G G CATTATG CCCAGTACATG ACCTTATG G G ACTTTC TACTTG G CAGTACATCTACGTATTAGTCATCG CTATTACCA TGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGAT TTCCAAGTCTCCACCC CATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCG TAACAACTCCGCCCCAT TGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAG TGAACCGTCAGATCA CTAGTCG ACTAG G G ATAACAG G G CCG C Matrice promoteur EFlalpha, version courte (SEQ ID NO : 168)

AGGAACCAATTCAGTCGACTGGATCCCGATGGCTCCGGTGCCCGTCAGTGGGCAGAGCGC ACATCGCCCACAGTC CCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGG GTAAACTGGGAAA GTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTG CAGTAGTCGCCGTGA ACGTTCTTTTTCG CAACG G GTTTG CCG CCAG AACACAG GTCCG CG G CCCCG A ACT AG G CCTAG G CGTCTG ATCACT AGTG ACTCTAGTCCTAGTCG ACTAG G G ATAACAG G G

Matrice promoteur EFlalpha (SEQ ID NO : 169)

GTGAGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTT GGGGGGAGGGGTCG G CAATTG A ACCG GTG CCTAG AGAAGGTGGCGCGG G GTAAACTG G G AAAGTG ATGTCGTGTACTG G CTCCG CCTTT TTCCCG AG G GTG G G G G AG AACCGTATATAAGTG CAGTAGTCG CCGTG AACGTTCTTTTTCG CAACG G GTTTG CCG C CAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGG CCCTTGCGTGCCTTGA ATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGG TGGGAGAGTTCGAGGC CTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGG GCCGCCGCGTGCGAA TCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATT TTTGATGACCTGCTGCGA CG CTTTTTTTCTG G CAAG ATAGTCTTGTAAATG CG G G CCAAG ATCTG CACACTG GTATTTCG GTTTTTG G G G CCG CG GGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCG CGGCCACCGAGAAT CGGACGGGG GTAGTCTCAAG CTG G CCG G CCTG CTCTG GTG CCTG G CCTCG CG CCG CCGTGTATCG CCCCG CCCTG GGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGG CCCTGCTGCAGGGA GCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGA AAAGGGCCTTTCCG TCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGAT TAGTTCTCGAGCTTTTG GAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGA GTGGGTGGAGACTGA AGTTAG G CCAG CTTG G CACTTG ATGTAATTCTCCTTG G AATTTG CCCTTTTTG AGTTTG G ATCTTG GTTCATTCTCAA G CCTCAG ACAGTG GTTCAAAGTTTTTTTCTTCCATTTCAG GTGTCGTGA

Matrice promoteur TRE3G (SEQ ID NO : 170)

CTTTCGTCTTCAAGAATTCCTGGAGTTTACTCCCTATCAGTGATAGAGAACGTATGAAGA GTTTACTCCCTATCAGT GATAGAGAACGTATGCAGACTTTACTCCCTATCAGTGATAGAGAACGTATAAGGAGTTTA CTCCCTATCAGTGATA GAGAACGTATGACCAGTTTACTCCCTATCAGTGATAGAGAACGTATCTACAGTTTACTCC CTATCAGTGATAGAGAA CGTATATCCAGTTTACTCCCTATCAGTG ATAG AG AACGTATAAG CTTTAG GCGTGTACGGTGGGCG CCTATAAAAG CAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGCAATTCCACAACACTTTTGTCTTA TACCAACTTTCCGTACC ACTTCCTACCCTCGTAAA Matrice eZ-Rosa26-3' (SEQ ID NO : 171)

AGATGGGCG G G AGTCTTCTG G G CAG G CTTAAAG G CTAACCTG GTGTGTG G G CGTTGTCCTG CAG G G G AATTG AAC AGGTGTAAAATTGGAGGGACAAGACTTCCCACAGATTTTCGGTTTTGTCGGGAAGTTTTT TAATAGGGGCAAATAG GAAAATGGAGGATAGGAGTCATCTGGGGTTTATGCAGCAAAACTACAGGTATATTGCTTG TATCCGCCTCGGAGA TTTCCATGAGGAGATAAAGACATGTCACCCGAGTTTATACTCTCCTGCTTAGATCCTACT ACAGTATGAAATACAGT GTCGCGAGGTAGACTATGTAAGCAGATTTAATCATTTTAAAGAGCCCAGTACTTCATATC CATTTCTCCCGCTCCTTC TG CAG CCTTATCAAAAG GTATTTAG AACACTCATTTTAG CCCCATTTTCATTTATTATA TG G CTTATCCAACCCCTAG ACAGAGCATTGGCATTTTCCCTTTCCTGATCTTAGAAGTCTGATGACTCATGAAACCAGA CAGATTAGTTACATACA CCACAAATCG AG GCTGTAGCTGGGG CCTCAACA TG CAGTTCTTTTATAACTCCTTAGTACACTTTTTGTTG ATC TT TG C TTG ATCCTTAATTTTCAGTGTCTATCACCTCTCCCGTCAG GTG GTGTTCCACATTTG G G CCTATTCTCAGTCCA GGGAGTTTTACAACAATAGATGTATTGAGAATCCAACCTAAAGCTTAACTTTCCACTCCC ATGAATGCCTCTCTCCTT TTTCTCCATTATAACTGAGCTATAACCATTAATGGTTTCAGGTGGATGTCTCCTCCCCCA ATATACCTGATGTATCTA CATATTGCCAGGCTGATATTTTAAGACATAAAAGGTATATTTCATTATTGAGCCACATGG TATTGATTACTGCTACTA AAATTTTGTCATTGTACACATCTGTAAAAGGTGGTTCCTTTTGGAATGCAAAGTTCAGGT GTTTGTTGTCTTTCCTGA CCTAAG GTCTTGTG AG CTTGTATTTTTTCTATTTAAG CAGTG TTTCTCTTG G ACTG G CTTG ACTCATG G CATTCTAC ACGTTATTG TG GTCTAAATGTG ATTTTG CCAAG CTTCTTCAG G ACCTATAATTTTG CTTG A TTGTAG CCAAACACA AGTAAAATGATTAAGCAACAAATGTATTTGTGAAGCTTGGTTTTTAGGTTGTTGTGTTGT GTGTGCTTGTGCTCTAT AATAATACTATCCAGGGGCTGGAGAGGTGGCTCGGAGTTCAAGAGCACAGACTGCTCTTC CAGAAGTCCTGAGTT CAATTCCCAGCAACCACATGGTGGCTCACAACCATCTGTAATGGGATCTGATGCCCTCTT CTGGTGTGTCTGAAGAC CACAAGTGTATTCACATTAAATAAATAATCCTCCTTCTTCTTCTTTTTTTTTTTTTAAAG AGAATACTGTCTCCAGTAG AATTACTGAAGTAATGAAATACTTTGTGTTTGTTCCAATATGGAAGCCAATAATCAAATA CTCTTAAGCACTGGAAA TGTACCAAGGAACTATTTTATTTAAGTGAACTGTGGACAGAGGAGCCATAACTGCAGACT TGTGGGATACAGAAG ACCAATGCAGACTTAATGTCTTTTCTCTTACACTAAGCAATAAAGAAATAAAAATTGAAC TTCTAGTATCCTATTTGT T AAA TG CTAG TTTACTAACTTTTGTG CTTCAT TATACAAAG CTG AAAG CTAAGTCTG CAGCCATTACTAAACATG AAAG CAAGTAATG ATAATTTTG G ATTTCAAAAATGTAG G G CCAG AGTTTAG CCAGCCAGTGGTGGTG CTTG CCTTT ATGCCTTAATCCCAGCACTCTGGAGGCAGAGACAGGCAGATCTCTGAGTTTGAGCCCAGC CTGGTCTACACATCAA GTTCTATCTAGGATAGCCAGGAATACACACAGAAACCCTGTTGGGGAGGGGGGCTCTGAG ATTTCATAAAATTATA ATTGAAGCATTCCCTAATGAGCCACTATGGATGTGGCTAAATCCGTCTACCTTTCTGATG AGATTTGGGTATTATTTT TTCTGTCTCTG CTGTTG GTTG G GTCTTTTG ACACTGTG G G CTTTCTTAAAG CCTCCTTCCCTG CCATGTG G ACTCTTG TTTG CTACTAACTTCCCATG G CTTAAATG G CATG G CTTTTTG CCTTCT AAG G G CAG CTG CTG AG ATTTG CAG CCTG A TTTCCAG GGTGGGGTTGGG AAATCTTTCAAACACTAAAATTGTCCTTTAATTTTTTTTTAA AAAATG G GTTATATAAT AAACCTCATAAAATAGTTATGAGGAGTGAGGTGGACTAATATTAATGAGTCCCTCCCCTA TAAAAGAGCTATTAAG GCTTTTTGTCTTATACTAACTTTTTTTTTAAATGTGGTATCTTTAGAACCAAGGGTCTTA GAGTTTTAGTATACAGAA ACTGTTGCATCGCTTAATCAGATTTTCTAGTTTCAAATCCAGAGAATCCAAATTCTTCAC AGCCAAAGTCAAATTAAG AATTTCTGACTTTAATGTTATTTGCTACTGTGAATATAAAATGATAGCTTTTCCTGAGGC AGGGTATCACTATGTATC T TG CCTG ATCTG CAACAAG ATATGTAG ACTAAAGTTCTG C TG CTTTTGTCTCCTG AATACTAAG GTTAAAATGTA GTAATACTTTTG G AACTTG CAG GTCAG ATTCTTTTATAG G G G ACACACTAAG G GAG CTTG G GTG ATAGTTG GTAAA TGTGTTTAAGTGATGAAAACTTGAATTATTATCACCGCAACCTACTTTTTAAAAAAAAAA GCCAGGCCTGTTAGAGC ATGCTAAGGGATCCCTAGGACTTGCTGAGCACACAAGAGTAGTACTTGGCAGGCTCCTGG TGAGAGCATATTTCAA AAAACAAG G CAG ACAACCAAG AAACTAC AGTAAG GTTACCTGTCTTTAACCATCTG CATATACACAG G G AT ATT AA AATATTCCAAATAATATTTCATTCAAGTTTTCCCCCATCAAATTG G G ACATG G ATTTCTCCG GTG AATAG G CAG AGT TGGAAACTAAACAAATGTTGGTTTTGTGATTTGTGAAATTGTTTTCAAGTGATAGTTAAA GCCCATGAGATACAGA ACAAAG CTG CTATTTCG AG GTCACTTG GTTATACTCAG AAG CACTTCTTTG G GTTTCCCTG CACTATCCTG ATCATGT GCTAGGCCTACCTTAGGCTGATTGTTGTTCAAATAACTTAAGTTTCCTGTCAGGTGATGT CATATGATTTCATATATC AAGGCAAAACATGTTATATATGTTAAACATTTGGACTTAATGTGAAAGTTAGGTCTTTGT GGGTTTTGATTTTAATTT CAAAACCTGAGCTAAATAAGTCATTTTACATGTCTTACATTTGGTGAATTGTATATTGTG GTTTGCAGGCAAGACTC TCTGACCTAGTAACCCTCCTATAGAGCACTTTGCTGGGTCACAAGTCTAGGAGTCAAGCA TTTCACCTTGAAGTTGA GACGTTTTGTTAGTGTATACTAGTTATATGTTGGAGGACATGTTTATCCAGAAGATATTC AGGACTATTTTTGACTG GGCTAAGGAATTGATTCTGATTAGCACTGTTAGTGAGCATTGAGTGGCCTTTAGGCTTGA ATTGGAGTCACTTGTA T ATCTCAAATAATG CTG G CCTTTTTTAAAAAG CCCTTGTTCTTTATCACCCTGTTTTCT ACATAATTTTTGTTCAAAG A AATACTTGTTTGGATCTCCTTTTGACAACAATAGCATGTTTTCAAGCCATATTTTTTTTC CTTTTTTTTTTTTTTTTTGGT TTTTCGAGACAGGGTTTCTCTGTATAGCCCTGGCTGTCCTGGAACTCACTTTGTAGACCA GGCTGGCCTCGAACTCA G AAATCCG CCTG CCTCTG CCTCCTG AGTG CCG G G ATTAAAG G CGTG CACCACCACG CCTG G CTAAGTTG G ATATTT TGTATATAACTATAACCAATACTAACTCCACTGGGTGGATTTTTAATTCAGTCAGTAGTC TTAAGTGGTCTTTATTGG CCCTTATTAAAATCTACTGTTCACTCTAACAGAGGCTGTTGGACTAGTGGGACTAAGCAA CTTCCTACGGATATACT AGCAGATAAGGGTCAGGGATAGAAACTAGTCTAGCGTTTTGTATACCTACCAGCTTATAC TACCTTGTTCTGATAGA AATATTTAG G ACATCTAG CTTATC

Matrice eZ-Rosa26-5' (SEQ ID NO : 172)

CCCCGCGGCAGGCCCTCCGAGCGTGGTGGAGCCGTTCTGTGAGACAGCCGGGTACGAGTC GTGACGCTGGAAGG GGCAAGCGGGTGGTGGGCAGGAATGCGGTCCGCCCTGCAGCAACCGGAGGGGGAGGGAGA AGGGAGCGGAAA AGTCTCCACCGGACGCGGCCATGGCTCGGGGGGGGGGGGGCAGCGGAGGAGCGCTTCCGG CCGACGTCTCGTCG CTGATTGGCTTCTTTTCCTCCCGCCGTGTGTGAAAACACAAATGGCGTGTTTTGGTTGGC GTAAGGCGCCTGTCAGT TAACGGCAGCCGGAGTGCGCAGCCGCCGGCAGCCTCGCTCTGCCCACTGGGTGGGGCGGG AGGTAGGTGGGGTG AGGCGAGCTGGACGTGCGGGCGCGGTCGGCCTCTGGCGGGGCGGGGGAGGGGAGGGAGGG TCAGCGAAAGTA GCTCGCGCGCGAGCGGCCG CCCACCCTCCCCTTCCT TG G G G G AGTCGTTTTACCCG CCG CCG G CCG G GCCTCGTC GTCTGATTGGCTCTCGGGGCCCAGAAAACTGGCCCTTGCCATTGGCTCGTGTTCGTGCAA GTTGAGTCCATCCGCC GGCCAGCGGGGGCGGCGAGGAGGCGCTCCCAGGTTCCGGCCCTCCCCTCGGCCCCGCGCC GCAGAGTCTGGCCG CGCGCCCCTGCGCAACGTGGCAGGAAGCGCGCGCTGGGGGCGGGGACGGGCAGTAGGGCT GAGCGGCTGCGGG GCGGGTGCAAGCACGTTTCCGACTTGAGTTGCCTCAAGAGGGGCGTGCTGAGCCAGACCT CCATCGCGCACTCCG GGGAGTGGAGGGAAGGAGCGAGGGCTCAGTTGGGCTGTTTTGGAGGCAGGAAGCACTTGC TCTCCCAAAGTCGC TCTGAGTTGTTATCAGTAAGGGAGCTGCAGTGGAGTAGGCGGGGAGAAGGCCGCACCCTT CTCCGGAGGGGGGA GGGGAGTGTTGCAATACCTTTCTGGGAGTTCTCTGCTGCCTCCTGGCTTCTGAGGACCGC CCTGGGCCTGGGAGAA TCCCTTG CCCCCT TTCCCCTCGTG ATCTG CAACTCCAGTCTT

Matrice mB3Galt6 shRNA TR506016D (SEQ ID NO : 173)

ACAG G GTCG ACAAG CTTTTCCAAAAAAAAAG CATG AG GTG CAGTTG CG CCTTTCCTATCTCTTG AATAG G AAAG G C GCAACTGCACCTCATGCTGGATCCCGCGTCCTTTCCACAAGATATATAAACCCAAGAAAT CGAAATACTTTCAAGTT ACGGTAAGCATATGATAGTCCATTTTAAAACATAATTTTAAAACTGCAAACTACCCAAGA AATTATTACTTTCTACGT CACGTATTTTGTACTAATATCTTTGTGTTTACAGTCAAATTAATTCTAATTATCTCTCTA ACAGCCTTGTATCGTATAT G CAAATATG AAG G AATCATG G G AAATAG G CCCTCTTCCTG CCCG ACCTTG GCGCGCGCTCGGCGCGCG GTCACG C TCCGTCACGTGGTGCGTTTTG

Matrice eZ-SiaT-TGS-Hook (SEQ ID NO : 174)

ATGATTCACACCAACCTGAAGAAAAAGTTCAGCTGCTGCGTCCTGGTCTTTCTTCTGTTT GCAGTCATCTGTGTGTG GAAGGAAAAGAAGAAAGGGAGTTACTATGATTCCTTTAAATTGCAAACCAAGGAATTCCA GGTGTTAAAGAGTCT G G G G AAATTG G CCATG G G GTCTG ATTCCCAGTCTGTATCCTCAAG CAG CACCCAG G ACCCCCACAG G G G CCG CCA G ACCCTCG G CAGTCTCAG AG G CCTAG CCAAG G CCAAACCAG AG G CCTCCTTCCAG GTGTG G AACAAG G ACAG CTC TTCCAAAAACCTTATCCCTAG G CTG CAAAAG GGGTCGGGG

Matrice TagBFP (SEQ ID NO : 175)

ATGTCGGGGAGCGAGCTGATTAAGGAGAACATGCACATGAAGCTGTACATGGAGGGCACC GTGGACAACCATCA CTTCAAGTGCACATCCGAGGGCGAAGGCAAGCCCTACGAGGGCACCCAGACCATGAGAAT CAAGGTGGTCGAGG G CG G CCCTCTCCCCTTCG CCTTCG ACATCCTG G CTACTAG CTTCCTCTACG G CAG CAAG ACCTTCATCAACCACACCC AGGGCATCCCCGACTTCTTCAAGCAGTCCTTCCCTGAGGGCTTCACATGGGAGAGAGTCA CCACATACGAGGACG GGGGCGTGCTGACCGCTACCCAGGACACCAGCCTCCAGGACGGCTGCCTCATCTACAACG TCAAGATCAGAGGGG TGAACTTCACATCCAACGGCCCTGTGATGCAGAAGAAAACACTCGGCTGGGAGGCCTTCA CCGAAACGCTGTACCC CGCTGACGGCGGCCTGGAAGGCAGAAACGACATGGCCCTGAAGCTCGTGGGCGGGAGCCA TCTGATCGCAAACA TCAAGACCACATATAGATCCAAGAAACCCGCTAAGAACCTCAAGATGCCTGGCGTCTACT ATGTGGACTACAGACT GGAAAGAATCAAGGAGGCCAACAACGAAACCTACGTCGAGCAGCACGAGGTGGCAGTGGC CAGATACTGCGACC TCCCTAG CAAA TG G G G CACAAG CTTAATTCCG G ATG A

Matrice Thymidine Kinase cDNA (SEQ ID NO : 176)

ATG GCTTCGTACCCCTG CCATCAACACG CGTCTG CGTTCG ACCAG G CTG CG CGTTCTCG CG G CCATAG CAACCG AC GTACGGCGTTGCGCCCTCGCCGGCAGCAAGAAGCCACGGAAGTCCGCCTGGAGCAGAAAA TGCCCACGCTACTGC G G GTTTATATAG ACG GTCCTCACG G G ATG G G G AAAACCACCACCACG CAACTG CTG GTG G CCCTG G GTTCG CG CG ACGATATCGTCTACGTACCCGAGCCGATGACTTACTGGCAGGTGCTGGGGGCTTCCGAGA CAATCGCGAACATCTA CACCACACAACACCGCCTCGACCAGGGTGAGATATCGGCCGGGGACGCGGCGGTGGTAAT GACAAGCGCCCAGA T AACAATG G G CATG CCTTATG CCGTGACCGACGCCGTTCTGG CTCCTCATATCG GGGGGGAGGCTGGGAGCTCAC ATGCCCCGCCCCCGGCCCTCACCCTCATCTTCGACCGCCATCCCATCGCCGCCCTCCTGT GCTACCCGGCCGCGCGA T ACCTTATG G G CAG CATG ACCCCCCAG GCCGTGCTGGCGTTCGTGG CCCTCATCCCG CCG ACCTTG CCCG G CACAA ACATCGTGTTGGGGGCCCTTCCGGAGGACAGACACATCGACCGCCTGGCCAAACGCCAGC GCCCCGGCGAGCGGC TTG ACCTG G CTATG CTG G CCG CG ATTCG CCG CGTTTACG G G CTG CTTG CCAATACG GTG CG GTATCTG CAG G G CG G CGGGTCGTGGCGGGAGGATTGGGGACAGCTTTCGGGGACGGCCGTGCCGCCCCAGGGTGC CGAGCCCCAGAGCA ACG CG G G CCCACG ACCCCATATCG G G G ACACGTTATTTACCCTGTTTCG G G CCCCCG AGTTG CTG G CCCCCAACG G CG ACCTGTACAACGTGTTTG CCTG G G CCTTG G ACGTCTTG G CCAAACG CCTCCGTCCCATG CACGTCTTTATCCTG G ATTACG ACCAATCG CCCGCCGGCTGCCGGGACG CCCTG CTG CAACTTACCTCCG G G ATG GTCCAG ACCCACGTCAC CACCCCCGGCTCCATACCGACGATCTGCGACCTGGCGCGCACGTTTGCCCGGGAGATGGG GGAGGCTAACTGA Matrice TK term (SEQ ID NO : 177)

GGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGG CAATAAAAAGACA G AATAAAACG CACG GTGTTG G GTCGTTTGTTCATAAACG CG G G GTTCG GTCCCAG G G CTG G CACTCTGTCG ATACC CCACCG AG G CCCCATTG G G G CCAATACG CCCG CGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCG G GTG AAG G CCCAGGGCTCGCAG CCAACGTCG GGGCGGCAGG CCCTG CCATAG CC

Matrice TetON-3G cDNA (SEQ ID NO : 178) ATGTCTAGACTGGACAAGAGCAAAGTCATAAACTCTGCTCTGGAATTACTCAATGGAGTC GGTATCGAAGGCCTGA CGACAAGGAAACTCGCTCAAAAGCTGGGAGTTGAGCAGCCTACCCTGTACTGGCACGTGA AGAACAAGCGGGCCC TGCTCGATGCCCTGCCAATCGAGATGCTGGACAGGCATCATACCCACTCCTGCCCCCTGG AAGGCGAGTCATGGCA AG ACTTTCTG CG G AACAACG CCAAGTCATACCG CTGTG CTCTCCTCTCACATCG CG ACG G G G T AAAGTG CATCTC G G CACCCG CCCAACAG AG AAACAGTACG AAACC TG G AAAATCAG CTCG CGTTCCTGTGTCAG CAAG G CTTCTCCC TGGAGAACGCACTGTACGCTCTGTCCGCCGTGGGCCACTTTACACTGGGCTGCGTATTGG AGGAACAGGAGCATC AAGTAGCAAAAGAGGAAAGAGAGACACCTACCACCGATTCTATGCCCCCACTTCTGAAAC AAGCAATTGAGCTGTT CGACCGGCAGGGAGCCGAACCTGCCTTCCTTTTCGGCCTGGAACTAATCATATGTGGCCT GGAGAAACAGCTAAA GTGCGAAAGCGGCGGGCCGACCGACGCCCTTGACGATTTTGACTTAGACATGCTCCCAGC CGATGCCCTTGACGAC TTTGACCTTGATATGCTGCCTGCTGACGCTCTTGACGATTTTGACCTTGACATGCTCCCC GGGTAA