Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR THE FUNCTIONAL ARTIFICIAL EVOLUTION OF POLYNUCLEOTIDE SEQUENCES, RECOMBINANT POLYNUCLEOTIDES OBTAINED AND PEPTIDES, POLYPEPTIDES AND PROTEINS CODED BY SAME
Document Type and Number:
WIPO Patent Application WO/2003/097833
Kind Code:
A2
Abstract:
The invention relates to a method of preparing recombinant double-stranded polynucleotides or peptides, polypeptides or proteins coded by same. The inventive method is characterised in that it comprises: (a) the assembly of overlapping single-stranded nucleotide sequences which cover the sequence of all or part of the polynucleotides coding for a source population of peptides, polypeptides or proteins, in order to obtain recombinant double-stranded polynucleotides, said recombinant double-stranded polynucleotides optionally comprising at at least one of the ends thereof a sequence for regulating the expression of a gene or a 3’ or 5’ part of said regulatory sequence; and (b) the introduction of complementary nucleotide sequences of a nucleotide sequence of a cloning and/or expression vector at the 3’ and/or 5’ ends of each of the recombinant double-stranded polynucleotides obtained in step (a). The invention also relates to recombinant double-stranded polynucleotides obtained, to peptides, polypeptides or proteins obtained which have one or more improved properties and to the uses of the inventive method.

Inventors:
LEGRAIN MICHELE (FR)
Application Number:
PCT/FR2003/001405
Publication Date:
November 27, 2003
Filing Date:
May 06, 2003
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
ENTOMED (FR)
LEGRAIN MICHELE (FR)
International Classes:
C07K14/47; C12N15/10; (IPC1-7): C12N15/10
Foreign References:
US6291242B12001-09-18
US5286632A1994-02-15
Other References:
PRODROMOU CHRISOSTOMOS ET AL: "Recursive PCR: A novel technique for total gene synthesis" PROTEIN ENGINEERING, OXFORD UNIVERSITY PRESS, SURREY, GB, vol. 5, no. 8, 1992, pages 827-829, XP002176276 ISSN: 0269-2139
STEMMER W P C ET AL: "Single-step assembly of a gene and entire plasmid from large numbers of oligodeoxyribonucleotides" GENE, ELSEVIER BIOMEDICAL PRESS. AMSTERDAM, NL, vol. 164, no. 1, 1995, pages 49-53, XP004041916 ISSN: 0378-1119
KIKUCHI M ET AL: "Novel family shuffling methods for the in vitro evolution of enzymes" GENE, ELSEVIER BIOMEDICAL PRESS. AMSTERDAM, NL, vol. 236, no. 1, 5 août 1999 (1999-08-05), pages 159-167, XP004175459 ISSN: 0378-1119
RICHMAN A M ET AL: "INDUCIBLE IMMUNE FACTORS OF THE VECTOR MOSQUITO ANOPHELES GAMBIAE: BIOCHEMICAL PURIFICATION OF A DEFENSIN ANTIBACTERIAL PEPTIDE AND MOLECULAR CLONING OF PREPRODEFENSIN CDNA" INSECT MOLECULAR BIOLOGY, BLACKWELL SCIENTIFIC, OXFORD,, GB, vol. 5, no. 3, 1996, pages 203-210, XP001133831 ISSN: 0962-1075
EGGLESTON ET AL.: "Genomic organization and immune regulation of the defensin gene from the mosquito, Anopheles gambiae" INSECT MOLECULAR BIOLOGY, vol. 9, no. 5, pages 481-490, XP002236511
Attorney, Agent or Firm:
Breese, Pierre (3 avenue de l'Opéra, Paris, FR)
Download PDF:
Claims:
REVENDICATIONS
1. 1) Procédé de préparation de polynucléotides doubles brins recombinés ou des peptides, polypeptides ou protéines pour lesquels ils codent, caractérisé en ce qu'il comprend : a) l'assemblage de séquences nucléotidiques simples brins chevauchants qui couvrent la séquence de tout ou partie de polynucléotides codant une population de départ de peptides, polypeptides ou protéines, pour obtenir des polynucléotides doubles brins recombinés, lesdits polynucléotides doubles brins recombinés comprenant éventuellement à l'une au moins de leurs extrémités une séquence de régulation de l'expression d'un gène ou une partie 3'ou 5'de cette séquence de régulation, b) l'introduction aux extrémités 3'et/ou 5'de chacun des polynucléotides doubles brins recombinés obtenus à l'étape (a) de séquences nucléotidiques complémentaires d'une séquence nucléotidique d'un vecteur de clonage et/ou d'expression, puis éventuellement c) l'insertion de chacun des polynucléotides doubles brins recombinés dans le vecteur de clonage et/ou d'expression comprenant des extrémités 3'et/ou 5' complémentaires de celles introduites dans lesdits polynucléotides doubles brins recombinés obtenus à l'étape (b), suivi optionnellement de d) la cotransformation d'un organisme hôte avec le vecteur de clonage et/ou d'expression comprenant des extrémités 3'et/ou 5'complémentaires de celles introduites dans lesdits polynucléotides doubles brins recombinés obtenus à l'étape (b) en présence desdits polynucléotides doubles brins recombinés, et l'expression dans l'organisme hôte et éventuellement la sécrétion des peptides, polypeptides ou protéines codés par ceuxci.
2. Procédé selon la revendication 1, caractérisé en ce qu'à l'étape (a) du procédé de l'invention, les polynucléotides doubles brins recombinés comprennent à l'une au moins de leurs extrémités tout ou partie d'une séquence de régulation de l'expression d'un gène, qui est apportée auxdits polynucléotides doubles brins recombinés par des séquences nucléotidiques simples brins supplémentaires présentes : i) soit à l'une des extrémités des séquences nucléotidiques simples brins chevauchants constituant les extrémités des polynucléotides doubles brins recombinés, avant l'assemblage (a), ii) soit, lors de l'assemblage (a), sous la forme d'un ou plusieurs acides nucléiques simples brins, chacun constitué d'une première et d'une seconde région nucléique, dont : un premier groupe est constitué de premières régions complémentaires des séquences nucléotidiques simples brins chevauchants constituant l'une au moins des extrémités des polynucléotides doubles brins recombinés, avant l'assemblage (a), et les secondes régions de ce premier groupe correspondent à tout ou partie d'une séquence de régulation de l'expression d'un gène, le second groupe, s'il est présent, est constitué de premières régions et secondes régions, pour une part complémentaires des secondes régions du premier groupe et pour une seconde part complémentaires les unes des autres, de façon à former ladite séquence de régulation de l'expression d'un gène ou une partie de celleci, iii) soit par la combinaison de (i) et (ii).
3. Procédé selon la revendication 1 ou 2, caractérisé en ce que les étapes (a) et (b) sont réalisées par polymérisation de préférence par une réaction de polymérisation en chaîne (PCR).
4. Procédé selon la revendication 3, caractérisé en ce que la polymérisation de l'étape (a) comprend plusieurs cycles de dénaturation, hybridation, extension en présence d'une polymérase, dans des conditions telles que chaque séquence nucléotidique simple brin et acide nucléique simple brin s'il est présent, sert de matrice pour l'élongation d'une autre séquence nucléotidique simple brin ou acide nucléique simple brin s'il est présent.
5. Procédé selon l'une des revendications 3 ou 4, caractérisé en ce qu'à l'étape (b) de polymérisation est réalisée avec des amorces comprenant des séquences nucléotidiques complémentaires d'une séquence nucléotidique d'un vecteur de clonage et/ou d'expression.
6. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que les peptides, polypeptides ou protéines de la population de départ présentent des régions de séquences d'acides aminés variables et des régions de séquences d'acides aminés substantiellement conservées au sein de ladite population.
7. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que chacune des séquences nucléotidiques simples brins est constituée ou comprend : un segment nucléotidique interne codant une séquence en acides aminés d'une des régions variables d'un des peptides, polypeptides ou protéines de la population de départ, ledit segment nucléotidique variable étant flanqué en 5'par un segment nucléotidique codant la séquence en acides aminés de tout ou partie de l'une quelconque des régions substantiellement conservées des peptides, polypeptides ou protéines de la population de départ, qui est immédiatement adjacente à l'extrémité N terminale d'une région variable, ledit segment nucléotidique étant luimme éventuellement flanqué en 5'd'une séquence nucléotidique simple brin supplémentaire correspondant à tout ou partie d'une séquence de régulation de l'expression d'un gène, en 3'par un segment nucléotidique codant la séquence en acides aminés de tout ou partie de l'une quelconque des régions substantiellement conservées des peptides, polypeptides ou protéines de la population de départ, qui est immédiatement adjacente à l'extrémité C terminale d'une région variable, ledit segment nucléotidique étant luimme éventuellement flanqué en 3'd'une séquence nucléotidique simple brin supplémentaire correspondant à tout ou partie d'une séquence de régulation de l'expression d'un gène.
8. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend après l'étape (c), le criblage ou la sélection desdits polynucléotides doubles brins recombinés pour une ou plusieurs propriétés désirées.
9. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend après l'étape (d), le criblage ou la sélection desdits peptides, polypeptides ou protéines pour une ou plusieurs propriétés désirées.
10. Procédé selon l'une des revendications 8 ou 9, caractérisée en ce que la ou les propriétés désirées correspondent à une ou plusieurs propriétés améliorés par rapport à celle (s) de la population de départ.
11. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend avant l'étape (a) l'alignement des séquences peptidiques, polypeptidiques ou protéiques de la population de départ pour identifier les régions variables et les régions substantiellement conservées.
12. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que le nombre de séquences nucléotidiques simples brins chevauchants de l'étape (a) est fonction du nombre de peptides, polypeptides ou protéines de la population de départ et du nombre de régions variables au sein de ladite population.
13. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que la taille des séquences nucléotidiques simples brins chevauchants de l'étape (a) est essentiellement fonction de la taille des régions variables desdits peptides, polypeptides ou protéines.
14. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que les peptides, polypeptides ou protéines de la population de départ sont naturels.
15. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que les peptides, polypeptides ou protéines de la population de départ sont des variants provenant de différents familles, ordres, genres ou espèces ou des variants allèliques.
16. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que les peptides, polypeptides ou protéines de la population de départ sont des peptides, polypeptides ou protéines mutés.
17. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que les peptides, polypeptides ou protéines de la population de départ sont d'origine animale, végétale, bactérienne ou virale.
18. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que les peptides, polypeptides ou protéines de la population de départ sont des variants naturels de peptides, polypeptides ou protéines d'insectes et/ou des peptides, polypeptides ou protéines mutées dérivant de variants naturels de peptides, polypeptides ou protéines d'insectes.
19. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que les peptides, polypeptides ou protéines de la population de départ ont une structure tridimensionnelle comportant au moins une hélice a et/ou au moins un brin ß, éventuellement reliés par au moins un pont disulfure, ou des fragments de ceuxci.
20. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que les peptides, polypeptides ou protéines de la population de départ ont une structure tridimensionnelle comportant une hélice a et deux brins antiparallèles reliés par trois ponts disulfure, ou des fragments de ceuxci.
21. Procédé selon l'une quelconque des revendications de 8 à 20, caractérisé en ce que la ou les propriétés sont choisies parmi le groupe comprenant : les propriétés anti bactériennes, les propriétés antifongiques, les propriétés antiinflammatoires, les propriétés antitumorales, les propriétés anticancéreuses, la cicatrisation des plaies et habilité à lier un récepteur, en particulier un canal ionique.
22. Une séquence nucléotidique simple brin pour tre utilisée à l'étape a) d'un procédé selon l'une quelconque des revendication 1 à 21, caractérisé en ce qu'elle est constitué ou comprend : un segment nucléotidique interne codant une séquence en acides aminés d'une des régions variables d'un des peptides, polypeptides ou protéines de la population de départ, ledit segment nucléotidique variable étant flanqué en 5'par un segment nucléotidique codant la séquence en acides aminés de tout ou partie de l'une quelconque des régions substantiellement conservées des peptides, polypeptides ou protéines de la population de départ, qui est immédiatement adjacente à l'extrémité N terminale d'une région variable, ledit segment nucléotidique étant luimme éventuellement flanqué en 5'd'une séquence nucléotidique simple brin supplémentaire correspondant à tout ou partie d'une séquence de régulation de l'expression d'un gène, en 3'par un segment nucléotidique codant la séquence en acides aminés de tout ou partie de l'une quelconque des régions substantiellement conservées des peptides, polypeptides ou protéines de la population de départ, qui est immédiatement adjacente à l'extrémité C terminale d'une région variable, ledit segment nucléotidique étant luimme éventuellement flanqué en 3'd'une séquence nucléotidique simple brin supplémentaire correspondant à tout ou partie d'une séquence de régulation de l'expression d'un gène.
23. Un polynucléotide doublebrin recombiné caractérisé en ce qu'il est obtenu par le procédé selon l'une quelconque des revendications de 1 à 21.
24. Un vecteur de clonage et/ou d'expression caractérisé en ce qu'il comprend un polynucléotide doublebrin recombiné selon la revendication 23.
25. Un organisme hôte caractérisé en ce qu'il est transformé par un vecteur de clonage et/ou d'expression selon la revendication 24.
26. Un peptide, polypeptide ou une protéine caractérisé en ce qu'il (elle) est obtenu (e) par le procédé selon l'une quelconque des revendications de 1 à 21.
27. Une banque caractérisée en ce qu'elle est constituée de polynucléotides doublebrins recombinés selon la revendication 23 ou de vecteurs de clonage et/ou d'expression selon la revendication 24 ou d'organismes hôtes selon la revendication 25 ou de peptides, polypeptides ou protéines selon la revendication 26.
28. Utilisation du procédé selon l'une quelconque des revendications de 1 à 21, pour la construction d'un vecteur de clonage et/ou d'expression.
Description:
PROCEDE D'EVOLUTION FONCTIONNELLE ARTIFICIELLE DE SEQUENCES POLYNUCLEOTIDIQUES, POLYNUCLEOTIDES RECOMBINES OBTENUS ET PEPTIDES, POLYPEPTIDES ET PROTEINES CODES PAR CEUX-CI La présente invention a pour objet un procédé de préparation de polynucléotides doubles brins recombinés ou des peptides, polypeptides ou protéines pour lesquels ils codent. L'invention concerne également les polynucléotides doubles brins recombinés obtenus et les peptides, polypeptides ou protéines obtenus présentant une ou plusieurs propriétés améliorées ainsi que les utilisations du procédé.

Différentes techniques ont été décrites dans l'art antérieur pour accélérer artificiellement l'évolution fonctionnelle des gènes. Parmi les plus répandues, on peut citer la mutagenèse par remplacement de cassette, l'error- prone PCR et le DNA shuffling.

La mutagenèse par remplacement de cassette est une technique basée sur le remplacement d'un fragment d'ADN plasmidique contenant une portion d'une séquence sauvage d'intért, par un fragment d'ADN (cassette) contenant au moins une mutation, désirée ou aléatoire. La cassette mutante est composée de 2 oligonucléotides complémentaires synthétiques de séquence prédéfinie (Cassette mutagenesis : an efficient method for generation of multiple mutations at defined sites, J. A. Wells, M. Vasser and D. B. Powers, Gene 34 : 315-323 (1985)) ou de 2 oligonucléotides complémentaires dégénérés ou de 2 oligonucléotides complémentaires dopés (Recombinant DNA, Watson, Gilman, Witkowski and Zoller, Freeman 204-205 (1992)), de façon à générer une banque de plasmides mutants contenant plusieurs séquences différentes.

L'error-prone PCR est une technique utilisant le faible degré de fidélité des ADN polymérases pour introduire en faible proportion des points de mutations le long des séquences amplifiées (A method for random mutagenesis of a defined DNA fragment using a modified polymerase chaine reaction, D. W. Leung, E. Chen and D. V. Goeddel, Technique 1 : 11-15 (1989)).

Le DNA shuffling est une technique basée sur la recombinaison homologue in vitro de séquences polynucléotidiques double-brins par fragmentation aléatoire à l'aide de la DNAse I et réassemblage par PCR (DNA shuffling by random fragmentation and reassembly In vitro recombinaison for molecular évolution, W. P. C. Stemmer, Proceedings of the national Academy of Sciences, USA 91 : 10747-10751 (1994) ; DNA Shuffling of a family of genes from diverse species accelerates directed évolution, A.

Cremeri, S. Raillard, S. Bermudez and W. P. C. Stemmer, Nature 391 : 288-291 (1998) ; Protein évolution by molecular breeding, J. Minshull and W. P. C. Stemmer, Current Opinion in Chemical Biology, 3 : 284-290 (1999) ; WO 95/22625 ; EP 0 911 396 ; WO 00/09679).

La mutagenèse par remplacement de cassette et l'error- prone PCR sont des techniques qui deviennent rapidement limitantes lorsque l'on cherche à générer rapidement des librairies de peptides ou de protéines recombinées présentant des propriétés améliorées. Ces limitations sont notamment liées aux inconvénients engendrés par la répétition du processus de base qui est requise pour assurer une évolution fonctionnelle (ex. accumulation de mutations neutres).

Le DNA shuffling est une technique d'évolution artificielle qui contraint l'utilisateur à isoler ainsi qu'à fragmenter préalablement les polynucléotides à assembler. Par ailleurs, la fragmentation des polynucléotides étant

aléatoire (DNAse I), une proportion non négligeable de polynucléotides recombinés non fonctionnels est inévitablement générée. En effet, les propriétés fonctionnelles d'un peptide, polypeptide ou d'une protéine présentant une structure tridimentionnelle définie, reposent sur la répartition spatiale des groupements chimiques portant l'activité. Ainsi, la fragmentation de polynucléotides au sein de séquences impliquées dans des motifs structuraux élémentaires est de nature à altérer le repliement global de la chaîne peptidique, polypeptidique ou protéique et par voie de conséquence à altérer sa fonctionnalité. Enfin, la fragmentation aléatoire de gènes de petite taille ne génère que peu de fragments capables de se réapparier au cours du processus d'assemblage. L'ensemble de ces inconvénients concourent ainsi à ralentir et à complexifier l'évolution artificielle de gènes codant pour des peptides, polypeptides ou des protéines fonctionnelles.

La présente invention vise précisément à palier aux inconvénients sus-mentionnés en proposant une méthode simple et rapide pour préparer des polynucléotides recombinés ou des peptides, polypeptides ou protéines pour lesquels ils codent, lesdits peptides, polypeptides ou protéines présentant avantageusement une ou plusieurs propriétés améliorées. On entend respectivement par peptides, polypeptides et protéines selon la présente invention, un enchaînement de 2 à 20 résidus d'acides aminés, enchaînement de 20 à 50 résidus d'acides aminés et enchaînement de plus de 50 résidus d'acides aminés.

La présente invention a donc pour principal objet un procédé de préparation de polynucléotides doubles brins

recombinés ou des peptides, polypeptides ou protéines pour lesquels ils codent, caractérisé en ce qu'il comprend : a) l'assemblage de séquences nucléotidiques simples brins chevauchants qui couvrent la séquence de tout ou partie de polynucléotides codant une population de départ de peptides, polypeptides ou protéines, pour obtenir des polynucléotides doubles brins recombinés, lesdits polynucléotides doubles brins recombinés comprenant éventuellement à l'une au moins de leurs extrémités une séquence de régulation de l'expression d'un gène ou une partie 3'ou 5'de cette séquence de régulation, b) l'introduction aux extrémités 3'et/ou 5'de chacun des polynucléotides doubles brins recombinés obtenus à l'étape (a) de séquences nucléotidiques complémentaires d'une séquence nucléotidique d'un vecteur de clonage et/ou d'expression.

L'une au moins des extrémités dudit vecteur de clonage et/ou d'expression linéarisé peut correspondre à la partie 3' ou 5'de séquence (s) de régulation de l'expression d'un gène dont la partie 3'ou 5'complémentaire correspond à l'une des extrémités des polynucléotides doubles brins recombinés obtenus à l'étape (b) du procédé de l'invention. On entend par séquence (s) de régulation de l'expression d'un gène selon la présente invention, des séquences régulatrices de la transcription, de la traduction et/ou de la maturation de peptides, polypeptides ou protéines telles qu'un promoteur, une séquence codant pour un peptide signal ou de transit (séquences pré, séquence pro), une séquence codant pour une endoprotéase, ou un terminateur. L'ensemble de ces séquences de régulation est connu de l'homme du métier et ce dernier est capable de les choisir en fonction des organismes hôte

dans lesquels les peptides, polypeptides ou protéines codés par les polynucléotides doubles brins recombinés obtenus par le procédé de l'invention sont exprimés.

A l'étape (a) du procédé de l'invention, les polynucléotides doubles brins recombinés comprennent à l'une au moins de leurs extrémités tout ou partie d'une séquence de régulation de l'expression d'un gène, qui est apportée auxdits polynucléotides doubles brins recombinés par des séquences nucléotidiques simples brins supplémentaires présentes : i) soit à l'une des extrémités des séquences nucléotidiques simples brins chevauchants constituant les extrémités des polynucléotides doubles brins recombinés, avant l'assemblage (a), ii) soit, lors de l'assemblage (a), sous la forme d'un ou plusieurs acides nucléiques simples brins, chacun constitué d'une première et d'une seconde région nucléique, dont : - un premier groupe est constitué de premières régions complémentaires des séquences nucléotidiques simples brins chevauchants constituant l'une au moins des extrémités des polynucléotides doubles brins recombinés, avant l'assemblage (a), et les secondes régions de ce premier groupe correspondent à tout ou partie d'une séquence de régulation de l'expression d'un gène, - le second groupe, s'il est présent, est constitué de premières régions et secondes régions, pour une part complémentaires des secondes régions du premier groupe et pour une seconde part complémentaires les unes des autres, de façon à former ladite séquence de régulation de l'expression d'un gène ou une partie de celle-ci, iii) soit par la combinaison de (i) et (ii).

Chacune des séquences nucléotidiques simples brins utilisées à l'étape (a) du procédé de l'invention est constituée ou comprend : un segment nucléotidique interne codant une séquence en acides aminés d'une des régions variables d'un des peptides, polypeptides ou protéines de la population de départ, ledit segment nucléotidique variable étant flanqué -en 5'par un segment nucléotidique codant la séquence en acides aminés de tout ou partie de l'une quelconque des régions substantiellement conservées des peptides, polypeptides ou protéines de la population de départ, qui est immédiatement adjacente à l'extrémité N terminale d'une région variable, ledit segment nucléotidique étant lui-mme éventuellement flanqué en 5'd'une séquence nucléotidique simple brin supplémentaire correspondant à tout ou partie d'une séquence de régulation de l'expression d'un gène, -en 3'par un segment nucléotidique codant la séquence en acides aminés de tout ou partie de l'une quelconque des régions substantiellement conservées des peptides, polypeptides ou protéines de la population de départ, qui est immédiatement adjacente à l'extrémité C terminale d'une région variable, ledit segment nucléotidique étant lui-mme éventuellement flanqué en 3'd'une séquence nucléotidique simple brin supplémentaire correspondant à tout ou partie d'une séquence de régulation de l'expression d'un gène.

Les peptides, polypeptides ou protéines de la population de départ peuvent tre des peptides, polypeptides ou protéines naturelles, plus particulièrement, des variants

provenant de différentes familles, ordres, genres ou espèces ou des variants allèliques.

Les peptides, polypeptides ou protéines de la population de départ peuvent tre des peptides, polypeptides ou protéines mutés.

Les peptides, polypeptides ou protéines de la population de départ sont choisis parmi des peptides, polypeptides ou protéines d'origine animale, végétale, bactérienne ou virale.

Selon la présente invention, les peptides, polypeptides ou protéines de la population de départ sont de préférence des variants naturels de peptides, polypeptides ou protéines d'insectes et/ou des peptides, polypeptides ou protéines mutées dérivant de variants naturels de peptides, polypeptides ou protéines d'insectes.

Les peptides, polypeptides ou protéines de la population de départ peuvent en particulier avoir une structure tridimensionnelle comportant au moins une hélice a et/ou au moins un brin P, éventuellement reliés par au moins un pont disulfure, ou des fragments de ceux-ci. Parmi les peptides, polypeptides ou protéines répondant à une telle conformation tridimentionnelle, on peut notamment citer : - les peptides, polypeptides ou protéines présentant une structure tridimentionnelle de type comportant au moins une hélice a et éventuellement au moins un pont disulfure comme par exemple ceux de la famille des cécropines (2 hélices a), des mélittines (2 hélices a), des magainines (1 hélice a), les brévinines (1 hélice a et 1 pont disulfure), des esculentines (1 hélice a et 1 pont disulfure), des ranatuerines (1 hélice a et 1 pont disulfure), des dermaseptines (1 hélice a), des protéines de transport de

lipides (4 hélices a reliées par 4 ponts disulfure) ou la myoémérythine (4 hélices a) ; - les peptides, polypeptides ou protéines présentant une structure tridimentionnelle de type comportant au moins un brin ß et éventuellement au moins un pont disulfure comme par exemple ceux de la famille des défensines classiques ou a de mammifères (3 brins (3 anti-parallèles reliés par 3 ponts disulfure), des défensines ß de mammifères (3 brins (3 anti- parallèles reliés par 3 ponts disulfure), des protégrines (2 brins (3 anti-parallèles reliés par 2 ponts disulfure), de la thanatine (2 brins ? anti-parallèles reliés par 1 pont disulfure), de l'androctonine (2 brins ß anti-parallèles reliés par 2 ponts disulfure), des knottin-like-peptides de plantes (3 brins ß anti-parallèles reliés par 3 ponts disulfure), de la superoxyde dismutase (8 brins (3 anti- parallèles), la protéine plasmatique liant le rétinol (8 brins ß anti-parallèles), de la neuraminidase du virus de la grippe (6 motifs consécutifs identiques de 4 brins ß anti- parallèles), des Immunoglobulines (régions constantes : 7 brins ß anti-parallèles et 1 pont disulfure ; régions variables : 9 brins ß anti-parallèles et 1 pont disulfure), des toxines isolées à partir de mollusques (par exemple la conotoxine @ : 3 brins ß anti-parallèles et 3 ponts disulfure) ou des toxines isolées à partir d'araignées (par exemple l'agatoxine R : 3 brins P anti-parallèles et 3 ponts disulfure) ; - les peptides, polypeptides ou protéines présentant une structure tridimentionnelle de type comportant au moins une hélice a et au moins un brin p, reliés par au moins un pont disulfure. Cette structure tridimentionnelle appelée Coup est notamment représentée dans les peptides ou protéines de la famille des défensines d'insectes (1 hélice a et 2 brins ß

anti-parallèles reliés par 3 ponts disulfure), de la drosomycine (1 hélice a et 3 brins ß anti-parallèles reliés 4 ponts disulfure), des défensines de plantes (1 hélice a et 3 brins P anti-parallèles reliés par 4 ponts disulfure), des hevein-like de plantes (1 hélice a et 3 brins P anti- parallèles reliés par 4 ponts disulfure), des y-thionines de plantes (2 hélice a et 2 brins ß anti-parallèles reliés par 2 à 4 ponts disulfure) ou des toxines isolées à partir de scorpions (par exemple la charibdtoxine : 1 hélice a et 3 brins P anti-parallèles reliés par 3 ponts disulfure).

Selon la présente invention, les peptides, polypeptides ou protéines de la population de départ ont de préférence une structure tridimensionnelle de type comportant une hélice a et deux brins ß antiparallèles reliés par trois ponts disulfure, ou les fragments de ceux-ci. Cette structure tridimensionnelle appelée CSa (3 est caractéristique de peptides et polypeptides isolés à partir d'insectes, dénommés défensines d'insectes. Ces défensines d'insectes présentent des propriétés antibactériennes, en particulier contre les bactéries à Gram positif, utiles dans le traitement et/ou la prévention d'infections tant chez l'homme et l'animal que chez les plantes. Les défensines d'insectes ont fait l'objet de nombreuses publications, brevets et demandes de brevet parmi lesquels on peut citer : Cystéines-rich antimicrobial peptides in invertebrates, JL. Dimarcq, P. Bulet, C. Hetru, J. Hoffmann, Biopolymers (Peptide Science), Vol. 47,465-477 (1998) ; Antimicrobial peptides in insects : structure and function, P. Bulet, C. Hetru, J-L Dimarcq, D. Hoffmann, Developmental and Comparative Immunology 23 (1999) 329-344 ; EP 0349451 ; EP 0546213, FR 2695392 et WO 99/53053.

Les peptides, polypeptides ou protéines de la population de départ présentent des régions de séquences d'acides aminés variables et des régions de séquences d'acides aminés substantiellement conservées au sein de ladite population.

On entend par régions de séquences d'acides aminés substantiellement conservées selon la présente invention, 2 ou plusieurs sous-séquences peptidiques, polypeptidiques ou protéiques ayant au moins 60%, de préférence 80% et en particulier 90 à 95% des résidus d'acides aminés qui sont identiques lorsque ces sous-séquences sont alignées pour le maximum de correspondance.

La demanderesse a défini préalablement à l'étape (a) d'assemblage, l'alignement des séquences peptidiques, polypeptidiques ou protéiques de la population de départ pour identifier lesdites régions variables et lesdites régions substantiellement conservées.

L'invention concerne également une séquence nucléotidique simple brin pour tre utilisée à l'étape (a) du procédé de l'invention, caractérisée en ce qu'elle est constituée ou comprend : - un segment nucléotidique interne codant une séquence en acides aminés d'une des régions variables d'un des peptides, polypeptides ou protéines de la population de départ, ledit segment nucléotidique variable étant flanqué -en 5'par un segment nucléotidique codant la séquence en acides aminés de tout ou partie de l'une quelconque des régions substantiellement conservées des peptides, polypeptides ou protéines de la population de départ, qui est immédiatement adjacente à l'extrémité N terminale d'une région variable, ledit segment

nucléotidique étant lui-mme éventuellement flanqué en 5' d'une séquence nucléotidique simple brin supplémentaire correspondant à tout ou partie d'une séquence de régulation de l'expression d'un gène, en 3'par un segment nucléotidique codant la séquence en acides aminés de tout ou partie de l'une quelconque des régions substantiellement conservées des peptides, polypeptides ou protéines de la population de départ, qui est immédiatement adjacente à l'extrémité C terminale d'une région variable, ledit segment nucléotidique étant lui-mme éventuellement flanqué en 3'd'une séquence nucléotidique simple brin supplémentaire correspondant à tout ou partie d'une séquence de régulation de l'expression d'un gène.

Le nombre de séquences nucléotidiques simples brins chevauchants de l'étape (a) est fonction du nombre de peptides, polypeptides ou protéines de la population de départ et du nombre de régions variables au sein de ladite population.

La taille des séquences nucléotidiques simples brins chevauchants de l'étape (a) est essentiellement fonction de la taille des régions variables desdits peptides, polypeptides ou protéines.

Les étapes (a) et (b) sont réalisées par polymérisation de préférence par une réaction de polymérisation en chaîne (PCR).

La polymérisation de l'étape (a) comprend plusieurs cycles de dénaturation, hybridation, extension en présence d'une polymérase, dans des conditions telles que chaque séquence nucléotidique simple brin et acide nucléique simple brin s'il est présent, sert de matrice pour l'élongation

d'une autre séquence nucléotidique simple brin ou acide nucléique simple brin s'il est présent.

L'étape (b) de polymérisation est réalisée avec des amorces comprenant des séquences nucléotidiques complémentaires d'une séquence nucléotidique d'un vecteur de clonage et/ou d'expression.

Le procédé de l'invention est également caractérisé en ce qu'il comprend après l'étape (b), l'insertion de chacun des polynucléotides doubles brins recombinés dans le vecteur de clonage et/ou d'expression comprenant des extrémités 3' et/ou 5'complémentaires de celles introduites dans lesdits polynucléotides doubles brins recombinés obtenus à l'étape (b), puis le criblage ou la sélection desdits polynucléotides doubles brins recombinés ou des peptides, polypeptides ou protéines codés par ceux-ci pour une ou plusieurs propriétés désirées.

Selon une autre forme de l'invention, le procédé comprend après l'étape (b), la co-transformation d'un organisme hôte avec le vecteur de clonage et/ou d'expression comprenant des extrémités 3'et/ou 5'complémentaires de celles introduites dans lesdits polynucléotides doubles brins recombinés obtenus à l'étape (b) en présence desdits polynucléotides doubles brins recombinés, l'expression dans l'organisme hôte et éventuellement la sécrétion des peptides, polypeptides ou protéines codés par ceux-ci, puis le criblage ou la sélection desdits peptides, polypeptides ou protéines pour une ou plusieurs propriétés désirées.

La ou les propriétés désirées correspondent selon la présente invention à une ou plusieurs propriétés améliorées par rapport à celle (s) des peptides, polypeptides ou protéines de la population de départ.

La ou les propriétés sont choisies parmi le groupe suivant : propriétés anti-bactériennes, propriétés anti- fongiques, propriétés anti-inflammatoires, propriétés anti- tumorales, propriétés anti-cancéreuses, cicatrisation des plaies et habilité à lier un récepteur, en particulier un canal ionique.

L'invention concerne également un polynucléotide double brin recombiné, caractérisé en ce qu'il est obtenu par le procédé de l'invention.

L'invention concerne également un vecteur de clonage et/ou d'expression caractérisé en ce qu'il comprend un polynucléotide double brin recombiné obtenu par le procédé de l'invention pour transformer un organisme hôte et exprimer dans ce dernier le peptide, polypeptide ou la protéine codée par le polynucléotide recombiné. Le vecteur peut tre un plasmide, un cosmide, un bactériophage ou un virus en particulier un baculovirus. Le vecteur d'expression est avantageusement un vecteur à réplication autonome comportant des éléments permettant son maintien et sa réplication dans l'organisme hôte comme une origine de réplication. En outre, le vecteur peut comporter des éléments permettant sa sélection dans l'organisme hôte comme par exemple un gène de résistance à un antibiotique ou un gène de sélection qui assurent la complémentation avec le gène respectif délèté au niveau du génome de l'organisme hôte. Le vecteur peut également tre un vecteur navette comportant des éléments permettant son maintien et sa réplication dans chacun des organismes hôte et des éléments permettant sa sélection dans chacun des organismes hôte. De tels vecteurs de clonage et/ou d'expression sont bien connus de l'homme du métier et largement décrits dans la littérature.

L'invention concerne également un organisme hôte caractérisé en ce qu'il est transformé par un vecteur de clonage et/ou d'expression de l'invention. Par « organisme hôte » selon la présente invention, on entend tout organisme mono ou pluricellulaire, inférieur ou supérieur, dans lequel un polynucléotide double-brin recombiné obtenu par le procédé de l'invention est introduit pour la production d'un peptide, polypeptide ou d'une protéine obtenus par le procédé de l'invention. L'organisme hôte peut est un microorganisme tel qu'une levure (par exemple une levure de genre Saccharomyces, Kluyveromyces, Hansenula, Pichia ou Schizosaccharomyces), une bactérie (par exemple Escherichia coli) ou un champignon (par exemple Aspergillus nidulans). L'organisme hôte peut également tre une cellule animale, en particulier une cellule d'arthropode (par exemple une cellule de Spodoptera frugiperda ou de Trichoplusia ni) ou une cellule de Mammifère. L'organisme hôte peut aussi tre une cellule végétale ou une plante.

L'invention concerne donc également un peptide, polypeptide ou une protéine caractérisé (e) en ce qu'il (elle) est obtenu (e) par le procédé de l'invention.

L'invention concerne également une banque, caractérisée en ce qu'elle est constituée de polynucléotides double-brins recombinés ou de vecteurs de clonage et/ou d'expression ou d'organismes hôtes ou de peptides, polypeptides ou protéines.

L'invention concerne également l'utilisation du procédé de l'invention, pour la construction d'un vecteur de clonage et/ou d'expression.

La mise en oeuvre du procédé de l'invention permet ainsi de préparer facilement et rapidement des polynucléotides doubles brins recombinés ou des peptides, polypeptides ou protéines pour lesquels ils codent, qui présentent avantageusement une ou plusieurs propriétés améliorées par rapport à celle (s) des peptides, polypeptides ou protéines de la population de départ. L'utilisation de séquences nucléotidiques simples brins telles que précédemment définies, dans l'étape (a) du procédé de l'invention permet de préserver l'intégrité des motifs structuraux élémentaires des peptides, polypeptides ou protéines codés par les polynucléotides doubles brins recombinés obtenus par le procédé de l'invention. Le repliement global des chaînes peptidiques, polypeptidiques ou protéiques et par voie de conséquence la fonctionnalité des peptides, polypeptides ou des protéines ne sont pas altérés.

L'utilisation d'amorces comprenant des séquences nucléotidiques complémentaires d'une séquence nucléotidique d'un vecteur de clonage et/ou d'expression dans l'étape (b) du procédé de l'invention, et éventuellement d'un ou plusieurs acides nucléiques simples brins tels que précédemment définis, dans l'étape (a) du procédé de l'invention permettent quant à eux de construire une banque de polynucléotides doubles brins recombinés capables de s'insérer directement dans un vecteur de clonage et/ou d'expression, par recombinaison homologue à l'intérieur d'un organisme hôte et d'exprimer et éventuellement sécréter directement les peptides, polypeptides ou les protéines pour lesquels les polynucléotides doubles brins recombinés codent.

L'étape d'amplification dans une bactérie, notamment E. coli étant désormais inutile, l'utilisateur gagne non seulement du temps mais évite aussi la perte éventuelle de séquences qui seraient toxiques dans la bactérie.

D'autres avantages et caractéristiques du procédé de l'invention apparaîtront des exemples qui suivent concernant la préparation d'une banque de défensines d'insectes recombinées présentant des propriétés antibactériennes améliorées et dans lesquels il sera fait référence aux dessins en annexe dans lesquels : - La figure 1 représente l'alignement des séquences peptidiques de 40 défensines d'insectes ; - La figure 2 représente la modélisation de la structure tridimensionnelle de la défensine du diptère Anopheles gambiae ; - La figure 3 représente la liste des séquences nucléotidiques simples brins chevauchants utilisées à l'étape (a) du procédé ; - La figure 4 représente la construction d'une banque de défensines d'insectes recombinées ; -La figure 5 représente le vecteur d'expression de levure S. cerevisiae pEM105 ; - La figure 6 représente les activités in vitro (IC90, CMI et CMB ; ug/ml) des défensines d'insecte hybrides contre les bactéries à Gram positif) ; - La figure 7 représente l'efficacité in vivo (pourcentage de survie et les scores moyens de santé par rapport aux jours post-infection) des défensines d'insectes recombinées ETD-P1255, ETD-P1263 et ETD-P1268 dans le modèle murin de péritonite à Staphylococcus aureus méthicilline-sensible avec administration par voie intra-péritonéale ; - La figure 8 représente l'efficacité in vivo (pourcentage de survie et les scores moyens de santé par rapport aux jours post-infection) des défensines

d'insectes recombinées ETD-P1255, ETD-P1263 et ETD-P1268 dans le modèle murin de péritonite à Staphylococcus aureus méthicilline-sensible avec administration par voie intra-veineuse ; - La figure 9 représente l'efficacité in vivo (pourcentage de survie et les scores moyens de santé par rapport aux jours post-infection) de la défensine d'insecte recombinée ETD-P1263 dans le modèle murin de péritonite à Staphylococcus aureus méthicilline- résistant avec administration par voie intra- péritonéale.

Exemple 1 : Préparation d'une banque de défensines d'insectes recombinées présentant des propriétés antibactériennes améliorées.

A) Construction de la banque de défensines d'insectes recombinées.

1) Choix des séquences nucléotidiques simples brins chevauchants et des acides nucléiques simples brins utilisés dans l'étape (a) du procédé.

La figure 1 en annexe représente l'alignement des séquences peptidiques de 40 défensines d'insectes (31 décrites dans la littérature et 9 nouvellement isolées par la demanderesse selon un procédé conventionnel connu de l'homme du métier, <BR> <BR> notifiées (*) ) issues de 6 ordres d'insectes différents.

L'analyse de l'alignement a permis de révéler la présence de 3 régions variables (en caractères gras, figure 1) séparées par des régions substantiellement conservées. 32 séquences différentes ont été identifiées pour la région variable n°l,

28 pour la région variable n°2 et 33 pour la région variable n°3. Comme l'expose la figure 2 en annexe, les régions variables n°l, n°2 et n°3 correspondent respectivement à la boucle N-terminale, à la boucle située entre l'hélice a et le premier brin ß et à la boucle C-terminale située entre les 2 brins P des défensines d'insectes.

Afin de préparer une banque de mutants associant ces différentes régions, la demanderesse a désigné et synthétisé 94 séquences nucléotidiques simples brins chevauchants qui couvrent la séquence de tout ou partie de polynucléotides codant une population de départ de défensines d'insectes (les résidus d'acides aminés entre parenthèses sur la figure 1 n'étant pas couverts par les séquences nucléotidiques simples brins chevauchants), pour obtenir à l'issu de l'étape (a) des polynucléotides doubles brins recombinés qui comprennent à leurs extrémités 5' (brin codant) la fin de la séquence pro du facteur MFa1 de S. cerevisiae et à leurs extrémités 3' (brin codant) le début de la séquence du terminateur de transcription du gène PGK1. Chacune de ces séquences nucléotidiques simples brins est constituée ou comprend : - un segment nucléotidique interne codant une séquence en acides aminés d'une des régions variables d'une des défensines d'insectes de la population de départ, ledit segment nucléotidique variable étant flanqué - en 5'par un segment nucléotidique codant la séquence en acides aminés de la région substantiellement conservée de la défensine du diptère Anopheles gambiae de la population de départ, qui est immédiatement adjacente à l'extrémité N terminale de la région variable, - en 3'par un segment nucléotidique codant la séquence en acides aminés de la région substantiellement conservée de la défensine du diptère Anopheles gambiae de la population de

départ, qui est immédiatement adjacente à l'extrémité C terminale de la région variable, ledit segment nucléotidique étant lui-mme éventuellement flanqué en 3'd'une séquence nucléotidique simple brin supplémentaire correspondant au début de la séquence du terminateur de transcription du gène PGK1.

Les séquences nucléotidiques simples brins chevauchants qui comprennent une séquence nucléotidique simple brin supplémentaire correspondant au début de la séquence du terminateur de transcription du gène PGK1 sont les séquences nucléotidiques simples brins chevauchants constituant les extrémités 3' (brin codant) des polynucléotides doubles brins recombinés, avant l'assemblage (a) c'est-à-dire celles qui sont constituées ou comprennent des segments nucléotidiques internes codant la séquence en acides aminés d'une des régions variables n°3 des défensines d'insectes de la population de départ.

La listes des séquences nucléotidiques simples brins chevauchants est exposée sur la figure 3. Les séquences nucléotidiques simples brins chevauchants sont décrites dans la liste de séquence sous les identificateurs de séquences SEQ ID NO : 1 à 94.

3 séries d'acides nucléiques simples brins ont également été synthétisés : EM363 (SEQ ID NO : 95), EM351 (SEQ ID NO : 96) et EM357 (SEQ ID NO : 97).

L'acide nucléique simple brin EM363 est constitué d'une première région qui est complémentaire de la séquence du segment nucléotidique codant la séquence en acides aminés de la région substantiellement conservée de la défensine du diptère Anopheles gambiae de la population de départ, qui est immédiatement adjacente à l'extrémité N terminale de la région variable n°l codée par le segment nucléotidique interne, des séquences nucléotidiques simples brins

chevauchants constituant l'extrémité 3' (brin codant) des polynucléotides doubles brins recombinés, avant l'assemblage (a). L'acide nucléique simple brin EM363 est également constitué d'une seconde région qui correspond à une première partie de la fin de la séquence pro du facteur MF (XL de S. cerevisiae.

L'acide nucléique simple brin EM351 est constitué d'une première région qui est complémentaire de la seconde région de l'acide nucléique EM363 et d'une seconde région qui correspond au reste de la fin de la séquence pro du facteur MFal de S. cerevisiae.

L'acide nucléique simple brin EM357 est constitué d'une première région qui est complémentaire de la séquence correspondant au début du terminateur de transcription du gène PGK1 des séquences nucléotidiques simples brins chevauchants constituant les extrémités 3' (brin codant) des polynucléotides doubles brins recombinés, avant l'assemblage (a). L'acide nucléique simple brin EM357 est également constitué d'une seconde région qui correspond au reste du début du terminateur de transcription du gène PGK1.

Les acides nucléiques simples brins EM351, EM357 et EM363 sont utilisés pour reconstituer des séquences permettant l'insertion des séquences nucléidiques simples brins assemblées dans l'étape (a) du procédé, dans le vecteur d'expression et de sécrétion de levure S. cerevisiae pEM105.

L'acide nucléique simple brin EM357 est également utilisé en tant qu'amorce dans l'étape (b) du procédé.

2) Etape d'assemblage (a) du procédé.

L'étape (a) d'assemblage est réalisée par PCR comme l'expose la figure 4 en annexe. Les acides nucléiques simples brins EM351, EM357 et EM363 sont utilisés à une concentration

de 10 picomoles dans un volume réactionnel final de 60ul.

Des mélanges de séquences nucléotidiques simples brins chevauchants sont utilisés à raison de 10 picomoles pour chacune des séries de séquences nucléotidiques simples brins suivantes : 0,31 picomoles par séquence nucléotidique simple brin constituée ou comportant un segment nucléotidique interne codant une séquence en acides aminés d'une des régions variables n°l d'une des défensines d'insectes de la population de départ ; 0,36 picomoles par séquence nucléotidique simple brin constituée ou comportant un segment nucléotidique interne codant une séquence en acides aminés d'une des régions variables n°2 d'une des défensines d'insectes de la population de départ et 0,30 picomoles par séquence nucléotidique simple brin constituée ou comportant un segment nucléotidique interne codant une séquence en acides aminés d'une des régions variables n°3 d'une des défensines d'insectes de la population de départ.

La réaction de PCR d'assemblage débute par la dénaturation à une température de 94°C pendant 3 minutes. Les étapes suivantes sont répétées 5 fois : i) dénaturation à une température de 94°C pendant 45 secondes, ii) hybridation à une température de 50°C pendant 45 secondes, iii) extension en présence d'une polymérase à une température de 72°C pendant 45 secondes.

La réaction PCR s'achève par une étape d'extension en présence d'une polymérase à une température de 72°C pendant 10 minutes.

A l'issu de l'étape (a), on obtient des polynucléotides doubles brins recombinés qui comprennent à leurs extrémités 5' (brin codant) la fin de la séquence pro du facteur MFa1 de

S. cerevisiae et à leurs extrémités 3' (brin codant) le début de la séquence du terminateur de transcription du gène PGK1.

3) Etape (b) du procédé.

Les polynucléotides doubles brins recombinés issus de l'étape (a) d'assemblage sont ensuite amplifiés en présence de 2 des amorces EM349 (SEQ ID NO : 98) et EM357 (SEQ ID NO : 97) (Figure 4). Ces deux amorces comprennent une séquence complémentaire respectivement de chacune des extrémités des polynucléotides doubles brins recombinés issus de l'étape (a) et une séquence de 30 nucléotides complémentaires des extrémités du vecteur d'expression de levure S. cerevisiae pEM105 linéarisé.

L'étape (b) du procédé de l'invention débute par la dénaturation à une température de 94°C pendant 3 minutes. Les étapes suivantes sont répétées 25 fois : i) dénaturation à une température de 94°C pendant 45 secondes, ii) hybridation à une température de 60°C pendant 45 secondes, iii) extension en présence d'une polymérase à une température de 72°C pendant 45 secondes.

La réaction d'amplification s'achève par une étape d'extension en présence d'une polymérase à une température de 72°C pendant 10 minutes.

L'étape (b) du procédé conduit à la génération de polynucléotides doubles brins recombinés présentant des extensions capables de s'hybrider avec les extrémités du vecteur d'expression de levure S. cerevisiae pEM105 linéarisé.

4) Construction de la banque d'expression par co- transformation d'une souche de levure S. cerevisiae.

Le vecteur d'expression de levure S. cerevisiae pEM105 (Figure 5) porteur du promoteur constitutif fort TDH3 (glycéraldéhyde 3 phosphate déshydrogénase) fusionné aux séquences codant pour les signaux de sécrétion pré de BGL2 (Béta-1, 3 glucanase) et pro du facteur MFa1 de S. cerevisiae et du terminateur de transcription du gène PGK1 (phosphoglycérate kinase) a été construit. Il porte également des séquences permettant sa réplication et sa sélection dans la levure (2p ori et URA3) et dans E. coli (ColEl ori et Ampr) ainsi que le gène KEX2 codant pour l'endoprotéase Yscf qui clive la pro séquence durant le processus de sécrétion (expression de KEX2 génomique insuffisante). Ce vecteur porte 2 sites de restriction uniques NheI et SalI permettant sa linéarisation. Le site Nhel est localisé dans la séquence codant pour le pro de MFa1 (mutation silencieuse introduite au niveau de la séquence codant pour les résidus 51 à 52 du pro de Meal) et le site SalI est en amont du terminateur PGK1. Une souche de levure YEM1 (MATa, ura3-A5, pral, prbl, prcl, cpsl) a été co-transformée par le plasmide pEM105 digéré par SalI et NheI et le pool de polynucléotides doubles brins recombinés présentant des extensions obtenus après l'étape (b) du procédé (lpg de pEM105 digéré par NheI et SalI + 115ng de fragment PCR par transformation). La transformation a été réalisée par la méthode à l'acétate de lithium connue de l'homme du métier. Les transformants ont été sélectionnés sur milieu sélectif YNBG supplémenté de 0,5% de casamino acides. En vue de vérifier la qualité de la banque, 100 transformants ont été analysés pour la production de peptide après croissance en milieu sélectif Kapeli (14,2g KH2PO4 SDS 2370017 ; 4g MgSO4 SDS 460012 ; 1, 6mL H3PO4 ; lmL d'une solution d'oligoéléments : 16g MnSO4, H20,0, 4g CuS04, 5H20,15g ZnS04, 7H20,2, 8g CoC12, 6H20,2, 48g Na2MoO4, 7,5g

H3B03, 0,2g Acide citrique, lg KC1, 2,5g NiS04,6H20, 25g Trisidium citrate 2H20, qsp 200mL ; 400mL glucose à 500g/L ; 1mL FeCl3/CaCl2 ; 500mL de Casaaminoacids à 200g/L ; 10mL d'une solution de vitamines : 0,2g Thiamine HCl, 0,5g Pyridoxine HC1, 0,8g Acide nicotinique, 0,005g D-Biotine, lg Ca-D-Pantothénate, 8g Méso Inositol, qsp 200mL ; qsp 5L). Les surnageants de culture récoltés après 48 heures de croissance ont été analysés par électrophorèse sur gel d'acrylamide (gel Tris-tricine) et coloration des protéines au nitrate d'argent. Une production de peptides a été détectée dans 65% de ces clones. 45 clones produisant des défensines d'insectes recombinées ont été analysés par séquençage nucléotidique. 45 défensines d'insectes recombinées différentes ont pu tre caractérisées : 22 séquences différentes parmi les 32 possibilités ont été identifiées pour la région variable n°l, 24 séquences différentes parmi les 28 possibilités ont été identifiées pour la région variable n°2 et 20 séquences différentes parmi les 33 possibilités ont été identifiées pour la région variable n°3.

B) Criblage ou sélection des défensines d'insectes recombinées présentant une activité contre les bactéries à Gram positif Staphylococcus aureus.

1) Culture et isolement.

La banque de défensines d'insectes recombinées obtenue selon le protocole précédemment décrit dans la partie A, est étalée sur des boîtes de Pétri (YNBG casamino acides agar).

Le nombre de clones par boîte est choisi de manière à former des colonies isolées. Ces colonies sont piquées et mises en culture automatiquement en microplaques 384 puits, dans 60ul de milieu (YNBG, casamino acides, 13% glycérol). Les plaques sont incubées à 30°C durant 72h, puis deux copies sont

stockées à-80°C, et une autre copie est conservée à 4°C avant de servir à la suite du processus.

2) Culture et production.

A partir d'une plaque 384 puits, on ensemence 4 plaques 96 puits DeepWell contenant lml de milieu de culture Kapeli.

Les plaques Deepwell sont couvertes d'une membrane perméable aux gaz et sont mises à incuber à 30°C sous agitation durant 96h. Au bout de 72h, on fait une adjonction de 100 pi de glucose à 500 g/1 par puits.

3) Purification.

On ajoute 1ml d'eau ultra pure stérile dans tous les puits des plaques 96 puits. Ces plaques sont ensuite centrifugées pendant 30 min à 4000 rpm et à 20°C. Le surnageant est purifié sur des plaques Oasis HLB (WATERS) : 1. 3ml de surnageant sont déposés sur chacune des 96 microcolonnes, soumises à un tirage sous vide pour faire passer le liquide. Un lavage avec 800 pi par colonne d'eau supplémentée à 0,05% de Trifluoroacétate (TFA). L'élution est réalisée avec 500 pi d'acétonitrile à 60% supplémenté de TFA à 0, 05%. L'éluat est récupéré dans une plaque DeepWell 96 puits lml.

4) Evaporation du solvant.

Le solvant d'élution est ensuite évaporé sous vide (30°C, 9 mbars, llh). Les plaques sont alors couvertes d'un film silicone autocollant et stockées à 4°C.

5) Analyse par Chromatographie Liquide à Haute Performance (CLHP) sur colonne de phase inverse : Contrôle de masse et quantification en vue des tests d'activité.

L'équivalent de 40 à 200 ul de surnageant purifié selon la précédente étape, est analysé par CLHP (type Alliance, Waters Associates) couplée à la spectrométrie de masse (type ZQ 2000, Waters Associates), pilotée par le logiciel Masslynx (Waters Associates). Les échantillons sont injectés de manière automatique et séquentielle (injecteur 2790, Waters Associates) sur une colonne analytique de type Uptisphère de 250 x 4,6 mm, remplie de silice avec un greffage C18 (phase inverse) de granulométrie de 5u et de porosité de 300 A° (Interchim). L'élution est réalisée par un gradient d'acétonitrile dans le TFA 0, 05% de 15 à 60 % en 30 min. avec un débit constant de 0,8 ml/min.

Le spectre UV (variation d'absorbance à 225 nm ; détecteur à barrette de diodes de type 996, Waters Associates) et le spectre de masse de chaque échantillon sont analysés individuellement. La masse correspondant à chaque pic du spectre UV est calculée par un logiciel de déconvolution (logiciel Transform, Waters Associates).

Lorsque la masse mesurée correspond à la masse théorique (gamme de 3500 à 5500 pour les défensines d'insectes), le pic d'intért est intégré par le logiciel Masslynx puis quantifié.

La quantification se fait par rapport à une courbe de calibration (aire du pic en fonction de la quantité d'échantillon) établie par injection de quantités connues de la défensine d'Anophèles gambiae dans les mmes conditions d'analyse. La quantification des défensines recombinées (en Fg) est calculée par intégration individuelle du pic du chromatogramme correspondant à chaque défensine recombinée.

6) Préparation de l'inoculum de Staphylococcus aureus.

Une préculture dans 4 ml de milieu LB, est obtenue par ensemencement d'une colonie de Staphylococcus aureus (souche

clinique 21, sensible à : amoxicilline, pristinamycine, érythromycine, péfloxacine, sulfaméthoxazole, triméthoprime, kanamycine, acide fusidique, fosfomycine, gentamycine, amikacine, rifampicine, oxacilline, teicoplanine, chloramphénicol, imipénème, vancomycine et méthicilline ; Don de l'Institut de Biologie Moléculaire et Cellulaire, Strasbourg), et incubée à 37°C sous agitation pendant 16h.

200 ul de cette préculture sont distribués dans 8 tubes de 4 ml de milieu LB, puis incubés 4h à 37°C sous agitation pour obtenir la solution primaire. Un inoculum est réalisé par dilution de cette solution primaire (environ au 1/100ème), de manière à obtenir une concentration en Staphylococcus aureus de 1,1. 106 bactéries/ml. Les concentrations sont calculées par mesure de la DO à 600 nm de la solution primaire selon la formule : Concentration en Staphylococcus aureus = 5,25. 108 x DO-3.107 (pour des DO allant de 0,05 à 0,3 environ) et contrôlées via une dilution en cascade (10-1, 10-2, 10-3,...) de la suspension à 2. 106/ml et comptage des Unités Formant Colonies (UFC) après étalement de 100 pL des dilutions 10-6, 10-5 et 10-4 sur des boîtes LB agar. Après incubation à 30°C pendant 16 à 18 heures, les colonies sont dénombrées (UFC/ml).

7) Criblage ou sélection des échantillons.

Les échantillons séchés sont repris dans 200ul d'eau et testés à 3 dilutions différentes : 40ul, 25ul et 16ul de ces échantillons sont distribués dans les plaques de test avant ajout de 180p1 d'inoculum par puits. Les microplaques sont incubées à 30°C durant 16 à 18h, puis la densité optique (DO) des puits est mesurée à 595 nm. Les résultats sont interprétés en calculant le pourcentage de pousse pour chaque puits selon la formule : % Pousse= (DO puits-DO du TS)/ (DO du TP-DO du TS) *100 où DO du TP= DO du témoin de pousse

(inoculum seul), DO du TS= DO du témoin de stérilité (milieu de culture sans bactéries) et DO puits = DO du puits dont on souhaite calculer le pourcentage de pousse (inoculum + défensine d'insecte recombinée). Les défensines d'insectes recombinées sont considérées comme actives lorsque le pourcentage de pousse est inférieur ou égal à 10.

Les polynucléotides double brin recombinés ETD-P1255, ETD- P1263, ETD-P1268, ETD-P1354, ETD-P1364, ETD-P1377, ETD-P1447 et ETD-P1449 sont décrits dans la liste de séquence sous les identificateurs de séquences SEQ ID NO : 99 à 106.

Les défensines d'insectes recombinées ETD-P1255, ETD-P1263, ETD-P1268, ETD-P1354, ETD-P1364, ETD-P1377, ETD-P1447 et ETD- P1449 sont décrites dans la liste de séquence sous les identificateurs de séquences SEQ ID NO : 107 à 114.

C) Activités anti-bactériennes in vitro.

Les activités anti-bactériennes de chacune des défensines d'insectes hybrides (ETD-P) ont été évaluées par détermination de l'IC90 (Inhibition de Croissance à 90%), de la Concentration Minimale Inhibitrice (CMI) et de la Concentration Minimale Bactéricice (CMB). Les activités de chacune des défensines hybrides sont comparées à celles de la défensine du diptère Anopheles gambiae ainsi qu'à celles d'antibiotiques conventionnellement utilisés (vancomycine et linezolide) testés dans les mmes conditions.

1) Isolement.

Les clones de défensines hybrides d'intért, identifiées selon le protocole précédemment décrit dans la partie B), sont repris d'un des stocks de microplaques 384 puits conservées à-80°C (partie B), paragraphe 1) ). Un

ensemencement est réalisé sur une gélose YNBG Casamino acides agar et placée dans un incubateur à 30°C pendant 48 à 72 heures. Après observation de l'état de pousse des levures, une colonie est isolée, étalée sur une boîte YNBG Casamino acides agar et incubée pendant 24 à 48 heures à 30°C.

L'expression est contrôlée par PCR.

2) Production.

Une préculture est préparée par mise en suspension d'une colonie dans 4mL de milieu Kapeli puis la préculture est incubée pendant 18 à 24 heures à 30°C sous agitation.

50mL de milieu Kapeli sont répartis dans des fioles de 500mL. La DO des précultures est mesurée à une dilution au 1/100ème (990 uL d'eau + 10 uL de préculture homogénéisée) pour déterminer la DO de la préculture non diluée. La préculture est ensuite diluée de façon à obtenir une solution de DO=0. 05 selon la formule : d=0.05/DO préculture non diluée. Un volume de la préculture, défini selon la formule V (préculture) =50/d, est ajouté aux 50mL de milieu Kapeli pour obtenir une solution de DO=0. 05. Les fioles sont mises à incuber à 30°C pendant 48H sous agitation (250rpm/min).

3) Purification.

La culture obtenue est centrifugée dans des tubes coniques à centrifuger 50mL pendant 15min à 4000tr/min. Le surnageant est transvasé dans un autre tube 50mL et est purifié avec le Sep-pack, sur Oasis HLB lg de phase selon les étapes suivantes : Equilibrage de la phase avec 15mL de méthanol pur, lavage avec 15mL de mélange eau/TFA 0.05%, chargement du surnageant à purifier, lavage avec 15mL de mélange eau/TFA 0.05% et élution avec lOmL de mélange eau/Acétonitrile 60%/TFA 0.05%. Le mélange Acétonitrile/H20 est évaporé sous vide (30°C, 9 mbars, 24 heures) puis les

échantillons sont repris dans 400uL d'eau et disposés sur un agitateur.

4) Quantification et contrôle de masse en vue des tests d'activité.

La quantification et le contrôle de masse est réalisé selon le protocole précédemment décrit dans la partie B), paragraphe 5).

5) Détermination des IC90.

La détermination des IC90 se fait par un test liquide en microplaques 96 puits. Le test est réalisé sur des souches bactériennes à Gram positif Staphylococcus aureus sensibles (souche clinique 21 ; Don de l'Institut de Biologie Moléculaire et Cellulaire, Strasbourg) et résistantes (souche clinique 4 ; Don du Dr. Gilles Prevost, Institut de Bactériologie, Strasbourg) de façon à obtenir un inoculum selon le protocole décrit dans la partie B) paragraphe 6).

100 ul d'échantillons à tester sont distribués en duplicats de façon à obtenir une gamme de concentration de 25 à 0,05 ug/ml dans les puits. Les échantillons sont ajoutés à de 100 ul de suspension bactérienne à 2. 106/ml dans chaque puits de façon à obtenir une concentration finale de 106/ml. Les plaques de microtitration sont incubées à 30°C pendant 16 à 18 heures. Les colonies sont dénombrées par comptage des UFC (Unités Formant Colonies) et le résultat est rapporté en UFC/ml. La densité optique des puits est mesurée à 600 nm et les résultats sont interprétés en calculant le pourcentage de pousse dans chaque puits selon la formule décrite partie B) paragraphe 7). Les inhibitions de croissance 90 (IC 90) sont les puits où le pourcentage de pousse est inférieur ou égal à 10%. Les résultats sont exposés dans la figure 6 en annexe.

6) Détermination des CMI et des CMB.

Les CMI (Concentrations Minimales Inhibitrices) et les CMB (Concentrations Minimales Bactéricides) ont été

déterminées sur les souches bactériennes à Gram positif suivantes : -Staphylococcus aureus sensible (souche clinique 21 ; Don de l'Institut de Biologie Moléculaire et Cellulaire, Strasbourg) ; -Staphylococcus aureus résistant (souche clinique 4 ; Don du Dr. Gilles Prevost, Institut de Bactériologie, Strasbourg) ; - Staphylococcus epidermidis sensible (souche clinique 34 ; Don de l'Institut de Biologie Moléculaire et Cellulaire, Strasbourg).

Les souches bactériennes sont issues de cultures sur milieu Mueller-Hinton gélosé au sang, fraîchement repiquées.

Une préculture de 3 ml en milieu Mueller-Hinton de chacune des souches est incubée à 35°C pendant 6 heures sous agitation.

Un inoculum de la souche désirée est préparé à partir de la préculture de 5-6 heures. L'inoculum est amené à une concentration de 2. 106 UFC/ml par dilution dans du milieu Mueller-Hinton. a) Détermination des CMI.

La détermination des CMI se fait par un test liquide en micro-plaques 96 puits (Costar 3599).

Les 60 puits centraux (puits notés B à G et 2 à 11) de la microplaque 96 puits sont utilisés. La colonne 1 de la microplaque sert de témoin de stérilité et la colonne 12 de témoin de pousse. Les lignes A2 à A11 et H2 à H11 servent soit de témoin de stérilité, soit de témoin de pousse.

100 pi de milieu Mueller-Hinton sont distribués dans les colonnes 3 à 12 et 200 pi dans la colonne 1. Lorsque les lignes A2 à Ail et H2 à H11 sont utilisées comme témoins de pousse, 100 pi de milieu Mueller-Hinton sont déposés dans les

puits. Lorsque les lignes A2 à All et H2 à Hll sont utilisées comme témoins de stérilité, 200 pi de milieu Mueller-Hinton sont déposés.

Les échantillons à tester (sous forme de poudre) sont mis en solution dans le solvant adéquat, de façon à avoir un volume minimum de 100 pi à 640 pg/ml. 400 pi de milieu Mueller-Hinton sont ajoutés aux solutions préparées pour obtenir des solutions de 500 pi à 128 ug/ml in fine. 200 pi de chacun des échantillons à tester (en solution à 128 ug/ml) sont ensuite distribués dans les puits (puits B2 et C2 de la colonne 2 pour le premier échantillon à tester, puits D2 et E2 pour le second échantillon à tester, etc...). Une dilution en cascade de 2 en 2 est réalisée à l'aide d'une pipette multicanaux. La dilution en cascade est réalisée en prélevant 100 pi d'échantillon en solution des puits de la colonne 2, en les déposant dans la colonne 3 qui contient 100 pi de milieu Mueller-Hinton et en mixant plusieurs fois, et ainsi de suite jusqu'à la colonne 11. Les 100 pi excédentaires de la colonne 11 sont jetés.

100 pi d'inoculum bactérien sont distribués dans les puits B2 à Gll, ainsi que dans la colonne témoin de pousse.

En ajoutant l'inoculum on effectue une dilution au dans chaque puits pour obtenir en final une gamme de concentration allant de 64 à 0.125 pg/ml. Des dilutions en cascade au l0ème de lO~là 10-6 de l'inoculum à 2. 106 UFC/ml sont réalisées, et 100 pi des dilutions 10-6, 10-5 et 10-4 sont étalés sur des boites de Muller-Hinton agar. La microplaque est incubée à 35-37°C durant 16 à 18 heures puis la densité optique de la microplaque est lue à 600-620 nm. Les boîtes de numération de l'inoculum (Muller-Hinton agar) sont incubées à 35-37°C durant 16 à 18 heures puis le comptage des CFU/ml de l'inoculum est effectué.

Les résultats sont interprétés en calculant le pourcentage de pousse dans chaque puits selon la formule : ((DO puits-Do moyenne témoin négatif) / (DO moyenne témoin positif-DO moyenne témoin négatif)) *100 La CMI est définie comme la concentration la plus faible pour laquelle 0 à 10% de pousse est obtenue. b) Détermination des CMB.

Les CMB sont déterminés à partir de la microplaque test.

100 ul de chaque puits de la microplaque qui ne présentent pas de trouble (pas de pousse bactérienne visible à l'oeil nu) ainsi que du puits à la concentration la plus élevée présentant un trouble visible (ceci pour chaque ligne) sont déposés sur milieu gélosé adéquat. Les boîtes sont incubées à 35-37°C pendant une nuit avant une numération en CFU/ml.

La CMB est définie comme la concentration la plus faible de drogue, donnant une numération bactérienne inférieure à 0.1% de l'inoculum de départ (soit une réduction de 3 valeurs logarithmiques).

Les résultats des CMI et des CMB sont exposés dans la figure 6 en annexe.

D) Efficacité in vivo.

1) Protocole-Modèle de péritonite à Staphylococcus aureus.

L'efficacité des différentes défensines d'insectes recombinanées (ETD-P), de la défensine d'Anopheles gambiae (DefA) et des antibiotiques conventionnels (Imipénème, IMP et Vancomycine, Van) a été évaluée in vivo chez la souris dans un modèle de péritonite à Staphylococcus aureus. Les échantillons testés ont été produits et purifiés selon le protocole précédemment décrit. Les souches de Staphylococcus

aureus méthicilline-sensibles (MSSA) (Souche clinique 21 ; Don de l'Institut de Biologie Moléculaire et Cellulaire, Strasbourg) ou méthicilline-résistantes (MRSA) (Souche clinique 4 ; Don du Dr. Gilles Prevost, Institut de Bactériologie, Strasbourg) sont mises en culture une nuit à 37°C dans du milieu Müller-Hinton. Les bactéries sont lavées et reprises dans une solution de NaCl 0.9%. Après quantification par mesure de DO à 600 nm, les bactéries sont diluées pour obtenir une densité bactérienne de 2.109 CFU/ml.

La suspension bactérienne est ensuite diluée au demi avec une solution de NaCl 0.9% contenant 10% de mucin gastrique.

Des groupes de 6 souris mâles OF1 de 19-20 g sont infectées par voie intra-péritonéale avec 500 pl de la suspension de S. aureus contenant 5.108 CFU dans du NaCl 0.9%, 5% mucin. Les traitements par les échantillons sont réalisés une heure après l'infection par une seule injection par voie intra-péritonéale ou intra-veineuse dans le cas des défensines (ETD-et DefA) et de la Vancomycine (Vanco), ou par voie sous-cutanée dans le cas de l'Imipénème (IMP). Des expériences témoins (placebo) sont réalisées systématiquement dans lesquelles les volumes d'échantillon sont remplacés par du NaCl 0, 9%. L'efficacité thérapeutique des traitements est évaluée par plusieurs critères : le pourcentage de survie au jour 7 après l'infection, l'évolution du poids corporel et du score de santé. Ce dernier paramètre, relatif à l'état de santé des souris, tient compte de l'état du pelage, de la mobilité, de l'état d'hydratation, de la présence ou non de diarrhée. Il est défini comme suit par une valeur de 0 à 5 : 0 = morte, 1 = moribonde, 2 = très malade, 3 = malade, 4 = légèrement malade et 5 = saine.

2) Comparaison de l'efficacité des défensines recombinées ETD-P1255, ETD-P1263 et ETD-P1268 avec celle de la défensine d'Anopheles gambiae (DefA) et de l'Imipénème

(IMP) dans le modèle de péritonite à Staphylococcus aureus méthicilline-sensible (MSSA).

-Administration par voieintra-péritonéale.

La figure 7 en annexe représente le pourcentage de survie et les scores moyens de santé par rapport aux jours post-infection. Dans cette expérience, la DefA et les 3 défensines recombinées administrées en dose unique de 3 mg/kg par voie intra-péritonéale, présentent une bonne efficacité thérapeutique dans un modèle où toutes les souris témoins traitées par le placebo (NaCl 0,9%) sont mortes 2 à 5 jours après l'infection. Seule 1 souris sur 6 est morte dans les groupes traités par la DefA, ETD-1263 et ETD-1268. Aucune mortalité n'a été observée dans le groupe traité par ETD- P1255. L'analyse des scores de santé et de l'évolution pondérale, montre qu'ETD-P1255 et ETD-P1263 sont plus actifs que la DefA : les souris traitées par ETD-P1263 et ETD-P1255 récupèrent plus rapidement que les souris traitées par les autres défensines recombinées, avec un score de santé moyen de 4 à 5 dès le premier jour suivant l'infection.

- Administration par voie intra-veineuse.

La figure 8 en annexe représente le pourcentage de survie et les scores moyens de santé par rapport aux jours post-infection. Dans cette expérience, la DefA et les 3 défensines recombinées administrées en dose unique de 3 mg/kg par voie intra-veineuse, présentent une efficacité thérapeutique plus faible comparativement à leur administration par voie intra-péritonéale. Alors que 50% des souris traitées par le placebo (NaCl 0, 9%) sont mortes 3 jours après l'infection, seul le traitement par l'ETD-P1263 est totalement efficace avec une reprise de poids dès 2ème jour après l'infection et un score de santé maximal (5/5) au jour 5 après l'infection. ETD-P1255 présente une bonne efficacité en termes de survie avec 84 % de survie comparé à

67% pour les groupes traités par la DefA et les autres défensines recombinées. L'analyse des courbes de poids et des scores de santé montre toutefois qu'ETD-1255 est moins efficace que la DefA.

3) Comparaison de l'efficacité de la défensine recombinée ETD-1263 avec celle de la défensine d'Anopheles gambiae (DefA) et de la Vancomycine (Van) dans le modèle de péritonite à Staphylococcus aureus méthicilline-résistante (MRSA) -Administration par voie intra-péritonéale.

La figure 9 en annexe représente le pourcentage de survie et les scores moyens de santé par rapport aux jours post-infection. Dans un modèle où 100% des souris traitées par le placebo (NaCl 0,9%) sont mortes au jour 3 après l'infection, ETD-1263 présente une très bonne efficacité thérapeutique à une dose de 3 mg/kg administrée par voie intra-péritonéale. A l'exception d'une souris morte, toutes les souris traitées ont repris rapidement du poids et retrouvent un bon état de santé dès le 2ème jour après l'infection. L'efficacité d'ETD-P1263 à la dose de 3 mg/kg est comparable à celle de la DefA à la dose de 10 mg/kg et de la Vancomycine à la dose de 10 ou 30 mg/kg, l'évolution du poids et des scores de santé étant très similaire pour ces quatre groupes de traitement.