Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR PRODUCING IN VIVO PROTEINS CHEMICALLY DIVERSIFIED BY INCORPORATING NON-STANDARD AMINO ACIDS
Document Type and Number:
WIPO Patent Application WO/2000/024922
Kind Code:
A1
Abstract:
The invention concerns processes enabling prokaryotic or eukaryotic cells to acquire the capacity to produce proteins whereof the amino acid sequences comprise at least a non-standard amino acid, methods for selecting said cells, methods for producing and purifying said proteins and cells and proteins obtained by said methods and processes. The invention also concerns uses of said cells and proteins in various fields such as therapeutics, cosmetics, diagnosis or biosynthesis or biodegradation of organic compound.

Inventors:
MARLIERE PHILIPPE (FR)
DOERING VOLKER (FR)
MOOTZ HENNING (DE)
Application Number:
PCT/FR1999/002628
Publication Date:
May 04, 2000
Filing Date:
October 28, 1999
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
PASTEUR INSTITUT (FR)
MARLIERE PHILIPPE (FR)
DOERING VOLKER (FR)
MOOTZ HENNING (DE)
International Classes:
C12N15/09; A61K8/72; A61K38/00; A61P3/10; A61P31/04; A61P31/12; A61P35/00; A61P39/00; A61P43/00; C07K1/22; C07K14/245; C12N1/00; C12N1/21; C12N15/10; C12N15/67; C12P21/02; A61K48/00; C12R1/19; (IPC1-7): C12P21/02
Other References:
LEMEIGNAN B. ET AL.: "Phenotypic suppression by incorporation of an alien amino acid", JOURNAL OF MOLECULAR BIOLOGY, vol. 231, no. 2, May 1993 (1993-05-01), pages 161 - 166, XP002113371
DÖRING V. ET AL.: "Reassigning Cysteine in the Genetic Code of Escherichia coli", GENETICS, vol. 150, no. 2, October 1998 (1998-10-01), pages 543 - 551, XP002113372
BAIN J.D. ET AL.: "Ribosome-mediated incorporation of a non-standard amino acid into a peptide through expansion of the genetic code", NATURE, vol. 356, 9 April 1992 (1992-04-09), pages 537 - 539, XP002113373
IBBA M.: "STRATEGIES FOR IN VITRO AND IN VIVO TRANSLATION WITH NON-NATURAL AMINO-ACIDS", BIOTECHNOLOGY AND GENETIC ENGINEERING REVIEWS, vol. 13, 1996, ISSN: 0264-8725, pages 197 - 216, XP002109693
Attorney, Agent or Firm:
Martin, Jean-jacques (rue de Chazelles Paris Cedex 17, FR)
Download PDF:
Claims:
REVENDICATIONS
1. Méthode permettant à des cellules d'acquérir la capacité de produire une protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel, caractérisée en ce qu'elle comprend les étapes suivantes: a) la transformation desdites cellules par au moins une introduction d'une mutation fauxsens au niveau d'un codon cible d'un gène codant pour une protéine nécessaire à la croissance desdites cellules, ladite protéine synthétisée à partir du gène ainsi mute n'étant plus fonctionnelle; b) le cas échéant la culture des cellules obtenues à l'étape a) dans un milieu de culture contenant un nutriment compensant la perte de fonctionnalité de ladite protéine ainsi mutée; et c) la culture des cellules obtenues à l'étape a) ou b) dans un milieu de culture contenant I'acide amine code par ledit codon cible.
2. Méthode selon la revendication 1, caractérisée en ce que le milieu de culture de l'étape c) ne contient pas le nutriment nécessité par la perte de fonctionnalité de ladite protéine mutée.
3. Méthode selon l'une des revendications 1 et 2, caractérisée en ce que l'étape c) de culture desdites cellules comprend une série de cultures desdites cellules dans un milieu de culture contenant I'acide amine code par ledit codon cible, chacune desdites cultures de la série étant effectuée jusqu'a obtention de la phase stationnaire de croissance et suivie d'un lavage des cellules obtenues, le nombre de cultures de la série étant suffisant pour permettre la sélection de mutations augmentant la suppression de ladite mutation fauxsens dudit gène mute.
4. Méthode selon l'une des revendications 1 à 3, caractérisée en ce que la mutation fauxsens est choisie parmi les mutations fauxsens qui ne reversent spontanément qu'a une très faible fréquence, de l'ordre d'un organisme parmi au moins 1015.
5. Méthode selon l'une des revendications 1 à 4, caractérisée en ce que la mutation fauxsens transforme un codon cible d'un gène codant pour une protéine nécessaire à la croissance de ladite cellule en un codon qui comparativement au codon cible présente un changement d'au moins deux bases, de préférence trois bases.
6. Méthode selon l'une des revendications 1 à 5, caractérisée en ce que le codon cible code pour un acide amine de faible volume stérique.
7. Méthode selon l'une des revendications 1 à 6, caractérisée en ce que le codon cible code pour un acide amine amphiphile.
8. Méthode selon l'une des revendications 1 à 7, caractérisée en ce que le codon cible code pour un acide amine dont le volume stérique est inférieur ou sensiblement égal au volume stérique de I'acide amine code par la mutation fauxsens.
9. Méthode selon l'une des revendications 5 à 8, caractérisée en ce que le codon cible code pour la cysteine.
10. Méthode selon l'une des revendications 5 à 9, caractérisée en ce que I'acide amine code par la mutation fauxsens est la valine ou l'isoleucine.
11. Méthode selon l'une des revendications 1 à 10, caractérisée en ce que l'étape a) de transformation desdites cellules est réalisée au moyen d'un vecteur comprenant une séquence dudit gène codant pour une protéine nécessaire à la croissance desdites cellules comportant ladite mutation fauxsens.
12. Méthode selon la revendication 11, caractérisée en ce que ledit vecteur est un vecteur plasmidique.
13. Méthode de sélection de cellules capables de produire une protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel caractérisée en ce qu'elle comprend les étapes a), le cas échéant b), et c) d'une méthode selon l'une des revendications 1 à 12, et la sélection des cellules capables de croitre à l'étape c).
14. Méthode de sélection de cellules selon la revendication 13, caractérisée en ce qu'elle comprend en outre une étape d) de culture des cellules obtenues à l'étape c) dans un milieu de culture contenant ledit acide amine code par ledit codon cible, la concentration dudit acide aminé pouvant tre à une concentration superieure à la concentration dudit acide amine utilisée à l'étape c), et le choix des cellules sensibles à la concentration dudit acide amine utilisée à l'étape d).
15. Méthode de sélection de cellules selon l'une des revendications 13 et 14, caractérisée en ce que I'aminoacyltRNA synthétase reconnaissant I'acide amine code par ladite mutation fauxsens desdites cellules sélectionnées est capable de charger sur un de ses tRNA associes un acide amine non conventionnel ou un acide amine autre que ledit acide amine code par ladite mutation fauxsens.
16. Méthode de sélection de cellules selon la revendication 15, caractérisée en ce que la séquence nucléique du gène codant pour ladite aminoacyltRNA synthétase comporte au moins une mutation comparée à la séquence du gène sauvage correspondant.
17. Méthode de sélection de cellules selon la revendication 16, caractérisée en ce que ladite mutation n'a pas été introduite par une technique de recombinaison génétique.
18. Cellule obtenue par une méthode selon l'une des revendications 1 à 17.
19. Cellule isolée capable de produire une protéine dont la séquence d'acides amines comprend au moins un acide aminé non conventionnel, caractérisée en ce qu'elle comprend une aminoacyltRNA synthétase reconnaissant un acide amine donne capable de charger sur un de ses tRNA associes un acide amine non conventionnel ou un acide amine autre que ledit acide amine donne, et en ce que la séquence nucléique du gène codant pour ladite aminoacyltRNA synthétase comporte au moins une mutation comparée à la séquence du gène sauvage correspondant, ladite mutation n'ayant pas été introduite par une technique de recombinaison génétique.
20. Cellule selon la revendication 18 ou 19, caractérisée en ce qu'il s'agit d'une cellule procaryote ou eucaryote.
21. Cellule selon la revendication 20, caractérisée en ce qu'il s'agit d'une cellule procaryote.
22. Cellule selon l'une des revendications 18 à 21, caractérisée en ce qu'elle est choisie parmi les cellules suivantes déposées à la CNCM (Collection Nationale de Culture de Microorganismes, Paris, France): a) souche E. coli deposee a la CNCM sous le N° I2025 le 25 mai 1998, b) souche E. coR déposée à la CNCM sous le N° I2026 le 25 mai 1998, et c) souche E. coli deposee a la CNCM sous le N° I2027 le 25 mai 1998. d) souche E. coli deposee a la CNCM sous le N° I2339 le 26 octobre 1999, e) souche E. coli deposee a la CNCM sous le N° I2340 le 26 octobre 1999, et souche E. coli deposee a la CNCM sous le N° 12341 le 26 octobre 1999.
23. Utilisation d'une méthode selon l'une des revendications 1 à 17 pour la production de protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel.
24. Utilisation d'une cellule selon l'une des revendications 18 à 22 pour la production de protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel.
25. Procédé de production d'une protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel, caractérisé en ce qu'il comprend les étapes suivantes: a) le cas échéant, la sélection d'une cellule par une méthode selon l'une des revendications 13 à 17; b) la culture de ladite cellule sélectionnée à l'étape a) ou d'une cellule selon l'une des revendications 18 à 22 dans un milieu de culture et des conditions de culture permettant la croissance de ladite cellule; et c) I'isolement de ladite protéine comprenant au moins un acide amine non conventionnel a partir du surnageant de culture et/ou du culot cellulaire obtenu à l'étape b).
26. Procédé selon la revendication 25, caractérisé en ce que ledit milieu de culture de l'étape b) permettant la croissance de ladite cellule contient ledit acide amine non conventionnel ou un de ses précurseurs.
27. Procédé selon la revendication 25, caractérisé en ce que ledit acide amine non conventionnel est synthétisé par ladite cellule.
28. Procédé selon la revendication 27, caractérisé en ce que la synthèse dudit acide amine non conventionnel est augmentée par modification génétique de ladite cellule.
29. Procédé selon l'une des revendications 25 à 28, caractérisé en ce que ladite cellule est auxotrophe pour I'acide amine code par ledit codon cible.
30. Procédé selon l'une des revendications 25 à 29, caractérisé en ce que ladite cellule comprend un gène d'intért homolpgue ou hétérologue dont la séquence codante comporte au moins un codon cible.
31. Procédé selon la revendication 30, caractérisé en ce l'étape b) comprend les composes nécessaires à l'induction de la synthèse de la protéine codée par ledit gène d'intért.
32. Procédé selon la revendication 30 ou 31, caractérisé en ce que l'activité biologique de la protéine codée par ledit gène d'intért est au moins partiellement conservee apres l'incorporation dudit acide amine non conventionnel au niveau du codon cible dudit gène d'intért.
33. Procédé selon l'une des revendications 25 à 32, caractérisé en ce que I'acide amine non conventionnel est choisi parmi les acides amines non conventionnels de formule I de configuration L dans laquelle: Ri ou R2 represente des radicaux contenant un groupe fonctionnel capable de réagir de manière sélective.
34. Procédé selon la revendication 33, caractérisé en ce que le groupe fonctionnel est choisi parmi les groupes aldéhyde, cétone, ethenyle, éthynyle ou nitrile.
35. Procédé selon l'une des revendications 25 à 34, pour la fonctionnalisation de proteine.
36. Procédé de purification de proteine, caractérisé en ce qu'il comprend les étapes suivantes: a) I'incorporation dans la séquence d'acides amines de ladite protéine d'un acide amine non conventionnel contenant un groupe fonctionnel capable de réagir de manière sélective par un procédé selon l'une des revendications 25 à 35; b) la mise en contact de la solution contenant la protéine obtenue à l'étape a) avec un support comprenant un compose capable de réagir spécifiquement avec ledit groupe fonctionnel et de fixer spécifiquement ladite protéine; et c) I'isolement de ladite protéine fixée sur le support.
37. Procédé de fixation d'une protéine sur un compose chimique ou biochimique, caractérisé en ce qu'il comprend les étapes suivantes: a) I'incorporation dans la séquence d'acides amines de ladite protéine par un procède. selon l'une des revendications 25 à 35 d'un acide amine non conventionnel contenant un groupe fonctionnel capable de réagir de manière sélective; b) la mise en contact de la protéine obtenue à l'étape a) avec ledit compose chimique ou biochimique comprenant un groupe capable de réagir spécifiquement avec ledit groupe fonctionnel dans un milieu permettant la réaction.
38. Procédé selon la revendication 37, caractérisé en ce que ledit compose chimique ou biochimique est luimme fixe sur un support solide ou est un compose constitutif d'un support solide.
39. Procédé selon la revendication 37 pour la préparation d'un complexe protéique.
40. Procédé selon la revendication 39, caractérisé en ce que la protéine fixée ou le compose chimique ou biochimique est choisi parmi les composes thérapeutiques, cosmétiques ou diagnostiques.
41. Procédé selon la revendication 39 ou 40, caractérisé en ce que le compose chimique ou biochimique est choisi parmi les composes capables de modifier l'activité biologique de la protéine fixee.
42. Procédé selon la revendication 39 ou 40, caractérisé en ce que le compose chimique ou biochimique est choisi parmi les composes dont l'activité biologique peut tre modifiée par la protéine fixée.
43. Procédé selon l'une des revendications 39 à 42, caractérisé en ce que le compose chimique ou biochimique est choisi parmi les composes comprenant une proteine, un polynucléotide, un acide gras, un sucre ou un polymère naturel ou synthétique.
44. Protéine obtenue par un procédé selon l'une des revendications 25 à 36.
45. Protéine selon la revendication 44, caractérisée en ce qu'il s'agit d'une protéine recombinante.
46. Complexe protéique obtenu par un procédé selon l'une revendications 39 a 43.
47. Utilisation d'une protéine selon la revendication 44 ou 45, ou d'un complexe protéique selon la revendication 46 comme réactif de diagnostic.
48. Procédé de diagnostic, caractérisé en ce qu'il met en oeuvre une protéine selon la revendication 44 ou 45, ou un complexe protéique selon la revendication 46.
49. Nécessaire de diagnostic, caractérisé en ce qu'il contient une protéine selon la revendication 44 ou 45, ou un complexe protéique selon la revendication 46.
50. Utilisation d'une protéine selon la revendication 44 ou 45, d'un complexe protéique selon la revendication 46 ou d'une cellule selon l'une des revendications 18 à 22 pour la préparation d'une composition pharmaceutique ou cosmétique.
51. Composition pharmaceutique ou cosmétique comprenant une protéine selon la revendication 44 ou 45, un complexe protéique selon la revendication 46 ou une cellule selon l'une des revendications 18 à 22.
Description:
PROCEDE DE PRODUCTION IN VIVO DE PROTEINES CHIMIQUEMENT DIVERSIFIEES PAR INCORPORATION D'ACIDES AMINES NON CONVENTIONNELS La présente invention a pour objet des méthodes permettant à des cellules procaryotes ou eucaryotes d'acquérir la capacité de produire des protéines dont les séquences d'acides amines comprennent au moins un acide amine non conventionnel, des méthodes de sélection desdites cellules, des procédés de production et de purification desdites protéines ainsi que les cellules et les protéines obtenues par les méthodes et procédés selon l'invention. L'invention comprend également les applications desdites cellules et protéines dans différents domaines tels que le domaine thérapeutique, cosmétique, diagnostic ou de la biosynthèse ou la biodégradation de compose organique.

Un nombre croissant de protéines produites massivement par des organismes recombinants sont employées comme catalyseurs dans l'industrie chimique ou comme agents thérapeutiques. La recherche de nouvelles protéines aux fonctions diversifiées est l'objet d'une activité intense, soit en criblant les protéines d'organismes extrmophiles, soit en créant des variants protéiques par mutagenèse et criblage.

Toutefois, la variabilité chimique des protéines qui peuvent tre produites dans des organismes vivants reste limitée par l'invariance du code génétique, c'est-a-dire restreinte aux combinaisons d'un jeu canonique de 20 acides amines. Si la descendance des espèces naturelles pouvait etre progressivement remodecée dans le laboratoire de manière à adopter différents codes genetiques, I'evolution des protéines pourrait tre redirigée et des sources artificielles de biodiversité ainsi établies.

La déviation expérimentale du code génétique est la seule voie qui permettrait de surmonter cette limitation. Un autre code génétique pourrait spécifier un ensemble plus ou moins grand d'acides amines, un ensemble substitue par des monomères non canoniques ou un ensemble d'acides amines canoniques parmi lesquels les codons sont redistribues. La spécification d'acides amines supplémentaires dans des lignées vivantes se prterait à de multiples applications dont la plus générique serait l'établissement d'une biodiversité artificielle.

L'incorporation, permanente ou transitoire, d'un seul acide amine supplémentaire, portant un motif chimique qui pourrait réagir sans modifier les acides amines conventionnels, suffirait à fonder de nouvelles méthodes de fonctionnalisation de proteine. Ceci est justement l'objet de la présente invention.

L'invention a pour objet une méthode permettant à des cellules d'acquérir la capacité de produire-une protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel, caractérisée en ce qu'elle comprend les étapes suivantes: a) la transformation desdites cellules par au moins une introduction d'une mutation faux-sens au niveau d'un codon cible d'un gène codant pour une protéine nécessaire à la croissance desdites cellules, ladite protéine synthétisée à partir du gène ainsi mute n'étant plus fonctionnelle; b) le cas échéant la culture des cellules obtenues à l'étape a) dans un milieu de culture contenant le nutriment exige par la perte de fonctionnalité de ladite protéine ainsi mutée; et c) la culture des cellules obtenues à l'étape a) ou b) dans un milieu de culture contenant l'acide aminé codé par ledit codon cible.

On entendra désigner dans la présente description par le terme de protéine également les peptides ou les polypeptides, ainsi que les glycoprotéines correspondantes lorsque lesdites protéines sont glycosylees.

On entendra également désigner dans la présente description par acide amine non conventionnel tout acide amine autre que les acides amines incorpores par les ribosomes au cours de la biosynthèse des protéines synthétisées par les organismes unicellulaires ou pluricellulaires procaryotes ou eucaryotes, ainsi que tout acide amine incorpore à la place de I'acide amine devant tre normalement incorpore à cette place au regard de la séquence nucléique traduite.

On entendra également désigner dans la présente description par mutation faux-sens, une mutation qui transforme un codon qui représente un acide amine en un codon qui code pour un autre acide amine, ce dernier, le cas échéant, ne pouvant remplacer I'acide amine d'origine pour donner une protéine fonctionnelle dans la protéine à la place du résidu d'acide amine d'origine.

On entendra également désigner dans la présente description par protéine nécessaire a la croissance de cellules, une protéine qui lorsqu'elle est synthétisée par les cellules de manière fonctionnelle permet auxdites cellules de croître dans des conditions de culture données et qui lorsqu'elle est synthétisée par les cellules de manière non fonctionnelle nécessite l'introduction d'un nutriment supplémentaire dans ledit milieu de culture donne pour permettre auxdites cellules de croître. De telles protéines non fonctionnelles peuvent tre par exemple synthétisées par des cellules suite à des mutations conditionnelles telles qu'une mutation de type photosensible.

Afin d'illustrer par un exemple, mais sans s'y limiter, on peut citer notamment la protéine thymidylate synthase de E. coli qui presente un site catalytique occupe par la cystéine au niveau de la position 146 de sa séquence d'acides amines et dont les mutations correspondantes du gène (thyA) causent une exigence nutritionnelle pour la thymine ou la thymidine, aucun autre acide amine ne pouvant remplacer la cystéine à ce site.

On entendra désigner dans la présente description par codon cible, le codon de trois bases nucléotidiques transforme par la mutation faux-sens.

L'invention comprend également une méthode selon l'invention, caractérisée en ce que le milieu de culture de l'étape c) ne contient pas le nutriment exige par la perte de fonctionnalité de ladite protéine mutée.

Selon l'invention, I'etape c) de culture desdites cellules peut comprendre une série de cultures desdites cellules dans un milieu de culture contenant I'acide amine code par ledit codon cible, chacune desdites cultures de la série étant effectuée jusqu'a obtention de la phase stationnaire de croissance et suivie d'un lavage des cellules obtenues, le nombre de cultures de la série étant suffisant pour permettre la sélection de mutations augmentant la suppression de ladite mutation faux-sens dudit gène mute et la propagation de l'allèle correspondant audit gène mute.

L'invention concerne en outre une méthode selon l'invention, caractérisée en ce que la mutation faux-sens est choisie parmi les mutations faux-sens qui ne reversent spontanément qu'a une très faible fréquence, de l'ordre d'un organisme parmi au moins 1015.

De préférence, la mutation faux-sens sera choisie parmi les mutations faux- sens qui transforment un codon cible d'un gène codant pour une protéine nécessaire à la croissance de ladite cellule en un codon qui comparativement au codon cible présente un changement d'au moins deux bases, de manière plus préférée trois bases.

On préfère également les méthodes selon l'invention, caractérisées en ce que le codon cible code pour un acide amine de faible volume stérique et/ou amphiphile et/ou de volume stérique inférieur ou sensiblement égal au volume stérique de I'acide amine code par la mutation faux-sens.

Parmi les codons cibles, on prefere notamment les codons cibles codant pour la cystéine et les mutations faux-sens choisies parmi les mutations faux-sens qui transforment un codon cible en un codon codant pour la valine ou l'isoleucine.

L'invention concerne en outre une méthode selon l'invention, caractérisée en ce que l'étape a) de-transformation desdites cellules est réalisée au moyen d'un vecteur

comprenant une séquence dudit gène codant pour une protéine nécessaire à la croissance desdites cellules comportant ladite mutation faux-sens, notamment au moyen d'un vecteur plasmidique.

De tels vecteurs seront préparés selon les méthodes couramment utilisées par l'homme du métier, et les clones en résultant peuvent etre introduits dans lesdites cellules par des méthodes usuelles de recombinaison génétique telles que par exemple la lipofection, I'electroporation ou le choc thermique.

Sous un autre aspect, I'invention a pour objet une méthode de sélection de cellules capables de produire une protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel caractérisée en ce qu'elle comprend les étapes a), le cas échéant b), et c) d'une méthode selon l'invention, et la sélection des cellules capables de croître à l'étape c).

De manière préférée, la méthode de sélection de cellules selon l'invention, comprendra en outre une étape d) de culture des cellules obtenues à i'étape c) dans un milieu de culture contenant ledit acide amine code par ledit codon cible, la concentration dudit acide amine pouvant tre à une concentration supérieure à la concentration dudit acide amine utilisée à l'étape c), et le choix des cellules sensibles a la concentration dudit acide amine utilisée à l'étape d).

On entend désigner par cellule sensible à un compose chimique ou biochimique ou à une concentration donnée dudit compose, une cellule dont la croissance est partiellement ou totalement inhibée lorsqu'elle est cultivée dans un milieu de culture contenant ledit compose chimique ou biochimique ou ladite concentration dudit compose.

L'invention comprend également une méthode de sélection de cellules selon l'invention, caractérisée en ce que I'aminoacyl-tRNA synthétase reconnaissant l'acide amine code par ladite mutation faux-sens desdites cellules séiectionnées est capable de charger sur un de ses tRNA associes un acide amine non conventionnel ou un acide amine autre que ledit acide amine code par ladite mutation faux-sens.

On entendra désigner dans la présente description par tRNA associe, un tRNA qui est reconnu par I'aminoacyl-tRNA synthétase reconnaissant un acide amine et qui peut transférer ledit acide amine.

L'invention comprend en outre une méthode de sélection de cellules mutantes selon l'invention, caractérisée en ce que la séquence nucléique du gène codant pour ladite aminoacyl-tRNA synthétase comporte au moins une mutation comparée a la

séquence du gène sauvage correspondant, ladite mutation n'ayant pas été introduite par une technique de recombinaison génétique.

Selon un autre aspect, I'invention a pour objet les cellules procaryotes ou eucaryotes obtenues par une méthode selon l'invention.

Parmi les cellules utilisables a ces fins, on peut citer bien entendu les cellules bactériennes telles que E. coli, mais également les cellules de levure, de mme que les celluies animales, en particulier les cultures de cellules de mammifères, comme notamment les cellules d'ovaire de hamster chinois (CHO), mais également les cellules d'insectes.

L'invention concerne également les cellules procaryotes ou eucaryotes isolées capables de produire une protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel, caractérisées en ce qu'elles comprennent une aminoacyl-tRNA synthétase reconnaissant un acide amine donne capable de charger sur un de ses tRNA associes un acide amine non conventionnel ou un acide amine autre que ledit acide amine donne, et en ce que la séquence nucléique du gène codant pour ladite aminoacyl-tRNA synthétase comporte au moins une mutation comparée à la séquence du gène sauvage correspondant, ladite mutation n'ayant pas été introduite par une technique de recombinaison génétique.

Ainsi, l'invention conceme une méthode de sélection de cellules basée sur la constitution par la cellule d'une voie métabolique nécessaire à sa croissance permettant d'obtenir des cellules capables de produire un acyl-tRNA non canonique capable de charger un acide amine non conventionnel.

Parmi les cellules selon l'invention, on préfère les cellules de bactérie, caractérisées en ce qu'elles sont choisies parmi les cellules suivantes déposées à la CNCM (Collection Nationale de Culture de Microorganismes, Paris, France): a) souche E. coli deposee a la CNCM sous le N° 1-2025 le 25 mai 1998, b) souche E. coli deposee a la CNCM sous le N° 1-2026 le 25 mai 1998, c) souche E. coli deposee a la CNCM sous le N° 1-2027 le 25 mai 1998, d) souche E. coli deposee a la CNCM sous le N° 1-2339 le 26 octobre 1999, e) souche E. coli deposee a la CNCM sous le N° 1-2340 le 26 octobre 1999, et souche E. coli deposee a la CNCM sous le N° 1-2341 le 26 octobre 1999.

La souche E. coli K12, deposee a la CNCM sous le N° 1-2025 et identifiée sous la référence, 85366, est un descendant de la souche MG1655 (wt E. coli K12), comportant les caractéristiques suivantes:

-deletion au locus thyA et remplacement par un gène de résistance à t'erythromycine, -porte un plasmide pTZ18 (col E1 replicon, bla+) avec l'allèle Cys146GUA de la thymidylate synthase.

La souche E. coli K12, deposee a la CNCM sous le N° 1-2026 et identifiée sous la référence ß8144, est un descendant de la souche MG1655 (wt E. coli K12), comportant les caractéristiques suivantes: -délétion au locus thyA et remplacement par un gène de résistance à t'erythromycine, -porte un plasmide pTZ18 (col E1 replicon, bla+) avec l'allèle Cys146GUA de la thymidylate synthase.

La souche E. coli K12, deposee a la CNCM sous le N° 1-2027 et identifiée sous la référence ß8146, est un descendant de la souche MG1655 5WT E. coli K12), comportant les caractéristiques suivantes: -deletion au locus thyA et remplacement par un gène de résistance à t'erythromycine, -porte un plasmide pTZ18 (col E1 replicon, bla+) avec I'allele Cys146GUA de la thymidylate synthase.

La souche E. coli K12, deposee a la CNCM sous le N° 1-2339 et identifiée sous la référence (35479, est un descendant de la souche MG1655 (wt E. coli K12), comportant les caractéristiques suivantes: -deletion au locus thyA et remplacement par un gène de résistance à l'érythromycine, -deletion au locus nrdD et remplacement par un gène de résistance à la kanamycine, -porte l'allèle R223H du gène valS, -porte un plasmide pTZ18 (col E1 replicon, bla+) avec I'allele Cys146GUA de la thymidylate synthase.

La souche E. coli K12, deposee a la CNCM sous le N° 1-2340 et identifiée sous la référence (35485, est un descendant de la souche MG1655 (wt E. coli K12), comportant les caractéristiques suivantes: -deletion au locus thyA et remplacement par un gène de résistance à t'erythromycine, -délétion au locus nrdD et remplacement par un gène de résistance à la kanamycine,

-porte l'allèle chromosomique Val 276 Ala du gène valS, -porte un plasmide pTZ18 (col E1 replicon, bla+) avec l'allèle Cys146GUA de la thymidylate synthase.

La souche E. coli K12, deposee a la CNCM sous le N° 1-2341 et identifiée sous la référence p5486, est un descendant de l, souche MG1655 (wt E. coli K12) comportant les caractéristiques suivantes: -deletion au locus thyA et remplacement par un gène de résistance à l'érythromycine, -deletion au focus nrdD et remplacement par un gène de résistance à la kanamycine, -porte l'allèle chromosomique Asp 230 Asn du gène valS, -porte un plasmide pTZ18 (col E1 replicon, bla+) avec l'allèle Cys146GUA de la thymidylate synthase.

L'invention comprend en outre l'utilisation d'une méthode ou d'une cellule selon l'invention pour la production de proteine, notamment recombinante, dont la séquence d'acides amines comprend au moins un acide amine non conventionnel.

Sous un autre aspect, I'invention concerne un procédé de production d'une protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel, caractérisé en ce qu'il comprend les étapes suivantes: a) le cas échéant, la sélection d'une cellule par une méthode selon l'invention ; b) la culture de ladite cellule sélectionnée à l'étape a) ou d'une cellule selon l'invention dans un milieu de culture et des conditions de culture permettant la croissance de ladite cellule; et c) l'isolement de ladite protéine comprenant au moins un acide amine non conventionnel à partir du surnageant de culture et/ou du culot cellulaire obtenu à l'étape b).

Parmi les protéines pouvant tre produites par un procédé selon l'invention, on peut mentionner, mais sans s'y limiter, les protéines qui par l'incorporation d'au moins un acide amine non conventionnel permettent d'obtenir une activité recherchée qu'une protéine dont la séquence comporte uniquement des acides amines conventionnels ne permet pas d'obtenir. Par activite, on entend désigner de manière générale toute activité telle qu'une activité physiologique ou biologique relative aux organismes uni- ou pluricellulaires, mme partielle, comme par exemple une activité structurelle ou biochimique, par exemple enzymatique, antigénique, de type anticorps ou de modulation, de régulation ou d'inhibition d'activité biologique, ou encore telle qu'elle

permette sa mise en oeuvre dans un procédé de biosynthèse ou de biodégradation de composes chimiques ou biochimiques.

On peut également mentionner parmi les protéines pouvant tre produites par un procédé selon l'invention, les protéines dont l'incorporation d'au moins un acide amine non conventionnel est effectuée de telle manière qu'il n'en résulte pas de modification approfondie de l'activité biologique de la protéine non modifiée correspondante. Outre l'activité biologique conservée de la protéine non modifiée correspondante, ces protéines selon l'invention présenteront un acide amine non conventionnel dont les propriétés spécifiques pourront tre avantageusement exploitées.

Parmi les propriétés spécifiques conférées par la présence d'un acide amine non conventionnel, on peut citer en particulier les propriétés liées à la présence d'un groupe fonctionnel sur ledit acide amine non conventionnel capable de réagir facilement et de manière spécifique avec un compose chimique ou biochimique dans des conditions permettant de ne pas altérer l'activité de la protéine ou évitant la modification des acides amines conventionnets.

La présence de ce groupe fonctionnel spécifique pourra avantageusement tre utilisée par exemple pour: (i) purifier toute proteine, notamment recombinante, incorporant ledit acide amine non conventionnel ; (ii) coupler une telle protéine à un support solide ; (iii) coupler à une telle protéine des molécules capables d'etre détectées, telles que des sondes spectroscopiques de nature variée; (iv) coupler a une telle protéine des polymères lipophiles ou hydrophiles permettant de les solubiliser dans des solvants ou de faire écran à la reconnaissance par des anticorps; (v) coupler une telle protéine à un poiynudeotide ; (vi) coupler une telle protéine à un compose chimique ou biochimique dont la présence permet d'augmenter, de diminuer, de moduler, de réguler ou de cibler l'activité biologique de ladite proteine, ou de modifier sa biodisponibilité en tant que compose à usage thérapeutique; ou encore (vii) fixer de manière permanente à une telle protéine un coenzyme qui sinon diffuserait en solution.

Selon la présente invention, I'incorporation d'au moins un acide amine non conventionnel pourra porter sur des acides amines à l'origine d'une spécificité ou de

I'activite, ou à l'origine de la conformation structurale, de la charge, de I'hydrophobicite ou de la capacité de multimérisation de la protéine non modifiée correspondante. Ainsi, pourront tre créées des protéines d'activité équivalente, augmentée ou diminuee, ou de spécificité équivalente, plus étroite, ou plus large que la protéine à acides amines conventionnels non modifiée correspondante.

Par proteine non modifiée, on entend désigner la protéine sauvage ou recombinante constituée d'acides amines conventionnels et dont est issue la protéine comprenant I'acide amine non conventionnel.

De préférence, le procédé de production selon l'invention est caractérisé en ce que ledit milieu de culture de l'étape b) permettant la croissance de ladite cellule contient ledit acide amine non conventionnel ou un de ses précurseurs.

Selon un mode particulier, un procédé de production selon l'invention est caractérisé en ce que ledit acide amine non conventionnel est synthétisé par ladite cellule, la synthèse dudit acide amine non conventionnel pouvant tre augmentée par modification génétique de ladite cellule.

L'invention concerne en outre un procédé de production d'une protéine dont la séquence d'acides amines comprend au moins un acide amine non conventionnel selon l'invention, caractérisé en ce que ladite cellule est auxotrophe pour I'acide amine code par ledit codon cible.

Sont également compris dans la présente invention, les procédés selon l'invention, caractérisés en ce que ladite cellule comprend un gène d'intért homologue ou hétérologue dont la séquence codante comporte au moins un codon cible.

D'une manière générale, le gène d'interet codera pour un ARN messager qui sera ensuite traduit en protéine d'intért.

Le gène d'intért peut tre isole par toute technique conventionnelle telle que clonage, PCR (Polymerase Chain Reaction) qu encore synthétisé chimiquement. II peut tre de type gnomique (muni d'un ou plusieurs introns) ou ADN complémentaire (ADNc). La protéine d'intért peut tre constituée par une protéine mature, un précurseur et, notamment un précurseur destine à tre sécrété et comprenant un peptide signal, une protéine tronquee, une protéine chimère provenant de la fusion de séquences d'origines diverses ou encore une protéine mutée présentant des propriétés biologiques améliorées et/ou modifiees.

De manière générale, le gène d'interet homologue ou hétérologue pourra tre choisi parmi les gènes codant pour toute protéine utilisable comme compose thérapeutique ou-cosmétique, ou comme réactif de diagnostic, ou encore comme

compose pouvant tre mis en oeuvre dans un procédé de biosynthèse ou de biodegradation.

A titre d'exemples, on peut citer les gènes d'intért codant pour les protéines d'intért suivantes: -cytokines ou lymphokines (interférons a, p et y, intedeukines et notamment l'IL-2, I'IL-6, I'IL-10 ou l'IL-12, facteurs nécrosant des tumeurs (TNF), facteurs stimulateurs de colonies (GM-CSF, C-CSF, M-CSF,...); -récepteurs cellulaires ou nucléaires, notamment ceux reconnus par des organismes pathogènes (virus, bactéries, ou parasites) ou leurs ligands; -protéines impliquées dans une maladie génétique (facteur Vil, facteur VIII, facteur IX, dystrophine ou minidystrophine, insuline, protéine CFTR (Cystic Fibrosis Transmembrane Conductance Regulator), hormones de croissance (hGH); -enzymes (urease, rénine, thrombine,...) ou toutes enzymes impliquées dans le métabolisme ou la biosynthèse des protéines, des lipides, des acides nucléiques, des sucres, des acides amines, des acides gras ou des nucléotides; -inhibiteurs d'enzymes (a1-antitrypsine, antithrombine III, inhibiteurs de protéases virales,...); -composes à effet anti-tumoral capables d'inhiber au moins partiellement l'initiation ou la progression de tumeurs ou cancers (anticorps, inhibiteurs agissant au niveau de la division cellulaire ou des signaux de transduction, produits d'expression des gènes suppresseurs de tumeurs, par exemple p53 ou Rb, protéines stimulant le système immunitaire,...); -protéines du complexe majeur d'histocompatibilité des classes I ou 11 ou protéines régulatrices agissant sur l'expression des gènes correspondants; -proteines capables d'inhiber une infection virale, bactérienne ou parasitaire ou son développement (protéines antigéniques ayant des propriétés immunogènes, épitopes antigéniques, anticorps,...); -toxines telles que la ricine, toxine cholérique, diphtérique,... ou immunotoxines; -marqueurs (p-gaiactosidase, peroxydase,...); et -luciferase, GFP (green fluorescent protein), etc..

L'invention comprend en outre un procédé de production d'une protéine selon l'invention, caractérisé en ce que le milieu de culture de l'étape b) comprend en outre les composes nécessaires à l'induction de la synthèse de la protéine codée par ledit gène d'interet. Ces composes sont connus de I'homme du métier et dépendent notamment de la cellule et du gène homologue ou hétérologue sélectionnés.

L'invention conceme également un procédé selon l'invention, caractérisé en ce que l'activité biologique de la protéine codée par ledit gène d'intért est au moins partiellement conservée après l'incorporation dudit acide amine non conventionnel au niveau du codon cible dudit gène d'interet.

L'invention conceme en outre un procédé selon l'invention, caractérisé en ce que I'acide amine non conventionnel est choisi parmi les acides amines non conventionnels de formule I et de configuration L dans laquelle: Ri ou? 2 represente des radicaux contenant un groupe fonctionnel capable de réagir de manière sélective, de préférence choisi parmi les groupes aldéhyde, cétone, éthényle, ethynyle ou nitrile.

Parmi ces groupes, on préfère particulièrement le groupe oxo (aldéhyde ou cétone) à réactivité sélective qui faciliterait la fonctionnalisation chimique des protéines.

D'autres groupes simples comme le groupe ethynyle se prteraient également à des réactions sélectives. Un vaste corpus d'expériences conduites a I'aide de systèmes de traduction acellulaire (ex vivo) et d'acyl-tRNAs synthétisés in vitro, a démontré qu'une grande variété de groupes acyles pouvaient tre transférés sur le ribosome en réponse à un codon lu par le tRNA. En bref, les modifications latérales des acides amines semblent toutes compatibles avec la traducttbn (ii n'a à ce jour pas été trouve d'aminoacide dont la chaîne latérale serait assez encombrante pour bloquer la traduction); des substitutions du motif amino en alkyl-amino, en hydroxy et en hydrazino sont compatibles avec la chimie de transpeptidation catalysée par le ribosome (Bain et al. 1991) (il est connu que le ribosome peut former des polyesters en plus des polyamides conventionnels); la substitution de l'hydrogène alpha du motif H2NCH (R)-COOH par un groupe alkyle (méthyle) ou l'inversion de configuration au carbone alpha (D-amino-acides) ne sont par contre pas acceptées par le ribosome.

L'invention a également pour objet un procédé selon l'invention, pour la fonctionnalisation de proteine.

L'invention concerne également un procédé de purification de proteine, caractérisé en ce qu'il comprend les étapes suivantes: a) I'incorporation dans la séquence d'acides amines de ladite protéine d'un acide amine non conventionnel contenant un groupe fonctionnel capable de réagir de manière sélective par un procédé selon t'invention ; b) la mise en contact de la solution contenant la protéine obtenue à l'étape a) avec un support comprenant un compose capable de réagir spécifiquement avec ledit groupe fonctionnel et de fixer spécifiquement ladite protéine; et c) I'isolement de ladite protéine fixée sur le support.

Les procédés de purification de proteine, naturelle ou recombinante, utilises habituellement par I'homme du métier font appel généralement à des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immuno-affinite à l'aide d'anticorps mono ou polyclonaux spécifiques, etc.. Ces méthodes sont parfois longues et fastidieuses et ne permettent pas toujours d'obtenir l'activité spécifique, le taux et le rendement de purification voulus. La présence d'un groupe fonctionnel spécifique sur la protéine à purifier capable de réagir sélectivement avec le support de purification sans altérer l'activité de la protéine faciliterait grandement la purification de protéine nécessaire à leur utilisation.

L'invention concerne également un procédé de fixation d'une protéine sur un compose chimique ou biochimique, caractérisé en ce qu'il comprend les étapes suivantes: a) I'incorporation dans la séquence d'acides amines de ladite protéine par un procédé selon l'invention d'un acide amine non conventionnel contenant un groupe fonctionnel capable de réagir de manière sélective; b) la mise en contact de la protéine obtenue à l'étape a) avec ledit compose chimique ou biochimique comprenant un groupe capable de réagir spécifiquement avec ledit groupe fonctionnel dans un milieu permettant la réaction.

De préférence, la fixation d'une protéine sur un compose chimique ou biochimique est une fixation par liaison covalente.

Les composes chimiques ou biochimiques pouvant tre utilises dans ledit procédé de fixation selon l'invention pourront tre choisis parmi tous les composes capables de réagir avec le groupe fonctionnel de I'acide amine non conventionnel incorpore.

On entend désigner dans la présente description par complexe protéique le produit obtenu à l'étape b) du procédé décrit ci-dessus comprenant une protéine selon l'invention fixée sur un compose chimique ou biochimique.

L'invention comprend aussi un procédé selon l'invention caractérisé en ce que ledit compose chimique ou biochimique est lui-mme fixe sur un support solide ou est un compose constitutif d'un support solide.

L'invention concerne en outre un procédé selon l'invention pour la préparation d'un complexe protéique.

De préférence, I'invention comprend les procédés de l'invention, caractérisés en ce que ladite protéine fixée ou ledit compose chimique ou biochimique est choisi parmi les composés thérapeutiques, cosmétiques ou diagnostiques.

Ladite protéine fixee sera choisie en particulier parmi les protéines dont la séquence d'acides amines comprend un acide amine non conventionnel selon un procédé de l'invention, et dont la protéine non modifiée correspondante sauvage ou recombinante est choisie parmi les protéines utilisables comme composes thérapeutiques, cosmétiques ou comme réactifs de diagnostic.

De préférence, les procédés selon l'invention, sont caractérisés en ce que le compose chimique ou biochimique est choisi parmi les composes capables de modifier l'activité biologique de la protéine fixée.

On entend désigner par composes capables de modifier l'activité biologique d'un autre compose, un compose capable d'augmenter, de diminuer, de réguler l'activité biologique dudit autre compose.

L'invention comprend également un procédé selon l'invention, caractérisé en ce que le compose chimique ou biochimique est choisi parmi les composes dont l'activité biologique peut tre modifiée par la protéine fixee.

L'invention comprend également un procédé selon l'invention, caractérisé en ce que le compose chimique ou biochimique est choisi parmi les composes comprenant une protéine, un polynucleotide, un acide gras, un sucre ou un polymère naturel ou synthétique.

Selon un autre aspect, invention a pour objet les protéines, en particulier recombinantes, et les complexes protéiques obtenus par un procédé selon l'invention.

L'invention comprend également une méthode de sélection de composes capables de se lier à une protéine selon l'invention ou capables de se lier au compose chimique ou biochimique du complexe protéique selon l'invention. Parmi ces

méthodes, on peut citer comme exemple une méthode caractérisée en ce qu'elle comprend les étapes suivantes: a) la mise en contact dudit compose susceptible d'tre sélectionné avec la protéine ou le complexe protéique selon l'invention, ladite protéine ou complexe protéique pouvant tre notamment fixée sur un support solide; b) la détermination de la capacité dudit compose à se lier avec la protéine ou le complexe protéique selon l'invention.

Les composes susceptibles d'etre sélectionnés peuvent tre des composes organiques tels que des protéines ou hydrates de carbone ou tous autres composes organiques ou inorganiques déjà connus, ou, des composes organiques nouveaux élaborés à partir de techniques de modélisation moléculaire et obtenus par synthèse chimique ou biochimique, ces techniques étant connues de l'homme de I'art.

Les cellules selon l'invention pourront également avantageusement servir de modèle et tre utilises dans des procédés pour etudier, identifier et/ou sélectionner des protéines selon l'invention ou des composes susceptibles de posséder une activité recherchée.

L'invention conceme également l'utilisation d'une protéine ou d'un complexe protéique selon l'invention comme réactif de diagnostic ainsi que les procédés de diagnostic, notamment pour la détection, l'identification, la localisation et/ou le dosage spécifique de polypeptide ou de polynucleotide, mettant en oeuvre une protéine ou un complexe protéique selon l'invention.

Sont en effet comprises dans les protéines selon l'invention, des protéines ayant incorpore au moins un acide amine non conventionnel et ayant conserve partiellement ou totalement l'activité initiale des protéines sauvages ou recombinantes non modifiées correspondantes, telles que des anticorps, des antigènes, des enzymes ou leurs fragments biologiquement actifs connus pour tre utilises dans des procédés de diagnostic.

De la mme manière, sont compris dans les complexes protéiques selon l'invention, des complexes protéiques formes à partir d'une protéine selon l'invention et un compose chimique ou biochimique tels que des complexes comprenant un anticorps, un antigène ou une sonde oligonucléotidique couple a une enzyme, à un substrat ou à une molécule capable d'tre détectée.

Parmi les procédés de diagnostic selon l'invention, on peut citer par exemple les procédés comprenant les étapes suivantes:

a) la mise en contact de l'échantillon biologique susceptible de contenir le compose recherche avec une protéine ou un complexe protéique selon l'invention, ladite protéine ou complexe protéique pouvant tre notamment fixée sur un support solide; et b) la mise en évidence, I'identification, la localisation et/ou le dosage du complexe forme entre le compose recherche et une protéine ou un complexe protéique selon l'invention.

L'homme du métier saura adapter avec les protéines ou les complexes protéiques selon l'invention les procédés de diagnostic standards connus.

Les techniques et les réactifs spécifiques permettant la mise en évidence, I'identification, la localisation et/ou le dosage du complexe forme que l'on pourra utiliser dans les procédés de l'invention, sont bien connus également de l'homme du métier et sont, par exemple, les techniques ELISA, RIA, d'immunofluorescence, de PCR ou d'autres techniques d'amplification d'un acide nucléique cible connues de l'homme de l'art.

L'invention conceme également un kit ou nécessaire de diagnostic, notamment pour la détection, l'identification, la localisation et/ou le dosage spécifique de protéine ou de polynucleotide caractérisé en ce qu'il contient une protéine ou un complexe protéique selon l'invention.

L'invention conceme en outre l'utilisation d'une proteine, d'un complexe protéique ou d'une cellule selon l'invention pour la préparation d'une composition pharmaceutique ou cosmétique.

L'invention a enfin pour objet une composition pharmaceutique ou cosmétique comprenant une proteine, un complexe protéique ou une cellule selon l'invention.

D'autres caractéristiques et avantages de l'invention apparaissent dans la suite de la description avec les exemples ci-après.

EXEMPLES EXEMPLE 1: Construction d'une souche d'E coli comportant une mutation faux-sens Cys->Val au site actif de la thymidylate synthase et créant une exigence nutritionnelle pour la thymine, la thymidine ou la cysteine.

Les allèles artificiels du gene thyA sont construits par mutagenèse dirigée du plasmide pTS0 (Lemeignan et al 1993), qui dérive du plasmide pTZ18R (BioRad) par insertion du gène thyA sauvage d'E. coli. La mutagenèse dirigée à I'aide d'un

oligonucleotide est réalisée selon la méthode decrite par Kunkel et coll. (1987) sur le phagemide pTSO. La-préparation de la matrice simple brin de pTSO, amplifiée dans la souche RZ1032 (Kunkel et coll., 1987) (Hfr KL16 P045 IysA (61-62)] dut1 ung1 thi1 relA1 supE44 zbd-279:: Tn10) est réalisée selon le protocole décrit par Sambrook et coll. (1989). Un oligonucléotide phosphoryle en 5' (achete à la société Genome Express) est utilise comme amorce mutagène: Oligodeoxynucleotide 1: 5'pTGGATAAAATGGCGCTGGCACCGGTACATGCATTCTTCCAGTTCTATGT L'hybridation de cet oligonucleotide avec la matrice simple brin dans chacune des deux constructions est réalisée avec 10 ng d'oligonucleotide et 0,2 NI de matrice dans un volume de 10 NI d'une solution tampon contenant 20 mM de Tris-HCI pH 7,5, 2 mM d'EDTA et 50 mM de chlorure de sodium. Les tubes sont incubes 5 mn à 70°C puis refroidis progressivement jusqu'a 30°C. A ce mélange est alors ajoute 0,5 mM de chacun des dNTP, 1 mM d'ATP, 10 mM de Tris-HCI a pH 7,5,10 mM de chlorure de magnésium, 2 mM de dithiothreitol et 1 unité de chacune des deux enzymes du phage T4 ADN ligase et ADN polymerase. Ce mélange réactionnel d'un volume final de 20 pi est incube 60 min à 37°C dont 5 NI sont ensuite utilises pour transformer des cellules compétentes de la souche GT869 (Parsot, C. 1986) (thrBl004 pro thi strA hsdS lacZ AM15 F'IacZ AM15 laclq traD36 proA+ proB+) d'E. coli K12 suivant la méthode decrite par Sambrook et coll. (1989). Les cellules transformées sont étalées sur des boites de Pétri contenant du milieu LB additionne de 100 mg/l de carbenicilline. Douze clones résistant à l'antibiotique sont réisolés sur le mme milieu. L'ADN simple-brin correspondant aux phagémides de ces clones est préparé et séquence selon la méthode dideoxy (Sanger et coll., 1977). Le kit de séquençage M13 (Boehringer Mannheim, Mannheim, Allemagne) et la desoxyadenosine 5'- (a-thio) triphosphate (1300 Ci/mmol, Amersham) sont combines selon les indications des fournisseurs.

Quatre amorces sont utilisées pour déterminer la séquence des allèles de thyA : Oligodeoxynucleotide 3: 5'GGTGTGATCATGATGGTC Oligodeoxynucleotide 4: 5'CCTGCAAGATGGATTCCC Oligodeoxynucleotide 5: 5'CGCGCCGCATTATTGTTTC Oligodeoxynucleotide 6: 5'GTCTGGACCGGTGGCGACA Le plasmide pTS1 ainsi obtenu propage l'allèle thyA: Val146, dans lequel la position 146 occupée dans le gène thyA sauvage par le codon UGC de la cystéine est occupée par le codon GUA de la valine. Le plasmide pTS1 est introduit par transformation, realisee selon la méthode de Sambrook et coll. (1989), dans la souche

AthyA d'E. coli K12, ß1308 (Lemeignan et coll., 1993), dont le gène chromosomique de la thymidylate synthase, thyA, est délété. La souche transformée portant l'allèle plasmidique thyA: Va) 146, p5366, se montre incapable de croitre sans que de la thymine ou de la thymidine soit ajoutée au milieu de culture, tout comme la souche 31308 dont elle dérive. Par contre, la souche p5366 montre une croissance marginale à 30°C sur gradient de diffusion de cysteine, réalisé dans des boites de Pétri contenant 25 ml de milieu minerai MS glucose à partir d'un puits central comportant 0,1 ml d'une solution 400 mM de L-cystéine. Dans les mmes conditions, la souche p1308 ne donne lieu à aucune croissance detectable. Ainsi, la mutation faux-sens convertissant la cystéine catalytique à la position 146 de la thymidylate synthase en valine peut tre partiellement supprimée par apport massif de cystéine exogène. L'addition de 0,1 mM de valine au milieu des boites de Pétri abolit la croissance de la souche (35366 sur gradient de cysteine. Ainsi, tout se passe comme si la cystéine pouvait s'infiltrer dans le site actif de la valyl-tRNA synthétase pour former des Cys-tRNAVal erronés, aptes à corriger la substitution de la cystéine par la valine dans le site actif de la thymidylate synthase. L'exces de valine préviendrait la formation de ces Cys-tRNAVal erronés.

Exemple 2: Construction d'une souche d'E. coli comportant une mutation faux- sens Cys->Ile au site actif de la thymidylate synthase et créant une exigence nutritionnelle pour la thymine, la thymidine ou la cysteine.

La construction correspondante est également conduite pour remplacer la cystéine en position 146 de la thymidylate synthase, par mutagenèse dirigée à l'aide de l'oligonucleotide 2, suivant le mme protocole que dans I'Exemple 1.

Oligodeoxynucleotide 2: 5'pTGGATAAAATGGCGCTGGCACCGATACATGCATTCTTCCAGTTCTATGT Le plasmide pTS2 ainsi obtenu propage l'allèle thyA: lle146, dans lequel la position 146 occupée dans le gène thyA sauvage par le codon UGC de la cystéine est occupée par le codon AUA de l'isoleucine. La souche propageant l'allèle plasmidique thyA: lle146, p5274, se révèle exiger l'apport nutritionnel de thymine, de thymidine ou de cystéine en exces, tout comme la souche p5366. La suppression phénotypique de la souche p5274 par la cystéine est abolie par 0,1 mM d'isoleucine, tout comme celle de la souche p5366 par la valine. Ainsi, tout se passe comme si l'isoleucyl-tRNA synthétase était capable de former des Cys-tRNAIle erronés en présence d'un excès de cysteine, et que cette formation erronée était prévenue par la présence d'un excès d'isoleucine.

Exemple 3: Sélection de mutants du code génétique mésincorporant la cystéine au lieu de la valine par culture sérielle en liquide et caractérisation génétique des mutants de la valyl-tRNA synthétase ainsi obtenus.

La souche ß5366 portant l'allèle faux-sens thyA: Val146 sur le plasmide pTS1 est cultivée en milieu minéral MS glucose (2 g/l, Richaud et coll., 1993) supplémenté avec 0,3 mM de thymidine pendant 24 h à 30°C en aérobiose. Les cellules sont ensuite lavées deux fois avec du milieu minéral MS désoxygéné. Un milieu nutritif désoxygéné contenant 10 ml de milieu minéral MS glucose additionne de 1,5 mM de cystéine est inocule au 1/100 à l'aide des cellules lavées. Les cellules sont ensuite cultivées en anaérobiose pendant 24 h à 30°C et un tube frais contenant 10 ml de milieu mineral MS glucose cystéine désoxygéné est inocule avec une dilution au 1/100 de la culture en phase stationnaire précédente. Cette procédure est répétée 26 fois. A l'issue de cette propagation sérielle, 12 clones de la culture liquide sont isolés sur boites de milieu minéral MS glucose (2 g/I) thymidine (0,3 mM) en aérobiose et sauvegardes en suspension dans le mme milieu liquide a-80°C. Les douze clones sont testes sur des boites contenant du milieu minéral MS glucose additionne de facteurs nutritionnels.

Tous ces clones se révèlent exiger la thymine ou la thymidine comme facteur de croissance, à moins que de la cystéine soit présente dans le milieu de culture, à une concentration d'au moins 1,5 mM.

Deux tels clones sont choisis pour une caractérisation génétique approfondie, p8144 et P8146. Des expériences de transduction par le phage P1 du caractère de résistance à la kanamycine, introduit dans le locus nrdD voisin du gène valS de la valyl-tRNA synthétase (97 mn du chromosome d'E. coli K12) sont effectuées à l'aide des souches ß8144 et P8146. Dans les deux cas, environ la moitie des transductants résistant à la kanamycine montrent également une dépendance nutritionnelle pour la thymidine suppressible par la cystéine exogène, à la concentration d'au moins 1,5 mM.

Cette proportion est en accord avec la distance génétique entre les gènes valS et nrdD (0,4 mn) et laisse supposer que le phénotype de suppression de la mutation faux-sens Cys->Val au site actif de la thymidylate synthase par de faibles concentrations de cystéine est cause par l'altération génétique du locus valS.

La fixation d'une altération génétique dans le gène valS des souches adaptées est confirmée par séquençage de ce locus: un A change en C cause le remplacement de la lysine à la position 277 par la glutamine dans les deux souches adaptées p8144 et (38146. Le séquençage est effectue sur une matrice obtenue par réaction de polymérisation en chaîne (PCR) réalisée dans des conditions décrites par Sambrook et

coll. (1989). La réaction d'amplification est réalisée dans 100 NI d'une solution contenant 10 ng d'ADN gnomique des souches 38144 ou P8146,20 pmoles de chaque amorce, 40 nmoles d'un mélange équimolaire des 4 desoxynucleotides triphosphate, 10 NI d'un tampon compose de 100 mM Tris-HCI pH 8,3,500 mM KCI et 20 mM MgCiz, en présence de 1 à 2 unités de Vent poiymerase (Biolabs). Pour chaque réaction, 30 cycles de polymérisation sont accomplis, en utilisant un amplificateur d'ADN (Perkin-Elmer Cetus), comme suit: la dénaturation est effectuée à 94°C pendant 5 min pour le 1er cycle et 1 min pour les cycles suivant,!'hybridation à 58°C pendant 1 min et l'élongation à 72°C pendant 3 min pour les 29 premiers cycles et pendant 10 min pour le demier cycle. Les oligonucleotides 7 et 8 sont utilises pour I'amplification du gène.

Oligodeoxynucleotide 7: 5'GGGGAATTCGGTGTGTGAAATTGCCGCAGAACG Oligodeoxynucleotide 8: 5'GGCAAGCTTCCAGTATTTCACGGGGAGTTATGC Les fragments de PCR ainsi obtenus sont purifies en utilisant le kit QlAquick (Qiagen) et transmis à la société Genaxis pour en déterminer la séquence.

Exemple 4: Suppression phénotypique par des précurseurs métaboliques de la cysteine.

L'exigence nutritionnelle en cystéine des souches adaptées p8144 et R8146 est mise à profit pour caractériser des précurseurs métaboliques qui puissent se substituer à la cystéine dans le milieu de culture sans donner lieu à la dégradation par oxydation.

La S-carbamyl-L-cysteine (3 mM), la S-methyl-L-cysteine (3 mM) et l'acide L- thiazolidine-4-carboxylate (2 mM) se révèlent capables de remplacer la cystéine comme facteur de croissance des souches adaptées p8144 et P8146, au lieu de la thymidine ou de la thymine. Les mmes composes se révèlent capables de satisfaire exigence en cystéine d'un mutant cysN:: kan (souche JT1, procurée par M. Berlyn, Coli Genetic Stock Center, Yale University, USA (Levh et al., 1988)). Toutefois, I'addition d'aucune de ces substances ne permet la croissance de la souche 31308 portant une délétion chromosomique du gène thyA de la thymidylate synthase, excluant ainsi leur contamination par des traces de thymine ou de thymidine.

Exemple 5: Sélection de mutants du code génétique mésincorporant la cystéine au lieu de la valine par isolement sur milieu solide et caractérisation génétique des mutants de la valyl-tRNA synthétase mesincorporant la cysteine.

La souche ß5366 portant l'allèle faux-sens thyA: Val146 sur le plasmide pTS1 est transduite avec un lysat du phage P1 récolté sur une souche auxiliaire d'E. coli ( (37170, Bouzon et al., 1997) dans le chromosome de laquelle un marqueur de résistance à la kanamycine avait été introduit au locus nrdD, voisin du locus valS du gène de la valyl-tRNA synthetase, produisant ainsi la souche (55419. Un allèle mutateur du gène dnaQ est introduit extemporanément par transduction de la souche p5419 à I'aide d'un lysat du phage P1 récolté sur une souche auxiliaire (MS2131, Shapiro 1990) portant un marqueur de résistance à la tétracycline dnaQ:: miniTn10. Un tel clone résistant à la tétracycline et montrant un taux de mutation spontanée amplifie environ 1000 fois (pour I'acquisition de la résistance à la streptomycine) est cultivé à 30°C en milieu minimum glucose en présence de thymidine (0,3 mM). Après 24 h, les cellules sont récoltées, lavées deux fois dans un volume identique de milieu de culture sans thymidine. Un volume de 0,1 ml de la suspension résultante, correspondant à environ 108 bactéries, est étalé à la surface d'une série de boites de Pétri contenant une concentration de S-carbamyl-L-cysteine variant entre 0 et 8 mM par incrément de 1 mM additionnant du milieu minéral MS glucose (2 g/l). La mme procédure est appliquée à la souche non matrice (35419, au gène dnaQ sauvage. L'ensemble des boites de Pétri est incube 96 h à 30°. Des colonies apparaissent sur les boites ayant une concentration de S-carbamyl-L-cysteine dépassant 2 mM dans le seul cas ou l'allèle mutateur dnaQ:: miniTn10 a été introduit dans la souche testee.

Un lysat du phage P1 récolté à partir d'un tel clone est employé pour transduire la souche p5366 portant l'allèle plasmidique thyA: Val146. Environ la moitie des transductants résistant à la kanamycine se montrent capables de croître en présence de 3 mM de S-carbamyl-L-cysteine et en absence de thymine ou de thymidine, parmi lesquels la souche (35455. L'autre moitie des transductants en est incapable et exige la thymine ou la thymidine pour proliférer, tout comme la souche (35366. Cette proportion entre les phénotypes s'accorde avec la distance génétique entre les locus valS et nrdD (0,4 mn). Ainsi, la suppression de la mutation faux-sens de thyA Cys->Val par une faible concentration de cystéine exogène pourrait résulter d'une altération du gène de la valyl-tRNA synthétase. Le locus valS d'une des souches obtenues par transduction de (35366 et capables de croitre en présence de 3 mM de S-carbamyl-L-cysteine et en absence de thymine ou de thymidine, désignée (35455, est amplifie par réaction de

polymérisation en chaîne et séquence comme ii est décrit dans I'Exemple 3. Un A change en C cause le remplacement de la thréonine à la position 222 par la proline, confirmant ainsi la fixation d'une altération génétique dans le gène valS de la souche (35455.

Exemple 6: Sensibilité des mutants de la valyl-tRNA synthétase à des acides amines non canoniques.

Les souches p5455, P8144 et P8146 sont testées pour leur sensibilité à des acides amines artificiels qui présentent une ressemblance stérique avec la valine. Le test est réalisé sur des botes de milieu minerai MS glucose supplémenté avec de la thymidine. Les cellules sont cultivées en milieu aérobie (minerai MS glucose 0,3 mM thymidine) pendant 24 h à 30°C et diluées au 1/250 dans du milieu minéral MS. 0,5 mi de cette suspension cellulaire sont étalés sur boites de Pétri contenant 25 mi de milieu minéral MS glucose. Un puits est ensuite évidé au centre de la boîte et rempli avec 0,1 ml d'une solution d'un acide amine: (1) 100 mM L-2-amino-butyrate (2) 100 mM L-2-amino-valerate (3) 100 mM L-2-3-diamino-propionate (4) 50 mM L-3-thiol-2-amino-butyrate.

Les botes sont ensuite incubées pendant 24 h à 30°C et l'apparition éventuelle sur les boites d'une zone d'inhibition autour du puits est enregistrée. Les diamètres des zones d'inhibition de croissance atténuées sur des boites de Pétri sont mesures : L-2-amino-butyrate: 5,2 cm (p5455), 5,7 cm (R8144), 6,7 cm ( (38146) ; L-2-amino-valerate: 2,1 cm ( (35455), 1,5 cm ( (38144), 6,7 cm ( (38146) ; L-2-3-diamino-propionate: 2,3 cm ( (35455), 2,7 cm ( (38144), 1,9 cm ( (38146); L-3-thiol-2-amino-butyrate: 2,0 cm ( (35366), 4,6 cm ( (35455), 4,0 cm ( (38144), 4,0 cm ( (38146).

Le L-2-amino-butyrate, le L-2-amino-valerate et le L-2,3 diamino-propionate aux concentrations indiquées sont sans effet sur la souche (35366 à l'allèle valS sauvage, mais inhibent la croissance des souches portant un gène valS mute. Le L-3-thiol-2- amino-butyrate inhibe la croissance de toutes les souches, mais on peut remarquer une inhibition plus importante sur les souches mutées. Ainsi, tout se passe comme si les mutants de la valyl-tRNA synthétase avaient une spécificité élargie les rendant capables de charger des tRNA'avec des acides amines qui ne peuvent tre incorpores par la forme sauvage de l'enzyme.

Exemple 7: Incorporation de l'acide amine non canonique ae-aminobutyrate dans les protéines d'une souche d'E. coli mutée dans la valyl-tRNA synthetase.

Un lysat de phage P1 obtenu à partir de la souche p5455 (voir exemple 5), a été employé pour transduire la souche CU505 portant une délétion ÆilvCABD et une mutation leu la rendant auxotrophe pour la valine, I'isoleucine et la leucine. La souche CU505 a été obtenue auprès du Coli Genetic Stock Center, à Yale University (USA).

Des clones transductants ont été sélectionnés sur des botes LB kanamycine et testes pour leur sensibilité à l'amino-butyrate (3 mM) en milieu solide MS glucose (2 g/I) contenant 0,3 mM de chacun des trois acides amines valine, isoleucine et leucine.

Environ 50 % des clones transductants ne pouvaient croître dans ces conditions, indiquant la co-transduction de l'allèle vaIS: T222P et le marqueur de résistance nrdD:: kan (voir exemple 5). L'un des clones transductants, désigné p5498, a été utilise pour démontrer l'incorporation d'amino-butyrate en remplacement de la valine, en comparaison avec CU505. Les deux souches ont été cultivées à 30°C en milieu liquide MS glucose (2 g/I) contenant le dipeptide lle-Leu à la concentration de 0,3 mM et le dipeptide lie-Val à la concentration de 0,02 mM soit en présence de 0,2 mM de L- amino-butyrate soit en absence de I'analogue. L'inoculum correspondant à chaque souche provenait d'une préculture en milieu liquide MS glucose (2 g/I) contenant le dipeptide lle-Leu à la concentration de 0,3 mM et le dipeptide lie-Val à la concentration de 0,04 mM. Les cultures (50 ml) en phase stationnaire après 24 h à 30°C ont été récoltées par centrifugation. Pour chaque test, le culot a ensuite été resuspendu dans 25 ml d'une solution d'acide trichloroacétique à 100 g/l (TCA 10%) à 4°C, centrifuge, resuspendu dans 5 ml de TCA 10%, centrifuge à nouveau, le culot resuspendu dans du TCA 5%, la suspension incubee à 95°C pendant 30 mn, centrifugée, le culot resuspendu dans 5 mi acetone, centrifuge, le culot resuspendu dans 5 ml acétone, centrifugé, le culot resuspendu dans 5 ml acétone, centrifugé, le culot laissé à sécher.

Le résidu ainsi obtenu a été dissous dans 1 ml d'une solution de NH4HCO3 à 50 mM pour tre lyophilise. Le lyophilisat a été dissous dans 2 mi d'acide chlorhydrique 6N contenant 2 g/I de phénol, le mélange scellé dans une ampoule, puis incube à 110°C pendant 20 h. La concentration des acides amines de I'hydrolysat a ensuite été quantifiée par dérivatisation par la ninhydrine suivant les instructions préconisées par le fournisseur de I'analyseur Beckman 6300. L'amino-butyrate a été détecté dans I'hydrolysat des protéines seulement dans le cas ou de I'amino-butyrate avait été ajoute au milieu de culture, et seulement pour la souche p5498. La proportion d'amino- butyrate remplaçait un quart de la quantité de valine, correspondant à environ 5

résidus amino-butyrate pour 100 acides amines des protéines totales. Les résultats détailles des analyses pour les deux souches CU505 et ß5498 dans les deux conditions de culture sont donnes dans le tableau ci-après.

Composition chimique des protéines extraites de souches auxotrophes pour la valine et cultivées en limitation de valine, avec ou sans amino-butyrate Acide aminé CU505 ß5498 CU505 p5498 incorpore dans wt valS valS T222P wtvalS valS T222P les proteines-Abu-Abu +Abu + Abu Abu 0 0 0 0,20 Val 0,83 0,79 0,83 0,61 Val + Abu 0,83 0,79 0,83 0,81 Ala 1,32 1,28 1,32 1,22 Ile 0,61 0,61 0,61 0,61 Résultats exprimes en équivalents Leu Exemple 8: Sélection de nouveaux mutants du code génétique à partir d'une souche mutatrice par isolement sur milieu solide.

La souche (35419, exprimant l'allèle inactif thyA: Val146 à partir d'un plasmide et portant le marqueur ÆnrdD:: kan dans le chromosome, ainsi qu'en rend compte sa construction décrite dans I'Exemple 5, a été transduite a I'aide d'un lysat du phage P1 récolté sur la souche TAD, portant un marqueur mutateur ÆmutS:: spc, conférant la résistance à la spectinomycine, en sélectionnant sur milieu solide LB contenant de la spectinomycine (25 mg/I) pour obtenir la souche p5555. Le phénotype mutateur de cette souche a été démontré en dénombrant la fréquence des mutants résistant à la rifamycine. En suivant la procédure expérimentale decrite dans I'Exemple 5, des clones capables de croitre à 30°C en milieu minéral glucose sans thymidine en présence de 2 à 5 mM de S-carbamoyl-L-cysteine (SCC), ont été obtenus. Trois d'entre ces clones ont servi à préparer des lysats du phage P1, qui ont été utilises pour transduire la souche p5366, en sélectionnant pour la résistance à la kanamycine, suivant la procédure de I'Exemple 5. Pour chacun des trois lysats, environ la moitie des transductants étaient capables de croître en milieu solide minéral glucose contenant

3 mM de SCC, indiquant la proximité d'une mutation supprimant l'allèle faux-sens thyA: C146V et du marqueur nrdD:: kan. Le locus valS des trois souches p5479, p5485 et p5486, chacune correspondant à un transductant SCC-suppressible obtenu à partir d'un des trois lysats a été amplifie par PCR et séquence comme il est décrit dans l'Exemple 3. Une mutation ponctuelle différente a été trouvée pour chacune des trois souches, à savoir Arg 223 changée en His dans la souche (35479, Val 276 changée en Ala dans la souche (35485 et Asp 230 changée en Asn dans la souche p5486. Ainsi, chaque clone présentant un phénotype de suppression du mutant faux-sens Cys 146 Val de thyA, présente également la sensibilite a I'amino-butyrate. Chacun de ces clones s'est révélé porter une mutation ponctuelle différente dans le gène valS, validant le crible sélectif comme moyen de diversifier l'activité de la valyl-tRNA synthétase chez Escherichia coli.

BIBLIOGRAPHIE BAIN J. D., E. S. DIALA, C. G. GLABE, D. A. WACKER, M. H. LYTTLE, T. A. DIX and A. R.

CHAMBERLIN, 1991; Site-specific incorporation of nonstructural residues during in vitro protein biosynthesis with semisynthetic aminoacyl-tRNAs, Biochemistry 30: 5411- 5421.

BOUZON, M. and P. MARLIERE, 1997; Human deoxycytidine kinase as a conditional mutator in Escherichia coli. C. R. Acad. Sci. Paris 320: 427-434.

KUNKEL, T. A., and J. D. ROBERTS, 1987; Rapid and efficient site-specific mutagenesis. without phenotypic selection. Methods Enzymol. 154: 367-382.

LEMEIGNAN, B., P. SONIGO and P. MARLIERE, 1993; Phenotypic suppression by incorporation of an alien amino acid. J. Mol. Biol. 231: 161-166.

LEVH, T. F., J. C. TAYLOR and G. D. MARKHAM, 1988; The sulfate activation locus of Escherichia coli K12: cloning, genetic, and enzymatic characterisation. J. Biol. Chem.

263: 2409-2416.

PARSOT, C., 1986; Evolution of biosynthetic pathways: a common ancestor for threonine synthase, threonine dehydratase and D-serine dehydratase. EMBO J., 5: 3013-3019.

RICHAUD, C., D. MENGIN-LECREULX, S. POCHET, E. J. JOHNSON, G. N. COHEN et al., 1993; Directed Evolution of Biosynthetic pathways. J. Biol. Chem. 268: 26827- 26835.

SAMBROOK, J., E. F. FRITSCH and T. MANIAIS, 1989; Molecular cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY.

SANGER, F., S. NICKLEN and A. R. COULSON, 1977; DNA sequencing with chain- terminating inhibitors. Proc. Natl. Acad. Sci. USA. 74: 5463-5467.

SHAPIRO, J. A 1990; Action of a transposable element in coding sequence fusions.

Genetics 126: 293-299.