Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR DIRECTING NUCLEIC ACIDS TO PLASTIDS
Document Type and Number:
WIPO Patent Application WO/2006/056701
Kind Code:
A1
Abstract:
The invention relates to nucleic acid sequences naturally imported into a plant cell plastid, and use thereof for directing an RNA sequence of interest to a plastid, which permits, in particular, the directed expression of a protein of interest in a plant cell plastid.

Inventors:
ARAR CHANTAL (FR)
DE ROSE RICHARD (US)
DUPRAT ANNE (FR)
JOYARD JACQUES (FR)
NICOLAI MARYSE (FR)
ROBAGLIA CHRISTOPHE (FR)
ROLLAND NORBERT (FR)
SALVI DANIEL (FR)
SORMANI RODNAY (FR)
Application Number:
PCT/FR2005/002940
Publication Date:
June 01, 2006
Filing Date:
November 25, 2005
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
GENOPLANTE VALOR (FR)
COMMISSARIAT ENERGIE ATOMIQUE (FR)
ARAR CHANTAL (FR)
DE ROSE RICHARD (US)
DUPRAT ANNE (FR)
JOYARD JACQUES (FR)
NICOLAI MARYSE (FR)
ROBAGLIA CHRISTOPHE (FR)
ROLLAND NORBERT (FR)
SALVI DANIEL (FR)
SORMANI RODNAY (FR)
International Classes:
C12Q1/68; A01H5/00; C12N5/04; C12N5/10; C12N15/29; C12N15/62; C12N15/82; C12P21/00
Domestic Patent References:
WO2004040973A22004-05-21
WO2004057941A22004-07-15
Foreign References:
FR2835698A12003-08-15
Other References:
MARRISON JOANNE L ET AL: "Subcellular visualization of gene transcripts encoding key proteins of the chlorophyll accumulation process in developing chloroplasts", PLANT PHYSIOLOGY (ROCKVILLE), vol. 110, no. 4, 1996, pages 1089 - 1096, XP002331633, ISSN: 0032-0889
OKITA THOMAS W ET AL: "mRNA localization in plants: Targeting to the cell's cortical region and beyond", CURRENT OPINION IN PLANT BIOLOGY, vol. 5, no. 6, December 2002 (2002-12-01), pages 553 - 559, XP002331634, ISSN: 1369-5266
GIBSON ET AL: "a putative Mg chelatase subunit from Arabidopsis thaliana cv C24", PLANT PHYSIOLOGY, AMERICAN SOCIETY OF PLANT PHYSIOLOGISTS, ROCKVILLE, MD, US, no. 111, 1996, pages 61 - 71, XP002076474, ISSN: 0032-0889
See also references of EP 1824998A1
Attorney, Agent or Firm:
Colombet, Alain (2 Place d'Estienne d'Orves, Paris Cedex 09, FR)
Download PDF:
Claims:
REVENDICATIONS
1. Méthode d'adressage d'un ARN d'intérêt vers un plaste d'une cellule végétale, ladite méthode comprenant la transformation d'une cellule végétale avec un acide nucléique d'intérêt lié à un acide nucléique d'adressage dont la séquence transcrite est celle d'un ARNm d'un gène nucléaire, ledit ARNm étant détectable dans un plaste.
2. Méthode selon la revendication 1 , dans laquelle l'acide nucléique d'adressage a pour séquence transcrite celle d'un ARNm d'un gène nucléaire endogène.
3. Méthode selon la revendication 1 ou 2, dans laquelle ledit plaste est sélectionné dans le groupe constitué d'un chloroplaste, d'un amyloplaste, d'un chromosplaste et d'un proplaste.
4. Méthode selon l'une des revendications 1 à 3, dans laquelle ledit ARNm est caractérisé par une concentration dans un plaste supérieure à sa concentration cytoplasmique.
5. Méthode selon la revendication 4, dans laquelle ledit ARNm est caractérisé par une concentration dans un plaste au moins 2 fois supérieure à sa concentration cytoplasmique.
6. Méthode selon l'une quelconque des revendications 1 à 5, dans laquelle ledit acide nucléique d'adressage a une séquence transcrite qui est celle d'un ARNm d'un gène sélectionné dans le groupe constitué des gènes ayant pour séquence codante SEQ ID No.1 , SEQ ID No.3, SEQ ID No.5, SEQ ID No.7, SEQ ID No.9, SEQ ID No.11 , SEQ ID No.13, SEQ ID No.15, SEQ ID No.17, SEQ ID No.19, SEQ ID No.21 , SEQ ID No.23, SEQ ID No.25, SEQ ID No.27, SEQ ID No.29, SEQ ID No.31 , SEQ ID No.33, SEQ ID No.35, SEQ ID No.37, SEQ ID No.39 et SEQ ID No.41.
7. Méthode selon l'une quelconque des revendications 1 à 6, dans laquelle ledit acide nucléique d'adressage a une séquence transcrite qui est celle d'un ARNm d'un gène codant le facteur eucaryote d'initiation de la traduction elF4E.
8. Méthode selon l'une quelconque des revendications 1 à 7, dans laquelle ledit acide nucléique d'intérêt est un ADN.
9. Méthode selon l'une quelconque des revendications 1 à 7, dans laquelle ledit acide nucléique d'intérêt est un ARN.
10. Méthode selon l'une quelconque des revendications 1 à 7, dans laquelle ledit acide nucléique d'adressage est un ADN.
11. Méthode selon l'une quelconque des revendications 1 à 7 et 9, dans laquelle ledit acide nucléique d'adressage est un ARN.
12. Méthode selon l'une quelconque des revendications 1 à 11 , dans laquelle ledit acide nucléique d'intérêt code une protéine hétérologue.
13. Construction d'acide nucléique comprenant un acide nucléique d'intérêt lié à un acide nucléique d'adressage dont la séquence transcrite est celle d'un ARNm d'un gène nucléaire sélectionné dans le groupe constitué des gènes ayant pour séquence codante SEQ ID No.1 , SEQ ID No.3, SEQ ID No.5, SEQ ID No.7, SEQ ID No.9, SEQ ID No.11 , SEQ ID No.13, SEQ ID No.15, SEQ ID No.17, SEQ ID No.19, SEQ ID No.21 , SEQ ID No.23, SEQ ID No.25, SEQ ID No.27, SEQ ID No.29, SEQ ID No.31 , SEQ ID No.33, SEQ ID No.35, SEQ ID No.37, SEQ ID No.39 et SEQ ID No.41.
14. Cellule végétale transformée avec un acide nucléique d'intérêt lié à un acide nucléique d'adressage dont la séquence transcrite est celle d'un ARNm d'un gène nucléaire sélectionné dans le groupe constitué des gènes ayant pour séquence codante SEQ ID No.1 , SEQ ID No.3, SEQ ID No.5, SEQ ID NoJ, SEQ ID No.9, SEQ ID No.11 , SEQ ID No.13, SEQ ID No.15, SEQ ID No.17, SEQ ID No.19, SEQ ID No.21 , SEQ ID No.23, SEQ ID No.25, SEQ ID No.27, SEQ ID No.29, SEQ ID No.31 , SEQ ID No.33, SEQ ID No.35, SEQ ID No.37, SEQ ID No.39 et SEQ ID No.41.
15. Plante transgénique susceptible d'être régénérée à partir de la cellule végétale transformée selon la revendication 14.
16. Méthode de production d'au moins une protéine d'intérêt dans un plaste d'une cellule végétale, la méthode comprenant les étapes consistant à : a) transformer une cellule végétale avec un acide nucléique codant une protéine d'intérêt lié à un acide nucléique d'adressage, la séquence transcrite dudit acide nucléique d'adressage étant celle d'un ARNm d'un gène nucléaire, ledit ARNm étant détectable dans un plaste d'une cellule végétale ; et b) exprimer ledit acide nucléique codant une protéine d'intérêt.
17. Méthode selon la revendication 16, dans laquelle la séquence transcrite dudit acide nucléique d'adressage est celle d'un ARNm d'un gène nucléaire, ledit ARNm étant caractérisé par une concentration dans un plaste supérieure à sa concentration cytoplasmique.
18. Méthode d'identification d'un ARN capable d'adresser un ARN d'intérêt vers un plaste d'une cellule végétale dans laquelle on détermine la concentration d'un ARN candidat dans un plaste et dans le cytoplasme d'une cellule végétale, et où on identifie, en tant qu'ARN capable d'adresser un ARN d'intérêt vers un plaste d'une cellule végétale, un ARN dont la concentration dans le plaste est supérieure à sa concentration dans le cytoplasme.
19. Méthode selon la revendication 18, dans laquelle on identifie, en tant qu'ARN capable d'adresser un ARN d'intérêt vers un plaste d'une cellule végétale, un ARN dont la concentration dans le plaste est au moins 2 fois supérieure à sa concentration dans le cytoplasme.
Description:
Méthode d'adressage d'acides nucléiques vers des plastes

L'invention concerne des séquences d'acides nucléiques naturellement importées dans un plaste de cellule végétale, et leur utilisation pour réaliser l'adressage d'une séquence d'ARN d'intérêt vers un plaste de cellule végétale, permettant ainsi notamment l'expression dirigée d'une protéine d'intérêt dans un plaste de cellule végétale.

Un concept a émergé depuis une quinzaine d'années selon lequel la localisation subcellulaire d'ARNm serait un mécanisme clé pour diriger des produits de gènes vers des compartiments subcellulaires individuels, ou vers des régions spécifiques d'une cellule ou d'un embryon, constituant ainsi un mécanisme important de régulation post-transcriptionnelle de l'expression de gènes. Ce phénomène de localisation d'ARNm intervient à la fois chez les organismes unicellulaires, les animaux et les plantes. Les mécanismes susceptibles de contribuer à cette localisation subcellulaire d'ARNm ont été revus par Kloc et al. (2002).

Les premières preuves d'une localisation subcellulaire spécifique d'ARNm dans des cellules de plantes sont très récentes. Une polarisation cellulaire a ainsi été démontrée dans des cellules du xylème en différenciation dans lesquelles une localisation exclusive au niveau du pôle basai ou du pôle apical a été observée en fonction du type d'ARNm d'expansines, des protéines de la paroi cellulaire, considéré (Im et al., 2000). Des ARNm de protéines de stockage chez le riz ont par ailleurs été localisés dans des sous-domaines spécifiques du réticulum endoplasmique (Choi et al., 2000).

Les plastes sont des organites semi-autonomes qui présentent une grande diversité structurale et contiennent des voies biosynthétiques uniques. En particulier, les chloroplastes sont supposés être issus d'une endosymbiose entre une bactérie photosynthétique et une cellule eucaryote. Le fonctionnement approprié de cette association nécessite un haut niveau d'intégration entre le génome chloroplastique et le génome cellulaire de la plante. De nombreux gènes chloroplastiques ont été transférés vers le noyau de la cellule hôte et les protéines codées par ces gènes sont ensuite importées dans le chloroplaste (Martin et Herrmann, 1998 ; Joyard et al., 1998). L'activité chloroplastique régule aussi l'expression de ces gènes aux niveaux transcriptionnel et post-transcriptionnel (Surpin et al., 2002 ; Petracek et al., 1997).

Plus généralement, le fonctionnement des plastes est fortement dépendant des protéines qui sont codées dans le noyau, traduites dans le cytoplasme et importées dans les plastes. En effet, la plupart des gènes codant les protéines plastidiales sont nucléaires et les protéines sont donc transloquées vers les plastes grâce à une machinerie d'importation de protéines contenue dans la membrane de l'enveloppe des plastes. Etonnamment, l'importation de molécules d'ARN depuis le noyau ou le cytoplasme de la cellule hôte vers les plastes n'a jamais été observée, malgré le rôle reconnu de la localisation d'ARN dans la régulation de l'expression génétique.

Très récemment, des travaux montrant l'adressage d'ARN vers les chloroplastes ont été divulgués dans la demande de brevet internationale WO 2004/040973. Cependant, les séquences d'ARN servant à la translocation des gènes dans le chloroplastes sont transformées avec une séquence CLS (Chloroplast Localization Séquence) d'origine virale dont les séquences sont préférentiellement choisies parmi les séquences des virus ASBVd, PLMVd, CChMVd, CChMVd ou encore ELVd et ne sont jamais des séquences d'ARN non transformées et/ou endogènes comme dans la présente invention.

Les inventeurs ont maintenant mis en évidence que des transcrits de certains gènes nucléaires, se retrouvent localisés dans des plastes, et ceci dans des cellules de différentes espèces végétales. Les inventeurs ont ainsi démontré pour la première fois que des ARN transcrits dans le noyau de cellules végétales peuvent être transloqués vers des plastes, en particulier vers des chloroplastes.

Les inventeurs ont en outre démontré qu'un ARN d'intérêt peut être adressé spécifiquement vers un plaste de cellule végétale en fusionnant cet ARN d'intérêt avec un transcrit d'un gène nucléaire détecté dans les plastes. La transformation de cellules végétales avec une telle construction permet donc de transloquer l'ARN d'intérêt vers un plaste, puis d'exprimer dans le plaste la protéine codée par cet ARN d'intérêt.

Le mécanisme d'adressage d'ARNm vers les plastes identifié par les inventeurs représente donc une alternative à la transformation du génome plastidial, en particulier du génome chloroplastique, utilisée jusqu'à présent pour une production dirigée de protéines recombinantes dans ces organites.

Définitions

Dans le cadre de la présente demande on entend par "acide nucléique" un ester de phosphate d'une forme polymérique de ribonucléosides (adénosine, guanosine, uridine ou cytidine; "molécules ARN") ou de désoxyribonucléosides (désoxyadénosine, désoxyguanosine, désoxythymidine, or désoxycytidine; "molécules ADN"), ou un analogue phosphoester quelconque de ceux-ci, tels que des phosphorothioates et des thioesters, sous forme simple brin ou sous forme double brin.

Un "acide nucléique d'adressage" est une molécule d'ADN ou d'ARN dont la séquence transcrite est celle d'un gène qui est localisé dans le noyau d'une cellule végétale (à savoir un gène nucléaire) et qui produit par transcription un ARN messager (ARNm) qui est transloqué du noyau vers un plaste de ladite cellule végétale.

L'expression "séquence transcrite" désigne une séquence d'ARN qui est susceptible d'être obtenue par transcription d'une séquence d'ADN, ou qui a la séquence d'une séquence ARN de référence. Ainsi, si l'acide nucléique d'adressage est une molécule d'ADN, la séquence transcrite est une séquence d'ARNm qui dérive de la séquence de la molécule d'ADN. Si l'acide nucléique d'adressage est déjà une molécule d'ARN, la séquence transcrite est alors celle de la molécule d'ARN.

Un acide nucléique d'adressage est donc caractérisé par une séquence transcrite qui est celle d'un ARNm d'un gène nucléaire, ledit ARNm étant naturellement détectable dans un plaste d'une cellule végétale. Ledit ARNm peut présenter une localisation majoritairement cytoplasmique, une localisation majoritairement plastidiale, ou être localisé en quantités équivalentes dans le cytoplasme et dans un plastide de la cellule. De préférence, ledit ARNm présente une localisation majoritairement plastidiale ; sa concentration dans un plaste est alors supérieure à sa concentration cytoplasmique. Ledit acide, nucléique d'adressage se caractérise alors par une séquence transcrite qui est celle d'un ARNm d'un gène nucléaire, ledit ARNm étant caractérisé par une concentration dans un plaste supérieure à sa concentration cytoplasmique.

Un "acide nucléique d'intérêt" désigne une molécule d'ADN ou d'ARN dont on souhaite adresser la séquence transcrite (s'il s'agit d'une molécule d'ADN) ou que

l'on souhaite adresser (s'il s'agit d'une molécule d'ARN) vers un plaste d'une cellule végétale.

Par "plaste" on désigne un organite ovoïde ou sphérique de quelques microns de long et délimité par une double membrane ou enveloppe. Les plastes sont spécifiques aux cellules végétales et à quelques Protistes. Ces organites ont pour rôle la synthèse et ou le stockage de molécules. Les plastes incluent le chloroplaste qui est l'organite dans lequel a lieu la photosynthèse, l'amyloplaste où a lieu le stockage de l'amidon, l'étioplaste présent dans les tissus non chlorophylliens comme les racines, le gérontoplaste présent dans les tissus sénescents, le chromosplaste qui accumule les pigments, et le proplaste qui est à l'origine des autres plastes.

Méthode d'adressage vers un plaste

Les inventeurs ont mis en évidence que, dans des cellules végétales, les ARNm de certains gènes nucléaires présentent une localisation subcellulaire au niveau de plastes. Ces résultats montrent qu'il existe un mécanisme de translocation d'ARNm depuis le noyau et/ou le cytosol des cellules végétales vers les plastes. En outre des constructions comprenant un tel ARNm fusionné avec une séquence d'acide nucléique d'intérêt sont également retrouvées au niveau des plastes. Ces résultats montrent donc que les transcrits de ces gènes nucléaires constituent des séquences d'adressage vers des plastβs.

L'utilisation de gènes nucléaires dont un transcrit est localisé dans les plastes est particulièrement utile pour transloquer des séquences d'acide nucléique d'intérêt, en particulier des séquences ARN, vers des compartiments subcellulaires plastidiaux spécifiques.

L'invention concerne donc une méthode d'adressage d'un ARN d'intérêt vers un plaste d'une cellule végétale, ladite méthode comprenant la transformation d'une cellule végétale avec un acide nucléique d'intérêt lié à un acide nucléique d'adressage dont la séquence transcrite est celle d'un ARNm d'un gène nucléaire, ledit ARNm étant détectable dans un plaste.

De manière préférée, l'acide nucléique d'adressage a pour séquence transcrite la séquence d'un ARNm d'un gène nucléaire qui est endogène à ladite cellule végétale.

Le plaste peut être sélectionné dans le groupe constitué d'un chloroplaste, d'un amyloplaste, d'un étioplaste, d'un gérontoplaste, d'un chromosplaste et d'un proplaste. Préférentiellement ledit plaste est un chloroplaste.

La détection d'un ARNm donné dans un plaste d'une cellule végétale est à la portée de l'homme du métier. On peut par exemple procéder à une extraction des ARN de plastes isolés à partir de cellules végétales, et rechercher la présence d'un ARNm donné par hybridation avec une sonde spécifique de l'ARNm. La quantité d'ARNm isolée dans un plaste peut être comparée à la quantité présente dans le reste de la cellule, c'est-à-dire le cytosol et l'ensemble des organites autres que le ou les plaste(s) considéré(s), ou à la quantité présente dans les ARN totaux extraits à partir de cellules entières (concentration cytoplasmique). De préférence ledit ARNm est caractérisé par une concentration dans un plaste supérieure à sa concentration cytoplasmique. De préférence encore la concentration dans un plaste dudit ARNm est au moins 2 fois supérieure à sa concentration cytoplasmique. La détermination des concentrations respectives de l'ARNm dans le plaste et le cytoplasme peut être effectuée conformément aux méthodes décrites dans la présente demande.

Les inventeurs ont ainsi identifié, par une étude de criblage sur puce, une liste reproductible de messagers nucléaires fortement enrichis dans les fractions plastidiales, en particulier chloroplastiques, de cellules végétales. Ces ARNm, ainsi que Les séquences d'ADN génomique ou les ADNc de ces gènes nucléaires -une fois transcrites- constituent donc des acides nucléiques permettant d'adresser un ARN auquel ils sont liés vers un compartiment plastidial.

De préférence, un acide nucléique d'adressage selon l'invention a une séquence d'ADN ou d'ARN dont la séquence transcrite est celle d'un ARNm d'un gène nucléaire sélectionné dans le groupe constitué de l'un des gènes identifiés dans l'un des tableaux I 1 II, III, ou IV. Les numéros d'accès TAIR est le numéro d'accès au gène identifié dans la base de données TAIR (The Arabidopsis Information Resource ; http://www.arabidopsis.org) qui a été formée à partir du séquençage du génome de Arabidopsis thaliana.

Tableau

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At3g03480 transferase family similar to hypersensitivity-related gène GB:CAA64636 [Nicotiana tabacum]; contains Pfam transferase family domain PF0Q248

At5g47250 disease résistance protein (CC-NBS-LRR class), putative domain signature CC-NBS-LRR exists, suggestive of a disease résistance protein. l At5g08100 Asparaginase

At2g33840 tyrosyl-tRNA synthetase -related

| At5g16770 myb DNA-binding protein(AtMYB9)

I At3g52520 hypothetical protein

At3g50440 hydrolase, alpha/beta fold family similar to ethylene-induced esterase [Citrus sinensis] Gl: 14279437, polyneuridine aldéhyde esterase [Rauvolfia serpentina] Gl:6651393; contains Pfam profile PF00561 : hydrolase, alpha/beta fold family

At4g 16920 disease résistance protein (TIR-NBS-LRR class), putative domain signature TIR-NBS-LRR exists, suggestive of a disease résistance protein

[ At5g65850 F-box protein family

| At5g54920 expressed protein strong similarity to unknown protein (pir

| At4g29905 expressed protein

At3g06920 pentatricopeptide (PPR) repeat-containing protein low similarity to fertility restorer [Pétunia x hybrida] Gl:22128587; contains Pfam profile PF01535: PPR repeat

At5g39730 avirulence induced gène (AIG) - like protein AIG2 PROTEIN, Arabidopsis thaliana, SWISSPROT:AIG2_ARATH

At4g23030 MATE efflux protein - related contains Pfam profile PF01554: Uncharacterized membrane protein family

At4g1 O51 O subtilisin-like serine protease contains similarity to subtilase; SP1 Gl:9957714 from [Oryza sativa]

At3g 13290 transducin / WD-40 repeat protein family contains 2 WD-40 repeats (PF00400); autoantigen locus HUMAUTANT (GI:533202) [Homo sapiens] and autoantigen locus HSU17474 (Gl:596134) [Homo sapiens]

I At3g43380 hypothetical protein hypothetical proteins - Arabidopsis thaliana

| At5g08520 expressed protein contains similarity to l-box binding factor

I At4g07340 contains similarity to Xenopus laevis replication protein A1 (SW: RFA 1 XENLA) j At5g47790 expressed protein

I At5g05670 signal récognition particle receptor beta subunit-related protein l At1g78890 expressed protein

At1g17230 leucine rich repeat protein family contains protein kinase domain, Pfam:PF00069; contains leucine-rich repeats, Pfam:PF00560

At5g56160 sec14 cytosolic factor family (phosphoglyceride transfer protein family) similar to SEC14 cytosolic factor (SRP45816) [Candida lipolytica]

At1g07620 TP-binding protein -related similar to GB:M24537 from [Bacillus subtilis]

At5g45830 tumor-related protein-like

At4g00730 lomeodomain protein AHDP

At3g59200 F-box protein family contains F-box domain Pfam:PF00646

At1g26930 Kelch repeat containing F-box protein family contains PfarτrPF01344 Kelch motif, Pfam:PF00646 F-box domain

At1g79350 expressed protein

At1g53290 galactosyltransferase family contains Pfam profile: PF01762

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

I At3g26090 expressed protein

| At3g13224 RNA récognition motif (RRM) - containing protein contains InterPro entry IPR000504: RNA-binding région RNP-1 (RNA récognition motif) (RRM)

| At3g20475 DNA mismatch repair MutS family similar to SP

At3g54220 scarecrow transcription factor (SCR)

| At3g61510 1-aminocyclopropane-1-carboxylate synthase (ACC synthase), putative similar to ACC synthases from Citrus sinensis [Gl:6434142], Cucumis melo [GI:695402], Cucumis sativus [Gl:3641645]

I At3g46020 RNA-binding protein, putative similar to Cold-inducible RNA-binding protein (Glycine-rich RNA-binding protein CIRP) from {Homo sapiens} SP

I At3g20280 expressed protein contains Pfam profile: PF00628 PHD-finger, implications for chromatin-mediated transcriptional régulation

At4g28780 GDSL-motif lipase/hydrolase protein similar to family II lipase EXL3 (GI:15054386), EXL1 (Gl: 15054382), EXL2 (GI:15054384) [Arabidopsis thaliana]; contains Pfam profile PF00657: Lipase/Acylhydrolase with GDSL- like motif

At4g 13650 pentatricopeptide (PPR) repeat-containing protein contains Pfam profile PF01535: PPR repeat

| At4g09580 expressed protein hypothetical protein - Arabidopsis thaliana,PIR2:B71448 l At4g18040 translation initiation factor elF4E

| At4g13810 disease résistance protein family (LRR) contains leucine rich-repeat domains Pfam:PF00560, INTERPRO:IPR001611 ; similar to disease résistance protein [Lycopersicon esculentum] gi

I At5g04220 C2 domain-containing protein GC donor splice site at exon 3; similar to Ca2+- dependent lipid-binding protein (CLB1) Gl:2789434 from [Lycopersicon esculentum] '

I At5g07650 formin homology 2 (FH2) domain-containing protein contains formin homology 2 domain, Pfam:PF02128

I At5g58430 leucine zipper-containing protein leucine zipper-containing protein, Lycopersicon esculentum, PIR:S21495

| At5g18240 transfactor-related protein

At5g48690 hypothetical protein

I At5g66460 glycosyl hydrolase family 5/cellulase ((1-4)-beta-mannan endohydrolase)

I At5g60060 F-box protein family various predicted proteins, Arabidopsis thaliana ; similar to SKP1 interacting partner 2 (SKIP2) TIGR_Ath1 :At5g67250

| At5g14070 glutaredoxin protein family contains INTERPRO Domain IPR002109, Glutaredoxin (thioltransferase)

| At4g10020 short-chain dehydrogenase/reductase family protein similar to sterol-binding dehydrogenase steroleosin Gl: 15824408 from [Sesamum indicum]

| At5g20730 auxin response transcription factor (ARF7) identical to auxin response factor 7 Gl:4104929 from [Arabidopsis thaliana]

I At5g65630 bromodomain-containing protein similar to 5.9 kb fsh membrane protein [Drosophila melanogaster] Gl:157455; contains Pfam profile PF00439: Bromodomain

I At2g02290 hypothetical protein and genefinder

| At1g78300 14-3-3 protein GF14 oméga (grf2) identical to GF14omega isoform Gl:487791 from [Arabidopsis thaliana]

| At1g61960 expressed protein similar to hypothetical protein Gl:5541664 from [Arabidopsis thaliana]

| At2g14630 hypothetical protein contains Pfam profile PF03004: Plant transposase (Ptta/En/Spm family)

At5g16230 acyl-racyl-carrier-proteini desaturase (stearoyl-ACP dësaturase). putative

N c d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At4g00750 dehydration-induced protein family similar to early-responsive to dehydration stress ERD3 protein [Arabidopsis thaliana] Gl:15320410; contains Pfam profile PF03141 : Putative methyltransferase

At4g37400, cytochrome P450 family similar to cytochrome P450 monooxygenase CYP91A2, Arabidopsis thaliana, D78607

At4g 15890 expressed protein

At4g09510 neutral invertase like protein Daucus carota mRNA, PID:e1372926

At4g 14720 expressed protein

At5g58000 expressed protein similar to unknown protein (gb

At5g39790 expressed protein δ'-AMP-ACTIVATED PROTEIN KINASE 1 BETA-1 SUBUNIT, pig, SWISSPROT:AAKB_PIG

At5g01390 DnaJ protein family similar to SP

At5g53210 bHLH protein family contains similarity to helix-loop-helix DNA-binding protein

At5g51030 short-chain dehydrogenase/reductase family protein contains INTERPRO family IPR002198 short chain dehydrogenase/reductase SDR family

At5g67540 glycosyl hydrolase family 43 contains similarity to xylanase Gl:2645416 from [Caldicellulosiruptor saccharolyticus]

At5g50030 expressed protein contains similarity to pollen-specific protein Bnm1 Brassica napus Gl: 1857671 ; contains Pfam profile PF04043: Plant invertase/pectin methylesterase inhibitor

At5g05190 expressed protein similar to unknown protein (emb

At3g 12600 MutT/nudix family protein contains Pfam profile PF00293: NUDIX domain

At3g54180 cell division control protein 2 homolog B (CDC2B) identical to cell division control protein 2 homolog B [Arabidopsis thaliana] SWISS-PROT: P25859

At5g01640 expressed protein prenylated Rab acceptor 1 Homo sapiens, EMBL: AJ 133534

At5g53230 hypothetical protein similar to unknown protein (pir

At2g33530 serine carboxypeptidase -related

At2g43690 receptor lectin kinase, putative similar to receptor-like kinase LECRK1 [Arabidopsis thaliana] gi

At3g09110 hypothetical protein

At4g27130 translation initiation factor

At1g60220 UIpI protease family contains Pfam profile PF02902: UIpI protease family, C- terminal catalytic domain

At1g49140 NADH-ubiquinone oxidoreductase 12 kD subunit -related annotation temporarily based on supporting cDNA gi

At1g52700 hypothetical protein contains similarity to lysophospholipase Gl: 1552244 from [Rattus norvegicus] '

At4g39430 hypothetical protein

At1g50980 F-box protein family contains F-box domain Pfam:PF00646

At4g35600 protein kinase family contains protein kinase domain, Pfam:PF00069

At2g 18980 peroxidase, putative identical to peroxidase ATP22a [Arabidopsis thaliana] gi

At2g27410 hypothetical protein

At2g 14520 CBS domain containing protein contains Pfam profiles PF00571 : CBS domain, PF01595: Domain of unknown function

At2g33770 ubiquitin-conjugating enzyme family low similarity to ubiquitin-conjugating BIR- domain enzyme APOLLON [Homo sapiens] GI:8489831 , ubiquitin-conjugating enzyme [Mus musculus] GI:3319990; contains Pfam profile PF00179:

Ubiquitin-conjugating enzyme

At2g24500 C2H2-type zinc finger protein -related likely a nucleic acid binding protein

At2g19190 light repressible receptor protein kinase, putative similar to light repressible

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At2g32590 hypothetical protein

At2g27280 hypothetical protein

At1g12190 F-box protein family contains F-box domain Pfam:PF00646

At1g22720 WAK-like kinase (WLK) contains similarity to serine/threonine kinase gb

At4g04400 hypothetical protein contains Pfam profile PF03384: Drosophila protein of unknown function, DUF287

At2g46740 FAD-linked oxidoreductase family strong similarity to At1g32300, At5g56490, At2g46750, At2g46760; contains PFQ1565: FAD binding domain

At1g62630 disease résistance protein (CC-NBS-LRR class), putative domain signature CC-NBS-LRR exists, suggestive of a disease résistance protein.

At2g 13900 CHP-rich zinc finger protein, putative

At4g28630 ABC transporter family protein identical to half-molecule ABC transporter ATM 1 Gl:9964117 from [Arabidopsis thaliana]

AtCg00320 trnfM : tRNA-Phe

At1g31320 latéral organ boundaries (LOB) domain family similar to latéral organ boundaries (LOB) domain-containing proteins from Arabidopsis thaliana

At1g24200 hypothetical protein similar to hypothetical protein, GB:AAB61107

At1g04070 expressed protein Contains similarity to hypothetical mitochondrial import receptor subunit gb Z98597 from S. pombe. ESTs gb

At1g53760 hypothetical protein

At1g72810 threonine synthase, putative strong similarity to SP

At1g10522 expressed protein

At1g78100 F-box protein family contains F-box domain Pfam:PF00646

At1g72410 hypothetical protein similar to N-term of COP1-lnteracting Protein 7 GB:BAA31739 [Arabidopsis thaliana]

At1g68720 deaminase -related similar to cytidine/deoxycytidyiate deaminase family protein GB:AAF73539 GI:8163170 from [Chlamydia muridarum]

At1g34300 expressed protein contains similarity to receptor-like protein kinase Gl:6979335 from [Qryza sativa]

At1g27850 transposon protein -related similar to En/Spm-like transposon protein GB.-AAB95292 GI:2088658 from [Arabidopsis thaliana]

At1g11220 expressed protein contains similarity to cotton fiber expressed protein GB:AAC33276 from [Gossypium hirsutum]

At1g73970 expressed protein

At1g66840 hypothetical protein

At1g01650 expressed protein

At2g26310 expressed protein and grail

At2g27490 expressed protein

At2g22290 GTP-binding protein, putative similar to GTP-binding protein GI:550072 from [Homo sapiens]

At2g45280 RAD51C DNA repair protein -related

At3g05460 expressed protein

At3g24230 polysaccharide lyase family 1 (pectate lyase) similar to pectate iyase GP: 14531296 from [Fragaria x ananassaj

At3g04605 Mutator-related transposase similar to MURA transposase of maize Mutator transposon

At3g52900 expressed protein chromosome assembly protein homolog, Aquifex aeolicus PIR:B70356

At3g08000 RNA-binding protein, putative similar to RNA-binding protein from- [Nicotiana tabacum] Gl: 15822703, [Nicotiana sylvestris] Gl:624925; contains Pfam profile: PF00076 RNA récognition motif, (a.k.a. RRM, RBD, or RNP domain)

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR region-binding protein [Homo sapiens] Gl: 12642795; contains Pfam profile PF00856: SET domain

At4g33840 glycosyl hydrolase family 10 xylan endohydrolase isoenzyme X-I, Hordeum vulgare,PID:g1813595

At4g29310 expressed protein hypothetical protein T27I1.4 Arabidopsis thaliana,PID:g3540181

At4g22170 F-box protein family contains F-box domain Pfam:PF00646

At4g30680 MA3 domain-containing protein similar to SP

At4g26660 expressed protein probable kinesin - Arabidopsis thaliana, Pir2:H71402

At4g25510 hypothetical protein

At4g33400 Dem -related protein Dem (defective embryo and meristems) protein - Lycopersicon esculentum, PID:e321604

At4g27980 expressed protein

At4g39050 kinesin-related protein kinesin motor protein - Ustilago maydis, PID:g2062750

At4g24050 short-chain dehydrogenase/reductase family protein contains INTERPRO family IPR002198 Short-chain dehydrogenase/reductase (SDR) superfamily

At4g37710 expressed protein predicted protein, Arabidopsis thaliana

At5g42320 hypothetical protein

At5g64190 expressed protein strong similarity to unknown protein (gb

At5g51210 oleosin

At5g03180 C3HC4-type zinc finger protein family various predicted proteins, Arabidopsis thaliana ; contains Pfam profile PF00097: Zinc finger, C3HC4 type (RING finqer)

At5g65310 homeobox-leucine zipper protein ATHB-5 (HD-Zip protein ATHB-5) identical to homeobox-leucine zipper protein ATHB-5 (HD-ZIP protein ATHB-5) (SP:P46667) [Arabidopsis thaliana]

At5g59940 CHP-rich zinc finger protein, putative large number of predicted zinc finger proteins, Arabidopsis thaliana, Homo sapiens and others

At5g56120 expressed protein similar to unknown protein (dbj

At2g03820 nonsense-mediated m RNA decay protein -related

At1g61820 glycosyl hydrolase family 1 similar to beta-glucosidase Gl: 1155254 from [Prunus avium]

At5g44750 expressed protein contains similarity to DNA-damage-inducible protein P

At2g23400 dehydrodolichyl diphosphate synthase [DEDOL-PP synthase], putative similar to GI.796076

At4g11720 hypothetical protein histidine-rich glycoprotein precursor, Plasmodium lophurae, PIR1:KGZQHL

At3g26250 CHP-rich zinc finger protein, putative

At1g23150 expressed protein location of EST gb

At2g24950 hypothetical protein contains Pfam profile PF03080: Arabidopsis proteins of unknown function

At3g14517 pseudogene, similar to L1 repeat, Tf subfamily, member 30 (LINE-element) [Mus musculus] (GB:NP_038605)

At3g 16390 jacalin lectin family similar to myrosinase-binding protein homolog [Arabidopsis thaliana] Gl:2997767, epithiospecifier [Arabidopsis thaliana] Gl:16118845; contains Pfam profiles PF01419 jacalin-like lectin family, PF01344 Kelch motif

At2g35330 expressed protein

At1g56110 nucleolar protein Nop56, putative similar to XNop56 protein [Xenopus laevis] Gl:14799394; contains Pfam profile PF01798: Putative snoRNA binding domain

At5g66910 disease résistance protein (CC-NBS-LRR class), putative domain signature

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

Gl:3264828 from [Gossypium hirsuturn]_ l At1g80960 îxpressed protein

| At1g67370 meiotic asynaptic mutant 1 identical to meiotic asynaptic mutant 1 [Arabidopsis thaliana] Gl:7939627; contains Pfam profiles PF02301 : DNA-binding HORMA domain, PF04433: SWIRM domain

| At1g64460 phosphatidylinositol 3- and 4-kinase family contains Pfam profile PF00454: Phosphatidylinositol 3- and 4-kinase

| At1s75980_ expressed protein

| At1g33800_ expressed protein

| At2g47490 mitochondrial carrier protein family contains Pfam profile: PF0Q153 mitochondrial carrier protein

At2g27950_ expressed protein

| At2g44830 protein kinase putative similar to protein kinase PVPK-1 [Phaseolus vulgaris] SWISS-PROT:P15792

| At3g24700 F-box protein family contains F-box domain Pfam:PF00646

| At3g46160 protein kinase-related contains eukaryotic protein kinase domain, INTERPRO:1PR000719

At3g49670 leucine-rich repeat transmembrane protein kinase, putative CLAVATA1 receptor kinase, Arabidopsis thaliana, EMBL:ATU96879

I At3g43200 pseudogene, putative protein predicted proteins, Arabidopsis thaliana

| At3g10970 haloacid dehalogenase-like hydrolase family low similarity to genetic modifier [Zea mays] Gl: 10444400; contains interPro accession IPR005834: Haloacid dehalogenase-like hydrolase

| At3g51920_ calmodulin 9 identical to calmodulin 9 GI:5825602 from [Arabidopsis thaliana]

| At3g11320 phosphate translocator-related low similarity to phosphoenolpyruvate/phosphate translocator precursor [Mesembryanthemum crystallinum] Gl:9295275, phosphate translocator [Nicotiana tabacum] GI:403023; contains Pfam profile: PF00892 Integra! membrane pro?

I At4g27680_ expressed protein MSP1 protein, Saccharomyces cerevisia, PIR2:A49506 l At4g00670 hypothetical protein

| At4g31320 auxin-induced (indole-3-acetic acid induced) protein, putative (SAUR_c) similar to auxin-induced protein TGSAUR22 (Gl: 10185820) [Tulipa gesnerian]; similar to auxin-induced protein 15A (SP:P33081) from [Glycine max]

| At4g28980 cdk-activating kinase 1At identical to Cdk-activating kinase 1At [Arabidopsis thaliana] gi

| At4g16690 esterase/lipase/thioesterase family similar to ethylene-induced esterase [Citrus sinensis] GM4279437, polyneuridine aldéhyde esterase [Rauvolfia serpentina] Gl:6651393, SP

| At5g57730 hypothetical protein

I At5g09560 KH domain protein various predicted RNA binding proteins, Arabidopsis thaliana

[At5g59770 expressed protein protein tyrosine phosphatase-like protein, PTPLB, Mus musculus, EMBLAF169286

| At5g47290 myb family transcription factor contains PFAM profile: PF00249 myb-like DNA binding domain

| At5g52170 homeodomain protein similar to Anthocyaninless2 (ANL2) (GP:5702094) [Arabidopsis thaliana]; contains Pfam PF00046: Homeobox domain and Pfam PF01852: START domain

At4g03260 leucine rich repeat protein family contains leucine rich repeat (LRR) domains, Pfam:PF00560

[Ât2g3i570 glutathione peroxidase, putative

At1g52060 jacalin lectin family similar to myrosinase-binding protein homolog [Arabidopsis

N 0 d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR thaliana] Gl:2997767; contains Pfam profile PF01419 jacalin-like lectin domain

| At4g15396 cytochrome P450 -related similar to Cytochrome P450 9OC 1 (ROTUNDIFOLIA3) (SP:Q9M066) [Arabidopsis thaliana]; contains Pfam profile: PF0QQ67: Cytochrome P450 {Arabidopsis thaliana}

| At2g2619Q expressed protein

At1g21310 extensin family protein contains extensin-like région, Pfam:PF04554

| At2g19450 diacylglycerol O-acyltransferase (acyl CoA:diacylglycerol acyltransferase) (DGAT) identical to gi:5050913, gi:6625553

[ At2g16340 hypothetical protein

| At3g10860 ubiquinol-cytochrome C reductase complex ubiquinone-binding protein (QP-C) -related similar to ubiquinol-cytochrome C reductase complex ubiquinone- binding protein (QP-C) GB:P46269 [Solanum tuberosum]

[ At1g05650 polygalacturonase, putative similar to GB:AAC23398

| At1g49080 pse ' ùdogene, putative transposon protein similar to Antirrhinum majus TNP2 protein gb

| At3g23280 auxin-regulated protein contains Pfam profile: PF00023 ankyrin repeat

| At1g28300 transcriptional factor B3 protein leafy cotylédon 2 nearly identical to LEAFY COTYLEDON 2 [Arabidopsis thaliana] Gl: 15987516; contains Pfam profile PF02362: B3 DNA binding domain

At1gO464O lipoyltransferase identical to GB:BAA78386

! At1g36310 expressed protein

| At1g47860 reverse transcriptase-related low similarity to reverse transcriptase [Arabidopsis thaliana] Gl:976278; contains Pfam profiles PF00078: Reverse transcriptase (RNA-dependent DNA polymerase), PF00096: Zinc finger, C2H2 type, PF03727: Hexokinase

| At1g61410 expressed protein similar to putative double- strand break repair protein Gl:9651817 from [Arabidopsis thaliana]

I AtIg 13940 expressed protein identical to hypothetical protein GB:AAD39280 GI:5080770 from [Arabidopsis thaliana]

| At1g65650 expressed protein similar to ubiquitin C-terminal hydrolase-like protein Gl:9759113 from [Arabidopsis thaliana]

! At1g31150 expressed protein EST gb

[ At1g69630 F-box protein family contains F-box domain Pfam:PF00646

[ At1g36950 zinc finger protein -related similar to GB:AAC69857 from [Arabidopsis thaliana]

| At1g55550 kinesin-related protein Similar to Kinesin proteins; Contains kinesin motor domain protein motif and kinesin heavy chain signature motif

I At2g23890 expressed protein and genefinder

| At2g07030 Mutator-related transposase similar to MURA transposase of maize Mutator transposon

| At2g14810 hypothetical protein l At2g31470 F-box protein family contains F-box domain Pfam:PF00646

| At3g46470 hypothetical protein

I At3g06400 DNA-dependent ATPase, putative similar to DNA-dependent ATPase SNF2H [Mus musculus] GI:14028669; contains Pfam profiles PF00271: Helicase conserved C-terminal domain, PF00176: SNF2 family N-terminal domain, PF00249: Myb-like DNA-binding domain

At3g04430 No apical meristem (NAM) protein family similar to CUC1 (GP: 12060422) {Arabidopsis thaliana}

| At3g51050 expressed protein hypothetical protein L1648.04 - Leishmania major, EMBL: LMFL1648

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAlR

Gl:3461830 from [Arabidopsis thaiiana]

At5g47620 heterogeneous nuclear ribonucieoprotein (hnRNP), putative

At5g 17820 peroxidase, putative identical to peroxidase ATP13a [Arabidopsis thaiiana] gi

I At5g33370 GDSL-motif lipase/hydrolase protein similar to family II lipase EXL3 (Gl: 15054386), EXL1 (Gl: 15054382), EXL2 (Gl: 15054384) [Arabidopsis thaiiana]; contains Pfam profile PF00657: Lipase/Acylhydrolase with GDSL- like motif

I At2g39880 myb family transcription factor (MYB25) contains Pfam profile: PF00249 myb- like DNA-binding domain

I At2g20240 expressed protein

[ At2g02220 leucine-rich repeat transmembrane protein kinase, putative

| At2g44210 expressed protein Pfam profile PF03080: Arabidopsis proteins of unknown function

| At3g60150 hypothetical protein hypothetical protein F4I1.34 - Arabidopsis thaiiana, PIR:T02408

| At3g 12970 expressed protein

| At3g61910 No apical meristem (NAM) protein family no apical meristem (NAM) - Pétunia hybrida, EMBLPHDNANAM

I At3g09030 expressed protein identical to GB:AAD56319 [Arabidopsis thaiiana]

| At3g02250 auxin-independent growth promoter -related similar to auxin-independent growth promoter GB:A44226 [Nicotiana tabacum]

| At4g10040 cytochrome c several plant cytochrome c (for instance cucurbit, PIR1:CCPU)

I At4g23380 hypothetical protein predicted proteins, Arabidopsis thaiiana

! At4g23110 hypothetical protein

| At4g 13990 hypothetical protein

| At5g54130 calcium-binding ÈF-hand family protein contains I NTERPRO: IPR002048 calcium-binding EF-hand domain

! At5g43670 protein transport protein SEC23

| At5g59800 hypothetical protein

| At5g12270 oxidoreductase, 2OG-Fe(II) oxygenase family similarity to ripening protein E8, tomato, PIR:S01642; contains Pfam domain PF03171 , 2OG-Fe(II) oxygenase superfamily

] At5g 16530 auxin efflux carrier protein family contains auxin efflux carrier domain, Pfam:PF03547

! At4g35410 clathrin assembly protein AP19 homolog

| At4gO3916 hypothetical protein low similarity to SP

[ At2g14960 auxin-regulated protein -related l At2g15000 expressed protein

| At2g16390 SNF2 domain/helicase domain-containing protein low similarity to RAD54 [Drosophila melanogaster] Gl:1765914; contains Pfam profiles PF00271: Helicase conserved C-terminai domain, PF00176: SNF2 family N-terminal domain

At1g51150 DegP protease contains similarity to DegP2 protease Gl: 13172275 from [Arabidopsis thaiiana]

At1g66180 expressed protein

I At3g60830 actin - like protein actin 3, Drosophila melanogaster, PIR:A03000

| At2g21770 cellulose synthase, catalytic subunit, putative similar to gi:2827141 cellulose synthase catalytic subunit, Arabidopsis thaiiana (Ath-A) l AtCg00700 psbN : photosystem II protein N

| At1g09240 nicotianamine synthase, putative similar to nicotianamine synthase [Lycopersicon esculentum][GI:4753801], nicotianamine synthase 2 [Hordeum

Tableau II :

N 0 d'accès Description (gènes homologues identifiés dans d'autres organismes) TAlR

At3g54400 nucleoid DNA-binding - like protein nucleoid DNA-binding protein cnd41 , chloroplast, common tobacco, PIR:T01996

At2g 15570 thioredoxin M-type 3, -chloroplast precursor (TRX-M3) identical to SP trnY&trnE

At5g66140 2OS proteasome alpha subunit D2 (PAD2) (gb

At2g40510 4OS ribosomal protein S26 (RPS26A)

At1g80300 adenine nucleotide translocase identical to adenine nucleotide translocase GB-.Z49227 [Arabidopsis thalianal (FEBS Lett. 374 (3), 351-355 (1995))

At1g17260 ATPase 10, plasma membrane-type (proton pump 10) (proton-exporting ATPase), putative strong similarity to SP

At4g 15440 hydroperoxide lyase (HPOL) like protein

At4g22260 alternative oxidase, putative (IMMUTANS) identical to IMMUTANS from Arabidopsis thaliana [gi:4138855]; contains Pfam profile PF01786 alternative oxidase

At3g27690 light harvesting chlorophyll A/B binding protein, putative similar to chlorophyll A-

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

B binding protein 151 precursor (LHCP) GB:P27518 from [Gossypium hirsutum]

I At3g56690 calmodulin-binding protein identical to calmodulin-binding protein GI:6760428 from [Arabidopsis thaliana]

| At3g15640 cytochrome c oxidase subunit Vb -related similar to cytochrome oxidase IV GB:223590 [Bos taurus]; contains Pfam profile: PF01215 cytochrome c oxidase subunit Vb

At3g48425 endonuclease/exonuclease/phosphatase family similar to SP

At2g31670 expressed protein

| At4g26670 expressed protein

| At1g06380 expressed protein similar to hypothetical protein Gl:6598642 from [Arabidopsis thaliana]

| At4g11960 hypothetical protein hypothetical protein F7H19.70 - Arabidopsis thaliana, PID:e1310057

At1g78620 expressed protein

I At3g48730 glutamate-1-semialdehyde 2,1-aminomutase 2 (GSA 2) (glutamate-1- semialdehyde aminotransferase 2) (GSA-AT 2) identical to GSA2 [SP

I At5g63570 glutamate-1-semialdehyde 2,1-aminomutase 1 (GSA 1) (glutamate-1- semialdehyde aminotransferase 1) (GSA-AT 1) identical to GSA 1 [SP

| At3g44780 hypothetical protein

At4g28660 photosystem 11 protein W - like photosystem II protein W, Porphyra purpurea, PIR2:S73268

At5g44020 végétative storage protein-related

| At1g12170 F-box protein family contains F-box domain Pfam:PF00646

| At1g46768 AP2 domain protein RAP2.1 identical to AP2 domain containing protein RAP2.1 Gl:2281627 from [Arabidopsis thaliana]

At1g13620 hypothetical protein

[ At1g77720 protein kinase family contains protein kinase domain, Pfam:PF00069

| At1g35530 DEAD/DEAH box helicase, putative low similarity to RNA helicase/RNAselll CAF protein [Arabidopsis thaliana] GI:6102610; contains Pfam profiles PF00270: DEAD/DEAH box helicase, PF00271 : Helicase conserved C-terminal domain

| At1g55570 pectinesterase (pectin methylesterase) family similar to pectinesterase [Lycopersicon esculentum][GI:1944575]; nearly identical to pollen-specific BP10 protein [SP l At1g14000 protein kinase -related

| At1g35500 hypothetical protein

| At1g21lZ0 hypothetical protein

| At1g72330 alanine aminotransferase, putative similar to alanine aminotransferase 2 SP

I AtIg 18040 cell division protein kinase, putative similar to cell division protein kinase 7 [Homo sapiens] SWISS-PROT: P50613

| At1g08340 rac GTPase activating protein -related similar to rac GTPase activating protein 1 GI:3695059 from [Lotus japonicus]

[ At1g27260 hypothetical protein

| At4g38620 transcription factor (MYB4) -related

I At2g47460 myb family transcription factor similar to myb-related DNA-binding protein Gl: 1020155 from [Arabidopsis thaliana]

| At2g18010 auxin-induced (indole-3-acetic acid induced) protein family similarto auxin- induced protein TGSAUR22 (GM0185820) [Tulipa gesnerian] ;similar to indole- 3-acetic acid induced protein ARG7 (SP:P32295) [Phaseolus aureus]

I At2g36840 ACT domain-containing protein contains Pfam profile ACT domain PF01842

At2g37080 myosin heavy chain -related

N 0 d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At4g31980 ;xpressed protein EREBP-4 homolog, Arabidopsis thaliana

At3g 15700 hypothetical protein similar to N-term of NBS/LRR disease résistance protein GB:AAC26125 [Arabidopsis thaliana]; contains Pfam profile: PF00931 NB-ARC domain

At3g21933 pseudogene contains Pfam profile: PF01657 Domain of unknown function

At3g 17470 calcium-binding EF-hand family protein contains INTERPRO:IPR002048 calcium-binding EF-hand domain

At3g60520 expressed protein

At3g08560 vacuolar ATP synthase subunit E -related similar to vacuolar ATP synthase subunit E GB:Q39258 [Arabidopsis thaliana]

At3g53330 plastocyanin-like domain containing protein similar to mavicyanin SP:P80728 from [Cucurbita pepo]

At4g 15040 subtilisin-like serine protease contains similarity to prepro-cucumisin GI:807698 from [Cucumis melo] __

At4q 10740 hypothetical protein

At4g37130 proline-rich protein-related

At5g37690 lipase family similar to family II lipase EXL3 (Gl: 15054386), EXL1 (Gl:15054382), EXL2 (GI:15054384) [Arabidopsis thaliana]

At5g46000 jacalin lectin family similar to myrosinase-binding protein homolog [Arabidopsis thaliana] Gl:2997767; contains Pfam profile PF01419 jacalin-like lectin domain

At5g54310 ARF GAP-like zinc finger-containing protein (ZIGA3) almost identical to ARF GAP-like zinc finger-containing protein ZIGA3 Gl: 10441352 from [Arabidopsis thaliana]

At5g 15490 UDP-glucose dehydrogenase-related protein UDP-glucose 6-dehydrogenase - Glycine max, EMBLU53418

At4g13510 ammonium transport protein (AMT1)

At4g02630 protein kinase family contains protein kinase domain-, Pfam:PF00069; contains serine/threonine protein kinase domain, INTERPRO:IPR002290

At1g56100 hypothetical protein

At1g74150 Kelch repeat-containing protein low similarity to mgB protein, Dictyostelium discoideum, PIR:S68824; contains Pfam profile PF01344: Kelch motif

At1g69770 chromomethylase -related similar to chromomethylase GB:AAB95486 [Arabidopsis arenosa]

At3g30810 hypothetical protein

At5g 18620 DNA-dependent ATPase, putative similar to DNA-dependent ATPase SNF2H [Mus musculus] GI:14028669; contains Pfam profiles PF00271 : Helicase conserved C-terminal domain, PF00176: SNF2 family N-terminal domain, PF00249: Myb-like DNA-binding domain

At1g62050 expressed protein

At3g25940 expressed protein

At1g80050 adenine phosphoribosyltransferase almost identical to adenine phosphoribosyltransferase GI:1402894 from [Arabidopsis thaliana]

At1g59312 hypothetical protein

At1g64960 expressed protein

At1g03370 C2 domain/GRAM domain-containing protein low similarity to SP

At1g03590 protein phosphatase 2C (PP2C) similar to GB:AAB97706

At4g17910 hypothetical protein predicted protein, Saccharomyces cerevisiae, PIR2:S56868

At2g33580 protein kinase -related contains a protein kinase domain profile (PDOC00100)

At2g44190 expressed protein

At2g 18480 mannitol transporter, putative similar to mannitol transporter [Apium graveolens var. dulce] Gl: 12004316; contains Pfam profile PF00083: major facilitator

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR superfamily protein

At2g46310 AP2 domain transcription factor, putative

At3g09600 myb family transcription factor contains Pfam profile: PF00249 myb-like DNA- binding domain

At3g26090 expressed protein

At3g 13224 RNA récognition motif (RRM) - containing protein contains InterPro entry 1PR000504: RNA-binding région RNP-1 (RNA récognition motif) (RRM)

At3g54220 scarecrow transcription factor (SCR)

At3g61510 1-aminocyclopropane-i-carboxylate synthase (ACC synthase), putative similar to ACC synthases from Citrus sinensis [Gl:6434142], Cucumis melo [GI:695402], Cucumis sativus [Gl:3641645]

At3g46020 RNA-binding protein, putative similar to Cold-inducible RNA-binding protein (Glycine-rich RNA-binding protein CIRP) from {Homo sapiens} SP

At4g28780 GDSL-motif lipase/hydrolase protein similar to family II lipase EXL3 (Gl: 15054386), EXL1 (Gl: 15054382), EXL2 (Gl: 15054384) [Arabidopsis thaliana]; contains Pfam profile PF00657: Lipase/Acylhydrolase with GDSL-like motif

At4g 13650 pentatricopeptide (PPR) repeat-containing protein contains Pfam profile PF01535: PPR repeat

At4g09580 expressed protein hypothetical protein - Arabidopsis thaliana, PIR2:B71448

At5g04220 C2 domain-containing protein GC donor splice site at exon 3; similar to Ca2+- dependent lipid-binding protein (CLB1) Gl:2789434 from [Lycopersicon esculentum]

At5g 18240 transfactor-related protein

At4g 10020 short-chain dehydrogenase/reductase family protein similar to sterol-binding dehydrogenase steroleosin Gl: 15824408 from [Sesamum indicum]

At5g20730 auxin response transcription factor (ARF7) identical to auxin response factor 7 Gl:4104929 from [Arabidopsis thaliana]

At5g65630 bromodomain-containing protein similar to 5.9 kb fsh membrane protein [Drosophila melanogaster] Gl: 157455; contains Pfam profile PF00439: • Bromodomain

At1g78300 14-3-3 protein GF14 oméga (grf2) identical to GF14omega isoform Gl:487791 from [Arabidopsis thaliana]

At1g61960 expressed protein similar to hypothetical protein Gl:5541664 from [Arabidopsis thaliana]

At2g 14630 hypothetical protein contains Pfam profile PF03004: Plant transposase (Ptta/En/Spm family)

At5g 16230 acyl-[acyl-carrier-protein] desaturase (stearoyl-ACP desaturase), putative similar to Acyl-[acyl-carrier protein] desaturase from Spinacia oleracea SP

At1g22170 expressed protein contains similarity to phosphoglycerate mutases

At4g08320 tetratricopeptide repeat (TPR)-containing protein glutamine-rich tetratricopeptide repeat (TPR) containing protein (SGT) - Rattus norvegicus, Pl D:e1285298 (SP

At5g49500 SRP54 (signal récognition particle 54 KDa) protein

At3g49400 transducin / WD-40 repeat protein family contains 4 WD-40 repeats (PF00400); low similarity (47%) to Agamous-like MADS box protein AGL5 (SP:P29385) {Arabidopsis thaliana}

At1g22210 trehalose-6-phosphate phosphatase, putative similar to trehalose-6-phosphate phosphatase (AtTPPB) GI:2944180 from [Arabidopsis thaliana]; contains Pfam profile PF02358: Trehalose-phosphatase

At1 g68935 expressed protein

At1g24625 zinc finger protein 7, ZFP7

At1g08100 high-affinity nitrate transporter ACH2 identical to GB:AAC35884 from

N' d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At5g49430 transducin / WD-40 repeat protein family similar to WD-repeat protein 9 (SP:Q9NSI6) {Homo sapiens}; contains Pfam PF00400: WD domain, G-beta repeat (4 copies)

At5g59640 serine/threonine-specific protein kinase - like putative protein serine /threonine kinase, Sorghum bicolor, EMBLSBRLK1

At5g06270 B-type cyclin -related similar to B-type cyclin G I -.849074 from [Nicotiana tabacum]

At5g65070 MADS-box protein

At5g01780 oxidoreductase, 2OG-Fe(II) oxygenase family low similarity to alkB protein - Escherichia coli, PIR:BVECKB, alkB [Caulobacter crescentus][GI:2055386]; contains Pfam domain PF03171 2OG-Fe(Il) oxygenase superfamily

At5g 15370 hypothetical protein

At5g42910 ABA-responsive élément binding protein, putative

At4g34060 hypothetical protein

At3g42480 hypothetical protein hypothetical proteins - Arabidopsis thaliana

At4g24530 PsRTI 7-1 like protein PsRTI 7-1 , Pisum sativum (pea), PATX:G1778376

At2g27280 hypothetical protein

At1g22720 WAK-like kinase (WLK) contains similarity to serine/threonine kinase gb

At4g04400 hypothetical protein contains Pfam profile PF03384: Drosophila protein of unknown function, DUF287

At2g46740 FAD-linked oxidoreductase family strong similarity to At1g32300, At5g56490, At2g46750, At2g46760; contains PF01565: FAD binding domain

At1g62630 disease résistance protein (CC-NBS-LRR class), putative domain signature CC- NBS-LRR exists, suggestive of a disease résistance protein.

At2g 13900 CHP-rich zinc finger protein, putative

At4g28630 ABC transporter family protein identical to half-molecule ABC transporter ATM 1 Gl:9964117 from [Arabidopsis thaliana]

At1g31320 latéral organ boundaries (LOB) domain family similar to latéral organ boundaries (LOB) domain-containing proteins from Arabidopsis thaliana

At1g24200 hypothetical protein similar to hypothetical- protein, GB:AAB61107

At1g04070 expressed protein Contains similarity to hypothetical mitochondrial import receptor subunit gb Z98597 from S. pombe. ESTs gb

At1g72810 threonine synthase, putative strong similarity to SP

At1g10522 expressed protein

At1g78100 F-box protein family contains F-box domain Pfam:PF00646

At1g68720 deaminase -related similar to cytidine/deoxycytidylate deaminase family protein GB:AAF73539 GI:8163170 from [Chlamydia muridaruml

At1g11220 expressed protein contains similarity to cotton fiber expressed protein GB-.AAC33276 from [Gossypium hirsutum]

At1g73970 expressed protein

At1g66840 hypothetical protein

AtIg01650 expressed protein

At2g26310 expressed protein and grail

At2g22290 GTP-binding protein, putative similar to GTP-binding protein Gl:550072 from [Homo sapiens]

At2g45280 RAD51 C DNA repair protein -related

At3g05460 expressed protein

At3g52900 expressed protein chromosome assembly protein homolog, Aquifex aeolicus, PIR:B70356

At4g04360 hypothetical protein

At4g26850 expressed protein

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At3g46170 short-chain dehydrogenase/reductase family protein contains similarity to 3- oxoacyl-[acyl-carrier protein] reductase SP:P51831 from [Bacillus subtilis]

At4g22070 WRKY family transcription factor identical to WRKY transcription factor 31 (WRKY31) Gl: 15990589 from [Arabidopsis thaliana]

At5g06390 expressed protein strong similarity to unknown protein (gb

At2g32430 galactosyltransferase family contains Pfam profile: PF01762 galactosyltransferase

At1g71240 expressed protein

At3g23980 expressed protein

At1q03060 putataive transport protein Similar to gb

At4g 34090 expressed protein

At1g55740 glycosyl hydrolase family 36 similar to seed imbibition protein GB:AAA32975 G 1 : 167100 from [Hordeum vulgare]

At1g16190 DNA repair protein RAD23, putative similar to DNA repair by nucleotide excision (NER) RAD23 protein, isoform II Gl:1914685 from [Daucus carota]

At1g12030 hypothetical protein

At1g64355 expressed protein

At1g47350 hypothetical protein similar to hypothetical protein GB:AAD22292 Gl:6598654 from [Arabidopsis thaliana]

At5g66020 hypothetical protein non-consensus AT donor splice site at exon 7, TA donor splice site at exon 10, AT acceptor splice at exon 13, strong similarity to unknown protein (emb

At2g43420 3-beta hydroxysteroid dehydrogenase/isomerase family contains Pfam profile PF01073 3-beta hydroxysteroid dehydrogenase/isomerase domain; similar to NAD(P)-dependent steroid dehydrogenase from Homo sapiens [SP

At3g56980 bHLH protein family NULL

At3g52200 dihydrolipoamide S-acetyltransferase (LTA3); nuclear gène encoding mitochondrial protein annotation temporarily based on supporting cDNA gi

At3g 10400 RNA récognition motif (RRM) - containing protein low similarity to splicing factor SC35 [Arabidopsis thaliana] Gl:9843653; contains InterPro entry IPR000504: RNA-binding région RNP-1 (RNA récognition motif) (RRM)

At3g25960 pyruvate kinase, putative similar to pyruvate kinase, cytosolic isozyme [Nicotiana tabacum] SWISS-PROT:Q42954

At3g07990 serine carboxypeptidase -related similar to serine carboxypeptidase II (CP-MIl) GB:CAA70815 [Hordeum vulgare]

At3g06270 protein phosphatase 2C (PP2C), putative similar to protein phosphatase-2C (PP2C) GB:AAC36699 [Mesembryanthemum crystallinum]; contains Pfam orofile: PF00481 protein phosphatase 2C

At3g05200 RING-H2 zinc finger protein ATL6 -related similar to GB:AAD33584 from [Arabidopsis thaliana]

At3g61600 POZ domain protein family contains Pfam PF00651: BTB/POZ domain; contains Interpro IPR000210/ PS50097: BTBB/POZ domain; similar to POZ/BTB containing-protein AtPOBI (Gl: 12006855) [Arabidopsis thaliana]; similar to actinfilin ((31:21667852) [Rattus norv?

At4g 10300 expressed protein predicted protein, Arabidopsis thaliana

At5g37790 protein kinase family contains protein kinase domain, Pfam:PFÇ)Q069_

At5g61850 LFY floral meristem identity control protein

At5g44040 expressed protein similar to unknown protein (gb

At5g40580 2OS proteasome beta subunit B (PBB2)

At4g33800 expressed protein

At5g41060 DHHC-type zinc finger domain-containing protein contains Pfam profile

N 0 d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

PF01529: DHHC zinc finger domain

|At3g45940 glycosyl hydrolase family 31 similar to alpha-xylosidase precursor Gl :4163997 from [Arabidopsis thaliana]

| At5g66710 protein kinase, putative similar to protein kinase ATN1 GP

I At2g45900 expressed protein j At1g68280 hypothetical protein

| At4g01730 DHHC-type zinc finger domain-containing protein contains Pfam profile PF01529: DHHC zinc finqer domain

| At1g23460 polygalacturonase, putative similar to polygalacturonase GB:BAA88472 G 1:6624205 from (Cucumis sativus)

| At1g21620 pumilio-family RNA-binding protein, putative similar to hypothetical protein GB-.AAD41414 Gl:5263312 from (Arabidopsis thaliana)

| At1g16640 transcriptional factor B3 family low similarity to reproductive meristem protein 1 [Arabidopsis thaliana] Gl: 13604227; contains Pfam profile PF02362: B3 DNA binding domain

| At1g18460 lipase family similar to triacylglycerol lipase, gastric precursor (EC 3.1.1.3) {Canis familiaris} [SP

[ At1g49890 expressed protein

I At4g08680 MuDR-A transposon protein -related similar to Z. mays MuDR-A protein

At5g41490 hypothetical protein strong similarity to unknown protein (gb

I At2g02790 hypothetical protein

|At2g39870 expressed protein

At2g41040 expressed protein l At2g15050 lipid transfer protein, putative similar to SP

I At2g28250 protein kinase family contains protein kinase domain, Pfam:PF00069

I At3g20720 expressed protein

| At3g01900 cytochrome P450 family similar to Cytochrome P450 94A1 (P450-dependent fatty acid omega-hydroxylase) (SP:O81117) {Vicia sativa}; contains Pfam profile: PF00067 cytochrome P450

| At3g62420 bZIP family transcription factor similar to common ptant regulatory factor 6 GI:9650826 from [Petroselinum crispum]

I At3g20030 F-box protein family contains F-box domain Pfam:PF00646

At4g33840 glycosyl hydrolase family 10 xylan endohydrolase isoenzyme X-I, Hordeum vulgare,PID:g1813595

I At4g26660 expressed protein probable kinesin - Arabidopsis thaliana, Pir2:H71402

| Àt4g25510 hypothetical protein

I At4g27980 expressed protein

| At4g37710 expressed protein predicted protein, Arabidopsis thaliana

[ At5g51210 oleosin

| At5g03180 C3HC4-type zinc finger protein family various predicted proteins, Arabidopsis thaliana ; contains Pfam profile PF00097: Zinc finger, C3HC4 type (RING finger)

I At5g59940 CHP-rich zinc finger protein, putative large number of predicted zinc finger proteins, Arabidopsis thaliana, Homo sapiens and others

| At4g11720 hypothetical protein histidine-rich glycoprotein precursor, Plasmodium lophurae, PIR1 :KGZQHL rAt3g26250 CHP-rich zinc finger protein, putative

I At2g24950 hypothetical protein contains Pfam profile PF03080: Arabidopsis proteins of unknown function

[At3g 16390 jacalin lectin family similar to myrosinase-binding protein homolog [Arabidopsis thaliana] Gl:2997767, epithiospecifier [Arabidopsis thaliana] Gl:16118845; contains Pfam profiles PF01419 jacalin-like lectin family, PF01344 Kelch motif

N 0 d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

I At2g35330 expressed protein

| At2g17200 ubiquitin protein -related

| At1g47840 hexokinase -related similar to hexokinase 2 GB:AAB49911 Gl: 1899025 from [Arabidopsis thaliana]

| At1g28430 cytochrome P450, putative similar to cytochrome P450 (CYP93A1) GI:1435059 from [Glycine max]

| At1g65870 disease résistance response protein-related/ dirigent protein-related similar to dirigent protein [Forsythia x intermedia] gi .__

At1g55880 pyridoxal-5'-phosphate-dependent enzyme, beta family similar to SP

| At1g17250 leucine rich repeat protein family contains leucine rich-repeat (LRR) domains Pfam:PF00560, INTERPRO:IPR001611 ; similar to Hcr2-0B [Lycopersicon esculentum] gi

At5g21070 expressed protein predicted protein - Oryza sativa - TREMBL:AP001072_3

I At2g38780 expressed protein

| At2g13840 expressed protein l At2g48100 exonuclease -related annotation temporarily based on supporting cDNA gi

I At2g37040 phenylalanine ammonia lyase (PAL1) nearly identical to SP

I At3g04460 expressed protein similar to peroxisomal biogenesis factor 12 GB:NP_000277 [Homo sapiens]

At3g 13140 hypothetical protein

| At3g43720 protease inhibitor/seed storage/iipid transfer protein (LTP) family contains Pfam protease inhibitor/seed storage/LTP family domain PF00234

I At4g39220 AtReriA

| At4g12240 hypothetical proteins

At4g07770 pseudogene, similar to L1 repeat, Tf subfamily, member 30 (LINE-element) [Mus musculus] (GB:NP_038605)

At4g 14920 PHD finger transcripti on factor, putative

I At5g46280 DNA replication licensing factor, putative similar to SP

I At5g43340 inorganic phosphate transporter identical to inorganic phosphate transporter [Arabidopsis thaliana] GI:3869190

| At5g42250 alcohol dehydrogenase (ADH), putative similar to alcohol dehydrogenase ADH GI:7705214 from [Lycopersicon esculentum]; contains Pfam zinc-binding dehydrogenase domain PF00107

At5g58540 expressed protein serine/threonine-specific protein kinase NPK15, Nicotiana tabacum, PIFfc_S52578 l At5g52510 scarecrow-like transcription factor 8 (SCL8)

I At2g43640 signal récognition particle protein 14kD, ATSRP14 -related

| At4g03870 pseudogene, putative transposon protein similar to MuDR transposon

At5g49270 expressed protein contains similarity to phytochelatin synthetase

| At5g61110 hypothetical protein

| At5g07810 SNF2 domain/helicase domain-containing protein similar to HepA-related protein HARP [Homo sapiens] Gl:6693791 ; contains Pfam profiles PF00271 : Helicase conserved C-terminal domain, PF00176: SNF2 family N-terminal domain, PF01844: HNH endonuclease

| At2g32920 protein disulfide isomerase family similar to SP

| At2g29920 hypothetical protein

| At1g37045 an Arabidopsis thaliana hypothetical protein, which contains similarity to retrotransposon Athila (GB:AF076275) -related temporary automated functional assignment

| At5g61700 ABC transporter family protein ABC family transporter, Entamoeba histolytica, EMBLΕH058

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR from [Arabidopsis thaliana]

At1g65650 expressed protein similar to ubiquitin C-terminal hydrolase-like protein Gl:9759113 from [Arabidopsis thaliana]

At1g31150 expressed protein EST gb

At1g55550 kinesin-related protein Similar to Kinesin proteins; Contains kinesin motor domain protein motif and kinesin heavy chain signature motif

At2g23890 expressed protein and genefinder

At2g07030 Mutator-related transposase similar to MURA transposase of maize Mutator transposon

At2g14810 hypothetical protein

At3g46470 hypothetical protein

At3g06400 DNA-dependent ATPase, putative similar to DNA-dependent ATPase SNF2H [Mus musculus] GI:14028669; contains Pfam profiles PF00271 : Helicase conserved C-terminal domain, PF00176: SNF2 family N-terminal domain, PF00249: Myb-like DNA-binding domain

At3g43590 expressed protein hexamer-binding protein HEXBP - Leishmania major, PIR:A47156

At3g 16360 two-component phosphorelay mediator -related similar to two-component phosphorelay mediators (ATHP1-3) GB:BAA37110, GB:BAA37111 , GB:BAA37112 [Arabidopsis thaliana]

At4g32620 expressed protein predicted protein T1 OM 13.8, Arabidopsis thaliana

At5g56340 expressed protein similar to unknown protein (pir

At5g50100 expressed protein similar to unknown protein (pir

At5g55690 MADS-box protein

At5g09840 expressed protein similar to unknown protein (emb

At5g42130 mitochondrial carrier protein family contains Pfam profile: PF00153 mitochondrial carrier protein

At5g40220 MADS-box protein MADS-box protein, Arabidopsis thaliana, EMBLATY12776

At3g44010 4OS ribosomal protein S29 (RPS29B) ribosomal protein S29, rat, PIR:S30298

At3g45190 expressed protein hypothetical protein At2g28360 - Arabidopsis thaliana, EMBLAAD20690

At5g44410 FAD-linked oxidoreductase family similar to SP

At1g18120 pseudogene, putative myrosinase-associated protein

At5g39000 protein kinase family contains protein kinase domain, Pfam:PF00069

At4g03970 UIpI protease family contains Pfam profile PF02902: UIpI protease family, C- terminal catalytic domain; similar to At5g28170, At1g35110, At1g44880, At3g42530, At4g19320, At5g36020, At3g43010, At2g10350

At1g56420 hypothetical protein

At1g61680 terpene synthase/cyclase family similar to 1,8-cineole synthase [GI:3309117][Salvia officinalis]; contains Pfam profile: PF01397 terpene synthase family

At1g06520 phospholipid/glycerol acyltransferase family contains Pfam profile PF01553: Acyltransferase

At1g54550 F-box protein family contains Pfam:PF00646 F-box domain; contains TIGRFAM TIGR01640 : F-box protein interaction domain

At2g01340 expressed protein

At2g44130 Kelch repeat containing F-box protein family very low similarity to SP

At2g24670 hypothetical protein

At3g23080 expressed protein C-term similar to phosphatidylcholine transfer protein GB:AAF08345 [Homo sapiens]

At3g09310 alpha-hemolysin -related similar to alpha-hemolysin GB:AAB81225 [Aeromonas

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR hydrophila]

At3g28430 expressed protein GC donor splice site at exon 16

At3g23670 phragmoplast-associated kinesin-related protein, putative similar to kinesin like protein GB:CAB10194 from [Arabidopsis thaliana]

At4g 19350 expressed protein

At4g30300 ABC transporter family protein ribonuclease L inhibitor - Mus musculus,PIR2:JC6555

At4g00760 expressed protein

At4g28180 hypothetical protein

At4g 18320 hypothetical protein

At4g 18820 expressed protein DNA polymerase III holoenzyme tau subunit, Thermus thermophilus, gb:AF025391

At5g 12970 C2 domain-containing protein contains INTERPRO:IPR000008 C2 domain

At5g66350 zinc finger protein SHI-related

At5g 13080 WRKY family transcription factor WRKY DNA binding protein - Solanum tuberosum, EMBLAJ278507

At5g22550 expressed protein strong similarity to unknown protein (emb

At5g39630 SNARE protein AtMEMB11 v-SNARE AtVTHa, Arabidopsis thaliana, EMBLAF114750

At3g51090 expressed protein hypothetical protein F16F14.4 - Arabidopsis thaliana: EMBLAC007047

At5g43270 squamosa promoter binding protein-related 2 (emb

At1g54760 MADS-box protein similar to MADS-box transcription factor Gl:4837612 from [Antirrhinum majus]

At5g 15650 reversibly glycosylated polypeptide-3

At3g 19800 expressed protein

At2g 18860 expressed protein

At2g03260 expressed protein

At3g05240 pentatricopeptide (PPR) repeat-containing protein contains Pfam profile PF01535: PPR repeat

At1g05660 polygalacturonase, putative similar to GB:AAC23398

At1g48670 Nt-gh3 deduced protein -related similar to Nt-gh3 deduced protein GI:4887010 from [Nicotiana tabacum]

At1g31850 dehydration-induced protein, putative strong similarity to early-responsive to dehydration stress ERD3 protein [Arabidopsis thaliana] Gl: 15320410; contains Pfam profile PF03141 : Putative methyltransferase

At1g08500 plastocyanin-like domain containing protein

At1g59640 bHLH protein

At1g68500 expressed protein

At2g27240 expressed protein contains Pfam profile PF01027: Uncharacterized protein family UPF0005

At2g07240 UIpI protease family contains Pfam profile PF02902: UIpI protease family, C- terminal catalytic domain

At3g22790 expressed protein similar to centromere protein homolog GB:CAB10255 from [Arabidopsis thaliana]

At3g16010 pentatricopeptide (PPR) repeat-containing protein contains Pfam profile PF01535: PPR repeat

At3g57540 expressed protein putative DNA binding protein - Arabidopsis thaliana, TREMBLATAC2339 3

At4g 12270 copper aminé oxidase like protein (fragmenti) copper aminé oxidase - Cicer arietinum,PID:e1335964

N c d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At3g01710 hypothetical protein

At3g01930 expressed protein similar to nodule-specific protein NIJ70 GB:AAC39500 [Lotus japonicus]

At3g29635 transferase family similar to anthocyanin 5-aromatic acyltransferase from Gentiana triflora Gl:4185599, malonyl CoA:anthocyanin 5-O-glucoside-6'"-O- malonyltransferase from Perilla frutescens Gl: 17980232, Salvia splendens Gl: 17980234; contains Pfam pr?

At4g31980 expressed protein EREBP-4 homolog, Arabidopsis thaliana

At4g32910 expressed protein

At4g37170 pentatricopeptide (PPR) repeat-containing protein contains Pfam profile PF01535: PPR repeat

At4g33030 UDP-sulfoquinovose synthase (sulfite:UDP-glucose sulfotransferase) (sulfolipid biosynthesis protein) (SQD1) identical to gi:2736155

At4g04330 expressed protein

At5g24500 expressed protein

At5g48020 expressed protein

At5g54660 expressed protein

At5g46160 ribosomal protein L14p family

At5g06540 pentatricopeptide (PPR) repeat-containing protein contains Pfam profile PF01535: PPR repeat

At5g37200 C3HC4-type zinc finger protein family low similarity to ring-H2 finger protein RHYIa from Arabidopsis thaliana [gi:3790593], ring finger-H2 protein from Xenopus laevis [gi:13752371]; contains Pfam domain zinc finger, C3HC4 type (RING finger) PF00097

At3g 10740 glycosyl hydrolase family 51 similar to arabinoxylan arabinofuranohydrolase isoenzyme AXAH-II from Gl:13398414 [Hordeum vulgare]

At4g13170 6OS ribosomal protein L13A (RPL13aC) ribosomal protein L13a -Lupinus luteus,PID:e1237871

At3g27050 expressed protein

At1g60095 jacalin lectin family contains smnilarity to myrosinase-binding protein homolog [Arabidopsis thaliana] Gl:2997767;

At3g09410 pectinacetylesterase family similar to pectinacetylesterase precursor GB:CAA67728 [Vigna radiata]; contains Pfam profile: PF03283 pectinacetylesterase

AtI g11655 expressed protein

At1g49800 hypothetical protein

At1g77610 glucose-6-phosphate/phosphate translocator-related similar to glucose-6- phosphate/phosphate-translocators from [Mesembryanthemum crystallinum] Gl:9295277, [Solanum tuberosum] Gl:2997593, [Pisum sativum] Gl:2997591 ; contains Pfam profile PF00892: Integ?

At1g10380 expressed protein

At1g28410 expressed protein

At1g77350 expressed protein

At1g01880 hypothetical protein contains similarity to DNA repair endonuclease GB:AAD47568 Gl:5712619 from [Drosophila melanogasteri

At1g28100 expressed protein

At1g35650 UIpI protease family PF02902: UIpI protease family, C-terminal catalytic domain; similar to At1g21020, At3g26530, At1g08760, At1g08740, At2g29240

At1g28560 expressed protein

At2g 13230 retroelement pol polyprotein -related

At2g40580 protein kinase family contains protein kinase domain, Pfam:PF00069

N 0 d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At3g62320 hypothetical protein hypothetical protein At2g36110 - Arabidopsis thaliana EMBL:AC007135

At3g05340 pentatricopeptide (PPR) repeat-containing protein contains I NTE RPRQ: I PR002885 PPR repeats

At3g02630 acyl-[acyl-carrier-protein] desaturase (stearoyl-ACP desaturase), putative similar to Acyl-[acyl-carrier protein] desaturase from Sesamum indicum Gl:575942, Cucumis sativus SP

At3g08600 expressed protein

At4g03560 two-pore calcium channel (TPC1) identical to two-pore calcium channel (TPC1) [Arabidopsis thaliana] gi

At5g 13680 expressed protein similar to unknown protein (ref

Atδg 17420 cellulose synthase, catalytic subunit (IRX3) identical to gi:5230423

At5g56850 expressed protein similar to unknown protein (pir

At5g67460 glycosyl hydrolase family 17 similar to beta-1 ,3-glucanase Gl:6714534 from [Salix gilgiana]

At5g36200 hypothetical protein similar to unknown protein (pir

At5g54150 hypothetical protein similar to unknown protein (pir

At5g48700 ubiquitin family contains INTERPRO:IP R000626 ubiquitin domain

At5g23230 isochoπ ' smatase hydrolase family low similarity to SP

At5g56040 leucine rich repeat protein kinase, putative contains leucine rich repeat (LRR) domains, Pfam:PF00560; contains protein kinase domain, Pfam:PF00069

At5g22870 hypothetical protein similar to unknown protein (gb

At3g23955 pseudogene, similar to hypothetical protein GB:AAD29066

At1g31090 hypothetical protein contains similarity to gi

At1g14250 hypothetical protein

At1g74190 leucine rich repeat protein family contains leucine rich-repeat (LRR) domains Pfam:PF00560, INTERPRO:IPR00161 1 ; contains similarity to Cf-2.1 [Lycopersicon pimpinellifolium] gi

At1g51160 expressed protein

At3g26310 cytochrome P450 family contains Pfam profile: PF00067 cytochrome P450

At1g18750 MADS-box protein similar to homeodomain transcription factor (AGL30) GI:3461830 from [Arabidopsis thaliana]

Atδg 17820 peroxidase, putative identical to peroxidase ATP13a [Arabidopsis thaliana] gi

At2g39880 myb family transcription factor (MYB25) contains Pfam profile: PF00249 myb-like DNA-binding domain

At2g20240 expressed protein

At2g44210 expressed protein Pfam profile PF03080: Arabidopsis proteins of unknown function

At3g 12970 expressed protein

At3g09030 expressed protein identical to GB:AAD56319 [Arabidopsis thaliana]

At3g02250 auxin-independent growth promoter -related similar to auxin-independent growth promoter GB:A44226 [Nicotiana tabacum]

At4g23380 hypothetical protein predicted proteins, Arabidopsis thaliana

At4g23110 hypothetical protein

At4g 13990 hypothetical protein

At5g43670 protein transport protein SEC23

At5g59800 hypothetical protein

At5g 16530 auxin efflux carrier protein family contains auxin efflux carrier domain Pfam:PF03547

At4g35410 clathrin assembly protein AP19 homolog

At2g 15000 expressed protein

N c d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At3g60830 actin - like protein actin 3, Drosophila melanogaster, PlR:A03000

At2g21770 cellulose synthase, catalytic subunit, putative similar to gi:2827141 cellulose synthase catalytic subunit, Arabidopsis thaliana (Ath-A)

At1g09240 nicotianamine synthase, putative similar to nicotianamine synthase [Lycopersicon esculentum][GI:4753801], nicotianamine synthase 2 [Hordeum vulgare][Gl:4894912]

At5g26780 glycine hydroxymethyltransferase - like protein glycine hydroxymethyltransferase, Solanum tuberosum, EMBLZ25863

At1g22910 RNA récognition motif (RRM) - containing protein contains InterPro entry IPR000504: RNA-binding région RNP-1 (RNA récognition motif) (RRM); similar to GB:AAC33496

At1g42460 UIpI protease family contains Pfam profile PF02902: UIpI protease family, C- terminal catalytic domain

At3g09670 PWWP domain protein

At3g44200 protein kinase family contains protein kinase domain, Pfam:PF00069; contains serine/threonine protein kinase domain, 1NTERPRO:1PR002290

At4g09350 DnaJ protein family similar to SP

At5g39880 expressed protein

At5g67490 expressed protein

At5g58860 cytochrome P450 86A1 identical to Cytochrome P450 86A1 (CYPLXXXVI) (P450-dependent fatty acid omega-hydroxylase) (SP:P48422) [Arabidopsis thaliana]

At5g 16070 chaperonin, putative similar to SWISS-PROT:P80317 T-complex protein 1 , zêta subunit (TCP-1-zeta) [Mus musculus]; contains Pfam:PF00118 domain, TCP- 1/cpn60 chaperonin family

At3g52680 F-box protein family contains F-box domain Pfam:PF00646

At2g35170 expressed protein

At2g23300 leucine-rich repeat transmembrane protein kinase, putative

At5g36070 hypothetical protein strong similarity to unknown protein (emb

At5g49780 leucine-rich repeat transmembrane protein kinase, putative

At1g37150 biotin holocarboxylase synthetase -related similar to biotin holocarboxylase synthetase GI:4874309 from [Arabidopsis thaliana] contains non-consensus GG acceptor splice sites.

At1g79710 hypothetical protein similar to hypothetical protein GB:AAC12874 [Synechococcus PCC7942]

At1g16420 hypothetical protein common family similar to At5g04200, At1g79340, At1g79320, At1g79310, At1g79330; similar to latex-abundant protein [GI:4235430][Hevea brasiliensis]

At2g33310 auxin-responsive protein IAA13 (Indoleacetic acid-induced protein 13) identical to SP

At2g22100 RRM-containing RNA-binding protein

At3g62680 proline-rich protein family contains proline-rich région, INTERPRO:IPR000694

At3g22180 DHHC-type zinc finger domain-containing protein contains Pfam profile PF01529: DHHC zinc finger domain

At3g21465 adenyl cyclase -related similar to adenyl cyclase GB:AAB87670 from [Nicotiana tabacum]

At4g 16420 transcriptional adaptor like protein

At1g47705 pseudogene, putative peroxidase similar to peroxidase GB:P00434 Gl:464365 from [Brassica râpa]

At1g10870 ARF GTPase-activating domain-containing protein

At1g07250 glycosyltransferase family similar to UDP-glucose glucosyltransferase Gl;453245

N 0 d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR from [Manihot esculenta]

At1g64105 No apical meristem (NAM) protein family contains Pfam PF02365: No apical meristem (NAM) domain

At1g10660 expressed protein

At1g60800 receptor-related kinase similar to somatic embryogenesis receptor-like kinase Gl:2224910 from [Daucus carota]

At2g32140 disease résistance protein (TIR class), putative domain signature TIR exists, suggestive of a disease résistance protein.

At2g33090 hypothetical protein

At2g47280 pectinesterase family contains Pfam profile: PF01095 pectinesterase

At2g41020 expressed protein

At2g44310 calcium-binding EF-hand family protein contains INTERPRO:IPR002048 calcium-binding EF-hand domain

At2g41450 GCN5-related N-acetyltransferase (GNAT) family low similarity to Swift [Xenopus laevis] Gl:14164561 ; contains Pfam profiles PF00583: acetyltransferase, GNAT family, PF00533: BRCA1 C Terminus (BRCT) domain

At3g23175 expressed protein supported by RACE -based full-length cDNA validâtes this gène structure. (Brassica génome séquence alignment supported. Work by cdtown, et al.)

At3g20840 ovule development protein, putative similar to ovule development protein AINTEGUMENTA (GI:1209099)[Arabidopsis thaliana]

At4g36750 quinone reductase family similar to 1 ,4-benzoquinone reductase [Phanerochaete chrysosporium][GI:4454993]; similar to Trp repressor binding protein [Escherichia CoIi][SP

At4g29000 transcription factor -related leghemoglobin activating factor - Glycine max, PID:e1374538

At5g22420 acyl CoA reductase-related protein

At5g01370 hypothetical protein

At5g03960 calmodulin-binding protein - related

At5g52050 MATE efflux protein - related contains Pfam profile PF01554: Uncharacterized membrane protein family

At4g29430 4OS ribosomal protein S15A (RPS15aE) ribosomal protein S15a - Brassica napus,P!R2:S20945

At2g 12700 hypothetical protein similar to GB:AAD23022

At4g05520 calcium-binding EF-hand family protein similar to EH-domain containing protein 1 from {Mus musculus} SP

At3g24020 disease résistance response protein-related contains similarity to disease résistance response protein 2Q6-d [Pisum sativum] gi

At5g63690 hypothetical protein

At3g46670 glucosyltransferase-related protein UDP-glucose glucosyltransferase - Arabidopsis thaliana, EMBL.-AB016819

At4g18010 inositol polyphosphate 5-phosphatase II (IP5PH) nearly identical to inositol polyphosphate 5-phosphatase II [Arabidopsis thaliana] GI:10444263 isoform contains an AT-acceptor splice site at intron 6

At1g80480 expressed protein contains Viral RNA helicase domain

Tableau III :

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At2g40100 light-harvesting chlorophyll a/b binding protein

At5g03880 auxin-regulated protein predicted protein, Arabidopsis thaliana

At4g10510 subtilisin-like serine protease contains similarity to subtilase; SP1 Gl:9957714 from [Oryza sativa]

At2g33840 tyrosyJ-tRNA synthetase -related

At5g05670 signal récognition particle receptor beta subunit-related protein

At1g53290 galactosyltransferase family contains Pfam profile: PF01762 galactosyltransferase ;contains similarity to Avr9 elicitor response protein Gl:4138265 from [Nicotiana tabacum]

At1g32700 expressed protein similar to hypothetical protein GB:AAF25968 Gl:6714272 from [Arabidopsis thaliana]

Atδg 16770 myb DNA-binding protein(AtMYB9)

At3g59200 F-box protein family contains F-box domain Pfam:PF00646

At3g43380 hypothetical protein hypothetical proteins - Arabidopsis thaliana

At5g38120 4-coumarate:CoA ligase (4-coumaroyl-CoA synthase) family similar to 4CL2, Arabidopsis thaliana [gi: 12229665], 4CL1 , Nicotiana tabacum [gi: 12229631]; contains Pfam AMP-binding enzyme domain PF00501

At4g07750 transposon protein -related similar to Arabidopsis thaliana putative En/Spm transposon protein (GB:AC005396)

At4g04710 calcium-dependent protein kinase, putative (CDPK) similar to calcium-dependent protein kinase [Nicotiana tabacum] gi

At5g 13350 auxin-responsive - like protein Nt-gh3 deduced protein, Nicotiana tabacum, EMBLAF123503

At2g20410 expressed protein

At5g39730 avirulence induced gène (AIG) - like protein AIG2 PROTEIN, Arabidopsis thaliana, SWISSPROT:AIG2_ARATH

At4g29905 expressed protein

At3g07300 expressed protein similar to translation initiation factor EIF-2B beta subunit GB:Q90511 [Fugu rubripes]

At4g30230 hypothetical protein

At2g01710 DnaJ protein family simlar to AHM1 [Triticum aestivum] Gl:6691467; contains Pfam profile PF00226: DnaJ domain

At2g34780 hypothetical protein

At4g20960 expressed protein riboflavin biosynthesis protein ribG, Synechocystissp., PIR2:S74377

At2g 19750 40S ribosomal protein S30 (RPS30A)

At5g65850 F-box protein family

At5g45830 tumor-related protein-like

At2g23070 casein kinase II alpha chain, putative similar to casein kinase II, alpha chain (CK II) [Zea mays] SWISS-PROT:P28523; contains protein kinase domain, Pfam:PF00069

At1g05300 métal transporter, putative (Zl P5) identical to putative métal transporter Zl P5 [Arabidopsis thaliana] gi

At1g36180 acetyl-CoA carboxylase -related similar to Gl: 1100253 from [Arabidopsis thaliana]

At4g 12390 pectinesterase - related low similarity to pectinesterase from Arabidopsis thaliana SP

At3g52520 hypothetical protein

At5g24600 expressed protein similar to unknown protein (pir

At1g78890 expressed protein

At5g56670 4OS ribosomal protein S30 (RPS30C)

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR cox11 Gl:1244782 from [Saccharomyces cerevisiae]

At5g6455Q expressed protein strong similarity to unknown protein (emb

At4g30370 C3HC4-type zinc finger protein family contains Pfam profile: PF00097 zinc finger, C3HC4 type (RING finger)

At1g12100 protease inhibitor/seed storage/lipid transfer protein (LTP) family contains Pfam protease inhibitor/seed storage/LTP family domain PF00234

At4g36210 expressed protein F35D11.3, Caenorhabditis elegans, PATX:G868225

At2g24180 cytochrome P450 family

At5g56410 F-box protein family contains F-box domain Pfam:PF00646

At4g 15830 expressed protein

At1g62170 serpin family similar to phloem serpin-1 Gl:9937311 from [Cucurbita maxima]; contains Pfam profile PF00079: Serpin (serine protease inhibitor)

At4g20000 expressed protein

At3g 13290 transducin / WD-40 repeat protein family contains 2 WD-40 repeats (PF00400); autoantigen locus HUMAUTANT (GI:533202) [Homo sapiens] and autoantigen locus HSU17474 (Gl:596134) [Homo sapiens]

At1g07620 GTP-binding protein -related similar to GB:M24537 from [Bacillus subtilis]

At4g24690 ubiquitin-associated (UBA)/PB1 domain-containing protein contains Pfam profiles PF00627: Ubiquitin-associated (UBA)ITS-N domain, PF00569: Zinc finger ZZ type domain, PF00564: PB1 domain

At5g04750 F1F0-ATPase inhibitor - like protein F1F0-ATPase inhibitor protein, OslF1-1, Oryza sativa, EMBL:AB029059

At3g26750 hypothetical protein

At5g52610 F-box protein family contains F-box domain Pfam:PF00646

At1g20190 expansin, putative (EXP11) similar to GB:U30460 from [Cucumis sativus]; alpha- expansin gene family, PMID: 11641069

At3g01310 expressed protein similar to unknown protein GB:BAA24863 [Homo sapiens], unknown protein GB:BAA20831 [Homo sapiens], unknown protein GB:AAB42264 [Caenorhabditis elegans]

At5g46180 ornithine-oxo-acid aminotransferase (omithine aminotransferase/omithine ketoacid aminotransferase), putative similar to SP

At5g47250 disease résistance protein (CC-NBS-LRR class), putative domain signature CC- NBS-LRR exists, suggestive of a disease résistance protein.

At3g46480 oxidoreductase, 2OG-Fe(II) oxygenase family low similarity to gibberellin 20- oxidase [gi:4678370]; contains Pfam domain PF03171 , 2OG-Fe(II) oxygenase superfamily

At2g28290 SNF2 domain/helicase domain-containing protein similar to transcriptional activator HBRM [Homo sapiens] Gl:414117; contains Pfam profiles PF00271: Helicase conserved C-terminal domain, PF00176: SNF2 family N-terminal domain

At3g55660 hypothetical protein various predicted proteins, Arabidopsis thaliana

At1g71740 hypothetical protein

At1g17940 hypothetical protein

At5g51440 heat shock protein, putative similar to heat shock 22 kDa protein, mitochondrial precursor SP:Q96331 from [Arabidopsis thaliana]

At1g10660 expressed protein

At1g23720 proline-rich protein family contains proline-rich extensin domains, INTERPRO:IPR002965

At3g 12700 gxpressed protein

At2g31380 sait tolerance-like protein

At5g49160 DNA (cytosine-5)-methyltransferase (DNA methyltransferase) (DNA metase) (sp

N 0 d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At4g 13900 disease résistance protein family contains leucine rich-repeat domains Pfam:PF00560, INTERPRO:IPR001611 ; similar to Cf-4A protein [Lycopersicon esculentum] gi

At5g56160 sec14 cytosolic factor family (phosphoglyceride transfer protein family) similar to SEC14 cytosolic factor (SP:P45816) [Candida lipolytica]

At5g05780 26S proteasome regulatory subunit S12 (RPN8), putative contains similarity to 26s proteasome regulatory subunit s12 (proteasome subunit p40) (mov34 protein) SP:P26516 from [Mus musculus]

At4g29410 6OS ribosomal protein L28 (RPL28C) unknown protein chromosome II BAC F6F22 - Arabidopsis thaliana,PID:g3687251

At3g07440 expressed protein est hits to genscan model

At1g79350 expressed protein

At5g3518Q expressed protein

At5g08520 expressed protein contains similarity to l-box binding factor

At1g03680 thioredoxin M-type 1 , chloroplast precursor (TRX-M1) nearly identical to SP

At4g07340 contains similarity to Xenopus laevis replication protein A1 (SW:RFA1_XENLA)

At3g50440 hydrolase, alpha/beta fold family similar to ethylene-induced esterase [Citrus sinensis] Gl: 14279437, polyneuridine aldéhyde esterase [Rauvolfia serpentina] Gl:6651393; contains Pfam profile PF0Q561 : hydrolase, alpha/beta fold family

At1g54480 leucine rich repeat protein family contains leucine rich-repeat (LRR) domains Pfam:PF00560, INTERPRO:IPR001611; contains similarity to disease résistance protein Gl:3894383 from [Lycopersicon esculentum]

At3g 13222 expressed protein

At4g34570 bifunctional dihydrofolate reductase-thymidylate synthase 2 (DHFR-TS) (THY-2) identical to SP

Tableau IV:

N° d'accès Description (gènes homologues identifiés dans d'autres organismes) TAIR

At2g 14630 hypothetical protein contains Pfam profile PF03004: Plant transposase (Ptta/En/Spm family)

At3gO8943 pseudogene, importin beta subunit similar to importin-betai GB:BAA34861 , importin-beta2 GB:BAA34862 [Oryza sativa]; frameshift

At2g41970 protein kinase, putative similar to Pto kinase interactor 1 (serine/threonine protein kinase) [Lycopersicon esculentum] gi

At2g04750 fimbrin -related

AtCg00040 matK : maturase

At5g06340 diadenosine 5',5'"-P1,P4-tetraphosphate hydrolase, putative similar to diadenosine 5 l ,5"'-P1 ,P4-tetraphosphate hydrolase from [Lupinus angustifolius] Gl: 1888557, [Hordeum vulgare subsp. vulgare] GI.-2564253; contains Pfam profile PF00293: NUDIX domai?

At1g17170 glutathione transferase, putative One of three repeated putative glutathione transferases. 72% identical to glutathione transferase [Arabidopsis thaliana] (gi

AtCg00960 rrn4.5S : 23S ribosomal RNA

At1g67150 hypothetical protein

At2g24400 auxin-induced (indole-3-acetic acid induced) protein, putative (SAUR_d) similar to SAUR-AC-like protein (small auxin up RNA) (GI:4455308) from [Arabidopsis thaliana]; auxin-induced protein TGSAUR22 (Gl: 10185820) [Tulipa gesnerian]

At1g06560 expressed protein

At2g43640 signal récognition particle protein 14kD, ATSRP14 -related

At5g61700 ABC transporter family protein ABC family transporter, Entamoeba histolytica, EMBLEH058

AtCgOI 050 ndhD : NADH dehydrogenase subunit 4

At1g78980 leucine-rich repeat transmembrane protein kinase, putative similar to leucine- rich repeat transmembrane protein kinase 2 GI:3360291 from [Zea maysj '

At2g24640 ubiquitin carboxyl terminal hydrolase -related

At3g50170 hypothetical protein various predicted gènes, Arabidopsis thaliana and Oryza sativa

At3g2519O intégral membrane protein -related contains Pfam profile: PF01988 intégral membrane protein; similar to nodulin-21 GB:CAA34506 [Glycine max]

At5g41970 GAMM 1 protein-related

At5g58020 expressed protein protein x 0001 , Homo sapiens, EMBLAF 117231

At1g52080 expressed protein

At5g55050 GDSL-motif lipase/hydrolase protein similar to family II lipases EXL3 Gl: 15054386, EXL1 Gl: 15054382, EXL2 Gl: 15054384 from [Arabidopsis thaliana]; contains Pfam profile PF00657: GDSL-like Lipase/Acylhydrolase

At4g30610 serine carboxypeptidase -related probable SERINE CARBOXYPEPTIDASE II-2 PRECURSOR - HORDEUM VULGARE,PIR2:T05701

AtI g 19210 AP2 domain transcription factor, putative similar to AP2 domain transcription factor GI:4567204 from [Arabidopsis thaliana]

At2g33330 expressed protein contains Pfam PF01657: Domain of unknown function

At1g13940 expressed protein identical to hypothetical protein GB:AAD39280 GI:5080770 from [Arabidopsis thaliana]

At5g09840 expressed protein similar to unknown protein (emb

At1g11915 expressed protein

At2g41620 expressed protein

At5g56910 expressed protein similar to unknown protein (pir

At1g62200 oligopeptide transporter -related similar to oligopeptide transporter 1-1 Gl:510238 from [Arabidopsis thaliana]; contains non-consensus GA donor site at intron 4

De préférence ledit acide nucléique d'adressage a une séquence transcrite qui est celle d'un ARNm d'un gène sélectionné dans le groupe constitué des gènes montrés dans le Tableau V. Les gènes montrés dans le Tableau V correspondent au gène codant le facteur eucaryote d'initiation de la traduction elF4E et à une sélection de gènes figurant dans le Tableau III ayant un différentiel d'expression en faveur du stroma versus le chloroplaste, en faveur du stroma versus les ARN totaux, et en faveur du chloroplaste versus les ARN totaux.

Tableau V

Selon un mode de réalisation préféré, ledit acide nucléique d'adressage a une séquence transcrite qui est celle d'un ARNm du gène codant le facteur eucaryote d'initiation de la traduction elF4E (SEQ ID No.41) et/ou ses homologues dans les autres espèces et plus particulièrement dans la tomate et le piment (brevet WO03/066900).

La séquence transcrite de l'acide nucléique d'adressage utilisé pour mettre en œuvre la méthode selon l'invention est préférentiellement celle d'un ARNm d'un gène nucléaire qui est endogène (c'est-à-dire présent naturellement dans le génome nucléaire de la cellule qui est transformée) ou qui est exogène à la cellule végétale (par exemple un gène nucléaire dont un ARNm a été détecté dans un plaste dans une cellule appartenant à une autre espèce végétale que celle de la cellule transformée). De préférence, le gène nucléaire est endogène à la cellule végétale transformée.

Par "acide nucléique d'intérêt lié à un acide nucléique d'adressage" on entend que l'acide nucléique d'intérêt et l'acide nucléique d'adressage sont génétiquement liés, c'est-à-dire qu'ils font partie d'une même construction nucléotidique (ADN, ARN ou mixte ADN/ARN). De préférence ledit acide nucléique d'intérêt est fusionné audit acide nucléique d'adressage.

L'acide nucléique d'intérêt peut être une séquence d'ADN ou d'ARN. De la même manière l'acide nucléique d'adressage peut être une séquence d'ADN ou d'ARN. L'acide nucléique d'intérêt lié à l'acide nucléique d'adressage peut être un acide nucléique mixte ADN/ARN. De préférence l'acide nucléique d'intérêt et l'acide nucléique d'adressage sont tous deux une séquence d'ADN. De préférence

également, l'acide nucléique d'intérêt et l'acide nucléique d'adressage sont tous deux une séquence d'ARN.

La cellule végétale peut être transformée avec un acide nucléique d'intérêt lié à un acide nucléique d'adressage de manière à obtenir une expression stable d'au moins ledit acide nucléique d'intérêt. Selon ce mode de réalisation, l'acide nucléique d'intérêt lié à un acide nucléique d'adressage peut se présenter sous la forme d'une construction comprenant une séquence d'ADN d'intérêt liée à une séquence d'ADN d'adressage, ladite construction étant intégrée dans le génome nucléaire de la cellule végétale. La transcription de cette construction dans le noyau produit un transcrit comprenant une séquence d'ARN d'intérêt liée à une séquence d'ARN d'adressage, le transcrit étant alors adressé vers un plaste de la cellule transformée.

La cellule végétale peut aussi être transformée avec un acide nucléique d'intérêt lié à un acide nucléique d'adressage de manière à obtenir une expression transitoire d'au moins ledit acide nucléique d'intérêt et ceci par des méthodes connues de l'homme de l'art comme par exemple l'utilisation de polyéthylène glycol (PEG), une molécule non toxique capable d'induire la déstabilisation de la membrane plasmique et qui permet le transfert de l'ADN à travers celle-ci. Les molécules d'ADN peuvent alors migrer jusqu'au noyau, où certaines d'entre elles, avec une efficacité plus ou moins grande, sont susceptibles de s'intégrer dans les chromosomes. L'ADN peut aussi être encapsulé dans des liposomes, petites vésicules artificielles de phospholipides, capables de fusionner avec des protoplastes. Enfin, il est possible de faire de l'électroporation de protoplastes ce qui consiste à soumettre un mélange de protoplastes et d'ADN à une série de chocs électriques de courte durée et de tension élevée. Ces méthodes permettent d'étudier l'expression transitoire dans des protoplastes, et d'obtenir des plantes transgéniques pour les espèces chez lesquelles on maîtrise la régénération à partir de protoplastes. L'acide nucléique d'intérêt lié à un acide nucléique d'adressage peut donc se présenter sous la forme d'une construction comprenant une séquence d'ARN d'intérêt liée à une séquence d'ARN d'adressage, ladite construction étant intégrée dans le cytosol de la cellule végétale. Cette construction d'ARN est alors adressée vers un plaste de la cellule transformée.

Ledit acide nucléique d'intérêt peut être une séquence codant une protéine, en particulier une protéine hétérologue. Par "protéine hétérologue" on entend une protéine qui n'est pas exprimée par la cellule végétale non transformée. Il peut s'agir

d'une protéine recombinante normalement exprimée chez un organisme eucaryote, par exemple une protéine d'origine humaine, animale, ou végétale. Il peut s'agir en particulier :

- d'une protéine d'intérêt thérapeutique et/ou prophylactique telle que l'insuline, la lipase gastrique, le collagène, ou un allergène ;

- de la protéine HppD ou 4-hydroxyphenylpyruvate dioxygenase de Pseudomonas fluorescens qui permet de moduler la biosynthèse de tocophérol dans les plantes (HPPD; Garcia et al. 1997, 1999; Norris et al., 1998),

- d'une protéine conférant une résistance à un herbicide tel que le précurseur de l'acétolactate synthétase (ALS) (Lee et al., 1988), l'acétolactate synthétase mutée (Preston et Powles, 2002), ou de la 3-énolpyruvylshikimate-5-phosphate synthétase (EPSP synthétase) (Klee et al., 1987) ;

- d'une protéine conférant une capacité à fixer l'azote ou à la photosynthèse accrue, une protéine conférant une résistance accrue à la sécheresse, au sel, ou aux températures extrêmes, par exemple ;

- d'une protéine conférant une résistance à des pathogènes tels que des insectes, champignons, bactéries, virus etc, telle qu'un inhibiteur de protéase, par exemple un inhibiteur de trypsine (Hilder et al., 1987), une toxine, par exemple les toxines de Bacillus thuringiensis (Vaeck et al., 1987 ; Fischhoff et al., 1987), etc.

Ledit acide nucléique d'intérêt peut aussi être une séquence non codante, telle qu'une séquence d'ARN antisens ou une séquence d'ADN dont le transcrit est un ARN antisens, ou encore un ARN interférant (ARNi, Sharp, 2001). Pour une description générale de la technologie antisens, l'homme du métier peut se référer par exemple à l'ouvrage « Antisense DNA and RNA » (CoId Spring Harbor Laboratory, D. Melton, éd. 1988).

La construction nucléotidique comprenant les acides nucléiques d'intérêt et d'adressage peut être préparée par toute méthode connue de l'homme du métier, par exemple par synthèse in vitro.

La construction nucléotidique utilisée pour transformer la cellule végétale dans la méthode d'adressage selon l'invention fait également l'objet de la présente demande. L'invention concerne plus particulièrement une construction d'acide nucléique comprenant un acide nucléique d'intérêt lié à un acide nucléique d'adressage dont la séquence transcrite est celle d'un ARNm d'un gène nucléaire sélectionné dans le groupe constitué par les gènes figurant dans le tableau V. Ledit

gène nucléaire est donc sélectionné dans le groupe des gènes ayant pour séquence codante SEQ ID No.1 , SEQ ID No.3, SEQ ID No.5, SEQ ID NoJ, SEQ ID No.9, SEQ ID No.11 , SEQ ID No.13, SEQ ID No.15, SEQ ID No.17, SEQ ID No.19, SEQ ID No.21 , SEQ ID No.23, SEQ ID No.25, SEQ ID No.27, SEQ ID No.29, SEQ ID No.31, SEQ ID No.33, SEQ ID No.35, SEQ ID No.37, SEQ ID No.39 et SEQ ID No.41 identifiées chez Arabidopsis thaliana et/ou leurs séquences homologues chez d'autres espèces.

Les constructions nucléotidiques mises en œuvre dans l'invention peuvent être des cassettes d'expression comprenant une séquence d'acide nucléique d'intérêt lié à une séquence d'acide nucléique d'adressage, associées à des éléments permettant l'expression de la séquence d'acide nucléique d'intérêt dans les cellules végétales, notamment un promoteur et un terminateur de transcription, ou encore un activateur. D'autres éléments tels que les introns, enhancers, séquences de polyadénylation et dérivées peuvent également être présents. La cassette d'expression peut aussi contenir des séquences 5' non traduites dites "leader". De telles séquences peuvent améliorer la traduction

De très nombreux promoteurs de transcription peuvent être utilisés pour l'expression dans des cellules végétales. Il peut s'agir d'un promoteur constitutif, tel que le promoteur Actine-lntron-actine, correspondant à la région en 5' non codante du gène de l'actine 1 du riz et son premier intron (Mc Elroy et al., 1991 ; GenBank n° S44221). La présence du premier intron actine permet d'augmenter le niveau d'expression d'un gène lorsqu'il est fusionné en 3' d'un promoteur. Il peut également s'agir d'un promoteur inductible ou tissu-spécifique, par exemple afin que l'acide nucléique d'intérêt ne soit adressé vers un plastide qu'à certains stades de développement de la plante, que dans certaines conditions environnementales, ou que dans certains tissus-cibles. Des exemples de promoteurs tissu-spécifiques incluent le promoteur du virus de la Chlorelle régulant l'expression du gène de l'adénine méthyltransférase (Mitra et Higgins, 1994) ou le promoteur du virus de la mosaïque du manioc (Verdaguer et al., 1998) qui s'expriment principalement dans les tissus verts, ou les éléments régulateurs du promoteur du gène2A11 de la tomate qui permettent une expression spécifique dans les fruits (Van Haaren et Houck, 1991).

Parmi les terminateurs, on peut notamment citer :

- le terminateur 3' Nos, terminateur de la nopaline synthase qui correspond à la région en 3' non codante du gène de la nopaline synthase provenant du plasmide Ti ό'Agrobacteirum tumefaciens souche à nopaline (Depicker et al., 1982), et

- le terminateur 3' CaMV 1 correspondant à la région 3' non codante de la séquence du virus à ADN bicaténaire circulaire de la mosaïque du chou-fleur produisant le transcrit 35S (Franck et al. 1980 ; GenBank n° V00141).

L'acide nucléique d'intérêt peut être associé ou, le cas échéant, constitué d'une séquence codant pour un agent de sélection. Peuvent être notamment utilisés des gènes qui confèrent une résistance à un antibiotique tel que l'hygromycine, la kanamycine, la bléomycine ou la streptomycine, ou à des herbicides tels que le glufosinate, le glyphosate ou le bromoxynil. Préférentiellement, ledit gène codant un agent de sélection est choisi parmi le gène bar (White et al. 1990 ; GenBank n° X17220) qui confère la résistance à l'herbicide Basta ® (glufosinate) et le gène NPTII qui confère la résistance à la kanamycine (Bevan et al., 1983).

Pour la mise en œuvre de l'invention il est ainsi fourni un vecteur, notamment un plasmide, contenant au moins une construction d'acide nucléique telle que décrite précédemment.

L'invention porte en outre sur un hôte cellulaire, notamment une bactérie telle que Agrobacterium tumefaciens, transformé par ledit vecteur. Un tel hôte cellulaire e . st utile pour transfecter des cellules de plante avec un vecteur selon l'invention.

L'invention concerne également une cellule végétale transformée avec un acide nucléique d'intérêt lié à un acide nucléique d'adressage dont la séquence transcrite est celle d'un ARNm d'un gène nucléaire, ledit ARNm étant détectable dans un plaste. De préférence ledit ARNm est un ARNm d'un gène nucléaire sélectionné dans le groupe constitué par les gènes figurant dans le tableau V et le gène elF4E.

La transformation de cellules végétales peut être réalisée par transfert d'un vecteur dans les protoplastes, notamment après incubation de ces derniers dans une solution de polyéthylèneglycol (PG) en présence de cations divalents (Ca 2+ ) selon la méthode décrite dans l'article de Krens et al. (1982).

La transformation des cellules végétales peut également être réalisée par électroporation notamment selon la méthode décrite dans l'article de Fromm et al. (1986).

La transformation des cellules végétales peut encore être réalisée par utilisation d'un canon à gène permettant la projection, à très grande vitesse, de particules métalliques recouvertes des séquences d'ADN d'intérêt, délivrant ainsi des gènes à l'intérieur du noyau cellulaire, notamment selon la technique décrite dans l'article de Finer et al. (1992).

Une autre méthode de transformation des cellules végétales, est celle de la micro-injection cytoplasmique ou nucléaire.

De préférence les cellules végétales sont transformées par un vecteur par le biais d'un hôte cellulaire lui-même transformé par ledit vecteur, l'hôte cellulaire étant susceptible d'infecter lesdites cellules végétales en permettant l'intégration dans le génome de ces dernières, des séquences d'acide nucléique d'intérêt initialement contenues dans le génome du vecteur susmentionné.

Avantageusement, l'hôte cellulaire utilisé est Agrobacterium tumefaciens, notamment selon les méthodes décrites dans les articles de Bevan (1984) et d'An et al. (1986), ou encore Agrobacterium rhizogenes, notamment selon la méthode décrite dans l'article de Robaglia et al, (1987).

De manière préférentielle, la transformation des cellules végétales est réalisée par le transfert de la région T du plasmide circulaire extra-chromosomique inducteur de tumeurs Ti d'Agrobacterium tumefaciens, en utilisant un système binaire (Watson et al., 1994).

Pour ce faire, deux vecteurs sont construits. Dans un de ces vecteurs, la région d'ADN-T a été éliminée par délétion, à l'exception des bords droit et gauche, un gène marqueur étant inséré entre eux pour permettre la sélection dans les cellules de plantes. L'autre partenaire du système binaire est un plasmide Ti auxiliaire, plasmide modifié qui n'a plus d'ADN-T mais contient toujours les gènes de virulence vir, nécessaires à la transformation de la cellule végétale. Ce plasmide est maintenu dans Agrobacterium.

L'invention concerne aussi la production de plantes transgéniques susceptible d'être régénérées à partir de la cellule végétale transformée, de même que les plantes transgéniques ainsi obtenues. L'invention comprend également les cellules et tissus végétaux, ainsi que les organes ou parties de plantes, y compris feuilles, tiges, racines, fleurs, fruits, et/ou graines obtenues à partir de ces plantes.

De préférence la cellule végétale selon l'invention est une cellule de plante sélectionnée dans le groupe constitué du maïs, du blé, de la tomate, du tabac, et du riz.

Méthode de production de protéines d'intérêt dans les plastes La méthode d'adressage vers un plaste selon l'invention permet d'obtenir la translocation d'un ARN vers un plaste et donc une expression localisée au niveau du plaste de la protéine éventuellement codée par cet ARN. La production de protéines dans les plastes de cellules végétales est avantageuse en termes de facilité d'extraction, mais aussi de stabilité, puisque certaines protéases seraient peu représentées dans les plastes, et en particulier les chloroplastes.

L'invention concerne donc une méthode de production d'au moins une protéine d'intérêt dans un plaste d'une cellule végétale comprenant les étapes consistant à : a) transformer une cellule végétale avec un acide nucléique codant une protéine d'intérêt lié à un acide nucléique d'adressage, la séquence transcrite dudit acide nucléique d'adressage étant celle d'un ARNm d'un gène nucléaire, ledit ARNm étant détectable dans un plaste d'une cellule végétale ; et b) exprimer ledit acide nucléique codant une protéine d'intérêt.

De manière avantageuse, ladire méthode de production contient une étape supplémentaire d'extraction des protéines du plaste par les méthodes usuelles et connues de l'homme du métier.

Le plaste peut être sélectionné dans le groupe constitué d'un chloroplaste, d'un amyloplaste, d'un chromosplaste, d'un étioplaste, d'un gérontoplaste, et d'un proplaste. Préférentiellement ledit plaste est un chloroplaste.

De préférence ledit ARNm détectable dans un plaste est caractérisé par une concentration dans un plaste supérieure à sa concentration cytoplasmique. De préférence encore la concentration dans un plaste dudit ARNm est au moins 2 fois supérieure à sa concentration cytoplasmique. La détermination des concentrations respectives de l'ARNm dans le plaste et le cytoplasme peut être effectuée conformément aux méthodes décrites dans la présente demande.

De préférence encore, ledit acide nucléique d'adressage selon l'invention a une séquence d'ADN ou d'ARN dont la séquence transcrite est celle d'un ARNm d'un gène nucléaire sélectionné dans le groupe par les gènes figurant dans le

tableau V. Ledit gène nucléaire est donc sélectionné dans le groupe des gènes ayant pour séquence codante SEQ ID No.1 , SEQ ID No.3, SEQ ID No.5, SEQ ID No.7, SEQ ID No.9, SEQ ID No.11 , SEQ ID No.13, SEQ ID No.15, SEQ ID No.17, SEQ ID No.19, SEQ ID No.21 , SEQ ID No.23, SEQ ID No.25, SEQ ID No.27, SEQ ID No.29, SEQ ID No.31 , SEQ ID No.33, SEQ ID No.35, SEQ ID No.37, SEQ ID No.39 ou SEQ ID No.41 identifiées chez Arabidopsis thaliana et/ou leurs séquences homologues chez d'autres espèces. Selon un mode de réalisation préféré, ledit acide nucléique d'adressage a une séquence transcrite qui est celle d'un ARNm du gène codant le facteur eucaryote d'initiation de la traduction elF4E.

Avantageusement ledit acide nucléique codant une protéine d'intérêt est fusionné audit acide nucléique d'adressage.

L'acide nucléique codant une protéine d'intérêt et l'acide nucléique d'adressage peuvent être tous deux une séquence d'ADN. L'acide nucléique codant une protéine d'intérêt et l'acide nucléique d'adressage peuvent aussi être tous deux une séquence d'ARN.

La cellule végétale peut être transformée avec ledit acide nucléique codant une protéine d'intérêt lié à un acide nucléique d'adressage de manière à obtenir une expression transitoire ou stable de la protéine d'intérêt, de préférence de manière à obtenir une expression stable.

La protéine d'intérêt peut être une protéine hétérologue. Par "protéine hétérologue" on entend une protéine qui n'est pas exprimée par la cellule végétale non transformée. Il peut s'agir d'une protéine recombinante normalement exprimée chez un organisme eucaryote, par exemple une protéine d'origine bactérienne, humaine, animale, ou végétale. Il peut s'agir en particulier d'une protéine d'intérêt agronomique, telle qu'une protéine conférant à la plante une résistance à un herbicide (par exemple le Basta), une protéine (une toxine ou protéase, par exemple) conférant à la plante une résistance à des pathogènes tels que des insectes, champignons, bactéries, virus etc, une protéine conférant une capacité à fixer l'azote ou à la photosynthèse accrue, une protéine conférant une résistance accrue à la sécheresse, au sel, ou aux températures extrêmes. Il peut aussi s'agir d'une protéine d'intérêt industriel, telle qu'une enzyme utilisée dans des procédés agrochimiques. La protéine peut aussi être une protéine d'intérêt thérapeutique et/ou prophylactique, comme l'insuline par exemple.

L'invention ne se limite pas à cette méthode de production et toute méthode connue par l'homme du métier peut être envisagée. En particulier, on peut envisager l'utilisation d'un opéron pour la production des protéines dans le plaste. Un opéron est une unité d'expression et de régulation des gènes bactériens comprenant des gènes structuraux et des éléments de contrôle dans l'ADN, reconnue par des produits de gènes régulateurs. L'invention comprend également le mode de mise en œuvre dans lequel l'ARN d'intérêt est sous la forme d'un ARN de type opéron, donnant plusieurs protéines, après traduction dans le plaste. Ce mode de mise en œuvre permet d'obtenir la production coordonnées de plusieurs protéines dans le plaste, en utilisant un seul construit. Un système de production de protéine dans le plaste comprenant l'opéron lactose (opéron inductible sous contrôle négatif) peut être utilisé selon un mode de réalisation de l'invention.

Méthode d'identification d'ARN capables d'adresser un ARN d'intérêt vers un plaste

Les inventeurs ont montré que des ARNm, transcrits de gènes nucléaires, qui ont été localisés dans des plastes, et en particulier qui sont présents dans les plastes avec une concentration supérieure à leur concentration cytoplasmique, permettent de transloquer une séquence d'ARN à laquelle ils sont liés depuis le noyau et/ou le cytosol d'une cellule végétale vers un plaste.

L'invention propose donc une méthode d'identification d'un ARN capable d'adresser un ARN d'intérêt vers un plaste d'une cellule végétale, dans laquelle on détermine la concentration d'un ARN candidat dans un plaste et dans le cytoplasme d'une cellule végétale, et où on identifie, en tant qu'ARN capable d'adresser un ARN d'intérêt vers un plaste d'une cellule végétale, un ARN dont la concentration dans le plaste est supérieure à sa concentration dans le cytoplasme.

De préférence, on identifie, en tant qu'ARN capable d'adresser un ARN d'intérêt vers un plaste d'une cellule végétale, un ARN dont la concentration dans le plaste est au moins 2 fois supérieure à sa concentration dans le cytoplasme.

Pour identifier ces ARN d'intérêt on peut utiliser une méthodologie telle que décrite dans l'exemple 1. On peut par exemple marquer une population d'ARN plastidiaux et une population d'ARN totaux, chacune avec cy3 et cy5, respectivement. Pour comparer la concentration relative d'un gène X dans ces deux populations, on peut procéder à un "dye swap", c'est-à-dire mettre respectivement à hybrider sur deux lames portant un oligonucléotide spécifique du gène X, les

mélanges (population d'ARN plastidiaux)-cy3 + (population d'ARN totaux)-cy5 et (population d'ARN plastidiaux)-cy5 + (population d'ARN totaux)-cy3. Le niveau d'hybridation à l'oligonucléotide est quantifié en mesurant la moyenne des intensités de fluorescence cy3 et cy5, normalisées en soustrayant le bruit de fond local, pour une même population d'ARN (acquisition des images à l'aide de ArrayScanner Génération III, Molecular Dynamics, et numérisation des images à l'aide de ImageQuant 5.2, Amersham Biosciences). Le niveau relatif de l'ARNm du gène X dans les ARN plastidiaux par rapport aux ARN totaux est alors estimé en calculant le rapport de la moyenne d'intensité de fluorescence dans les ARN plastidiaux sur la moyenne d'intensité de fluorescence dans les ARN totaux. On peut identifier, en tant qu'ARN d'intérêt, un ARN pour lequel la moyenne géométrique des intensités moyennes de fluorescence, dans les populations d'ARN plastidiaux et totaux, est supérieure à -2, et pour lequel le rapport de la moyenne d'intensité de fluorescence, dans les ARN totaux, sur la moyenne d'intensité de fluorescence, dans les ARN plastidiaux est compris entre 0 et 0,5.

Les exemples suivants illustrent l'invention sans en limiter sa portée.

EXEMPLES

Exemple 1 : Identification d'ARNm de gènes nucléaires ayant une localisation plastidiale

Matériels et méthodes

Purification des chloroplastes d'Arabidopsis thaliana

Les chloroplastes bruts ont été obtenus à partir de feuilles d'Arabidopsis thaliana selon une méthode dérivée du protocole décrit par Ferro et al., (Mol CeII Proteomics, 2003). Toutes les opérations ont été menées à 0-5 0 C dans des tampons dépourvus de RNAse.

Avant le début de l'extraction, préparer 6 tubes contenant 30 ml d'une solution contenant : 50% de Percoll, sorbitol 0,4 M, Tricine-KOH 20 mM, MgCI 2 5 mM et EDTA 2,5 mM. Préformer les gradients de Percoll pour la purification des chloroplastes par centrifugation à 38700 g pendant 55 min (rotor Sorvall SS-34). Stocker les tubes contenant ces gradients de Percoll préformés à 0-5 0 C.

Les plantes (400-500 g de feuilles) sont placées dans l'obscurité à 4°C pendant la nuit précédant l'extraction, lavées à l'eau désionisée puis séchées sur

papier filtre avant broyage. Le matériel (400-500 g de feuilles pour 2 litres de tampon de broyage contenant: sorbitol 0,4 M, Tricine-KOH 20 mM pH 8,4, EDTA 10 mM, NaHCO3 10 mM et 0.1 mg/mL de sérum albumine bovine (BSA) dégraissée) deux fois 2 secondes dans un Waring Blendor à faible vitesse. Le broyât est filtré rapidement à travers 4-5 couches de gaze et une épaisseur de nylon blutex. La solution filtrée est répartie équitablement dans 6 tubes à centrifugation (500 ml chacun) et centrifugée à 2070 g pendant 2 min (rotor Sorvall GS 3). Le surnageant est éliminé et les culots d'organites sont repris dans un volume final de milieu de lavage contenant: sorbitol 0,40 M, Tricine-KOH 20 mM, pH 7.6, MgCI 2 5 mM, EDTA 2,5 mM. Déposer la suspension de chloroplastes (6 ml par tube) au sommet des gradients de Percoll préformés. Centrifuger les gradients à 13,300 g pendant 10 min (swinging rotor Sorvall HB-6). Récupérer les chloroplastes intacts (une bande de couleur vert foncé localisée dans la partie basse du gradient) avec une pipette. Diluer 3-4 fois la suspension de chloroplastes intacts dans 200-300 ml de milieu de lavage contenant : sorbitol 0,40 M, Tricine-KOH 20 mM, pH 7.6, MgCI 2 5 mM, EDTA 2,5 mM. Centrifuger la suspension à 2070 g pendant 2 min (rotor Sorvall SS-34). Récupérer chaque culot, contenant les chloroplastes lavés, purifiés et intacts pour la préparation des ARNs et/ou la prépartion du stroma. A la fin de cette étape, le rendement de chloroplastes intacts est de 50 à 60 mg de protéines.

Contrôle de la pureté des organites purifiés

La pureté des chloroplastes purifiés est contrôlée à l'aide de différentes méthodes. (1) Des marqueurs enzymatiques : par exemple, la Fumarase (EC 4.2.1.2), marqueur de la contamination par des mitochondries ; Hydroxypyruvate reductase (EC 1.1.1.81), marqueur de la contamination par des peroxisomes ; (2) Des marqueurs immunologiques : par exemple, des anticorps dirigés contre la sous- unité T de la glycine-decarboxylase (marqueur de la contamination par des mitochondries); des anticorps dirigés contre l'histone H3 (marqueur de la contamination par des noyaux ). (3) des études protéomiques qui n'ont pas permis de détecter des protéines issues des noyaux, des mitochondries, ou du cytosol dans l'enveloppe des plastes d'Arabidopsis purifiés selon ce protocole.

Purification du stroma des chloroplastes d'Arabidopsis thaliana Toutes les opérations ont été menées à 0-5 0 C dans des tampons dépourvus de RNAse. Les chloroplastes intacts et purifiés à partir de feuilles d'Arabidopsis thaiiana ont été lysés dans un milieu hypotonique contenant, MOPS-NaOH 10 mM, pH 7,8, MgCI 2 4 mM). Le stroma a été purifié à partir du lysat par centrifugation sur gradients (6 tubes, 13.2 ml, Ultraclear, Beckman) de saccharose contenant: MOPS- NaOH 10 mM, pH 7.8, MgCI 2 4 mM en trois couches de 0,3 M, 0,6 M et 0,93 M saccharose. Les chloroplastes lises (ajuster à un volume final de 21 ml) sont déposés au sommet des gradients de saccharose (3,5 ml par tube). Les tubes sont centrifugés à 70000 g pendant 1 h (rotor Beckman SW41-TÎ). Après cette étape de centrifugation, le stroma, localisé au sommet du gradient est prélevé pour les extractions d'acides nucléiques. A la fin de cette étape, le rendement en stroma est d'environ 30 mg de protéines.

Contrôle de la pureté du stroma purifié

La pureté du stroma purifié est contrôlée à l'aide de différents marqueurs immunologiques : par exemple, des anticorps dirigés contre la protéine E 37 ou la protéine ceQORH (marqueurs de la contamination par l'enveloppe des chloroplastes); des anticorps dirigés contre les protéines LHCPs (marqueurs de la contamination par des thylacoïdes ). Ces études n'ont pas permis de détecter des protéines issues de l'enveloppe ou des thylacoïdes dans les fractions de stroma purifiées selon ce protocole.

Extraction de l'ARN des chloroplastes

Un culot de chloroplastes purifiés conservé à -8O 0 C est mis en suspension par homogénéisation au vortex dans 7 ml de tampon d'extraction (50 mM Tris-HCI pH 8, 300 mM NaCI, 2% SDS 1 5 mM EDTA pH 8, 0,5 mM d'acide aurintricarboxylique, 14,3 mM β-mercaptoéthanol, 0,5% polyvinylpyrrolidone, PM 360 000) préparé extemporanément, puis placé au bain-marie à 65°C pendant 15 min en agitant toutes les 2-3 minutes.

La solution est divisée et transférée dans deux tubes, puis centrifugée à 12 500 g à température ambiante pendant 15 min. Le surnageant est transféré dans un nouveau tube auquel sont ajoutés 0,35 ml de KOAc 3M, pH 4,8. La solution est homogénéisée et laissée dans la glace 30 minutes avant centrifugation à 10000 g

pendant 10 min à 4°C. (1) Le surnageant est transféré dans un nouveau tube et 2 ml de phénol/chloroforme/alcool isoamylique (IAA) (25:24:1) sont ajoutés. La solution est homogénéisée au vortex pendant 2 à 3 min puis centrifugée à 4 000 g pendant 15 min. L'étape (1) est répétée jusqu'à l'homogénisation puis 2 ml de chloroforme sont ajoutés à la phase aqueuse, la solution est homogénéisée au vortex pendant 2 à 3 min avant centrifugation pendant 15 min à 4000 g. Les deux surnageants sont transférés dans un seul tube contenant 100 mg de PVPP, puis incubés 20 min à 78°C en agitant doucement toutes les 2 à 3 minutes. Le tube est ensuite refroidi sur de la glace. On ajoute 2,85 ml d'eau et 10,85 ml de chloroforme/IAA (24 : 1) par 8 ml de surnageant, puis la solution est homogénéisée au vortex pendant 2 à 3 min avant centrifugation pendant 10 min à 4000 g. Le surnageant est transféré dans un tube et 4 ml de chloroforme/IAA (24 : 1) sont ajoutés, l'ensemble est homogénéiser au vortex puis centrifuger 10 min à 4000g. Le surnageant est transféré dans un nouveau tube et 8ml d'isopropanol sont ajoutés. L'ensemble est mélangé et incubé à -20 0 C pendant 12h. Après centrifugation à 5000 g pendant 45 min à 4°C, le culot est lavé avec de l'éthanol 70% avant d'être repris dans 500 μl d'eau et centrifugé à 10000 g pendant 5 min à 4°C. Le surnageant est alors transféré dans un tube Eppendorf où on ajoute 1 ml d'eau et 391 μl de LiCI 8M puis laissé 3 h à 4°C. Après centrifugation à 10000 g pendant 20 min à 4 0 C, le culot est lavé avec de l'éthanol 70% puis repris dans 100 μl d'eau sans RNase.

Extraction d'ARN stromal

Environ 1 ml de surnageant de stroma congelé est transféré dans un tube contenant un mélange, préalablement chauffé à 8O 0 C, contenant 2 ml de tampon TLES (Tris pH 8 100 mM, LiCI 100 mM, EDTA pH 8 10 mM, SDS 1%, PVPP 1 %, PVP 1 %, 5 mM DTT) et 2 ml de phénol. Après homogénisation (2 min au vortex) et centrifugation (15 min 4000 g), la phase supérieure est prélevée. 1 ml de tampon TLES est ajouté à la phase phénolique résiduelle, puis le mélange est agité et centrifugé. La phase supérieure est prélevée et rassemblée avec celle préalablement mise de côté. Une solution de LiCI 8M est ajoutée de façon à obtenir une concentration LiCI 2M finale, TARN est ainsi précipité une nuit à 4 0 C. Après centrifugation le culot est repris dans 100 μl d'eau.

L'ARN est purifié à l'aide du kit Rneasy (Qiagen). Selon le protocole du fabricant, 350 μl de tampon RLT+ 3,5 μ| de β-Mercaptoéthanol et 250 μl d'éthanol

absolu sont ajoutés ; l'ensemble est homogénéisé et centrifugé 15 secondes à 10000 rpm. 500μl de tampon RPE sont ajouté sur la membrane et l'ensemble est centrifugé 15 secondes à 10000 rpm. L'éluat est éliminé et la colonne est lavée à nouveau avec 500 μl de tampon RPE l'ensemble est centrifugé 2 minutes à 10000 rpm une première fois puis une seconde pour éliminer les traces d'éthanol. L'ARN est elué en ajoutant 30 μl d'eau RNase free sur la colonne. Après 1 minute, l'ensemble est centrifugé 1 minute 10000 rpm. L'élution est renouvelée avec 30 μl d'H 2 O. Les 2 éluats sont rassemblés et la solution est dosée.

Extraction des ARN totaux de feuilles

1 g de matériel végétal est broyé dans de l'azote liquide. La poudre obtenue est transférée dans un flacon contenant 2 ml de phénol et 2 ml de tampon TLES préalablement chauffés à 80 0 C ; l'ensemble est mélangé au vortex pendant 2 min avant d'ajouter 2 ml de chloroforme/lsoamyl Alcool (C/IA) (24 : 1) et de mélanger à nouveau au vortex pendant 2 min puis de centrifuger 12 min à 5000 g à 15°C. Le surnageant est récolté. 1 ml de tampon TLES est ajouté à la phase phénolique restante ; on mélange au vortex pendant 2 min et avant de centrifuger 10 min à 5000 g à ' 15°C. Le surnageant est à nouveau prélevé et rassemblé avec le premier surnageant récolté. Une ou plusieurs extractions au phénol/chloroforme/acide isoamylique (25:24:1) peuvent être effectuées si une interface blanchâtre entre la phase aqueuse et la phase phénolique est visible

Un volume de chloroforme/lsoamylic alcool est ajouté à la phase aqueuse issue de l'extraction par le mélange phénol/chloroforme/alcool isoamylique. On mélange au vortex pendant 2 min et avant de centrifuger 10 min à 5000 g à 4°C. Le surnageant est récolté et la concentration de la solution est ajustée à 2M de LiCI avec du LiCI 8M. L'ARN précipite une nuit à 4°C. Le mélange est centrifugé 45 min à 12000 rpm à 4 0 C puis le culot est resuspendu avec 100 μl d'H 2 O MiIIiQ pour Mini RNA Clean Up (Qiagen).

L'ARN est purifié à l'aide du kit Rneasy (Qiagen). 350 μl de tampon RLT+ 3,5 μl de β-Mercaptoéthanol (ajouté extemporanément) et 250 μl d'éthanol absolu sont ajoutés, l'ensemble est homogénéisé et centrifugé 15 secondes à 10000 rpm. 500μl de tampon RPE sont ajoutés sur la membrane et l'ensemble est centrifugé 15 secondes à 10000 rpm. L'éluat est éliminé et la colonne est lavée à nouveau avec 500 μl de tampon RPE ; l'ensemble est centrifugé 2 minutes à 10000 rpm une

première fois puis une seconde pour éliminer les traces d'éthanol. L'ARN est elué en ajoutant 30 μl d'eau RNase free sur la colonne. Après 1 minute, l'ensemble est centrifugé 1 minute 10000 rpm. L'élution est renouvelée avec 30μl d'H 2 O. Les 2 éluats sont rassemblés et la solution est dosée.

Synthèse des sondes marquées Cy3 ou Cy5 à partir des ARN totaux

• Synthèse de la sonde marquée Cy3 ou Cy5

3 μg d'ARN totaux sont placés dans 8,5 μl d'H 2 O sans RNase. On ajoute 0,5 μl de spike 2 μl de nonamères aléatoires. Le mélange est incubé 10 minutes à 70 0 C puis placé dans la glace pendant 1 min et centrifugé. Le mélange est ensuite incubé 10 minutes à température ambiante.

On prépare un tampon d'incubation, à ajouter à l'ARN, qui comprend pour une sonde 4 μl de tampon 5x SSII, 2 μl 0,1 M DTT, 1 μl d'un mélange de dNTP, 1 μl de dCTP Cy3 ou Cy5, 200 U de Superscript II (Invitrogen).

Le mélange d'incubation est ajouté à l'ARN et incubé 10 minutes à température ambiante, puis 3 heures à 42°C. 2 μl de NaOH 2,5 M sont ajoutés. Le tout est incubé alors 10 minutes à 37 0 C, puis sont ajoutés 10 μl de tampon HEPES 2 M pH 8.

* Purification de la sonde marquée Cy3 ou Cy5

Les sondes sont purifiées à l'aide du Kit de purification QIAGEN selon le protocole du fournisseur. Brièvement, 500 μl de tampon PB sont ajoutés à la sonde. Le mélange est déposé sur colonne puis centrifugé pendant 2 min à 14000 rpm, la colonne est lavée par ajout de 500 μl de tampon de lavage PE puiscentrifugée 1 min 14000 rpm, le tube collecteur est vidé et 500 μl de tampon de lavage PE sont ajoutés l'ensemble est centrifugé 1 min à 14000 rpm ; le tube collecteur est vidé puis 500 μl de tampon de lavage PE sont ajoutés, l'ensemble est centrifugé 1 min à 14000 rpm, le tube collecteur est vidé puis centrifugé 1 min à 14000 rpm pour assécher correctement la colonne. La colonne est placée dans un nouveau tube collecteur, et 50 μl de tampon d'élution sont ajoutés sur la membrane et laissés 1 min à température ambiante. L'ensemble est centrifugé 1 min à 14000 rpm. Une seconde elution est effectuée comme précédemment à l'aide de 50 μl de tampon d'élution.

Préparation des lames (spotting)

Les lames utilisées pour l'hybridation sont préalablement spottées à l'aide d'un robot (spotter Lucidea, Amersham Biosciences). Les 26000 oligonucléotides (set unigene 26K Operon), chacun correspondant à un gène du génome d'Arabidopsis, sont répartis dans des plaques format 384, en solution dénaturante, à une concentration de 2 μM. Les 130 amplicons correspondants aux gènes du génome de chloroplaste et aux transcrits mitochondriaux sont en solution dénaturante à une concentration de 50 ng/μl. L'ensemble de la matrice Arabidopsis (génome nucléaire et organites) est déposé sur des lames de verre Type 7 Star (Amersham Bioscience). Les lames sont sèchées dans l'enceinte du spotter à une hygrométrie de 50 % toute une nuit. Puis, chaque lame est exposée sous UV à 500 mJ pendant 15 secondes (cross-linking).

Hybridation sur lame

Classiquement lorsque l'on effectue une expérience microarray et que l'on compare le niveau d'expression dans un échantillon A par rapport à un échantillon B, plusieurs répétitions techniques (3) d'un « dye Swap » sont réalisées. Un « dye- swap », ou inversion de fluorochromes, est une deuxième expérience d'hybridation avec inversion des deux fluorochromes par rapport à la population. Cela correspond donc à deux hybridations sur deux lames différentes. Les données issues de l'hybridation des deux lames sont habituellement traitées ensemble.

Pour une expérience en swap classique, 6 tubes sont préparés de la façon suivante : 3 x tube A contenant 50 pmoles Population A cy3 + 50 pmoles Population B cy5, et 3 x tube B contenant 50 pmoles Population B cy3 + 50 pmoles Population A cy5. Les sondes sont évaporées au speed vack. Préhybridation des lames : les lames sont préhybridées dans une solution préparée extemporanément de composition suivante : 5X SSC, 0.1% SDS, 0.1% BSA. La solution est placée à 42°C pendant 2 heures puis les lames sont trempées dans le tampon à 42 0 C sous agitation pendant 45 min. Les lames sont rincées dans 3 bains successifs d'eau puis séchées à l'azote.

6 lames qui se suivent dans l'ordre de spotting d'une même sessions de spotting sont associées comme suit avec les tubes de sondes :

Traitement des lamelles : les lamelles sont immergées dans une solution de SDS 1 % et incubées dans un sonicateur pendant 5 minutes. Les lamelles sont rincées 5 fois avec de l'eau milliQ puis immergées dans EtOH 70%. Les lamelles sont séchées à l'azote.

Hybridation : après évaporation, chaque sonde (tube A ou B) est reprise dans 10,5 μl H 2 O et 3 μl d'ADN fractionné de sperme de hareng (0,1 mg/ml, Ci 1 mg/ml), et dénaturée 2 minutes à 95°C , 30% formamide, 1X tampon d'hybridation Amersham Biosciences. Les sondes sont dénaturées 2 min à 95°C puis conservées dans la glace.

Pour l'hybridation, la sonde est déposée sur la lamelle et la lame recouvre la lamelle. L'ensemble est déposé dans une chambre d'hybridation Corning et incubé au bain-marie à 37°C durant 16 heures. Les lames sont lavées sous agitation dans les bains succesifs suivants : 2X SSC 0,1% SDS 5 min à 37°C, 2X SSC 0,1% SDS 5 min à 37 0 C, 0,2X SSC 1 minute à température ambiante, 0,1X SSC 1 min à température ambiante puis dans l'eau. Les lames sont séchées à l'azote puis scannées.

Acquisition des images

La lecture optique des puces est réalisée à l'aide d'un scanner ArrayScanner Génération III (Molecular Dynamics) muni de deux lasers. Ces deux lasers excitent les deux molécules fluorescentes, Cy3 et Cy5 par émission des deux longueurs d'onde respectives de 550 nm et de 649 nm. Les photons émis en retour par les fluorochromes sont captés par un photomultiplicateur (PMT) réglé à 700 V et transformés en signal électrique amplifié qui est converti en deux images numériques en niveau de gris, une pour chaque longueur d'onde.

Traitement des images

Les images numérisées sont visualisées à l'aide du logiciel ImageQuant 5.2 (Amersham Biosciences) pour contrôler leur qualité globale. Ensuite, le logiciel ArrayVision 7.0 (Amersham Biosciences) permet l'analyse des images et la méthode utilisée fournit entre autres paramètres une valeur des intensités mesurées pour

chaque spot ainsi que le bruit de fond avoisinant. C'est à cette étape que les spots sont annotés, le logiciel attribue à chaque spot ses coordonnées et l'identifiant du gène qui lui correspond.

Normalisation

Pour les comparaisons ARNtotaux_ARNchloro et ARNtotaux_ARNstroma, il a été choisi d'effectuer une normalisation par swap. Dans ce cas, 2 lames d'un swap sont associées et pour chaque intensité, le bruit de fond local est soustrait. La moyenne des intensités correspondant à la même population d'ARN est calculée. Le bruit de fond pouvant être parfois supérieur à la valeur de fluorescence mesurée, la poyenne des intensités mesurée pour une population peut être une valeur négative. Le rapport des 2 moyennes est déterminée (RatioAB). Lorsqu'il y a plusieurs réplicats techniques un deuxième ratio (ratioAB 2) est calculé. On calcule également un facteur A, qui est la moyenne géométrique des intensités moyennes mesurées dans chacune des deux populations d'ARN comparées (par exemple A =

~JlntARNtotαux*IntARNchloro si lntARNtotaux>0 et lntARNchloro>0, ou A =

IntARNtotαux* IntARNchloro si lntARNtotaux<0 ou lntARNchloro<0).

Pour la comparaison ARNstroma_ARNchloro, la procédure de normalisation est différente. 3 répétitions techniques ou 3 swaps (6 lames) ont été réalisées. Le bruit de fond a été soustrait des intensités et les 6 lames ont été normalisées indépendamment par la méthode Loess par bloc (Lonnstedt et Speed, 2002). Pour chaque lame, le ratio intensité stroma/intensité chloro est calculé puis converti en Iog 2 - La moyenne des 6 valeurs de Iog2(ratio) est calculée et correspond à M. Le RatioAB est le rapport de la moyenne des intensités correspondant à l'ARNstroma sur la moyenne des intensités correspondant à l'ARNchloroplaste. Un test statistique bayesien (Yang et al., 2002) a été appliqué pour comparer les 6 valeurs d'intensité correspondant à la population d'ARN chloro au 6 valeurs d'intensité correspondant à la population d'ARN stroma. Le ratio stroma/chloro est la moyenne des 6 ratios stroma/chloro de chaque lame. T est Ia valeur du test statistique, pvalue est la p value correspondante et B correspond à la probabilité que le ratio chloro/stroma soit différent de 0 sur la probabilité que le ratio soit égale à 1. Quand B est supérieur à 0 le gène a une probabilité plus grande d'être différentiellement exprimé que d'être invariant.

Résultats

La comparaison des ARNtotaux avec les ARNstroma a permis d'identifier les 1222 gènes d'Arabidospsis listés dans le Tableau I. Les gènes sélectionnés répondaient aux critères suivants : A>-2 pour les 3 swaps, moyenne des ratios ARNtotaux_ARNstroma des swaps compris entre 0 et 0,5 et coefficient de variation <

Une comparaison des ARNchloro avec les ARNtotaux a permis d'identifier les 1315 gènes d'Arabidospsis répondant aux critères suivants : A>-2 pour les 3 swaps, moyenne des ratios ARNtotaux_ARNchloro des swaps compris entre 0 et 0,5 et coefficient de variation < 0,1. Cette liste de 1315 gènes a été croisée avec la liste des 1222 gènes précédemment sélectionnés et a conduit à la sélection de 683 gènes communs, qui sont reportés dans le Tableau II.

Une comparaison ARNstroma/ARNchloro, avec une normalisation de type Loess par bloc, a conduit à la sélection de 109 gènes (Tableau III) dont l'expression est supérieure dans le stroma par rapport au chloroplaste à et aux ARN totaux et dont l'expression est supérieure dans le chloroplaste par rapport aux ARN totaux. Ces gènes répondent aux critères : valeur du test statistique Bayesien>0 et M>0.

Une liste de 46 gènes, montrée dans le Tableau IV, a été établie en croisant deux sélections de gènes. La première sélection de 287 gènes a été effectuée à partir d'une comparaison ARNchloro/ARNtotaux sur la base des critères suivants : moyenne des ratios AB des swaps >1 ,5, variance < 0,001 ou ratio >5 s'il n'y a pas de seuil de variance. La deuxième sélection de 706 gènes a été effectuées à partir d'une comparaison ARNtotaux/ARNstroma sur la base des critères suivants : moyenne des ratios des 2 swaps <0,66, variance < 0,001 ou ratio >0,2 s'il n'y a pas de seuil de variance. Les 46 gènes identifiés sont les gènes communs à ces deux sélections.

Exemple 2: Mise en évidence d'un adressage de l'ARNm du facteur d'initiation de la transcription eucaryote 4E (elF4E) vers les chloroplastes Matériels et méthodes

Analyse par Hybridation et synthèse des sondes ARN

L'hybridation in situ a été effectuée comme décrit dans Rodriguez et al. (1998) avec des antisens marqués à la digoxygénine. Les sondes ARN et les analyses par Nothern blot ont été effectuées selon les procédures standard (Sambrook et al., 1989). Les sondes d'ADNc ont été marquées par amorçage aléatoire en utilisant du 32 P-dCTP et les sondes ARN ont été marquées par transcription in vitro en utilisant soit du 32 P-UTPoU la digoxygénine (DIG RNA Labelling kit, Roche diagnostics).

Purification des chloroplastes et extraction d'acides nucléiques Toutes les opérations ont été menées à 0-5°C. Les chloroplastes bruts ont été obtenus à partir de feuilles (6 g de A. thaliana, 30 g de N. tabacum, 100 g de L sativa ou 4 kg de S. oleracea). Les plantes ont été placées dans le noir à 4°C pendant la nuit et les chloroplastes ont été extraits dans un tampon isoosmotique (A thaliana et N. tabacum : TRIS-HcI pH 8, 20 mM, EDTA, 0,33 M Sorbitol, 0,1% βmercaptoethanol ; L Sativa : 0,4 M sorbitol, 10 mM NaCI, 50 mM MOPS pH 7 ; S. oleracea : 0,33 M saccharose, 20 mM MOPS pH 7.8) et purifiés par centrifugation isopycnique sur gradients de Percoll préformés (Douce et Joyard, 1982). Les chloroplastes de N. tabacum ont aussi été obtenus à partir de protoplastes comme décrit dans Charbonnier et al. (1987).

Les chloroplastes intacts purifiés de S. oleracea ont été lysés dans un milieu hypotonique, et le stroma, et les membranes de thylakoïde et d'enveloppe ont été purifiés à partir du lysat par centrifugation sur gradients de saccharose, (Douce and Joyard, 1982). L'ARN ou I 7 ADN chloroplastique des fractions sous-chloroplastiques ont été extraits des chloroplastes intacts purifiés ou des fractions sous-plastidiales purifiées par extraction au phénol/chloroforme et précipitation à l'éthanol. Pour les analyses par Southern blot, les acides nucléiques chloroplastiques ont été traités avec de la ARNase et digérés avec les enzymes de restriction appropriées.

Traitement des chloroplastes purifiés par ARNase et protéase

Les protoplastes intacts purifies de N. tabacum ont été incubés avec 50 μl de

ARNase One (Promega) dans le tampon d'extraction pendant 20 min sur la glace avant extraction de l'ARN.

Pour les chloroplastes de L sativa, cinquante nanogrammes de protéine recombinante cpSRP43 de A thaliana portant un tag-Histidine (ayant un site de

clivage par la trypsine en aval du tag-Histidine) et 50 pg d'ARN antisens AtelF4E (correspondant au cDNA de elF4E d'A. thaliana, qui ne présente pas d'hybridation croisée avec le mRNA de elF4E de L. sativa) marqué à la digoxygénine ont été ajoutés aux chloroplastes de L sativa purifiés avant incubation avec de la trypsine (650 unités). Après 5 min d'incubation sur la glace, 10 μg d'ARNase A ont été ajoutés avant d'incuber pendant 4 min à température ambiante. Une aliquote du mélange a été mélangée avec le tampon de dénaturation de protéine pour une détection par western blot séparée à l'aide d'un anticorps anti-tag-Histidine. L'ARN a été purifié à partir du reste du mélange d'incubation et une aliquote a été utilisée pour une détection directe de l'ARN AtelF4E marqué à la digoxygénine après transfert sur membrane. Le reste de l'ARN a été utilisé pour une hybridation Northern blot avec la sonde ARN antisens LselF4E marquée à la digoxygénine.

Production de plantes transgéniques et bombardement de particules L'ADNc AtelF4E1 a été amplifié par PCR et clone en amont et dans le cadre de lecture du gène de la green fluorescent protein 4 (mGFP5) sous le contrôle du promoteur 35S du virus de la mosaïque du chou-fleur (CaMV) (Von Arnim et al., 1998). La cassette de gène chimère a alors été placée dans le vecteur binaire pPZP- BASTA (un dérivé de pPZP ; Hajdukiewicz et al., 1994). La transformation d'Arabidopsis par Agrobacterium a été effectuée conformément à Bechtold et al. (1983). Le bombardement de particules à l'aide d'un canon à particules pneumatique (Bio-Rad PDS- 1000/He, pression d'hélium de 1 550 psi, disques de rupture 1 350 psi, distance de la cible 10 cm, microbilles en or de 1 μm) et l'observation par microscopie laser confocale (TCS-SP2, Leica, Deerfield, IL) ont été effectués comme décrit dans Ferro et al. (2002).

Résultats

UARNm de elFAEl est localisé dans les chloroplastes chez quatre espèces de plantes différentes

Les expériences d'hybridation in situ avec une sonde elF4E1 de A thaliana (AtelF4E1) ont montré que le signal d'hybridation est associé aux chloroplastes. Des recherches de similarités dans des banques de données ayant révélé l'absence de similarité de séquence entre i'ARNm de AtelF4E1 et l'ADN chloroplastique d'A. thaliana, les inventeurs ont cherché à caractériser davantage cette observation.

Une analyse Northern blot a été effectuée sur de l'ARN extrait de chloroplastes purifiés à partir d'A thaliana. L'ARNm elF4E peut être détecté dans l'extrait d'ARN chloroplastique par la sonde ARN antisens AtelF4E1. Le faible niveau de contamination de la préparation d'ARN chloroplastique par de l'ARN cytosolique a été vérifié en utilisant une sonde ARNr 28S. L'ARNm de AtelF4E a aussi été détecté spécifiquement dans la fraction d'ARN chloroplastique par RT-PCR.

De l'ARN chloroplastique a également été purifié à partir de Nicotiana tabacum ; il a ainsi été observé qu'une sonde d'ADNc de elF4E de N. tabacum s'hybridait à l'ARN chloroplastique (NtelF4E). La contamination la préparation d'ARN chloroplastique par de TARN nucléaire ou cytosolique a été exclue en utilisant une sonde pour le petit ARN nucléaire U6 et une sonde d'ADNc du gène de la nitrite réductase (Mr) 1 respectivement. Une sonde chloroplastique, PsbB, a détecté les ARNm correspondant dans tous les extraits. En outre, le traitement des chloroplastes intacts purifiés avec de l'ARNase, avant l'extraction d'ARN, ne fait pas disparaître le signal correspondant à l'ARNm de NtelF4E, ce qui suggère que PARNm est protégé de l'activité ARNase soit par des complexes protéiques à la surface du chloroplaste, soit par les membranes d'enveloppe des chloroplastes intacts.

Pour vérifier si l'ARNm de elF4E peut se lier à la membrane externe, des chloroplastes ont été purifiés à partir de Lactuca Sativa (laitue), ce qui permet d'obtenir de meilleurs rendements en chloroplastes que la purification à partir d'A thaliana et de N. tabacum. Les chloroplastes ont été traités avec une combinaison de trypsine et d'ARNase pour supprimer tout ARN qui pourrait être protégé par des complexes protéiques associés à la membrane. L'hybridation avec une sonde e\F4E de L. sativa (LselF4E) a montré que l'ARNm de LselF4E était protégé des traitements combinés par la protéase et par l'ARNase. L'efficacité de ces traitements a été évaluée par ajout, aux chloroplastes purifiés, de protéine recombinante exogène marquée par un tag-Histidine (cpSRP43) et d'ARN AtelF4E marqué à la digoxygénine. La disparition de la protéine cpSRP43 et de l'ARN AtelF4E après traitement par la protéase et l'ARNAse, alors que l'ARNm de LselF4E était détecté, a montré que l'ARNm de LselF4E est probablement localisé à l'intérieur de l'enveloppe chloroplastique. Des expériences d'hybridation contrôle ont révélé l'absence d'hybridation croisée entre la sonde elF4E de L. sativa et l'ADN chloroplastique purifié ou l'ARN mitochondrial.

Spinacia oleracea (épinard) a ensuite été utilisé en tant que source de chloroplastes pour obtenir les fortes quantités de chloroplastes nécessaires à un fractionnement en fractions d'enveloppe, de thylakoïdes et de stroma séparées. L'hybridation de la sonde LselF4E démontre que l'ARNm homologue de S. oleracea elF4E (SoelF4E) était localisé dans le stroma chloroplastique, ce qui exclut la localisation de SoelF4E dans l'espace intermembranaire de l'enveloppe des chloroplastes et valide ainsi la vectorisation de TARN à travers à la fois les membranes externes et internes des enveloppes de chloroplastes.

Une fusion des ARNm de elF4E1 et de la GFP est vectorisée vers les chloroplastes

L'ARNm codant la GFP (Green Fluorescent Protein, mGFP5) a ensuite été fusionné en 3' de l'ARN m AtelF4E1 sous le contrôle du promoteur 35S de CaMV et des lignées A. thaliana transgéniques ont été produites. Une lignée exprimant l'ARNm hybride a été sélectionnée et utilisée pour préparer de l'ARN chloroplastique. L'hybridation avec une sonde GFP a montré que l'ARN m hybride est effectivement localisé dans la fraction chloroplastique, comme il avait été observé avec l'ARNm AtelF4E1.

Ces résultats démontrent donc que l'adressage de l'ARNm elF4E dans les chloroplastes se produit dans quatre espèces de plante différentes et constitue donc une caractéristique générale des cellules de plantes. De plus, ces résultats confirment les résultats observés sur puce, et démontre qu'un ARN détecté préférentiellement comme associé au chloroplaste est effectivement transloqué à l'intérieur du plaste.

C'est la première fois qu'est rapportée l'importation dans les chloroplastes d'un ARN endogène provenant d'un autre compartiment cellulaire. La protéine elF4E est un des régulateurs clé de la traduction générale et spécifique chez les eucaryotes (Gingras et al., 1999) mais il n'est pas nécessaire à la traduction des ARNm chloroplastique qui sont dépourvus de la structure en coiffe (« cap ») (Sugiura et al., 1998). Un mode de régulation fréquemment observé de l'activité traductionnelle de la cellule est là séquestration de elF4E par des protéines de liaison (Gingras et al., 1999 ; Groisman et al., 2002). Comme une grande quantité de protéines doivent être

synthétisées dans le cytoplasme de manière coordonnée avec les besoins des chloroplastes, la séquestration chloroplastique de l'ARNm elF4E peut être un moyen de régulation de l'activité traductionnelle dans le cytosol en fonction du statut physiologique du chloroplaste. Les échanges d'ARN entre le cytosol et les chloroplastes peuvent constituer un nouveau niveau d'intégration cellulaire chez les plantes.

BIBLIOGRAPHIE

An G (1986). Development of plant promoter expression vectors and their use for analysis of differential activity of nopaline synthase promoter in transformed cells. Plant Physiol 81 : 86-91

Bechtold N, Ellis J, Pelletier G (1993) In planta Agrobacterium mediated gène transfer by infiltration of adult Arabidopsis thaliana plants. C R Acad Sci Paris, Life Sciences 316, 1194-1199.

Bevan M. (1984) Binary Agrobacterium vectors for plant transformation. Nucleic Acid Research, 12(22):8711-21.

Charbonnier L, Primard C, Leroy P, Chupeau Y. (1987) A Miniscale method for the simultaneous isolation of chloroplast and mitochondrial DNA from tobacco, french bean and rapeseed. Plant Mol. Biol. Rep. 4, 213-218.

Choi SB, Wang C, Muench DG, Ozawa K, Franceschi VR, Wu Y, Okita TW. (2000) Messenger RNA targeting of rice seed storage proteins to spécifie ER subdomains. Nature. 407(6805):765-7.

Depicker A, Stachel S, Dhaese P, Zambryski P, Goodman HM. (1982) Nopaline synthase: transcript mapping and DNA séquence. J. Mol. Appl. Genêt, 1 , 561-573

Douce R, and Joyard J. in Methods in Chloroplast Molecular Biology (Edelman M, Hallick R, and Chua NH. eds.) Elsevier Science Publishers B.V. Amsterdam, pp. 239-256 (1982).

Ferro M, Salvi D, Rivière-Rolland H, Vermat T, Seigneurin-Berny D, Grunwald D, Garin J, Joyard J, Rolland N. (2002) Intégral membrane proteins of the chloroplast envelope: identification and subcellular localization of new transporters. Proc Natl Acad Sci U S A. 99 : 11487-92.

Ferro M, Salvi D, Brugière S, Miras S, Kowalski S, Louwagie M, Garin J, Joyard J & Rolland N (2003) Proteomics of the chloroplast envelope membranes from Arabidopsis thaliana. Mol. CeIl. Proteomics 2: 325-345.

Finer, J. J., Vain, P., Jones, M.W. and McMullen, M. D. (1992) Development of the particle inflow gun for DNA delivery to plant cells. Plant CeII Reports 11 :323-328.

Fischhoff DA, Bowdish KS, Perlak FJ, et. al. (1987) Insect tolérant transgenic tomato plants. Bio/Technology, 5, 807-813.

Franck A, Guilley H, Jonard G, Richards K, Hirth L (1980) Nucleotide séquence of cauliflower mosaic virus DNA. CeII, 21, 285-294

Fromm ME, Taylor LP, Walbot V. (1986) Stable transformation of maize after gène transfer by electroporation. Nature, 319: 791-793

Garcia I, Rodgers M, Lenne C, Rolland A, Sailland A et Matringue M (1997) Subcelllular localization and purification of a p-hydroxyphenylpyruvate dioxygenase from cultured carrot cells and characterization of the corresponding cDNA. Biochem. J., 325:761-769.

Garcia I, Rodgers M, Pépin R, Hsieh TF, et Matringe M (1999). Characterization and subcellular compartmentation of recombinant 4- hydroxyphenylpyruvate dixoxygenase from Arabidopsis in transgenic tobacco. Plant Physiol, 119(4):1507-16.

Gingras AC, Raught B. and Sonenberg N. (1999) elF4 initiation factors: effectors of mRNA recruitment to ribosomes and regulators of translation.. Annu. Rev. Biochem. 68, 913-63.

Groisman I, Jung MY, Sarkissian M, Cao Q, Richter JD. (2002) Translational control of the embryonic cell cycle. Cell.;109(4):473-83.

Hajdukiewicz, P., Svab, Z. & Maliga, P. (1994) The small, versatile pPZP family of Agrobacterium binary vectors for plant transformation. Plant Mol. Biol. 25, 989-94.

Hilder VA, Gatehouse AMR, Sheerman SE, Barker RF, Boulter D (1987) A novel mechanism of insect résistance engineered into tobacco. Nature, 300, 160- 163.

Im KH, Cosgrove DJ, Jones AM. (2000) Subcellular localization of expansin mRNA in xylem cells. Plant Physiol. 123(2):463-70.

Joyard J, Teyssier E, Miege, C, Berny-Seigneurin, D, Maréchal, et al. (1998) The biochemical machinery of plastid envelope membranes. Plant Physiol. 118, 715- 723.

Klee HJ, Muskopf YM, Gasser CS. (1987) Cloning of an Arabidopsis thaliana gène encoding 5-enolpyruvylshikimate-3-phosphate synthase: séquence analysis and manipulation to obtain glyphosate-tolerant plants. Mol. Gen. Genêt., 210, 437- 442.

Kloc M, Zearfoss NR, Etkin LD. (2002) Mechanisms of subcellular mRNA localization. CeII. 22;108(4):533-44.

Krens FA, Molendijk L, Wullens GJ and Schilperoort RA (1982) In vitro transformation of plant protoplasts with Ti-p!asmid DNA. Nature 296: 72-74

Lee KY, Townsend J., Tepperman J., Black M., Chui CF, Mazur B. et al., (1988) The molecular basis of sulfonylurea herbicide résistance in tobacco. EMBO J., vol. 7, No. 5, pp. 1241-1248.

Lonnstedt I. et Speed TP. (2002) Replicated Microarray Data. Statistical Sinica 12: 31-46.

Martin W and Herrmann RG. (1998) Gène transfer from organelles to the nucleus: how much, what happens, and why. Plant Physiol. 118, 9-17

McEIroy D., Blowers, A.D., Jenes, B. and Wu, R. (1991) Construction of expression vectors based on the rice actin 1 (Act1) 5' région for use in monocot transformation. Mol. Gen. Genêt. 231, 150-160.

Mitra A, Higgins DW. (1994) The Chlorella virus adenine methyltransferase gène promoter is a strong promoter in plants. Plant Mol. Biol. 26, 85-93,

Norris SR, Shen X, DellaPenna D (1998). Complémentation of the Arabidopsis pds1 mutatin with the gène encoding p-hydroxyphenylpyruvate dioxygenase. Plant Physiol, 117(4): 1317-23

Petracek ME, Dickey LF, Huber SC, Thompson WF. (1997) Light-regulated changes in abundance and polyribosome association of ferredoxin mRNA are dépendent on photosynthesis. Plant CeII 9, 2291-300.

Preston C, Powles SB. (2002) Evolution of herbicide résistance in weeds: initial frequency of target site-based résistance to acetolactate synthase-inhibiting herbicides in Lolium rigidum. Heredity, 88(1), 8-13.

Robaglia C, Vilaine F, Pautot V, Raimond F, Amselem J, Jouanin L, Casse- Delbart F, Tepfer M. (1987) Expression vectors based on the Agrobacterium rhizogenes Ri plasmid transformation System. Biochimie. 69(3):231-7.

Rodriguez CM, Freire MA 1 Camilleri C, Robaglia C. (1998) The Arabidopsis thaliana cDNAs coding for elF4E and elF(iso)4E are not functionally équivalent for yeast complémentation and are differentially expressed during plant development. Plant J. 13, 465-73.

Sambrook J, Fritsch EF. and Maniatis T. (1989) Molecular cloning : a laboratory manual, 2nd éd. CoId Spring Harbor Laboratory press.

Sharp, PA (2001) RNA interférence - 2001. Gènes Dev, 15:485-490.

Sugiura M, Hirose T, and Sugita M. (1998) Evolution and mechanism of translation in chloroplasts.Annu. Rev. Genêt. 32,437-59.

Surpin M, Larkin RM, Chory J. (2002) Signal transduction between the chloroplast and the nucleus. Plant CeI1 14 : 327-338.

Vaeck, M., A. Reynaerts, H. Hofte, S. Jansens, M. DeBeuckeleer, C. Dean, M. Zabeau, M. Van Montagu, and J. Leemans. (1987) Transgenic plants protected from insect attack. Nature 328: 33-37.

Van Haaren MJ, Houck CM. (1991) Strong négative and positive regulatory éléments contribute to the high-level fruit-specific expression of the tomato 2A11 gène. Plant Mol. Biol. 17,615- 630,1991. van Heerden A, Browning KS. (1994) Expression in Escheήchia coli of the two subunits of the isozyme form of wheat germ protein synthesis initiation factor 4F. Purification of the subunits and formation of an enzymatically active complex. J. Biol. Chem. 269:17454-17457.

Verdaguer B, de Kochko A, Fux Cl, Beachy RN, Fauquet C. (1998) Functional organization of the cassava vein mosaic virus (CsVMV) promoter. Plant Mol Biol., 37(6): 1055-67.

Von Amim, A.G., Deng, X.W.& Stacey, M. G. (1998) Cloning vectors for the expression of green fluorescent protein fusion proteins in transgenic plants. Gène. 221 , 35-43.

Watson et al. (1994) Ed. De Boeck Université, pp 273-292

White J., Chang S-YP., Bibb MJ. and Bibb MJ. (1990) A cassette containing the bar gène of Streptomyces hygroscopicus: a selectable marker for plant transformation. Nuci. Acid. Res. 18, 1062.

Yang, Y. H., Dudoit, S., Luu, P., Lin, D. M., Peng, V., Ngai, J., and Speed, T. P. (2002). Normalization for cDNA microarray data: a robust composite method addressing single and multiple slide systematic variation. Nucleic Acids Research 30(4):e15.