Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
ICBP90 POLYPEPTIDE AND ITS FRAGMENTS AND POLYNUCLEOTIDES CODING FOR SAID POLYPEPTIDES AND APPLICATIONS FOR DIAGNOSING AND TREATING CANCER
Document Type and Number:
WIPO Patent Application WO/2000/078949
Kind Code:
A1
Abstract:
The invention concerns a novel ICBP90 (Inverted CCAAT box binding protein 90) and its fragments, polynucleotides coding for said polypeptides and specific antibodies directed against said polypeptides. The invention also concerns methods and kits for diagnosing cell proliferation and compounds useful as medicine for preventing and/or treating pathology involving cell proliferation and in particular cancer.

Inventors:
BRONNER CHRISTIAN (FR)
HOPFNER RAPHAEL (FR)
MOUSLI MARC (FR)
JELTSCH JEAN-MARC (FR)
LUTZ YVES (FR)
OUDET PIERRE (FR)
Application Number:
PCT/FR2000/001747
Publication Date:
December 28, 2000
Filing Date:
June 22, 2000
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
ASS POUR LE DEV DE LA RECH (FR)
BRONNER CHRISTIAN (FR)
HOPFNER RAPHAEL (FR)
MOUSLI MARC (FR)
JELTSCH JEAN MARC (FR)
LUTZ YVES (FR)
OUDET PIERRE (FR)
International Classes:
A61K47/48; A61P35/00; C07K16/18; C12N15/12; C12Q1/68; C12Q1/6886; A61K38/00; A61K48/00; (IPC1-7): C12N15/12; C07K14/435; C07K14/47; C12N15/10; C12N15/66; C12N15/11; C12Q1/68; C07K16/18; G01N33/53; A61K51/00; A61P35/00
Domestic Patent References:
WO1998037207A11998-08-27
WO1999038972A21999-08-05
Other References:
DATABASE EMBL NUCLEOTIDE AND PROTEIN SEQUENCES, 18 August 1998 (1998-08-18), HINXTON, GB, XP002133353
DATABASE EMBL NUCLEOTIDE AND PROTEIN SEQUENCES, 18 April 1997 (1997-04-18), HINXTON, GB, XP002133354
FUJIMORI A. ET AL.,: "Cloning and mapping of Np95 gene which encodes a novel nuclear protein associated with cell proliferation.", MAMMALIAN GENOME, vol. 9, no. 12, 1998, pages 1032-1035, XP000890078
SANDRI M I ET AL: "P53 REGULATES THE MINIMAL PROMOTER OF THE HUMAN TOPOISOMERASE IIALPHA GENE", NUCLEIC ACIDS RESEARCH,GB,OXFORD UNIVERSITY PRESS, SURREY, vol. 24, no. 22, 15 November 1996 (1996-11-15), pages 4464 - 4470, XP002068824, ISSN: 0305-1048
ISAACS RJ T AL.,: "Regulation of the human topoisomerase IIalpha gene promoter in confluence arrested cells.", THE JOURNAL OF BIOLOGICAL CHEMISTRY, vol. 271, no. 28, 12 July 1996 (1996-07-12), pages 16741 - 16747, XP002133355
HERZOG C E AND ZWELLING L A: "Evaluation of a potential regulatory role for inverted CCAAT boxes in the human topoisomerase IIalpha promoter", BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS, vol. 232, 1997, pages 608 - 612, XP000877157
LIM K ET AL.: "Reduced level of ATF is corelated with transcriptional repression of DNA topoisomerase IIalpha gene during TPA-induced differentiationof HL-60 cells", BIOCHEMISTRY AND MOLECULAR BIOLOGY INTERNATIONAL, vol. 46, no. 1, September 1998 (1998-09-01), pages 35 - 42, XP000900088
KUBO T ET AL.,: "DNA topoisomerase IIalpha gene expression under transcriptional control in etoposide/teniposide-resistant human cancer cells", CANCER RESEARCH, vol. 55, 1 September 1995 (1995-09-01), pages 3860 - 3864, XP000877419
DATABASE EMBL NUCLEOTIDE AND PROTEIN SEQUENCES, 3 April 2000 (2000-04-03), HINXTON, GB, XP002148667
HOPFNER R ET AL.,: "ICBP90, a novel human CCAAT binding protein, involved in the regulation of topoisomerase IIalpha expression.", CANCER RESEARCH, vol. 60 (1), 1 January 2000 (2000-01-01), pages 121-8, XP000884566
FUJIMORI ET AL., MAMMALIAN GENOME, vol. 9, pages 1032
Attorney, Agent or Firm:
Martin, Jean-jacques (rue de Chazelles Paris Cedex 17, FR)
Download PDF:
Claims:
REVENDICATIONS
1. Polypeptide isolé dénommé ICBP90 (inverted CCAAT box binding protein 90) de séquence d'acides aminés SEQ ID N°2.
2. Polypeptide isolé caractérisé en ce qu'il comprend un polypeptide choisi parmi : a) un polypeptide de séquence SEQ ID N°2, SEQ ID N°4, SEQ ID N°6 ou SEQ ID N°8 ; b) un polypeptide variant de polypeptide de séquences d'acides aminés défini en a) ; c) un polypeptide homologue au polypeptide défini en a) ou b) et comportant au moins 80 % d'homologie, de préférence 90 % avec ledit polypeptide de a) ; d) un fragment d'au moins 5 acides aminés consécutifs d'un polypeptide défini en a), b) ou c) ; e) un fragment biologiquement actif d'un polypeptide défini en a), b) ou c).
3. Polypeptide selon l'une quelconque des revendications 1 à 2 caractérisé en ce qu'il est comporte au moins un domaine de fixation à l'ADN sélectionné dans le groupe composé d'un domaine « doigt de zinc » et d'un domaine « leucine zipper N.
4. Polypeptide selon la revendication 3 caractérisé en ce que la séquence d'ADN sur laquelle se lie ledit polypeptide est une boite CCAAT, de préférence une boite CCAAT inversée (Inverted CCAAT Box : ICB).
5. Polynucléotide isolé caractérisé en ce qu'il code pour un polypeptide selon la revendication 1.
6. Polynucléotide selon la revendication 5 de séquence SEQ ID N° 1.
7. Polynucléotide isolé caractérisé en ce qu'il comprend un polynucléotide choisi parmi : a) un polynucléotide de séquence SEQ ID N°1, SEQ ID N°3, SEQ ID N°5 ou SEQ ID N°7 ou dont la séquence est celle de l'ARN correspondant à la séquence SEQ ID N° l, SEQ ID N°3, SEQ ID N°5 ou SEQ ID N°7 ; b) un polynucléotide dont la séquence est complémentaire de la séquence d'un polynucléotide défini en a), c) un polynucléotide dont la séquence comporte au moins 80% d'homologie avec un polynucléotide défini en a) ou b), d) un polynucléotide hybridant dans des conditions de forte stringence avec une séquence de polynucléotide défini en a), b) ou c), e) un fragment d'au moins 15 nucléotides consécutifs, de préférence 21 nucléotides consécutifs, et de manière préférée 30 nucléotides consécutifs d'un polynucléotide défini en a), b), c) ou d) à l'exception de l'EST humain AI 084 125, à l'exception de la séquence correspondant à la séquence SEQ ID ? 944 publiée le 5 août 1999 dans la demande de brevet WO 99 38972 et à l'exception des séquences SEQ ID N°9, N° 10 et N° 11 correspondant respectivement aux EST humains N° AI 083 773, N° AA 811 055, N° AA 488 755, N° AA 129 794 et N° AA 354 253.
8. Polynucléotide selon la revendication 7 caractérisé en ce qu'il est marqué directement ou indirectement par un composé radioactif ou un composé non radioactif.
9. Utilisation d'un polynucléotide selon la revendication 8 en tant qu'amorce pour l'amplification ou la polymérisation de séquences nucléiques.
10. Utilisation d'un polynucléotide selon la revendication 8 en tant que sonde pour la détection de séquences nucléiques.
11. Utilisation d'un polynucléotide selon la revendication 8 en tant que oligonucléotide sens ou antisens pour contrôler l'expression du produit protéique correspondant.
12. Vecteur recombinant de clonage d'un polynucléotide selon l'une des revendications 5 à 8 et/ou d'expression d'un polypeptide selon l'une des revendications 1 à 4 caractérisé en ce qu'il contient un polynucléotide selon l'une quelconque des revendications 5 à 8.
13. Vecteur selon la revendication 12 caractérisé en ce qu'il comporte les éléments permettant 1'expression éventuellement la sécrétion dudit polypeptide dans une cellule hôte.
14. Vecteur selon l'une quelconque des revendications 12 à 13 caractérisé en ce que les éléments permettant l'expression dudit polypeptide sont choisis parmi : a) le polynucléotide isolé de séquence SED ID N°12 ; b) un polynucléotide dont la séquence est complémentaire de la séquence du polynucléotide défini en a) ; c) un polynucléotide dont la séquence comporte au moins 80% d'identité avec un polynucléotide défini en a) ou en b) ; d) un polynucléotide hybridant dans des conditions de forte stringence avec une séquence du polynucléotide défini en a), b) ou c).
15. Cellule hôte, caractérisée en ce qu'elle est transformée par un vecteur selon l'une des revendications 12,13 et 14.
16. Procédé de préparation d'un polypeptide recombinant caractérisé en ce que l'on cultive une cellule hôte selon la revendication 15 dans des conditions permettant l'expression et éventuellement la sécrétion dudit polypeptide recombinant et que l'on récupère ledit polypeptide recombinant.
17. Polypeptide recombinant susceptible d'tre obtenu par un procédé selon la revendication 16.
18. Anticorps monoclonal ou polyclonal et ses fragments caractérisé en ce qu'il lie spécifiquement un polypeptide selon l'une des revendications 1 à 4 et 17.
19. Anticorps monoclonal selon la revendication 18 spécifique de la protéine ICBP90 humaine et capable d'inhiber l'interaction entre ICBP90 et la séquence d'ADN sur laquelle se lie spécifiquement la protéine ICBP90.
20. Anticorps monoclonal selon la revendication 18 spécifique de la protéine ICBP90 humaine et capable d'inhiber l'interaction entre ICBP90 et des protéines avec lesquelles ICBP90 interagit, lesdites protéines étant de préférence ICBP90 ellememe ou des protéines d'un complexe transcriptionnel.
21. Procédé de détection et/ou de dosage d'un polypeptide selon l'une des revendications 1 à 4 et 17, dans un échantillon biologique, caractérisé en ce qu'il comprend les étapes suivantes : a) mise en contact de l'échantillon biologique avec un anticorps selon l'une des revendications 18 à 20 ; b) mise en évidence du complexe antigèneanticorps formé.
22. Nécessaire pour la mise en oeuvre d'un procédé selon la revendication 21 dans un échantillon biologique par réaction immunologique, caractérisé en ce qu'il comprend les éléments suivants : a) un anticorps monoclonal ou polyclonal selon l'une des revendications 18 à 20 ; b) le cas échéant, les réactifs pour la constitution du milieu propice à la réaction immunologique ; c) les réactifs permettant la détection du complexe antigène anticorps produit par la réaction immunologique.
23. Procédé de détection et/ou de dosage d'un polynucléotide selon l'une quelconque des revendications 5 à 8 dans un échantillon biologique, caractérisé en ce qu'il comporte les étapes suivantes : a) isolement de l'ADN à partir de l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de 1'ARN de l'échantillon biologique ; b) amplification spécifique de l'ADN à l'aide d'amorces selon la revendication 9 ; c) analyse des produits d'amplification.
24. Nécessaire pour la mise en oeuvre d'un procédé selon la revendication 23 dans un échantillon biologique, caractérisé en ce qu'il comprend les éléments suivants : a) un couple d'amorces nucléiques selon la revendication 9 ; b) les réactifs nécessaires pour effectuer une réaction d'amplification d'ADN ; c) éventuellement un composant permettant de vérifier la séquence du fragment amplifié, plus particulièrement une sonde selon la revendication 10.
25. Procédé de détection et/ou de dosage d'acide nucléique selon l'une quelconque des revendications 5 à 8 dans un échantillon biologique, caractérisé en ce qu'il comporte les étapes suivantes : a) Mise en contact d'une sonde selon la revendication 10 avec un échantillon biologique ; b) Détection et/ou dosage de l'hybride formé entre ladite sonde et l'ADN de l'échantillon biologique.
26. Nécessaire pour la mise en oeuvre d'un procédé selon la revendication 25 dans un échantillon biologique, caractérisé en ce qu'il comprend les éléments suivants : a) une sonde selon la revendication 10 ; b) les réactifs nécessaires à la mise en oeuvre d'une réaction d'hybridation.
27. Procédé selon les revendications 21,23 et 25 pour le diagnostic de prolifération cellulaire.
28. Procédé de criblage de ligand susceptible d'affecter l'activité transcriptionnelle d'un gène dont le promoteur comporte des boites CCAAT et/ou CCAAT inversées (ICB) susceptibles de lier un polypeptide selon les revendications 1 à 4 et 17 et qui comporte les étapes suivantes : a) mise en contact dudit polypeptide et d'un ou plusieurs ligand (s) potentiel (s) en présence de réactifs nécessaires à la mise en oeuvre d'une réaction de transcription ; b) détection et/ou mesure de l'activité transcriptionnelle.
29. Procédé de criblage de ligand susceptible d'affecter la fonction « récepteur nucléaire)) du polypeptide selon les revendications 1 à 4 et 17 et qui comporte les étapes suivantes : a) mise en contact dudit polypeptide et d'un ou plusieurs ligands potentiels en présence de réactifs nécessaires ; b) détection et/ou mesure de l'activité transcriptionnelle d'un gène dont le promoteur comporte des boites CCAAT et/ou CCAAT inversées (ICB) susceptible de lier ledit polypeptide.
30. Nécessaire pour la mise en oeuvre d'un procédé selon les revendications 28 et 29 dans un échantillon biologique caractérisé en ce qu'il comprend les éléments suivants : a) un polypeptide selon les revendications 1 à 4 et 17 ; b) un ligand ; c) les réactifs nécessaires à la mise en oeuvre d'une réaction de transcription.
31. Ligand susceptible d'tre obtenu par le procédé selon la revendication 28 ou 29.
32. Composé caractérisé en ce qu'il est choisi parmi : a) un polypeptide selon l'une des revendications 1 à 4 ou 17 ; b) un polynucléotide selon l'une des revendications 5 à 8 ; c) un vecteur selon l'une des revendications 12 à 14 ;. d) une cellule selon la revendication 15 ; e) un anticorps selon l'une des revendications 18 à 20 ; i) un ligand selon la revendication 31 à titre de médicament.
33. Composé selon la revendication 32 à titre de médicament destiné à la prévention et/ou au traitement du cancer.
34. Utilisation d'un composé selon les revendications 32 et 33 pour la préparation d'un médicament destiné à moduler, à augmenter ou à diminuer la prolifération cellulaire.
35. Composition pharmaceutique pour le traitement préventif et curatif du cancer caractérisée en ce qu'elle contient une quantité thérapeutiquement efficace d'un composé selon l'une des revendications 32 et 33 et un véhicule pharmaceutiquement acceptable.
36. Composition pharmaceutique caractérisée en ce qu'elle comprend un anticorps selon l'une des revendications 18 à 20 en tant qu'agent de ciblage conjugué à au moins un agent sélectionné parmi le groupe des agents antiprolifératifs, antinéoplastiques ou cytotoxiques.
37. Produit comprenant au moins un composé selon les revendications 32 et 33 et au moins un autre agent anticancéreux comme produit de combinaison pour une utilisation simultanée, séparée ou étalée dans le temps en thérapie anticancéreuse.
38. Composition pour la détection, la localisation et l'imagerie des cancers, comprenant un anticorps selon l'une quelconque des revendications 18 à 20, l'anticorps est marqué directement ou indirectement avec un marqueur générateur de signal sélectionné parmi les isotopes radioactifs et les entités non isotopiques.
39. Méthode de détection, de localisation et d'imagerie du cancer, comprenant les étapes de : a) injection parentérale chez un tre humain d'une composition selon la revendication 38 ; b) accumulation après un temps suffisant au niveau des cellules cancéreuses de l'anticorps marqué puis pénétration de l'anticorps marqué à l'intérieur desdites cellules, sans que ledit anticorps ne se lie de manière substantielle aux cellules normales ; et c) détection du signal au moyen d'un détecteur de signal ; et d) conversion du signal détecté en une image des cellules cancéreuses.
Description:
« POLYPEPTIDE ICBP90 ET SES FRAGMENTS ET POLYNUCLEOTIDES CODANT LESDITS POLYPEPTIDES ET APPLICATIONS AU DIAGNOSTIC ET AU TRAITEMENT DU CANCER ».

La présente invention concerne un nouveau polypeptide ICBP90 et ses fragments, le clonage de l'ADNc et les polynucléotides codant pour lesdits polypeptides, des vecteurs de clonage et/ou d'expression incluant lesdits polynucléotides, des cellules transformées par lesdits vecteurs et des anticorps spécifiques dirigés contre lesdits polypeptides. L'invention concerne également des procédés et des kits de diagnostic des cancers, un procédé et un kit de criblage de ligands du polypeptide de l'invention et des composés utilisables à titre de médicament pour la prévention et/ou le traitement des cancers.

Les ADN topoisomérases sont des protéines nucléaires hautement conservées au cours l'évolution dont le rôle principal est de contrôler la conformation et la topologie de l'ADN dans le noyau, qui sont constamment altérées par les différents processus biologiques impliquant l'ADN tels par exemple la transcription et la réplication. Les topoisomérases exercent leur action en coupant 1'ADN et en reliant ces lésions après avoir réalisé le changement conformationnel adéquat.

Chez les mammifères et l'homme en particulier, il existe à l'heure actuelle au moins cinq gènes différents codant pour une topoisomérase et au moins deux pseudogènes additionnels (pour revue, voir Nitiss 1998). Ainsi, la topoisomérase I, codée par le gène TOP1 retire les supertours présents dans l'ADN en ne coupant qu'un seul brin. Les deux topoisomérases de type II existant chez l'homme appelées TopIIa et TopIIp, altèrent la topologie de l'ADN en introduisant des clivages double brin transitoires (pour revue, voir

Wang 1996). Enfin, il existe deux topoisomérases de type III codées par deux gènes localisés en 17pli. 2-12 et 22qll-12 et qui agissent uniquement contre les supertours négatifs de l'ADN.

Dans les cellules tumorales, les topoisomérases de'type II jouent un rôle très important ; dans ces cellules en croissance et en division rapide, il existe un grand besoin de maintenir les molécules d'ADN dans une conformation correcte puisque des taux de transcription et de réplication élevés sont nécessaires. Ainsi, les taux de toposiomérases II sont en général plus élevés dans les cellules tumorales humaines que dans les tissus normaux de mme origine. Cependant, le taux d'expression élevé de la topoisomérase IIa dans les cellules tumorales peut variés entre deux tumeurs de nature différente affectant un mme tissu. Par exemple, le noyau des cellules de carcinome du poumon à petites cellules présente un taux plus élevé de topoisomérase lIa que le noyau des cellules de carcinomes pulmonaires à cellules de taille normale (Guinee et al., 1996). De la mme manière, le taux de topoisomérase IIa dans les cellules A549 est trois fois plus élevé que dans les cellules PC3, ces deux lignées cellulaires provenant d'adénocarcinome de l'épithélium pulmonaire (Yamasaki et al., 1996).

Ces constatations donnent à penser que la topoisomérase IIa peut tre considérée comme un marqueur de prolifération cellulaire pour certains types de cancer. Le processus cancéreux se caractérisant par une prolifération cellulaire anormale due en partie à la perte de l'inhibition de contact, la topoisomérase IIa apparaît donc comme une cible privilégiée des drogues chimiothérapeutiques pour le traitement du cancer (Pommier et al.

1994), et les traitements anticancéreux actuels font largement appel aux inhibiteurs de topoisomérases.

La plupart de ces inhibiteurs exercent leurs effets cytotoxiques en stabilisant le complexe de clivage de l'ADN. Des drogues comme les anthracyclines [doxorubicine (adriamycine) ou épipodophyllotoxines (tel l'étoposide (VP-16) ou le téniposide (VM26))], les acridines (tel que le mAMSA) et les anthracendiones (e. g. mitoxantrone) sont des exemples de drogues inhibitrices de topoisomérases II qui stabilisent le complexe de clivage. Plus récemment, une nouvelle classe d'inhibiteurs de topoisomérases II a été développée ; ces inhibiteurs agissent au niveau de l'activité catalytique et non plus en stabilisant le complexe de clivage. La drogue fostriécine en est un exemple (Boritzki et al., 1988).

Aujourd'hui ces différentes drogues sont utilisées dans des traitements anti-cancéreux curatifs et palliatifs.

Néanmoins, l'un des problèmes majeurs rencontré dans les traitements anti-cancéreux actuels utilisant les inhibiteurs des topoisomérases est l'émergence d'une résistance aux drogues (Kubo et al., 1995). Ces résistances sont soit le fait d'une surexpression de pompes permettant l'efflux de drogues à l'extérieur de cellules avant qu'elles n'atteignent leur cible (e. g ; P-glycoprotéine, protéine associée à la multirésistance aux drogues (MRP)), soit le fait de changement du taux d'expression de la topoisomérase IIa (Deffie et al., 1989 ; Fry et al., 1991), soit des deux (pour revue, voir Isaacs et al., 1998).

L'un des aspects de la présente invention est donc de comprendre les mécanismes de régulation de l'expression du gène de la topoisomérase IIa, afin de développer une alternative au phénomène de résistance aux drogues observé pour certains cancers, et ce, dans l'optique d'améliorer le traitement préventif et curatif des cancers.

Il existe deux types de topoisomérases de type II qui différent dans leur profil d'expression ; la topoisomérase IIa (Top IIa) (170 kD), essentiellement localisée dans le nucléoplasme au niveau du centromère des chromosomes mitotiques, intervient-dans les processus biologiques fondamentaux que sont la réplication, la condensation des chromosomes et la transcription. La topoisomérase IIP (Top IIß) (180 kD) est semble-t-il plutôt impliquée dans la transcription des ARN ribosomiques étant donné la localisation nucléolaire de cette enzyme. Les deux topoisomérases de type II humaines sont localisées sur deux chromosomes différents (17q21-22 pour la topoisomérase lIa et 3p24 pour la topoisomérase IIß) (Tsai-Plugfelder et al., 1988 ; Drake et al., 1989 ; Chung et al., 1989 ; Jenkins et al., 1992 ; Austin et al., 1993).

Contrairement à la topoisomérase IIß dont 1'expression se caractérise par une relative constance, la topoisomérase IIa présente une variation d'expression en fonction de l'état de prolifération des cellules et de leur position dans le cycle cellulaire.

L'expression de l'ARN messager (ARNm) est plus élevée dans les cellules en prolifération que dans les cellules arrtées en confluence. L'expression de la topoisomérase IIa augmente au cours de la phase S du cycle cellulaire pour atteindre un maximum en fin de phase G2/M (Goswami et al., 1996), le niveau d'ARN messager étant dix fois plus élevé en fin de phase S que pendant la phase G1.

Egalement, il semble exister un couplage entre la synthèse et la dégradation de la topoisomérase lIa et la condensation/décondensation chromosomique (Heck et al., 1988).

Les connaissances actuelles concernant la régulation du gène de la topoisomérase lIa restent somme toute assez sommaires.

Récemment, une région promotrice d'environ 650 paires de bases a

été décrite par Hochhauser et al. (1992), elle présente toutes les caractéristiques d'un gène domestique, absence de boite TATA et richesse modérée en sites GC (présence notamment d'une boite Spl pouvant remplacer la boite TATA) en sont deux exemples. La présence de 5 boites CCAAT inversées ou ICB (Inverted CCAAT box) est une autre particularité de ce type de promoteur.

Des facteurs de transcription interagissant avec le promoteur du gène de la topoisomérase lIa humaine ont été décrits ; on peut citer c-myb (Brandt et al., 1997), p53 (Sandri et al., 1996), ATF (Lim et al., 1998), Spl et Sp3 (Kubo et al., 1995). Quoi qu'il en soit, en dehors de NF-Y (également appelé CBF, ACF et CP1, références dans Isaacs et al., 1996) les facteurs de transcription agissant sur les séquences ICB du promoteur du gène de la topoisomérase IIa humaine ne sont pas encore tous identifiés et caractérisés ; Herzog et Zwelling (1997) ont cependant mis en évidence deux protéines d'un poids moléculaire apparent de 90 kD et de 140 kD qui lient respectivement ICB1 à ICB4 et ICB5. Isaacs et ses collaborateurs (1996) ont proposé que le NFY ainsi qu'une autre protéine non identifiée reconnaissent une boite ICB de la région promotrice du gène de la topoisomérase IIa ; ils ont également montré que les mutations de ICB2 abrogeaient complètement la diminution de l'activité promotrice normalement observée dans des cellules arrtées à confluence (Isaac et al., 1996).

Ils ont identifié NFY comme un composant d'un complexe induit par la prolifération et qui se lie in vitro à la séquence ICB2 du promoteur du gène de la topoisomérase IIa humaine, bien que NF-Y soit toujours détectable dans les cellules arrtées à confluence (Isaac et al., 1996). Ils ont proposé que ICB2 agisse comme un régulateur négatif du promoteur du gène de la topoisomérase IIa des cellules arrtées à confluence et que cette répression puisse

tre supprimée dans les cellules prolifératives. La boite ICB2 du promoteur du gène de la topoisomérase IIa joue donc un rôle primordial dans l'arrt du processus prolifératif normal lorsque les cellules arrivent à confluence.

Des facteurs de transcription se liant à la séquence ICB ainsi que la séquence ICB elle-mme constituent donc des cibles moléculaires pour contrôler le taux d'expression de la topoisomérase IIa. En intervenant sur ces facteurs, il est possible d'envisager de contrôler 1'expression du gène de la topoisomérase IIa et par voie de conséquence la prolifération cellulaire.

La présente invention a pour objet la mise en évidence de nouveaux facteurs de transcription se liant la boite ICB impliquée dans le contrôle de la prolifération cellulaire.

Une technique récente appelée système « simple-hybride » qui permet d'isoler des clones ADNc codant pour des protéines de liaison à l'ADN spécifique de certaines séquences a été utilisée. Ce système présente un double avantage car il est capable non seulement de mettre à jour des interactions ADN-protéine in vivo chez la levure mais aussi de donner directement accès aux ADN complémentaires (ADNc) codant les protéines candidates ayant une activité de facteur transcription. Le système repose principalement sur la construction d'une souche de levure test selon le principe mis au point par Wang et Reed (1993). Cette souche de levure permet le criblage de banques d'ADNc en mettant en évidence l'interaction ADN-protéine in vivo par le biais de l'activation d'un gène rapporteur intégré au génome de la levure test.

La présente invention a donc pour objet un polypeptide isolé dénommé ICBP90 (inverted CCAAT box binding protein) de séquence d'acides aminés SEQ ID N°2. Cette séquence comprend :

a) un domaine « ubiquitine » comprenant la séquence d'acides aminés 1 à 75 de la séquence SEQ ID N°2 ; b) un domaine « doigt de zinc » de type C4HC3 comprenant la séquence d'acides aminés 310 à 366 de la séquenee SEQ ID N°2 et un domaine"doigt de zinc"de type C3HC4 comprenant la séquence d'acides aminés 724 à 763 de la séquence ID n° 2 ; c) un domaine « leucine zipper » putatif comprenant la séquence d'acides aminés 58 à 80 de la séquence SEQ ID N°2 ; d) deux domaines de localisation nucléaire potentiels comprenant les séquences d'acides aminés 581 à 600 et 648 à 670 de la séquence SEQ ID N°2 ; e) un site de phosphorylation par une tyrosine kinase comprenant la séquence d'acides aminés 452 à 458 de la séquence SEQ ID N°2 ; des sites de phosphorylation par une protéine kinase cAMP/cGMP dépendante comprenant les séquences d'acides aminés 246 à 249,295 à 298 et 648 à 651 de la séquence SEQ ID N°2 ; g) des sites de phosphorylation par une caséine kinase II comprenant la séquence d'acides aminés 23 à 26,57 à 60, 91 à 94,109 à 112,165 à 168,265 à 268,354 à 357 et 669 à 672 de la séquence SEQ ID N°2 ; h) des sites de phosphorylation par une protéine kinase C comprenant la séquence d'acides aminés 82 à 84,104 à 106,160 à 162,173 à 175,251 à 253,301 à 303,380 à 382,393 à 395,504 à 506,529 à 531,625 à 627 et 639 à 641 de la séquence SEQ ID N°2.

La présente invention porte également sur un polypeptide isolé caractérisé en ce qu'il comprend un polypeptide choisi parmi : a) un polypeptide de séquence SEQ ID N°2, SEQ ID N°4, SEQ ID N°6 ou SEQ ID N°8 ; b) un polypeptide variant de polypeptide de séquences d'acides aminés défini en a) ; c) un polypeptide homologue au polypeptide défini en a) ou b) et comportant au moins 80 % d'homologie, de préférence 90 % avec ledit polypeptide de a) ; d) un fragment d'au moins 5 acides aminés consécutifs d'un polypeptide défini en a), b) ou c) ; e) un fragment biologiquement actif d'un polypeptide défini en a), b) ou c).

Il doit tre compris que l'invention concerne les polypeptides obtenus par purification à partir de sources naturelles, ou bien obtenues par recombinaison génétique, ou encore par synthèse chimique et pouvant alors comporter des acides aminés non naturels.

Dans la présente description, on utilisera le terme polypeptide pour désigner également une protéine ou un peptide.

On entendra par polypeptide variant l'ensemble des polypeptides mutés pouvant exister naturellement, en particulier chez l'tre humain, et qui correspondent notamment à des troncatures, substitutions, délétions et/ou additions de résidus d'amino-acides. Les polypeptides homologues selon l'invention conserve au moins un domaine choisi parmi le domaine de liaison à l'ADN et/ou le domaine d'interaction avec une autre protéine.

Par polypeptide homologue, on entendra désigner les polypeptides présentant, par rapport au polypeptide naturel ICBP90, certaines modifications comme en particulier une délétion,

addition ou substitution d'au moins un acide aminé, une troncature, un allongement et/ou une fusion chimérique. Parmi les polypeptides homologues, on préfère ceux dont la séquence d'acides aminés présente au moins 80 % d'homologie, de préférence 90 %, de manière préférée 95 %, et de manière encore préférée 97 % d'homologie avec les séquences d'acides aminés des polypeptides selon l'invention. Dans le cas d'une substitution, un ou plusieurs acides aminés consécutifs ou non consécutifs, sont remplacés par des acides aminés « équivalents ». L'expression acide aminé « équivalent » vise ici à désigner tout acide aminé susceptible d'tre substitué à l'un des acides aminés de la structure de base sans cependant modifier les caractéristiques ou propriétés fonctionnelles essentielles, comme leurs activités biologiques, des polypeptides correspondants telles que l'induction in vivo d'anticorps capables de reconnaître le polypeptide dont la séquence d'acides aminés est comprise dans la séquence d'acides aminés SEQ ID N°2, ou l'un de ses fragments ci-dessus définis et notamment la séquence d'acides aminés SEQ ID N°4, SEQ ID N°6 et SEQ ID N°8. Ces acides aminés équivalents peuvent tre déterminés soit en s'appuyant sur leur homologie de structure avec les acides aminés auxquels ils se substituent, soit sur les résultats des essais d'activité biologique croisée auxquels les différents polypeptides sont susceptibles de donner lieu. A titre d'exemple, on mentionnera les possibilités de substitutions susceptibles d'tre effectuées sans qu'il en résulte une modification approfondie des activités biologiques des polypeptides modifiés correspondants, les remplacements, par exemple, de la leucine par la valine ou l'isoleucine, de l'acide aspartique par l'acide glutamique, de la glutamine par l'asparagine, de l'arginine par la lysine etc., les substitutions inverses étant naturellement envisageables dans les mmes conditions.

Par fragment biologiquement actif, on entendra désigner en particulier un fragment de séquence d'acides aminés de polypeptide selon l'invention présentant au moins une des caractéristiques ou propriétés fonctionnelles des polypeptides selon l'invention, notamment en ce que : (i) il est capable d'tre reconnu par un anticorps spécifique d'un polypeptide selon l'invention ; (ii) il présente au moins l'un des domaines ou régions tels que définis ci- après ; (iii) il est capable de se lier à 1'ADN et notamment aux boites CCAATT et/ou CCAAT inversée ; (iv) il est capable de moduler le taux d'expression du gène de la topoisomérase lia ; (v) il est capable de moduler la prolifération cellulaire.

Par fragment de polypeptide, on entend désigner un polypeptide comportant au minimun 5 acides aminés, de préférence 7 acides aminés, de manière préférée 10 et de manière encore préférée 15 acides aminés. Les fragments de polypeptide selon l'invention obtenus par clivage dudit polypeptide par une enzyme protéolytique, par un réactif chimique, ou encore en plaçant ledit polypeptide dans un environnement très acide font également partie de l'invention.

Le polypeptide selon l'invention peut également s'associer à d'autres polypeptides par des interactions protéine-protéine. On entend désigner par interactions protéine-protéine, des associations mettant directement en contact au moins deux protéines. Ainsi, le polypeptide de l'invention peut se dimériser pour former des homodimères ou des hétérodimères, ou s'associer sous la forme d'homomultimères ou d'hétéromultimères. Le polypeptide selon l'invention peut également interagir avec un autre polypeptide pour exercer son action ; ainsi, le polypeptide selon l'invention peut posséder, en plus de son domaine de liaison à l'ADN, un domaine d'action sur la transcription qui exerce son action via des

interactions protéine-protéine avec d'autres composants protéique de la machinerie transcriptionnelle. On entend désigner par composant protéique de la machinerie transcriptionnelle tous les facteurs de transcription nécessaires à la réalisation-et à la régulation de la réaction de transcription.

Le polypeptide selon l'invention est caractérisé en ce qu'il est capable de se lier à une séquence d'ADN et en ce qu'il est comporte au moins un domaine de fixation à 1'ADN sélectionné dans le groupe composé d'un domaine « doigt de zinc » (zinc-finger) et d'un domaine « leucine zipper » ; la séquence d'ADN sur laquelle se lie ledit polypeptide est une boite CCAAT, de préférence une une boite CCAAT inversée (inverted CCAAT box : ICB).

On entend désigner par liaison à une séquence d'ADN, une interaction spécifique entre le polypeptide de l'invention et une séquence d'ADN au moyen d'une série de liaisons faibles contractées entre les acides aminés de la protéine et les bases. Le polypeptide selon l'invention possède au moins un domaine de liaison à 1'ADN qui contient au moins un des motifs protéiques connus susceptibles d'interagir avec l'ADN, c'est-à-dire la structure en doigt de gant à laquelle est associée un atome de zinc ( « zinc- singer »), la structure hélice-tour-hélice, la structure hélice-boucle- hélice et la fermeture éclair à leucines (« leucine-zipper »).

Par motif en doigt de gant (« zinc-finger »), on entend désigner une séquence d'une vingtaine d'acides aminés ayant dans l'espace une forme de doigt de gant. Il en existe deux types : ceux qui contiennent quatre cystéines (C4) et ceux qui contiennent deux cystéines et deux histidines (C2H2). Ces acides aminés définissent la nature du doigt de gant et sont situés à sa base et un ion Zn++ est situé au centre du carré formé par ces quatre acides aminés. Le

polypeptide selon l'invention possède potentiellement deux motifs de type C4.

Par motif de type « leucine zipper M, on entend désigner des motifs appartenant à des facteurs de transcription dimérique qui sont soit des homodimères, soit des hétérodimeres. Le monomère est constitué d'une séquence à caractère basique qui interagit de manière spécifique avec l'ADN et d'un domaine hydrophobe en hélice a qui interagit avec le domaine homologue de l'autre chaîne.

Dans ce domaine se trouve une leucine tous les 7 aminoacides, c'est-à-dire à chaque tour d'hélice. Toutes ces leucines sont alignées et l'interaction se fait à leur niveau entre les deux monomères. Le polypeptide selon l'invention possède potentiellement un motif de type « leucine zipper ».

L'invention concerne également un polynucléotide isolé caractérisé en ce qu'il code pour un polypeptide de séquence SEQ ID N° 1 tel que défini précédemment. De manière préférée, le polynucléotide selon l'invention possède la séquence SEQ ID N° 1.

L'invention concerne également le polynucléotide isolé caractérisé en ce qu'il comprend un polynucléotide choisi parmi : a) un polynucléotide de séquence SEQ ID N° 1, SEQ ID N°3, SEQ ID N'5 ou SEQ ID N°7 ou dont la séquence est celle de 1'ARN correspondant à la séquence SEQ ID N° 1, SEQ ID N°3, SEQ ID N°5 ou SEQ ID N°7 ; b) un polynucléotide dont la séquence est complémentaire de la séquence d'un polynucléotide défini en a), c) un polynucléotide dont la séquence comporte au moins 80% d'homologie avec un polynucléotide défini en a) ou b), d) un polynucléotide hybridant dans des conditions de forte stringence avec une séquence de polynucléotide défini en a), b) ou c),

e) un fragment d'au moins 15 nucléotides consécutifs, de préférence 21 nucléotides consécutifs, et de manière préférée 30 nucléotides consécutifs d'un polynucléotide défini en a), b), c) ou d) à l'exception de l'EST humain AI 084 125, à l'exception de la séquence correspondant à la séquence SEQ ID N° 944 publiée le 5 août 1999 dans la demande de brevet WO 99 38972 et à l'exception des séquences SEQ ID N°9, N° 10 et N° 11 correspondant respectivement aux EST humains N° AI 083 773, N° AA 811 055, N° AA 488 755, N° AA 129 794 et N° AA 354 253 présentes dans les bases de données d'EST humains ( « human dbest).

Dans la présente description, on entendra désigner par polynucléotide, oligonucléotide, séquence de polynucléotide, séquence nucléotidique ou acide nucléique un fragment d'ADN, aussi bien un ADN double brin, un ADN simple brin que des produits de transcription desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isolés, ou de synthèse, comportant ou non des nucléotides non naturels, désignant un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment ou une région d'un acide nucléique.

Par polynucléotide de séquence complémentaire, on entend désigner tout ADN dont les nucléotides sont complémentaires de ceux de la SEQ ID N° 1, SEQ ID N°3, SEQ ID N°5, SEQ ID N°7 ou d'une partie de la SEQ ID N° 1, SEQ ID N°3, SEQ ID N°5, SEQ ID N°7 et dont l'orientation est inversée.

Par pourcentage d'homologie au sens de la présente invention, on entend un pourcentage d'identité entre les bases de deux polynucléotides, ce pourcentage étant purement statistique et les différences entre les deux polynucléotides étant réparties au

hasard et sur toute leur longueur. Selon l'invention, les polynucléotides de séquence nucléique homologue présentent un taux d'homologie d'au moins 80 %, de préférence 90 %, de manière préférée 95 %, de manière encore préférée 97 %.

Une hybridation dans des conditions de forte stringence signifie que les conditions de température et de force ionique sont choisies de telle manière qu'elles permettent le maintien de l'hybridation entre deux fragments d'ADN complémentaires. A titre illustratif, des conditions de forte stringence de l'étape d'hybridation aux fins de définir les fragments polynucléotidiques décrits ci-dessus, sont avantageusement les suivantes : L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation à 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond à une solution 0,15 M NaCl + 0,015 M citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhard's, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (i. e. : 42°C, pour une sonde de taille > 100 nucléotides) suivie de 2 lavages de 20 minutes à 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes à 20°C en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratiqué en 0,1 x SSC + 0,1 % SDS pendant 30 minutes à 60°C pour une sonde de taille > 100 nucléotides. Les conditions d'hybridation de forte stringence décrites ci-avant pour un polynucléotide de taille définie, seront adaptées par l'homme du métier pour des oligonucléotides de taille plus grande ou plus petite, selon l'enseignement de Sambrook et al., 1989.

Avantageusement, un fragment nucléotidique répondant à la définition précédente aura au moins 15 nucléotides consécutifs, de

préférence au moins 21 nucléotides, et encore plus préférentiellement au moins 30 nucléotides consécutifs de la séquence dont il est issu.

Par EST (« expressed sequence tag »), on entend désigner des séquences exprimées, caractérisées dans une banque d'ADN complémentaire (ADNc) et utilisées comme balise cartographique de 1'ADN gnomique.

Selon un mode de réalisation de l'invention, le polynucléotide selon l'invention se caractérise en ce qu'il est marqué directement ou indirectement par un composé radioactif ou un composé non radioactif. Utilisation d'un polynucléotide selon l'invention en tant qu'amorce pour l'amplification ou la polymérisation de séquences nucléiques ; l'invention porte également sur l'utilisation d'un polynucléotide selon l'invention en tant que sonde pour la détection de séquences nucléiques. Selon l'invention, les fragments de polynucléotides pouvant tre utilisés comme sonde ou comme amorce dans des procédés de détection, d'identification, de dosage ou d'amplification de séquence nucléique, présenteront une taille minimale de 9 bases, de préférence de 18 bases, et de manière plus préférée 36 bases. Enfin, l'invention porte sur l'utilisation d'un polynucléotide selon l'invention en tant que séquence d'acide nucléique sens ou antisens pour contrôler l'expression du produit protéique correspondant.

Les séquences de polynucléotides selon l'invention non marquées peuvent tre utilisées directement comme sonde, amorce ou oligonucléotide ; cependant les séquences utilisées sont généralement marquées pour obtenir des séquences utilisables pour de nombreuses applications. Le marquage des amorces, des sondes, des oligonucléotides selon l'invention est réalisé par des éléments radioactifs ou par des molécules non radioactives ; parmi

les isotopes radioactifs utilisés, on peut citer le 32p, le 33P, le 35S, le 3H ou le l25I. Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les agents luminescents tels que les agents radioluminescents, chémiluminescents, bioluminescents, fluorescents, phosphorescents.

Les polynucléotides selon l'invention peuvent ainsi tre utilisés comme amorce et/ou sonde dans des procédés mettant en oeuvre notamment la technique PCR (réaction en chaîne à la polymérase) (Erlich, 1989 ; Innis et al., 1990, et Rolfs et al., 1991).

Cette technique nécessite le choix de paires d'amorces oligonucléotidiques encadrant le fragment qui doit tre amplifie. On peut, par exemple, se référer à la technique décrite dans le brevet américain U. S. N° 4 683 202. Les fragments amplifiés peuvent tre identifiés, par exemple après une électrophorèse en gel d'agarose ou de polyacrylamide, ou après une technique chromatographique comme la filtration sur gel ou la chromatographie échangeuse d'ions. La spécificité de l'amplification peut tre contrôlée par hybridation moléculaire en utilisant comme sonde les séquences nucléotidiques de polynucléotides de l'invention, des plasmides contenant ces séquences ou leurs produits d'amplification. Les fragments nucléotidiques amplifiés peuvent tre utilisés comme réactifs dans des réactions d'hybridation afin de mettre en évidence la présence, dans un échantillon biologique, d'un acide nucléique cible de séquence complémentaire à celle desdits fragments nucléotidiques amplifiés.

L'invention vise également les fragments nucléotidiques susceptibles d'tre obtenus par amplification à l'aide d'amorces selon l'invention.

D'autres techniques d'amplification de l'acide nucléique cible peuvent tre avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like on entendra désigner toutes les méthodes mettant en oeuvre des reproductions directes ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les systèmes de marquage ont été amplifiés, ces techniques sont bien entendu connues, en général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque l'échantillon d'origine est un ARN il convient préalablement d'effectuer une transcription inverse. Il existe actuellement de très nombreux procédés permettant cette amplification, comme par exemple la technique SDA (Strand Displacement Amplification) ou technique d'amplification à déplacement de brin (Walker et al., 1992), la technique TAS (Transcription-based Amplification System) décrite par Kwoh et al. en 1989, la technique 3SR (Self-Sustained Sequence Replication) décrite par Guatelli et al. en 1990, la technique NASBA (Nucleic Acid Sequence Based Amplification) décrite par Kievitis et al. en 1991, la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) décrite par Landegren et al. en 1988 et perfectionnée par Barany et al. en 1991, qui emploie une ligase thermostable, la technique de RCR (Repair Chain Reaction) décrite par Segev en 1992, la technique CPR (Cycling Probe Reaction) décrite par Duck et al. en 1990, la technique d'amplification à la Q-béta-réplicase décrite par Miele et al. en 1983 et perfectionnée notamment par Chu et al. en 1986 et Lizardi et al. en 1988, puis par Burg et al. ainsi que par Stone et al. en 1996.

Dans le cas où le polynucléotide cible à détecter est un ARN, par exemple un ARNm, on utilisera avantageusement,

préalablement à la mise en oeuvre d'une réaction d'amplification à l'aide des amorces selon l'invention ou à la mise en oeuvre d'un procédé de détection à l'aide des sondes de l'invention, une enzyme de type transcriptase inverse afin d'obtenir un ADNc à partir de l'ARN contenu dans l'échantillon biologique. L'ADNc obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procédé d'amplification ou de détection selon l'invention.

Les sondes nucléotidiques selon l'invention hybrident spécifiquement avec une molécule d'ADN ou d'ARN de polynucléotide selon l'invention, plus particulièrement avec la séquence SEQ ID N° 1 codant pour le polypeptide ICBP90, dans des conditions d'hybridation de forte stringence telles que données sous forme d'exemple précédemment.

La technique d'hybridation peut tre réalisée de manières diverses (Matthews et al., 1988). La méthode la plus générale consiste à immobiliser l'acide nucléique extrait des cellules de différents tissus ou de cellules en culture sur un support (tel que la nitrocellulose, le nylon, le polystyrène) et à incuber, dans des conditions bien définies, l'acide nucléique cible immobilisé avec la sonde. Après l'hybridation, l'excès de sonde est éliminé et les molécules hybrides formées sont détectées par la méthode appropriée (mesure de la radioactivité, de la fluorescence ou de l'activité enzymatique liée à la sonde).

Selon un autre mode de mise en oeuvre des sondes nucléiques selon l'invention, ces dernières peuvent tre utilisées comme sonde de capture. Dans ce cas, une sonde, dite « sonde de capture », est immobilisée sur un support et sert à capturer par hybridation spécifique l'acide nucléique cible obtenu à partir de l'échantillon biologique à tester et l'acide nucléique cible est ensuite

détecté grâce à une seconde sonde, dite < sonde de détection », marquée par un élément facilement détectable.

Dans un mode préféré de réalisation, l'invention comprend l'utilisation d'un oligonucléotide sens ou antisens pour contrôler 1'expression du produit protéique correspondant. Parmi les fragments d'acides nucléiques intéressants, il faut citer en particulier les oligonucléotides anti-sens, c'est-à-dire dont la structure assure, par hybridation avec la séquence cible, une inhibition de l'expression du produit correspondant. Il faut également citer les oligonucléotides sens qui, par interaction avec des protéines impliquées dans la régulation de 1'expression du produit correspondant, induiront soit une inhibition, soit une activation de cette expression. Les oligonucléotides selon l'invention présentent une taille minimale de 9 bases, de préférence de 18 bases, et de manière plus préférée 36 bases.

L'invention concerne un vecteur recombinant de clonage d'un polynucléotide selon l'invention et/ou d'expression d'un polypeptide selon l'invention caractérisé en ce qu'il contient un polynucléotide selon l'invention tel que précédemment décrit. Le vecteur selon l'invention est caractérisé en ce qu'il comporte les éléments permettant l'expression éventuellement la sécrétion desdites séquences dans une cellule hôte. Ces vecteurs sont utiles pour transformer des cellules hôtes afin de cloner ou d'exprimer les séquences nucléotidiques de l'invention. Des vecteurs particuliers sont par exemple des vecteurs d'origine virale ou plasmidique.

Parmi ces vecteurs, on préfère ceux de la série pGEX (Pharmacia) pour 1'expression dans les bactéries ou pSG5 (Stratagene, La Jolla, CA USA) pour 1'expression en système eucaryote.

Selon un mode particulier de réalisation, le vecteur selon l'invention comporte des éléments de contrôle de l'expression des

polypeptides ; ces éléments de contrôle sont choisis de préférence parmi (i) la séquence promotrice du gène ICBP90 selon l'invention qui correspond à la séquence SEQ ID N°12 ; (ii) un polynucléotide dont la séquence est complémentaire à la séquence SEQ ID N° 12 ; (iii) un polynucléotide dont la séquence comporte au moins 80% d'identité avec un polynucléotide défini en (i) ou (ii) ; (iv) un polynucléotide hybridant dans des conditions de forte stringence avec la séquence de polynucléotide définie en (i), (ii), (iii).

Les outils informatiques à la disposition de l'homme du métier lui permettent aisément d'identifier les boites régulatrices promotrices nécessaires et suffisantes au contrôle de 1'expression génique, notamment les boites TATA, CCAAT, GC, ainsi que les séquences régulatrices stimulatrices (« enhancer ») ou inhibitrices (« silencers ») qui contrôlent en CIS l'expression des gènes selon l'invention.

Il est également dans l'étendue de l'invention d'utiliser les éléments ci-dessus définis et choisis parmi la séquence SEQ ID N° 12 pour contrôler 1'expression de polypeptides hétérologues autres que ceux de l'invention et notamment pour diriger 1'expression de polypeptides hétérologues dans les types cellulaires dans lesquels les polypeptides selon l'invention s'expriment normalement.

L'invention comprend en outre les cellules hôtes, notamment les cellules eucaryotes et procaryotes, caractérisées en ce qu'elles sont transformées par les vecteurs selon l'invention. De préférence, les cellules hôtes sont transformées dans des conditions permettant l'expression d'un polypeptide recombinant selon l'invention. L'hôte cellulaire peut tre choisi parmi les cellules bactériennes (Olins et Lee, 1993), mais également les cellules de levure (Buckholz, 1993), de mme que les cellules animales, en particulier les cultures de cellules de mammifères (Edwards et

Aruffo, 1993), mais également les cellules d'insectes dans lesquelles on peut utiliser des procédés mettant en oeuvre des baculovirus par exemple (Luckow, 1993). Ces cellules peuvent tre obtenues par l'introduction dans des cellules hôtes d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus, puis la mise en culture desdites cellules dans des conditions permettant la réplication et/ou l'expression de la séquence nucléotidique transfectée.

L'invention concerne également une méthode de préparation d'un polypeptide caractérisé en ce qu'il met en oeuvre un vecteur selon l'invention. Plus particulièrement, l'invention porte sur une méthode de préparation d'un polypeptide recombinant caractérisé en ce que l'on cultive des cellules transformées selon l'invention dans des conditions permettant l'expression dudit polypeptide recombinant et que l'on récupère ledit polypeptide recombinant.

Le polypeptide selon l'invention est susceptible d'tre obtenu selon un procédé de l'invention et selon les techniques de production de polypeptides recombinants connues de l'homme du métier. La présente invention concerne donc le polypeptide recombinant susceptible d'tre obtenu par la méthode ci-dessus présentée. Dans ce cas, la séquence d'acide nucléique utilisée est placée sous le contrôle de signaux permettant son expression dans un hôte cellulaire. Un système efficace de production d'un polypeptide recombinant nécessite de disposer d'un vecteur, par exemple d'origine plasmidique ou virale, et d'une cellule hôte compatible. Le vecteur doit comporter un promoteur, des signaux d'initiation et de terminaison de la traduction, ainsi que des régions appropriées de régulation de la transcription. Il doit pouvoir tre maintenu de façon stable dans la cellule et peut éventuellement posséder des signaux particuliers spécifiant la sécrétion du

polypeptide traduit. Ces différents signaux de contrôle sont choisis en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences d'acide nucléique selon l'invention peuvent tre insérées dans des vecteurs à réplication autonome au sein de l'hôte choisi,.-ou des vecteurs intégratifs de l'hôte choisi. De tels vecteurs seront préparés selon les méthodes couramment utilisées par l'homme du métier, et les clones en résultant peuvent tre introduits dans un hôte approprié par des méthodes standards telles par exemple la transfection par précipitation au phosphate de calcium, la lipofection, l'électroporation, le choc thermique.

Les polypeptides recombinants obtenus comme indiqué ci- dessus, peuvent aussi bien se présenter sous forme glycosylée que non glycosylée et peuvent présenter ou non la structure tertiaire naturelle.

Les polypeptides obtenus par synthèse chimique et pouvant comporter des acides aminés non naturels correspondant auxdits polypeptides recombinants, sont également compris dans l'invention. Les peptides selon l'invention peuvent également tre préparés par les techniques classiques, dans le domaine de la synthèse des peptides. Cette synthèse peut tre réalisée en solution homogène ou en phase solide.

Les procédés de purification de polypeptide recombinant utilisés sont connus de l'homme du métier. Le polypeptide recombinant peut tre purifié à partir de lysats et extraits cellulaires, du surnageant du milieu de culture, par des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immuno-affinité à l'aide d'anticorps mono ou polyclonaux spécifiques, etc.

Une variante préférée consiste à produire un polypeptide recombinant fusionné à une protéine « porteuse » (protéine chimère). L'avantage de ce système est qu'il permet une stabilisation et une diminution de la protéolyse du produit recombinant, une augmentation de la solubilité au cours de la renaturation in vitro et/ou une simplification de la purification lorsque le partenaire de fusion possède une affinité pour un ligand spécifique.

L'invention concerne également un anticorps monoclonal ou polyclonal et ses fragments, caractérisés en ce qu'ils lient spécifiquement un polypeptide selon l'invention. Les anticorps chimériques, les anticorps humanisés et les anticorps simple chaîne font également partie de l'invention. Les fragments d'anticorps selon l'invention sont de préférence des fragments Fab ou F (ab') 2.

Les polypeptides selon l'invention permettent de préparer des anticorps monoclonaux ou polyclonaux. Les anticorps monoclonaux pourront avantageusement tre préparés à partir d'hybridomes selon la technique décrite par Kohler et Milstein en 1975. Les inventeurs ont employé cette technique pour obtenir un hybridome produisant un nouvel anticorps monoclonal hautement spécifique d'un épitope de la protéine ICBP90.

Les anticorps polyclonaux pourront tre préparés, par exemple par immunisation d'un animal, en particulier une souris, avec un polypeptide selon l'invention associé à un adjuvant de la réponse immunitaire, puis purification des anticorps spécifiques contenus dans le sérum des animaux immunisés sur une colonne d'affinité sur laquelle a préalablement été fixé le polypeptide ayant servi d'antigène. Les anticorps polyclonaux selon l'invention peuvent aussi tre préparés par purification sur une colonne d'affinité, sur

laquelle a préalablement été immobilisé un polypeptide selon l'invention.

L'invention porte également sur un anticorps monoclonal spécifique de la protéine ICBP90 humaine et capable-dlinhiber l'interaction entre ICBP90 et la séquence d'ADN sur laquelle se lie spécifiquement la protéine ICBP90. Selon un autre mode de réalisation, l'anticorps monoclonal selon l'invention et spécifique de la protéine ICBP90 humaine est capable d'inhiber l'interaction entre ICBP90 et les protéines avec lesquelles ICBP90 interagit, lesdites protéines étant de préférence ICBP90 elle-mme ou des protéines du complexe transcriptionnel. Par protéines du complexe transcriptionnel, on entend désigner toutes les protéines intervenant dans la réaction de la transcription que se soit l'initiation, l'élongation ou la terminaison de la transcription.

Les anticorps de l'invention pourront également tre marqués de la mme manière que décrit précédemment pour les sondes nucléiques de l'invention et de manière préférée avec un marquage de type enzymatique, fluorescent ou radioactif.

Par ailleurs, outre leur utilisation pour la purification des polypeptides, les anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent également tre utilisés pour la détection de ces polypeptides dans un échantillon biologique.

Ils constituent ainsi un moyen d'analyse de 1'expression de polypeptide selon l'invention, par exemple par immunofluorescence, marquage à l'or, immunoconjugués enzymatiques.

Plus généralement, les anticorps de l'invention peuvent tre avantageusement mis en oeuvre dans toute situation où 1'expression d'un polypeptide selon l'invention doit tre observée, et plus particulièrement en immunocytochimie, en

immunohistochimie ou dans des expériences de « western blotting ».

Ainsi, l'invention concerne une méthode de détection et/ou de dosage d'un polypeptide selon l'invention, dans un échantillon biologique, caractérisé en ce qu'il comprend les étapes suivantes de mise en contact de l'échantillon biologique avec des anticorps selon l'invention puis de mise en évidence du complexe antigène- anticorps formé. Cette méthode peut tre utilisée en immunocytochimie pour la localisation cellulaire du polypeptide selon l'invention et en immunohistochimie pour évaluer la prolifération cellulaire.

Entre également dans le cadre de l'invention, un nécessaire pour la détection et/ou le dosage d'un polypeptide selon l'invention dans un échantillon biologique, caractérisé en ce qu'il comprend les éléments suivants : (i) un anticorps monoclonal ou polyclonal tel que décrit précédemment ; (ii) le cas échéant, les réactifs pour la constitution du milieu propice à la réaction immunologique ; (iii) les réactifs permettant la détection des complexes antigène-anticorps produits par la réaction immunologique. Ce kit est notamment utile à la réalisation d'expériences de Western Blotting ; celles-ci permettent d'étudier la régulation de 1'expression du polypeptide selon l'invention à partir de tissus ou de cellules. Ce kit est également utile aux expériences d'immunoprécipitation pour mettre en évidence notamment les protéines interagissant avec le polypeptide selon l'invention.

Toute procédure classique peut tre mise en oeuvre pour réaliser une telle détection et/ou dosage. A titre d'exemple, une méthode préférée met en jeu des processus immunoenzymatiques selon la technique ELISA, par immunofluorescence, ou radio- immunologique (RIA) ou équivalent.

L'invention comprend également une méthode de détection et/ou de dosage d'acide nucléique selon l'invention, dans un échantillon biologique, caractérisé en ce qu'il comporte les étapes suivantes : (i) d'isolement de 1'ADN à partir de l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARN de l'échantillon biologique ; (ii) d'amplification spécifique de l'ADN codant pour le polypeptide selon l'invention à l'aide d'amorces ; (iii) d'analyse des produits d'amplification.

L'invention comprend en outre un nécessaire pour la détection et/ou le dosage d'un acide nucléique selon l'invention, dans un échantillon biologique, caractérisé en ce qu'il comprend les éléments suivants : (i) un couple d'amorces nucléiques selon l'invention, (ii) les réactifs nécessaires pour effectuer une réaction d'amplification d'ADN, et éventuellement (iii) un composant permettant de vérifier la séquence du fragment amplifié, plus particulièrement une sonde selon l'invention.

L'invention comprend aussi une méthode de détection et/ou de dosage d'acide nucléique selon l'invention, dans un échantillon biologique, caractérisé en ce qu'il comporte les étapes suivantes : (i) de mise en contact d'une sonde selon l'invention avec un échantillon biologique ; (ii) de détection et/ou de dosage de 1'hybride formé entre ladite sonde et l'ADN de l'échantillon biologique.

L'invention comprend également un nécessaire pour la détection et/ou le dosage d'acide nucléique selon l'invention, dans un échantillon biologique, caractérisé en ce qu'il comprend les éléments suivants : (i) une sonde selon l'invention, (ii) les réactifs nécessaires à la mise en oeuvre d'une réaction d'hybridation, et le cas échéant, (iii) un couple d'amorces selon l'invention, ainsi que les réactifs nécessaires à une réaction d'amplification de l'ADN.

L'invention concerne particulièrement les procédés selon l'invention et décrits ci-dessus, pour la détection et le diagnostic de prolifération cellulaire, et plus particulièrement de prolifération cellulaire d'origine cancéreuse.

L'invention concerne également une méthode de criblage de ligands susceptibles d'affecter l'activité transcriptionnelle d'un gène dont le promoteur comporte des boites CCAAT et/ou CCAAT inversées susceptibles de lier un polypeptide selon l'invention, ladite méthode étant caractérisée en ce qu'elle comporte les étapes suivantes de mise en contact dudit polypeptide et d'un ou plusieurs ligand (s) potentiel (s) en présence de réactifs nécessaires à la mise en oeuvre d'une réaction de transcription ou de détection et/ou de mesure de l'activité transcriptionnelle. C'est également un des objets de l'invention de fournir un kit ou un nécessaire pour le criblage de ligands susceptibles d'affecter l'activité transcriptionnelle d'un gène dont le promoteur comporte des boites CCAAT et/ou CCAAT inversées susceptibles de lier un polypeptide selon l'invention caractérisé en ce qu'il comprend les éléments suivants : (i) un polypeptide selon l'invention ; (ii) un ligand ; (iii) les réactifs nécessaires à la mise en oeuvre d'une réaction de transcription.

Le polypeptide ICBP90 selon l'invention présente une fonction de récepteur nucléaire. Par récepteur nucléaire, on entend désigner un polypeptide qui possède les propriétés essentielles des récepteurs nucléaires d'hormones. Cette superfamille de gène contient entre autres les récepteurs nucléaires à l'acide rétinoique (RAR, RXR,...), les récepteurs nucléaires aux hormones stéroïdes (glucocorticoïdes, minéralocorticoldes, progestérone, androgène, oestrogène), et les récepteurs nucléaires aux hormones thyroïdiennes (hormone T3). C'est donc également un des objets de

la présente invention de fournir un procédé de criblage de ligand susceptible d'affecter la fonction « récepteur nucléaire » du polypeptide selon l'invention. Un tel procédé comporte les étapes de : a) mise en contact du polypeptide de l'invention et d'un ou plusieurs ligands potentiels en présence de réactifs nécessaires ; b) détection et/ou mesure de l'activité transcriptionnelle d'un gène dont le promoteur comporte des séquences nucléotidiques sur lesquelles sont susceptibles de se lier le polypeptide de l'invention. De préférence, lesdites séquences nucléotidiques sont des boites CCAAT et/ou CCAAT inversées (ICB).

Les techniques de détection et/ou de mesure de l'activité transcriptionnelle sont connues de l'homme du métier. Il convient notamment de citer les technologies de Northern Blotting et de RT- PCR qui peuvent tre mises en oeuvre avec les polynucléotides de l'invention utilisés respectivement comme sonde ou comme amorce.

Par ligand, on entend définir tous les composés susceptibles d'interagir avec le polypeptide selon l'invention pour former un complexe susceptible d'affecter l'activité transcriptionnelle, c'est-à- dire d'augmenter, de diminuer, de moduler ou d'annuler la transcription d'un gène sous le contrôle d'un promoteur contenant une séquence d'ADN à laquelle se lie le polypeptide de l'invention.

Un tel ligand est donc susceptible d'avoir une activité agoniste ou antagoniste. Parmi les ligands selon l'invention, il convient de citer les molécules biologiques interagissant avec le polypeptide selon l'invention, ainsi que tous les composés chimiques de synthèse. Parmi les ligands, il convient également de citer l'anticorps selon l'invention, ainsi qu'un oligonucléotide

présentant une identité de séquence avec la séquence nucléotidique CCAAT et/ou CCAAT inversée ; un tel ligand est susceptible de constituer un inhibiteur du polypeptide selon l'invention.

L'invention porte également sur le ligand susceptible d'tre obtenu par les procédés de criblage précédents.

On entend définir également par ligand tout composé susceptible de se lier à la séquence d'ADN de liaison du polypeptide selon l'invention. Un tel ligand constitue un inhibiteur compétitif du polypeptide selon l'invention pour la liaison à la séquence d'ADN.

De préférence, l'échantillon biologique selon l'invention dans lequel est réalisé la détection et le dosage est constitué par un fluide corporel, par exemple un sérum humain ou animal, du sang, de la salive, du mucus pulmonaire, ou par des biopsies. Entre également dans la définition d'un échantillon biologique de l'invention le liquide biologique résultant d'un lavage broncho- alvéolaire obtenu également lors des analyses diagnostiques des cancers des voies aériennes profondes.

Selon un autre aspect, l'invention concerne un composé caractérisé en ce qu'il est choisi parmi un anticorps, un polypeptide, un ligand, un polynucléotide, un oligonucléotide ou un vecteur selon l'invention à titre de médicament et notamment en tant que principes actifs de médicament ; ces composés seront préférentiellement sous forme soluble, associés à un véhicule pharmaceutiquement acceptable. Par véhicule pharmaceutiquement acceptable, on entend désigner tout type de véhicule employé habituellement dans la préparation de compositions injectables, c'est-à-dire un diluant, un agent de suspension tel une solution saline isotonique ou tamponnée. De préférence, ces composés seront administrés par voie systémique,

en particulier par voie intraveineuse, par voie intramusculaire, intradermique ou par voie orale. Leurs modes d'administration, posologies et formes galéniques optimaux peuvent tre déterminés selon les critères généralement pris en compte dans l'établissement d'un traitement adapté à un patient comme par exemple l'âge ou le poids corporel du patient, la gravité de son état général, la tolérance au traitement et les effets secondaires constatés, etc.

Selon un autre aspect, l'invention concerne un composé caractérisé en ce qu'il est choisi parmi un polypeptide, un polynucléotide, un polynucléotide antisens, un anticorps, un vecteur, une cellule, un ligand selon l'invention à titre de médicament et notamment en tant que principes actifs de médicament ; ces composés seront préférentiellement sous forme soluble, associés à un véhicule pharmaceutiquement acceptable.

Par véhicule pharmaceutiquement acceptable, on entend désigner tout type de véhicule employé habituellement dans la préparation de compositions injectables, c'est-à-dire un diluant, un agent de suspension tel une solution saline isotonique ou tamponnée. De préférence, ces composés seront administrés par voie systémique, en particulier par voie intraveineuse, par voie intramusculaire, intradermique ou par voie orale. Leurs modes d'administration, posologies et formes galéniques optimaux peuvent tre déterminés selon les critères généralement pris en compte dans l'établissement d'un traitement adapté à un patient comme par exemple l'âge ou le poids corporel du patient, la gravité de son état général, la tolérance au traitement et les effets secondaires constatés, etc. Quand l'agent est un polypeptide, un antagoniste, un ligand, un polynucléotide, par exemple une composition anti-sens, un vecteur, on peut l'introduire dans des tissus ou des cellules hôtes par un certain nombre de façons, incluant l'infection virale, la micro-injection ou

la fusion de vésicules. On peut également utiliser l'injection par jet pour une administration intramusculaire comme décrit par Furth et al. (1992). On peut déposer le polynucléotide sur des microparticules d'or, et le délivrer par voie intradermique-à l'aide d'un dispositif de bombardement de particules, ou un « pistolet à gène N comme décrit dans la littérature (voir par exemple Tang et al.

(1992) où les microprojectiles d'or sont revtues avec le polynucléotide de l'invention, de préférence le polynucléotide antisens de l'invention, puis bombardée dans les cellules de peau.

Le composé selon l'invention est utilisé pour la préparation d'un médicament destiné à moduler, à augmenter ou à diminuer la prolifération cellulaire.

L'invention porte également sur une composition pharmaceutique pour le traitement préventif et curatif du cancer caractérisée en ce qu'elle contient une quantité thérapeutiquement efficace d'un composé selon l'invention et un véhicule pharmaceutiquement acceptable. Selon un mode préféré de réalisation, la composition pharmaceutique est caractérisée en ce qu'elle contient un anticorps selon l'invention en tant qu'agent de ciblage conjugué à au moins un agent sélectionné parmi le groupe des agents antiprolifératifs, antinéoplastiques ou cytotoxiques. Ces agents sont des radioisotopes ou des entités non isotopiques. La conjugaison de l'anticorps de la présente invention à un agent antiprolifératif, antinéoplastique ou cytotoxique peut tre utilisé pour arrter le développement des cancers et pour induire une régression et/ou une élimination de la masse tumorale. De préférence, l'anticorps ou le fragment d'anticorps ainsi conjugué est introduit dans le patient atteint de cancer et délivré aux sites tumoraux par voie orale ou parentérale dans un liquide transporteur pharmaceutiquement acceptable tel qu'une solution

de sel physiologique. Alternativement, une solution ou une suspension d'anticorps ou de fragment d'anticorps conjugué à un agent peut tre perfusée directement dans le tissu épithélial malin, cette méthode étant utilisée de préférence dans le cas où leS cancer n'est pas métastasé.

Les radioisotopes préférés conjugués aux anticorps monoclonaux employés pour la thérapie sont des radioisotopes émetteurs de rayons gamma et de préférence l'Iode'3', l'Yttrium90, 1'Or199, le Palladium'00, le Cuivre67, le Bismuth2'7 et l'Antimoine2l'.

Les radioisotopes émetteurs de rayons beta et alpha peuvent également tre utilisés pour la thérapie. Les entités non isotopiques conjuguées aux anticorps monoclonaux employés pour la thérapie sont multiples et variés ; on peut citer : (i) les antimétabolites telles les agents anti-folate, le méthotrexate, (ii) les analogues des purines et des pyrimidines (mercaptopurine, fluorouracile, 5-azacytidine), (iii) les antibiotiques, (iv) les lectines (ricine, abrine) et (iv) les toxines bactériennes (toxine diphtérique).

L'anticorps selon l'invention peut également tre utilisé en tant qu'agent de ciblage pour cibler des cellules cytotoxiques telles les cellules T humaines, les monocytes ou les cellules NK sur le lieu de la tumeur métastasée ou non. Les cellules cytotoxiques peuvent tre attachées à l'anticorps via le récepteur Fc situé à la surface de ces cellules ou via un anticorps intermédiaire présentant une double spécificité par exemple ; de tels anticorps bispécifiques pour le ciblage des cellules cancéreuses peuvent tre produits en fusionnant une cellule immunitaire produisant l'anticorps de la présente invention ou l'hydridome de la présente invention avec une cellule produisant un anticorps dirigé contre la cellule cytotoxique à cibler. Des anticorps bispécifiques peuvent également tre produits par couplage chimique de deux anticorps ayant la

spécificité désirée. L'anticorps selon l'invention permet également de cibler des véhicules de délivrance d'agents antiprolifératifs, antinéoplastiques ou cytotoxiques sur le lieu de la tumeur métastasée ou non. Par véhicules de délivrance on entend désigner les liposomes et les particules virales. Dans certains cas, on pourra prévoir des éléments de ciblage assurant une expression spécifique de certains tissus ou cellules de façon à pouvoir limiter les zones d'expression des polypeptides selon l'invention.

L'invention concerne également un produit comprenant au moins un composé selon l'invention et au moins un agent anticancéreux comme produit de combinaison pour une utilisation simultanée, séparée ou étalée dans le temps en thérapie anti- cancéreuse.

Enfin, l'invention concerne une composition pour la détection, la localisation et l'imagerie des cancers, comprenant un anticorps selon l'invention, tel que l'anticorps est marqué directement ou indirectement avec un marqueur générateur de signal sélectionné parmi les isotopes radioactifs et les entités non isotopiques tels que définis précédemment. L'invention a également pour objet une méthode de détection, de localisation et d'imagerie du cancer, comprenant (i) les étapes d'injection parentérale chez un tre humain d'une composition selon l'invention ; (ii) l'accumulation après un temps suffisant au niveau des cellules cancéreuses de l'anticorps marqué puis pénétration de l'anticorps marqué à l'interieur desdites cellules, sans que ledit anticorps ne se lie de manière substantielle aux cellules normales ; et (iii) la détection du signal au moyen d'un détecteur de signal ; et (iv) la conversion du signal détecté en une image des cellules cancéreuses.

D'autres caractéristiques et avantages de l'invention apparaissent dans la suite de la description avec les exemples représentés ci-après. Dans ces exemples on se référera aux figures suivantes.

Figure 1 : Expression de la protéine ICBP90 dans les cellules HeLa (cellules tumorales) et dans les fibroblastes pulmonaires humains en culture primaire (cellules non tumorales).

La détection de la protéine endogène ICBP90 a été réalisée sur des extraits totaux de protéines de cellules HeLa à confluence (piste 1) ou en prolifération (piste 2) et sur des extraits totaux de protéines de fibroblastes pulmonaires humains en culture primaire à confluence (piste 3) ou en prolifération (piste 4). Après migration sur gel de polyacrylamide 8% en présence de SDS, les protéines sont transférées sur membrane de nitrocellulose par électrotransfert. La révélation est réalisée à l'aide de 1'anticorps 1RC1C-10 dilué au 1/4000 (concentration initiale 2 mg/ml) et d'un anticorps secondaire couplé à la phosphatase alcaline et dirigé contre les chaines lourdes d'anticorps de souris. Dans les pistes correspondant aux extraits de cellules HeLa, on observe une bande majeure à 97 kDa ; pour les cellules HeLa en prolifération, des bandes supplémentaires de tailles inférieures à 97 kDa apparaissent (piste 2). Dans les fibroblastes pulmonaires humains à confluence, la protéine endogène n'est pas exprimée (piste 3) et apparaît lorsque les cellules se mettent à proliférer (piste 4). Ces observations suggèrent que la protéine endogène ICBP90 est un marqueur de prolifération cellulaire pour des cellules normales (fibroblastes) tandis que pour les cellules tumorales elle serait un marqueur quelque soit le stade cellulaire.

Figure 2 : Immunoprécipitation de la protéine endogène L'immunoprécipitation est réalisée sur des extraits protéiques totaux de cellules MOLT-4. L'anticorps 1RC1C-10 est fixé sur des billes de protéine G sépharose, puis mis en contact avec les extraits protéiques pendant 2 heures à température ambiante. Après lavage les complexes billes/lRClC-10/protéine sont précipités par centrifugation et analysés par migration sur gel de polyacrymalide 8% en présence de SDS, puis transfert sur membrane de nitrocellulose et révélation comme indiqué dans la figure 1. On observe une bande unique de 97 kDa, ainsi qu'une bande de 45 kDa qui correspond à la chaine lourde de 1 RC 1 C-10.

Figure 3 : Localisation nucléaire de la protéine endogène Nous avons utilisé des cellules HeLa pour examiner 1'expression endogène de la protéine ICBP90 in situ à l'aide de l'anticorps 1RClC-10 et d'un anticorps secondaire antisouris couplé au fluorochrome CY3. Le marquage est localisé exclusivement dans le noyau. Le nucléole et le cytoplasme ne sont pas marqués.

Figure 4 : Expression de 1'ICBP59 endogène dans les cellules en prolifération Nous avons observé la protéine endogène sur des coupes en paraffine d'appendice humain. Après déparaffinage et prétraitement par chauffage en tampon acide (démasquage des sites antigéniques), les coupes sont incubées pendant 16 heures avec l'anticorps 1RC1C-10 dilué au 1/10000 (concentration initiale de 2 mg/ml). La révélation se fait par mise en contact avec un anticorps secondaire biotinyle, puis incubation avec le complexe streptavidine-peroxydase. Une contre coloration des noyaux à

l'hématoxyline de Harris est également réalisée. Le marquage par 1RC1C-10 est localisé essentiellement dans des zones de prolifération cellulaire. Les cellules marquées se trouvent dans les cryptes glandulaires (CG) ainsi que dans les zones germinatives (ger).

Figure 5 : Expression de ICBP-59 dans divers tissus humains Nous avons évalué le niveau d'expression de l'ARNm correspondant à ICBP59 sur un dot blot d'ARN comportant 50 tissus humains différents. Le blot a été hybride pendant 16 heures à 68° C avec une sonde d'ADNc radioactive (32P) de 679 pb dans une solution d'hybridation ExpressHyb (Clontech). Après lavages, on réalise une révélation par autoradiographie (exposition une semaine à 80°C). Les tissus présentant le plus haut niveau d'expression sont le thymus adulte et foetal, ainsi que la moelle osseuse adulte et le foie foetal.

Figure 6 : Séquence nucléotidique de ICBP90 L'ADNc codant pour ICBP90 comporte 2379 pb. Les portions de séquence indiquées en gras sont celles qui n'apparaissent pas dans les bases de données d'EST humains (human dbest). Les autres parties de la séquence existent dans diverses EST : de 1 à 325 : EST n° AI083773. de 367 à 865 : EST n° AA811055. de 940 à 1857 : EST n° AA488755, EST n° AA 129794 et EST n° AA354253.

Figure 7 : Séquence protéique de ICBP90 La séquence en acides aminés de ICBP90 est déduite par traduction de la séquence nucléotidique de la figure 6. ICBP90

comporte 793 résidus et présente un poids moléculaire théorique de 89,758 kDa. Le pKi est de 7,7. Les acides aminés indiqués en gras correspondent à ICBP-59.

Figure 8 : Détection de l'ICBP90 dans les sera de patients ayant des marqueurs sériques élevés de tumeurs solides.

Un volume de 2A1 de sérum de chaque patient est dilué dans 1 ml de tampon PBS (Phosphate Buffer Saline 1X) contenant 0,1% de tween 20 suivi de dilutions croissantes réalisées dans le mme tampon comme indiqué dans la figure. Un échantillon de 0,5 ml de chaque dilution est filtré sur la membrane de nitrocellulose à l'aide d'un appareil « Slot Blot BioRad ». La membrane est bloquée en présence de tampon PBS (contenant 0,1% de tween 20 et 5% de lait) pendant 1 heure à température ambiante. La protéine ICBP90 est révélée à l'aide de l'anticorps lRC-lC10 (lng/ml) et de l'anticorps secondaire (anti-souris couplé à la peroxydase dilué au 1/5000). Les bandes sont révélées par chimiluminescence par exposition pendant 10 secondes d'un film X-MAT (Kodak).

Figure 9 : Organisation structurale du gène ICBP90.

A. Des exons représentés par des boites : les boites grises représentent des exons codants ; des boites blanches représentent des exons non-codants. La taille des exons est indiquée en pb dans chaque boite, et les noms des exons sont identiques au-dessus des boites. Les introns sont mentionnés de manière schématique par des lignes fines et leur taille approximative est indiquée en pb. Un site putatif de démarrage de la transcription et un signal consensus de polyadénylation sont indiqués. L'ATG est le codon de début de traduction et TGA le codon d'arrt de la traduction.

B. Séquence de la région 5'flanquante du gène ICBP90 (Seq ID ? 12) (Numéro d'accession Genbank N° AF 220 226 déposée le 30 décembre 1999). Les exons sont en majuscules et les introns en minuscules. Le codon de début ATG est en majuscules gras, les boîtes riches en GC (GC) et les boites CCAAT (CB) sont représentées en minuscules gras.

Figure 10 : Analyse du promoteur d'ICBP90 Les séquences du promoteur d'ICBP90 ont été fusionnées à la séquence du gène « reporter » CAT dans le vecteur pBLCAT2 qui a ensuite été transfecté dans les cellules COS-1.

Une représentation schématique de ces constructions est représentée sur la gauche, avec le nombre se référant aux nucléotides en amont du codon d'initiation. Les activités CAT relatives des extraits cellulaires correspondant à l'induction de l'activité du promoteur TK minimal sont exprimées en pourcentage (à partir de trois expériences de transfection indépendantes) et sont indiquées sur la droite.

Figure 11 : Analyse par Northern Blotting et Western Blotting de l'expression d'ICBP90.

A. L'hybridation Northern a été effectuée sur une membrane de Northern Blotting dont les dépôts d'ARN proviennent de lignées cellulaires cancéreuses de différents organes. Une sonde spécifique d'ICBP90, synthétisée par PCR, et marquée à la digoxigénine, a été utilisée pour la détection des ARNm d'ICBP90. Les tailles des ARNm sont mentionnées sur la droite de la ligne 7.

Les lignes 1 à 7 contiennent des ARN provenant respectivement de la lignée leucémique promyélocytaire HL-60, de Hela 53, de cellules K562 de leucémie myélogéne chronique, de

cellules de leucémie lymphoplastique MOLT-4, de cellules Raji du lymphome de Burkitt, de cellules SW480 d'adénocarcinome colorectal, et de cellules A549 de carcinome pulmonaire.

L'histogramme montre les taux d'expression des ARNm correspondant aux bandes de 5,1 kb et de 4,3 kb exprimés en pourcentage du taux d'expression de l'ARNm de 5,1 kb des cellules HL-60 (ligne 1, figure 11A).

B. Analyse en Western Blotting de 1'expression de ICBP90 dans les cellules MOLT-4 et Hela.

Des lysats de cellules totales de cellules Hela et MOLT-4 en prolifération ont été préparés. L'expression d'ICBP90 a été analysée en Western Blotting en utilisant l'anticorps 1 RC 1 C-10.

EXEMPLE 1 : MISE EN EVIDENCE D'UNE NOUVELLE PROTEINE DE LIAISON A LA SEQUENCE ICB 1.1. Construction reportrice pour le criblage de la banque Le système du simple hybride est une technique puissante qui permet de détecter in vivo chez la levure l'interaction de protéines avec des séquences d'ADN spécifiques en criblant des banques d'ADNc. Ceci permet d'évaluer directement 1'ADNc correspondant de la protéine à lier. Plusieurs études ont permis d'identifier la nouvelle protéine dans cette méthode. Ces méthodes décrivent très bien les protocoles utilisés (Inouye et al., 1994 ; Wang et Reed, 1993).

Brièvement, les oligonucléotides suivants ont été synthétisés 5'-AATTCGATTGGTTCTGATTGGTTCTGATTGGTTCTT-3'et 5'- CTAGAAGAACCAATCAGAACCAATCAGAACCAATCG-3'. Ces nucléotides sont ensuites hybrides. Selon les instructions du

fabricant (Clontech, Palo Alto, CA), la construction reportrice cible possède trois copies en tandem de la séquence ICB2 (ICB2X3).

Comme mentionné plus haut, une copie de ICB2 est soulignée et les séquences CCAAT sont représentées en gras. Pour déterminer la spécificité de liaison des protéines à la boîte ICB, les oligonucléotides suivants qui contiennent trois copies en tandem de la boîte GC1 (GC1X3) et également présents dans le promoteur ont été synthétisés et hybrides : 5'-AATTCGGGGCGGGGCCGGGGCGGGGCCGGGGCGGGGCT-3' 5'-CTAGAGCCCCGCCCCGGCCCCGCCCCGGCCCCGCCCCGG-3' Les fragments d'ADN cible résultant sont clones dans le polylinker d'un plasmide intégratif pHISi-1 (Clontech) par ligation des extrémités cohésives au niveau du site EcoRI et XbaI, en amont du promoteur minimal du gène his3. La souche de levure YM4271 (Clontech) est utilisée pour la transformation et des colonies de levure ayant intégrées le plasmide dans leur génome sont sélectionnées sur un milieu synthétique Dropout ne contenant pas d'histidine. Deux clones ont été isolés : un pour ICB2 et un pour la boite GC1.

1.2. Criblage de la banque Une banque d'ADNc de la lignée cellulaire Jurkat clonée au site d'EcoRI du polylinker en aval de GAL4-AD du vecteur pGAD10 (Clontech) est utilisée pour le criblage selon les instructions du fabricant. Des clones positifs sont sélectionnés puis cultivés sur un milieu sélectif déplété en histidine et en leucine. L'ADN plasmidique de ces clones est récupéré et introduit par électroporation dans des bactéries EschsnchïCL coli XLl-blue. Le séquençage des inserts a été réalisé sur une matrice d'ADN plasmidique purifiée à partir d'une culture d'1,5 ml utilisant un kit de mini préparation (Bio-Rad,

Hercules, CA, USA). Une banque d'ADNc de thymus humain clone dans ?, gtlo (Clontech) a été criblée par hybridation sur une plaque, pour récupérer un ADNc codant la partie N-terminale de la protéine.

1.3. Découverte de ICBP-59 Les ADNc de quatre clones ayant rempli les critères de sélection du système simple hybride ont été séquences, et les profils analysés à l'aide de bases de données informatiques (Genbank, EMBL, PDB, Swissprot) afin de déterminer la nature des protéines codées. Deux clones correspondent à des protéines ribosomales (hRS12 et hRS4), un à une sérine-thréonine kinase (STPLK-1) et le quatrième à une protéine humaine d'un poids moléculaire théorique de 59 kDa (calculé à partir de la séquence traduite) et non répertoriée.

Les ADNc, codant pour hRS4, hRS12 et ICBP-59 et obtenus par digestion par EcoRI des clones positifs obtenus dans le vecteur pGAD 10, ont été clones au site EcoRI du vecteur d'expression pGEX-4T-1 (Pharmacia). Les ADN recombinants sont ensuite transformés dans une souche d'Escherichia coli adaptée (BL21). 500 ml de culture du clone sélectionné ont été utilisés lorsque une densité optique de 0,5 a été atteinte. La surexpression des protéines d'intért a été induite par 1'IPTG (lmM) pendant 2h à 37° C. Le vecteur pGEX-4T-l conduit à l'obtention de grandes quantités de protéines sous forme fusionnée à la glutathion-S-transférase (GST). Les protéines de fusion avec la glutathione-S-transférase (GST) sont ensuite purifiées en utilisant des billes de sépharose couplé au glutathion (Pharmacia) suivi par une coupure durant la nuit avec de la thrombine (0,05 U/ml) à 4° C (Pharmacia).

Pour tester l'aptitude de la protéine de poids moléculaire de 59 kDa à lier spécifiquement les boites ICB 1 et/ou ICB2, trois copies en tandem de ICB2 (ICB2X3, séquences décrites précédemment) ont été marquées au niveau terminal au phosphore 32p en utilisant la polynucléotide kinase T4 (New England Biolabs) et du [y32P] ATP (160 mCi/mmol, ICN Irvine, CA, USA). Pour examiner la spécificité de la liaison, des oligonucléotides contenant seulement une copie de la boite CCAAT ont été synthétisés : ICB 1 : 5'-AGTCAGGGATTGGCTGGTCTG-3' ; 5'-CAGACCAGCCAATCCCTGACT-3' ICB2 : 5'-AAGCTACGATTGGTTCTTCTG-3' ; 5'-CAGAAGAACCAATCGTAGCTT-3'.

La protéine ICBP-59 purifiée (1 pg) est incubée avec 1 ng d'oligonucléotide marqué à son extrémité terminale par du phosphore 32p dans 12% de glycérol, 12 mM d'HEPES-NaOH (pH 7,9), 60 mM KCI, 4 mM Tris-HCl (pH 7,9), 100 ng BSA, 0,6 mM DTT et 100 ng de poly (dI/dC) dans 20 il (Inouye et al., 1994). Après 30 minutes d'incubation à température ambiance, le mixte réactionnel est chargé sur des gels de polyacrylamide à 6%. Dans les expériences de compétition, la quantité indiquée d'oligonucléotides non marqués est ajoutée au mixte réactionnel 10 min avant l'addition de protéines. Pour examiner les propriétés de liaison de l'ICBP90 à la boite ICB2, le mme protocole est utilisé à la différence que l'oligonucléotide marqué contient seulement une copie de la séquence CCAAT telle que décrite ci-dessous : ICB2 : 5'-ATAAAGGCAAGCTACGATTGGTTCTTCTGGACGGAGAC-3' 5'-GTCTCCGTCCAGAAGAACCAATCGTAGCTTGCCTTTTAT-3'

La spécificité de liaison est étudiée en utilisant un nucléotide non marqué contenant une boite GC du promoteur du gène de la topoisomérase lIa humaine : <BR> <BR> 5'-GAATTCGAGGGTAAAGGCGCGGGGTTGAGGCAGATGCCA 3'<BR> 5'-TGGCATCTGCCTCAACCCCGCCCCTTTACCCTCGAATTC-3'.

Ces expériences de retard de migration sur gel d'acrylamide, nous ont permis de mettre en évidence que la nouvelle protéine humaine de 59 kDa est capable de lier une séquence d'ADN de type ICB, et ce de manière spécifique. Nous avons appelé cette protéine ICBP-59 (pour Inverted CCAAT Box Binding Protein of 59 kDa).

EXEMPLE 2 : CARACTERISATION DE LA PROTEINE ICBP90 2.1. Synthèse d'anticorps Les anticorps monoclonaux de souris sont synthétisés dans notre Laboratoire par injection de la protéine ICBP-59 par les méthodes traditionnelles (Brou et al., 1993) ; la protéine a été au préalable purifiée par un système de fusion GST. Deux anticorps monoclonaux de 1RClC-10 et lRClH-12 ont été sélectionnés pour leur performance à détecter la protéine endogène correspondant à la protéine ICBP-59 à la fois dans des expériences de Western blotting et dans des expériences d'immunocytochimie. Avant utilisation, les anticorps sont purifiés sur colonne DEAE-cellulose (DE52, Whatmann) à partir des liquides d'ascites.

2.2. Mise en évidence de la protéine endogène par Western Blotting Afin de détecter la protéine endogène correspondant à ICBP- 59, nous avons dans un premier temps utilisé 1RC1C-10 en Western blot (0,4 g/ml d'anticorps monoclonal 1RC1C-10) sur des

extraits nucléaires de cellules HeLa en situation de prolifération et de confluence (Figure 1). Les cellules COS-1 et HeLa sont cultivées tel que décrit précédemment (Brou et al., 1993 ; Gaub et al., 1998 ; Rochette-Egly et al., 1997). Les cellules MOLT-4 sont cultivées dans de l'air à 100% dans du RPMI supplémenté par 10% de sérum de veau fetal. Les fibroblastes pulmonaires humains en culture primaire sont préparés et cultivés dans du DMEM/F12 tel que décrit précédemment (Kassel et al., 1998). Des extraits nucléaires de cellules Jurkat ont été achetés chez Sigma alors que ceux de MOLT-4 et HL60 ont été préparés tel que décrit auparavant (Lavie et al., 1999). Les cellules HeLa en phase de croissance et les fibroblastes pulmonaires humains sont obtenus par déplétion de la culture en sérum pendant 30 h suivi par la réintroduction pendant 16 heures par 10% de sérum de veau ftai (v/v). La prolifération est arrtée lorsque la confluence atteint 60 à 70%. Les cellules arrtées à confluence (confluence de 100%) sont obtenues de manière concomitante en omettant l'étape de déplétion en sérum. Pour ces deux types cellulaires, des lysats cellulaires bruts sont préparés en récoltant les cellules dans du PBS (phosphate buffer saline) suivi d'une étape de sonication. Pour les expériences d'immunotransfert des lysats de cellules totales et des extraits nucléaires sont chargés sur des gels de polyacrylamide SDS à 8% pour réaliser une électrophorèse en une dimension. Les protéines sont transférées sur des membranes de nitrocellulose bloquées avec un réactif de blocage 10% (Roche Molecular Biochemicals, Mannheim, Germany) et incubées avec l'anticorps monoclonal purifié (1RC1C-10) à la concentration de 0,5 llg/ml. Un anticorps anti-souris de mouton couplé à la phosphatase alcaline (fragments Fab, Roche Molecular Biochemicals) est utilisé à une dilution de 1/2 500. Des signaux

sont détectés en utilisant le chlorure de 4-nitro blue tetrazolium/5- bromo-4-chloro-3-indolyl-phosphate comme substrat.

Ces expériences montrent que la protéine endogène présente un poids moléculaire apparent d'environ 97 kDa. En outre, on observe que les formes de la protéine varie en fonction de la nature tumorale ou non-tumorale des cellules ainsi que de l'état de confluence ou de prolifération des cellules. En effet, dans les pistes correspondant aux extraits de cellules HeLa, on observe une bande majeure à 97 kDa ; pour les cellules heLa en prolifération, des bandes supplémentaires de tailles inférieures à 97 kDa apparaissent (piste 2). Dans les fibroblastes pulmonaires humains à confluence, la protéine endogène n'est pas exprimée (piste 3) et apparaît lorsque les cellules se mettent à proliférer (piste 4). Ces observations suggèrent que la protéine endogène ICBP90 est un marqueur de prolifération cellulaire pour des cellules normales (fibroblastes) tandis que pour les cellules tumorales elle serait un marqueur quelque soit le stade cellulaire.

L'utilisation de l'anticorps monoclonal dans des expériences d'immunoprécipitation sur des extraits de protéines nucléaires, suivies d'un Western blot, conduit de la mme manière à la mise en évidence d'une protéine de 97 kDa (Figure 2).

Les résultats obtenus en Western blot, aussi bien pour les extraits de protéines nucléaires que pour les immunoprécipitations, montrent que la protéine de 59 kDa isolée à l'aide du système simple hybride ne constitue qu'un fragment de la protéine endogène humaine correspondante, en l'occurrence le fragment C-terminal à partir du résidu D263. Il nous a donc fallu entreprendre un nouveau criblage de banque d'ADNc.

2.3. Analyse en Dot Blot d'ARN de multiples tissus humains Afin de choisir une banque nous donnant le plus de chance possible d'isoler la protéine complète, nous avons voulu identifier un tissu humain exprimant l'ARN messager (ARNm) correspondant en quantité importante. A l'aide d'une sonde d'ADNc recouvrant une partie de la séquence de ICBP59 et marquée au 32P, nous avons testé 1'expression de l'ARNm d'intért dans 50 tissus humains différents sur un dot blot d'ARN. Brièvement, une sonde longue de 678 paires de bases correspondant à la séquence en acides aminés 269 à 500 de ICBP90 a été synthétisée par PCR en utilisant de la Taq polymérase (Sigma, St Louis, MO, USA). La sonde marquée par random priming en utilisant du dCTP-a 32P est purifiée sur colonnes Sephadex G50 (Pharmacia, Uppsala, Suède).

Un dot blot d'ARN de multiples organes contenant de l'ARN poly (A) + de 50 tissus humains différents est hybride 20 heures dans des conditions de forte stringence dans un milieu ExpressHyb (Clontech) à 68° C avec une sonde marquée au 32P. Des lavages à haute stringence sont réalisés dans du 0,1 x SSC, O, 1% SDS à 68° C (De Vries et al., 1996).

Les réultats obtenus (figure 5) montrent que les tissus exprimant le plus fortement l'ARNm de la protéine ICBP-59 sont le thymus adulte et foetal, ainsi que la moelle osseuse adulte et le foie foetal. Pour isoler la protéine entière, notre choix s'est donc porté sur une banque d'ADNc de thymus adulte.

2.4. Criblage de la banque et clonage de ICBP90 Le criblage de la banque nous a permis d'obtenir plusieurs clones d'environ 4000 paires de bases (pb) comportant un cadre de lecture ouvert de 2379 pb (Fig. 6). Cette séquence code pour une protéine de 793 acides aminés (Fig. 7) dont le poids moléculaire

théorique (calculé à partir de la séquence traduite) est de 89,758 kDa. Nous avons appelé cette protéine ICBP90 (pour Inverted CCAAT Box Binding Protein of 90 kDa) par analogie avec l'appellation utilisée pour la protéine initiale de 59 kDa.

L'ADNc ICBP90 (2379 bp) a été synthétisé par PCR en utilisant 1'ADN polymérase Deep Vent (New England Biolabs, Beverly, MA, USA) et les oligonucléotides utilisés au cours de cette réaction de PCR étaient voisins du site de EcoRI. Le produit de réaction a été par la suite souscloné dans un vecteur pGEX-4T-1 (Pharmacia) pour 1'expression de la protéine de fusion GST dans BL21. La surexpression est induite par IPTG (lmM) pendant 4h à 25° C. La protéine ICBP90 est ensuite purifiée.

2.5. Immunocytochimie et immunohistochimie.

L'observation directe de la protéine ICBP90 sur des cellules et tissus a été également mise en oeuvre.

Des cellules COS-1 ont été transfectées comme décrit précédemment (Brou et al., 1993 ; Gaub et al., 1998) avec le vecteur pSG5 (Stratagene, La Jolla, CA) dans lequel 1'ADNc de ICBP90 (2379 bp) a été sous-clone dans le site de restriction EcoRI. L'ADNc est synthétisé par réaction de polymérisation en chaine (PCR) utilisant la polymérase Deep Vent (New England Biolabs) et des oligonucléotides flanquants le site de restriction EcoRI. La construction plasmidique est vérifiée par séquençage.

L'immunomarquage des cellules HeLa et des cellules COS-1 transfectées est réalisé tel que décrit précédemment (Brou et al., 1993) avec respectivement les anticorps monoclonaux 1RC1C-10 et 1 RC 1 H-12. Un marquage indirect à l'immunopéroxidase de ICBP90 et de topoisomérase IIa est réalisé comme décrit précédemment (Rio et al., 1987, Devys et al., 1993). Les appendices humains ont été

inclus dans la paraffine et fixés dans du formalin 10% tamponé (Sigma). Des coupes sériées (3 Am) sont incubées durant la nuit à température ambiante avec l'anticorps 1RC1C-10 et avec l'anticorps anti-topoisomérase IIa (NeoMarkers, Union City, CA, USA). Des anticorps liés de manière spécifique sont visualisés par un complexe utilisant la streptavidine biotine (LAB/LSAB method, Dako LSAB2 System kit ; DAKO, Carpinteria, CA, USA).

En immunocytochimie, l'anticorps 1RC1C-10 marque le noyau des cellules HeLa tandis que le nucléole et 1'ensemble du cytoplasme ne sont pas marqués (Figure 3). En immunohistochimie, des coupes en paraffine d'appendice humain montrent un marquage localisé essentiellement dans des zones de prolifération cellulaire (Figure 4). En effet, les cellules marquées sont logées dans les cryptes glandulaires (CG) ainsi que dans les zones germinatives (Ger). Un marquage identique est obtenu lorsqu'on utilise un anticorps anti-topoisomérase IIa qui est une enzyme uniquement exprimée dans des cellules en prolifération (résultats non illustrés).

2.6. Recherches BLAST et prédiction de domaines Les études sur BLAST en ligne ont été réalisées à partir des informations du National Center for Biotechnology Information au National Institute of Health (Bethesda, MD, USA). SCANPROSITE et PROFILESCAN sont utilisés pour l'analyse protéique (Infobiogen, Villejuif, France).

ICBP90 comporte un domaine « ubiquitin-like » dans ses 80 premiers acides aminés, deux sites de localisation nucléaires potentiels dans la partie C-terminale et deux domaines en doigt de zinc (« zinc-finger »), dont l'un serait impliqué dans la liaison à 1'ADN et l'autre dans des interactions protéine-protéine. Plusieurs

sites potentiels de phosphorylation par la protéine kinase C, la caséine kinase II ainsi que par une tyrosine kinase sont également présents.

La production et la purification de ICBP90 à l'aide du système de fusion GST (mme procédé que celui utilisé pour ICBP-59) nous a finalement permis de tester la capacité de la protéine complète à lier les séquences d'ADN de type ICB. Son comportement est en tous points identique à celui observé pour ICBP-59.

En définitive, nous avons isolé une nouvelle protéine humaine que nous avons appelée ICBP90 pour les raisons évoquées ci-dessus. Son poids moléculaire théorique est de 89,758 kDa et son poids moléculaire apparent sur gel d'acrylamide est de 97 kDa.

Cette protéine est non seulement localisée exclusivement dans le noyau des cellules humaines, mais elle présente également la capacité à lier des séquences d'ADN de manière spécifique, en l'occurrence des séquences de type CCAAT. Pour ces raisons, nous pensons que ICBP90 a la possibilité de moduler 1'expression des gènes dont le promoteur est pourvu de boîtes CCAAT, éventuellement en position inversée (ICB). Le gène de la topoisomérase IIa humaine qui nous intéresse plus particulièrement, et qui comporte cinq séquences ICB dans son promoteur, nous semble tre une des cibles privilégiées de ICBP90.

Ces expériences ont permis de mettre en évidence les caractéristiques remarquables de l'anticorps 1RClC-10 qui ne marque uniquement que les cellules en prolifération dans le cas de cellules non cancéreuses ; il marque les cellules cancéreuses en prolifération ou en quiescence ; il est utilisable dans 4 techniques différentes (Western blotting, immunocytochimie, immunohistologie, immunoprécipitation) ; il possède une très bonne affinité et permet d'utiliser une dilution de 1/150 000 en

immunohistochimie (i. e. 13 ng/ml) ; enfin, son utilisation ne génère quasiment pas de bruit de fond.

Les applications futures de 1RC1C-10 se situent en premier lieu dans les domaines du diagnostique et de la recherche fondamentale. Pour le diagnostique en anatomo-pathologie par exemple, il serait tout à fait possible de rendre compte de l'état prolifératif d'un tissus cancéreux donné. Concernant la recherche fondamentale, des investigations sont en cours dans notre laboratoire afin de déterminer la contribution exacte de ICBP90 dans les mécanismes de prolifération des cellules normales et des cellules cancéreuses. Or, pour l'étude de 1'expression de ICBP90 en fonction du cycle cellulaire, de sa localisation nucléaire précise et de son interaction avec d'autres protéines cellulaires, l'utilisation de l'anticorps sera incontournable.

Pour l'instant nous n'avons pas étudié 1'expression de l'ICBP90 en fonction du cycle cellulaire. Néanmoins, dans le cas ou des lignées de cellules cancéreuses sont confluentes ou lorsqu'elles sont en prolifération nous ne pouvons détecter de différences significatives de 1'expression de l'ICBP90 (Fig. 1) du moins en ce qui concerne la forme à 97 kDa. Par contre, dans des cellules confluentes non cancéreuses (cellules musculaires lisses bronchiques humaines) 1expression de l'ICBP90 est difficilement détectable (résultats non illustrés). Ceci est confirmé sur les coupes histologiques où aucune cellule en quiescence n'est marquée par l'anticorps. Il est par conséquent possible que l'ICBP90 soit exprimée quelle que soit la phase du cycle cellulaire dans des cellules cancéreuses alors que son expression varierait en fonction de chaque phase dans des cellules non cancéreuses. Ceci rend donc l'utilisation de l'anticorps extrmement intéressante, en ce sens que nous aurions à disposition un marqueur de la

prolifération cellulaire de tissus cancéreux qui ne dépendrait pas de la phase du cycle cellulaire contrairement à d'autres marqueurs de prolifération cellulaire tels que le Ki-67, la topoisomérase IIa, la cycline E et la cycline B 1. En effet, la fin de la phase S est caractérisée par une très faible expression de Ki-67, la cycline E marque les cellules en fin de phase G 1 jusqu'au milieu de la phase S et la cycline B1 marque les cellules en phase G2/M (pour revue Darzynkiewicz et al., 1994). Par ailleurs, il a été montré que PCNA (Proliferating Cell Nuclear Antigen) surestime le nombre de cellules en prolifération dans certains types de tissus (Roskell and Biddolph, 1999).

ICBP90 joue un rôle important dans la prolifération cellulaire en régulant 1'expression de gènes tels que celui de la topoisomérase IIa. Différentes stratégies visant à bloquer l'action de cette protéine doivent permettre de modifier la prolifération cellulaire. Ainsi, l'utilisation de l'anticorps 1RC1C-10 ainsi que l'utilisation de peptides mimant l'interaction ADN/ICBP90 sans pour autant engendrer d'effet physiologique subséquent constitue une possibilité intéressante. Le design de ses peptides s'inspirerait directement de la séquence protéique de ICBP90 que nous avons décrite. Une forme tronquée corrspondant à ICBP59 pourrait par exemple tre un des premiers candidats.

Le blocage pur et simple de 1'expression de ICBP90 dans le but d'éliminer complètement son influence sur les gènes et par extension sur la prolifération cellulaire peut tre envisagé ; il peut se faire soit par une approche classique en obtenant des inhibiteurs de la protéine, soit en utilisant une approche plus moderne correspondant à la technique d'interférence par l'ARN double brin (RNA interference ou RNAi) telle que décrit récemment par Kennerdell & Carthew (1998).

EXEMPLE 3 : ISOLEMENT ET CARACTERISATION DU GENE ICBP90 3.1. Matériels et méthodes 3.1.1. Construction et criblage d'une banque gnomique placentaire humaine Après digestion partielle avec l'enzyme MboI, l'ADN gnomique placentaire a été fractionné en fonction de la taille sur un gradient de 10 à 40% de sucrose. Des fragments d'ADN de 15 kb ont été ligués dans un vecteur kGEM12 préalablement digéré par BamHI (Promega, Madison WI, USA). Après empaquetage, les particules de phages k ont été titrées sur des cellules TAP 90. La banque gnomique contient 3.106 unités formant des plaques (plaques forming units, pfu). 106 clones ont été étalés pour l'analyse. Une sonde de 620 pb correspondant à une extrémité 5' terminale de l'ADNc de ICBP90 utilisée pour le criblage a été marquée au a32P-dCTP par une méthode d'amorçage aléatoire (random priming) (Sambrook et al., 1989). La sonde marquée est utilisée selon un protocole classique d'hybridation sur plaque pour cribler la banque gnomique (Sambrook et al., 1989). L'hybridation a été réalisée à 68°C dans du 5X SSC (15 mM NaCl, 1,5 mM citrate de sodium pH 7,0), 5 X de solution Denhardt, 100 tg/ml DADN de sperme de saumon et 0,1% de SDS, suivi par 30 minutes de lavages dans du 2X SSC, 0,1% SDS à température ambiante.

Deux étapes de criblage ont été réalisées pour purifier un clone positif. Le clone positif a ensuite été digéré avec l'enzyme NotI et deux fragments de 6 et de 10 kb ont été sous-clones dans le

vecteur pBluescript-SK+ (Stratagene, La Jolla CA, USA) selon un protocole standard (Sambrook et al., 1989).

3.1.2. Criblage de la banque d'ADNc de thymus humain Une banque kGT10 d'extrémité 5'd'ADNc de thymus humain (Clontech, Palo Alto, CA, USA) a été criblée par hybridation sur plaque en utilisant la sonde d'ADNc de 679 pb synthétisée telle que dans le paragraphe relatif à l'analyse par Northern Blotting. Des signaux ont été détectés en utilisant du chlorure de 4-nitro-bleu- tétrazolium et de 5-bromo-4-chloro-3-indolyl-phosphate comme substrat.

3.1.3. Réaction de polymérisation en chaîne (PCR) sur 1'ADN gnomique placentaire L'ADN gnomique placentaire a été préparé selon une méthode conventionnelle (Sambrook et al., 1989). Pour la région 5' du gène ICBP90, les inventeurs ont utilisé le kit PCR Advantageo- GC genomic de Clontech qui est adapté aux régions riches en GC de l'ADN gnomique. Pour couvrir les régions 3'-flanquantes, la Taq polymérase (Sigma, St Louis, MO, USA) et son tampon correspondant ont été utilisés. Les réactions ont été réalisées selon les instructions du fabricant en utilisant 250 ng d'ADN gnomique placentaire comme matrice dans un volume final de 50. 1. Afin d'obtenir l'amplification des introns de longueur 19 kb et 8,7 kb le système PCR Expand 20kbP'us (Roche Diagnostics, Mannheim, Germany) a été utilisé.

La réaction a été réalisée dans 100, ut en utilisant 125 ng d'ADN gnomique placentaire par réaction.

3.1.4. Constructions plasmidiques et essais CAT Une série de différents fragments ont été obtenus par PCR dans la région 5'flanquante du gène ICBP90 en utilisant des amorces de 20 nucléotides afin d'obtenir les constructions décrites dans la figure 10. Celles-ci contiennent un site de restriction BamHI et l'ADN gnomique placentaire humain a été utilisé comme amorce. Les produits PCR ont été digérés et sous-classes en amont du gène reporter chloramphénicol acétyl transférase (CAT) d'un vecteur contenant le promoteur minimal de la thymidine kinase (pBICAT2). Les constructions plasmidiques ont été vérifiées par séquençage. Des cellules COS-1 ont été cultivées dans un milieu Dulbecco modifié par Eagle (DMEM) supplémenté avec 5% de sérum de veau ftai. Après l'étalement, les cellules ont été transférées avec les différentes constructions plasmidiques (5 g) en utilisant la technique de co-précipitation au phosphate de calcium (Banerji et al., 1981)). Les analyses d'expression de la CAT ont ensuite été réalisées comme décrit ailleurs (Goetz et al. (1996)).

3.1.5. Localisation chromosomique du gène ICBP90 Des chromosomes métaphysiques ont été préparés à partir de leucocytes humains du sang périphérique selon les protocoles standards (Haddad et al. (1988)). Brièvement, une sonde de 10 kb correspondant à un fragment 5'terminal du clone de 16 kb isolé à partir du criblage de la banque d'ADN gnomique placentaire, a été marquée avec de la biotine-16-dUTP (Roche Diagnostics) par « nick-

translation M. La sonde est ensuite précipitée avec un excès (50X) d'ADN humain Cot-1 (Life Technologies, Rockville MD), resuspendu dans 50% de formamide, 1X SSC, pré-hybride pendant 2 heures à 37°C puis hybride sur la nuit à 37°C. La détection est réalisée en utilisant de l'avidine-FITC (Vector Laboratories, Burlingam CA). Les chromosomes ont été contre-colorés avec du 4'-6-diamino-2- phénylindole (Sigma).

3.1.6. Analyse de Northern blotting et de Western Blotting Une membrane de Northern Blotting contenant 2 pLg d'ARN polyA+ par ligne, provenant de 7 lignées cellulaires humaines cancéreuses différentes (Clontech) a été préhybridée dans du Express Hyb (Clontech) puis hybridée avec la sonde spécifique de ICBP90 dans du Express Hyb à 68°C pendant deux heures. La sonde double-brin marquée à la digoxigénine a été préparée par amplification PCR d'un fragment de 676 pb à partir de l'ADNc d'ICBP90 (nucléotides 806 à 1 485 ; Numéro d'Accession Genbank AF 129 507) selon les instructions du fabricant (Roche Diagnostics).

Après purification au travers d'une colonne de chromatographie Micro Bio-Spin 30 (Bio-Rad, Hercules, CA), la sonde spécifique ICBP90 (5 ng/ml) a été chauffée à 95°C pendant 15 minutes puis refroidie dans la glace avant l'addition de la solution d'hybridation. Les lavages après l'hybridation ont été réalisés deux fois dans du 2X SSC, 0,1% SDS (30 minutes par lavage à température ambiante), puis deux fois dans du 0,1X SSC, 0,1% SDS (30 min. par lavage à 68°C). La membrane a été traitée avec la solution A (0,1 M acide malique, 0,15 M de NaCl à pH 7,5)

puis bloquée par incubation avec 1% d'agent bloquant (Roche Diagnostics) dans le tampon A pendant 30 minutes à température ambiante.

Un anticorps conjugué à la phosphatase-alcaline dirigé contre la digoxigénine (fragment Fab, Roche Diagnostics) a été ajouté (150 mU/ml) puis incubé pendant 30 minutes à température ambiante. La membrane a ensuite été lavée deux fois avec la solution A puis équilibrée dans du 0,1 M tris-HCI, 0,1 M NaCl, pH 9,5. Pour la détection par chémiluminescence, les inventeurs ont utilisé l'agent Disodium 3- (4-méthoxyspiro {l, 2 dioetane-3,2'- (5'- chloro) tricyclo [3.3-1.137] décan}-4-yl) phenyl phosphates (Roche Diagnostics) selon les instructions du fabricant. Les bandes d'ARNm ont été quantifiées en utilisant le logiciel NIH image 1.62 et exprimées en pourcentage de la bande d'ARNm la plus abondante (c'est-à-dire la bande de 5,1 kb des cellules HL-60).

L'analyse en Western Blotting a été réalisée comme décrit ailleurs (Hopfner et al. (2000)). Les signaux ont été détectés en utilisant le chlorure de 4-nitro-blue tétrazolium/le phosphate de 5-bromo-4chloro-3-indolyl comme substrat.

3.1.7. Outils de recherche d'alignement local de base, prédictions de sites de démarrage de la transcription et de signal polyA Des recherches d'alignement local de base ont été réalisées via le Centre National d'Information en Biotechnologie au National Institute of Health (Bethesda, MD, USA). Le criblage d'une banque de facteurs de transcription avec le programme d'ordinateur Mat Inspector, les prédictions de sites de démarrage de la transcription (TSS) avec Neural Network, ainsi que la prédiction de signal polyA,

ont été réalisés via le Baylor College of Medicine (Reese et al.

(1996)).

3.2. Résultat 3.2.1. Isolement et caractérisation du gène de l'ICBP90 Une banque d'ADN complémentaire de placenta humain clone dans le phage lambda GEM 12 a été criblée à l'aide d'une sonde d'ADN. Le criblage a conduit à la purification d'un seul clone positif ayant un insert de 16 kb. L'analyse de la séquence a permis de déterminer qu'il contenait une séquence intronique longue de 10 kb et contenant 3 exons (appelé B, C et D dans la figure 9A). Tous les autres criblages, incluant notamment ceux qui ont été réalisés par PCR sur des banques de BAC (Bacterial Artificial Chromosome) ou de YAC (Yeast Artificial Chromosome), n'ont pas permis d'isoler d'autres clones positifs. Par conséquent, nous avons décidé de déterminer le reste de l'organisation du gène par PCR directement sur de l'ADN gnomique de placenta humain. La plus grande difficulté fut d'obtenir le côté 5'de l'intron de 19 kb. Ainsi, des amorces ont été choisies dans 1'exon A (amorce sens) et dans le côté 5'du clone de 16 kb (amorce anti-sens). L'exon E et l'intron de 8,7 kb ont été amplifiés en utilisant une amorce sens dans l'exon D et l'amorce anti-sens dans l'exon F. Finalement, la séquence complète de 1'exon F jusqu'au signal de poly-adénylation a été déterminée en utilisant une amorce sens choisie dans le début de l'exon F et l'amorce anti-sens dans le côté 3'd'une EST (référence dans GenBank n° AW297533) homologue a la séquence du gène de llCBP90. La séquence complète du gène de 11CBP90 montre qu'il est composé de 6 exons codants dont la taille varie de 100 paires de

bases à 3453 paires de bases. La plupart des jonctions exons/introns répondent aux séquences consensus pour les sites accepteurs et donneurs d'épissage. Une séquence consensus de poly-adénylation (AATAAA) a été trouvée dans la région 3', c'est-à- dire 1152 nucléotides après le codon stop dans la figure 9A.

3.2.2 La région 5'du gène de l'ICBP90 Le criblage d'une banque d'ADN complémentaire de thymus humain clone dans le phage lambda gtlO a conduit à l'obtention de deux populations de cDNA qui se distinguent l'une de l'autre dans leur région 5', exactement 10 paires de bases en amont du codon d'initiation, c'est-à-dire dans la région 5'non traduite. Ces deux populations de cDNA prédisent l'existence de deux exons alternatifs en 5'appelés exon I et exon II (Figure 9A). Nous avons observé que les exons I et II sont reliés à un site d'épissage alternatif interne de 1'exon A. De plus, nous avons trouvé dans une base de données un EST (référence dans GenBank n° AI084125) correspondant aux nucléotides 1290 à 1356 (Figure 9B). Les positions de ces deux exons et de l'EST à l'intérieur du locus ont été déterminées par PCR. Pour cela nous avons utilisé des amorces correspondant aux 18 premiers nucléotides de chaque exon et une amorce anti-sens choisie dans le premier exon traduit (exon A). Cette stratégie nous a permis de reconstruire la région 5'telle qu'elle est représentée dans les figures 9A et 9B, avec l'exon I correspondant aux nucléotides 1 à 134 et 1'exon II correspondant aux nucléotides 676 à 725. La séquence EST (AI084125) est contiguë au site d'épissage interne de 1'exon A. Nous n'avons pas encore déterminé avec précision le début des exons I, II et A puisque leurs séquences ont été déduites à partir de criblages de banques de cDNA (Figure 9A).

Quatre boites GC (GC 1 a GC4) ont été trouvées dans la région 5' (Figure 9B). Ces boites représentent des sites potentiels de liaison pour le facteur de transcription Spl, mais seulement une boite (GC3) correspond à une séquence consensus, c'est-à-dire GGGGCGGGG. De plus deux boites CCAAT (CB1 et CB2) ont été trouvées. Des analyses prédictives de séquences suggèrent que deux régions promotrices existent dans la région 5', c'est-à-dire avant le codon d'initiation (ATG). Deux sites potentiels d'initiation de la transcription ont été prédits aux positions 571 et 827. Le premier suit la séquence consensus de liaison à Spl et le second suit la boite GC1 (respectivement entre les exons I & II, et les exons II & A). Afin de voir si ces deux régions sont fonctionnelles en tant que région promotrice, plusieurs constructions plasmidiques contenant un gène rapporteur (gène de la Chloramphénicol Acétyl Transférase ; CAT) en aval des différentes régions promotrices potentielles ont été préparées. Des cellules COS ont été transfectées avec ces constructions plasmidiques. La figure 10 montre les résultats obtenus et qui correspondent au pourcentage d'augmentation de l'activité basale. L'activité maximale a été obtenue avec la construction plasmidique contenant 1114 paires de bases en amont du site d'initiation de la traduction, avec une augmentation de 236,7% de l'activité promotrice basale (promoteur minimal du gène de la thymidine kinase). La construction plasmidique contenant 642 paires de bases en amont de 1'ATG a conduit à une augmentation de 115,6% alors que la construction plasmidique contenant uniquement la séquence entre l'exon I et 1'exon II montrait une activité relativement faible avec une augmentation uniquement de 22,8% (figure 10). Ces résultats suggèrent l'existence d'une région promotrice entre les exons II et A.

3.2.3. Localisation chromosomique du gène ICBP90 La localisation chromosomique du gène ICBP90 a été réalisée par hybridation in situ de fluorescence (FISH). Le gène ICBP90 est localisé sur le chromosome 19pl3.3 dans une région télomérique.

Une recherche réalisée dans Genbank a montré qu'une région de 6Mb dans la bande chromosomique 19 p 13.3 d'une banque de cosmide spécifique du chromosome 19 (hybride homme/hamster 5HL2-B) contient 147 nucléotides codant pour les acides aminés 746 à 793 de ICBP90. Cette séquence a été localisée entre les marqueurs STS (sequence tagged site) D19S883 et D 19S325.

3.2.4 Expression de ICBP90 dans différentes lignées cellulaires ICBP90 participe à la régulation de l'expression du gène TopIIa (Hopfner et al. (2000)). Comme TopIIa est exprimée de manière différentielle dans différentes tumeurs et lignées cellulaires, ICBP90 lui-mme est susceptible d'avoir une régulation complexe en terme d'activité et d'expression génique.

Dans une première étape vers la compréhension des mécanismes régulant l'expression du gène ICBP90, l'ARNm dlCBP90 a été analysé dans différentes lignées cellulaires. L'ARNm d'ICBP90 a été étudié dans la lignée cellulaire HL60 dérivée d'une leucémie promyélocytaire (ligne 1), de cellule Hela S3 (ligne 2), de cellules de leucémie lymphoblastique MOLT-4, de cellules Raji du lymphome de Burkitt (ligne 5), d'adénocarcinome colorectal SW 480 (ligne 6), de cellules A549 de carcinome du poumon (ligne 7) (figure 1 lA).

Deux bandes d'ARNm de 4,3 et 5,1 kb sont observées. Les quantités relatives d'ARNm dans les bandes varient selon le type cellulaire. L'histogramme de la figure 11A montre les taux d'ARNm dans les bandes de chacune des lignées cellulaires, exprimé en pourcentage de la quantité maximale observée de bandes d'ARNm de 5,1 kb dans les cellules HL-60 (ligne 1, figure l lA). Dans les cellules MOLT-4, seule la bande d'ARNm de 4,3 kb est observée, alors que dans les cellules de leucémies promyélocytaires la bande à 5,1 kb est prédominante. Dans les cellules Raji du lymphome de Burkitt, seule la bande à 5,1 kb est détectée. Approximativement, des quantités égales des deux types d'ARNm sont observées dans les autres lignées cellulaires, c'est-à-dire les cellules Hela, K562, A549, SW 480. Pour les cellules HL-60, néanmoins, l'ARNm de 5,1 kb est plus fortement exprimé que l'ARNm de 4,3 kb. D'autres analyses ont été entreprises sur les cellules Hela pour confirmer que les 2 transcrits proviennent de la transcription du gène ICBP90. Une sonde d'ADNc de 626 pb marquée à la digoxigénine localisée immédiatement en amont du signal poly A (c'est-à-dire l'exon F) et utilisée comme sonde pour des expériences de Northern Blotting, a produit les mmes résultats, c'est-à-dire l'apparition de deux bandes d'ARNm de 4,3 kb et de 5,1 kb. Ce résultat confirme que les deux formes d'ARNm sont générées à partir d'un seul gène.

Les inventeurs ont également étudié 1'expression de la protéine ICBP90 afin de déterminer si ces deux isoformes d'ARNm sont susceptibles de coder pour deux protéines différentes.

La figure 11B montre le profil d'expression de ICBP90 dans des extraits protéiques de cellules MOLT-4 et Hela. Alors qu'une seule bande de 97 kDa est observée dans les cellules MOLT-4, dans les cellules Hela, à côté de la bande de 97 kDa qui est doublée, plusieurs autres bandes d'un poids moléculaire inférieur sont

observées. Ces résultats suggèrent que, dans les cellules MOLT-4, un ARNm code pour une forme unique dICBP90. A l'inverse, dans les cellules Hela, les deux ARNm sont susceptibles de conduire à la production de différents isoformes d'ICBP90.

3.3 Commentaires Le gène ICBP90 s'étend sur environ 35,8 kb. Six exons traduits et deux exons non traduits, et de fait sept introns, ont été identifiés par les inventeurs. Les deux domaines en doigt de zinc de ICBP90 sont codés par le mme exon (exon F), contrairement au gène du récepteur aux oestrogènes humains dans lequel chacun des doigts-de-zinc putatifs du domaine de liaison à 1'ADN du récepteur sont codés séparément (Ponglikitmongkol et al. (1988)).

Le domaine « ubiquitin-like » de ICBP90 est codé par les exons A et B alors que le domaine « leucine zipper » est codé par l'exon B. De manière intéressante, l'exon F seul est susceptible de coder pour une protéine fonctionnelle car elle code pour deux signaux de localisation nucléaire, les domaines zinc-finger et plusieurs sites putatifs de phosphorylation. Deux grands introns de 8,7 kb et de 19 kb ont été trouvés.

Le gène ICPB 90 a été localisé dans la région chromosomique 19pl3.3. Plusieurs autres gènes ont été localisés dans cette région, par exemple le Nuclear Factor I/C (également un facteur de transcription liant CCAAT, (Qian et al. (1995)). De manière intéressante, une translocation atypique t (7 ; 19) dans la leucémie myélomonocytaire aiguë, impliquant un site fragile au locus 19pl3.3 a été décrite (Sherer et al. (1991)). Egalement, il a été suggéré que les gènes impliqués dans le développement des carcinomes pancréatiques sont localisés en 19pl3.3 et 19ql3.1-

13.2 (Hoglund et al. (1998)). Des réarrangements des bandes 14q32.3 et 19pl3.3 d'une délétion préférentielle du bras court du chromosome 1 constituent des altérations chromosomiques non aléatoires dans le myélome multiple et la leucémie des cellules du plasma (Taniwaki et al. (1996)). D'autres gènes ont été localisés dans cette région ; ils incluent un gène impliqué dans l'adénocarcinome du syndrome Peutz-Jeghers (Gruba et al. (1998)).

Egalement, il a été suggéré que le gène suppresseur de tumeur putatif pour l'adénome malin est localisé en D19S216 au niveau de la bande chromosomique 19pu3.3 qui joue un rôle important dans la tumorigenèse de l'adénome malin (Lee et al. (1998)).

L'analyse de la séquence de la région 5'du gène ICBP90 a révélé l'existence de plusieurs exons non-traduits avec une région promotrice entre les exons II et A et probablement un second promoteur plus faible localisé entre les exons I et II. La région promotrice entre les exons II et A est un promoteur sans séquence TATA, suggérant que le gène ICBP90 peut tre un gène de ménage, au moins lorsque ce promoteur est impliqué. En ce sens, il ressemble fortement aux régions promotrices des gènes ATFa (Goetz et al., 1996), CRE-BP1/ATF 2 (Nagase et al., 1990) et TopIIa, (Hochhauser et al., 1992), qui ne contiennent pas de boites TATA canoniques mais plusieurs sites de liaison de SP-1.

Les boîtes GC et/ou CCAAT sont susceptibles d'tre impliquées dans la régulation de l'expression du gène ICBP90 via les facteurs de transcription SP-1 et les protéines de liaison à CCAAT. De plus, étant donné que la protéine ICBP90 est une protéine de liaison à CCAAT, ICBP90 est également susceptible de réguler sa propre expression.

Une banque de données de facteurs de transcription a été criblée à l'aide du programme d'ordinateur Mat Inspector du Baylor

College of Medicine, et de nombreux sites de liaison de facteurs de transcription ont été identifiés dans la séquence précédant le codon ATG (figure 9B). Parmi ces sites de liaison aux facteurs de transcription, il est intéressant de noter des sites de liaison du facteur de transcription AP-2 régulé au cours du développement et qui contrôle 1'expression de gène tel DR-nm 23 (Martinez et al.

(1997)), les sites de liaison de la protéine myélolde « zinc-finger » MZF 1 qui est impliquée dans la régulation de I'hématopolese (Hromas et al. (1996)).

L'analyse de Northern Blotting a démontré qu'il existe deux populations d'ARNm de 4,3 kb et de 5,1 kb. De manière intéressante, chaque population présente une spécificité cellulaire.

Par exemple, les cellules lymphoblastiques MOLT-4 expriment seulement l'ARNm de 4,3 kb, alors que dans les cellules Raji du lymphome de Burkitt (lymphocytes B matures), seul le transcrit de 5,1 kb est observé. Les cellules HL-60 expriment davantage d'ARNm de 5,1 kb que d'ARNm de 4,3 kb. Les cellules HL-60 et les cellules Raji du lymphome de Burkitt sont davantage différenciées que les cellules MOLT-4 suggérant que les taux d'expression du transcrit de 5,1 kb par rapport à celui de 4,3 kb peut tre directement corrélé avec l'état de différenciation des cellules.

De manière intéressante, une étiquette de séquence exprimée (EST, Expressed Sequence Tag) correspondant à la séquence 5'de 1'exon A a été identifiée à partir d'oligodendrogliome anaplastique (numéro d'accession Genbank N° AI 084 125) alors qu'une EST correspondant à l'inclusion de 1'exon II a été isolée à partir d'un mélange de tumeurs de cellules germinales (numéro d'accession Genbank N° AI 968 662). Les résultats des inventeurs suggèrent donc que la régulation des transcrits ICBP90 est comparable avec ce qui se passe pour le récepteur aux oestrogènes. En fait, six

transcrits différents codant une protéine commune, mais différant dans la région 5'non traduite du fait d'un épissage alternatif des exons amonts, ont été reportés (Flouriot et al., 1998 et Grandien, 1996).

L'analyse en Western Blotting montre une bande majoritaire à 97 kDa dans les cellules MOLT-4 alors que plusieurs bandes sont observées dans les cellules Hela (Figure 11B). Ces données sont en accord avec l'existence de plusieurs ARNm ICBP90 et/ou d'isoformes de la protéine ICBP90 dont le taux d'expression peut tre contrôlé de manière cellule-spécifique.

Deux isoformes protéiques pour le récepteur aux oestrogènes ont été décrits (Griffin et al., 1999) qui différent l'un de l'autre par les 41 amino-acides N-terminaux. La double-bande de 97 kDa observée à partir des cellules Hela (Figure 11B) est donc susceptible de représenter deux isoformes différant par leur extrémité N- terminale. Pour ce faire, l'exon A codant pour 47 amino-acides est épissé en dehors du cadre de lecture, et conséquemment, la région protéique codante commence avec l'exon B. Néanmoins, il est également possible qu'il existe d'autres exons susceptibles d'tre transcrits dans d'autres tissus.

Egalement, l'intron de 8,7 kb (c'est-à-dire entre l'exon D et E) est susceptible de contenir une région promotrice qui peut conduire à des isoformes d'ICBP90 de poids moléculaires inférieurs à ceux observés dans les cellules Hela en prolifération (Figure 11B). De manière intéressante, la spécificité tissulaire des différents ARNm du récepteur aux oestrogènes est déterminée par différents promoteurs dont l'activité apparaît tre altérée dans les lignées cellulaires du cancer du sein (Flouriot et al., 1998).

L'ensemble de ces résultats suggère que le gène ICBP90 et la protéine ICBP90 présentent des caractéristiques communes avec

les membres de la famille du récepteur à l'acide rétinoïque, aux stéroïdes, aux hormones thyroïdiennes en ce qui concerne les structures génique et protéique.

En effet, les inventeurs ont démontré expérimentalement, en utilisant la technique du double hybride, l'existence d'interactions entre la protéine ICBP90 et TIP60 (Tat Interactive Protein, 60 kDa).

La protéine TIP60 a été très récemment décrite comme étant un co- activateur du récepteur nucléaire, notamment le récepteur pour les androgènes (Brady ME et al., 1999).

De ce fait, ICBP90 est susceptible de jouer le rôle d'un récepteur nucléaire sur lequel se lie un ligand endogène. Il est donc également dans la portée de la présente invention d'utiliser le polypeptide ICBP90 de l'invention pour isoler, cribler, identifier le ligand endogène. Il est également dans la portée de l'invention d'utiliser le polypeptide ICBP90 de l'invention pour isoler, cribler, identifier des molécules naturelles ou de synthèse, biologique ou chimique, agoniste ou antagoniste de ce ligand naturel.

REFERENCES Austin et al. (1993), Biochim. Biophys. Acta, 1172,283-291.

Banerji, J. et al. (1981), Cell, 27 : 299-308.

Barany, F. (1991), Proc. Natl. Acad. Sci. USA, 88,189-193.

Boritzki, T. J. et al. (1988), Biochem. Pharmacol., 37,4063-4068.

Brady, M. E. et al. (1999), J. Biol. Chem., 274 : 17599-17604.

Brandt, T. L. et al. (1997), J. Biol. Chem., 272,6278-6284.

Brou, C. et al. (1993), EMBO J., 12,489-499.

Buckholz, R. G. (1993), Curr. Op. Biotechnology, 4,538-542.

Burg, J. L. et al. (1996), Mol. and Cell. Probes, 10,257-271.

Chu, B. C. F. et al. (1986), Nucleic Acids Res., 14,5591-5603.

Chung, T. D. Y. et al. (1989), Proc. Natl. Acad. Sci. USA, 86,9431- 9435.

Darzynkiewicz et al. (1994), Methods in Cells Biology, 41,421-435.

Deffie, A. M. et al. (1989), Cancer Res., 49,58-62.

De Vries, L. et al. (1995), Proc. Natl. Acad. Sci. USA, 92,11916- 11920.

Devys et al. (1993), Nature Genet., 4,335-340.

Drake, F. H. et al., Biochemistry, 28,8154-8160.

Duck, P. et al. (1990), Biotechniques, 9,142-147.

Edwards, C. P. and Aruffo, A. (1993), Curr. Op. Biotechnology, 4, 558-563.

Erlich, H. A. (1989), New York : Stockton Press.

Flouriot et al. (1998), Mol. Endrocrinol., 12 : 1239-254.

Fry, A. M. et al. (1991), Cancer Res., 51,6592-6595.

Furth et al. (1992), Anal. Biochem., 205 : 365.

Gaub, M. P. et al. (1998), J. Histochem Cytochem., 46,1103-1111.

Goetz, J. et al. (1996), J. Biol. Chem., 271 : 29589-29598.

Goswami, P. C. et al. (1996), Mol. Cell. Biol., 16,1500-1508.

Grandien (1996), Mol. Cell. Endrocrinol., 116 : 207-212).

Griffin et al. (1999), Mol. Endocrinol. 13 : 1571-1587.

Gruba et al. (1998), Cancer Res., 58 : 5267-5270.

Guatelli, J. C. et al. (1990), Proc. Natl. Acad. Sci. USA, 87,1874- 1878.

Guinee, D. G. et al. (1996), Cancer, 78,729-735.

Haddad et al. (1988), Human Genet., 103 : 619-625.

Heck, M. M. et al. (1988), Proc. Natl. Acad. Sci. USA, 85,1086- 1090.

Herzog, C. E. and Zwelling, L. A. (1997), Biochem. Biophys. Res.

Commun., 232,608-612.

Hochhauser, D. et al. (1992), J. Biol. Chem., 267,18961-18965.

Hoglund et al. (1998), Genes Chromosomes Cancer, 21 : 8-16.

Hopfner et al. (2000), Cancer Res., 60 : 121-128.

Hromas et al. (1996), Curr. Top. Microbiol. Chem., 211 : 159-164.

Innis, M. A. et al. (1990), Academic Press.

Inouye, C. et al. (1994), DNA Cell Biol., 13,731-742.

Isaacs, R. J. et al., Biochim. Biophys. Acta, 1400,121-137.

Isaacs, R. J. et al. (1996), J. Biol. Chem., 271,16741-16747.

Jenkins, J. R. et al. (1992), Nucleic Acids Res., 20,5587-5592.

Kassel, O. et al. (1998), Mol. Pharmacol., 54,1073-1079.

Kennerdell, J. R. and Carthew, R. W. (1998), Cell, 95,1017-1026.

Kievitis, T. et al. (1991), J. Virol. Methods, 35,273-286.

Kohler, G. et al. (1975), Nature, 256 (5517), 495-497.

Kubo, T. et al. (1995), Cancer Res., 55,3860-3864.

Kwoh, D. Y. et al. (1989), Proc. Natl. Acad. Sci. USA, 86,1173- 1177.

Landegren, U. et al. (1988), Science, 241,1077-1080.

Lavie, J. et al. (1999), J. Biol. Chem., 274,2308-2314.

Lee et al. (1998), Cancer Res., 58 : 1140-1143.

Lim, K. et al. (1998), Biochem. Mol. Biol. Int., 46,35-42.

Lizardi, P. M. et al. (1988), Bio/technology, 6,1197-1202.

Luckow, V. A. (1993), Curr. Op. Biotechnology, 4,564-572.

Martinez et al. (1997), Cancer Res., 57 : 1180-1187.

Matthews, J. A. et al. (1988), Anal. Biochem., 169 : 1-25.

Miele, E. A. et al. (1983), J. Mol. Biol., 171 : 281-295.

Nagase et al. (1990), J. Biol. Chem., 265 : 17300-17306.

Nitiss, J. L. (1998), Biochim. Biophys. Acta, 1400,63-81.

Olins, P. O. and Lee, S. C. (1993), Curr. Op. Biotechnology, 4,520- 525.

Pommier, Y. et al. (1994), Cancer Invest., 12,530-542.

Ponglikitmongkol et al. (1988), EMBO J. 7 : 3385-3388.

Rio, M. C. et al. (1987), Proc. Natl. Acad. Sci. USA, 84,9243-9247.

Qian et al. (1995), Genomics, 28 : 66-73.

Reese et al. (1996), Large Scale Sequencing Specific Neural Networks for Promoter and Splice Recognition. Biocomputing : Proceedings of the 1996 Pacific Symposium. Edited by Lawrence Hunter and Terri E. World Scientific Singapore, 1996, January 27, 1996.

Rochette-Egly, C. et al. (1997), Cell, 90,97-107.

Roskell, D. E. et Biddolph, S. C. (1999), Eur. J. Med. Res. 26,105- 106.

Rolfs, A. et al. (1991), Berlin : Springer-Verlag.

Sambrook, J. et al. (1989), Molecular Cloning : A Laboratory Manual, Sec. Ed. Cold Spring Harbor Lab., Cold Spring Harbor, New York.

Sandri, M. I. et al. (1996), Nucleic Acids Res., 24,4464-4470.

Segev, D. (1992), Kessler C. Springer Verlag, Berlin, New-York, 197- 205.

Sherer et al. (1991), Cancer Genet. Cytogenet., 57 : 169-173.

Stone, B. B. et al. (1996). Mol. and Cell. Probes, 10 : 359-370.

Tang et al. (1992), Nature, 356 : 152.

Taniwaki et al. (1996), Leuk. Lymphoma, 21 : 25-30.

Tsai-plugfelder, M. et al. (1988), Proc. Natl. Acad. Sci. USA, 85, 7177-7181.

Walker, G. T. et al. (1992), Nucleic Acids Res., 20 : 1691-1696.

Wang, J. C. (1996), Ann. Rev. Biochem., 65,635-692.

Wang, M. M. and Reed, R. R. (1993), Nature (London), 364,121- 126.

Yamazaki et al. (1996), Acta Oncol., 35,417-423.