Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
CELLULAR GENES INVOLVED IN ONCOGENESIS, PRODUCTS OF SAID GENES AND THEIR DIAGNOSTIC AND THERAPEUTIC USES
Document Type and Number:
WIPO Patent Application WO/2002/022777
Kind Code:
A2
Abstract:
The invention concerns the identification of cellular genes involved in oncogenesis, by insertional mutagenesis of the hepatitis B virus. Besides novel genes (including a gene of the MCM family), the invention further concerns the involvement of TRAP-150, SERCA-1, hTERT, CCT7, NMP 84p, TRKB, TRUP, ST3GalVI, and IP¿3?R¿1? genes in cancerology.

Inventors:
PATERLINI-BRECHOT PATRIZIA (FR)
BRECHOT CHRISTIAN (FR)
Application Number:
PCT/FR2001/002509
Publication Date:
March 21, 2002
Filing Date:
July 31, 2001
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
INST NAT SANTE RECH MED (FR)
PATERLINI BRECHOT PATRIZIA (FR)
BRECHOT CHRISTIAN (FR)
International Classes:
A61P35/00; C07K14/47; C07K14/705; C07K16/18; C07K16/40; C12N9/12; C12N15/12; A61K38/00; (IPC1-7): C12N/
Domestic Patent References:
WO1998011916A11998-03-26
WO2001002568A22001-01-11
WO2001009317A12001-02-08
WO2001022920A22001-04-05
WO2001057190A22001-08-09
Foreign References:
EP1074617A22001-02-07
Other References:
SAIGO K ET AL: "Large scale screening of HBV-DNA integration sites into human liver tumor DNA: Evidence for SERCA1 HBV mediated cisactivation." JOURNAL OF HEPATOLOGY, vol. 28, no. SUPPL. 1, 1998, page 87 XP001006181 33rd Annual Meeting of the European Association for the Study of the Liver;Lisbon, Portugal; April 15-18, 1998 ISSN: 0168-8278
CHAMI M ET AL: "In vivo targeting of SERCA1 gene by hepatitis B virus (HBV) DNA integration in a human hepatocellular carcinoma." BIOPHYSICAL JOURNAL, vol. 76, no. 1 PART 2, janvier 1999 (1999-01), page A381 XP001006182 Forty-third Annual Meeting of the Biophysical Society;Baltimore, Maryland, USA; February 13-17, 1999 ISSN: 0006-3495
DATABASE EMBL [en ligne] 5 juin 1998 (1998-06-05) Database accession no. AA996057 XP002168857 cité dans la demande
DATABASE EMBL [en ligne] 15 mars 1996 (1996-03-15) Database accession no. N67205 XP002168858 cité dans la demande
DATABASE EMBL [en ligne] 17 août 1999 (1999-08-17) Database accession no. AC009318 XP002168859 cité dans la demande
DATABASE EMBL [en ligne] 1 mai 2000 (2000-05-01) Database accession no. Q9UJA3 XP002199303
DATABASE EMBL [en ligne] 20 mars 1987 (1987-03-20) Database accession no. P04191 XP002199304
DAW-JEN TSUEI ET AL: "INVERSE POLYMERASE CHAIN REACTION FOR CLONING CELLULAR SEQUENCES ADJACENT TO INTEGRATED HEPATITIS B VIRUS DNA IN HEPATOCELLULAR CARCINOMAS" JOURNAL OF VIROLOGICAL METHODS,NL,AMSTERDAM, vol. 49, no. 3, 1994, pages 269-284, XP000603737 ISSN: 0166-0934 cité dans la demande
PINEAU PASCAL ET AL: "A t(3;8) chromosomal translocation associated with hepatitis B virus integration involves the carboxypeptidase N locus." JOURNAL OF VIROLOGY, vol. 70, no. 10, 1996, pages 7280-7284, XP002168856 ISSN: 0022-538X cité dans la demande
ZHANG XIAO-KUN ET AL: "Hepatitis B virus DNA integration and expression of an erb B-like gene in human hepatocellular carcinoma." BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS, vol. 188, no. 1, 1992, pages 344-351, XP001002460 ISSN: 0006-291X cité dans la demande
WANG J ET AL: "HEPATITIS B VIRUS INTEGRATION IN A CYCLIN A GENE IN A HEPATOCELLULAR CARCINOMA" NATURE (LONDON), vol. 343, no. 6258, 1990, pages 555-557, XP001002499 ISSN: 0028-0836 cité dans la demande
GOZUACIK DEVRIM ET AL: "Identification of human cancer-related genes by naturally occurring Hepatitis B Virus DNA tagging." ONCOGENE, vol. 20, no. 43, 2001, pages 6233-6240, XP008000449 ISSN: 0950-9232
CHAMI MOUNIA ET AL: "SERCA1 truncated proteins unable to pump calcium reduce the endoplasmic reticulum calcium concentration and induce apoptosis." JOURNAL OF CELL BIOLOGY, vol. 153, no. 6, 11 juin 2001 (2001-06-11), pages 1301-1313, XP002189854 ISSN: 0021-9525
DATABASE EMBL [en ligne] 9 mai 2002 (2002-05-09) Database accession no. CAD27750 XP002199306
DATABASE EMBL [en ligne] 1 décembre 2001 (2001-12-01) Database accession no. Q969I5 XP002199305
DATABASE EMBL [en ligne] 16 octobre 2001 (2001-10-16) Database accession no. O14983 XP002199307
Attorney, Agent or Firm:
Blot, Philippe (Place d'Estienne d'Orves Paris Cedex 09, FR)
Download PDF:
Claims:
REVENDICATIONS
1. Acide nucléique isolé, comprenant une séquence nucléotidique choisie parmi SEQ ID n° 2,12,14,16,18,27,29,1,3,4,5,6,7,8,9,10 et 11 ou une séquence nucléotidique telle qu'elle code pour l'une des séquences d'acides aminés SEQ ID n° 13,15,17,19,28 et 30.
2. Acide nucléique isolé dit 83T, comprenant une séquence nucléotidique comprise entre les nucléotides 881787 et 812959 du supercontig NT 025651.
3. Acide nucléique isolé dit FR7, comprenant une séquence nucléotidique comprise entre les nucléotides 2128117 et 2130561 du supercontig NT 009622.
4. Acide nucléique isolé, comprenant une séquence nucléotidique située à proximité d'une des séquences SEQ ID n° 7 et 10.
5. Polypeptide isolé, comprenant une séquence d'acides aminés choisie parmi SEQ ID n° 13,15,17,19,28 et 30, ou une séquence codée par l'une des séquences nucléotidiques SEQ ID n° 2,12,14,16, 18,27,29,1,3,4, 5, 6,7,8,9,10 et 11, ou par un acide nucléique selon la revendication 2 ou 3.
6. Vecteur de clonage et/ou d'expression comprenant une séquence d'acide nucléique selon la revendication 1,2 ou 3.
7. Cellule hôte transfectée avec unvecteur selon la revendication 6.
8. Procédé de production d'un polypeptide selon la revendication 5, dans lequel un vecteur d'expression selon la revendication 6 est transféré.
9. Utilisation d'un acide nucléique selon la revendication 1,2 ou 3, pour l'obtention de sondes ou d'amorces ayant au moins 15 nucléotides, qui hybrident spécifiquement avec l'une des séquences d'acide nucléique de la revendication 1 ou son complémentaire, dans des conditions stringentes d'hybridation.
10. Anticorps dirigé contre le polypeptide tel que défini dans la revendication 5.
11. Utilisation d'au moins un anticorps selon la revendication 10 pour la détection ou la purification d'un polypeptide tel que défini dans la revendication 5 dans un échantillon biologique.
12. Kit comprenant : au moins un anticorps selon la revendication 10, éventuellement fixé sur un support ; des moyens de révélation de la formation de complexes antigènes/anticorps spécifiques entre le polypeptide de la revendication 5 et ledit anticorps et/ou des moyens de quantification de ces complexes.
13. Procédé de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant les étapes consistant à : a1) mettre en présence un échantillon biologique contenant de I'ADN ou de IARN avec des oligonucléotides spécifiques permettant l'amplification de tout ou partie d'un gène impliqué dans l'oncogenèse ou de son transcrit, ledit gène comprenant une séquence choisie parmi SEQ ID n° 1, 3,7,9,10, 11,20,24,2,12,14,16,18,21,25,27 et 29 ; b1) amplifier ledit ADN ou ARN ; c1) détecter les produits d'amplification ; d1) comparer les produits d'amplification obtenus à ceux obtenus avec un échantillon contrôle, et détecter de cette manière une éventuelle anomalie dans ledit gène ou dans son transcrit, ou encore un nombre anormal de copies dudit gène, indicateur d'une prédisposition à développer une tumeur, ou a2) mettre en présence un échantillon biologique contenant de I'ARNm obtenu à partir d'un prélèvement de cellules suspectes chez un patient, avec des oligonucléotides spécifiques permettant I'amplification de tout ou partie du transcrit dudit gène, comprenant une séquence choisie parmi SEQ ID n° 1, 3,7,9,10,11,20,24,2,12,14,16,18,21,25,27 et 29 ; b2) amplifier ledit transcrit ; c2) détecter et quantifier les produits d'amplification ; une modification du taux de transcrit dudit gène par rapport au contrôle normal étant indicatrice d'une tumeur ou d'une prédisposition à développer une tumeur.
14. Procédé de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant les étapes consistant à : a1) mettre en présence un échantillon biologique contenant de I'ADN ou de I'ARN avec des oligonucléotides spécifiques permettant I'amplification de tout ou partie d'un gène impliqué dans l'oncogenèse ou de son transcrit, ledit gène étant choisi parmi IP3R1, CCT7, NMP p84, TRKB, TRUP, ST3GaIVI ; b1) amplifier ledit ADN ou ARN ; c1) détecter les produits d'amplification ; d1) comparer les produits d'amplification obtenus à ceux obtenus avec un échantillon contrôle, et détecter de cette manière une éventuelle anomalie dans ledit gène ou dans son transcrit, ou encore un nombre anormal de copies dudit gène, indicateur d'une prédisposition à développer une tumeur, ou a2) mettre en présence un échantillon biologique contenant de I'ARNm obtenu à partir d'un prélèvement de cellules suspectes chez un patient, avec des oligonucléotides spécifiques permettant l'amplification de tout ou partie du transcrit dudit gène choisi parmi IP3R1, CCT7, NMP p84, TRKB, TRUP, ST3GaIVI ; b2) amplifier ledit transcrit ; c2) détecter et quantifier les produits d'amplification ; une modification du taux de transcrit dudit gène par rapport au contrôle normal étant indicatrice d'une tumeur ou d'une prédisposition à développer une tumeur.
15. Procédé de diagnostic in vitro d'unetumeur ou d'une prédisposition à développer une tumeur, comprenant les étapes consistant à : a1) mettre en présence un échantillon biologique contenant de J'ADN ou de I'ARN avec des oligonucléotides spécifiques permettant l'amplification de tout ou partie d'un gène impliqué dans l'oncogenèse ou de son transcrit, ledit gène comprenant un acide nucléique isolé selon l'une des revendications 2 ou 3 ; b1) amplifier ledit ADN ou ARN ; c1) détecter les produits d'amplification ; d1) comparer les produits d'amplification obtenus à ceux obtenus avec un échantillon contrôle, et détecter de cette manière une éventuelle anomalie dans ledit gène ou dans son transcrit, ou encore un nombre anormal de copies dudit gène, indicateur d'une prédisposition à développer une tumeur, ou a2) mettre en présence un échantillon biologique contenant de I'ARNm obtenu à partir d'un prélèvement de cellules suspectes chez un patient, avec des oligonucléotides spécifiques permettant l'amplification de tout ou partie du transcrit dudit gène, comprenant un acide nucléique isolé selon l'une des revendications 2 ou 3 ; b2) amplifier ledit transcrit ; c2) détecter et quantifier les produits d'amplification ; une modification du taux de transcrit dudit gène par rapport au contrôle normal étant indicatrice d'une tumeur ou d'une prédisposition à développer une tumeur.
16. Procédé de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant la mise en contact d'au moins un anticorps dirigé contre le polypeptide comprenant une séquence choisie parmi SEQ ID n° 13,15,17,19,22,26,28,30 ou codé par une séquence nucléotidique comprenant une séquence choisie parmi SEQ ID n° 1, 3,7,9,10,11,20,24,2,12,14,16,18,21,25,27,29, avec un prélèvement biologique, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps et la détection et/ou la quantification des complexes immunologiques spécifiques éventuellement formés.
17. Procédé de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant la mise en contact d'au moins un anticorps dirigé contre un polypeptide choisi parmi IP3R1, CCT7, NMP p84, TRKB, TRUP, ST3GaIVI, avec un prélèvement biologique, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps et la détection et/ou la quantification des complexes immunologiques spécifiques éventuellement formés.
18. Procédé de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant la mise en contact d'au moins un anticorps dirigé contre le polypeptide codé par un acide nucléique isolé selon l'une des revendications 2 ou 3, avec un prélèvement biologique, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps et la détection et/ou la quantification des complexes immunologiques spécifiques éventuellement formés.
19. Composition pharmaceutique comprenant un acide nucléique selon l'une des revendications 1,2 ou 3, ou un polypeptide selon la revendication 5, en association avec un véhicule pharmaceutiquement acceptable.
20. Composition pharmaceutique comprenant un acide nucléique antisens de !'acide nucléique selon la revendication 1,2 ou 3, ou un anticorps selon la revendication 10, en association avec un véhicule pharmaceutiquement acceptable.
21. UtiNsation d'un acide nucléique comprenant une séquence choisie parmi SEQ ID n°1, 3,7,9,10,11,20,24,2, 12,14,16,18,21,25,27 et 29, d'un antisens dudit acide nucléique, d'un polypeptide codé par ledit acide nucléique, ou d'un anticorps contre ledit polypeptide pour la fabrication d'un médicament destiné au traitement des tumeurs.
22. Utilisation d'un acide nucléique comprenant une séquence d'un gène choisi parmi IP3R1, CCT7, NMP p84, TRKB, TRUP, ST3GaIVI, d'un antisens dudit acide nucléique, d'un polypeptide codé par ledit acide nucléique, ou dun anticorps contre ledit polypeptide pour la fabrication d'un médicament destiné au traitement des tumeurs.
23. Utilisation d'un acide nucléique selon l'une des revendication 2 ou 3, d'un antisens dudit acide nucléique, d'un polypeptide codé par ledit acide nucléique, ou d'un anticorps contre ledit polypeptide pour la fabrication d'un médicament destiné au traitement des tumeurs.
24. Procédé de détection de gènes impliqués dans l'oncogenèse comprenant les étapes consistant à extraire de I'ADN à partir d'un tissu de foie tumoral ; amplifier in vitro par AluPCR une séquence nucléotidique à la jonction ADN viral/ADN cellulaire ; séquencer ladite séquence nucléotidique, identifier un ou des gènes comprenant ou situé (s) à proximité de ladite séquence ainsi séquencée ; caractérisé en ce que l'étape d'amplification utilise une amorce comprenant la séquence 5'TGCCCAAGGTCTTACATAAGAGGA3'.
25. Utilisation d'un gène identifié par le procédé selon la revendication 24 pour le diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur.
26. Utilisation d'un gène identifié par le procédé selon la revendication 24, d'un antisens dudit gène, d'un polypeptide codé par ledit gène, ou d'un anticorps contre lodit polypeptide pour la fabrication d'un médicament destiné au traitement des tumeurs.
Description:
GENES CELLULAIRES IMPLIQUES DANS L'ONCOGENESE, LES PRODUITS DE CES GENES ET LEURS APPLICATIONS DIAGNOSTIQUES ET THERAPEUTIQUES.

L'invention a trait à l'identification de gènes cellulaires impliqués dans l'oncogénèse, et en particulier susceptible de jouer dans la carcinogénese hépatique.

L'infection chronique par le virus de l'hépatite B (VHB), un virus de la famille Hepadna, est un facteur étiologique majeur du carcinome hépatocellulaire (CHC), la forme histologique la plus fréquente de cancer primitif du foie. Au cours des dernières années, il a été clairement montré que le VHB est impliqué dans le processus de carcinogenèse hépatique par trois mécanismes synergiques : a) la réponse immune aux antigènes viraux est à la base d'une inflammation hépatique chronique qui peut évoluer en cirrhose. La cirrhose, caractérisée par la régénération hépatocytaire et la fibrose hépatique, est une pathologie pré-tumorale qui évolue en CHC avec une fréquence de 5 % par an ; b) le génome viral détermine l'expression de protéines virales (X, protéine PreS2/S tronquée) qui peuvent moduler directement les voies cellulaires de transduction du signal et, par ce biais, la prolifération et viabilité cellulaire ; c) le génome viral s'intègre dans le génome cellulaire dans la quasi-totalité des carcinomes CHC associés au VHB. Cette intégration a été montrée induire une instabilité chromosomique et, parfois, activer en cis (cis- activation ou mutagenèse insertionnelle) des gènes cellulaires situés à proximité du site d'intégration (Paterlini et al, 1994).

Les stratégies de clonage conventionnelles mises en oeuvre depuis une vingtaine d'années n'ont pas permis d'identifier des sites communs d'intégration du VHB dans I'ADN cellulaire des carcinomes CHC. Des gènes proches des sites d'intégration du virus n'ont été trouvés que dans cinq tumeurs seulement (Pineau et al, 1996 ; Zhang et al, 1992 ; Dejean et al, 1986 ; Wang et al, 1990 ; Tsuei et al, 1994), le nombre total des tumeurs étudiées restant faible. Dans deux cas seulement, à savoir l'intégration du gène RAR-ß et celle du gène cycline A2, des analyses complémentaires ont été menées pour démontrer l'effet transformant de l'intégration du VHB. Malgré cela, la conclusion générale de ces études était que la mutagenèse insertionnelle relative au VHB était un événement anecdotique dans le CHC.

Mettant à profit une technique de PCR utilisant des amorces spécifiques des séquences Alu (Minami et al, 1995), les auteurs de la présente invention sont maintenant parvenus à cribler 45 tumeurs CHC positives pour le VHB et à isoler parmi celles-ci 21 sites d'intégration du VHB dans le génome cellulaire, à partir de 18 tumeurs. 13 séquences gnomiques cellulaires flanquant ces sites d'intégration ont ainsi été identifiées. 11 de ces séquences ont indiqué t'existence de gènes d'intérêt à proximité des sites d'intégration.

Ces gènes correspondent soit à des gènes inconnus jusque là, soit à des gènes connus mais dont l'implication en oncogénèse n'avait pas été rapportée ou confirmée. II s'agit en particulier des séquences des gènes connus suivants : -le gène TRAP 150 considéré comme codant pour une protéine d'un complexe co-activateur de récepteur nucléaire (protéine désignée "Thyroïd hormone ReceptorAssociated Protein"), (Ito et al, 1999) ; -le gène hTERT qui code pour la télomérase humaine, qui catalyse la synthèse de I'ADN télomérique des chromosomes (Urquidi et al, 2000) ; -le gène SERCA 1 pour Sarco/Endoplasmic Reticulum Calcium ATPase, qui code pour une pompe calcique qui transfère le calcium du cytosol au réticulum endoplasmique (Chami et al, 2000) ; -le gène IP3R1 (récepteur inositol 1,4,5-triphosphate de type 1) qui code pour un canal calcique intracellulaire, localisé au niveau de la membrane du réticulum endoplasmique, et qui contrôle la libération de calcium à partir de ce compartiment en direction du cytosol, en réponse à des signaux induits par des récepteurs tyrosine kinase et des récepteurs de la membrane plasmique couplés aux protéines G.

Les séquences d'acides nucléiques identifiées sont présentées dans la liste de séquences annexée. Dans cette liste, SEQ ID n° 1 est la séquence nucléotidique cellulaire proche d'un site d'intégration du VHB dans la tumeur désignée FR7 par les inventeurs, la séquence-SEQ ID n°2 étant la partie transcrite de cette séquence.

Les séquences SEQ ID n° 3 à n° 10 sont les séquences nucléotidiques présentes de façon unique dans le génome cellulaire, qui sont à

proximité des sites d'intégration du VHB, respectivement dans les tumeurs désignées 54T, 83T, 95T, FR2, FR3, SA1, SA2, et GR2S.

La séquence SEQ ID n° 11 représente la séquence cellulaire trouvée à proximité du site d'insertion du VHB dans la tumeur désignée 77T par les inventeurs (séquence cellulaire que l'on retrouve dans la séquence du clone génomique AL035461 de Genbank).

Les séquences SEQ ID n° 1,3 à 11,20 et 23-24 correspondent aux 13 séquences cellulaires flanquant les sites d'intégration du génome du VHB.

La séquence SEQ ID n°12 est la séquence d'ADNc isolée d'un foie normal par les inventeurs, identifiée par ceux-ci comme codant pour une nouvelle protéine membre de la famille des protéines MCM (pour "Minichromosome maintenance", Bik K. Tye, 1999), et désignée MCM8. La séquence d'acides aminés correspondante est représentée par la SEQ ID n°13.

Les séquences nucléotidiques SEQ ID n° 14,16 et 18 sont des séquences également transcrites du gène MCM8, suite à trois épissages différents. Les séquences SEQ ID n°15, 17 et 19 représentent les séquences d'acides aminés codées respectivement par ces séquences nucléotidiques.

La séquence SEQ ID n° 20 représente la séquence cellulaire trouvée à proximité du site d'insertion du VHB dans la tumeur désignée 100T par les inventeurs (correspondant au gène TRAP 150), ia séquence SEQ ID n° 21 étant la séquence de I'ADNc du gène TRAP 150, et la séquence SEQ ID n° 22, la séquence d'acides aminés correspondante.

Les séquences SEQ ID n° 23 et 24 représentent les séquences cellulaires trouvées à proximité de sites d'intégration du VHB dans les tumeurs désignées 83T et 86T respectivement, correspondant aux gènes hTERT et hSERCA1.

La séquence SEQ ID n° 25 représente la séquence de I'ADNc du gène SERCA 1 complet et la séquence SEQ ID n° 26, la séquence d'acides aminés correspondante.

Les séquences SEQ ID n°27 et 29 sont des séquences transcrites du gène SERCA1, désignées respectivement S1T+4 et S1T-4,

produites par épissage de i'exon 11 et épissage alternatif de 1'exon 4 (la forme S1T-4 présentant un épissage de 1'exon 4 et de 1'exon 11, et la forme S1T+4 ne présentant qu'un épissage de !'exon 11). Les séquences SEQ ID n° 28 et 30 sont les séquences d'acides aminés correspondantes, respectivement.

Les séquences SEQ ID n° 31 et 33 représentent les gènes identifiés à proximité de la séquence cellulaire (SEQ ID n°4) flanquant un des deux sites d'intégration du VHB dans la tumeur désignée 83T, et correspondent respectivement au nouveau gène appelé 83T et au gène CCT7.

Les séquences SEQ ID n° 32 et 34 sont les séquences polypeptidiques correspondant aux séquences SEQ ID n° 31 et 33.

Les séquences SEQ iD n° 35, 37,39,41 et 43 représentent les gènes identifiés à proximité des séquences cellulaires flanquant les sites d'intégration du VHB dans les tumeurs 54T, 95T, FR2, SA1 et SA2 respectivement, correspondant au gène de la Nuclear Matrix Protein p84, aux gènes TRKB, TRUP, ST3GaIVI et IP3R1 ; les séquences SEQ ID n° 36,38,40, 42 et 44 étant les séquences polypeptidiques correspondantes.

Par"à proximité", on entend les séquences nucléotidiques dont au moins l'une des bases est située au plus à environ 80 kb, de préférence au plus à environ 150 kb, de préférence encore au plus à environ 200 kb, en amont ou en aval des séquences cellulaires identifiées flanquant un site d'intégration de I'ADN du VHB.

Un premier aspect de l'invention vise donc une méthode de détection de gènes impliqués dans l'oncogenèse par identification de gènes contenant ou situés à proximité d'une séquence nucléotidique cellulaire flanquant un site d'intégration du génome du VHB. La méthode de détection selon l'invention comprend notamment les étapes consistant à extraire de I'ADN à partir d'un tissu de foie tumoral, amplifier in vitro une séquence nucléotidique à la jonction ADN viral/ADN cellulaire, à séquencer ladite séquence nucléotidique, et à identifier un ou des gènes comprenant ou situé (s) à proximité de ladite séquence ainsi séquence.

L'extraction d'ADN à partir de tissus est réalisée selon les méthodes bien connu de I'homme du métier, par exemple par extraction au phénol précédée ou non de digestion par la protéinase K.

L'identification des gènes d'intérêt est réalisé par comparaison de séquence avec des gènes connus déposés dans des banques de données ou avec des gènes prédits par un logiciel d'analyse de séquences, tel que Genescan, dans des clones gnomiques ou supercontigs.

Plus particulièrement, I'étape d'amplification repose sur une technique d'Alu-PCR utilisant des amorces spécifiques du gène VHB-X et de la séquence répétée Alu (Minami et al, 1995). Afin d'éviter une amplification entre des séquences Alu, une première amplification met en jeu des amorces synthétisées avec des dUTP au lieu de dTTP. Ces amorces sont détruites après 10 cycles de réplication, notamment par l'enzyme uracyl DNA glycosylase. Seules les séquences spécifiquement ciblées sont ensuite amplifiées avec une amorce spécifique de la région VHB-X et une séquence tag introduit dans t'amorce spécifique de la séquence Alu. Selon un mode particulier de réalisation, d'amplification met en jeu quatre étapes d'amplification utilisant successivement les couples d'amorces HB1 (SEQ ID n° 47)/A5 (SEQ ID n° 48), HB2 (SEQ ID n° 49)/Tag5 (SEQ ID n° 50), 26C (SEQ ID n° 52)/Tag 5 (SEQ ID n° 50) et MX2 (SEQ ID n°53)/Tag5 (SEQ ID n°50).

Un autre aspect de l'invention vise un acide nucléique isolé, comprenant une séquence nucléotidique cellulaire choisie parmi SEQ ID n° 1, 3,4,5,6,7,8,9,10,11,20,23 et 24, ou situé à proximité d'une de ces séquences. En particulier, cet acide nucléique correspondra à un gène.

La présente invention concerne notamment l'utilisation de la séquence SEQ ID n° 7 ou SEQ ID n° 10 pour l'identification de. gènes impliqués dans l'oncogénèse. Plus particulièrement, l'invention concerne l'utilisation de la séquence SEQ ID n° 7 ou SEQ ID n° 10 pour l'identification de nouveaux gènes situés à proximité de ces séquences.

L'invention concerne en particulier un acide nucléique isolé, comprenant une séquence nucléotidique choisie parmi SEQ ID n° 2,12,14,16, 18,27,29,31,45,1,3,4,5,6,7,8,9,10 et 11 ou une séquence nucléotidique

telle qu'elle code pour l'une des séquences d'acides aminés SEQ ID n° 13, 15, 17,19,28,30, et 46.

II est entendu que sont également comprises les séquences homologues desdites séquences identifiées, définies comme : i) des séquences similaires à au moins 70 % de l'une des séquences identifiées ; ou ii) des séquences hybridant avec l'une desdites séquences identifiées ou sa séquence complémentaire, dans des conditions stringentes d'hybridation, ou iii) des séquences codant pour un polypeptide, tel que défini plus bas.

De préférence, une séquence nucléotidique homologue selon l'invention est similaire à au moins 75 % des séquences identifiées, de préférence encore au moins 85 %, ou au moins 90 %.

De manière préférentielle, une telle séquence nucléotidique homologue hybride spécifiquement aux séquences complémentaires de l'une des séquences identifiées dans des conditions stringentes. Les paramètres définissant les conditions de stringence dépendent de la température à laquelle 50% des brins appariés se séparent (Tm).

Pour les séquences comprenant plus de 30 bases, Tm est définie par la relation : Tm=81, 5+0,41 (% G+C) +16, 6Log (concentration en cations)- 0,63 (% formamide)- (600/nombre de bases) (Sambrook et al., 1989).

Pour les séquences de longueur inférieure à 30 bases, Tm est définie par la relation : Tm= 4 (G+C) + 2 (A+T).

Dans des conditions de stringence appropriées, auxquelles les séquences aspécifiques n'hybrident pas, la température d'hybridation peut être de préférence de 5 à 10°C en dessous de Tm, et les tampons d'hybridation utilisés sont de préférence des solutions de force ionique élevée telle qu'une solution 6xSSC par exemple.

Le terme"séquences similaires"employé plus haut se réfère à la ressemblance parfaite ou identité entre les nucléotides comparés mais aussi à la ressemblance non parfaite que l'on qualifie de similitude. Cette recherche de

similitudes dans les séquences nucléiques distingue par exemple les purines et les pyrimidines.

Une séquence nucléotidique homologue inclut donc toute séquence nucléotidique qui diffère de l'une des séquences identifiées, par mutation, insertion, délétion ou substitution d'une ou plusieurs bases, ou par la dégénérescence du code génétique.

Parmi de telles séquences homologues, sont comprises les séquences des gènes de mammifères autres que I'homme, de préférence d'un primate, d'un bovin, ovin ou porc, ou encore d'un rongeur, ainsi que les variants alléliques.

L'invention a également pour objet des polypeptides isolés codés par ces acides nucléiques. En particulier, l'invention comprend un polypeptide isolé, comprenant une séquence d'acides aminés choisie parmi SEQ ID n° 13, 15,17,19,28,30,32 et 46, ou une séquence codée par l'une des séquences nucléotidiques SEQ ID n° 2, 12,14,16,18,27,29,31,45,1,3,4,5,6,7,8,9, 10 et 11 ou par une séquence nudéotidique située à proximité d'une des séquences SEQ ID n° 7 et 10.

L'invention a plus particulièrement pour objet un polypeptide isolé comprenant la séquence SEQ ID n°13, identifié comme un nouveau. membre de la famille des protéines MCM.

II est entendu que sont égaiement comprises les. séquences homologues, définies comme : i) les séquences similaires à au moins 70% de l'une des séquences d'acides aminés identifiées ; ou ii) les séquences codées par une séquence d'acide nucléique homologue telle que définie précédemment, c'est-à-dire une séquence d'acide nucléique hybridant avec l'une des séquences nucléotidiques identifiées ou sa séquence complémentaire, dans des conditions stringentes d'hybridation.

Là encore, le terme"similaires"se réfère à la ressemblance parfaite ou identité entre les acides aminés comparés mais aussi à la ressemblance non parfaite que l'on qualifie de similitude. Cette recherche de similitudes dans une séquence polypeptidique prend en compte les

substitutions conservatives qui sont des substitutions d'acides aminés de même classe, telles que des substitutions d'acides aminés aux chaînes latérales non chargées (tels que I'asparagine, la glutamin, la serine, la thréonine, et la tyrosine), d'acides aminés aux chaînes latérales basiques (tels que la lysine, I'arginine, et I'histidine), d'acides aminés aux chaînes latérales acides (tels que I'acide aspartique et I'acide glutamique) ; d'acides aminés aux chaînes latérales polaires (tels que la glycine, I'alanine, la valine, la leucine, I'isoleucine, la proline, la phénylalanine, la méthionine, le tryptophane, et la cystéine).

Plus généralement, par « séquence d'acides aminés homologue », on entend donc toute séquence d'acides aminés qui diffère de la séquence d'acides aminés identifiée par substitution, délétion et/ou insertion d'un acide aminé ou d'un nombre réduit d'acides aminés, notamment par substitution d'acides aminés naturels par des acides aminés non naturels ou pseudoacides aminés à des positions telles que ces modifications ne portent pas significativement atteinte à l'activité biologique du polypeptide codé.

De préférence, une telle séquence d'acides aminés homologue est similaire à au moins 85 % de la séquence identifiée, de préférence au moins 95 %.

L'homologie est généralement déterminée en utilisant un logiciel d'analyse de séquence (par exemple, Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705). Des séquences d'acides aminés similaires sont alignées pour obtenir le maximum de degré d'homologie (i. e. identité ou similitude, comme défini plus haut). A cette fin, il peut être nécessaire d'introduire de manière artificielle des espaces (« gaps ») dans la séquence. Une fois I'alignement optimal réalisé, le degré d'homologie est établi par enregistrement de toutes les positions pour lesquelles les acides aminés des deux séquences comparées sont identiques, par rapport au nombre total de positions.

Un aspect particulier de l'invention concerne par ailleurs de nouvelles formes de transcrits des gènes MCM8 et SERCA1, qui se distinguent

des transcrits codant pour les protéines MCM8 et SERCA1 par un épissage différentiel.

L'invention a donc également pour objet un acide nucléique comprenant une séquence nucléotidique choisie parmi SEQ ID n°14, 16,18,27 et 29, étant entendu que sont comprises toutes séquences homologues, I'homologie étant définie de manière analogue à la définition donnée plus haut.

L'invention a également pour objet un polypeptide comprenant une séquence d'acides aminés codée par ladite séquence nucléotidique, telle que les séquences SEQ ID n°15, 17,19,28 ou 30.

Ces formes variantes de MCM8 et SERCA1 se retrouvent dans un ensemble de tissus sains (non-tumoraux), et codent pour des protéines qui pourraient moduler l'activité des protéines de type sauvage MCM8 et SERCA respectivement.

Plus particulièrement, I'expression des formes tronquées de SERCA1 peut induire une mort cellulaire apoptotique.

Les auteurs de l'invention on en outre montré que les protéines tronquées SERCA1 ont un effet dominant négatif à la fois sur SERCA1 et SERCA2b. Ils ont par ailleurs mis en évidence un rôle régulateur de ces protéines sur les stocks calciques du réticulum endoplasmique (RE), en favorisant la fuite du calcium du RE.

Les polypeptides de la présente invention peuvent être synthétisés par toutes les méthodes bien connues de l'homme du métier. Les polypeptides de l'invention peuvent par exemple être synthétisés par les techniques de la chimie de synthèse, telles que la synthèse de type Merrifield qui est avantageuse pour des raisons de pureté, de spécificité antigénique, d'absence de produits secondaires non désirés et pour sa facilité de production.

Une protéine recombinante peut également être produite par un procédé, dans lequel un vecteur contenant un acide nucléique comprenant l'une des séquences identifiées ou une séquence homologue est transféré dans une cellule hôte qui est mise en culture dans des conditions permettant 1'expression du polypeptide correspondant.

La protéine produite peut ensuite être récupérée et purifiée.

Les procédés de purification utilisés sont connus de l'homme du métier. Le polypeptide recombinant obtenu peut être purifié à partir de lysats et extraits cellulaires, du surnageant du milieu de culture, par des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immunoaffinité à I'aide d'anticorps mono-ou polyclonaux spécifiques, etc.

La séquence d'acide nucléique d'intérêt peut être insérée dans un vecteur d'expression, dans lequel elle est liée de manière opérante à des éléments permettant la régulation de son expression, tels que notamment des promoteurs, activateurs et/ou terminateurs de transcription.

Les signaux contrôlant l'expression des séquences nucléotidiques (promoteurs, activateurs, séquences de terminaison...) sont choisis en fonction de t'hôte cellulaire utilisé. A cet effet, les séquences nucléotidiques selon l'invention peuvent être insérées dans des vecteurs à réplication autonome au sein de t'hôte choisi, ou des vecteurs intégratifs de t'hôte choisi. De tels vecteurs seront préparés selon les méthodes couramment utilisées par I'homme du métier, et les clones en résultant peuvent être introduits dans un hôte approprié par des méthodes standard, telles que par exemple t'étectroporation ou la précipitation au phosphate de calcium.

Les vecteurs de clonage et/ou d'expression tels que décrits ci- dessus, contenant une séquence nucléotidique définie selon l'invention font également partie de la présente invention.

L'invention vise en outre les cellules hôtes transfectées, de manière transitoire ou stable, par ces vecteurs d'expression. Ces cellules peuvent être obtenues par l'introduction dans des cellules hôtes, procaryotes ou eucaryotes, d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus, puis la mise en culture desdites cellules dans des conditions permettant la réplication et/ou l'expression de la séquence nucléotidique transfectée.

Des exemples de cellules hôtes incluent notamment des cellules de mammifères, telles que les cellules COS-7,293, MDCK, des cellules d'insectes telles que les cellules SF9, des bactéries telles que E. coli et des souches de levures telles que L40 et Y90.

Les séquences nucléotidiques de l'invention peuvent être d'origine artificielle ou non. II peut s'agir de séquences d'ADN ou d'ARN, obtenues par criblage de banques de séquences au moyen de sondes élaborées sur la base des séquences identifiées. De telles banques peuvent être préparées par des techniques classiques de biologie moléculaire, connues de I'homme de I'art.

Les séquences nucléotidiques selon l'invention peuvent égaiement être préparées par synthèse chimique, ou encore par des méthodes mixtes incluant la modification chimique ou enzymatique de séquences obtenues par criblage des banques.

Les séquences nucléotidiques de l'invention permettent la réalisation de sondes ou amorces, hybridant spécifiquement avec l'une des séquences identifiées selon l'invention, ou son brin complémentaire. Les conditions d'hybridation appropriées correspondent aux conditions de température et de force ionique usuellement utilisées par I'homme du métier, de préférence dans des conditions stringentes telles que définies précédemment. Ces sondes peuvent être utilisées comme outil de diagnostic in vitro pour la détection, par des expériences d'hybridation, notamment d'hybridation"in situ", de transcrits spécifiques des polypeptides de l'invention dans des échantillons biologiques ou pour la mise en évidence de synthèses aberrantes ou d'anomalies génétiques résultant d'un polymorphisme, de mutations ou d'un mauvais épissage.

Les acides nucléiques de l'invention utiles comme sondes comportent au minimum 15 nucléotides, préférentiellement au moins 20 nucléotides, préférentiellement encore au moins 100 nucléotides, mais sont de préférence inférieurs à la longueur totale des séquences cellulaires identifiées.

Les acides nucléiques utiles comme amorces comportent au minimum 15 nucléotides, de préférence au moins 18 nucléotides, et préférentiellement moins de 40 nucléotides.

Plus précisément, la présente invention a pour objet un acide nucléique ayant au moins 15 nucléotides, qui hybride spécifiquement avec l'une des séquences d'acide nucléique identifiées ou son complémentaire, dans des conditions stringentes d'hybridation.

Préférentiellement, les sondes ou amorces de l'invention sont marquées, préalablement à leur utilisation. Pour cela, plusieurs techniques sont à la portée de t'homme du métier comme par exemple le marquage fluorescent, radioactif, chimioluminescent ou enzymatique. Les séquences identifiées par les auteurs d l'invention peuvent par ailleurs être liées à des peptides pour former des PNAs ("peptide nucleic acids", Nielsen PE et al, 1993) utiles notamment comme sondes facilement détectables.

Les méthodes de diagnostic in vitro dans lesquelles ces oligonucléotides sont mis en oeuvre pour la détection de mutations ou de remaniements génomiques, au niveau des gènes décrits ici, ou encore pour la détection de copies surnuméraires de ces gènes sont incluses dans la présente invention.

L'homme du métier connaît bien les méthodes standard pour analyser l'ADN contenu dans un échantillon biologique et pour diagnostiquer un désordre génétique. De nombreuses stratégies d'analyse génotypique sont disponibles (Antonarakis et a/., 1989 ; Cooper et a/., 1991).

De préférence, on peut utiliser la méthode DGGE (Electrophorèse sur gel de gradient dénaturant), la méthode SSCP (Polymorphisme de conformation simple brin) ou la méthode DHPLC (Chromatographie liquide haute performance dénaturante ; Kuklin et al., 1997 ; Huber et a/., 1995) pour détecter une anomalie dans les gènes décrits. De telles méthodes sont de préférence suivies par un séquençage direct. Le procédé de RT-PCR peut être avantageusement mis en oeuvre pour détecter des anomalies dans les transcrits des gènes décrits, car il permet de visualiser les conséquences d'une mutation d'épissage provoquant la perte d'un ou plusieurs exons au niveau du transcrit, ou un épissage aberrant dû à I'activation d'un site cryptique. Ce procédé est également de préférence suivi d'un séquençage direct. Les procédés plus récemment développés utilisant des puces à ADN peuvent

également être mis en oeuvre pour détecter une anomalie dans les gènes décrits (Bellis et a/., 1997).

De manière générale, les séquences identifiées ou des fragments de celles-ci peuvent être utilisées pour la fabrication de puces à ADN de type "microarrays" (comprenant des ADNc) ou"DNA chips" (comprenant des oligonucléotides synthétisés in situ ou fixés après synthèse).

Ces puces comprennent un très grand nombre de sondes différentes (jusqu'à plusieurs dizaines de milliers sur une surface d'environ 1 cm2) fixées sur un support inerte, chacune en un endroit précis. Ces puces peuvent être mises en présence d'un échantillon d'acides nucléiques marqués à tester et les séquences complémentaires aux sondes s'apparient. Les séquences de l'invention peuvent ainsi être intégrées à ces puces en tant que sondes. Les puces sont particulièrement avantageuses dans le cadre d'un diagnostic génétique, comme vu ci-dessus, mais aussi pour l'identification de gènes inconnus revêtant, par hybridation avec les séquences de l'invention, une implication éventuelle dans l'oncogénèse.

L'invention a également pour objet des anticorps dirigés contre les polypeptides tels que définis précédemment.

II peut s'agir d'anticorps poly-ou monoclonaux ou de leurs fragments, d'anticorps chimériques, notamment humanisés ou immunoconjugues.

Les anticorps polyclonaux peuvent être obtenus à partir du sérum d'un animal immunisé contre un polypeptide selon les modes opératoires usuels.

Selon un mode de réalisation de l'invention, on peut utiliser comme antigène un fragment peptidique approprié, tel que défini plus haut, pouvant être couplé par l'intermédiaire d'un résidu réactif à une protéine ou un autre peptide. Des lapins sont immunisés avec t'équivalent de 1 mg de t'antigène peptidique selon la procédure décrite par Benoit et al. (1982). A des intervalles de quatre semaines, les animaux sont traités par des injections de 200 ug d'antigène et saignés 10 à 14 jours plus tard. Après la troisième injection, t'anti-sérum est examiné pour déterminer sa capacité à se lier au

peptide antigène radiomarqué à l'iode, préparé par la méthode chloramine-T et est ensuite purifié par une chromatographie sur colonne échangeuse d'ion carboxyméthyl-cellulose (CMC). Les molécules d'anticorps sont ensuite recueillies dans les mammifères et isolées jusqu'à la concentration souhaitée par les méthodes bien connues de t'homme de I'art, par exemple, en utilisant DEAE Sephadex pour obtenir la fraction IgG.

Afin d'augmenter la spécificité du sérum polyclonal, les anticorps peuvent être purifiés par une chromatographie d'immuno-affinité en utilisant des polypeptides immunisant en phase solide. L'anticorps est mis en contact avec le polypeptide immunisant en phase solide pendant une durée suffisante de façon à faire immuno-réagir le polypeptide avec la molécule d'anticorps afin de former un complexe immunologique en phase solide.

Les anticorps monoclonaux peuvent être obtenus selon la méthode classique de culture d'hybridomes décrite par Köhler et Milstein (1975).

Les anticorps ou fragments d'anticorps de l'invention peuvent être par exemple des anticorps chimériques, des anticorps humanisés, des fragments Fab et F (ab') 2. Ils peuvent également se présenter sous forme d'immunoconjugués ou d'anticorps marqués.

Les anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent notamment être utilisés pour l'analyse par immunohistochimie des polypeptides sur des coupes de tissus spécifiques, par exemple par immunofluorescence, marquage à l'or, immunoperoxydase...

Les anticorps ainsi produits peuvent être avantageusement mis en oeuvre dans toute situation où 1'expression des polypeptides de l'invention doit être observée.

L'invention a plus généralement pour objet l'utilisation d'au moins un anticorps ainsi produit pour la détection ou la purification d'un polypeptide tel que défini précédemment dans un échantillon biologique.

L'invention a également pour objet un kit pour la mise en oeuvre de cette méthode comprenant : -au moins un anticorps spécifique des polypeptides de l'invention, éventuellement fixé sur un support ;

-des moyens de révélation de la formation de complexes antigènes/anticorps spécifiques entre les polypeptides de l'invention et ledit anticorps et/ou des moyens de quantification de ces complexes.

L'invention vise également un procédé de détection in vitro de polypeptides de l'invention ou d'anticorps dirigés contre ces polypeptides dans un échantillon biologique, dans lequel on met en contact ledit échantillon biologique avec respectivement un anticorps ou un polypeptide de l'invention (à savoir notamment un polypeptide comprenant une séquence choisie parmi SEQ ID n° 13, 15,17,19,22,26,28,30,32,34,36,38,40,42,44,46 ou codé par une séquence comprenant une séquence nucléotidique choisie parmi SEQ ID n°43, 1,3,4,5,6,7,8,9,10,11,20,23,24,2,12,14,16,18,21,25,27, 29,31,33,35,37,41,45 ou située à proximité de SEQ ID n° 1, 3,4,5,6,7,8, 9,10,11,20,23 et 24) ou un fragment épitopique de celui-ci et on observe la formation de complexes immuns, révélateurs de la présence de polypeptides de l'invention ou contre ces polypeptides d'anticorps, respectivement dans l'échantillon biologique.

Un autre aspect de l'invention vise les applications diagnostiques et thérapeutiques relatives aux séquences identifiées par les inventeurs à proximité des sites d'intégration du VHB, ainsi que des polypeptides et anticorps correspondants.

Les auteurs de la présente invention ont en effet montré que l'ensemble de ces gènes étaient impliqués dans l'oncogénèse, et plus particulièrement dans la carcinogénèse hépatique.

Ces résultats ouvrent de multiples perspectives dans le domaine de la cancérologie.

Les acides nucléiques comprenant au moins l'une des séquences des gènes décrits précédemment ou leurs homologues, sont utiles pour la détection d'une anomalie dans ces gènes ou dans leurs transcrits.

L'invention a, par suite, pour objet un procédé de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant les étapes consistant à : -mettre en présence un échantillon biologique contenant de I'ADN ou de I'ARN avec des oligonucléotides spécifiques permettant

I'amplification de tout ou partie d'un gène tel que décrit précédemment (à savoir notamment un gène comprenant une séquence choisie parmi SEQ ID n° 43,1,3,7,9,10,11,20,24,2,12,14,16,18,21,25,27,29,31,33,35,37 , 39,41 et 45) ou de son transcrit ; -amplifier ledit ADN ou ARN ; -détecter les produits d'amplification ; -comparer les produits d'amplification obtenus à ceux obtenus avec un échantillon contrôle, et détecter de cette manière une éventuelle anomalie dans ledit gène ou dans son transcrit ou encore un nombre anormal de copies dudit gène, indicateur d'une tumeur ou d'une prédisposition à développer une tumeur.

L'échantillon biologique en question peut notamment être du sang, ou un fragment tissulaire prélevé chez un patient.

L'expression de ces gènes étant retrouvée sur des cellules cancéreuses, les méthodes d'évaluation de l'expression des polypeptides correspondants, à partir de prélèvements de tissus suspects chez des patients, sont également particulièrement avantageuses dans des tests diagnostiques, en anatomopathologie.

Ces méthodes peuvent viser à détecter I'ARNm codant pour ces polypeptides ou ces polypeptides eux-mêmes.

Selon le premier mode de réalisation, I'invention concerne une méthode de diagnostic in vitro d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant les étapes consistant à -mettre en présence un échantillon biologique contenant de I'ARNm obtenu à partir d'un prélèvement de cellules suspectes chez un patient, avec des oligonucléotides spécifiques permettant l'amplification de tout ou partie du transcrit des gènes ciblés (à savoir notamment un gène comprenant une séquence choisie parmi SEQ ID n° 43,1,3,7,9,10,11,20,24,2,12,14, 16,18,21,25,27,29,31,33,35,37,39,41 et 45) ; -amplifier ledit transcrit ; -détecter et quantifier les produits d'amplification ;

une modification du taux de transcrit des gènes ciblés par rapport au contrôle normal étant indicatrice d'une tumeur ou d'une prédisposition à développer une tumeur.

Selon un deuxième mode de réalisation, l'invention concerne une méthode in vitro pour le diagnostic d'une tumeur ou d'une prédisposition à développer une tumeur comprenant la détection ou la mesure du taux d'expression des polypeptides décrits précédemment dans un échantillon biologique, obtenu par exemple à partir d'un prélèvement de cellules suspectes chez un patient.

La présence des polypeptides ou des gènes transcrits des gènes en quantités différentes de la normale peut être corrélée à un pronostic plus ou moins grave, en terme d'agressivité de la tumeur par exemple.

Dans certaines circonstances, où l'on observe par exemple une expression modifiée des polypeptides décrits plus haut, corrélée à un phénotype tumoral, on peut chercher à restaurer ou à stimuler l'activité desdits polypeptides sauvages.

Les polypeptides décrits précédemment ou les acides nucléiques correspondants peuvent alors être utiles à titre de médicament.

L'invention a donc également pour objet une composition pharmaceutique comprenant un polypeptide tel que défini précédemment ou un acide nucléique codant pour ledit polypeptide, en association avec un véhicule pharmaceutiquement acceptable.

Les modes d'administration, les posologies et les formes galéniques des compositions pharmaceutiques selon l'invention, contenant au moins un polypeptide, peuvent être déterminées de manière usuelle par l'homme du métier, notamment selon les critères généralement pris en compte pour l'établissement d'un traitement thérapeutique adapté à un patient, comme par exemple t'âge ou le poids corporel du patient, la gravité de son état général, la tolérance au traitement, et les effets secondaires constatés, etc.

De manière générale, une quantité thérapeutiquement ou prophylactiquement efficace variant d'environ 0,1 ug à environ 1 mg peut être administrée à des adultes humains.

L'invention a également pour objet une composition pharmaceutique comprenant un acide nucléique tel que défini précédemment, et un véhicule pharmaceutiquement acceptable, ladite composition étant destinée à être utilisée en thérapie génique. L'acide nucléique de préférence inséré dans un vecteur généralement viral (tels que les adénovirus et les rétrovirus) peut être administré sous forme nue, exempt de tout véhicule favorisant le transfert à la cellule cible, tels que des liposomes anioniques, des lipides cationiques, des microparticules, par exemple des microparticules d'or, des agents de précipitation, par exemple du phosphate de calcium, ou tout autre agent facilitant la transfection. Dans ce cas, le polynucléotide peut être simplement dilué dans une solution physiologiquement acceptable, telle qu'une solution stérile ou une solution stérile tampon, en présence ou en l'absence d'un véhicule.

De manière alternative, un acide nucléique de l'invention peut être associé à des agents qui facilitent ! a transfection.) i peut être, entre autres, (i) associé à un agent chimique qui modifie la perméabilité cellulaire tel que la bupivacaïne ; (ii) encapsulé dans des liposomes, éventuellement en présence de substances supplémentaires facilitant la transfection ; ou (iii) associé à des lipides cationiques ou des microparticules de silice, d'or ou de tungstène.

Lorsque les constructions d'acide nucléique de l'invention recouvrent des microparticules, celles-ci peuvent être injectées par voie intradermique ou intraépidermique par la technique du canon à gènes,"gene gun" (WO 94/24263).

La quantité à utiliser comme médicament dépend notamment de la construction d'acide nucléique elle-même, de l'individu auquel cet acide nucléique est administré, du mode d'administration et du type de formulation, et de la pathologie. De manière générale, une quantité thérapeutiquement ou prophylactiquement efficace variant d'environ 0,1 pg à environ 1 mg, de préférence d'environ 1 pg à environ 800 ug et, de manière préférentielle d'environ 25 pg à environ 250 ug, peut être administrée à des adultes humains.

Les constructions d'acides nucléiques de l'invention peuvent être administrées par toute voie d'administration conventionnelle telle que notamment par voie parentérale. Le choix de la voie d'administration dépend

en particulier de la formulation choisie. Une administration ciblée au site des tumeurs visées peut être particulièrement avantageuse.

L'invention a donc enfin pour objet une méthode de traitement thérapeutique, dans laquelle on administre à un patient nécessitant un tel traitement, une quantité efficace d'un polypeptide tel que défini précédemment ou un acide nucléique codant pour ce polypeptide, dans le cadre d'une thérapie génique.

Le patient visé est généralement un être humain, mais I'application peut également être étendue à tout mammifère le cas échéant.

A l'inverse, dans d'autres circonstances où l'on observe par exemple une surexpression des polypeptides décrits plus haut, en corrélation avec un phénotype tumoral, on peut chercher à bloquer ou inhiber l'activité desdits polypeptides.

L'invention a donc également pour objet une composition pharmaceutique comprenant un anticorps dirigé contre ledit polypeptide, en association avec un véhicule pharmaceutique acceptable.

L'invention a en outre pour objet une composition pharmaceutique comprenant un acide nucléique comprenant une séquence anti-sens bloquant 1'expression des gènes décrits ci-dessus, en association avec un véhicule pharmaceutiquement acceptable.

La formulation de ces compositions pharmaceutiques et la posologie associée sont à la portée de l'homme du métier, au vu notamment des informations données précédemment, concernant les compositions pharmaceutiques à base de polypeptides ou d'acide nucléique codant pour les polypeptides.

Plus précisément, invention a pour objet l'utilisation d'un acide nucléique comprenant une séquence choisie parmi SEQ ID n° 43, 1,3,7,9, 10,11,20,24,2,12,14,16,18,21,25,27,29,31,33,35,37,39,41 et 45 d'un anti-sens dudit acide nucléique, d'un polypeptide codé par ladite acide nucléique, ou d'un anticorps contre ledit polypeptide pour la fabrication d'un médicament destiné au traitement des tumeurs.

De manière générale, les séquences identifiées par les inventeurs comme étant impliquées dans l'oncogénèse, ou les polypeptides ou anticorps

correspondants peuvent être avantageusement utilisés comme outils pour la recherche (criblage et identification) d'agents thérapeutiques présentant une activité stimulatrice ou inhibitrice ciblée envers ceux-ci.

Les exemples et figures suivants illustrent l'invention sans en limiter la portée : LEGENDE DES FIGURES : -La Figure 1 représente la structure de l'intégration de I'ADN du VHB dans 5 gènes, les codes 86T, 100T, 77T, 83T et FR7 entant les codes des tumeurs CHC de différents patients, présents dans le tableau 1. Le cadre clair ouvert représente la séquence de VHB, VHBX la région X du génome de VHB.

Le nombre au-dessus du cadre indique la dernière base du VHB avant la jonction cellulaire/VHB. La numérotation du génome VHB commence à partir du site EcoR1 hypothétique de sous-type adw. Les cadres hachurés représentent les régions homologues par rapport aux séquences des bases de données, les cadres ombrés représentant les séquences codantes. Les flèches en gras indiquent la direction de l'ORF. La flèche à double-tête marque la longueur de la séquence cellulaire obtenue par Alu-PCR. La ligne en pointillés indique la distance de 10800 paires de base entre la séquence identifiée par les inventeurs et la fin de la séquence codante pour hTERT.

-La Figure 2A représente une structure des ADNc variants de SERCA1 avec un épissage de 1'exon 11 et un épissage alternatif de 1'exon 4, d'après clonage dans un foie normal. L'épissage de I'exon 11 conduit à une séquence mutée de 22 acides aminés (cadre noir), un codon stop prématuré apparaissant dans 1'exon 12.

Les transcrits de SERCA1 épissés codent donc pour des protéines tronquées dans leur partie C-terminale.' -La Figure 2B représente une structure prédite des protéines SERCA1 et S1T. Les numéros sous les dessins indiquent les domaines transmembranaires.

D351 : asparagine 351 phosphorylable.

(.) : résidus transmembranaires de liaison au calcium.

(o) : résidus cytoplasmiques de liaison au calcium.

La séquence C-terminale mutée est représentée en ligne pointillée (22 acides aminés) et le peptide (35 acides aminés) codé pour 1'exon 4 est en gris.

EXEMPLES Exemple 1 : Identification des jonctions ADN viral/ADN cellulaire par la technique Alu-PCR Les auteurs de la présente invention ont développé une nouvelle approche technique à partir d'une méthode PCR utilisant des amorces spécifiques des séquences Alu et des amorces spécifiques du génome du VHB (Minami et al., 1995).

Cette méthode prévoit l'amplification de I'ADN extrait des tumeurs du foie avec t'amorce HB1 (5'ACAUGAACCUUUACCCCGUUGC3', SEQ ID n°47) et t'amorce A5 (5'CAGUGCCAAGUGUUUGCUGACGCCAAAGUGCUGGGAUUACAG3', SEQ ID n°48). L'amplification est réalisée dans un volume final de 50 pI, en tampon Tris pH 8,9 25 mM, acétate de potassium 40 mM, chorure de magnésium 2,5 mM et glycérol 4%, avec 10 pmol et 100 pmol des amorces A5 et HB1 respectivement. Chacun des dNTP est présent à la concentration 200 uM.

L'amplification est réalisée à l'aide des enzymes Taq polymerase (Gibco BRL, MD, USA), 1 unité, et Vent exo + polymerase (New England Biolabs, MA, USA), 0,04 unité. Les conditions de PCR sont les suivantes : dénaturation 30 s à 94 °C, hybridation 30 s à 59 °C, élongation 3 min à 70°C.

Après 10 cycles d'amplification, les amorces HB1 et A5 -synthétisées avec des dUTP à la place des dTTP-sont détruites par ajout d'1 unité de l'enzyme uracyl DNA glycosylase et incubation à 37°C pendant 30 min.

Après 10 min à 94°C, I'amplification est ensuite poursuivie avec 10 pmol de chacunes des l'amorces HB2 (5'GCGCTGCAGTGCCAAGTGTTTGCTGACGC3', SEQ ID n°49) et Tag5

(5'CAAGTGTTTGCTGACGCCAAAG3', SEQ ID n°50) selon les conditions suivantes : 20cycles 30s à 94oC, 30s à 65°C, 3 min à 70°C, avec diminution de la température d'hybridation des amorces de 1°C tous les deux cycles, jusqu'à 55°C 19 cycles 30s à 94°C, 30s à 55°C, 3 min à 70°C cycle final 30s à 94°C, 30s à 55°C, 8 min à 72°C 1 ut de cette amplification est soumis à une PCR à I'aide de t'amorce interne MD60 (5'CTGCCGATCCATACTGCGGAAC3', SEQ ID n°51) et de t'amorce Tag5.

Cette méthode, décrite dans l'article Minami et al. (1995), n'a pas permis d'isoler un nombre important de jonctions ADN viral/ADN cellulaire. Les inventeurs ont alors modifié la technique. Une fois effectuée l'amplification HB2-Tag5, comme décrit dans Minami et al 1995,2 pi de cette amplification sont utilisés pour effectuer une autre amplification avec t'amorce 26C (Poussin K et al., 1999 ; SEQ ID n°52) et t'amorce Tag5. L'amplification 26C-Tag5 est effectuée exactement comme I'amplification HB2-Tag5.2 pI de l'amplification 26C-Tag5 sont ensuite utilisés pour effectuer une amplification à I'aide des amorces MX2 (5'TGCCCAAGGTCTTACATAAGAGGA3', SEQ ID n°53) et Tag5.

La séquence MX2, hautement conservée dans les différents sous-types de VHB, se trouve dans le génome du VHB à la position 1639 (du nucléotide 1639 au nucléotide 1662). Cette amorce a permis aux inventeurs d'isoler un nombre important de jonctions ADN viral/ADN cellulaire grace à son efficacité et à sa position. En effet la technique VHB-Alu isole des fragments assez grands (1 Kb ou plus). Pour qu'elle soit efficace il faut donc utiliser une amorce sur le génome du VHB qui soit le plus proche possible de la jonction mais pas au delà. Or, cette tâche est difficile puisque les points d'intégrations du génome viral ne sont pas connus. L'identification de cette amorce est donc dérivée de la grande expérience des inventeurs dans ce domaine et de l'analyse de plusieurs sites d'intégration.

L'amplification MX2-Tag5 est effectuée dans un volume final de réaction de 100 pI, dans un tampon Tris pH 8,9 25 mM, acétate de potassium 40 mM, chorure de magnésium 2,5 mM et glycérol 4%. La molarité de chaque amorce est 10 pmol et chacun des dNTP est présent à la concentration 250 uM. L'amplification est réalisée à I'aide des enzymes Taq polymerase (Gibco BRL, MD, USA) 1,2 unités plus Vent exo + polymerase (New England Biolabs, MA,USA).

L'amplification est effectuée dans un appareil Perkin-Elmer thermal Cycler 9600 (Emeryville, CA, USA) de la façon suivante : premier cycle 2 min à 94°C, 30s à 63°C, 4 min à 72°C 14 cycles 30s à 94°C, 30s à 67°C, 4 min à 72°C, avec diminution de la température d'hybridation des amorces de 1°C à chaque cycle, jusqu'à 54°C 24 cycles 30s à 94°C, 30s à 54°C, 4 min à 72°C cycle final 30s à 94°C, 30s à 54°C, 10 min à 72°C EXEMPLE 2 Identification de gènes impliqués dans l'oncogénèse par mutagénèse insertionnelle par le virus de t'hépatite B : L'ADN a été extrait de tissus tumoraux et non tumoraux comme décrit dans Paterlini et al., 1990. Afin d'amplifier les jonctions d'ADN cellulaireNHB dans le tissu tumoral, une Alu-PCR a été réalisée comme décrit précédemment.

Le tableau 1 présenté ci-dessous présente le résultat du criblage de 45 patients atteints de carcinomes hépatiques positifs pour le virus de t'hépatite C parmi lesquels 21 sites d'intégration d'ADN cellulaireNHB ont été isolés par les inventeurs.

Tableau 1 : sérologie VHB et histologie hépatique des patients analysés Code CHC Histologic dans les tissus non tumoraux HbsAg anti-HBs Séquences flaquantes cellulaires (pb) 54T MLC + - 475 63T MLC + - 606 77T CH + - 485 83T LC + - 673 239 86T CH - + 314 95T LC + - 355 100T MLC + - 258 101T CH + - 502 FR2 LC + - 1220 FR3 LC + - 1349 FR7 LC + - 660 SA1 CH + - 366 SA2 LC + - 511 591 SA5 LC + + 586 GR1 LC - + 282 GR2 LC + - 271 780 GR3 LC + - 886 GR10 LC + - 1880 MLC : changements hépatiques minimaux, CH : hepatitie chronique active, LC : cirrhose du foie, HbsAg : antigène de surface de l'hépatite B,<BR> anti-HBs : anticorps contre l'antigène de surface de l'hépatite B

Dans une tumeur (86T), l'intégration de I'ADN du VHB est intervenue en phase dans le troisième exon du gène SERCA1 (numéro d'accession U96773, SEQ ID n°24). Les protéines SERCA jouent un role clé dans la régulation du calcium cellulaire (Pozzan et al., 1994) qui à son tour agit comme messager intracellulaire impliqué dans un large panel d'activités cellulaires basiques ou spécialisées, incluant la prolifération cellulaire et la mort cellulaire (Berridge, 1998). Dans ! a tumeur, l'intégration du VHB produit une cis-activation de transcrits de fusion X-VHB/SERCA1 (Chami et al., 2000).

L'expression in vitro des transcrits VHB/SERCA1 induit une déplétion de calcium dans le réticulum endoplasmique et l'apoptose. Les résultats des inventeurs montrent pour la première fois une mutation du gène SERCA dans une pathologie maligne tumorale.

Dans une seconde tumeur (100T), l'intégration de I'ADN VHB a été identifiée à proximité d'une séquence cellulaire de 258 paires de bases (SEQ ID n°20) contenant une séquence de 115 paires de bases identiques au gène TRAP 150. La SEQ ID n°20 correspond aux nucléotides 103283 à 103541 de la séquence gnomique de TRAP150 (numéro d'accession AL360074). La SEQ ID n° 21 correpond à I'ADNc de TRAP 150 (numéro d'accession AS117756, nucléotides 2119 à 2233). Le génome du VHB et l'ORF de TRAP150 sont dans la même orientation. Les protéines TRAP participent au complexe protéique qui coactive le récepteur de I'hormone thyroïdienne nucléaire en présence du ligand (Ito, 1999). L'hormone thyroïdienne est l'un des agents régulateurs majeurs de la prolifération cellulaire hépatique (Lin et al., 1999). Cependant, le rôle biologique précis du gène de la protéine TRAP150 humaine est toujours inconnu.

Dans une autre tumeur 77T, les auteurs de l'invention ont trouvé que l'intégration de I'ADN du VHB intervenait dans un nouveau gène de la famille des gènes MCM (pour"Minichromosome Maintenance", Bik K. Tye, 1999), appelé gène MCM8. L'ADN du VHB a en effet été localisé à proximité d'une séquence de 485 paires de bases (SEQ ID n°11) identique à une partie de la séquence gene-like MCM 2/3/5 sur le chromosome 20p12. 3-13. La SEQ ID n°11 correspond aux nucléotides 51574 à 52059 de la séquence gene- like MCM 2/3/5 (numéro d'accession : AL035461). L'analyse par logiciel de la

séquence du clone avec des programmes de prédiction de gènes et les données expérimentales des inventeurs indiquent que cette séquence code pour un nouveau membre de la famille des protéines MCM, appelé MCM8. Le génome de VHB présente une orientation opposée à celle de l'ORF de MCM8.

Les protéines MCM sont une famille de protéines incluant six membres (MCM2 à 7) hautement conservés de la levure à t'homme. Les six protéines MCM forment un complexe qui a une activité ADN hélicase et sont impliquées dans le contrôle de la réplication de I'ADN une seule fois par cycle (Kearsey et al., 1998). Les protéines MCM sont hautement exprimées dans les cellules prolifératives et néoplasiques. L'ADNc de ce nouveau gène humain MCM8 a été cloné par les inventeurs à partir de foie normal (SEQ ID n°12). De manière à étudier l'expression de ce nouveau gène dans la tumeur et le tissu hépatique adjacent, un anticorps monoclonal dirigé contre une séquence peptidique N- terminale spécifique de MCM8 a été produit. Une analyse par Western Blot a montré qu'une forme tronquée de MCM8 (33kD) est spécifiquement exprimée dans le tissu tumoral (77T) par comparaison au tissu sain. La taille de cette protéine est compatible avec une forme de la protéine MCM8 tronquée dans sa partie C-terminale en raison d'un codon stop prématuré lié à l'intégration de I'ADN du VHB (taille prédite : 32,8 kDa).

Dans un autre carcinome (83T), L'ADN du VHB s'est intégré à proximité d'une séquence cellulaire de 239 paires de bases (SEQ ID n°23) identique à une séquence localisée en amont du promoteur du gène hTERT (SEQ ID n°23, bases 240 à 478 de la séquence gnomique de hTERT (numéro d'accession : AF128893)). Le génome du VHB et l'ORF du gène hTERT ont des orientations opposées. Les télomérases sont exprimées dans la majorité des tumeurs malignes humaines et sont absentes des tissus somatiques différenciés (Urquidi et al., 2000). Les cellules primaires normales peuvent être immortalisées par transfection stable avec le gène de la télomérase.

L'activation des télomérases est une des modifications requises pour la transformation maligne des fibroblastes humains. L'analyse par Western Blot de la tumeur 83T à I'aide d'un anticorps dirigé contre la protéine hTERT montre une surexpression de hTERT dans les tissus tumoraux par comparaison aux tissus non tumoraux. Elle montre également une surexpression d'une protéine

hTERT de taille supérieure (environ 170 kD) oar rapport à la protéine hTERT sauvage. Cette observation confirme donc l'hypothèse des inventeurs selon laquelle l'intégration du gènome du VHB se produit au niveau de gènes impliqués dans les processus tumorigéniques.

Dans ce même carcinome 83T, un deuxième site d'intégration de VHB a été identifié sur le chromosome 2p24.-24.3. La séquence cellulaire isolée est positionnée entre les nucléotides 883565 et 884238 dans le supercontig NT025651 (SEQ ID n°4). Cette séquence est située 2 kb en amont du codon ATG d'un nouveau gène prédit, contenant un domaine de type homéobox. Ce nouveau gène, appelé gène 83T (SEQ ID n°31), est situé entre les bases 881787 (ATG) à 812959 (séquence polyA) de ce supercontig NT025651. Le génome du VHB et l'ORF du gène 83T présentent une orientation opposée. L'analyse par le logiciel Genescan prédit que le site d'intégration du VHB est localisé entre le codon d'initiation ATG et le promoteur du gène 83T (position prédite du promoteur : bases 893015 à 893054). La protéine 83T correspondante est annoncée comme contenant un domaine de liaison à l'ADN qui présente 70% d'homologie (56% d'identité) avec la protéine homéobox humaine EMX2, et 70% d'homologie (54% d'identité) avec la protéine EMX1. Les gènes homéobox sont des gènes hautement conservés au niveau évolutif qui codent pour des facteurs de transcription impliqués dans le développement.

Ce deuxième site d'intégration a été localisé 53 kb en amont du gène codant pour la protéine chaperon CCT7 (Chaperonin Containing TCP1, subunit7). Ce gène est positionné entre les nucleotides 771916 et 790598 du supercontig NT025651 (SEQ ID n° 33). Les ORFs du génome de VHB et de CCT7 sont dans la même orientation. La protéine CCT7 est impliquée dans un complexe TCP1 (Tailless Complex Polypeptide 1), qui fait lui-même partie d'un complexe hétéro-oligomérique TRiC (TCP1-Ring Complex) qui aide-au repliement de nombreuses protéines cellulaires (McCallum et al., 2000). Un rôle essentiel du complexe TRiC a été démontré pour la maturation de la cycline E dans des cellules humaines en culture (Wo et al., 1998).

Dans la tumeur 54T, I'ADN de VHB s'est intégré dans le chromosome 18p11. 3, au niveau d'une séquence intronique (bases 222267 à

222742 du supercontig NT011005, SEQ ID n°3) de la Nuclear Matrix Protein p84. L'orientation du génome VHB et de l'ORF du gène NMP p84 est la même.

Le gène de la Nuclear Matrix Protein p84 (numéro d'accession : XM 008756, SEQ ID n° 35) code pour une protéine nucléaire qui lie la protéine p110RB au niveau de sa région N-terminale (Durfee et al., 1994). Cette liaison contribuerait à concentrer la protéine p110RB dans certaines régions subnucléaires.

Dans la tumeur 95T, VHB s'intègre dans le chromosome 9q21. 1, 13 kb en aval de la séquence codant pour la Neurotopic Tyrosine Receptor Kinase 2 (NTRK2 ou TRKB, SEQ ID n° 37). La séquence cellulaire isolée est positionnée entre les nucléotides 3194297 et 394652 du supercontig NT023935 (SEQ ID n°5). L'orientation du génome de VHB et de l'ORF du gène cellulaire est la même. La famille trk des récepteurs à neurotrophine (trkA, trkB, trkC) favorise la survie, la croissance et la différenciation des tissus neuronaux et non neuronaux. La protéine TrkB est exprimée dans des cellules de type neuroendocrines de l'intestin grêle et du colon, dans les cellules alpha du pancréas, dans les monocytes et macrophages des nodules lymphatiques et de la rate, et dans les couche granuleuse de t'épiderme (Shibayama et Koizumi, 1996). L'expression de la protéine TrkB a été associée à une évolution défavorable des tumeurs de Wilms et des neuroblastomes. TkrB est par ailleurs exprimée dans des cellules de prostate cancéreuses mais pas dans des cellules normales. La voie de signalisation en aval des récepteurs trk implique la cascade d'activation MAPK à travers les gènes Shc, Ras activé, ERK-1 et ERK-2, et la voie de transduction PLC-gamma1 (Sugimoto et al.

2001).

L'intégration de VHB dans la tumeur FR2 se produit dans le chromosome 14q24.2. La séquence cellulaire isolée est délimitée par les positions 559079 et 600299 du supercontig NT010159 (SEQ ID n°6). Elle se situe 8 kb en aval du gène codant la protéine TRUP (Thyroid hormone Uncoupling Protein ; Burris et al., 1995 ; numéro d'accession : M36072, SEQ ID n°39), aussi appelé Protéine Ribosomale L7a. L'orientation du génome de VHB et l'ORF du gène TRUP est la même. Le gène TRUP est supposé être un pseudo-gène dans la mesure où sa séquence, dépourvue d'intron, ne comprend qu'un exon. Un gène homologue avec des séquences introniques

est localisé sur le chromosome 9q33-q34 et code pour une protéine de 266 acides aminés. La protéine TRUP interagit avec la région charnière et la partie N-terminale du domaine de liaison du récepteur de ('hormone thyroïde. Elle agit sur le récepteur de I'hormone thyroïde et le récepteur de I'acide rétinoïque en bloquant leur liaison à I'ADN. TRUP représente donc une protéine de régulation qui module l'activité transcriptionnelle da la superfamille des récepteurs à hormones nucléaires (Burris et al., 1995). Des analyses par differential display ont montré que le gène de la protéine ribosomale L7a est exprimé dans des tumeurs de cerveau malignes (Kroes et al., 2000). Une analyse d'hybridation soustractive portant sur 36 cas de cancer colorectal humain a par ailleurs indiqué que ce même gène est surexprimé dans 72% des cas (Wang et al., 2000). La protéine ribosomale L7a est adressée par l'intermédiaire de son domaine 11 au nucléole (Russo et al., 1997). Enfin, le proto-oncogène trk2h se trouve activé, dans une lignée cellulaire dérivée d'une tumeur mammaire, par sa fusion avec la grande sous unité de la protéine ribosomale L7a (Ziemiecki et al., 1990).

Dans la tumeur SA1, I'ADN du VHB s'intègre dans le chromosome 3q11. 2,3 kb en amont du gène de I'alpha 2,3 sialyltransférase (ST3GalVI, SEQ ID n° 41). La séquence cellulaire isolée est positionnée entre les nucléotides 29061 et 28695 du supercontig NT005494 (SEQ ID n°8). Le génome de VHB présente une orientation opposée par rapport à l'ORF du gène ST3GaIVI. Les alpha 2,3 sialyltransférases sont impliquées dans la glycosylation des protéines. Les gènes de cette famille sont hyperexprimés dans plusieurs types de tumeurs : cancers du sein, de l'estomac et du colon, et métastases hépatiques (Pëtretti et al., 2000). Dans les carcinomes humains colorectaux, I'expression du gène est corrélée à l'évolution maligne de la maladie (Schneider et al., 2001). La suppression de l'expression de sialyltransférases par une stratégie d'ADN antisens provoque une diminution de l'invasivité de cellules de cancer de colon humaines in vitro (Zhu et al., 2001).

L'intégration du génome de VHB dans la tumeur SA2 se produit dans le chromosome 3p25, au niveau du 38sème intron du gène IPR3R1. La séquence cellulaire isolée est délimitée par les nucléotides 4987889 à 5009109

du supercontig NT 005927 (SEQ ID n°9). L'ORF du gène du récepteur inositol 1,4,5-triphosphate de type 1 (IP3R1, SEQ ID n° 43) et le génome de VHB ont une même orientation.

Dans une autre tumeur (FR7), I'ADN du VHB était intégré à proximité d'une séquence cellulaire de 660 paires de bases (SEQ ID n°1) identique à un fragment du clone gnomique AC009318, sur le chromosome 12p (bases 112312-112971). Un fragment de 190 paires de bases de cette séquence (SEQ ID n°2) est identique à des ESTs humaines dérivées de tissus foetaux (numéros d'accession N67205 et H16791) et de tissus tumoraux (neuroblastome et cancer du sein ; Cancer Genome Anatomy Project, numéros d'accession A1361463 et AA996057). Une analyse par le logiciel Genescan a montré que le gène « FR7 » prédit ne présente aucune homologie avec un gène ou un domaine connu. Cette analyse prédit un ARNm d'une longueur de 3847 paires de bases. Le gène FR7 contient successivement les ESTs AK001927 (positions 2128117 à 2128688), BG741742 (positions 2128634 à 2129361) et BF572281 (extrémité 3'en position 2130561), celles-ci étant repérées par leur position sur le supercontig NT 009622. La SEQ ID n°45, délimitée par les positions 2128117 à 2130561 du supercontig NT 009622, correspond donc à une séquence partielle du gène FR7. D'après cette étude, le VHB s'intègre dans de la séquence correspondant à I'EST BG741742 (position 2129217 sur le supercontig NT 009622). Les ORFs du génome du VHB et de FR7 ont la même orientation. Des expériences de Nothern Blot ont montré une expression de ce nouveau gène dans un foie normal d'un adulte humain. Une autre expérience de Northern Blot a revête la présence des bandes de taille anormales dans le tissu tumoral FR7 en comparaison de celles identifiées dans le foie normal. Cette étude a montré l'expression d'un transcrit chimérique X/FR7 exprimé dans la tumeur FR7 (Gozuacik et al. Oncogene, sous presse).

Les auteurs de l'invention ont ainsi trouvé que l'intégration du virus de l'hépatite B dans des gènes cellulaires de carcinome hépatique intervenait à la fois dans des foies cirrhotiques et non cirrhotiques et à la fois chez des patients positifs et négatifs pour t'antigène de surface de t'hépatite B,

indiquant son intérêt général de cette intégration virale dans la transformation cellulaire hépatique.

EXEMPLE 3 : Mise en évidence de différents transcrits SERCA1 : Les auteurs de l'invention ont cloné les transcrits SERCA1 à partir de foies normaux et ont obtenu 25 clones. Huit d'entre eux ont été caractérisés par un épissage de 1'exon 11, dont deux avec un épissage d'à la fois l'exon 11 et l'exon 4. L'épissage de 1exon 11 conduit à un décalage de 22 acides aminés suivi par un codon stop dans 1'exon 12 (Figure 2A). Ces transcrits épissés codent pour des protéines tronquées dans leur partie C-terminale (SERCA1-T) dans lesquelles sont manquants six segments transmembranaires putatifs de SERCA1 (M5-10) incluant4 des 5 résidus de liaison au calcium (Glu-771, Asn- 796, Thr-799 et Asp-800) ainsi que la boucle cytoplasmique entre les segments transmembranaires 6 et 7 qui contrôle aussi la liaison au calcium. Ainsi, ces protéines tronquées ne peuvent pas fonctionner comme des pompes calciques (Figure 2B). En outre, la forme S1T-4 ne contient pas le peptide (acides aminés 74-108) codant pour le second segment transmembranaire putatif (M2), ni les cinq derniers résidus C-terminaux de M1. La taille attendue des protéines S1T+4 est S1T-4 est de 46 et 43 kDa respectivement.

Un peptide correspondant aux 10 acides aminés C-terminaux des protéines tronquées SERCA1-T (RQHSPPWWRR) a été synthétisé (Sigma- Genosis Ltd, GB). Après immunisations chez des lapins, puis collecte des sérums, un anticorps polyclonal, nommé anti-SERCA1-T, spécifique des protéines tronquées SERCA1-T a été purifié par chromatographie d'affinité contre le peptide synthétique. Cet anticorps anti-SERCA1-T ne reconnaît pas les protéines SERCA1 non tronquées.

Une analyse de RT-PCR des transcrits épissés de SERCA1 a été réalisée sur différents tissus adultes et foetaux humains. Cette analyse a revête que les transcrits SERCA1-T sont exprimés dans différents tissus humains adultes (pancréas, foie, rein, poumon et placenta, ainsi que dans la rate et le thymus) et dans différents tissus humains foetaux (rein, foie, cerveau et thymus), Ils ne sont pas exprimés dans le muscle squelettique adulte, le coeur

et le cerveau adultes, ni dans le muscle squelettique fcetal et le cceur foetaL Le rapport SERCA1-T/SERCA1 est significativement augmenté dans le foie et le rein foetaux en comparaison avec les tissus adultes correspondants.

Une analyse de RT-PCR des transcrits épissés de SERCA1 a été aussi réalisée sur différents tissus tumoraux d'hépatocarcinomes humains et sur les tissus non tumoraux adjacents, ainsi que sur deux foies normaux différents et sur trois lignées cellulaires dérivées de cellules iiepatiques. Dans 7 des 11 couples de tissus tumoraux d'hépatocarcinomes et de tissus non tumoraux adjacents, les auteurs de l'invention ont observé un rapport significativement augmenté SERCA1-T/SERCA1 dans les tissus tumoraux contre les tissus non tumoraux. Le même résultat a été obtenu dans les lignées cellulaires Hep3B, HepG2 et Huh7, en comparaison des tissus de foies normaux.

L'utilisation de I'anticorps polyclonal anti-SERCA1-T a permis de confirmer l'expression protéique des formes tronquées de SERCA1 dans les lignées tumorales humaines CCL13 et T47D, tout comme dans les cellules primaires humaines non transfectées Hs27.

La protéine tronquée SERCA1 a pu être détectée dans la fraction microsomique de cellules transfectées de manière transitoire par western blot.

La protéine SERCA1-T a été détectée en tant que monomère (46kDa) dans des conditions dénaturantes (échantillon chauffé et traité avec de l'urée), tandis que des dimères de SERCA1-T (92kDa) étaient mis en évidence dans des conditions moins dénaturantes (échantillon chauffé mais sans urée). Des analyses d'immunohistochimie des cellules transfectées ont été réalisées avec I'anticorps anti-SERCA1-T et ont permis de détecter une localisation réticulaire dans les celluies transfectées avec S1T+4.

Les auteurs de l'invention ont ensuite analysé la localisation subcellulaire des protéines SERCA1-T. Ces analyses sont basées sur t'étude de la colocalisation de SERCA1-T avec la protéine SERCA2b endogène qui est un marqueur efficace de la localisation dans le réticulum endosplasmique. Les construits SERCA1-T et SERCA1 ont été clones dans des vecteurs d'expression en fusion avec la séquence GFP. SERCA1 fusionne avec GFP a été utilisé comme contrôle. La distribution subcellulaire des protéines codées a

été étudiée dans les cellules transfectées de manière transitoire HuH7, en utilisant l'immunofluorescence et la microscopie confocale à balayage. Les auteurs de l'invention ont ainsi pu montrer la colocalisation de S1T+4 et S1T-4 fusionnés à GFP avec SERCA2b endogène coloré avec un anticorps anti- SERCA2 monoclonal (clone IID8).

Une surexpression des protéines SERCA-T induit I'apoptose dans trois lignées cellu (aires derivees de cefCules hépatiques differentes (CCL13, HuH7 et HepG2). L'analyse morphologique a été basée sur le dénombrement des corps apoptotiques dans les cellules exprimant GFP. Dans les cellules transfectées de manière transitoire HuH7, le pourcentage de corps apoptotiques avec S1T+4 et S1T-4 est significativement plus important que dans les contrôles (cellules transfectées par GFP et SERCA1). Des résultats similaires ont été obtenus dans des cellules CCL13. Ce résultat était confirmé par des expériences en cytométrie de flux basées sur l'analyse des structures mitochondriales en utilisant une coloration à l'orange nonylacrydine (NAO). En comparaison des contrôles (cellules transfectées NTC ou pcDNA3), les cellules transfectées avec S1T+4 et S1T-4 ont présentées un nombre significativement plus élevé de cellules apoptotiques caractérisées par une taille cellulaire plus petite associée à une plus faible incorporation de NAO.

Pour rechercher les effets des protéines SERCA-T sur t'homéostasie du calcium dans la lumière de réticulum endoplasmique (ER), les auteurs de l'invention ont sélectivement mesuré la concentration calcique dans I'ER en utilisant des chimères ER-AEQ ciblées (aequorine). Cette analyse a été effectuée dans trois lignées cellulaires différentes (HUH7, CCL13 et cellules Hela) et était basée sur une cotransfection du construit ER-AEQ et des construits codant pour. S1T+4 ou S1T-4. Pour obtenir une estimation quantitative de la concentration en Ca2+ dans la lumière du réticulum endoplasmique, la concentration en Ca2+ a été diminuée pendant à la fois la reconstitution de I'AEQ avec la colenterazine et pendant la phase initiale de perfusion. Dans ces conditions, la concentration en Ca2+ était de 10 AM dans le réticulum endoplasmique. Lorsque la concentration en calcium du milieu de perfusion a été modifiée vers 1 mM, la concentration en calcium de la lumière du réticulum endoplasmique a augmenté graduellement pour atteindre une

valeur plateau. Les résultats de cette expérience sont reportés dans le tableau 2 ci-après.

TABLEAU 2 : Teneur en calcium dans I'ER Construit [calcium] ER (ils) Contrôle HuH7 330, 24 +/-71, 62 (n=14) S1T+4 HuH7 173,52 +/-58, 16 (n=10) S1T-4 HuH7 241, 14 +/-77, 68 (n=8) Contrôle CCL13 284, 15 +/-31, 46 (n=4) S1T+4 CCL13 189,73 +/-34, 52 (n=6) S1T-4 CCL13 244, 8 +/-24,39 (n=5) Contrôle Hela 339, 85 +/-47, 56 (n=7) S1T+4 Heia 268, 92 +/-32, 55 (n=14) S1T-4 Heta287, 11 +/-44, 08 (n=9) En comparaison des cellules contrôles, la teneur en calcium du réticulum endoplasmique a donc été réduite de manière significative dans les cellules transfectées par S1T+4 et S1T-4 par rapport aux cellules contrôles.

Dans ces cellules exprimant S1T+4 et S1T-4, I'efflux des ions Ca2+ est significativement plus rapide que dans les cellules contrôles.

Les SERCA1 tronquées déterminent une diminution du calcium dans les stocks calciques du RE in vitro.

Les auteurs de l'invention ont postulé que les protéines SERCA1 tronquées pourraient avoir un effet dominant négatif sur les protéines SERCA endogènes et moduler leur fonction de pompe.

Cet effet dominant négatif des protéines SERCA1 tronquées a été étudié dans les cellules HUH7 et Hela dans des tests de cotransfection avec SERCA1 ou SERCA2. Cette étude était basée sur la mesure du contenu calcique du RE en utilisant la construction ER-AEQ.

Le tableau 3 rapporte les résultats obtenus dans les cellules HuH7 : Construit [calcium] ER (µM) % ER [Ca2+] accumulation par rapport au contrôle Contrôle 330 +/-72 (n=14) 100 S1T+4 174 +/-58 (n=10) 53 S1T-4 241 +/- 78 (n=8) 73 SERCA1 448 +/-8 1(n=13) 136 SERCA1 + S1T+4297+/-78 (n=11) 90 SERCA1 + S1T-4 343 +/-99 (n=10) 103 SERCA2 687 +/-105 (n=6) 208 SERCA2 + S1T + 4 434 +/-131 (n=4) 131 SERCA2 + S1T-4 445 +/-61 (n=4) 134

Dans les HUH7, la valeur du plateau dans les cellules transfectées avec SERCA1 et SERCA2 est augmentée pour atteindre 136 % et 208 % par rapport au pourcentage d'accumulation dans les cellules contrôle (100 %). La cotransfection de SERCA1 avec SIT+4 ou SIT-4 fait baisser le pourcentage d'accumulation à 90 % et à 103 % respectivement par rapport au contrôle (Tableau 3). La cotransfection de SERCA2 avec S1T+4 ou S1T-4 fait baisser le pourcentage d'accumulation à 131 % et à 134 % respectivement par rapport au contrôle. Des résultats similaires ont été obtenus dans les cellules Hela.

Ce résultat montre bien un effet dominant négatif des protéines SERCA1 tronquées sur SERCA1 et SERCA2.

Un des mécanismes impliqués dans la baisse du calcium dans le RE dans les cellules exprimant les SERCA1 tronquées peut être la fuite du calcium du RE.

Le taux de fuite de calcium du RE a été mesuré après le plateau d'accumulation du calcium dans le RE suite à une addition du TbuBHQ (inhibiteur des SERCA). Le niveau de fuite de calcium a été évalué à différentes concentrations de calcium à I'aide d'une fonction dérivée de la pente de fuite. Les auteurs de l'invention ont obtenu des résultats qui montrent une augmentation du taux de fuite de calcium dans les cellules exprimant S1T+4 et S1T-4 par rapport au contrôle.

Ce résultat est compatible avec t'hypothèse que les dimères de SERCA1-T pourraient agir comme un pore à cation.

Cette étude suggère un modèle de contrôle des dépôts calciques et de régulation des mécanismes d'apoptose in vitro par les protéines hybrides X/SERCA1 et les protéines SERCA tronquées. L'ensemble de ces résultats indiquent que ces protéines pourraient réguler les stocks calciques du RE par leur capacité à former des dimères. En effet, ces dïmerës peuvent contribuer, en formant un pore, à une fuite du calcium du RE vers le cytoplasme.

Les auteurs de l'invention ont pu montrer également que les protéines SERCA tronquées ont un effet dominant négatif à la fois sur SERCA1 et SERCA2b.

L'ensemble de nos résultats implique la mutation d'un gène SERCA dans un cancer humain et suggère une relation entre protéines SERCA normales et tronquées, homéostasie calcique du RE, apoptose et transformationcellulaire.

BIBLIOGRAPHIE -Antonarakis S. E., N Engl J. Med. 320 : 153-163 (1989).

-Bellis et a/., medecine/sciences, 13 : 1317-24, (1997).

-Berridge et al, Nature, 395 (6703) : 645-8 (1998).

= Benolt et a/., PNAS USA, 79,917-921 (1982).

-Bik K Tye, Annu. Rev. Biochem. 68 : 649 : 686 (1999).

-Burris, T. P. at al., Proc Natl Acad Sci U S A, 92 : 9525-9 (1995).

-Chami et al, Oncogene, 19 : 2877-2886 (2000).

-Cooper et a/., Diagnosis of genetic disease using recombinant DNA, 3rd Edition, Hum Genet., 87 : 519-560 (1991).

-Durfee, T et al., J Cell Biol, 127 : 609-22 (1994).

-Dejean et al, Nature, 322 : 70-72 (1986).

-Huber, C. G. et al., Anal. Chem, 67 : 578-585 (1995).

-Ito et al, Molecular Cell, 3 : 361-370 (1999).

-Kearsey et al, Biochim. Biophys. Acta, 1398 (2) : 113-36 (1998).

-Köhler et Milstein, Nature, 256,495-497, (1975).

-Kroes, R. A. et al., Cancer Lett, 156 : 191-8 (2000).

-Kuklin, A. et al., Genetic Testing, 1 : 201-206 (1997/98).

-Lin et al., Mol. Carcinogenesis, 26 : 53-61 (1999).

-McCallum, C. et al., J Cell Biol, 149 : 591-602 (2000).

-Minami et al, Genomics, 29 : 403-408 (1995).

-Nielsen et al, Anticancer Drug Des., 8 (1) : 53-63 (1993).

-Paterlini et al, Primary liver cancer in HbsAg-negative patients : A study of HBV genome using the polymerase chain reaction. In"viral hepatitis and Liver Disease", 556-559, Williams and Wilkins, Baltimore (1990).

-Paterlini et al, Hepatitis B virus and primar liver cancer in hepatitis B surface antigen-positive and negative patients. In : Primary liver cancer, etiological and progression factors, London : B. C. 167-190 (1994).

-Petretti, T. et a,., Gut, 46 : 359-66 (2000).

-Pineau et al, J. Virol. 70 : 7280-7284 (1996).

-Poussin K et al., Int J Cancer, 80 : 497-505, (1999).

-Pozzan et al, Physiol. Rev. 74 (3) : 595-636 (1994).

-Russo, G. et al., J Biol Chem, 272 : 5229-35 (1997).

-Sambrook et a/., Molecular cloning, a laboratory manual Spring Harbor Laboratory Press, 9.54-62 (1989).

-Schneider, F. et al., Cancer Res, 61 : 4605-11 (2001).

-Shibayama, E. & Koizumi, H., Am J Pathol 148 : 1807-18 (1996).

-Sugimoto, T. et al., Jpn J Cancer Res, 92 : 152-60 (2001).

-Tsuei et al, J. Virol. Methods, 49 : 269-284 (1994).

-Urquidi et al, Annu. Rev. Med. 51 : 65-79 (2000).

-Wang et al, Nature, 343 : 555-557 (1990).

-Wang, Y. et al., lnt J Oncol, 16 : 757-62 (2000).

-Won, K. et al., Mol Cell Biol, 18 : 7584-7589 (1998).

-Zhang et al, Biochem. Biophys. Res. Commun., 188 : 344-351 (1992).

-Zhu, Y. et al., Biochim Biophys Acta, 1536 : 148-60 (2001).

-Ziemiecki, A. et al.,). Embo J, 9 : 191-6 (1990).