Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SEQUENCES AHEAD OF GENE SM22, VECTORS CONTAINING SAME, AND THERAPEUTICAL USES THEREOF, PARTICULARLY FOR TREATING VASCULAR DISEASES
Document Type and Number:
WIPO Patent Application WO/1997/035974
Kind Code:
A1
Abstract:
DNA sequences including a fragment of the sequence ahead of the coding portion of the SM22 protein gene, or a sequence hybridisable therewith under highly stringent conditions, said fragment being capable of inducing specific gene expression in eukaryotic cells, as well as a sequence coding for a protein or RNA of therapeutical interest, are disclosed. Said sequence or a vector containing same may be used for treating coronary diseases, particularly restenosis.

Inventors:
PAULIN DENISE (FR)
SMALL VICTOR (AT)
MOSSLER HERBER (AT)
LI ZHENLIN (FR)
MERICSKAY MATHIAS (FR)
Application Number:
PCT/FR1997/000543
Publication Date:
October 02, 1997
Filing Date:
March 26, 1997
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
PASTEUR INSTITUT (FR)
UNIV PARIS 7 (FR)
PAULIN DENISE (FR)
SMALL VICTOR (AT)
MOSSLER HERBER (AT)
LI ZHENLIN (FR)
MERICSKAY MATHIAS (FR)
International Classes:
C12N15/09; A01K67/027; A61K31/00; A61K31/70; A61K31/7088; A61K35/76; A61K48/00; A61P9/00; A61P9/10; C07K14/47; C07K14/475; C07K14/54; C12N5/10; C12N9/12; C12N9/20; C12N15/12; C12Q1/68; A61K38/00; (IPC1-7): C12N15/12; A61K31/00; C07K14/47
Domestic Patent References:
WO1994013824A11994-06-23
WO1995021258A11995-08-10
WO1995009916A11995-04-13
WO1995019167A11995-07-20
WO1995007361A11995-03-16
Foreign References:
EP0174608A11986-03-19
Other References:
L. LI ET AL: "Expression of the SM22 alpha promoter in transgenic mice provides evidence for distinct transcriptional regulatory programs in vascular and visceral smooth muscle cells", THE JOURNAL OF CELL BIOLOGY, vol. 132, 1996, pages 849 - 859, XP000609076
J. SOLWAY ET AL.: "Structure and expression of a smooth muscle cell-specific gene, SM22 alpha", THE JOURNAL OF BIOLOGICAL CHEMISTRY, vol. 270, no. 22, 1 June 1995 (1995-06-01), USA, pages 13460 - 13469, XP000609071
P.R. KEMP ET AL.: "cloning and analysis of the promoter region of the rat SM22 alpha gene", BIOCHEMICAL JOURNAL, vol. 310, 1995, GREAT BRITAIN, pages 1037 - 1043, XP000196609
DATABASE WPI Section Ch Week 9141, Derwent World Patents Index; AN 91-300978, XP002020314, ODA JUNICHI: "New DNA sequence of gene coding lipoprotein lipase-derived from microbe, pref. belonging to Pseudomonas genus"
M.W. CHANG ET AL.: "Cytostatic gene therapy for vascular proliferative disorders with a constitutively active form of the retinoblastoma gene product", SCIENCE, vol. 267, 27 January 1995 (1995-01-27), pages 518 - 522, XP000609101
P. MIDOUX ET AL.: "Specific gene transfer mediated by lactosylated poly-L-lysine into hepatoma cells", NUCLEIC ACIDS RESEARCH, vol. 21, no. 4, 25 February 1993 (1993-02-25), GB, pages 871 - 878, XP000371764
H. MOESSLER ET AL.: "The SM 22 promoter directs tissue-specific expression in arterial but not in venous or visceral smooth muscle cells in transgenic mice", DEVELOPMENT, vol. 122, 1 August 1996 (1996-08-01), GREAT BRITAIN, pages 2415 - 2425, XP000196601
Download PDF:
Claims:
REVENDICATIONS
1. Séquence d'ADN caractérisée en ce qu'elle comprend un fragment de la séquence en amont de la partie codante du gene de la protéine SM22, ou d'une séquence hybndaπt dans des conditions de forte stringence à ladite séquence en amont, ledit fragment étant susceptible d induire une expression spécifique d'un gène dans des cellules eucaryotes, et une séquence codant pour une protéine, ou un ARN, d'intérêt thérapeutique .
2. Séquence d'ADN selon la revendication 1 , caractérisée en ce qu'elle comprend un fragment de la séquence en amont de la partie codante du gène de la protéine SM 22, ou d'une séquence hybπdant dans des conditions de forte stringence à ladite séquence en amont, ledit fragment étant susceptible d'induire une expression spécifique m vivo d'un gène dans les cellules des artères, et une séquence codant pour une protéine, ou un ARN, d'intérêt thérapeutique.
3. Séquence selon l'une des revendications 1 ou 2, caractérisée en ce que ladite protéine , ou ledit ARN, est susceptible d'inhiber la croissance des cellules du muscle lisse, d'activer la croissance des cellules endothéliales de consolider les parois des artères et/ou d'induire une réponse immunitaire.
4. équence selon l'une des revendications 1 à 3, caractérisée en ce que ledit fragment est compris dans la séquence située entre les nucléotides 2126 et +4135 du gène de souris de la protéine SM22 (SEQ ID π° 1 ).
5. Séquence selon l'une des revendications 1 à 4, caractérisée en ce que ledit fragment est compris dans la séquence située entre les nucléotides 2126 à +65 du gène de souris de la protéine SM 22 (SEQ ID N°2).
6. Séquence selon l'une des revendications 1 à 5 caractérisée en ce qu'elle contient au moins une partie de la séquence située entre les nucléotides 2126 et 445 du gène de la souris de la protéine SM 22 (SEQ ID N° 3) .
7. Séquence selon l'une des revendications 1 à 6, caractérisée en ce que ladite protéine d'intérêt thérapeutique est une protéine induisant la formation d'un composé cytotoxique.
8. Séquence selon la revendication 7, caractérisée en ce que ladite protéine est la thymidine kmase du virus de l'herpès.
9. Séquence selon l'une des revendications 1 à 6, caractérisée en ce que ladite protéine d'intérêt thérapeutique présente un effet cytostatique.
10. Séquence selon l'une des revendications 1 à 6 caractérisée en ce que ladite protéine d'intérêt thérapeutique présente une activité lipolytique 1 1 Séquence selon la revendication 10, caractérisée en que ladite protéine est la lipoprotéine lipase 12 Séquence selon l'une des revendications 1 à 6, caractérisée en ce que ladite protéine d'intérêt thérapeutique est un facteur de croissance des cellules endothéhales 13 Séquence selon la revendication 11 , caractérisée en ce que ledit facteur est une interleukine 14 Séquence selon l'une des revendications 1 à 6, caractérisée en ce que ladite protéine d'intérêt thérapeutique est une protéine musculaire ou de structure tissulaire 15 Séquence selon l'une des revendications 1 à 6, caractérisée en ce que l'ARN d'intérêt thérapeutique est l'ARN aπtisens de la protéine p53 16 Séquence d'ADN située en amont de la partie codante du gène de souris de la protéine SM 22 caractérisée en ce qu'elle comprend au moins une partie de la séquence SEQ ID Nc5 suivante, ou une séquence s'hybπdant avec celleci dans des conditions stπngentes GGGCCCCAGG AATGTGTTTC CTTCTCTCCA CCATGTTTTT ATAGCTCTTG GGCTGGGAGA AGAGGCGGGT CTGGGTCTTT GTTTCTGAGC TTTGTTCTAT GTTCCTCCAT GCTACGGTTG CAATTGTTTT CTATGAACGA GTACATTCAA TAAAGACAAC CAGACCTGGG ATTTGGGGTC TTACTGATGT GTTGGGAGGT GCAGGAGCCT CCGTGTCCCA TTTATTTTGG CCTTCCCGTC TCGTTTCTGT GCGTGGCTAC ATTGGGAATG ACCTTCCTTG ATCCCACCAA GCCACCCATT GATTCTGTAA ACATGTGACC CTTGCTCCAA GCATTGCTTA CAGGAGCAGG ATACTGAAAG TGTGTCTGTG CCCTCTCCTG ATAACCCCTC CCTTCAGCAG GCACACAGCA CCTGACTACC CACCACGTAT GTAAACGTCA GTATCCTTTC CAGCCAGCTC TGCAGATGGG TGTCCAGGCT GTGCATGATG CACCTCAAGT GGGCAGAGCT TGCAGGCCAA GGTTTTAAAG GCTGTTCAGG AATGGATGGC AAGCAGGATC TAAGAGGAGG GGGGGTTGTT GTTGTTTGGG GGGGGGGTGG TTTTGGTTTG TTTTTTTTGA GACAGGGTTT CTCTGTGTGG CCCTGGCCCT CCTGGAACCC ACTCTGTAGA CCAGGCTGGC CTTGAACTCA GAAATCTGCC TGCCTCTGCC TCCCGAGTGC TGGGATTAAA GGCGTGTGCC CATCGAGGAG GGAGATTTTA TTTAGATTAT AAAAAGGACG G GATT 17 Séquence d'ADN située en amont de la partie codante du gène de la souris de la protéine SM22, caractérisée en ce qu'elle comprend au moins une partie de la séquence SEQ ID n° 1 suivante, ou une séquence s'hybridant avec celleci dans des conditions stringentes GG GCCCCAGGAA TGTGTTTCCT TCTCTCCACC ATGTTTTTAT AGCTCTTGGG CTGGGAGAAG AGGCGGGTCT GGGTCTTTGT TTCTGAGCTT TGTTCTATGT TCCTCCATGC TACGGTTGCA ATTGTTTTCT ATGAACGAGT ACATTCAATA AAGACAACCA GACCTGGGAT TTGGGGTCTT ACTGATGTGT TGGGAGGTGC AGGAGCCTCC GTGTCCCATT TATTTTGGCC TTCCCGTCTC GTTTCTGTGC GTGGCTACAT TGGGAATGAC CTTCCTTGAT CCCACCAAGC CACCCATTGA TTCTGTAAAC ATGTGACCCT TGCTCCAAGC ATTGCTTACA GGAGCAGGAT ACTGAAAGTG TGTCTGTGCC CTCTCCTGAT AACCCCTCCC TTCAGCAGGC ACACAGCACC TGACTACCCA CCACGTATGT AAACGTCAGT ATCCTTTCCA GCCAGCTCTG CAGATGGGTG TCCAGGCTGT GCATGATGCA CCTCAAGTGG GCAGAGCTTG CAGGCCAAGG TTTTAAAGGC TGTTCAGGAA TGGATGGCAA GCAGGATCTA AGAGGAGGGG GGGTTGTTGT TGTTTGGGGG GGGGGTGGTT TTGGTTTGTT TTTTTTGAGA CAGGGTTTCT CTGTGTGGCC CTGGCCCTCC TGGAACCCAC TCTGTAGACC AGGCTGGCCT TGAACTCAGA AATCTGCCTG CCTCTGCCTC CCGAGTGCTG GGATTAAAGG CGTGTGCCCA TCGAGGAGGG AGATTTTATT TAGATTATAA AAAGGACGGG ATTTGGGGAA TCCTGTCTAG TGAATTCAGG ACGTAATCAG TGGCTGGGAA GCAAGAGCTC TAGAGGAGCT CCAGCTTATT ATGACCCTTC CTTCAGATGC CACAAGGAGG TGCTGGAGTT CTATGCACCA ATAGCTTAAA CCAGCCAGGC TGGCTGTAGT GGATTGAGCG TCTGAGGCTG CACCTCTCTG GCCTGCAGCC AGTTCTGGGT GAGACTGACC CTGCCTGAGG GTTCTCTCCT TCCCTCTCTC TACTCCTTCC TCCCTCTCCC TCTCCCTCTC TCTGTTTCCT GAGGTTTCCA GAATTGGGGA TGGGACTCAG AGACACCACT AAAGCCTTAC CTTTTAAGAA GTTGCATTCA GTGAGTGTGT GAGACATAGC ACAGATAGGG GCAGAGGAGA GCTGGTTCTG TCTCCACTGT GTTTGGTCTT GGGTACTGAA CTCAGACCAT CAGGTGTGAT AGCAGTTGTC TTTAACCCTA ACCCTGAGCC TGTCTCACCT GTCCCTTCCC AAGACCACTG AAGCTAGGTG CAAGATAAGT GGGGACCCTT TCTGAGGTGG TAGGATCTTT CACGATAAGG ACTATTTTGA AGGGAGGGAG GGTGACACTG TCCTAGTCCT CTTACCCTAG TGTCTCCAGC CTTGCCAGGC CTTAAACATC CGCCCATTGT CACCGCTCTA GAAGGGGCCA CCCTTGACTT GCTGCTAAAC AAGGCACTCC CTAGAGAAGA GTCCACTGTA GGCAGATAGG TGACAGGTGG CAGATAGGTG ACAGATAGGT GACAGGTGGA GGAGCTTTGG AACTGGGACT GGACAGCCCT GGGACCCTGT TCCTCCCAAA GGGTCTTGGT GGTTCCCCTT GGGGCTCTCT AAAGGATGTC AGTGGGCTGT TGCCACATCT ATATAAGAGG ACTAGTCTTC TGGAATTTAG GTGTGATCTC TCAGGGATGC AGAAATGCTC ACCCTTACTG TCATTTTATG GGCTGAGGTA CCACAGGCAG ATATACCCTG GTCTGCTTGT TGTCCAGGGT CTCTGCTACA TGGAGGCCCC TTTCCACAGC CTAACCTCTC TACCTGCTGA CAGGAGGGCT GGATGGCCAC AGGCATCCAA CGTGCGCATC ATGCAGGTGT TTTGCGTTGG AGCTTTTGTC TAGAAATACC CTGGTGGGCT GCCAAACCAC CACCCATATC CCTCTCTCCT CTCTGCTGCC TCTAAGATGA CAGCTTGATT TTTCTTATAG TGATTTTTTT TTTTGGTTTT GTTTTTTTGT TTGTTTTAAG TTAGCATACA AAGTAATACA TTTCATCATG GCATTTGGAC ATACATATAT ATTTTATTTG CTCTCCTGGC CTCTTCTCAA AGAGACTTCT CTGGACTTTC TTGTATTTTT GGTTGTGAGC CTAGCCTTTA ACGGCTGAGC CATCTCTCCA GCCCTTCTTT GGACTTTCTA CTTCATACTT CCCACCAGTC TGGGAAGAAG GGCACATGGA ATCTTGAGAG CATGACCTGA CCCAGACCTG ACAGATGTCA AGGCTGCAGT GTATGCTCTT GTTCGTACGG CTTGTTCTTA GTCCTGCAGT TCAGAACTTT CTGGAGACTG AGAAGTGCAT GTGAGGACAC TCTCCTCCCA TCTTTTCCTC TAGTGGCTAG TGATGTTTGG TTTTTTGTTT TGAGACAGGG TTTCTCTGTA TAGCCCTAGC TATCCTGGAA CTCACTTTGT AGATCAGGCT GGCCTCCAAC TCAGAAATCT GCCTGCCTCT GCCTCCCGAG TGCTGGGACT AAAGGCGTGC GCCACCACTG TCCAGTCAGG AGTAGAAGGA AACTGTAAGG TGCTTGAGAC AGGCTGAGTA GAGGCTAGGA GGAAGGGGCA CCGCAGTCAC CGGCTCCATG ACTCTGTGAC TTTTGTGGTT CCTTGTCGCA GCGGTTCCTG GTGGTGGTGG TGGTCGGGGG TTGGGGGGAG GGGGCAGGCC ACACAGTGGG GTGTGGGAGG GAATAGCTGT TGACAACTTC CCAACAGAAA CCAGGCTTTT GAGTCCTCCA GGGTAGCTTG AGAGGGTACT CAGAAAGCCG TGTCCATGTC CCCTTTCCTT CACCTCAGGG AAGTAAGTTG CCTATAGGGT TGTCATTTCA ATGAGGTCTT CTGGTTATTC TGTTTTTCTC TCAATGTTGG TGTTGGGCTC AGGGAATGCT TTGGAGAAGG TGGTGGGAAC TGGAGAAGGG AAGATCAGTT TACCATACCT GTGGGCAGGA TGACCCATGT TCTGCCATGC ACTTGGTAGC CTTGGAAAGG CCACTTTGAA CCTCAATTTT CTCAACTGTT AAATGGAGTG GTAACTGCTA TCTCATAATA AAGGGGAACG TGAGGAAGGC GTTTGGATAG TGCCTGGTTG CGGCCAGGCT GCAGTCAAGA CTAGTTCCCA CCAACTCGAT TTTAAAGCCT TGCAAGAAGG TGGCTTGTTT GTCCCTTGCA GGTTCCTTTG CTCGGGCCAA ACTCTAGAAT GCCTCCCCCT TTCTTTCTCA TTGAAGAGCA GACCCAAGTC CGGGTAACAA GGAAGGGTTT CAGGGTCCTG CCCATAAAAG GTTTTTCCCG GCCGCCCTCA GCACCGCCCC GCCCCGACCC CCGCAGCATC TCCAAAGCAT GCAGAGAATG TCTCCGGCTG CCCCCGACAG ACTGCTCCAA CTTGGTGTCT TTCCCCAAAT ATGGAGCCTG TGTGGAGTGA GTGGGGCGGC CCGGGGTGGT GAGCCAAGCA GACTTCCATG GGCAGGGAGG GGCGCCACGG GGCGGCAGAG GGGTGACATC ACTGCCTAGG CGGCCTTTAA ACCCCTCACC CAGCCGGCGC CCCGGCCCGT CTGCCCCAGC CCAGACACCG AAGCTACTCT CCTTCCAGTC CACAAACGAC CAAGCCTTGT AAGTGCAAGT CATGGGAGCA GAAGGGCTGT GGGCTCAATT AGATCCCCTA GTCTCTTCTA GTTTGCTGGG TGGAATTGGG TCCCTAGAGA CCATTCTCTG TGTTAGACAA AAAGTCTGGG TTAAAATGCC TAGGATGATT TGACTGGGGC AAAAGAATAA ATGGGGTGAG AGGGAGGCTC AAATTCAGTC ACTGTCCCAC CCATAGGTGT ATGGGCTATG TGTTAGGCCC AAAGAGGTGA CAAATGAGGC CAAGGGAACA ACTCCATCTT TGGATCTCCA AGAAGGTGAG GGGCTAAGTT CTGGAAAGCA GTGACCCACT GATGGTCCCC AGGGCTAATG CAACTCGGGG GAGCCAGGAG GTAGCCCCCT CAGGCAGTGG AGGACTAAAG ATCTTATTTT TTGTAGCGCT AGGGATCAAA CCCCAGGGCG CTATGTGTGG CAGGCATGTG CTCCATCTAC CACAGAAGTT TAATCCTTCA GACTAGCCTG GGATAGGGCC TGCTTTTTCT TTCCTTTTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTTT CTTTCCTTTT CTCTCTTTCA CTCTCTCTTT CTAATTTCTT TTTCTTTTTT TCTTTCTTTT CTTTAGACAG GGTTTCTCTG TGTAGCCCTG GCTGTTCTGG AACTCACTCT TTAGACCAGG CTGGCCTCGA ATCTCAGAAA TCTACCTGCC TCTGCCTCCC AAGTGCTGGG ATTAAAGGCG TGTGCCACCA CTGCCCAGCT AAGGTTTGCT TTTTGATGGC AGCTTGGTCC AGTTTGAAAG TAGGAGGTCA TACTGTGTAA ACTCACTGGT TAAAGTACCC CCTCCCTTCC ACCCTGCAAT ACACACACAC ACACACACAC ACACACACAC ACACACACAC ACCCCATCTC GAAGAGCTCT ATTAAGCTCC AGGTGCACTG TAGTTCACAG ACTGCATCTT CCAGGTTTGC TCCCACTTCA CAAGCAGAGA ACTCATAACT GAAGGGGGTG ACAGCACAGG GGAAGGGAAA GCAAGATGTT TAGAGTCTGA CAGCTGGCCC GGGACCAGAG CCATGTGGTA ATGTTTGCTC CACTCCCATC CACCTCCACG GCTGTGATGT GGAGAAGGTC CCCGCTTTCA TGGGAAGGAG GTGGGGGAGC CTGTCATCTG CTCCATGCTC ACACAATTTT TCTCTCAACC AATGACCTCT CAGAAGCAGG GGTTGGTTTG CAAAATTCTT CAGATACCTC AACAGATGGC ATCCCACTCA GGCTATCCCT GCTGACTAGG TCTGGCTCCA GCCCTGACTG TATCTACCCA GGGACCTACC TGCCTGCTTT GCTCCTATAG CCTTCCTCCG TGTCTGGGTC CCCAGAGAGC TGCCGGCATA GGCCTTTGAG GCAACAGCTG GCATACAGGC CAGGCTTCCC ATGCTCTGGC TAGCAGATTC TCTGCCCTGG AGGACTTTGA CTGCATGGTT TCTCTCACTG CTGCAACAGT CAGAGCTGGC CCACACGGGC ACAACAGCGC ACTTCCATCT GGGTCTCCCT GAGAATGCCG CTGTTTTCTG AGAACCCTTG GACTCTGGTG GCTTTATCAG GTCTTTTTGT CAGCTGCGCT TTGGGGGATG AACTTTGCTC TTCTGGCTTC TGGGTCAGAG GGTAAAGATT TGGTGGCAAC CGGTAGCTAG AGAAAGATAG CTACTGGCTG AATTTGGAGG ACATGGCTTC TGGAAAACCT CTCTAGTGCT TTTCTGGCTA GTCTTGGCAA AGTAAAAATG CTCTGATAGC CAGCCCGGGT GATGCAGGGC TTCCTGTTCG AGGCCTTTCT GTACAAAATT AGTGAGACAT TGCCTCAAAA CTATGAAACA AGCCAGACTC TGTTGAAGCA CGCCTTTAAT CCCAGCACTC AGGAGGCTGA AGCAGGCAAG ATCTCTGTTA GTTGGAGGCC AGTCTACAGG AAAGTTCTAC AACAGCAGAG GCCAGACAGT GCAACCCTTT CTGGGGGTGT GGGGGAGGAA AACCCAACAA AAACACAAAC TATAAAACAA AGAGAAGGCC GAGGACAAAG CTTAGCAATG CATACTTCCC TTTCTATGTG AAGCCCTGGG CTCCACCAGT ACTGCAGAAA GAAGCAAGCA ATGAGGGACA GGAGGTTGGC TCTAGGCCCA GGGGTTGTCA AAATAGTCCA CAGGCCAAAG GCAGCCTGAT GTCTGTTTTT ATAAACAAAA TTTTATTGGC ACACATTGGT TATGTATCAG CTAGGCTATT TTCATTACAA TAGAGGCCAT ATGGTCTGTA AAGTCTAAAΛ TATTTACTCT GCTGTTTTAC ATAAAAAGTT GACAGACTCT TGCTCTAGAC TGACAAATAT CTAAGACCTT GTTTTCTGAG GTTCAAGTTT CAGAGGGGTC TCTGCAGCAA GTGGGTAAAG CTGGTCTAGG TCATGCTATG ATGTCTAGGG TCCCCTCAGA GTGGAAGGCC TGCTTAGCAC AAATGAAGTA AAGTAACTTG CTGGCTCTTT GTTCTTTTCT CCACACTCTA TACTTTAGCT CTGCCTC 18 Séquence d'ADN située en amont de la partie codante du gene de la souris de la protéine SM22 caractérisée en ce qu'elle comprend au moins une partie de la séquence SEQ ID n° 2 suivante ou une séquence s'hybπdant avec celleci dans des conditions stπngentes SEQ I D NO : 2 : GGGCCCCAGG AATGTGTTTC CTTCTCTCCA CCATGTTTTT ATAGCTCTTG GGCTGGGAGA AGAGGCGGGT CTGGCTCTTT GTTTCTGAGC TTTGTTCTAT GTTCCTCCAT GCTACGGTTG 1 CAATTGTTTT CTATGAACGA GTACATTCAA TAAAGACAAC CAGACCTGGG ATTTGGGGTC 1 TTACTGATGT GTTGGGAGGT GCAGGAGCCT CCGTGTCCCA TTTATTTTGG CCTTCCCGTC 2 TCGTTTCTGT GCGTGGCTAC ATTGGGAATG ACCTTCCTTG ATCCCACCAA GCCACCCATT 3 GATTCTGTAA ACATGTGACC CTTGCTCCAA GCATTGCTTA CAGGAGCAGG ATACTGAAAG 3 TGTGTCTGTG CCCTCTCCTG ATAACCCCTC CCTTCAGCAG GCACACAGCA CCTGACTACC 4 CACCACGTAT GTAAACGTCA GTATCCTTTC CAGCCAGCTC TGCAGATGGG TGTCCAGGCT 4 GTGCATGATG CACCTCAAGT GGGCAGAGCT TGCAGGCCAA GGTTTTAAAG GCTGTTCAGG 5 AATGGATGGC AAGCAGGATC TAAGAGGAGG GGGGGTTGTT GTTGTTTGGG GGGGGGGTGG 6 TTTTGGTTTG TTTTTTTTGA GACAGGGTTT CTCTGTGTGG CCCTGGCCCT CCTGGAACCC 6 ACTCTGTAGA CCAGGCTGGC CTTGAACTCA GAAATCTGCC TGCCTCTGCC TCCCGAGTGC 7 TGGGATTAAA GGCGTGTGCC CATCGAGGAG GGAGATTTTA TTTAGATTAT AAAAAGGACG 7 GGATTTGGGG AATCCTGTCT AGTGAATTCA GGACGTAATC AGTGGCTGGG AAGCAAGAGC 8 TCTAGAGGAG CTCCAGCTTA TTATGACCCT TCCTTCAGAT GCCACAAGGA GGTGCTGGAG 9 TTCTATGCAC CAATAGCTTA AACCAGCCAG GCTGGCTGTA GTGGATTGAG CGTCTGAGGC 9 TGCACCTCTC TGGCCTGCAG CCAGTTCTGG GTGAGACTGA CCCTGCCTGA GGGTTCTCTC 10 : CTTCCCTCTC TCTACTCCTT CCTCCCTCTC CCTCTCCCTC TCTCTGTTTC CTGAGGTTTC 10 , CAGAATTGGG GATGGGACTC AGAGACACCA CTAAAGCCTT ACCTTTTAAG AAGTTGCATT 1 1 ' CAGTGAGTGT GTGAGACATA GCACAGATAG GGGCAGAGGA GAGCTGGTTC TGTCTCCACT.
11. C GTGTTTGGTC TTGGGTACTG AACTCAGACC ATCAGGTGTG ATAGCAGTTG TCTTTAACCC 12 t TAACCCTGAG C CTGTCTCAC CTGTCCCTTC CCAAGACCAC TGAAGCTAGG TGCAAGATAA 1 31 GTGGGGACCC TTTCTGAGGT GGTAGGATCT TTCACGATAA GGACTATTTT GAAGGGAGGG.
12. c AGGGTGACAC TGTCCTAGTC CTCTTACCCT AGTGTCTCCA GCCTTGCCAG GCCTTAAACA.
13. TCCGCCCATT GTCACCGCTC TAGAAGGGGC CACCCTTGAC TTGCTGCTAA ACAAGGCACT.
14. ( CCCTAGAGAA GATAC CATAC CTGTGGGCAG GATGACCCAT GTTCTGCCAT GCACTTGGTA 15 t GCCTTGGAAA GGCC ACTTTG AACCTCAATT TTCTCAACTG TTAAATGGAG TGGTAACTGC 1 61 TATCTCATAA TAAAGGGGAA CGTGAGGAAG GCGTTTGGAT AGTGCCTGGT TGCGGCCAGG.
15. E CTGCAGTCAA GACTAGTTC C CACCAACTCG ATTTTAAAGC CTTGCAAGAA GGTGGCTTGT.
16. TTGTCCCTTG CAGGTTCCTT TGCTCGGGCC AAACTCTAGA ATGCCTCCCC CTTTCTTTCT.
17. C CATTGAAGAG CAGACCCAAG TCCGGGTAAC AAGGAAGGGT TTCAGGGTCC TGCCCATAAA 18 £ AGGTTTTTCC CGGCCGCCCT CAGCACCGCC CCGCCCCGAC CCCCGCAGCA TCTCCAAAGC 192 ATGCAGAGAA TGTCTCCGGC TGCCCCCGAC AGACTGCTCC AACTTGGTGT CTTTCCCCAA.
18. E ATATGGAGCC TGTGTGGAGT GAGTGGGGCG GCCCGGGGTG GTGAGCCAAG CAGACTTCCA 204 TGGGCAGGGA GGGGCGCCAC GGGGCGGCAG AGGGGTGACA TCACTGCCTA GGCGGCCTTT 2 1 C AAACCCCTCA CCCAGCCGGC GCCCCGGCCC GTCTGCCCCA GCCCAGACAC CGAAGCTACT 2 1 Ê CTCCTTCCAG TCCACAAACG ACCAAGCCTT 2 1 S 19 Souche déposée le 25 mars 1996 auprès de la CNCM sous le n°l1685 portant le plasmide p2126πlz comprenant la séquence seion la revendication 18 .
19. Souche déposée le 25 mars 1996 auprès de la CNCM sous le n° 11686 portant le plasmide p2126INTnlz comprenant la séquence selon la revendication 17.
20. Vecteur caractérise en qu'il contient une séquence selon l'une des revendications 1 a 16.
21. Vecteur selon la revendication 20, caractérisé en ce qu'il contient une origine de réphcation efficace dans les cellules des artères.
22. Vecteur selon l'une des revendications 21 et 22 caractérisé en ce qu'il est un dérivé d'un adénovirus.
23. ARN caractérisé en ce qu'il est capable d'être exprime par une séquence ou un vecteur seion l'une des revendications 1 à 23.
24. Composition caractérisée en ce qu'elle contient une séquence ou un vecteur selon l'une des revendications 1 à 16 et 21 à 23.
25. Composition selon la revendication 25, caractérisée en ce que la séquence ou le vecteur sont compris dans une composition facilitant leur transfection dans les cellules.
26. Composition selon la revendication 25, caractérisée en ce qu'elle comprend un gel qui est un complexe de polyLlysiπe et de lactose.
27. Médicament caractérisé en ce qu'il contient une séquence ou un vecteur selon l'une des revendications 1 à 16 et 21 à 23.
28. Composition pharmaceutique caractérisée en ce qu'eue contient une quantité pharmaceutiquement efficace d'une séquence nucléique ou d'un vecteur selon l'une des revendications 1 à 16 et 21 a 23, et des excipients pharmaceutiquement compatibles.
29. Utilisation d'un vecteur ou d'une séquence selon l'une des revendications 1 à 16 et 21 à 23 pour la fabrication d'un médicament pour le traitement des maladies coronariennes.
30. Utilisation d'un vecteur ou d'une séquence selon i'une des revendications 1 a 16 et 21 à 23 pour la fabrication d'un médicament pour le traitement de la restenose.
31. Utilisation d'un vecteur ou d'une séquence selon l'une des revendications 1 a 16 et 21 à 23 pour la fabrication d'un médicament pour le traitement des mutations fragilisant les vaisseaux.
32. Animaux transgéniques caractérisés en ce qu'ils portent une séquence ou un vecteur selon l'une des revendications 1 à 16 et 21 à23 dans lequel le gène codant pour la protéine d'intérêt thérapeutique est remplacé par un gène reporteur .
33. Procédé de criblage de molécules in vitro pour leur activité sur les séquences régulatrices du gène codant pour la protéine SM22 comprenant les étapes suivantes' transfection de cellules avec une séquence ou un vecteur selon l'une des revendications 1 à 16 et 21 à 23, dans lequel le gène codant pour la protéine d'intérêt thérapeutique est remplacé par un gène reporteur, incubation des cellules transfectées avec la molécule à tester, et quantification de l'expression du gène réporteur.
34. Procédé de détection de mutations sur la région comportant la séquence selon l'une des revendications 1 à 16 ou le vecteur selon l'une des revendications 21 à 23, caractérisé par une altération de l'expression du gène placé en aval de ladite séquence.
35. Procédé d'expression de protéines d'intérêt thérapeutique caractérisé en ce qu'il met en oeuvre les produits selon l'une des revendications 1 à 24.
Description:
SEQUENCES EN AMONT DU GENE SM 22, VECTEURS LES CONTENANT ET LEURS UTILISATIONS THERAPEUTIQUES,

NOTAMMENT DANS LE TRAITEMENT DES MALADIES VASCULAIRES

La présente invention est relative à des séquences en amont d'un gène exprimé dans les cellules du muscle lisse, tel que SM 22, ainsi qu'à des vecteurs les contenant.

Elle a en outre pour objet l'utilisation de ces vecteurs et séquences en thérapeutique, par exemple pour la production de polypeptides actifs localement ou de manière systémique, notamment des polypeptides i mmunogènes, des polypeptides régulateurs endogènes tels que les cytok i nes, ou encore pour la production d'ARN d'intérêt thérapeutique , par exemple un ARN anti-sens De manière particulière, l'invention a pour objet l'utilisation des vecteurs et séquences nucléotidiques dans le traitement des maladies vasculaires.

L'athérosclérose est une maladie dégénérative des artères assoc i ant les lésions de l'artériosclérose et de l'athérome, et combinant a i nsi un durcissement des artères et une dégénérescence graisseuse de leur tun i que interne. Cette insuffisance coronarienne est généralement remédiée par une angioplastie coronaire percutanée consistant à i ntroduire dans le réseau artériel coronaire un cathéter muni à son extrém i té d'un ballonnet, d'avancer le cathéter j usqu'au niveau de la sténose et de gonfler le ballonnet afin d'écraser la lésion contre la paroi et de rétablir ainsi un calibre coronaire permettant une perfusion myocardique suffisante

Cette technique de revasculansation myocardique est très largement utilisée (50 000 interventions par an en France et 500 000 i ntervent i ons par an aux Etats-Unis) mais est cependant limitée par la réappar i tion, dans les mois suivants l'opération, d'une nouvelle lésion au s i te dilaté, ou resténose, dans environ 30 % des cas.

Les d i vers traitements proposés pour traiter ce type de lésions sont résumés dans l'article de FELDMAN et STEG "Perspective de la thérap i e gén i que de la resténose" (Médecine/Sciences, synthèse 1996 12, 47-55)

Deux mécanismes sont responsables des resténoses l'hyperplasie mtimale et le remodelage artériel Le premier de ces mécanismes, l'hyperplasie intimale est due à la prolifération des cellules musculaires lisses dans l'intima, qui aboutit à la synthèse d'une volumineuse matrice extra cellulaire Cette activatioπ serait induite par la libération locale de facteurs de croissance, et de cytokines. ainsi que par la suppression de la synthèse de certains peptides endothéliaux antiproliférants. Le second mécanisme, le remodelage artériel, consiste en une réduction du calibre de l'artère sans modification de l'épaisseur de la paroi, et donc sans prolifération de cellules.

Ces auteurs décrivent diverses tentatives destinées à inhiber l'hyperplasie iπtimale, par thérapie génique, mais dont les résultats se sont révélés peu satisfaisants, pour diverses raisons L'inefficacité du transfert est une des raisons généralement invoquée pour expliquer ces résultats Ce problème a été partiellement résolu par l'utilisation de vecteurs adénoviraux, mais d'autres problèmes sont apparus, liés à l'immunogénicité de ces virus, au risque de recombiπaison avec des adénovirus sauvages ou au risque de dissémination de ces vecteurs dans la circulation systémique. Ces auteurs citent en outre l'utilisation de séquences promotrices spécifiques des cellules vasculaires, comme la préproendothéline, ou des complexes adénovirus-ligand, comme constituant des voies de recherche très intéressantes, sans pour autant développer ces aspects.

La demande WO 96/05.321 (Rhône Poulenc Rorer S A.) décrit aussi des adénovirus recombinants défectifs comportant un gène suicide pour le traitement de la resténose. Le gène suicide peut être placé sous le contrôle d'un promoteur actif dans les cellules musculaires lisses vasculaires. Seul le promoteur de l'actiπe α du muscle lisse est cité dans le cadre de ce mode de mise en oeuvre. Aucun exemple d'utilisation d'une telle construction ne vient illustrer cette demande.

Les protéines constituant les muscles lisses ont fait l'objet d'études parcellaires Ainsi, la protéine SM 22, qui constitue un des premiers marqueurs à apparaître lors de la différenciation des cellules de muscles lisses, a été étudiée et la partie codante de son gène a été séquencée

chez la souris (SOLWAY et AL, 1995, J Biol Chem, 270,22, 13460- 13469) et chez le rat (KEMP et AL, 1995, BIOCHEM J 310, 1037-1043) Les séquences du gène de poulet et du gène humain ont aussi ete déterm i nes (Nishida et al, 1991 , Biochem Int , 23 663-668 pour le gène de poulet , Thweatt et al 1992, Biochem Biophyse Res Comm , 187 1 - 7 pour le gène humain)

Le g è ne codant pour la protéine SM 22 alpha chez la souris est compose de cinq exons et comprend 6,2 kb II est présent en une seule copie dans le génome SOLWAY et al ont montré que les 441 paires de base en amont de la région codante du gène étaient nécessaires et suffisantes pour induire un taux important de transcription d'un gène reporteur, dans des cultures cellulaires primaires d'aortes de rats et dans les lignées kjr Ils ont d'autre part mis en évidence que les ARN messagers de ce gène étaient exprimés a des taux importants dans l'aorte, dans l'utérus, dans les poumons et dans l'intestin

KEMP et al (1995, BIOCHEM J 310, 1037-1043 ) ont clone et séquence le fragment de 1 ,9 kb en amont de la séquence codante du gène SM 22 de rat Des délétions effectuées dans le fragment ont montré que la région du promoteur comprise entre les nucléotides +65 et -303 éta i ent plus actives qu'un fragment de 1 ,5 kb comprenant une part i e i mportante de la région du gène non traduite, ce qui suggérerait la présence de séquences régulatrices à l'extrémité 5' du promoteur

OSBOURN et AL (1995, Gène, 154, 249-253) ont aussi étudié la rég i on 5' en amont du gène SM 22 du rat Ils ont mis en évidence la présence de deux introns dans cette région

On notera que ces études ont été faites m vitro en utilisant des cultures de cellules primaires de l'aorte, et non in vivo Or, ces cond i t i ons d'expérimentation ne sont pas représentatives de l'activit é des gènes dans les cellules de l'organisme

De plus, elles ne concernent qu'une région très limitée de la partie non codante du gène située à l'extrémité 5' c'est-à-dire la partie en aval du nucléotide -441

Plus r é cemment Li et al (1996, J Cell Biol, 132, 849-859) ont é tudié la régulation du gène SM22 à l'aide de souris transgéniques

Néanmoins, cet article ne mentionne aucune application de vecteurs portant des fragments de ce gène et en tout état de cause aucune application thérapeutique

En outre un nombre limite de constructions ont été fabriquées, et de manière générale seul I effet sur des embryons, et non sur des adultes, a été teste

Les auteurs déduisent de leur étude que les séquences comprises entre les nucléotides -2735 et -445 ne contiennent pas d'éléments régulateurs musculaires essentiels Le demandeur s'est attaché à identifier in vivo, sur des individus adultes l'activité des diverses régions constituant la région en amont de la séquence codante exprimée du gène de la protéine SM 22 II s'est d'autre part attaché a déterminer si des modifications dans cette séquence induisait les changements dans l'expression du gène dans les différents tissus

Il a mis en évidence de manière surprenante qu'il était possible , en modifiant la région en 5' du gène de la protéine SM 22 de souris, d'obtenir, chez des individus adultes, une expression spécifique d'un gène reporteur dans les muscles lisses des artères et en particulier de l'aorte

Il a en outre montré que les séquences identifiées par Ll et al (1996, précédemment cités) comme ne contenant pas de séquences régulatrices essentielles, contenaient au contraire des séquences indispensables à une expression spécifique du gène SM 22 chez l'adulte

II a enfin montre de manière surprenante que des séquences introniques étaient nécessaires pour l'induction d'une expression spécifique dans les artères

La présente invention a donc pour objet une séquence d'ADN caractérisée en ce qu'elle comprend

- un fragment de la séquence en amont de la partie codante du gène de la protéine SM 22, ou d'une séquence hybπdant dans des conditions fortement stπngentes à ladite séquence en amont, ledit fragment étant susceptible d'induire une expression spécifique m vivo de ce gène dans des cellules des artères, et

- une séquence codant pour une protéine, ou un ARN, d'intérêt thérapeutique

L'invention concerne également toute séquence nucléotidique ou ohgonucléotide d origine naturelle ou obtenue par synthèse chimique présentant une homologie avec la séquence SEQID n°1 d'au moins 70 %

On entend par séquence nucléotidique d'origine naturelle, un fragment d'ADN complémentaire obtenu par transcription inverse de l ' ARN messager cellulaire ou encore un fragment d'ADN génomique obtenu après clivage de l'ADN cellulaire à l'aide d'enzymes de restriction

On entend par séquence nucléotidique obtenue par synthèse chimique un fragment d'ADN de séquence connue généré par synthèse automatique de polynucléotides, par exemple à l'aide d'un appareil automatique adapte

On entend par protéine ou ARN d'intérêt thérapeutique une molécule susceptible d'inhiber la croissance des cellules du muscle lisse, d'activer la croissance des cellules endothéhales, de consolider les artères et/ou capable d'induire une réponse immunitaire cellulaire ou humorale

Pour la présente invention, le terme "conditions fortement stπngeπtes" est utilisé dans le sens donné par Maniatis et al , 1982 (Molecular cloning A Laboratory Manual, Cold Spπng Harbor Lab CSH, N Y USA ou l'une de ses récentes rééditions. A titre préféré, les conditions d'hybridation sont telles que décrites par Maniatis (édition de 1982) Trois lavages destinés à éliminer les fragments non hybrides sont nécessaires et sont effectués à 65°C en présence de 0,2 SSC et 0, 1 % SDS, en l'absence de formamide

De manière avantageuse, ladite séquence comprend un fragment de la séquence comprise entre les nucléotides -2126 et +4135, dont la séquence SEQ ID n°1 est donnée en annexe, de la séquence comprise entre les nucléotides

-2126 et +65 dont la séquence SEQ ID n° 2 est donnée en annexe ou encore de la séquence comprise entre les nucléotides -2126 et -445 dont la séquence SEQ ID N°3 est donnée en annexe

Elle peut aussi comprendre un fragment de la séquence SEQ ID N° 4

Un tel fragment peut en particulier comprendre au moins une partie de la séquence SEQ ID N°5 qui correspond à la partie en amont de l'extrémité 5' de la partie codante comprise entre les nucléotides -2126 et -1 340 Une telle séquence SEQ ID N°5 dont la séquence est donnée en annexe constitue un objet de la présente invention

Les séquences SEQ ID n° 2 et SEQ ID n° 1 sont comprises respectivement dans les plasmides p2126nlz et p2126INTnlz portées par les souches déposées le 25 mars 1996 auprès de la Collection Nationale de Culture de Microorganismes de l'Institut Pasteur (CNCM) respectivement sous les n° 1-1685 et 1-1686

L'invention a également pour objet les séquences hybπdant dans des conditions de forte stringence avec les séquences SEQ ID n° 1 SEQ ID n° 2, SEQ ID n° 3 et SEQ ID N° 5

Les séquences incluant la séquence du premier intron du gène SM 22, et en particulier la séquence SEQ ID N° 1 constituent des modes de mise en oeuvre particulièrement avantageux de la présente invention, car elles permettent une expression de protéines ou ARN d'intérêt thérapeutique, chez l'adulte, spécifique des artères

La présente invention n'est néanmoins pas restreinte à des séquences contenant des fragments du gène de souris, mais concerne toute autre séquence de toute autre espèce ayant les mêmes propriétés à savoir d'induire spécifiquement une expression d'un gène dans les cellules des artères Ainsi, l'homme du métier pourra avantageusement se référer à l'article de KEMP et AL (1995, précédement cité) qui décπt la séquence en amont du gène de rat de la protéine SM 22 La présente invention couvre aussi toute séquence comprenant des fragments des séquences en amont de gènes de la protéine SM 22, modifiées par exemple par délétioπ de certaines structures qui conservent des fonctions identiques ou similaires à celles de la séquence complète

La protéine d'intérêt thérapeutique peut être une protéine induisant la formation d'un composé cytotoxique, telle que la thymidine kiπase du virus de l'herpès Cette protéine présente la particularité de transformer le ganciclovir (Merck Index, référence 4262), un analogue de la

guanosine, en un dérive qui bloque la synthèse de l'ADN dans les cellules en réphcation L'introduction d'un gène codant pour cette protéine dans les séquences selon la présente invention permet donc de bloquer la prolifération des cellules dans le cas de l'hyperplasie intimale Une séquence codant la thymidine kinase est notamment décrite par Caruso et Klatzmann (1992, Proc Natl Acad Sci , USA, 89, 182-186)

Ladite protéine d'intérêt thérapeutique peut aussi être une protéine présentant un effet cytostatique, telle que la protéine codée par le gène Rb (Chang et al 1995 Science, 267, 518-522), ou par le gène eNOS (Hamon et al , 1994, Circulation, 90, 1357-1362)

Elle peut aussi être une protéine présentant une activité lipolytique, telle qu'une lipoprotéine lipase De telles protéines sont codées par les séquences décrites par Reyner (1995, Nature Genetics, 10, 28) et Ming Sun Liu (1 994 J Biol Chem, 269-1 1417) Elle peut aussi être un facteur de croissance des cellules endothéliales Une telle protéine peut être en particulier une interleukme

Elle peut être une protéine musculaire, telle que la myosine, ou l'actine, ou encore une protéine de structure tissulaire telle que le collagèπe ou l'élastine

Elle peut être une protéine induisant une réponse immunitaire telle que décrite dans la demande WO 90 1 1092, et en particulier un antigène viral tel que la glycoprotéine gp120 ou la protéine Nef du VIH (virus de l'immunodéficience humaine) De manière générale, ladite protéine peut être une ou plusieurs protéines présentant un intérêt thérapeutique ou vaccinal, telles que des protéines d'intérêt immunothérapeutique, par exemple des interleukmes, les facteurs de croissance, par exemple les facteurs de croissance des fibroblastes (FGF) ou le NGF (Nerve Growth Factor), des protéines pouvant induire une réponse immunitaire, que ce soit une immunité humorale, cytotoxique ou cellulaire, ou des protéines permettant de complémenter l'activité d'un gène normalement exprimé chez l'individu à traiter mais qui ne l'est plus, soit par mutation ou délation de sa séquence

Cette séquence peut aussi coder pour un ARN d'intérêt thérapeutique Un tel ARN peut être l'ARN antisens de la protéine p 53 ou un ARN tel que décrit dans la demande WO 90 1 1092 déposée par la société VICAL La présente invention a en outre pour objet des vecteurs caractérises en ce qu'ils contiennent une séquence selon l'invention telle que décrite ci-dessus Un tel vecteur peut contenir tout autre séquence d'ADN nécessaire à l'expression de la protéine, ou de l'ARN, d'intérêt thérapeutique dans les tissus cibles, et en particulier peut contenir une origine de réphcation efficace dans les celluies des artères, en particulier dans les cellules du muscle lisse

Un tel vecteur peut comprendre des séquences permettant la recombinaison homologue chez l'organisme traité, spécifique du gène a remplacer, lesdites séquences étant placées en amont et en aval de la séquence selon l'invention Du fait de la présence de telles séquences, le gène non désiré, présent dans l'organisme traité sera remplacé par le gène porté par le vecteur ou la séquence et que l'on désire voir s'exprimer dans l'organisme

Une telle méthode de recombiπaison homologue peut être du type de celle décrite par Le Mouellic et al , (1990, Proc. Nat Acad Sa USA , 87, 4712-4716) ou dans la demande PCT WO 91/06 667

Un tel vecteur peut être un vecteur dérivé d'un adénovirus Des adénovirus adaptes a la mise en oeuvre de la présente invention sont en particulier ceux décrits par FELDMAN et STEG (1996, précédemment cité) ou OHNO et al (1994, Sciences, 265, 781 -784) ou encore dans la demande FR 94 03 151 (Institut Pasteur, Inserm) Ces virus sont généralement rejetés par l'individu, du fait de leur trop forte immunogenicité Néanmoins, des souches de ces virus ont ete sélectionnées afin de diminuer leur caractère immunogène En tout état de cause, ces vecteurs, même présentant une forte immunogenicité, peuvent être utilisés dans le cadre de la présente invention, car les artères sont traitées durant des périodes de temps relativement courtes, de l'ordre de quelques semaines, compatibles avec les temps de rejet des adénovirus par le système immunitaire de l'hôte

On notera néanmoins que l'introduction des séquences selon la présente invention dans les vecteurs décrits ci-dessus n'est pas indispensable, et que les cellules des artères peuvent être directement traπsfectees par de l'ADN comprenant ces séquences Les séquences nucléiques selon la présente invention peuvent être introduites après couplage covalent de l'acide nucléique avec des composés favorisant leur pénétration dans les cellules ou leur transport vers le noyau, les conjugués résultants étant éventuellement encapsulés dans des microparticules polymères, comme dans la demande internationale WO 94/27238 de Meidsorb Technologies International

Selon un autre mode de réalisation, les séquences nucléiques peuvent être incluses dans un système de transfection comprenant des polypeptides favorisant leur pénétration dans les cellules, comme dans la demande internationale WO 95/10534 de Seikagaku Corporation

Ces vecteurs ou séquences peuvent être administrés in situ par tout moyen connu de l'homme du métier Ainsi, ils peuvent être délivrés in situ à l'aide d'un cathéter à ballonnet recouvert de canaux, tel que décrit par FELDMAN et STEG (1996, précédemment cité)

Ils peuvent aussi être administrés au cours d'une opération, ou en dénudant l'aorte Un autre mode d'administration consiste à introduire un grillage de faible maillage imprégné d'ADN comprenant ces séquences, le long de l'aorte , tel que décrit par Feldman et al (1995 J Clin Invest 95 2662-2671 )

Ces séquences ou vecteurs peuvent avantageusement être administrés sous la forme d'une composition les contenant, par exemple dans un gel facilitant leur transfection dans les cellules des artères Un tel gel peut être un complexe de poly-L lysine et de lactose, tel que décrit par MIDOUX (1993, Nucleic Acid Research, 21 , n°4, 871 -878) ou du poloxamer 407 tel que décrit par PASTORE (1994, Circulation, 90 I- 517) lis peuvent aussi être mis en solution dans une solution tamponnée ou être associés à des liposomes

La présente invention est en outre relative à des médicaments contenant de telles séquences, vecteurs ou compositions, ainsi qu'à des compositions pharmaceutiques les contenant en quantités

pharmaceutiquement efficaces ainsi que des excipients pharmaceutiquement compatibles

De tels séquences, vecteurs ou compositions peuvent être avantageusement utilises pour la fabrication de médicaments pour la délivrance au niveau des artères d'un ADN (ADNc ou ADN géπomique) pouvant exprimer notamment un gène codant pour une protéine d'intérêt, pour le traitement des maladies coronariennes, et en particulier pour le traitement de la resténose Elles peuvent néanmoins être aussi utilisées pour la fabrication d'un médicament pour le traitement de mutations fragilisant les vaisseaux Un tel médicament pourrait, par exemple, comprendre une séquence ou un vecteur selon l'invention capable d exprimer un gène codant pour une protéine normale de la desmine ou une protéine d'adhésion du muscle du type CAM

La présente invention a aussi pour objet des ARN exprimés à partir des séquences et vecteurs objets de la présente invention, et en particulier des ARN messager

La présente invention a aussi pour objet un procédé de criblage de molécules m vitro, en vue de tester leur activité sur les séquences régulatrices du gène codant pour la protéine SM 22 Un tel procédé comprendra, par exemple, une première étape suivant laquelle on transfecte des cellules avec une séquence ou un vecteur selon l'invention comprenant un gène reporteur placé sous le contrôle de tout ou partie de la séquence du promoteur du gène codant pour la protéine SM 22 Dans une seconde étape, les cellules ainsi transfectées sont incubées en présence de la molécule à tester, puis l'expression du gène reporteur est quantifiée

Les cellules utilisées pour la transfection sont avantageusement des cellules de muscle lisse, en particulier des cellules de l'aorte, soit sous la forme d'une culture primaire, soit sous la forme d'une lignée cellulaire stable

Dans le cas ou les cellules sont transfectées par des constructions telles que p2126nlz ou p2126INTnlz, la quantification de la bêta-galactosidase produite sera avantageusement effectuée par lecture optique, par exemple en utilisant la trousse de détection commercialisée par Boehπnger sous la référence 1 669 893 (catalogue Boehππger-

Mannheim - « Biochemicals » 1996, page 236. béta-Gal Reporter Gène Assay, Chemilummescent)

Dans un autre mode de réalisation du procédé de criblage in vitro selon l'invention, le gène reporteur est le gène codant pour la luciférase Dans ce cas, la quantification de l'expression de la luciférase est avantageusement effectuée par chimioluminescence, par exemple au moyen de la trousse de diagnostic commercialisée par Boehπnger sous la référence 1 758 241 (catalogue Boehπnger-Mannheim « Biochemicals », 1 996, Luciférase Reporter Gène Assay) La présente invention est aussi relative à des animaux transgéniques et en particulier des souris portant une séquence ou un vecteur tel que défini ci-dessus dans lequel le gène codant pour la protéine d'intérêt thérapeutique est remplacée par un gène reporteur

La présente invention est enfin relative à un procédé de détection de mutations de la séquence en amont de la partie codante du gène de la protéine SM22 De telles mutations sont en effet susceptibles de modifier l'expression du gène codant pour la protéine SM22, en particulier diminuer ou même abolir l'expression de ce gène dans les muscles lisses De telles mutations seraient de nature à entraîner une modification du fonctionnement du muscle lisse, la protéine SM22 étant apparentée à une famille de protéines impliquées dans la régulation de la fixation du calcium, du type calponme (Ayme-Southgate et al 1989, J Cell Biol ) Un tel procédé de détection de mutations peut être avantageusement le procédé objet de la demande de brevet français FR-93 10821

De manière complémentaire, des séquences selon l'invention modifiées de telle sorte qu'elles permettent une augmentation de l'expression du gène SM22 font également partie de l'invention

De telles souris transgéniques peuvent être utilisées pour cribler des molécules pour leur activité sur les séquences régulatrices gène codant pour la protéine SM 22 Des molécules peuvent être administrées à des souris, puis après sacrifice, des coupes histologiques sont effectuées afin de mettre en évidence les tissus colores par le gène reporteur

Pour la mise en oeuvre de la présente invention, l'homme du métier pourra avantageusement se référer au manuel suivant "SAMBROK et al (Molecular cloning, A Laboratory Manual, Cold Spπng Harbor

Laboratory Press, New York, 1989), ou à l'une de ses récentes rééditions

La présente invention est illustrée sans pour autant être limitée par les exemples qui suivent

La figure 1 représente la carte de restriction et la structure exon/intron du site SM 22, comprenant la région -2474 à +6030 (par rapport au site d'initiation de la transcription). Les exons sont représentés par des carrés blancs tandis que les flèches indiquent la position des séquences répétées de type B1

La figure 2 représente l'alignement de trois séquences répétées de type B1 , dans lesquelles les échanges de base sont indiquées La figure 3 est un autoradiogramme illustrant l'identification du site d'initiation de la transcription Le puits P correspond à l'amorce utilisée

La figure 4A représente la séquence de la région 5' en amont du site d'initiation de la transcription, et de l'exon du gène SM 22. Les sites de fixation des différents facteurs sont indiqués, ainsi que les différentes séquences concensus. Les lignes discontinues indiquent la position des séquences répétées de type B1 .

La figure 4B est une carte de restriction schématique du gène SM 22.

La figure 4C est une carte de restriction détaillée du gène SM 22.

La figure 5 illustre la fabrication du plasmide p352nlz

La figure 6 illustre la fabrication du plasmide p2126 nlz.

La figure 7 illustre la fabrication du plasmide p2126INTnlz.

Les figures 8A et 8B illustrent l'expression du gène lacZ dans des embryons de souris transgéniques. Les figures 8A, 8B, représentent respectivement des embryons aux stades 12,5 et 15,5 jours.

Les figures 9A à 9D représentent des coupes histologiques d'embryons colorés à l'aide de lacZ. La figure 9A représente une coupe d'un embryon au stade 12,5 jours au niveau du coeur, montrant une coloration intense exclusivement dans le myocarde du ventricule droit (RV) et dans les parois des artères (abréviations AA coude de la

quatrième artère aortique , CA artère carotidienne , E oesophage , Iv ventricule gauche PA partie proximale de l'aorte , PT tronc pulmonaire , RA atrium droit RV ventricule droit , T trachée , V veine cardinale droite et gauche) La figure 9B représente une coupe à travers la région abdominale d'un embryon au stade 14,5 jours, montrant une coloration des artères ombilicales (UA) et l'absence de marquage des viscères (B vessie , D duodénum , H gros intestin L foie , M intestin grêle , ST estomac) La figure 9D est une coupe à travers les segments de la queue au stade 12,5 jours montrant le marquage dans le myotome (my) et l'artère de la queue (a)

La figure 9C est un agrandissement de la partie de la photographie correspondant a I artère ombilicale au stade de 12,5 jours, montrant un marquage exclusif de la couche musculaire (m) et une absence de marquage de l'endothehum (e)

Les figures 10A a 10C illustrent l'expression du traπsgene dans des souris adultes

La figure 10A représente une vue de dessus de l'ensemble du coeur montrant un intense marquage de l'aorte (a) et de l'artère pulmonaire (pa) et une absence de marquage de la veine cave (vc) Les figures 10B et 10C sont des coupes à travers la couche de muscle lisse (sm) du colon de l'adulte et d'une artère mésentère adjacente (ma) Le marquage de lacZ (figure 10B) montre que l'expression du transgèπe est restreinte à l'artère tandis que l'immunofluorescence avec des anticorps SM 22 (figure 10C) met en évidence l'expression du gène SM 22 endogène dans les cellules du muscle lisse aussi bien de l'artère que du colon

La figure 1 1 représente un vecteur comportant les régions régulatrices du gène SM 22 et le gène codant la thymidme kmase du virus de l'herpès

Les figures 12A à 12D illustrent l'expression de la construction SM 445 nlz dans des embryons de 15,5 jours p c (figures 12A à 12C) et dans un adulte de 2 mois (figure 12D)

EXEMPLES: Matériels et méthodes

1. Clonage et caractérisation du gène de la souris SM 22

Environ 10 6 phages recombinants d'une banque génomique de souris c57/bl construite dans le phage delta-EMBL 3 (fourni par Dr D Plachov Munster Allemagne) ont été criblées en utilisant le fragment BAL l/Eco RV de 890 bp de l'ADN complémentaire de la protéine de souris SM22 ( Almendral et al, 1989 , Exp Cell Res 181 , 518-530), comme sonde La sonde a ete marquée radioactivement par initiation aléatoire et l'ADN a ete hybπdee sur des filtres laisses durant une nuit a 65°C dans un tampon de Church Les filtres ont été ensuite lavés dans du 0,2 X SSC/0 1 % SDS a 65°c et des plaques positives ont ete purifiées et homogénéisées par trois recriblages successifs dans des conditions identiques L'un des clones isolés s'est révèle contenir un locus SM 22 entier II a été ensuite cartographie à l'aide d'enzymes de restriction et sous-clone Afin d'éviter des réarrangements durant les procédures de clonage, une analyse par hybridation de type Southern de l'ADN génomique de souris et des clones génomiques a été effectuée et les figures de restriction des fragments ont été comparées La séquence du gène SM 22 a été déterminée sur les deux brins par la méthode de terminaison de chaîne ( Sanger et al, 1977, Proc Natl Acad Sci 74, 5463) en utilisant le kit Sequenase V2 0 (United States Biochemical, Clevelaπd, Ohio)

2. Hybridation de type Northern, extension par amorce, 5'RACE, et analyse de protection par RNAse

De l'ARN total de lignées cellulaires et de tissu de souris adulte a été isolée par la méthode de Chirgwiπ et al, (1979, Biochemistry, 1 8 5294-5299) modifiés Pour l'isolement des ARN messager, le kit Oligotex (Quiagen Inc, Chatsworth, CA) a été utilise en suivant les instructions du fabricant

Les analyses par hybridation de type Northern ont été effectuées en utilisant des gels d'agarose contenant du formaidehyde et par hybridation capillaire sur des membranes Hyboπd-N (Amersham Life Science Little Chalfont Royaume Uni) selon les méthodes connus de l'homme du métier

Pour les analyses par extension d'amorce un oligonucléotide synthétique de 30 nucléotides (P27N1 ) complémentaire de la séquence +36 a +65 de l'ADN complémentaire du gène SM 22 présentant la séquence SEQ ID N° 6 (5'-AAGGCTTGGTCGTTTGTGGACTGGAAGGAG-3), a ete marque par de la poiynucléotide kinase T4 5 μg d'ARN messager d'utérus de souris ont été hybrides a 55°C avec 1 -2 X 10 5 cpm de sonde purifiée et la reaction d'extension d'amorce a été effectuée en utilisant les procédures de laboratoire connues de l'homme du métier Les résultats sont analysés par électrophorèse sur des gels de polyacrylamide dénaturants à 6 % Une réaction utilisant la même amorce a été chargée dans un puits adjacent afin de permettre une détermination directe du site d'initiation de la transcription

La méthode 5'RACE a été effectuée en utilisant deux oligonucleotides synthétiques antisens de 18 bp correspondant aux bases +1 12 à +129 (amorce 2) et +162 à +179 (amorce 1 ) de l'ADN complémentaire SM 22, tel que décrit en substance par FROHMAN et al, (1988, Proc Natl Acad Sci, 85, 8998-9002)

En vue des analyses de protection par ia RNase, un fragment obtenu par PCR de 417 bp comprenant la région -352 à +65 du gène du SM 22 a été fabriqué et clone par la méthode des bouts collants dans le site HinC II du vecteur pBluescπpt SK+ La séquence du fragment obtenu par PCR a été vérifiée Afin de générer une sonde ARN antisens marquée radioactivement, la construction a été linéarisée avec Sph I a la position -203 du gène SM 22 et transcrite avec de la RNA polymerase T7 en présence de 32p_Qjp [_ a SO nde (3 X 10^ cpm) a été hybπdée avec 5 μg d'ARN messager d'utérus de souris à 42°C durant une nuit Après hybridation les échantillons ont été incubés avec des RNases A et T (1 heure à 37°C), précipités, et analyses comme décrits pour l'analyse par extension d'amorce

3. Culture cellulaire et transfection

Les lignées cellulaires NIH 3T3, 10T1/2 et 8/47 ont été cultivées dans du DMEM (Life Technologies, Inc, Vienne, Autriche) complementées avec 10 % de sérum de foetus de veau (Hyclone Inc , Etats-Unis) a 37°C, dans une atmosphère de Co2 à 7%

Pour les expériences de transfection, des cellules confluentes ont été étalées, repiquées dans des boîtes de Petri de 6 cm, et laissées croître jusqu'à obtenir approximativement une confluence de 75 % avant ajout du mélange de transfection.

Les transfections ont été effectuées en utilisant le réactif Lipofectamine commercialisé par Life Technologies Inc .

En résumé 24 μg de Lipofectamine ont été ajoutés à 6 μg de plasmide portant le gène reporteur supereπroulé et 2 μg de PCMVβ gai comme témoin interne Après ajout de 3 ml de DMEM, le cocktail de transfection a été ajouté aux cellules. Au bout de 6 heures, ce mélange a été remplacé avec du milieu de croissance contenant 10 % de sérum et à nouveau changé au bout de 12 heures. L'expression du produit du gène reporteur a été analysée après 24 heures. Pour les expériences de st i mulation par le sérum, des cellules transfectées ont été placées dans du DMEM contenant 20 % de sérum, 24 heures avant d'être récoltées

4. Dosage de la CAT et de la β-galactosidase

Les cellules ont été prélevées sur des boîtes de pétri avec un racloir à cellules, centrifugées, resuspendues dans 150 μl de tampon Z (100 mM de phosphate de sodium, pH 7,5, 1 mM MgCI2, 10 nM KCI, 50 nMβ - mercaptoethanol) et lysées par trois cycles de congélation/décongélation. Les débris ont été éliminés par centrifugation à basse vitesse et l'activité de la β-galactosidase a été déterminée à partir de 2 à 20 μl de surnageant selon les procédés connus de l'homme du métier Pour la détermination de l'activité CAT selon GORMAN et al (1982 Mol. Cell. Biol , 2, 1044-1051 ), de 10 à 100 μl de lysat ont été utilisés. Afin de tenir compte des variations dans l'efficacité de transfection. l'activité CAT a été normalisée avec l'activité βgal.

5- Production des souris transgénigues Des mserts des plasmides pnlz2126 et p2126INTnlz. déposés auprès de la CNCM respectivement sous les n°l-1685 et n°l-1686, ont été isolés par digestion avec Sal l/Pme I, suivie d'une électrophorèse sur gel, puis d'une purification utilisant le kit Geneclean (Bio 101 . la Jolla, CA) puis resuspendus dans 10 mM de Tris Hcl pH 7,5, 0,25mM EDTA

Les animaux transgéniques ont été produits comme décrits précédemment par Ll et al (1993, Development, 177/3, 947-959)

Des souris portant le transgene ont été identifiées par PCR et hybridation de type Southern en utilisant une sonde ADN La construction pnlz2126 a permis d'obtenir trois animaux positifs sur 17 souris, deux d'entre elles transmettant et exprimant cette construction

Pour la construction p2126INTnlz deux animaux positifs sur les 28 testés ont été obtenus et a nouveau un seul exprime et transmet cette construction Les souris transgéniques ont été rétro-croisées avec des souris c57/bl et les colorations histochimiques ont été effectuées avec des souris hemizygotes pour le transgène 6. Colorations histochimigues Des embryons entiers ou des tissus d'adultes ont été fixés durant 15 à 30 minutes a 4°C dans du formaldéhyde à 1 % dans du tampon A (100 mM de phosphate de sodium , pH 7,3,2 mM Mgcl2, 0,1 % de sodium de deoxycholate, et 0 2 % NP-40). Après rinçage, les spécimens ont été colorés durant une nuit à 30 °C dans du tampon A contenant 1 mg/ml de X - gai (Sigma, St Louis, Missouri), 5 mM de ferrocyanure de potassium, 5mM de ferπcyanure de potassium, et 20 mM de Tns-CI pH 7,3 Les échantillons colorés ont alors été rincés, déshydratés à l'aide de concentrations croissantes d'éthanol, clarifiés dans du xylène, et enrobés dans de la paraffine Les coupes histologiques ont été effectuées avec une épaisseur de 7 à 10 μm et à nouveau colorées avec de l'hématoxlme d'Ehrhch et de l'éosiπe Les embryons ont d'autre part pu être a nouveau clarifiés à l'aide d'un mélange d'alcool benzylique et de benzoate de beπzyle

Pour rimmunohistocoloration, les tissus de souris ont été fixes dans 3 % de paraformaldéhyde dans du tampon PBS à 4°C durant 3 heures, puis enrobés dans un milieu Tissue-Tek (Reichert-Jung, Vienne) et sectionnés sur un cryo-microtome a des épaisseurs de 5 à 10 μm Les coupes sélectionnées ont été montées et colorées en utilisant un anticorps monocloπal dirige à rencontre de la SM 22 (Duband et al, 1993, Differentiations 55, 1 -11 ), à une dilution 1/30 ainsi qu'en utilisant un anticorps secondaire marqué Cy3 (Biological Détection Systems

USA) Les coupes ont été examinées à l'aide d'un microscope a fluorescence

EXEMPLE 1.

Caractérisation du locus SM 22 Le criblage par hybridation de la banque génomique de souris a conduit a l'isolement de trois clones se recouvrant, contenant le gène complet de la SM 22 Une carte de restriction, qui est partiellement reproduite sur la figure 1 a été établie et les exons ont été localisés par hybridation à l'aide de sondes ohgonucléotidiques synthétiques Les régions présentant un intérêt ont été sous clonées et séquencées

La séquence a été déterminée entre les positions -2474 et +1 10 en aval du site de polyadenylation et a été comparée dans la banque de données EMBL Le gène couvre 5923 bp à partir du site de début de la transcription jusqu'au site de polyadenylation et la séquence codante est partagée en 5 exons (figure 1 ) Toutes les frontières exon-mtron correspondent à des séquences consensus

Le premier exon contient seulement une séquence ieader en 5' et le codon de départ de la transcription est donc localisé dans le second exon séparé du site de départ de la transcription par plus de 4kbp de séquence d'intron

Deux signaux de polyadenylation potentiels ont été localisés au position 5905 et 5913 et plusieurs régions TGT placées en aval du site de polyadenylation, prennent vraisemblablement part dans la terminaison de la transcription

L'analyse de la séquence révèle de plus la présence de trois séquences répétées (figure 2) qui présentent des homologies importantes avec les éléments répétés de type B1 , dont certains sont transcrits par la RNA polymérase III et codent pour des ARN 5S On notera que toutes les séquences répétées sont dans une orientation inverse par rapport au locus SM 22

Le site de départ de la transcription a été cartographiée par analyse par extension d'amorce (figure 3) Un oligonucléotide antisens complémentaire de l'extrémité 3' de l'exoπ 1 conduit à l'obtention de quatre produits d'extension qui diffèrent seulement par une paire de

bases (bp) en longueur, le plus long d'entre eux étant de 65 bp. Le produit de la transcription démarre donc avec un G, 77bp en amont du codon d'initiation de la transcription.

Les produits d'extension les plus courts ont été vraisemblablement causés par une terminaison prématurée de l'extension de l'amorce due à des modifications (cappmg) à extrémité 5' de l'ARN messager

Ces résultats ont été confirmés par l'analyse par protection par la

RNAse , qui conduit à un fragment protégé de 65bp et par le clonage et le séquençage du produit d'extension dérivé d'une réaction indépendante avec une amorce antisens située dans le second exon du gène

Ces résultats sont en accord avec ceux de Solway et al ( 1995 précédemment cité). Des différences de séquences mineures entre ces deux résultats sont vraisemblablement dues à des variations alleliques entre les différentes souches de souris.

La séquence TTTAAA en position -28bp (figure 4) est en relation étroite avec la séquence TATAAA et a vraisemblablement la fonction d'une boîte TATA L'analyse par ordinateur de la séquence en 5' révèle la présence de plusieurs sites potentiels de liaison pour des facteurs ainsi que pour des éléments qui sont connus comme contribuant à la régulation de la transcription de gène musculaires (figure 4). Au total 1 1 boîtes de type E (CANNTG), quatre motifs du type Mef-2/rSRF (YTAWAAATAR), quatre éléments de liaison SRF potentiels (CC(A/T)6GG), cinq sites de liaision AP-2 (CCCMNSSS) et cinq motifs SP1 (GGGCGG) ont été localisés. Enfin, un élément similaire au motif TGT3-3, récemment identifié comme site de liaison d'un facteur nucléaire du muscle lisse et comme contribuant à la régulation de la transcription de l'actine alpha du muscle lisse, a été localisé (figure 4) EXEMPLE 2 Clonage et construction de plasmides recombinants pour la création de souris transgénigues 1. Fabrication de pnlz

Le plasmide pGEM7 (c'est-à-dire le plasmide pGEM-72F (+/-), commercialisé par Promega Corp., Madison, Wi, USA. Séquences disponibles dans Gen Bank, sous les numéros suivants X65310 et X

6531 1 ) comprend un gène de résistance à l'ampiciliine, un gène lac Z et une origine de réphcation II comprend 3000 paires de base II a été digéré avec Nae l/Bsp 1201 L'extrémité sortante Bsp 1201 du vecteur a été rendue « bouts francs » avec l'enzyme de Klenow, et le plasmide a été refermé en présence d'un hnker Sal I de 10 pb Le fragment lacZ de pGEM 7 a donc été délété, un site Sal I introduit, et un site Bsp 1201 restauré

Un site Pme I a été introduit par insertion d'un hnker Pme I avec des extrémités simple-brin sortantes Nsi I, dans le site Nsi I de la construction

Finalement, le gène lacZ couplé au signal de localisation nucléaire a été isolé à partir de pDes2.2πlz (Ll et al, 1993, précédemment cité) avec Hind III et Sac I donnant deux fragments du gène rapporteur

Les deux fragments ont été insérés entre les sites Hind III et Sac I du vecteur pGEM7 modifié et vérifiés pour leur orientation Cette procédure donne le vecteur pnlz sans promoteur

2. Fabrication de p352nlz

La figure 5 illustre la fabrication de ce plasmide

Un fragment PCR de 417 pb couvrant la région -352 à +65 du gène SM 22, dont la séquence se retrouve dans la séquence SEQ ID N° 1 qui comprend l'enchaînement des nucléotides - 2126 à + 4135, a été produit et inséré dans le site Hinc II rendu bout-franc du vecteur pBluescrιptSK+ La séquence du fragment PCR a été vérifiée Le fragment est récupéré par les sites Xba I et Xho I et inséré dans le plasmide pBLCAT 3 dans les sites correspondants, générant le recombinant p352CAT Pour créer p352nlz, le fragment Xba l/Xhol de p352CAT a été inséré dans les sites correspondants de pnlz

3. Fabrication de p2126nlz

Pour créer p2126nlz, un fragment Bsp 1201/Sph I de 1 ,9 kb recouvrant la région -2126 à -206 du locus SM 22, dont la séquence se retrouve dans la séquence SEQ ID N° 1 qui comprend l'enchaînement des nucléotides - 2126 a + 4135, a été inséré dans les sites respectifs de p352nlz Ce plasmide a été déposé le 25 mars 1996 auprès de la CNCM sous le n° 1-1685 Sa fabrication est illustrée par la figure 6

4. Fabrication de p2126INTnlz

La fabrication de ce plasmide est illustrée par la figure 7 Un fragment Bsp 1201/Hιnd III de 5,8 kb recouvrant la région -2126 a +3651 du locus SM 22 a été inséré dans les sites correspondants de pnlz donnant pINt-nlz Ensuite un fragment PCR de 496 pb de la base +3648 a +4143 du locus SM 22 a été généré en utilisant une amorce en amont et une amorce en aval conçue pour introduire un site Hind III en position 41 35-4140 Ce produit de PCR a été digéré avec Hind III et hé dans le site Hind III de pINT-nlz pour donner p2126INT-nlz La construction p2126INTniz contient donc 2126 paires de bases de la région en 5' du début de transcription, le premier exon, le premier intron entier et 15 paires de bases du deuxième exon avec les quatre dernières paires de bases mutées de CATG en GCTT pour éliminer le codon d'initiation de traduction et introduire un site Hind III comme mentionné ci-dessus La partie de l'insert dérivé du promoteur de SM 22 contenu dans le plasmide p2126 INTnlz est constitué par la séquence SEQ ID N°1 Ce plasmide a été dépose le 25 mars 1996 auprès de la CNCM sous le n°l-1686 Sa fabrication est illustrée par la figure 7 EXEMPLE 3 : Expression des constructions p2126 nlz et p2126 INTnlz dans les animaux transgénigues

Deux constructions utilisant le gène reporteur lacZ avec signal de localisation nucléaire du virus SV 40 ont été fabriquées, comme décrit dans l'exemple 2 La première construction, p2126nlz contient 2126 bp de la région en amont et le premier exon (65 bp) La seconde construction p2126INTnlz est identique à la première à l'exception de l'addition du premier intron et des premières 12bp du second exon

Comme indiqué dans la partie Matériel et Méthodes, chacune des constructions a donné naissance à au moins une souris transgénique exprimant le gène reporteur

Les embryons obtenus de 12,5 à 15,5 jours après le coït (dpc) ont été colores de manière a mettre en évidence l'activité βgai Les expressions des deux constructions sont identiques, à tous les stades

observés bien que p2126INTnlz donne une coloration un petit peu plus intense

L'expression a ete détectée en premier lieu au jour 8 5 dans la région du coeur de l'embryon et dans les vaisseaux de l'enveloppe cardiaque Au jour 9 5 l'expression de lacZ dans le coeur augmente et est confinée au ventricule droit aux artères

Entre 12,5 et 15 5 jours une ségrégation du marquage en fonction des régions devient évident, le marquage étant confiné au ventricule droit (figures 8A et 8B) Les coupes montrent que l'expression a heu dans le myocarde du ventricule droit, avec des marquages mineurs dans le ventricule gauche et dans l'adrium droit (figure 9A)

Cette expression dans le coeur est seulement transitoire et n'apparaît pas chez l'adulte Elle est vraisemblablement inhibée dans les phases tardives du développement des foetus L'expression précoce est aussi observée dans les segments du rostre à partir de 9,5 jours qui s'étend aux segments caudaux à 10,5 jours, et atteint des niveaux importants à 11 ,5 jours

L'expression diminue à partir de 12,5 jours dans les segments du rostre (figure 8B) et finalement n'est plus détectable à 14,5 jours (figure 10E)

Les coupes montrent que l'expression du transgène est restreinte à la région myotomale des segments (figure 9 D)

La plus grande partie de l'expression a heu dans le système vasculaire de l'embyron en développement A partir de 9,5 jours, l'expression est détectée dans l'aorte dorsale A 10,5 jours, la coloration de l'aorte dorsale et des coudes aortiques augmente et à 11 ,5 jours l'expression lacZ est clairement visible dans l'aorte dorsale, les coudes aortiques, les artères iliaques, les artères ombilicales, les artères de la carotide et dans les vaisseaux majeurs de la tête L'expression du transgène dans les vaisseaux augmente à partir de

12,5 jours date a laquelle les vaisseaux intercostaux peuvent être facilement vus (Figure 8A)

A 15 5 jours (figure 8B) lacZ est présent dans les vaisseaux majeurs, incluant ceux des membres et de la queue, et la coloration du tronc pulmonaire devient visible L'expression dans le système

vasculaire persiste chez l'adulte et est clairement visible dans l'aorte, dans le tronc pulmonaire et dans l'artère pulmonaire droite (figure 10A), ainsi que dans les vaisseaux des intestins (figure 10B), dans la vessie et dans l'utérus Des coupes histologiques révèlent mieux les différences dans l'expression du transgène dans les artères et dans les veines. La section de l'embryon à 12.5 jours (figure 9A) montre un niveau d'expression très élevée dans les couches musculaires des artères de la carotide, de ia quatrième artère du coude de l'aorte, du tronc pulmonaire proximal et de la partie proximale de l'aorte ascendante, tandis que les parties gauche et droite des veines cardinales antérieures restent non colorées L'absence d'expression du transgène dans les veines musculaires ressort à l'évidence des coupes du ductus venosus, ainsi que des veines portales et ombilicales La même situation est observée chez l'adulte, où l'expression ne peut jamais être détectée dans les veines caves (figure 10A) ni dans les veines pulmonaires.

Ces observations mettent en évidence des différences qui n'avaient jusqu'alors pas été mises en évidence entre les couches de muscles lisses des artères et des veines. D'autres vues des artères montrent que l'expression est restreinte à la couche de muscles et est absente de l'endothelium (figure 9C).

Il est de plus évident, au vu de l'ensemble des observations (figures 8A, 8B), que l'expression du transgène est absente des muscles lisses des viscères Ceci est inattendu, car le gène SM 22 endogène est supposé être exprimé dans les tissus musculaires lisses vasculaires et des viscères. Dans les coupes histologiques de la région abdominale d'embryon à 14 5 jours, les couches de muscles de l'estomac, de l'intestin et de la vessie en développement sont facilement reconnaissables (figure 9C). L'expression du transgène dans cette région est clairement détectée dans les artères ombilicales, mais pas dans les couches de muscles des viscères de l'estomac, du duodénum, de l'intestin grêle et du gros intestin, et de la vessie, où aucune expression lacZ n'est observée. En outre, aucune expression n'est observée dans l'oesophage et dans la trachée (figure 9A), ainsi que dans les bronches du poumon

La coloration du tissu musculaire de l'adulte donne essentiellement les mêmes résultats La figure 10B montre que l'expression du transgene est absente dans les muscles du colon, alors que le vaisseau mésentère est très fortement coloré par lacZ Par contre, la coloration par immunofluorescence de la coupe d'une région intestinale similaire montre que la protéine SM 22 endogène est présente dans les deux tissus (figure 10C) L'absence d'expression du transgène dans les muscles lisses des viscères de l'adulte est de plus confirmée par des colorations de l'oesophage, de la trachée, de la vessie du canal déférent et de l'utérus pour l'activité βgal En aucun cas, il ne peut être détectée une expression βgal dans les couches musculaires de ces tissus

Curieusement, une coloration importante est observée dans le cytoplasme des cellules epithéhales du lumen du canal déférent et dans l'épithéhum des conduits rénaux Ceci est vraisemblablement dû à une activité galactosidase endogène, la coloration étant aussi visible dans les animaux non transgéniques témoins

EXEMPLE 4 :

Fabrication d'une construction comportant des régions régulatrices du gène SM 22 et le gène codant la thymidine kinase du virus de l'herpès (SM 22 INT-TKl.

Le fragment HIV-LTR (-167, + 80) est délété du plasmide pLTR- TK par digestion Hind III dont les extrémités sont rendues bout franc avec l'enzyme de Klenow, suivie d'une digestion Xho I Le plasmide refermé en insérant un hnker contenant les sites Xhol en 5', les sites Hind III et Bsp 1201 dans l'ordre 5'->3' et une extrémité 3' bout-franc pour donner le vecteur p-TK Un fragment Bsp 1201/Hind III de 5.8 kb recouvrant la région -2126 à + 3648 du locus SM 22 est inséré dans p- TK pour obtenir SM 22 INT-TK Ce fragment est compris dans l'enchaînement de nucléotides de la SEQ ID N°1

Cette construction est schematiquement représentée sur la figure 1 1

EXEMPLE 5:

Fabrication du plasmide p445 nlz portant le fragment -445 à + 65 du gène SM22 fusionné au gène lacZ, et obtention de transgènes

Matériels et méthodes Construction de p445nlz

Le plasmide p2126nlz a été coupe par Xba I qui a un site unique dans le « polyhnker » en 5' en amont de la séquence SM 22 Les extrémités 5' protudaπtes du fragment ont été remplies à l'aide de la polymérase Klenow, par du dNTP

Après précipitation le fragment a été coupé par Pst I qui a un site unique en position -445 relativement au nucléotide +1 de début de la transcription Les extrémités 3' protudantes de la coupure Pst I ont été hydrolysées à la polymérase Klenow sans dNTP Le fragment comprenant les séquences plasmidiques plus la séquence SM 22 de - 445 à + 65 fusionnée au gène lacZ a été purifié à partir d'un gel d'agarose et refermé par la ligase T4 Pour les expériences de transgénèse le fragment injecté dans les oeufs de souris a été purifié à partir d'une double digestion Pst 1/Nsι I du plasmide p2126nlz

Les résultats obtenus avec cette construction et ceux obtenus avec p2126 INTIacZ et p2126lacZ pour comparaison, figurent dans le tableau ci-après

Les propriétés de régulation transcπptionnelle de la séquence du gène SM 22 entre les nucléotides -445 et +65 ont été analysées in vivo dans des souris transgéniques par deux méthodes La première méthode appelée analyse transitoire consiste à analyser le patron d'expression du gène lacZ directement dans les embryons fondateurs FO à un stade donné La deuxième méthode consiste à établir des lignées stables à partir de fondateurs FO adultes 1. Analyse transitoire

L'analyse transitoire a permis d'obtenir quatre embryons ayant intégré le transgène p445πlz dans leur génome sur un total de 1 3 embryons Parmi les quatre embryons positifs analysés à 12.5 jours de développement un embryon n'exprimait pas le transgène Deux embryons présentaient un patron d expression identique à celui de la lignée p2126 INT nlz au même stade, c est-à-dire spécifique des cellules musculaires lisses artérielles et enfin un troisième embryon présentait

les mêmes territoires d'expression artérielle additionnés de divers sites d'expression ectopique essentiellement diffus dans le mésenchyme embryonnaire

2. Lignées stables Deux lignées stables indépendantes ont été établies à partir d'un mâle (lignée n°1 ) et d'une femelle (lignée n°9)

L'expression du transgene a été analysée dans l'embryon au stade

15,5 jours pour la lignée 1 et 17,5 jours de développement dans la lignée 9 Les deux lignées présentent le même type d'expression dans les artères au niveau du coeur, le transgène est exprimé dans l'aorte dorsale et le tronc pulmonaire artériel

A la différence des lignées obtenues avec les transgènes p2126nlz et p2126 INTnlz, les deux lignées p445nlz expriment lacZ très fortement dans les parois de l'oesophage et de la trachée respiratoire qui sont composées de muscle lisse à ce stade

Les deux lignées présentent des différences entre elles dans certaines régions de l'embryon Pour la lignée n D 1 , le transgene s'exprime fortement dans les bronchioles en continuité de la trachée à 15,5 jours ce qui n'est pas observé dans la lignée n°9 à 17,5 jours où lacZ n'est trouvé que dans la trachée Cette différence peut être due soit à une modification de la régulation due à des sites d'intégration différents dans les deux lignées, soit à la différence de stade qui fait que l'expression de lacZ peut être réprimée entre le jour 15,5 et 17,5

Dans les deux lignées on trouve donc une expression du transgène dans des organes qui contiennent une forte composante de cellules musculaires lisses II est intéressant de noter qu'il s'agit d'une partie au moins des cellules musculaires lisses de type respiratoire, la trachée, et une partie des cellules musculaires lisses de type viscérai, l'oesophage

Enfin des sites d'expression ectopiques différents, c'est-à-dire où la présence de la protéine ou de l'ARN SM 22 endogène n'a pas été reportée, ont été trouves dans les deux lignées La lignée 1 présente entre autre une expression forte très localisée dans les deux doigts postérieurs de chaque membre La lignée 9 exprime fortement lacZ dans les régions antérieures du cerveau

L expression de cette construction à deux stades de l'évolution est illustrée par les figures 12A à 12D qui représentent des embryons de 15.5 jours p c (12A, 12B, 12C) et un adulte de 2 mois (12 D) SM 445 nlz colorés pour l'activité β-galactosidase. On note l'expression dans le tissu musculaire lisse des artères, de l'oesophage et des bronches sur les figures 12A, B, C ainsi que dans des sites ectopiques comme la moelle épinière (12B) ou les deux doigts postérieurs de chaque membre (12A) On note aussi l'absence d'expression dans l'aorte thoracique ou le tronc pulmonaire artériel chez l'adulte (12D). Seule une expression dans la trachée est maintenue.

Les résultats obtenus montrent qu'une séquence de 450 paires de bases est suffisante pour garder la même expression dans l'embryon et le foetus mais pas chez l'adulte.

TABLEAU

LISTE DE SEQUENCES

1) INFORMATIONS GENERALES i) DEPOSANT

(A) NOM INSTITUT PASTEUR

(B) RUE 28 RUE DU DOCTEUR ROUX (C) VILLE: PARIS

(E) PAYS: FRANCE

(F) CODE POSTAL: 75015

(A) NOM: UNIVERSITE PARIS 7

(B) RUE: 1 PLACE JUSSIEU

(C) VILLE: PARIS

(E) PAYS: FRANCE

(F) CODE POSTAL: 75005

(ii) TITRE DE L' INVENTION: SEQUENCES EN AI-.ONT DU GENE S.-J22 ;iii) NOMBRE DE SEQUENCES: S

(iv) FORME DECHIFFRABLE PAR ORDINATEUR:

(A) TYPE DE SUPPORT: Floppy disk

(B) ORDINATEUR: IBM PC compatible

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS

(D) LOGICIEL: Patentin Release #1.0, Version #1.30 (OEB)

INFORMATIONSPOURLASEQIDNO ; 1 :

( i ) CARACTERISTIQUESDELASEQUENCE:

(A) LONGUEUR: 6261 paires de bases

(B) TYPE : nuclcoride

(C) NOMBRE DE BRINS : double

(D) CONFIGURATION : linéaire

(ϋ) TYPE DE MOLECULE : ADN (sénomique)

(iii) HYPOTHETIQUE : NON

(vi) ORIGINE :

(A) ORGANISME : SOURIS

GG GCCCCAGGAA

TGTGTTTCCT TCTCTCCACC ATGTTTTTAT AGCTCTTGGG CTGGGAGAAG AGGCGGGTCT

GGGTCTTTGT TTCTGAGCTT TGTTCTATGT TCCTCCATGC TACGGTTGCA ATTGTTTTCT

ATGAACGAGT ACATTCAATA .AAGACAACCA GACCTGGGAT TTGGGGTCTT ACTGATGTGT

TGGGAGGTGC AGGAGCCTCC GTGTCCCATT TATTTTGGCC TTCCCGTCTC GTTTCTGTGC

GTGGCTACAT TGGGAATGAC CTTCCTTGAT CCCACCAAGC CACCCATTGA TTCTGTAAAC

A A J GTGACCCT TGCTCCAAGC ATTGCTTACA GGAGCAGGAT ACTGAAAGTG TGTCTGTGCC

CTCTCCTGAT AACCCCTCCC TTCAGCAGGC ACACAGCACC TGACTACCCA CCACGTATGT

AAACGTCAGT ATCCTTTCCA GCCAGCTCTG CAGATGGGTG TCCAGGCTGT GCATGATGCA

CCTCAAGTGG GCAGAGCTTG CAGGCCAAGG TTTTAAAGGC TGTTCAGGAA TGGATGGCAA

GCAGGATCTA AGAGGAGGGG GGGTTGTTGT TGTTTGGGGG GGGGGTGGTT TTGGTTTGTT

TTTTTTGAGA CAGGGTTTCT CTGTGTGGCC CTGGCCCTCC TGGAACCCAC TCTGTAGACC

AGGCTGGCCT TGAACTCAGA AATCTGCCTG CCTCTGCCTC CCGAGTGCTG GGATTAAAGG

Λ Λ ( :^ C ! TGCCCA TCGAGGAGGG AGATTTTATT TAGATTATAA AAAGGACGGG ATTTGGGGAA

^ c à c J GτcτAQ TGAA TTCAGG ACGTAATCAG TGGCTGGGAA GCAAGAGCTC TAGAGGAGCT

CCAGCTTATT ATGACCCTTC CTTCAGATGC CACAAGGAGG TGCTGGAGTT CTATGCACCA

A I AGCTTAAA CCAGCCAGGC TGGCTGTAGT GGATTGAGCG TCTGAGGCTG CACCTCTCTG

^ JÏ CTGCAGCC AGTTCTGGGT GAGACTGACC CTGCCTGAGG GTTCTCTCCT TCCCTCTCTC n Λ ^SS£?? CC TCC CTCTCCC TCTCCCTCTC TCTGTTTCCT GAGGTTTCCA

VJAAΓTGGGGA

^- Γ ÎSS? CAG AGA CACCACT AAAGCCTTAC CTTTTAAGAA GTTGCATTCA GTGAGTGTGT

T i^S^SiP ACAGATAGGG GCAGAGGAGA GCTGGTTCTG TCTCCACTGT GTTTGGTCTT τ^??J^ GAA CTCAGA CCAT CAGGTGTGAT AGCAGTTGTC TTTAACCCTA ACCCTGAGCC n Λ^l C JR A ^ Cτ GTCCCT TCCC AAGACCACTG AAGCTAGGTG CAAGATAAGT GGGGACCCTT

A JS? " Λ ^SP TGG TAGGA TCTTT CACGATAAGG ACTATTTTGA AGGGAGGGAG GGTGACACTG

^ T ^ C T^ GTCCT CTTA CCCTAG TGTCTCCAGC CTTGCCAGGC CTTAAACATC CGCCCATTGT

A A ^ S^ 10 GAAGGGG CCA CCCTTGACTT GCTGCTAAAC AAGGCACTCC CTAGAGAAGA

GTCCACTGTA GGCAGATAGG TGACAGGTGG CAGATAGGTG ACAGATAGGT GACAGGTGGA

GGAGCTTTGG AACTGGGACT GGACAGCCCT GGGACCCTGT TCCTCCCAAA GGGTCTTGGT

GGTTCCCCTT GGGGCTCTCT AAAGGATGTC AGTGGGCTGT TGCCACATCT ATATAAGAGG

ACTAGTCTTC TGGAATTTAG GTGTGATCTC TCAGGGATGC AGAAATGCTC ACCCTTACTG

TCATTTTATG GGCTGAGGTA CCACAGGCAG ATATACCCTG GTCTGCTTGT TGTCCAGGGT

CTCTGCTACA TGGAGGCCCC TTTCCACAGC CTAACCTCTC TACCTGCTGA CAGGAGGGCT

GGATGGCCAC AGGCATCCAA CGTGCGCATC ATGCAGGTGT TTTGCGTTGG AGCTTTTGTC

TAGAAATACC CTGGTGGGCT GCCAAACCAC CACCCATATC CCTCTCTCCT CTCTGCTGCC

TCTAAGATGA CAGCTTGATT TTTCTTATAG TGATTTTTTT TTTTGGTTTT GTTTTTTTGT

TTGTTTTAAG TTAGCATACA AAGTAATACA TTTCATCATG GCATTTGGAC ATACATATAT

ATTTTATTTG CTCTCCTGGC CTCTTCTCAA AGAGACTTCT CTGGACTTTC TTGTATTTTT

GGTTGTGAGC CTAGCCTTTA ACGGCTGAGC CATCTCTCCA GCCCTTCTTT GGACTTTCTA

CTTCATACTT CCCACCAGTC TGGGAAGAAG GGCACATGGA ATCTTGAGAG CATGACCTGA

CCCAGACCTG ACAGATGTCA AGGCTGCAGT GTATGCTCTT GTTCGTACGG CTTGTTCTTA

GTCCTG CAGT TCAGAA CTTT CTGGAGACTG AGAAGTGCAT GTGAGGACAC TCTCCTCCCA

TCTTTTCCTC TAGTGGCTAG TGATGTTTGG TTTTTTGTTT TGAGACAGGG TTTCTCTGTA

_I AGCCCTAGC TATCCTGGAA CTCACTTTGT AGATCAGGCT GGCCTCCAAC TCAGAAATCT

GCCTGCCTCT GCCTCCCGAG TGCTGGGACT AAAGGCGTGC GCCACCACTG TCCAGTCAGG

A 5î.t GAAGGA ^CTCTAAGG TGCTTGAGAC AGGCTGAGTA GAGGCTAGGA GGAAGGGGCA r , Λ C 2 CAGTCAC CGG CTCCATG ACTCTGTGAC TTTTGTGGTT CCTTGTCGCA GCGGTTCCTG

Δr ïï^ΞSS^ TGGTCGGGG <î TTGGGGGGAG GGGGCAGGCC ACACAGTGGG GTGTGGGAGG r Δ ?^ AGC y G I TGACAACT TC CCAACAGAAA CCAGGCTTTT GAGTCCTCCA GGGTAGCTTG n A AGA 1 GGG I ACT CAGAAAGCCG TGTCCATGTC CCCTTTCCTT CACCTCAGGG AAGTAAGTTG

- rr -^ïïiϋS? 31 TGTCAT TTCA ATGAGGTCTT CTGGTTATTC TGTTTTTCTC TCAATGTTGG τ J^Y^SS 10 AGGGAA TGCT TTGGAGAAGG TGGTGGGAAC TGGAGAAGGG .AAGATCAGTT

TACCATACCT GTGGGCAGGA TGACCCATGT TCTGCCATGC ACTTGGTAGC CTTGGAAAGG

CCACTTTGAA CCTCAATTTT CTCAACTGTT AAATGGAGTG GTAACTGCTA TCTCATAATA

AAGGGGAACG TGAGGAAGGC GTTTGGATAG TGCCTGGTTG CGGCCAGGCT GCAGTCAAGA

CTAGTTCCCA CCAACTCGAT TTTAAAGCCT TGCAAGAAGG TGGCTTGTTT GTCCCTTGCA

GGTTCCTTTG CTCGGGCCAA ACTCTAGAAT GCCTCCCCCT TTCTTTCTCA TTGAAGAGCA

GACCCAAGTC CGGGTAACAA GGAAGGGTTT CAGGGTCCTG CCCATAAAAG GTTTTTCCCG

GCCGCCCTCA GCACCGCCCC GCCCCGACCC CCGCAGCATC TCCAAAGCAT GCAGAGAATG

TCTCCGGCTG CCCCCGACAG ACTGCTCCAA CTTGGTGTCT TTCCCCAAAT ATGGAGCCTG

TGTGGAGTGA GTGGGGCGGC CCGGGGTGGT GAGCCAAGCA GACTTCCATG GGCAGGGAGG

GGCGCCACGG GGCGGCAGAG GGGTGACATC ACTGCCTAGG CGGCCTTTAA ACCCCTCACC

CAGCCGGCGC CCCGGCCCGT CTGCCCCAGC CCAGACACCG AAGCTACTCT CCTTCCAGTC

CACAAACGAC CAAGCCTTGT AAGTGCAAGT CATGGGAGCA GAAGGGCTGT GGGCTCAATT

AGATCCCCTA GTCTCTTCTA GTTTGCTGGG TGGAATTGGG TCCCTAGAGA CCATTCTCTG

TGTTAGACAA AAAGTCTGGG TTAAAATGCC TAGGATGATT TGACTGGGGC AAAAGAATAA

ATGGGGTGAG AGGGAGGCTC AAATTCAGTC ACTGTCCCAC CCATAGGTGT ATGGGCTATG

TGTTAGGCCC AAAGAGGTGA CAAATGAGGC CAAGGGAACA ACTCCATCTT TGGATCTCCA

AGAAGGTGAG GGGCTAAGTT CTGGAAAGCA GTGACCCACT GATGGTCCCC AGGGCTAATG

CAACTCGGGG GAGCCAGGAG GTAGCCCCCT CAGGCAGTGG AGGACTAAAG ATCTTATTTT

TTGTAGCGCT AGGGATCAAA CCCCAGGGCG CTATGTGTGG CAGGCATGTG CTCCATCTAC

CACAGAAGTT TAATCCTTCA GACTAGCCTG GGATAGGGCC TGC1 1 1TTCT TTCCTTTTCT

CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTTT CTTTCCTTTT

CTCTCTTTCA CTCTCTCTTT CT.AATTTCTT TTTCTTTTTT TCTTTCTTTT CTTTAGACAG

GGTTTCTCTG TGTAGCCCTG GCTGTTCTGG AACTCACTCT TTAGACCAGG CTGGCCTCGA

ATCTCAGAAA TCTACCTGCC TCTGCCTCCC AAGTGCTGGG ATTAAAGGCG TGTGCCACCA

CTGCCCAGCT AAGGTTTGCT TTTTGATGGC AGCTTGGTCC AGTTTGAAAG TAGGAGGTCA

TACTGTGTAA ACTCACTGGT TAAAGTACCC CCTCCCTTCC ACCCTGCAAT ACACACACAC

ACACACACAC ACACACACAC ACACACACAC ACCCCATCTC GAAGAGCTCT ATTAAGCTCC

AGGTGCACTG TAGTTCACAG ACTGCATCTT CCAGGTTTGC TCCCACTTCA CAAGCAGAGA

ACTCATAACT GAAGGGGGTG ACAGCACAGG GGAAGGGAAA GCAAGATGTT TAGAGTCTGA

CAGCTGGCCC GGGACCAGAG CCATGTGGTA ATGTTTGCTC CACTCCCATC CACCTCCACG

GCTGTGATGT GGAGAAGGTC CCCGCTTTCA TGGGAAGGAG GTGGGGGAGC CTGTCATCTG

CTCCATGCTC ACACAATTTT TCTCTCAACC AATGACCTCT CAGAAGCAGG GGTTGGTTTG

CAAAATTCTT CAGATACCTC AACAGATGGC ATCCCACTCA GGCTATCCCT GCTGACTAGG

TCTGGCTCCA GCCCTGACTG TATCTACCCA GGGACCTACC TGCCTGCTTT GCTCCTATAG

CCTTCCTCCG TGTCTGGGTC CCCAGAGAGC TGCCGGCATA GGCCTTTGAG GCAACAGCTG

GCATACAGGC CAGGCTTCCC ATGCTCTGGC TAGCAGATTC TCTGCCCTGG AGGACTTTGA

CTGCATGGTT TCTCTCACTG CTGCAACAGT CAGAGCTGGC CCACACGGGC ACAACAGCGC

ACTTCCATCT GGGTCTCCCT GAGAATGCCG CTGTTTTCTG AGAACCCTTG GACTCTGGTG

GCTTTATCAG GTCTTTTTGT CAGCTGCGCT TTGGGGGATG AACTTTGCTC TTCTGGCTTC

TGGGTCAGAG GGTAAAGATT TGGTGGCAAC CGGTAGCTAG AGAAAGATAG CTACTGGCTG

AATTTGGAGG ACATGGCTTC TGGAAAACCT CTCTAGTGCT TTTCTGGCTA GTCTTGGCAA

AGTAAAAATG CTCTGATAGC CAGCCCGGGT GATGCAGGGC TTCCTGTTCG AGGCCTTTCT

GTACAAAATT AGTGAGACAT TGCCTCAAAA CTATGAAACA AGCCAGACTC TGTTGAAGCA

CGCCTTTAAT CCCAGCACTC AGGAGGCTGA AGCAGGCAAG ATCTCTGTTA GTTGGAGGCC

AGTCTACAGG AAAGTTCTAC AACAGCAGAG GCCAGACAGT GCAACCCTTT CTGGGGGTGT

Λ ^ ( ?? Λ K3 2 AGGAA AACGG AACA.A AAACACAAAC TATAAAACAA AGAGAAGGCC GAGGACAAAG

I TAGCAATG CATACTTCCC TTTCTATGTG AAGCCCTGGG CTCCACCAGT ACTGCAGAAA

GAAGCAAGCA ATGAGGGACA GGAGGTTGGC TCTAGGCCCA GGGGTTGTCA AAATAGTCCA

^ AGGCCAAAG OCAGCCTGAT GTCTGTTTTT ATAAACAAAA TTTTATTGGC ACACATTGGT

TATGTATCAG CTAGGCTATT TTCATTACAA TAGAGGCCAT ATGGTCTGTA AAGTCTAAAA

TATTTACTCT GCTGTTTTAC ATAAAAAGTT GACAGACTCT TGCTCTAGAC TGACAAATAT

CTAAGACCTT GTTTTCTGAG GTTCAAGTTT CAGAGGGGTC TCTGCAGCAA GTGGGTAAAG

CTGGTCTAGG TCATGCTATG ATGTCTAGGG TCCCCTCAGA GTGGAAGGCC TGCTTAGCAC

AAATGAAGTA AAGTAACTTG CTGGCTCTTT GTTCTTTTCT CCACACTCTA TACTTTAGCT

CTGCCTC

(2) INFORMATIONS POUR LA SEQ ID NO: 2:

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 2190 paires de bases

(B) TYPE: nucléotide

(C) NOMBRE DE BRINS: double

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (génomique)

(iii) HYPOTHETIQUE: NON

(vi) ORIGINE:

(A) ORGANISME: SOURIS

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2 : GGGCCCCAGG AATGTGTTTC CTTCTCTCCA CCATGTTTTT ATAGCTCTTG GGCTGGGAGA AGAGGCGGGT CTGGGTCTTT GTTTCTGAGC TTTGTTCTAT GTTCCTCCAT GCTACGGTTG 1 CAATTGTTTT CTATGAACGA GTACATTCAA TAAAGACAAC CAGACCTGGG ATTTGGGGTC 1

TTACTGATGT GTTGGGAGGT GCAGGAGCCT CCGTGTCCCA TTTATTTTGG CCTTCCCGTC 2-

TCGTTTCTGT GCGTGGCTAC ATTGGGAATG ACCTTCCTTG ATCCCACCAA GCCACCCATT 3(

GATTCTGTAA ACATGTGACC CTTGCTCCAA GCATTGCTTA CAGGAGCAGG ATACTGAAAG 3;

TGTGTCTGTG CCCTCTCCTG ATAACCCCTC CCTTCAGCAG GCACACAGCA CCTGACTACC 4:

CACCACGTAT GTAAACGTCA GTATCCTTTC CAGCCAGCTC TGCAGATGGG TGTCCAGGCT 4 Î

GTGCATGATG CACCTCAAGT GGGCAGAGCT TGCAGGCCAA GGTTTTAAAG GCTGTTCAGG 5-'

AATGGATGGC AAGCAGGATC TAAGAGGAGG GGGGGTTGTT GTTGTTTGGG GGGGGGGTGG 60

TTTTGGTTTG TTTTTTTTGA GACAGGGTTT CTCTGTGTGG CCCTGGCCCT CCTGGAACCC 6(

ACTCTGTAGA CCAGGCTGGC CTTGAACTCA GAAATCTGCC TGCCTCTGCC TCCCGAGTGC 7:

TGGGATTAAA GGCGTGTGCC CATCGAGGAG GGAGATTTTA TTTAGATTAT AAAAAGGACG 7E

GGATTTGGGG AATCCTGTCT AGTGAATTCA GGACGTAATC AGTGGCTGGG AAGCAAGAGC 8^

TCTAGAGGAG CTCCAGCTTA TTATGACCCT TCCTTCAGAT GCCACAAGGA GGTGCTGGAG 9C

TTCTATGCAC CAATAGCTTA AACCAGCCAG GCTGGCTGTA GTGGATTGAG CGTCTGAGGC 96

TGCACCTCTC TGGCCTGCAG CCAGTTCTGG GTGAGACTGA CCCTGCCTGA GGGTTCTCTC 102

CTTCCCTCTC TCTACTCCTT CCTCCCTCTC CCTCTCCCTC TCTCTGTTTC CTGAGGTTTC 10E

CAGAATTGGG GATGGGACTC AGAGACACCA CTAAAGCCTT ACCTTTTAAG AAGTTGCATT 114

CAGTGAGTGT GTGAGACATA GCACAGATAG GGGCAGAGGA GAGCTGGTTC TGTCTCCACT 12C

GTGTTTGGTC TTGGGTACTG AACTCAGACC ATCAGGTGTG ATAGCAGTTG TCTTTAACCC 12£

TAACCCTGAG CCTGTCTCAC CTGTCCCTTC CCAAGACCAC TGAAGCTAGG TGCAAGATAA 132

GTGGGGACCC TTTCTGAGGT GGTAGGATCT TTCACGATAA GGACTATTTT GAAGGGAGGG 13B

AGGGTGACAC TGTCCTAGTC CTCTTACCCT AGTGTCTCCA GCCTTGCCAG GCCTTAAACA 144

TCCGCCCATT GTCACCGCTC TAGAAGGGGC CACCCTTGAC TTGCTGCTAA ACAAGGCACT 15C

CCCTAGAGAA GATACCATAC CTGTGGGCAG GATGACCCAT GTTCTGCCAT GCACTTGGTA 156

GCCTTGGAAA GGCCACTTTG AACCTCAATT TTCTCAACTG TTAAATGGAG TGGTAACTGC 162

TATCTCATAA TAAAGGGGAA CGTGAGGAAG GCGTTTGGAT AGTGCCTGGT TGCGGCCAGG 168

CTGCAGTCAA GACTAGTTCC CACCAACTCG ATTTTAAAGC CTTGCAAGAA GGTGGCTTGT 174

TTGTCCCTTG CAGGTTCCTT TGCTCGGGCC AAACTCTAGA ATGCCTCCCC CTTTCTTTCT 18 ι

CATTGAAGAG CAGACCCAAG TCCGGGTAAC AAGGAAGGGT TTCAGGGTCC TGCCCATAAA 18 '

AGGTTTTTCC CGGCCGCCCT CAGCACCGCC CCGCCCCGAC CCCCGCAGCA TCTCCAAAGC 19 :

ATGCAGAGAA TGTCTCCGGC TGCCCCCGAC AGACTGCTCC AACTTGGTGT CTTTCCCCAA 19 ,

ATATGGAGCC TGTGTGGAGT GAGTGGGGCG GCCCGGGGTG GTGAGCCAAG CAGACTTCCA 2 0 -

TGGGCAGGGA GGGGCGCCAC GGGGCGGCAG AGGGGTGACA TCACTGCCTA GGCGGCCTTT 21 (

AAACCCCTCA CCCAGCCGGC GCCCCGGCCC GTCTGCCCCA GCCCAGACAC CGAAGCTACT 2 1 -

CTCCTTCCAG TCCACAAACG ACCAAGCCTT 2 1 :

(2) INFORMATIONS POUR LA SEQ ID NO: -,

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: ιeβ 1 .paires de bases

(B) TYPE: nuclέotidV

(C) NOMBRE DE BRINS: doubl >

(D) CONFIGURATION: linéaire

( ii ) TYPE DE MOLECULE : ADN ( gé nomique )

( i ii ) HYPOTHETIQUE : NON

(Vi) ORIGINE:

(A) ORGANISME: SOURIS

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: -5 GGGCCCCAGG AATGTGTTTC CTTCTCTCCA CCATGTTTTT ATAGCTCTTG GGCTGGGAGA AGAGGCGGGT CTGGGTCTTT GTTTCTGAGC TTTGTTCTAT GTTCCTCCAT GCTACGGTTG CAATTGTTTT CTATGAACGA GTACATTCAA TAAAGACAAC CAGACCTGGG ATTTGGGGTC

TTACTGATGT GTTGGGAGGT GCAGGAGCCT CCGTGTCCCA TTTATTTTGG CCTTCCCGTC 2

TCGTTTCTGT GCGTGGCTAC ATTGGGAATG ACCTTCCTTG ATCCCACCAA GCCACCCATT 3

GATTCTGTAA ACATGTGACC CTTGCTCCAA GCATTGCTTA CAGGAGCAGG ATACTGAAAG 3

TGTGTCTGTG CCCTCTCCTG ATAACCCCTC CCTTCAGCAG GCACACAGCA CCTGACTACC 4

CACCACGTAT GTAAACGTCA GTATCCTTTC CAGCCAGCTC TGCAGATGGG TGTCCAGGCT 4

GTGCATGATG CACCTCAAGT GGGCAGAGCT TGCAGGCCAA GGTTTTAAAG GCTGTTCAGG 5

AATGGATGGC AAGCAGGATC TAAGAGGAGG GGGGGTTGTT GTTGTTTGGG GGGGGGGTGG 6

TTTTGGTTTG TTTTTTTTGA GACAGGGTTT CTCTGTGTGG CCCTGGCCCT CCTGGAACCC 6

ACTCTGTAGA CCAGGCTGGC CTTGAACTCA GAAATCTGCC TGCCTCTGCC TCCCGAGTGC 7

TGGGATTAAA GGCGTGTGCC CATCGAGGAG GGAGATTTTA TTTAGATTAT AAAAAGGACG 7

GGATTTGGGG AATCCTGTCT AGTGAATTCA GGACGTAATC AGTGGCTGGG AAGCAAGAGC 8

TCTAGAGGAG CTCCAGCTTA TTATGACCCT TCCTTCAGAT GCCACAAGGA GGTGCTGGAG 9

TTCTATGCAC CAATAGCTTA AACCAGCCAG GCTGGCTGTA GTGGATTGAG CGTCTGAGGC 9 '

TGCACCTCTC TGGCCTGCAG CCAGTTCTGG GTGAGACTGA CCCTGCCTGA GGGTTCTCTC 10

CTTCCCTCTC TCTACTCCTT CCTCCCTCTC CCTCTCCCTC TCTCTGTTTC CTGAGGTTTC 10

CAGAATTGGG GATGGGACTC AGAGACACCA CTAAAGCCTT ACCTTTTAAG AAGTTGCATT 11 -

CAGTGAGTGT GTGAGACATA GCACAGATAG GGGCAGAGGA GAGCTGGTTC TGTCTCCACT 12 '

GTGTTTGGTC TTGGGTACTG AACTCAGACC ATCAGGTGTG ATAGCAGTTG TCTTTAACCC 12

TAACCCTGAG CCTGTCTCAC CTGTCCCTTC CCAAGACCAC TGAAGCTAGG TGCAAGATAA 13

GTGGGGACCC TTTCTGAGGT GGTAGGATCT TTCACGATAA GGACTATTTT GAAGGGAGGG 13 '

AGGGTGACAC TGTCCTAGTC CTCTTACCCT AGTGTCTCCA GCCTTGCCAG GCCTTAAACA 14 *

TCCGCCCATT GTCACCGCTC TAGAAGGGGC CACCCTTGAC TTGCTGCTAA ACAAGGCACT 15 (

CCCTAGAGAA GATACCATAC CTGTGGGCAG GATGACCCAT GTTCTGCCAT GCACTTGGTA 15 {

GCCTTGGAAA GGCCACTTTG AACCTCAATT TTCTCAACTG TTAAATGGAG TGGTAACTGC 16 :

TATCTCATAA TAAAGGGGAA CGTGAGGAAG GCGTTTGGAT AGTGCCTGGT TGCGGCCAGG 16 i C

40

INFORMATIONS POUR LA SEQ ID NO: 4

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: . paires de bases

(B) TYPE : nuclcotide

(C) NOMBRE DE BRINS : double

(D) CONFIGURATION : linéaire

(ii) TYPE DE MOLECULE : ADN (génomique)

(iii) HYPOTHETIQUE : NON

(vi) ORIGINE :

(A) ORGANISME : SOURIS

FEUILLE RECTIFIEE (REGLE 91) ISA/EP

TCTAGAGGCC ACGGAACGGT GCCAAGCACA CAGTCCCTTT TGCCTCTTTC ACGGGAGCAG

GAGTCCCAGT GCCTGTCGTG GAAAGGGAGG AACATGCCAG GTCCCTGTGT GTCCTTGGCC

CTGTCTCACC AAAGGACTCA GGGCTGGTTT CTGAGTTTCC GTCCAGTATT TAGCCAAGTC

CTGTGTTAGT CACGTAGGCC TAAGAGCCTT GGCGTTTACA GAGTCACCCA GCTCTGGCCC

CTGGCATTCT GGTCCTTGGC GTTTACAGAG TCACCCAGCT CCAGGCCCCT GGCACTTTGG

TACTTGGTTG CCCTTCACTC CACCAGGTCC ATTCCAGATG CCAAGAGTGG GCCCCAGGAA

TGTGTTTCCT TCTCTCCACC ATGTTTTTAT AGCTCTTGGG CTGGGAGAAG AGGCGGGTCT

GGGTCTTTGT TTCTGAGCTT TGTTCTATGT TCCTCCATGC TACGGTTGCA ATTGTTTTCT

ATGAACGAGT ACATTCAATA AAGACAACCA GACCTGGGAT TTGGGGTCTT ACTGATGTGT

TGGGAGGTGC AGGAGCCTCC GTGTCCCATT TATTTTGGCC TTCCCGTCTC GTTTCTGTGC

GTGGCTACAT TGGGAATGAC CTTCCTTGAT CCCACCAAGC CACCCATTGA TTCTGTAAAC

ATGTGACCCT TGCTCCAAGC ATTGCTTACA GGAGCAGGAT ACTGAAAGTG TGTCTGTGCC

CTCTCCTGAT AACCCCTCCC TTCAGCAGGC ACACAGCACC TGACTACCCA CCACGTATGT

AAACGTCAGT ATCCTTTCCA GCCAGCTCTG CAGATGGGTG TCCAGGCTGT GCATGATGCA

CCTCAAGTGG GCAGAGCTTG CAGGCCAAGG TTTTAAAGGC TGTTCAGGAA TGGATGGCAA

GCAGGATCTA AGAGGAGGGG GGGTTGTTGT TGTTTGGGGG GGGGGTGGTT TTGGTTTGTT

TTTTTTGAGA CAGGGTTTCT CTGTGTGGCC CTGGCCCTCC TGGAACCCAC TCTGTAGACC

AGGCTGGCCT TGAACTCAGA AATCTGCCTG CCTCTGCCTC CCGAGTGCTG GGATTAAAGG

CGTGTGCCCA TCGAGGAGGG AGATTTTATT TAGATTATAA AAAGGACGGG ATTTGGGGAA

TCCTGTCTAG TGAATTCAGG ACGTAATCAG TGGCTGGGAA GCAAGAGCTC TAGAGGAGCT

CCAGCTTATT ATGACCCTTC CTTCAGATGC CACAAGGAGG TGCTGGAGTT CTATGCACCA

ATAGCTTAAA CCAGCCAGGC TGGCTGTAGT GGATTGAGCG TCTGAGGCTG CACCTCTCTG

GCCTGCAGCC AGTTCTGGGT GAGACTGACC CTGCCTGAGG GTTCTCTCCT TCCCTCTCTC

TACTCCTTCC TCCCTCTCCC TCTCCCTCTC TCTGTTTCCT GAGGTTTCCA GAATTGGGGA

TGGGACTCAG AGACACCACT AAAGCCTTAC CTTTTAAGAA GTTGCATTCA GTGAGTGTGT

GAGACATAGC ACAGATAGGG GCAGAGGAGA GCTGGTTCTG TCTCCACTGT GTTTGGTCTT

GGGTACTGAA CTCAGACCAT CAGGTGTGAT AGCAGTTGTC TTTAACCCTA ACCCTGAGCC

TGTCTCACCT GTCCCTTCCC AAGACCACTG AAGCTAGGTG CAAGATAAGT GGGGACCCTT

TCTGAGGTGG TAGGATCTTT CACGATAAGG ACTATTTTGA AGGGAGGGAG GGTGACACTG

TCCTAGTCCT CTTACCCTAG TGTCTCCAGC CTTGCCAGGC CTTAAACATC CGCCCATTGT

CACCGCTCTA GAAGGGGCCA CCCTTGACTT GCTGCTAAAC AAGGCACTCC CTAGAGAAGA

TACCATACCT GTGGGCAGGA TGACCCATGT TCTGCCATGC ACTTGGTAGC CTTGGAAAGG

CCACTTTGAA CCTCAATTTT CTCAACTGTT AAATGGAGTG GTAACTGCTA TCTCATAATA

AAGGGGAACG TGAGGAAGGC GTTTGGATAG TGCCTGGTTG CGGCCAGGCT GCAGTCAAGA

CTAGTTCCCA CCAACTCGAT TTTAAAGCCT TGCAAGAAGG TGGCTTGTTT GTCCCTTGCA

GGTTCCTTTG CTCGGGCCAA ACTCTAGAAT GCCTCCCCCT TTCTTTCTCA TTGAAGAGCA

GACCCAAGTC CGGGTAACAA GGAAGGGTTT CAGGGTCCTG CCCATAAAAG G l I H TCCCG

GCCGCCCTCA GCACCGCCCC GCCCCGACCC CCGCAGCATC TCCAAAGCAT GCAGAGAATG

TCTCCGGCTG CCCCCGACAG ACTGCTCCAA CTTGGTGTCT TTCCCCAAAT ATGGAGCCTG

TGTGGAGTGA GTGGGGCGGC CCGGGGTGGT GAGCCAAGCA GACTTCCATG GGCAGGGAGG

GGCGCCACGG GGCGGCAGAG GGGTGACATC ACTGCCTAGG CGGCCTTTAA ACCCCTCACC

CAGCCGGCGC CCCGGCCCGT CTGCCCCAGC CCAGACACCG AAGCTACTCT CCTTCCAGTC

CACAAACGAC CAAGCCTTGT AAGTGCAAGT CATGGGAGCA GAAGGGCTGT GGGCTCAATT

AGATCCCCTA GTCTCTTCTA GTTTGCTGGG TGGAATTGGG TCCCTAGAGA CCATTCTCTG

TGTTAGACAA AAAGTCTGGG TTAAAATGCC TAGGATGATT TGACTGGGGC AAAAGAATAA

ATGGGGTGAG AGGGAGGCTC AAATTCAGTC ACTGTCCCAC CCATAGGTGT ATGGGCTATG

TGTTAGGCCC AAAGAGGTGA CAAATGAGGC CAAGGGAACA ACTCCATCTT TGGATCTCCA

AGAAGGTGAG GGGCTAAGTT CTGGAAAGCA GTGACCCACT GATGGTCCCC AGGGCTAATG

CAACTCGGGG GAGCCAGGAG GTAGCCCCCT CAGGCAGTGG AGGACTAAAG ATCTTATTTT

TTGTAGCGCT AGGGATCAAA CCCCAGGGCG CTATGTGTGG CAGGCATGTG

CTCCATCTAC

CACAGAAGTT TAATCCTTCA GACTAGCCTG GGATAGGGCC TGCTTTTTCT TTCCTTTTCT

CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTTT CTTTCC I ι i I ^^

CTCTCTTTCA CTCTCTCTTT CTAATTTCTT TTTCTTTTTT TCTTTCTTTT CTTTAGACAG GGTTTCTCTG TGTAGCCCTG GCTGTTCTGG AACTCACTCT TTAGACCAGG CTGGCCTCGA

ATCTCAGAAA TCTACCTGCC TCTGCCTCCC AAGTGCTGGG ATTAAAGGCG TGTGCCACCA

CTGCCCAGCT AAGGTTTGCT TTTTGATGGC AGCTTGGTCC AGTTTGAAAG TAGGAGGTCA

GTCCACTGTA GGCAGATAGG TGACAGGTGG CAGATAGGTG ACAGATAGGT GACAGGTGGA

GGAGCTTTGG AACTGGGACT GGACAGCCCT GGGACCCTGT TCCTCCCAAA GGGTCTTGGT

GGTTCCCCTT GGGGCTCTCT AAAGGATGTC AGTGGGCTGT TGCCACATCT

ATATAAGAGG

ACTAGTCTTC TGGAATTTAG GTGTGATCTC TCAGGGATGC AGAAATGCTC

ACCCTTACTG

TCATTTTATG GGCTGAGGTA CCACAGGCAG ATATACCCTG GTCTGCTTGT

TGTCCAGGGT

CTCTGCTACA TGGAGGCCCC TTTCCACAGC CTAACCTCTC TACCTGCTGA

CAGGAGGGCT

GGATGGCCAC AGGCATCCAA CGTGCGCATC ATGCAGGTGT TTTGCGTTGG

AGCTTTTGTC

TAGAAATACC CTGGTGGGCT GCCAAACCAC CACCCATATC CCTCTCTCCT CTCTGCTGCC

TCTAAGATGA CAGCTTGATT TTTCTTATAG TGATTTTTTT TTTTGGTTTT GTTTTTTTGT

TTGTTTTAAG TTAGCATACA AAGTAATACA TTTCATCATG GCATTTGGAC ATACATATAT

ATTTTATTTG CTCTCCTGGC CTCTTCTCAA AGAGACTTCT CTGGACTTTC

TTGTA i I i M

GGTTGTGAGC CTAGCCTTTA ACGGCTGAGC CATCTCTCCA GCCCTTCTTT

GGACTTTCTA

CTTCATACTT CCCACCAGTC TGGGAAGAAG GGCACATGGA ATCTTGAGAG

CATGACCTGA

CCCAGACCTG ACAGATGTCA AGGCTGCAGT GTATGCTCTT GTTCGTACGG

CTTGTTCTTA

GTCCTGCAGT TCAGAACTTT CTGGAGACTG AGAAGTGCAT GTGAGGACAC

TCTCCTCCCA

TCTTTTCCTC TAGTGGCTAG TGATGTTTGG TTTTTTGTTT TGAGACAGGG

TTTCTCTGTA

TAGCCCTAGC TATCCTGGAA CTCACTTTGT AGATCAGGCT GGCCTCCAAC

TCAGAAATCT

GCCTGCCTCT GCCTCCCGAG TGCTGGGACT AAAGGCGTGC GCCACCACTG

TCCAGTCAGG

AGTAGAAGGA AACTGTAAGG TGCTTGAGAC AGGCTGAGTA GAGGCTAGGA

GGAAGGGGCA

CCGCAGTCAC CGGCTCCATG ACTCTGTGAC TTTTGTGGTT CCTTGTCGCA

GCGGTTCCTG

GTGGTGGTGG TGGTCGGGGG TTGGGGGGAG GGGGCAGGCC ACACAGTGGG

GTGTGGGAGG

GAATAGCTGT TGACAACTTC CCAACAGAAA CCAGGCTTTT GAGTCCTCCA

GGGTAGCTTG

AGAGGGTACT CAGAAAGCCG TGTCCATGTC CCCTTTCCTT CACCTCAGGG

AAGTAAGTTG

CCTATAGGGT TGTCATTTCA ATGAGGTCTT CTGGTTATTC TGTTTTTCTC

TCAATGTTGG

TGTTGGGCTC AGGGAATGCT TTGGAGAAGG TGGTGGGAAC TGGAGAAGGG

AAGATCAGTT

TACTGTGTAA ACTCACTGGT TAAAGTACCC CCTCCCTTCC ACCCTGCAAT

ACACACACAC

ACACACACAC ACACACACAC ACACACACAC ACCCCATCTC GAAGAGCTCT

ATTAAGCTCC

AGGTGCACTG TAGTTCACAG ACTGCATCTT CCAGGTTTGC TCCCACTTCA

CAAGCAGAGA

ACTCATAACT GAAGGGGGTG ACAGCACAGG GGAAGGGAAA GCAAGATGTT

TAGAGTCTGA

CAGCTGGCCC GGGACCAGAG CCATGTGGTA ATGTTTGCTC CACTCCCATC

CACCTCCACG

GCTGTGATGT GGAGAAGGTC CCCGCTTTCA TGGGAAGGAG GTGGGGGAGC

CTGTCATCTG

CTCCATGCTC ACACAATTTT TCTCTCAACC AATGACCTCT CAGAAGCAGG GGTTGGTTTG

CAAAATTCTT CAGATACCTC AACAGATGGC ATCCCACTCA GGCTATCCCT GCTGACTAGG

TCTGGCTCCA GCCCTGACTG TATCTACCCA GGGACCTACC TGCCTGCTTT GCTCCTATAG

CCTTCCTCCG TGTCTGGGTC CCCAGAGAGC TGCCGGCATA GGCCTTTGAG GCAACAGCTG

GCATACAGGC CAGGCTTCCC ATGCTCTGGC TAGCAGATTC TCTGCCCTGG AGGACTTTGA

CTGCATGGTT TCTCTCACTG CTGCAACAGT CAGAGCTGGC CCACACGGGC ACAACAGCGC

ACTTCCATCT GGGTCTCCCT GAGAATGCCG CTGTTTTCTG AGAACCCTTG GACTCTGGTG

GCTTTATCAG GTCTTTTTGT CAGCTGCGCT TTGGGGGATG AACTTTGCTC TTCTGGCTTC

TGGGTCAGAG GGTAAAGATT TGGTGGCAAC CGGTAGCTAG AGAAAGATAG CTACTGGCTG

AATTTGGAGG ACATGGCTTC TGGAAAACCT CTCTAGTGCT TTTCTGGCTA GTCTTGGCAA

AGTAAAAATG CTCTGATAGC CAGCCCGGGT GATGCAGGGC TTCCTGTTCG AGGCCTTTCT

GTACAAAATT AGTGAGACAT TGCCTCAAAA CTATGAAACA AGCCAGACTC TGTTGAAGCA

CGCCTTTAAT CCCAGCACTC AGGAGGCTGA AGCAGGCAAG ATCTCTGTTA GTTGGAGGCC

AGTCTACAGG AAAGTTCTAC AACAGCAGAG GCCAGACAGT GCAACCCTTT CTGGGGGTGT

GGGGGAGGAA AACCCAACAA AAACACAAAC TATAAAACAA AGAGAAGGCC GAGGACAAAG

CTTAGCAATG CATACTTCCC TTTCTATGTG AAGCCCTGGG CTCCACCAGT ACTGCAGAAA

GAAGCAAGCA ATGAGGGACA GGAGGTTGGC TCTAGGCCCA GGGGTTGTCA AAATAGTCCA

CAGGCCAAAG GCAGCCTGAT GTCTGTTTTT ATAAACAAAA TTTTATTGGC ACACATTGGT

TATGTATCAG CTAGGCTATT TTCATTACAA TAGAGGCCAT ATGGTCTGTA AAGTCTAAAA

TATTTACTCT GCTGTTTTAC ATAAAAAGTT GACAGACTCT TGCTCTAGAC TGACAAATAT

CTAAGACCTT GTTTTCTGAG GTTCAAGTTT CAGAGGGGTC TCTGCAGCAA GTGGGTAAAG

CTGGTCTAGG TCATGCTATG ATGTCTAGGG TCCCCTCAGA GTGGAAGGCC TGCTTAGCAC

AAATGAAGTA AAGTAACTTG CTGGCTCTTT GTTCTTTTCT CCACACTCTA TACTTTAGCT

CTGCCTCAAC ATG

(2) INFORMATIONS POUR LA SEQ ID NO: Ξ

(i) CARACTERISTIQUES DE LA SEQUENCE:

(A) LONGUEUR: 785 paires de bases

(B) TYPE: nucléotide

(C) NOMBRE DE BRINS: double

(D) CONFIGURATION: linéaire

(ii) TYPE DE MOLECULE: ADN (œnomique)

(iii) HYPOTHETIQUE: NON

(vi) ORIGINE:

(A) ORGANISME: SOURIS

(xi) DESCRIPTION- DE LA SEQUENCE: SEQ ID NO : ?

GGGCCCCAGG AATGTGTTTC CTTCTCTCCA CCATGTTTTT ATAoCTCTTG GGCTGGGAGA t.

AGAGGCGGGT CTGGGTCTTT GTTTCTGAGC TTTGTTCTAT GTTCCTCCAT GCTACGGTTG II

CAATTGTTTT CTATGAACGA GTACATTCAA TAAAGACAAC CAGACCTGGG ATTTGGGGTC 1E

TTACTGATGT GTTGGGAGGT GCAGGAGCCT CCGTGTCCCA TTTATTTTGG CCTTCCCGTC 24

TCGTTTCTGT GCGTGGCTAC ATTGGGAATG ACCTTCCTTG ATCCCACCAA GCCACCCATT 3C

GATTCTGTAA ACATGTGACC CTTGCTCCAA GCATTGCTTA CAGGAGCAGG ATACTGAAAG 36

TGTGTCTGTG CCCTCTCCTG ATAACCCCTC CCTTCAGCAG GCACACAGCA CCTGACTACC 4:

CACCACGTAT GTAAACGTCA GTATCCTTTC CAGCCAGCTC TGCAGATGGG TGTCCAGGCT 48

GTGCATGATG CACCTCAAGT GGGCAGAGCT TGCAGGCCAA GGTTTTAAAG GCTGTTCAGG 5'

AATGGATGGC AAGCAGGATC TAAGAGGAGG GGGGGTTGTT GTTGTTTGGG GGGGGGGTGG 6C

TTTTGGTTTG TTTTTTTTGA GACAGGGTTT CTCTGTGTGG CCCTGGCCCT CCTGGAACCC 6£

ACTCTGTAGA CCAGGCTGGC CTTGAACTCA GAAATCTGCC TGCCTCTGCC TCCCGAGTGC 7:

TGGGATTAAA GGCGTGTGCC CATCGAGGAG GGAGATTTTA TTTAGATTAT AAAAAGGACG 7E GGATT- 7E

Références

Almendral, J. M., Santaren, J. F., Perera, J., Zerial, M. and Bravo, R. (1989). Expression, cloning and cDNA sequence of a fibroblast serum-regulated gene encoding a putative actin- associated protein (ρ27). Exp. Cell Res., 181, 518-530.

Babij, P., Kelly, C. and Periasamy, M. (1991). Characterisation of a mammaiian smooth muscle myosin heavy-chain gene: Complete nucleotide and protein coding sequence and analysis of the 5' end of the gene. Proc. Natl Acad Sci., 88, 10676-10680.

Birnstiel, M. L., Busslinger, M. and Strub, K. (1985). Transcription termination and 3 ' processing: the end is in site. Cell, 41, 349-359.

Bour, B. A., O'Brien, M. A, Lockwood, W. L., Goldstein, E. S., Bodmer, R., Taghert, P. H , Abmayr S. M. and Nguyen, H. T. (1995). Drosophila MEF2, a transcription factor that is essential for myogenesis. Genes & Dev., 9, 730-741.

Chamley-Campell, J. H. and Campell, G. R. (1981). Artherosclerosis, 40, 347-357.

Chirgwin, J. M., Przybyla, A. E., MacDonald, R. J. and Rutter, W. J. (1979). Isolation of biologically active ribonucleic acid from sources enriched in ribonuclease. Biochemistry, 18, 5294-5299.

Duband, J.-L., Gimona, M-, Scatena, ML, Sartore, S. and Small J. V. (1993). Calponin and SM 22 as differentiation markers of smooth muscle: spatiotemporal distribution during avian embryonic development. Differentiation, 55, 1-11.

Dynan, W. S. and Tijan,R. (19S3) The promoter-specific transcription factor SP 1 binds to upstrea m sequences in the SV 40 early promoter. Cell„ 35, 79-87.

Frohman, M. A., Dush, M. K. and Martin, G. R. (1988). Rapid production of full-Iength cDNAs from rare transcripts: Amplification using a single gene-specific oligonucleotide primer. Proc Natl. Acad. Sci, r 85, 8998-9002.

Gimona, M., Sparrow, 2ME. P., Strasser, P., Herzog, M. and Small, J. V. (1992). Calponin and SM 22 isoforms in avian and mammalian smooth muscle. Absence of phosphorylation in vivo. Eur. J. Biochem...205. 1067-1075.

Kelly, R., Alonso, S., Tajbakhsh, S, Cossu, G. and Buckingham, M. (1995). Myosin light chain 3F regulatory sequences conferregionalized cardiac and skeletal muscle expression in transgenic mice. J. of Cell Biol, 129/2, 3S3-396.

Gorman, CM. , Moffat L.F. and B.H.H. (1982) . Recombinant genomes which express chloramphenicol acetyl-transferase in mammalian cells. Mol. Cel

Biol. ,2: 1044-1051.

Kemp, P. R, Osbourn, J. K., Grainger D. J. and Metcalfe, J. C (1995). Cloning and analysis of the promoter region of the rat SM 22α gene. Biochem. J., 310, 1037-1043.

Kim, J.-H., Busbel, P. R. and Kumar, C. C. (1993). Smooth muscle α-actin promoter activity is induced by serum stimulation of fibroblast cells, Biochem. Biophys. Res. Com., 190/3, 1115-1121.

Kramerov, D. A-, Lekakh, I. V., Samarina, O. P. and Ryskov, A. P. (1982). The sequences homologous to major interspersed repeats B1 and B2 of mouse genome are present in mRNA and small cytoplasmic poly(A)+ RNA. Nuc. Acid Res., 10/23, 7477-7491.

Krayev, A. S., Kramerσv, D. A., Skryabin, K. G., Ryskov A. P., Bayev, A. A. and Georgiev, G. P. (1980). The nucleotide sequence of the ubiquitous repetitive DNA sequence B1 complementary to the most abundant class of mouse fold-back RNA. Nuc Acid Res... 8/6, 1201-1215.

Lees-Miller, J. P., Heeley, B. H., Smillie, L. B. and Kay, C. M. (1987a). Isolation and charakterization of an abundant and novel 22-kDa protein (SM 22) from chicken gizzard smooth muscle, y. Biol Chem., 262/7, 2988-2993.

Lees-Miller, J. P., Heeley, D. H. and Smillie, L. B. (1987b). An abundant and novel protein of 22 kDa (SM 22) is widely distributed in smooth muscles. Biochem. J., 244, 705-709.

Li, Z., Marchand, P., Humbert, J., Babinet C. and Paulin D. (1993). Desmin sequence elements regulating skeletal muscle-specific expression in transgenic mice. Development, 177/3, 947-959.

Lilly, B., Zhao, B. Ranganayakulu, G., Paterson, B. M., Schulz, R. A. and Olson, E. N.

(1995). Requirement fo MADS Domain transcription facter D-MEF2. for muscle formation in drosophila. Science, 267, 688-693.

Lückow,. B. and Schϋtz, G. (1987). CAT constructions with multiple unique restriction sites for the functional analysis of eukaryotic promoters and regulatory elements. Nuc. Acid Res., 15/13, 5490.

Min, B., Foster, D. N. and Strauch, A. R. (1990). The 5'-flanking region of the mouse vascular smooth muscle α-actin gene contains evolutionarily conserved sequence motifs within a functional promoter. J. Biol. Chem., 265/27, 16667-16675.

Miwa, T., Manabe, Y, Kurokawa, K., Kamada, S., Kanda, N., Bruns, G., Ueyama, H. and Kakunaga, T. (1991). Structure, chromosome location and expression of the human smooth muscle (enteric type) γ-actin gene: Evolution of six human actin genes. Mol. Cell. Biol, 11/6, 3296-3306.

Mössler H. (1995). Characterization of the gene structure and the promoter region of the smooth muscle specific protein SM 22 of mus musculus. PhD thesis at the University of Salzburg, Austria.

Nishida, W., Kitami, Y., Abe, M. and Hiwada, K. (1991). Gene cloning and nucleotide sequence of SM 22α from the chicken gizzard smooth muscle. Biochem. Insem., 23/4, 663- 668.

Olson, E. N. (1990). Myo D family: a paradigm for development?. Genes and Dev., 4, 1454-

1461.

Osbourn, J. K., Weissberg, P. L. and Shanahan, C. M. (1995). A regulatory element downstream of the rat SM 22a gene transcription start point enhances reporter gene expression in vascular smooth muscle cells. Gene, 154, 249-253.

Pearlstone, J. R., Weber, M., Lees-Miller, J. P., Carpenter, M. R. and Smillie, L. B.

(1987). Amino acid sequence of chicken gizard smooth muscle SM 22α. J. Biol Chem., 262/13, 5985-5991.

Prinjha, R. K., Shapland, C. E., Hsuan, J. J, Totty, N. F., Mason, L J. and Lawson, D.

(1994). Cloning and sequencing of cDNAs encoding the actin cross-linking protein transgelin dermes a new faeily of actin-associatcd proteins. Cell Motil and Cytoskel, 28, 243-255.

Reddy, S., Ozgur, K., Lu, M., Chang, W., Mohan, S., Kumar, C. and Ruley, H E. (1990). Structure of the human smooth muscle α-actin gene. J. Biol Chem., 265/3, 1683-1687.

Sanger, F., Nicklen, S. and Coulson, A. R. (1977). DNA sequencing with chain termination inhibitors. Proc. Natl Acad Sci, 74, 5463ff.

Santaren, J. F., Blüthmann, H., MacDonald-Bravo, H. and Bravo, R. (1987). Specific antibody against a protein (p27) present in nonestablished fibroblasts. A putative Microfilament associated protein. Exp. Cell. Res., 173, 341-348.

Shanahan,. C. M., Weissberg, P. L. and Metcalf; J.. C. (1993). Isolation of gene markers of differentiated and proliferating vascular smooth muscle cells. Circ. Res., 73, 193 - 204.

Shanahan, C., Cary, N. R. B., Metcalf, J. C. and Weissberg, P. L. (1994). High Expression of genes for calcification-regulating proteins in human artherosclerotic plaques. J. Clin, Invest, 93, 2393 - 2402.

Shapland, C, Lowings, P. and Lawson, D. (1988). Identification of new actin associated polypeptides that are modified by viral transformation and changes in cell shape. J. Cell Biol., 107, 153-161.

Shapland, C, Hsuan, J. J. Totty, N. F. and Lawson, D. (1993). Purification and properties of Transgelin: A transfomation and shape change sensitive actin-gelling protein. J. Cell Biol, 121/5, 1065-1073.

Solway, J, Seltzer, X, Samaha, F- F., Kim, S. Alger, L. E., Nia, Q., Morrisey, E. E., Ip, H. S. and Parmacek, M. S. (1995). Structure and expression of a smooth muscle cell-specific gene, SM 22α. J. of Biol Chem., 270/22, 13460-13469.

Thweatt,. R. Lumpkin, C. K. and Goldstein, S. (1992). A novel gene encoding a smooth muscle protein is overexpressed in senescent human fibroblasts. Biochem. Biophys. Res. Com., 187/1, 1-7.

Tzeng, Y.-J, GuhL E. Graessmann, M. and Graessmann, A. (1993). Breast cancer formation in transgenic animals induced by the whey acidic protein SV 40 T antigen (WAP- SV-T) hybrid gene. Oncogene, 8, 1965-1971.

LI LI, J.M. MIANO, B. MERCER and E. OLSON

J. OF CELL BIOLOGY 1996 - VOL 132 N° 5, p. 349-859