Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
PROCESS FOR THE DEFINITE CROSS-LINKING OF DOUBLE HELIX DNA FRAGMENTS BY MEANS OF A LINKAGE DNA AS WELL AS OLIGONUCLEOTIDES USED AS LINKAGE DNA
Document Type and Number:
WIPO Patent Application WO/1985/000621
Kind Code:
A1
Abstract:
Process for the definite cross-linking of DNA fragments by means of cohesive ends by replacing a first fragment by a linkage DNA, dividing the obtained DNA in the region of the linkage sequence during the formation of the cohesive end and cross-linking the obtained DNA having the cohesive end with a second DNA fragment, the cohesive ends of the first end of the second DNA fragment being complementary. As linkage DNA, an oligonucleotide is used which has the formula R1 - (X)n - R2 wherein R1 and R2 represent, reading from left to right, identical tetranucleotide sequences, in themselves complementary, having the formula (II), or R1 is a pentanucleotide sequence having the formula (III) and R2 is a pentadesoxynucleotide sequence having the formula (IV), the central nucleotides being complementary sequences of R1 and R2 groups being identical, or else R1 representing a tetranucleotide or pentanucleotide sequence which is not complementary in itself or an hexanucleotide sequence having the formula (V), (VI) or (VII) and R2 a complementary nucleotide sequence enantiomorphous of R1 and of the same length. X is a short intermediary compound having the form of an oligonucleotide comprising from 2 to 30 nucleotide units.

Inventors:
KOESTER HUBERT (DE)
Application Number:
PCT/EP1984/000196
Publication Date:
February 14, 1985
Filing Date:
June 28, 1984
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
KOESTER HUBERT (DE)
International Classes:
C07H1/00; C07H21/04; C12N15/00; C12N15/09; (IPC1-7): C12N15/00; C07H21/04
Foreign References:
EP0046669A11982-03-03
US4321365A1982-03-23
EP0036258A21981-09-23
GB2073245A1981-10-14
Download PDF:
Claims:
2. H -Patentansprüche
1. Verfahren zur definierten Verknüpfung doppelhelikaler DNAFragmente über kohäsive Enden mit den Schritten: 1 Umsetzung eines ersten DNAFragmentes an dessen stumpfen Ende mit einer kurzen, beidseitig stumpfen doppelhelikalen LinkerDNA in Gegenwart von Ligasen,.
2. Spaltung der so erhaltenen DNA im Bereich der Linker¬ sequenz unter Ausbildung des eine Sequenz von 1 6 Nucleotide aufweisenden kohäsiven Endes und.
3. Verknüpfung der so erhaltenen, das kohäsive Ende aufwei¬ senden DNA mit einem ein kohäsives Ende aufweisenden zweiten DNAFragment in Gegenwart von Ligasen, wobei die kohäsiven Enden der ersten und zweiten DNA Fragmente zueinander komplementär sind, dadurch gekenn¬ zeichnet, daß man als LinkerDNA ein in sich selbst zr komplementäres, unter Ligationsbedinqunqen als Doppelhelix vorliegendes oligonucleotid der allgemeinen Formel I (5') R1 (X)n R2 (3') (I) in der R 1 und R2 von links nach rechts gelesen identische, in sich selbst komplementäre Tetradesoxy oder Monoribotridesoxy nucleotidsequenzen aus der Gruppe der Sequenzen der Formel II (5' )A*ATT* (3' ) T*TAA* A*TAT* T*ATA* G*GCC* C*CGG* G*CGC* (II) C*GCG* G*ATC* G*TAC* C*ATG* C*TAG* A*CGT* A*GCT* T*CGA* T*GCA* in denen A, C, G und T bzw. A*, C*, G* und T* Adenin, Cytosin, Guanin bzw. Thy idinnucleotide sind, wobei A*, C*, G* und T* entweder das 5' bzw. 3'endstän¬ dige Desoxy oder das 5' bzw. 3'endständige Ribo¬ nucleotid bedeuten und das Ribothymidinnucleotid T* durch das Ribouridinnucleotid ersetzt sein kann, Zt, oder R"1 eine Pentadesoxy oder Monoribotetradesoxynucleotid sequenz aus der Gruppe der Sequenzen der Formel III (5*)A*ANTT* (3') T*TNAA* A*TNAT* T*ANTA* G*GNCC* C*CNGG* G*CNGC* C*GNCG* G*ANTC* (III) G*TNAC* C*ANTG* C*TNAG* A*CNGT* A*GNCT* T*CNGA* T*GNCA* bedeutet, wobei A, C, G und T bzw. A* , C*, G* und T* wie oben definiert sind und N eines der Nucleotide A, T, C oder G bedeutet, 2 und R eine Pentadesoxyoder Monoribotetradesoxynucleotid sequenz aus der Gruppe der Sequenzen der Formel IV 2J (5' )A*AN'TT* (3* ) T*TN'AA* A*TN'AT* T*AN*TA* G*GN*CC* C*CN'GG* G*CN*GC* (Iγ) C*GN'CG* G*AN'TC* G*TN'AC* C*AN'TG* C*TN'AG* A*CN'GT* A*GN'CT* T*CN'GA* T*GN'CA* bedeuten, wobei A, C, G und T bzw. A*, C*, G* und T* wie oben definiert sind, N" das zu N komplementäre Nucleotid A, T, C oder G ist und die Sequenzen der Gruppen R 1 und R2 bis auf die zueinander komplementären Nucleotide N und N' , von links nach rechts gelesen, identisch sind, oder R eine der durch Kombination der vier Nucleotide A, C, G und T möglichen, nicht in sich selbst komplementären Tetra¬ oder Pentanucleotidsequenzen der Formeln V oder VI oder eine in sich selbst komplementäre oder nicht in sich selbst komplementäre Hexanucleotidsequenz der Formel VII ^JRE OMPI WIPO 1 2 3 4 ( 5 ' ) N N N N ( 3 ' ) (V) 1 2 3 4 S (5 ' ) N N N N N3 ( 3 « ) (VI) (5 ' ) N1 N2N3N4N5N6 ( 3 ' ) (VII ) bedeuten , wobei N , N , N , N , N und N eines der Nucleotide A, T, C oder G ist, und R 2 eine zu R1 spiegelbildlich komplementäre Tetra, Penta bzw. Hexanucleotidsequenz der Formeln V, VI bzw. VII mit den oben angegebenen Bedeutungen für N 1 , N2, N , N , N und N ist und entweder R eine Monoribotridesoxy, Monoribotetradesoxy oder Monoribopentadesoxynucleotid 2 sequenz und R eine Tetradesoxy, Pentadesoxy oder Hexadesoxy nucleotidsequenz oder R eine Tetradesoxy, Pentadesoxy oder Hexadesoxynucleotidsequenz und R eine Monoribotridesoxy Monoribotetradesoxy oder Monoribopentadesoxynucleotid sequenz ist, oder R 1 eine zu R2 spiegelbildlich komplemen¬ täre Monoribotridesoxy, Monoribotetradesoxy oder Monoribopentadesoxysequenz ist, wobei sich das Ribonucleo tid am 5' oder 3'Ende von R oder am 5' oder 3'Ende 2 von R befindet, und wobei 5' bzw. 3' ständiges Ribo thymidin durch Ribouridin ersetzt sein kann. ' X ein Oligonucleotid aus der Gruppe der Sequenzen der Formel VIII (5') C*G* (3') G*C* T*A* A*T* G*CGG* G*GCC* (VIII) A*ATT* T*TAA* C*CCGGG* G*GGCCC* A*AATTT* T*TTAAA* in denen A, C, G und T bzw. A*, C*, G* und T* wie oben definiert sind, und n eine ganze Zahl von 1 5 bedeutet, verwendet, und die Spaltung der so erhaltenen doppelhelikalen DNA im Linkerbereich bei Nucleotidsequenzen, die keine Ribo¬ nucleotide enthalten, in an sich bekannter Weise mit einer für das zu erzeugende kohäsive Ende spezifischen Restrik tionsendonuclease der Klassen II oder III und bei Ribo¬ nucleotide enthaltenden Nucleotidsequenzen mit Basen oder Ribonucleasen vornimmt.
4. 2 Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß man das ein kohäsives Ende aufweisende erste DNAFragment vor der Verknüpfung mit dem zweiten DNAFragment mit einer an sich bekannten, kohäsive Enden unterschiedlicher Restrik tionsspezifität aufweisenden AdapterDNA umsetzt. WRE OMPI 3 Unter Ligationsbedingungen doppelhelikale LinkerDNA der Formel I (5')R1 (X)n R2(3') (I) in der R 1 , R2, X und n wie oben definiert sind. ^J EA OMPI.
Description:
Verfahren zur definierten Verknüpfung doppelhelikaler DNA-Fragmente mittels einer Linker-DNA sowie als Linker-DNA geeignete Oligonucleotide. _ ι __

Beschreibung

Die Erfindung betrifft ein Verfahren zur definierten Verknüpfung doppelhelikaler DNA-Fragmente über kohäsive Enden mit den im Anspruch 1 angegebenen Merkmalen. Die Erfindung betrifft weiter¬ hin eine doppelhelikale Linker-DNA der im Anspruch 1 angegebenen

Formel I, in der R 1 , R2, X und n wie oben definiert sind. Das

Verfahren bzw. die Linker-DNA der Erfindung kann für eine ge¬ zielte Veränderung des Erbmaterials verwendet werden.

Restriktions-Linker sind bekannt (Scheller et al., Science Bd. _9_6 , 177 (1977)

und werden seit langem in der Molekularbiologie und Gentechnologie verwendet. Ihnen ist gemeinsam, daß die Erkennungsregion für die Restriktionsendonuclease im zentralen Teil der Oligonucleotidsequenz liegt und in der Regel im 5 ' - und 3' -endständigen Bereich von G-/C-reichen Sequenzen flan¬ kiert wird. Im folgenden werden zwei Beispiele für bekannte Linker-Sequenzen gegeben:

Eco RI-Linker: d(GGAATTCC) Bam HI-Linker: d(CGGATCCG)

Die Nachteile dieser Linker sollen im folgenden an einem Bei¬ spiel erläutert werden. Nach Ligation dieser Linker an DNA mit Hilfe von T4-Polynucleotidligase wird durch diese Linker das Erbmaterial (DNA) unweigerlich und irreversibel verändert, da nach dem "Schneiden" mit der entsprechenden Restriktions- endonuclease (gegebenenfalls nach erfolgter Klonierung etc.) auch nach Anwenden einer einzelstrangspezifischen Endo-/ Exonuclease, ein Teil der angekoppelten Linkernucleotide an der DNA verbleiben:

- *• Z -

GGAATTCC

1. DNA ////// CCTTAAGG T4-Ligase

' GGAATTCC

1. DNA /////

" CCTTAAGG

Eco RI-Endonuclease

' GG AATTC

1. DNA ///// /// 2. DNA ' CCTTAA

T4-Ligase

' GGAATTC

1. DNA ///// /// 2 . D " NÄΓ

3' CCTTAAG

1. Klonierung V 2. Eco RI-Endonuclease

GG

1. DNA /////

CCTTAA

Nuclease

5' GG

1. DNA ///// 3' CC

Es wird deutlich, daß bei diesem Beispiel gemäß dem Stand der Technik die ursprüngliche DNA um 2 GC-Basenpaare ver¬ längert wurde.

Die Nachteile des bekannten Verfahrens können mit dem Ver¬ fahren bzw. der Linker-DNA der Erfindung vermieden werden, da sie ermöglichen, die ursprüngliche Erbinformation in un¬ veränderter Weise zurückzugewinnen. Die Merkmale des Ver¬ fahrens der Erfindung ergeben sich aus dem kennzeichnenden Teil des Anspruchs 1.

Der hier verwendete Begriff "komplementär" bedeutet komple¬ mentär im Sinne von Watson und Crick. "Spiegelbildlich komplementär" bedeutet, daß zwei Sequenzen komplementär sind, wenn die eine von links nach rechts und die andere von rechts nach links gelesen wird.

Die Oligonucleotide I weisen normalerweise ebenso wie die ersten und zweiten DNA-Fragmente am 5' -Ende eine Phosphat¬ gruppe auf; fehlt diese am Oligonucleotid I, ist lediglich dafür zu sorgen, daß das 1. bzw. 2. DNA-Fragment an der Verknüpfungs¬ stelle für die Linker-DNA eine 5' -ständige Phosphatgruppe auf¬ weist. Fehlt die Phosphatgruppe im ersten oder zweiten DNA- Fragment, muß das Oligonucleotid I eine 5'-Phosphatgruppe auf¬ weisen.

Wenn R eine der durch Kombination der vier Nucleotide A, T, C und G möglichen, nicht in sich selbst komplementären Tetra¬ nucleotidsequenzen ist, ergeben sich die aus Tabelle 1 er- sichtlichen Sequenzen. Wenn R eine der durch Kombination der vier Nucleotide A, T, C und G möglichen, nicht in sich selbst komplementären Pentanucleotide ist (in Anbetracht der unge¬ raden Nucleotidzahl sind Pentanucleotidsequenzen ausschlie߬ lich nicht in sich selbst komplementär), erhält man durch ana¬ loge Permutation die hier im einzelnen nicht wiedergegebenen möglichen Sequenzen, z.B.

- H -

(5' )AAAAA (3' ) AAAAT

GGGGC GGGGG

Sinngemäß können auch durch entsprechende Permutation die Kombinationsmöglichkeiten für in sich selbst oder nicht in sich selbt komplementäre Hexanucleotide aus den Nucleotiden A, T, C und G erhalten werden, z.B.

(5' )AAAAAA (3' ) (5' ) AAAAAT (3')

AAAATT

AATTTT

GGCCCC GGGGCC GGGGGC GGGGGG

1 Für die hier angesprochenen Fälle, daß R eine nicht in sich selbst komplementäre Tetra- oder Penta- oder eine in sich oder nicht in sich selbst komplementäre Hexanucleotidsequenz ist, gilt, daß R^ die zu R 1 spiegelbildlich komplementäre S equenz mit gleicher Kettenlänge aufweisen muß, z.B.

(5')ACTA(X) TAGT(3 r ).

(5 r ) CACACA (X) n TGTGTG ( 3 ' )

( 5 r ) AAATTT (X) AAATTT ( 3 ' ) n

OMPI ^ """

- r -

Weiterhin gilt für diese Fälle, daß entweder R 1 oder R2 ein einziges Ribonucleotid enthalten muß, und zwar in den end¬ ständigen Positionen 3 ! oder 5', oder gegebenenfalls auch X ein 3'- oder 5 '-endständiges Ribonucleotid enthält, z.B.

(5')C*ACAGC*TGTG(3') ,

wobei R 1 = C*ACA, R2 = TGTG und X = GC* bedeuten und die

Ribonucleotide durch * markiert sind.

Es gilt die Regel, daß zur Erzeugung kohäsiver Enden in dem Spacer X ein Ribonucleotid vorhanden sein muß , wenn entweder R 1 oder R2 ein Ribonucleotid aufweisen; ein

Ribonucleotid im Spacer X ist dagegen nicht erforderlich, wenn R 1 und R2 je ein Ribornucleotid enthalten.

Es ist jedoch auch möglich, daß R 1 und R2 5'- oder 3 '-stän¬ dige Ribonucleotide enthalten, wobei die jeweilige Positionierung des Ribonucleotids bestimmt, welche Ketten¬ länge das übertragene kohäsive Ende aufweist.

Weiterhin gilt, daß T* (Ribothymidin) durch das gleich¬ wirkende U* (Ribouridin) ersetzt sein kann.

Eine Aufzählung und Beschreibung von Restriktionsendonucleasen der Klassen II und III ist in der Firmenschrift "Restriction Endonucleases" der Boehringer Mannheim GmbH, 1981, enthalten; diese Veröffentlichung enthält auch Restriktionsendonucleasen der Klassen II und III, die für das Verfahren der Erfindung ver¬ wendbar sind, in der folgenden Beschreibung jedoch nicht nament¬ lich genannt werden.

Mit dem Verfahren der Erfindung lassen sich- 1 , 2 , 3, 4, 5 oder 6, vorzugsweise 4, Nucleotide aufweisende kohäsive Enden auf die erste DNA übertragen, wobei Nucleotide aus der

Spacer-Gruppe X nicht mit übertragen werden. Es ist jedoch auch möglich, wie später an einem Beispiel gezeigt wird, aus dem Spacer X ein oder mehrere Nucleotide mit auf die erste DNA zu übertragen, und zwar bei geeigneter Positionie¬ rung eines Ribonucleotids in der Gruppe X.

Die Ausbildung der kohäsiven Enden an der 1. DNA erfolgt durch Spaltung des aus der 1. DNA und der Linker-DNA er¬ haltenen Reaktionsproduktes, das in allgemeiner Schreibweise wie im Schema I dargestellt werden kann (am Schluß der Beschreibung) .

Im Schema 1 bedeutet N die die Reste R bildenden Nucleotide A, T, G und/oder C bzw. A*, T*, G*, C* und/oder U* und X die oben definierte Oligonucleotidgruppierung mit 2-30 Nucleotideinheiten. Weiterhin sind mit Pfeilen die Spaltungs¬ positionen gemäß vier Spaltungsvarianten a, b, c und d dargestellt, auf die im folgenden eingegangen wird.

Varianten a, b:

Die Spaltung erfolgt mittels Restriktionsendonucleasen der Klassen II bzw. III und führt zu der Ausbildung eines kohäsiven Endes an der Fremd-DNA, das die gleiche Nucleotid- zahl aufweist wie die Gruppe R 1 bzw. R2 der Linker-DNA.

Je nach Spezifität der Endonuclease wird das kohäsive Ende am 5'- oder 3'-Ende der Fremd-DNA erzeugt.

Varianten c, d:

Die Spaltung erfolgt mittels Basen bzw. RNA-sen, setzt somit voraus, daß an den Spaltungspositionen Ribonucleotide A*, T*, C*, G* oder U* vorhanden sind, wobei zu beachten ist, daß die Spaltung immer am 3 '-Ende des Ribonucleotids

- > -

erfolgt. Je nach Positionierung der Ribonucleotide wird das kohäsive Ende am 5'- oder 3 '-Ende der Fremd-DNA erzeugt; weiterhin bestimmt die Positionierung der Ribonucleotide die Kettenlänge (1-6) des übertragenen kohäsiven Endes.

Das kohäsive Ende kann ausschließlich aus den Nucleotiden der Gruppen R 1 und R * ? stammen; es können jedoch zusätzlich noch Nucleotide aus der Spacerregion übertragen werden.

Gemäß einer weiteren vorteilhaften Ausführungsform der Er¬ findung kann man das ein kohäsives Ende aufweisende, erste DNA-Fragment vor der Verknüpfung mit dem zweiten DNA-Fragment mit einer an sich bekannten, kohäsive Enden unterschiedlicher Restriktionsspezifizität aufweisenden Adapter-DNA umsetzen. Auch für diese Variante wird später noch ein Beispiel gegeben.

Das Verfahren der Erfindung wird im folgenden anhand von bevo zugten Beispielen näher erläutert.

Wenn in den Oligonucleotiden der allgemeinen Formel I R und

2 R Sequenzen der allgemeinen Formel II bedeuten, d.h. z.B. di zentrale Erkennungsregion von Restriktionsendonucleasen der Klassen II und III, und (X)_ eine kurze Spacerregion darstell lassen sich mit diesen Oligonucleotiden mit Hilfe von Ligasen, insbesondere T ^ -Polynucleotidligase Erkennungsregionen für Restriktionsendonucleasen in genetisches Material (DNA) ein¬ bauen. Dabei gestatten es die Oligonucleotide der Formel I, d nach erfolgter Kopplung und Klonierung die ursprüngliche Erb¬ information in unveränderter Form zurückgewonnen wird. Dies wird dadurch erreicht, daß sich die den kohäsiven Teil beinha tende Signalsequenz der Restriktionsendonuclease an den beide Enden des Oligonucleotids befindet.

- ff -

Das folgende Beispiel 1 verdeutlicht die Vorteile, die mit einem Oligonucleotid der Erfindung der Formel d- AATTCGAAT ) erreichbar sind.

5' AATTCGAATT

1. DNA/// TTAAGCTTAA

T4-Ligase

5' GAATTCGAATT 3' CTTAAGCTTAA

Eco RI-Endonuclease

AATTC :*

1.DNA/// //2.DNA

CTTAA

T4-Ligase

5' GAATTC 3'

1.DNA/// ///2.DNA 3' CTTAAG 5

J1.Klonierung i2.Eco Rl-Endonuclease

Nuclease

1.DNA///

OMPI

Es wird deutlich, daß mit dem Verfahren bzw. dem Oligonucleo¬ tid der Erfindung die Erbinformation (1. DNA) nach Kopplung derselben mit dem Oligonucleotid der Erfindung bzw. der Linker-DNA, Spaltung unter Erzeugung eines kohäsiven Endes, Kopplung an eine zweite DNA (Vektor-DNA) mit einem komple¬ mentären kohäsiven Ende, Klonieren, erneute Spaltung und Abspaltung des kohäsiven Endes in unveränderter Form zurück¬ erhalten wird.

Die Einführung Endonuclease-spezifischer kohäsiver Enden gemäß der Erfindung hängt vom endständigen Basenpaar der ersten DNA ab. Einige Beispiele für die vier möglichen Basenkonstellationen sollen das Verfahren der Erfindung weiterhin erläutern:

Beispiel 2

5' G

1. DNA/777 3' C

Oligonucleotide I; AATTCGAATT (Signalsequenz für Eco Rl)

GATCCGGATC (Signalsequenz für Barn HI)

GTACCGGTAC (Signalsequenz für Kpn I )

TCGACGTCGA (Signalsequenz für Sal I )

AGCTCGAGCT (Signalsequenz für Sac I/Sst I)

Beispiel 3

Oligonucleotide I: GATCTAGATC (Signalsequenz für Bgl IT)

TCGATATCGA (Signalsequenz für Cla I) AGCTTAAGCT (Signalsequenz für Hind III) AATTTAAATT (Signalsequenz für Aha III)

Beispiel 4

Oligonucleotide I: TGCAGCTGCA (Signalsequenz für Pst I)

GATCGCGATC (Signalsequenz für Pvn I) TCGAGCTCGA (Signalsequenz für Xho I)

Beispiel 5

1. DNA////

3 «

Oligonucleotide I: GATCATGATC (Signalsequenz für Bei I)

GTAGATCTAG (Signalsequenz für Xba I)

Für die Beispiele 1 - 5 ist die Kenntnis des endständigen Basenpaares der ersten DNA (Fremd-DNA) erforderlich. Dem¬ gegenüber genügt für einige Restriktionsendonucleasen das Vorhandensein der selbst komplementären Tetranucleotid- sequenz, so daß diese Linker gemäß dem Verfahren der Er-

MPI

fin d ung für jede Fremd-DNA verwendet werden können, gleich ¬ gültig, welches endständige Basenpaar dort vorliegt, d.h. nach A nkopplung einiger der Oligonucleotide der Erfindung wir d immer das kohäsive Ende der entsprechenden Restriktions- endonuclease erzeugt. Im folgenden werden hierfür einige Bei¬ spiele gegeben.

Beispiel 6

5' N

1. DNA///// 3* N «

Oligonucleotide I: GATCCGGATC (Signalsequenz für Mbol /Sau 3 A)

TCGAGCTCGA (Signalsequenz für Taq I)

AATTCGAATT (Signalsequenz für Eco Rl*)

AGCTCGAGCT (Signalsequenz für Alu I)

N ist eines der Nucleotide A, C, G und T; N' bedeutet das jeweils dazu komplementäre Nucleotid A, C, G und T.

Im folgenden wird ein Beispiel für den Einsatz eines Oligo-

1 nucleotids gegeben, in dem R eine Sequenz der Formel III und

2 R eine Sequenz der Formel IV mit den dort angegebenen Defi¬ nitionen für A, C, G und T bzw. A*, C*, G* und T* sowie N und N' bedeuten, wobei die Sequenzen von R 1 und R2, von links nach rechts gelesen, bis auf die zueinander komplementären

Nucleotide N und N' identisch sind.

Beispiel 7

Oligonucleotide I: GTCACCGGTGAC (Signalsequenz für Bst EU)

- TTREΛ OMPI

- U -

Falls aufgrund des gegebenen endständigen Basenpaares der Fremd- DNA nicht direkt die gewünschten kohäsiven Enden erzeugt werden können, gelingt dies in einem zwischen den Spaltungs- und Ver- knüpfungsschritt eingeschalteten zusätzlichen Verfahrens¬ schritt. Im nachfolgenden Beispiel 8 besitzt die erste DNA (Fremd-DNA) ein endständiges GC-Basenpaar, so daß die für Hind III spezifischen kohäsiven Enden nicht direkt einge¬ führt werden können. Es wird daher zunächst der Barn HI-Linker und danach eine Barn HI-/Hind III-Adapter-DNA verwendet, um das gewünschte Ziel zu erreichen (Adapter-DNA kann als kurze DNA mit kohäsiven Enden unterschiedlicher Restriktions- spezifität definiert werden) :

Beispiel 8

5* GATCCGGATC

1. DNA//// C CTAGGCCTAG

GATCCCGGGTA

DNA////

CCTAG GGCCCATTCGA

T4-Ligase

Eine Verfahrensführung gemäß Beispiel 8 ermöglicht letzt¬ lich die Einführung jedes kohäsiven Endes unabhängig davon, welches endständige Basenpaar die erste DNA trägt, wobei entsprechend dem erfindungsgemäßen Konzept die erste DN A unverändert zurückerhalten werden kann.

- I S -

G emäß einer weiteren Variante des Verfahrens bzw. der Oligo ¬ nucleotide der Erfindung können an definierten Positionen des Oligonucleotids Ribonucleotide eingebaut werden. Erfindungs¬ gemäß können die Restriktionsendonuclease-spezifischen kohäsiven Enden auch ohne Verwendung der Restriktionsendo- nuclease eingeführt werden. Dies wird an den folgenden Bei¬ spielen 9 und 10 erläutert.

Beispiel 9

Kohäsives Ende für Eco Rl:

G A*ATTGC*AATT 1. DNA//// C + TTAA*CGTTA*A

Ligase

1.Phosphatase

2.J0 4 -

> f 3.Phosphatase

G 1. DNA////

CTTAA

OMPI

Beispiel 1 0

Kohäsives Ende für Pst I :

5' C TGCAG*CTGCA*

1. DNA//// 3' G A*CGTCG*ACGT

igase

5' CTGCAG*

1. DNA//// P 3' G

1.Phosphatase 2.J0 4 - ψ 3.Phosphatase

CTGCA

1. DNA////

3'

In den Beispielen 9 und 10 werden, ebenso wie in der folgen¬ den Beschreibung, Ribonucleotide durch * gekennzeichnet.

Durch den Einbau eines Ribonucleotids wird innerhalb der DNA eine definierte alkalilabile Position geschaffen, wie sich aus dem folgenden ReaktionsSchema ergibt:

- I S -

Dabei verbleibt der Phosphatrest der Internucleotidbindung am Ribonucleotid. Nach Behandlung mit Phosphatase wird eine 2', 3'-cis-Diolgruppierung geschaffen, die durch Perjodat- behandlung in bekannter Weise gespalten und ebenfalls in be¬ kannter Weise unter milden alkalischen Bedingungen zur Elimi¬ nierung des Ribonucleotids führt. Zum Schluß wird durch er¬ neute Phosphatasebehandlung das 3'-terminale Desoxyribo- nucleotid freigesetzt. Es kann vorteilhaft sein, diesen Schritt erst später in einer Reaktionssequenz durchzuführen, um dieses kohäsive Ende durch den 3'-Phosphatrest "geschützt" zu behalten.

Ein weiterer Vorteil dieser Verfahrensvariante liegt darin, daß die Ribonucleotidpositionen so gewählt werden können, daß jeweils nur einer der beiden DNA-Stränge eine definierte al¬ kalilabile Bruchstelle erhalten, bzw. der jeweils andere Strang durch die entsprechende Restriktionsendonuclease geschnitten werden kann. Dies wird im folgenden an zwei Beispielen erläu¬ tert:

- U -

Beispiel 11

0H ~ spaltbar

5• _G A*ATTCGAATT

1. DNA//// 3' C T TAAGCTTAA* enzy fmatisch spaltbar

Beispiel 12 enzymatisch spaltbar

/ 5 r G AATTCG*AATT

1. DNA////

3* C TTAA*GCTTAA f. OH -spaltbar

Das Verfahren der Erfindung ermöglicht auch die Einführung von kohäsiven Enden, die nicht selbst komplementär sind. In diesem Falle ist R eine nicht in sich selbst komplementäre Tetra- oder Pentanücleotidsequenz oder eine in sich selbst oder nicht in sich selbst komplementäre Hexanucleotidsequenz der Formel V, VI bzw. VII gemäß dem Hauptanspruch (mit den

2 dort angegebenen weiteren Definitionen) ; R ist stets eine zu R spiegelbildlich komplementäre Sequenz gleicher Länge mit 4, 5 oder 6 Nucleotiden. Wie weiter oben ausgeführt wurde, weist R oder R ein 5'-oder 3'-endständiges Ribonucleotid auf, wobei gegebenenfalls in dem Spacer (X) ein weiteres Ribo¬ nucleotid vorzusehen ist.

In Abhängigkeit davon, wo die Ribonucleotide positioniert sind, kann - bei gleicher Nucleotidsequenz - die Länge des kohäsiven Endes beeinflußt werden und das kohäsive Ende entweder an das 3'- oder 5'-Ende der ersten DNA (Fremd-DNA) dirigiert werden.

- ] -

D ie folgenden Beispiele erläutern diese Verfahrensvariante

Beispiel 13

C*ACAGC*TGTG GTGTC*GACAC*

1. T4-Ligase

2. Phosphatase

3. Perjodat ψ 4. Phosphatase

1. DNA//// 3' GTGT

Beispiel 14

C*ACAG*CTGTG

1. DNA////

3' GTGTCG*ACAC*

1. T4-Ligase

2. Phosphatase

3. Perjodat ■

4. Phosphatase

1 . DNA////

3 ' GTGTC

- I ff -

Beispiel 1 5

CACAG*CTGTG*

1 . DNA////

3 ' ' *GTGTCG*ACAC

1. T4-Ligase

2. Phosphatase ψ 3. Perjodat

4. Phosphatase

CACA

1. DNA////

3' '

Beispiel 16

5' CACAGC*TGTG*

1. DNA////

3* GTGT*CGACAC

1. T4-Ligase

2. Phosphatase

3. Per odat 4. Phosphatase

5' CACAG

1. DNA////

Durch geeignete Positionierung der Ribonucleotide ist auch bei dieser Verfahrensvariante möglich, die alkalilabile Bruchstelle in jeweils nur einem der beiden DNA-Stänge einzuführen. Dies ermöglicht z.B. bei ringförmiger, doppelsträngiger, entweder die Isolierung des Minus-oder des Plus-Stranges.

Das folgende Beispiel verdeutlicht, daß mit Oligonucleotiden I, in denen R 1 und R2 in sich selbst oder nicht in sich selbst komplementäre Hexanucleotidsequenzen sind, kohäsive Enden er¬ zeugt werden können, die, in Abhängigkeit von der Positionierung von Ribonucleotiden in den Resten R 1 , R2 bzw. X, Kettenlängen von 1 - 6 Nucleotiden aufweisen.

Beispiel 1 7

t v A π , TΔ Λ *ACACAGC*TGTGTG OH I reraü- OiM A j Q TGTGTC*GACACAC* - (Fremd-DNA)

GTGTGT

A n - KτΛ ^ C*ACACAGCT*GTGTG OH l. remα-DNA ] GTGTGT*CGACACAC* -> (Fremd-DNA)

GTGTG

t v A n „a Δ » C*ACACAGCTG*TGTG OH (_- remα-UNA, GTGTG * TCGACACAC * (Fremd-DNA) GTGT

etc.

(Fremd-DNA) *CACACAGCTGTGT*G OH GT*GTGTCGACACAC* - (Fremd-DNA)

Die vorstehenden Beispiele offenbaren die große Flexibilität des Verfahrens der Erfindung, das immer dann von Vorteil ist, wenn DNA-Fragmente irreversibel miteinander verkoppelt werden

- 7. 0 -

sollen o d er wenn sich die Anwendung von Restriktionsendo ¬ nucleasen verbietet, weil das Vorhandensein interner Signal¬ sequenzen sehr wahrscheinlich ist. Dies ist bei hochmole¬ kularen DNA-Fragmenten, z.B. zur Etablierung einer Genbank, fast immer der Fall.

Der in dem Oligonucleotid der Formel I enthaltene Spacer (X) n stellt kurze Oligonucleotidsequenzen dar, die als notwendiger Spacer unter Berücksichtigung der für die Restriktionsendo- nuclease-Erkennungsregion notwendigen Nucleotide und der er¬ forderlichen Stabilität der durch Selbstkomplementarität sich bildenden doppeisträngigen DNA ausgewählt wird. Wird die zen¬ trale Tetranucleotidsequenz nur durch die wenig Stabilität vermittelnden AT-Basenpaare gebildet, wie z.B. beim Eco RI- Linker

d(AATTCGAÄTT)

so kann die Stabilität z.B. durch Verlängerung des Spacers erhöht werden, z.B.

d(AATTCGCGAATT) .

Dadurch kann eine weitere Erkennungsregion für eine Restriktions- endonuclease eingeführt werden, z.B. für X = CCCGGG hat der Eco RI-Linker die Formel

Xmal .S al d(AATT CCξGGGAATT)

Hier wird nicht nur mit dem Linker die Eco Rl-Signalsequenz in eine Fremd-DNA eingeführt, die GC als endständiges Basenpaar besitzt, sondern auch noch die recht seltene Erkennungssequenz

-güREA

O PI

für Smal/Xmal.

Das folgende A usführungsbeispiel betrifft die Herstellung und erfindungsgemäße Anwendung eines Oligonucleotids der Erfin¬ dung der Formel d(GATCCGGATC) .

Beispiel 1 * 8

Herstellung von d(GATCCGGATC) (vgl. Tetrahedron Let. 1983, 747 )

100 mg C-Träger (10 μMol N-benzoyliertes C, kovalent gebunden an "Controlled Pore Glass" (CPG) werden nacheinander mit je 100 μMol der durch MSNT (1,5 Äquivalente/PO~) aktivierten N-geschützten, 5'-dimethoxytritylierten Desoxynucleosid-3*- (2-chlorphenyl)-phosphodiester T, A, G, G, C, C, T, A und G umgesetzt. Ein Reaktionszyklus umfaßt Kondensation (45') in Pyridin, Waschen mit Pyridin, Capping mit Essigsäureanhydrid/ Pyridin (10*), Waschen mit Pyridin, CH 2 Cl 2 /MeOH(7:3) und Ab¬ spalten der Dimethoxytritylgruppe mit gesättigtem ZnBr- in CH 2 Cl 2 /Methanol (7:3) für 10' und Waschen mit CH 2 Cl 2 /MeOH (7:3) sowie Pyridin.

Die durchschnittlichen Kondensationsausbeuten liegen bei 90 - 95 %.

Nach der letzten Kondensation erfolgt Abspaltung der 2-Chlor- Phenylgruppe durch Behandeln mit Oximatreagenz (vgl. Tetra¬ hedron Let. 1978, 2727) ,

3 ml, für 24 h, Abspaltung vom Träger und Entfernung der N-Arylgruppen durch Behandlung mit konzentriertem wässrigem Ammoniak, 12 h bei 50° C. Nach dem Einengen und 5-facher Extraktion mit je 5 ml CHC1., wird die wässrige Lösung durch Anionaustauschchromatographie an DEAE-Cellulose in der üb¬ lichen Weise gereinigt (vgl. Liebigs Ann. 1978, 839 und

O PI

, WIO

Tetrahedron Let. 1983, 747) .

D as gereinigte Material wird in üblicher Weise durch Poly- acrylamidgelelektrophorese (20 %, 7M Harnstoff) und Vergleich mit einem Homo-oligo-dT-Kettenlängenstandard und durch Sequenzierung entweder nach Maxam-Gilbert oder nach der "mobility shift"-Methode charakterisiert.

Ligation:

Um das Ligationssubstrat zu erhalten, wird pBR 322 mit Bai I (TGG^CCA) in üblicher Weise linearisiert und auf diese Weise die DNS mit dem stumpfen ^-Ende versehen. Die Ligation erfolgt in 66 mM Tris-HCl (pH 7,6), 6,6 mM MgCl 2 , 10 mM Dithiothreitol, 0,4 itiM ATP und 4 Einheiten T4-Ligase pro 20 μl Reaktions¬ volumen. Der Linker wird im 50-fachen Überschuß über die Termini verwendet. Die Ligationsdauer beträgt 24 h bei 10° C.

Anschließend wird mit Barn HI in der üblichen Weise inkubiert; die entstandenen Barn Hl-kohäsiven Enden werden in gleicher Weise wie oben angegeben, jedoch mit lediglich 0,02 Einheiten T4- Ligase, pro 20 μl ligiert. Die Reaktionsdauer beträgt 1 h bei 22 c C.

Die Agarosegelelektrophorese zeigt Umwandlung der linearen pB R 322-DNS in circuläre DNS unter Ligationsbedingungen, unter denen nur kohäsive, nicht jedoch stumpfe Enden ligiert werden.

JÜREÄ PI

Tabelle I

T T TT A A A T CCCT GGGT TCAT TCGT TACT TTTA AA A A CCCA GGGA TCAA TACA TTTC A A A C CCCC GGGC TCAC TCGT TACC TTTG AAAG CCCG GGGG TCAG TCGG TACG

TTCT CCTT GGTT TGCT TGAT TAGT TTCA AATA CCTA GGTA TGAA TAGA TT.CC AATC CCTC GGTC TGCC TGAC TAGC TTCG AATG CCTG GGTG TGCG TGAG TAGG

TTAT AACT CCAT GGAT CTAT CTGT GATT

AACA CCAA GGAA CTAA CTGA GATA

TTAC AACC CCAC GGAC CTAC CTGC TTAG AACG CCAG GGAG CTGG GATG

TTGT AAGT CCGT GGCT CATT CAGT GACT TTGA AAGA CCGA GGCA CATA CAGA GACA TTGC AAGC CCGC CATC CAGC GACC TTGG AAGG GGCG CAGG GACG

TATT CTCT GTGT CGTT CGAT

ATAA CTCA GTGA CGTA CGAA

TATC ATAC CTCC GTGC CGTC CGAC

TATG ATAG CTCG GTGG CGTG CGAG

TCTT ACAT CACT GAGT ATCT ATGT TCTA ACAA CACA GAGA ATCA ATGA TCTC ACAC CACC GAGC ATCC ATGC TCTG ACAG CACG GAGG ATCG ATGG

TGTT AGAT CGCT GCGT ACTT TGTA AGAA CGCA GCGA ACTA ACGA TGTC AGAC CGCC ACTC ACGC TGTG AGAG GCGG ACTG ACGG

TAAT ATTT CTTT GTTT AGTT TAAA ATTA CTTA GTTA AGTA AGCA TAAC ATTC CTTC GTTC AGTC AGCC TAAG ATTG CTTG GTTG AGTG AGCG

TCCT ACCT CAAT GAAT GTCT GTAT TCCA ACCA CAAA GAAA GTCA GTAA TCCC ACCC CAAC GAAC GTCC TCCG ACCG CAAG GAAG GTCG GTAG

TGGT AGGT CGGT GCCT GCTT GCAT TGGA AGGA CGGA GCCA GCTA GCAA TGGC AGGC CGGC GCCC GCTC GCAC TGGG AGGG CGGG GCCG GCTG GCAG