Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR THE ENRICHMENT OR ANALYSIS OF DNA FRAGMENTS FROM A COMPLEX GENOMIC DNA SAMPLE
Document Type and Number:
WIPO Patent Application WO/2009/106322
Kind Code:
A1
Abstract:
The present invention relates to a method for the enrichment of smaller DNA fragments from more complex genomic DNA, and to a method for the analysis of genomic DNA, wherein the method for enrichment is employed.

Inventors:
BAUER CLAUDIA (DE)
BAUER PETER (DE)
RIESS OLAF (DE)
Application Number:
PCT/EP2009/001362
Publication Date:
September 03, 2009
Filing Date:
February 26, 2009
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
UNIV EBERHARD KARLS (DE)
BAUER CLAUDIA (DE)
BAUER PETER (DE)
RIESS OLAF (DE)
International Classes:
C12Q1/68
Foreign References:
US20070141604A12007-06-21
EP1184466A22002-03-06
EP1630237A22006-03-01
EP0487104A11992-05-27
Other References:
BASHIARDES STAVROS ET AL: "Direct genomic selection", NATURE METHODS JAN 2005,, vol. 2, no. 1, 1 January 2005 (2005-01-01), pages 63 - 69, XP002525087
OKOU DAVID T ET AL: "Microarray-based genomic selection for high-throughput resequencing", NATURE METHODS NOV 2007,, vol. 4, no. 11, 1 November 2007 (2007-11-01), pages 907 - 909, XP002524506
ALBERT THOMAS J ET AL: "Direct selection of human genomic loci by microarray hybridization", NATURE METHODS, NATURE PUBLISHING GROUP, GB, vol. 4, no. 11, 1 November 2007 (2007-11-01), pages 903 - 905, XP002499757, ISSN: 1548-7091, [retrieved on 20071014]
LOVETT ET AL: "Fishing for complements: finding genes by direct selection", TRENDS IN GENETICS, ELSEVIER SCIENCE PUBLISHERS B.V. AMSTERDAM, NL, vol. 10, no. 10, 1 October 1994 (1994-10-01), pages 352 - 357, XP023477939, ISSN: 0168-9525, [retrieved on 19941001]
Attorney, Agent or Firm:
LAUFER, Gabriele (DE)
Download PDF:
Claims:
Patentansprüche

1. Verfahren zur Anreicherung und/oder Analysierung von zusammenhängenden genomischen DNA-Fragmenten aus einer zu untersuchenden komplexen genomischen DNA, mit den folgenden Schritten:

a) Bereitstellen von doppelsträngigen DNA-Sonden, die Sequenzen aufweisen, welche Sequenzen in der zu untersuchenden komplexen genomischen DNA entsprechen, b) Immobilisieren der doppelsträngigen DNA-Sonden aus Schritt a) an einen Träger, c) Denaturieren der an den Träger immobilisierten doppelsträngigen DNA-Sonden zur Herstellung von an den Träger gebundenen ein- zelsträngigen DNA-Sonden, d) Fragmentieren und Denaturieren der zu untersuchenden genomischen DNA zur Herstellung von genomischen DNA-Fragmenten, e) Inkubieren und Hybridisieren von fragmentierter und denaturierter genomischer DNA mit an den Träger immobilisierten einzelsträngigen DNA-Sonden, f) Entfernen von nicht hybridisierter genomischer DNA, und g) Elution von spezifisch an die DNA-Sonden gebundenen genomischen DNA-Frgamenten von dem Träger.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die zu untersuchende genomische DNA Säugetier-DNA, insbesondere vom Menschen, ist.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die DNA- Sonden in Schritt a) durch eine Fragmentierung von größeren DNA- Abschnitten gewonnen werden.

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass in BAC-Klonen enthaltene DNA für die Fragmentierung eingesetzt wird.

5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die Sonden in Schritt b) über eine Markierung an den Träger immobilisiert werden.

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass zur Markierung der doppelsträngigen DNA-Sonden ein Marker eingesetzt wird, der eine spezifische oder unspezifische Affinität für den Träger besitzt.

7. Verfahren nach einem der Ansprüche 5 oder 6, dadurch gekennzeichnet, dass der Marker Biotin-dUTP ist.

8. Verfahren nach einem der Ansprüche 6 oder 7, dadurch gekennzeichnet, dass die DNA-Sonden terminal mit dem Marker markiert werden.

9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass für die Markierung eine terminale Transferase eingesetzt wird.

10. Verfahren nach einem der Ansprüche 5 bis 9, dadurch gekennzeichnet, dass der Träger eine Beschichtung mit einer spezifischen Affinität für die Markierung der DNA-Sonden aufweist.

11. Verfahren nach einem der Ansprüche 7 bis 10, dadurch gekennzeichnet, dass die Immobilisierung der markierten doppelsträngigen DNA-Sonden in Schritt b) über Streptavidin erfolgt, mit welchem der Träger beschichtet ist.

12. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, dass der in Schritt b) verwendete Träger ausgewählt ist aus Mikrotiterplatten und Säulen.

13. Verfahren nach einem der Ansprüche 1 bis 12, dadurch gekennzeichnet, dass Schritt d) vor oder parallel zu einem der vorherigen Schritte durchgeführt wird.

14. Verfahren nach einem der Ansprüche 1 bis 13, dadurch gekennzeichnet, dass die Denaturierungen der DNA-Sonden in Schritt c) und/oder der genomischen DNA in Schritt d) durch Hitze, Säure oder Alkali und Wasserstoffbrücken lösende Agenzien durchgeführt wird.

15. Verfahren nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, dass die Elution der genomischen DNA-Fragmente durch Hitze, Säure oder Alkali und Wasserstoffbrücken lösende Agenzien vorgenommen wird.

16. Verfahren nach einem der Ansprüche 1 bis 15, dadurch gekennzeichnet, dass es im Anschluss an die Anreicherungsschritte a) bis g) den weiteren Schritt h) aufweist:

h) Analysieren der angereicherten genomischen DNA-Fragmente mittels m-v/rro-Amplifikation und/oder direkte Sequenzierung.

17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, dass es zur Untersuchung von Mutationen in genomischer DNA eingesetzt wird.

18. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass es zur Untersuchung von Mutationen bei Genen eingesetzt wird, die mit bestimmten Krankheiten assoziiert sind.

19. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass es zur Identifizierung von Genen eingesetzt wird, die mit bestimmten Krankheiten assoziiert sind.

Description:

VERFAHREN ZUR ANREICHERUNG ODER ANALYSE VON DNA FRAGMENTEN AUS EINER

KOMPLEXEN GENOMISCHEN DNA PROBE

Die vorliegende Erfindung betrifft ein Verfahren zur Anreicherung zusammenhängender genomischer DNA-Fragmente aus zu untersuchender komplexer genomischer DNA, und ein Verfahren zur Analyse der mit diesem Anreicherungsverfahren gewonnenen DNA-Fragmente, sowie den Einsatz des Verfahrens zur Untersuchung von Mutationen in genomischer DNA, insbesondere von Mutationen bei Genen, die mit bestimmten Krankheiten assoziiert sind und/oder zur Identifizierung von Genen, die mit bestimmten Krankheiten assoziiert sind.

In der modernen molekularen Biologie ist die gezielte Anreicherung von spezifischen Regionen aus komplexen Genomen ein wichtiger Schritt, um nachfolgend spezifische Sequenzabschnitte analysieren und identifizieren zu können, wobei gegenwärtig

insbesondere die Polymerase-Kettenreaktion (PCR) eingesetzt wird, die sich innerhalb der letzen Jahre als die herausragende Anreicherungsmethode erwiesen hat. Daneben sind im Stand der Technik ferner Verfahren zu schnellen und kostengünstigen Produktion dichter DNA-Microarrays bekannt, sowie Verfahren, mit welchen DNA im Hochdurchsatz parallel sequenziert werden kann. Der Einsatz von Microarrays in Kombination mit den weiteren Verfahren der Sequenzierung und PCR hat es der Wissenschaft ermöglicht, riesige Mengen von Daten zu verarbeiten und zu verstehen.

Ein großes Ziel der molekulardiagnostischen Wissenschaft ist es nämlich, mit den verfügbaren Verfahren und Techniken mittels einer spezifischer Anreicherung innerhalb der komplexen Struktur der genomischen DNA Sequenzabschnitte bzw. Gene zu identifizieren, über welche Krankheiten diagnostiziert und ggf. auch gezielt behandelt werden können.

So erlauben gegenwärtig neuartige Sequenziertechnologien (hochdichte Parallelsequenzierung) die Resequenzierung von mehreren Megabasen von individuellen Genomen. Auf diese Weise lassen sich bspw. komplette Bakteriengenome (100 Mb) auf einmal innerhalb von drei bis fünf Tagen re-sequenzieren bzw. de-novo- sequenzieren. Allerdings übersteigt das menschliche Genom, wie auch die Genome vieler anderer Spezies, die Sequenzierkapazität dieser Technologien um das Vielfache, weil gerade Abweichungen vom Normalzustand etwa 5 bis 20 Mal unabhängig untersucht werden müssen, bevor mit hinreichender Sicherheit bspw. eine krankhafte Mutation entdeckt werden kann.

Die genomische Forschung und die molekulargenetische Diagnostik bei Menschen wie auch bei vielen anderen Spezies oder Modellorganismen pflanzlicher oder tierischer Art stellt die Wissenschaft vor zwei wiederkehrende aufwändige bzw. überfordernde Herausforderungen.

So wird gegenwärtig bei der Mutationssuche in bekannten Krankheitsgenen mit der konventionellen Sanger-Sequenziermethode das Krankheitsgen bzw. die Krankheits-

gene in einzelnen Exonen analysiert und dann Dutzende Einzelbefunde zu einem Gesamtergebnis zusammengefügt. Die Nachteile bei diesem Ansatz liegen darin, dass einerseits eine Vielzahl von Einzeluntersuchungen erforderlich ist, die zeitlich synchronisiert werden müssen; so erfordert bspw. eine Mutationssuche in den bekannten Brustkrebsgenen 76 Einzelanalysen von 100 bis 500 Basenpaaren. Ferner ist von Nachteil, dass der Verlust größerer genomischer Abschnitte ("exonische Deletionen") nicht bemerkt werden, da die PCR-Analytik in solchen Bereichen regelmäßig zu fälschlich unauffälligen Befunden führt ("allelic drop out"). Für die Brustkrebsgene müssten diese Mutationsformen, die immerhin 5 bis 10 % aller bekannten Mutationen darstellen, durch aufwändig etablierte Spezialuntersuchungen kontrolliert werden.

Daher besteht trotz dieser gegenwärtig verfügbaren Verfahren bei der Größe der Säugetiergenome (bis zu 3 Gb) der große Nachteil, dass mit einzelnen Experimenten keine sorgfältigen Screenings durchgeführt werden können.

Auch muss berücksichtigt werden, dass bei den konventionellen Verfahren nur exonische Abschnitte der Gene analysiert werden, weil die großen Introns Aufwand und Kosten vervielfachen. Obgleich oftmals klinisch relevante Mutationen in diesen intronischen Abschnitten seltener sind, werden diese jedoch dadurch systematisch übersehen.

Ferner müssen die PCR-Ansätze, die der Mutationssuche zugrunde gelegt werden, zunächst getestet werden, was sehr zeitaufwändig ist und zu einem hohen personellem Aufwand führt. Auch die Durchführung der PCR-Reaktionen verursacht einen hohen Kosten- und Zeitaufwand, da diese mit vergleichbaren Protokollen durchgeführt werden müssen, um reproduzierbare und aussagekräftige Ergebnisse zu erzielen, so dass einerseits diese Reaktionen erst etabliert werden müssen, und andererseits auch nach der Etablierung oft mehrere der Reaktionen für die Analyse eines Individuums erforderlich sind.

Auch die Mutationssuche in unbekannten Krankheitsgenen stellt heute die Wissenschaft vor große Herausforderungen. Hierbei wurde insbesondere die positionelle Klonierungstechnik eingesetzt, mithilfe derer Krankheitsgene identifiziert werden konnten, und die dadurch zu relevanten medizinischen Durchbrüchen geführt hat. Dabei werden beginnend mit der Kopplungsanalyse in großen Familien mit der nachfolgenden Sequenzierung von Kandidatengenen immer wiederkehrend umschriebene Abschnitte des humanen Genoms analysiert.

Die Nachteile bei dieser Methode sind dabei u.a., dass selbst in großen, aufwändig vorbereiteten Studien oft Dutzende von Genen in zahlreichen Patienten jeweils exonweise durchsequenziert werden, wobei es selten gelingt, alle Abschnitte in ausgezeichneter Qualität darzustellen. Ferner sind diese Analysen seriell und damit sehr zeit- und kostenintensiv. Gleichzeitig ist dabei das Risiko, durch Fehlannotation das entscheidende Gen überhaupt nicht zu untersuchen, sehr hoch.

Kandidatenregionen, also Regionen, in denen mit einer bestimmten Wahrscheinlichkeit Mutationen vorliegen, die Krankheiten hervorrufen können, sind regelmäßig etwa 500 kb bis 10 Mb groß. Daher wäre es wünschenswert, ein Verfahren zu entwickeln, mit welchem DNA-Moleküle beliebiger Patienten dieser jeweiligen Kandidatenregion anzureichern und nachfolgend zu analysieren.

Vor diesem Hintergrund ist es Aufgabe der vorliegenden Erfindung, ein robustes und flexibles Anreicherungsverfahren bereitzustellen, mit welchem relativ kleine Abschnitte eines komplexen Genoms (50 kb bis 10 Mb) angereichert werden können.

Erfindungsgemäß wird diese Aufgabe durch ein Verfahren gelöst, welches die folgenden Schritte aufweist:

a) Bereitstellen von doppelsträngigen DNA-Sonden, die Sequenzen aufweisen, welche Sequenzen in der zu untersuchenden komplexen genomischen DNA entsprechen,

b) Immobilisierung der doppelsträngigen DNA-Sonden aus Schritt a) an einen Träger,

c) Denaturieren der an der Träger immobilisierten doppelsträngigen DNA- Sonden zur Herstellung von an den Träger gebundenen einzelsträngigen DNA- Sonden,

d) Fragmentieren und Denaturieren der zu untersuchenden genomischen DNA zur Herstellung von genomischen DNA-Fragmenten,

e) Inkubieren und Hybridisieren von fragmentierter und denaturierter genomischer DNA mit an den Träger immobilisierten einzelsträngigen DNA-Sonden,

f) Entfernen von nicht hybridisierter genomischer DNA, und

g) Eluieren von spezifisch an die DNA-Sonden gebundenen genomischen DNA- Fragmenten von dem Träger.

Die der Erfindung zugrunde liegende Aufgabe wird auf diese Weise vollkommen gelöst.

Mit der vorliegenden Erfindung wird ein Anreicherungsverfahren kleinerer DNA- Fragmente aus zu untersuchender komplexer genomischer DNA bereitgestellt, welches höchst flexibel ist und welches es ermöglicht, DNA-Fragmente von Interesse schnell und gezielt anzureichern, wonach diese nachfolgend zuverlässig analysiert werden können, bspw. mittels einer in vitro-Amplifikation bzw. einer direkten Sequenzierung.

Mit der vorliegenden Erfindung wird ein neues Verfahren zur Probenanreicherung bereitgestellt, mit welchem die Komplexität von genomischer DNA erfolgreich und in reproduzierbarer Weise reduziert werden kann.

Dabei werden also zunächst DNA-Sonden bereitgestellt, die - bspw. über bestimmte Markierungen - an einem Träger immobilisiert werden. Die DNA-Sonden, bzw. die Quelle für die Sonden, werden dabei gezielt im Hinblick auf den zu untersuchenden Genomabschnitt ausgewählt, und können eine zufällige Fragmentlänge von ca. 100 bp bis 3000 bp, insbesondere von zwischen 250 bp und 1000 bp als vorteilhaft erwiesen haben. Nach der Immobilisierung der Sonden werden diese denaturiert, d.h. der Doppelstrang der DNA-Sonden wird in zwei Einzelstränge aufgebrochen. Parallel dazu wird die zu untersuchende genomische DNA (zufällig) fragmentiert, wobei sich Fragmente mit einer Größe von etwa 100 bis 3000 bp, insbesondere von 250 bis 1000 bp als besonders vorteilhaft herausgestellt haben. Diese Angaben zu den Fragmentlängen sind aber lediglich beispielhaft, weshalb auch kleinere oder größere Längen eingesetzt werden können. Nach der Fragmentierung wird die genomische DNA ggf. denaturiert, also in Einzelstränge zerlegt, wobei dies bspw. durch Erhitzen der Fragmente in einem Puffer, vorzugsweise in einem Hybridisierungspuffer, vorgenommen wird, oder aber alkalisch. Andererseits, insbesondere bei Verwendung von sogenannter Library-DNA ist eine Denaturierung nicht immer notwendig, da diese bereits auch in einzelsträngiger Form vorliegt. Dem Fachmann wird klar sein, dass er, je nach Art und Form der zu untersuchenden genomischen DNA, einen Denaturierungsschritt vorsehen muss oder nicht.

Die Fragmentierung der genomischen DNA kann dabei bspw. mittels eines oder mehrerer Restriktionsenzymen, durch Ultraschallbeschallung, durch Nebulisation durchgeführt werden.

Die fragmentierte und ggf. denaturierte genomische DNA wird anschließend zu den auf den Träger immobilisierten Sonden gegeben, bspw. in einer Menge von 0,1-20 μg, wobei sich eine Menge von 10 bis 20 μg als vorteilhaft erwiesen hat, wonach der Ansatz anschließend zur Hybridisierung über einen Zeitraum inkubiert wird. Bei diesem Schritt lagern sich zwei DNA-Einzelstränge, die komplementäre Basensequenzen besitzen, zu Doppelsträngen zusammen.

Die Hybridisierungsbedinungen zwischen Sonde und Ziel (also die Fragmente) sollten dabei derart gewählt werden, dass die spezifische Wechselwirkung zwischen Sonde und Ziel, bzw. die Erkennungs- und Bindungsreaktion ("Hybridisierung") der beiden Moleküle sowohl ausreichend spezifisch als auch hinreichend stabil ist. Dabei werden regelmäßig Bedingungen gewählt, die allgemein gleichmäßig stabil unabhängig von den spezifisch beteiligten Sequenzen sind, wobei Puffer, Inkubationsdauer und Inkubationstemperatur zu berücksichtigende Faktoren sind.

Vorliegend wird bspw. ein Hybridisierungspuffer eingesetzt, der 5x SSC (0,75M NaCl, 75mM NaCitrat, pH 7 0,1% (w/v) N-Laurly-Sarcosin; 0,02% (W/V) SDS; 2% Blocking Reagens (Kasein-Fraktion fettfreier Trockenmilch) enthält. Die Reaktion wird dann bspw. für eine Dauer von 1 bis 80 Stunden, vorzugsweise von 60 Stunden inkubiert.

Nach der Hybridisierungsreaktion kann der Träger gewaschen werden, bspw. über ein bis mehrere, vorzugsweise drei, Waschschritte mit einem Waschpuffer, wodurch alle nicht durch Hybridisierung gebundenen Anteile der Ziel-DNA entfernt werden. Dabei kann jeder beliebige Waschpuffer eingesetzt werden, der keinen Einfluss auf die hybridisierten Produkte hat, mit dem jedoch nicht gebundene genomische DNA- Fragmente abgewaschen werden können.

Im letzten Schritt werden dann die komplementär zu den einzelsträngigen DNA- Sonden gebundenen, ebenfalls einzelsträngigen DNA-Fragmente (die "Targets" bzw. Ziele) der genomischen DNA mobilisiert, bspw. durch alkalische Lyse oder durch Hitze. Unter "Eluieren" ist dabei jede Verfahrensmaßnahme zu verstehen, mit dem die Targets vom Träger - und damit von den an den Träger immobilisierten Sonden - gelöst werden. Es versteht sich, hierdurch gewonnenen Fragmente für eine weitere Analyse ggf. noch in der Lösung neutralisiert werden müssen, insbesondere bei einem Einsatz einer alkalischen Lyse für die Immobilisierung. Dem Fachmann wird klar sein, welche Bedingungen er für welche Analyse wählen muss, um diese durchführen zu können.

Wichtig ist also in dem erfindungsgemäßen Verfahren, dass die doppelsträngigen DNA-Sonden vor Zugabe der Ziel-DNA bereits denaturiert und einzelsträngig gemacht wurden.

In der vorliegenden Erfindung wird dabei unter "genomischer DNA" bzw. "Genom" das gesamte genetische Material eines Organismus verstanden. Dabei ist die DNA (Desoxyribonucleinsäure), die aus dem genetischen Material in dem Chromosom eines bestimmten Organismus abgeleitet ist, die "genomische DNA". Ferner ist unter einer "genomischen Bibliothek" oder "genomische Library-DNA" eine Sammlung von Klonen zu verstehen, die aus einem Satz von zufällig generierten, überlappenden DNA-Fragmenten, die das gesamte Genom eines Organismus repräsentieren, hergestellt wurde. Diese - vorliegend auch "Library-DNA" genannte - genomische DNA liegt oftmals auch bereits in Einzelstrangform vor. In diesem Zusammenhang sind vorliegend unter genomischen "DNA-Fragmenten" kleinere Abschnitte des Gesamtgenoms zu verstehen, die eine Länge von ca. 50 bis ca. 5000 bp aufweisen können, wobei als Vergleich das Genom von bspw. Säugetieren eine Größe von bis zu 3 Gb besitzen kann. Vorliegend kann also, wenn von "genomischer DNA" die Rede ist, nicht nur die aus dem genetischen Material in dem Chromosom eines bestimmten Organismus abgeleitete oder gewonnene gesamte genomische DNA eines Organismus zu verstehen sein, sondern eben auch die in Form einer Bibliothek oder Library vorliegenden DNA-Fragmente, die das gesamte Genom eines Organismus repräsentieren.

Zur Herstellung einer genomischen Bibliothek wird die gesamte zelluläre DNA eines Organismus durch Restriktionsenzyme in Fragmente zerlegt, die danach in einen geeigneten Klonierungsvektor, bspw. Bakteriophagen oder Cosmide, eingefügt und vermehrt werden. Wenn nur ein Teil aller im Genom eines Organismus vorkommenden DNA-Bereiche in einer Genbibliothek enthalten ist, so wird diese als subgenomi- sche Bibliothek bezeichnet.

Unter einer "Sonde" wird vorliegend ein Oligonucleotid verstanden, das in der Lage ist, in einer Basen-spezifischen Art und Weise mit einem komplementären Strang Nucleinsäure eine Bindung einzugehen. Dabei ist unter "Oligonucleotid" jede Nuc-

leinsäure zu verstehen, wie bspw. DNA oder RNA, die darüber hinaus einzel- oder doppelsträngig vorliegen kann. Es versteht sich, dass Oliconucleotide natürlich vorkommend sein können, oder synthetisch sind, normalerweise werden diese jedoch mithilf e synthetischer Mittel hergestellt. Die Länge der Oligonucleotide ist gewöhnlich mindestens 5, 10 oder 20 Basen lang, und kann bis zu 50, 100, 1000 oder weitere Basen lang sein. Dabei können Oligonucleotide auch Peptidnucleinsäuren oder analoge Nucleinsäuren mit einschließen.

Unter einem "Träger" ist vorliegend jedes Substrat zu verstehen, an den Nucleinsäure- sonden angebracht werden können bzw. angebracht sind. Dabei können typischerweise eine Vielzahl von verschiedenen Sonden an die Oberfläche des Trägers an verschiedenen bekannten Stellen gekoppelt sein. Derartige Träger werden dann auch als "Chips" oder "Microarrays" bezeichnet. Die Oberfläche des Trägers bzw. des Substrats kann praktisch in jeder Form oder in einer Vielzahl von Oberflächen hergestellt sein, so dass bspw. Träger in Form von (Mikrotiter-)Platten, eines Blatts, von Fasern oder Glas, etc. eingesetzt werden können, die für eine Anheftung von Sonden geeignet ist.

Das zu untersuchende Genom bzw. die genomische DNA ist dabei nicht auf den Menschen als Quelle beschränkt, sondern erstreckt sich auf einschließlich, jedoch nicht limitierend, allgemein auf Säugetiere, ferner auf Pflanzen, Bakterien oder Zellen, die von jedem der oben Genannten abgeleitet sind. Dabei versteht sich, dass auch auf "Library-DNA" als Ausgangsmaterial für genomische DNA zurückgegriffen werden kann.

Dabei ist bei dem Verfahren in einer Ausführungsform bevorzugt, wenn die DNA- Sonden in Schritt a) durch eine Fragmentierung von größeren DNA-Abschnitten gewonnen werden, wobei ferner bevorzugt ist, wenn hierfür eine DNA eingesetzt wird, die in BAC-Klonen ("bacterial artificial chromosome", künstliches Bakterienchromosom) enthalten ist.

So ist bspw. die frei erhältliche BAC-Klonsammlung 32k (Osoegawa et al., „A Bacterial Artificial Chromosome Library for Sequencing the Complete Human Genome", Genome Research 2001; 11:483-496) geeignet, bei der 150.000 bis 250.000 zusammenhängende Basen des humanen Genoms jeweils in einem künstlichen Bakterienchromosom enthalten sind, welche jederzeit hochrein durch Bakterien hergestellt werden können.

Es versteht sich jedoch, dass jede andere Quelle von Genomen geeignet ist, und das vorliegende Verfahren nicht auf den Einsatz von BACs beschränkt ist.

Auch bei dieser Ausführungsform des Verfahrens kann die Fragmentierung mittels eines oder mehrerer Restriktionsenzyme, durch Ultraschall, durch Nebulization (Druckluft oder Stickstoff) in kleinere Abschnitte aufgeteilt werden.

In einer Weiterbildung des erfindungsgemäßen Verfahrens ist bevorzugt, wenn die Sonden in Schritt b) über eine Markierung an den Träger immobilisiert werden. Dabei wird vorliegend unter einer Markierung jede chemische, biologische oder physikalische Modifizierung der Sonden verstanden, die eine Anbindung der Sonden an den Träger und damit deren Immobilisierung daran ermöglichen.

Dabei ist bevorzugt, wenn zur Markierung der doppelsträngigen DNA-Sonden ein Marker eingesetzt wird, der eine spezifische oder unspezifische Affinität für den Träger besitzt.

Wenn der an die Sonden anzubringende Marker eine unspezifische Affinität für den Träger besitzt, dann binden die Sonden - über den Marker - beliebig an den Träger, d.h., dass es nicht auf die Beschaffenheit der Oberfläche des Trägers ankommt, an welche die Sonden gebunden werden sollen. Andererseits, bei einer spezifischen Affinität des Markers für den Träger, binden die Sonden ganz spezifisch an die - ggf. entsprechend bearbeitete - Oberfläche des Trägers und ggf. an spezifische Stellen auf dieser.

Dabei ist bei einer spezifischen Affinität des Markers bevorzugt, wenn der Marker Biotin-dUTP ist. Dieser kann dann, in einer bevorzugten Weiterbildung des Verfahrens, terminal an der Sonde angebracht sein, wobei wiederum bevorzugt ist, wenn für die Markierung eine terminale Transferase eingesetzt wird. Die terminale Transferase ist ein Enzym, das die matrizenunabhängige Anheftung von Desoxynucleotiden (2'- Desoxyribonucleosidmonophosphate) an die endständigen 3'-OH-Gruppen von DNA-Molekülen vermittelt. Daher kann dieses Enzym bspw. Biotin-dUTP an die DNA-Sonden anheften.

Gemäß einer anderen bevorzugten Ausführungsform weist der Träger eine Beschich- tung mit einer spezifischen Affinität für den Marker auf, wobei dann, wenn der Marker Biotin-dUTP ist, bevorzugt ist, wenn die Immobilisierung der markierten doppelsträngigen DNA-Sonden in Schritt c) über Streptavidin erfolgt, mit welchem der Träger beschichtet ist. Streptavidin, ein aus einem Bakterium isoliertes Protein, bindet Biotin an seine vier Untereinheiten. Ganz allgemein kann aber jede Modifizierung eingesetzt werden, welche durch hochaffine Wechselwirkungen zwischen den Partnern eines spezifischen Bindepaares, wie z. B. Biotin/Streptavidin oder Avidin, Hapten/Anti- Hapten-Antikörper, Zucker/Lectin etc., vermittelt werden.

Bei dem Verfahren ist ferner insgesamt bevorzugt, wenn der Träger ausgewählt ist aus der Gruppe bestehend aus Mikrotiterplatten, Zentrifugationssäulen, magnetische Beads, paramagnetische Beads. Es versteht sich dabei, dass dabei jedes Substrat als Träger dienen kann, das für die vorliegenden Zwecke entsprechend modifiziert und eingesetzt werden kann. Im Stand der Technik ist eine Vielzahl von Trägersubstraten offenbart, die für das vorliegende Verfahren geeignet und dem Fachmann hinreichend bekannt sind.

Insbesondere ist in einer alternativen Ausführungsform bevorzugt, wenn Schritt d) vor oder parallel zu einem der vorherigen Schritte durchgeführt wird. Zur Beschleunigung des Verfahrens ist dabei verständlicherweise bevorzugt, wenn der Schritt des Fragmentierens und Denaturierens der genomischen DNA parallel zu der Fragmentierung und ggf. Markierung und Immobilisierung der Sonden durchgeführt wird. Dies

hängt aber auch jeweils von den einzusetzenden Sonden/dem genomischen DNA- Material ab, und dem Fachmann wird anhand dieser klar sein, welche Reihenfolge jeweils angewandt werden sollte.

Bei dem erfindungsgemäßen Verfahren ist ferner bevorzugt, wenn die Denaturierung der DNA-Sonden in Schritt c) und/oder der genomischen DNA in Schritt d) durch Hitze, Alkali oder Säure und Wasserstoffbrücken lösende Agenzien, wie z. B. Harnstoff, Formamid, durchgeführt wird. Es versteht sich, dass der Fachmann denaturierende Agenzien auch im Gemisch zur Anwendung bringen kann.

In einer Ausführungsform des erfindungsgemäßen Verfahrens ist ferner vorgesehen, dass die Elution der genomischen DNA-Fragmente durch Verfahren vorgenommen wird, die ausgewählt sind aus der Gruppe bestehend Hitzeeinwirkung, Säure- oder Alkalibehandlung und dem Einsatz aus Wasserstoffbrücken lösende Agenzien, wie z. B. Harnstoff, Formamid.

Die Erfindung betrifft ferner ein Verfahren zur Analyse von genomischer DNA, das durch die Schritte der Anreichung durch das erfindungsgemäße Verfahren sowie des Analysierens der eluierten genomischen DNA-Fragmente gekennzeichnet ist.

Dabei ist bevorzugt, wenn das Analysieren vorgenommen wird durch eines oder mehrere der Verfahren, die ausgewählt sind aus der Gruppe bestehend aus Polymera- se-Ketten-Reaktion, Sequenzierung, insbesondere direkte Sequenzierung, und klonale Amplifikation auf Glasoberflächen.

Die PCR, mit der spezifische DNA-Fragmente in vitro amplifiziert werden, ist eine überaus empfindlichen Technik, mit der sich auch aus sehr geringen Mengen heterogener DNA innerhalb kurzer Zeit ein oder mehrere bestimmte doppelsträngige DNA- Fragmente millionenfach anreichern lassen. Dabei kann bspw. auch die sogenannte emPCR (emulsion based PCR) eingesetzt werden, bei der Microbeads, an die ein- zelsträngige DNA-Fragmente gekoppelt sind, mit den Amplifikationsreagenzien in

einem öl-Wasser-Gemisch emulgiert werden (siehe bspw. Margulies et al. (2005) Nature ; 437:376-380).

Die durch Anreicherung gewonnene genomische DNA kann bspw. auch mit sogenannten Next-generation Sequenzierautomaten sequenziert werden, bei welchen anstelle einer Klonierung in bakterielle oder virale Systeme zur Vermehrung einzelner Sequenzen eine unmittelbare klonale Amplifikation von Einzelmolekülen erfolgt. Dabei wird die genomische DNA bereits nach der Fragementierung in einem weiteren Schritt mit PCR- bzw. Sequenzieradaptern versehen (Herstellung der so genannten Library). Nach der Anreicherung gemäß dem erfindungsgemäßen Verfahren kann die gewonnene Library-DNA dann direkt klonal amplifiziert werden (zum Beispiel Microbead-gekoppelte emPCR (Margulies et al. (2005) Nature; 437:376-380) für das 454-Verfahren (siehe www.genome-sequencing.com: und Roche Applied Science/454) oder klonale Amplifikation auf einer Glasoberfläche nach dem Solexa IG Verfahren (siehe www.illumina.com)) und online in den jeweiligen Sequenzierautomaten sequenziert werden. Es versteht sich, dass auch andere Verfahren zur Ermittlung von Nukleinsäure-Sequenzen im Megabasen-Durchsatz grundsätzlich auf dieses Anreicherungsverfahren zurückgreifen können, um eine überfordernde Komplexität des Ausgangsmaterials zu reduzieren.

Insgesamt ist bevorzugt, wenn das Verfahren zur Untersuchung von Mutationen in genomischer DNA eingesetzt wird, wobei in einer Ausführungsform bevorzugt ist, wenn das Verfahren zur Untersuchung von Mutationen bei Genen eingesetzt wird, die mit bestimmten Krankheiten assoziiert sind, und es bei einer anderen Ausführungsform bevorzugt ist, wenn das Verfahren zur Identifizierung von Genen eingesetzt wird, die mit bestimmten Krankheiten assoziiert sind.

Bei diesen Einsätzen werden demnach einerseits Mutationen in Genen untersucht, von denen bekannt ist, dass sie mit bestimmten Krankheiten bzw. Symptomen assoziiert sind. So wurde bspw. in jüngerer Zeit gezeigt, dass eine einzige Genmutation die Ursache bei einem von 25 Parkinson-Fällen weltweit ist. Die Studien lassen

vermuten, dass die Mutation in einem erst kürzlich entdeckten Gen namens LRRK2 etwa fünf Prozent der vererbten Parkinson-Fälle und etwa zwei Prozent der sporadischen Fälle verursacht.

Andererseits können mit dem erfindungsgemäßen Verfahren auch bisher unbekannte Gene identifiziert werden, die mit Krankheiten assoziiert sind. So wurden kürzlich Riskiogene für Morbus Crohn und Typ-2-Diabetes identifiziert. Die erfindungsgemäßen Verfahren bieten ein hervorragendes Werkzeug, um derartige Analysen zu verbessern, sowohl hinsichtlich der Kosten und des (Zeit)-Aufwands, als auch in der Zuverlässigkeit und Flexibilität.

Es versteht sich, dass die vorstehend genannten und die nachstehend noch zu erläuternden Merkmale nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der vorliegenden Erfindung zu verlassen.

Die Erfindung soll nun anhand eines Beispiels und der beigefügten Figur dargestellt werden werden, ohne sie aber auf dieses Beispiel zu beschränken. Es zeigt:

Fig. 1 Genomische Anreicherung humaner DNA-Abschnitte, die komplementär zum Chromosom-5-BAC (RPH 795P7) sind.

Ausführungsbeispiel

Für die Durchführung des erfindungegemäßen Verfahrens wurde eine fragmentierte und biotinmarkierte BAC-Sonde (RP11795P7; Chromosom 5) eingesetzt, mit einer Konzentration von 150 ng/μl. Hiervon wurden 1,0 μl, 0,5 μl bzw. 1,0 μl einer 1:10 Verdünnung eingesetzt. Die durchschnittliche Länge der Fragmente betrug ca. < 400 bp (Basenpaare). Die Fragementierung erfolgte durch Nebulisierung der BAC-DNA auf 200 bis 800 bp Fragmente. Anschließend erfolgte eine Aufreinigung dieser Fragmente über eine MinElute ® Säule (Quiagen, Hilden, Deutschland). Die Fragmente wurden

ferner durch eine terminale Transferase mit Biotin- 16-ddUTP (jeweils Roche Di- agnostics, Mannheim, Deutschland) mit Biotin markiert.

Ferner wurde humane genomische DNA durch Nebulisierung auf ca. 200 bp bis 800 bp fragmentiert. Auch diese DNA-Fragmente wurden über eine MinElute ® Säule gereinigt und kleine Fragmente (<250bp) durch AMPure ® -Beads (Agencoυrt ® Bioscien- ce, Beverly MA, USA) entfernt. Nach der Eluierung der DNA von den Beads erfolgte ein „End Polishing" der Fragmente und eine Phosphorylierung durch T4 DNA Polymerase und T4 Polynukleotidkinase (PNK) und dATP (jeweils New England Biolabs GmbH, Frankfurt, Deutschland), sowie im Anschluss eine weitere Reinigung über eine MinElute ® Säule. Die Fragmente wurden mit einer Konzentration c von 580 ng/μl eingesetzt, wobei 4,0 μl (entsprach ca. 2 μg), 2,0 μl (entsprach ca. 1 μg) bzw. 1,0 μl (entsprach ca. 0,5 μg) verwendet wurden; die Länge der Fragmente betrug durchschnittlich ca. 600 bp; gepoolt F#17. Wenn die Fragmente nach der Anreicherung bspw. für eine Amplifizierung eingesetzt werden sollten, wurden an die „polis- hed" DNA-Fragmente spezifische Adapter (Einzelstrang-Adapter oder Doppelstrang- Adapter) ligiert.

Sämtliche Ansätze wurden als dreifach-Ansätze angesetzt. Eingesetzt wurden ferner Streptavidin beschichtete Mikrotiterplatten von Thermo Scientific (Waltham, USA, Katalog Nummer 95 029 362). Die biotinmarkierte BAC-Sonde (150ng; ca. 400 bp) wurde mit 50 μl Bindepuffer (10 mM Tris-HCl, 2M NaCl, ImM EDTA, 0,1 % Tween 20, pH 7,6) in die Wells der Streptavidin-beschichteten Platte pipettiert. Anschließend wurden die Wells mit Klebefolie verschlossen, und 1 Stunde bei Raumtemperatur im Plattenschüttelthermoblock mit Geschwindigkeit 2 inkubiert. Anschließend wurde die Platte kurz anzentrifugiert und der Puffer abgenommen; es folgte ein Waschschritt mit 0,5 M NaOH sowie eine 10-minütige Inkubation mit 100 μl 0,5M NaOH zur Denaturierung der immobilisierten Sonden.

Nach der Inkubation wurde das NaOH abgenommen und die Wells mit jeweils 300 μl PBS und 0,05 % Tween 20 gewaschen (jeweils vorsichtig 2 mal mit der Pipette mi-

sehen). Auch dieser Puffer wurde danach abgenommen und die Platte kurz umgekehrt auf Papier trockenen gelassen.

Parallel wurden 50 μl Hybridisierungspuffer (5x SSC (0,75M NaCl, 75mM NaCitrat, pH 7 0,1% (w/v) N-Laurly-Sarcosin; 0,02% (W/V) SDS; 2% Blocking Reagens (Kasein- Fraktion fettfreier Trockenmilch)) mit der fragmentierten genomischen DNA (ca. 20 μg) versetzt, und 5 Minuten durch Aufkochen bei 95°C denaturiert. Je Well wurden 100 μl auf Hybridisierungstemperatur vorgemärmter Hybridisierungspuffer vorgelegt und die denaturierte DNA hinzu pipettiert; anschließend wurden die Wells mit Klebefolie verschlossen.

Die Platte wurde ca. 60 Stunden bei ca. 55°C auf dem Thermoblock mit Geschwindigkeit 2 inkubiert, um in den Wells eine Temperatur von ca. 50 0 C zu erzielen, bei der die Fragmente an die Sonden hybridisieren. Die Platte war dabei fest verschlossen, um eine Austrocknung zu vermeiden. Anschließend wurde die Platte kurz anzentrifugiert. Die Wells wurden mit ja 300 μl PBS + 0,05% Tween 20 gewaschen (und der Inhalt der Wells jeweils 2-mal vorsichtig mit der Pipette gemischt); der Puffer wurde dann abgenommen und beim letzten Waschgang kurz umgekehrt auf Papier trocknen gelassen.

Zur Elution der spezifisch angereicherten DNA wurden 50 μl 50 mM NaOH in die Wells pipettiert und 5 min. bei Raumtemperatur inkubiert, um die Hybridisie- rungskomplexe wieder zu dentaurieren. Danach wurde das NaOH abgenommen und die Lösung in Eppendorf-Cups mit vorgelegten 8 μl IM Tris-HCl, pH 7,0 pipettiert und neutralisiert. Aus diesem Ansatz wurden jeweils 4 μl in die Kontroll-PCR (zur Erfolgskontrolle des Verfahrens) eingesetzt.

Der PCR-Nachweis wurde mit Primern für die Marker D5S818(9791/9792) und D13S317(9793/9794) in einer Multiplex-Reaktion, die anschließende Fragmentanalyse wird auf dem CEQ8000 (Beckman Coulter) durchgeführt.

Die Ergebnisse sind in Fig. 1 dargestellt. Es ist zu erkennen, dass der zur Anreicherung verwendete BAC-Klon (Chromosom 5) das D5S818 Allel "13" zeigte. Die eingesetzte, heterozygote humane DNA zeigte die D5S818-Merkmale "11" und "12" (Chroma- togram D). Alle genomischen Anreicherungen waren positiv für die erwarteten Merkmale "11" und "12" sowie für ein stärker oder schwächer ausgeprägtes Merkmal "13" (Reste von BAC-DNA im Eluat; Chromatogram A-C). Wichtig für die spezifische Anreicherung ist das Fehlen von D13S317-Allelen im Eluat (die D13S317-Allele "12" und "13" fehlen in den Amplifikationen nach Anreicherung (Chromatogram A-C). Das bedeutet, dass im Eluat nach genomischer Anreicherung nur noch humane DNA- Abschnitte komplementär zum Chromosom-5- BAC vorhanden sind.

Die oben dargestellten Beispiele zeigen, dass die genomische Anreicherung mithilf e des erfindungsgemäßen Verfahrens in drei parallelen Ansätzen erfolgreich war:

Alle genomischen Anreicherungen waren positiv für die erwarteten Merkmale "11" und "12" (siehe Fig. 1, Chromatogramm A bis D), sowie für ein stärker oder schwächer ausgeprägtes Merkmal "13", wobei Letzteres auf Reste von BAC-DNA im Eluat zurückzuführen ist; siehe Chromatogramm A bis C. Wichtig für die spezifische Anreicherung ist das Fehlen von D13S317-Allelen im Eluat (die D13S317-Allele 12 und 13 fehlen in den Amplifikationen nach Anreicherung) (Chromatogramm A bis C), was bedeutet, dass im Eluat nach genomischer Anreicherung nur noch humane DNA-Abschnitte vorhanden sind, die komplementär zum Chromosom-5-BAC sind.

Mittels des erfindungsgemäßen Verfahrens konnte demnach eine 10.000-fache Anreicherung der spezifischen DNA-Abschnitte unter Abtrennung der unspezifischen DNA erreicht werden. Eine hohe Anreicherungseffizienz bietet den Vorteil, dass die angereicherte DNA bspw. in eine Emulsion-PCR (em-PCR) und in eine anschließende GS-FLX-Sequenzierung eingesetzt werden kann. Vorteilhafterweise kann bei der erfindungsgemäßen Verfahren also auf eine PCR als Anreicherungsmethode verzichtet werden, wobei dadurch die bei einer PCR häufig auftretenden unkontrollierten Basenaustausche vermieden werden, was zu einem verfälschten Ergebnis führen würde.