Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR DETERMINING THE CELL COUNT OF EUKARYOTIC CELLS
Document Type and Number:
WIPO Patent Application WO/2018/202669
Kind Code:
A1
Abstract:
The invention relates to a method and a nucleic acid molecule for determining the cell count of eukaryotic cells in a sample. The method according to the invention is based on analyzing DNA methylation (DNAm), wherein genomic regions which are fundamentally methylated in the cells to be examined are addressed. In this connection, the method according to the invention substantially comprises the identification of a genome region which is reliably methylated in the cell types to be measured and the use of an unmethylated reference nucleic acid which comprises said region. When different amounts of the reference nucleic acid are used, the degrees of methylation continuously decrease with rising concentration of the reference nucleic acid. The accuracy of the method according to the invention is particularly high when the degrees of methylation are between 20% and 80%, i.e., when the number of reference nucleotide sequences approximately corresponds to the number of genomic nucleic acid molecules.

Inventors:
WAGNER WOLFGANG (DE)
BOZIC TANJA (DE)
Application Number:
PCT/EP2018/061124
Publication Date:
November 08, 2018
Filing Date:
May 02, 2018
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
RWTH AACHEN (DE)
International Classes:
C12Q1/6881
Domestic Patent References:
WO2014170497A22014-10-23
Other References:
JONATHAN A HEISS ET AL: "Training a model for estimating leukocyte composition using whole-blood DNA methylation and cell counts as reference", EPIGENOMICS, vol. 9, no. 1, 1 January 2017 (2017-01-01), United Kingdom, pages 13 - 20, XP055486089, ISSN: 1750-1911, DOI: 10.2217/epi-2016-0091
WIECZOREK GEORG ET AL: "Quantitative DNA methylation analysis of FOXP3 as a new method for counting regulatory T cells in peripheral blood and solid tissue", CANCER RESEARCH, AMERICAN ASSOCIATION FOR CANCER RESEARCH, US, vol. 69, no. 2, 15 January 2009 (2009-01-15), pages 599 - 608, XP002583651, ISSN: 0008-5472, DOI: 10.1158/0008-5472.CAN-08-2361
EUGENE ANDRES HOUSEMAN ET AL: "DNA methylation arrays as surrogate measures of cell mixture distribution", BMC BIOINFORMATICS, BIOMED CENTRAL, LONDON, GB, vol. 13, no. 1, 8 May 2012 (2012-05-08), pages 86, XP021127800, ISSN: 1471-2105, DOI: 10.1186/1471-2105-13-86
M. BUTTARELLO; M. PLEBANI: "Automated blood cell counts: state of the art", AM J CLIN PATHOL, vol. 130, 2008, pages 104 - 116, XP002688307, DOI: doi:10.1309/EK3C7CTDKNVPXVTN
L. E. REINIUS; N. ACEVEDO; M. JOERINK; G. PERSHAGEN; S. E. DAHLEN; D. GRECO; C. SODERHALL; A. SCHEYNIUS; J. KERE: "Differential DNA methylation in purified human blood cells: implications for cell lineage and studies on disease susceptibility", PLOS ONE, vol. 7, 2012, pages e41361
M. ZILBAUER; T. F. RAYNER; C. CLARK; A. J. COFFEY; C. J. JOYCE; P. PALTA; A. PALOTIE; P. A. LYONS; K. G. SMITH: "Genome-wide methylation analyses of primary human leukocyte subsets identifies functionally important cell-typespecific hypomethylated regions", BLOOD, vol. 122, 2013, pages e52 - 60, XP055368097, DOI: doi:10.1182/blood-2013-05-503201
Attorney, Agent or Firm:
REMUS, Alvaro (DE)
Download PDF:
Claims:
Patentansprüche

1 . Verfahren zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe, welches umfasst:

Identifizieren mindestens einer spezifischen Region im Genom mindestens einer Zelle oder eines Zelltyps, wobei die spezifische Region mindestens ein CpG-Dinukleotid umfasst, das in der Zelle oder dem Zelltyp grundsätzlich methyliert ist;

Bereitstellen mindestens eines nicht-methylierten Referenz- Nukleinsäuremoleküls, das mindestens eine Referenz-Nukleotidsequenz umfasst, die der spezifischen Region entspricht und das mindestens ein CpG-Dinukleotid umfasst;

Einbringen einer vorbestimmten Menge des Referenz-Nukleinsäuremoleküls in die Probe;

Anschließend Ermitteln des Methylierungsgrades des CpG-Dinukleotids in der Probe; und

Berechnen der Anzahl der Zellen basierend auf dem ermittelten Methylierungsgrad, wobei der Methylierungsgrad ein Verhältnis der Anzahl der Referenz-Nukleotidsequenzen zu der Anzahl der Zellen repräsentiert.

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass zwei oder mehr unterschiedliche Referenz-Nukleinsäuremoleküle, die unterschiedliche spezifische Regionen umfassen, in die Probe eingebracht werden.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die spezifische Region mindestens eine Nukleotidsequenz innerhalb einer Region von ungefähr 50.000, 20.000, 10.000, 5.000, 4.000, 3.000, 2.000, 1 .000, 500 oder 100 Nukleotiden stromaufwärts und/oder stromabwärts von einer der Nukleotidsequenzen gemäß SEQ ID NO: 1 bis SEQ ID NO: 3 umfasst.

4. Verfahren zur Herstellung eines Referenz-Nukleinsäuremoleküls zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe, welches umfasst:

Identifizieren mindestens einer spezifischen Region im Genom mindestens einer Zelle oder eines Zelltyps, wobei die spezifische Region mindestens ein CpG-Dinukleotid umfasst, das in der Zelle oder dem Zelltyp grundsätzlich methyliert ist;

Isolieren oder Synthetisieren mindestens einer Referenz-Nukleotidsequenz, welche die spezifische Region und das mindestens eine CpG-Dinukleotid umfasst;

Vermehren der Referenz-Nukleotidsequenz außerhalb der Zelle oder des Zelltyps zur Erlangung eines nicht-methylierten Nukleinsäuremoleküls.

5. Nukleinsäuremolekül, das in dem Verfahren nach Anspruch 4 hergestellt wurde.

6. Nukleinsäuremolekül, das mindestens eine Nukleotidsequenz umfasst, welche mindestens einer spezifischen Region aus dem Genom mindestens einer eukaryotischen Zelle oder eines eukaryotischen Zelltyps entspricht, wobei die spezifische Region mindestens ein CpG-Dinukleotid umfasst, das in der Zelle oder dem Zelltyp grundsätzlich methyliert ist, dadurch gekennzeichnet, dass sich das CpG-Dinukleotid in einem nicht-methylierten Zustand befindet.

7. Verwendung eines Nukleinsäuremoleküls zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe mittels des Verfahrens nach einem der Ansprüche 1 bis 3, wobei das Nukleinsäuremolekül mindestens eine

Nukleotidsequenz umfasst, die ausgewählt ist aus der Gruppe bestehend aus:

a) mindestens einer Nukleotidsequenz, welche mindestens eine der

Nukleotidsequenzen gemäß SEQ ID NO: 1 bis SEQ ID NO: 3 umfasst; b) mindestens einer Nukleotidsequenz, die sich von einer der

Nukleotidsequenzen gemäß SEQ ID NO: 1 bis SEQ ID NO: 3 mit

Ausnahme des CpG-Dinukleotids durch den Austausch von höchstens 10%, vorzugsweise höchstens 5%, der Nukleotide unterscheidet und c) mindestens einer Nukleotidsequenz, die dem zu der Nukleotidsequenz gemäß a) oder b) komplementären Strang entspricht.

8. Künstliches Nukleinsäuremolekül, das mindestens eine Nukleotidsequenz umfasst, die ausgewählt ist aus der Gruppe bestehend aus:

a) mindestens einer Nukleotidsequenz, die mindestens eine Sequenz der Nukleotidsequenzen SEQ ID NO: 4 bis SEQ ID NO: 14 umfasst, b) mindestens einer Nukleotidsequenz, die zu mindestens 90%,

vorzugsweise mindestens 95%, mit der Nukleotidsequenz gemäß a) identisch ist und

c) mindestens einer Nukleotidsequenz, die dem zu einer der

Nukleotidsequenzen gemäß a) oder b) komplementären Strang entspricht.

9. Kit, welches das Nukleinsäuremolekül nach Anspruch 5 oder 6 und/oder eine Kombination von mindestens zwei unterschiedlichen künstlichen Nukleinsäuremolekülen nach Anspruch 8 umfasst.

Verwendung des Nukleinsäuremoleküls nach Anspruch 5 oder 6 und/oder des künstlichen Nukleinsäuremoleküls nach Anspruch 8 und/oder des Kits nach Anspruch 9 zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe.

Description:
Verfahren zur Bestimmung der Zellzahl von eukaryotischen Zellen

Die Erfindung betrifft ein Verfahren zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe. Die Erfindung betrifft ferner ein Nukleinsäuremolekül, das mindestens eine Nukleotidsequenz umfasst, welche mindestens einer spezifischen Region aus dem Genom mindestens einer eukaryotischen Zelle oder eines eukaryotischen Zelltyps entspricht, wobei die spezifische Region mindestens ein CpG-Dinukleotid umfasst.

Für viele Anwendungen in der klinischen Diagnostik, beispielsweise bei der Erstellung von Blutbildern, ist die relative Quantifizierung von Zelltypen von besonderer Bedeutung. Die Bestimmung der zellulären Zusammensetzung von Blutproben und hierbei insbesondere das Differentialblutbild, d. h. die Bestimmung der Zusammensetzung der weißen Blutkörperchen (Leukozyten) im Blut, ist eine der häufigsten diagnostischen Testverfahren und somit eine Routineuntersuchung in der medizinischen Labordiagnostik. Ein Differentialblutbild kann beispielsweise durch mikroskopische Untersuchung der Blutprobe und manuelles Zählen der Zellen erstellt werden. In der Routinediagnostik werden Blutproben aber in der Regel mit Hilfe von automatischen Zellzählern mittels durchflusszytometrischer Verfahren (z.B. Coulter Counter) analysiert (1 ). Alternative Messungen beruhen auf Zählkammern, automatisierten optischen Zellzählungen, oder Messungen des elektrischen Widerstands (CASY). Die Bestimmung der Zellzahl ist bei vielen diagnostischen und zellbiologischen Verfahren notwendig. Hierfür stehen zahlreiche Methoden zur Verfügung, die insbesondere auf Bildgebung oder Durchfluss-Zytometrie (Impedanz- oder Streulichtmethoden) beruhen (1 ). Diese automatischen Zellzähler erfassen beispielsweise die elektrische Impedanz, die optischen Auswirkungen der Lichtstreuung oder die Intensität von Fluoreszenz-Signalen.

Neben Verfahren, die eine Quantifizierung von zellulärem Material auf Basis der Zählung einzelner Zellen ermöglichen, werden vor allem auch unterschiedliche durchflusszytometrische Verfahren eingesetzt, die eine Quantifizierung von Zellen beispielsweise mit Hilfe von Referenzkügelchen in bestimmter Konzentration erlauben. Diese Methoden haben jedoch den Nachteil, dass zuvor eine arbeitsintensive Aufarbeitung der zu messenden Probe durchgeführt werden muss, die beispielsweise aufwändige Schritte wie Zentrifugieren, Filtrieren und/oder Sedimentieren umfassen kann.

Viele optische Durchfluss-Zytometer nutzen das Prinzip der Fluoreszenz- oder Streulichtmessung. Beide Messmethoden erfordern zur Zählung einzelner Zellen aber den Einsatz speziell vorbereiteter und gereinigter Blutproben. Beispielsweise ist es zur Vorbereitung einer Blutprobe erforderlich, eine Hämolyse der Erythrozyten und eine spezifische Markierung der Zellen vorzunehmen. Die Probenvorbereitung ist folglich sehr zeitaufwendig, so dass mittels optischer Durchfluss-Zytometrie weder schnelle noch kostengünstige Zellzahlbestimmungen in einer komplexen Probe durchgeführt werden können.

Die oben genannten Verfahren der Zellzahlbestimmung benötigen relativ frisches Material, bei dem die Zellen lebend und möglichst vereinzelt vorliegen. In der Regel benötigen diese Verfahren aufgrund der Schlauchsysteme ferner ein bestimmtes Mindestvolumen. Außerdem kann es im Laufe des Probenversands zu einem Großlabor oder durch verzögerte Messungen zu einem vermehrten Zellsterben kommen, so dass die Zellzahl entsprechend zu niedrig geschätzt würde. Die Autolyse beginnt bereits nach wenigen Stunden und betrifft zunächst insbesondere die Granulozyten. Ein Versand von Blutproben im gefrorenen Zustand ist bisher nicht möglich, da die Zellen dabei lysiert werden. Zudem bestehen bei allen Messverfahren Messungenauigkeiten, die eine Validierung mit einem anderen Verfahren unter Umständen sinnvoll machen. Bei sehr kleinen Zellmengen (z.B. Liquordiagnostik) oder bei sehr kleinen Probenmengen ist die Analyse nicht mit allen Verfahren möglich. Es ist Aufgabe der vorliegenden Erfindung, ein Verfahren zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe bereitzustellen, das die oben genannten Nachteile vermeidet, eine schnelle und zuverlässige Quantifizierung der Zellen gewährleistet und auch eine Analyse älterer Proben ermöglicht. Erfindungsgemäß wird die Aufgabe durch ein Verfahren zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe gelöst, welches umfasst:

Identifizieren mindestens einer spezifischen Region im Genom mindestens einer Zelle oder eines Zelltyps, wobei die spezifische Region mindestens ein CpG-Dinukleotid umfasst, das in der Zelle oder dem Zelltyp grundsätzlich methyliert ist;

Bereitstellen mindestens eines nicht-methylierten Referenz- Nukleinsäuremoleküls, das mindestens eine Referenz-Nukleotidsequenz umfasst, die der spezifischen Region entspricht und das mindestens eine CpG-Dinukleotid umfasst;

Einbringen einer vorbestimmten Menge des Referenz-Nukleinsäuremoleküls in die Probe;

Anschließend Ermitteln des Methylierungsgrades des CpG-Dinukleotids in der Probe; und

- Berechnen der Anzahl der Zellen basierend auf dem ermittelten Methylierungsgrad, wobei der Methyl ierungsgrad ein Verhältnis der Anzahl der Referenz-Nukleotidsequenzen zu der Anzahl der Zellen repräsentiert.

Epigenetische Verfahren zur Bestimmung absoluter Zellzahlen standen bislang nicht zur Verfügung. Bisher ist auch kein Verfahren bekannt, bei der DNA- Methylierung zur Zellzahlbestimmung eingesetzt wird. Das erfindungsgemäße Verfahren beruht in vorteilhafter Weise auf der Analyse der DNA-Methylierung (DNAm), wobei genomische Bereiche adressiert werden, die in den zu untersuchenden Zellen (z.B. Blutzellen) grundsätzlich methyliert sind. Schon vor der DNA-Isolation werden diese Zellen mit entsprechender unmethylierter Referenz-DNA in bekannter Konzentration versetzt (entweder durch Zugabe der Referenzmoleküle zur Probe oder umgekehrt durch Zugabe der Probe zu einer vorgegebenen Menge der Referenzmoleküle). Nach der DNA-Isolation lässt sich das Verhältnis von methylierter und nicht-methylierter DNA sehr genau bestimmen. Das erfindungsgemäße Verfahren basiert also im Wesentlichen auf der Identifikation eines Genombereichs, der in den zu messenden Zelltypen zuverlässig methyliert ist und einer unmethylierten Referenz-DNA, die diesen Bereich umfasst. Aus der Anwendung des erfindungsgemäßen Verfahrens ergeben sich die folgenden Vorteile: - Die Proben können vor der Analyse tiefgefroren werden;

- Insbesondere in Kombination mit epigenetischen Blutbildanalysen ermöglicht es eine quantitative Auswertung;

- Sehr kleine Blutmengen reichen aus (theoretisch < 10 μΙ);

- Einfache Analyse;

- Isolierte DNA kann zu Analysezwecken sehr leicht versendet werden.

Erfindungsgemäß erfolgt die Quantifizierung der Zellen mittels der Bestimmung des Methylierungsgrades spezifischer genomischer Regionen in vorteilhafter Weise unter Zuhilfenahme eines nicht-methylierten Referenz- Nukleinsäuremoleküls, das in bekannter Konzentration zugegeben wird. Die quantitative Bestimmung der Zellzahlen kann somit durch die Zugabe einer vorbestimmten Menge eines nicht-methylierten Referenz-Nukleinsäuremoleküls zu einer Probe durchgeführt werden, sofern die spezifische Region im Genom der Zellen, die der Referenz-Nukleotidsequenz des Referenzmoleküls entspricht, in den zu zählenden Zellen grundsätzlich methyliert ist, d. h. in diesen Zellen generell einen hohen Methylierungsgrad aufweist. Durch den Einsatz einer nicht- methylierten Standardsequenz ist es folglich in vorteilhafter Weise möglich, absolute Zellzahlen basierend auf dem Methylierungsgrad der DNA (DNAm) schnell und zuverlässig zu bestimmen. Die Vorteile des erfindungsgemäßen Verfahrens basieren also auf epigenetischen Eigenschaften der DNA und sind somit auch retrospektiv für bereits isolierte Proben (z. B. ältere Blutproben) geeignet. DNA ist relativ stabil, d. h. die Proben können für die Untersuchungen einfach versendet und im Hoch-Durchsatzverfahren gemessen werden. Das ermöglicht auf zuverlässige und kostengünstige Weise die quantitative Bestimmung der zellulären Zusammensetzung von Proben, beispielsweise humanen Blutproben.

DNA-Methyl ierung (DNAm) ist eine epigenetische Modifikation, bei der Methylgruppen jeweils an das 5. Kohlenstoffatom von Cytosinen angehängt werden, hauptsächlich wenn diese in Form von Cytosin-Guanin- (CpG) Dinukleotiden vorliegen. Die Analyse der DNA-Methyl ierung hat dabei einige Vorteile im Vergleich zu immun-phänotypischen Verfahren: i) DNAm ist unmittelbar mit den Vorgängen bei der Differenzierung der Zellen verknüpft; ii) DNAm erleichtert die absolute Quantifizierung mit einer Auflösung im Bereich einzelner Basen (im Bereich von 0 bis 100% DNAm); iii) die meisten Zellen enthalten nur zwei Kopien der DNA-Moleküle, so dass die Ergebnisse zur Bestimmung der Zellzahlen bzw. der Zellzusammensetzung in der Probe auf einfache Weise extrapoliert werden können (wogegen RNA in kleinen Subpopulationen hoch überexprimiert sein kann); und iv) DNA ist relativ stabil: sie kann aus lysierten oder gefrorenen Zellen isoliert und dann bei Raumtemperatur zur weiteren Analyse transportiert werden. Die Analyse der DNA-Methylierung (DNAm) kann beispielsweise mittels Pyrosequenzierung oder MassArray kostengünstig und im Hoch-Durchsatzverfahren für die speziellen Genbereiche erfolgen. Alternativ sind auch weitergehende Untersuchungstechniken wie Sequenzierungs- und Microarray-basierte Verfahren möglich.

Die Berechnung der Anzahl der Zellen kann beispielsweise derart erfolgen, dass mindestens zwei Aliquots der selben Probe bereitgestellt werden und eine vorbestimmte Menge des Referenz-Nukleinsäuremoleküls in jedes Aliquot der Probe eingebracht wird, wobei eine erste Menge des Referenzmoleküls in ein erstes Aliquot und eine zweite Menge des Referenzmoleküls in ein zweites Aliquot eingebracht wird, und wobei die zweite Menge größer oder kleiner als die erste Menge ist. Durch den Einsatz unterschiedlicher Konzentrationen des Referenzmoleküls kann in vorteilhafter Weise eine Referenzkurve erstellt werden, mittels der dann die Zellzahl präzise bestimmt werden kann. Hierdurch kann auch die Konzentration des Referenzmoleküls ermittelt werden, die ungefähr der zu erwarteten Zellzahl entspricht und somit die höchst mögliche Genauigkeit der Messung gewährleistet. Alternativ kann die Kopienzahl der Referenz- Nukleotidsequenz auch berechnet werden und die Zellzahl somit auch ohne Referenzkurve bestimmt werden. Mit beiden Methoden kann also beispielsweise die Referenz-DNA-Konzentration bestimmt werden, die einer 50%igen DNA- Methylierung entspricht und damit einer gleichen Kopien-Zahl der Referenz-DNA und der genomischen DNA. Grundsätzlich sollte die Menge an Referenzmolekülen in etwa der erwarteten Kopienzahl der genomischen DNA entsprechen, da die Sensitivität in diesem Messbereich am höchsten ist. Darüber hinaus kann durch die Verwendung von Referenzmolekülen in aufsteigenden Konzentrationen ein breites Spektrum von Zellzahlen zuverlässig abgedeckt werden. Beispielsweise kann das Referenz-Nukleinsäuremolekül eine Referenz- Nukleotidsequenz umfassen und die Menge des Referenz-Nukleinsäuremoleküls derart eingestellt sein, dass das Verhältnis der Anzahl an Referenzmolekülen zur ungefähr erwarteten Anzahl der Zellen annähernd 2:1 ist. Unter der Voraussetzung, dass die zu analysierenden Zellen jeweils zwei Kopien ihrer DNA- Moleküle enthalten, entspricht dieses Verhältnis einer gleichen Kopien-Zahl der Referenz-DNA und der genomischen DNA, so dass bei dieser Ausführungsform die höchstmögliche Sensitivität des erfindungsgemäßen Verfahrens gewährleistet ist.

In vorteilhafter Ausgestaltung der Erfindung ist vorgesehen, dass zwei oder mehr unterschiedliche Referenz-Nukleinsäuremoleküle, die unterschiedliche spezifische Regionen umfassen, in die Probe eingebracht werden. Auch durch die Verwendung von vielen unterschiedlichen Referenz-Sequenzen kann ein breiteres Spektrum von Zellzahlen zuverlässig abgedeckt werden. Außerdem kann durch die parallele Bestimmung verschiedener spezifischer genomischer Regionen eine weitere Validierung und zusätzliche Genauigkeit erreicht werden.

Bei den Zellen kann es sich beispielsweise um hämatopoetische Zellen handeln, vorzugsweise Leukozyten. In vorteilhafter Ausgestaltung der Erfindung ist in diesem Fall vorgesehen, dass die spezifische Region innerhalb des Gens LSM14B („LSM Family Member 14B", assoziiertes Protein„LSM14 homolog B") und/oder des Gens ZC3H3 („Zinc Finger CCCH-Type Containing 3", assoziiertes Protein „Zinc finger CCCH domain-containing protein 3") liegt. Diese Regionen sind in hämatopoetischen Zellen, insbesondere allen Leukozyten- Subpopulationen, konsistent hoch methyliert und eignen sich daher beispielsweise besonders zur Verwendung als spezifische Region im Rahmen des erfindungsgemäßen Verfahrens. Zusätzlich kann es sich bei den Zellen beispielsweise auch um Stammzellen, insbesondere mesenchymale Stammzellen oder induzierte pluripotente Stammzellen (iPSC), handeln. In vorteilhafter Ausgestaltung der Erfindung ist ferner vorgesehen, dass die spezifische Region mindestens eine Nukleotidsequenz innerhalb einer Region von ungefähr 50.000, 20.000, 10.000, 5.000, 4.000, 3.000, 2.000, 1 .000, 500 oder 100 Nukleotiden stromaufwärts und/oder stromabwärts von einer der Nukleotidsequenzen gemäß SEQ ID NO: 1 bis SEQ ID NO: 3 umfasst.

GCGCCCTGATGAAGGCGTGCGGGGTGATGGGATGGCCTTCGCCGTTCTCAC CCGATGTCTCGTTGTTCAGTCTTCCCTGGGTTCTGCCTCCGCCTCGCCCTTC CAGCCGCACGTGCCTTACA (SEQ ID NO: 1 )

GACAGGGGGAAGGGCGGGGCGCTGAGAGGCGAGGCCGGCGTCTTCTTGAC AATGCGGTAGCGGGTCTTGATCACCTTGCTGGTGGGTGCAGTCCGCACGGC ATGCAGGCTGGACGCTGTAGA (SEQ ID NO: 2) TCCAAAAGCTTCCGGAAGAGCGGGCAGGGTCCTGCACAGCTGTTCATTCACC CGCGAGTACGTCAAGCATACATTGGGCACCGACTGTGTGCCACGCCCGTCC CGGCAGAGGCCCTGGGGAC (SEQ ID NO: 3)

Insbesondere ist in weiterer vorteilhafter Ausgestaltung der Erfindung vorgesehen, dass die spezifische Region mindestens eine Nukleotidsequenz umfasst, die ausgewählt ist aus den Sequenzen gemäß SEQ ID NO: 1 bis SEQ ID NO: 3.

In vorteilhafter Ausgestaltung der Erfindung ist ferner vorgesehen, dass das CpG- Dinukleotid ein Dinukleotid ist, das aus den Nukleotiden Nr. 61 und 62 mindestens einer Nukleotidsequenz besteht, die ausgewählt ist aus den Sequenzen gemäß SEQ ID NO: 1 bis SEQ ID NO: 3. cg06096175 auf dem Infinium HumanMethylation450 BeadChip (lllumina, San Diego, USA) (CpG 61/62 ist in eckiger Klammer und fett gedruckt hervorgehoben):

GCGCCCTGATGAAGGCGTGCGGGGTGATGGGATGGCCTTCGCCGTTCTCAC CCGATGTCT[CG]TTGTTCAGTCTTCCCTGGGTTCTGCCTCCGCCTCGCCCTTC CAGCCGCACGTGCCTTACA (SEQ ID NO: 1 ) cg25834632 auf dem Infinium HumanMethylation450 BeadChip (lllumina, San Diego, USA) (CpG 61/62 ist in eckiger Klammer und fett gedruckt hervorgehoben):

GACAGGGGGAAGGGCGGGGCGCTGAGAGGCGAGGCCGGCGTCTTCTTGAC AATGCGGTAG[CG]GGTCTTGATCACCTTGCTGGTGGGTGCAGTCCGCACGG CATGCAGGCTGGACGCTGTAGA (SEQ ID NO: 2) cg09414987 auf dem Infinium HumanMethylation450 BeadChip (lllumina, San Diego, USA) (CpG 61/62 ist in eckiger Klammer und fett gedruckt hervorgehoben):

TCCAAAAGCTTCCGGAAGAGCGGGCAGGGTCCTGCACAGCTGTTCATTCACC CGCGAGTA[CG]TCAAGCATACATTGGGCACCGACTGTGTGCCACGCCCGTCC CGGCAGAGGCCCTGGGGAC (SEQ ID NO: 3) In vorteilhafter Ausgestaltung der Erfindung ist ferner vorgesehen, dass das CpG- Dinukleotid cg06096175 (liegt im Gen „LSM Family Member 14B" (LSM14B), welches das Protein„LSM 14 homolog B" kodiert), cg25834632 (liegt im Gen„Zinc Finger CCCH-Type Containing 3" (ZC3H3), welches das Protein „Zinc finger CCCH domain-containing protein 3" kodiert) und/oder cg09414987 (kein assoziiertes Gen) ist. Diese CpG-Dinukleotide sind in hämatopoetischen Zellen, insbesondere allen Leukozyten-Subpopulationen, konsistent hoch methyliert und eignen sich daher beispielsweise besonders als Referenz-CpG-Dinukleotide zur Bestimmung absoluter Zellzahlen. Die Erfindung betrifft darüber hinaus ein vorteilhaftes Verfahren zur Herstellung eines Referenz-Nukleinsäuremoleküls zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe, welches umfasst:

Identifizieren mindestens einer spezifischen Region im Genom mindestens einer Zelle oder eines Zelltyps, wobei die spezifische Region mindestens ein CpG-Dinukleotid umfasst, das in der Zelle oder dem Zelltyp grundsätzlich methyliert ist;

Isolieren oder Synthetisieren mindestens einer Referenz-Nukleotidsequenz, welche die spezifische Region und das mindestens eine CpG-Dinukleotid umfasst; Vermehren (Amplifizieren) der Referenz-Nukleotidsequenz außerhalb der Zelle oder des Zelltyps zur Erlangung eines nicht-methylierten Nukleinsäuremoleküls. Das nach dem erfindungsgemäßen Verfahren hergestellte Referenz- Nukleinsäuremolekül muss mindestens eine Nukleotidsequenz umfassen, die der spezifischen Region im Genom der Zellen entspricht, wobei diese Region in den eukaryotischen Zellen grundsätzlich methyliert sein muss, d. h. in diesen Zellen generell einen hohen Methylierungsgrad aufweisen muss. Ein wichtiger Verfahrensschritt ist daher die Identifikation eines Genombereichs, der in den unterschiedlichen Zelltypen zuverlässig methyliert ist. Erfindungsgemäß wird das Referenz-Nukleinsäuremolekül dann aber im weiteren derart hergestellt, dass sich das CpG-Dinukleotid in einem nicht-methylierten Zustand befindet und somit als Referenzmolekül für das oben beschriebene Verfahren geeignet ist.

Beispielsweise kann die Vermehrung der Referenz-Nukleotidsequenz durch Einbringen der Referenz-Nukleotidsequenz in mindestens eine prokaryotische Zelle, Vermehren der Nukleotidsequenz in der prokayotischen Zelle und Isolieren mindestens eines Nukleinsäuremoleküls, das mindestens eine Referenz- Nukleotidsequenz umfasst, aus der prokaryotischen Zelle durchgeführt werden. Das Referenzmolekül kann also beispielsweise in E. coli amplifiziert (z.B. in Form eines Plasmids) und dann aufgereinigt werden. In Bakterien wird die DNA nicht entsprechend methyliert, so dass in dieser Ausgestaltung des Verfahrens sichergestellt ist, dass die Referenz-Nukleotidsequenz nicht methyliert ist.

Alternativ kann die Referenz-Nukleotidsequenz in vitro vermehrt oder synthetisiert werden, vorzugsweise mittels Polymerase-Kettenreaktion (PCR). Auf diese vorteilhafte Weise kann eine unmethylierte Referenz-DNA schnell und zuverlässig hergestellt werden. Das PCR-Produkt könnte beispielsweise als selbstständiger DNS-Doppelstrang oder als klonierte Plasmid-DNA als Standard verwendet werden.

Erfindungsgemäß wird die Aufgabe auch durch ein Nukleinsäuremolekül gelöst, das in dem zuvor beschriebenen erfindungsgemäßen Verfahren hergestellt wurde. Erfindungsgemäß wird die Aufgabe ferner durch ein Nukleinsäuremolekül gelöst, das mindestens eine Nukleotidsequenz umfasst, welche mindestens einer spezifischen Region aus dem Genom mindestens einer eukaryotischen Zelle oder eines eukaryotischen Zelltyps entspricht, wobei die spezifische Region mindestens ein CpG-Dinukleotid umfasst, das in der Zelle oder dem Zelltyp grundsätzlich methyliert ist, und wobei sich das CpG-Dinukleotid in einem nicht-methylierten Zustand befindet. Das erfindungsgemäße Nukleinsäuremolekül umfasst mindestens eine Nukleotidsequenz, die der spezifischen Region im Genom der Zellen entspricht, wobei diese Region in den eukaryotischen Zellen grundsätzlich methyliert ist, d. h. in diesen Zellen generell einen hohen Methylierungsgrad aufweist. Das erfindungsgemäße Nukleinsäuremolekül umfasst ferner mindestens ein CpG-Dinukleotid, das sich in einem nicht-methylierten Zustand befindet. Ein solches Referenz-Nukleinsäuremolekül kann beispielsweise ein DNA-Molekül sein.

Die Erfindung betrifft auch die vorteilhafte Verwendung eines Nukleinsäure- moleküls zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe mittels des erfindungsgemäßen Verfahrens, wobei das Nukleinsäuremolekül mindestens eine Nukleotidsequenz umfasst, die ausgewählt ist aus der Gruppe bestehend aus:

a) mindestens einer Nukleotidsequenz, welche mindestens eine der Nukleotidsequenzen gemäß SEQ ID NO: 1 bis SEQ ID NO: 3 umfasst;

b) mindestens einer Nukleotidsequenz, die sich von einer der Nukleotidsequenzen gemäß SEQ ID NO: 1 bis SEQ ID NO: 3 mit Ausnahme des CpG-Dinukleotids durch den Austausch von höchstens 10%, vorzugsweise höchstens 5%, der Nukleotide unterscheidet und

c) mindestens einer Nukleotidsequenz, die dem zu der Nukleotidsequenz gemäß a) oder b) komplementären Strang entspricht. Die Erfindung betrifft ferner ein künstliches Nukleinsäuremolekül, das mindestens eine Nukleotidsequenz umfasst, die ausgewählt ist aus der Gruppe bestehend aus:

a) mindestens einer Nukleotidsequenz, die mindestens eine Sequenz der Nukleotidsequenzen SEQ ID NO: 4 bis SEQ ID NO: 14 (siehe Tabellen 1 und 2) umfasst,

mindestens einer Nukleotidsequenz, die zu mindestens 90%, vorzugsweise mindestens 95%, mit der Nukleotidsequenz gemäß a) identisch ist und mindestens einer Nukleotidsequenz, die dem zu einer der Nukleotidsequenzen gemäß a) oder b) komplementären Strang entspricht.

Erfindungsgemäß wird die Aufgabe ferner durch ein Kit gelöst, welches das erfindungsgemäße Nukleinsäuremolekül und/oder eine Kombination von mindestens zwei unterschiedlichen erfindungsgemäßen künstlichen Nukleinsäuremolekülen umfasst. Zusätzlich kann ein solches Kit mindestens eine Pufferlösung und/oder ein Reagenz zur Durchführung eines oder mehrerer der folgenden Verfahren umfassen:

DNA-Amplifizierung, methylierungsspezifische PCR, Bisulfit-Behandlung von DNA, DNA-Sequenzierung, vorzugsweise Pyrosequenzierung von Bisulfit-behandelter DNA, Microarrays (lllumina Human Methylation BeadChip - Technologie), Reduced Representation Bisulfite Sequencing (RRBS), Whole Genome Bisulfite Sequencing (WGBS), DNAm Messungen mittels digitaler PCR, barkodierte Bisulfit-Amplikon-Sequenzierung (BBA-seq), „Mass Array ® " und „SNP- Genotyping".

Die erfindungsgemäßen künstlichen Nukleinsäuremoleküle können ferner in vorteilhafter Weise zur Herstellung eines Kits zur Durchführung des erfindungsgemäßen Verfahrens verwendet werden.

Die Erfindung betrifft ferner die Verwendung des erfindungsgemäßen Nukleinsäuremoleküls und/oder des erfindungsgemäßen künstlichen Nukleinsäuremoleküls und/oder des erfindungsgemäßen Kits zur Bestimmung der Zellzahl von eukaryotischen Zellen in einer Probe, d. h. zur absoluten Quantifizierung von Zellen oder Zelltypen.

Sowohl das erfindungsgemäße Verfahren als auch die erfindungsgemäßen Nukleinsäuremoleküle und Kits können grundsätzlich für die Zellzahlbestimmung unterschiedlichster Zelltypen in verschiedenen Anwendungsbereichen eingesetzt werden. Insbesondere sind diese beispielsweise auch für die Bestimmung der Leukozytenzahl im Blut oder anderen Körperflüssigkeiten (Liquor, Urin etc.) geeignet. Die Leukozytenzahl wird routinemäßig in Blutproben mittels durchflusszytometrischen Messverfahren bestimmt. Allerdings ist die Bestimmung nicht in allen Blutproben möglich (beispielsweise aufgrund von Koagulation oder zu kleinem Blutvolumen) und kann an älteren Blutproben nicht mehr zuverlässig durchgeführt werden. Die Proben müssen für die Analyse frisch versendet und zeitnah gemessen werden. Im Gegensatz dazu kann die erfindungsgemäße epigenetische Bestimmung der Zellzahl auch an Blutproben erfolgen, in denen die Zellen nicht mehr vereinzelt sind. Das erfindungsgemäße Verfahren ist darüber hinaus auch in Kombination mit anderen Methoden sinnvoll, da ohne großen Mehraufwand eine quantitative Information gewonnen wird, während ansonsten nur relative Verhältnisse der hämatopoetischen Zelltypen ermittelt werden können. Im Hochdurchsatzverfahren kann das erfindungsgemäße Verfahren ferner sehr kostengünstig durchgeführt werden. Die Messgenauigkeit ist dabei mit der Genauigkeit konventioneller Methoden vergleichbar.

Mit Hilfe des erfindungsgemäßen Verfahrens kann beispielsweise die Anzahl der kernhaltigen Blutzellen zuverlässig bestimmt werden. Insbesondere in der Kombination mit epigenetischen Verfahren zu Bestimmung des Differentialblutbildes ist das erfindungsgemäße Verfahren vorteilhaft, da es eine quantitative Aussage zulässt. Im Gegensatz zu konventionellen Verfahren können die Blutproben auch gefroren versendet werden, da lediglich der DNA-Gehalt im Verhältnis zum Volumen bestimmt wird. Da jedoch bei der DNA-Isolation zwangsläufig starke Abweichungen entstehen, ist die Messung der DNA- Konzentration nicht zuverlässig möglich. Im Gegensatz dazu wird erfindungsgemäß mindestens eine Referenz-Nukleotidsequenz mit vorbestimmter Konzentration zugesetzt (oder die Probe wird zu einer vorgegebenen Menge der Referenz-Nukleotidsequenz zugegeben), die dann bei der DNA-Isolation den gleichen Schwankungen unterworfen ist wie die genomische DNA.

"Grundsätzlich methyliert" im Sinne der Erfindung bedeutet, dass das entsprechende CpG-Dinukleotid oder mehrere CpG-Dinukleotide innerhalb einer spezifischen Region unter physiologischen Bedingungen in einer eukaryotischen Zelle einen hohen Methyl ierungsgrad aufweist bzw. aufweisen.

„Physiologische Bedingungen" im Sinne der Erfindung bezeichnet Umgebungsparameter (z.B. Zusammensetzung des Milieus innerhalb und außerhalb der Zelle, Temperatur, pH-Wert etc.), die den im Organismus herrschenden Lebensbedingungen entsprechen.

"Methylierungsgrad" im Sinne der Erfindung bezeichnet das Verhältnis von methylierten CpG-Dinukleotiden zu nicht-methylierten CpG-Dinukleotiden.

"Hoher Methylierungsgrad" im Sinne der Erfindung bezeichnet einen Methylierungsgrad mindestens eines spezifischen CpG-Dinukleotids von mindestens 80%, vorzugsweise mindestens 90%, besonders bevorzugt mindestens 95%, insbesondere mindestens 98%.

"Nicht-methyliert" oder "nicht-methylierter Zustand" im Sinne der Erfindung bezeichnet einen Methylierungsgrad mindestens eines spezifischen CpG- Dinukleotids von höchstens 20%, vorzugsweise höchstens 10%, besonders bevorzugt höchstens 5%, insbesondere höchstens 2%.

Die Erfindung wird im Weiteren anhand der folgenden Abbildungen und Ausführungsformen beispielhaft näher erläutert. Figur 1 zeigt Diagramme, die jeweils die Methylierungsgrade ("ß-value") unterschiedlicher CpG-Dinukleotide in verschiedenen Zelltypen darstellen. Der DNA-Methyl ierungsgrad (beta-value von 0 bis 1 ) ist für verschiedene Zelltypen und in peripherem Blut von verschiedenen Erkrankungen aufgetragen. Die CpG- Dinukleotide (cg06096175, cg09414987 und cg25834632) wurden aus öffentlich zugänglichen Datensätzen des Infinium HumanMethylation450 BeadChip (lllumina, San Diego, USA) ausgewählt. Sie sind alle in gereinigten hämatopoetischen Subpopulation von Reinius et al. (2) (A, D, G; GSE35069, 6 Proben) und Zilbauer et al. (3) (B, E, H; E-MTAB-2145, 6 Proben), sowie in DNAm-Profilen aus Blutproben von gesunden Spendern (C, F, I; GSE41 169, 30 Proben; GSE32148, 20 Proben; GSE40005, 12 Proben), akuter Myeloid-Leukemie (AML; TCGA, 194 Proben; GSE58477, 62 Proben; GSE62298, 68 Proben), myelodysplastischem Syndrom (MDS; GSE51758, 4 Proben), myeloproliferativen Neoplasmen (MPN; 8 Proben), und anderen hämatopoetischen Erkrankungen (GSE37362, 31 Proben; GSE69954, 65 Proben) einheitlich hoch methyliert.

WB = Vollblut ("whole blood"); PBMC = mononukleare Zellen des peripheren Bluts ("peripheral blood mononuclear cells").

Figur 2 zeigt ein Diagramm, welches das Verhältnis der Referenz- Nukleinsäuremoleküle („Standard") zum Messwert der DNA-Methylierung (DNAm) darstellt. Bei diesen Versuchen wurden Blutproben unterschiedliche Mengen der Referenz-Nukleinsäuremoleküle zugefügt. Es wurden jeweils unterschiedliche Mengen von Referenz-DNA (Plasmid) (0.0002 - 0.1 100 ng) mit 150 μΙ Blut von zwei Blutproben versetzt. Anschließend wurde die DNA mittels des QIAamp DNA Blood Mini Kits isoliert (Qiagen), bisulfit konvertiert (EZ DNA Methylation Kit,Zymo Research) und die genomische Sequenz mit den in Tabelle 1 aufgeführten Primern für LSM14B amplifiziert. Das Amplikon wurde daraufhin mit dem PyroMark Q96 ID Pyrosequenziergerät (Qiagen) mit dem Sequenzierprimer (Tabelle 1 ) gemessen. Das Verhältnis des logarithmierten Werts des DNA- Standards (ng) bezogen auf 5.000 Zellen zur DNA-Methylierung (DNAm) ergibt erwartungsgemäß annährend eine Gerade.

Figure 3 zeigt ein Flussdiagramm und weitere Diagramme, welche eine beispielhafte Ausführungsform des erfindungsgemäßen Verfahrens illustrieren. (A) Schematische Darstellung der Quantifizierung von Zellen basierend auf DNA- Methylierung (DNAm) mit einer nicht-methylierten Referenz-Nukleinsäure.

(B) Zwei Blutproben (Spender 1 und 2) wurden mit einer Verdünnungsreihe einer Referenz-DNA (Plasmid mit nicht-methylierter Sequenz des LSM14B Gens; 0,0002 ng bis 0,1 100 ng) gemischt.

(C) Das Verhältnis des logarithmierten Werts der Referenz-DNA [ng] pro Zelle (ermittelt mit dem Abbott „Cell-Dyn Analyzer") zur DNA-Methylierung (DNAm) ergibt eine fast lineare Abhängigkeit im Bereich eines Methylierungsgrads zwischen 20% und 80%. Die ermittelten DNAm-Werte kommen den berechneten, erwarteten DNAm-Werten (Kurve) sehr nahe. (D) Die auf Basis der Referenz-DNA (Plasmid LSM14B) ermittelten Zellzahlen korrelieren deutlich mit den Zellzahlen, die mit einem Abbott„Cell-Dyn Analyzer" (n = 41 ; Validierungsgruppe III; R = 0.84) bestimmt wurden.

(E) Verhältnis der mit einem„Coulter Counter" (n = 38; Validierungsgruppe IV; R = 0.97; MAD = durchschnittliche absolute Abweichung („mean absolute deviation")) bestimmten Zellzahlen zu erfindungsgemäß bestimmten Zellzahlen von Granulozyten, Lymphozyten und Monozyten.

Figur 4 zeigt in einem Diagramm die Kombination unterschiedlicher spezifischer Regionen bzw. Referenz-Nukleotidsequenzen in unterschiedlichen Konzentrationen in jeder Blutprobe (0.0033 ng ZC3H3, 0.01 1 ng LSM14B und 0.033 ng cg09414987).

Figur 5 zeigt Diagramme zur Bestimmung der Zellzahl nach dem erfindungsgemäßen Verfahren unter Verwendung von „MassARRAV'-Analysen. Zu Blutproben aus der Validierungsgruppe IV (n = 38) wurden Referenz- Nukleotidsequenzen mit einer spezifischen Region des gegeben. Die DNAm-Werte wurden dann mittels„MassARRAY" bestimmt.

(A) Die DNAm-Werte des relevanten CpG-Dinukleotids korrelieren mit den Zellzahlen, die mittels eines "Coulter Counters" (R = 0.48) bestimmt wurden. Diese

Korrelation ist aber geringer als bei entsprechenden Daten, bei denen die DNAm- Werte mittels Pyrosequenzierung ermittelt wurden.

(B) Ein Vergleich der DNAm-Werte, die mittels "MassARRAY" und Pyrosequenzierung („PSQ") bestimmt wurden, ergeben tatsächlich eine eher geringe Übereinstimmung, wobei die mittels„MassARRAY" bestimmten Zellzahlen allgemein zu hoch geschätzt sind. Folglich würden die mit Hilfe einer "MassARRAY"-Methode bestimmten Zellzahlen zu hoch angesetzt.

(C) Daher wurde ein Korrekturfaktor von 0,25 angewendet, um die mittels "MassARRAY" bestimmten Zellzahlen zu berechnen.

Figur 6 zeigt die grafische Darstellung der Korrelation der epigenetische Zellzahlbestimmung von humanen induzierten pluripotenten Stammzellen (iPSC) mit der berechneten Zellzahl. Bei diesem Versuch wurden unterschiedliche Zellzahlen an iPSCs mit der gleichen Menge an Standard-DNA gemischt (0.02 ng) und anschließend die gesamte DNA isoliert. Die epigenetische Zellzahlbestimmung zeigt eine enge Korrelation der berechneten Zellzahl mit der realen Zellzahl. DNA-Isolierung und Bisulfit-Umwandlung

Genomische DNA wurde aus Blut mittels des„QIAamp DNA Mini Kit" (Qiagen, Hilden, Deutschland) isoliert. Genomische DNA aus Serum wurde aus Serumröhrchen (S-Monovette; Sarstedt, Nümbrecht, Deutschland) nach 1 - stündiger Inkubation bei Raumtemperatur und Zentrifugation für Minuten bei 2.000 x g isoliert. DNA wurde anschließend aus 1 ml Serum mit dem "PME free- circulating DNA extraction kit" (GSA/L System; Analytik Jena, Jena, Deutschland) unter Zugabe von Träger-RNA gemäß den Herstelleranweisungen isoliert. Entweder 1 g DNA aus peripherem Blut oder die vollständige DNA-Probe aus Serum wurde mit dem „EZ DNA Methylation Kit" (Zymo Research, Irvine, CA, USA) Bisulfit-konvertiert.

Herstellung der nicht-methylierten Referenz-DNA

Die spezifischen Regionen wurden mittels PCR amplifiziert (Eppendorf Mastercycler 5341 ; Eppendorf AG, Hamburg, Deutschland), in den Vektor pBR322 kloniert (Thermo Fischer Waltham, Massachusetts, USA), in DH5a E.coli expandiert und mit dem„Plasmid DNA purification kit" (Macherey-Nagel, Düren, Deutschland) isoliert. Um den optimalen Bereich des DNA-Methylierungsgrades der Blut/Referenz-Mischung zu bestimmen, wurde peripheres Blut (150 μΙ) mit unterschiedlichen Verdünnungen der Referenz-Nukleinsäure (0.0002 - 0.1 100 ng) gemischt. Die Mischungen aus Blut und Referenz-DNA wurden wie oben beschrieben der DNA-Isolierung und Bisulfit-Umwandlung unterzogen.

Pyrosequenzierung

Spezifische Regionen, welche die CpG-Dinukleotide cg06096175 (LSM14B), cg25834632 (ZC3H3) und cg09414987 (kein assoziiertes Gen) umfassen, wurden mittels PCR (Eppendorf Mastercycler 5341 ; Eppendorf AG) amplifiziert. Die Primer wurden mit der "Pyrosequencing Assay Design Software 1 .0" (Biotag AB, Uppsala, Schweden) kreiert und sind in Tabelle 1 aufgeführt. Die Pyrosequenzierung wurde dann mit einem "PyroMark Q96 ID" - System unter Verwendung regionspezifischer Sequenzierungsprimer durchgeführt. Die Ergebnisse wurden mit der„PyroMark Q CpG Software" (Qiagen) analysiert.

MassARRAY-Analyse

Alternativ wurde "MassARRAY" für die spezifische Analyse der DNAm-Werte eingesetzt. Amplicons wurden mit der "Sequenom's EpiDESIGNER Software" kreiert (Tabelle 2). Konvertierte DNA wurde mittels PCR mit dem„HotStart Plus PCR Master Mix" (Qiagen) amplifiziert. Nicht-eingebaute dNTPs wurden mit „shrimp alkaline Phosphatase" (Agena Bioscience, San Diego, CA, USA) neutralisiert. Anschließend wurden 10 μΙ des PCR-Produkts in vitro transkribiert und basenspezifisch (U-spezifisch) mit„RNase A" (T-Cleavage MassCIeave Kit; Agena Bioscience, Hamburg, Deutschland) geschnitten. Das geschnittene Produkt wurde dann mit einem "MALDI-TOF" Massenspektrometer (MassARRAY Analyzer 4 System; Agena Bioscience) analysiert.

Bestimmung der absoluten Zellzahlen

Nach dem Mischen der genomischen DNA mit der nicht-methylierten Referenz- DNA kann der Methylierungsgrad ("DNAm") mathematisch als das Verhältnis von methylierter DNA zur Gesamt-DNA beschrieben werden: a * C R + b * C G

DNAm =

CR + C G

"CR" bzw. "CG" entsprechen dabei der Anzahl der Referenz-Nukleinsäuremoleküle bzw. der Anzahl der genomischen Nukleinsäuremoleküle; "a" bzw. "b" sind absolute DNAm-Werte, die mittels Pyrosequenzierung oder "MassARRAY" in Kontrollproben mit reiner Referenz-DNA bzw. DNA aus Blut bestimmt wurden (z.B. 7% und 93% DNAm). Um die Anzahl der Referenz-Nukleinsäuremoleküle („CR") zu bestimmen, wurde die folgende Formel verwendet:

"ITIR" ist dabei die hinzugefügte Menge an Referenzmolekülen (z.B. 0.01 1 ng "LSM14B"), N A ist die Avog ad ro- Konstante, MW ist das Molekulargewicht der Referenz-DNA (berechnet für das Plasmid mit der "LSM14B-Sequenz": 2.85 * 10 6 g * mo 1 ) und der Faktor 1 .5 wurde empirisch ermittelt (für das verwendete Referenz-DNA-Präparat; bezogen auf die Tatsache, dass gereinigte Plasmide auch Fragmente des bakteriellen Genoms oder anderer Plasmide umfassen können).

Mit diesen Parametern ist es reziprok möglich, die Anzahl der genomischen DNA- Moleküle (CG) zu berechnen, und somit die Anzahl der Zellen („cells") in einer Probe zu bestimmen:

C a * (DNAm - a)

cells/μΐ =

2 v * (b - DM Am)

Der Korrekturwert "2" entstammt der Tatsache, dass jede Zelle zwei Kopien genomischen DNA enthält; "v" ist das Volumen der analysierten Probe in μΙ.

Es wurden öffentlich zugängliche und eigene DNA-Methylierungsdatensätze verwendet, bei denen Blutproben auf dem Infinium HumanMethylation450 BeadChip Mikroarray (lllumina, San Diego, USA) untersucht wurden. Die potentiell relevanten CpG-Dinukleotide wurden nach folgenden Kriterien ausgewählt: 1 ) Die spezifische Region muss in verschiedenen Zelltypen immer mindestens ein DNA- Methyl ierungsgrad von 97,5% aufweisen; 2) Sie muss in Datensätzen mit vielen Blutproben durchgehend über 97,5% methyliert sein; und 3) Sie muss in verschiedenen Erkrankungen durchgehend eine hohe DNA-Methylierung aufwiesen. Auf dieser Grundlage wurden bespielsweise die CpG-Dinukleotide cg06096175 (liegt im Gen „LSM Family Member 14B" (LSM14B), welches das Protein „LSM 14 homolog B" kodiert), cg25834632 (liegt im Gen „Zinc Finger CCCH-Type Containing 3" (ZC3H3), welches das Protein „Zinc finger CCCH domain-containing protein 3" kodiert) und/oder cg09414987 (kein assoziiertes Gen) identifiziert. Diese CpG-Dinukleotide sind in allen getesteten Blutzelltypen durchgehend hoch methyliert (DNAm („ß-value") > 0.975) (Figur 1 ). Die DNA-Sequenzen mit den entsprechenden spezifischen Regionen werden mittels PCR amplifiziert und in ein Plasmid kloniert (pBR322). Das Plasmid wird dann in E. coli amplifiziert und aufgereinigt. In den Bakterien wird diese DNA- Sequenz nicht methyliert, so dass die jeweilige Referenz-Nukleotidsequenz grundsätzlich nicht methyliert ist. Die Plasmid-DNA wird vor der weiteren Analyse in einer bestimmten Konzentration mit dem Blut durchmischt. Dafür ist eine geringe Probenmenge ausreichend, beispielsweise 150 μΙ Blut (grundsätzlich kann auch sehr viel weniger verwendet werden). Es ist beispielsweise möglich eine kleine heparinisierte Kapillare (wie sie für die Blutgewinnung aus der Fingerbeere verwendet werden) blasenfrei zu füllen und somit ein relativ definiertes Volumen vorzugeben. Dieses Volumen wird anschließend mit einer bestimmten Menge des Referenz-Nukleinsäuremoleküls versetzt (z.B. in einem Eppendorf-Gefäß). Dabei sollte die Menge an Referenz-DNA in etwa der erwarteten Kopienzahl der genomischen DNA entsprechen. Dies ist vorteilhaft, da die Sensitivität in diesem Messbereich am höchsten ist. Figur 2 zeigt das Verhältnis von Referenz-DNA (Standard) zum Messwert der DNA-Methylierung, wobei unterschiedliche Mengen an Referenz-DNA zugegeben wurden. Auf diese Weise konnte die DNA- Konzentration bestimmt werden, die einer 50% DNA-Methylierung entspricht (0.01 ng) und somit einer gleichen Kopien-Zahl der Referenz-DNA (Plasmide) und der genomischen DNA.

Das erfindungsgemäße Verfahren (Figur 3A) kann in vorteilhafter Weise noch weiter verfeinert werden, indem nicht nur eine bestimmte Referenz-Nukleinsäure verwendet wird, sondern eine Mischung unterschiedlicher Referenz- Nukleinsäuremoleküle (z.B. mit den ausgewählten CpG-Dinkleotiden cg09414987 und cg25834632), die jeweils in einer anderen Konzentration vorliegen können und somit ein anderes Spektrum von Zellzahlen abdecken. Dies ist insbesondere bei Messungen notwendig, bei denen mit einer sehr großen Schwankung an Blutzellen gerechnet werden muss (beispielsweise bei Urinproben, Liquorproben oder in Fall von Leukämien). Außerdem kann durch die parallele Bestimmung verschiedener geeigneter spezifischer Genombereiche eine weitere Validierung der Zellzahl erfolgen. Werden unterschiedliche Mengen der Referenz-Nukleinsäure verwendet, nehmen die DNAm-Werte mit steigender Konzentration der Referenz-Nukleinsäure kontinuierlich ab (Figur 3B). Das Verhältnis des logarithmierten Werts der Referenz-DNA pro Zelle zur DNA-Methylierung ergibt im mittleren Bereich eine annähernd lineare Abhängigkeit, wobei die erfindungsgemäß bestimmten Methylierungsgrade mit berechneten, erwarteten DNAm-Werten sehr gut korrelieren (Figur 3C). Die auf Basis einer erfindungsgemäßen Referenz- Nukleinsäure (Referenz-Nukleotidsequenz „LSM14B") bestimmten Zellzahlen korrelieren ferner deutlich mit Zellzahlen, die durch herkömmliche Zählverfahren ermittelt wurden (Figur 3D). Das erfindungsgemäße Verfahren ist folglich zur Bestimmung absoluter Zellzahlen geeignet, wobei die Zellzahlbestimmung mittels des erfindungsgemäßen Verfahrens beispielsweise auch in vorteilhafter Weise mit der Erstellung eines epigenetischen Differenzialblutbilds kombiniert werden kann (Figur 3E).

Die Genauigkeit des erfindungsgemäßen Verfahrens ist insbesondere dann besonders hoch, wenn die Methylierungsgrade zwischen 20% und 80% liegen, d. h. wenn die Anzahl der Referenz-Nukleotidsequenzen in etwa der Anzahl der genomischen Nukleinsäuremoleküle entspricht (Figur 3C). Um die Bandbreite des erfindungsgemäßen Verfahrens zu erweitern, kann es vorteilhaft sein unterschiedliche Referenz-Nukleotidsequenzen, ggf. in unterschiedlichen Konzentrationen (z.B. in höherer und geringerer Konzentration), miteinander zu kombinieren (Figur 4). Die Methylierungsgrade können in vorteilhafter Weise beispielsweise mittels Pyrosequenzierung ermittelt werden. Es ist aber auch möglich, die„MassARRAY"- Technology zur Bestimmung der DNAm-Werte einzusetzen, wobei zur Erhöhung der Genauigkeit ggf. ein Korrekturwert verwendet werden kann (Figur 5). Das erfindungsgemäße Verfahren eignet sich insbesondere auch für die epigenetische Bestimmung der Zellzahl von Stammzellen, insbesondere mesenchymalen Stammzellen oder induzierten pluripotenten Stammzellen (iPSC). Das erfindungsgemäße Verfahren zeigt auch bei diesen Zelltypen eine sehr gute Korrelation der erfindungsgemäß ermittelten Zellzahlen mit den realen, im Voraus bestimmten Zellzahlen (Figur 6).

Überraschender Weise kann mit dem erfindungsgemäßen Verfahren eine vergleichbare Genauigkeit und Zuverlässigkeit erreicht werden wie mit herkömmlichen Verfahren zu Zellzahlbestimmung (1 ). Es wird die herkömmlichen Verfahren aber nie vollständig ersetzen können, da mit dem erfindungsgemäßen Verfahren keine Zellen quantifiziert werden können, die nur sehr wenig DNA enthalten (wie z.B. Erythrozyten und Thrombozyten). Insgesamt ist das erfindungsgemäße Verfahren aber sehr gut zur absoluten Quantifizierung von eukaryotischen Zellen geeignet und stellt somit für viele Anwendungen aufgrund der oben genannten Vorteile eine echte Alternative zu herkömmlichen Verfahren dar.

Tabelle 1 : Primer für Pyrosequenzierung

Primer Sequenz

LSM14B

5'-G AG AG GAG G AG GTAG AATTTAGG G AAGATTG AA-3 ' (SEQ

Vorwärts

ID No: 4)

5'-Biotin-TACACCCCAAAAACTCCTCCAACATC-3' (SEQ ID No:

Rückwärts

5)

Sequenzierung 5'- GTAGAATTTAGGGAAGATTG-3' (SEQ ID No: 6)

cg0941498

5'-Biotin-ATTTTTGTTGTGGGAATATTTAGGTTATGTGTTT-3'

Vorwärts

(SEQ ID No: 7)

Rückwärts 5'-CCTTCTCCCCACAATTCACCAAT-3' (SEQ ID No: 8)

Sequenzierung 5 '-AATC C ATAC C C AATATATACTT-3 ' (SEQ ID No: 9)

ZC3H3

5'- TGGGGATGTGTGTGTTATATGGGTTGAG-3' (SEQ ID No:

Vorwärts 10)

Sequenzierung 5'-j JTGTATTTATTAG^ ID No: 12)

Nicht-Patent-Literatur:

1 . M. Buttarello, M. Plebani, Automated blood cell counts: State of the art. Am J Clin Pathol 130, 104-1 16 (2008).

2. L. E. Reinius, N. Acevedo, M. Joerink, G. Pershagen, S. E. Dahlen, D.

Greco, C. Soderhall, A. Scheynius, J. Kere, Differential DNA methylation in purified human blood cells: implications for cell lineage and studies on disease susceptibility. PLoS ONE 7, e41361 (2012).

3. M. Zilbauer, T. F. Rayner, C. Clark, A. J. Coffey, C. J. Joyce, P. Palta, A.

Palotie, P. A. Lyons, K. G. Smith, Genome-wide methylation analyses of primary human leukocyte subsets identifies functionally important cell-type- specific hypomethylated regions. Blood 122, e52-60 (2013).