Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR EVALUATING DATA FROM MASS SPECTROMETRY, MASS SPECTROMETRY METHOD, AND MALDI-TOF MASS SPECTROMETER
Document Type and Number:
WIPO Patent Application WO/2018/072862
Kind Code:
A1
Abstract:
The invention relates to a method for evaluating data from mass spectrometry for the analysis of peptides from biological samples, in particular from MALDI-TOF mass spectrometry, having the following steps: a) providing expected mass defects; b) determining measured mass defects, namely the mass defects resulting from the data from the mass spectrometry; c) comparing the measured mass defects with the expected mass defects.

Inventors:
BOSKAMP TOBIAS (DE)
Application Number:
PCT/EP2017/001131
Publication Date:
April 26, 2018
Filing Date:
September 22, 2017
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
UNIV BREMEN BCCMS (DE)
International Classes:
G01N33/68; G16B40/10; H01J49/00
Domestic Patent References:
WO2007076606A12007-07-12
WO2014130627A12014-08-28
Foreign References:
US20120232805A12012-09-13
US20070038387A12007-02-15
US20160003842A12016-01-07
US7634364B22009-12-15
Other References:
BAJRAMI B ET AL: "Shifting Unoccupied Spectral Space in Mass Spectrum of Peptide Fragment Ions", JOURNAL OF THE AMERICAN SOCIETY FOR MASS SPECTROMETRY, ELSEVIER SCIENCE INC, US, vol. 20, no. 11, 1 November 2009 (2009-11-01), pages 2124 - 2134, XP026688360, ISSN: 1044-0305, [retrieved on 20090714], DOI: 10.1016/J.JASMS.2009.07.005
MELINDA L. TOUMI ET AL: "Improving Mass Defect Filters for Human Proteins", JOURNAL OF PROTEOME RESEARCH., vol. 9, no. 10, 1 October 2010 (2010-10-01), US, pages 5492 - 5495, XP055435402, ISSN: 1535-3893, DOI: 10.1021/pr100291q
INDRANIL MITRA ET AL: "Improved Mass Defect Model for Theoretical Tryptic Peptides", ANALYTICAL CHEMISTRY, vol. 84, no. 6, 7 March 2012 (2012-03-07), US, pages 3026 - 3032, XP055435405, ISSN: 0003-2700, DOI: 10.1021/ac203255e
HAIYING ZHANG ET AL: "Mass defect filter technique and its applications to drug metabolite identification by high-resolution mass spectrometry", JOURNAL OF MASS SPECTROMETRY., vol. 44, no. 7, 1 July 2009 (2009-07-01), GB, pages 999 - 1016, XP055330389, ISSN: 1076-5174, DOI: 10.1002/jms.1610
CAN BRUCE ET AL: "Probabilistic Enrichment of Phosphopeptides by Their Mass Defect", ANALYTICAL CHEMISTRY, vol. 78, no. 13, 1 July 2006 (2006-07-01), US, pages 4374 - 4382, XP055435415, ISSN: 0003-2700, DOI: 10.1021/ac060046w
DEL PRETE EUGENIO ET AL: "Comparative Analysis of MALDI-TOF Mass Spectrometric Data in Proteomics: A Case Study", 31 July 2016, NETWORK AND PARALLEL COMPUTING; [LECTURE NOTES IN COMPUTER SCIENCE; LECT.NOTES COMPUTER], SPRINGER INTERNATIONAL PUBLISHING, CHAM, PAGE(S) 154 - 164, ISBN: 978-3-540-28012-5, ISSN: 0302-9743, XP047351763
ASSAF WOOL ET AL: "Precalibration of matrix-assisted laser desorption/ ionization-time of flight spectra for peptide mass fingerprinting", PROTEOMICS, 1 January 2002 (2002-01-01), pages 1365 - 1373, XP055435027, Retrieved from the Internet 3.0.CO;2-9/asset/1365_ftp.pdf?v=1&t=jb5dxuss&s=bc88802156716333f237a20bd4e028cd99b57b3a> [retrieved on 20171213]
WOOL A; SMILANSKY Z: "Precalibration of matrix-assisted laser desorptionlionization-time of flight spectra for peptide mass fingerprinting", PROTEOMICS, vol. 2, 2002, pages 1365 - 1373
WOLSKI WE; LALOWSKI M; JUNGBLUT P; REINERT K: "Calibration of mass spectrometric peptide mass fingerprint data without specific external or internal calibrants", BMC BIOINFORMATICS, vol. 6, no. 1, 2005, pages 203, XP021000803, DOI: doi:10.1186/1471-2105-6-203
FROEHLICH J ET AL.: "A Classifier Based on Accurate Mass Measurements to Aid Large Scale, Unbiased Glycoproteomics", MOL. CELL. PROTEOMICS, vol. 12, 2013, pages 1017 - 1025
YAO X; DIEGO P; RAMOS AA; SHI Y: "Averagine-scaling analysis and fragment ion mass defect labeling in peptide mass spectrometry", ANAL. CHEM., vol. 80, no. 19, 1 October 2008 (2008-10-01), pages 7383 - 91
SLENO L: "The use of mass defect in modern mass spectrometry", J. MASS. SPECTROM., vol. 47, 2012, pages 226 - 236, XP055105217, DOI: doi:10.1002/jms.2953
Attorney, Agent or Firm:
MÖLLER, Friedrich et al. (DE)
Download PDF:
Claims:
Patentansprüche

1. Verfahren zum Auswerten von Daten einer Massenspektrometrie zur Analyse von Peptiden aus biologischen Proben, insbesondere einer MALDI-TOF- Massenspektrometrie, mit folgenden Schritten:

a) Bereitstellung erwarteter Massendefekte;

b) Bestimmung gemessener Massendefekte, nämlich der sich aus den Daten der Massenspektrometrie ergebenden Massendefekte;

c) Vergleich der gemessenen Massendefekte mit den erwarteten Massendefekten.

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die erwarteten Massendefekte berechnet werden aus wobei /77N die Nominalmasse eines Peptids bezeichnet und

rp vorzugsweise zwischen 10 3 und 10^ liegt, insbesondere etwa 4,95 10"4 beträgt.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Massendefekt zu einer gemessenen Masse m berechnet wird aus

wobei die Funktion floor(x) für ein beliebiges x > 0 den ganzzahligen Anteil von x bezeichnet.

4. Verfahren nach Anspruch 1 oder einem der weiteren Ansprüche, dadurch gekennzeichnet, dass die Diskrepanz ö zwischen dem gemessenen und dem erwarteten Massendefekt direkt aus der gemessenen Masse m berechnet wird als

wobei die Funktion <p(x) = x-floor(x) den Nachkommaanteil von x für ein beliebiges x > 0 bezeichnet.

5. Verfahren nach Anspruch 1 oder einem der weiteren Ansprüche, dadurch gekennzeichnet, dass zum Vergleich der gemessenen Massendefekte mit den erwarteten Massendefekten über Teilintervalle einer Massenachse jeweils der Median der gemessenen Massendefekte gebildet und mit dem erwarteten Massendefekt verglichen wird.

6. Verfahren nach Anspruch 1 oder einem der weiteren Ansprüche, dadurch gekennzeichnet, dass bei weiterer Verwendung der Daten die Messwerte korrigiert werden, nämlich in Abhängigkeit von der Abweichung der gemessenen Massendefekte von den erwarteten Massendefekten.

7. Verfahren nach Anspruch 1 oder einem der weiteren Ansprüche, dadurch gekennzeichnet, dass die gemessenen Massendefekte für lokale Maxima der spektralen Intensitäten berechnet werden.

8. Verfahren zum Auswerten von Daten einer Massenspektrometrie zur Analyse von Peptiden aus biologischen Proben, insbesondere einer MALDI-TOF- Massenspektrometrie, vorzugsweise nach einem der voranstehenden Ansprüche, mit folgenden Schritten:

a) Bereitstellung erwarteter Massendefekte;

b) Bestimmung gemessener Massendefekte, nämlich der sich aus den Daten der Massenspektrometrie ergebenden Massendefekte;

c) Bestimmung der Diskrepanzen zwischen den gemessenen Massendefekten und den erwarteten Massendefekten.

d) Bestimmung der Streuung der Diskrepanzen um deren Mittelwert;

e) Vergleich der Streuung mit einer definierten zulässigen Streuung.

9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass zur Bestimmung einer Streuung der Massendefektdiskrepanzen Interquartilsabstände der ermittelten Diskrepanzen über Teilintervalle der Massenachse bestimmt werden, und dass bei Überschreitung eines Grenzwertes der Streuung insbesondere die Daten als fehlerhaft verworfen werden.

10. Verfahren nach Anspruch 8 oder 9, dadurch gekennzeichnet, dass ein Korridor für zulässige Streuungen gebildet ist durch Grenzwerte d 2(m) = ±μ^ν(πι) wobei v( ) = σρ (m) +

12 und O (/77N) = Oo + Sp mN, mit oo s 0,02 und SP = 2,0 * 10"5, und Am(m) die Breite von m/z-Bins an der Massenposition m bezeichnet,

und m/z-Bins die sich durch Diskretisierung der Massenachse ergebenden Intervalle repräsentieren, und μ > 0 einen Skalierungsfaktor angibt, vorzugsweise μ = 2, und dass insbesondere die Daten als fehlerhaft verworfen werden, wenn die Streuung der Massendefektdiskrepanzen außerhalb des derart vorgegebenen Korridors liegt.

1 1. Verfahren nach Anspruch 8 oder einem der weiteren Ansprüche, dadurch gekennzeichnet, dass der Massebereich mit erkennbarem Peptidsignal bestimmt wird als die Gesamtheit aller Teilintervalle der Massenachse, für die der Quotient aus der tatsächlichen Streuung und der maximal zulässigen Streuung dp(m) einen festgelegten Schwellwert t nicht überschreitet, wobei vorzugsweise ί = 1 ,2 festgelegt wird, und dass bei Über- oder Unterschreitung eines Grenzwertes für die untere bzw. obere Grenze dieses Massebereiches oder dessen Ausdehnung insbesondere die Daten als fehlerhaft verworfen werden.

12. Massenspektrometrisches Verfahren zur Analyse von Peptiden aus biologischen Proben, insbesondere unter Verwendung eines MALDI-TOF- Massenspektrometers, mit folgenden Schritten:

a) Durchführung eines oder mehrerer massenspektrometrischer Untersuchungen an der biologischen Probe und Bereitstellung von sich aus den massenspektrometrischen Untersuchungen ergebenden Daten;

b) Durchführung des Verfahrens nach einem der voranstehenden Ansprüche.

13. Massenspektrometrisches Verfahren zur Handhabung eines Einzelspektrums von Peptiden aus biologischen Proben mit folgenden Schritten: a) Messung von m/z-Werte für verschiede Peptide mittels einer Messapparatur, insbesondere unter Verwendung eines MALDI-TOF- Massenspektrometers,

b) Zuordnung der gemessenen m/z-Werte zu entsprechenden m/z-Bins eines 2D-Histogramms,

c) Auftrag von spektralen Intensitäten der m/z-Bins in dem 2D-Histogramm, wobei auf einer Abszissenachse die m/z-Bins und auf einer Ordinatenachse die Diskrepanz zwischen gemessenem und erwartetem Massendefekt aufgetragen werden,

d) wobei die durch die beiden Achsen aufgespannte Diagrammfläche in eine Vielzahl, vorzugsweise 20 bis 50, von Rechtecken aufgeteilt wird,

e) wobei die gemessenen Werte auf eine m/z-Auflösung, die der gewählten Unterteilung der Ordinatenachse entspricht, hochinterpoliert, und

f) wobei für jedes Rechteck diejenigen Intensitätswerte des interpolierten Spektrums aufsummiert werden, deren Massendefektdiskrepanz in die jeweiligen Teilintervalle der Achsen fallen,

g) wobei unterschiedliche Intensitätswerte unterschiedlich gekennzeichnet werden und gleiche Intensitätswerte gleich gekennzeichnet werden

14. Massenspektrometrisches Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass zu jedem Teilintervall der Abszissenachse, insbesondere der horizontalen Massenachse, die entsprechenden Intensitätswerte der Ordinatenachse statistisch ausgewertet werden, um Häufungspunkte und/oder Streuungswerte zu bestimmen.

15. Massenspektrometrisches Verfahren nach Anspruch 14, dadurch gekennzeichnet, dass zur Beschreibung der Verteilung der Intensitätswerte in vertikaler Richtung zirkuläre Statistiken verwendet werden, insbesondere kann ein erstes zirkuläres Moment Z als (komplexwertige) Statistik herangezogen werden.

16. Massenspektrometrisches Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass zur Bestimmung eines Massenshiftprofiis (Vektor aller zirkulären Moment Z für alle Teilintervalle der Abszissenachse, insbesondere der horizontalen Massenachse) die Schritte zur Bildung des Histogramms und der Berechnung der zirkulären Momente zusammengesetzt werden und gemäß der Formel

als Fourier-Integrale des kontinuierlich interpolierten Spektrums 5 über die Teilintervalle lk der Abszissenachse ausgedrückt werden.

17. Massenspektrometrisches Verfahren zur Handhabung eines Einzelspektrums von Peptiden aus biologischen Proben, insbesondere nach einem der Ansprüche 13 bis 16, dadurch gekennzeichnet, dass für eine Massenshiftnormalisierung zu einem Ensemble für jedes Spektrum

a) ein Massenshiftprofil ermittelt wird,

b) aus allen einzelnen Massenshiftprofilen durch elementweise Bildung des arithmetischen Mittelwertes ein gemeinsames, mittleres Referenzprofil gebildet wird,

c) jedes Spektrum modifiziert wird, so dass das Massenshiftprofil des modifizierten Spektrums dem Referenzprofil entspricht.

18. Massenspektrometrisches Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass für die Normalisierung eines einzelnen Spektrums auf das Referenzprofil jeweils für die einzelnen Teilintervalle, für die die Massenshiftprofile berechnet werden, relative Verschiebungswerte bestimmt und über die gesamte Massenachse interpoliert werden und die gemessenen Werte des Spektrums um diese interpolierten Verschiebungswerte korrigiert werden.

19. MALDI-TOF-Massenspektrometer mit einer Steuereinheit zur Analyse von Peptiden aus biologischen Proben unter Anwendung eines Verfahrens nach einem der Ansprüche 1 bis 18.

Description:
Verfahren zum Auswerten von Daten einer Massenspektrometrie und massenspektrometrisches Verfahren sowie ein MALDI TOF Massenspektrometer

Beschreibung

Die Erfindung betrifft ein Verfahren zum Auswerten von Daten einer Massenspektrometrie zur Analyse von Peptiden aus biologischen Proben, insbesondere einer MALDI-TOF-Massenspektrometrie gemäß der Ansprüche 1 und 8. Daneben betrifft die Erfindung ein massenspektrometrisches Verfahren zur Analyse von Peptiden aus biologischen Proben, insbesondere unter Verwendung eines MALDI-TOF-Massenspektrometers nach Anspruch 12. Schließlich ist die Erfindung gerichtet auf ein massenspektrometrisches Verfahren zur Analyse von Peptiden aus biologischen Proben gemäß den Ansprüchen 13 und 17 sowie ein MALDI-TOF-Massenspektrometer nach Anspruch 19.

Bei der sogenannten Matrix Assisted Laser Desorption/Ionization Time-of-flight Massenspektrometrie (MALDI-TOF-MS) wird eine biologische Gewebeprobe nach einer geeigneten Probenpräparation mit einer Matrixlösung überzogen und in Vakuum mit einem Laser beschossen. Dabei werden biologische Makromoleküle aus dem Gewebe herausgelöst und ionisiert, typischerweise mit einer einfach positiven Ladung. Die Ionen werden anschließend in einem elektrischen Feld beschleunigt und von einem Detektor registriert. Aus der Flugzeit lässt sich der m/z-Wert, d.h. das Verhältnis zwischen Masse und Ladung des Moleküls bestimmen. Das gemessene Massenspektrum stellt die relative Zahl der registrierten Ionen (spektrale Intensität) als Funktion ihrer m/z-Werte dar. Unter der Annahme einer einfach positiven Ionisierung ist der m/z-Wert äquivalent zur Masse m des ionisierten Moleküls. Nachfolgend wird zur Vereinfachung unter der Masse m des ionisierten Moleküls der m/z-Wert verstanden. Der m/z-Wert bzw. die molekulare Masse wird in Dalton (Da) angegeben als ein Vielfaches der atomaren Masseneinheit (1 Da = 1 amu, atomic mass unit). Näherungsweise entspricht die Masse eines Moleküls in Da der Gesamtzahl der Protonen und Neutronen, aus denen die Atomkerne des Moleküls zusammengesetzt sind. Die Differenz zwischen dieser ganzzahligen Nominalmasse und der tatsächlichen Masse wird als Massendefekt bezeichnet. Der Massendefekt eines Moleküls ist die Summe der Massendefekte der einzelnen Atome, die wiederum für jedes chemische Element bzw. Isotop verschieden sind.

Der Ausdruck "Massendefekt" wird in der Literatur nicht einheitlich verwendet. Eine erste Bedeutung des Begriffs bezieht sich auf die Differenz der Massen in der Sl-Einheit kg. Eine zweite Bedeutung bezieht sich ebenfalls auf die Differenz der Massen, geht aber von der atomaren Masseneinheit u aus, die mit Bezug zum Kohlenstoff-Isotop 12C definiert ist. Aufgrund dieser Festlegung ist der Massendefekt des Kohlenstoff-Isotops 12C gleich Null. Für diese zweite Bedeutung wird anstelle des Begriffs "Massendefekt" auch der Begriff "Massenüberschuss" verwendet, um den Unterschied zur oben genannten ersten Bedeutung herauszustellen. In der Biologie und Chemie, insbesondere im Zusammenhang mit massenspektrometrischen Verfahren, wird aber trotzdem der Begriff "Massendefekt" verwendet, also im Sinne der zweiten Bedeutung, so auch hier.

Bei der Akquisition von MALDI-TOF-Massenspektrometriedaten von biologischen Gewebeschnitten wird eine Vielzahl von Informationen über die proteomische Struktur der Gewebeproben gewonnen. Gleichzeitig unterliegt die Messung einer Reihe von potentiellen Störungen, die zu Verzerrungen und Verfälschungen der gewonnenen Informationen führen können. Aufgrund der hohen Komplexität der Daten ist eine objektive Beurteilung ihrer Qualität und Genauigkeit oftmals nicht möglich. Aktuell existieren keine breit akzeptierten und leicht anwendbaren Maßstäbe, die eine Aussage darüber erlauben, welche Datenqualität eine Messung aufweist oder ob zwei Messungen Daten von vergleichbarer Qualität liefern. Aus der US 2016/0003842 A1 ist ein massenspektrometrisches Verfahren zur Analyse von Peptiden bekannt. Ziel ist dabei die Erkennung sogenannter Glykopeptide. In den Fig. 2a, 2b der US 2016/0003842 A1 sind Massendefekte über nominalen Massen m/z aufgetragen. Unterschieden werden Bereiche mit Peptiden einerseits und mit Glykopeptiden angereicherte Bereiche andererseits.

Eine häufig auftretende Verzerrung der gemessenen Daten besteht in einem systematischen Fehler in den gemessenen Massen, der auch unter sorgfältig kontrollierten experimentellen Bedingungen die messtechnisch bedingte Toleranzgrenze überschreitet. Herkömmliche Methoden zur Korrektur solcher Massenverzerrungen sind in vielen Fällen entweder zu ungenau oder zu zeitaufwendig.

Aufgabe der vorliegenden Erfindung ist die Schaffung eines Verfahrens zur Qualitätskontrolle von Massenspektrometriedaten (bei der Analyse von Peptiden aus biologischen Proben) bzw. ein massenspektrometrisches Verfahren, mit einer entsprechenden Kontrolle, bzw. ein massenspektrometrisches Verfahren mit einer Signalkorrektur. Zur Lösung der Aufgabe weist das Verfahren die Merkmale des Anspruchs 1 auf. Vorgesehen ist demnach ein Verfahren zum Auswerten von Daten einer Massenspektrometrie zur Analyse von Peptiden aus biologischen Proben, insbesondere einer MALDI-TOF- Massenspektrometrie, mit folgenden Schritten: a) Bereitstellung erwarteter Massendefekte;

b) Bestimmung gemessener Massendefekte, nämlich der sich aus den Daten der Massenspektrometrie ergebenden Massendefekte;

c) Vergleich der gemessenen Massendefekte mit den erwarteten Massendefekten.

Je nach Größe der Abweichung der gemessenen Massendefekte von den erwarteten Massendefekten können die Daten bzw. eine zugrunde liegende Messung als fehlerhaft oder akzeptabel bewertet werden. Auch kann durch eine geeignete Signalquelle ein zur Bewertung der Daten korrespondierendes Signal ausgegeben werden, etwa eine Anzeige auf einem Bildschirm. Sofern die Daten bzw. die Messung als akzeptabel bewertet werden, wird mit den Daten weiter gearbeitet und/oder es werden weitere Messungen durchgeführt. Bei als fehlerhaft bewerteten Daten können diese beispielsweise für die weitere Verarbeitung verworfen werden und/oder die für die Durchführung der Massenspektrometrie verwendete Vorrichtung wird einer Überprüfung unterzogen.

Das Verfahren basiert unter anderem auf einer rechnergestützten Visualisierung der Massendefekte der in einem Spektrum aufgefundenen Peaks. Dabei wird ausgenutzt, dass eine Vielzahl der Peaks von Peptiden herrühren, deren Massendefekte einem charakteristischen Muster folgen. Durch Vergleiche der gemessenen Massendefekte mit einem theoretisch erwarteten Muster der Massendefekte / den erwarteten Massendefekten lassen sich rechnerisch und visuell Rückschlüsse auf die Qualität der gemessenen Daten ziehen.

Die Massendefekte werden im massenspektrometrischen Verfahren natürlich nici it direkt gemessen, sondern aus den ermittelten Massen (welche in einem TOF-Massenspektrometer aus gemessenen Flugzeiten bestimmt werden) berechnet. Zur Vereinfachung wird aber der Begriff "gemessener Massendefekt" zur Abgrenzung gegenüber dem "erwarteten Massendefekt" verwendet. Letzterer ergibt sich anhand von Berechnungen aufgrund der besonderen Eigenschaften der Peptide. In Fortbildung der Erfindung ist vorgesehen, dass die erwarteten Massendefekte berechnet werden aus

wobei /77N die Nominalmasse eines Peptids bezeichnet

und r p vorzugsweise zwischen 10 ~3 und 10 4 liegt, insbesondere etwa 4,95 * 10 "4 beträgt.

Für die Berechnung der erwarteten Massendefekte werden somit für eine gegebene (ganzzahlige) Nominalmasse ΤΪΝ die Differenz zu der sich aus dem Produkt mit 1+r p ergebenden Masse m berücksichtigt. r p ist vorzugsweise der Faktor 4,95x1ο -4 . Auch davon abweichende Werte sind grundsätzlich möglich.

Nach einem weiteren Gedanken der Erfindung ist vorgesehen, dass der Massendefekt zu einer gemessenen Masse m berechnet wird aus wobei die Funktion floor(x) für ein beliebiges x > 0 den ganzzahligen Anteil von x bezeichnet.

Der gemessene Massendefekt wird also als Differenz zwischen m und derjenigen Nominalmasse ΓΠ bestimmt, deren zugehörige erwartete Peptidmasse /r?p = (1+Γ Ρ )Π7Ν am dichtesten an m liegt.

In Fortbildung der Erfindung ist vorgesehen, dass die Diskrepanz δρ zwischen dem gemessenen und dem erwarteten Massendefekt direkt aus der gemessenen Masse m berechnet wird als wobei die Funktion φ(χ) = x-floor(x) den Nachkommaanteil von x für ein beliebiges x > 0 bezeichnet.

Nach einem weiteren Gedanken der Erfindung ist vorgesehen, dass zum Vergleich der gemessenen Massendefekte mit den erwarteten Massendefekten über Teilintervalle einer Massenachse jeweils der Median der gemessenen Massendefekte gebildet und mit dem erwarteten Massendefekt verglichen wird.

In Fortbildung der Erfindung werden bei weiterer Verwendung der Daten die Messwerte (der ermittelten Massen) korrigiert, nämlich in Abhängigkeit von der Abweichung der gemessenen Massendefekte von den erwarteten Massendefekten. Im einfachsten Fall werden die ermittelten Massen um die Differenzen der Massendefekte korrigiert. Nach einem weiteren Gedanken der Erfindung werden die gemessenen Massendefekte für lokale Maxima der spektralen Intensitäten berechnet. Jedes lokale Maximum wird als Peak einer bestimmten gemessenen Masse angesehen.

Ein weiteres erfindungsgemäßes Verfahren weist die Merkmale des Anspruchs 8 auf. Vorgesehen ist demnach ein Verfahren zum Auswerten von Daten einer Massenspektrometrie zur Analyse von Peptiden aus biologischen Proben, insbesondere einer MALDI-TOF- Massenspektrometrie, vorzugsweise nach einem der zuvor erörterten Verfahren, mit folgenden Schritten: a) Bereitstellung erwarteter Massendefekte;

b) Bestimmung gemessener Massendefekte, nämlich der sich aus den Daten der Massenspektrometrie ergebenden Massendefekte;

c) Bestimmung der Diskrepanzen zwischen den gemessenen Massendefekten und den erwarteten Massendefekten.

d) Bestimmung der Streuung der Diskrepanzen um deren Mittelwert;

e) Vergleich der Streuung mit einer definierten zulässigen Streuung. Je nach Abweichung der Streuung von der definierten zulässigen Streuung können die Daten bzw. eine zugrunde liegende Messung als fehlerhaft oder akzeptabel bewertet werden. Auch kann durch eine geeignete Signalquelle ein zur Bewertung der Daten korrespondierendes Signal ausgegeben werden, etwa eine Anzeige auf einem Bildschirm.

Sofern die Daten bzw. die Messung als akzeptabel bewertet werden, wird mit den Daten weiter gearbeitet und/oder es werden weitere Messungen durchgeführt. Bei als fehlerhaft bewerteten Daten können diese beispielsweise für die weitere Verarbeitung verworfen werden und/oder die für die Durchführung der Massenspektrometrie verwendete Vorrichtung wird einer Überprüfung unterzogen.

In Fortbildung der Erfindung ist vorgesehen, dass zur Bestimmung einer Streuung der Massendefektdiskrepanzen Interquartilsabstände der ermittelten Diskrepanzen über Teilintervalle der Massenachse bestimmt werden, und dass bei Überschreitung eines Grenzwertes der Streuung insbesondere die Daten als fehlerhaft verworfen werden.

Nach einem weiteren Gedanken der Erfindung ist ein Korridor für zulässige Streuungen gebildet durch die Grenzwerte

wobei v(m) = O p im) +

und Ο (Π7 ) = Oo + sp m N , mit σ 0 a 0,02 und SP = 2,0* 10 "5 , und Am(m) die Breite von m/z-Bins an der Massenposition m bezeichnet, und m/z-Bins die sich durch Diskretisierung der Massenachse ergebenden Intervalle repräsentieren, und μ > 0 einen Skalierungsfaktor angibt, vorzugsweise μ = 2, und wobei insbesondere die Daten als fehlerhaft verworfen werden, wenn die Streuung der Massendefektdiskrepanzen außerhalb des derart vorgegebenen Korridors liegt. In Fortbildung der Erfindung ist vorgesehen, dass der Massebereich mit erkennbarem Peptidsignal bestimmt wird als die Gesamtheit aller Teilintervalle der Massenachse, für die der Quotient aus der tatsächlichen Streuung und der maximal zulässigen Streuung cfp(m) einen festgelegten Schwellwert t nicht überschreitet, wobei vorzugsweise f = 1 ,2 festgelegt wird. Die untere bzw. obere Grenze dieses Massebereiches gibt die Ausdehnung des Peptidsignalbereiches an.

Je nach Unterschreitung eines Toleranzwertes für die obere Grenze oder die Ausdehnung des Peptidsignalbereiches, bzw. Überschreitung eines Toleranzwertes für die untere Grenze des Peptidsignalbereiches können die Daten bzw. eine zugrunde liegende Messung als fehlerhaft oder akzeptabel bewertet werden. Auch kann durch eine geeignete Signalquelle ein zur Bewertung der Daten korrespondierendes Signal ausgegeben werden, etwa eine Anzeige auf einem Bildschirm.

Sofern die Daten bzw. die Messung als akzeptabel bewertet werden, wird mit den Daten weiter gearbeitet und/oder es werden weitere Messungen durchgeführt. Bei als fehlerhaft bewerteten Daten können diese beispielsweise für die weitere Verarbeitung verworfen werden und/oder die für die Durchführung der Massenspektrometrie verwendete Vorrichtung wird einer Überprüfung unterzogen.

Das erfindungsgemäße massenspektrometrische Verfahren weist die Merkmale des Anspruchs 12 auf. Zur Analyse von Peptiden aus biologischen Proben, insbesondere unter Verwendung eines MALDI-TOF-Massenspektrometers, sind folgende Schritte vorgesehen:

a) Durchführung eines oder mehrerer massenspektrometrischer Untersuchungen an der biologischen Probe und Bereitstellung von sich aus den massenspektrometrischen Untersuchungen ergebenden Daten;

b) Durchführung eines der Verfahren zum Auswerten von Daten, wie zuvor dargestellt.

Eine weitere Lösung der eingangs genannten Aufgabe weist die Maßnahmen des Anspruchs 13 auf. Demnach ist ein Verfahren vorgesehen mit folgenden Schritten:

a) Messung von m/z-Werten für verschiede Peptide mittels einer Messapparatur, insbesondere unter Verwendung eines MALDI-TOF- Massenspektrometers,

b) Zuordnung der gemessenen m/z-Werte zu entsprechenden m/z-Bins eines 2D-Histogramms,

c) Auftrag von spektralen Intensitäten der m/z-Bins in dem 2D-Histogramm, wobei auf einer Abszissenachse die m/z-Bins und auf einer Ordinatenachse die Diskrepanz zwischen gemessenem und erwartetem Massendefekt aufgetragen werden, d) wobei die durch die beiden Achsen aufgespannte Diagrammfläche in eine Vielzahl, vorzugsweise 20 bis 50, von Rechtecken aufgeteilt wird,

e) wobei die gemessenen Werte auf eine m/z-Auflösung, die der gewählten Unterteilung der Ordinatenachse entspricht, hochinterpoliert werden, und f) wobei für jedes Rechteck diejenigen Intensitätswerte des interpolierten Spektrums aufsummiert werden, deren Massendefektdiskrepanz in die jeweiligen Teilintervalle der Achsen fallen,

g) wobei unterschiedliche Intensitätswerte unterschiedlich gekennzeichnet werden und gleiche Intensitätswerte gleich gekennzeichnet werden.

Bevorzugt kann es die Erfindung vorsehen, dass zu jedem Teilintervall der Abszissenachse, insbesondere der horizontalen Massenachse, die entsprechenden Intensitätswerte der Ordinatenachse statistisch ausgewertet werden, um Häufungspunkte und/oder Streuungswerte zu bestimmen.

Ein weiteres Ausführungsbeispiel kann es vorsehen, dass zur Beschreibung der Verteilung der aufsummierten Intensitätswerte in vertikaler Richtung zirkuläre Statistiken verwendet werden, insbesondere kann ein erstes zirkuläres Moment Z als (komplexwertige) Statistik herangezogen werden.

Insbesondere ist es denkbar, dass zur Bestimmung eines Massenshiftprofils (Vektor aller zirkulären Moment Z für alle Teilintervalle der Abszissenachse, insbesondere der horizontalen Massenachse) die Schritte zur Bildung des Histogramms und der Berechnung der zirkulären Momente zusammengesetzt werden und gemäß der Formel

als Fourier-Integrale des kontinuierlich interpolierten Spektrums S über die Teilintervalle der Abszissenachse ausgedrückt werden.

Eine weitere Lösung der eingangs genannten Aufgabe weist die Maßnahmen des Anspruchs 17 auf. Demnach ist ein massenspektrometrisches Verfahren zur Handhabung eines Einzelspektrums vorgesehen, bei dem für eine Massenshiftnormalisierung zu einem Ensemble für jedes Spektrum

a) ein Massenshiftprofil ermittelt wird,

b) aus allen einzelnen Massenshiftprofilen durch elementweise Bildung des arithmetischen Mittelwertes ein gemeinsames, mittleres Referenzprofil gebildet wird,

c) jedes Spektrum modifiziert wird, so dass das Massenshiftprofil des modifizierten Spektrums dem Referenzprofil entspricht, Darüber hinaus kann es vorgesehen sein, dass für die Normalisierung eines einzelnen Spektrums auf das Referenzprofil jeweils für die einzelnen Teilintervalle, für die die Massenshiftprofile berechnet werden, relative Verschiebungswerte bestimmt und über die gesamte Massenachse interpoliert werden, wobei die gemessenen Werte des Spektrums um diese interpolierten Verschiebungswerte korrigiert werden.

Ein MALDI-TOF-Massenspektrometer zur Lösung der vorbezeichneten Aufgabe wird durch Anspruch 19 beschrieben. Demnach weist dieses Massenspektrometer eine Steuereinheit auf zur Durchführung des erfindungsgemäßen Verfahren nach mindestens einem der Ansprüche 1 bis 18.

Weitere Merkmale der Erfindung ergeben sich aus der Beschreibung im Übrigen und aus den Ansprüchen. Vorteilhafte Ausführungsbeispiele der Erfindung werden nachfolgend anhand von Zeichnungen näher erläutert. Es zeigen:

Figur 1 einen Ausschnitt aus einem Mittelwertspektrum mit deutlich erkennbarer, wellenförmiger Grundlinie mit charakteristischer Wellenlänge von etwas mehr als 1 Da; Figur 2 ein herkömmliches Massendefektdiagram eines Mittelwertspektrums mit erkennbarem Peptidband;

Figur 3ein Peptidmassendefektdiagramm (PMD) des Mittelwertspektrums zu Figur 2, nämlich mit Darstellung einer Massenverschiebung über der Masse (m/z), mit horizontaler Referenzlinie für einen erwarteten Massendefekt und Referenzkorridor (gestrichelte Linien), Massendefektdiskrepanz und deren Streuung (durchgezogene Linien) sowie erwarteter Streuung (Strich-Punkt-Strich Linien) und oberer Grenze des Massebereichs mit erkennbarem Peptidsignal (gepunktete Linie);

Figur 4ein PMD eines Mittelwertspektrums mit stark reduziertem Signal-Rauschverhältnis, erkennbar am verkürzten Peptidsignalbereich, der nur bis ca. 1300 Da reicht; Figur 5ein PMD eines Spektrums mit deutlicher Massenverschiebung um ca. 0,15 bis 0,35 Da;

Figur 6ein PMD mit deutlich erkennbarer Linienstruktur aufgrund einer äquidistant gesampelten Massenachse;

Figur 7: ein PMD eines Mittelwertspektrums mit sehr grob gesampelter Massenachse; aufgrund des groben Samplings ist die Struktur des Peptidbandes kaum noch zu erkennen; Figur 8ein PMD eines Mittelwertspektrums mit fehlerhaft durchgeführter Kalibrierung, erkennbar am Bruch im Peptidband ab ca. m/z=1700;

Figur 9ein Peptidmassendefekthistogramm (PMH) eines Mittelwertspektrums mit Massenverschiebung vergleichbar zu der in Figur 5 gezeigten;

Figur 10 Mittelwertspektren vor (oben) und nach (unten) Massenshiftnormalisierung.

Die in einer MALDI-Messung registrierten Moleküle beinhalten insbesondere Metabolite und Peptide. Metabolite sind Stoffwechselprodukte und können unterschiedliche chemische Formen aufweisen, z.B. Lipide, Kohlehydrate oder Abbauprodukte von aus der Nahrung oder der Umwelt aufgenommenen Substanzen. Ihre Massen betragen typischerweise weniger als 1000 Da. Demgegenüber sind Peptide Verkettungen von Aminosäuren mit Massen von bis zu 5000 Da und mehr. Alle 23 in Proteinen vorkommende Aminosäuren - und damit alle Peptide - bestehen aus den fünf chemischen Elementen Kohlenstoff, Wasserstoff, Sauerstoff, Stickstoff und Schwefel. Das relative Verhältnis dieser Elemente zueinander ist bei allen Peptiden näherungsweise und unabhängig von ihrer Gesamtmasse gleich, so dass der Massendefekt eines Peptides im Wesentlichen durch dessen Nominalmasse bestimmt wird. Es ergibt sich ein nahezu linearer Zusammenhang zwischen der Masse m eines Peptids und seiner Nominalmasse rrin: m ~ mp(m ) = (1 + p) mN, mit r p « 4,95 χ 10 " .

Die Streuung der wahren Massen um den theoretischen Mittelwert m? ist relativ klein, ihre Standardabweichung kann mit

σρ(π7Ν) = OO + SP /T7N, mit oo = 0,02, Sp « 2,0 * 10 5 abgeschätzt werden.

Aufgrund der großen Zahl von unterschiedlichen Proteinen und daraus resultierenden Peptiden in biologischen Gewebezellen weist ein typisches MALDI-Spektrum Signalintensitäten an praktisch allen mp(mN) für einen breiten Bereich von Nominalmassen auf. Bildet man aus mehreren während der Vermessung einer Gewebeprobe gewonnen Spektren ein Summen- oder Mittelwertspektrum, siehe Figur 1 , so ist darin eine charakteristische, gleichmäßige Wellenlinie als Grundlinie 20 zu erkennen, die insbesondere oberhalb von ca. 1000 Da deutlich hervortritt und eine Wellenlänge von näherungsweise 1 +rp Da aufweist.

Die Bestimmung der Masse eines Moleküls ist mit einem Fehler behaftet, der im Wesentlichen von zwei Ursachen herrührt: Zum einen kann die Flugzeit eines Moleküls nur mit einer gewissen Genauigkeit und in diskreten Intervallen gemessen werden, woraus sich eine Diskretisierung der Massenachse, also eine Einteilung in aufeinanderfolgende Intervalle (m/z-Bins) ergibt. Üblicherweise ist die Breite der m/z-Bins nicht konstant sondern nimmt zu höheren Massen hin zu. Zum anderen hängt die Flugzeit des Moleküls nicht nur von seiner Masse ab sondern auch von dessen Anfangszustand innerhalb der lonenwolke zu Beginn der Beschleunigung. Dieser Anfangszustand, insbesondere Geschwindigkeit und Bewegungsrichtung des Moleküls, sind weitestgehend unbekannt und führen zu einem deutlichen Messfehler, der üblicherweise durch eine Kalibrierung nach der Messung korrigiert wird.

Zu den gängigen Kalibrierungsmethoden gehören die externe Kalibrierung und die statistische Peptidkalibrierung. Bei der externen Kalibrierung werden vor der Messung mehrere Tropfen einer Lösung mit definierten Inhaltsstoffen neben der Gewebeprobe platziert. Die darin gemessenen Spektren werden nach der Messung mit den erwarteten Massen der bekannten Inhaltsstoffe verglichen und es wird eine Kalibrierungskurve für die m/z-Achse eines Spektrums bestimmt. Bei der Peptidkalibrierung wird der oben beschriebene Zusammenhang zwischen wahrer Masse eines Peptids und dessen Nominalmasse ausgenutzt, um die mutmaßlich zu einem Peptid gehörenden Peakpositionen auf die theoretisch erwarteten m/z-Werte zu verschieben, siehe Wool A, Smilansky Z: Precalibration of matrix-assisted laser desorption/ionization-time of flight spectra for peptide mass fingerprinting. Proteomics 2002, 2, 1365-1373.

Beide Kalibrierungsmethoden können die Fehler in den m/z-Werten nicht vollständig korrigieren. Die externe Kalibrierung erfordert darüber hinaus eine manuelle Interaktion, während die Peptidkalibrierung sehr rechen- und zeitaufwändig ist.

Da bei dieser Methode der Ausgleich der Massenfehler global für alle Spektren einer Messung erfolgt, lassen sich unterschiedliche Fehler in den Spektren eines Datensatzes auf diese Weise nicht korrigieren. Als Alternative wird daher auch eine interne Kalibrierung angewandt, bei der die Kalibrierungslösung über die zu messende Gewebeprobe verteilt wird und somit eine individuelle Korrektur für jedes Spektrum der Messung möglich ist.

Aus praktischen Gründen kann eine Kalibrierungslösung nur eine geringe Anzahl bekannter Substanzen beinhalten. Dies limitiert die Anzahl der Stützstellen, aus denen die Kalibrierungskurve bestimmt wird, und damit die Genauigkeit der Kalibrierung. Darüber hinaus erfordert diese Form der Kalibrierung eine manuelle Benutzerinteraktion.

Demgegenüber sind Methoden der statistischen Peptidkalibrierung (siehe Wool A, Smilansky Z: Precalibration of matrix-assisted laser desorption/ionization-time of flight spectra for peptide mass fingerprinting. Proteomics 2002, 2, 1365-1373; Wolski WE, Lalowski M, Jungblut P, and Reinert K. Calibration of mass spectrometric peptide mass fingerprint data without specific external or internal calibrants. BMC bioinformatics, 6(1 ):203, 2005) vollautomatisch und kommen ohne Kalibrierungslösung aus. Bei diesen Methoden erfolgt die Korrektur durch Abgleich der im Gewebe gemessenen Massen mit einem theoretischen Peptidmassenmodell (s.o.) sowie einer Peptiddatenbank. Diese Methoden erfordern ein vorheriges Peak Picking, also eine Identifikation relevanter Peaks in einem Spektrum, sind sehr zeitaufwendig und können aufgrund falscher Zuordnung zwischen Peak und Peptiddatenbank zu fehlerhaften Ergebnissen führen.

Zur Visualisierung der in einem Spektrum beobachteten Massendefekte werden die m/z-Werte der in einem Spektrum gefundenen Peaks in einem Diagramm aufgetragen, dessen horizontale Achse der Masse m (bzw. dem m/z-Wert) entspricht, während auf der vertikalen Achse deren Nachkommaanteil m-floor(m) abgetragen wird, siehe Figur 2. Solche Diagramme werden benutzt, um unterschiedliche Zusammensetzungen komplexer Molekülmischungen sichtbar zu machen. Eine Variante sind sog. Kendrick-Massendefektdiagramme, die zur Charakterisierung von chemischen Verbindungen einer bestimmten Gruppe verwendet werden, siehe Wikipedia: Kendrick mass. https://en.wikipedia.org/wiki/Kendrick_mass. Im Zusammenhang mit Untersuchungen an Peptiden können Massendefektdiagramme zur Abgrenzung zwischen Peptiden und sog. Glykopeptiden herangezogen werden, siehe US 2016/0003842 A1 und Froehlich J et al.: A Classifier Based on Accurate Mass Measurements to Aid Large Scale, Unbiased Glycoproteomics. Mol. Cell. Proteomics 2013, 12, 1017-1025.

Darüber hinaus können Peptide gezielt chemisch so modifiziert werden, dass sie einen vom Peptidmassenmodell (auch als Averagine-Modell bezeichnet) signifikant abweichenden Massendefekt aufweisen und mittels dieser Abweichung von unmodifizierten Peptiden abgegrenzt werden können, siehe Chen X, Savickas P, Vestal M. Methods and Systems for mass defect filtering of mass spectrometry data. US Patent 7,634,364, filed 2006-06-23, granted 2009- 12-15; Yao X, Diego P, amos AA, Shi Y. Averagine-scaling analysis and fragment ion mass defect labeling in peptide mass spectrometry. Anal. Chem. 2008 Oct 1 ;80(19):7383-91. doi: 10.1021/ac801096e; Sleno L. The use of mass defect in modern mass spectrometry. J. Mass. Spectrom. 2012, 47: 226-236. doi:10.1002/jms.2953

Bei dieser Methode der Massendefektfilterung wird demnach der zu einem spektralen Peak bestimmte Massendefekt genutzt, um das zugehörige Molekül chemisch näher zu charakterisieren. Eine ausreichend hohe Genauigkeit in der Massenbestimmung muss daher für diese Methode vorausgesetzt werden.

Zur grafischen Veranschaulichung der Massendefektfilterung wird gelegentlich eine von der üblichen Massenskala abweichende Darstellung verwendet, bei der in vertikaler Richtung anstelle des Massendefektes die Abweichung von der jeweils nächstgelegenen, dem Averagine-Modell entsprechenden Masse abgetragen wird, siehe Yao X, Diego P, Ramos AA, Shi Y. Averagine-scaling analysis and fragment ion mass defect labeling in peptide mass spectrometry, Anal. Chem. 2008 Oct 1 ; 80(19):7383-91. doi: 10.1021/ac801096e.

Im jeweiligen Kontext dienen diese Diagramme lediglich der Illustration der Methode mittels exemplarischer, synthetisch berechneter Peptidmassen. Eine Anwendung dieser Darstellungsform auf tatsächlich gemessene Daten ist nicht bekannt.

Aus einem über mehrere Spektren einer MALDI-Messung gebildeten Mittelwertspektrum lässt sich ein Diagramm erstellen, das als Peptidmassendefektdiagramm (PMD) bezeichnen wird. Hierzu bestimmt man eine Liste aller lokalen Maxima und ihrer jeweiligen m/z-Werte, sowie für jeden m/z-Wert die Abweichung von der jeweils nächstgelegenen, dem theoretischen Peptidmassenmodell entsprechenden Masse. Unter der Annahme, dass die gemessenen Signale auf Peptide zurückzuführen sind, wird nun für jeden m/z- Wert m diejenige Nominalmasse mn bestimmt, für die die Abweichung zwischen m und der nach dem theoretischen Peptidmassenmodell (Averagine-Modell, s. o.) erwarteten Masse mp(mn) im Betrag minimiert wird (s.u.). Die minimale Abweichung «S P (m), die Werte von -0,5 bis 0,5 annehmen kann, wird als Peptidmodelldistanz bezeichnet. Die Peptidmodelldistanz entspricht der weiter oben beschriebenen Diskrepanz zwischen gemessenem und erwartetem Massendefekt.

Die Positionen aller lokalen Maxima werden nun in ein Diagramm eingetragen, dessen horizontale Achse wiederum der Masse bzw. dem m/z-Wert entspricht, und auf dessen vertikaler Achse die oben bestimmte Abweichung vom Peptidmassenmodell abgetragen ist.

Gegenüber dem bekannten Massendefektdiagramm wird das PMD also durch eine Transformation erzeugt, die die Positionen der theoretisch erwarteten Peptidmassendefekte auf die Referenzlinie 22 abbildet, die eine waagerechte Nulllinie ist. Darüber hinaus unterscheidet sich das PMD von bekannten Darstellungen dadurch, dass hierfür keine vorherige spezifische Signalanalyse durchgeführt wird, inbesondere keine Identifikation von signifikanten Peptidpeaks (Peak Picking). Vielmehr spiegelt das PMD im Wesentlichen statistische Eigenschaften des spektralen Hintergrundsignals wieder (vgl. Abb. 1 ), von dem lediglich angenommen wird, das es zu großen Anteilen von Peptidmolekülen herrührt. Die vertikale Achse erstreckt sich von -0,5 bis 0,5 und stellt die vorzeichenbehaftete Diskrepanz zwischen dem für ein Peptid erwarteten und dem tatsächlich gemessenen Massendefekt dar. Zusätzlich zur Referenzlinie 22 kann ein Referenzkorridor mit Linien 23, 24 eingezeichnet werden, der die erwartete Streuung der Peptidmassendefekte um ihren Mittelwert darstellt, unter Berücksichtigung der für eine Messung gegebenen Diskretisierung der Massenachse.

An einem PMD lassen sich leicht folgende Qualitätseigenschaften eines Spektrums ablesen:

1 . Massenbereich mit Peptidsignalen: Ein klar erkennbares Band („Peptidband 21 ") in der Nähe der Referenzlinie 22 lässt auf das Vorhandensein von Peptidsignalen in dem jeweiligen Massenbereich schließen. Wo sich die Bandstruktur in einer unstrukturierten Punktwolke verliert (typischerweise erkennbar am oberen Ende der Massenachse, rechts von einer oberen Grenze 30), geht das Peptidsignal im Rauschen unter (Figuren 3,4).

Massenverschiebung: Weicht das Peptidband 21 erkennbar von der Referenzlinie 22 ab, so lässt dies auf eine Diskrepanz zwischen den wahren und den gemessenen Molekülmassen schließen. Die Größe der Diskrepanz entspricht dem vertikalen Versatz zwischen der Referenzlinie 22 und der Mittellinie 25 des Peptidbands 21. Der Referenzkorridor gibt dabei den Bereich an, in dem eine Verschiebung durch die jeweilige Diskretisierung der Massenachse erklärbar ist (Figuren 3,5). 3. Äquidistant oder zu grob gesamplete Massenachse: Ein MALDI-TOF Massenspektrometer diskretisiert die Massenachse typischerweise nicht äquidistant sondern mit zu hohen Massen hin zunehmender Binbreite. Bei der Nachverarbeitung von Spektraldaten werden die Daten häufig auf eine äquidistante Massenachse mit niedrigerer Auflösung resamplet, wodurch ein Genauigkeitsverlust entsteht. Eine äquidistante

Massenachse ist im PMD deutlich durch eine lineare Struktur der aufgetragenen Punkte erkennbar (Figur 6). Ist die Auflösung der Daten nach dem Resampling zu niedrig, verliert sich die Struktur des Peptidbandes 21 (Figuren 6,7).

Fehlerhafte Kalibrierung der Massenachse: Bei der Kalibrierung der Massenachse können Fehler auftreten, die zu einer unstetigen Verzerrung der Massenachse führen. Solche Verzerrungen treten im PMD als ein Bruch bzw. Versatz im Peptidband 21 auf (Figur 8).

Im Vergleich zur Visualisierung mittels herkömmlicher Massendefektdiagramme sind in einem PMD die oben genannten Qualitätsmerkmale eines Spektrums sehr viel deutlicher erkennbar, insbesondere können auch kleinere oder auf Teilabschnitte der Massenachse beschränkte Massenverschiebungen als Abweichungen von der horizontalen Referenzlinie 22 leichter erfasst werden. Statt für ein Mittelwertspektrum kann ein PMD auch für ein Einzelspektrum oder für das Maximumspektrum über mehrere Einzelspektren (sog. Skyline-Spektrum) gebildet werden, diese Darstellung ist jedoch weniger aussagekräftig.

Neben der reinen Visualisierung können die in einem PMD dargestellten Informationen auch wie folgt quantitativ ausgewertet werden (siehe auch mathematische Formulierung weiter unten): 1 . Bestimmung der Diskrepanz zwischen gemessenem und erwartetem Peptidmassendefekt in Abhängigkeit von der Masse. Hierzu wird der Median der Massendefekte über Teilintervalle der Massenachse gebildet und mit dem erwarteten Wert verglichen. 2. Bestimmung der Streuung der Massendefekte um deren Mittelwert.

Hierzu wird der Interquartilsabstand der Massendefekte über Teilintervalle bestimmt und in ein vorgegebenes Vielfaches der Standardabweichung einer angenommenen Normalverteilung umgerechnet. 3. Bestimmung des Massebereiches mit erkennbarem Peptidsignal. Hierzu wird die aus den Daten bestimmte Streuung der Massendefekte (Bereich zwischen Linien 26, 27) mit der Breite des Referenzkorridors (Bereich zwischen Linien 23, 24) verglichen und der Bereich ermittelt, in dem die Abweichung innerhalb einer gewählten Toleranz bleibt.

Diese quantitativen Informationen können sowohl im PMD dargestellt als auch numerisch angezeigt bzw. zur Qualitätsbewertung der Messung weiterverarbeitet werden. Mit

5 = (Sj,mj)j =1 ...„, mit n E N, 0 < <■·· < n wird ein (Einzel-, Mittelwert- oder Skyline-) Spektrum bezeichnet, bestehend aus den n Intensitäten Si ... s n zu den m/z-Werten m-[ ... m n . Mit floor(x) für x > 0

wird der ganzzahligen Anteil einer positiven Zahl x bezeichnet, mit

<p(x) = x - floor(x) für x > 0 wird der Nachkommaanteil einer positiven Zahl x bezeichnet.

Das PMD der lokalen Maxima von S besteht aus der grafischen Darstellung der

Punkte wobei u C N den Radius der lokalen Umgebung bezeichnet, über die die lokalen Maxima gebildet werden, und die Funktion die vorzeichenbehaftete Diskrepanz zwischen dem für ein Peptid erwarteten und dem tatsächlich gemessenen Massendefekt beschreibt. Die obige Darstellung der Diskrepanz 5p(m) ergibt sich wie folgt:

Der theoretisch erwartete Massendefekt eines Peptids mit Nominalmasse ΓΠΝ beträgt 77p— Irin = ( 1 +ΓΡ)Π7Ν— ΓΠΝ - Γρ Π?Ν.

Zu einer tatsächlich gemessenen Masse m eines Peptids wird dessen Nominalmasse als diejenige ganzzahlige Masse mn angenommen, für die die absolute Differenz minimiert wird. Dies führt zu m N = floor(-^- + I

Vl+rp

Die Diskrepanz 0>(m) ergibt sich aus der Differenz zwischen gemessenem und erwarteten Massendefekt zu

<5p(m)

Die Gewichtung der Differenz der Massendefekte mit 1/(1 +rp) dient der Normalisierung von öp(m) auf den Wertebereich [-0,5 ... 0,5].

Die Referenzlinie 22 der theoretisch erwarteten mittleren Massendefekte von Peptiden wird durch die Nulllinie ö> = 0 beschrieben. Zur Bestimmung des Referenzkorridors (Linien 23, 24) wird die erwartete Varianz v(m) der Positionen der lokalen Maxima in Abhängigkeit von der Masse betrachtet, die durch die Summe aus der Varianz der wahren Peptidmassen O^P und der von der Diskretisierung der Massenachse herrührenden Varianz abgeschätzt werden kann,

Am(m)

\2~

Darin bezeichnet Am(m) die Breite der m/z-Bins an der Massenposition m. Der Referenzkorridor wird durch die Begrenzungslinien 23, 24 bzw.

gebildet, wobei der Skalierungsfaktor μ > 0 die Breite des Korridors als Vielfaches einer Standardabweichung angibt (typischerweise μ = 2).

Zu dem Spektrum S sei eine Partitionierung / der Massenachse in paarweise disjunkte Intervalle /* gegeben:

' = mit Ä " E N, U k k = [m 1( mj. Zu einem PMD, in dem die Punkte dargestellt sind, wird zur Bestimmung der Massendiskrepanz E(m) für die Teilintervalle die Diskrepanz

E k = median (5p Cwij) ü C i n iJ gebildet. Die Ek werden als Punkte über den jeweiligen Mittelpunkten der zugehörigen Teilintervalle U dargestellt, dazwischen wird geeignet interpoliert (z.B. linear).

Die Streuung e(m) der Massendefekte wird in analoger Weise aus den Interquartilsabständen (IQR) gebildet, wobei der Skalierungsfaktor μ > 0 wiederum die Breite des Korridors als Vielfaches einer Standardabweichung angibt, typischerweise μ = 2, und erf die gaußsche Fehlerfunktion bezeichnet.

Als Massebereich mit erkennbarem Peptidsignal wird derjenige Teil der Massenachse bestimmt, für den das Verhältnis zwischen beobachteter (Linien 26, 27) und erwarteter Streuung (Linien 28, 29) unterhalb einer festgelegten Toleranzschwelle t bleibt:

Ein typischer Toleranzwert ist f = 1 ,2. Die Positionen der äußeren Ränder von M P können im PMD als vertikale Linien eingezeichnet werden.

Die zuvor beschriebene Darstellung eines Spektrums in einem PMD lässt sich prinzipiell sowohl auf Mittelwert- als auch auf Einzelspektren anwenden. Sie setzt jedoch die Identifikation von lokalen Maxima in dem betreffenden Spektrum voraus und damit einen ausreichend hohen Signal-Rauschabstand, der bei Einzelspektren typischerweise nicht gegeben ist. Durch die Darstellung der Spektren in einem Peptidmassendefekthistogramm (PMH) kann dieser Nachteil umgangen werden. Hierzu werden alle spektralen Intensitäten zu sämtlichen m/z-Bins eines Spektrums in einem 2D-Histogramm dargestellt, in dem wiederum die horizontale Achse der Massenachse entspricht und die vertikale Achse die Peptidmodelldistanz zur jeweiligen Masse darstellt (s.u.). Beide Achsen werden gleichmäßig in vorher gewählte Anzahlen von Teilintervallen unterteilt (typischerweise 20-50, kann für beide Achsen unterschiedlich sein), woraus sich eine Partitionierung der Diagrammfläche in rechteckige Kacheln ergibt. Das zu untersuchende Spektrum wird nun auf eine m/z-Auflösung, die der gewählten Unterteilung der Massendefektachse entspricht, hochinterpoliert. Für jede Kachel werden dann alle diejenigen Intensitätswerte des interpolierten Spektrums aufsummiert, deren Massen und Massendefekte in die jeweiligen Teilintervalle der horizontalen bzw. vertikalen Achse fallen.

Zur grafischen Darstellung können schließlich alle Kacheln mit einer geeignet gewählten Grauwert- oder Farbskala entsprechend der aufsummierten Intensitäten visualisiert werden. Wie im PMD werden zusätzlich die Referenzlinie 31 sowie der Referenzkorridor 32, 33 eingezeichnet (Fig. 9). Das PMH lässt sich in gleicher Weise interpretieren wie das PMD.

Analog zur quantitativen Auswertung eines PMD lassen sich charakteristische Größen eines Spektrums auch aus einem PMH - und somit auch für Einzelspektren - berechnen. Hierzu wird zu jedem Teilintervall der horizontalen Massenachse eine Auswertung jeweils der vertikal angeordneten, aufsummierten Intensitätswerte durchgeführt, um daraus Häufungspunkte und Streuungswerte zu bestimmen.

Es ist dabei zu beachten, dass die obere und die untere Randlinie eines PMH, also die Punkte, die zu den extremen Distanzwerten +0,5 und -0,5 gehören, als miteinander identifiziert aufgefasst werden können. Zur Beschreibung der Verteilung der aufsummierten Intensitätswerte in vertikaler Richtung sind daher zirkuläre Statistiken geeignet. Insbesondere kann das erste zirkuläre Moment Z als (komplexwertige) Statistik herangezogen werden (mathematische Formulierung s. u.). Die zirkulären Momente Z für alle Teilintervalle der Massenachse zusammengenommen werden hier als Massenshiftprofil des betrachteten Spektrums bezeichnen. Das komplexe Argument von Z entspricht (bis auf einen Faktor von 2π/(1+Γρ)) der Diskrepanz zwischen gemessenen und erwarteten Massen. Der Betrag von Z liefert ein reziprokes Maß für die Streuung der gemessenen Peptidmodelldistanzen: Der Wert Z=0 entspricht einer maximalen Streuung aller Messungen über das Intervall [-0,5 .. 0,5], während im Extremfall einer minimalen Streuung, bei der alle Distanzwerte identisch sind, Z einen Wert mit Betrag 1 annimmt. Für die tatsächliche Berechnung des Massenshiftprofils Z können die beiden Schritte der Bildung des 2D-Histogramms und der Berechnung der zirkulären Momente zusammengefasst und als Fourier-Integrale des Spektrums über die Teilintervalle der assenachse ausgedrückt werden (s. u.). Numerisch lassen sich diese Integrale durch geeignete Integrationsformeln (z.B. Trapezformel oder Simpson'sche Regel) approximieren. Dabei kann auch auf eine feinere Diskretisierung und Interpolation des Spektrums verzichtet und direkt mit den diskreten spektralen Intensitäten in der ursprünglich vorliegenden Auflösung gerechnet werden. Das Massenshiftprofil liefert eine Abschätzung der in einem Spektrum auftretenden Messfehler der gemessenen Massen gegenüber den wahren Massen. In der Praxis ist es häufig wünschenswert, diese Verschiebungen zu korrigieren und so zu einer höheren Genauigkeit der gemessenen Massen eines Spektrums zu gelangen.

Andererseits wird das Massenshiftprofil durch einen Abgleich der gemessenen Daten mit dem relativ einfachen, linearen Averagine-Modell (s. o.) gewonnen. Die Abschätzung der Massenfehler durch das Massenshiftprofil kann daher nicht genauer sein als die Genauigkeit des Modells selbst, das zumindest im unteren Massenbereich bis ca. 1000 Da für viele Anwendungen nicht ausreichend hoch ist. Eine Korrektur der gemessenen Massen um die geschätzten Messfehler könnte daher dazu führen, dass Teile der Messung ungenauer werden.

Für viele Anwendungen ist jedoch nicht eine absolute Massengenauigkeit ausschlaggebend, sondern vielmehr eine möglichst gute Vergleichbarkeit zwischen einzelnen Spektren aus ein- und derselben oder aus mehreren Messungen. Der absolute Messfehler der gemessenen Massen eines Spektrums ist in diesen Fällen weniger relevant als die Differenzen der Messfehler innerhalb eines Ensembles von Spektren.

Das Verfahren der Massenshiftnormalisierung besteht darin, zu einem Ensemble zunächst für jedes Spektrum das jeweilige Massenshiftprofil zu ermitteln (s. o.), aus allen einzelnen Massenshiftprofilen ein gemeinsames, mittleres Referenzprofil zu bilden, und schließlich jedes Spektrum so zu modifizieren, dass das Massenshiftprofil des modifizierten Spektrums dem Referenzprofil entspricht. Durch diese Angleichung wird die relative Abweichung zwischen den zu ein- und demselben Peptid gehörenden Signalpeaks der einzelnen Spektren verringert und die Vergleichbarkeit der Spektren wird erhöht (Fig. 10, unten). Das Referenzprofil wird durch elementweise Bildung des arithmetischen Mittelwertes bestimmt (s. u.). Für die Normalisierung eines einzelnen Spektrums auf das Referenzprofil werden jeweils für die einzelnen Teilintervalle, für die die Massenshiftprofile berechnet wurden, relative Verschiebungswerte bestimmt und diese über die gesamte Massenachse interpoliert. Die gemessenen Massenwerte des Spektrums werden dann um diese interpolierten Verschiebungswerte korrigiert.

Durch die Anwendung dieser Verschiebungen erhält jedes einzelne Spektrum eine eigene Massenachse. Für eine gemeinsame Auswertung eines Ensembles von Spektren ist es meist wünschenswert, dass alle Spektren auf einer gemeinsamen Massenachse definiert sind. Dies lässt sich dadurch erreichen, dass eine gemeinsame Massenachse gebildet wird (z.B. durch Mittelung über alle einzelnen Massenachsen oder durch Auswahl einer beliebigen Massenachse als Referenzmassenachse) und anschließend jedes normalisierte Spektrum auf die gemeinsame Massenachse interpoliert wird. Peptidmassendefekthistogramm:

Mit 5 = (s ,tti/)y=i.„„, mit n e N, 0 < in! < ··■ < τη η

Wird wie oben ein (Einzel-, Mittelwert- oder Skyline-) Spektrum bezeichnet, bestehend aus den n Intensitäten Si... s„ zu den m/z-Werten Zu einem Spektrum S sei wie oben eine Partitionierung / der Massenachse gegeben sowie eine weitere Partitionierung J des Intervalls [-0,5 ... 0,5],

Zu den Partitionierungen I und J liefert r k l = (m e i k : <s P (m) e;,) eine feinere Partitionierung der Massenachse, bei der die Teilintervalle r w den einzelnen Kacheln des 2D-Histogramms zugordnet sind. Weiter sei eine Interpolierende des Spektrums S durch eine kontinuierliche Funktion S(rn) gegeben, S: [mi, m„] -» R, mit S(m j = S j = 1... n.

Die Matrix H _S) = (h k .i) se ' durch

h k l = 1 +Γρ f 5(t) dt für k = Ι .,. Κ, Ι = 1 ...L

definiert. Zur numerischen Berechnung der h k l kann z.B. 5 als lineare Interpolierende von S gewählt werden, die Integrale lassen sich dann exakt auswerten. Zur Bildung des PMH wird die Matrix H S) als Grauwert- oder Falschfarbenbild dargestellt.

Massenshiftprofil:

Mit den Bezeichnungen und Definitionen des vorigen Abschnittes ist das erste zirkuläre Moment der Spalten von H gegeben durch die komplexwertigen Größen wobei <5, die Mittelwerte der Intervalle ] t bezeichnet. Im Grenzfall infinitesimal feinen Partitionierung J (d.h. L -» oo) lassen sich die Z* durch darstellen. Zur konkreten numerischen Berechnung dieser Integrale können eine geeignete Integrationsformel (z.B. Trapezformel oder Simpson'sche Regel) und als Stützstellen von 5 gerade die diskreten Messpunkte (τη 7 -)/_ ι...„ gewählt werden. Wegen s mj) = Sj entfällt dann die Notwendigkeit, das Spektrum S explizit zu interpolieren.

Massenshiftnormalisierung:

Ein Ensemble von N Spektren S' (i = l ...Λ ) sei gegeben, die eine gemeinsame Massenachse aufweisen. Weiter sei eine Partitionierung / der Massenachse in K Teilintervalle wie oben gegeben. Die zu dieser Partitionierung für die einzelnen Spektren 5' berechneten Massenshiftprofile seien mit Z' bezeichnet:

* = (4) k=l.,Jf für i = 1 ...ΛΓ

Zu den Massenshiftprofilen Z' wird das Referenzprofil Z durch elementweise arithmetische Mittelwertbildung berechnet: Sei nun 5 = {s j .m j ) n ein beliebiges, über derselben Massenachse definiertes

Spektrum mit Massenshiftprofil Z = (Z k k =i._K. Zu jedem Teilintervall der Partitionierung / wird nun eine relative Verschiebung bestimmt, wobei arg(z) e (-π, π] die komplexe Argumentfunktion bezeichnet. Die einzelnen Verschiebungen A k werden den Mittelpunkten der Teilintervalle I k zugeordnet und über die gesamte Massenachse interpoliert (typischerweise mittels linearer Interpolation). So wird ein Verschiebungsvektor Δ* = (Δ^) erhalten. Das normalisierte Spektrum 5* wird durch Anwendung der Verschiebungswerte auf die m/z-Werte des Spektrums S erhalten,

S* = (s j ,m*) , mit m = m J + Δ*

*****

Bezugszeichenliste

20 Grundlinie

21 Peptidband

22 Referenzlinie

23 Linie für Referenzkorridor

24 Linie für Referenzkorridor

25 Mittellinie als

Massendefektdiskrepanz

26 Linie für Massendefektstreuung

27 Linie für Massendefektstreuung

28 Linie für erwartete Streuung

29 Linie für erwartete Streuung

30 obere Grenze

31 Referenzlinie

32 Linie für Referenzkorridor

33 Linie für Referenzkorridor