Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR THE REDUCTION OF A DATA RECORD
Document Type and Number:
WIPO Patent Application WO/2007/079819
Kind Code:
A1
Abstract:
Disclosed is a computer method for reducing a data record comprising N (n+1) -tuples (x1a, x2a, ..., xna, ya), wherein a=1,2, ..., N while n amounts to at least 2. Said method encompasses the following steps: a) a first cumulative data record is created by adding up the y-values of the tuples; b) a second cumulative data record is created by replacing the added y-values of the tuples with the sums of the y-values of the tuples whose x2-values lie within an interval around the x2-value of the original tuple of the first cumulative data record; c) a threshold value is determined for the y-values; d) the y-values of the nth cumulative data record are compared to the respective threshold value; e) a reduced data record is generated by removing all tuples whose respective y-value in the nth cumulative data record from step b) or c) does not exceed the threshold value, from the data record that is to be reduced.

Inventors:
WOZNY MANFRED (DE)
Application Number:
PCT/EP2006/011252
Publication Date:
July 19, 2007
Filing Date:
November 23, 2006
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
WOZNY MANFRED (DE)
International Classes:
H03M7/30; G01N30/00; G01N30/72; G01N30/86
Domestic Patent References:
WO2005031791A22005-04-07
Other References:
HIGHCHEM: "Spectra Average", WEBSITE, 13 October 2004 (2004-10-13), pages 1, XP002432415, Retrieved from the Internet [retrieved on 20070507]
HIGHCHEM: "Background subtraction", WEBSITE, 13 October 2004 (2004-10-13), pages 1, XP002432416, Retrieved from the Internet [retrieved on 20070507]
HIGHCHEM: "Exporting Data Reduced Chromatograms", WEBSITE, 13 October 2004 (2004-10-13), pages 1, XP002432417, Retrieved from the Internet [retrieved on 20070507]
Attorney, Agent or Firm:
WINTER BRANDL FÜRNISS HÜBNER RÖSS KAISER POLTE - PARTNERSCHAFT - (Freising, DE)
Download PDF:
Claims:

Ansprüche

1. Computerverfahren zur Reduktion eines Datensatzes, der aus N (n+l )-Tupeln (xi α>

X 2αr- - -i χ nω Ya) besteht, wobei a=l , 2,..., N gilt und n mindestens 2 beträgt, das die folgenden Schritte aufweist: a) Erstellen eines ersten Summendatensatzes dadurch, dass die y-Werte der

Tupel ersetzt werden durch die Summen der y- Werte derjenigen Tupel, deren x i -Werte in einem Intervall um den Xi-Wert des ursprünglichen Tupels liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der Xi-Dimension entsprechen, b) Erstellen eines zweiten Summendatensatzes dadurch, dass die y- Werte der

Tupel des in a) erhaltenen ersten Summendatensatzes ersetzfSverden durch die Summen der y- Werte derjenigen Tupel, deren x 2 - Werte in einem Intervall um den x 2 -Wert des ursprünglichen Tupels des ersten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x 2 -Dimension entsprechen, c) Für alle n>2 , falls vorhanden: Erstellen eines n- ten Summendatensatzes dadurch, dass die y- Werte der Tupel des in b) erhaltenen n-1 -ten Summendatensatzes ersetzt werden durch die y- Werte derjenigen Tupel, deren x n -Werte in einem Intervall um den x n -Wert des ursprünglichen Tupels des n- 1 -ten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x n -Dimension entsprechen, d) Ermitteln mindestens eines jeweiligen ersten statistischen Parameters des jeweiligen n-ten Summendatensatzes aus Schritt b) oder c), e) Ermitteln eines jeweiligen Schwellenwertes für die y-Werte aus dem jeweiligen ersten statistischen Parameter, f) Vergleichen der y-Werte des n-ten Summendatensatzes mit dem jeweiligen Schwellenwert, g) Erzeugen eines reduzierten Datensatzes durch Entfernen aller Tupel des zu reduzierenden Datensatzes, deren entsprechender y-Wert im n-ten

Summendatensatz aus Schritt b) oder c) nicht größer als der Schwellenwert ist.

2. Computerverfahren zur Reduktion von Chromatographie- Massenspektroskopiedatensätzen durch Entfernen unspezifischer Signale aus

Datensätzen, die aus einer Gesamtheit von N Massenspektren M α bestehen, die zu

den aufeinander folgenden Zeiten t α aufgenommen werden und die jeweils n α

Wertepaare (xαj.yαj) aufweisen, wobei die x α j die m/z-Werte und die y α j die

Intensitätswerte darstellen und CC G {1,2,..., Nj sowie J £ \1 5 2,..., Yl a j gilt, das die folgenden Schritte aufweist: a) für α e {l,...N} Summieren von einzelnen Massenspektren aus der

Gesamtheit der Massenspektren einschließlich M α , die innerhalb eines t α

einschließenden Zeitintervalls T α aufgenommen wurden, zu jeweiligen ersten

Summenmassenspektren M' α bestehen aus n' α Wertepaaren (x' α k > y'αkλ wobei

K E )l,2,.., Yl a f gilt, und die Breite der Zeitintervalle T α in

Abhängigkeit von der Breite von mindestens einem chromatographischen Peak im Zeitbereich um t α bestimmt wird,

b) für jedes x' a \^ eines jeweiligen ersten Summenmassenspektrums M' α

Summieren der Werte y' αrn , deren entsprechende Werte x' αm in einem m/z-

Intervall X' α k um x'αk liegen, zu jeweiligen Summenwerten y" α k, um ein

jeweiliges zweites Summenmassenspektrum M" α zu erhalten mit den

Wertepaaren (x"αk =x αk > y "αk) > wobei das m/z-Intervall X'αk m Abhängigkeit von der Breite der entsprechenden massenspektrometrischen Peaks im Bereich um x' α k bestimmt wird,

c) Ermitteln mindestens eines jeweiligen ersten statistischen Parameters des jeweiligen zweiten Summenmassenspektrums M" α ,

d) Ermitteln eines jeweiligen Schwellenwerts Y α aus dem jeweiligen ersten statistischen Parameter.

e) Vergleichen der Summenwerte y"^ mit dem jeweiligen Schwellenwert Y α , f) Erzeugen eines jeweiligen reduzierten Datensatzes durch Entfernen der

Wertepaare (x α j, y α j) der jeweiligen Massenspektren M α , für die die

entsprechenden Summenwerte y" α k nicht größer als der jeweilige

Schwellenwert Y α sind, wobei x" α k = x α j gilt.

3. Verfahren gemäß Anspruch 2, wobei im Schritt a) eine gewichtete Summation

erfolgt, bei der die Gewichtung der zu summierenden Massenspektren Mp eine mit

dem Betrag t α — tp des zeitlichen Abstands des Massenspektrums vom jeweiligen

Massenspektrum M α monoton abnehmende Funktion darstellt.

4. Verfahren gemäß Anspruch 2, wobei im Schritt b) eine gewichtete Summation erfolgt, bei der die Gewichtung der jeweiligen Werte y' αm eine mit dem Betrag

v 1 — v '

λ am ak des Abstandes des jeweiligen Wertes x' αrn von x' a k monoton

abnehmende Funktion darstellt.

5. Verfahren gemäß einem der Ansprüche 2 bis 4, wobei die Ermittlung des

Schwellenwertes Y α im Schritt d) die folgenden Schritte aufweist:

da) Ermittlung eines ersten Schwellenwertes Y α i aus dem ersten statistischen Parameter,

db) Ermitteln mindestens eines zweiten statistischen Parameters für diejenigen

Wertepaare des zweiten Summenrnassenspektrums M" α , für die der

Summenwert y"^ größer als der erste Schwellenwert Y α j ist,

de) Ermitteln eines zweiten Schwellenwertes Y α 2 aus dem zweiten statistischen Parameter, dd) Wiederholen der Schritte da) bis de) bis der Betrag der Differenz zwischen dem ersten Schwellenwert Y α i und dem zweiten Schwellenwert Y α 2 einen vorbestimmten Grenzwert δY nicht mehr übersteigt.

6. Verfahren gemäß einem der Ansprüche 2 bis 5, wobei die Schritt* c) bis e) für den gesamten Wertepaarbereich des jeweiligen zweiten Summenrnassenspektrums M" α durchgeführt werden.

7. Verfahren gemäß einem der Ansprüche 2 bis 6, wobei zur Durchführung der Schritte c) bis e) das jeweilige zweite Summenmassenspektrum M" α in

Wertepaarteilbereiche I ακ mit ^ ^ {^)-}λ α | und

[ X aL X a ^ ] = L . unterteilt wird, und die Schritte c) bis e) 1 jeweils für einen Wertepaarteilbereich I ακ durchgeführt werden.

8. Verfahren gemäß Anspruch 7, wobei der jeweilige Wertepaarteilbereich I ακ in Abhängigkeit von der Breite der massenspektrometrischen Peaks bestimmt wird.

9. Verfahren gemäß einem der Ansprüche 2 bis 8, wobei der jeweilige Zeitbereich T α im Wesentlichen der vollen Breite auf halber Höhe, FWHM, der chromatographischen Peaks entspricht.

10. Verfahren gemäß einem der Ansprüche 2 bis 9 wobei das m/z-Intervall X' ακ im

Wesentlichen der vollen Breite auf halber Höhe, FWHM, der massenspektrometrischen Peaks entspricht.

11. Verfahren gemäß einem der Ansprüche 7 bis 10, wobei die Wertepaarteilbereiche I ακ entsprechend der folgenden Gleichungen bestimmt werden:

L α(κ+1) x ( α u ( ) κ+l ) , x ( α 0 ( ) κ+l ) mit :

x (u) = x (0)

x ( α 0 ( ) κ+l ) = ß r - δ( V x ( O 0 K ) ) / , 3 falls ß ' - δ( v x ( α o K0 7 < x α ! π α <

x' αl( κ+l ) = x" α n α , falls ß - δ(x< 0) ) > x"

wobei x die untere Grenze und λ <χκ die obere Grenze des

Wertepaarteilbereichs I ακ sind, ß einen Faktor darstellt, der größer als 5 ist und δ

für die Breite des m/z-Intervalls X' α κ i m Wertepaarbereich I ακ steht.

12. Verfahren gemäß einem der Ansprüche 1 bis 1 1, wobei im Schritt c) der Mittelwert

MW 0 , und die Standardabweichung SD α der von Null verschiedenen Intensitätswerte als statistische Parameter bestimmt werden und im Schritt d) der Schwellenwert Y α entsprechend der Gleichung

Y α = MW α + f(α) SD α bestimmt wird, wobei f(α) einen Faktor darstellt.

13. Verfahren gemäß Anspruch 12, wobei f(α) einen von α unabhängigen Wert von 0,5 bis 5, insbesondere 2 aufweist.

14. Computersystem zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 13.

15. Computerprogrammprodukt, das in Verbindung mit einem Computer oder einem Computersystem direkt oder nach Durchführung einer vorbestimmten Routine ein Verfahren nach einem der Ansprüche 1 bis 13 ausführt.

16. Computerlesbares Medium, auf dem Daten gespeichert sind, die gemäß einem Verfahren nach einem der Ansprüche 1 bis 13 erzeugt werden.

Description:

Verfahren zur Reduktion eines Datensatzes

Die vorliegende Erfindung betrifft allgemein das Gebiet der Reduktion der Datenmenge von Datensätzen wobei der Verlust an relevanter Information weitgehend vermieden wird.

Insbesondere betrifft die vorliegende Erfindung ein Computerverfahren zur Reduktion von Datensätzen, ein Computersystem zur Durchführung eines solchen Verfahrens, ein Computerprogrammprodukt, das in Verbindung mit einem Computer oder einem Computersystem das erfindungsgemäße Verfahren ausführt, sowie ein computerlesbares Medium, auf dem Daten gespeichert sind, die mit dem erfindungsgemäßen Verfahren erzeugt wurden.

Die Größe von Datensätzen spielt bei deren Bearbeitung mit dem Computer eine entscheidende Rolle. Die zunehmende Größe von Datensätzen verlängert die

Bearbeitungsdauer und erhöht die Anforderungen an die Systemressourcen. So werden beispielsweise größere Speichermedien, ein verbessertes Speichermanagement sowie gesteigerte Prozessorenleistungen erforderlich. Somit verursachen große Datenmengen einen oft exponentiell ansteigenden Kostenaufwand und zudem einen erhöhten Zeitaufwand und machen so häufig die Bearbeitung dieser großen Datensätze mit dem

Durchschnitts-PC unmöglich.

Ein Weg, diesen Problemen zu begegnen, ist es, die Größe der anfallenden Datensätze zu reduzieren.

Ein Gebiet, das hier lediglich beispielgebend näher erläutert werden soll und auf dem Probleme mit der anfallenden großen Datenmenge häufig auftreten, ist die Auswertung von Datensätzen von gekoppelten Chromatographie-Massenspektroskopie-Experimenten.

Hierbei wird eine zu untersuchende Probe zunächst chromatographisch in einer Säule aufgetrennt, bevor die einzelnen Probenbestandteile massenspektroskopisch analysiert werden.

Im Fall von LC-MS, d. h. Flüssigchromatographie-Massenspektrometrie(Liquid Chromatography - Mass Spectroscopy)-Experimenten, wird der massenspektroskopische Teil der Analyse oft mit der Elektrospray-Massenspektroskopie durchgeführt. Hierbei entstehen Datensätze, die in der Regel einen Umfang von einigen hundert Megabytes bis zu mehr als einem Gigabyte aufweisen.

Diese Größe der Datensätze ist problematisch sowohl im Hinblick auf die Auswertung als auch im Hinblick auf die Archivierung.

Im Stand der Technik sind beispielsweise folgende Verfahren bekannt, die Größe von LC-MS-Datensätzen zu reduzieren:

Einerseits ist es möglich, die Detektionsempfindlichkeit des massenspektrometrischen Schritts zu reduzieren. Bei den häufig verwendeten MCP (Microchannelplate)- Detektoren kann dies dadurch erreicht werden, dass die MCP-Spannung vermindert wird. Mit dieser Maßnahme kann der Umfang der Datensätze beliebig reduziert werden. Allerdings hat diese Reduktion zur Folge, dass sehr schwache Signale nicht mehr delektiert werden oder dass der massenspektroskopische Response-Faktor - das Verhältnis der Intensität des massenspektroskopischen Signals zur Konzentration des Analyten in der Probe - mit abnehmender Analyt-Konzentration abnimmt und gegen Null strebt. Durch dieses Verhalten ist die zuverlässige Quantifizierung kleiner Signale nicht mehr sichergestellt. Dies stellt insbesondere bei vergleichenden Studien rekombinanter therapeutischer Proteine, sogenannten Comparability-Studien, einen entscheidenden Nachteil dar, da das Ziel solcher Studien darin besteht, die Anwesenheit nicht erwarteter Signale mit möglichst großer Zuverlässigkeit ausschließen zu können.

Weiterhin kann ein so genannter Cutoff- Wert bei der Datenaufnahme der Massenspektren verwendet werden. Bei diesem Verfahren handelt es sich ebenfalls um ein Verfahren, mit dem die Datensätze schon bei der Aufnahme der Daten in Ihrem Umfang beschränkt werden. Die Reduktion kommt dabei dadurch zustande, dass Signale unterhalb des Cutoff- Wertes nicht aufgezeichnet werden. Der Nachteil dieses Verfahrens besteht darin, dass der richtige Cutoff- Wert im Voraus nur schwer festzulegen ist, und in der Regel nicht derselbe Wert für alle Einzelspektren geeignet ist. Der letzte Punkt ist deshalb von

Bedeutung, weil der Umfang unspezifischer Signale insbesondere durch das

Vorhandensein von Analyt-Ionen hoher Konzentration signifikant erhöht wird.

Schließlich können Rauschsignale durch die statistische Analyse einzelner Massenspektren entfernt werden. Ein solches Verfahren ist beispielsweise in der Patentanmeldung WO 2005031791 beschrieben. Hierbei werden einzelne Massenspektren statistisch mit dem Ziel analysiert, unspezifische, d.h. dem Rauschen zuzuordnende Signale zu identifizieren, um diese Signale aus den Spektren zu entfernen. Ein ähnliches Verfahren ist auch in der unter dem Markennamen MassMap ® (www.massmap.bregler.org) vertriebenen Software zur Auswertung von LC-MS- Datensätzen implementiert. Im Fall von MassMap ® erfolgt keine Speicherung der Spektren, aus denen die Rauschsignale entfernt wurden. Die Software stellt eine Routine zur Verfügung, mit der Total-Ionenstrom-Chromatogramme berechnet werden, bei denen die dem Rauschen zugeordneten Signale nicht berücksichtigt werden. Mit der Entfernung von Peaks, die den Rauschsignalen zuzuordnen sind und wie sie anhand von statistischen Analysen einzelner Spektren identifiziert werden, werden eine Reduktion des Umfangs von LC-MS-Datensätzen und eine Verbesserung des Signal/Rausch- Verhältnisses von Total-Ionenstrom-Chromatogrammen erreicht. Allerdings führt die Betrachtung der Einzelspektren bei Signalen an der Nachweisgrenze dazu, dass auch bei diesem Verfahren viele Signale, die von Analyten stammen, fälschlicherweise dem Rauschen zugeordnet werden. Im Ergebnis resultiert auch hier ein Sensitivitätsverlust.

Nachteilig an all diesen Verfahren ist es somit, dass obwohl Signale, die den Analyten entsprechen, an der Nachweisgrenze noch zuverlässig detektierbar sind, die erwähnten Verfahren diese Signale in einzelnen Massenspektren als Rauschsignale fehiidentifizieren.

In der Konsequenz führen diese Verfahren so zu einer Verminderung der Detektierbarkeit von Signalen an der Nachweisgrenze.

Ausgehend vom Stand der Technik war es daher Aufgabe der vorliegenden Erfindung, ein Computerverfahren zur Reduktion von Datensätzen zur Verfügung zu stellen, bei der

die Erkennbarkeit von Signalen an der Nachweisgrenze so wenig wie möglich vermindert wird.

Insbesondere war es Aufgabe der vorliegenden Erfindung, ein dementsprechendes Computerverfahren zur Reduktion von Chromatographie-Massenspektroskopie- Datensätzen, ein Computersystem zur Durchführung eines solchen Verfahrens, ein Computerprogrammprodukt das in Verbindung mit einem Computer oder einem Computersystem dieses Verfahren ausführt sowie ein computerlesbares Medium, auf dem Daten gespeichert sind, die mit dem erfindungsgemäßen Verfahren erzeugt worden sind, zur Verfügung zu stellen.

Diese Aufgabe wird durch ein Computerverfahren zur Reduktion von Datensätzen gemäß Anspruch 1 oder 2, durch ein Computersystem zur Durchführung eines solchen Verfahrens nach Anspruch 14, durch ein Computerprogrammprodukt nach Anspruch 15, das in Verbindung mit einem Computer oder einem Computersystem das erfindungsgemäße Verfahren ausführt, sowie durch ein computerlesbares Medium nach Anspruch 16, auf dem Daten gespeichert sind, die mit dem erfindungsgemäßen Verfahren erzeugt worden sind, gelöst.

überraschenderweise hat der Erfinder der vorliegenden Erfindung herausgefunden, dass wenn man bei der statistischen Analyse einzelner Datensätze statt der einzelnen Datenaufnahme Vorgänge, beispielsweise Scans, Summen mehrerer einzelner Datenaufnahmevorgänge verwendet, die Signale an der Nachweisgrenze nicht mehr fälschlicherweise dem Rauschen zugeordnet werden, sondern als relevante Signale erkannt werden.

Somit kam der Erfinder zu dem Resultat, dass man mit dem erfindungsgemäßen Verfahren letztendlich zu einem genaueren Ergebnis gelangt, obwohl man summierte Scans statt Einzelscans statistisch analysiert, und somit die absoluten Signalwerte und die Meßfehler summiert.

Neben diesen Eigenschaften unterscheidet sich das erfindungsgemäße Verfahren auch durch einige weitere Aspekte vom beispielsweise in der Patentanmeldung WO 2005031791 offenbarten Stand der Technik.

Im Unterschied zu dem Verfahren des Standes der Technik kommt das erfindungsgemäße Verfahren ohne einen Extraschritt zur Identifizierung von Peaks aus. Dies ermöglicht eine schnellere Datenverarbeitung und schont Systemressourcen.

Das erfindungsgemäße Verfahren benötigt ferner im Gegensatz zu dem in der Druckschrift WO 2005031791 offenbarten Verfahren keinerlei Voraussetzungen hinsichtlich der Struktur des Rauschens, während in der WO 2005031791 z.B. im Fall von Tof-Spektren eine Poisson- Verteilung angenommen wird.

Schließlich kann die Berechnung des Mittelwerts und der Standardabweichung als statistische Momente beim erfindungsgemäßen Verfahren beispielsweise nur für Datenpunkte mit von Null verschiedenen Intensitätswerten erfolgen.

Weiterhin hat der Erfinder überraschenderweise herausgefunden, dass die selektive Erkennung unspezifischer Peaks, wie beispielsweise Rauschpeaks, weiter verbessert wird, wenn die einzelnen Scans so summiert werden, dass sich die jeweils zu addierenden Scans an der Breite eines charakteristischen Signals orientieren.

Ein solches charakteristisches Signal ist beispielsweise ein Messsignal, das in der Dimension, in der es gemessen wurde, einen bestimmten Teil oder eine bestimmte Eigenschaft des gemessenen Objekts, beispielsweise einer Probensubsianz oder einer zu beobachtenden Anordnung genauer beschreibt.

Somit umfasst die vorliegende Erfindung ein Computerverfahren zur Reduktion eines Datensatzes, der aus N (n+l)-Tupeln (xi α> X2α > - - - > x > Ya) besteht, wobei α=l , 2,..., N gilt und n mindestens 2 beträgt, wobei das Computerverfahren die folgenden Schritte aufweist:

a) Erstellen eines ersten Summendatensatzes dadurch, dass die y- Werte der Tupel ersetzt werden durch die Summen der y-Werte derjenigen Tupel, deren Xi-Werte in einem Intervall um den xi-Wert des ursprünglichen Tupels liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x i -Dimension entsprechen, b) Erstellen eines zweiten Summendatensatzes dadurch, dass die y- Werte der Tupel des in a) erhaltenen ersten Summendatensatzes ersetzt werden durch die Summen der y-Werte derjenigen Tupel, deren X 2 -WeIIe in einem Intervall um den X 2 -WeH des ursprünglichen Tupels des ersten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der X 2 -Dimension entsprechen, c) Für alle n>2 , falls vorhanden: Erstellen eines n- ten Summendafensatzes dadurch, dass die y-Werte der Tupel des in b) erhaltenen n-1 -ten Summendatensatzes ersetzt werden durch die y-Werte derjenigen Tupel, deren x n -Werte in einem Intervall um

den x n -Wert des ursprünglichen Tupels des n-1 -ten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x n -Dimension entsprechen, d) Ermitteln mindestens eines jeweiligen ersten statistischen Parameters des jeweiligen n-ten Summendatensatzes aus Schritt b) oder c), e) Ermitteln eines jeweiligen Schwellenwertes für die y-Werte aus dem jeweiligen ersten -statistischen Parameter, f) Vergleichen der y-Werte des n-ten Summendatensatzes mit dem jeweiligen Schwellenwert, g) Erzeugen eines reduzierten Datensatzes durch Entfernen aller Tupel des zu reduzierenden Datensatzes, deren entsprechender y-Wert im n-ten

Summendatensatz aus Schritt b) oder c) nicht größer als der Schwellenwert ist.

Optional können auch in Schritt g) zunächst alle y-Werte des zu reduzierenden Datensatzes auf Null gesetzt werden, deren entsprechender Wert im n-ten Summendatensatz aus Schritt b) oder c) nicht größer als der jeweilige Schwellenwert ist.

Danach wird dann durch Entfernen der Tupel, deren y- Werte im vorhergehenden Schritt auf Null gesetzt wurden, ein reduzierter Datensatz erstellt.

Beispielsweise bei zeitabhängigen Bildverarbeitungs-Anwendungen ist ein solches Verfahren nützlich und reduziert die erforderliche Speichermenge ohne Qualitätsverlust und verbessert zusätzlich die Bildqualität durch den Wegfall von Rauschsignalen.

Besonders geeignet ist ein solches Verfahren beispielsweise, wenn Veränderungen von bekannten Objekten im Laufe der Zeit überwacht werden sollen. Denkbar ist eine Anwendung des erfindungsgemäßen Verfahrens somit unter anderem bei der Datensicherung bei Kamera-gestützen überwachungssystemen.

Bei Chromatographie-Massenspektroskopie-Analyseverfahren wird ein zusätzlicher Gewinn an Selektivität mit dem erfindungsgemäßen Verfahren dadurch erreicht, dass die Bewertung der Signale der summierten Massenspektren anhand von Summen erfolgt, die sich über m/z-Bereiche erstrecken, die der erwarteten Breite massenspektrometrischer Signale entsprechen.

Hierbei können beliebige chromatographische Verfahren, wie beispielsweise Flüssigkeitschromatographie, Kapillarelektrophorese oder Gaschromatographie mit beliebigen geeigneten massenspektroskopischen Verfahren, wie z.B. Elektrospray-, Elektronenstoß-Ionisation-, Kollisions-Aktivierungs-, oder Neutralisations- Reionisierungs-MS kombiniert werden.

Somit ist eine Ausführungsform der vorliegenden Erfindung ein Computerverfahren zur Reduktion von beispielsweise Flüssigchromatographie-Massenspektroskopie- Datensätzen durch Entfernen unspezifischer Signale aus den Datensätzen, die aus N

Massenspektren M α bestehen, die während der Erstellung der Datensätze zu aufeinander

folgenden Zeiten t α aufgenommen werden und die jeweils n α Wertepaare (xαj > yαj)

aufweisen, wobei die x α j die m/z- Werte und die y α j die Intensitätswerte darstellen und α

e { 1 , 2, ... , N} sowie j e { 1, 2, ... , n α } gilt, wobei das Verfahren die folgenden Schritte aufweist: a) für α e {l,...N} Summieren von einzelnen Massenspektren aus der Gesamtheit der

Massenspektren einschließlich M α . die innerhalb eines t α einschließenden

Zeitintervalls T α aufgenommen wurden. zu jeweiligen ersten

Summenmassenspektren M' α bestehend aus n' α Wertepaaren (x' α k > y'αkX wobei

K /7 a j gilt, und die Breite der Zeitintervalle T α in Abhängigkeit von

der Breite von mindestens einem chromatographischen Peak im Zeitbereich um t α bestimmt wird, b) für jedes x' α k eines jeweiligen ersten Summenmassenspektrums M' α Summieren

der Werte y' αrn , deren entsprechende Werte x' αm in einem m/z-Intervall X' α k um

x 'αk Hegen, zu jeweiligen Summenwerten y" α |<, um ein jeweiliges zweites

Summenmassenspektrum M" α zu erhalten mit den Wertepaaren (x"αk =x 'αk > y"αk) >

wobei das m/z-Intervall X' α k in Abhängigkeit von der Breite der entsprechenden

massenspektrometrischen Peaks im Bereich um x' a i< bestimmt wird, c) Ermitteln mindestens eines jeweiligen ersten statistischen Parameters des jeweiligen zweiten Summenmassenspektrums M" α ,

d) Ermitteln eines jeweiligen Schwellenwerts Y a aus dem jeweiligen ersten statistischen Parameter,

e) Vergleichen der Summenwerte y"αk m ^ dem jeweiligen Schwellenwert Y α , f) Erzeugen eines jeweiligen reduzierten Datensatzes durch Entfernen der Wertepaare (x α ;, y α j) der jeweiligen Massenspektren M α , für die die entsprechenden

Summenwerte y" α k nicht größer als der jeweilige Schwellenwert Y α sind, wobei

x"αk = ^αj gilt.

Auch bei diesem Verfahren ist es wiederum möglich, den Schritt f) in zwei Teilschritte zu unterteilen, wobei in einem ersten Teilschritt die y α ;-Werte der jeweiligen

Massenspektren M α , für die die entsprechenden Summenwerte y" α k nicht größer als der

jeweilige Schwellenwert Y α sind, zu Null gesetzt werden. In einem zweiten Teilschritt

werden diese Wertepaare mit den zu Null gesetzten y α j-Werten aus dem Datensatz entfernt.

Entsprechend einer besonders bevorzugten Ausführungsform der Erfindung findet in Schritt a) eine gewichtete Summation statt, bei der die Gewichtung der zu summierenden

Massenspektren MR eine mit dem Betrag |t α tß des zeitlichen Abstands des

Massenspektrums vom jeweiligen Massenspektrum M α monoton abnehmende Funktion darstellt.

Unter monoton abnehmend wird verstanden, dass der Funktionswert mit größer werdendem x nicht größer wird, d.h., dass aus Xi<x 2 folgt, dass f(xi) > f(x 2 ) ist. Bevorzugt ist die Funktion streng abnehmend, d.h., dass aus xi<x 2 folgt, dass f(xι) > f(x 2 ) ist.

In einer weiteren bevorzugten Ausführungsform der Erfindung findet in Schritt b) eine gewichtete Summation der Intensitäten statt, bei der die Gewichtung der jeweiligen

Werte y' αm eine mit dem Betrag X am - X ak des Abstandes des jeweiligen Wertes

x'αm von x'αk monoton abnehmende Funktion darstellt.

Auch hier ist eine streng monoton abnehmende Funktion wiederum besonders bevorzugt.

Bei einem erfindungsgemaßen Verfahren zur Reduktion von Datensätzen für Chromatographie-Massenspektroskopiedatensatze kann ferner der jeweilige Zeitbereich

T α so ausgewählt werden, dass er im Wesentlichen der vollen Breite auf halber Hohe (FWHM) der chromatographischen Peaks entspricht

So kann die Scan-Summation jeweils optimal an ein vorhandenes Signal angepasst werden Somit wird sichergestellt, dass sich die Anzahl der summierten Scans in sinnvoller Weise aus den Umstanden ergibt, und dass nur die Scans in einem Teilbereich summiert werden, die sinnvollerweise eine gewisse Datenahnhchkeit erwarten lassen In besonderer Weise wird durch diesen Schritt der Probenauftrennung in dem vorgeschalteten Chromatographieverfahren Rechnung getragen Ergeben sich in dem Chromatogramm relativ breite Peaks, so wird bevorzugt auch nur über diese breiten Bereiche summiert, wahrend, wenn die Chromatographie vorwiegend schmale Peaks liefert, auch nur über diese schmalen Bereiche summiert wird Dies hat den Vorteil, dass die Massenspektren in den Bereichen summiert werden, die nach dem Chromatographieschritt einer größtenteils aufgereinigten Probenkomponente entsprechen

Ebenso kann in dem zweiten Summierungsschπtt der Summierungsbereich X α ]< so ausgewählt werden, dass er im Wesentlichen der vollen Breite auf halber Hohe (FWHM) der massenspektrometπschen Peaks im Summierungsbereich entspncht Die hierbei für die Intervallgroße zu verwendende Peakbreite muss nicht vom jeweiligen Massenspektrum abhangen, sondern ist in der Regel eine Funktion des m/z- bzw x- Werts Die Peakbreite kann auf der Grundlage der Auflosung des Massenanalysators bestimmt werden Sie kann entweder, wie im Fall von Ionenfallen und Quadrupolanalysatoren, weitgehend unabhängig vom m/z- Wert oder, wie im Fall von Tof-Analysatoren, direkt proportional zum m/z- Wert sein Durch diese Auswahl des

Summierungsbereichs X α k wird vermieden, dass zu viele unspezifische Signale summiert werden, die aus peakfremden Bereichen stammen

Die Berechnung der statistischen Parameter der zweiten Summenmassenspektren erfolgt bevorzugt individuell für jedes einzelne Spektrum. Die gemeinsame Verwendung von statistischen Parametern für mehrere Spektren ist jedoch ebenfalls möglich.

Die Ermittlung des Schwellenwerts Y α im Schritt d) weist in einer weiteren Ausführungsform die folgenden Schritte auf: da) Ermitteln eines ersten Schwellenwerts Y α ι aus dem ersten statistischen Parameter, db) Ermitteln mindestens eines zweiten statistischen Parameters für diejenigen Wertepaare des zweiten Summenmassenspektrums M" α , für die der Summenwert

y"αk größer als der erste Schwellenwert Y α i ist,

de) Ermitteln eines zweiten Schwellenwerts Y α 2 aus dem zweiten statistischen

Parameter, dd) Wiederholen der Schritte da) bis de) bis der Betrag der Differenz zwischen dem ersten Schwellenwert Y α i und dem zweiten Schwellenwert Y α 2 einen vorbestimmten Grenzwert δY nicht mehr übersteigt.

Solch ein Verfahren erlaubt es, dass der Schwellenwert jeweils automatisch für jedes Summenmassenspektrum optimal angepasst berechnet wird und nicht durch den Fachmann jeweils individuell festgelegt werden muss.

Optional können die Schritte c) bis e) für den gesamten Wertepaarbereich des jeweiligen zweiten Summenmassenspektrums M" α durchgeführt werden.

In einer Ausführungsform wird zur Durchführung der Schritte c) bis e) das jeweilige

zweite Summenmassenspektrum M" α in Wertepaarteilbereiche I α κ m ^ κ α K € {1 ,2 ,..., K a } und |_ x α i ' x α n; J = U < *κ unterteilt, und die Schritte c) bis

1

e) werden jeweils für einen Wertepaarteilbereich I ακ durchgeführt.

Hierdurch kann vorteilhafterweise der Wertepaarteilbereich in seiner Ausdehnung an die entsprechende Peakbreite angepasst werden, so dass entsprechend einer weiteren Ausführungsform bei der Bearbeitung von massenspektroskopischen Datensätzen der jeweilige Wertepaarteilbereich I ακ in Abhängigkeit von der Breite der massenspektrometrischen Peaks bestimmt wird.

In einer speziellen Ausführungsform werden die Wertepaarteilbereiche I ακ entsprechend den folgenden Gleichungen bestimmt:

α (κ + 1) x ( α u ( κ ) + 1 ) ,x ( α 0 ) + 1 ) mit :

X (O) _ ω κ-rl) δ£ fn llp ß . X Zv (C) α( falls ß-δ(x (0) ) < x"

X ( α 0 ( ) κ + l) = x" α n < falls ß • -δ( ^x ( rv 0 v- } ) > x C"X I. -

y (u) χ (o) wobei A ακ die untere Grenze und ακ die obere Grenze des Wertepaarteilbereichs

I ακ sind, ß einen Faktor größer als 5 darstellt, und δ für die Breite des

Summierungsbereichs X ακ für m/z- Werte des Wertepaarbereichs I ακ steht.

Weiterhin können bei dem erfindungsgemäßen Verfahren im Schritt c) der Mittelwert

MW α und die Standardabweichung SD α der von Null verschiedenen Intensitätswerte als

statistische Parameter und im Schritt d) der Schwellenwert Y α entsprechend der Gleichung

Y α = MW α + f(α) SD α bestimmt werden, wobei f(α) einen Faktor darstellt, der bevorzugt in einem Bereich von 0,5 bis 5 rangiert und besonders bevorzugt 2 ist.

Es ist dem Fachmann jedoch klar, dass er je nach den Anforderungen an die Genauigkeit der Datenerfassung bzw. an die Größe der resultierenden Datensätze den Faktor f(α) jeweils individuell anpassen kann. Hierbei führt ein kleiner Faktor f(α) zu einer besseren Datenerfassung an der Nachweisgrenze, allerdings auch zu einer erhöhten Datenmenge.

Es ist dem Fachmann ferner klar, dass sämtliche in dieser Erfindung offenbarte Ausführungsformen beliebig miteinander kombinierbar sind, ohne dass dadurch vom Umfang der vorliegenden Erfindung abgewichen wird.

Schließlich umfasst die vorliegende Erfindung ein Computersystem zur Durchführung des Verfahrens nach einem der Ansprüche 2 bis 13. Ein solches System kann beispielsweise direkt an eine Chromatographie-Massenspektroskopie-Analyseeinheit gekoppelt sein. Sie ist ebenso auch getrennt von dieser Einheit zur Datenauswertung denkbar.

Losgelöst von spektroskopischen Analyseverfahren ist ein solches Computersystem zur Reduktion von Datensätzen beispielsweise auch auf dem Gebiet der Bildverarbeitung denkbar.

Ein entsprechendes Computerprogrammprodukt, das in Verbindung mit einem Computer oder einem Compυtersystem direkt oder nach Duichfiihrung einer vorbestimmten Routine ein Verfahren nach einem der Ansprüche 2 bis 13 ausführt, ist ebenfalls durch die vorliegende Erfindung umfasst.

Schließlich umfasst die vorliegende Erfindung ein computerlesbares Medium, wie beispielsweise Disketten, Festplatten, tragbare Laufwerke, CDs, DVDs, optische Disketten oder Bänder, auf dem Daten gespeichert sind, die gemäß einem Verfahren nach einem der Ansprüche 2 bis 13 erzeugt worden sind.

Weitere Vorteile und Ausführungsformen der vorliegenden Erfindung ergeben sich aus den Ausfuhrungsbeispielen sowie aus der Zeichnung.

Es zeigt

Figur 1 einen schematischen überblick über wesentliche Verfahrensschritte des erfindungsgemäßen Verfahrens;

Figur 2 einen Ausschnitt aus dem Totalionenstrom-Chromatogramm eines Datensatzes;

Figur 3 einen Ausschnitt aus dem Summenmassenspektrum (Summe der Scans von 13,85 min bis 14,25 min) des in Figur 2 mit A gekennzeichneten Peaks;

Figur 4 einen vergrößerten Ausschnitt des Massenspektrums aus Figur 3 in der Umgebung des in Figur 3 mit a bezeichneten Peaks;

Figur 5 einen Vergleich von Summenmassenspektren, wie sie ausgehend von verschieden verarbeiteten Datensätzen entsprechend dem Summenmassenspektrum der Figur 3 erhalten wurden; und

Figur 6 einen Vergleich von Summenmassenspektren, wie sie ausgehend von verschieden verarbeiteten Datensätzen entsprechend dem Summenmassenspektrum der Figur 3 erhalten wurden.

Die folgenden Beispiele sollen dazu dienen, die Erfindung zu verdeutlichen. Sie sind jedoch nicht dafür vorgesehen, den Umfang der vorliegenden Erfindung, wie er durch die Patentansprüche bestimmt wird, einzuschränken.

Anhand von Figur 1 wird das erfindungsgemäße Verfahren anhand eines Datensatzes aus einem LC-MS-Experiment schematisch beispielhaft erläutert.

Ein solcher Datensatz besteht hier beispielsweise aus einer Anzahl einzelner Massenspektren, die in regelmäßiger zeitlicher Abfolge aufgenommen werden. Ein

solches Einzelmassenspektrum M α , das aus einer Anzahl an Wertepaaren (x α j, y α j) besteht, ist schematisch im oberen Schaubild in Figur IA dargestellt.

Diese Einzelmassenspektren werden nun in einem ersten Schritt intervallartig summiert. Dies geschieht, indem eine bestimmte Anzahl an Spektren, die zeitlich aufeinander folgend aufgenommen wurden, summiert werden. Hierbei umfassen die im

Summationsintervall T α summierten Spektren das Einzelmassenspektrum M α , das zum

Zeitpunkt t α aufgenommen wurde, sowie die Spektren M a .ß, M α _5, M α _4, M α .3, M α _2,

M α -1 , M α +] , M α+2 , M α +3, M α+ 4, M α+5 und M a +ß.

Das auf diese Weise erhaltene erste Summenmassenspektrum M' α ist im unteren Schaubild in Figur IA gezeigt.

In einem zweiten Schritt, gezeigt in Figur IB, werden die so erhaltenen ersten Summenmassenspektrum M' α erneut summiert. Diese Summation erfolgt jedoch anders als im ersten Summationsschritt innerhalb der jeweiligen ersten Summenmassenspektren.

Hier werden die zu den x' α k~ Werten gehörigen y' α k~ Werte innerhalb eines Intervalls X' α k

jeweils intervallartig zu einem y" α k-Wert summiert, so dass das im unteren Schaubild in

Figur 1 B gezeigte zweite Summenmassenspektrum M" α entsteht.

Aus diesen zweiten Summenmassenspektrums M" α wird nun ein erster statistischer

Parameter bestimmt, woraus wiederum ein Schwellenwert Y α ermittelt wird.

Dieser Schwellenwert ist im oberen Schaubild in Figur IC durch eine horizontale Linie im zweiten Summenmassenspektrum angegeben. Erkennbar liegen einige y" α k- Werte in

dem zweiten Summenmassenspektrum unter dem Schwellenwert Y α .

Diese y"^- Werte, die kleiner als Y α sind, sind einem x'^-Wert zugeordnet. Diesem

jeweiligen x'^-Wert im zweiten Summenmassenspektrum M" α entspricht ein X 0 ^- Wert

in einem Einzelmassenspektrum M α . Dieses entsprechende Einzelmassenspektrum M α ist zur verbesserten übersichtlichkeit noch einmal direkt unter dem Summenmassenspektrum M" α in dem zweiten Schaubild von oben in der Figur 1 C erneut dargestellt.

In einem letzten Schritt werden die Wertepaare (xcφ y α ;) aus dem jeweiligen

entsprechenden Einzelmassenspektrum M α entfernt, deren entsprechende y^-Werte

kleiner als Y α sind.

Auf diese Weise entsteht ein reduzierter Datensatz ohne den Verlust relevanter Information.

Das Ergebnis der erfindungsgemäßen Datenverarbeitung wird im Folgenden anhand eines beispielhaften LCMS-Datensatzes näher erläutert.

Bei der dem Datensatz zu Grunde liegenden Probe handelt es sich um einen Proteinspot, der aus einem Polyacrylamidgel isoliert wurde. Die reduzierte und alkylierte Probe wurde tryptisch verdaut.

Die im Chromatographieschritt erfolgte RP („reversed phase")-Analyse des Peptidgemisches erfolgte mit Hilfe einer Vydac Cis-Kapillarsäule (Durchmesser 0,3 mm, Länge 150 mm) und eines linearen Acetonitril/Wasser-Gradienten (Eluent A: Wasser mit 0,075 % (v/v) TFA; Eluent B: 80 % Acetonitril / 20 % Wasser mit 0,055 % TFA; Gradient: 5 % B bis 90 % B in 30 Minuten; Flussrate 5 μl/min).

Figur 2 zeigt einen Ausschnitt aus dem so erhaltenen Totalionenstrom-Chromatogramm der zu analysierenden reduzierten, alkylierten und tryptisch verdauten Proteinspotprobe. Klar erkennbar ist, wie der RP-Trennungsschritt die Probe aufgetrennt hat, so dass die

einzelnen Bestandteile der zu analysierenden Probe in zeitlicher Abfolge als Eluat die Säule verlassen haben.

Dieses Eluat der Säule wurde direkt in die Quelle eines Electrospray- Massenspektrometers eingeleitet. Bei dem Gerät handelte es sich um ein Q-Tof 2 der Fa. Micromass, GB. Als Ionenquelle wurde eine Nano-Spray-Vorrichtung verwendet. Der zeitliche Abstand zwischen den Massenspektren betrug 2,15 s, die Massenspektren wurden von 200 amu bis 2000 amu aufgenommen. Hierbei entspricht 1 (Atommasseneinheit (atomic mass unit)) 1 ,660538 * 10 "27 kg.

Ein Summenspektrum des so aufgenommenen Datensatzes ist in Figur 3 gezeigt. Figur 3 zeigt einen Ausschnitt aus dem Summenmassenspektrum (Summe de& Scans von 13,85 min bis 14,25 min) des in Figur 2 mit A gekennzeichneten Peaks. Der Datensatz weist die in Tabelle 1 angegebenen Eigenschaften auf:

Tabelle 1 :

Figur 4 zeigt einen vergrößerten Ausschnitt aus dem Spektrum aus Figur 3. Es ist deutlich sichtbar, dass sich die einzelnen Peaks des Massenspektrums über einen gewissen m/z-Bereich erstrecken und einen FWHM- Wert von etwa 0,15 amu aufweisen.

Dieser Datensatz wurde mit dem erfindungsgemäßen Verfahren und vergleichsweise mit dem in der WO 2005031791 offenbarten Verfahren verarbeitet.

Auf die Druckschrift WO 2005031791 wird hiermit vollinhaltlich verwiesen.

Entsprechend dem in der Druckschrift WO 2005031791 gelehrten Verfahren wurden zunächst die Daten ausgelesen, die mit einem jeweiligen Spektrum korrespondieren. Anschließend wurde eine statistische Rausch-Analyse mit diesen ausgelesenen Daten durchgeführt, um statistische Parameter zu erhalten, die mit der Rauschverteilung im Zusammenhang stehen. Bei der Berechnung der Erwartungswerte und der Standardabweichungen als diese statistischen Parameter wurden in übereinstimmung mit der Beschreibung alle Datenpunkte verwendet und somit auch solche, die Intensitätswerte gleich Null aufwiesen. Aus den erhaltenen statistischen Parametern wurde ein Grenzwert bestimmt. Dieser Grenzwert ergab sich aus dem Erwartungswert, multipliziert mit dem Zweifachen der Standardabweichung. Schließlich wurden die relevanten Signale in einem jeweiligen Spektrum durch Vergleich der Datenpunkte in dem Spektrum mit dem Grenzwert identifiziert. Signale mit einer Intensität unterhalb dieses Grenzwerts wurden verworfen.

Bei der Verarbeitung desselben Datensatzes mit dem erfindungsgemäßen Verfahren wurde die Breite der Zeitbereiche T α konstant auf 7 Datenpunkte eingestellt, wobei die

Zeitbereiche symmetrisch um t α verteilt waren. Die Breite der m/z-Intervalle X' α k

entsprach x' α j/5000, wobei diese Intervalle ebenfalls symmetrisch um x' α j verteilt waren.

Schließlich wurde das Verfahren mit dem Faktor zur Bestimmung der Wertepaarteilbereiche ß = 400 und mit variablen Werten für den Faktor f im Bereich von 2 bis 2,5 zur Bestimmung des Schwellenwerts durchgeführt.

Die Dateigrößen, die sich dadurch ergeben, dass alle Datenpunkte aus den Originalspektren entfernt werden, deren zuzuordnende Intensitäten in den jeweiligen zweiten Summenmassenspektren nach Durchführung der Schritte a) bis f) gemäß Anspruch 2 gleich Null sind, sind in der nachfolgenden Tabelle 2 zusammengestellt und werden mit den resultierenden Dateigrößen nach der Datensatzverarbeitung gemäß der WO 2005031791 verglichen.

Tabelle 2:

Verfahren f Dateigröße [MB]

Original-Datei - 333

Stand der Technik - 51.6

Erfindungsgemäßes 2,00 67,2

Verfahren

2, 15 51 ,2

2,30 37,5

2,50 28,1

Zur Bewertung der resultierenden Datensätze wurden von den Datensätzen mit f = 2,15 und f = 2,50 die Summenmassenspektren berechnet.

Vergleiche der entsprechenden Summenmassenspektren sind in den Figuren 5 und 6 gezeigt.

In Figur 5 wurde das mit „Original geglättet" bezeichnete Spektrum dadurch erhalten, dass das vom Originaldatensatz abgeleitete Einzelspektrum a) einer binomialen Glättung unterworfen wurde. Dieses geglättete Spektrum ist mit b) bezeichnet. Die in dieses Spektrum eingezeichnete Linie entspricht dem Rauschpegel des Spektrums, d.h. dass Peaks oberhalb der Linie als echt zu betrachten sind, während Peaks, die die Linie nicht übersteigen, nicht notwendigerweise als signifikant anzusehen sind. Das Vergleichsspektrum c) wurde nach der Datenverarbeitung mit dem in der WO 2005031791 offenbarten Verfahren erhalten. Spektrum d) wurde mit dem erfindungsgemäßen Verfahren erstellt. Hierbei wurde für f ein Wert von 2,15 gewählt.

Der mit dem erfindungsgemäßen Verfahren mit f = 2,15 erhaltene Datensatz besitzt entsprechend der oben gezeigten Tabelle einen Umfang, der etwas kleiner ist als der Umfang des gemäß der WO 2005031791 erhaltenen Datensatzes. Trotz ungefähr gleichen Umfangs sind im Massenspektrum, das entsprechend dem erfindungsgemäßen Verfahren erhalten wurde, alle die im Spektrum b) mit Buchstaben gekennzeichneten signifikanten Peaks eindeutig erkennbar.

Im Gegensatz dazu sind in dem nach WO 2005031791 erzeugten Massenspektrum die Peaks b, e, i, r, t und w nicht mehr erkennbar.

Analog zu Figur 5 wurden das in Figur 6 mit b) bezeichnete Spektrum dadurch erhalten, dass das vom Originaldatensatz abgeleitete Spektrum a) einer binomialen Glättung unterworfen wurde.

Das Vergleichsspektrum c) wurde nach der Datenverarbeitung mit dem in der WO 2005031791 offenbarten Verfahren erhalten und ist mit dem in Figur 5 gezeigtem Spektrum identisch.

Das mit d) bezeichnete Spektrum wurde abgeleitet aus einem Datensatz, der entsprechend dem erfindungsgemäßen Verfahren mit f = 2,50 erhalten wurde.

Es ist offensichtlich, dass selbst bei dem mit f = 2,50 entsprechend dem erfindungsgemäßen Verfahren erhaltene Spektrum die Detektierbarkeit signifikanter Peaks mit Intensitäten an der Nachweisgrenze verglichen mit dem gemäß WO 2005031791 erhaltenen Spektrum stark verbessert ist. Dies gilt, obwohl der entsprechende Datensatz einen Umfang besitzt, der lediglich 55 % des Umfangs des nach der WO 2005031791 erhaltenen Datensatzes beträgt.

Da der Rechenaufwand zur automatischen Auswertung von LCMS-Datensätzen ungefähr mit dem Quadrat der Datensatzgröße zunimmt, bedeutet eine Halbierung der Datensatzgröße bei gleichzeitig verbesserter Detektierbarkeit von Signalen nahe der Nachweisgrenze einen wesentlichen Vorteil.

So können durch das erfindungsgemäße Verfahren kleinere Datensätze mit sehr genauen Informationen auch mit vergleichsweise leistungsschwachen Computern zügig bearbeitet werden.

Die Genauigkeit an der Nachweisgrenze erlaubt dabei dennoch eine sehr detaillierte Auswertung der Daten.

Auch die Datensicherung erfordert geringere Systemressourcen, da durch die Nichtberücksichtigung unspezifischer Information und durch die Beschränkung auf die signifikante Information die zu speichernde Datenmenge erheblich reduziert wird.