Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND ARRANGEMENT FOR DETERMINING AT LEAST ONE IMPLICATION, IN PARTICULAR A PATHOLOGICAL IMPLICATION
Document Type and Number:
WIPO Patent Application WO/2018/028789
Kind Code:
A1
Abstract:
The invention relates to a method and an arrangement for determining at least one implication, in particular a pathological implication, in which the implication is determined, by means of a first set of data generated using a spectrometric measurement of an object sample and correlating to the object and at least one second set of data correlating to the object, on the basis of a linking of the first and second data sets, wherein the first data set is formed by a first preprocessing module and the second data set is formed by a second preprocessing module and is forwarded to at least one forecast module at which data, on which the determination is based, are output.

More Like This:
Inventors:
OTTE CLEMENS (DE)
Application Number:
PCT/EP2016/069142
Publication Date:
February 15, 2018
Filing Date:
August 11, 2016
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS AG (DE)
International Classes:
G01N21/359; A61B5/00
Foreign References:
US6411907B12002-06-25
DE102013200058B32014-06-26
US6258576B12001-07-10
Other References:
HORI R ET AL: "A combined FT-IR microscopy and principal component analysis on softwood cell walls", CARBOHYDRATE POLYMERS, APPLIED SCIENCE PUBLISHERS, LTD. BARKING, GB, vol. 52, no. 4, 1 June 2003 (2003-06-01), pages 449 - 453, XP004411424, ISSN: 0144-8617, DOI: 10.1016/S0144-8617(03)00013-4
Download PDF:
Claims:
Patentansprüche

1. Verfahren zur Feststellung von zumindest einer, insbesondere pathologischen, Implikation bei der auf Grundlage von mittels eines mit einer spektrometrischen Messung einer Objektprobe erzeugten mit dem Objekt korrelierenden ersten Satzes von Daten und zumindest einem zweiten von mit dem Objekt korrelierenden Satzes von Daten eine Feststellung über die Implikation basierend auf einer Verknüpfung der ersten und zweiten Datensätze erfolgt, wobei der erste Datensatz durch ein erstes Vorverarbeitungsmodul und der zweite Datensatz durch ein zweites Vorverarbeitungsmodul gebildet und an ein Voraussagemodul weitergeleitet wird, an dem eine Datenausgabe erfolgt, die der Feststellung zugrundegelegt wird.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das erste und/oder zweite Vorverarbeitungsmodul derart be¬ trieben wird, dass es mittels einer Merkmalsextrakton, insbesondere Intensitäten je Wellenlänge oder Frequenz, aus den zugrundeliegenden mit dem Objekt korrelierenden, insbesondere spektrometrisch erfassten, ersten Informationen den Satz von Daten, insbesondere als Koeffizienten einer Funktion gemäß Signalverarbeitung, bildet. 3. Verfahren nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, dass das erste und/oder zweite Vorverarbei¬ tungsmodul derart betrieben wird, dass der erste Datensatz und der zweite Datensatz einer Verdichtung, insbesondere gemäß Wavelet-Transformation, Hauptkomponentenanalyse, und/oder nichtlinearen Dimensionsreduzierung, zugeführt wird.

4. Verfahren nach einem der beiden vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zur Verknüpfung eine Verkettung der Koeffizienten zu einem Vektor erfolgt und der Vektor dem Voraussagemodul zugeführt wird.

5. Verfahren nach einem der vorhergehenden Ansprüche dadurch gekennzeichnet, dass die für die Bildung des zweiten Daten- satz mit dem Objekt korrelierenden zugrundegelegten zweiten Informationen, durch Ermittlung einer, insbesondere mathematisch und/oder durch auf die Messung angewandten Filterfunktionen gebildeten, Ableitung der ersten Informationen, durch eine weitere separate, insbesondere spektrometrische, Messung des Objekts oder anderen Quellen, die mit dem Objekt korre¬ lierende zweite Informationen bereithalten, verwendet werden.

6. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- kennzeichnet, dass die separate Messung zeitgleich als durch eine andere Charakterisierung, insbesondere mit anderem spektralen Messbereich, aufweisende spektrometrische Messung durchgeführt wird. 7. Verfahren nach einem der beiden vorhergehenden Ansprüche dadurch gekennzeichnet, dass die für die Bildung des zweiten Datensatz mit dem Objekt korrelierenden zugrundegelegten zweiten Informationen durch nichtspektrale, beispielsweise genomische und/oder proteomische, Daten gegeben sind.

8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Voraussagemodul derart prozessorge¬ steuert betrieben wird, dass ihm zugeführte Daten gemäß eines nach Art eines lernenden Modells derart verarbeitet werden, dass als Ausgabe eine Implikation enthaltende Daten erfolgt, wobei das Modul derart betrieben werden kann, dass dem Modul zur Ausgabe akkurater Implikationen in einer nach Art der Anwendung lernender Modelle erfolgenden Trainingsphase Daten zugeführt werden können, für die die vorauszusagende Implika- tion bekannt ist.

9. Verfahren nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, dass das Voraussagemodul derart betrieben wird, dass es als ein lernendes Modell nach Art eines so genannten linearen Modells, Neuronalen Netzwerks, einer Kernel¬ basierten Methode, wie beispielsweise dem Gaußprozessmodell , oder so genannten Support Vector Machine, funktioniert.

10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, das den Vorverarbeitungsmodulen ein, insbesondere eine Kernel-basierte Methode nutzendes, Voraus¬ sagemodul folgt, wobei das Voraussagemodul die Datensätze der Vorverarbeitungsmodule jeweils durch getrennte Teilmodelle und/oder Kernel Funktionen verarbeitet und diese mittels ei¬ ner mathematischen Funktion, insbesondere Addition oder Multiplikation, kombiniert. 11. Anordnung zur Feststellung von zumindest einer, insbesondere pathologischen, Implikation gekennzeichnet durch Mittel zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche .

Description:
Beschreibung

Verfahren und Anordnung zur Feststellung von zumindest einer, insbesondere pathologischen, Implikation

Die Erfindung betrifft ein Verfahren zur Feststellung von zumindest einer, insbesondere pathologischen, Implikation gemäß Anspruch 1 und eine Anordnung zur Feststellung von zumindest einer, insbesondere pathologischen, Implikation gemäß An- spruch 11.

Es ist bekannt Spektrometer zur Ermittlung von Eigenschaften eines mit diesem untersuchten Objekts einzusetzen. Beispielsweise kann man mit einem Spektrometer im medizinischen Be- reich durch Untersuchung von Gewebeteilen eine Entscheidung treffen, ob eine Gewebeprobe Krebsgewebe enthält. Beispiels ¬ weise kann hierzu die optische Spektroskopie zum Einsatz kom ¬ men, bei der die Gewebeprobe mit Licht, insbesondere bei der Nahinfrarotspektroskopie (NIRS) mit kurzwelligem infrarotem Licht, bestrahlt wird und daraufhin die Intensität des re ¬ flektierten Lichts als Funktion der Wellenlänge des Lichts gemessen wird.

Spektroskopie wird aber nicht nur zur Klassifikation von Ob- jekten eingesetzt, sondern auch für Aufgaben, die mittels des statistischen Verfahrens der Regression Voraussagen über quantitative Eigenschaften wie beispielsweise die Angabe von Blutalkoholwerten geben. Ferner kommt die Spektroskopie auch bei der Zustandsüberwachung, beispielsweise im Rahmen einer industriellen Anwendung zum Einsatz, in dem Vibrationsamplituden als Funktion der Frequenz gemessen werden.

Als Ergebnis der Messungen mittels Spektroskopie liegt ein Spektrum vor, welches durch einen aus Realzahlen gebildeten Vektor (xl,..., xL) von für L Wellenlängen bzw. Frequenzen gemessenen Intensitätswerten beschrieben werden kann. Dabei kann die Anzahl L sehr groß sein, also sich im Rahmen von mehreren hunderten oder tausenden Werten bewegen. Hinzu kommt das unterschiedliche Charakteristiken der untersuchten Proben das Spektrum auf komplexe Art und Weise verändern. Beispiels ¬ weise ist daher bei der Nahinfrarotspektroskopie eine manuel ¬ le Auswertung der Spektren in der Regel nicht möglich.

Die Komplexität der Spektren erfordert daher fortgeschrittene Methoden der Vorverarbeitung und Analyse. In der Regel erfordert die Analyse hierzu beispielsweise ein Modell zur Kali ¬ brierung der erzeugten Daten, wobei hierfür die Eigenschaften der jeweiligen gemessenen Probe bekannt sind und mit den je ¬ weilig erfassten Spektren in Bezug gesetzt werden.

Den genannten Herausforderungen wird bisher typischerweise dadurch begegnet, dass bestimmte Vorverarbeitungen auf die Spektren angewandt werden, wie beispielsweise eine Offset- Korrektur, eine Glättung oder Normierung, worauf die vorverarbeiteten Spektren und die bekannten Eigenschaften genutzt werden, um ein Modell anhand der Daten zu bilden bzw. optimieren, oft unter Nutzung von linearen Modellen wie dem so genannten „Partial Least Squares".

Dieser Ansatz bewältigt die bestehenden Herausforderungen aber nur zum Teil. Aufgabe der Erfindung ist es eine Lösung anzugeben, die die für die Anwendung der Spektroskopie bestehenden Herausforde ¬ rungen, insbesondere für das medizinische Umfeld, in demge ¬ genüber verbesserter Weise bewältigt. Diese Aufgabe wird durch das Verfahren zur Feststellung von zumindest einer, insbesondere pathologischen, Implikation gemäß Anspruch 1 durch dessen Merkmale, sowie durch die Anord ¬ nung zur Feststellung von zumindest einer, insbesondere pathologischen, Implikation gemäß Anspruch 11, gelöst.

Bei dem erfindungsgemäßen Verfahren zur Feststellung von zumindest einer, insbesondere pathologischen, Implikation erfolgt auf Grundlage von mittels eines mit einer spektrometrischen Messung einer Objektprobe erzeugten mit dem Objekt korrelierenden ersten Satzes von Daten und zumindest einem zweiten von mit dem Objekt korrelierenden Satzes von Daten eine Feststellung über die Implikation basierend auf einer Verknüpfung der ersten und zweiten Datensätze, wobei der erste Datensatz durch ein erstes Vorverarbeitungsmodul und der zweite Datensatz durch ein zweites Vorverarbeitungs ¬ modul gebildet und an ein Voraussagemodul weitergeleitet wird, so dass an dem Voraussagemodul eine Datenausgabe er- folgt und der Feststellung der Objekteigenschaften zugrundegelegt wird.

Weitere Vorteile sind durch die Weiterbildungen des Verfahrens gegeben.

Beispielsweise wird das erste und/oder zweite Vorverarbei ¬ tungsmodul bei einer Weiterbildung der Erfindung derart betrieben, dass es mittels einer Merkmalsextrakton, insbesondere Intensitäten je Wellenlänge oder Frequenz, aus den zugrun- deliegenden mit dem Objekt korrelierenden, insbesondere spektrometrisch erfassten, ersten Informationen den Satz von Daten, insbesondere als Koeffizienten einer Funktion gemäß Signalverarbeitung, bildet. Hierdurch wird insbesondere eine maschinelle Verarbeitung mittels mathematischer, insbesondere statistischer Methoden der Signalverarbeitung möglich.

Eine Kompression der Daten zur Reduktion der benötigten Res- sourcen erzielt man wenn man das Verfahren derart weiterbil ¬ det, dass das erste und/oder zweite Vorverarbeitungsmodul derart betrieben wird, dass der erste Datensatz und der zwei ¬ te Datensatz einer Verdichtung zugeführt wird, insbesondere mittels Wavelet-Transformation, Hauptkomponentenanalyse, oder Methoden der nichtlinearen Dimensionsreduzierung.

Wird die Erfindung derart weitergebildet, dass zur Verknüp ¬ fung eine Verkettung der Koeffizienten zu einem Vektor er- folgt und der Vektor dem Voraussagemodul zugeführt wird, kön ¬ nen da jeder Vektor quasi eine eigene Sicht auf die Daten darstellt, mehrere Sichten zu einer Sicht zusammengeführt und dem vorzugsweise für diese kombinierte Sicht optimierten Vo- raussagemodul zugeführt werden.

Jedes Vorverarbeitungsmodul liefert eine eigene Sicht auf das zugrundeliegende Objekt. Eine Sicht kann beispielsweise da ¬ durch definiert sein, dass ein Vorverarbeitungsmodul eine ei- gene mathematische Filterfunktion (z.B. die erste Ableitung des Spektrums über den Wellenlängen) auf die Spektren anwendet und dadurch zusätzliche Informationen bereitstellt.

Eine Sicht kann auch dadurch definiert sein, dass eine sepa- rate Messung des zugrundeliegenden Objekts stattfindet, ins ¬ besondere in einem anderen spektralen Messbereich als bei der ersten Messung.

In einer Weiterbildung des Verfahrens kann eine Sicht auch nichtspektrale Daten des zugrundeliegenden Objekts beinhal ¬ ten, insbesondere genomische und/oder proteomische Informati ¬ onen im medizinischen Bereich. Dies erlaubt es beispielsweise patientenspezifische Faktoren, die einen Einfluss auf die spektrale Messung haben können, zu erfassen und bei der Be- rechnung der Objekteigenschaften im Voraussagemodul zu berücksichtigen .

Vorzugsweise wird das Verfahren derart weitergebildet, dass das Voraussagemodul derart prozessorgesteuert betrieben wird, dass zunächst in einer Trainingsphase mittels Methoden des maschinellen Lernens auf Daten trainiert wird, für die die vorauszusagende Implikation bekannt ist.

Für das Training des Voraussagemodul eignen sich im Bereich des maschinellen Lernens bekannte und gut funktionierende

Verfahren, insbesondere lineare Modelle (z.B. Partial Least Squares) , Neuronale Netzwerke wie das Mehrschichtperzeptron, oder Kernel-basierte Methoden wie beispielsweise das Gaußpro- zessmodell oder die so genannte Support Vector Machine.

Die Erfindung wird auch vorteilhaft weitergebildet, wenn den Vorverarbeitungsmodulen ein, insbesondere eine Kernelbasierte Methode nutzendes, Voraussagemodul folgt, wobei das Voraussagemodul die Datensätze der Vorverarbeitungsmodule je ¬ weils durch getrennte Teilmodelle und/oder Kernel Funktionen verarbeitet und diese mittels einer mathematischen Funktion, insbesondere Addition oder Multiplikation, kombiniert.

Die erfindungsgemäße Anordnung zur Feststellung von zumindest einer, insbesondere pathologischen, Implikation weist Mittel zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche.

Die erfindungsgemäße Anordnung hilft durch die Verwirklichung des erfindungsgemäßen Verfahrens durch seine Implementierung zur Verwirklichung der genannten Vorteile des Verfahrens und seiner Weiterbildungen.

Weitere Vorteile und Einzelheiten der Erfindung werden anhand der in den Figuren dargestellten Ausführungsbeispiele erläutert. Es zeigt

FIG 1 eine schematische Darstellung eines aus dem Stand der Technik bekannten Ansatzes

FIG 2 in schematischer Darstellung ein erstes Ausfüh- rungsbeispiel , bei welchem die Weiterbildung darge ¬ stellt ist, bei der auf einer Kombination von Sätzen von Merkmalen ein maschinelles Lernen durchgeführt wird,

FIG 3 ein weiteres Ausführungsbeispiel, bei dem in sche ¬ matischer Darstellung eine Weiterbildung gezeigt wird, bei der je Satz von Merkmalen eine aus der Wavelet Transformation bzw. Kompression bekannte, so genannte „wavelet decomposition" durchgeführt wird .

In FIG 1 ist schematisch der aus dem Stand der Technik be- kannte Ansatz zu erkennen, bei dem ein beispielsweise durch NIRS erzeugtes Spektrum RS einer durch ein Vorverarbeitungs ¬ modul A bereitgestellten Vorverarbeitung zuführt wird.

Im Idealfall soll eine Vorverarbeitung dabei irrelevante In- formationen im Spektrum reduzieren und relevante Informationen des Spektrums hervorheben. Beispielsweise sollen damit störende Einflüsse des Messprozesses wie variierende Abstände zwischen Sensor und Probe unter Anwendung von geeigneten Methoden, wie zum Beispiel einer Offsetkorrektur oder einer Normung des Spektrums, reduziert werden.

Das Ergebnis der Vorverarbeitung, also die Daten, werden als geeignete Signale transformiert einem Voraussagemodul B zuge ¬ führt, welches die Implementierung und Anwendung eines mathe- matischen Modells repräsentiert, welches durch Training opti ¬ miert wird. Die vom Modell vorausgesagten Merkmale einer spektroskopisch untersuchten Probe stehen dabei als in geeignete Signale transformierte Daten als Ausgabegröße (n) am Aus ¬ gang OUTPUT des Moduls B bereit.

Es zeigt sich aber, dass diese Ansätze häufig nicht ausrei ¬ chen, um akkurate Vorhersagen zu ermöglichen. Wesentlicher Nachteil des in FIG 1 dargestellten Ansatzes ist, dass dem Modell die Informationen über die Probe nur in einer einzigen Repräsentation (d.h. einer einzigen Sicht) resultierend aus der Vorverarbeitung A zur Verfügung gestellt werden.

Der erste erfinderische Schritt ist daher, mehrere unter ¬ schiedliche Sichten mit idealerweise sich komplementierenden, voneinander möglichst unabhängigen Informationen über die Probe zu kombinieren. Ein weiterer wesentlicher der Lösung zugrundeliegender erfinderische Ansatz liegt ferner in der Transformation des Lernens bei spektralen Daten auf ein aus dem maschinellen Lernen bekanntes so genanntes Multi-View Lernproblem.

Als ein Ergebnis dieser Transformation stellt sich das in der FIG 2 dargestellte Ausführungsbeispiel der Erfindung dar. Zu erkennen ist als Ausgangsbasis das beispielsweise mit NIRS erzeugte Spektrum RS einer Probe. Die Daten des Spektrums werden als zur Verarbeitung geeignete Signale transformiert parallel zu einer Mehrzahl n von Vorverarbeitungsmodulen AI...An zugeführt.

Jede der Vorverarbeitungsmodule AI...An erzeugt dabei unter An- wendung von sich jeweils unterscheidenden Algorithmen jeweils ein Satz an Merkmalen, so dass am Voraussagemodul B eine Mehrzahl von Merkmalsvektoren ΧΙ.,.Χη als zur Verarbeitung geeignete Signale transformiert bereitgestellt werden. Das Voraussagemodul B kann nun, da es durch die unterschied ¬ lichen Vorverarbeitungsalgorithmen unterschiedliche Sichten auf ein und dasselbe Objekt vorliegen hat (d.h. komplementäre Informationen über die Probe besitzt) , diese kombiniert be ¬ trachten und zwar derart, dass die Herausarbeitung relevanter Daten von irrelevanten Daten sowie das Lernen wesentlich optimierter durchgeführt werden kann und letztlich damit akkuratere zu Ausgabesignalen geformte Voraussagedaten erzeugt werden . Die erfindungsgemäße Multi-View Lernproblem Transformation ermöglicht auch ein weiteres nicht direkt dargestelltes Bei ¬ spiel .

Dieses weitere Ausführungsbeispiel ergibt sich mittels erfin- dungsgemäßer Weiterbildung unter anderem dann, wenn gemäß des erfindungswesentlichen Ansatzes, dass das lernende Modell sich anhand spektroskopischer Daten, die durch eine Mehrzahl sich unterscheidender Merkmalsvektoren ΧΙ.,.Χη repräsentiert sind, optimiert, wobei jeder Merkmalsvektor eine andere Sicht auf das gemessene Objekt darstellt.

Hierdurch wird es nach erfindungsgemäßer Überlegung möglich auch andere Quellen, als nur ein Spektroskop, für sich unterscheidende Merkmalsvektoren einzusetzen.

Beispielsweise können weitere Spektroskope die Quelle der Spektren und damit Merkmalsvektoren sein, wobei diese Spekt- roskope sich beispielsweise im spektralen Messbereich unterscheiden. Denkbar sind auch zumindest einzelne Merkmalsvekto ¬ ren Xi aus nicht-spektroskopischen Quellen zu beziehen.

Grundsätzlich gibt es zwei Möglichkeiten, die unterschiedli- chen Merkmalsvektoren XI...Xn der n Sichten zu kombinieren.

Die erste Möglichkeit ist die Konkatenation (d.h. Verkettung) zu einer Menge von Gesamtmerkmalsvektoren X=(X1, X2, Xn) , auf der das Modell in Modul B trainiert und angewandt wird. Die Dimension des Gesamtvektors X ist hier gleich der Summe der Dimensionen der einzelnen Vektoren XI...Xn. Die Modellbildung in B findet hierbei auf den Gesamtmerkmalsvektoren X statt . Die zweite Möglichkeit ist, anstelle der Konkatenation zu ei ¬ nem Gesamtvektor, die einzelnen Merkmalsvektoren XI...Xn getrennt in Modul B zu verarbeiten. Dies ist vorteilhaft insbe ¬ sondere bei in ihrer Art heterogenen Datensätzen, wie sie beispielsweise bei der Kombination von spektroskopischen Da- ten mit nicht-spektroskopischen (z.B. genomischen/

proteomischen) Daten auftreten.

Eine getrennte Verarbeitung der Merkmalsvektoren XI...Xn in Modul B kann erfolgen, indem beispielsweise n Teilmodelle ge- trennt auf den XI...Xn trainiert werden und deren n Modellvorhersagen f(Xl), f (Xn) geeignet kombiniert werden, beispielsweise über gewichtete Mittelwertbildung. Die Modelle in Modul B können dabei beispielsweise lineare Modelle, Neuronale Netze oder Kernel-basierende Methoden wie Gaußprozessmodelle oder Support Vector Machines sein. Eine Ausgestaltungsvariante der Erfindung verwendet Kernel ¬ basierte Methoden im Vorhersagemodul B. Hierbei definiert ei ne Kernelfunktion ein Ähnlichkeitsmaß k(X,Y) zwischen zwei jeweils durch ihre Merkmalsvektoren X und Y repräsentierten Objekte. Ein bei Spektraldaten gut funktionierender Kernel ist beispielsweise der in der Literatur bekannte sogenannte MLP-Kernel, welcher durch a w 2 X T Y + a b 2

k(X, Y) er — arcsin|

π <Ja w 2 X T X + a b 2 +lla w 2 Y T Y + a b 2 + 1 gegeben ist, wobei X und Y aus kombinierten Merkmalen bestehende Vektoren zweier Spektren darstellen und die sogenannten Hyperparameter a,a w ,a b während des Trainings optimiert werden.

Wenn man die Merkmalsvektoren nicht konkateniert , sondern aus oben genannten Gründen getrennt verarbeitet, kann dies durch Kombination mehrerer unterschiedlicher Kernel-Funktionen erfolgen, die jeweils auf den einzelnen Merkmalsvektoren arbeiten. Die Gesamt-Kernelfunktion ergibt sich hierbei als Kombination der n Kernel, k(X,Y) = h{k x (X\,Y\),...,k n (Xn n)) wobei XI und Yl die Repräsentationen zweier Objekte im Merkmalsraum der ersten Sicht sind und Xn und Yn entsprechend die Repräsentationen im Merkmalsraum der N-ten Sicht. Die Funktion h kann dabei die gewichtete Summe und/oder das gewichtete Produkt der einzelnen Kernel bilden.

Ein Vorteil dabei ist, dass die einzelnen Kernel in kleineren Räumen arbeiten, so dass insgesamt weniger Parameter vom maschinellen Lernen trainiert werden müssen. Beispielsweise kann statt der Anwendung des oben genannten Ausführungsbeispiels mit MLP Kernel anstelle der Konkatenation zu einem 100 dimensionalen Raum, eine Aufteilung auf zwei Kernel erfolgen, die jeweils in einem 50 dimensionalen Raum arbeiten.

Weitere Ausführungsbeispiele sind ebenso erfindungsgemäß um- fasst, bei denen zum Beispiel N Sichten N Merkmalssätze ver ¬ arbeiten, durch M < N Kernel verarbeitet werden und somit ei ¬ nige Kernel eine Verkettung von Merkmalssätzen verarbeiten, während andere lediglich einen Merkmalssatz als Grundlage ihrer Verarbeitung zugeführt bekommen.

Ein Vorteil der Kernel, insbesondere der bisher genannten Me ¬ thoden, besteht darin, dass diverse Hyperparameter eines Ker- nel oft auch als Maß für die Wichtigkeit der eingangsseitig vorliegenden Größe interpretiert werden können. Dies kann dabei helfen, das jeweilige Modell zu validieren und spektrale Bereiche zu ermitteln, deren Werte von Relevanz für die Voraussage sind.

Der Einsatz eines Gaußprozessmodells , was ebenfalls eine Aus ¬ gestaltungsvariante der Erfindung darstellt, ist von Vorteil, weil dessen Anwendung eine Voraussage generiert, die auf ei ¬ ner Wahrscheinlichkeitsinterpretation beruht, die genutzt werden kann, um die Sicherheit des Modells bei der Voraussage zu bewerten.

Insbesondere bei der Konkatenation entstehen hochdimensionale Merkmalsvektoren. Daher ist gemäß einer weiteren vorteilhaf- ten Weiterbildung der Erfindung eine Kompression vorgesehen. Ein Ausführungsbeispiel hierzu ist in der FIG 3 dargestellt.

In der schematischen Darstellung ist eine so genannte Wave- let-Transformation gezeigt. Also eine ebenfalls prozessorge- stützte Signalverarbeitung der anfallenden ( Spektral ) Daten .

Zu erkennen ist eine Wavelet Zerlegung (Wavelet

Decomposition) , die gemäß ihrer Funktion eine ausgedünnte Re- Präsentation der Eingangsdaten, beispielsweise für die Kernel, erzeugt, da sehr viele der durch die Wavelet- Transformation erzeugten Koeffizienten zumindest annähernd den Wert 0 aufweisen.

Diese Transformation wird auf zwei Sichten angewandt; zum Einen auf ein durch spektroskopische Verfahren wie NIRS von ei ¬ ner Probe erfasstes Spektrum und zum Anderen auf eine zweite Sicht, die beispielsweise durch eine durchgeführte Signalver- arbeitung des Spektrums erzeugte erste Ableitung des Spekt ¬ rums .

Die erzeugten und per Wavelet Decomposition ausgedünnten Koeffizienten lassen sich dann wie in der Figur durch das Plus- zeichen angedeutet durch Addition zu kombinierten Merkmalsvektoren zusammenfügen und an die beispielsweise oben genannten diversen Modelle bzw. Kernel weitergeben.

Damit wird eine sehr gute Kompression erzielt. Beispielsweise kann ein Spektrum mit 250 Wellenlängen durch weniger als 50

Wavelet-Koeffizienten repräsentiert werden. Die Konkatenation von zwei Sichten mit eingangs 250 Wellenlängen würde somit einen kombinierten Merkmalsvektor mit einer Dimension von weniger als 100 statt einer Dimension von 500 erzielen.

Alternative Kompressionsmethoden als die dargestellte Methode sind ebenso anwendbar, beispielsweise die Hauptkomponenten ¬ analyse oder ein nichtlinearer Dimensionreduktionsansatz. Die Erfindung ist nicht auf die beschriebenen Ausführungsbei ¬ spiele und deren Weiterbildungen beschränkt, vielmehr umfasst sie alle durch die Ansprüche abgedeckten Varianten sowie Kombinationen von zumindest Teilen von den genannten Methoden, insbesondere die, bei dem in das erfindungsgemäß gebildete Gerüst verschiedene Vorverarbeitungsmethoden sowie, insbesondere heterogene, beispielsweise von unterschiedlichen Messge ¬ räten stammenden, Daten auf einfache Weise integriert werden und so beispielsweise in medizinischen Anwendungen, genomischen oder proteomischen Informationen über den Patien ten mit spektralen Daten mittels separater Kernel zur Analyse, wie beispielsweise zur Unterscheidung von karzinomen Gewebe von gesundem Gewebe, insbesondere während laufender Ope rationen, zu kombinieren.