Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND ASSISTANCE SYSTEM FOR PARAMETERIZING AN ANOMALY DETECTION METHOD
Document Type and Number:
WIPO Patent Application WO/2020/057937
Kind Code:
A1
Abstract:
A method for parameterizing an anomaly detection method, which takes a multiplicity of sensor data points as a basis for performing a density-based cluster method, comprising a) mapping (S10) each sensor data point (SP1, SP2, SP3) in a data space into a pixel data point (PP1, PP2, PP3) in a pixel space, b) reproducing (S11) at least one operation of the density-based cluster method in the data space by means of at least one pixel operation in the pixel space, c) receiving (S12) at least one parameter value for each parameter of the density-based cluster method, d) applying (S13) the at least one pixel operation in accordance with the parameter values to the pixel data points (PP1, PP2, PP3), e) outputting (S14) a cluster result in visual form in the pixel space, and f) providing (S16) the received parameter values for the anomaly detection method, and an assistance apparatus (80) for parameterizing an anomaly detection apparatus (90) that performs the anomaly detection method.

Inventors:
KEHRER JOHANNES (DE)
WEBER STEFAN HAGEN (DE)
PAULITSCH CHRISTOPH (DE)
Application Number:
PCT/EP2019/073176
Publication Date:
March 26, 2020
Filing Date:
August 30, 2019
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS AG (DE)
International Classes:
G05B23/02
Foreign References:
US20110072016A12011-03-24
Other References:
JENS DITTRICH ET AL: "Die Umgedrehte Vorlesung - Chancen für die Informatiklehre", DATENBANK-SPEKTRUM, 1 March 2014 (2014-03-01), Berlin/Heidelberg, pages 69 - 76, XP055525303, Retrieved from the Internet [retrieved on 20181120], DOI: 10.1007/s13222-013-0143-9
NAGARAJU S ET AL: "An effective density based approach to detect complex data clusters using notion of neighborhood difference", INTERNATIONAL JOURNAL OF AUTOMATION AND COMPUTING, ZHONGGUO KEXUE ZAZHISHE, CN, vol. 14, no. 1, 29 December 2016 (2016-12-29), pages 57 - 67, XP036141705, ISSN: 1476-8186, [retrieved on 20161229], DOI: 10.1007/S11633-016-1038-7
Download PDF:
Claims:
Patentansprüche

1. Verfahren zur Parametrisierung eines Anomalieerkennungs verfahrens, das basierend auf einer Vielzahl von Sensordaten punkten, ein dichtebasiertes Clusterverfahren durchführt, um fassend

a) Abbilden (S10) eines jeden Sensordatenpunkts (SP1, SP2, SP3) in einem Datenraum in einen Pixeldatenpunkt (PP1, PP2, PP3) in einem Pixelraum, der von einer Vielzahl von Pixelda tenpunkten aufgespannt wird,

b) Nachbilden (Sil) mindestens einer Operation des dichteba sierten Clusterverfahrens im Datenraum durch mindestens eine Pixeloperation im Pixelraum,

c) Empfangen (S12) von mindestens einem Parameterwert für je den Parameter des dichtebasierten Clusterverfahrens,

d) Anwenden (S13) der mindestens einen Pixeloperation ent sprechend den empfangenen Parameterwerten auf die Pixeldaten punkte (PP1, PP2 , PP3 ) ,

e) Ausgeben (S14) eines Clusterergebnisses in visueller Form im Pixelraum, und

f) Bereitstellen (S16) der empfangenen Parameterwerte für das Anomalieerkennungsverfahren .

2. Verfahren nach Anspruch 1, wobei nach Ausgabe des Clus terergebnisses mindestens einer der Parameterwerte geändert wird (S15) und die Verfahrensschritte c) , d) und e) mit dem mindestens einen geänderten Parameterwert erneut durchgeführt werden .

3. Verfahren nach einem der vorangehenden Ansprüche, wobei der Pixelraum durch ein zweidimensionales Koordinatensystem aufgespannt wird, wobei jeder Koordinate eine unterschiedli che Größe (Gl, G2) der Sensordatenpunkte (SP1, SP2, SP3) zu geordnet ist.

4. Verfahren nach Anspruch 3, wobei das Verhältnis der Aus dehnung der beiden Koordinaten zueinander jeweils dem Ver hältnis der Wertebereiche der zugeordneten Größe (Gl, G2) der Sensordatenpunkte zueinander entspricht, oder mindestens ein Wertebereich normalisierte Sensordatenwerte umfasst oder min destens ein Wertebereich Sensordatenwerte entsprechend einer Verteilungsfunktion (30) umfasst.

5. Verfahren nach einem der vorangehenden Ansprüche, wobei das Clusterverfahren ein dichtebasiertes räumliches Cluster analyseverfahren mit Rauschen (DBSCAN) ist.

6. Verfahren nach Anspruch 5, wobei

ein Distanzwert ( ) ein erster Parameter des Clusterverfah rens und die minimale Anzahl (minPts) von Sensordatenpunkten (SP1, SP2, SP3) um ein Cluster zu bilden, ein zweiter Parame ter des Clusterverfahrens ist.

7. Verfahren nach Anspruch 5 oder 6, wobei eine Ermittlung von Kernpunkten (KP) aus der Vielzahl von Sensordatenpunkten (SP1, SP2, SP3) eine erste Operation des dichtebasierten Clusterverfahrens im Datenraum ist und diese erste Operation auf eine erste Pixeloperation im Pixelraum abgebildet wird, wobei die erste Pixeloperation für jeden Sensordatenpunkt (SP1, SP2, SP3) , dem ein betrachteter Pixeldatenpunkt (PP4) zugeordnet ist, überprüft, ob die Anzahl der Pixeldatenpunk te, die innerhalb eines Distanzwerts entsprechend dem ersten empfangenen Parameterwert um den betrachteten Pixeldatenpunkt (PP4) angeordnet sind, gleich dem zweiten empfangenen oder größer als der zweite empfangene Parameterwert ist.

8. Verfahren nach Anspruch 7, wobei die Anzahl der Pixelda tenpunkte innerhalb eines Distanzwerts entsprechend dem ers ten empfangenen Parameter um den betrachteten Pixeldatenpunkt durch das Ermitteln aller Pixeldatenpunkte, die innerhalb ei nes Strukturelement (21) angeordnet sind, ermittelt wird, wo bei das Strukturelement (21) zentriert um den betrachteten Pixeldatenpunkt (PP4) angeordnet ist, und die räumliche Aus dehnung des Strukturelements abhängig vom ersten empfangenen Parameterwert ( ) ist.

9. Verfahren nach Anspruch 8, wobei eine Form des Struktu relements (21) abhängig von einem in dem Clusterverfahren an gewendeten Distanzmaß ist, insbesondere das Strukturelement (21) für ein Euklidisches Distanzmaß rund ist, das Struktu relement (21) für ein Manhattan Distanzmaß rautenförmig ist, das Strukturelement (21) für ein Chebyshev Distanzmaß quadra tisch ist.

10. Verfahren nach einem der Ansprüche 6 bis 9, wobei jeder Pixeldatenpunkt (PP1, PP2, PP3) im Pixelraum abhängig von ei ner minimalen Distanz des Pixeldatenpunktes (PP1, PP2, PP3) zu einem nächsten Kernpunkt (KP) in einer Farbe dargestellt wird .

11. Verfahren nach einem der Ansprüche 6 bis 10, wobei eine Kontur (61, 62) eines Clusters anzeigt wird, indem die Pixel datenpunkte (PP1, PP2, PP3) , die einen Abstand von der Hälfte des ersten Parameterwerts ( /2), bevorzugt zusätzlich die Pixeldatenpunkte, die einen Abstand von einem Ganzen ersten Parameterwert ( ) von einem am nächsten gelegenen Kernpunkt (KP) aufweisen, farblich dargestellt werden.

12. Verfahren nach einem der Ansprüche 6 bis 11, wobei die Pixel entsprechend einer Schummerung abhängig von einer räum lichen Verteilung der Kernpunkte im Pixelraum dargestellt werden .

13. Verfahren nach einem der Ansprüche 1 bis 3, wobei für mehr als zweidimensionale Sensordatenpunkte ein zweidimensio nales Verfahren gemäß den Ansprüchen 4 bis 12 mit zwei vor- gebbaren Größen (Dimensionen) zu einem ausgewählten Datenwert einer dritten Größe der Sensordatenpunkte durchgeführt wird und über eine Änderung des ausgewählten Datenwertes der drit ten Größe eine Änderung des Clusterergebnisses des zweidimen sionalen Verfahrens dargestellt wird.

14. Assistenzvorrichtung (80) zur Parametrisierung eines Ano malieerkennungsverfahrens, insbesondere ausgeführt in einer Anomalieerkennungsvorrichtung (90), basierend auf einer Viel zahl von Sensordatenpunkten mittels eines dichtebasierten Clusterverfahrens durchführt, umfassend

a) Abbildungseinheit (81), die derart ausgebildet ist, jeden Sensordatenpunkt (SP1, SP2, SP3) in einem Datenraum in einen Pixeldatenpunkt (PP1, PP2, PP3) in einem Pixelraum abzubil den,

b) Nachbildeeinheit (82), die derart ausgebildet ist, mindes tens eine Operation des dichtebasierten Clusterverfahrens im Datenraum durch mindestens eine Pixeloperation im Pixelraum, der von einer Vielzahl von Pixeldatenpunkten aufgespannt wird, nachzubilden,

c) Eingabeeinheit (83), die derart ausgebildet ist, mindes tens einen Parameterwert für jeden Parameter des dichteba sierten Clusterverfahrens zu empfangen,

d) Operationseinheit (84), die derart ausgebildet ist, min destens eine Pixeloperation entsprechend den empfangenen Pa rameterwerten auf die Pixeldatenpunkte anzuwenden,

e) Ausgabeeinheit (85), die derart ausgebildet ist, Clus terergebnisse im Pixelraum in visueller Form auszugeben, und f) Bereitstellungseinheit (86), die derart ausgebildet ist, die empfangenen Parameterwerte als Eingangsparameter für die Anomalieerkennungsverfahren bereitzustellen.

15. Assistenzvorrichtung nach Anspruch 14, wobei der Pixel raum durch eine Vielzahl von Pixel mindestens eines Teilbe reichs der Ausgabeeinheit (85), insbesondere eines Bild schirms, ausgebildet ist.

16. Assistenzvorrichtung nach Anspruch 14 oder 15, wobei die Eingabeeinheit (83) und die Ausgabeeinheit (85) als eine gra phische Nutzerschnittstelle ausgebildet sind, die derart aus gebildet ist, für mindestens einen Parameter ein graphisches Eingabeelement (72, 73) darzustellen und darüber die entspre chenden Parameterwerte auszuwählen und zu empfangen.

17. Computerprogrammprodukt umfassend ein nichtflüchtiges Computer-lesbares Medium, das direkt in einen Speicher eines digitalen Computers ladbar ist, umfassend Programmcodeteile, die dazu geeignet sind, die Schritte des Verfahrens nach ei nem der Ansprüche 1 bis 13 durchzuführen.

Description:
Beschreibung

Verfahren und Assistenzsystem zur Parametrisierung eines Ano malieerkennungs V erfahrens

Die Erfindung betrifft ein Verfahren, ein Assistenzsystem so wie ein Computerprogrammprodukt zur Parametrisierung eines Anomalieerkennungsverfahrens, das basierend auf einer Viel zahl von Sensordatenpunkten ein dichtebasiertes Clusterver fahren in Echtzeit approximiert.

Eine datenbasierte Anomalieerkennung wird in Industrieanlagen dazu eingesetzt, unerwünschte oder gefährliche Betriebszu stände von Maschinen oder sonstigen Komponenten der Anlage frühzeitig zu erkennen und rechtzeitig, beispielsweise durch Abschaltung oder Reparatur, darauf reagieren zu können.

Beispiele für Anomalien in Industrieanlagen, die anhand von meist durch Sensoren aufgenommene Daten erkannt werden sol len, sind ungewollte Produktionsminderungen, verschleißbe dingte Gerätefehler, Abnutzungserscheinungen, Fehleinstellun gen von Geräten, aber auch Nachfragerückgänge, Produktions rückgänge oder Qualitätseinbußen.

Technische Verfahren zur Anomalieerkennung basieren üblicher weise auf einer bestimmten Parametrisierung, also der Auswahl von Eingangsparametern, der eingesetzten Algorithmen. Je bes ser die Abgrenzung von einem normalen zu einem anormalen Ver halten ist, desto besser kann ein regelgerechter Betrieb si chergestellt und Kosten durch Anomalien vermieden werden.

Ein weit verbreitetes Verfahren zur Anomalieerkennung ist das Trainieren eines dichtebasierten Clustering-Algorithmus auf Daten, insbesondere Sensordaten aus dem regelgerechten Be trieb, also Daten ohne Anomalien. Dieses Verfahren ist sehr trennscharf, aber schwierig zu parametrisieren . Bei zweidi mensionalen Daten können die Ergebnisse aus dem Clustering- Algorithmus zur Überprüfung in Form eines Streudiagramms vi- sualisiert werden, in dem die Punkte entsprechend ihres Ano maliestatus beziehungsweise ihrer Zugehörigkeit zu einem Cluster eingefärbt sind.

Eine richtige Einstellung der Parameterwerte solcher Clus- tering-Algorithmen, im Weiteren auch kurz als Clusterverfah ren bezeichnet, ist wichtig, aber auch sehr zeitaufwändig. Schon eine geringe Abweichung der Parameterwerte vom domänen spezifischen und benutzerabhängigen Optimum kann zu veränder ter Clusterbildung und damit schlechteren Erkennungsraten führen .

Es sind automatisierte Verfahren bekannt, welche Vorschläge zu einer initialen Parametrisierung eines dichtebasierten Clustering-Algorithmus liefern. Solche automatisierten Ver fahren haben den Nachteil, dass die Parametrisierung aus ei ner Regel resultiert, welche das Optimum für einen konkreten Fall nur annähert, und keine aktuellen Informationen, wie zum Beispiel Kontext- und Domänenwissen eines Benutzers, berück sichtigt. Der Nutzer sollte möglichst auch verstehen, wie das automatisierte Verfahren zur Parameterbestimmung funktioniert und die Parameter bildet.

Des Weiteren muss ein Nutzer eines Clusterverfahrens, der den zugrundeliegenden Clustering-Algorithmus nicht im Detail nachvollziehen kann, trotzdem verstehen können, wie sich Än derungen der Parameterwerte des Algorithmus auf das Clus terergebnis auswirken. Deshalb ist es notwendig, dass ein Nutzer manuell geeignete Parameterwerte einstellt beziehungs weise nachj ustiert . Dazu werden mindestens einer oder mehrere der Parameterwerte geändert und der Clustering-Algorithmus mit den neuen Parameterwerten gestartet. Die Berechnung der Clusterzugehörigkeit durch den Clustering-Algorithmus ist sehr zeitintensiv . Abhängig von der Anzahl der zugrunde lie genden Datenpunkte dauert die Berechnung von Sekunden bis zu Stunden. Anschließend kann das Clusterergebnis beispielsweise durch Visualisierung oder ausgegebene Fehlermaße ausgewertet werden. Um ein brauchbares Clusteringergebnis zu erhalten, sind häufig mehrfache Parameteränderungen und Berechnung der jeweiligen Clusterergebnisse notwendig.

Es ist somit die Aufgabe der vorliegenden Erfindung zeitopti miert und unter Einbeziehung von Domänenwissen eines Benut zers, die Festlegung von Parametern für eine Anomalieerken nung zu beschleunigen.

Die Aufgabe wird durch die in den unabhängigen Ansprüchen be schriebenen Maßnahmen gelöst. In den Unteransprüchen sind vorteilhafte Weiterbildungen der Erfindung dargestellt.

Gemäß einem ersten Aspekt betrifft die Erfindung ein Verfah ren zur Parametrisierung eines Anomalieerkennungsverfahrens, das basierend auf einer Vielzahl von Sensordatenpunkten ein dichtebasiertes Clusterverfahren durchführt, umfassend a) Abbilden eines jeden Sensordatenpunktes in einem Datenraum in einen Pixeldatenpunkt in einem Pixelraum,

b) Nachbilden mindestens einer Operation des dichtebasierten Clusterverfahrens im Datenraum durch mindestens eine Pixe loperation im Pixelraum,

c) Empfangen von mindestens einem Parameterwert für jeden Pa rameter des dichtebasierten Clusterverfahrens,

d) Anwenden der mindestens einen Pixeloperation entsprechend den empfangenen Parameterwert auf die Pixeldatenpunkte, e) Ausgabe eines Clusterergebnisses in visueller Form im Pi xelraum, und

f) Bereitstellen der empfangenen Parameterwerte als Parameter für das Anomalieerkennungsverfahren.

Die Bezeichnungen Clusteranalyse, Clusteranalyseverfahren, Clusteringverfahren und Clusterverfahren werden nachfolgend als Synonyme verwendet.

Durch das Abbilden der Sensordatenpunkte in den Pixelraum und das Nachbilden des Clusterverfahrens durch Pixeloperationen kann nicht nur ein Ergebnis des Clusterverfahrens schneller dargestellt werden, sondern das nachgebildete Clusterverfah ren als solches kann schneller ausgeführt werden. Aufwändige Berechnungen der Cluster entsprechend dem tatsächlichen Clus- tering-Algorithmus werden durch graphische beziehungsweise visuelle Verfahren angenähert und ersetzt. Operationen im Pi xelraum können durch leistungsstarke Hardware, wie beispiels weise Graphikkarten, sowie zeitoptimierte Algorithmen durch geführt werden.

Ein Sensordatenpunkt umfasst mindestens zwei Kenngrößen, auch kurz als Größen bezeichnet, eines Gerätes, wie beispielsweise Leistung, Geschwindigkeit, Spannung, Strom, Drehzahl, Drehmo ment, aber auch Stückzahl, Qualität, Anzahl oder Dauer, zu einem beispielsweise Zeitpunkt oder bei einem bestimmten Be triebsmodus eines Geräts oder einer Anlagenkomponente. In ei nem Datenraum liegen Sensordaten als Werte ohne sonstigen Be zug vor. Ein Pixeldatenpunkt in einem Pixelraum bezeichnet einen Bildpunkt, auch als Pixel bezeichnet, der einem Sensor datenpunkt zugeordnet ist. Eine Vielzahl von Pixel wiederum spannt einen Pixelraum, im zweidimensionalen Fall beispiels weise Bildpunkte einer visuellen Ausgabeeinheit, beispiels weise einem Bildschirm oder Display, auf.

In einer vorteilhaften Ausführungsform wird nach Ausgabe des Clusterergebnisses mindestens einer der Parameterwerte geän dert und die Verfahrensschritte c) , d) und e) werden mit dem mindestens einen geänderten Parameterwert erneut durchge führt .

Dies hat den Vorteil Clusterergebnisse mit veränderten Para metern kurzfristig visualisieren, also bildlich berechnen und darstellen zu können. Eine solche zeitoptimierte Berechnung und Darstellung von Clusterergebnissen mit unterschiedlichen Parametern erlaubt ein einfaches Erkennen von Auswirkungen der Parameteränderung auf die resultierenden Clusterergebnis se. Ein Nutzer lernt somit den Clustering-Algorithmus zu ver stehen, ohne ein tieferes Verständnis der technischen Imple mentierung haben zu müssen. Somit ist eine Parametereinstel lung des eigentlichen dichtebasierten Clusterverfahrens ange- passt an die technischen Gegebenheiten und ein Domänenwissen eines Fachmanns möglich.

In einer vorteilhaften Ausführungsform wird der Pixelraum durch ein zweidimensionales Koordinatensystem aufgespannt, wobei jeder Koordinate eine unterschiedliche Größe der Sens ordatenpunkte zugeordnet ist.

In einem zweidimensionalen Pixelraum können vorzugsweise Grö ßen, die eine Abhängigkeit voneinander aufweisen, einander gegenübergestellt werden. Beispiele von Größen, die den bei den Koordinaten zugeordnet sind, sind beispielsweise Leis tung und Geschwindigkeit, Intensität und Verschleiß, Umsatz und Gewinn, Anzahl und Dauer. Bevorzugt sind auch Messgrößen, die miteinander multipliziert physikalisch eine Leistung er geben, wie beispielsweise Spannung und Strom, Drehzahl und Drehmoment oder auch Durchfluss und Druck, um beispielsweise Regionen gleicher Leistung zu ermitteln. Bevorzugt sind auch Größen wie Werkzeugnummer oder Maximalstrom beziehungsweise Druck, die von einer weiteren gemeinsamen charakteristischen Größe abhängen, so dass sich klare Gruppen ergeben.

Die Bezeichnungen Cluster und Gruppe werden in diesem Doku ment als Synonym verwendet und bezeichnet eine Ähnlichkeits struktur von ähnlichen Objekten.

In einer vorteilhaften Ausführungsform entspricht das Ver hältnis der Ausdehnung der beiden Koordinaten zueinander je weils dem Verhältnis der Wertebereiche der zugeordneten Größe der Sensordatenpunkte zueinander, wobei insbesondere zumin dest ein Wertebereich normalisierte Sensordatenwerte umfasst, oder mindestens ein Wertbereich Sensordatenwerte entsprechend einer Verteilungsfunktion umfasst.

Dies erlaubt eine intuitive Darstellung. Durch eine Normali sierung der Sensordatenwerte und anschließende Zuordnung zu einer Koordinate wird ein Fehler bei einer anschließenden Clusterbildung reduziert. Bei einer ungleichmäßigen Vertei- lung der Datenpunkte kann durch die Anordnung der Datenpunkte gemäß einer Verteilungsfunktion eine gleichmäßigere Vertei lung der Datenpunkte auf die Pixel erreicht werden.

In einer vorteilhaften Ausführungsform ist das Clusterverfah ren ein dichtebasiertes räumliches Clusteranalyseverfahren mit Rauschen, das auch abgekürzt als DBSCAN bezeichnet wird.

Dies hat den Vorteil, dass ein sehr häufig verwendetes Clus teranalyseverfahren zeitoptimiert approximiert wird.

In einer vorteilhaften Ausführungsform ist ein Distanzwert ein erster Parameter des Clusterverfahrens und die minimale Anzahl von Sensordatenpunkten um ein Cluster zu bilden, ein zweiter Parameter des Clusterverfahrens.

Dies ermöglicht es, die Hauptparameter von dichtebasierten Clusteranalyseverfahren über das visuelle Verfahren zeitopti miert anzuwenden, ein daraus resultierendes Clusterergebnis anzuzeigen und analysieren zu können.

In einer vorteilhaften Ausführungsform ist eine Ermittlung von Kernpunkten aus der Vielzahl von Sensordatenpunkten eine erste Operation des dichtebasierten Clusterverfahrens im Da tenraum und diese erste Operation wird auf eine erste Pixelo peration im Pixelraum abgebildet, wobei die erste Pixelopera tion für jeden Sensordatenpunkt, dem ein betrachteter Pixel datenpunkt zugeordnet ist, überprüft, ob die Anzahl der Pi xeldatenpunkte, die innerhalb eines Distanzwertes entspre chend des ersten empfangenen Parameterwerts um den betrachte ten Pixeldatenpunkt angeordnet sind, gleich dem zweiten emp fangenen oder größer als der zweite empfangene Parameterwert ist .

Durch das Ersetzen der ersten Operation des dichtebasierten Clusterverfahrens durch eine erste Pixeloperation im Pixel raum können graphische Verfahren zur Berechnung und Darstel lung des Clusterergebnisses verwendet werden. Diese erfordern eine geringere Anzahl an Rechenschritten, skalieren bei spielsweise lediglich linear statt quadratisch, und ermögli chen damit eine Durchführung in Echtzeit.

In einer vorteilhaften Ausführungsform wird die Anzahl der Pixeldatenpunkte innerhalb eines Distanzwertes entsprechend dem ersten empfangenen Parameter um den betrachteten Pixelda tenpunkt durch das Ermitteln aller Pixeldatenpunkte, die in nerhalb eines Strukturelements angeordnet sind, ermittelt, wobei das Strukturelement zentriert um den betrachteten Pi xeldatenpunkt angeordnet ist und die räumliche Ausdehnung des Strukturelements abhängig vom ersten empfangenen Parameter wert ist.

Durch die Verwendung eines Strukturelements kann die Pixelda tenoperation zur Ermittlung eines Kernpunktes sehr effizient durch die Verwendung von Operationen aus der Bildverarbeitung durchgeführt werden.

In einer vorteilhaften Ausführungsform ist eine Form des Strukturelements abhängig von einem in dem Clusterverfahren verwendeten Distanzmaß, insbesondere ist das Strukturelement für ein euklidisches Distanzmaß rund, das Strukturelement für ein Manhatten-Distanzmaß rautenförmig und das Strukturelement für ein Chebyshev-Distanzmaß quadratisch.

Dies hat den Vorteil, dass die Ermittlung von Kernpunkten und damit von Clustern im Pixelraum flexibel auf ein im dichteba sierten Clusterverfahren verwendetes Distanzmaß angepasst werden kann. Durch die unterschiedliche Form des Strukturele ments werden die unterschiedlichen Distanzmaße approximiert.

In einer vorteilhaften Ausführungsform wird jeder Pixeldaten punkt im Pixelraum abhängig von einer minimalen Distanz des Pixeldatenpunktes zu einem nächsten Kernpunkt in einer Farbe dargestellt . Dies hat den Vorteil, dass nicht nur die Zugehörigkeit zu ei nem Cluster, sondern die räumliche Nähe bzw. der Abstand ei nes Pixeldatenpunktes zu einem Kernpunkt dargestellt wird. Dadurch kann noch deutlicher die Dichteverteilung der Sensor datenpunkte sichtbar gemacht werden und bei einer Analyse des visuell dargestellten Clusterergebnisses mindestens einer der Parameter entsprechend angepasst werden.

In einer vorteilhaften Ausführungsform wird eine Kontur eines Clusters angezeigt, in dem die Pixeldatenpunkte, die einen Abstand von einer Hälfte des ersten Parameterwertes, bevor zugt zusätzlich die Pixeldatenpunkte, die einen Abstand von einem Ganzen ersten Parameterwert von einem am nächsten gele genen Kernpunkt aufweisen, farblich dargestellt werden.

Durch eine solche Kontur werden ermittelte Gruppen oder Clus ter deutlich erkennbar und trennscharf voneinander abge grenzt. Eine solche Kontur zeigt somit Datenpunkte gleichen Abstands von „äußeren" Kernpunkten des ermittelten Clusters an und werden auch als Isokontur bezeichnet. Eine weitere Isokontur mit dem Abstandswert von einem halben Parameterwert gibt eine mögliche weitere Trennlinie zwischen Clusterpunkten und beispielsweise als Rauschen beziehungsweise anormal ange sehene Pixeldatenpunkte an. Durch eine Darstellung der Kon turlinien kann insbesondere deutlich ein Einfluss von geän derten Parameterwerten auf die ermittelten Cluster sichtbar und somit für einen Nutzer auswertbar gemacht werden. Alle Pixeldatenpunkte außerhalb dieser beiden Konturen, die einem Sensordatenpunkt entsprechen, werden als Rauschen beziehungs weise anormal angesehen und separat in einer von den umlie genden Pixeln, denen kein Sensordatenpunkt zugeordnet ist, unterscheidbaren Farbe dargestellt.

In einer vorteilhaften Ausführungsform werden die Pixel, ent sprechend einer Schummerung abhängig von einer räumlichen Verteilung der Kernpunkte im Pixelraum dargestellt. Die

Schummerung erfolgt anhand der Beleuchtung mit einer imaginä ren Lichtquelle. Dies hat den Vorteil, die Positionierung einzelner Pixelda tenpunkte in der Nähe von Clustergrenzen besser beurteilen zu können. Insbesondere kann ein Benutzer selbst den Grad des 3D-Effekts einstellen oder ihn automatisch anhand der relati ven Anzahl von Datenpunkten in der Nähe der Kontur oder wei terer Kennwerte einstellen lassen.

In einer vorteilhaften Ausführungsform wird für mehr als zweidimensionale Sensordatenpunkte ein zweidimensionales Ver fahren mit zwei vorgebbaren Größen zu einem ausgewählten Da tenwert einer dritten Größe der Sensordatenpunkte durchge führt und über eine Änderung des ausgewählten Datenwertes der dritten Größe eine Änderung des Clusterergebnisses des zwei dimensionalen Verfahrens dargestellt.

Dies erlaubt es, eine dritte Größe in die graphische Berech nung und visuelle Darstellung des Clusterergebnisses einzube ziehen. Durch eine beispielsweise kontinuierliche, schritt weise Änderung der dritten Größe und entsprechenden kontinu ierlichen Darstellung der entsprechenden Clusterergebnisse kann die Veränderung der Cluster abhängig von dieser dritten Größe sichtbar und somit von einem Nutzer beziehungsweise Ex perten analysiert und mindestens ein Parameterwert der einge gebenen ersten und zweiten Parameter angepasst werden. Die dritte Größe, die einer dritten Datendimension entspricht, kann somit durch eine Animation der zweidimensionalen Sensor daten anhand einer dritten Dimension dargestellt werden. Für eine gute Interpretierbarkeit durch einen Experten werden Zeitschritte oder Betriebszustände als dritte Dimension emp fohlen .

Ein zweiter Aspekt der Erfindung betrifft eine Assistenzvor richtung, das eine Parametrisierung eines Anomalieerkennungs verfahrens, insbesondere ausgeführt in einer Anomalieerken nungsvorrichtung (90), basierend auf einer Vielzahl von Sens ordatenpunkten mittels eines dichtebasierten Clusterverfah rens durchführt, umfassend a) eine Abbildungseinheit, die derart ausgebildet ist, jeden Sensordatenpunkt in einen Pixeldatenpunkt in einen Pixel raum zu übertragen,

b) eine Nachbildeeinheit, die derart ausgebildet ist, mindes tens eine Operation des dichtebasierten Clusterverfahrens im Datenraum durch mindestens eine Pixeloperation im Pi xelraum nachzubilden,

c) eine Eingabeeinheit, die derart ausgebildet ist, mindes tens einen Parameterwert für jeden Parameter des dichteba sierten Clusterverfahrens zu empfangen,

d) eine Operationseinheit, die derart ausgebildet ist, min destens eine Pixeloperation entsprechend den Parameterwer ten auf die Pixeldatenpunkte anzuwenden,

e) eine Ausgabeeinheit, die derart ausgebildet ist, Clus

terergebnisse im Pixelraum in visueller Form darzustellen, und

f) eine Bereitstellungseinheit, die derart ausgebildet ist, die empfangenen Parameterwerte als Eingangsparameter für das Anomalieerkennungsverfahren bereitzustellen.

Eine solche Assistenzvorrichtung, die mindestens einen Pro zessor umfasst, ermöglicht es das Clusterergebnis nicht mehr im ursprünglichen Datenraum, sondern in einem Pixelraum zu berechnen. Die Laufzeit zur Berechnung des Clusterergebnisses ist somit nicht mehr abhängig von der Anzahl der Datenpunkte, sondern der Anzahl der Pixel, also der Auflösung der Visuali sierung, sowie der gewählten Parameterwerte. Über die Wahl der Anzahl der Pixel kann zwischen Auflösung und Rechenzeit abgewogen werden. Dies kann den Ansatz speziell für große Da tensätze enorm beschleunigen. Somit ist eine Berechnung von Clusterergebnissen in Echtzeit möglich.

In einer vorteilhaften Ausführungsform ist der Pixelraum durch eine Vielzahl von Pixeln mindestens eines Teilbereichs der Ausgabeeinheit, insbesondere eines Bildschirms, ausgebil det . Ein Pixel bezeichnet einen Bildpunkt einer visuellen Ausgabe einheit. Ein Pixel kann aber auch eine Gruppe von physikali schen Bildpunkten sein, wenn die Auflösung der Eingabeeinheit größer als die Auflösung der Pixeldatenpunkte im Pixelraum ist .

In einer vorteilhaften Ausführungsform sind die Eingabeein heit und die Ausgabeeinheit als eine graphische Nutzer schnittstelle ausgebildet, die derart ausgebildet ist, ein graphisches Eingabeelement für mindestens einen Parameter darzustellen und darüber den entsprechenden Parameterwert auszuwählen und zu empfangen.

Dies ermöglicht eine einfache und intuitive Änderungs- bezie hungsweise Eingabemöglichkeit der Parameter, die insbesondere bei gleichzeitiger Darstellung des Clusterergebnisses einen Zusammenhang zwischen den empfangenen Parametern und dem Clusterergebnis erfassbar macht.

In einem dritten Aspekt betrifft die Erfindung ein Computer programmprodukt umfassend ein nicht vorübergehendes computer lesbares Medium, das direkt in einen Speicher eines digitalen Computers ladbar ist, umfassend Programmcodeteile, die dazu geeignet sind, die Schritte des beschriebenen Verfahrens durchzuführen .

Sofern es in der nachfolgenden Beschreibung nicht anders an gegeben ist, beziehen sich die Begriffe "abbilden", "nachbil den", "empfangen", "anwenden", "ausgeben", "bereitstellen" und dergleichen vorzugsweise auf Handlungen und/oder Prozesse und/oder Verarbeitungsschritte, die Daten verändern und/oder erzeugen und/oder die Daten in andere Daten überführen, wobei die Daten insbesondere als physikalische Größen dargestellt oder vorliegen können.

Unter einem Prozessor kann im Zusammenhang mit der Erfindung beispielsweise ein Computer, eine Maschine oder eine elektro nische Schaltung verstanden werden. Auch kann unter einem Prozessor ein virtualisierter Prozessor, der beispielsweise in einem durch viele Nutzer geteilten Server, auch als Cloud bezeichnet, ausgebildet sein. Eine jeweilige "Einheit", zum Beispiel die Abbildungseinheit oder Nachbildeeinheit, kann hardwaretechnisch und/oder auch softwaretechnisch implemen tiert sein. Bei einer hardwaretechnischen Implementierung kann die jeweilige Einheit als Vorrichtung oder als Teil ei ner Vorrichtung zum Beispiel als Computer, als Teil eines Computers wie beispielsweise eine Graphikkarte oder als Mik roprozessor ausgebildet sein. Bei einer softwaretechnischen Implementierung kann die jeweilige Einheit als Computerpro grammprodukt, als eine Funktion, als eine Routine, als Teil eines Programmcodes oder als ausführbares Objekt ausgebildet sein .

Ein Computerprogrammprodukt kann beispielsweise als Speicher medium, wie zum Beispiel eine Speicherkarte, USB-Stick, CD- ROM, DVD oder auch in Form einer herunterladbaren Datei von einem Server in einem Netzwerk bereitgestellt oder geliefert werden .

Ausführungsbeispiele des erfindungsgemäßen Verfahrens sowie der Assistenzvorrichtung sind in den Zeichnungen beispielhaft dargestellt und werden anhand der nachfolgenden Beschreibung näher erläutert. Es zeigen:

Figur 1 ein Ausführungsbeispiel des erfindungsgemäßen Ver fahrens als Flussdiagramm;

Figur 2 eine schematische Darstellung von Parametern eines dichtebasierten Clusterverfahrens ;

Figur 3 eine schematische Darstellung der Abbildung von

Sensordatenpunkten in einem dreidimensionalen Da tenraum in Pixeldatenpunkte eines zweidimensionalen Pixelraums ; Figur 4 eine schematische Darstellung zur Ausdehnung und Einteilung einer Koordinate entsprechend einer Ver teilungsfunktion der Sensordatenwerte;

Figur 5 eine schematische Darstellung der erfindungsgemäßen ersten Pixeloperation;

Figur 6 ein Ausführungsbeispiel eines durch das erfindungs gemäße Verfahren ausgegebenen Clusterergebnisses in visueller Form im Pixelraum;

Figur 7 ein Ausführungsbeispiel einer erfindungsgemäßen As sistenzvorrichtung in Blockdarstellung; und

Figur 8 ein Ausführungsbeispiel einer erfindungsgemäßen

Ausgabeeinheit mit graphischen Parametereingabeele menten in schematischer Darstellung.

Einander entsprechende Teile sind in allen Figuren mit den gleichen Bezugszeichen versehen.

Um eine datenbasierte Anomalieerkennung, beispielsweise für eine industrielle Anlage beziehungsweise ein technisches Ge rät durchzuführen, ist eine Auswahl von Eingabeparametern, die einen Cluster charakterisieren, in ein Clusterverfahren notwendig. Die Parameter können beispielsweise in eine Anoma lieerkennungsvorrichtung eingegeben werden und die zu unter suchenden Sensordaten entsprechend den eingegebenen Parame tern Cluster von Sensordatenpunkten ermittelt und das Ergeb nis des Clusterverfahrens ausgegeben werden. Erst anhand des Clusterergebnisses kann abgeschätzt werden, ob die eingegebe nen Parameter zu einem für den Anwendungsbereich sinnvollen Clusterergebnis führen. Ein erneutes Durchführen der Cluster analyse mit geänderten Parametern ist somit mehrfach notwen dig. Da die Zeit zur Ermittlung eines Clusterergebnisses, insbesondere bei einer großen Datenmenge zeitaufwändig ist, können die Parameter für das Clusterverfahren durch das nach- folgende Verfahren zeitoptimiert und bereits unter Einbezie hung von Expertenwissen ermittelt werden.

Dabei wird die Funktionsweise eines dichtebasierten Cluster verfahrens durch eine interaktive Visualisierung nachempfun den. Dies erfolgt annähernd in Echtzeit. Ein Benutzer intera giert also nicht mehr mit dem langsamen dichtebasierten Clus terverfahren, das eine Berechnung von Clustern anhand von Sensordatenpunkten in einem Datenraum durchführt, sondern di rekt mit einem interaktiven, visuell dargestellten und mit Datenverarbeitungsmethoden aus dem Bildverarbeitungsbereich durchgeführten Verfahren, das eine Auswirkung von Parameter ändern in einem dichtebasierten Clusterverfahren direkt und in Echtzeit approximiert.

Dem Clusterverfahren liegen eine, insbesondere große, Anzahl von Datenpunkten, insbesondere Sensordatenpunkten, vor, für die ein Zusammenhang in Form einer Dichteverteilung von Da tenpunkten in Gruppen, sogenannte Cluster, ermittelt werden soll. Figur 1 zeigt das Verfahren als Flussdiagramm. In einem ersten Verfahrensschritt S10 wird ein jeder Sensordatenpunkt in einem Datenraum in einen Pixeldatenpunkt in einem Pixel raum abgebildet.

Figur 3 zeigt beispielhaft für einen dreidimensionalen Daten raum 10 Sensordatenpunkte SP1, SP2, SP3, die jeweils einen Wert für eine jeweils unterschiedliche Größe Gl, G2, G3 auf weisen. Die Größe Gl könnte beispielsweise die Leistung, die Größe G2 beispielsweise die Geschwindigkeit angeben. G3 könn te eine vorbestimmte Zeit oder ein Betriebsmodus sein. Die Sensordatenpunkte werden hier in ein zweidimensionales Koor dinatensystem mit den Ausdehnungen eines Pixelraums 20, bei spielsweise von Bildpunkten einer visuellen Ausgabeeinheit, wie beispielsweise einem Bildschirm, abgebildet. Die Abbil dung wird durch den Pfeil symbolisiert. Dazu werden alle Da tenpunkte der Größen Gl, G2 bei einem festen Wert der Größe G3, beispielsweise dem Wert B für die Clusteranalyse berück sichtigt. So wird beispielsweise der Sensordatenpunkt SP1 im Datenraum 10 auf einen Pixeldatenpunkt PP1 im Pixelraum 20 abgebildet. Entsprechend wird der Sensordatenpunkt SP2 auf den Pixeldatenpunkt PP2 abgebildet. Der Sensordatenpunkt SP3 wird auf den Pixeldatenpunkt PP3 abgebildet, der mit dem Pi xeldatenpunkt PP2 zusammenfällt, da die Auflösung des Pixel datenraums 20 keinen separaten Pixel für diesen Wert bereit hält .

Das Verhältnis der Ausdehnung des Pixelraums 20, das heißt das Verhältnis der Koordinaten für die Größen Gl und G2 ist im gezeigten Beispiel gleich dem Verhältnis der Wertebereiche der Eingangsdaten. Im Idealfall ist die Skalierung der beiden Koordinaten identisch. Je größer die Abweichung der Skalie rung ist, desto größer ist der Fehler bei einer anschließen den Ermittlung der Cluster. Daher ist bei großen Unterschie den der Wertebereiche vorab eine Normalisierung der Sensorda tenpunkte vorzunehmen. Die Ermittlung der Cluster sollte dann auch auf die normalisierten Datenpunkte durchgeführt werden. Für jeden Pixel im Pixelraum 20 wird die Anzahl von Sensorda tenpunkten berechnet, die auf diese Pixelpositionen abgebil det werden. Für die Pixelpositionen des Pixeldatenpunktes PP2 ist daher die Anzahl der darauf projizierten Sensordatenpunk te, hier also der Wert 2, vermerkt.

Um eine besonders gute Auflösung der Pixeldatenpunkte bei sehr unterschiedlicher Dichteverteilung der Sensordatenpunkte zu erreichen, kann ein Wertebereich von Sensordatenwerten entsprechend einer Verteilungsfunktion 30 eingeteilt werden. Figur 4 zeigt auf der linken Seite eine solche Verteilungs funktion 30, bei der die Häufigkeit H, mit der ein Wert der Größe Gl vorhanden ist, über den Wertebereich der Größe Gl aufgetragen ist. Auf der rechten Seite von Figur 4 ist die Koordinate der Größe Gl des Pixelraums 40 entsprechend der Verteilungsfunktion 30 skaliert. Dabei werden die Abstände zwischen jeweils zwei blau markierten Werten von Gl auf glei che Abstände der Koordinate Gl im Pixelraum 40 überführt.

Dies hat jedoch den Nachteil, dass eine darauf basierte Clus terbestimmung von der üblichen Verteilung der Datenpunkte und somit von der üblichen bekannten Darstellung für den Domänen experten abweicht. Eine Interpretation des Clusterergebnisses wird somit eventuell erschwert.

Im nächsten Verfahrensschritt Sil, siehe Figur 1, wird nun mindestens eine Operation des dichtebasierten Clusterverfah rens im Datenraum durch mindestens eine Pixeloperation im Pi xelraum nachgebildet. Ein sehr häufig verwendetes dichteba siertes Clusterverfahren ist ein so genanntes dichtebasiertes räumliches Clusteranalyseverfahren mit Rauschen, kurz auch als DBSCAN bezeichnet. Dieses Clusterverfahren wird über zwei Parameter, einen Distanzwert e sowie einen Schwellwert für die minimale Anzahl von Datenpunkten (minPts) , die eine Grup pe beziehungsweise ein Cluster darstellen, gesteuert.

In Figur 2 sind diese Parameter und weitere Kenngrößen zur Clusterermittlung des DBSCAN-Clusterverfahrens schematisch dargestellt. Um eine dichte Region im Datenraum, also ein Cluster zu finden, wird für jeden Sensordatenpunkt SP4 über prüft, wie viele andere Sensordatenpunkte in einem Abstand kleiner dem vorgegebenen Distanzwert e vorhanden sind. Im linken Bereich von Figur 2 sind mehrere Sensordatenpunkte Sp4- SP9 durch Punkte dargestellt, der betrachtete Sensorda tenpunkt SP4 ist mit einer stärkeren Kontur markiert. Der Pfeil zeigt einen Abstand e, der dem vorgegebenen ersten Pa rameter entspricht und eine Distanz angibt. Ist die Anzahl der Sensordatenpunkte in der Umgebung des betrachteten Sen sorpunktes SP4 gleich oder größer als der vorgegebene zweite Parameter minPts, der einen Schwellwert für die Anzahl der benachbarten Datenpunkte angibt, so ist der betrachtete Sens ordatenpunkt SP4 ein Kernpunkt eines Clusters. Ist der

Schwellwert beispielsweise auf die Anzahl von fünf Datenpunk ten festgelegt, so ist der Sensordatenpunkt SP4 ein Kernpunkt KP. Alle Sensordatenpunkte, welche selbst nicht Kernpunkte sind, die jedoch innerhalb der Distanz e zu einem existieren den Kernpunkt liegen, werden als Randpunkte bezeichnet. Der Sensordatenpunkt SP5 auf der rechten Seite von Figur 2 ist beispielsweise ein Randpunkt, da er einen geringeren Abstand als die vorgegebene Distanz e zum Kernpunkt SP4 aufweist, selbst aber kein Kernpunkt ist, da lediglich vier Datenpunkte in einem Abstand e liegen. Ein Punkt NP wird als Rauschpunkt bezeichnet, wenn er einen größeren Abstand als der vorgegebe ne erste Parameter e zum nächsten Kernpunkt aufweist.

Das Bestimmen von Kernpunkten und Clustern wird nun im Pixel raum durch eine Pixeloperation nachgebildet. Figur 5 zeigt auf der linken Seite die aus Figur 3 bekannte Darstellung der Sensordatenwerte in einem Pixelraum 20. Die Darstellung ent spricht einem zweidimensionalen Histogramm, das zusätzlich zu jedem Pixel die Anzahl der Sensordatenpunkte, die durch den gleichen Pixel dargestellt werden, umfasst. Die vorher be schriebene erste Operation des dichtebasierten Clusterverfah rens im Datenraum wird nun auf eine erste Pixeloperation im Pixelraum abgebildet. Die erste Pixeloperation überprüft für jeden Sensordatenpunkt, dem ein betrachteter Pixeldatenpunkt PP4 zugeordnet ist, ob die Anzahl der Pixeldatenpunkte, die innerhalb eines Distanzwertes e entsprechend einem ersten Pa rameterwert um den betrachteten Pixeldatenpunkt PP4 angeord net sind, größer als der zweite Parameterwert, nämlich die minimale Anzahl von Datenpunkten minPts in einem Cluster ist.

In einer Implementierung dieser Operation wird beispielsweise für jeden Eintrag im 2D-Histogramm, siehe Pixelraum 20 der einen Wert ungleich Null aufweist, überprüft, ob die Anzahl der Pixeldatenpunkte innerhalb der Distanz e größer dem

Schwellwert der Anzahl von Punkten minPts ist. Dazu wird bei spielsweise der Pixeldatenpunkt PP4 als betrachteter Pixelda tenpunkt untersucht, indem ein Strukturelement 21 der Ausdeh nung entsprechend dem ersten Parameter e verwendet wird. Ist dies erfüllt, wird der Punkt PP4 als Kernpunkt KP in eine se parate Ergebnismatrix 50, siehe rechte Seite von Figur 5, ge speichert. Das Fallen eines Pixeldatenpunkts in ein Struktu relement 21 kann durch günstige Implementierung zeitoptimiert überprüft werden. Insbesondere eine Implementierung durch Zählen der Anzahl von Datenpunkten in der Nachbarschaft zu einem betrachteten Pixeldatenpunkt PP4 aus dem 2D-Histogramm 20 ermöglicht eine schnelle Implementierungsausführung.

Im nächsten Verfahrensschritt S12 des erfindungsgemäßen Ver fahrens, siehe Figur 1, werden nun mindestens ein Parameter wert für jeden Parameter des dichtebasierten Clusterverfah rens empfangen. Somit sind nun für den bereits beschriebenen Vorgang die Größe des Strukturelements e sowie der Schwell wert für die Anzahl von Pixeldatenpunkten minPts, die ein Cluster bilden, festgelegt. Als ein weiterer Parameter kann ein Distanzmaß, das im Clusterverfahren angewandt werden soll, festgelegt werden. Entsprechend einem solchen Distanz maß wird ein unterschiedliches Strukturelement 21 in der Pi xeloperation verwendet. Für ein euklidisches Distanzmaß wird ein rundes Strukturelement 21 verwendet. Für ein Manhatten- Distanzmaß wird ein rautenförmiges Strukturelement, für ein Chebyshev-Distanzmaß wird ein quadratisches Distanzmaß ver wendet. Die beschriebene Pixeloperation wird nun in Verfah rensschritt S13, siehe Figur 1, entsprechend den empfangenen Parameterwerten auf die Pixeldaten angewendet und in Schritt S14 das Clusterergebnis in visueller Form im Pixelraum ausge geben .

Für das Ausgeben (S14) der Clusterergebnisse wird nach dem Ermitteln der Kernpunkte KP1, KP2, KP3 der Cluster für jedes Pixel im Pixelraum 20 die minimale Distanz zum nächsten Kern punkt KB aus der Ergebnismatrix 50 berechnet. Ein resultie rendes Distanzfeld kann sehr effizient beispielsweise durch einen Algorithmus von Meijster et al . berechnet werden, der in "A General Algorithm for Computing Distance Transforms in Linear Time," in Mathematical Morphology and its Applications to Image and Signal Processing, Seiten 331-340, Springer, 2000, beschrieben ist. Für eine visuelle Darstellung wird die berechnete minimale Distanz zu den Kernpunkten aus dem Dis tanzfeld in Farbe abgebildet. Somit wird jeder Pixeldaten punkt im Pixelraum abhängig von einer minimalen Distanz zu einem nächsten Kernpunkt in einer unterschiedlichen Farbe dargestellt. Bevorzugt wird eine divergierende Farbpalette verwendet und abhängig vom Abstand eines Pixels vom nächsten Kernpunkt die Pixelfarbe entsprechend einem Farbgradienten unterschiedlich gewählt. Die Kernpunkte selbst werden im Er gebnis nicht mehr separat dargestellt und sind durch die Farbpalette erkennbar. Die Farbpalette wird für das gesamte Ergebnisbild bevorzugt einheitlich definiert.

Um den Rand beziehungsweise die Grenzen eines Clusters deut lich erkennen zu können, wird eine Eingrenzung berechnet und eingezeichnet. Hierfür werden Isokonturen auf dem Distanzfeld für einen Abstand von einem Ganzen des ersten Parameterwertes e und bevorzugt eine weitere Isokontur mit dem Abstand von der Hälfte des ersten Parameterwertes /2 berechnet. Ein Be nutzer kann somit zwischen Kernpunkten, die innerhalb der Isokontur mit einem Abstand von der Hälfte des ersten Parame terwertes s/2 liegen und Randpunkten des Clusters unterschei den. Alle Punkte, die also durch eine Abbildung eines Sensor datenpunktes definiert sind, die außerhalb dieser beiden Kon turen liegen, werden als Rauschen beziehungsweise anormal an gesehen und bevorzugt in einer Farbe, die sich von den sons tigen Pixeln unterscheidet, separat dargestellt.

Eine visuelle Darstellung 60 des Clusterergebnisses ist in Figur 6 dargestellt. In einer farblichen Darstellung ist bei spielsweise ein Kernpunkt KP in grüner Farbe dargestellt, die Pixel entsprechend ihrem Abstand zum nächsten Kernpunkt, wer den beispielsweise in einer graduellen Farbskala von grün nach weiß dargestellt.

Im rechts neben der visuellen Darstellung des Clusterergeb nisses 60 dargestellten Ausschnitt ist ein Bereich eines Cluster 65 vergrößert dargestellt. Der farbliche Verlauf au ßerhalb des Clusters 65, siehe Bereich 63, zeigt eine Schum merung, die abhängig von einer räumlichen Verteilung der Kernpunkte im Pixelraum dargestellt wird. Die Kontur 61 mit einem Abstand und einem halben empfangenen Parameterwert s/2 ist dabei deutlicher sichtbar als die Isokontur 62, die einen Abstand eines ganzen ersten Parameterwerts e angibt. Rausch punkte 64 sind wiederum farblich abgehoben dargestellt.

Liegen auf beiden Seiten nahe der Kontur 61 ähnlich viele Pi xeldatenpunkte vor, ist ein besonders starker Höheneffekt er zeugt durch die Schummerung wünschenswert. Dadurch wird die Zuverlässigkeit der Grenze verdeutlicht. Ist der Unterschied der Anzahl der Pixeldatenpunkte auf beiden Seiten der Kontur hoch, kann die Unsicherheit der Kontur an dieser Stelle durch einen schwächeren Höheneffekt verdeutlicht werden. Ebenfalls wird ein Genauigkeitswert für die Zuverlässigkeit angegeben

Nach einer Ausgabe des Clusterergebnisses kann mindestens ei ner der Parameterwerte, bevorzugt über eine graphische Nut zerschnittstelle geändert werden, siehe Verfahrensschritt S15 in Figur 1. Ist dies der Fall, wird der geänderte Parameter wert im Verfahrensschritt S12 im Verfahren empfangen und die Verfahrensschritte des Anwendens S13 der Pixeloperation er neut durchgeführt und ein Clusterergebnis basierend auf den geänderten Parameterwerten ausgegeben, siehe Verfahrens schritt S15. Diese wiederholte Anwendung der Pixeloperationen ist durch den Pfeil n symbolisiert. Sind keine weiteren Para meteränderungen gewünscht, siehe Pfeil y, werden im Verfah rensschritt S16 die letzten empfangenen Parameterwerte e und minPts dem Anomalieerkennungsverfahren, das das dichtebasier tes Clusterverfahren mit den Sensordatenpunkten im Datenraum beispielsweise in einer Anomalieerkennungsvorrichtung aus führt, bereitgestellt.

Figur 7 zeigt eine Assistenzvorrichtung 80, die das beschrie bene Verfahren ausführt. Die Assistenzvorrichtung 80 umfasst eine Abbildungseinrichtung 81, die derart ausgebildet ist, jeden Sensordatenpunkt in einen Pixeldatenpunkt in einem Pi xelraum zu übertragen, eine Nachbildeeinheit 82, die derart ausgebildet ist, mindestens eine Operation des dichtebasier ten Clusterverfahrens im Datenraum durch mindestens eine Pi xeloperation im Pixelraum nachzubilden, sowie eine Operati onseinheit 84, die derart ausgebildet ist, mindestens eine Pixeloperation entsprechend den empfangenen Parameterwerten auf die Pixeldatenpunkte anzuwenden. Die Assistenzvorrichtung 80 umfasst des Weiteren eine Bereitstellungseinheit 86, die die empfangenen Parameterwerte als Eingangsparameter für ein Anomalieerkennungsverfahren im Datenraum einer Anomalieerken nungsvorrichtung 90 bereitstellt . Über diese Bereitstellungs einheit 86 kann ebenfalls die zu betrachtende gesamte Sensor datenmenge in das Assistenzsystem geladen beziehungsweise dort empfangen und gespeichert werden. Das Assistenzsystem 80 umfasst des Weiteren eine Eingabeeinheit 83 und eine visuelle Ausgabeeinheit 85, die bevorzugt als eine graphische Nutzer schnittselle ausgebildet sind.

Figur 8 zeigt eine Ausgabeeinheit beziehungsweise die darauf dargestellte graphische Nutzerschnittstelle 70. In Bereich 71 ist dabei ein Clusterergebnis dargestellt. Darunter sind für den ersten und zweiten Parameter , minPts jeweils ein gra phisches Eingabeelement 72, 73 angezeigt. Das graphische Ein gabeelement 72, 73 kann beispielsweise jeweils als ein Schie beregler dargestellt sein, über den der erste und/oder der zweite Parameter , minPts geändert und als Eingabe für die Pixeloperation an die Operationseinheit 84 bereitgestellt werden. Eine Neuberechnung der Cluster erfolgt automatisch nach einer Parameteränderung.

Zur Erweiterung der Clusteranalyse auf mehr als zweidimensio nale Sensordaten können beispielsweise Aggregationsverfahren auf zwei Dimensionen wie zum Beispiel selbstorganisierende Karten angewendet werden. Erfindungsgemäß wird eine dritte oder weitere Datendimension bzw. eine entsprechende Größe G3 durch eine Animation der zweidimensionalen Clusteranalyse an hand eines jeweils unterschiedlichen Sensordatenwertes B der dritten Größe G3 dargestellt. Hierbei kann auf eine geeignete Wahl der dritten Dimension G3 eventuell durch eine vorherge hende Aggregation mehrerer Datendimensionen Rücksicht genom men werden. Mit einem weiteren graphischen Eingabeelement, beispielsweise einem weiteren Schieberegler 74, kann ein Datenwert der drit ten Größe G3 eingegeben werden. Beispielsweise kann das Clus terverfahren für sukzessiv geänderte Werte der dritten Größe durchgeführt und die visuelle Darstellung der resultierenden Clusterergebnisse als Animation dargestellt werden. Insbeson dere können für die dritte Datendimension verändernde Be triebsbedingungen wie zum Beispiel Stillstand, Hochfahren, Teillastbetrieb, Volllastbetrieb, Herunterfahren gewählt wer den, so dass Vergleiche der angelernten "Gut- und Schlechtbe reiche", die durch Punkte innerhalb der Cluster beziehungs weise außerhalb der Cluster gekennzeichnet sind, zwischen verschiedenen Betriebsbedingungen möglich sind. Somit werden gerade nicht die bekannten, gewollten Betriebsbedingungsände rungen als Anomalie erkannt. Veränderungen von Pixeldaten punkten bei unterschiedlichen Betriebsbedingungen, also einer unterschiedlichen dritten Dimension von Größen, können anhand von Trajektorien beispielsweise von Kernpunkten oder ausge wählten Punkten der Konturlinien 61, 62 dargestellt werden.

Durch das beschriebene Verfahren und die beschriebene Vor richtung können geeignete Parameterwerte für eine erste Ana lyse im Datenraum durch die graphische approximierte Durch führung des Clusterverfahrens in einen Pixelraum zeitopti miert ermittelt und durch Expertenwissen vorgeprüft werden. Durch die Durchführung des Clusterverfahrens in Echtzeit und eine einfache Änderung der Parameter kann der Einfluss der Parameter auf das Clusterergebnis anschaulich dargestellt werden und auch einem Nichtexperten das Verhalten des Clus terverfahrens abhängig von den Eingabeparametern aufgezeigt werden. Somit kann das zeitaufwändige datenbasierte Cluster verfahren im Datenraum nur für voruntersuchte und sinnvoll erachtete Parameterwerte durchgeführt werden und somit zu ei nem zeitoptimierten Anomalieerkennungsprozess beitragen. Über ein geeignetes Abbild beziehungsweise Mapping der Größen auf den Pixelraum können Rechenzeit gegenüber Auflösung gegenei nander abgewogen werden, so dass zum Beispiel ein Anlagenbe diener schnell einen groben Überblick erhält, der dann beim Auftreten von Anomalien durch einen Instandhalter mit einer längerdauernden Analyse im Detail untersucht werden kann.

Alle beschriebenen und/oder gezeichneten Merkmale können im Rahmen der Erfindung vorteilhaft miteinander kombiniert wer den. Die Erfindung ist nicht auf die beschriebenen Ausfüh rungsbeispiele beschränkt.