Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SOCIAL MEDIA MONITORING FOR THE MAINTENANCE OF PUBLIC TRANSPORT VEHICLES OR FACILITIES
Document Type and Number:
WIPO Patent Application WO/2023/012266
Kind Code:
A1
Abstract:
Method, device and computer program product for monitoring public transport vehicles or facilities, comprising the following method steps: acquiring data from social networks, in particular contributions to social networks, in particular from passengers on the public transport vehicles or users of the public transport facilities; analysing the acquired data with regard to information about the public transport vehicles or facilities; determining a state of the public transport vehicles or facilities from the information about the public transport vehicles or facilities; deriving a maintenance instruction for the public transport vehicles or facilities from the determined state of the public transport vehicles or facilities.

Inventors:
HAUPTVOGEL ANNIKA (DE)
LEHMANN OLIVER (DE)
LOMAEVA MARIIA (DE)
STÜBINGER LUKAS (DE)
VIDAL MIGALLON IRINA (DE)
Application Number:
PCT/EP2022/071917
Publication Date:
February 09, 2023
Filing Date:
August 04, 2022
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS MOBILITY GMBH (DE)
International Classes:
G06Q30/02; G06F16/00; G07B15/00
Foreign References:
EP3001380A12016-03-30
US20130246135A12013-09-19
US20140229391A12014-08-14
US20110234427A12011-09-29
Download PDF:
Claims:
Patentansprüche

1 . Verfahren zur Überwachung von Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs umfassend folgende Verfahrensschritte : a . Erfassen von Daten aus sozialen Netzwerken, insbesondere von Beiträgen in sozialen Netzwerken, insbesondere von Fahrgästen der Fahrzeuge oder von Nutzern der Einrichtungen des öf fentlichen Personenverkehrs ; b . Analysieren der erfassten Daten hinsichtlich Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs ; c . Ermitteln eines Zustands der Fahrzeuge oder der Einrichtungen des öf fentlichen Personenverkehrs aus den Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs ; d . Ableiten einer Handlungsanweisung zur Instandhaltung der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs aus dem ermittelten Zustand der Fahrzeuge oder der Einrichtungen des öf fentlichen Personenverkehrs .

2 . Verfahren nach Anspruch 1 , dadurch gekennzeichnet , dass Verfahrensschritt b . umfasst : Filtern der erfassten Daten nach einem vorgegebenen Algorithmus zur Ermittlung von Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs .

3 . Verfahren nach Anspruch 1 oder 2 , dadurch gekennzeichnet , dass Verfahrensschritt b . umfasst :

Identi fi zieren von Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs aus den erfassten Daten aus den sozialen Netzwerken und Zuordnen der erfassten Daten aus den sozialen Netzwerken zu den identi fi zierten Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs ; und

22 - Analysieren der erfassten Daten hinsichtlich Informationen zu den identifizierten Fahrzeugen oder Einrichtungen des öffentlichen Personenverkehrs. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass Verfahrensschritt c. vorangeht: Aggregieren und Klassifizieren und/oder Kategorisieren der Informationen zu den Fahrzeugen oder Einrichtungen des öffentlichen Personenverkehrs. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass Verfahrensschritt c. vorangeht: Erfassen von Daten der Fahrzeuge oder Einrichtungen des öffentlichen Personenverkehrs, insbesondere von Sensor- und/oder Diagnosedaten zur Beschreibung eines Zustands der Fahrzeuge oder Einrichtungen des öffentlichen Personenverkehrs . Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass Verfahrensschritt c. umfasst:

- Zusammenführen der, insbesondere klassifizierten und/oder kategorisierten, Informationen und von den Daten der Fahrzeuge oder Einrichtungen des öffentlichen Personenverkehrs, insbesondere von Sensor- und/oder Diagnosedaten zur Beschreibung eines Zustands der Fahrzeuge oder Einrichtungen des öffentlichen Personenverkehrs; und

- Ermitteln eines Zustands der Fahrzeuge oder der Einrichtungen des öffentlichen Personenverkehrs aus den zusammengeführten Informationen zu den Fahrzeugen oder Einrichtungen des öffentlichen Personenverkehrs und den erfassten Daten der Fahrzeuge oder Einrichtungen des öffentlichen Personenverkehrs. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass Verfahrensschritt c. umfasst: Klassi fi zieren und/oder Kategorisieren der ermittelten Zustände . Computerprogrammprodukt umfassend Befehle , die bei der Aus führung des Programms durch ein geeignetes mobiles Endgerät dieses veranlassen, das Verfahren nach einem der Ansprüche 1 bis 7 aus zuführen . Bereitstellungsvorrichtung für das Computerprogrammprodukt nach Anspruch 8 , wobei die Bereitstellungsvorrichtung das Computerprogrammprodukt speichert und/oder bereitstellt , insbesondere ein Datenträger, auf dem das Computerprogrammprodukt nach Anspruch 8 gespeichert ist . . Vorrichtung, eingerichtet zur Aus führung des Verfahrens nach einem der Ansprüche 1 bis 7 , umfassend Mittel , die zur Aus führung des j eweiligen Verfahrensschritts geeignet sind .

Description:
Beschreibung

Social-Media-Monitoring für die Instandhaltung von Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs

Die Erfindung betri f ft ein Verfahren zur Überwachung von Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs , ein Computerprogrammprodukt sowie eine Vorrichtung zur Aus führung des Verfahrens .

Sicherheitskritische Komponenten von Fahrzeugen und Einrichtungen des öf fentlichen Personenverkehrs , wie beispielsweise Drehgestelle von Schienenfahrzeugen, werden mittels Sensoren überwacht , um einen reibungs freien Betrieb zu gewährleisten . Die erfassten Daten können weiterverarbeitet zur Instandhaltungsplanung genutzt und so eine gute Verfügbarkeit der Komponenten erreicht werden . Inzwischen wird vermehrt auf Künstliche Intelligenz für die Auswertung von Sensordaten zurückgegri f fen .

Die Verwendung von Social Media Analytics , insbesondere vom sogenannten Social Listening, ist im Konsumentenbereich verbreitet . Mittels Meinungs- und Stimmungsanalysen sowie weiteren Verfahren der Text- und Wortanalyse aggregieren Unternehmen beispielweise die Meinung der Verbraucher . Erwähnungen in Posts und Konversationen auf Social-Media- Plattformen in Zusammenhang mit einem Produkt oder eine Marke werden ausgewertet .

Der Erfindung liegt die Aufgabe zugrunde , die Zustandsbestimmung von Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs und deren Instandhaltung weiter zu verbessern .

Gelöst wird die Aufgabe durch die Gegenstände der unabhängigen Patentansprüche 1 und 8 , 9 und 10 . Weiterbildungen und Ausgestaltungen der Erfindung finden sich in den Merkmalen der abhängigen Patentansprüche wieder .

Ein erfindungsgemäßes Verfahren zur Überwachung von Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs umfasst folgende Verfahrensschritte : a . Erfassen von Daten aus sozialen Netzwerken, insbesondere von Beiträgen in sozialen Netzwerken, insbesondere von Fahrgästen der Fahrzeuge oder von Nutzern der Einrichtungen des öf fentlichen Personenverkehrs ; b . Analysieren der erfassten Daten hinsichtlich Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs ; c . Ermitteln eines Zustands der Fahrzeuge oder der Einrichtungen des öf fentlichen Personenverkehrs aus den Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs ; d . Ableiten einer Handlungsanweisung zur Instandhaltung der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs aus dem ermittelten Zustand der Fahrzeuge oder der Einrichtungen des öf fentlichen Personenverkehrs .

Mit dem Verfahren können insbesondere Zustände von Komponenten im Fahrzeuginnenraum abgeleitet werden, welche insbesondere die Passagiererfahrung beeinflussen, und die gewonnenen Informationen werden als Planungsgrundlage für die Instandhaltungsabläufe im Depot herangezogen . Handlungsanweisungen zur Instandhaltung können konkrete Maßnahmen zur Überprüfung, Reinigung, Reparatur oder Austausch von Einrichtungen oder Komponenten der Fahrzeuge oder der Einrichtungen des öf fentlichen Personenverkehrs umfassen .

Mit dem Verfahren lassen sich Fahrzeuge , beispielsweise

Schienenfahrzeuge oder Busse , des öf fentlichen Personenverkehrs überwachen, insbesondere deren Einrichtungen, Anlagen und/oder technische Komponenten, wie z . B . die Sanitärzellen in Schienenfahrzeugen, die Fahrgasträume , hier beispielsweise Sitze , Tische , Kof ferablagen etc . , die Türen, der Internetempfang, die Lautsprecher für Durchsagen oder die Monitore für Anzeigen, die Klimatechnik oder die Bremsen .

Ferner können auch landseitige Einrichtungen der Infrastruktur überwacht werden, wie beispielsweise Haltestellen, Bahnsteige , Rolltreppen oder Fahrstühle in Bahnhöfen usw .

Mittels der erfassten Daten können gezielt Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs ausgewertet werden, insbesondere hinsichtlich dem subj ektiv empfundenen Raumklima ( Temperatur, Luftfeuchtigkeit etc . ) , dem Zugang zum Internet , dem Zustand des Fahrgastinnenraums oder der Sanitärzelle , beispielsweise hinsichtlich Funktionstüchtigkeit , Vandalismusschäden oder Verschleiß , der Hörbarkeit von Durchsagen oder der Lesbarkeit von Anzeigen und somit zur Verständlichkeit von Fahrgastinf ormationen, beispielsweise zum Fahrtverlauf , zur Bedienbarkeit und Funktionstüchtigkeit von weiteren Komponenten oder Einrichtungen wie beispielsweise von Türen, Rolltreppen oder Fahrstühlen, Schäden und Auswirkungen durch Vandalismus ( z . B . durch Graf fiti ) oder dem empfundenen Verkehrslärm ( z . B . durch Bremsenquietschen oder Kurvenquietschen) und/oder dem Bremsverhalten des Fahrzeugs . Zum Teil betref fen die Beiträge in den sozialen Netzwerken Einrichtungen oder Komponenten, die mittels herkömmlicher Sensoren nicht oder nur unzureichend zu überwachen sind . So sind beispielsweise keine Kameras zur Überwachung der Sauberkeit in Sanitärräumen erlaubt .

Anhand dieser Informationen wird ein Zustand der

Einrichtungen, Anlagen oder Komponenten ermittelt und basierend auf diesem Zustand Handlungsanweisungen generiert , beispielsweise für Personal auf dem Fahrzeug oder der Einrichtung, insbesondere aber zur Instandhaltung in einem Depot . Die Handlungsanweisungen beinhalten konkrete Maßnahmen zur Wartung oder Instandhaltung, insbesondere zur Überprüfung, Reinigung, Reparatur oder Austausch . Damit wird zum einen eine hohe Systemverfügbarkeit erzielt und zum anderen wird die Attraktivität des öf fentlichen Personenverkehrs gestärkt .

Daten von mehreren Sozialen Netzwerken, wie beispielsweise Twitter, Facebook, Instagram, WeChat , WhatsApp, TikTok und/oder von sogenannten social media data aggregators , wie beispielsweise Brandwatch oder Sprinklr können erfasst und anschließend ausgewertet werden . Die Daten umfassen dabei nicht nur von den Nutzern zur Verfügung gestellte Daten, wie Text , Bilder, Audiodaten oder Videos , sondern auch Daten der Sozialen Medien, wie z . B . der Ort ( Positionsdaten) , die Zeit ( Zeitstempel ) , Informationen über den Nutzer oder dessen

Verhalten oder seine Reputation im Sozialen Netzwerk . Zur Stimulierung von Beiträgen in sozialen Netzwerken können begleitend gezielte Kampanien durchgeführt werden . Nutzer, beispielsweise Fahrgäste , werden dabei gezielt ermutigt , Beiträge zum Zustand, Bedienungs freundlichkeit , Nutzungs freundlichkeit , Qualität und Verständlichkeit von Fahrgastinf ormationen und/oder zum Komfort in den sozialen Netzwerken zu teilen, und somit instandhaltungsrelevante Daten zu generieren .

Die Analyse der erfassten Daten aus den sozialen Netzwerken gemäß Verfahrensschritt b . und/oder die Ermittlung des Zustands gemäß Verfahrensschritt c . kann weitergebildet auf überwachten Lernmethoden für Klassi fikationsprobleme basieren, welche annotierte Trainingsdatensätze benötigen .

In einer dem Verfahrensschritt b . vorangehenden Lern- oder

Trainingsphase können, insbesondere historisch, erfasste Daten aus sozialen Netzwerken nach Stichwörtern, Hashtags des Betreibers etc . durchsucht werden . Hierfür kann eine umfangreiche Liste von Stichwörtern aus einem umfangreichen Wortschatz , gegebenenfalls in mehreren Sprachen, genutzt werden .

Gemäß einer Aus führungs form können zuvor auch visuelle Daten aus sozialen Netzwerken, wie beispielsweise Videos oder Fotos , mittels Bildanalysealgorithmen, beispielsweise mittels Computer Vision Methoden, analysiert und, insbesondere instandhaltungsrelevante , Informationen aus den visuellen Daten in Textform erfasst werden ( video-to-text , image-to- text ) .

Ortsdaten, Zeitstempel etc . liegen zur Auswertung üblicherweise bereits in Textform vor .

Weitergebildet umfasst das Verfahren eine dem Verfahrensschritt b . vorangehende Lernphase mit folgenden Verfahrensschritten :

- Filtern der erfassten Daten nach einem vorgegebenen Algorithmus zur Ermittlung von Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs ;

- Selektieren, Annotieren und Klassi fi zieren und/oder Kategorisieren der gefilterten Daten aus den sozialen Netzwerken;

- Trainieren wenigstens eines Algorithmus der künstlichen Intelligenz mit den selektierten, annotierten und klassi fi zierten und/oder kategorisierten Daten aus den Sozialen Netzwerken .

Das Filtern der erfassten Daten nach einem vorgegebenen Algorithmus zur Ermittlung von Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs kann dabei umfassen : o Bereitstellen einer Stichwortliste ; o Durchsuchen der erfassten Daten aus den sozialen Netzwerken auf Vorliegen von wenigstens einem Stichwort aus der Stichwortliste ; o Heraus filtern der erfassten Daten aus den sozialen Netzwerken bei Vorliegen von wenigstens einem Stichwort aus der Stichwortliste zur nachfolgenden Weiterverarbeitung .

Der Filterung kann eine Vorverarbeitung der erfassten Daten vorangehen, insbesondere um die Datenqualität zu verbessern, beispielsweise umfassend eine Korrektur von Schreibfehlern oder grammatischen Fehlern, das Hinzufügen von fehlenden Werten oder Worten etc .

Das Selektieren, Annotieren und Klassi fi zieren und/oder Kategorisieren der gefilterten Daten aus den sozialen Netzwerken kann einen oder mehrere der folgenden Verfahrensschritte umfassen : o Identi fi zieren von instandhaltungsrelevanten Informationen aus den gefilterten Daten aus den sozialen Netzwerken; o Selektieren der gefilterten Daten aus den sozialen Netzwerken mit identi fi zierten instandhaltungsrelevanten Informationen; o Annotieren der selektierten Daten aus den sozialen Netzwerken; o Aggregieren der selektierten und gegebenenfalls annotierten Daten aus den sozialen Netzwerken; o Bereitstellen einer Liste von Kategorien und/oder Klassen, und o Zuordnen der selektierten und gegebenenfalls annotierten und gegebenenfalls aggregierten Daten aus den sozialen Netzwerken zu den bereitgestellten Kategorien und/oder Klassen; o Bereitstellen einer Liste von Handlungsanweisungen zur Instandhaltung der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs , und o Zuordnen von wenigstens einer Handlungsanweisung aus der Liste von Handlungsanweisungen zur Instandhaltung zu den bereitgestellten Kategorien und/oder Klassen; zusätzlich oder alternativ : o Zuordnen von wenigstens einer Handlungsanweisung aus der Liste von Handlungsanweisungen zur Instandhaltung zu den selektierten, gegebenenfalls annotierten und gegebenenfalls klassi fi zierten und/oder kategorisierten Daten; o Identi fi zieren von Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs aus den erfassten Daten aus den sozialen Netzwerken und Zuordnen der selektierten, gegebenenfalls annotierten und gegebenenfalls klassi fi zierten und/oder kategorisierten Daten zu den identi fi zierten Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs .

Das Identi fi zieren von instandhaltungsrelevanten Informationen aus den gefilterten Daten aus den sozialen Netzwerken, das Selektieren der gefilterten Daten aus den sozialen Netzwerken mit identi fi zierten instandhaltungsrelevanten Informationen sowie das Annotieren der selektierten Daten aus den sozialen Netzwerken wird während der Lernphase typischerweise von Menschen ausgeführt . Bei der Annotation können die Daten mit Anmerkungen oder weiteren relevanten Informationen oder Metadaten gekennzeichnet bzw . markiert werden, damit der verwendete Algorithmus der künstlichen Intelligenz diese Daten auch versteht .

Eine anschließende Aggregation, also das Erstellen einer Verbindung zwischen Daten und/oder das Erstellen von Metadaten aus den Daten, erleichtert Häufigkeitsanalysen oder das Erkennen von Klassen und/oder Kategorien, die daraufhin definiert und bereitgestellt werden können . Klassen und/oder Kategorien können aber auch bereits vorab vorgegeben werden, insbesondere basierend auf Erfahrungswissen .

Die selektierten und gegebenenfalls annotierten und gegebenenfalls aggregierten Daten aus den sozialen Netzwerken werden j eweils wenigstens einer Kategorie und/oder Klasse aus den bereitgestellten Kategorien und/oder Klassen zugeordnet . Je nach identi fi zierten instandhaltungsrelevanten Informationen kann ein Datensatz auch mehreren Kategorien und/oder Klassen zugeordnet werden . Auch dies kann während der Lernphase manuell erfolgen .

Die Zuordnung des identi fi zierten Fahrzeugs oder der identi fi zierten Einrichtung des öf fentlichen Personenverkehrs erfolgt hingegen eindeutig . D . h . j edem Datensatz , beispielsweise einem Beitrag in den sozialen Netzwerken, wird ein Fahrzeug oder eine Einrichtung des öf fentlichen Personenverkehrs zugeordnet . Wenn möglich, wird den erfassten Daten aus den sozialen Netzwerken eine Einrichtung oder Komponente des Fahrzeugs oder der Einrichtung des öf fentlichen Personenverkehrs eindeutig zugeordnet . Gleichermaßen wird j eder der bereitgestellten Kategorien und/oder Klassen wenigstens eine Handlungsanweisung aus der Liste von Handlungsanweisungen zugeordnet . Wie oben ausgeführt , können die Daten aus den sozialen Netzwerken auch mehreren Kategorien und/oder Klassen zugeordnet sein, so dass auch mehrere Handlungsanweisungen einem Beitrag zugeordnet werden können . Die Handlungsanweisungen werden wiederum vorgegeben und basieren insbesondere auf Erfahrungswissen .

Klassen können mehrere Kategorien umfassen . In einer Klasse werden gleichartige Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs abstrahiert zusammengefasst . Beispielsweise betref fen die Klassen Einrichtungen, Anlagen und/oder technische Komponenten der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs . Wie oben bereits ausgeführt können Klassen beispielsweise betref fen : die Sanitärzellen in Schienenfahrzeugen, die Fahrgasträume , hier beispielsweise Sitze , Tische , Kof ferablagen etc . , die Türen, der Internetempfang, die Lautsprecher für Durchsagen oder die Monitore für Anzeigen, die Klimatechnik oder die Bremsen . Kategorien können sich auf einzelne Aspekte , gegebenenfalls innerhalb der Klassen, beziehen, so z . B . auf die Art des vorliegenden instandhaltungsrelevanten Problems , wie beispielsweise auf ein empfundenes Raumklima ( Temperatur, Luftfeuchtigkeit etc . ) , dem Zugang zum Internet oder der Übertragungsgeschwindigkeit , dem Zustand des Fahrgastinnenraums oder der Sanitärzelle , beispielsweise hinsichtlich Funktionstüchtigkeit , Vandalismusschäden oder Verschleiß , der Hörbarkeit von Durchsagen oder der Lesbarkeit von Anzeigen und somit zur Verständlichkeit von Fahrgastinf ormationen, beispielsweise zum Fahrtverlauf , zur Bedienbarkeit und Funktionstüchtigkeit von weiteren Komponenten oder Einrichtungen wie beispielsweise von Türen, Rolltreppen oder Fahrstühlen, Schäden und Auswirkungen durch Vandalismus ( z . B . durch Graf fiti ) oder dem empfundenen Verkehrslärm ( z . B . durch Bremsenquietschen oder Kurvenquietschen) und/oder dem Bremsverhalten des Fahrzeugs .

Innerhalb der Klassen und/oder Kategorien kann während der Lernphase zusätzlich eine Gewichtung der selektierten, gegebenenfalls annotierten und gegebenenfalls klassi fi zierten und/oder kategorisierten Daten vorgenommen werden, insbesondere hinsichtlich ihrer Relevanz für die Instandhaltung und/oder hinsichtlich eines Schweregrades .

Der während der Lernphase trainierte und während der Anwendungsphase ausgeführte Algorithmus der künstlichen Intelligenz ist weitergebildet ein Algorithmus des Maschinellen Lernens . Maschinelles Lernen gilt als Teil der Künstlichen Intelligenz . Es kann auf einer Reihe von Algorithmen basieren, die mit den selektierten, gegebenenfalls annotierten und gegebenenfalls klassi fi zierten und/oder kategorisierten Daten trainiert werden, um eine Aufgabe zu erfüllen, ohne dass sie dafür programmiert wurden .

Weitergebildet handelt es sich um Algorithmen der linguistischen Datenverarbeitung (Natural language processing, kurz NLP ) .

Während einer sich der Lernphase anschließenden Anwendungsphase finden die oben genannten von Menschenhand ausgeführten Schritte , wie die Identi fikation, Selektion, Klassi fi zierung und/oder Kategorisierung automatisiert vom trainierten Algorithmus statt .

In der Anwendungsphase wird für die Verfahrensschritte b . und/oder c . der gemäß der Lernphase trainierte Algorithmus ausgeführt , um aktuell erfasste Daten aus sozialen Netzwerken zu analysieren und/oder daraufhin Zustände zu ermitteln . Gegebenenfalls wird der gemäß der Lernphase trainierte Algorithmus auch ausgeführt , um Handlungsanweisungen zur Instandhaltung gemäß Verfahrensschritt d . abzuleiten, welche Anschließend dem Betreiber und/oder Instandhalter, insbesondere dessen Service-Personal , zur Verfügung gestellt werden können . Weitergebildet werden die in Verfahrensschritt d . abgeleiteten Handlungsanweisungen zur Instandhaltung über eine API-Schnittstelle (API steht für Application Programming Interface ) zur Verfügung gestellt . Zusätzlich oder alternativ können die Handlungsanweisungen zur Instandhaltung auch per E-Mail , Textnachrichten, Web-Applikationen oder dergleichen übermittelt werden . Diese Daten können auch zur Veranschaulichung eines Fahrzeugstatus oder Einrichtungsstatus eines Fahrzeugs oder Einrichtung oder einer Fahrzeugflotte oder einer Gruppe von gleichartigen Einrichtungen visualisiert werden .

Die während der Anwendungsphase erfassten aktuellen Daten aus den sozialen Netzwerken können ebenfalls zur weiteren Verbesserung des Algorithmus in begleitenden oder ständig fortlaufenden Lernphasen genutzt werden, um den Algorithmus iterativ zu verbessern .

Gleichermaßen können auch Informationen aus der Instandhaltung erfasst und für die Lernphase des Algorithmus genutzt werden . Diese Informationen können ihrerseits wiederum vorverarbeitet , gefiltert , sortiert und klassi fi ziert werden . Beispielsweise wird dadurch eine Güte oder Relevanz der ursprünglich erfassten Daten aus den sozialen Netzwerken bewertet und gewichtet . Dies wird auch Modellüberwachung genannt .

Gemäß einer Weiterbildung der Erfindung umfasst Verfahrensschritt b . das Filtern der erfassten Daten nach einem vorgegebenen Algorithmus zur Ermittlung von Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs . Dieser Verfahrensschritt kann identisch zu dem Verfahrensschritt der Filterung in der Lernphase ausgebildet sein . Zur Filterung kann entsprechend derselbe Algorithmus genutzt , beispielsweise dieselbe Stichwortliste wie in der Lernphase verwendet werden . Entsprechend kann der Filterung in der Anwendungsphase auch eine Vorverarbeitung der erfassten Daten, insbesondere um die Datenqualität zu verbessern, beispielsweise umfassend eine Korrektur von Schreibfehlern oder grammatischen Fehlern, das Hinzufügen von fehlenden Werten oder Worten etc . vorangehen, wie auch die Analyse von visuellen Daten aus den sozialen Netzwerken, wie beispielsweise Videos oder Fotos , mittels Bildanalysealgorithmen, beispielsweise mittels Computer Vision Methoden, zur Erfassung von, insbesondere instandhaltungsrelevanten, Informationen aus den visuellen Daten in Textform ( video-to-text , image-to-text ) .

Gemäß einer weiteren Weiterbildung des Verfahrens umfasst Verfahrensschritt b . das Identi fi zieren von Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs aus den erfassten Daten aus den sozialen Netzwerken und Zuordnen der erfassten Daten aus den sozialen Netzwerken zu den identi fi zierten Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs . Das Analysieren der erfassten Daten erfolgt hinsichtlich der Informationen zu den identi fi zierten Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs . Fahrzeug oder Einrichtung sind mit der entsprechenden Information verknüpft . Wie oben bereits ausgeführt , sind Beiträge in sozialen Netzwerken üblicherweise mit Ortsdaten, Zeitstempel versehen, die zur Auswertung genutzt und üblicherweise in Textform vorliegen .

Weitergebildet geht Verfahrensschritt c . voran : Aggregieren und Klassi fi zieren und/oder Kategorisieren der Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs . Dieser Verfahrensschritt wird in der Anwendungsphase automatisch durch den während der Lernphase trainierten Algorithmus vorgenommen und ist frei von menschlichem Zutun . Gerade Natural Language Processing (NLP ) Algorithmen sind in der Lage , Beiträge aus sozialen Netzwerken auf zubereiten und bezüglich definierter Themen für die Instandhaltung zu klassi fi zieren und auswertbar zu machen . Entsprechend werden vorteilhaft trainierte NLP Algorithmen eingesetzt .

Gemäß einer weiteren Weiterbildung kann Verfahrensschritt c . vorangehen : Erfassen von Daten der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs , insbesondere von Sensor- und/oder Diagnosedaten zur Beschreibung eines Zustands der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs .

Weitergebildet können anschließend die insbesondere klassi fi zierten und/oder kategorisierten, Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs und die Daten der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs , insbesondere die Sensor- und/oder Diagnosedaten zur Beschreibung eines Zustands der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs zusammengeführt und ein Zustand wenigstens eines Fahrzeugs oder Einrichtung des öf fentlichen Personenverkehrs aus den zusammengeführten Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs und den erfassten Daten der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs ermittelt .

Durch das Zusammenführen von Sensor- und/oder Diagnosedaten zu Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs und den klassi fi zierten und/oder kategorisierten Informationen zu den Fahrzeugen oder Einrichtungen des öf fentlichen Personenverkehrs , basierend auf den Beiträgen in den sozialen Netzwerken, lassen sich diese ganzheitlich analysieren . Ein solch hollistischer Ansatz bietet den Vorteil eines besseren Verständnisses der vormals allein ausgewerteten Sensor- und/oder Diagnosedaten und ihren Einfluss auf das subj ektive Empfinden von Nutzern, wie beispielsweise Fahrgästen in Schienenfahrzeugen . So lassen sich Schlüsse auf die Auswertung der Sensor- und/oder Diagnosedaten ziehen, beispielsweise die Veränderung von Schwellwerten, bei deren Über- oder Unterschreitung Handlungsanweisungen zur Instandhaltung erzeugt werden .

Die mittels des Verfahrens ermittelten Zustände der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs können nach einer weiteren Weiterbildung ebenfalls klassi fi ziert und/oder kategorisiert werden .

Mittels des Verfahrens sind Trendanalysen, Häufigkeitsanalysen aus zuführen und Vorhersagen für zukünftige Zustände abzuleiten und insofern eine vorausschauende Instandhaltung (predictive maintenance ) möglich .

Ein erfindungsgemäßes Computerprogrammprodukt umfasst

Befehle , die bei der Aus führung des Programms durch ein geeignetes mobiles Endgerät dieses veranlassen, das Verfahren aus zuführen . Auf einer Bereitstellungsvorrichtung, insbesondere ein Datenträger, für das Computerprogrammprodukt ist das Computerprogrammprodukt gespeichert . Eine Vorrichtung, beispielsweise ein Computer, ist eingerichtet zur Aus führung des Verfahrens und umfasst Mittel , die zur Aus führung des j eweiligen Verfahrensschritts geeignet sind .

Die Erfindung vereinfacht die Instandhaltungsplanung als auch die Betriebsplanung von Fahrzeugen und Einrichtungen des öf fentlichen Personenverkehrs . Die tendenziell eher fahrgast zentrierten Daten aus den sozialen Netzwerken komplementieren Sensor- und/oder Diagnosedaten, fahrzeugseitig oder landseitig erfasst , und geben so einerseits die Möglichkeit einer Überwachung von bisher unüberwachten Einrichtungen oder Komponenten und lassen andererseits Rückschlüsse auf den Einfluss von mittels Sensoren gemessenen obj ektiven Werten auf die subj ektiven Empfindungen der Nutzer oder Fahrgäste zu, beispielsweise hinsichtlich des Komforts . Erfassen, Sammeln und Zusammenfassen von Beiträgen aus den Sozialen Netzwerken ist darüber hinaus kostengünstig . Damit könnten entsprechend rein komplementäre Sensoren eingespart werden . Der Zustand der überwachten Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs kann ohne zusätzliche Sensordaten ermittelt und überwacht werden, beispielsweise auch in Bereichen, die nicht oder nur unzureichend per Sensoren zu überwachen sind . Depotaufenthalte von Fahrzeugen können verringert , Verfügbarkeit gesteigert und Servicekosten gesenkt werden . Gleichzeitig wird die Attraktivität des öf fentlichen Personenverkehrs für die Nutzer bzw . Passagiere gestärkt .

Die Erfindung lässt zahlreiche Aus führungs formen zu . Eine Aus führungs form wird nachfolgenden anhand der Figur näher erläutert . In der Figur ist schematisch ein Ablauf eines Aus führungsbeispiels des erfindungsgemäßen Verfahrens dargestellt . Das Verfahren ist in zwei Phasen eingeteilt , eine Lernphase 1 und eine Anwendungsphase 2 . Die Lernphase 1 umfasst die nachfolgend näher erläuterten Verfahrensschritte Datenhandling 4 , Analyse und Analytik 5 sowie Optimierung 6 . Die Anwendungsphase 2 umfasst die Verfahrensschritte Aus führung 7 sowie Instandhaltung 8 .

Der Startpunkt wird durch einen Social Media Aggregator 3 gebildet , welcher Beiträge in verschiedenen sozialen Netzwerken von Fahrgästen von Fahrzeugen oder von Nutzern von Einrichtungen des öf fentlichen Personenverkehrs sammelt und an den Prozess , sowohl während der Lernphase 1 im Verfahrensschritt Datenhandling 4 als auch während der Anwendungsphase 2 im Verfahrensschritt Aus führung 7 übergibt .

Das Datenhandling 4 während der Lernphase 1 umfasst insbesondere eine Filterung sowie gegebenenfalls eine Vorverarbeitung der erfassten Daten aus den sozialen Netzwerken, um eine Datenqualität zu verbessern .

Die Analyse und Analytik 5 umfasst insbesondere die Klassi fi zierung und/oder Kategorisierung der erfassten und gegebenenfalls gefilterten Daten aus den sozialen Netzwerken sowie den Einsatz von Algorithmen des Maschinenlernens , insbesondere aus dem Bereich der Natural Language Processing (NLP ) .

In der Anwendungsphase 2 wird das in der Lernphase 1 trainierte analytische Modell im Schritt Aus führung 7 angewandt , insbesondere auf aktuelle Beiträge aus den sozialen Netzwerken, welche vom Social Media Aggregator 3 zur Verfügung gestellt werden, um Handlungsanweisung zur Instandhaltung der Fahrzeuge oder Einrichtungen des öf fentlichen Personenverkehrs aus dem ermittelten Zustand der Fahrzeuge oder der Einrichtungen des öf fentlichen Personenverkehrs abzuleiten und an die Instandhaltung 8 zu übergeben. Gegebenenfalls werden Informationen und Erfahrungen aus der Instandhaltung 8, wie in einer Art Regelkreis, in die Lernphase 1 zur Optimierung 6 des Algorithmus zurückgeführt.

Nachfolgend wird anhand eines Praxisbeispiels die Entwicklung von Algorithmen für das Verfahren erläutert, in welchem Nachrichten auf Twitter in einem zweistufigen Prozess ausgewertet wurden. Zunächst wurden die Tweets nach Relevanz (relevanter Tweet vs . nicht relevant) klassifiziert und anschließend für relevante Tweets das Thema der Tweets mittels Multiklassen-Klassif izierung bestimmt.

In der ersten Phase der Entwicklung KI-basierter Analysen ist es vorteilhaft eine Vergleichsbasis zu erstellen, um optimierte Methoden bewerten zu können. Das Basis- Klassifikationsmodell basiert auf traditionellen, maschinellen Lernalgorithmen. Für die eben genannten Prozessstufen wurden SVM (Support Vector Machines) , Random Forest, logistische Regression und Entscheidungsbäume getestet. Diese Algorithmen klassifizieren die Tweets angemessen, sind aber nicht in der Lage die komplexe Struktur der Sprache zu erfassen, die in Twitter-Nachrichten oft benutzt wird.

Die erste Klassifikationsstufe ist eine binäre Auswahl, bei der Tweets als relevant oder nicht relevant klassifiziert werden. Die beste Performance für den Relevanztest wurde mit dem Support Vector Classifier (SVC) -Algorithmus erreicht. Hierbei werden die Tweets mittels TF-IDF Vectorizer in Vektoren umgewandelt, der jedem N-Gramm von Fragmenten mit 1 bis 3 Wörtern Länge entsprechend ihrer Bedeutung im Text eine Punktzahl zuweist. Die vektorisierte Repräsentation der Tweets wird dann dem SVC zugeführt. Die Performanz von SVC bei den Testdaten ist in der nachfolgenden Tabelle zu sehen.

Tabelle : Güte der Algorithmen für beide Klassi fikationsphasen .

Der zweite Klassi fikationsschritt bestimmt das Instandhaltungsthema für relevante Tweets . Hierbei wird zwischen neun verschiedenen Themen in einer Multi-klassen- Klassi f ikation unterschieden . Diese Themen sind :

• wifi - Zugang zum Internet

• hvac - Hei zung, Lüftung, Klimatechnik

• seats/tables -Fahrgastsit ze und -tische

• announcements - Ansagen und Anzeigen zum Fahrablauf

• vandalism - Schäden und Auswirkungen durch Vandalismus ( z . B . Graf fiti )

• toilets - Sanitäre Anlagen

• interior -Fahrgastraum

• doors - Fahrgasttüren

• brakes/noise - Verkehrslärm und Bremsverhalten .

Als Basislinienalgorithmus wurde ein Random Forest ausgewählt und trainiert . Dieses Modell besteht aus einem Ensemble von Entscheidungsbäumen, die zuerst j eweils eine Klasse ( Thema ) pro Tweet bestimmen aus denen anschließend per Mehrheitsentscheid das finale Thema gewählt wird . Einer der Hauptvorteile von Random Forests ist ihre Interpretierbarkeit . Es ist relativ einfach zu beurteilen und zu visualisieren, wie und warum der Algorithmus eine bestimmte Entscheidung getrof fen hat .

Die Heraus forderung für den zweiten Klassi fikationsschritt liegt in der größeren Anzahl von Themen ( 9 statt 2 Klassen) und dass einem Tweet mehr als ein Thema zugeordnet werden kann . Wie im ersten Schritt werden die Tweets mit TF- IDF vektorisiert und anschließend durch den Random Forest klassifiziert. Die Gesamtklassif izierungs-metrik, der macro Fl-Maß, ist mit 0,7 zwar besser als eine rein zufällige Themen- Zuordnung (0.11) , aber stellt noch kein zuverlässiges Ergebnis dar.

Ein Transformer, im Kontext des maschinellen Lernens zur Verarbeitung natürlicher Sprache, ist ein Deep-Learning- Modell, der die Bedeutung aller Bestandteile von Eingabedaten (hier Twitter-Nachrichten) bewertet. Transformer benutzen einen Aufmerksamkeitsmechanismus, der den Kontext von zu untersuchenden Satzfragmente identifiziert und damit deren Bedeutung bestimmt. Dies kann an folgendem Beispiel veranschaulicht werden:

"Didn't get a window seat on the train ride today because it was so crowded!"

"Didn't get a window seat on the train ride today because it was all torn ! "

Da beide Sätze fast ausschließlich aus den gleichen Wörtern gebildet werden und die oben beschriebenen Basisalgorithmen Entscheidungen aufgrund von Metriken verwenden, die auf der Worthäufigkeit in Texten basieren, würden die Basisalgorithmen diese Beispielsätze als annähernd äquivalent ansehen. Der Unterschied jedoch, welcher auf einen Mangel hinweist („Zug voll" vs . „zerrissener Sitz") , würde nicht erkannt werden. Vor allem in solch ambivalenten sprachlichen Situationen können Transformer ihre Stärke beweisen und erkennen, dass sich die Aussage des ersten Satzes auf einen Zug bezieht, während der zweite ein Sitzplatzproblem behandelt .

Ein manuell annotierter Datensatz wurde für das Training aller Transformer benutzt. Zunächst wurde durch Filterung mittels regulärer Begriffe basierend auf einer umfangreichen Liste von Stichwörtern, wobei die benutze Stichwortliste wurde aus einem umfangreichen Wortschatz gebildet wurde, welcher aus vorhergehenden Twitter-Sprachanalysen, betriebsinternen Kommunikationen zur Instandhaltung von Rollmaterial als auch Instandhaltungsapplikationen im Endkundeneinsatz gewonnen wurde, die Beiträge im Kontext von Instandhaltung im öffentlichen Personenverkehr erfasst und diese Daten im Anschluss von mehreren Personen annotiert und kategorisiert, denen nicht-überschneidende Gruppen von Tweets zugeteilt wurden. Idealerweise sollte jedes Tweet-Label durch die Mittelung mehrerer Urteile von Muttersprachler bestimmt werden, um eine hohe Annotierungsgüte zu erreichen. Dies ist von besonderem Interesse, wenn komplexe Sprache, Sarkasmus oder Inhalte identifiziert und beurteilt werden, die spezifisch für die untersuchten Regionen sind und manchmal nur von ortskundigen Passagieren verstanden werden können. In der durchgeführten Analyse wurde die Mittelwertmethode durch Konsensbildung für Tweets, welche nicht eindeutig zu o.g. Kennzeichnungen zugeordnet werden konnten, angewandt. Dies reduzierte den Bearbeitungsaufwand um ca. 60% ohne die Annotierungsgüte ausschlaggebend zu verringern.

Für beide Klassifikationstrainings (Relevanz- und Themenphase) wurde der annotierte Datensatz in Trainings-, Validierungs- und Testdatensatz aufgeteilt. 80 % des Datensatzes wurden für das Training und die restlichen 20 % für Validierung und Tests verwendet.

Die besten Ergebnisse bei der Themenklassifizierung (Phase 2) wurden mit „Bidirectional Encoder Representation from Transformers" (BERT) erzielt. Für den Relevanzklassifizierungsschritt (Phase 1) wurde schließlich RoBERTa gewählt, welcher den „Robust BERT Approach", der BERT übertraf. Die Kreuzentropie-Funktion wurde verwendet, um die Vorhersagekraft der Modelle (loss) zu messen. Für den Optimierungsalgorithmus des Modelltrainings , der die Gewichte (oder Konfiguration) des Transformer-Modells bei jeder Iteration entsprechend dem Loss kontinuierlich aktualisiert, wurde der Adam-Optimierer sowohl für die Relevanz- als auch für die Themenklassifizierung ausgewählt. Die Güte der Modelle wurde durch Hyperparameter-Tuning optimiert, einschließlich der Lernrate, der Batchgröße und der Anzahl der Trainingsepochen. Das Training wurde auf GPUs mit Hilfe des FLAIR-Bibliothek, das State-of-the-Art-Lösungen für Deep Learning bereitstellt, durchgeführt. Alle trainierten Transformer wurden auf dem Testdatensatz mit den folgenden Metriken bewertet: Genauigkeit, Fl-Score, Präzision und Erinnerung.

Für Phase 2, ebenfalls in obiger Tabelle dargestellt, wurde der gewichtete Mittelwert des Fl-Wertes aller Klassen als Kennzahl der Güte der Mehrklassen-Klassif izierung benutzt. Der höchstmögliche Wert ist 1, was perfekte Genauigkeit und Trefferquote an-zeigt, und der niedrigste ist 0.

Im Generellen ist die in sozialen Medien benutzte Sprache schwer maschinell zu analysieren, da sie häufig komplex ist. Es mangelt u. a. nicht an subtilen Redenwendungen, Slang, gewollten Stilblüten und Rechtschreibfehlern. Sogar für Muttersprachler ist die benutze Sprache zum Teil schwer verständlich. Einige Tweets weisen eine gewisse Mehrdeutigkeit auf, die sogar menschliche Leser herausfordert, was in einigen Fällen zu Unstimmigkeiten bei der Themenklassifikation führen kann, was wiederum das Training der Transformer erschwert. Trotz der nicht perfekten Annotation sind Transformer jedoch oft in der Lage, die wahre Themenklassifikation selbst zu erlernen, wenn sie mit genügend Daten trainiert werden. Der Schlüssel zu den weiteren Verbesserungen des eingesetzten Klassifikationsmodells liegt daher in noch größeren, beschrifteten Datensätzen mit einer breiteren Auswahl instandhaltungsrelevanter Tweets. Auch hier bestätigt sich wieder, dass alle Modelle des überwachten, maschinellen Lernens, selbst die fortschrittlichen wie Transformers, nur so gut sind wie die Daten, durch welche sie trainiert wurden. Anhand dieses ausgewählten Praxisbeispiels wird gezeigt , wie der Ansatz neuen Input für die Instandhaltung generiert und wie diese prozessual in den Ablauf einfließen . Für die Anwendung ist es wichtig die Abläufe im Depot besser zu verstehen und genau zu betrachten, zu welchem Zeitpunkt der neue Input zum Tragen kommt . Aktuell werden Fehler im Innenraum bei Routineinspektionen nach der Einfahrt des Zugs im Depot festgestellt . Um im Vergleich dazu Zeit einzusparen, die Qualität der Tätigkeiten zu steigern und die Passagiererfahrung zu verbessern, ist es erforderlich, dass die Information vor Einfahrt des Zugs vorliegt oder es Fehler erkannt werden, die nicht bei der Routineinspektion festgestellt werden . Deswegen ist es notwendig, dass die analysierten Informationen in der Arbeitsvorbereitung und in der Ablaufplanung zu Beginn einer Schicht vorliegen . I st dies der Fall so kann die Arbeitsvorbereitung noch vor Einfahrt eines Zugs im Depot feststellen, ob und welche Instandhaltungsmaßnahmen im Innenraum des Zuges anstehen . Damit kann sich auf diese Maßnahmen vorbereitet werden, um die Zugaufenthalte im Depot möglichst kurz zu halten . Dies führt letzten Endes zum einen zu einer besseren Planbarkeit und zum anderen zu einer besseren Planungsqualität . Abgesehen von der Verbesserung der Planbarkeit im Depot können ebenfalls unerkannte Fehler entdeckt werden . Beispielsweise wurde über Social Media eine nicht funktionierende Steckdose erkannt , welche durch eine visuelle Inspektion allein nicht entdeckt worden wäre . Bei der Durchsicht des verwendeten Instandhaltungssystems war dieser Fehler ebenfalls nicht auf zufinden . Somit kann durch diesen Ansatz , sofern darüber auf Social Media berichtet wird, dahin gehend verwendet werden, um diverse Komponenten im Fahrzeuginnenraum zu überwachen .