Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
COMPUTER-ASSISTED METHOD FOR GENERATING TRAINING DATA FOR A NEURAL NETWORK FOR PREDICTING A CONCENTRATION OF POLLUTANTS
Document Type and Number:
WIPO Patent Application WO/2021/032332
Kind Code:
A1
Abstract:
The invention relates to a computer-assisted method for generating training data for a neural network, wherein the neural network is configured for detecting a concentration of pollutants from at least one emission of pollutants, and the method is characterised at least by the following steps: - providing at least one series of measurements of the concentration of pollutants having at least one measured value that is above an established threshold; - providing at least one series of measurement for a physical measured quantity, in particular a temperature, a wind speed and/or traffic density, associated with the measured concentration of pollutants; - providing a model, wherein the model models a correlation between the measured quantity and the emission of pollutants; - calculating a first value E 0 of the emission of pollutants using the model, wherein, for this purpose, at least one measured value of the measured quantity is used, which measured value is associated with a value E 1 of the provided measured concentration of pollutants; - calculating a second value E 0 of the emission of pollutants using the model, wherein, for this purpose, the measured value of the measured quantity is numerically modified, which measured value is used for calculating the first value {E 1 of the emission of pollutants; and - generating a synthetic series of measurements as training data by modifying ∆C the value C 0 of the provided series of measurements of the concentrations of pollutants, wherein the modification ∆C is carried out using the relative modification ∆E/E 0 of the calculated values of the emissions of pollutants. The invention further relates to a computer-assisted method for training a neural network and to a method for detecting a concentration of pollutants using the neural network trained in this way.

Inventors:
JAEGER FLORIAN ANSGAR (DE)
MÜLLER KATRIN (DE)
Application Number:
PCT/EP2020/064986
Publication Date:
February 25, 2021
Filing Date:
May 29, 2020
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS AG (DE)
International Classes:
G06N20/00; G06F17/10
Other References:
KE GU ET AL: "Recurrent Air Quality Predictor Based on Meteorology- and Pollution-Related Factors", IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, vol. 14, no. 9, 9 September 2018 (2018-09-09), US, pages 3946 - 3955, XP055741094, ISSN: 1551-3203, DOI: 10.1109/TII.2018.2793950
DING DAIZONG 17110240010@FUDAN EDU CN ET AL: "Modeling Extreme Events in Time Series Prediction", PROCEEDINGS OF THE 25TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY & DATA MINING , KDD '19, ACM PRESS, NEW YORK, NEW YORK, USA, 25 July 2019 (2019-07-25), pages 1114 - 1122, XP058466144, ISBN: 978-1-4503-6201-6, DOI: 10.1145/3292500.3330896
BRIAN S. FREEMAN ET AL: "Forecasting air quality time series using deep learning", AIR & WASTE MANAGEMENT ASSOCIATION. JOURNAL, vol. 68, no. 8, 24 May 2018 (2018-05-24), US, pages 866 - 886, XP055740911, ISSN: 1096-2247, DOI: 10.1080/10962247.2018.1459956
SHUANG LIU ET AL: "Multimodal GAN for Energy Efficiency and Cloud Classification in Internet of Things", IEEE INTERNET OF THINGS JOURNAL, 20 August 2018 (2018-08-20), pages 1 - 8, XP055580521, DOI: 10.1109/JIOT.2018.2866328
"Designing Sustainable Technologies, Products and Policies : From Science to Innovation", 4 July 2018, SPRINGER INTERNATIONAL PUBLISHING, Cham, ISBN: 978-3-319-66981-6, article FLORIAN ANSGAR JAEGER ET AL: "LCA in Strategic Decision Making for Long Term Urban Transportation System Transformation : From Science to Innovation", pages: 193 - 204, XP055740646, DOI: 10.1007/978-3-319-66981-6_22
Download PDF:
Claims:
Patentansprüche

1. Computergestütztes Verfahren zum Erzeugen von Trainingsda ten für ein neuronales Netz, wobei das neuronale Netz zum Er mitteln einer Schadstoffkonzentration aus wenigstens einer Schadstoffemission ausgebildet ist, gekennzeichnet durch fol gende Schritte:

- Bereitstellen wenigstens einer Messreihe der Schadstoffkon zentration mit wenigstens einem Messwert, der oberhalb eines festgelegten Schwellenwertes ist;

- Bereitstellen wenigstens einer Messreihe für eine zur ge messenen Schadstoffkonzentration zugehörigen physikalischen Messgröße, insbesondere einer Temperatur, einer Windgeschwin digkeit und/oder einer Verkehrsstärke;

- Bereitstellen eines Modells, wobei das Modell einen Zusam menhang zwischen der Messgröße und der Schadstoffemission mo delliert;

- Berechnen eines ersten Wertes E0 der Schadstoffemission mittels des Modells, wobei hierzu wenigstens ein zu einem Wert C0 der bereitgestellten gemessenen Schadstoffkonzentra tion zugehöriger Messwert der Messgröße verwendet wird;

- Berechnen eines zweiten Wertes E1 der Schadstoffemission mittels des Modells, wobei hierzu der für das Berechnen des ersten Wertes E0 der Schadstoffemissionen verwendete Messwert der Messgröße numerisch verändert wird; und

- Erzeugen einer synthetischen Messreihe als Trainingsdaten durch eine Veränderung DC des Wertes C0 der bereitgestellten gemessenen Messreihe der Schadstoffkonzentrationen, wobei die Veränderung DC mittels der relativen Änderung DE/E0 der be rechneten Werte der Schadstoffemissionen erfolgt.

2. Computergestütztes Verfahren gemäß Anspruch 1, gekenn zeichnet dadurch, dass die Veränderung AC des wenigstens ei nen Wertes C0 der bereitgestellten Messreihe der Schadstoff konzentrationen zusätzlich mittels eines verkehrsbedingten Anteils a an der Schadstoffkonzentration erfolgt.

3. Computergestütztes Verfahren gemäß Anspruch 2, gekenn zeichnet dadurch, dass die Veränderung DC des wenigstens ei nen Wertes C0 der bereitgestellten Messreihe der Schadstoff konzentration mittels C/C0 = a E/E0 erfolgt.

4. Computergestütztes Verfahren gemäß Anspruch 2 oder 3, ge kennzeichnet dadurch, dass ein verkehrsbedingter Anteil a im Bereich von 0,3 bis 0,5 verwendet wird.

5. Computergestütztes Verfahren gemäß einem der vorhergehen den Ansprüche, gekennzeichnet dadurch, dass eine Stickoxid konzentration als Schadstoffkonzentration und eine Stickoxi demission als Schadstoffemission verwendet wird.

6. Computergestütztes Verfahren gemäß einem der vorhergehen den Ansprüche, gekennzeichnet dadurch, dass als physikalische Messgröße eine Temperatur, eine Windgeschwindigkeit und/oder einer Verkehrsstärke verwendet wird.

7. Computergestütztes Verfahren gemäß einem der vorhergehen den Ansprüche, gekennzeichnet dadurch, dass die Messreihe der Schadstoffkonzentration und die Messreihe der Messgröße mit tels einer Messstation innerhalb einer Stadt erfasst wurden.

8. Computergestütztes Verfahren gemäß einem der vorhergehen den Ansprüche, gekennzeichnet dadurch, dass als Modell ein domainbasiertes Modell verwendet wird.

9. Computergestütztes Verfahren zum Trainieren eines neurona len Netzes, wobei das neuronale Netz zum Ermitteln einer Schadstoffkonzentration aus wenigstens einer Schadstoffemis sion ausgebildet ist, gekennzeichnet dadurch, dass zum Trai nieren des neuronalen Netzes ein gemäß einem der vorhergehen den Ansprüche erzeugter Trainingsdatensatz verwendet wird.

10. Computergestütztes Verfahren zum Ermitteln einer Schad stoffkonzentration mittels eines neuronalen Netzes und mit tels eines Modells, wobei das neuronale Netz zum Ermitteln einer Schadstoffkonzentration aus wenigstens einer Schadstof femission ausgebildet und gemäß Anspruch 8 trainiert ist, wo bei das Modell einen Zusammenhang zwischen einer physikali schen Messgröße, insbesondere einer Temperatur, einer Windge- schwindigkeit und/oder einer Verkehrsstärke, und der Schad stoffemission modelliert, gekennzeichnet durch folgende Schritte:

- Berechnen eines Wertes der Schadstoffemission mittels des Modells, wobei hierzu wenigstens ein Messwert der Messgröße verwendet wird; und

- Ermitteln der Schadstoffkonzentration aus dem berechneten Wert der Schadstoffemission mittels des neuronalen Netzes.

Description:
Beschreibung

Computergestütztes Verfahren zum Erzeugen von Trainingsdaten für ein neuronales Netz für eine Vorhersage einer Schadstoff konzentration

Die Erfindung betrifft ein Verfahren zum Erzeugen von Trai ningsdaten für ein neuronales Netz gemäß dem Oberbegriff des Patentanspruches 1, ein Verfahren zum Training eines neurona len Netzes gemäß dem Oberbegriff des Patentanspruches 9 sowie ein Verfahren zum Ermitteln einer Schadstoffkonzentration mittels eines neuronalen Netzes gemäß dem Oberbegriff des Pa tentanspruches 10.

Die Schadstoffbelastung, beispielsweise eine Stickoxidkon zentration, kann innerhalb einiger deutscher Städte für be stimmte Zeiträume oberhalb der zulässigen Grenzwerte liegen.

Zur Sicherstellung einer ausreichenden Luftqualität können Städte mehrere Maßnahmen treffen, beispielsweise Fahrverbote. Allerdings ist es für die Wirksamkeit dieser Maßnahmen erfor derlich, dass diese bereits vor einem möglichen Überschreiten der Grenzwerte durchgeführt werden. Hierzu ist eine zuverläs sige und möglichst präzise Vorhersage (Prognose) der Schad stoffkonzentration erforderlich.

Grundsätzlich werden Emissionen (Dimension Masse oder Masse pro Länge pro Zeit) und Konzentrationen (Dimension Masse pro Volumen) unterschieden. Die Emission ist die emittierte Masse eines Schadstoffes, beispielsweise eines Verkehrsteilnehmers innerhalb eines Zeitbereiches, beispielsweise einer Stunde. Die Emission kann ebenfalls auf eine Länge (Straßenlänge, Streckenlänge usw.) und einen Zeitbereich bezogen sein, so- dass diese hierbei die Dimension Masse pro Länge pro Zeit aufweist. Die Schadstoffkonzentration wird, beispielsweise von einer Messstation, an einem bestimmten Ort innerhalb der Stadt, gemessen. Grundsätzlich sind die Emissionen und Schad stoffkonzentrationen zeitabhängig. Die Schadstoffkonzentration ist aufgrund der Komplexität der Vorgänge schwer vorherzusagen, sodass hierfür typischerweise neuronale Netze verwendet werden.

Das grundsätzliche Verfahren ist hierbei zweigeteilt. Zu nächst wird die Emission mittels eines Modells berechnet. An schließend wird die Schadstoffkonzentration aus der modellba siert berechneten Emission mittels des neuronalen Netzes er mittelt.

Hierzu ist ein Training des neuronalen Netzes erforderlich, das heißt es sind Trainingsdaten bezüglich der Schadstoffkon zentration erforderlich. Sinnbildlich muss das neuronale Netz mittels der Trainingsdaten lernen, wie sich die Schadstoff konzentration aus der Schadstoffemission ergibt. Typischer weise werden zum Trainieren des neuronalen Netzes historische Daten der Schadstoffkonzentration als Trainingsdaten verwen det. Ein derart trainiertes neuronales Netz liefert in Situa tionen, die häufig auftreten, eine gute Vorhersage. Daher kann die durchschnittliche Schadstoffkonzentration durch die se ausreichend genau vorhergesagt werden.

Problematisch sind Ereignisse oder Situationen hoher Belas tung, da diese typischerweise selten sind. Dadurch stehen nur wenig Daten zum Training des neuronalen Netzes zur Verfügung. Durch dieses Problem ist die Vorhersage für die eigentlich interessanten Ereignisse hoher Belastung, das heißt für die seltenen Ereignisse, schlechter.

Aus dem Stand der Technik sind im Wesentlichen zwei Verfahren zur Verbesserung der Vorhersage bezüglich solcher seltenen Ereignisse bekannt.

Erstens können die für das Training verwendeten Daten bezie hungsweise Messreihen unterschiedlich gewichtet werden. Bei spielsweise wird ein historisches Ereignis hoher Belastung mehrmals verwendet. Nachteilig hieran ist, dass dadurch die Vorhersage der durchschnittlichen Belastung verschlechtert wird. Somit bleibt das eigentliche Problem, dass für Ereig nisse hoher Belastung weniger Messreihen beziehungsweise Messdaten und somit Trainingsdaten vorliegen, bestehen.

Zweitens können die Schadstoffemission und Schadstoffkonzent ration durch einen vollständigen modellbasierten Ansatz be rechnet werden. Dies ist ein großer Aufwand und zudem sind nicht alle Abhängigkeiten bekannt. Die bekannten Verfahren liefern daher typischerweise zu geringe Werte für die Schad stoffkonzentration .

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, ein verbessertes Training eines neuronalen Netzes, welches zur Ermittlung einer Schadstoffkonzentration aus einer Schadstof femission vorgesehen ist, bereitzustellen.

Die Aufgabe wird durch ein Verfahren zum Erzeugen von Trai ningsdaten für ein neuronales Netz mit den Merkmalen des un abhängigen Patentanspruches 1, durch ein Verfahren zum Trai ning eines neuronalen Netzes mit den Merkmalen des unabhängi gen Patentanspruches 9, sowie durch ein Verfahren zum Ermit teln einer Schadstoffkonzentration mit den Merkmalen des un abhängigen Patentanspruches 10 gelöst. In den abhängigen Pa tentansprüchen sind vorteilhafte Ausgestaltungen und Weiter bildungen der Erfindung angegeben.

Das erfindungsgemäße computergestützte Verfahren zum Erzeugen von Trainingsdaten für ein neuronales Netz, wobei das neuro nale Netz zum Ermitteln einer Schadstoffkonzentration aus we nigstens einer Schadstoffemission ausgebildet ist, umfasst wenigstens die folgenden Schritte:

- Bereitstellen wenigstens einer Messreihe der Schadstoffkon zentration mit wenigstens einem Messwert, der oberhalb eines festgelegten Schwellenwertes ist;

- Bereitstellen wenigstens einer Messreihe für eine zur ge messenen Schadstoffkonzentration zugehörigen physikalischen Messgröße, insbesondere einer Temperatur, einer Windgeschwin digkeit und/oder einer Verkehrsstärke;

- Bereitstellen eines Modells, wobei das Modell einen Zusam menhang zwischen der Messgröße und der Schadstoffemission mo delliert;

- Berechnen eines ersten Wertes E 0 der Schadstoffemission mittels des Modells, wobei hierzu wenigstens ein zu einem (ursprünglichen) Wert C 0 der bereitgestellten gemessenen Schadstoffkonzentration zugehöriger Messwert der Messgröße verwendet wird;

- Berechnen eines zweiten Wertes E 1 der Schadstoffemission mittels des Modells, wobei hierzu der für das Berechnen des ersten Wertes E 0 der Schadstoffemissionen verwendete Messwert der Messgröße numerisch verändert wird; und

- Erzeugen einer synthetischen Messreihe als Trainingsdaten durch eine Veränderung DC des Wertes C 0 der bereitgestellten gemessenen Messreihe der Schadstoffkonzentrationen, wobei die Veränderung DC mittels der relativen Änderung DE/E 0 der be rechneten Werte der Schadstoffemissionen erfolgt.

Das erfindungsgemäße Verfahren zum Erzeugen von Trainingsda ten stellt Daten beziehungsweise eine Zeitreihe der Schad stoffkonzentration bereit, mittels welchem das neuronale Netz trainiert werden kann. Das Training kann mittels bekannter Verfahren, beispielsweise Deep-Learning, erfolgen.

Das neuronale Netz (englisch: Artificial Neural Network) ist hierbei dazu vorgesehen oder dazu ausgebildet, aus einer Schadstoffemission eine Schadstoffkonzentration zu ermitteln. Die Schadstoffemission beziehungsweise die Schadstoffemissio nen werden mittels des Modells berechnet.

Im ersten Schritt des erfindungsgemäßen Verfahrens zum Erzeu gen der Trainingsdaten wird eine Messreihe einer Schadstoff konzentration bereitgestellt, wobei wenigstens ein Wert be ziehungsweise Messwert der Schadstoffkonzentration oberhalb des festgelegten Schwellenwertes ist. Mit anderen Worten wird eine Messreihe bereitgestellt, die zu einer wenigstens zu ei- nem Zeitpunkt hohen Schadstoffkonzentration und somit zu ei ner hohen Schadstoffbelastung korrespondiert. Somit lag ein seltenes Ereignis einer hohen Schadstoffbelastung vor.

Der Schwellenwert ist typischerweise durch einen Grenzwert festgelegt, beispielsweise 200 Mikrogramm pro Kubikmeter (pg/m 3 ) für Stickoxid. Die Messreihe ist eine zeitliche Ab folge (kontinuierlich oder diskret) von Messwerten der Schad stoffkonzentration, beispielsweise in der Einheit pg/m 3 . Die Messreihe weist einen oder mehrere Messwerte auf, wobei jeder Messwert zu einem bestimmten Zeitpunkt erfasst worden ist.

Der Zeitpunkt kann ebenfalls ein Zeitbereich sein, sodass für den Zeitbereich ein Messwert erfasst oder ermittelt wurde. Beispielsweise wird für jede Stunde ein Messwert der Schad stoffkonzentration ermittelt, beispielsweise durch eine oder mehrere Messungen. Mit anderen Worten wird beispielsweise für jede Stunde eines Tages ein Messwert der Schadstoffkonzentra tion erfasst. Die zeitliche geordnete Abfolge dieser erfass ten Messwerte bildet dann eine exemplarische Messreihe der Schadstoffkonzentration aus.

Im zweiten Schritt des erfindungsgemäßen Verfahrens zum Er zeugen der Trainingsdaten wird wenigstens eine Messreihe ei ner physikalischen Messgröße bereitgestellt. Hierbei ist die Messgröße eine physikalische Größe, beispielsweise eine Tem peratur, eine Windgeschwindigkeit und/oder eine Verkehrsstär ke beziehungsweise Verkehrsdichte. Die Messgröße ist zur be- reitgestellten gemessenen Schadstoffkonzentration zugehörig, das heißt, dass für jeden Zeitpunkt ein Messwert der Schad stoffkonzentration und ein Messwert der Messgröße vorliegt. Mehrere Messgrößen und entsprechende Messreihen können vorge sehen sein.

Beispielsweise wird für jede Stunde eines Tages eine durch schnittliche Schadstoffkonzentration und die bei der jeweili gen durchschnittlichen Schadstoffkonzentration vorliegende und somit zugehörige durchschnittliche Temperatur, Windge schwindigkeit und/oder Verkehrsstärke erfasst. Mit anderen Worten werden wenigstens zwei Messgrößen zeitlich erfasst, die Schadstoffkonzentration und die physikalische Messgröße, beispielsweise die Temperatur, die Windgeschwindigkeit und/oder die Verkehrsstärke, die bei der gemessenen Schad stoffkonzentration vorliegen beziehungsweise Vorlagen. Die Messgröße ist deshalb von Bedeutung, da diese oder mehrere Messgrößen, wie beispielsweise die Temperatur, die Windge schwindigkeit und/oder die Verkehrsstärke, die Schadstoffkon zentration grundsätzlich beeinflussen, das heißt die Schad stoffkonzentration ist von der einen oder mehreren Messgrößen abhängig. So kann die Schadstoffkonzentration an einer Mess station innerhalb einer Stadt entscheidend von der Windrich tung und/oder der Verkehrsstärke abhängen.

Im dritten Schritt des erfindungsgemäßen Verfahrens zum Er zeugen der Trainingsdaten wird ein Modell bereitgestellt, wo bei das Modell einen Zusammenhang (Abhängigkeit) zwischen der Messgröße und der Schadstoffemission modelliert beziehungs weise beschreibt. Mittels des Modells kann somit die Schad stoffemission, beispielsweise eines Verkehrsteilnehmers, in Abhängigkeit der Messgröße, beispielsweise der Temperatur, der Windgeschwindigkeit und/oder der Verkehrsstärke, berech net werden. Typischerweise sind diese Modelle komplex und do mainbasiert. Das Modell weist somit wenigstens eine Eingangs größe und wenigstens eine Ausgangsgröße auf, wobei die Ein gangsgröße die Messgröße ist, und die Ausgangsgrößen die Schadstoffemission ist.

Im vierten Schritt des erfindungsgemäßen Verfahrens zum Er zeugen der Trainingsdaten wird ein erster Wert E 0 der Schad stoffemission mittels des Modells berechnet. Hierzu wird we nigstens eine zu einem Wert C 0 der bereitgestellten gemesse nen Schadstoffkonzentration zugehöriger Messwert der Messgrö ße verwendet. Mit anderen Worten wird der zum Wert C 0 der be- reitgestellten gemessenen Schadstoffkonzentration zugehörige Wert der Messgröße, beispielsweise der zum Wert der Schad stoffkonzentration zugehörige Wert der Temperatur, als Ein gangsgröße des Modells verwendet. Hieraus berechnet das Mo- dell dann den ersten Wert E 0 der Schadstoffemission. Bei spielsweise werden Temperatur, Windgeschwindigkeit und/oder Verkehrsstärke in das Modell als Eingangsgrößen gegeben, wo raus das Modell dann die erste Schadstoffemission E 0 berech net.

Im fünften Schritt des erfindungsgemäßen Verfahrens zum Er zeugen der Trainingsdaten wird ein zweiter Wert E 1 der Schad stoffemission mittels des Modells berechnet. Hierzu wird der für das Berechnen des ersten Wertes E 0 der Schadstoffemissio nen verwendete Messwert der Messgröße numerisch verändert.

Mit anderen Worten wird die zweite Schadstoffemission E 1 für einen veränderten Wert der Messgröße, beispielsweise für ei nen veränderten Wert der Temperatur, der Windgeschwindigkeit und/oder der Verkehrsstärke berechnet. Der veränderte Wert der Messgröße oder dementsprechend die veränderte Messreihe der Messgröße wird somit als Eingangsgröße in das Modell ge geben. Dadurch wird der zweite Wert der Schadstoffemission E 1 beziehungsweise eine zweite Schadstoffemission beziehungswei se eine zweite Zeitreihe der Schadstoffemission berechnet. In diesem Sinne korrespondiert der zweite Wert der Schadstof femission E 1 zu einer synthetischen Schadstoffemission, die beim entsprechenden veränderten Wert der Messgröße, bei spielsweise bei einer veränderten Temperatur, einer veränder ten Windgeschwindigkeit und/oder einer veränderten Verkehrs stärke vorliegen würde. Hierbei ist es vorteilhaft den Wert der Messgröße nur geringfügig zu verändern. Beispielsweise ist die relative Änderung des Wertes der Messgröße bevorzugt kleiner als 10 Prozent.

Im sechsten Schritt des erfindungsgemäßen Verfahrens wird ei ne neue, weitere oder synthetische Messreihe erzeugt, die dem Trainingsdatensatz zugrunde liegt. Mit anderen Worten umfasst der Trainingsdatensatz die neue Messreihe, wobei das neurona le Netzwerk mittels der neuen Messreihe trainierbar ist. Die neue Messreihe wird durch eine Veränderung DC des Wertes C 0 der bereitgestellten gemessenen Messreihe der Schadstoffkon zentrationen erzeugt, wobei die Veränderung DC mittels der relativen Änderung DE/E 0 = (ß 1 — E Q )/E Q der berechneten Werte der Schadstoffemissionen erfolgt. Da der neuen Messreihe der zweite (synthetisch) berechnete Wert E 1 der Schadstoffemissi on zugrunde liegt, und der zweite Wert E 1 eben nicht auf ei nen gemessenen Wert der Messgröße basiert, kann die neue be ziehungsweise weitere Messreihe der Schadstoffkonzentration ebenfalls als synthetische Messreihe bezeichnet werden. Mit anderen Worten ist die neu erzeugte Messreihe im Hinblick auf die bereitgestellte gemessene Messreihe nicht gemessen wor den, sondern mittels des beschriebenen Verfahrens synthetisch erzeugt.

Durch die vorliegende Erfindung kann somit eine Mehrzahl von synthetischen Messreihen der Schadstoffkonzentration erzeugt werden, mit welchem das neuronale Netz, wie bereits mit der ursprünglich gemessenen Messreihe der Schadstoffkonzentrati on, trainiert werden kann. Da die ursprüngliche bereitge stellte gemessene Messreihe der Schadstoffkonzentration zu einem selten Ereignis hoher Belastung korrespondiert - was durch den Schwellenwert des ersten Schrittes des vorliegenden Verfahrens sichergestellt ist, können somit mehrere Messrei hen von seltenen Ereignissen hoher Belastung synthetisch er zeugt werden. Wird das neuronale Netz mittels dieser neu er zeugten synthetischen Messreihen trainiert, so wird die Vor hersage des neuronalen Netzes bezüglich der genannten selte nen Ereignisse verbessert, ohne das eine Verschlechterung des durchschnittlichen Verhaltens zu erwarten ist.

Mit anderen Worten ermöglicht die vorliegende Erfindung es dem neuronalen Netz von einem umfangreicheren Trainingsdaten satz zu lernen. Dadurch wird die Vorhersage des neuronalen Netzes bezüglich der seltenen, aber relevantesten Ereignisse hoher Belastung verbessert.

Weiterhin ist die Integration des Vorhersagealgorithmus in bereits bestehende Modelle nicht komplexer als die Verwendung herkömmlicher Algorithmen für neuronale Netze. Das ist des halb der Fall, da diese zwar verbessert werden, aber in ihrer Struktur unverändert bleiben. Mit anderen Worten betrifft die vorliegende Erfindung zunächst das Trainieren des neuronalen Netzes beziehungsweise das Erzeugen eines zugehörigen Trai ningsdatensatzes beziehungsweise ein Erweitern eines bereits bestehenden Trainingsdatensatzes.

Im Vergleich zu einer Gewichtung von Messwerten kann eben falls eine wesentlich bessere Datenbasis erzeugt werden. Ver glichen mit einem vollständigen modellbasierten Ansatz sind Aufwand und Datenanforderung deutlich geringer. Weiterhin muss das Modell nicht online für eine Vorhersage betrieben werden, sondern muss lediglich für die spezifischen und rele vanten Ereignisse oder Szenarien zum Trainieren des neurona len Netzes laufen. Dadurch kann vorteilhafterweise Rechenzeit eingespart werden. Ein Onlinebetrieb kann jedoch vorgesehen sein.

Die vorliegende Erfindung ermöglicht somit eine genauere Vor hersage bei einem geringeren Aufwand und reduzierten Datenan forderungen .

Das erfindungsgemäße computergestützte Verfahren zum Trainie ren eines neuronalen Netzes, wobei das neuronale Netz zum Er mitteln einer Schadstoffkonzentration aus wenigstens einer Schadstoffemission ausgebildet ist, ist gekennzeichnet dadurch, dass zum Trainieren des neuronalen Netzes ein gemäß der vorliegenden Erfindung und/oder einer ihrer Ausgestaltun gen erzeugter Trainingsdatensatz verwendet wird.

Es ergeben sich zum erfindungsgemäßen Verfahren zum Erzeugen der Trainingsdaten gleichartige und gleichwertige Vorteile und Ausgestaltungen.

Das erfindungsgemäße computergestützte Verfahren zum Ermit teln einer Schadstoffkonzentration mittels eines neuronalen Netzes und mittels eines Modells, wobei das neuronale Netz zum Ermitteln einer Schadstoffkonzentration aus wenigstens einer Schadstoffemission ausgebildet und gemäß der vorliegen- den Erfindung und/oder einer ihrer Ausgestaltungen trainiert ist, wobei das Modell einen Zusammenhang zwischen einer phy sikalischen Messgröße, insbesondere einer Temperatur, einer Windgeschwindigkeit und/oder einer Verkehrsstärke, und der Schadstoffemission modelliert, ist gekennzeichnet durch fol gende Schritte:

- Berechnen eines Wertes der Schadstoffemission mittels des Modells, wobei hierzu wenigstens ein Messwert der Messgröße verwendet wird; und

- Ermitteln der Schadstoffkonzentration aus dem berechneten Wert der Schadstoffemission mittels des neuronalen Netzes.

Dadurch wird vorteilhafterweise eine Vorhersage für die Schadstoffkonzentration bereitgestellt. Die Vorhersage ent spricht der ermittelten Schadstoffkonzentration. Basierend auf der ermittelten Schadstoffkonzentration können technische Maßnahmen vorgesehen sein, die zu einer tatsächlichen Redu zierung der Schadstoffkonzentration führen. Die Vorhersage kann alternativ oder ergänzend bereits solche automatisierten Maßnahmen vorsehen und/oder diese vorschlagen. Beispielsweise könnte als eine solche Maßnahme der Verkehr durch eine ent sprechende Ampelschaltung umgeleitet werden und/oder Straßen vollständig gesperrt werden. Zudem könnten automatisiert und basierend auf der erfindungsgemäßen Vorhersage mehr Busse und/oder Straßenbahnen zur Verfügung gestellt werden.

Es ergeben sich zum erfindungsgemäßen Verfahren zum Erzeugen der Trainingsdaten beziehungsweise zum erfindungsgemäß trai nierten neuronalen Netz gleichartige und gleichwertige Vor teile und Ausgestaltungen.

Gemäß einer vorteilhaften Ausgestaltung der Erfindung erfolgt die Veränderung DC des wenigstens einen Wertes C 0 der bereit gestellten Messreihe der Schadstoffkonzentrationen zusätzlich mittels eines verkehrsbedingten Anteils a an der Schadstoff konzentration . Mit anderen Worten wird der verkehrsbedingte Anteil an der Schadstoffkonzentration berücksichtigt. Typischerweise setzt sich die Schadstoffkonzentration eines Schadstoffes, bei spielsweise von Stickoxid, aus mehreren Anteilen zusammen.

Die Anteile sind hauptsächlich der Verkehr, die Gebäude und die Industrie sowie die Energieerzeugung. Der Anteil des Ver kehrs, das heißt der verkehrsbedingte Anteil a, ist typi scherweise bekannt. Beispielsweise durch einen Vergleich mit einer weiteren nicht so stark durch den Verkehr belasteten Messstation. Dadurch kann vorteilhafterweise in effizienter Weise von den Schadstoffemissionen auf die Schadstoffkonzent rationen geschlossen werden, ohne dass eine explizite und aufwendige Berechnung oder Ermittlung erforderlich ist. Die ser approximative heuristische Ansatz ermöglicht somit eine effiziente Ermittlung der Schadstoffkonzentrationen aus den Schadstoffemissionen und somit zur Bereitstellung beziehungs weise Erzeugung des Trainingsdatensatzes.

In einer vorteilhaften Ausgestaltung der Erfindung erfolgt die Veränderung DC des wenigstens einen Wertes C 0 der bereit gestellten Messreihe der Schadstoffkonzentration mittels

DC/C Q = aDE/E 0 .

Mit anderen Worten wird bevorzugt eine lineare Abhängigkeit zwischen der relativen Änderung der Schadstoffemissionen und der relativen Änderung der Schadstoffkonzentrationen verwen det. Die relative Änderung der Schadstoffemissionen wird ge mäß der vorliegenden Erfindung durch das Modell ermittelt.

Das heißt, dass ausgehend von einem Messwert der Messgröße, beispielsweise der Temperatur, der Windgeschwindigkeit und/oder der Verkehrsstärke, diese Messgröße in ihrem Wert verändert wird, und eine zum veränderten Messwert zugehörige neue Schadstoffemission ermittelt und die relative Änderung zwischen der neuen Schadstoffemission (zweite Schadstoffemis sion) und der zum ursprünglichen Messwert der Messgröße zuge hörigen Schadstoffemission (erste Schadstoffemission) berech net wird. Die Schadstoffkonzentration, welche für das Trai nieren des neuronalen Netzes erforderlich ist, wird mittels des verkehrsbedingten Anteils a aus der derart ermittelten relativen Änderung der Schadstoffemission bestimmt. Dies wird insbesondere für jeden Wert beziehungsweise Zeitpunkt der ur sprünglichen Messreihe der Schadstoffkonzentrationen durchge führt. Mit anderen Worten wird jeder Wert C 0 der Messreihe der Schadstoffkonzentration um ein typischerweise verschiedenes D C verändert. Der Wert der derart neu gebildeten syntheti schen Messreihe der Schadstoffkonzentration wird demnach für jeden Zeitpunkt t durch C x (t) = C 0 (t) + AC(t) beziehungsweise für diskrete Zeitwerte t n durch ^(ί h )= C 0 (t n ) + AC(t n ) ermittelt. Es können ebenfalls nur Teilbereiche der Messreihe der Schad stoffkonzentration derart verändert werden, insbesondere le diglich ein Wert beziehungsweise Zeitpunkt der genannten Messreihe. Weitere mathematisch äquivalente Formulierungen und/oder Änderungen können vorgesehen sein.

Gemäß einer vorteilhaften Ausgestaltung der Erfindung wird ein verkehrsbedingter Anteil a im Bereich von 0,3 bis 0,5 verwendet.

Mit anderen Worten hat der Verkehr, welcher beispielsweise den Straßenverkehr umfasst, an der Schadstoffkonzentration, beispielsweise an einer Messstation an einer Straße, einen Anteil im Bereich von 0,3 bis 0,5. Besonders bevorzugt ist ein hoher lokaler verkehrsbedingter Anteil (Verkehrsanteil). Der verkehrsbedingte Anteil a ist grundsätzlich von den Um ständen des Einzelfalls, beispielsweise der Stadt, der Stra ße, des Standortes der Messstation usw., abhängig. Dennoch hat sich gezeigt, dass hohe lokale verkehrsbedingte Anteile, bestenfalls in Kombination mit einem möglichst homogen urba- nen Hintergrund, zur Ermittlung der relativen Änderung der Schadstoffkonzentration aus der relativen Änderung der Schad stoffemission besonders gut geeignet ist.

In einer vorteilhaften Weiterbildung der Erfindung wird eine Stickoxidkonzentration als Schadstoffkonzentration und eine Stickoxidemission als Schadstoffemission verwendet wird. Mit anderen Worten ist der betrachtete Schadstoff Stickstoff monoxid und/oder Stickstoffdioxid (zusammenfassend NO x) . Wei tere Stickoxidverbindungen können alternativ oder ergänzend vorgesehen sein. Ebenfalls können weitere Schadstoffe alter nativ oder ergänzend vorgesehen sein. So kann die vorliegende Erfindung für eine Mehrzahl von Schadstoffen oder Schadstoff klassen verwendet werden. Insbesondere ebenfalls für Parti kelklassen von Schadstoffen, beispielsweise PMiound/oder PM 2 .5.

Gemäß einer vorteilhaften Ausgestaltung der Erfindung wird als physikalische Messgröße eine Temperatur, eine Windge schwindigkeit und/oder eine Verkehrsstärke verwendet.

Die Temperatur, die Windgeschwindigkeit und/oder die Ver kehrsstärke sind relevante Größen, insbesondere die Tempera tur und die Verkehrsstärke, die die zeitliche und räumliche Verteilung und Ausbreitung der Schadstoffemission und somit die Bildung der Schadstoffkonzentration, beispielsweise am Ort der Messstation, maßgeblich beeinflussen und/oder bestim men. Mit anderen Worten hängt die Schadstoffkonzentration, die beispielsweise zu einem Zeitpunkt beziehungsweise inner halb eines Zeitbereiches, durch eine Messstation gemessen wird, von der Temperatur, der Windgeschwindigkeit und/oder der Verkehrsstärke ab. Grundsätzlich ist die Windgeschwindig keit ein Vektorfeld, welches typischerweise eine bezüglich der Erdoberfläche horizontale und vertikale Komponente auf weist. Vorliegend können ebenfalls Teilgrößen der Windge schwindigkeit, beispielsweise eine Windrichtung (horizontale Komponente), der Betrag der Windgeschwindigkeit und/oder eine Windstärke (Kategorisierung in Geschwindigkeitsintervalle), als Messgröße verwendet werden. Weitere physikalische Mess größen können alternativ oder ergänzend vorgesehen sein.

In einer vorteilhaften Ausgestaltung der Erfindung wurden die Messreihe der Schadstoffkonzentration und die Messreihe der Messgröße mittels einer Messstation innerhalb einer Stadt er fasst. Das ist deshalb bevorzugt, da hohe Schadstoffkonzentrationen innerhalb von Städten auftreten und dort eine Vielzahl von Menschen direkt betroffen sind. Dort sind somit Maßnahmen zur Vermeidung solcher hohen Schadstoffkonzentrationen besonders erforderlich. Die vorliegende Erfindung und/oder eine ihrer Ausgestaltungen kann hierzu, durch eine verbesserte Vorhersa ge, die durch ein verbessert trainiertes neuronales Netz er möglicht wird, einen entscheidenden Beitrag leisten.

Bevorzugt werden für das Verfahren gemäß der vorliegenden Er findung und/oder einer ihrer Ausgestaltungen die genannten Messreihen erfasst.

Gemäß einer bevorzugten Ausgestaltung der Erfindung wird als Modell ein domainbasiertes Modell verwendet.

Insbesondere umfasst das Modell die verkehrsspezifischen Schadstoffemissionen. Mit anderen Worten sind mittels des Mo dells die Schadstoffemissionen des Verkehrs, beispielsweise in einem Bereich einer Stadt und/oder an einer Straße, bere chenbar. Das Modell modelliert somit die verkehrsspezifischen Schadstoffemissionen .

Weitere Vorteile, Merkmale und Einzelheiten der Erfindung er geben sich aus den im Folgenden beschriebenen Ausführungsbei spielen sowie anhand der Zeichnung. Dabei zeigt die einzige Figur ein schematisiertes Ablaufdiagramm einer Ausgestaltung der Erfindung.

Gleichartige, gleichwertige oder gleichwirkende Elemente kön nen in der Figur mit denselben Bezugszeichen versehen sein.

Die Figur zeigt ein Ablaufdiagramm beziehungsweise Flussdia gramm gemäß einer Ausgestaltung der vorliegenden Erfindung.

Zunächst wird in einem ersten Schritt S1 eine Messreihe für eine Schadstoffkonzentration C 0 (t) , eine Temperatur T 0 (t), eine Windrichtung V 0 (t) und/oder eine Verkehrsstärke p 0 (t) bereitge stellt. Die Schadstoffkonzentration ist beispielsweise eine Stickoxidkonzentration. Die Schadstoffkonzentration und die Messgrößen, das heißt vorliegend die Temperatur, die Wind richtung und/oder die Verkehrsstärke wurden gemeinschaftlich erfasst. In diesem Sinne sind die Werte der Messgrößen den Werten der Schadstoffkonzentration zugeordnet. Dadurch werden für jeden Zeitpunkt, beispielsweise jede Stunde eines Tages, beispielsweise vier Werte bereitgestellt, nämlich die Schad stoffkonzentration für diesen Zeitpunkt, die Temperatur für diesen Zeitpunkt, die Windgeschwindigkeit für diesen Zeit punkt und die Verkehrsstärke für diesen Zeitpunkt. Hierbei können durchschnittliche, gemittelte und/oder gewichtete Wer te für den jeweiligen Zeitpunkt, beispielsweise über einen Zeitbereich von einer Stunde, verwendet werden.

Mit anderen Worten werden vier Zeitreihen C 0 (t), G 0 (ί), V 0 (t), p 0 (t) bereitgestellt, wobei für jeden Zeitpunkt der Zeitrei hen, ein Messwert der Schadstoffkonzentration, ein Messwert der Temperatur, ein Messwert der Windgeschwindigkeit und ein Messwert der Verkehrsstärke vorliegt. Die Messwerte müssen nicht zu diesem Zeitpunkt erfasst worden sein, sondern können repräsentativ für diesen Zeitpunkt ausgewählt oder ermittelt worden sein, beispielsweise durch eine Mittelung. Beispiels weise umfassen die Zeitreihe 24 Werte, die zu den Stunden ei nes Tages korrespondieren.

In einem zweiten Schritt S2 wird mittels der gemessenen Zeit reihen r 0 (t) , V 0 (t) , p 0 (t) der Messgrößen durch ein Domain- Modell eine erste Schadstoffemission E 0 , für wenigstens einen der Zeitpunkte t, bevorzugt für alle Zeitpunkte t, berechnet. Die erste Schadstoffemission E 0 basiert somit auf tatsächli chen Messwerten beziehungsweise Messdaten. Typischerweise sind hierbei Temperatur und Verkehrsstärke relevant. Die Windgeschwindigkeit ist für die Emissionen weniger relevant.

In einem dritten Schritt S3, der parallel zu S2 durchgeführt werden kann, wird wenigstens ein Wert wenigstens einer Mess- große verändert. Beispielsweise wird die zum Zeitpunkt t vor liegende Temperatur um 3 Prozent erhöht, und dadurch eine neue synthetische Messreihe erzeugt. Die derart neu erzeugte Zeitreihe beziehungsweise Messreihe weist wenigstens einen Wert auf, der auf dieser Änderung basiert und demnach nicht gemessen wurde. In diesem Sinne ist die durch die Veränderung erzeugte Messreihe synthetisch. Anschließend wird aus den un veränderten Zeitreihen für die Windgeschwindigkeit und die Verkehrsstärke und aus der veränderten Messreihe für die Tem peratur eine zweite Schadstoffemission E lr für den Zeitpunkt an welchem der Messwert der Temperatur verändert wurde, be rechnet. Die zweite Schadstoffemission E 1 basiert somit auf tatsächlichen Messwerten beziehungsweise Messdaten und der durch die Veränderung synthetisch erzeugten Messreihe.

Nach den Schritten S2 und S3 liegen somit für wenigstens ei nen Zeitpunkt zwei berechnete Schadstoffemissionen E 0 , E 1 vor.

In einem vierten Schritt S4 wird mittels der relativen Abwei chung DE/E 0 = (E 1 — E Q )/E Q der berechneten Schadstoffemissionen die relative Änderung der Schadstoffkonzentration mittels C/C 0 = aE/E 0 berechnet. Hierbei ist mit a der verkehrsbe dingte Anteil an der Schadstoffkonzentration bezeichnet. Bei spielsweise weist a den Wert 0,4 auf.

Aus der relativen Änderung der Schadstoffkonzentration (an dem betrachteten Zeitpunkt) wird mittels der Messreihe der Schadstoffkonzentration eine neue synthetische Messreihe für die Schadstoffkonzentrationen dadurch erzeugt, dass der Mess wert C 0 , der zum betrachteten Zeitpunkt vorliegt, um D C ver ändert wird. Dadurch wird die neue Zeitreihe (synthetische Messreihe) erzeugt, die für das Trainieren des neuronalen Netzes zusätzlich zur ursprünglich bereitgestellten gemesse nen Messreihe der Schadstoffkonzentrationen verwendet werden kann. Grundsätzlich kann das obenstehend beschriebene Vorge hen für alle Zeitpunkte oder Teile der Zeitpunkte durchge führt werden. Im Folgenden wird ein vereinfachtes Ausführungsbeispiel er läutert.

Für einen bestimmten Zeitpunkt und einem bestimmten Ort, bei spielsweise dem Ort der Messstation, liegt ein hoher Messwert der Stickoxidkonzentration, das heißt ein Messwert oberhalb des Schwellenwertes oder Grenzwertes, vor. Hierzu werden für diesen Zeitpunkt eine bestimmte Temperatur, Windrichtung und Verkehrsstärke gemessen.

Mittels des für die Schadstoffemissionen des Verkehrs spezi fischen Domain-Modells wird für die gemessene Temperatur, Windrichtung und Verkehrsdichte (Eingabegrößen oder Eingabe parameter des Domain-Modells) die erste Schadstoffemission für diesen Zeitpunkt, beispielsweise 30 pg/m/s an Stickoxide, berechnet.

Anschließend wird eine weitere Berechnung mit einer leicht veränderten Temperatur, beispielsweise um 5 Prozent oder 5 Grad Celsius gegenüber der ursprünglich gemessenen Temperatur erhöht, mittels des Domain-Modells durchgeführt. Die Windge schwindigkeit und die Verkehrsstärke bleiben hierbei unverän dert. Hieraus ergibt sich die zweite Schadstoffemission, bei spielsweise 33 pg/m/s an Stickoxide. Dadurch ergibt sich eine relative Änderung der Schadstoffemission um 10 Prozent. Diese relative Änderung der Schadstoffemission wird nun auf eine relative Änderung der Schadstoffkonzentration umgelegt bezie hungsweise umgerechnet.

Die Schadstoffkonzentration umfasst typischerweise mehrere Anteile, beispielsweise einen Anteil des Verkehrs (verkehrs bedingter Anteil), einen Anteil der Gebäude und einen Anteil aus der Energieerzeugung. Beispielsweise ist der verkehrsbe dingte Anteil a gleich 44 Prozent, der gebäudebedingte An teil oder regionalbedingte Anteil 18 Prozent und der energie erzeugungsbedingte Anteil 38 Prozent. Insbesondere der ver kehrsbedingte Anteil sinkt bezüglich Stickoxiden seit Jahren und wird sich voraussichtlich in den kommenden Jahren weiter reduzieren .

Aus dem verkehrsbedingten Anteil, welchen das Domain-Modell bezüglich der Schadstoffemissionen umfasst, kann dann durch DC/C Q = aDE/E 0 auf die relative Änderung der Schadstoffkon zentration geschlossen werden. Bei einer relativen Änderung der Schadstoffemission um 10 Prozent ergibt sich somit eine relative Änderung der Schadstoffkonzentration um 4,4 Prozent. Das heißt, dass sich die ursprünglich gemessene Schadstoff konzentration zum vorliegend betrachteten Zeitpunkt um 4,4 Prozent ändern würde. Mit anderen Worten übersetzt sich eine 10 prozentige Änderung der Temperatur oder eine Änderung der Temperatur um 5 Grad Celsius in eine 4,4 prozentige Änderung der Schadstoffkonzentration.

Wird das obenstehend erläuterte Verfahren für jeden Zeitpunkt oder für weitere ausgewählte Zeitpunkte der gemessenen Zeit reihe für die Schadstoffkonzentrationen durchgeführt, so kann eine neue synthetische Zeitreihe beziehungsweise Messreihe für die Schadstoffkonzentration erzeugt werden. Das neuronale Netz kann dann mit dieser neu erzeugten Zeitreihe trainiert werden.

Das beschriebene Verfahren ist computergestützt und kann mit einem Rechner, einem zentralen oder dezentralen Server, in der Cloud oder mittels eines Quantencomputers durchgeführt werden. Weiterhin basiert das computergestützte Verfahren auf Messwerten von physikalischen Messgrößen, die als Eingangs größen beziehungsweise Eingangsparameter einbezogen sind.

Obwohl die Erfindung im Detail durch die bevorzugten Ausfüh rungsbeispiele näher illustriert und beschrieben wurde, so ist die Erfindung nicht durch die offenbarten Beispiele ein geschränkt oder andere Variationen können vom Fachmann hie raus abgeleitet werden, ohne den Schutzumfang der Erfindung zu verlassen. Bezugszeichenliste

51 erster Schritt

52 zweiter Schritt S3 dritter Schritt S4 vierter Schritt