Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
ARRANGEMENT FOR MODELLING A NON-LINEAR PROCESS
Document Type and Number:
WIPO Patent Application WO/1995/002855
Kind Code:
A1
Abstract:
An arrangement is disclosed for modelling a non-linear process with at least one input quantity (x1, x2) and at least one output quantity (y). The arrangement has a neuronal network whose function in a first part of the value range of input quantities (x1, x2) is determined by teaching measurement data obtained by the recording of measurement values of the process. In a second part of the value range of input quantities (x1, x2), in which no measurement data are available for teaching the neuronal network, an experience-based device for assigning function values, preferably a fuzzy logic system, is provided. The invention is applied in regulation devices.

Inventors:
LINZENKIRCHNER EDMUND (DE)
Application Number:
PCT/DE1994/000776
Publication Date:
January 26, 1995
Filing Date:
July 06, 1994
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS AG (DE)
LINZENKIRCHNER EDMUND (DE)
International Classes:
G05B17/02; G05B13/02; (IPC1-7): G05B13/02
Other References:
M.A. KRAMER, M.L. THOMPSON AND P.M. BHAGAT: "EMBEDDING THEORETICAL MODELS IN NEURAL NETWORKS", PROCEEDINGS OF THE 1992 AMERICAN CONTROL CONFERENCE, vol. 1, June 1992 (1992-06-01), CHICAGO US, pages 475 - 479
B. FREISLEBEN AND T. KUNKELMANN: "COMBINING FUZZY LOGIC AND NEURAL NETWORKS TO CONTROL AN AUTONOMOUS VEHICLE", SECOND IEEE INTERNATIONAL CONFERENCE ON FUZZY SYSTEMS, vol. 1, April 1993 (1993-04-01), SAN FRANCISCO US, pages 321 - 326
D.C. PSICHOGIOS AND L.H. UNGAR: "PROCESS MODELING USING STRUCTURED NEURAL NETWORKS", PROCEEDIGS OF THE 1992 AMERICAN CONTROL CONFERENCE, vol. 3, June 1992 (1992-06-01), CHICAGO US, pages 1917 - 1921
H. GOMI AND M. KAWATO: "RECOGNITION OF MANIPULATED OBJECTS BY MOTOR LEARNING WITH MODULAR ARCHITECTURE NETWORKS", NEURAL NETWORKS, vol. 6, no. 4, 1993, ELMSFORD US, pages 485 - 497
Download PDF:
Claims:
Patentansprüche
1. Anordnung zur Modellierung eines nichtlinearen Prozes¬ ses mit mindestens einer Eingangsgröße (xl, x2) und minde¬ stens einer Ausgangsgröße (y), mit einem neuronalen Netz (1), dessen Funktion in einem ersten Teil des Wertebereichs der Eingangsgrößen (xl, x2) durch Trainieren von Meßdaten bestimmt wird, die durch Meßwerterfassung von dem Prozeß gewonnen wurden, und mit einer Einrichtung zur Vorgabe von Funktionswerten in einem zweiten Teil des Wertebereichs der Eingangs¬ größen (xl, x2), in dem keine Meßdaten zum Trainieren des neuronalen Netzes (1) vorliegen.
2. Anordnung nach Anspruch 1, d a d u r c h g e ¬ k e n n z e i c h n e t , daß die Einrichtung zur Vorgabe von Funktionswerten in dem zweiten Teil eine Einrichtung zur Überwachung der Eingangsgrößen (xl, x2) auf Verlassen des ersten Teils enthält sowie ein steuer¬ bares Tor (9), welches von der Überwachungseinrichtung gesteuert wird und bei Eingangsgrößen im zweiten Teil des Wertebereichs auf Vorgabe von Funktionswerten umschaltet.
3. Anordnung nach Anspruch 1 oder 2, d a d u r c h g e k e n n z e i c h n e t , daß die Einrichtung zur Vorgabe von Funktionswerten in dem zweiten Teil ein FuzzySystem ist, in welchem die Zugehörigkeit der Werte der Eingangsgrößen (xl, x2) zum ersten Teil durch Zuge¬ hörigkeitsfunktionen (14, 15) gekennzeichnet wird und das bei Eingangsgrößen im zweiten Teil die Werte der Ausgangsgrößen (y) nach Art der FuzzyLogik vorgibt.
4. Anordnung nach Anspruch 3, d a d u r c h g e ¬ k e n n z e i c h n e t , daß die Zugehörigkeitsfunk¬ tionen (14, 15) durch die Auftrittshäufigkeit der Werte der Eingangsgrößen (xl, x2) bei der Meßwerterfassung bestimmt sind.
5. Anordnung nach Anspruch 3 oder 4, d a d u r c h g e k e n n z e i c h n e t , daß im zweiten Teil des Wertebereichs der Eingangsgrößen (xl, x2) und im Wertebereich der Ausgangsgrößen (y) weitere Zugehörigkeitsfunktionen (16 ... 23) für lin¬ guistische Werte definiert sind und daß im Regelwerk das Verhalten des Prozesses erfahrungs basiert durch WENN/DANNRegeln anhand der linguistischen Werte nachgebildet ist.
6. Anordnung nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t , daß die Einrichtung zur Vorgabe von Funktionswerten in dem zweiten Teil ein FuzzySystem ist, daß im zweiten Teil des Wertebereichs der Eingangsgrößen und im Wertebereich der Ausgangsgrößen das Verhalten des Prozesses erfahrungsbasiert nachgebildet ist und daß die Funktion des neuronalen Netzes im zweiten Teil des Wertebereichs der Eingangsgrößen durch Trainieren der Vorgabewerte, die durch das FuzzySystem gewonnen wurden, bestimmt wird.
Description:
Beschreibung

Anordnung zur Modellierung eines nichtlinearen Prozesses

Die Erfindung betrifft eine Anordnung zur Modellierung eines nichtlinearen Prozesses mit mindestens einer Ein¬ gangsgröße und mindestens einer Ausgangsgröße, mit einem neuronalen Netz.

Wie z. B. aus dem Buch von Eberhard Schöneburg,

Nikolaus Hansen und Andreas Gawelczyk "Neuronale Netz¬ werke", erschienen 1990 im Markt & Technik Verlag, bekannt ist, können mit neuronalen Netzen komplexe nichtlineare Funktionen mit vielen Ein- und Ausgangsgrößen durch Trainieren auf der Basis von Lerndaten nachgebildet werden. Diese Fähigkeit kann genutzt werden, um aus Me߬ daten, die von einem Prozeß gewonnen wurden, das stati¬ sche, nichtlineare Verhalten des Prozesses zu modellieren. Man erhält auf diese Weise ein Prozeßmodell, das durch die nichtlineare Ausgabefunktion des neuronalen Netzes reali¬ siert ist und zur Verbesserung der Prozeßführung in einem Regelkreis eingesetzt werden kann. Bei der Meßdaten¬ erfassung am realen Prozeß tritt allerdings das Problem auf, daß meistens nicht alle möglichen Prozeßzustände durchfahren werden können. Die Ausgabedaten und damit auch die vom neuronalen Netz gelernte Funktion haben deshalb auch nur in den Betriebszuständen Gültigkeit, für die ausreichend viele Meßdaten vorliegen. Treten nun im laufenden Betrieb neue Prozeßzustände auf, dann können unvorhersehbare Eingriffe in den Prozeß zu kritischen oder sogar unzulässigen Zuständen führen, wenn das neuronale Netz zur Prozeßregelung/-steuerung eingesetzt wird.

Der Erfindung liegt die Aufgabe zugrunde, eine Anordnung zu schaffen, welche die genannten Nachteile bei der Model¬ lierung eines nichtlinearen Prozesses durch ein neuronales Netz vermeidet.

Zur Lösung dieser Aufgabe weist die neue Anordnung die in Anspruch 1 genannten Merkmale auf. Vorteilhafte Weiter¬ bildungen der Erfindung sind in den Unteransprüchen ange¬ geben.

Die Eingangssignale des neuronalen Netzes werden auf Ver¬ lassen des durch die Meßdaten abgedeckten ersten Teils des Wertebereichs der Eingangsgrößen überwacht. Das Ansprechen dieser Überwachung kann dann dazu verwendet werden, auf eine andere Einrichtung zur Vorgabe von unkritischen

Funktionswerten der Ausgangsgrößen umzuschalten. In einer alternativen Realisierungsmöglichkeit trainiert das neuro¬ nale Netz sowohl die in dem ersten Teil vorliegenden Me߬ daten als auch die im zweiten Teil vorgegebenen Werte der Ausgangsgrößen, um dann im gesamten Wertebereich der Ein¬ gangsgrößen unkritische Werte für die Ausgangsgrößen aus¬ geben zu können.

Die Erfindung hat den Vorteil, daß Meßdaten lediglich in einem mit vertretbarem Aufwand realisierbaren Bereich von Prozeßzuständen erfaßt werden müssen und in dem übrigen Bereich unkritische Werte für Ausgangsgrößen erzeugbar sind, wobei auch Erfahrungswissen über die weiteren Prozeßzustände eingebracht werden kann. Die Funktion der Anordnung ist daher nicht auf die am realen Prozeß gemes¬ senen Zustände begrenzt.

Anhand der Figuren, in denen ein Ausführungsbeispiel der Erfindung dargestellt ist, werden im folgenden die Erfin- düng sowie Ausgestaltungen und Vorteile näher erläutert.

Es zeigen:

Figur 1 eine Anordnung mit einem neuronalen Netz und einem Fuzzy-System, Figur 2 ein Diagramm der Auftrittshäufigkeiten von Werten der Eingangsgrößen xl und x2 eines realen Prozes¬ ses,

Figuren 3 und 4 daraus abgeleitete Zugehörigkeitsfunk¬ tionen für die Eingangsgrößen xl und x2 und Figuren 5 und 6 die Diagramme nach den Figuren 3 und 4, ergänzt um weitere Zugehörigkeitsfunktionen.

In Figur 1 sind ein Fuzzy-System und ein trainiertes neuronales Netz 1 miteinander kombiniert. Das Fuzzy- System enthält zwei Fuzzifizierungsbausteine 2 und 3 für Eingangsgrößen xl bzw. x2 sowie Bausteine 4 und 5 eines Regelwerks, denen Defuzzifizierungsbausteine 6 und 7 nach¬ geschaltet sind. In das Fuzzy-System sind neben den Regeln für die eigentliche Nachbildung des Prozesses in dem Teil des Wertebereichs der Eingangsgrößen xl und x2, in dem keine Meßdaten vorliegen, auch solche Regeln integriert, die das neuronale Netz 1 ausschalten oder sein Ausgangs¬ signal 8 abschwächen. Dazu ist ein steuerbares Tor 9 vorgesehen, das mit einem Ausgangssignal 10 des Defuzzi- fizierungsbausteins 7 angesteuert wird. Das Tor 9 schließt sich also gerade dann, wenn der aktuelle Prozeßzustand den Bereich verläßt, für den das neuronale Netz 1 trainiert wurde. Ein Ausgangssignal y wird in der Anordnung nach Figur 1 durch Überlagerung eines Ausgangssignals 11 des steuerbaren Tores 9 und eines Äusgangssignals 12 des Defuzzifizierungsbausteins 6 in einem Summationsglied 13 gebildet.

Anhand der Figuren 2 bis 6 soll im folgenden ein Verfahren zum Entwurf einer Anordnung nach Figur 1 beschrieben wer¬ den. Die Meßdaten, die zum späteren Trainieren des neuro- nalen Netzes verwendet werden sollen, werden durch Me߬ werterfassung von dem realen Prozeß gewonnen und als ge¬ ordnete Datensätze mit jeweils sämtlichen zeitgleich ab¬ getasteten Werten der Ein- und Ausgangsgrößen abgelegt. Insbesondere wenn keine detaillierten Kenntnisse über die interne Struktur des Prozesses vorliegen, werden bei der Meßwerterfassung möglichst viele Prozeßgrößen berück¬ sichtigt. Dabei können auch solche Eingangssignale mit-

erfaßt werden, die zur Bildung der gewünschten Ausgangs¬ signale nicht relevant oder redundant sind. Um solche Ein¬ gangssignale vor der weiteren Auswertung auszuschließen, können Datenanalyseverfahren, z. B. eine Korrelations- rechnung oder ein Trainieren und Vergleichen von Netzen jeweils unter Weglassen von Eingängen, auf die Datensätze angewendet werden. Durch Korrelationen von Eingangs¬ signalen untereinander bzw. von Ein- und Ausgangssignalen kann festgestellt werden, welche Eingangssignale gleiche Nutzinformationen enthalten und welche eine Wirkung auf Ausgangssignale haben. Erkennt man z. B. , daß ein Ein¬ gangssignal keine Wirkung auf die Ausgangssignale hat, dann muß es im weiteren nicht mehr berücksichtigt werden. Eine weitere Möglichkeit zur Reduktion von Eingangs- Signalen ist das mehrfache Training von neuronalen Netzen, wobei jeweils eines der Eingangssignale weggelassen wird.

In Figur 2 ist ein anhand der Datensätze ermitteltes Höhenliniendiagramm für die Auftrittshäufigkeit von Werte- paaren der Eingangsgrößen xl und x2 dargestellt. In Be¬ reichen hoher Auftrittshäufigkeiten kann beim Trainieren des neuronalen Netzes mit einer guten Nachbildung des Prozesses gerechnet werden. Sie bilden einen ersten Teil des Wertebereichs der Eingangsgrößen xl und x2, in dem eine ausreichende Anzahl von Meßdaten vorliegt. In einem zweiten Teil dagegen, der sich außerhalb der gezeigten Höhenlinien befindet, sind keine Meßdaten vorhanden. Für jede einzelne Eingangsgröße ergeben sich aus den Meßdaten Häufigkeitsverteilungen, deren Verlauf prinzipiell den in den Figuren 3 und 4 dargestellten Zugehörigkeitsfunktionen 14 und 15 für die Eingangsgrößen xl bzw. x2 entspricht. An den Abszissen sind die Wertebereiche der Eingangsgrößen xl bzw. x2, an den Ordinaten der Wahrheitswert w aufge¬ tragen. Beide Zugehörigkeitsfunktionen 14 und 15 be- schreiben in Verbindung miteinander die in den Meßdaten enthaltenen Prozeßzustände, die durch das neuronale Netz 1 erfaßt werden. In gleicher Weise werden Zugehörigkeits-

funktionen für das Ausgangssignal y (Figur 1) des Pro¬ zesses festgelegt.

In einem weiteren Schritt können zu den Zugehörigkeits- funktionen 14 und 15 weitere Zugehörigkeitsfunktionen 16 ... 19 sowie 20 ... 23 für die Eingangsgröße xl bzw. die Eingangsgröße x2 gemäß den Figuren 5 und 6 definiert werden. Diese Definition erfolgt erfahrungsbasiert, d. h., die Wertebereiche der einzelnen Größen werden entsprechend den Vorgaben eines erfahrenen Prozeßbedieners in sinnvolle Teilbereiche unterteilt. Dabei erfolgt die Definition der Zugehörigkeitsfunktionen derart, daß jeder mögliche Prozeßzustand durch mindestens eine Zugehörigkeitsfunktion abgedeckt wird. Die Zugehörigkeitsfunktionen 18 und 19 bzw. 21 und 22, die an die durch die Meßdaten entstandenen Zugehörigkeitsfunktionen 14 bzw. 15 angrenzen, sollten sich vorteilhaft mit diesen überlappen, damit ein fließen¬ der Übergang gewährleistet ist. Als Sonderfall, der in diesem Ausführungsbeispiel nicht dargestellt ist, können auch durch rechteckige Zugehörigkeitsfunktionen scharf gegeneinander abgegrenzte Teilbereiche definiert werden.

Die Definition von Zugehörigkeitsfunktionen erfolgt in gleicher Weise für die Ausgangsgröße y des Prozesses.

Ausgehend von den nun für alle Prozeßzustände vorhandenen Zugehörigkeitsfunktionen wird das Verhalten des Prozesses in Form von Fuzzy-Regeln für all die Prozeßzustände in den Baustein 4 des Regelwerks (Figur 1) eingebracht, die nicht durch entsprechende Meßdaten erfaßt sind. Als Ergeb¬ nis liegt ein Fuzzy-System vor, das für alle nicht vom neuronalen Netz abgedeckten Prozeßzustände ein erfahrungs- basiertes Prozeßmodell realisiert.

Alternativ zu der in Figur 1 dargestellten Anordnung besteht auch die Möglichkeit, mit einem nach dem oben beschriebenen Verfahren erzeugten Fuzzy-System Hilfsdaten

zu generieren, mit denen der ursprüngliche Meßdatensatz so ergänzt wird, daß alle Prozeßzustände abgedeckt sind, Mit diesem ergänzten Datensatz kann dann ein neuronales Netz trainiert werden, das auch den mittels des Fuzzy- Syste s erweiterten Prozeßzustandsbereich modelliert.