Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
ESTIMATION METHOD FOR A VARIABLE OF A PROCESS OF PROCESS MANUFACTURING USING A REFERENCE VECTOR METHOD
Document Type and Number:
WIPO Patent Application WO/2002/073323
Kind Code:
A2
Abstract:
The invention relates to a method according to which a process variable of a process (1) of process manufacturing is estimated during the progression of the process (1) by means of a reference vector model (2). For preliminarily training said model, a number (N) of pairs of values is defined that comprise one vector of detectable signals (x¿1??i¿, , x¿n??i¿) of the process (1) and one measuring variable (y?i¿) each for the process variable to be estimated that corresponds to said measured value. At least one further pair of values that is detected by means of the process (1) is defined for online post-training.

Inventors:
REINSCHKE JOHANNES (DE)
MIELE MARCO (DE)
Application Number:
PCT/DE2002/000899
Publication Date:
September 19, 2002
Filing Date:
March 13, 2002
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS AG (DE)
REINSCHKE JOHANNES (DE)
MIELE MARCO (DE)
International Classes:
G05B17/02; G05B23/02; B21B37/00; (IPC1-7): G05B17/02; G05B23/02
Foreign References:
DE19727821A11999-01-21
US5950146A1999-09-07
US5991525A1999-11-23
Attorney, Agent or Firm:
SIEMENS AKTIENGESELLSCHAFT (München, DE)
Download PDF:
Claims:
Patentansprüche
1. Schätzverfahren für eine Prozessgröße eines Prozesses (1) der Grundstoffindustrie, wobei eine Anzahl (N) von Wertepaaren vorgegeben wird, wobei jedes Wertepaar einen Vektor von erfassbaren Signalen (x1i,..., xni) des Prozesses (1) und einen mit diesem Vek tor korrespondierenden Messwert (yi) für die zu schätzende Prozessgröße aufweist, wobei anhand der Anzahl (N) von Wertepaaren ein empirisches Modell (2) für die Abhängigkeit der Prozessgröße von den erfassbaren Signalen (xi,..., xn) erstellt wird, wobei aufgrund des Modells (2) während des Ablaufs des Pro zesses (1) anhand mindestens eines weiteren Vektors von er fassbaren Signalen (xi,..., xn) ein Schätzwert (y*) für die Prozessgröße ermittelt wird, wobei dem Modell (2) mindestens ein weiteres Wertepaar vor gegeben wird, dessen Vektor während des Prozesses (1) er mittelt worden ist und dessen Messwert (y) nach dem Ermit teln des Vektors ermittelt worden ist, wobei das erstellte Modell (2) anhand des mindestens einen weiteren Wertepaares auf einem Prozessautomatisierungsrech ner angepasst wird, wobei das Modell (2) ein Stützvektormodell (2) ist.
2. Schätzverfahren nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t, dass die Prozessgröße nur diskre te Werte annehmen kann.
3. Schätzverfahren nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t, dass die Prozessgröße kontinuier liche Werte annehmen kann.
4. Schätzverfahren nach Anspruch 3, d a d u r c h g e k e n n z e i c h n e t, dass das Model (2) analytisch partiell nach den erfassbaren Signalen (x1,..., xn) ableit bar ist.
5. Schätzverfahren nach Anspruch 3 oder 4, d a d u r c h g e k e n n z e i c h n e t, dass das Stützvektormodell (2) als symmetrische Kernfunktionen (k) Gaußsche radiale Ba sisfunktionen enthält.
6. Schätzverfahren nach einem der obigen Ansprüche, d a d u r c h g e k e n n z e i c h n e t, dass das Erstel len und Anpassen des Modells (2) gemäß einer Stückelungsme thode (chunking method) erfolgt.
7. Schätzverfahren nach Anspruch 6, d a d u r c h g e k e n n z e i c h n e t, dass die Stückelungsmethode als Sequentielle Minimale Optimierung (Sequential Minimal Optimi sation) ausgebildet ist.
8. Schätzverfahren nach einem der obigen Ansprüche, d a d u r c h g e k e n n z e i c h n e t, dass das mindes tens eine weitere Wertepaar zwischengespeichert wird und dass das Anpassen des Modells (2) anhand des mindestens einen wei teren Wertepaares zu einem späteren Zeitpunkt erfolgt.
9. Schätzverfahren für mehrere Prozessgrößen eines Prozesses der Grundstoffindustrie, d a d u r c h g e k e n n z e i c h n e t, dass für jede der Prozessgrößen ein Schätzverfahren nach einem der obigen Ansprüche angewendet wird.
10. Schätzverfahren nach einem der obigen Ansprüche, d a d u r c h g e k e n n z e i c h n e t, dass der Prozess (1) ein Kohleund Erzaufbereitungsprozess, ein Verhüttungs prozess (la), ein Stahlerzeugungsprozess (1b), ein Gießpro zess (lc), ein Walzprozess (ld), oder ein Zellstoffund Pa piererzeugungsoderverarbeitungsprozess ist.
Description:
Beschreibung Schätzverfahren für eine Größe eines Prozesses der Grund- stoffindustrie unter Verwendung einer Stützvektormethode Die vorliegende Erfindung betrifft ein Schätzverfahren für eine Prozessgröße eines Prozesses der Grundstoffindustrie, - wobei eine Anzahl von Wertepaaren vorgegeben wird, - wobei jedes Wertepaar einen Vektor von erfassbaren Signalen des Prozesses und einen mit diesem Vektor korrespondieren- den Messwert für die zu schätzende Prozessgröße aufweist, - wobei anhand der Anzahl von Wertepaaren ein empirisches Mo- dell für die Abhängigkeit der Prozessgröße von den erfass- baren Signalen erstellt wird, -wobei aufgrund des Modells während des Ablaufs des Prozes- ses anhand mindestens eines weiteren Vektors von erfassba- ren Signalen ein Schätzwert für die Prozessgröße ermittelt wird, -wobei dem Modell mindestens ein weiteres Wertepaar vorgege- ben wird, dessen Vektor während des Prozesses ermittelt worden ist und dessen Messwert nach dem Ermitteln des Vek- tors ermittelt worden ist, - wobei das erstellte Modell anhand des mindestens einen wei- teren Wertepaares auf einem Prozessautomatisierungsrechner angepasst wird.

Derartige Schätzverfahren sind, z. B. auf der Basis neuronaler Netze, allgemein bekannt. Beispielhaft wird auf die DE 197 27 821 A1 verwiesen.

Die bislang in der Grundstoffindustrie verwendeten Schätzver- fahren wie neuronale Netze oder klassische Regressionsverfah- ren weisen Probleme auf. Oft skaliert der Trainingsaufwand für das Modell ungünstig mit der Dimension der Eingangsvekto- ren. Im ungünstigsten Fall steigt der Trainingsaufwand expo- nentiell an. Häufig beruht das Trainingsverfahren auf einem nichtlinearen Optimierungsverfahren. Dies kann dazu führen,

dass das globale Optimum möglicherweise nicht gefunden und/ oder der Rechenzeitbedarf zu groß wird.

Diese Problematiken kommen noch mehr zum Tragen, wenn das Mo- delltraining nicht offline, sondern online erfolgen soll, d. h. auf einem der Rechner der Prozessautomatisierung (Pro- zesssteuerung bzw.-regelung) der Anlage. Denn für das Trai- ning (d. h. das Erstellen bzw. Anpassen des empirischen Mo- dells anhand der Wertepaare) steht online-im Gegensatz zum offline-in der Regel nur eine relativ kurze und klar be- grenzte Zeitspanne zur Verfügung. Ferner muss der Trainings- vorgang online absolut zuverlässig ablaufen.

Die Aufgabe der vorliegenden Erfindung besteht darin, ein Schätzverfahren für ein empirisches Modell zu schaffen, das auch bei einem höherdimensionalen Eingangsgrößenvektor zuver- lässig und mit akzeptablem Rechenaufwand trainierbar ist.

Die Aufgabe wird dadurch gelöst, dass das Modell ein Stütz- vektormodell ist.

Denn bei Stützvektormethoden steigt der Aufwand zum Trainie- ren des Modells sowohl bezüglich der Zahl der zum Training verwendeten Ein/Ausgangswertepaare als auch bezüglich der Di- mension des Eingangsgrößenvektors nur linear an. Geeignete Trainingsverfahren für das Modell sind"Stückelungsmethoden" (engl."chunking methods"), z. B die gemäß Joachims oder die "Sequentielle Minimale Optimierung" (engl."Sequential Mini- mal Optimisation") gemäß Platt. Denn diese Verfahren arbeiten zuverlässig und schnell.

Stützvektormethoden bzw. Stützvektormodelle sind durch die folgenden Eigenschaften charakterisiert : a) Ein Stützvektormodell ist (bis auf einen Offset) eine Li- nearkombination von symmetrischen Kernfunktionen, die sich

mathematisch als Skalarprodukt zweier identischer Funktio- nen schreiben lassen. b) Die Koeffizienten in der in (a) genannten Linearkombinati- on werden durch Lösen eines konvexen Optimierungsproblems (z. B. eines linearen oder quadratischen Programmierungs- problems) bestimmt.

Stützvektormethoden und Stützvektormodelle sind z. B. in den Monographien "Advances in Kernel Methods-Support Vector Learning" von B. Schölkopf, C. J. C. Burges, A. J. Smola, MIT Press, Cambridge (Mass.), London 1999 und "An introduction to Support Vector Machines and other kernel- based learning methods"von N. Cris. tianini, J. Shawe-Taylor, Cambridge University Press 2000 eingehend beschrieben. Darin sind auch die oben genannten Trainingsverfahren gemäß Joachims bzw. Platt dargestellt und weitere Fachliteratur genannt.

Bei der empirischen Modellierung und insbesondere bei Stütz- vektormethoden unterscheidet man Modelle, bei denen die Aus- gangsgröße stetig vom Eingangsgrößenvektor abhängt, und Mo- delle, bei denen die Ausgangsgröße nur diskrete Werte, insbe- sondere binäre Werte (also 0 und 1) annehmen kann. Die erst- genannten Modelle werden in der Literatur auch als Regressi- onsmethoden bezeichnet, die zweitgenannten als Klassifikati- ons-oder Mustererkennungsverfahren.

Regressionsmethoden werden in der Regel zur Vorhersage von physikalischen Prozessgrößen innerhalb der Prozessautomati- sierung (Prozesssteuerung und-regelung) einer Anlage verwen- det, während Klassifikations-bzw. Mustererkennungsverfahren z. B. zur Fehler-bzw. Störungserkennung in der Anlage dienen.

Wenn das Modell analytisch partiell nach den erfassbaren Sig- nalen ableitbar ist, ist der online-Rechenaufwand minimal.

Die symmetrischen Kernfunktionen können z. B. Gaußsche radia- le Basisfunktionen sein.

Wenn das mindestens eine weitere Wertepaar zwischengespei- chert wird und das Anpassen des Modells anhand des mindestens einen weiteren Wertepaares zu einem späteren Zeitpunkt er- folgt, kann das Anpassen des Modells während Zeiten erfolgen, in denen die Rechenleistung des zum Anpassen eingesetzten Rechners nicht anderweitig benötigt wird.

Wenn die Abhängigkeit mehrerer Prozessgrößen von einem Vektor von erfassbaren Signalen durch ein empirisches Modell be- schrieben werden soll, so ist ein solches Modell äquivalent zu einer entsprechenden Anzahl von empirischen Modellen, die die Abhängigkeit je einer dieser Prozessgrößen beschreiben.

Der Prozess kann prinzipiell beliebiger Natur sein. Insbeson- dere kann er ein Kohle-und Erzaufbereitungsprozess, ein Ver- hüttungsprozess, ein Stahlerzeugungsprozess, ein Gießprozess, ein Walzprozess sowie ein Zellstoff-und Papiererzeugungs- oder-verarbeitungsprozess sein.

Anhand der nachfolgenden Beschreibung eines Ausführungsbei- spiels wird ein Verfahren zur Erstellung online-fähiger empi- rischer Modelle mittels Stützvektormethoden beschrieben. Da- bei zeigen in Prinzipdarstellung FIG 1 eine Anlage der Grundstoffindustrie und FIG 2 ein Ablaufdiagramm.

Gemäß FIG 1 soll für einen Prozess 1 der Grundstoffindustrie eine Prozessgröße des Prozesses 1 geschätzt werden. Der Pro- zess 1 kann dabei ein beliebiger Prozess 1 der Grundstoffin-

dustrie sein. Schematisch dargestellt sind in FIG 1 ein Ver- hüttungsprozess la, ein Stahlerzeugungsprozess lb, ein Gieß- prozess lc und ein Walzprozess ld. Es kommen aber auch andere Prozesse in Frage, insbesondere ein Aufbereitungsprozess für Kohle-oder Erz und ein Erzeugungs-oder Verarbeitungsprozess für Zellstoff oder Papier.

Zur Online-Schätzung der Prozessgröße wird zunächst eine be- stimmte Art eines Stützvektormodells 2 zusammen mit einer Trainingsmethode ausgewählt. Dabei muss beachtet werden, dass die Trainingsmethode bezüglich Rechenzeit und Zuverlässigkeit online-fähig ist, d. h. auf einem Prozessautomatisierungsrech- ner 2'für den Prozess 1 einsetzbar ist. Denn auf dem Pro- zessautomatisierungsrechner 2'der Anlage ist das Schätzver- fahren vorzugsweise implementiert. Als Stützvektormodell 2 kann z. B.-aber nicht notwendigerweise-das in US-A- 5,950,146 beschriebene Stützvektormodell gemäß Vapnik heran- gezogen werden.

Ferner wird von der Anlage, auf der der Prozess 1 abläuft, (oder einer ähnlichen Anlage) eine Anzahl N von Wertepaaren gesammelt. Die Wertepaare bestehen jeweils aus einem Vektor von erfassbaren Signalen x1i,..., Xn, von denen die zu schätzende Prozessgröße abhängt, und einem zu diesem Vektor korrespondierenden Messwert y'für die zu schätzende Prozess- größe (i = 1,..., N). Diese Anzahl N von Wertepaaren wird zum Offline-Training eines Stützvektormodells 2 der gewählten Art verwendet. Es wird also anhand der Anzahl N von Wertepaa- ren ein empirisches Stützvektormodell 2 für die Abhängigkeit der Prozessgröße von den erfassbaren Signalen erstellt. Das derart vortrainierte Stützvektormodell 2 wird dann zusammen mit der gewählten Online-Trainingsmethode auf dem Prozessau- tomatisierungsrechner 2'der Anlage implementiert.

Zur Online-Schätzung der Prozessgröße wird ein Vektor von er- fassbaren Signalen xl,..., xn des Prozesses 1 dem Stützvek- tormodell 2 als Eingangsgrößenvektor zugeführt. Das Stützvek-

tormodell 2 ermittelt dann anhand des zugeführten Vektors während des Ablaufs des Prozesses 1 einen Schätzwert y* für die Prozessgröße.

Der tatsächliche Wert y der Prozessgröße kann häufig eben- falls anhand des Prozesses 1 (allerdings immer erst im nach- hinein) ermittelt werden. Dieser Wert y wird zusammen mit dem Eingangsgrößenvektor dem Stützvektormodell 2 zum online-Trai- ning zugeführt. Anhand des aus Eingangsgrößenvektor und Pro- zessgröße gebildeten Wertepaares, also einerseits des Vektors von erfassbaren Signalen xi,..., xn sowie andererseits des korrespondierenden Messwerts y für die Prozessgröße, wird das Stützvektormodell 2 dann online (d. h. auf dem Prozessautoma- tisierungsrechner 2') nachtrainiert bzw. angepasst.

Das Erstellen und Anpassen des Modells 2 erfolgt vorzugsweise gemäß einer"Stückelungsmethode" ("chunking method") wie sie z. B. von Joachims beschrieben ist oder wie sie als sogenann- te"Sequentielle Minimale Optimierung" ("Sequential Minimal Optimisation") von Platt entwickelt worden ist.

Bei hinreichender freier Rechenkapazität des Prozessautomati- sierungsrechners 2'kann das Anpassen des Modells 2 unmittel- bar nach dem Ermitteln des neuen Wertepaares erfolgen. In der Regel wird es aber sinnvoller sein, das weitere Wertepaar- ggf. mehrere weitere Wertepaare-zwischenzuspeichern und das Anpassen des Modells 2 zu einem späteren Zeitpunkt mit den bis dahin akkumulierten Wertepaaren vorzunehmen.

Der obenstehende Ablauf auf dem Prozessautomatisierungsrech- ners 2'wird nachfolgend in Verbindung mit FIG 2 nochmals er- läutert.

Gemäß FIG 2 wird dem Modell 2 in einem Schritt 3 eine Anzahl N von Wertepaaren vorgegeben. Jedes Wertepaar besteht dabei aus einem Vektor von erfassbaren Signalen xli,..., xni und einem zu diesem Vektor korrespondierenden Messwert y'für die

zu schätzende Prozessgröße. Anhand dieser Wertepaare wird dann in einem Schritt 4 das Modell 2 trainiert.

Sodann wird in einem Schritt 5 dem Stützvektormodell 2 ein Vektor von erfassbaren Signalen xi,..., xn eingegeben. Es ermittelt daraufhin in einem Schritt 6 einen Schätzwert y* für die Prozessgröße. Sodann wird in einem Schritt 7 der tat- sächliche Wert y der Prozessgröße ermittelt. Der Vektor von erfassbaren Signalen xi,..., xn wird zusammen mit dem Wert y in einem Schritt 8 zwischengespeichert. Dann wird in einem Schritt 9 abgefragt, ob ein Nachtrainieren des Modells 2 er- folgen soll. Je nach dem Ergebnis der Abfrage wird entweder zum Schritt 5 zurückgesprungen oder in einem Schritt 10 ein Nachtraining des Modells 2 vorgenommen.

Stützvektormodelle zur Modellierung stetiger Prozessgrößen sind z. B. von der Form N f (x) E wj k (x, x) + b. j=l k ist eine symmetrische Kernfunktion, die sich mathematisch als Skalarprodukt zweier identischer Funktionen schreiben lässt. Als Kernfunktionen k kommen z. B. Gaußsche radiale Ba- sisfunktionen k (xi, x) = exp (-) x-x/c) in Frage. Alternati- ven, die anwendungsabhängig evtl. günstiger sein können, sind in den beiden genannten Monographien angegeben.

Das gesamte Stützvektormodell 2 ist eine Linearkombination dieser Funktionen k. xi (j = 1,..., N) sind die Eingangsvek- toren der zum Training verwendeten Wertepaare. Wj und b sind vom Trainingsverfahren zu bestimmende Koeffizienten.

Die Kernfunktionen k sind analytisch gegebene, in der Regel mehrfach stetig differenzierbare Funktionen. Es ist daher möglich, die partiellen Ableitungen nach allen Komponenten des Eingangsgrößenvektors x in analytischer Form zu bilden.

Dadurch, dass das gesamte Stützvektormodell 2 eine Linearkom-

bination dieser Kernfunktionen k ist, lassen sich somit vorab auch sog. Modellsensitivitäten (= partielle Ableitungen der zu schätzenden Prozessgröße bzw. des Modells 2 nach den er- fassbaren Signalen x1,..., xn) analytisch bilden und im Stützvektormodell 2 hinterlegen. Analytisch hinterlegte Mo- dellsensivitäten haben gegenüber numerisch bestimmten Sensi- tivitäten den Vorteil einer höheren Genauigkeit bei in der Regel geringerem Rechenaufwand.

Falls nicht eine kontinuierliche, sondern eine diskrete Pro- zessgröße modelliert werden soll, wird in der obenstehend be- schriebenen Weise zunächst eine stetige Zwischengröße ermit- telt, auf die eine geeignete Diskretisierungsfunktion, z. B. die Signumfunktion, angewendet wird.

Obenstehend wurde ein Schätzverfahren für eine einzelne ska- lare Prozessgröße beschrieben. Wenn die Abhängigkeit mehrerer Prozessgrößen von einem Vektor von erfassbaren Signalen durch ein empirisches Modell 2 beschrieben werden soll, so ist ein solches Modell 2 äquivalent zu einer entsprechenden Anzahl von empirischen Modellen, die die Abhängigkeit je einer die- ser Prozessgrößen beschreiben.