Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SIGNAL SEPARATION METHOD AND DEVICE FOR NON-LINEAR MIXING OF UNKNOWN SIGNALS
Document Type and Number:
WIPO Patent Application WO/2000/025489
Kind Code:
A1
Abstract:
Parameters of a technical system are determined, wherein output signals consisting of a plurality of superimposed, statistically independent input signals can be detected. Parameters are detected in such a way that the statistical dependence of output signals is maximized.

Inventors:
OBRADOVIC DRAGAN (DE)
Application Number:
PCT/DE1999/003304
Publication Date:
May 04, 2000
Filing Date:
October 14, 1999
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS AG (DE)
OBRADOVIC DRAGAN (DE)
International Classes:
G06F17/10; G06F17/18; G06N3/00; G10L15/02; G10L15/16; G10L15/20; G10L21/0272; H03H21/00; H04L25/03; (IPC1-7): H04L25/03; G10L21/02; H03H21/00
Foreign References:
DE19531388C11996-07-25
US5282154A1994-01-25
Other References:
TE-WON LEE ET AL: "Combining time-delayed decorrelation and ICA: towards solving the cocktail party problem", PROCEEDINGS OF THE 1998 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, ICASSP '98 (CAT. NO.98CH36181), PROCEEDINGS OF THE 1998 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, SEATTLE, WA, USA, 12-1, 1998, New York, NY, USA, IEEE, USA, pages 1249 - 1252 vol.2, XP002132701, ISBN: 0-7803-4428-6
OBRADOVIC D: "Dynamic signal mixtures and blind source separation", 1999 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. PROCEEDINGS. ICASSP99 (CAT. NO.99CH36258), 1999 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. PROCEEDINGS. ICASSP99, PHOENIX, AZ, USA, 15-19, 1999, Piscataway, NJ, USA, IEEE, USA, pages 1441 - 1444 vol.3, XP002132702, ISBN: 0-7803-5041-3
INOUYE Y ET AL: "Cumulant-based blind identification of linear multi-input-multi-output systems driven by colored inputs", IEEE TRANSACTIONS ON SIGNAL PROCESSING, JUNE 1997, IEEE, USA, vol. 45, no. 6, pages 1543 - 1552, XP002132703, ISSN: 1053-587X
Attorney, Agent or Firm:
SIEMENS AKTIENGESELLSCHAFT (Postfach 22 16 34 München, DE)
SIEMENS AKTIENGESELLSCHAFT (Postfach 22 16 34 München, DE)
Download PDF:
Claims:
Patentanspriiche
1. Verfahren zur Ermittlung von Parametern eines technischen Systems, mit dem Ausgangssignale aus einer Menge überlagerter, statistisch voneinander unabhängiger Eingangssignale ermittelt werden können, bei dem die Parameter derart ermittelt werden, daß die statistische Unabhängigkeit der Ausgangssignale maximiert wird.
2. Verfahren nach Anspruch 1, bei dem die Parameter in einem iterativen Verfahren ermittelt werden.
3. Verfahren nach Anspruch 1 oder 2, bei dem die Parameter Elemente einer Entmischmatrix sind, mit der die Menge der überlagerten Eingangssignale multipliziert wird, wodurch die Ausgangssignale gebildet werden.
4. Verfahren nach Anspruch 3, bei dem die Optimierung der Parameter der Entmischmatrix durch die folgenden Schritte erhalten wird : Wiederholung einer zeitverzögerten Dekorrelationsberechnung (6) zur Ermittlung der Eigenwerte der Entmischmatrix, Ermittlung der Eigenwerte der Entmischmatrix, für die Kreuzkorrelationen einen minimalen Wert annehmen, und Ausführung einer Kumulantenminimierung (5), wobei als Startwerte für die Kumulantenminimierung die im vorherigen Schritt ermittelten Eigenwerte verwendet werden.
5. Verfahren nach Anspruch 4, bei dem die Kumulantenminimierung durch Trainieren eines neuronalen Netzes (5) erfolgt.
6. Verfahren nach einem der Ansprüche 3 bis 5, bei dem bei der Optimierung der Parameter der Entmischmatrix wenigstens ein Diagonalparameter der Entmischmatrix auf einen vorgegebenen Wert gesetzt wird.
7. Verfahren nach einem der Ansprüche 3 bis 6, bei dem die Entmischmatrix auf eine finite Impulsantwort begrenzt wird.
8. Verfahren nach einem der Ansprüche 3 bis 7, bei dem die Entmischmatrix während der Kumulantenminimierung (5) durch Projektion in einen Einheitskreis stabilisiert wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, eingesetzt zur Trennung überlagerter, statistisch voneinander unabhängiger Eingangssignale.
10. Verfahren nach einem der Ansprüche 1 bis 8, eingesetzt zur Trennung überlagerter, statistisch voneinander unabhängiger akustischer Eingangssignale.
11. Anordnung zur Ermittlung von Parametern eines technischen Systems, mit dem Ausgangssignale aus einer Menge überlagerter, statistisch voneinander unabhängiger Eingangssignale ermittelt werden können, mit einem Prozessor, der derart eingerichtet ist, daß die Parameter derart ermittelt werden können, daß die statistische Unabhängigkeit der Ausgangssignale maximiert wird.
12. Anordnung nach Anspruch 11, bei der der Prozessor derart eingerichtet ist, daß die Parameter in einem iterativen Verfahren ermittelt werden.
13. Anordnung nach Anspruch 11 oder 12, bei der der Prozessor derart eingerichtet ist, daß die Parameter Elemente einer Entmischmatrix sind, mit der die Menge der überlagerten Eingangssignale multipliziert wird, wodurch die Ausgangssignale gebildet werden.
14. Anordnung nach Anspruch 13, bei der der Prozessor derart eingerichtet ist, daß die Optimierung der Parameter der Entmischmatrix durch die folgenden Schritte erhalten wird : Wiederholung einer zeitverzögerten Dekorrelationsberechnung (6) zur Ermittlung der Eigenwerte der Entmischmatrix, Ermittlung der Eigenwerte der Entmischmatrix, für die Kreuzkorrelationen einen minimalen Wert annehmen, und Ausführung einer Kumulantenminimierung (5), wobei als Startwerte für die Kumulantenminimierung die im vorherigen Schritt ermittelten Eigenwerte verwendet werden.
15. Anordnung nach Anspruch 14, bei der der Prozessor derart eingerichtet ist, daß die Kumulantenminimierung durch Trainieren eines neuronalen Netzes (5) erfolgt.
16. Anordnung nach einem der Ansprüche 13 bis 15, bei der der Prozessor derart eingerichtet ist, daß bei der Optimierung der Parameter der Entmischmatrix wenigstens ein Diagonalparameter der Entmischmatrix auf einen vorgegebenen Wert gesetzt wird.
17. Anordnung nach einem der Ansprüche 13 bis 16, bei der der Prozessor derart eingerichtet ist, daß die Entmischmatrix auf eine finite Impulsantwort begrenzt wird.
18. Anordnung nach einem der Ansprüche 13 bis 17, bei der der Prozessor derart eingerichtet ist, daß die Entmischmatrix während der Kumulantenminimierung (5) durch Projektion in einen Einheitskreis stabilisiert wird.
19. Anordnung nach einem der Ansprüche 11 bis 18, eingesetzt zur Trennung überlagerter, statistisch voneinander unabhängiger Eingangssignale.
20. Anordnung nach einem der Ansprüche 11 bis 18, eingesetzt zur Trennung überlagerter, statistisch voneinander unabhängiger akustischer Eingangssignale.
Description:
Beschreibung SIGNALTRENNUNGSVERFAHREN UND-ANORDNUNG FÜR NICHTLINEARE MISCHUNGEN UNBEKAN- NTER SIGNALE Die Erfindung betrifft ein Verfahren sowie einer Anordnung zur Ermittlung von Parametern eines technischen Systems Bei einer Vielkanal-Ubertragung und einem Vielkanal-Empfang von Signalen tritt häufig eine Interferenz beispielsweise zwischen den Signalen/Bildern auf. Ein typisches Beispiel ist dabei eine Mischung eines Sprachsignals mit Rauschen, was bei der Telekommunikation und bei Videokonferenzen ein großes Problem darstellen kann. Die vorliegende Erfindung betrifft daher das Gebiet der Signaltrennung, um beispielsweise ein ursprüngliches Sprachsignal wiederzugewinnen.

Typische bekannte Techniken zur Trennung der Quellensignale ausgehend von Mischsignalen basieren auf einer zeitlichen Mittelung oder einer Filterung der Signale. Dies hat indessen Nachteile bezüglich des Rechenaufwands zur Folge.

Es sind auch Verfahren auf der Grundlage der sogenannten Blind Channel Equalization (Signalentzerrung ohne Vorkenntnisse aber den Ubertragungskanal) bekannt, aber diese Verfahren benötigen immer eine gewisse Kenntnis über die Quellsignale, wie beispielsweise eine Kenntnis über ihre statistische Verteilung.

Das Problem der Signaltrennung tritt beispielsweise auch auf, wenn zwei Sprecher in zwei entfernt von ihnen stehende Mikrofone sprechen, so daß jedes Mikrofon ein Gemisch der von den zwei Sprechern gesprochenen Signale aufnimmt. Somit besteht das Problem, das Signalgemisch, also eine Menge überlagerter Eingangssignale wieder zu trennen. Aus L. Molgedey, H. G.

Schuster,"Separation of a Mixture of Independent Signals using Time-Delayed Correlations", Phys. Ref. Lett. 72,3634 (1994) ist dabei das folgende Verfahren bekannt : Das Problem, n überlagerte und korrelierte Quellensignale (Eingangssignale) zu trennen und gleichzeitige die Mischungskoeffizienten der Quellenstärken zu bestimmen, läßt sich auf ein Eigenwertproblem reduzieren, bei dem simultan zwei symmetrische n x n Matrizen diagonalisiert werden müssen. Die Matrixelemente sind meßbare zeitverzögerte Korrelationsfunktionen. Die Lösung des Eigenwertproblems kann durch ein neuronales Netz erfolgen, wobei die Lernregel für die lateralen inhibitorischen Wechselwirkungen zwischen den Neuronen durch eine Liapunov- Funktion bestimmt werden kann, deren Minima die (entarteten) Lösungen des Problems liefern.

Dieses Verfahren wurde auch bereits auf akustische Eingangssignale angewandt (siehe F. Ehlers, H. G. Schuster, "Blind Separation of convolutive mixtures and an application in automatic speech recognition"IEEE Trans. Signal Proc. (1997).

Aus der DE 195 31 388 Cl ist ein Signaltrennungsverfahren und eine Signaltrennungseinrichtung für nichtlineare Mischungen unbekannter Signale (Blind Channel) bekannt, das schematisch in Fig. 3 dargestellt ist.

Dieses deutsche Patent behandelt die Separierung eines Signalgemisches, bestehend aus der nichtlinearen Überlagerung von M unbekannten Quellsignalen Xl, X2, wobei N (N 2 M) unterschiedliche Mischungen der M Quellsignale X1, X2 inklusive eines eventuellen Störsignals einer Signalauswerteeinrichtung zugeführt werden, die durch eine statistische Analyse der Signale die nichtlinearen Übertragungsfaktoren bestimmt und mit diesen errechneten Faktoren die Mischung rückgängig macht, so daß die N Ausgänge der Signaltrennungseinrichtung möglichst näherungsweise die M Quellsignale ohne Überlagerungen enthalten. Dadurch wird eine Behandlung nichtlinearer Gemische möglich, wobei nichtlinear bedeutet, daß die Quellsignale X1, X2 durch ein unbekanntes nichtlineares System G gemischt werden. Das unbekannte System G wird durch eine sogenannte Volterra-Reihe beschrieben, und die Signaltrennungseinrichtung G-1 bestimmt die Koeffizienten der Volterra-Reihe. Mit deren Kenntnis ist eine Entmischung des Signalgemischs möglich.

Außerdem können die Koeffizienten zu weiteren Analysen zur Orts-oder Geschwindigkeitsbestimmung der Signalquellen benutzt werden.

Das aus dieser Druckschrift bekannte Verfahren besteht dabei im wesentlichen aus zwei Schritten : * Erstens werden die durch den wählbaren Grad der Nichtlinearität bei der Mischung eindeutig bestimmten nichtlinearen Gleichungen für ein gleitendes Zeitfenster gelöst und die Lösungen werden über die Zeit gemittelt. Diese zeitliche Mittelung stellt einen Hauptnachteil dieser bekannten Technik dar, da sie den Rechenaufwand und gleichzeitig die Zeitdauer für die Berechnung erhöht.

Zweitens wird aus einer genügend großen Anzahl von unterschiedlichen Kumulanten der geschätzten Ausgangssignale gebildetes Potential minimiert, wobei die zur Berechnung des Potentials nötigen Werte aus einem gleitenden Zeitfenster einer wählbaren Länge stammen. Dabei ist vorausgesetzt, daß sich das Mischungssystem so langsam ändert, daß diese Änderung bei der Berechnung der gesuchten Mischungsfaktoren vernachlässigt werden kann. Gemäß diesem deutschen Patent wird zur Ausführung des zweiten genannten Schrittes eine Kostenfunktion konstruiert, die minimiert wird. Wenn das globale Minimum erreicht ist, hat man die optimalen Werte, in diesem Fall der Übertragungsfaktoren, gefunden.

Hinsichtlich des zeitlichen Aufwands sowie des Rechenaufwands ist das in der DE 195 31 388 Cl beschriebene Verfahren aufgrund der Ausführung einer zeitlichen Mittelung am Abschluß des ersten, oben genannten Verfahrensschrittes nachteilig.

Die vorliegende Erfindung hat daher zur Aufgabe, ein Verfahren und eine Anordnung bereitzustellen, die die Trennung überlagerter, statistisch voneinander unabhängiger akustischer Signale mit verringertem Rechenaufwand ermöglicht.

Diese Aufgabe wird durch das Verfahren sowie durch die Anordnung mit den Merkmalen gemäß den unabhängigen Ansprüchen gelöst.

Bei einem Verfahren zur Ermittlung von Parametern eines technischen Systems, mit dem Ausgangssignale aus einer Menge überlagerter, statistisch voneinander unabhängiger Eingangssignale ermittelt werden können, werden die Parameter derart ermittelt, daß die statistische Unabhängigkeit der Ausgangssignale maximiert wird.

Eine Anordnung zur Ermittlung von Parametern eines technischen Systems, mit dem Ausgangssignale aus einer Menge überlagerter, statistisch voneinander unabhängiger Eingangssignale ermittelt werden können, weist einen Prozessor auf, der derart eingerichtet ist, daß die Parameter derart ermittelt werden können, daß die statistische Unabhängigkeit der Ausgangssignale maximiert wird.

Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.

Die Parameter werden bevorzugt in einem iterativen Verfahren ermittelt.

In einer weiteren Ausgestaltung sind die Parameter Elemente einer Entmischmatrix, mit der die Menge der überlagerten Eingangssignale multipliziert oder auch gefaltet wird, wodurch die Ausgangssignale gebildet werden.

Die Optimierung der Parameter der Entmischmatrix wird bevorzugt durch die folgenden Schritte erhalten : -Wiederholung einer zeitverzögerten Dekorrelationsberechnung zur Ermittlung der Eigenwerte der Entmischmatrix, -Ermittlung der Eigenwerte der Entmischmatrix, für die Kreuzkorrelationen einen minimalen Wert annehmen, und -Ausführung einer Kumulantenminimierung, wobei als Startwerte für die Kumulantenminimierung die im vorherigen Schritt ermittelten Eigenwerte verwendet werden.

Die Kumulantenminimierung kann beispielsweise durch Trainieren eines neuronalen Netzes, aber auch jegliche andere bekannte Minimierungstechnik, wie beispielsweise Gradientenabstieg oder Monte-Carlo-Simulationen verwendet werden.

In einer Weiterbildung wird bei der Optimierung der Parameter der Entmischmatrix wenigstens ein Diagonalparameter der Entmischmatrix auf einen vorgegebenen Wert gesetzt, womit, um eine Stabilität des Minimierungsvorgangs hin zu einem globalen Minimum zu gewährleisten.

Die Entmischmatrix wird bevorzugt auf eine finite Impulsantwort begrenzt, d. h. es wird ein FIR-Filter (Finite Impulse Response) eingesetzt zur Bildung der einzelnen Komponenten der Entmischmatrix. Der FIR-Filter kann sowohl ein kausales FIR- Filter oder auch ein nicht-kausales FIR-Filter sein.

Ferner wird die Entmischmatrix während der Kumulantenminimierung bevorzugt durch Projektion in einen Einheitskreis stabilisiert.

Die Weiterbildungen gelten sowohl für das Verfahren als auch für die Anordnung, wobei bei der Anordnung jeweils der Prozessor derart eingerichtet ist, daß der entsprechende Verfahrensschritt durchführbar ist oder durchgeführt wird.

Die Erfindung sowie deren Weiterbildungen können vorteilhaft eingesetzt werden zur Trennung überlagerter, statistisch voneinander unabhängiger Eingangssignale, insbesondere akustischer Eingangssignale.

Das Verfahren sowie die Anordnung sind für eine beliebige Anzahl von Eingangssignalen anwendbar.

Weitere Vorteile, Merkmale und Eigenschaften der vorliegenden Erfindung werden nunmehr bezugnehmend auf die beiliegenden Figuren der Zeichnungen anhand eines Ausführungsbeispiels näher erläutert.

Fig. 1 zeigt die Anwendung eines Systems zur Trennung überlagerter, statistisch voneinander unabhängiger akustischer Signale gemäß dem Ausführungsbeispiel, Fig. 2 zeigt eine symbolische Darstellung des Systems von Fig. 1, und Fig. 3 zeigt eine aus dem Stand der Technik (DE 195 31 388 Cl) bekannte Signaltrennungseinrichtung für nichtlineare Mischungen unbekannter Signale.

Zur Wiedergewinnung des ursprünglichen Sprachsignals wird aus einer Mischung von Signalen die statistische Unabhängigkeit zwischen den Quellensignalen (ursprüngliches Sprachsignal und Rauschen), im weiteren auch als Eingangssignale bezeichnet, ausgenutzt und der inverse Vorgang des dynamischen Systems, der die Mischung der Signale ergeben hat, wird im wesentlichen näherungsweise trainiert (gelernt). Zwei verschiedene Mischungen des Sprachsignals bzw. des Rauschsignals werden beispielsweise durch zwei Mikrofone 1,2 (vgl. Fig. 1) erhalten, die voneinander beabstandet sind und/oder in entgegengesetzten Richtungen ausgerichtet sind. Bei dem Verfahren wird die sogenannte zeitverzögerte Dekorrelationstechnik (TDD, time delayed decorrelation) verwendet, um die Lernphase zu initiieren, d. h. um Startwerte für die Lernphase zu ermitteln und vorzugeben, wodurch der Berechnungsaufwand für eine im weiteren beschriebenen Kumulantenminimierung verringert werden kann und die Gefahr lokaler Minima verringert werden kann.

Fig. 1 zeigt zwei Mikrofone 1,2, die ein erstes Eingangssignal Z1 (t) und ein zweites Eingangssignal Z2 (t) aufnehmen. Diese Eingangssignale Z1 (t) und Z2 (t) können untereinander wiederum jeweils mit Rauschen vermischt sein, was durch eine Mischmatrix S (siehe Bezugszeichen 3) symbolisch in Fig. 1 dargestellt ist.

Nach dem Empfang bzw. der Übertragung wird eine Menge X1 (t) und X2 (t) überlagerter, statistisch voneinander unabhängiger Eingangssignale Z1 (t) und Z2 (t) erhalten. Diese Signale werden in eine Berechnungseinheit 4 eingegeben, in der im wesentlichen zwei Schritte ausgeführt werden, die symbolisch durch eine Berechnungseinheit B (Bezugszeichen 6) für den ersten Schritt sowie ein neuronales Netzwerk 5 für den zweiten Schritt dargestellt ist.

Durch die Berechnungseinheit 4 werden zwei Ausgangssignale Yl (t) bzw. Y2 (t) ermittelt, die bei optimaler Einstelllung der Parameter in der Berechnungseinheit 4 näherungsweise gleich den Eingangssignalen Z1 (t) bzw. Z2 (t) sind. Mit anderen Worten, bei optimaler Einstellung der Parameter der verwendeten Matrizen in der Berechnungseinheit 4 erfolgt durch diese Berechnungseinheit 4 im wesentlichen der inverse Vorgang zu dem dynamischen Mischvorgang, der durch die Matrix S (Bezugszeichen 3) symbolisch dargestellt ist. Das Ausführungsbeispiel beschäftigt sich mit dem Optimierungsvorgang der Einstellung der Parameter der Entmischmatrix.

Es werden die Parameter der Matrizen in der Berechnungseinheit 4 derart optimiert, daß die statistische Unabhängigkeit zwischen den durch den Matrizenvorgang in der Berechnungseinheit 4 gewonnenen Ausgangssignale Yl (t), Y2 (t) maximiert wird. Zu diesem Zweck werden die Ausgangssignale Yl (t) bzw. Y2 (t) zu der Berechnungseinheit 4 zurückgeführt (s.

Rückführschleifen 7 bzw. 8). Durch ein iteratives Verfahren wird ermittelt, ob sich die statistische Unabhängigkeit der Ausgangssignale Yl (t) bzw. Y2 (t) im Vergleich zu dem vorherigen Schritt der Iteration erhöht hat (und somit die Iteration die "richtige"Richtung in Richtung des globalen Minimums einer im weiteren beschriebenen Kostenfunktion einnimmt) oder nicht.

Fig. 2 zeigt eine mathematische Darstellung des Schemas von Fig. 1, wobei der Mischvorgang 3 durch eine Matrix S (q) mathematisch beschrieben werden kann und der Entmischvorgang, der durch die Berechnungseinheit 4 erfolgen soll, durch eine Entmischmatrix M (q) symbolisiert wird.

In Fig. 2 ist somit das Problem der Trennung einer sogenannten Multi-Channel Blind Source (Vielfach-Kanal-Quelle ohne a- priori-Kenntnis) in zwei Dimensionen dargestellt. Dabei ist angenommen, daß das Mischsystem S (q), wobei q für eine Einheitsverzögerung steht, stabil ist und gleichzeitig auch eine stabile Invertierung aufweist, d. h. daß es ein Minimalphasensystem ist. Darüber hinaus ist angenommen, daß die Eingangssignale Z1 (t) und Z2 (t) (beispielsweise ein Sprach- bzw. ein Rauschsignal) statistisch voneinander unabhängig sind und nicht gaussförmig verteilt sind. Die Menge X1 (t) und X2 (t) der überlagerten Eingangssignale Z1 (t) und Z2 (t) sind Eingangssignale in ein Entmischsystem mit einer Entmischmatrix M (q), deren Parameter (Matrixelemente) auf eine Maximierung der statistischen Unabhängigkeit zwischen den Ausgangssignalen Yl (t) und Y2 (t) trainiert werden. Unter"Trainieren"ist dabei der gut bekannte Lernvorgang beispielsweise eines neuronalen Netzes bekannt, das als ein Beispiel für eine Technik genannt sein soll, die statistische Unabhängigkeit zu maximieren. Dies erfolgt durch Minimierung einer im weiteren beschriebenen Kostenfunktion J (M).

Es wird eine Kumulanten-Kostenfunktion gebildet, die die Diagonalkumulantenelementen der Kumulantenordnung 2-4 minimiert : 4.. 2 Dcum :--i J (M) = 4 Is*-, C (i) nondiag 2 i=l nondiag Folgende Gesichtspunkte der dynamischen Mischung durch die Mischmatrix S (q) sind dabei zu berücksichtigen : Stabilität des Entmischsystems : Dies wird erreicht, wenn M (q) auf eine finite Impulsantantwort (FIR-Filter) beschränkt wird. Die Stabilität des FIR-Systems M (q) kann darüber hinaus auch dadurch erhalten werden, daß während der Lernphase eine Projektion in den Einheitskreis erfolgt Eine möglicherweise vorliegende Nichtkausalität der Invertierung von S (q) kann durch eine geeignete Zeitverschiebung (Verzögerung) des Eingangssignals X (t) kompensiert werden.

Eindeutigkeit der getrennten Signale Y (t) : Für den Fall statischer Mischungen werden die ursprünglichen Quellsignale durch eine Skalierung wiedergewonnen. Für den Fall einer dynamischen Entmischung ist die Gefahr einer Nichteindeutigkeit der getrennten Signale Y (t) sogar noch größer. Es ist offensichtlich, daß für den Fall, daß Yl (t) und Y2 (t) statistisch voneinander unabhängig sind, auch jegliche linear gefilterte Modifikation dieser Signale immer noch statistisch unabhängig sind. Daher ist eine zusätzliche Information notwendig, um die inhärente Nichteindeutigkeit des Problems zu verringern.

Gaussverformung der Daten : Algorithmen auf Kumulantenbasis für eine statische Blind Source-Trennung minimieren bzw. eliminieren in effektiver Weise Diagonalkumulanten höherer Ordnung entsprechend den Ausgangssignalen Y (t). Andererseits führt eine lineare Filterung zu einer Gaussverteilungs-Verformung der Daten, bei denen die Kumulanten höherer Ordnung in Richtung 0 gehen. Dies kann daher zu Randlösungen führen, in denen die Kostenfunktion ein lokales Minimum erreicht, wobei die erwünschte eigentliche Trennung (globales Minimum) nicht erfolgt. Um diesen ungewünschten Fall zu vermeiden, wird die Struktur der Entmisch-Transferfunktion (Entmischmatrix) M (q) einigen Beschränkungen unterworfen.

Um die obengenannten Probleme zu umgehen, wird ein Ansatz gewählt, daß wenigstens eines (oder auch alle) der Diagonalelemente auf den Einheitswert gesetzt werden : Mll(q) = 1 und M22(q) = 1.

Diese Annahme ist exakt, wenn die Mischelemente Sll (q) und/oder S22 (q) ebenfalls einen Einheitswert"1"aufweisen. Sonst sei angenommen, daß Sll (q) und/oder S22 (q) stabile Invertierungen aufweisen, was die Skalierung der Diagonalelemente von M (q) auf den Einheitswert erlaubt. Dieser Ansatz verringert wesentlich die Nichteindeutigkeit einer Lösung und vermeidet darüber hinaus in effektiver Weise die Gefahr einer übermäßigen Gaussverteilungs-Verformung der Ausgangssignale. Auch wenn auf den ersten Blick die Beschränkung der Diagonalelemente von M (q), wie oben ausgeführt, sehr restriktiv wirkt, ist diese Annahme in der praktischen Anwendung in der Regel erfüllt. Ein typisches Beispiel ist die Entrauschung von Sprachsignalen auf der Grundlage einer Aufzeichnung mit zwei Mikrofonen, wobei die Mikrofone voneinander räumlich getrennt sind oder ein Mikrofon in Richtung des Sprechers gerichtet ist, während das andere Mikrofon in der umgekehrten Richtung gerichtet ist, so daß das zweite, von dem Sprecher abgewandte Signal im wesentlichen nur ein Rauschsignal aufnimmt.

Der Kumulantenansatz basiert auf einer direkten Ermittlung der Diagonalkumulanten, wie sie in dem eingangs genannten Artikel von F. Ehlers und H. Schuster,"Blind Separation of convolutive mixtures and an application in automatic speech recognition" IEEE Trans. Signal Proc. (1997), ausgeführt ist, was aber inhärent den Nachteil aufweist, daß die numerische Lösung sehr aufwendig ist. Daher wird eine geeignete Initialisierung dieses Minimierungsverfahrens verwendet. Um Startwerte für das Minimierungsverfahren zu ermitteln, wird gemäß der vorliegenden Erfindung die Technik der zeitverzögerten Dekorrelation (TDD) zur gleichzeitigen Dekorrelierung zweier verschiedener Zeitverzögerungen angewendet, wobei diese TDD-Technik sich auf ein geeignetes Matrix-Eigenwertproblem zurückführen läßt. Wie bereits gesagt, wird diese TDD-Technik gemäß der vorliegenden Erfindung zur Initiierung des Diagonal (Kreuzkorrelations)- Kumulantenminimierungsproblems verwendet.

Zusammenfassend läßt sich das Verfahren in die folgenden beiden Schritte unterteilen : 1. Wiederholung des TDD-Verfahrens auf Grundlage des Eigenwertproblems im Frequenzbereich für verschiedene Verzögerungspaare und Ermittlung der Lösung, bei der die Kreuzkorrelationsterme einen minimalen Wert aufweisen.

2. Initiierung (Start) der Diagonal-Kumulantenminimierung auf Grundlage der im oben genannten Schritt ermittelten Startwerte (FIR-Parameter).

Im folgenden sollen noch einige Haupteigenschaften und Vorteile noch einmal zusammengefaßt werden : -Es ist kein a-priori-Wissen der Signaleigenschaften notwendig, mit der Ausnahme, daß eine statistische Unabhängigkeit gefordert wird.

-Die Stabilität des dynamischen Entmischsystems wird durch die Modulierung seiner Komponenten als FIR-Filter gewährleistet.

-Eine übermäßige Gaussverteilung-Verformung wird durch den Ansatz vermieden, daß wenigstens eines der Elemente der Mischtransfer-Funktionsmatrix (Entmischmatrix) auf den Einheitswert gesetzt wird bzw. auf den Einheitswert skaliert werden kann, und -da der Kumulanten-Minimierungsschritt (Schritt 2) einen hohen Rechenaufwand erfordert, wird der Lernalgorithmus beispielsweise eines neuronalen Netzes durch das TDD- Verfahren initialisiert.

Im weiteren ist ein Programm in Matlab, Version 4 oder Version angegeben, mit dem das oben beschriebene Ausführungsbeispiel auf einem Rechner realisiert werden kann : function cost, outl, out2 =cumulant_costFIRa2 (par, input, pl, pll, p2, p22, a3, a4) ; % cost,outl,out2=cumulantcostFIRa2 (par, input, pl, pll, p2, p22, a3, a4) ; % cumulant cost % FIR representation used % filter function used in both directions (noncausal) [np, mp] =size (par) ; firl=par (l : pl) ; firll=par (l+pl : pl+pll) ; fir2=par (l+pl+pll : pl+pll+p2) ; fir22=par (pl+pll+p2+l : mp) ; den=l ; % FIR only outl= [input ( : ; l)-filter (firl, den, input ( :, 2))-flipud (filter ( 0 firll], [den], flipud (input ( :, 2))))] ; %/std (input (1, :)) ; % dlsim % filter out2= [input ( :, 2)-filter (fir2, den, input (:, 1))-flipud (filter ( 0 fir22], den, flipud (input ( :, l)))) ; %/std (input ( :, 2)) ; % dlsim % filter out= [outl out2] ; % outl=outl/std (outl) ; % this scaling was not needed in examples in SIP98 paper % out2=out2/std (out2) ; Ld=0 ; % number of delays in calculating the cross-correlation cost3=0 ; cost4=0 ; costALL1= [] ; costALL2= [] ; ol2=outl. *out2 ; cost2=mean (ou2)"2 ; oll2=outl. *outl. *out2 ; ol22=outl. *out2. *out2 ; if a3 ==1 cost3= [mean (ol22) ^2+ [mean (ol22) ^2 ; end if a4 ==1 cost4= mean (oll2. *outl)-3*mean (outl. ^2) *mean (ol2) ^2+...

[mean (ol22. *out2)-3*mean (out2. ^2) *mean (ol2)]^2; end % cum4a= [cum4x (outl, outl, outl, outl)] A2 ; % cum4b= [cum4x (out2, out2, out2, out2)] ^2 ; cost=cost2+a3*cost3+a4*cost4 ; %-cum4a-cum4b ;