Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND DEVICE FOR LOCALISING AND TRACKING ACOUSTIC ACTIVE SOURCES
Document Type and Number:
WIPO Patent Application WO/2019/149323
Kind Code:
A1
Abstract:
The present invention relates to a method (1) and a device (10) for localising and tracking acoustic active sources (11) or acoustic signals (15). In particular, the method (1) according to the invention and the device (10) according to the invention are suitable for localising and tracking acoustic active sources (11) in road traffic. The method (1) comprises in particular the following steps: the estimation of phase shifts with the aid of transformed sound signals and source frequencies in order to obtain an estimated angle of incidence for each active source; and the combined estimation of a position and a speed at least of one of the active sources of a source statistic in the state space, a linear motion model of the active source being assumed, and a non-linear function being used, which establishes the relationship between the estimated incident angle spectra and positions and speeds.

Inventors:
FAUSS MICHAEL (DE)
REINHARD DOMINIK (DE)
WAHLIG MICHAEL (DE)
ZOUBIR ABDELHAK (DE)
ZHANG CHEN (DE)
SCHRÄBLER SIGHARD (DE)
MERZOUG PATRICK (DE)
Application Number:
PCT/DE2019/200004
Publication Date:
August 08, 2019
Filing Date:
January 31, 2019
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
CONTINENTAL TEVES AG & CO OHG (DE)
International Classes:
G01S3/808; G01S5/20; G01S5/18
Foreign References:
CN106772246A2017-05-31
JP2014067091A2014-04-17
Other References:
DAMARLA THYAGARAJU ET AL: "Helicopter tracking using acoustic arrays", 17TH INTERNATIONAL CONFERENCE ON INFORMATION FUSION (FUSION), INTERNATIONAL SOCIETY OF INFORMATION FUSION, 7 July 2014 (2014-07-07), pages 1 - 7, XP032653775
Download PDF:
Claims:
PATENTANSPRÜCHE

1. Verfahren (1) zum Lokalisieren und Verfolgen akustischer aktiver Quellen (11), umfassend die folgenden Schritte: a) Aufnehmen (Sl) von Schallsignalen (15) mit mindestens zwei Mikrofonarrays (13) bestehend aus jeweils mindes tens zwei Mikrofonen (14), um aufgenommene Schallsigna le zu erhalten;

b) Transformieren der aufgenommenen Schallsignale (S2) in den Zeit-Frequenz-Bereich, um transformierte Schallsig nale zu erhalten;

c) Ermitteln von Detektionen (S3) in den transformierten Schallsignalen mittels eines Hypothesentests, um eine Teststatistik zu erhalten;

d) Ermitteln von aktiven Quellen (S4) in der Teststatistik mittels eines binären Hypothesentests im Zeitbereich; e) Auswahlen von Frequenzen (S5) in den transformierten Schallsignalen basierend auf der Amplitude der jeweili gen Frequenzen, um Quellenfrequenzen der aktiven Quel len zu erhalten;

f) Schätzen S6 von Phasenversätzen mit Hilfe der transfor mierten Schallsignale und der Quellenfrequenzen, um für jede aktive Quelle einen geschätzten Einfallswinkel zu erhalten;

g) Gemeinsames Schätzen (Sl) einer Position und einer Ge schwindigkeit zumindest einer der aktiven Quellen der Quellenstatistik im Zustandsraum, wobei ein lineares Bewegungsmodell der aktiven Quelle angenommen wird und eine nichtlineare Funktion, welche die geschätzten Ein fallswinkelspektren sowie Positionen und Geschwindig keiten ins Verhältnis setzt, verwendet wird.

2. Verfahren (1) nach Anspruch 1, wobei der Schritt des Er- mittelns von Detektionen (S3) folgende Schritte umfasst: cl) Schätzen der spektralen Leistungsdichte (S3.1) von Hintergrundgeräuschen in den transformierten

Schallsignalen, um eine geschätzte spektrale Leistungs dichte zu erhalten;

c2) Dividieren der transformierten Schallsignale

(S3.2) durch die geschätzte spektrale Leistungsdichte, um die Teststatistik zu erhalten.

3. Verfahren (1) nach Anspruch 2, wobei im Schritt des Ermit- telns von Detektionen (S3) eine maskierte Teststatistik ermittelt wird, umfassend die folgenden Schritte:

c3) Schätzen eines Schwellwertes (S3.3) anhand der geschätzten spektralen Leistungsdichte, um einen ersten Schwellwert zu erhalten;

c4) Ermitteln von Detektionen (S3.4) in der Teststa tistik, wobei nur Amplitudenwerte in der Teststatistik, die größer oder gleich dem ersten Schwellwert sind, als Detektion gewertet werden und die übrigen Amplituden werte zu null gesetzt werden, um eine Binärmaske zu er halten;

c5) Durchführen einer morphologischen Filterung oder eines Soft-Max-verfahrens (S3.5) der ermittelten Detek tionen der Binärmaske, um eine gefilterte Binärmaske zu erhalten;

c6) Multiplizieren der Teststatistik mit der gefil terten Binärmaske (S3.6), um eine maskierte Teststatis tik zu erhalten.

4. Verfahren (1) nach Anspruch 3, wobei der Schritt des

Durchführens einer morphologischen Filterung (S3.5) min destens einen der folgenden Schritte umfasst: c5.1) Durchführen einer morphologischen Öffnung, wobei Amplitudenwerte der ermittelten Detektionen in der Bi närmaske, die keine ermittelte Detektion in benachbar ten Zeit-Frequenz-Punkten aufweisen, zu null gesetzt werden, um „morphologisch geöffnete Detektionen" zu er halten;

c5.2) Durchführen einer morphologischen Schließung, wo bei Amplitudenwerte der ermittelten Detektionen der Bi närmaske, die ermittelte Detektionen in benachbarten Zeit-Frequenz-Punkten aufweisen, zu eins gesetzt wer den, um „morphologisch geschlossene Detektionen" zu er halten .

5. Verfahren (1) nach einem der vorherigen Ansprüche, wobei der Schritt des Ermittelns von aktiven Quellen (S4) fol gende Schritte umfasst:

dl) Projizieren der Teststatistik (S4.1) in den Zeit bereich, um eine projizierte Teststatistik zu erhalten; d2) Schätzen eines Schwellwerts (S4.2) anhand der

projizierten Teststatistik, um einen zweiten Schwell wert zu erhalten;

d3) Ermitteln von aktiven Quellen (S4.3) in der pro jizierten Teststatistik, wobei nur Werte in der proji zierten Teststatistik, die größer oder gleich dem zwei ten Schwellwert sind, als aktive Quellen gewertet wer den und die übrigen Werte zu null gesetzt werden, um die aktiven Quellen zu erhalten.

6. Verfahren (1) nach einem der Ansprüche 3 oder 4 bis 5, so fern diese Anspruch 3 umfassen, wobei der Schritt des Aus- wählens von Frequenzen (S5) folgende Schritte umfasst: el) Multiplizieren der transformierten Schallsignale mit der Binärmaske (S5.1), um maskierte Schallsignale zu erhalten;

e2) Anwenden eines Peak-Detection-Verfahrens (S5.2) auf die maskierten Schallsignale, um die Quellenfre quenzen der aktiven Quellen zu erhalten.

7. Verfahren (1) nach einem der vorherigen Ansprüche, wobei der Schritt des Schützens von Phasenversätzen (S6) folgen de Schritte umfasst:

fl) Schätzen einer räumlichen Kovarianz (S6.1) für jede Quellenfrequenz, um geschätzte räumliche Kovarian zen zu erhalten;

f2) Schätzen eines Einfallswinkelspektrums (S6.2) für jede Quellenfrequenz aus den geschätzten räumlichen Kovarianzen, um geschätzte Einfallswinkelspektren zu erhalten;

f3) Bilden eines geometrischen Mittelwerts (S6.3) zwischen den geschätzten Einfallswinkelspektren, um je weils ein einzelnes Einfallswinkelspektrum für jedes Mikrofonarray zu erhalten;

f4) Extrahieren der stärksten Peaks aus den einzelnen

Einfallswinkelspektren (S6.4), um für jede aktive Quel le den geschätzten Einfallswinkel zu erhalten.

8. Vorrichtung (10) zum Lokalisieren und Verfolgen von akus tischen aktiven Quellen (11), umfassend:

mindestens zwei Mikrofonarrays (13) bestehend aus je weils mindestens zwei Mikrofonen (14), die eingerichtet sind, um Schallsignale (15) aufzunehmen;

ein Zeit-Frequenz-Analyse-Modul (16.1), das eingerich tet ist, um die aufgenommenen Schallsignale in den Zeit-Frequenz-Bereich zu transformieren; ein Detektionsmodul (16.2), das eingerichtet ist, um Detektionen in den transformierten Schallsignalen mit tels eines Hypothesentests zu ermitteln und um eine Teststatistik basierend auf den Detektionen zu erhal ten;

ein Quellenmodul (16.3), das eingerichtet ist, um akti ve Quellen in der Teststatistik mittels eines binären Hypothesentests im Zeitbereich zu ermitteln;

ein Frequenzmodul (16.4), das eingerichtet ist, um Fre quenzen in den transformierten Schallsignalen basierend auf der Amplitude der jeweiligen Frequenzen auszuwählen und um Quellenfrequenzen der aktiven Quellen basierend auf den ausgewählten Frequenzen zu erhalten;

ein Winkelmodul (16.5), das eingerichtet ist, um Pha senversätze mit Hilfe der transformierten Schallsignale und der Quellenfrequenzen zu schätzen und um für jede aktive Quelle einen geschätzten Einfallswinkel basie rend auf den Phasenversätzen zu erhalten;

ein Verfolgungsmodul (16.6), das eingerichtet ist, um eine Position und eine Geschwindigkeit zumindest einer der aktiven Quellen der Quellenstatistik im Zustands raum gemeinsam zu schätzen, wobei ein lineares Bewe gungsmodell der aktiven Quelle angenommen wird und eine nichtlineare Funktion, welche die geschätzten Einfalls winkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, verwendet wird.

9. Vorrichtung (10) nach Anspruch 8, wobei das Detektionsmo dul (16.2) ferner eingerichtet ist,

um die spektrale Leistungsdichte von Hintergrundgeräu schen in den transformierten Schallsignalen zu schät zen; um die transformierten Schallsignale durch die ge schätzte spektrale Leistungsdichte zu dividieren, um die Teststatistik zu erhalten.

10. Vorrichtung (10) nach Anspruch 9, wobei das Detektions modul (16.2), um eine maskierte Teststatistik zu ermit teln, ferner eingerichtet ist,

um einen Schwellwert anhand der geschätzten spektralen Leistungsdichte zu schätzen, um einen ersten Schwell wert zu erhalten;

um Detektionen in der Teststatistik zu ermitteln, wobei nur Amplitudenwerte in der Teststatistik, die größer oder gleich dem ersten Schwellwert sind, als Detektion gewertet werden und die übrigen Amplitudenwerte zu null gesetzt werden, um eine Binärmaske zu erhalten;

um eine morphologischen Filterung oder ein Soft-Max- Verfahren der ermittelten Detektionen der Binärmaske durchzuführen, um eine gefilterte Binärmaske zu erhal ten;

um die Teststatistik mit der gefilterten Binärmaske zu multiplizieren, um eine maskierte Teststatistik zu er halten .

11. Vorrichtung (10) nach Anspruch 10, wobei das Detekti onsmodul (16.2) ferner eingerichtet ist,

um eine morphologischen Öffnung durchzuführen, wobei Amplitudenwerte der ermittelten Detektionen der Binär maske, die keine ermittelte Detektion in benachbarten Zeit-Frequenz-Punkten aufweisen, zu null gesetzt wer den, um „morphologisch geöffnete Detektionen" zu erhal ten und/oder

um eine morphologischen Schließung durchzuführen, wobei Amplitudenwerte der ermittelten Detektionen der Binär- maske, die ermittelte Detektionen in benachbarten Zeit- Frequenz-Punkten aufweisen, zu eins gesetzt werden, um „morphologisch geschlossene Detektionen" zu erhalten.

12. Vorrichtung (10) nach einem der Ansprüche 8 bis 11, wo bei das Quellenmodul (16.3) ferner eingerichtet ist,

um die Teststatistik in den Zeitbereich zu projizieren; um einen Schwellwert anhand der projizierten Teststa tistik zu schätzen, um einen zweiten Schwellwert zu er halten;

um aktive Quellen in der projizierten Teststatistik zu ermitteln, wobei nur Werte in der projizierten Teststa tistik, die größer oder gleich dem zweiten Schwellwert sind, als aktive Quellen gewertet werden und die übri gen Werte zu null gesetzt werden, um die aktiven Quel len zu erhalten.

13. Vorrichtung (10) nach einem der Ansprüche 10 oder 11 bis 12, sofern diese Anspruch 10 umfassen, wobei das Fre quenzmodul (16.4) ferner eingerichtet ist,

um die transformierten Schallsignale mit der Binärmaske zu multiplizieren, um maskierte Schallsignale zu erhal ten;

um ein Peak-Detection-Verfahren auf die maskierten Schallsignale anzuwenden, um die Quellenfrequenzen der aktiven Quellen zu erhalten.

14. Vorrichtung (10) nach einem der vorherigen Ansprüche, wobei das Winkelmodul (16.5) ferner eingerichtet ist,

um eine räumlichen Kovarianz für jede Quellenfrequenz zu schätzen, um geschätzte räumliche Kovarianzen zu er halten; ein Einfallswinkelspektrum für jede Quellenfrequenz aus den geschätzten räumlichen Kovarianzen zu schätzen, um geschätzte Einfallswinkelspektren zu erhalten;

um einen geometrischen Mittelwert zwischen den ge schätzten Einfallswinkelspektren zu bilden, um jeweils ein einzelnes Einfallswinkelspektrum für jedes Mikro- fonarray zu erhalten;

um die stärksten Peaks aus den einzelnen Einfallswin kelspektren zu extrahieren, um für jede aktive Quelle den geschätzten Einfallswinkel zu erhalten.

15. Fahrzeug (12) umfassend eine Vorrichtung (10) gemäß ei nem der vorherigen Ansprüche 8 bis 14 und zumindest ein Fahrerassistenzsystem (17), wobei die zumindest eine ge schätzte Position und Geschwindigkeit zumindest einer der aktiven Quellen von der Vorrichtung (10) an das Fahreras sistenzsystem (17) übertragen wird.

Description:
Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen bzw. akustischer Signale. Insbesondere sind das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung zum Lokalisie ren und Verfolgen akustischer aktiver Quellen im Straßenver kehr geeignet.

In Fahrzeugen kommen vermehrt Fahrerassistenzsysteme zum Ein satz und autonomes Fahren ist ein Entwicklungsschwerpunkt. Um solchen Fahrerassistenzsystemen, wie automatischer Kollisi onswarnung, automatischem Bremsen oder automatischem Auswei chen und ähnlichen, aber auch Systemen für autonomes Fahren Daten über Position und/oder Geschwindigkeit von Objekten in der Umgebung eines Fahrzeugs bereitstellen zu können, werden Sensoren wie Kameras, LiDAR, Ultraschallsensoren und der gleichen eingesetzt.

Insbesondere die Verarbeitung von Bilddaten und die Ermitt lung von Position und/oder Geschwindigkeit von Objekten dar aus, sind sehr kompliziert und rechenaufwendig. Allgemein sind für die Bereitstellung und Verarbeitung von Daten bezüg lich der Position und/oder Geschwindigkeit von Objekten ins besondere in Fahrzeugen im Straßenverkehr die Echtzeitfähig- keit und möglichst geringe vorbestimmte Annahmen von großer Bedeutung. Es muss möglich sein, das Verfahren echtzeitfähig auf gegebener Hardware von Fahrzeugen zu implementieren bzw. in bestehende Fahrzeuge zu integrieren. Daher darf zum einen das Verfahren keine zu rechenaufwändigen Algorithmen, wie z. B. maschinelles Lernen, beinhalten. Zum anderen dürfen keine Algorithmen verwendet werden, welche den gesamten Da- tensatz (alle Daten einer längeren Signalaufnahme) benötigen, um eine erfolgreiche Detektion oder Lokalisation durchzufüh ren. Zudem gilt, dass akustische Quellen, welche im Straßen verkehr auftreten, verschiedenste spezifische Eigenschaften besitzen. Zum Beispiel handelt es sich bei einer Sirene (Feu erwehr, Polizei, Krankenwagen) um ein schmalbandiges Signal. Das Motorengeräusch eines vorbeifahrenden Autos hat jedoch eine breitbandige Charakteristik. Bei dem Aufprall eines Au tos hingegen handelt es sich um ein impulsives Geräusch. Die se Beispiele dienen nur der Veranschaulichung, wie divers die Eigenschaften der zu detektierenden und zu lokalisierenden Quellen sind. Weiterhin können sich diese Eigenschaften auch über die Zeit verändern. Aus diesen Gründen sollten keine An nahmen über die Eigenschaften der Quelle gemacht, sondern al le Informationen aus den aufgenommenen Daten inferiert wer den. Genauso wie die Eigenschaften der Quellen sind auch die Eigenschaften der Störgeräusche sehr divers und können des halb nicht ohne weiteres a priori modelliert werden. Beson ders das Frequenzverhalten der Störungen hängt sehr stark von der konkreten Situation ab. Aus demselben Grund wie bei den Eigenschaften der Quellen sollten hier alle notwendigen In formationen direkt aus den Daten geschätzt werden.

Die vorliegende Erfindung löst daher die Aufgabe, ein Verfah ren und eine Vorrichtung zum Lokalisieren und Verfolgen akus tischer aktiver Quellen bzw. akustischer Signale bereitzu stellen, die zuvor genannte Probleme löst oder zumindest ab schwächt .

Diese Aufgabe wird durch das Verfahren gemäß Patentanspruch 1 sowie die Vorrichtung gemäß dem weiteren unabhängigen An spruch gelöst. Vorteilhafte Weiterbildungen und Ausführungs- formen der vorliegenden Erfindung sind Gegenstand der abhän gigen Patentansprüche.

Die vorliegende Erfindung stellt ein Verfahren und eine Vor richtung zur passiv akustischen Ortung von anderen Teilneh mern im Straßenverkehr bereit, wobei mehrere Mikrofone in mehreren Gruppen (Mikrofonarrays ) planar in der Ebene ange ordnet sind. Zudem ermöglicht die vorliegende Erfindung die Detektion von Zielen bzw. aktiven Quellen gegenüber Hinter grundgeräuschen durch eine spektrale Signatur und ein Mehr schwellenverfahren in Frequenz- und Zeitbereich.

Das erfindungsgemäße Verfahren zum Lokalisieren und Verfolgen akustischer aktiver Quellen, umfasst die folgenden Schritte: a) Aufnehmen von Schallsignalen mit mindestens zwei Mikro- fonarrays bestehend aus jeweils mindestens zwei Mikrofonen, um aufgenommene Schallsignale zu erhalten.

b) Transformieren der aufgenommenen Schallsignale in den Zeit-Frequenz-Bereich, um transformierte Schallsignale zu er halten .

c) Ermitteln von Detektionen in den transformierten

Schallsignalen mittels eines Hypothesentests, um eine Test statistik zu erhalten.

d) Ermitteln von aktiven Quellen in der Teststatistik mit tels eines binären Hypothesentests im Zeitbereich.

e) Auswählen von Frequenzen in den transformierten Schall signalen basierend auf der Amplitude der jeweiligen Frequen zen, um Quellenfrequenzen der aktiven Quellen zu erhalten. f) Schätzen von Phasenversätzen mit Hilfe der transfor mierten Schallsignale und der Quellenfrequenzen, um für jede aktive Quelle einen geschätzten Einfallswinkel zu erhalten. g) Gemeinsames Schätzen einer Position und einer Geschwin digkeit zumindest einer der aktiven Quellen der Quellensta- tistik im Zustandsraum, wobei ein lineares Bewegungsmodell der aktiven Quelle angenommen wird und eine nichtlineare Funktion, welche die geschätzten Einfallswinkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, ver wendet wird.

Das Verfahren ist insbesondere vorteilhaft für die Ermittlung von Gegenständen und Gefahren (wie z. B. Fußgänger, Fahrrä der, Kraftfahrzeuge und weitere aktive oder passive Verkehrs teilnehmer) im Straßenverkehr anhand ihrer Schallsignale (Be triebsgeräusche, Warnsignale und dergleichen) . Vor allem in Fahrerassistenzsystemen, wie Kollisionswarnung, automatischem Bremsassistenten, autonomem Fahren und dergleichen, von Fahr zeugen können die Informationen über ermittelte Gegenstände und Gefahren aus dem erfindungsgemäßen Verfahren verwendet werden .

Die mindestens zwei Mikrofonarrays sind in einem Abstand zu einander angeordnet. Dabei sind die Mikrofonarrays bevorzugt planar in einer Ebene angeordnet, die bevorzugt eine horizon tale Ebene sein kann. Weiter können die Mikrofonarrays bevor zugt parallel zueinander ausgerichtet sein. Weiterhin bevor zugt sind die Mikrofonarrays in einem Abstand von 70 Zentime tern ( [cm] ) bis 90 [cm] und besonders bevorzugt in einem Ab stand von 80 [cm] +/- 1 [cm] angeordnet. Durch den Abstand zwischen den Mikrofonarrays erreichen Schallwellen je nach der Position der Quelle, von der die Schallwellen ausgesendet wurden, zu unterschiedlichen Zeiten die einzelnen Mikro- fonarrays. Aus diesem Laufzeitunterschied zwischen den

Schallsignalen an den einzelnen Mikrofonen lässt sich der Einfallswinkel der Schallsignale von der Quelle relativ zu den Mikrofonarrays ermitteln. Hieraus lässt sich über das Prinzip der Triangulation die Position der Quelle ermitteln. Jedes Mikrofonarray muss aus mehreren Mikrofonen gebildet werden. Der Abstand der einzelnen Mikrofone eines Mikro- fonarrays zueinander kann bevorzugt 4 [cm] +/- 0,5 [cm] be tragen. Die einzelnen Mikrophone eines Mikrofonarrays können weiter bevorzugt in eine Ebene angeordnet und/oder parallel zueinander ausgerichtet sein. Die Anzahl der Mikrofone trägt zu der Präzision der Schallortung bei, wobei mit steigender Anzahl der Mikrophone eines Mikrofonarrays die Präzision der Ortung der Quelle der Schallsignale steigt.

Die aufgenommenen Schallsignale werden für die weitere Sig nalverarbeitung in den Zeit-Frequenz-Bereich transformiert. Die Transformation der aufgenommenen Schallsignale in den Zeit-Frequenz-Bereich erfolgt bevorzugt mittels einer schnel len Fourier-Transformation (Fast Fourier Transformation,

FFT) .

Zur Diskriminierung der Detektionen der Schallquellen von Hintergrundgeräuschen wird eine Hypothese aufgestellt. Je nachdem, ob ein Schallsignal im Zeit-Frequenz-Bereich auf grund seiner Frequenz den Hypothesentest besteht, wird eine Detektion erkannt. Der Hypothesentest wird mithilfe einer Teststatistik im Zeit-Frequenz-Bereich durchgeführt.

Die aktiven Quellen werden aus den Detektionen in der Test statistik mit einem binären Hypothesentest ermittelt. Dabei werden zeitliche Häufungen von Detektionen als eine aktive Quelle identifiziert.

Aus den transformierten Schallsignalen wird basierend auf der Amplitude der jeweiligen Frequenzen jeweils nur die mindes tens eine stärkste Frequenz jeder einzelnen der aktiven Quel len als deren mindestens eine Quellenfrequenz ausgewählt. Basierend auf den transformierten Schallsignalen und den aus gewählten Quellenfrequenzen wird der Phasenversatz bzw. der Laufzeitunterschied der Schallsignale der aktiven Quellen an den Mikrofonarrays abgeschätzt. Basierend auf dem geschätzten Phasenversatz bzw. Laufzeitunterschied wird für jede Quellen frequenz und somit für jede aktive Quelle ein Einfallswinkel bezüglich jedem der Mikrofonarrays bestimmt.

Im Zustandsraum wird gemeinsam die Position und Geschwindig keit (Zustand) jeder aktiven Quelle geschätzt, in dem für je de aktive Quelle ein lineares Bewegungsmodell angenommen wird. Diese linearen Bewegungsmodelle sind bei abhängig von der Abtastrate des Verfahrens hinreichend genau. Bevorzugt beträgt die Abtastrate mindestens 8000 Hertz ([Hz]). Es wird bevorzugt eine nichtlineare Funktion verwendet, um die Ein fallswinkel der aktiven Quellen und die Zustände (Position und Geschwindigkeit) der einzelnen aktiven Quellen ins Ver hältnis zu setzen. Somit kann für jeden Zeitschrift nur aus den aktuellen Daten und den Daten aus dem Zeitschrift davor gemeinsam die Position und die Geschwindigkeit, also der zu- stand jeder einzelnen aktiven Quelle geschätzt werden.

Es kann auch eine Aussage über die Unsicherheit der Schätzung der Position und der Geschwindigkeit (des Zustands) jeder ak tiven Quelle getroffen werden. Diese Aussage kann für die weitere Verarbeitung in einem Fahrerassistenzsystem eines Fahrzeugs wie dem autonomen Fahren wichtig sein.

Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Ermittelns von Detektionen folgende Schritte: cl) Schätzen der spektralen Leistungsdichte von Hinter grundgeräuschen in den transformierten Schallsignalen, um ei ne geschätzte spektrale Leistungsdichte zu erhalten.

c2) Dividieren der transformierten Schallsignale durch die geschätzte spektrale Leistungsdichte, um die Teststatistik zu erhalten .

In einem Zeitraum ohne aktive Quellen wird aus den aufgenom menen Schallsignalen über eine vorgegebene Dauer die spektra le Leistungsdichte der Hintergrundgeräusche ermittelt und so mit geschätzt. Die geschätzte spektrale Leistungsdichte wird abgespeichert und in den nachfolgenden Schritten weiterver wendet .

Die transformierten Schallsignale werden in die Teststatistik umgewandelt, indem die Schallsignale durch die geschätzte spektrale Leistungsdichte der Hintergrundgeräusche dividiert werden .

Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens wird im Schritt des Ermittelns von Detektionen ei ne maskierte Teststatistik ermittelt und dieser Schritt um fasst die die folgenden Schritte:

c3) Schätzen eines Schwellwertes anhand der geschätzten spektralen Leistungsdichte, um einen ersten Schwellwert zu erhalten;

c4) Ermitteln von Detektionen in der Teststatistik, wobei nur Amplitudenwerte in der Teststatistik, die größer oder gleich dem ersten Schwellwert sind, als Detektion gewertet werden und die übrigen Amplitudenwerte zu null gesetzt wer den, um eine Binärmaske zu erhalten; c5) Durchführen einer morphologischen Filterung (S3.5) der ermittelten Detektionen der Binärmaske, um eine gefilterte Binärmaske zu erhalten;

c6) Multiplizieren der Teststatistik mit der gefilterten Binärmaske (S3.6), um eine maskierte Teststatistik zu erhal ten .

Basierend auf der geschätzten spektralen Leistungsdichte wird ein erster Schwellwert für Amplitudenwerte abgeschätzt und gespeichert .

In der Teststatistik werden nur Amplitudenwerte die größer oder gleich dem ersten Schwellwert sind als ermittelte Detek tionen gewertet bzw. markiert woraus sich die Binärmaske ergibt. Die übrigen Amplitudenwerte werden zu null gesetzt.

Durch die morphologische Filterung oder ein Soft-Max- Verfahren werden nur Häufungen von Amplitudenwerten in der Binärmaske zu eins und alle anderen Amplitudenwerte, die nicht in Häufungen auftreten, gleich null gesetzt, sodass ei ne gefilterte Binärmaske entsteht. Dies dient der Vermeidung von Fehlern 1. Art und Fehlern 2. Art.

Die Teststatistik wird mit der Binärmaske multipliziert wodurch eine maskierte Teststatistik erhalten wird in der nur die Amplitudenwerte der Detektionen enthalten sind.

Zum einen wird dadurch die Teststatistik an Zeit-Frequenz- Punkten, welche sicher keine aktive Quelle darstellen, zu null gesetzt. Zum anderen wird bei Zeit-Frequenz-Punkten, welche potentiell zu einer aktiven Quelle gehören der Grad der Sicherheit erhalten ob es sich um eine Quelle handelt o- der nicht. Diese Information ist für die nachfolgenden

Schritte essentiell.

Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Durchführens einer morpho logischen Filterung mindestens einen der folgenden Schritte: c5.1) Durchführen einer morphologischen Öffnung, wobei

Amplitudenwerte der ermittelten Detektionen der Binärmaske, die keine ermittelte Detektion in benachbarten Zeit-Frequenz- Punkten aufweisen, zu null gesetzt werden, um „morphologisch geöffnete Detektionen" zu erhalten.

c5.2) Durchführen einer morphologischen Schließung, wobei Amplitudenwerte der ermittelten Detektionen der Binärmaske, die ermittelte Detektionen in benachbarten Zeit-Frequenz- Punkten aufweisen, zu eins gesetzt werden, um „morphologisch geschlossene Detektionen" zu erhalten.

Nur ermittelte Detektionen, die in einer gewissen Häufung bzw. über eine gewisse Zeitdauer hinweg, also mit einer ge wissen Anzahl an benachbarten ermittelten Detektionen auftre- ten werden zu eins gesetzt. Vereinzelte ermittelte Detektio nen werden zu null gesetzt. Somit können Störgeräusche und Artefakte vermieden werden. Dies hängt zum einen mit der Art der morphologischen Filterung zusammen. Zum anderen hängt es auch mit der Art des detektierten Schallsignals zusammen. Ein impulsives Signal (wie z. B. ein Klatschen) würde, obwohl es eine kurze Zeitdauer hat, nicht entfernt werden da es eine große Ausdehnung im Frequenzbereich besitzt. Ein reines Si nussignal, welches nur aus einer einzelnen Frequenz besteht, würde auch nicht zu null gesetzt werden, da es über eine lan ge Zeit aktiv ist. Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Ermittelns von aktiven Quellen folgende Schritte:

dl) Projizieren der Teststatistik in den Zeitbereich, um eine projizierte Teststatistik zu erhalten.

d2) Schätzen eines Schwellwerts anhand der projizierten Teststatistik, um einen zweiten Schwellwert zu erhalten.

d3) Ermitteln von aktiven Quellen in der projizierten Test statistik, wobei nur Werte in der projizierten Teststatistik, die größer oder gleich dem zweiten Schwellwert sind, als ak tive Quellen gewertet werden und die übrigen Werte zu null gesetzt werden, um die aktiven Quellen zu erhalten.

Die Teststatistik bzw. die maskierte Teststatistik wird zu rück in den Zeit-Bereich projiziert. Die Projektion in den Zeitbereich erfolgt indem die maskierte Teststatistik über die Frequenz summiert wird um eine Summenstatistik zu erhal ten .

In der projizierten Teststatistik wird ein zweiter Schwell wert abgeschätzt und gespeichert. Der Schwellwert wird dabei so bestimmt, dass eine vorgegebene Schranke für eine Falscha larmrate eingehalten (d.h. nicht überschritten) wird.

Die Werte bzw. Amplitudenwerte in der projizierten Teststa tistik, die nicht größer oder gleich dem zweiten Schwellwert sind, werden nicht als aktive Quellen gewertet und zu null gesetzt, so dass die Falschalarmrate die vorgegebenen Schran ke nicht überschreitet.

Nach diesem Schritt ist es nun möglich zu ermitteln zu wel chen Zeitpunkten mindestens eine akustische Quelle aktiv ist. Diese Information ist für die Lokalisation und Zielverfolgung notwendig, da nur eine Position und später eine Geschwindig keit inferiert werden soll, falls auch eine akustische Quelle aktiv ist.

Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Auswählens von Frequenzen folgende Schritte:

el) Multiplizieren der transformierten Schallsignale mit der Binärmaske, um maskierte Schallsignale zu erhalten.

e2) Anwenden eines Peak-Detection-Verfahrens auf die mas kierten Schallsignale, um die Quellenfrequenzen der aktiven Quellen zu erhalten.

Die transformierten Schallsignale werden in maskierte Schall signale verarbeitet, indem die Binärmaske mit den transfor mierten Schallsignalen multipliziert wird.

Auf die maskierten Schallsignale wird ein Peak-Detection- Verfahren angewendet. Damit werden nur die Frequenzen mit den stärksten Amplituden herausgefiltert. Diese stellen jeweils zumindest eine der Quellenfrequenzen einer der aktiven Quel len dar.

Basierend auf den Quellenfrequenzen können die Richtungen, aus welcher Schallsignale der aktiven Quellen auf den Mikro- fonarrays auftreffen, über Zeitverzögerungen (Laufzeitunter schiede) zwischen den einzelnen Mikrofonarrays geschätzt wer den .

Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Schätzens von Phasenver sätzen folgende Schritte: fl) Schätzen einer räumlichen Kovarianz für jede Quellen frequenz, um geschätzte räumliche Kovarianzen zu erhalten. f2) Schätzen eines Einfallswinkelspektrums für jede Quel lenfrequenz aus den geschätzten räumlichen Kovarianzen, um geschätzte Einfallswinkelspektren zu erhalten.

f3) Bilden eines geometrischen Mittelwerts zwischen den ge schätzten Einfallswinkelspektren, um jeweils ein einzelnes Einfallswinkelspektrum für jedes Mikrofonarray zu erhalten. f4) Extrahieren der stärksten Peaks aus den einzelnen Ein fallswinkelspektren, um für jede aktive Quelle den geschätz ten Einfallswinkel zu erhalten.

Es wird eine räumliche Kovarianz-Matrix, welche die Korrela tion der einzelnen im Raum verteilten Mikrofone beschreibt (in Analogie zur zeitlichen Kovarianz, welche die Korrelation eines Signals über die Zeit beschreibt), für jede Quellenfre quenz geschätzt. Zur Schätzung der Kovarianz-Matrix wird die Stichprobenvarianz verwendet. Dies ist notwendig um die spä teren Einfallswinkel der Quelle zu schätzen.

Basierend auf den geschätzten räumlichen Kovarianzen werden Einfallswinkelspektren für die aktiven Quellen geschätzt.

Zum Schätzen der Einfallswinkel wird der MUSIC Algorithmus (Schmidt 1979) verwendet.

Aus den einzelnen Einfallswinkelspektren wird jeweils ein Einfallswinkelspektrum für jedes Mikrofonarray erzeugt, indem jeweils ein geometrischer Mittelwert aus den einzelnen Ein fallswinkelspektren erzeugt wird.

Aus den einzelnen Einfallswinkelspektren, welche die Vertei lung der Leistung über den Raumwinkel darstellen (in Analogie zum Spektrum, bei dem die Leistung über die Frequenz ermit- telt wird, werden nur die stärksten Peaks, d.h. die Einfalls winkel mit der höchsten Leistungsdichte, herausgenommen. Aus den stärksten Peaks wird für jede aktive Quelle der geschätz ten Einfallswinkel ermittelt.

Diese Schritte stellen die Grundvoraussetzung für die folgen den Schritte da, da die Einfallswinkel für die spätere Zie lortung und - V erfolgung notwendig sind.

Mit der vorliegenden Erfindung ist somit eine Richtungserken nung und Zielverfolgung dadurch möglich, dass der MUSIC- Algorithmus mit einem Kalman- oder Partikelfilter kombiniert wird .

Die verwendeten Verfahren wurden an die Anforderung zuge schnitten. Die geschieht insbesondere durch die Vorverarbei tung, welche im Gegensatz zu etablierten Verfahren, keinerlei Modellannahmen voraussetzt. Insbesondere betrifft dies die Detektion von aktiven Quellen, sowie die Ermittlung der akti ven Frequenzen, welche nicht a priori bekannt sein müssen, aber Grundlage für die weitere Verarbeitung sind.

Die erfindungsgemäße Vorrichtung zum Lokalisieren und Verfol gen von akustischen aktiven Quellen umfasst als Module min destens zwei Mikrofonarrays , ein Zeit-Frequenz-Analyse-Modul , ein Detektionsmodul, ein Quellenmodul, ein Frequenzmodul, ein Winkelmodul und ein Verfolgungsmodul. Die mindestens zwei Mikrofonarrays bestehen aus jeweils mindestens einem Mikrofon und sind eingerichtet, um Schallsignale aufzunehmen. Das Zeit-Frequenz-Analyse-Modul ist eingerichtet, um die aufge nommenen Schallsignale in den Zeit-Frequenz-Bereich zu trans formieren. Das Detektionsmodul ist eingerichtet, um Detektio nen in den transformierten Schallsignalen mittels eines Hypo thesentests zu ermitteln und um eine Teststatistik basierend auf den Detektionen zu erhalten. Das Quellenmodul ist einge richtet, um aktive Quellen in der Teststatistik mittels eines binären Hypothesentests im Zeitbereich zu ermitteln. Das Fre quenzmodul ist eingerichtet, um Frequenzen in den transfor mierten Schallsignalen basierend auf der Amplitude der jewei ligen Frequenzen auszuwählen und um Quellenfrequenzen der ak tiven Quellen basierend auf den ausgewählten Frequenzen zu erhalten. Das Winkelmodul ist eingerichtet, um Phasenversätze mit Hilfe der transformierten Schallsignale und der Quellen frequenzen zu schätzen und um für jede aktive Quelle einen geschätzten Einfallswinkel basierend auf den Phasenversätzen zu erhalten. Das Verfolgungsmodul ist eingerichtet, um eine Position und eine Geschwindigkeit zumindest einer der aktiven Quellen der Quellenstatistik im Zustandsraum gemeinsam zu schätzen, wobei ein lineares Bewegungsmodell der aktiven Quelle angenommen wird und eine nichtlineare Funktion, welche die geschätzten Einfallswinkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, verwendet wird.

Die Vorrichtung ist insbesondere vorteilhaft für die Ermitt lung von Gegenständen und Gefahren (wie z. B. Fußgänger, Fahrräder, Kraftfahrzeuge und weitere aktive oder passive Verkehrsteilnehmer) im Straßenverkehr anhand ihrer Schallsig nale (Betriebsgeräusche, Warnsignale und dergleichen) . Vor allem in Fahrerassistenzsystemen, wie Kollisionswarnung, au tomatischem Bremsassistenten, autonomem Fahren und derglei chen, von Fahrzeugen können die Informationen über ermittelte Gegenstände und Gefahren aus dem erfindungsgemäßen Verfahren verwendet werden.

Die mindestens zwei Mikrofonarrays sind in einem Abstand zu einander angeordnet. Dabei sind die Mikrofonarrays bevorzugt planar in einer Ebene angeordnet, die bevorzugt eine horizon- tale Ebene sein kann. Weiter können die Mikrofonarrays bevor zugt parallel zueinander ausgerichtet sein. Weiterhin bevor zugt sind die Mikrofonarrays in einem Abstand von 70 Zentime tern ( [cm] ) bis 90 [cm] und besonders bevorzugt in einem Ab stand von 80 [cm] +/- 1 [cm] angeordnet. Durch den Abstand zwischen den Mikrofonarrays erreichen Schallwellen je nach der Position der Quelle, von der die Schallwellen ausgesendet wurden, zu unterschiedlichen Zeiten die einzelnen Mikro- fonarrays. Aus diesem Laufzeitunterschied zwischen den

Schallsignalen an den einzelnen Mikrofonen lässt sich der Einfallswinkel Schallsignale von der Quelle relativ zu den Mikrofonarrays ermitteln. Hieraus lässt sich über das Prinzip der Triangulation die Position der Quelle ermitteln. Jedes Mikrofonarray muss aus mehreren Mikrofonen gebildet werden. Der Abstand der einzelnen Mikrofone eines Mikrofonarrays zu einander kann bevorzugt 4 [cm] +/- 0,5 [cm] betragen. Die einzelnen Mikrophone eines Mikrofonarrays können weiter be vorzugt in eine Ebene angeordnet und/oder parallel zueinander ausgerichtet sein. Die Anzahl der Mikrofone trägt zu der Prä zision der Schallortung bei, wobei mit steigender Anzahl der Mikrophone eines Mikrofonarrays die Präzision der Ortung der Quelle der Schallsignale steigt.

Die aufgenommenen Schallsignale werden für die weitere Sig nalverarbeitung von dem Zeit-Frequenz-Analyse-Modul in den Zeit-Frequenz-Bereich transformiert. Die Transformation der aufgenommenen Schallsignale in den Zeit-Frequenz-Bereich er folgt bevorzugt mittels einer FFT.

Zur Diskriminierung der Detektionen der Schallquellen von Hintergrundgeräuschen durch das Detektionsmodul wird eine Hy pothese aufgestellt. Je nachdem, ob ein Schallsignal im Zeit- Frequenz-Bereich aufgrund seiner Frequenz den Hypothesentest besteht, wird eine Detektion erkannt. Aus den Detektionen wird eine Teststatistik im Zeit-Frequenz-Bereich erstellt.

Die aktiven Quellen werden von dem Quellenmodul aus den De tektionen in der Teststatistik mit einem binären Hypothesen test ermittelt. Dabei werden zeitliche Häufungen von Detekti onen als eine aktive Quelle identifiziert.

Aus den transformierten Schallsignalen wird von dem Frequenz modul basierend auf der Amplitude der jeweiligen Frequenzen jeweils nur die mindestens eine stärkste Frequenz jeder ein zelnen der aktiven Quellen als deren mindestens eine Quellen frequenz ausgewählt.

Basierend auf den transformierten Schallsignalen und den aus gewählten Quellenfrequenzen wird von dem Winkelmodul der Pha senversatz bzw. der Laufzeitunterschied der Schallsignale der aktiven Quellen an den Mikrofonarrays abgeschätzt. Basierend auf dem geschätzten Phasenversatz bzw. Laufzeitunterschied wird für jede Quellenfrequenz und somit für jede aktive Quel le ein Einfallswinkel bezüglich jedem der Mikrofonarrays be stimmt .

Im Zustandsraum wird gemeinsam die Position und Geschwindig keit (Zustand) jeder aktiven Quelle von dem Verfolgungsmodul geschätzt, in dem für jede aktive Quelle ein lineares Bewe gungsmodell angenommen wird. Diese linearen Bewegungsmodelle sind bei abhängig von der Abtastrate des Verfahrens hinrei chend genau. Bevorzugt beträgt die Abtastrate mindestens 8000 Hertz ([Hz]). Es wird bevorzugt eine nichtlineare Funktion verwendet, um die Einfallswinkel der aktiven Quellen und die Zustände (Position und Geschwindigkeit) der einzelnen aktiven Quellen ins Verhältnis zu setzen. Somit kann für jeden Zeit- schritt nur aus den aktuellen Daten und den Daten aus dem Zeitschritt davor gemeinsam die Position und die Geschwindig keit, also der zustand jeder einzelnen aktiven Quelle ge schätzt werden.

Es kann auch eine Aussage über die Unsicherheit der Schätzung der Position und der Geschwindigkeit (des Zustands) jeder ak tiven Quelle getroffen werden. Diese Aussage kann für die weitere Verarbeitung in einem Fahrerassistenzsystem eines Fahrzeugs wie dem autonomen Fahren wichtig sein.

Die einzelnen Module der erfindungsgemäßen Vorrichtung können separate Datenverarbeitungseinrichtungen, wie z. B. Mikrocon troller (yC) , integrierte Schaltungen, anwendungsspezifische integrierte Schaltungen (Application-Specific Integrated Cir cuit, ASIC) , anwendungsspezifisches Standardprodukte (Appli cation-Specific Standard Products, ASSP) , digitale Signalpro zessoren (DSP), im Feld programmierbare (Logik- ) Gatter- Anordnung (Field Programmable Gate Arrays, FPGA) und derglei chen sein. Sie können gemeinsam auf einem oder auf mehreren solcher Datenverarbeitungseinrichtungen implementiert werden. Dabei können die einzelnen Module als Module eines Software programms ausgestaltet sein.

Die zuvor dargestellten Ausführungen bezüglich des erfin dungsgemäßen Verfahrens gelten auch für die erfindungsgemäße Vorrichtung. So können alle Schritte des Verfahrens und der vorteilhaften Weiterbildungen des erfindungsgemäßen Verfah rens durch die erfindungsgemäße Vorrichtung bzw. durch die entsprechenden Module der erfindungsgemäßen Vorrichtung aus geführt werden. Die Erfindung betrifft ferner ein Fahrzeug das eine Vorrich tung wie zuvor beschrieben und zumindest ein Fahrerassistenz system umfasst. Die zumindest eine geschätzte Position und Geschwindigkeit zumindest einer der aktiven Quellen von der Vorrichtung wird an das Fahrerassistenzsystem übertragen.

Das Fahrerassistenzsystem, wie Kollisionswarnung, automati scher Bremsassistent, autonomes Fahren und dergleichen, kann aus den geschätzten Positionen und Geschwindigkeiten der ak tiven Quellen Entscheidungen über die Unterstützung des Fah rers des Fahrzeugs treffen. So kann z. B. eine Warnung für den Fahrer oder ein automatisches Bremsen ausgelöst werden, wenn das Fahrzeug mit einer gewissen Geschwindigkeit einer aktiven Quelle zu nahe kommt.

KURZE BESCHREIBUNG DER FIGUREN

Fig.l zeigt ein Ablaufdiagramm des erfindungsgemäßen Verfah rens .

Fig.2 zeigt eine schematische Darstellung der erfindungsgemä ßen Vorrichtung in einem Fahrzeug.

AUSFÜHRLICHE BESCHREIBUNG DER FIGUREN

Die in den Figuren und deren Beschreibung dargestellten be vorzugten Ausführungsformen der vorliegenden Erfindung dienen lediglich dem besseren Verständnis der Erfindung, sind jedoch keinesfalls einschränkend auszulegen.

In Fig. 1 ist ein Verfahren 1 zum Lokalisieren und Verfolgen akustischer aktiver Quellen als Ablaufdiagramm dargestellt. Nach einer optionalen Initialisierung SO des Verfahrens 1 er- folgt eine kontinuierliche Aufnahme S1 von Schallsignalen mit mindestens zwei Mikrofonarrays . Darauf erfolgt ein Transfor mieren der aufgenommenen Schallsignale S2 in den Zeit- Frequenz-Bereich und ein Ermitteln von Detektionen S3 in den transformierten Schallsignalen mittels eines Hypothesentests, wobei eine Teststatistik erstellt wird. In der Teststatistik erfolgt ein Ermitteln von aktiven Quellen S4 mittels eines binären Hypothesentests im Zeitbereich. Anschließend erfolgt ein Auswahlen von Frequenzen S5 in den transformierten

Schallsignalen basierend auf der Amplitude der jeweiligen Frequenzen. Daraus resultieren Quellenfrequenzen der aktiven Quellen. Mit Hilfe der transformierten Schallsignale und der Quellenfrequenzen erfolgt ein Schätzen von Phasenversätzen S6, um für jede aktive Quelle einen geschätzten Einfallswin kel zu erhalten. Schließlich erfolgt im Zustandsraum ein ge meinsames Schätzen einer Position und einer Geschwindigkeit (Zustand) S7 zumindest einer der aktiven Quellen der Quellen statistik. Es wird dazu ein lineares Bewegungsmodell der ak tiven Quelle angenommen und eine nichtlineare Funktion, wel che die geschätzten Einfallswinkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, verwendet.

In Fig. 2 ist eine Vorrichtung 10 zum Lokalisieren und Ver folgen akustischer aktiver Quellen schematisch dargestellt. Von einer akustischen aktiven Quelle 11 in der Umgebung eines Fahrzeugs 12 mit zwei Mikrofonarrays 13 umfassend jeweils vier Mikrofone 14 werden Schallsignale 15 (z. B. Betriebsge räusche, Warnsignale und dergleichen) ausgesendet. Die

Schallsignale 15 werden von den Mikrofonen 14 der zwei Mikro- fonarrays 13 aufgenommen. Die aufgenommenen Schallsignale werden in einem Lokalisierungs- und Verfolgungsmodul 16 des Fahrzeugs 12 ausgewertet. Das Lokalisierungs- und Verfol gungsmodul 16 kann in einer Datenverarbeitungsanlage des Fahrzeugs 12 wie z. B. in dem Steuergerät ausgeführt sein. In dem Lokalisierungs- und Verfolgungsmodul ist ein Zeit- Frequenz-Analyse-Modul 16.1, das die aufgenommenen Schallsig nale der zwei Mikrofonarrays 13 empfängt, mit einem Detekti onsmodul 16.2 verbunden. Das Detektionsmodul 16.2 ist mit ei nem Quellenmodul 16.3 verbunden, welches wiederum mit einem Frequenzmodul 16.4 verbunden ist. An das Frequenzmodul ist ein Winkelmodul 16.5 und an dieses ein Verfolgungsmodul 16.6 angeschlossen. Von den Modulen 16.1 bis 16.6 werden aus den aufgenommenen Schallsignalen eine Position und eine Geschwin digkeit der aktiven Quelle 11 ermittelt und an ein Fahreras sistenzsystem 17 weitergeleitet. Das Fahrerassistenzsystem 17 kann aus der geschätzten Position und Geschwindigkeit der ak tiven Quelle 11 eine Entscheidung über die Unterstützung ei nes Fahrers des Fahrzeugs treffen. Es kann eine Warnung für den Fahrer oder ein automatisches Bremsen auslösen, wenn das Fahrzeug 12 mit einer gewissen Geschwindigkeit der aktiven Quelle 11 zu nahe kommt.

BEZUGSZEICHEN

I Verfahren

10 Vorrichtung

II aktive Quellen

12 Fahrzeug

13 Mikrofonarray

14 Mikrofon

15 Schallsignale

16 Lokalisierungs- und Verfolgungsmodul

16.1 Zeit-Frequenz-Analyse-Modul

16.2 Detektionsmodul

16.3 Quellenmodul

16.4 Frequenzmodul

16.5 Winkelmodul

16.6 Verfolgungsmodul

17 Fahrerassistenzsystem

51 Aufnehmen

52 Transformieren der aufgenommenen Schallsignale

53 Ermitteln von Detektionen

53.1 Schätzen der spektralen Leistungsdichte

53.2 Dividieren der transformierten Schallsignale

53.3 Schätzen eines Schwellwertes

53.4 Ermitteln von Detektionen

53.5 Durchführen einer morphologischen Filterung

53.6 Multiplizieren der Teststatistik mit der morpholo gisch gefilterten Binärmaske

54 Ermitteln von aktiven Quellen

54.1 Projizieren der Teststatistik

54.2 Schätzen eines Schwellwerts

54.3 Ermitteln von aktiven Quellen Auswählen von Frequenzen

Multiplizieren der transformierten Schallsignale mit der Binärmaske

Anwenden eines Peak-Detection-Verfahrens

Schätzen von Phasenversätzen

Schätzen einer räumlichen Kovarianz

Schätzen eines Einfallswinkelspektrums

Bilden eines geometrischen Mittelwerts

Extrahieren der stärksten Peaks aus den einzelnen Einfallswinkel Spektren

Gemeinsames Schätzen einer Position und einer Ge schwindigkeit