Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND COMMUNICATION DEVICE WITH MEANS FOR INTERFERENCE SUPPRESSION IN AUDIO SIGNALS
Document Type and Number:
WIPO Patent Application WO/2005/041615
Kind Code:
A1
Abstract:
The invention relates to a method for the operation of a communication device (13.1, 13.2, 13.4) and a communication device (13.1, 13.2, 13.4) with means for interference suppression in audio signals, whereby the communication device (13.1, 13.2, 13.4) broadcasts audio signals (8.1 to 8.3) into an environment (9) and records both said audio signals (8.1 to 8.3), including overlaid interference components caused by the environment, containing at least echoes (8.2) and reverberations (8.3) and audio signals (15.1 to 15.3) from an external noise source, preferably a communication device user (15), including the interference components (15.2 and 15.3) thereof, caused by the environment and a first algorithm (5) determines a spatial impulse reply (14) for the environment (9). The method for operation of a communication device and the communication device with means for interference suppression in audio signals is characterised in that a second interference suppression algorithm (16) is applied to the recorded audio signals (15.1 to 15.3), for the external noise source, preferably for the communication terminal user (15), which uses a reverberation time (T60) in the suppression, determined from the spatial impulse reply (14), provided by the first algorithm (5).

Inventors:
LORENZ FRANK (DE)
POERSCHMANN CHRISTOPH (DE)
Application Number:
PCT/EP2004/008999
Publication Date:
May 06, 2005
Filing Date:
August 11, 2004
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS AG (DE)
LORENZ FRANK (DE)
POERSCHMANN CHRISTOPH (DE)
International Classes:
H04R3/02; H04R27/00; (IPC1-7): H04R3/02
Foreign References:
US5263019A1993-11-16
US4066842A1978-01-03
Other References:
PATENT ABSTRACTS OF JAPAN vol. 1997, no. 01 31 January 1997 (1997-01-31)
Attorney, Agent or Firm:
SIEMENS AKTIENGESELLSCHAFT (München, DE)
Download PDF:
Claims:
Patentansprüche
1. Verfahren zum Betrieb eines Kommunikationsgerätes (13.1, 13.2, 13.4), wobei das Kommunikationsgerät (13.1, 13.2, 13.4) Audiosignale (8.1 bis 8. 3) an eine Umgebung (9) abstrahlt und einerseits diese Audiosignale (8.1 bis 8.3) einschließ lich umgebungsbedingter überlagerter Störanteile, die zu mindest Echo (8.2) und Nachhall (8.3) enthalten, wieder aufnimmt und andererseits Audiosignale (15.1 bis 15.3) einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenut zers (15), einschließlich deren umgebungsbedingter Stör anteile (15.2 und 15.3) aufnimmt, und die wiederaufgenommenen Audiosignale (8.1 bis 8.3) durch einen ersten Algorithmus (5) benutzt werden, um eine Raumimpulsantwort der Umgebung zu bestimmen, dadurch gekennzeichnet, däss auf die aufgenommenen Audiosignale (15.1 bis 15.3) der externen Schallquelle, vorzugsweise des Kommunikationsge rätenutzers (15), ein zweiter EntstörAlgorithmus (16) angewendet wird, der zur Entstörung eine Nachhallzeit (T60) verwendet, die er aus der durch den ersten Algo rithmus (5) bestimmten Raumimpulsantwort (14) ermittelt.
2. Verfahren gemäß dem voranstehenden Patentanspruch 1, dadurch gekennzeichnet, dass ausschließlich der erste Algorithmus (5) die Nachhallzeit (T60) bestimmt.
3. Verfahren gemäß dem voranstehenden Patentanspruch 1, dadurch gekennzeichnet, dass ausschließlich der zweite EntstörAlgorithmus (16) die Nachhallzeit (T60) bestimmt.
4. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 3, dadurch gekennzeichnet, dass die Nachhallzeit (T60) aus dem energetischen Abfall des Nachhalls (8.3) in der Raumimpulsantwort (14) berechnet wird.
5. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 4, dadurch gekennzeichnet, dass als erster Algorithmus ein AECAlgorithmus (5) (AEC = A coustic Echo Cancellation) verwendet wird.
6. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 5, dadurch gekennzeichnet, dass der zweite EntstörAlgorithmus (16) unter Ausnutzung der umgebungsabhängig bestimmten oder übernommenen Nachhall zeit (T60) die überlagerten Störanteile (15.2 und 15.3) aus dem aufgenommenen Audiosignal (15.1 bis 15.3) der ex ternen Schallquelle entfernt.
7. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 6, dadurch gekennzeichnet, dass zur Bestimmung der Nachhallzeit (T60) in Abhängigkeit der Frequenz die Raumimpulsantwort (14) gefiltert wird, vor zugsweise mit Bandpassfiltern.
8. Kommunikationsgerät (13.1, 13.2, 13.4) mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsge rät (13.1, 13.2, 13.4) über zumindest einen Lautsprecher (7) verfügt, der Audiosigna le (8.1 bis 8.3) an eine Umgebung (9) abstrahlt und weiterhin zumindest ein Mikrofon (10) aufweist, mit dem einerseits diese Audiosignale (8.1 bis 8.3) einschließ lich umgebungsbedingter überlagerter Störanteile, die zu mindest Echo (8.2) und Nachhall (8.3) enthalten, wieder aufgenommen werden und andererseits Audiosignale (15.1 bis 15.3) einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenut zers (15), einschließlich deren umgebungsbedingter Stör anteile (15.2, 15.3) aufgenommen werden, und im Kommunikationsgerät (13.1, 13.2, 13.4) ein erstes Mit tel (5) vorgesehen ist, das ein Mittel zur Berechnung ei ner Raumimpulsantwort der Umgebung aufweist, dadurch gekennzeichnet, dass ein zweites Mittel (16) für die aufgenommenen Audiosigna le (15.1 bis 15.3) der externen Schallquelle, vorzugswei se des Kommunikationsengerätenutzers (15), einschließlich deren umgebungsbedingter Störanteile (15.2, 15.3) ange ordnet ist, das ein Mittel zur Ermittlung der Nachhall zeit (T60) aufweist, das die Nachhallzeit (T60) ermit telt, die in der durch das erste Mittel (5) bestimmen der Raumimpulsantwort (14) enthalten ist.
9. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voran stehende Patentanspruch 8, dadurch gekennzeichnet, dass ausschließlich das erste Mittel (5) Programmmittel und/oder Programmmodule aufweist, die die Nachhallzeit (T60) bestimmen.
10. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voran stehende Patentanspruch 8, dadurch gekennzeichnet, dass ausschließlich das zweite Mittel (16) Programmmittel und/oder Programmmodule aufweist, die die Nachhallzeit (T60) bestimmen.
11. Kommunikationsgerät (13.1, 13. 2, 13.4) gemäß einem der voranstehende Patentansprüche 8 bis 10, dadurch gekennzeichnet, dass die Programmmittel und/oder Programmmodule des ersten Mittels einen AECAlgorithmus (5) (AEC = Acoustic Echo Cancelation) beinhalten.
12. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehende Patentansprüche 8 bis 11, dadurch gekennzeichnet, dass die Programmmittel und/oder Programmmodule des zweiten Mittels (16) einen Algorithmus beinhalten, der unter Aus nutzung der umgebungsabhängig bestimmten Nachhallzeit die überlagerten Störanteile (15.2 und 15.3) aus dem aufge nommenen Audiosignal (15.1 bis 15.3) der externen Schall quelle (15) entfernt.
13. 13 Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 12, dadurch gekennzeichnet, dass Bandpassfilter vorgesehen sind, die die Raumimpulsantwort (14) filtern und die Bestimmung der Nachhallzeit (T60) in Abhängigkeit der Frequenz ermöglichen.
14. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 13, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein Telefon ist.
15. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voran stehenden Patentanspruch 14, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein kabelge bundenes Telefon ist.
16. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 14, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein Mobilfunk endgerät ist.
17. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 13, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein elektri sches Haushaltgerät mit Mittel zur Spracheingabe und Sprachausgabe ist.
18. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 17, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein elektri sches Modul eines Fahrzeuges mit Mitteln zur Spracheinga be und Sprachausgabe ist.
Description:
VERFAHREN UND KOMMUNIKATIONSGERÄT MIT MITTELN ZUR ENTSTÖRUNG VON AUDIOSIGNALEN Die Erfindung betrifft ein Verfahren zum Betrieb eines Kommu- nikationsgerätes, wobei das Kommunikationsgerät Audiosignale an eine Umgebung abstrahlt und einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufnimmt und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließ- lich deren umgebungsbedingter Störanteile, aufnimmt, und die wiederaufgenommenen Audiosignale durch einen ersten Algorith- mus benutzt werden, um eine Raumimpulsantwort der Umgebung zu bestimmen.

Des weiteren betrifft die Erfindung ein Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen, wobei das Kom- munikationsgerät über zumindest einen Lautsprecher verfügt, der Audiosignale an eine Umgebung abstrahlt und weiterhin zu- mindest ein Mikrofon aufweist, mit dem einerseits diese Au- diosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wie- der aufgenommen werden und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerä- tenutzers, einschließlich deren umgebungsbedingter Störantei- le, aufgenommen werden, und im Kommunikationsgerät ein erstes Mittel vorgesehen ist, das ein Mittel zur Berechnung einer Raumimpulsantwort der Umgebung aufweist.

Es ist allgemein bekannt, dass über Lautsprecher abgestrahlte oder von einer Schallquelle, zum Beispiel der menschlichen Stimme, erzeugte Audiosignale in Räumen im Allgemeinen durch Echos und Nachhall verfälscht werden. Während die Echos aus direkten, einfachen und frühen Reflexionen des Audiosignals an einer der Begrenzungsflächen des Raumes, zum Beispiel den Wänden, dem Boden oder der Decke, bestehen, ist der Nachhall diffus und wird durch mehrfache, nur noch nach statistischen Methoden abschätzbare Reflexionen an den Begrenzungsflächen erzeugt.

Die Art und Dauer des Nachhalls werden von der Geometrie des Raumes und der Beschaffenheit der Wände entscheidend beein- flusst. Verschiedene Algorithmen der digitalen Sprach-und Audiosignalverarbeitung, vor allem solche, welche sich mit dem Problem der Enthallung von Sprachsignalen befassen, benö- tigen häufig eine Abschätzung der sogenannten Nachhallzeit.

Die Nachhallzeit, meist mit T60 abgekürzt, ist eine in der Akustik bekannte wichtige Kenngröße für Räume. Sie kann fre- quenzabhängig bestimmt werden und beschreibt, in welcher Zeit nach dem Verstummen einer Signalquelle die Energie des Hall- signals um 60 dB [dB = Dezibel], gegebenenfalls noch abhängig von dem jeweiligen Frequenzband, abgefallen ist.

Die Nachhallzeit wird bisher über zwei Verfahrensarten be- stimmt, nämlich über statistische Schätzverfahren oder durch ein Verfahren, das sich eines oder mehrerer Messsignale be- dient.

Im ersten Fall wird zum Beispiel eine über viele Sprecher und Sprachbeispiele gemittelte Information über das Zeit-und Amplitudenverhältnis von Sprachabschnitten zu Sprachpausen herangezogen, um über die Veränderung dieses Verhältnisses im Vergleich zum Wert bei unverhallter Sprache eine Aussage über die Nachhallzeit zu gewinnen.

Man kann leicht erkennen, dass hier sprecherspezifische Ei- genarten, wie zum Beispiel häufige und/oder lange Sprachpau- sen, diese Abschätzung stark verfälschen können. Es ist zu betonen, dass eine Abschätzung der Nachhallzeit ohne Verwen- dung eines Messsignals, also zum Beispiel während eines Tele- fongesprächs, im Allgemeinen sehr problematisch ist, da nicht ohne weiteres feststellbar ist, welche Signalanteile des vom Mikrofon aufgenommenen Schallsignals Direktschall und welche Anteile Echo oder Hall sind. Unter Direktschall. versteht man das Signal, welches ohne eine einzige Reflexion direkt vom Sprecher, also von der"Schallquelle"zum Mikrofon gelangt.

Eine auf statistischen Merkmalen basierte Schätzung der Nach- hallzeit kann höchstens dadurch erfolgen, dass Merkmale typi- scher unverhallter,"sauberer"Sprache mit den Merkmalen des vorliegenden, aufgenommenen, verhallten Sprachsignals vergli- chen werden.

Im zweiten Fall muss über eine externe Schallquelle ein Mess- signal, zum Beispiel weißes Rauschen, abgespielt werden, wel- ches dem System bekannt ist. Über die Korrelation zwischen dem abgespielten Messsignal und dem Signal, welches über das Mikrofon des Kommunikationsgeräts wieder empfangen wird, kann dann die Abschätzung der Nachhallzeit T60 erfolgen. Diese Möglichkeit ist höchstens für Versuchsaufbauten praktikabel, da zum Beispiel dem Benutzer eines Telefons nicht zugemutet werden kann, vor oder während jedes Gesprächs erst mit dem Telefon eine solche Messung durchzuführen.

Je genauer die Nachhallzeit bekannt ist, desto besser lässt sich die Enthallung eines Audiosignals ermöglichen.

Es ist daher Aufgabe der Erfindung, ein Verfahren zum Betrieb eines Kommunikationsgerätes und ein Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen zu finden, welches im Vergleich zu den bisher bekannten Verfahren und Hardware- geräten mit einer genauer ermittelten Nachhallzeit auch eine bessere Entstörung der Audiosignale zulässt.

Diese Aufgaben der Erfindung werden durch das Verfahren mit den Merkmalen des Patentanspruches 1 und gegenständlich durch das Kommunikationsgerät mit den Merkmalen des Patentanspru- ches 8 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand untergeordneter Patentansprüche.

Die Erfinder haben erkannt, dass Informationen, die in der Raumimpulsantwort enthalten sind, auch zur Entstörung weite- rer Audiosignale verwendet werden können. Die Raumimpulsant- wort kann mit Hilfe eines bekannten Verfahrens gewonnen wer- den. Vorteilhaft kann die durch das Acoustic Echo Cancelati- on-Verfahren berechnete Raumimpulsantwort, wobei das AEC- Verfahren in vielen Telefonen schon vorhanden ist und welches diese Raumimpulsantwort zur Unterdrückung der wiederaufgenom- menen Audiosignale benutzt, auch zur Bestimmung der Nachhall- zeit der Umgebung verwendet werden.

Wird beispielsweise-im Falle von zwei Kommunikationsgeräten - das von einem ersten Kommunikationsgerät im Freisprechmodus abgestrahlte Audiosignal, üblicherweise die Stimme des Kommu- nikationsgerätenutzers des zweiten Kommunikationsgerätes, in- klusive der durch die Umgebung des ersten Kommunikationsge- räts bedingter Störanteile wieder vom Mikrofon des ersten Kommunikationsgeräts aufgenommen, so lässt sich aus diesen Audiosignalen mit einem ersten Algorithmus zunächst die Raum- impulsantwort bestimmen. Die Raumimpulsantwort beinhaltet im- plizit die Nachhallzeit T60, das heißt die Nachhallzeit kann aus ihr berechnet werden.

Soll nun ein weiteres Audiosignal, zum Beispiel die Sprache des Kommunikationsgerätenutzers vom ersten Kommunikationsge- rät, aufgenommen werden, welches seinerseits durch die Umge- bung störbehaftet ist, so wird aus der bereits vom ersten Al- gorithmus bestimmten Raumimpulsantwort die Nachhallzeit des Raumes bestimmt. Diese Nachhallzeit kann dann genutzt werden, um den Nachhall im aufgenommenen Sprachsignal des ersten Kom- munikationsgerätenutzers zu bestimmen. Hierbei machen sich die Erfinder zusätzlich die Erkenntnis zu nutzte, das sich die Nachhallzeit auch bei verschiedenen Positionen der Schallquelle im Raum nicht signifikant ändert.

Entsprechend diesem Erfindungsgedanken schlagen die Erfinder ein Verfahren zum Betrieb eines Kommunikationsgerätes vor, wobei das Kommunikationsgerät Audiosignale an eine Umgebung abstrahlt und einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufnimmt und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren umgebungs- bedingter Störanteile, aufnimmt, und ein erster Algorithmus eine Raumimpulsantwort der Umgebung bestimmt, dahingehend zu verbessern, dass auf die aufgenommenen Audiosignale der ex- ternen Schallquelle, vorzugsweise des Kommunikationsengeräte- nutzers, ein zweiter Entstör-Algorithmus angewendet wird, der zur Entstörung eine Nachhallzeit verwendet, die er aus der durch den ersten Algorithmus bestimmten Raumimpulsantwort er- mittelt.

Hierdurch lässt sich diejenige Nachhallzeit zur Entstörung von Audiosignalen einer externen Schallquelle nutzen, die aus der durch Abstrahlung eines bekannten Audiosignals und der anschließenden Aufnahme des im Raum verhallten Audiosignals bestimmten Raumimpulsantwort berechnet werden kann. Gegenüber der Schätzung der Nachhallzeit von Audiosignalen einer exter- nen Schallquelle ist dieses Verfahren genauer.

Das Verfahren eignet sich besonders gut für Kommunikationsge- räte, wie zum Beispiel für Funkgeräte, Mobilfunkgeräte oder Festnetztelefone, da gerade hier die Möglichkeit der Abstrah- lung eines bekannten Signals und der anschließenden Aufnahme gegeben ist. Aber auch für Stand-Alone-Geräte, die Audiosig- nale über einen Lautsprecher ausgeben und auch Audiosignale über ein Mikrofon aufnehmen können, ist das Verfahren geeig- net, die durch die Umgebungsbedingung des Stand-Alone-Gerätes ergebende Nachhallzeit zu nutzen und entsprechend zu entstö- ren.

Außerdem ist die Bestimmung der Nachhallzeit über dieses Ver- fahren wesentlich genauer möglich, als gegenüber einer bishe- rigen Abschätzung aus dem verhallten Audiosignal.

Das neue Verfahren kann beispielsweise die Grundlage für eine Echtzeitparametrisierung und eine Echtzeitanpassung von Algo- rithmen zur Enthallung von Sprachsignalen bilden.

Es ist vorteilhaft, wenn ausschließlich der erste Algorithmus die Nachhallzeit bestimmt.

Alternativ dazu ist es möglich, dass ausschließlich der zwei- te Entstör-Algorithmus die Nachhallzeit bestimmt.

Weiterhin ist es günstig, wenn die Nachhallzeit aus dem ener- getischen Abfall des Nachhalls berechnet wird, wobei die In- formation über die Geschwindigkeit dieses Abfalls in der Raumimpulsantwort enthalten ist. Hierdurch kann eine genauere Bestimmung der Nachhallzeit gegenüber der statistisch basier- ten Schätzung der Nachhallzeit erfolgen.

Zur Bestimmung der Raumimpulsantwort, aus der dann die Nach- hallzeit bestimmt werden kann, kann in dem neuen Verfahren beim ersten Algorithmus ein AEC-Algorithmus (AEC = Acoustic Echo Cancelation) verwendet werden. Dieser AEC-Algorithmus ist in vielen Telefonen schon heute vorhanden und wird ei- gentlich zur Unterdrückung der wiederaufgenommenen Audiosig- nale benutzt. Der Algorithmus berechnet eine Raumimpulsant- wort, welche sich erfindungsgemäß zur Bestimmung der Nach- hallzeit verwenden lässt.

Zur Entstörung der aufgenommenen Audiosignale des Kommunika- tionsgerätenutzers wird ein zweiter Entstör-Algorithmus ver- wendet. Ein solcher zweiter Entstör-Algorithmus soll unter Ausnutzung der bestimmten oder übernommenen Nachhallzeit die umgebungsbedingt überlagerten Störanteile, wie Echo und Hall, aus dem aufgenommenen Audiosignal des Kommunikationsgeräte- nutzers entfernen.

Für das Verfahren ist es ebenfalls vorteilhaft, wenn die Raumimpulsantwort in Abhängigkeit der Frequenz und vorzugs- weise durch mehrere Bandpässe gefiltert wird. Hierdurch kann die Nachhallzeit, die selbst frequenzabhängig ist, in Abhän- gigkeit der Frequenz bestimmt werden.

An dieser Stelle sei erwähnt, dass die Anwendung des neuen Verfahrens sehr einfach bei zwei Kommunikationsgeräten nach- gewiesen werden kann : Das beschriebene Verfahren zum Betrieb eines Kommunikationsgerätes basiert darauf, dass der Laut- sprecher eines Audiosystems, zum Beispiel in einen Raum ab- strahlt und dass das durch den Raum verhallte Audiosignal wieder vom Mikrofon des Audiosystems aufgenommen wird.

Zum Nachweis wird eine Sprachverbindung zwischen den zwei Mo- bilfunkteilnehmern aufgebaut. Anschließend trennt der erste Mobilfunkteilnehmer, während der zweite Mobilfunkteilnehmer spricht, die akustische Verbindung zwischen Lautsprecher und Mikrofon, zum Beispiel durch Verdecken des Lautsprechers mit der Hand. Bemerkt nun der zweite Mobilfunkteilnehmer eine deutliche Verschlechterung der Qualität des Audiosignals, zum Beispiel in Form einer verhallten Stimme, wenn der erste Mo- bilfunkendteilnehmer spricht, so wird das neue Verfahren zur Bestimmung der Nachhallzeit im Gerät des ersten Mobilfunkend- teilnehmers angewendet. Dies setzt voraus, dass ein Enthal- lungs-Algorithmus angewendet wird. Die Unterbrechung der Ü- bertragungsstrecke beim ersten Mobilfunkendgerät verhindert eine Adaption des verwendeten"Entstör-Algorithmus"an die Nachhallzeit des Raums.

Zur gegenständlichen Lösung ihrer Aufgabe schlagen die Erfin- der auch vor, ein bekanntes Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsge- rät über zumindest einem Lautsprecher verfügt, der Audiosig- nale an eine Umgebung abstrahlt und weiterhin zumindest ein Mikrofon aufweist, mit dem einerseits diese Audiosignale ein- schließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufgenommen werden und andererseits Audiosignale einer externen Schall- quelle, vorzugsweise eines Kommunikationsgerätenutzers, ein- schließlich deren umgebungsbedingter Störanteile aufgenommen werden, und im Kommunikationsgerät ein erstes Mittel vorgese- hen ist, das ein Mittel zur Berechnung einer Raumimpulsant- wort der Umgebung aufweist, dahingehend zu verbessern, dass ein zweites Mittel für die aufgenommenen Audiosignale der ex- ternen Schallquelle, vorzugsweise des Kommunikationsengeräte- nutzers, einschließlich deren umgebungsbedingter Störanteile angeordnet ist, das ein Mittel zur Ermittlung der Nachhall- zeit aufweist, das die Nachhallzeit ermittelt, die in der durch das erste Mittel bestimmten Raumimpulsantwort enthalten ist.

Hierdurch wird ein Kommunikationsgerät zur Verfügung ge- stellt, in dem die Nachhallzeit, die durch die Ausnutzung der Abstrahlung eines bekannten Audiosignals und der anschließen- den Aufnahme des im Raum verhallten Audiosignals über die Be- stimmung der Raumimpulsantwort, bestimmt wurde, welches nun auch für die Entstörung der Audiosignale einer externen Schallquelle verwendet werden kann. Die Entstörung kann hier- bei genauer als bisher erfolgen, da die Nachhallzeit besser und genauer bestimmt wird.

Es besteht die Möglichkeit, dass ausschließlich das erste Mittel über Programmmittel und/oder Programmmodule verfügt, die die Nachhallzeit bestimmen.

Alternativ dazu kann aber auch ausschließlich das zweite Mit- tel Programmmittel und/oder Programmmodule aufweisen, die die Nachhallzeit bestimmen.

Das erste Mittel kann über Programmmittel und/oder Programm- module verfügen, die einen AEC-Algorithmus (AEC = Acoustic Echo Cancellation) oder einen Algorithmus, wie in Welch, P. D. [1970],"The Use of Fast Fourier Transform for the Esti- mation of Power Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73), beschrieben, ausführen. Der Inhalt dieses Literaturverweises wird vollinhaltlich übernommen.

Weiterhin ist es vorteilhaft, wenn die zweiten Mittel Pro- grammmittel und/oder Programmmodule aufweisen, die einen Al- gorithmus ausführen, der unter Ausnutzung der umgebungsabhän- gig bestimmten Nachhallzeit die umgebungsbedingt überlagerten Störanteile, wie Echo und Hall, aus dem aufgenommenen Audio- signal des Kommunikationsgerätenutzers entfernt.

Die Bestimmung der Nachhallzeit in Abhängigkeit der Frequenz und entsprechend die frequenzabhängige Entstörung der Audio- signale wird in dem Kommunikationsgerät günstig realisiert, wenn im Kommunikationsgerät Bandpassfilter angeordnet sind, die die Raumimpulsantwort filtern.

Bei dem neuen Kommunikationsgerät kann es sich um ein Tele- fon, zum Beispiel in Form eines Mobilfunkendgerätes oder ei- nes kabelgebundenen Telefons, ein elektrisches Haushaltgerät oder ein elektrisches Modul eines Fahrzeuges mit Mitteln zur Spracheingabe und Sprachausgabe handeln.

Im Folgenden wird die Erfindung anhand bevorzugter Ausfüh- rungsbeispiele mit Hilfe der Figuren 1 bis 5 beschrieben, wo- bei in den Figuren die folgenden Abkürzungen verwendet wer- den : 1 : Direktschall eines impulsartigen Audiosignals ; 2 : E- chos ; 3 : Nachhall/Nachhallkurve ; 4 : Empfangene Signale vom zweiten Kommunikationsgerät ; 4. 1 : Signale vom Spracherzeu- gungsmodul ; 5 : Algorithmus zur Bestimmung der Nachhallzeit ; 6 : Digital-Analog-Wandler ; 7 : Lautsprecher ; 8.1 : Signal, das direkt vom Lautsprecher zum Mikrofon gelangt = Direktschall ; 8.2 : Signal des Lautsprechers, das einfach am Objekt reflek- tiert wird = Echo ; 8.3 : Signal des Lautsprechers, das mehr- fach und diffus am Objekt reflektiert wird = Nachhall ; 9 : Ob- jekt an dem die Signale reflektiert werden ; 10 : Mikrofon ; 11 : Analog-Digital-Wandler ; 12 : Zu sendende Signale zum zweiten Kommunikationsgerät ; 12.1 : Signale zum Spracherkennungsmodul ; 13.1 : Erstes Kommunikationsgerät ; 13.2 : Zweites Kommunikati- onsgerät ; 13.3 : Schnittstelle für Signalübermittlung ; 13.4 : Sprachgesteuertes Elektrogerät : 14 : Raumimpulsantwort ; 15 : Kommunikationsgerätenutzer/Bediener ; 15.1 : Signal, das direkt vom Kommunikationsgerätenutzer zum Mikrofon gelangt = Direkt- schall ; 15.2 : Signal des Kommunikationsgerätenutzers, das einfach am Objekt reflektiert wird = Echo ; 15.3 : Signal des Kommunikationsgerätenutzers, das mehrfach und diffus am Ob- jekt reflektiert wird = Nachhall ; 16 : Algorithmus zur Ent- hallung der Signale 15.1 bis 15.3 ; 17 : Entstöreinheit ; 18 : Spracherzeugungsmodul ; 19 : Spracherkennungsmodul ; A60 : Ener- giebereich, in dem die Energie um 60 Dezibel abfällt ; T60 : Nachhallzeit.

Es zeigen im Einzelnen : Figur 1 : Zeitliche Energieverteilung eines ursprünglich im- pulsförmigen Audiosignals in einem Raum ; Figur 2 : Zeitliche Energieverteilung desselben Audiosignals aus Figur 1, jedoch in einem kleineren Raum ; Figur 3 : Gemessene Raumimpulsantwort eines Raumes ; Figur 4 : Zwei Kommunikationsgeräte, die Signale austauschen, wobei in einem Kommunikationsgerät das neue Verfah- ren angewendet wird ; Figur 5 : Sprachgesteuertes Elektrogerät, in dem das neue Verfahren angewendet wird.

Die Figur 1 zeigt exemplarisch in einem Diagramm die zeitli- che Energieverteilung eines Audiosignals, die man in einem Raum mit einem Mikrofon aufnehmen und messen kann, wenn ein impulsartiges Audiosignal, zum Beispiel ein Knall, auftritt.

Diese Energieverteilung erhält man, indem man das Betrags- quadrat einer Raumimpulsantwort bildet und dieses logarith- miert.

Auf der Ordinate des Diagramms sind die logarithmierten Sig- nalamplituden, als Maß für die Energie des Audiosignals, und auf der Abszisse die Zeit, jeweils in willkürlichen Einhei- ten, aufgetragen.

Man erkennt als erste Linie ganz links im Diagramm den soge- nannten Direktschall 1, welcher auf direktem Weg von der Schallquelle zum Messmikrofon gelangt. Dann folgen, die in diesem Beispiel energetisch schwächeren Echos 2, die einmal oder zweimal an Wänden des Raumes reflektiert wurden, bevor sie zum Messmikrofon gelangen.

Zuletzt folgt, symbolisiert durch ein Dreieck, der Nachhall 3, welcher aus quasi chaotischen überlagerten Reflexionen des Audiosignals im Raum besteht und diffus am Messmikrofon ein- trifft.

Das neue Verfahren nutzt die Nachhallzeit T60 eines Audiosig- nals, die aus der Raumimpulsantwort 14, die für einen be- stimmten Raum charakteristisch ist, bestimmt wurde.

Zur Bestimmung der Nachhallzeit T60 wird in Figur 1 auf der Ordinate des Diagramms ein Energiebereich A60 bestimmt, der im Bereich des Nachhalls 3 liegt, in dem die Energie des Nachhalls um 60 Dezibel abfällt. Der obere und der untere Grenzwert des Energiebereiches A60 werden zuerst auf die Nachhallkurve 3 und danach auf die Abszisse also die Zeitach- se projiziert. Der projizierte Bereich auf der Zeitachse ent- spricht der Nachhallzeit T60.

An dieser Stelle sei erwähnt, dass der Energiebereich nicht notwendigerweise mit 60 Dezibel gewählt werden muss, sondern auch kleiner oder größer gewählt werden kann. Zum Beispiel kann auch ein Bereich gewählt werden, in dem die Energie des Nachhalls, um zum Beispiel 30 Dezibel abfällt. Der Wert, der aus der Projektion auf die Zeitachse erhalten wird, muss ent- sprechend um den Faktor der Verkleinerung/Vergrößerung der Energie, angepasst werden. Bei einem Energiebereich von nur 30 Dezibel wird entsprechend der Zeitabschnitt mit dem Faktor 2 multipliziert, um die Nachhallzeit T60 zu erhalten.

In Figur 2 wird wiederum exemplarisch die zeitliche Energie- verteilung eines impulsartigen Audiosignals, zum Beispiel ei- nes Knalles gezeigt. Im Unterschied zu den Randbedingungen, die für die Figur 1 galten, soll das Audiosignal in einem kleineren Raum aufgenommen werden. Dies äußert sich in einem geringeren Nachhall 3. Die Nachhallkurve 3 fällt schneller ab, wodurch auch die Nachhallzeit T60 geringer als in Figur 1 ist. Der Einfachheit halber wurde der Direktschall 1 und die Echos 2 im Diagramm der Figur 2 unverändert aus dem Diagramm der Figur 1 übernommen. Bei einer reellen Messung eines Sig- nals könnten hier jedoch Unterschiede auftreten.

Man erkennt, dass aus dem energetischen Abfall des Nachhalls 3, also der negativen Steigung der Nachhallkurve 3, die Nach- hallzeit T60 bestimmt werden kann.

Die Figur 3 zeigt nun eine gemessene Raumimpulsantwort 14 ei- nes Raumes. Auf der Ordinate sind die Signalamplituden und auf der Abszisse ist die Zeit aufgetragen. Die Geschwindig- keit des Abfalls der Energie in der Raumimpulsantwort über die Zeit ist charakteristisch für diesen bestimmten Raum.

Diese Geschwindigkeit wird unabhängig vom Messsignal und der Position von Schallquelle und Mikrofon im Raum für diesen be- stimmten Raum erhalten werden.

Die Figur 4 zeigt zwei Kommunikationsgeräte 13.1 und 13.2, die Signale 4 und 12 über eine Schnittstelle 13.3 austau- schen. Dabei kann es sich bei den Kommunikationsgeräten 13.1 und 13.2 beispielsweise um Endgeräte im Mobilfunknetz han- deln. Bei der Schnittstelle 13.3 kann es sich beispielsweise um eine Sende-/Empfangsantenne oder um eine Infrarotschnitt- stelle handeln.

Im Kommunikationsgerät 13.1 wird das neue Verfahren angewen- det.

Das erste Kommunikationsgerät 13.1 soll sich in einer Umge- bung befinden, zum Beispiel in einer Kirche, in der Hallef- fekte auftreten. Diese Umgebung ist durch ein einseitig offe- nes Rechteck mit dem Bezugszeichen 9 angedeutet.

Das Signal 4 wird über die Schnittstelle 13.3 vom zweiten Kommunikationsgerät 13.2 zum ersten Kommunikationsgerät 13.1 gesendet und von diesem empfangen. Das Signal 12 soll vom ersten Kommunikationsgerät 13.1 zum zweiten Kommunikationsge- rät 13.2 gesendet werden, dabei sollen Störungen, die durch die Umgebung 9 des ersten Kommunikationsgerätes 13.1 auftre- ten, unterdrückt werden.

Das erste Kommunikationsgerät 13.1 verfügt zumindest über ei- nen Digital-Analog-Wandler 6, der die vom zweiten Kommunika- tionsgerät 13.2 gesendeten digitalen Signale 4 in analoge Signale umwandelt und an einen Lautsprecher 7 weiterleitet.

Außerdem verfügt das erste Kommunikationsgerät 13.1 über ein Mikrofon 10, welches analoge Signale aufnehmen kann und über einen Analog-Digital-Wandler 11 digitalisiert.

Durch das neue Verfahren soll das Signal 15.1, in der Regel Sprachesignale, das ein Kommunikationsgerätenutzer 15 an das Mikrofon 10 des ersten Kommunikationsgeräts 13.1 abgibt, ent- stört werden. Die Entstörung geschieht durch möglichst voll- ständige Unterdrückung des unerwünschten Echos 15.2 und des unerwünschten Halls 15.3. Um dieses Signal entstören zu kön- nen, muss die Nachhallzeit T60 ermittelt werden. Hierbei macht sich das neue Verfahren Folgendes zu nutze : - Die Nachhallzeit, die für diese Umgebung 9 charakteristisch ist, ist in der Raumimpulsantwort enthalten. Die Raumimpuls- antwort wiederum lässt sich aus dem Verhältnis der Signale 8.2 und 8.3 zum Signal 8.1 bestimmen.

- Die Nachhallzeit ändert sich an verschiedenen Positionen der Schallquelle im Raum nicht signifikant. Das heißt, die Signale 8.1 bis 8.3 die vom Lautsprecher 7 zum Mikrofon 10 gelangen und die Signale 15.1 bis 15. 3, die vom Kommunikati- onsgerätenutzer 15 zum Mikrofon 10 gelangen, haben eine ähn- liche Nachhallzeit.

Im neuen Verfahren wird die bereits bekannte Nachhallzeit folgendermaßen für die Entstörung des Signals 15.1 nutzbar gemacht. Das vom zweiten Kommunikationsgerät 13.2 gesendete Signal 4 wird durch den Digital-Analog-Wandler 6 umgewandelt und über den Lautsprecher 7 des ersten Kommunikationsgeräts 13.1 ausgegeben. Analog zu den Diagrammen der Figuren 1 und 2 kann das Signal 4 in Form von Direktschall 8.1, Echo 8.2 und Nachhall 8.3 zum Mikrofon 10 des ersten Kommunikationsgerätes 13.1 gelangen.

Der Direktschall 8.1, das Echo 8. 2 und der Nachhall 8.3 wer- den über einen Analog-Digital-Wandler 6 umgewandelt und über einem Algorithmus 5 wird die Raumimpulsantwort bestimmt.

Zur Bestimmung der Raumimpulsantwort können verschiedene Me- thoden eingesetzt werden.

So kann ein sogenannter AEC-Algorithmus (AEC = Acoustic Echo Cancellation) implementiert werden. Dieser Algorithmus wird verwendet, um im Freisprechmodus das Echo des Sprachsignals des fernen Teilnehmers, welches vom Lautsprecher 7 abge- strahlt und unerwünscht vom Mikrofon 10 wieder aufgenommen wird, zu kompensieren. Hierzu wird mittels Abschätzung der Übertragungsstrecke Lautsprecher 7 und Mikrofon 10 eine Im- pulsantwort berechnet. Durch Faltung des vom Kommunikations- gerät 13.2 gesendeten Signals 4 mit dieser Impulsantwort und anschließender Subtraktion des so berechneten Signals vom Mikrofonsignal findet die Echo-Unterdrückung statt. Das Sig- nal wird über eine Entstöreinheit 17 entstört.

Alternativ dazu kann zur Bestimmung der Raumimpulsantwort ein bekannter Algorithmus eingesetzt werden, welcher zuerst von "Welch"publiziert wurde. So beschreibt die Welch Methode (siehe auch Welch, P. D. [1970],"The Use of Fast Fourier Transform for the Estimation of Power Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73) die Bestimmung ei- ner Impulsantwort durch die Abstrahlung eines Ausgangssignals und der Messung des Eingangssignals. Einzige Anforderung an das Ausgangssignal ist das Vorhandensein von ausreichend E- nergie in den zu betrachtenden Frequenzbereichen.

Ist die Raumimpulsantwort mit einem Algorithmus 5 bestimmt, so kann hieraus die Nachhallzeit bestimmt werden. Diese Nach- hallzeit kann auch für die Entstörung des Signals 15.1 des Kommunikationsgerätenutzers 15 genutzt werden, da die Nach- hallzeiten, die sich für die Übertragung von Signalen 8.1 bis 8.3 vom Lautsprecher 7 über die Umgebung 9 zum Mikrofon 10 und für die Übertragung von Signalen 15.1 bis 15.3 vom Kommu- nikationsgerätenutzers 15 zum Mikrofon 10 ergeben, ähnlich sind. Um diese Nachhallzeit aus der Raumimpulsantwort, die durch den ersten Algorithmus 5 bestimmt wurde, zu ermitteln, ist ein weiterer Algorithmus 16 vorgesehen, der Zugriff auf die Daten des Algorithmus 5 hat, also auch auf die Raumim- pulsantwort und die darin enthaltene Nachhallzeit. Dann wer- den die Signale 15.1 bis 15.3 mit einer Entstöreinheit 17 entstört und als Signale 12 ausgegeben.

Die Figur 5 zeigt eine besondere Ausführung eines Kommunika- tionsgerätes. Hier wird das neue Verfahren in einem sprachge- steuerten Elektrogerät 13.4 angewendet. Dabei steht der Be- diener 15 des sprachgesteuerten Elektrogeräts nur mit dem sprachgesteuerten Elektrogerät 13.4 in Kontakt und nicht wie in Figur 4 mit einem weiteren Kommunikationsteilnehmer, der sich an einem zweiten Kommunikationsgerät befindet.

Das sprachgesteuerte Elektrogerät 13.4 verfügt über ein Spracherzeugungsmodul 18, um Signale 4.1 zum Beispiel den Me- nüumfang des Elektrogerätes 13.4, über den Lautsprecher 7 ausgeben zu können. Außerdem verfügt das sprachgesteuerte E- lektrogerät 13.4 über ein Spracherkennungsmodul 19, um Signa- le 12.1, zum Beispiel die Sprache des Bedieners 15, erkennen zu können.

Abhängig von der Umgebung 9, können die über den Lautsprecher 7 in Form von Direktschall 8.1, Echo 8.2 und Nachhall 8.3 ausgegebene Signale ungewollt vom Mikrofon 10 aufgenommen werden. Um diese Rückkopplung zu vermeiden, wird im sprachge- steuerten Elektrogerät 13.4 ein Algorithmus 5 ausgeführt, der unter anderem auch die Raumimpulsantwort bestimmt. Außerdem wird diese Rückkopplung mit einer Entstöreinheit 17 unter- drückt.

Zur Entstörung des vom Bediener 15 an das Mikrofon 10 ge- schickten Signals 15.1 kann der Algorithmus 5 nicht verwendet werden. Aber die Nachhallzeit, die sich aus der Raumimpuls- antwort berechnen lässt, welche im Algorithmus 5 bestimmt wurde, die aber nahezu gleich für die Signale 15.1 bis 15.3 des Bedieners 15 gilt, kann von einem weiteren Algorithmus 16 verwendet werden, der mit einer Entstöreinheit 17 das Signal 15.1 entstört.

Es versteht sich, dass die vorstehend genannten Merkmale der Erfindung nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der Erfindung zu verlassen.