Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
REVERBERATION REDUCTION FOR SIGNALS IN A BINAURAL HEARING APPARATUS
Document Type and Number:
WIPO Patent Application WO/2011/110239
Kind Code:
A1
Abstract:
The aim is to propose a more efficient method for reducing reverberation in binaural hearing systems. This has been done by developing a method for obtaining a reduced-reverberation, binaural output signal (Šl (λ, μ), Šr (λ, μ) for a binaural hearing apparatus. First of all, a left input signal (X1 (λ, μ)) and a right input signal (Xr (λ, μ)) are provided. The two input signals are combined to form a reference signal (Xref (λ, μ)). The reference signal is used to ascertain spectral weights (Glate (λ, μ)), or these weights are provided in another way, in order to use them to reduce late reverberation. To this end, the two input signals have the spectral weight applied to them. Furthermore, a coherency (17) for signal components of the weighted input signals (Šl (λ, μ), Šr (λ, μ)) is ascertained. Noncoherent signal components of both weighted input signals are then attenuated in order to reduce early reverberation.

Inventors:
JEUB, Marco (Pontstr. 24, Aachen, 52062, DE)
LÖLLMANN, Heinrich (Königsstr. 9/11, Aachen, 52064, DE)
VARY, Peter (Morinerweg 1, Aachen, 52074, DE)
Application Number:
EP2010/060849
Publication Date:
September 15, 2011
Filing Date:
July 27, 2010
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS MEDICAL INSTRUMENTS PTE. LTD. (Block 28, Ayer Rajah Crescent No. 06-08, Singapore 9, 13995, SG)
JEUB, Marco (Pontstr. 24, Aachen, 52062, DE)
LÖLLMANN, Heinrich (Königsstr. 9/11, Aachen, 52064, DE)
VARY, Peter (Morinerweg 1, Aachen, 52074, DE)
International Classes:
H04R25/00; G10L21/02
Attorney, Agent or Firm:
MAIER, Daniel (Siemens AG, Postfach 22 16 34, München, 80506, DE)
Download PDF:
Claims:
Patentansprüche

1. Verfahren zum Gewinnen eines enthallten, binauralen Ausgangssignals für eine binaurale Hörvorrichtung

gekennzeichnet durch

Bereitstellen eines linken Eingangssignals ( Xi (λ, μ) ) und eines rechten Eingangssignals ( Xr (λ, μ) ) ,

Kombinieren der beiden Eingangssignale zu einem Referenzsignal ( Xref (λ, μ) ) ,

- Ermitteln von spektralen Gewichten ( Giate (λ, μ) ) aus dem

Referenzsignal oder Bereitstellen spektraler Gewichte, mit denen später Nachhall reduzierbar ist,

Beaufschlagen des linken und rechten Eingangssignals mit den spektralen Gewichten,

- Ermitteln einer Kohärenz von Signalanteilen der gewichteten Eingangssignale (Sl (λ, μ) , Sr (λ, μ) ) und

Dämpfen nicht-kohärenter Signalanteile beider gewichteter Eingangssignale, um einen frühen Nachhall zu reduzieren. 2. Verfahren nach Anspruch 1, wobei bei dem Kombinieren ein zeitlicher Versatz zwischen den beiden Eingangssignalen ( Xi (λ, μ) , Xr (λ, μ) ) ausgeglichen und die beiden Eingangssignale anschließend zu dem Referenzsignal ( Xref (λ, μ) ) addiert werden .

3. Verfahren nach Anspruch 1 oder 2, wobei die spektralen Gewichte ( Giate (λ, μ) ) aus dem Referenzsignal ( Xref (λ, μ) ) er¬ mittelt werden und hierzu eine Nachhallzeit (Ίβο) aus dem Re¬ ferenzsignal geschätzt wird.

4. Verfahren nach Anspruch 3, wobei zum Schätzen der Nachhallzeit ( βο) eine Vorauswahl von Segmenten des Referenzsig¬ nals getroffen wird. 5. Verfahren nach Anspruch 4, wobei bei der Vorauswahl nur diejenigen Segmente ausgewählt werden, innerhalb derer ein Abfall des Schallpegels nachgewiesen wird.

6. Verfahren nach Anspruch 5, wobei je eine Abfallzeit der vorausgewählten Segmente ermittelt, und diejenige Abfallzeit, die mit größter Wahrscheinlichkeit auftritt, als Nachhallzeit festgelegt wird.

7. Verfahren nach einem der Ansprüche 4 bis 6, wobei die Länge jedes der Segmente an die jeweilige Länge seines Schallab¬ falls angepasst wird. 8. Verfahren nach einem der vorhergehenden Ansprüche, wobei zum Ermitteln der spektralen Gewichte ( Giate (λ, μ) ) die Ener¬ gie eines späten Nachhalls geschätzt wird.

9. Verfahren nach einem der vorhergehenden Ansprüche, wobei beim Ermitteln der Kohärenz ein Kohärenzmodell (18) verwendet wird, bei dem Abschattungseffekte eines Kopfs eines Nutzers berücksichtigt sind.

10. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Dämpfen nicht-kohärenter Signalanteile zur Reduktion frühen Nachhalls vor dem Gewichten der Eingangsignale zur Reduktion späten Nachhalls erfolgt.

11. Binaurale Hörvorrichtung mit

- einer Aufnahmeeinrichtung zum Aufnehmen eines linken Eingangssignals ( Xi (λ, μ) ) und eines rechten Eingangssig¬ nals ( Xr (λ, μ) ) ,

einer Signalverarbeitungseinrichtung (10) zum Kombinieren der beiden Eingangssignale zu einem Referenzsignal ( Xref (λ, μ)),

einer Gewichtungseinrichtung (13) zum Ermitteln von spektralen Gewichten (Giate (λ, μ) ) aus dem Referenzsignal oder Bereitstellen spektraler Gewichte, mit denen später Nachhall reduzierbar ist, und zum Beaufschlagen des linken und rechten Eingangssignals mit den spektralen Gewichten, und einer Kohärenzeinrichtung (17) zum Ermitteln einer Kohärenz von Signalanteilen der gewichteten Eingangssignale (Sl (λ, μ) , Sr (λ, μ) ) und zum Dämpfen nicht-kohärenter Signalanteile beider gewichteter Eingangssignale, um einen frühen Nachhall zu reduzieren.

Description:
Beschreibung

Enthallen von Signalen einer binauralen Hörvorrichtung Die vorliegende Erfindung betrifft ein Verfahren zum Bereit ¬ stellen eines enthallten, binauralen Ausgangssignals einer binauralen Hörvorrichtung. Darüber betrifft die vorliegende Erfindung eine entsprechende binaurale Hörvorrichtung. Unter einer Hörvorrichtung wird hier jedes im oder am Ohr tragbare, schallausgebende Gerät verstanden, insbesondere ein Hörgerät, ein Headset, Kopfhörer und dergleichen.

Hörgeräte sind tragbare Hörvorrichtungen, die zur Versorgung von Schwerhörenden dienen. Um den zahlreichen individuellen Bedürfnissen entgegenzukommen, werden unterschiedliche Bauformen von Hörgeräten wie Hinter-dem-Ohr-Hörgeräte (HdO) , Hörgerät mit externem Hörer (RIC: receiver in the canal) und In-dem-Ohr-Hörgeräte (IdO), z.B. auch Concha-Hörgeräte oder Kanal-Hörgeräte (ITE, CIC) , bereitgestellt. Die beispielhaft aufgeführten Hörgeräte werden am Außenohr oder im Gehörgang getragen. Darüber hinaus stehen auf dem Markt aber auch Knochenleitungshörhilfen, implantierbare oder vibrotaktile Hörhilfen zur Verfügung. Dabei erfolgt die Stimulation des geschädigten Gehörs entweder mechanisch oder elektrisch.

Hörgeräte besitzen prinzipiell als wesentliche Komponenten einen Eingangswandler, einen Verstärker und einen Ausgangswandler. Der Eingangswandler ist in der Regel ein Schallempfänger, z. B. ein Mikrofon, und/oder ein elektromagnetischer Empfänger, z. B. eine Induktionsspule. Der Ausgangswandler ist meist als elektroakustischer Wandler, z. B. Miniaturlautsprecher, oder als elektromechanischer Wandler, z. B. Knochenleitungshörer, realisiert. Der Verstärker ist üblicherweise in eine Signalverarbeitungseinheit integriert. Dieser prinzipielle Aufbau ist in FIG 1 am Beispiel eines Hinter- dem-Ohr-Hörgeräts dargestellt. In ein Hörgerätegehäuse 1 zum Tragen hinter dem Ohr sind ein oder mehrere Mikrofone 2 zur Aufnahme des Schalls aus der Umgebung eingebaut. Eine Signal- Verarbeitungseinheit 3, die ebenfalls in das Hörgerätegehäuse 1 integriert ist, verarbeitet die Mikrofonsignale und ver ¬ stärkt sie. Das Ausgangssignal der Signalverarbeitungseinheit 3 wird an einen Lautsprecher bzw. Hörer 4 übertragen, der ein akustisches Signal ausgibt. Der Schall wird gegebenenfalls über einen Schallschlauch, der mit einer Otoplastik im Gehörgang fixiert ist, zum Trommelfell des Geräteträgers übertra ¬ gen. Die Energieversorgung des Hörgeräts und insbesondere die der Signalverarbeitungseinheit 3 erfolgt durch eine ebenfalls ins Hörgerätegehäuse 1 integrierte Batterie 5.

Bei Sprachkommunikationssystemen führt Raumhall oft zu einer Reduktion der Sprachqualität und -Verständlichkeit. Dies gilt insbesondere für binaurale Hörsysteme wie beispielsweise bi- naurale Hörgerätesysteme. Die Effekte des Raumhalls können in zwei unterschiedliche Wahrnehmungskomponenten kategorisiert werden: überlappende Maskierung und Verfärbung. Später Nachhall, der über mehrere Reflexionen zum Hörer gelangt, verursacht hauptsächlich Maskierungseffekte. Demgegenüber verur- sacht früher Nachhall eine Verfärbung des echofreien Sprachsignals .

In der Vergangenheit wurden zahlreiche Lösungsansätze entwi ¬ ckelt, um die Effekte des Nachhalls zu reduzieren und die Sprachverständlichkeit zu erhöhen. So wurde eine gemeinsame Unterdrückung von frühem und spätem Nachhall in einem einka- naligen System mithilfe eines zweistufigen Ansatzes vorge ¬ schlagen. In „M. Wu und D. Wang, "A two-stage algorithm for one-microphone reverberant speech enhancement , " IEEE Transac- tions on Audio, Speech, and Language Processing, Vol. 14, Nr. 3, Seiten 774-784, 2006" und in „N. Gaubitch, E. Habets, und P. Naylor, "Multimicrophone speech dereverberation using spa- tiotemporal and spectral processing, " in Proc. IEEE Interna ¬ tional Symposium on Circuits and Systems (ISCAS), 2008, Sei- ten 3222-3225" wird eine Reduktion früher Reflexionen auf der Basis einer Modifikation eines durch lineare Prädiktion erhaltenen Restsignals, gefolgt von einer spektralen Subtrakti ¬ on zur Reduktion von Langzeithall, beschrieben. Beide Methoden sind nicht für eine Binauraleingang- Binauralausgang-Verarbeitung geeignet und würden den binaura- len Höreindruck (interaurale Pegeldifferenz und interaurale Zeitdifferenz) eines binauralen Systems stören. Die Reduktion späten Nachhalls von Gaubitch et al . basiert auf „Lebart, K. : Speech Dereverberation applied to Automatic Speech Recogniti- on and Hearing Aids, Ph.D. dissertation, L'universite de Ren- nes, France, 1999". Die Berechnung der spektralen Gewichte durch Lebart enthält eine Schätzung der Nachhallzeit. Darüber hinaus sind frühere Algorithmen beispielsweise aus „R. Rat- nam, D.L. Jones, B.C. Wheeler, W.D. O'Brien, C.R. Lansing, and S.S. Feng, "Blind Estimation of the Reverberation Time", Journal of Acoustical Society of America, 114(5), Nov. 2003, Seiten 2877-2892" oder aus "R. Ratnam, D.L. Jones, W.D.

O'Brien, "Fast Algorithm for Blind Estimation of Reverberation Time", IEEE Signal Processing Letters, Vol. 11, Nr. 6, Ju ¬ ne 2004" oder aus "H. Löllmann, P. Vary, "Estimation of the Reverberation Time in Noisy Environments", International Workshop on Acoustic Echo and Noise Control, Seattle, USA,

Sept. 2008" bekannt, die eine quasi-kontinuierliche Schätzung der Nachhallzeit durchführen, basierend auf einem maximum- likelihood-Schätzer (ML), was jedoch rechnerisch sehr aufwändig ist.

Weiterhin ist aus „J. Peissing, "Binaurale Hörgerätestrate ¬ gien in komplexen Störschallsituationen," Ph.D. dissertation, Universität Göttingen, Göttingen, Germany, 1992" eine kohä- renz-basierte Struktur zur Störgeräuschunterdrückung bekannt. Des Weiteren ist in „L. Danilenko, „Binaurales Hören im nichtstationären diffusen Schallfeld," Dissertation, RWTH Aachen, 1968" und in „J. Allen, D. Berkley, and J. Blauert, „Multimicrophone signal-processing technique to remove room reverberation from speech Signals," J. Acoust. Soc. Am., Vol. 62, Nr. 4, Seiten 912-915, 1977" eine Berechnung spektraler Koeffizienten dargelegt. Ferner ist in „M. Jeub and P. Vary, „Binaural dereverberation based on a dual-channel Wiener fil- ter with optimized noise field coherence," in Proc. IEEE Int. Conference on Acoustics, Speech and Signal Processing

(ICASSP), Dallas, X, USA, 2010, Seiten 4710-4713" ein ver ¬ besserter kohärenz-basierter Algorithmus beschrieben.

Schließlich ist in "M. Dörbecker, „Mehrkanalige Signalverar- beitung zur Verbesserung akustisch gestörter Sprachsignale am Beispiel elektronischer Hörhilfen, " Dissertation, RWTH Aachen, 1998" ein Kohärenzmodell offenbart.

Die Aufgabe der vorliegenden Erfindung besteht darin, den Nachhall in einem binauralen Hörsystem wirksamer zu reduzieren .

Erfindungsgemäß wird diese Aufgabe gelöst durch ein Verfahren zum Bereitstellen eines enthallten, binauralen Ausgangssig- nals einer binauralen Hörvorrichtung durch Aufnehmen eines linken Eingangssignals und eines rechten Eingangssignals durch die Hörvorrichtung, Kombinieren der beiden Eingangssignale zu einem Referenzsignal, Ermitteln von spektralen Gewichten aus dem Referenzsignal oder Bereitstellen spektraler Gewichte, mit denen später Nachhall reduzierbar ist, Beauf ¬ schlagen des linken und rechten Eingangssignals mit den spektralen Gewichten, Ermitteln einer Kohärenz von Signalanteilen der gewichteten Eingangssignale und Dämpfen nichtkohärenter Signalanteile beider gewichteter Eingangssignale, um einen frühen Nachhall zu reduzieren.

Darüber wird erfindungsgemäß bereitgestellt eine binaurale Hörvorrichtung mit einer Aufnahmeeinrichtung zum Aufnehmen eines linken Eingangssignals und eines rechten Eingangssig- nals, einer Signalverarbeitungseinrichtung zum Kombinieren der beiden Eingangssignale zu einem Referenzsignal, einer Ge ¬ wichtungseinrichtung zum Ermitteln von spektralen Gewichten aus dem Referenzsignal oder Bereitstellen spektraler Gewichte, mit denen später Nachhall reduzierbar ist, und zum Beauf- schlagen des linken und rechten Eingangssignals mit den spektralen Gewichten, und einer Kohärenzeinrichtung zum Ermitteln einer Kohärenz von Signalanteilen der gewichteten Eingangssignale und zum Dämpfen nicht-kohärenter Signalantei- le beider gewichteter Eingangssignale, um einen frühen Nachhall zu reduzieren.

In vorteilhafter Weise wird erfindungsgemäß also ein binaura- 1er Enthallungsalgorithmus eingesetzt, bei dem später Nach ¬ hall mit Spektralgewichten reduziert wird, die aus einem kom ¬ binierten Signal (rechtes Signal mit linkem Signal) im Fre ¬ quenzbereich gewonnen werden. Zusätzlich wird früher Nachhall durch Berücksichtigung der Kohärenz zwischen linkem und rech- tem Signal reduziert. Dadurch kann eine qualitativ hochwerti ¬ ge Enthallung gewährleistet werden.

Bei der Reduktion des späten Nachhalls wird ein Referenzsig ¬ nal benutzt, das durch Kombinieren des linken und rechten Signals der binauralen Hörvorrichtung gewonnen wird. Bei dem Kombinieren werden vorzugsweise ein zeitlicher Versatz zwischen den beiden Eingangssignalen ausgeglichen und die beiden Eingangssignale anschließend zu dem Referenzsignal addiert. Auf diese Weise lässt sich ein einfaches Referenzsignal ge- winnen, mit dem Gewichte für die Reduktion des späten Nachhalls für beide einzelnen Eingangssignale gewonnen werden können .

Wenn die spektralen Gewichte aus dem Referenzsignal ermittelt werden, ist es günstig, hierzu die Nachhallzeit aus dem Refe ¬ renzsignal zu schätzen. Zum Schätzen der Nachhallzeit ist es besonders vorteilhaft, eine Vorauswahl von Segmenten des Re ¬ ferenzsignals zu treffen. Auf diese Weise kann die Nachhall ¬ zeit zum einen sehr zuverlässig geschätzt werden und zum an- deren lässt sich hierdurch der Rechenaufwand deutlich reduzieren .

Vorzugsweise werden bei der Vorauswahl nur diejenigen Segmente ausgewählt, innerhalb derer ein Abfall des Schallpegels detektiert wird. Dieser Abfall kann zur Schätzung der Nachhallzeit herangezogen werden. Zum Schätzen der Nachhallzeit kann je eine Abfallzeit der vorausgewählten Segmente ermittelt und diejenige Abfallzeit, die mit größter Wahrscheinlichkeit auftritt, als Nachhallzeit festgelegt werden. Damit lässt sich eine robustere Methode zur Gewinnung der Nachhallzeit erreichen.

Darüber hinaus kann bei der Schätzung der Nachhallzeit die Länge jedes der Segmente an diejenige Länge seines Schallab ¬ falls angepasst werden. Durch die variable Länge der Segmente kann deutlich Rechenaufwand eingespart werden.

Ferner ist es vorteilhaft, wenn zum Ermitteln der spektralen Gewichte für die Reduktion des späten Nachhalls die Energie dieses späten Nachhalls geschätzt wird. Für die Energieschät- zung ist nicht zwangsläufig eine Schätzung der Nachhallzeit erforderlich, vielmehr kann die Energie auch allein aus der Korrelation der spektralen Koeffizienten bestimmt werden. Erst mit Kenntnis der Energie des Störschalls (Nachhall) kann dieser wirksam reduziert werden.

Für die Reduktion des frühen Nachhalls im binauralen System wird hier ein Kohärenzverfahren eingesetzt. Beim Ermitteln der Kohärenz wird vorteilhafterweise ein Kohärenzmodell ein ¬ gesetzt, bei dem Abschattungseffekte des Kopfs eines Nutzers berücksichtigt sind. Auf diese Weise wird die natürliche Hör ¬ situation modelliert, bei der Einzelgeräte des binauralen Hörsystems am linken und rechten Ohr getragen werden und der Kopf sich als akustisches Störelement dazwischen befindet. Das Dämpfen nicht-kohärenter Signalanteile zur Reduktion frühen Nachhalls erfolgt vorzugsweise nach dem Gewichten bzw. Filtern der Eingangssignale zur Reduktion späten Nachhalls. Prinzipiell ist es jedoch auch möglich, diese beiden Verarbeitungsstufen in vertauschter Reihenfolge auszuführen. Das Vertauschen reduziert unter Umständen die Wirksamkeit des ge ¬ samten Verfahrens . Die vorliegende Erfindung wird nun anhand der beigefügten Zeichnungen näher erläutert, in denen zeigen:

FIG 1 den prinzipiellen Aufbau eines Hörgeräts gemäß dem

Stand der Technik;

FIG 2 ein Prinzipschalbild eines zweistufigen Enthallungs- systems und

FIG 3 ein detailliertes Blockdiagramm eines zweistufigen

Enthallungssystems .

Die nachfolgend näher geschilderten Ausführungsbeispiele stellen bevorzugte Ausführungsformen der vorliegenden Erfindung dar.

In einer Ausführungsform der Erfindung wird ein binauraler, zweistufiger Algorithmus genutzt, der die gemeinsame Redukti ¬ on frühen und späten Nachhalls erlaubt und grundsätzlich den binauralen Höreindruck wahrt. Ein derartiger Algorithmus ist in M. Jeub, M. Schäfer, T. Esch und P. Vary: „Model-based De- reverberation preserving binaural cues", Preprint 2010, IEEE Transactions on Audio, Speech and Language Processing, be ¬ schrieben. Ein spezieller Ansatz des Kohärenzverfahrens ist in dem oben bereits genannten Artikel „M. Jeub and P. Vary, „Binaural dereverberation based on a dual-channel wiener fil- ter with optimized noise field coherence," in Proc. IEEE Int. Conference on Acoustics, Speech and Signal Processing

(ICASSP), Dallas, TX, USA, 2010", Seiten 4710-4713,

entwickelt. Auf beide Artikel wird hier explizit Bezug genom ¬ men .

FIG 2 gibt ein vereinfachtes Blockdiagramm eines beispielhaf ¬ ten zweistufigen Enthallungssystems wieder. Das Enthallungs- system ist beispielsweise in ein Hörgerätesystem mit zwei Hörgeräten (eines für das linke Ohr und eines für das rechte Ohr) implementiert. Die beiden Hörgeräte des Hörgerätesystems stehen miteinander in Kommunikationsverbindung. So wird bei- spielsweise das Mikrofonsignal des rechten Hörgeräts zum lin ¬ ken Hörgerät übertragen, und in dem linken Hörgerät ist das Enthallungssystem integriert. Dem binauralen Enthallungssys- tem stehen dann beide Eingangssignale 1 und r (linker Kanal und rechter Kanal) gemäß FIG 2 zur Verfügung. In einer ersten Verarbeitungsstufe I sorgt ein entsprechender Algorithmus für die Reduktion späten Nachhalls. Als Ausgang der ersten Stufe I ergibt sich ein binaurales Signal mit einem linken Zwi ¬ schensignal 1' und einem rechten Zwischensignal r' entspre- chend dem linken Kanal und dem rechten Kanal. In den beiden

Zwischensignalen 1' und r' ist der späte Nachhall, der in den Eingangssignalen 1 und r noch vorhanden war, reduziert.

Die beiden Zwischensignale 1' und r' werden einer zweiten Verarbeitungsstufe II zugeführt. Dort ist ein kohärenz ¬ basierter Algorithmus implementiert, der die beiden Signale im Hinblick auf frühen Nachhall verbessert. D. h. im linken Zwischensignal 1' wird der frühe Nachhall reduziert und es ergibt sich ein verbessertes linkes Ausgangssignal 1' ' . Eben- so wird in dem rechten Zwischensignal r' der frühe Nachhall reduziert, so dass sich ein verbessertes rechtes Ausgangssig ¬ nal r' ' ergibt. Am Ende des Enthallungssystems steht also ein verbessertes binaurales Signal mit einem rechten Kanal und einem linken Kanal zur Verfügung, bei dem sowohl der späte Nachhall als auch der frühe Nachhall reduziert ist.

In FIG 3 ist ein Blockdiagramm zur detaillierten Beschreibung der beiden Verarbeitungsstufen I und II von FIG 2 dargestellt. Die Eingangssignale Xi (λ, μ) und X r (λ, μ) der ers- ten Verarbeitungsstufe I, die den Eingangssignalen 1 und r von FIG 2 entsprechen, liegen hier im Frequenzbereich vor. D. h. vor der Verarbeitung in dem dargestellten Enthallungssystem erfolgt eine Transformation in den Frequenzbereich. Der Index λ bezeichnet ein Segment beziehungsweise ein Frame des jeweiligen Eingangssignals. Das Eingangssignal wird näm ¬ lich segmentiert und in Kurzzeitspektren gewandelt. Der Index μ bezeichnet einen Frequenzbereich. Innerhalb der ersten Verarbeitungsstufe I werden die beiden Eingangssignale des linken und rechten Kanals einer Kombina ¬ tionseinheit 10 zugeführt, in der das linke Eingangssignal Xi (λ, μ) und das rechte Eingangssignal X r (λ, μ) zu einem Refe- renzsignal X ref (λ, μ) kombiniert werden. Die beiden Eingangs ¬ signale werden hier derart kombiniert, dass die zeitliche Verschiebung beider Signale zueinander ausgeglichen wird und sie anschließend addiert werden. Das Referenzsignal X ref (λ, μ) wird durch eine Rücktransformationseinheit 11 in den Zeit- bereich rücktransformiert. Aus dem Referenzsignal im Zeitbe ¬ reich wird durch eine Schätzeinrichtung 12 die Nachhallzeit geschätzt. Die Nachhallzeit ist definiert als das Zeitinter ¬ vall, in dem die Energie eines stationären Schallfelds um 60 dB unter den Anfangspegel sinkt, nachdem die Schallquelle ausgeschaltet wurde. Die Schätzung der Nachhallzeit kann bei ¬ spielsweise blind erfolgen, d. h. die Nachhallzeit wird aus einem Hallsignal ohne Kenntnis über das Anregungssignal oder die Raumgeometrie gewonnen. Eine weiterentwickelte Form der Nachhallzeitschätzeinrichtung 12 greift auf einen verbesserten Algorithmus für die blinde Nachhallzeitschätzung zurück. Dieser verbesserte Algorithmus besteht vorzugsweise darin, dass ein verrauschtes und ver ¬ halltes Sprachsignal zunächst von einem Störgeräuschunterdrü- ckungssystem verarbeitet wird, um ein entstörtes, verhalltes Sprachsignal zu erhalten. Danach wird die tatsächliche Nach ¬ hallzeitschätzung durchgeführt. Die Hauptschritte dieses Al ¬ gorithmus sind folgende: In einem ersten Schritt erfolgt eine Unterabtastung, die eine Reduktion der Rechenkomplexität des Algorithmus erlaubt. Mit einer moderaten Unterabtastung kann ein Energieabfall immer noch ausreichend festgestellt werden.

In einem zweiten Schritt wird eine Vorauswahl durchgeführt, um Segmente zu detektieren, in denen ein Schallabfall (Ener- gieabfall des Schalls) auftritt. Diese Detektion erfolgt in den nachstehenden Unterschritten: Das bereits in Frames beziehungsweise Segmente unterteil ¬ te Eingangssignal wird in Sub-Frames geteilt und ein Zäh ¬ ler wird auf null initialisiert.

Die Energie, der Maximalwert und der Minimalwert eines aktuellen Sub-Frames werden mit den Werten des nächsten Sub-Frames verglichen.

Wenn die Energie, der Maximalwert und der Minimalwert des nächsten Sub-Frames kleiner als diejenigen Werte für den aktuellen Sub-Frame sind, wird der Zähler um eins erhöht. Andernfalls wird der Zähler auf null gesetzt.

Wenn die Energie, der Maximalwert und der Minimalwert des nächsten Sub-Frame größer als diejenigen Werte für den aktuellen Sub-Frame sind, wird überprüft, ob der Zähler bereits einen Minimalwert erreicht hat. Der Minimalwert liegt beispielsweise bei drei; bei mindestens drei Werten kann nämlich davon ausgegangen werden, dass es sich nicht um einen zufälligen Energieabfall innerhalb von zwei Sub ¬ Frames handelt, sondern vielmehr um einen tatsächlich gesuchten Energieabfall . Wenn der Zähler also einen vorgegebenen Minimalwert erreicht hat, wird ein Schallabfall angenommen. Dies ist auch der Fall, wenn der Zähler einen vorgegebenen Maximalwert erreicht. Ein Maximalwert wird deswegen vorgegeben, da die Anzahl der Sub-Frames, wenn sie den Maximalwert erreicht, dann ausreichend für eine Schätzung ist. In beiden Fällen (der Zähler erreicht den Minimalwert oder den Maximalwert) wird der Zähler auf null gesetzt und die Nachhallzeit wird mithilfe eines ML- Schätzers berechnet, wie dies beispielsweise in [Ratnam et al . , 2003] vorgestellt ist. Die Schätzung erfolgt für eine Gruppe der letzten aufeinander folgenden Sub-Frames, bei denen der Zähler hochgezählt worden ist. Daher ist die Länge einer solchen Gruppe, bei der die ML-Schätzung angewandt wurde, nicht fest, sondern an den (detektier- ten) Sprachabfall angepasst. Diese ML-Schätzung stellt einen dritten Schritt der Nachhallzeitschätzung dar. Der Wert für die Nachhallzeit, der durch die ML-Schätzung erhalten wurde, wird verwendet, um in einem vierten Schritt ein Histogramm zu aktualisieren, das aus den ML-Schät zwerten be- steht, welche innerhalb eines vorgegebenen, vergangenen Zeit ¬ intervalls berechnet wurden.

In einem fünften Schritt wird ein Wert der Nachhallzeit, der durch das Maximum im Histogramm repräsentiert ist, verwendet, um die tatsächliche Nachhallzeit zu wählen bzw. festzulegen. Schließlich werden in einem sechsten Schritt die Werte der geschätzten Nachhallzeit über der Zeit geglättet, um die Va ¬ rianz der Schätzung zu reduzieren. Der Vorteil der Vorauswahl liegt darin, dass eine signifikante Reduktion der Rechenkomplexität erreicht werden kann. Im Gegensatz zu den früheren Algorithmen [Ratnam 2003, Ratnam 2004, Löllmann 2008] verwendet der neue Ansatz eine adaptive Pufferlänge für die ML-Schätzung, was die Schätzgenauigkeit insbesondere für geringe Nachhallzeiten erhöht. Außerdem wird die tatsächliche Nachhallzeit durch das Maximum des

Histogramms und nicht durch seinen ersten Peak bestimmt.

Zurückkommend auf FIG 3 wird also in der Schätzeinheit 12 ei- ne Nachhallzeit Τβο bestimmt. Dieser Wert Τβο wird zusammen mit dem Referenzsignal im Frequenzbereich einer Berechnungs ¬ einheit 13 zugeführt, die daraus in bekannter Weise bei ¬ spielsweise über eine Energieschätzung Gewichte G' i ate (λ, μ) für die Reduzierung des späten Nachhalls bestimmt. Diese er- mittelten Gewichte werden zeitlich über mehrere Segmente bzw. Frames des Eingangssignals in einer Glättungseinheit 14 ge ¬ glättet. Daraus resultieren schließlich die Gewichte Gi ate (λ, μ) . In einem letzten Schritt der ersten Verarbeitungsstufe I werden die geglätteten Gewichte Gi ate (λ, μ) sowohl mit dem linken Eingangssignal Xi (λ, μ) als auch mit dem rechten Eingangssignal X r (λ, μ) in den Multiplikationseinheiten 15 und 16 multipliziert. Als Produkte ergeben sich für den linken Kanal das Signal S ; (λ, μ) und für den rechten Kanal das Sig- nal S r (λ, μ) , welche den Zwischensignalen 1' und r' aus FIG 2 entsprechen. Es erfolgte damit in der ersten Verarbeitungs ¬ stufe I eine binaurale spektrale Subtraktion zur Reduktion des späten Nachhalls.

Die aus der ersten Verarbeitungsstufe I resultierenden Signa ¬ le S l (λ, μ) und S r (λ, μ) werden nun in einer zweiten Verarbeitungsstufe II von frühem Nachhall so weit wie möglich be ¬ freit. Dies geschieht dadurch, dass ein binaurales Kohärenz- Wiener-Filter eingesetzt wird. Im vorliegenden Beispiel weist das Filter eine Recheneinheit 17 auf, um aus einer Kohärenz der Signale des linken Kanals und rechten Kanals entsprechende Gewichte G COh (λ, μ) für die Dämpfung nicht-kohärenter Sig ¬ nalanteile zu gewinnen. Die Recheneinheit 17 greift hierzu auf ein Kohärenzmodell 18 zurück. Dieses integrierte Kohä ¬ renzmodell 18 berücksichtigt Abschattungseffekte durch den Kopf eines Nutzers in Bezug auf die Kohärenz des Störschall ¬ felds. Es wird beispielsweise ein Kohärenzmodell verwendet, wie es in dem Artikel „Binaural dereverberation based on a dual-channel Wiener filter with optimized noise field cohe- rence" von M. Jeub und P. Vary vorgeschlagen ist. Das verbes ¬ serte Modell bezieht sich auf die Kohärenz des Störschall ¬ felds im Gegensatz zu einem idealen, diffusen Störschallfeld ohne Kopfabschattung . Das Kohärenzmodell 18 kann auf demjeni- gen von [Dörbecker 1998] basieren.

Die von der Recheneinheit 17 erhaltenen Gewichte G COh (λ, μ) werden mit dem Signal S j (λ, μ) multipliziert, um ein ent- halltes Ausgangssignal (λ, μ) im linken Kanal zu erhalten, und mit dem Signal S r (λ, μ) des rechten Kanals multipli ¬ ziert, um ein enthalltes Signal S r (λ, μ) im rechten Kanal zu erhalten. Hierzu sind die Multiplikationseinheiten 19 und 20 vorgesehen . Der wesentliche Vorteil der anhand der FIG 2 und 3 vorge ¬ stellten Kombination besteht darin, dass in der Verarbeitungsstufe I in erster Linie späte Nachhallkomponenten redu- ziert werden, während das anschließende Wiener-Filter in Ver ¬ arbeitungsstufe II alle nicht-kohärenten Signalkomponenten dämpft. Dies führt zu einer wirksamen Reduktion sowohl früher als auch später Nachhallkomponenten. Infolge der zweikanali- gen Systemstruktur wird der binaurale Höreindruck nicht be- einflusst .

In einer alternativen Ausführungsform kann die zweite Verarbeitungsstufe II vor der ersten Verarbeitungsstufe I erfol- gen. Dabei ergeben sich aber unter Umständen geringe Einbußen in der Wirksamkeit der Nachhallreduktion. Darüber hinaus können die an sich voneinander unabhängigen Verarbeitungsstufen I und II auch ineinander verwoben sein. Dann ist eine Zweistufigkeit nicht ohne Weiteres zu erkennen.

In einem weiteren Ausführungsbeispiel wird, wie oben bereits angedeutet wurde, keine Nachhallzeitschätzung mit einer

Schätzeinheit 12 durchgeführt. Vielmehr wird dann zur Bestim ¬ mung der Energie des späten Nachhalls eine Korrelation der spektralen Koeffizienten genutzt.

In einer noch anderen Ausführungsform wird die Nachhallzeit ebenfalls nicht geschätzt, sondern fest vorgegeben. Dabei wird ein Kompromiss für unterschiedliche akustische Gegeben- heiten gefunden. Durch die Vorgabe des Werts für die Nachhallzeit kann deutlich Rechenaufwand eingespart werden unter dem Nachteil einer weniger effizienten Nachhallreduktion.




 
Previous Patent: VOICE COMMUNICATION OF DIGITS

Next Patent: ELECTRIC GENERATOR