Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
PROCESS FOR FINDING THE OVERALL MONITORING THRESHOLD DURING A BIT-RATE-REDUCING SOURCE CODING
Document Type and Number:
WIPO Patent Application WO/1993/002508
Kind Code:
A1
Abstract:
In oder to find the overall monitoring threshold (6) during a bit-rate-reducing source coding of digitised audio signals (1), a requantization and coding regulation for the time or spectral scanning values (2) of the audio signal is found from the masking effect of all relevant maskers and noise maskers (100, 200, 300) and from the steady audio threshold (400). To this end the masking sides (101, 102, 201, 202, 301, 302) of the selected maskers are segmented and approximated in the individual segments by low-order polynomials, whereby the coefficients of the low-order polynomials are found. The intensities of the maskers converted into a logarithmic level are used to find the coefficients of the low-order polynomials. The overall monitoring threshold (6) is found at individual or eventually selected support points in steps, masker by masker, from the polynomials describing the masking sides of the eventually selected maskers.

Inventors:
SEDLMEYER ROBERT (DE)
BREFORT ANDREAS (DE)
GROH JENS (DE)
KRAFFT WOLFGANG (DE)
ROSINSKI KLAUS (DE)
WIESE DETLEF (DE)
STOLL GERHARD (DE)
LINK MARTIN (DE)
Application Number:
PCT/EP1992/001658
Publication Date:
February 04, 1993
Filing Date:
July 21, 1992
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
INST RUNDFUNKTECHNIK GMBH (DE)
International Classes:
H03H17/02; H04B1/66; H04B14/04; (IPC1-7): H04B1/66
Domestic Patent References:
WO1988010035A11988-12-15
Foreign References:
EP0424162A21991-04-24
EP0420745A21991-04-03
EP0176243A21986-04-02
Attorney, Agent or Firm:
KONLE, TILMAR (DE)
Download PDF:
Claims:
1. /o VERFAHREN ZUM ERMITTELN DER GLOBALEN MΓΓHÖRSCHWELLE BEI EINER BITRATENREDUZIERENDEN QUELLCODIERUNG PATENTANSPRÜCHE Verfahren zum Ermitteln der globalen Mithörschwelle bei einer bitratenreduzierenden Quellcodierung digitalisierter Tonsignale, bei dem aus der Verdeckungswirkung aller relevanter tonaler Maskierer und Rauschmaskierer sowie aus der Ruhehörschweile eine Umquantisierungs und Codierungsvorschrift für die zeitlichen oder spektralen Abtastwerte des Tonsignals ermittelt werden, gekennzeichnet durch folgende Verfahrensschritte: a) Die Verdeckungsflanken der ggf. selektierten Maskierer werden segmentiert und in den einzelnen Segmenten durch Polynome niedriger Ordnung angenähert, wobei die Koeffizienten der Polynome niedriger Ordnung ermittelt werden; II b) für die Ermittlung der Koeffizienten der Polynome niedriger Ordnung werden die in logarithmische Pegel umgerechneten Intensitäten der Maskierer verwendet, und c) aus den die Verdeckungsflanken der ggf. selektierten Maskierer beschreibenden Polynomen wird schrittweise Maskierer für Maskierer an einzelnen, ggf. selektierten Stützstellen die globale Mithörschwelle ermittelt. 2 Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß bei der schrittweisen Berechnung der globalen Mithörschwelle mit dem frequenzmäßig höchsten Maskierer begonnen wird.
2. 3 Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß bei der schrittweisen Berechnung der Mithörschwelle stets von dem jeweiligen Maskierer ausgehend dessen spektrale Verdeckungsflanke frequenzmäßig nach oben und dann nach unten ermittelt wird.4 Verfahren nach einem der Ansprüchel bis 3, dadurch gekennzeichnet, daß diejenigen Maskierer unberücksichtigt bleiben, deren Verdeckungsflanken im wesentlichen keine Auswirkungen auf die Ermittlung der globalen Mithörschwelle anhand der Verdeckungsflanken benachbarter Maskierer haben.
3. 5 Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß diejenigen Maskierer unberücksichtigt bleiben, deren Verdeckungsflanke hinsichtlich des Pegels bzw. der Intensität weit unterhalb der globalen Mithörschwelle liegen.
4. 6 Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Berücksichtigung eines Maskierers bei der Ermittlung der globalen Mithörschwelle abgebrochen wird, sobald die Auswirkung seiner Verdeckungsflanke auf die Ermittlung der globalen Mithörschwelle ein bestimmtes Maß unterschreitet.
5. 7 Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Berücksichtigung eines Maskierers bei der Ermittlung der globalen Mithörschwelle abgebrochen wird, sobald der Pegel bzw. die Intensität seiner Verdeckungsflanke an der momentan ermittelten Stützstelle der globalen Mithörschwelle ein bestimmtes Maß unterschreitet, so daß der Pegel bzw. die Intensität der Verdeckungsflanke im wesentlichen keine Auswirkungen auf die Ermittlung der globalen Mithörschwelle hat.
6. 8 Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß die Berücksichtigung eines Maskierers bei der Ermittlung der globalen Mithörschwelle abgebrochen wird, sobald der Pegel bzw. die Intensität der Verdeckungsflanke des Maskierers an der momentan ermittelten Stützstelle der globalen Mithörschwelle ein bestimmtes Maß unter die Intensität bzw. den Pegel der Ruhehörschwelle absinkt.
7. 9 Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß die Intensitäten der Verdeckungsflanke der einzelnen Maskierer bei der schrittweisen Ermittlung der globalen Mithörschwelle addiert werden. /3 10 Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß die Intensitätsaddition mit Hilfe eines Nomogramms erfolgt.
8. 11 Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß als Eingangswert für das Nomogramm der Absolutwert der Pegeldifferenz zwischen der bis dahin ermittelten globalen Mithörschwelle und der Verdeckungsflanke des momentan betrachteten Maskierers verwendet wird.
9. 12 Verfahren nach Anspruch 10 oder 11 , dadurch gekennzeichnet, daß der Ausgangswert des Nomogramms zu dem maximalen Pegel bzw. Intensitätswert addiert wird, der aus der bis dahin ermittelten globalen Mithörschwelle und der Verdeckungsflanke des momentan betrachteten Maskierers gebildet wird.
10. 13 Verfahren nach einem der Ansprüche 9 bis 12, dadurch gekennzeichnet, daß die möglichen Intensitäten bzw. Pegeladditionswerte auf eine vorausberechnete, der gewünschten Genauigkeit entsprechende Anzahl beschränkt werden.
11. 14 Verfahren nach einem der Ansprüche 1 bis 13, dadurch gekennzeichnet, daß die spektralen Stützstellen für die Berechnung der globalen Mithörschwelle so festgelegt werden, daß sie nur an diskreten, spektralen Orten zu liegen kommen.
12. 15 Verfahren nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, daß der spektrale Abstand der Stützstellen zur Ermittlung der globalen IH Mϊthörschwelle im unteren Frequenzbereich geringer ist als im mittleren Frequenzbereich und im oberen Frequenzbereich größer ist als im mittleren Frequenzbereich.
13. 16 Verfahren nach einem der Ansprüche 1 bis 15, dadurch gekennzeichnet, daß das digitalisierte Tonsignal in den Frequenzbereich abgebildet wird und daß die spektralen Stützstellen für die Ermittlung der globalen Mithörschwelle so festgelegt werden, daß sie auf den Stützstellen der Abbildung zu liegen kommen.
14. 17 Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet, daß die logarithmischen Pegel in Pegelstufen quantisiert werden.
15. 18 Verfahren nach Anspruch 17, dadurch gekennzeichnet, daß zur Umrechnung der Intensitäten in logarithmische Pegel eine Tabelle verwendet wird.
16. 19 Verfahren nach Anspruch 18, dadurch gekennzeichnet, daß die Anzahl der in der Tabelle enthaltenen Zuordnungen zwischen Intensitätswerten und logarithmischen Pegelstufen durch Aufteilung der Intensitätswerte in Mantissen und Exponenten und durch Ablage lediglich der Mantissen reduziert wird.
Description:
Verfahren zum Ermitteln der globalen Mithörschwelle bei einer bitratenreduzierenden Quellcodierung

BESCHREIBUNG

Die Erfindung bezieht sich auf ein Verfahren zum Ermitteln der globalen Mithörschwelle bei einer bitratenreduzierenden Quellcodierung.

Zur Codierung von digitalen Tonsignalen mit bitratenreduzierenden Codierverfahren, ist es aus der WO 88/04 117 bekannt, die spektrale Mithörschwelle zur Gewinnung einer Umquantisierungsvorschrift zu berechnen.

Da die zu übertragenden Signale nicht nur aus einem einzigen Ton, sondern aus einer Vielzahl von Harmonischen bestehen, sind die von solchen Signalen hervorgerufenen Mithörschwellen sehr verschieden. Deren Berechnung erfordert die Berücksichtigung aller relevanten tonalen Maskierer sowie aller relevanten Rauschmaskierer, die jeweils frequenz- und pegelabhängige Verdeckungsflanken besitzen. Eine derart umfangreiche Berücksichtigung erfordert einen entsprechend hohen Rechenaufwand im Quellcodierer, welcher sich nur bei einer Rechnersimulation, nicht jedoch bei einer Echtzeitrealisierung vertreten läßt.

Die Aufgabe der Erfindung besteht demgegenüber darin, den Rechenaufwand für eine bitratenreduzierende Quellcodierung insbesondere für Echtzeitanwendungen zu verringern.

Diese Aufgabe wird erfindungsgemäß durch die kennzeichnenden Merkmale des Patentanspruches 1 gelöst.

Vorteilhafte Ausgestaltungen und Weiterbildung des erfindungsgemäßen Verfahrens ergeben sich aus den Unteransprüchen.

Die Erfindung wird anhand der Zeichnungen näher erläutert. Es zeigt:

Fig. 1 ein Blockschaltbild eines Quellcodierers zur Durchführung des erfindungsgemäßen Verfahrens;

Fig. 2 ein Frequenzdiagramm mit drei Maskierern und der

Ruhehörschwelle, deren gemeinsame Verdeckungswirkung in der erfindungsgemäß ermittelten, globalen Mithörschwelle resultiert.

Bei dem Blockschaltbild nach Fig. 1 wird das eingangsseitige digitalisierte Tonsignal 1 im Falle einer Teilbandcodierung einer Polyphasen-Filterbank 10 zugeführt, welche Teilband-Abtastwerte 2 erzeugt. Im Falle einer Transformationscodierung wird die Filterbank 10 durch eine Zeit/Frquenz- Transformationsstufe ersetzt, welche diskrete, spektrale Abtastwerte erzeugt, z.B. entsprechend einer Cosinus- oder einer Fast-Fourier-Transformation. Die Abtastwerte 2 werden in einer Quantisierungsstufe 20 entsprechend ihres zulässigen Quantisierungsrauschens nach Maßgabe eines Codier- und Umquantisierungs-Steuerungssignals 7 umquantisiert. Das Steuerungssignal 7 wird zusammen mit den umquantisierten Abtastwerten 3 einem Multiplexer 70 zugeführt, welcher die Signale 3 und 7 je nach angewandter Bitratenreduktion in einen Zeitmultiplexrahmen einfügt, um das Ausgangssignal 8 zu bilden.

Das eingangsseitige, digitalisierte Tonsignal 1 wird ferner einer Transformationsstufe 40 zugeführt, welche im Falle einer Teilbandcodierung diskrete, spektrale Abtastwerte 5 erzeugt. Im Falle einer Transfor¬ mationscodierung können die in der Zeit/Frequenz-Transformationsstufe ermittelten spektralen Abtastwerte als Abtastwerte 5 verwendet werden (gestrichelt eingezeichneter Pfad 2a). Aus den Abtastwerten 5 und ggf. den maximalen Signalpegeln 4 berechnet eine Stufe 50 nach einer erfindungs¬ spezifischen Vorgehensweise die globale Mithörschwelle 6, wie im einzelnen noch näher erläutert wird.

Bei einer Teilbandcodierung werden aus den Abtastwerten 2 zusätzlich die maximalen Signalpegel 4 in den einzelnen Teilbändern durch eine Stufe 30 ermittelt.

Aus der globalen Mithörschwelle 6 wird in einer Stufe 60 das oben erwähnte Codier- und Umquantierungs-Steuerungssignal 7 erzeugt. Die Stufe 60 ist in Fig. 3, Informationsblöcke 5.5 und 5.3 der eingangs erwähnten WO 88/04117 beschrieben, worauf ausdrücklich Bezug genommen wird. Und zwar sind in dem dortigen Informationsblock 5.5 das Verhältnis zwischen maximal auftretendem (maskierendem) Teilbandpegel und minimaler, globaler Mithörschwelle (entsprechend zulässigem Quantisierungsrauschen) bestimmt, aus welchem in dem nachfolgenden Informationsblock 5.3 die teilbandmäßige Zuweisung der Quantisierung (= Auflösung) berechnet wird.

Im folgenden soll nunmehr unter Bezugnahme auf Fig. 2 die Berechnung der globalen Mithörschwelle 6 näher erläutert werden.

V

In dem Frequenzdiagramm nach Fig. 2 sind drei Maskierer 100, 200, 300 bei 250 Hz, 1 KHz und 4 kHz mit ihren oberen Verdeckungsflanken 101, 201 bzw. 301 sowie ihren unteren Verdeckungsflanken 102, 202 bzw. 302 aufgetragen. Weiterhin ist in Fig. 2 die Ruhehörschwelle 400 eingezeichnet. Aus dem Zusammenwirken von oberen und unteren Verdeckungsflanken 101, 201, 301, 102, 202, 302 und der Ruhehörschwelle 400 läßt sich unter Anwendung der nachstehenden, erfindungsspezifischen Vorgehensweise in vorteilhafter Weise die globale Mithörschwelle 6 ermitteln.

Und zwar werden bei einem bevorzugten Ausführungsbeispiel zur Reduktion des Rechenaufwandes für die Berechnung der globalen Mithörschwelle folgende Kriterien berücksichtigt:

a) Jeder Maskierer 100, 200, 300 besitzt, wie in Fig. 2 dargestellt, eine obere und eine untere Verdeckungsflanke 101 bzw. 102, 201 bzw. 202, 301 bzw. 302. Diese Verdeckungsflanken werden beschrieben durch Polynome höherer Ordnung. Da Polynomberechnungen sehr aufwendig sind, werden diese Verdeckungsflanken segmentiert und diese mit Polynomen niedriger Ordnung, z.B. Geradengleichungen angenähert.

b) Da die Verdeckungsflanken der einzelnen Maskierer zur Berechnung der globalen Mithörschwelle 6 ggf. Pegelabhängigkeiten enthalten, müssen die aus der Transformation der Tonsignale in den Frequenzbereich berechneten Intensitäten in logarithmische Pegel umgerechnet werden. Die Logarithmierung wird normalerweise ebenfalls mit einem Polynom höherer Ordnung berechnet und ist somit für eine Realisierung zu aufwendig. Da es jedoch ausreichend ist, die Logarithmierung mit einer

begrenzten Genauigkeit zu berechnen, wird die Anzahl der in der Tabelle enthaltenen logarithmischen Pegelstufen erfindungsgemäß auf eine geringe Anzahl reduziert. Diese logarithmischen Pegel werden in einer Tabelle abgelegt, welche dann anstatt der Polynomberechnung benutzt wird. Wenn die Logarithmierung mit Hilfe einer Aufspaltung der Intensitäten in Mantisse und Exponent realisiert wird, so werden die logarithmischen Pegel der Mantisse in einer Tabelle abgelegt, welche dann anstatt der Polynomberechnung benutzt wird.

c) Nicht alle Maskierer sind für die Berechnung der globalen Mithörschwelle relevant, da ein Maskierer einen anderen Maskierer verdecken kann. Die Verdeckungsflanke eines solchen verdeckten Maskierers liegt pegel- oder intensitätsmäßig weit unterhalb der globalen Mithörschwelle und hat somit keine nennenswerte Auswirkung mehr auf die globale Mithörschwelle. Deshalb werden diese nicht relevanten Maskierer in der Stufe 50 aussortiert und nicht mehr zur Berechnung der globalen Mithörschwelle 6 herangezogen.

d) Alle Maskierer, deren Verdeckungsflanken intensitäts- oder pegelmäßig soweit unterhalb der Ruhehörschwelle 400 des menschlichen Gehörs liegen, daß die aus der Verdeckungskurve des Maskierers und der Ruhehörschwelle resultierende Verdeckung nicht wesentlich größer ist als die Ruhehörschwelle selbst, sind für die Berechnung der globalen Mithörschwelle nicht relevant, da die Verdeckungsflanke eines solchen Maskierers intensitäts- oder pegelmäßig weit unterhalb der globalen Mithörschwelle 6 liegt und somit keine nennenswerte Auswirkung mehr auf die globale Mithörschwelle hat. Deshalb werden auch diese nicht

l relevanten Maskierer in der Stufe 50 aussortiert und nicht mehr zur Berechnung der globalen Mithörschwelle 6 herangezogen.

e) Mit numerischen Methoden ist es in einem digitalen System prinzipiell nicht möglich, einen durchgehenden Kurvenverlauf zu berechnen. Die spektralen Stützstellen für die Berechnung der globalen Mithörschwelle 6 werden deshalb so festgelegt, daß sie nur an diskreten spektralen Orten berechnet werden.

f) Die erforderliche spektrale Auflösung zur Berechnung der globalen Mithörschwelle 6 läßt sich mit Hilfe der Psychoakustik in Bezug auf die Mithörschwelle auf eine begrenzte Anzahl von Stützstellen reduzieren. Die spektralen Stützstellen für die Berechnung der globalen Mithörschwelle 6 werden dehalb so festgelegt, daß sie im unteren Frequenzbereich einen niedrigeren spektralen Abstand haben als im oberen Frequenzbereich.

g) Zur Berechnung der globalen Mithörschwelle 6 muß das Tonsignal mit Hilfe einer Transformation in den Frequenzbereich abgebildet werden (Stufe 40; Fig. 1), um eine spektrale Analyse des Tonsignals zu ermöglichen. Die spektralen Stützstellen für die Berechnung der globalen Mithörschwelle 6 werden dabei so festgelegt, daß sie auf den Stützstellen dieser Transformation zu liegen kommen. Durch den höheren spektralen Abstand der Stützstellen zur Berechnung der Mithörschwelle im oberen Frequenzbereich wird dort nur ein Teil der Stützstellen der Transformation benutzt.

1- h) Die globale Mithörschwelle 6 wird an ihren Stützstellen schrittweise Maskierer für Maskierer berechnet. Da ein Maskierer in der Regel zu höheren Frequenzen hin mehr verdeckt als zu niedrigeren, wird bei der schrittweisen Berechnung der globalen Mithörschwelle 6 mit dem frequenzmäßig höchsten Maskierer begonnen, so daß das im folgenden Absatz beschriebene Abbruchkriterium möglichst früh zum Tragen kommt.

i) Bei der schrittweisen Berechnung der globalen Mithörschwelle 6 wird immer von dem jeweiligen Maskierer ausgehend dessen spektrale Ver¬ deckungsflanke frequenzmäßig nach oben und danach nach unten be¬ rechnet. Dies ermöglicht einen frühzeitigen Abbruch der Berechnung des Verdeckungsanteils, der durch die Verdeckungsflanke des jeweiligen Maskierers zur globalen Mithörschwelle 6 beiträgt. Dieser Abbruch erfolgt sobald die Auswirkung der Verdeckungsflanke des jeweiligen Maskierers auf die bisher berechnete globale Mithörschwelle 6 ein bestimmtes Maß unterschreitet.

j) Die Berechnung der Auswirkung der Verdeckungsflanke eines Maskierers und die globale Mithörschwelle 6 wird abgebrochen, sobald die Intensität oder der Pegel der Verdeckungsflanke des Maskieres an der momentan berechneten Stützstelle der globalen Mithörschwelle 6 ein bestimmtes Maß unterschreitet, so daß er keine nennenswerte Auswirkung mehr auf die globale Mithörschwelle 6 hat.

k) Die Berechnung der Auswirkung der Verdeckungsflanke eines Maskierers auf die globale Mithörschwelle 6 wird abgebrochen, sobald die Intensität

oder der Pegel der Verdeckungsflanke des Maskierers an der momentan berechneten Stützstelle der globalen Mithörschwelle 6 ein bestimmtes Maß unter die Intensität oder den Pegel der Ruhehörschwelle 400 fällt und somit keine nennenswerte Auswirkung mehr auf die globale Mithörschwelle 6 hat.

1) Die globale Mithörschwelle 6 setzt sich, wie oben beschrieben, aus der Verdeckungswirkung verschiedener einzelner Maskierer 100, 200, 300 zusammen und wird durch Intensitätsaddition der Verdeckungsflanken 101, 102, 201, 202, 301, 302 dieser einzelnen Maskierer gebildet. Diese Intensitätsaddition erfordert normalerweise einen erheblichen Rechenaufwand, da ausgehend von logarithmischen Pegeln eine Intensitätsaddition mehrere Potenzierungen und Logarithmierungen erfordert. Die Intensitätsaddition wird deshalb mit Hilfe eines Nomogramms durchgeführt. Als Eingangswert für das Nomogramm wird der Absolutwert der Pegeldifferenz zwischen der bisher berechneten globalen Mithörschwelle 6 und der Verdeckungsflanke des momentan betrachteten Maskierers benutzt. Als Ausgangswert des Nomogramms erhält man einen logarithmischen Pegel, der zu dem maximalen Pegel, gebildet aus der bisher berechneten globalen Mithörschwelle 6 und der Verdeckungsflanke des momentan betrachteten Maskierers, addiert wird. Da die erforderliche Genauigkeit für die Intensitätsaddition begrenzt ist, wird die Anzahl der möglichen Pegeladditionswerte auf eine geringe Anzahl reduziert. Diese können für das Nomogramm voraus-berechnet werden und für die real auftretenden absoluten Pegeldifferenzen angewendet werden.

Von den vorgenannten Schnitten a) bis 1) können im Bedarfsfall nur ein Teil der Schnitte angewandt werden, wie dies in den Unteransprüchen angegeben ist.




 
Previous Patent: AM RECEIVER

Next Patent: BASIC RATE INTERFACE