Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
DEVICE AND METHOD FOR DETERMINING A QUANTISER STEP SIZE
Document Type and Number:
WIPO Patent Application WO/2005/083681
Kind Code:
A1
Abstract:
In order to determine a quantiser step size for quantising a signal comprising audio or video information, a first quantiser step size and an interference threshold are supplied (502). According to the invention, the actual interference introduced by means of the first quantizer step size is determined (504) and compared with the interference threshold (506). Even if the comparison indicates that the actually introduced interference is higher than the threshold, a second coarser quantizer step size is used (508), that is then used for the quantisation (514) if it emerges that the interference introduced by the coarser second quantizer step size is lower than the threshold or the interference introduced by the first quantiser step size (512). In this way, the quantisation interference is reduced during the coarsening of the quantisation and thus during an increase in the compression gain.

Inventors:
GRILL BERNHARD (DE)
SCHUG MICHAEL (DE)
TEICHMANN BODO (DE)
RETTELBACH NIKOLAUS (DE)
Application Number:
PCT/EP2005/001652
Publication Date:
September 09, 2005
Filing Date:
February 17, 2005
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
FRAUNHOFER GES FORSCHUNG (DE)
GRILL BERNHARD (DE)
SCHUG MICHAEL (DE)
TEICHMANN BODO (DE)
RETTELBACH NIKOLAUS (DE)
International Classes:
G10L19/032; (IPC1-7): G10L19/02
Other References:
QUACKENBUSH S R ED - INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS: "CODING OF NATURAL AUDIO IN MPEG-4", PROCEEDINGS OF THE 1998 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING. ICASSP '98. SEATTLE, WA, MAY 12 - 15, 1998, IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, NEW YORK, NY : IEEE, US, vol. VOL. 6 CONF. 23, 12 May 1998 (1998-05-12), pages 3797 - 3800, XP000951286, ISBN: 0-7803-4429-4
DOMAZET D ET AL: "Advanced software implementation of MPEG-4 AAC audio encoder", VIDEO/IMAGE PROCESSING AND MULTIMEDIA COMMUNICATIONS, 2003. 4TH EURASIP CONFERENCE FOCUSED ON 2-5 JULY 2003, PISCATAWAY, NJ, USA,IEEE, vol. 2, 2 July 2003 (2003-07-02), pages 679 - 684, XP010650238, ISBN: 953-184-054-7
BRANDENBURG K: "MP3 AND AAC EXPLAINED", PROCEEDINGS OF THE INTERNATIONAL AES CONFERENCE, 1999, pages 99 - 110, XP008004053
Attorney, Agent or Firm:
ZINKLER, Franz et al. (Zimmermann Stöckeler & Zinkle, Postfach 246 Pullach, DE)
Download PDF:
Claims:

Patentansprüche 1. Vorrichtung zum Ermitteln einer Quantisierer- Schrittweite zum Quantisieren eines Signals, das Au- dio-oder Videoinformationen aufweist, mit folgenden Merkmalen : einer Einrichtung (502) zum Liefern einer ersten Quan- tisierer-Schrittweite und einer Störungsschwelle ; einer Einrichtung (504) zum Bestimmen einer durch die erste Quantisierer-Schrittweite eingeführten ersten Störung ; einer Einrichtung (506) zum Vergleichen der durch die erste Quantisierer-Schrittweite eingeführten Störung mit der Störungsschwelle ; einer Einrichtung (508) zum Wählen einer zweiten Quan- tisierer-Schrittweite, die größer als die erste Quan- tisierer-Schrittweite ist, wenn die eingeführte erste Störung größer als die Störungsschwelle ist ; einer Einrichtung (510) zum Bestimmen einer durch die zweite Quantisierer-Schrittweite eingeführten zweiten Störung ; einer Einrichtung (512) zum Vergleichen der eingeführ- ten zweiten Störung mit der Störungsschwelle oder der eingeführten ersten Störung ; und einer Einrichtung (514) zum Quantisieren des Signals mit der zweiten Quantisierer-Schrittweite, wenn die

eingeführte zweite Störung kleiner als die eingeführte erste Störung oder kleiner als die Störungsschwelle ist.

2. Vorrichtung nach Anspruch 1, bei der das Signal ein Audiosignal ist und Spektralwerte einer Spektraldar- stellung des Audiosignals aufweist, und bei der die Einrichtung (502) zum Liefern als psychoakustisches Modell ausgebildet ist, das eine erlaubte Störung für ein Frequenzband, basierend auf einer psychoakusti- schen Maskierungsschwelle berechnet.
3. Vorrichtung nach Anspruch 1 oder 2, bei der die Ein- richtung (504) zum Bestimmen der eingeführten ersten Störung oder die Einrichtung (510) zum Berechnen der eingeführten zweiten Störung ausgebildet ist, um unter Verwendung einer Quantisierer-Schrittweite zu quanti- sieren, um unter Verwendung der Quantisierer- Schrittweite zu requantisieren, und um einen Abstand zwischen dem requantisierten Signal und dem Signal zu berechnen, um die eingeführte Störung zu erhalten.
4. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (502) zum Liefern der ersten Quantisierer-Schrittweite ausgebildet ist, um die Quantisierer-Schrittweite gemäß folgender Gleichung zu berechnen : bei der die Einrichtung (514) zum Quantisieren ausge- bildet ist, um gemäß der folgenden Gleichung zu quan- tisieren. y \" x. y ; = round'+ s q

wobei xi ein zu quantisierender Spektralwert ist, wo- bei q die Quantisierer-Schrittweiten-Informationen darstellt, wobei s eine Zahl ungleich oder gleich Null ist, wobei a ein Exponent ungleich"1"ist, wobei Round eine Rundungsfunktion ist, die einen Wert aus einem ersten größeren Wertebereich in einen Wert in einem zweiten kleineren Wertebereich abbildet, wobei (THR) die erlaubte Störung ist, und wobei i ein Laufindex für Spektralwerte in dem Frequenzband ist.

5. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (508) zum Wählen ferner ausge- bildet ist, um dann, wenn die eingeführte Störung kleiner als die erlaubte Störung ist, eine größere Quantisierer-Schrittweite zu wählen.
6. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (502) zum Liefern ausgebildet ist, um die erste Quantisierer-Schrittweite als Ergeb- nis einer Analyse/Synthese-Ermittlung zu liefern.
7. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (508) zum Wählen ausgebildet ist, um eine Quantisierer-Schrittweite für ein Fre- quenzband, unabhängig von einer Quantisierer- Schrittweite für ein anderes Frequenzband zu verän- dern.

8. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (502) zum Liefern ausgebildet ist, um die erste Quantisierer-Schrittweite als Ergeb- nis eines vorausgehenden Iterationsschritts mit einer Vergröberung der Quantisierer-Schrittweite zu ermit- teln, und bei dem die Störungsschwelle eine durch eine im vorausgehenden Iterationsschritt zum Bestimmen der ersten Quantisierer-Schrittweite eingeführte Störung ist.
9. Verfahren zum Ermitteln einer Quantisierer- Schrittweite zum Quantisieren eines Signals, das Au- dio-oder Videoinformationen aufweist, mit folgenden Schritten : Liefern (502) einer ersten Quantisierer-Schrittweite und einer Störungsschwelle ; Bestimmen (504) einer durch die erste Quantisierer- Schrittweite eingeführten ersten Störung ; Vergleichen (506) der durch die erste Quantisierer- Schrittweite eingeführten Störung mit der Störungs- schwelle ; Wählen (508) einer zweiten Quantisierer-Schrittweite, die größer als die erste Quantisierer-Schrittweite ist, wenn die eingeführte erste Störung größer als die Störungsschwelle ist ; Bestimmen (510) einer durch die zweite Quantisierer- Schrittweite eingeführten zweiten Störung ;

Vergleichen (512) der eingeführten zweiten Störung mit der Störungsschwelle oder der eingeführten ersten Stö- rung ; Quantisieren (514) des Signals mit der zweiten Quanti- sierer-Schrittweite, wenn die eingeführte zweite Stö- rung kleiner als die eingeführte erste Störung oder kleiner als die Störungsschwelle ist.

10. Computerprogramm mit einem Programmcode zum Ausführen des Verfahrens gemäß Patentanspruch 9, wenn das Compu- terprogramm auf einem Computer abläuft.
Description:

Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite Beschreibung Die vorliegende Erfindung bezieht sich auf Audiocodierer und insbesondere auf Audiocodierer, die Transformtions- basiert sind, d. h., bei denen zu Beginn der Codierer- Pipeline eine Umsetzung einer zeitlichen Darstellung in ei- ne spektrale Darstellung erfolgt.

Ein bekannter Transformations-basierter Audiocodierer ist in Fig. 3 gezeigt. Der in Fig. 3 gezeigte Codierer ist im internationalen Standard ISO/IEC 14496-3 : 2001 (E), Subpart 4, Seite 4, dargestellt und in der Technik auch als AAC- Codierer bekannt.

Nachfolgend wird der bekannte Codierer dargestellt. An ei- nem Eingang 1000 wird ein zu codierendes Audiosignal einge- speist. Dieses wird zunächst einer Skalierungss-t-u-f-e-1002 zugeführt, in der eine sogenannte AAC-Verstärkungssteuerung durchgeführt wird, um den Pegel des Audiosignals festzule- gen. Seiteninformationen aus der Skalierung werden einem Bitstromformatierer 1004 zugeführt, wie es durch den Pfeil zwischen dem Block 1002 und dem Block 1004 dargestellt ist. Das skalierte Audiosignal wird hierauf einer MDCT- Filterbank 1006 zugeführt. Beim AAC-Codierer implementiert die Filterbank eine modifizierte diskrete Cosinustransfor- mation mit 50 % überlappenden Fenstern, wobei die Fenster- länge durch einen Block 1008 bestimmt wird.

Allgemein gesagt ist der Block 1008 dazu vorhanden, dass transiente Signale mit kürzeren Fenstern gefenstert werden, und dass eher stationäre Signale mit längeren Fenstern ge- fenstert werden. Dies dient dazu, dass aufgrund der kürze- ren Fenster für transiente Signale eine höhere Zeitauflö- sung (auf Kosten der Frequenzauflösung) erreicht wird, wäh- rend für eher stationäre Signale eine höhere Frequenzauflö- sung (auf Kosten der Zeitauflösung) durch längere Fenster erreicht wird, wobei tendenziell längere Fenster bevorzugt werden, da sie einen größeren Codiergewinn versprechen. Am Ausgang der Filterbank 1006 liegen zeitlich betrachtet auf- einanderfolgende Blöcke von Spektralwerten vor, die je nach Ausführungsform der Filterbank MDCT-Koeffizienten, Fourier- Koeffizienten oder auch Subbandsignale sein können, wobei jedes Subbandsignal eine bestimmte begrenzte Bandbreite hat, die durch den entsprechenden Subbandkanal in der Fil- terbank 1006 festgelegt wird, und wobei jedes Subbandsignal eine bestimmte Anzahl von Subband-Abtastwerten aufweist.

Nachfolgend wird beispielhaft der Fall dargestellt, bei dem die Filterbank zeitlich betrachtet aufeinanderfolgende Blö- cke von MDCT-Spektralkoeffizienten ausgibt, die allgemein gesagt, aufeinanderfolgende Kurzzeitspektren des zu codie- renden Audiosignals am Eingang 1000 darstellen. Ein Block von MDCT-Spektralwerten wird dann in einen TNS- Verarbeitungsblock 1010 eingespeist, in dem eine zeitliche Rauschformung stattfindet (TNS = temporary noise shaping).

Die TNS-Technik wird dazu verwendet, um die zeitliche Form des Quantisierungsrauschens innerhalb jedes Fensters der Transformation zu formen. Dies wird dadurch erreicht, dass ein Filterprozess auf Teile der Spektraldaten jedes Kanals angewendet wird. Die Codierung wird auf einer Fensterbasis durchgeführt. Insbesondere werden die folgenden Schritte

ausgeführt, um das TNS-Tool auf ein Fenster spektraler Da- ten, also auf einen Block von Spektralwerten anzuwenden.

Zunächst wird ein Frequenzbereich für das TNS-Tool ausge- wählt. Eine geeignete Auswahl besteht darin, einen Fre- quenzbereich von 1,5 kHz bis zum höchsten möglichen Skalen- faktorband mit einem Filter abzudecken. Es sei darauf hin- gewiesen, dass dieser Frequenzbereich von der Abtastrate abhängt, wie es im AAC-Standard (ISO/IEC 14496-3 : 2001 (E)) spezifiziert ist.

Anschließend wird eine LPC-Berechnung (LPC = linear predic- tive coding = lineare prädiktive Codierung) ausgeführt, und zwar mit den spektralen MDCT-Koeffizienten, die in dem aus- gewählten Zielfrequenzbereich liegen. Für eine erhöhte Sta- bilität werden Koeffizienten, die Frequenzen unter 2,5 kHz entsprechen, aus diesem Prozess ausgeschlossen. übliche LPC-Prozeduren, wie sie aus der Sprachverarbeitung bekannt sind, können für die LPC-Berechnung verwendet werden, bei- spielsweise der bekannte Levinson-Durbin-Algorithmus. Die Berechnung wird für die maximal zulässige Ordnung des Rauschformungsfilters ausgeführt.

Als Ergebnis der LPC-Berechnung wird der erwartete Prädik- tionsgewinn PG erhalten. Ferner werden die Reflexionskoef- fizienten oder Parcor-Koeffizienten erhalten.

Wenn der Prädiktionsgewinn eine bestimmte Schwelle nicht überschreitet, wird das TNS-Tool nicht angewendet. In die- sem Fall wird eine Steuerinformation in den Bitstrom ge- schrieben, damit ein Decodierer weiß, dass keine TNS- Verarbeitung ausgeführt worden ist.

Wenn der Prädiktionsgewinn jedoch eine Schwelle überschrei- tet, wird die TNS-Verarbeitung angewendet.

In einem nächsten Schritt werden die Reflexionskoeffizien- ten quantisiert. Die Ordnung des verwendeten Rauschfor- mungsfilters wird durch Entfernen aller Reflexionskoeffi- zienten mit einem Absolutwert kleiner als eine Schwelle von dem"Schwanz"des Reflexionskoeffizienten-Arrays bestimmt.

Die Anzahl der verbleibenden Reflexionskoeffizienten liegt in der Größenordnung des Rauschformungsfilters. Eine geeig- nete Schwelle liegt bei 0,1.

Die verbleibenden Reflexionskoeffizienten werden typischer- weise in lineare Prädiktionskoeffizienten umgewandelt, wo- bei diese Technik auch als"Step-Up"-Prozedur bekannt ist.

Die berechneten LPC-Koeffizienten werden dann als Codierer- Rauschformungsfilterkoeffizienten, also als Prädiktionsfil- terkoeffizienten verwendet. Dieses FIR-Filter wird über den spezifizierten Zielfrequenzbereich geführt. Bei der Deco- dierung wird ein autoregressives Filter verwendet, während bei der Codierung ein sogenanntes Moving-Average-Filter verwendet wird. Schließlich werden noch die Seiteninforma- tionen für das TNS-Tool dem Bitstromformatierer zugeführt, wie es durch den Pfeil dargestellt ist, der zwischen dem Block TNS-Verarbeitung 1010 und dem Bitstromformatierer 1004 in Fig. 3 gezeigt ist.

Hierauf werden mehrere in Fig. 3 nicht gezeigte optionale Tools durchlaufen, wie beispielsweise ein Langzeitprädikti- ons-Tool, ein Intensity/Kopplungs-Tool, ein Prädiktions- Tool, ein Rauschsubstitutions-Tool, bis schließlich zu ei- nem Mitte/Seite-Codierer 1012 gelangt wird. Der Mit-

te/Seite-Codierer 1012 ist dann aktiv, wenn das zu codie- rende Audiosignal ein Multikanalsignal ist, also ein Ste- reosignal mit einem linken Kanal und einem rechten Kanal. Bisher, also in der Verarbeitungsrichtung vor dem Block 1012 in Fig. 3 wurden der linke und der rechte Stereokanal getrennt voneinander verarbeitet, also skaliert, durch die Filterbank transformiert, der TNS-Verarbeitung unterzogen oder nicht etc.

Im Mitte/Seite-Codierer wird dann zunächst überprüft, ob eine Mitte/Seite-Codierung sinnvoll ist, also überhaupt ei- nen Codiergewinn bringt. Eine Mitte/Seite-Codierung wird dann einen Codiergewinn bringen, wenn der linke und der rechte Kanal eher ähnlich sind, da dann der Mitte-Kanal, also die Summe aus dem linken und dem rechten Kanal nahezu gleich dem linken oder dem rechten Kanal ist, abgesehen von der Skalierung durch den Faktor 1/2, während der Seite- Kanal nur sehr kleine Werte hat, da er gleich der Differenz zwischen dem linken und dem rechten Kanal ist. Damit ist zu sehen, dass dann, wenn der linke und der rechte Kanal annä- hernd gleich sind, die Differenz annähernd Null ist bzw. nur ganz kleine Werte umfasst, die-so ist die Hoffnung- in einem nachfolgenden Quantisierer 1014 zu Null quanti- siert werden und somit sehr effizient übertragen werden können, da dem Quantisierer 1014 ein Entropie-Codierer 1016 nachgeschaltet ist.

Dem Quantisierer 1014 wird von einem psycho-akustischen Mo- dell 1020 eine erlaubte Störung pro Skalenfaktorband zuge- führt. Der Quantisierer arbeitet iterativ, d. h. es wird zunächst eine äußere Iterationsschleife aufgerufen, die dann eine innere Iterationsschleife aufruft. Allgemein ge- sagt wird zunächst, ausgehend von Quantisiererschrittwei-

ten-Startwerten, eine Quantisierung eines Blocks von Werten am Eingang des Quantisierers 1014 vorgenommen. Insbesondere quantisiert die innere Schleife die MDCT-Koeffizienten, wo- bei eine bestimmte Anzahl von Bits verbraucht wird. Die äu- ßere Schleife berechnet die Verzerrung und modifizierte E- nergie der Koeffizienten unter Verwendung des Skalenfak- tors, um wieder eine innere Schleife aufzurufen. Dieser Prozess wird iteriert, bis ein bestimmter Bedingungssatz erfüllt ist. Für jede Iteration in der äußeren Iterations- schleife wird dabei das Signal rekonstruiert, um die durch die Quantisierung eingeführte Störung zu berechnen und mit der von dem psycho-akustischen Modell 1020 gelieferten er- laubten Störung zu vergleichen. Ferner werden die Skalen- faktoren der nach diesem Vergleich noch als gestört gelten- den Frequenzbänder von Iteration zu Iteration um eine oder mehrere Stufen vergrößert, und zwar für jede Iteration der äußeren Iterationsschleife.

Dann, wenn eine Situation erreicht ist, bei der die durch die Quantisierung eingeführte Quantisierungsstörung unter- halb. der durch das psycho-akustische Modell bestimmten er- laubten Störung ist, und wenn gleichzeitig Bitanforderungen erfüllt sind, nämlich, dass eine Maximalbitrate nicht über- schritten wird, wird die Iteration, also das Analyse-Durch- Synthese-Verfahren beendet, und es werden die erhaltenen Skalenfaktoren codiert, wie es in dem Block 1014 ausgeführt ist und in codierter Form dem Bitstromformatierer 1004 zu- geführt, wie es durch den Pfeil gekennzeichnet ist, der zwischen dem Block 1014 und dem Block 1004 gezeichnet ist. Die quantisierten Werte werden dann dem Entropie-Codierer 1016 zugeführt, der typischerweise unter Verwendung mehre- rer Huffman-Code-Tabellen für verschiedene Skalenfaktorbän- der eine Entropie-Codierung durchführt, um die quantisier-

ten Werte in ein binäres Format zu übertragen. Wie es be- kannt ist, wird bei der Entropie-Codierung in Form der Huffman-Codierung auf Code-Tabellen zurückgegriffen, die aufgrund einer erwarteten Signalstatistik erstellt werden, und bei denen häufig auftretende Werte kürzere Code-Wörter bekommen als seltener auftretende Werte. Die entropie- codierten Werte werden dann ebenfalls als eigentliche Hauptinformationen dem Bitstromformatierer 1004 zugeführt, der dann gemäß einer bestimmten Bitstromsyntax ausgangssei- tig das codierte Audiosignal ausgibt.

Wie es bereits ausgeführt worden ist, wird bei dieser ite- rativen Quantisierung dann, wenn die durch eine Quantisie- rer-Schrittweite eingeführte Störung größer als die Schwel- le ist, eine feinere Quantisierer-Schrittweite verwendet, und zwar in der Hoffnung, dass damit das Quantisierungsrau- schen abnimmt, weil feiner quantisiert wird.

Dieses Konzept ist dahin gehend nachteilhaft, dass natür- lich durch die feinere Quantisierer-Schrittweite die zu ü- bertragende Datenmenge zunimmt und damit der Komprimierge- winn abnimmt.

Die Aufgabe der vorliegenden Erfindung besteht darin, ein Konzept zum Ermitteln einer Quantisierer-Schrittweite zu schaffen, das einerseits eine geringe Quantisierungsstörung einführt und andererseits einen guten Komprimiergewinn lie- fert.

Diese Aufgabe wird durch eine Vorrichtung zum Ermitteln ei- ner Quantisierer-Schrittweite gemäß Patentanspruch 1, ein Verfahren zum Ermitteln einer Quantisierer-Schrittweite ge-

mäß Patentanspruch 8 oder ein Computer-Programm gemäß Pa- tentanspruch 9 gelöst.

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, dass eine zusätzliche Reduktion der Störleistung einerseits und gleichzeitig eine Erhöhung oder zumindest Beibehaltung des Codiergewinns dadurch erreicht werden kann, dass auch dann, wenn die eingeführte Störung größer als eine Schwelle ist, nicht, wie im Stand der Technik, feiner quantisiert wird, sondern zumindest einige gröbere Quantisierer- Schrittweiten ausprobiert werden. Es hat sich herausge- stellt, dass auch bei gröberen Quantisierer-Schrittweiten Reduktionen der durch die Quantisierung eingeführten Stö- rung erreicht werden können, und zwar dann, wenn die gröbe- re Quantisierer-Schrittweite den zu quantisierenden Wert besser"trifft"als die feinere Quantisierer-Schrittweite. Dieser Effekt basiert darauf, dass der Quantisierungsfehler nicht nur von der Quantisierer-Schrittweite abhängt, son- dern natürlich auch von den zu quantisierenden Werten. Lie- gen die zu quantisierenden Werte nah bei den Schrittweiten der gröberen Quantisierer-Schrittweite, so wird eine Reduk- tion des Quantisierungsrauschens bei gleichzeitigem größe- ren Komprimierungsgewinn (da gröber quantisiert worden ist), erreicht werden.

Das erfindungsgemäße Konzept ist besonders dann sehr profi- tabel, wenn bereits für die erste Quantisierer- Schrittweite, ausgehend von der der Schwellenvergleich durchgeführt wird, sehr gute geschätzte Quantisierer- Schrittweiten vorliegen. Bei einem bevorzugten Ausführungs- beispiel der vorliegenden Erfindung wird es daher bevor- zugt, die erste Quantisierer-Schrittweite durch eine direk- te Berechnung auf der Basis der mittleren Rauschenergie und

nicht auf der Basis eines Worst-Case-Szenarios zu ermit- teln. Damit können die Iterationsschleifen gemäß dem Stand der Technik entweder bereits erheblich reduziert oder voll- kommen obsolet werden.

Die erfindungsgemäße Nachbearbeitung der Quantisierer- Schrittweite probiert dann bei dem Ausführungsbeispiel nur noch einmal eine gröbere Quantisierer-Schrittweite aus, um von dem beschriebenen Effekt des"besseren Treffens"eines zu quantisierenden Werts zu profitieren. Wird dann festge- stellt, dass die durch die gröbere Quantisierer- Schrittweite erhaltene Störung kleiner als die vorherige Störung oder sogar kleiner als die Schwelle ist, dann kann weiter iteriert werden, um eine noch gröbere Quantisierer- Schrittweite zu probieren. Dieses Prozedere der Vergröbe- rung der Quantisierer-Schrittweite wird so lange fortge- setzt, bis die eingeführte Störung wieder zunimmt. Dann ist ein Abbruchkriterium erreicht, so dass mit der gespeicher- ten Quantisierer-Schrittweite, die die geringste eingeführ- te Störung lieferte, quantisiert wird und das Codierproze- dere wie benötigt weitergeführt wird.

Bei einem alternativen Ausführungsbeispiel der vorliegenden Erfindung kann zum Schätzen der ersten Quantisierer- Schrittweite ein Analyse-Durch-Synthese-Ansatz wie im Stand der Technik durchgeführt werden, der so lange stattfindet, bis ein dortiges Abbruchkriterium erreicht wird. Dann kann die erfindungsgemäße Nachbearbeitung eingesetzt werden, um schließlich zu überprüfen, ob nicht doch mit einer gröberen Quantisierer-Schrittweite zu genauso guten Störungsergeb- nissen oder sogar zu besseren Störungsergebnissen gekommen werden kann. Wird dann festgestellt, dass eine gröbere Quantisierer-Schrittweite genauso gut oder sogar noch bes-

ser ist, im Hinblick auf die eingeführte Störung, so wird diese zum Quantisieren genommen. Wird dagegen festgestellt, dass die gröbere Quantisierung nichts bringt, so wird die ursprünglich z. B. durch ein Analyse/Synthese-Verfahren er- mittelte Quantisierer-Schrittweite zum letztendlichen Quan- tisieren verwendet.

Erfindungsgemäß können somit beliebige Quantisierer- Schrittweiten eingesetzt werden, um einen ersten Schwellen- vergleich durchzuführen. Es ist unerheblich, ob diese erste Quantisierer-Schrittweite bereits durch Analyse/Synthese- Schemen oder sogar durch eine direkte Berechnung der Quan- tisierer-Schrittweiten ermittelt worden ist.

Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird dieses Konzept zum Quantisieren eines im Frequenzbereich vorliegenden Audiosignals eingesetzt. Die- ses Konzept kann jedoch auch zur Quantisierung eines Zeit- bereichsignals eingesetzt werden, das Audio-und/oder Vi- deoinformationen aufweist.

Ferner sei darauf hingewiesen, dass die Schwelle, mit der verglichen wird, eine psychoakustische oder psychooptische erlaubte Störung ist, oder eine andere Schwelle, für die der Wunsch besteht, dass sie unterschritten wird. So kann diese Schwelle tatsächlich eine von einem psychoakustischen Modell gelieferte erlaubte Störung sein. Diese Schwelle kann jedoch auch eine vorher ermittelte eingeführte Störung für die ursprüngliche Quantisierer-Schrittweite sein oder irgendeine andere Schwelle.

Es sei darauf hingewiesen, dass die quantisierten Werte nicht unbedingt Huffman-codiert werden müssen, sondern dass

dieselben alternativ mit einer anderen Entropie-Codierung codiert werden kann, wie beispielsweise einer arithmeti- schen Codierung. Alternativ können die quantisierten Werte auch binär codiert werden, da auch diese Codierung dazu führt, dass zur übertragung von kleineren Werten oder von Werten gleich Null weniger Bits benötigt werden als zur ü- bertragung von größeren Werten oder allgemein von Werten ungleich Null.

Vorzugsweise kann zur Ermittlung der Ausgangswerte, also der 1 Quantisiererschrittweite, auf den iterativen Ansatz ganz oder wenigstens zu großen Teilen verzichtet werden, wenn die Quantisierer-Schrittweite aus einer direkten Rauschenergieabschätzung ermittelt wird. Die Berechnung der Quantisierer-Schrittweite aus einer exakten Rauschenergie- abschätzung ist erheblich schneller als eine Berechnung in einer Analyse-durch-Synthese-Schleife, da die Werte für die Berechnung direkt vorliegen. Es müssen nicht erst mehrere Quantisierungsversuche unternommen und verglichen werden, bis eine für die Codierung günstige Quantisierer- Schrittweite gefunden ist.

Da es sich bei der verwendeten Quantisiererkennlinie jedoch um eine nichtlineare Kennlinie handelt, muss die nichtline- are Kennlinie bei der Rauschenergieabschätzung berücksich- tigt werden. Es kann nicht mehr die einfache Rauschenergie- abschätzung für einen linearen Quantisierer verwendet wer- den, da sie zu ungenau ist. Erfindungsgemäß wird ein Quan- tisierer mit folgender Quantisierungskennlinie verwendet : a q 1 1 y ; = round + s J

In der vorstehenden Gleichung sind die xi die zu quantisie- renden Spektralwerte. Die Ausgangswerte sind durch yi ge- kennzeichnet, wobei yi somit die quantisierten Spektralwer- te sind. q ist die Quantisierer-Schrittweite. Round ist die Rundungsfunktion, die vorzugsweise die Funktion nint ist, wobei"nint"für"nearest integer"steht. Der Exponent, der den Quantisierer zu einem nichtlinearen Quantisierer macht, ist mit a bezeichnet, wobei a ungleich 1 ist. Typischer- weise wird der Exponent a kleiner als 1 sein, so dass der Quantisierer eine komprimierende Charakteristik hat. Bei Layer 3 und bei AAC beträgt der Exponent a gleich 0,75.

Der Parameter s ist eine additive Konstante, die irgendei- nen Wert haben kann, die jedoch auch Null sein kann.

Erfindungsgemäß wird zur Berechnung der Quantisierer- Schrittweite folgender Zusammenhang verwendet : Mit a gleich 3 ergibt sich folgende Gleichung : In diesen Gleichungen steht der linke Term für die in einem Frequenzband erlaubte Störung THR, welche von einem Psycho- akustik-Modul für ein Skalenfaktorband mit den Frequenzli- nien von i gleich il bis i gleich i2 geliefert wird. Die vorstehende Gleichung ermöglicht eine nahezu exakte Ab- schätzung der durch eine Quantisierer-Schrittweite q einge- führten Störung für einen nichtlinearen Quantisierer mit der vorstehenden Quantisiererkennlinie mit dem Exponenten

a ungleich 1, wobei die Funktion nint aus der Quantisie- rergleichung die eigentliche Quantisierergleichung durch- führt, nämlich eine Rundung zur nächsten Ganzzahl.

Es sei darauf hingewiesen, dass statt der Funktion nint ei- ne beliebige Rundungsfunktion round verwendet werden kann, nämlich z. B. auch eine Rundung auf die nächste geradzahlige oder nächste ungeradzahlige Ganzzahl oder eine Rundung auf die nächste 10er-Zahl etc. Allgemein gesagt ist die Run- dungsfunktion dafür verantwortlich, dass ein Wert aus einem Wertevorrat mit einer bestimmten Anzahl von erlaubten Wer- ten auf einen Wertevorrat mit einer kleineren bestimmten zweiten Anzahl von Werten abgebildet wird.

Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung sind die quantisierten Spektralwerte bereits zu- vor einer TNS-Verarbeitung und, wenn es sich um z. B. Ste- reosignale handelt, einer Mitte/Seite-Codierung unterzogen worden, sofern die Kanäle derart waren, dass der Mit- te/Seite-Codierer aktiviert worden ist.

Mit dem Zusammenhang zwischen Quantisierer-Schrittweite und Skalenfaktor, der gemäß folgender Gleichung gegeben ist, q = 2 (t/4) *ssf kann somit der Skalenfaktor für jedes Skalenfaktorband di- rekt angegeben werden und einem entsprechenden Audiocodie- rer eingespeist werden. Der Skalenfaktor ergibt sich aus folgender Gleichung.

Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung kann noch eine Nachbearbeitungsiteration einge- setzt werden, die auf einem Analyse-durch-Synthese-Prinzip basiert, um die direkt ohne Iteration berechnete Quantisie- rer-Schrittweite für jedes Skalenfaktorband noch etwas zu variieren, um das tatsächliche Optimum zu erreichen.

Im Vergleich zum Stand der Technik ermöglicht jedoch die bereits sehr genaue Berechnung der Startwerte eine sehr kurze Iteration, obgleich sich herausgestellt hat, dass in den allermeisten Fällen auf die nachgeschaltete Iteration gänzlich verzichtet werden kann.

Das bevorzugte Konzept, das auf der Berechnung der Schritt- weite mit Hilfe der mittleren Rauschenergie basiert, lie- fert somit eine gute und realistische Abschätzung, da sie nicht, wie im Stand der Technik, mit einem Worst-Case- Szenario arbeitet, sondern einen Erwartungswert des Quanti- sierungsfehlers als Grundlage verwendet und somit bei sub- jektiv äquivalenter-Qualität eine effizientere Codierung der Daten mit erheblich geringerer Bitzahl erlaubt. Des weiteren ist durch die Tatsache, dass auf die Iteration komplett verzichtet werden kann bzw. dass die Anzahl der Iterationsschritte deutlich reduziert werden kann, ein we- sentlich schnellerer Codierer erreichbar. Dies ist insbe- sondere deswegen bemerkenswert, weil die Iterationsschlei- fen im bekannten Codierer wesentlich für den Gesamtzeitbe- darf des Codierers waren. Somit führt bereits eine Redukti- on um einen oder weniger Iterationsschritte zu einer be- trächtlichen Zeiteinsparung des Codierers insgesamt.

Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Zeich- nungen detailliert erläutert. Es zeigen : Fig. 1 ein Blockschaltbild einer Vorrichtung zum Ermit- teln eines quantisierten Audiosignals ; Fig. 2 ein Ablaufdiagramm zur Darstellung der Nachbear- beitung gemäß einem bevorzugten Ausführungsbei- spiel der vorliegenden Erfindung ; Fig. 3 ein Blockschaltbild eines bekannten Codierers ge- mäß dem AAC-Standard ; Fig. 4 eine Darstellung der Reduktion der Quantisie- rungsstörung durch eine gröbere Quantisierer- Schrittweite ; und Fig. 5 ein Blockschaltbild der erfindungsgemäßen Vor- richtung zum Ermitteln einer Quantisierer- Schrittweite zum Quantisieren eines Signals.

Nachfolgend wird bezugnehmend auf Fig. 5 das erfindungsge- mäße Konzept dargestellt. Fig. 5 zeigt eine schematische Darstellung einer Vorrichtung zum Ermitteln einer Quanti- sierer-Schrittweite zum Quantisieren eines Signals, das Au- dio-oder Videoinformationen aufweist und über einen Sig- naleingang 500 bereitgestellt wird. Das Signal wird einer Einrichtung 502 zum Liefern einer ersten Quantisierer- Schrittweite (QSW) und zum Liefern einer Störungsschwelle zugeführt, die nachfolgend auch als einführbare Störung be- zeichnet wird. Es sei darauf hingewiesen, dass die Stö- rungsschwelle irgendeine Schwelle sein kann. Vorzugsweise

wird es jedoch eine psychoakustische oder psychooptisch einführbare Störung sein, wobei diese Schwelle so gewählt ist, dass ein Signal, in das die Störung eingeführt worden ist, dennoch vom menschlichen Zuhörer oder Betrachter als ungestört wahrgenommen wird.

Die Schwelle (THR) sowie die erste Quantisierer- Schrittweite werden einer Einrichtung 504 zum Bestimmen der durch die erste Quantisierer-Schrittweite eingeführten tat- sächlichen ersten Störung zugeführt. Die Bestimmung der tatsächlich eingeführten Störung findet vorzugsweise durch Quantisieren mit der ersten Quantisierer-Schrittweite, durch Requantisieren unter Verwendung der ersten Quantisie- rer-Schrittweite und durch Berechnung des Abstands zwischen dem ursprünglichen Signal und dem requantisierten Signal statt. Vorzugsweise, wenn Spektralwerte verarbeitet werden, werden von korrespondierenden Spektralwerten des ursprüng- lichen Signals und des requantisierten Signals die Quadrate gebildet, um dann die Differenz der Quadrate zu bestimmen.

Alternative Abstandsbestimmungsmethoden können eingesetzt werden.

Die Einrichtung 504 liefert einen Wert für eine durch die erste Quantisierer-Schrittweite tatsächlich eingeführte erste Störung. Diese wird zusammen mit der Schwelle THR ei- ner Einrichtung 506 zum Vergleichen zugeführt. Die Einrich- tung 506 führt einen Vergleich zwischen der Schwelle THR und der ersten tatsächlich eingeführten Störung durch. Ist die erste tatsächlich eingeführte Störung größer als die Schwelle, so wird die Einrichtung 506 eine Einrichtung 508 zum Wählen einer zweiten Quantisierer-Schrittweite aktivie- ren, wobei die Einrichtung 508 ausgebildet ist, um die zweite Quantisierer-Schrittweite gröber, also größer als

die erste Quantisierer-Schrittweite zu wählen. Die von der Einrichtung 508 gewählte zweite Quantisierer-Schrittweite wird einer Einrichtung 510 zum Bestimmen der tatsächlich eingeführten zweiten Störung zugeführt. Hierzu erhält die Einrichtung 510 das ursprüngliche Signal sowie die zweite Quantisierer-Schrittweite und führt wieder eine Quantisie- rung mit der zweiten Quantisierer-Schrittweite, eine Re- quantisierung mit der zweiten Quantisierer-Schrittweite und eine Abstandsberechnung zwischen dem requantisierten Signal und dem ursprünglichen Signal durch, um ein Maß für die tatsächlich eingeführte zweite Störung einer Einrichtung 512 zum Vergleichen zuzuführen. Die Einrichtung 512 zum Vergleichen vergleicht die tatsächlich eingeführte zweite Störung mit der tatsächlich eingeführten ersten Störung o- der mit der Schwelle THR. Ist die tatsächlich eingeführte zweite Störung kleiner als die tatsächlich eingeführte ers- te Störung oder sogar kleiner als die Schwelle THR, so wird die zweite Quantisierer-Schrittweite zum Quantisieren des Signals verwendet.

Es sei darauf hingewiesen, dass das in Fig. 5 gezeigte Kon- zept lediglich schematisch ist. Selbstverständlich müssen zum Durchführen der Vergleiche in den Blöcken 506 und 512 nicht unbedingt getrennte Vergleichseinrichtungen vorgese- hen sein, sondern es kann auch eine einzige Vergleichsein- richtung vorgesehen sein, die entsprechend angesteuert wird. Dasselbe gilt für die Einrichtungen 504 und 510 zum Bestimmen der tatsächlich eingeführten Störungen. Auch sie müssen nicht unbedingt als getrennte Einrichtungen ausge- führt sein.

Darüber hinaus wird darauf hingewiesen, dass die Einrich- tung zum Quantisieren nicht unbedingt als getrennte Ein-

richtung von der Einrichtung 510 ausgeführt sein muss. Ty- pischerweise werden nämlich die durch die zweite Quantisie- rer-Schrittweite quantisierten Signale bereits in der Ein- richtung 510 erzeugt, wenn die Einrichtung 510 eine Quanti- sierung und Requantisierung durchführt, um die tatsächlich eingeführte Störung zu ermitteln. Die dort erhaltenen quan- tisierten Werte können auch abgespeichert werden und dann, wenn die Einrichtung 512 zum Vergleichen ein positives Er- gebnis liefert, als quantisiertes Signal ausgegeben werden, so dass die Einrichtung 514 zum Quantisieren gewissermaßen mit der Einrichtung 510 zum Bestimmen der tatsächlich ein- geführten zweiten Störung"verschmilzt".

Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung ist die Schwelle THR die psychoakustisch bestimm- te maximal einführbare Störung, wobei in diesem Fall das Signal ein Audiosignal ist. Die Schwelle THR wird hierbei von einem psychoakustischen Modell geliefert, das herkömm- lich arbeitet und für jedes Skalenfaktorband eine in dieses Skalenfaktorband geschätzte einführbare maximale Quantisie- rungsstörung liefert. Die maximal einführbare Störung ba- siert auf der Maskierungsschwelle dahingehend, dass sie i- dentisch zu der Maskierungsschwelle ist oder von der Mas- kierungsschwelle abgeleitet wird, dahingehend, dass z. B. eine Codierung mit einem Sicherheitsabstand durchgeführt wird, derart, dass die einführbare Störung kleiner als die Maskierungsschwelle ist, oder dass eine eher offensive Co- dierung im Sinne einer Bitratenreduktion durchgeführt wird, und zwar dahingehend, dass die erlaubte Störung über der Maskierungsschwelle liegt.

Nachfolgend wird bezugnehmend auf Fig. 1 eine bevorzugte Art und Weise zur Implementierung der Einrichtung 502 zum

Liefern der ersten Quantisierer-Schrittweite dargestellt. Insofern sind die Funktionalitäten der Einrichtung 50 von Fig. 2 und der Einrichtung 502 von Fig. 5 gleich. Vorzugs- weise ist die Einrichtung 502 ausgebildet, um die Funktio- nalitäten der Einrichtung 10 und der Einrichtung 12 von Fig. 1 zu haben. Ferner ist bei diesem Beispiel der Quanti- sierer 514 in Fig. 5 gleich dem Quantisierer 14 in Fig. 1 ausgebildet.

Nachfolgend wird ferner bezugnehmend auf Fig. 2 ein kom- plettes Prozedere dargestellt, das dann, wenn die einge- führte Störung größer als die Schwelle ist, ebenfalls grö- bere Quantisierer-Schrittweiten versucht.

Darüber hinaus ist der linke Zweig in Fig. 2, der das er- findungsgemäße Konzept darstellt, dahingehend erweitert, dass dann, wenn die eingeführte Störung größer als die Schwelle ist und die Vergröberung der Quantisierer- Schrittweite nichts bringt, und wenn Bitratenanforderungen nicht besonders streng sind bzw. in der"Bitsparkasse"noch etwas Platz ist, auch eine Iteration mit einer kleineren, d. h. feineren Quantisierer-Schrittweite durchgeführt wird.

Schließlich wird nachfolgend bezugnehmend auf Fig. 4 der Effekt dargestellt, auf dem die vorliegende Erfindung ba- siert, nämlich dass trotz Vergröberung der Quantisierer- Schrittweite ein geringeres Quantisierungsrauschen und da- mit einhergehend eine Erhöhung des Komprimierungsgewinns erhaltbar sind.

Fig. 1 zeigt eine Vorrichtung zum Ermitteln eines quanti- sierten Audiosignals, das als spektrale Darstellung in Form von Spektralwerten gegeben ist. Insbesondere sei darauf

hingewiesen, dass, wenn-bezugnehmend auf Fig. 3-keine TNS-Verarbeitung und keine Mitte/Seite-Codierung vorgenom- men worden sind, die Spektralwerte direkt die Ausgangswerte der Filterbank sind. Wird jedoch nur eine TNS-Verarbeitung, jedoch keine Mitte/Seite-Codierung vorgenommen, so sind die in den Quantisierer 1015 eingespeisten Spektralwerte spekt- rale Restwerte, wie sie aus der TNS-Prediktionsfilterung entstehen.

Wird eine TNS-Verarbeitung samt Mitte/Seite-Codierung ein- gesetzt, so sind die in die erfindungsgemäße Vorrichtung eingespeisten Spektralwerte Spektralwerte eines Mitte- Kanals oder Spektralwerte eines Seite-Kanals.

Die erfindungsgemäße Vorrichtung umfasst zunächst eine Ein- richtung zum Liefern einer erlaubten Störung, die in Fig. 1 mit 10 bezeichnet ist. Als Einrichtung zum Liefern einer erlaubten Störung kann das in Fig. 3 gezeigte psychoakusti- sche Modell 1020 dienen, das typischerweise ausgebildet ist, um für jedes Skalenfaktorband, also für eine Gruppe von mehreren spektral aneinander angrenzenden Spektralwer- ten, eine erlaubte Störung oder Schwelle zu liefern, die auch als THR bezeichnet wird. Die erlaubte Störung basiert auf der psychoakustischen Maskierungsschwelle und gibt an, wie viel Energie in ein ursprüngliches Audiosignal einge- führt werden kann, ohne dass die Störenergie vom menschli- chen Ohr wahrgenommen wird. Anders ausgedrückt ist die er- laubte Störung der künstlich eingeführte (durch die Quanti- sierung) Signalanteil, der von dem eigentlichen Audiosignal maskiert wird.

Die Einrichtung 10 ist abgebildet, um die erlaubte Störung THR für ein Frequenzband, vorzugsweise ein Skalenfaktor-

band, zu berechnen und einer nachgeschalteten Einrichtung 12 zuzuführen. Die Einrichtung 12 dient zum Berechnen einer Quantisierer-Schrittweiten-Information für das Frequenz- band, für das die erlaubte Störung THR angegeben worden ist. Die Einrichtung 12 ist ausgebildet, um die Quantisie- rer-Schrittweiten-Informationen q einer nachgeschalteten Einrichtung 14 zum Quantisieren zuzuführen. Die Einrichtung 14 zum Quantisieren arbeitet nach der im Block 14 gezeich- neten Quantisierungsvorschrift, wobei die Quantisierer- Schrittweiten-Informationen bei dem im Fig. 1 gezeigten Fall dazu verwendet werden, um einen Spektralwert xi zu- nächst durch den Wert q zu teilen, und das Ergebnis dann mit dem Exponenten a ungleich 1 zu exponentieren und dann gegebenenfalls einen additiven Faktor s hinzuzufügen.

Dann wird dieses Ergebnis einer Rundungsfunktion zugeführt, die bei dem in Fig. 1 gezeigten Ausführungsbeispiel den nächsten Integer auswählt. Der Integer kann definitionsge- mäß wieder durch Abschneiden von Stellen hinter dem Komma, also durch"immer Abrunden"erzeugt werden. Alternativ kann der nächste Integer auch durch Abrunden bis 0,499 und Auf- runden ab 0,5 erzeugt werden. Wieder alternativ kann der nächste Integer durch"immer Aufrunden"ermittelt werden, je nach einzelner Implementierung. Statt der nint-Funktion kann jedoch auch eine beliebige Round-Funktion eingesetzt werden, die allgemein gesagt einen zu rundenden Wert aus einem ersten größeren Wertevorrat in einen kleineren zwei- ten Wertevorrat abbildet.

Am Ausgang der Einrichtung 14 liegt dann der quantisierte Spektralwert in dem Frequenzband an. Wie es aus der im Block 14 gezeigten Gleichung ersichtlich ist, wird die Ein- richtung 14 neben der Quantisierer-Schrittweite q auch

selbstverständlich der zu quantisierende Spektralwert in dem betrachteten Frequenzband zugeführt.

Es sei darauf hingewiesen, dass die Einrichtung 12 nicht unbedingt die Quantisierer-Schrittweite q direkt ausrechnen muss, sondern dass als alternative Quantisierer- Schrittweiten-Informationen auch der Skalenfaktor, wie er in bekannten Transformations-basierten Audiocodierern ver- wendet wird, berechnet werden kann. Der Skalenfaktor ist über die rechts vom Block 12 in Fig. 1 gezeigte Beziehung mit der tatsächlichen Quantisierer-Schrittweite verknüpft.

Ist die Einrichtung zum Berechnen also ausgebildet, um als Quantisierer-Schrittweiten-Informationen den Skalenfaktor scf zu berechnen, so wird dieser Skalenfaktor der Einrich- tung 14 zum Quantisieren zugeführt, die dann statt dem Wert q im Block 14 den Wert 21/4 scf zur Quantisierungsberechnung verwendet.

Nachfolgend wird eine Herleitung der im Block 12 gegebenen Form gegeben.

Wie es ausgeführt worden ist, gehorcht der Exponentialge- setz-Quantisierer, wie er im Block 14 dargestellt ist, fol- gender Beziehung : x \a a x ; zu Die inverse Operation ist folgenderma#en dargestellt: xi'=yi1/α#q Diese Gleichung stellt somit die zur Requantisierung nötige Operation dar, wobei yi ein quantisierter Spektralwert ist,

und wobei je' ; ein requantisierter Spektralwert ist. q ist wieder die Quantisierer-Schrittweite, die über die in Fig.

1, rechts von Block 12 gezeigte Beziehung mit dem Skalen- faktor zusammenhängt.

Erwartungsgemäß ist das Ergebnis konsistent zu dieser Glei- chung für den Fall a gleich 1.

Wenn nun die vorstehende Gleichung über einen Vektor der Spektralwerte aufsummiert wird, ist die gesamte Rauschleis- tung in einem Band, das durch den Index i bestimmt wird, folgendermaßen gegeben : Zusammengefasst wird der erwartete Wert des Quantisierungs- rauschens eines Vektor bestimmt durch die Quantisierer- Schrittweite q und einen sogenannten Formfaktor, der die Betragsverteilung der Komponenten des Vektors beschreibt.

Der Formfaktor, welcher der ganz rechte Term in der vorste- henden Gleichung ist, hängt von den tatsächlichen Eingangs- werten ab und muss nur einmal berechnet werden, auch wenn die vorstehende Gleichung für unterschiedlich erwünschte Störungspegel THR berechnet wird.

Wie es bereits ausgeführt worden ist, vereinfacht sich die- se Gleichung mit a gleich h folgendermaßen :

Die linke Seite dieser Gleichung ist somit eine Schätzung der Quantisierungs-Rauschenergie, die im Grenzfall mit der erlaubten Rauschenergie (Threshold) übereinstimmt.

Es wird also folgender Ansatz gemacht : Die Summe über die Wurzeln der Frequenzlinien im rechten Teil der Gleichung entspricht einem Maß für die Gleichmä- ßigkeit der Frequenzlinien und ist als Formfaktor vorzug- weise schon im Encoder bekannt : Es ergibt sich also : q entspricht hier der Quantisierer-Schrittweite. Diese ist bei AAC festgelegt als : q = 2(1/4)*scf scf ist der Skalenfaktor. Falls der Skalenfaktor zu ermit- teln ist, kann die Gleichung aufgrund der Beziehung zwi- schen Schrittweite und Skalenfaktor folgendermaßen ausge- rechnet werden : Die vorstehende Gleichung liefert somit einen geschlossenen Zusammenhang zwischen dem Skalenfaktor scf für ein Skalen- faktorband, das einen bestimmten Formfaktor hat, und für das eine bestimmte Störschwelle THR, die typischerweise vom psychoakustischen Modell stammt, gegeben ist.

Wie es bereits ausgeführt worden ist, liefert die Berech- nung der Schrittweite mit Hilfe der mittleren Rauschenergie eine bessere Abschätzung, da von keinem Worst-Case-Szenario ausgegangen wird, sondern da der Erwartungswert des Quanti- sierungsfehlers als Grundlage verwendet wird.

Das erfindungsgemäße Konzept eignet sich somit zu einer Er- mittlung der Quantisierer-Schrittweite bzw. äquivalent des Skalenfaktors für ein Skalenfaktorband ohne jegliche Itera- tionen.

Dennoch kann, wenn Rechenzeitanforderungen nicht ganz so streng sind, noch eine Nachverarbeitung durchgeführt wer- den, wie sie nachfolgend anhand von Fig. 2 dargestellt wird. In einem ersten Schritt in Fig. 2 wird die erste Quantisierer-Schrittweite geschätzt (Schritt 50). Die Schätzung der ersten Quantisierer-Schrittweite (QSW) findet unter Verwendung des anhand von Fig. 1 dargestellten Proze- deres statt. Dann wird in einem Schritt 52 eine Quantisie- rung mit der ersten Quantisierungs-Schrittweite vorzugswei- se gemäß dem Quantisierer, wie er anhand von Block 14 in Fig. 1 dargestellt ist, durchgeführt. Daraufhin wird eine Requantisierung von den mit der ersten Quantisierer- Schrittweite erhaltenen Werten durchgeführt, um dann die eingeführte Störung zu berechnen. Hierauf wird in einem Schritt 54 überprüft, ob die eingeführte Störung größer als die vorgegebene Schwelle ist.

Es sei darauf hingewiesen, dass die durch den im Block 12 dargestellten Zusammenhang berechnete Quantisierer- Schrittweite q (oder scf) eine Approximation ist. Würde der in Block 12 von Fig. 1 gegebene Zusammenhang tatsächlich exakt sein, so sollte in Block 54 festgestellt werden, dass die eingefügte Störung genau der Schwelle entspricht. Auf- grund der Approximationsnatur des Zusammenhangs im Block 12 von Fig. 1 kann die eingefügte Störung jedoch größer oder kleiner als die Schwelle THR sein.

Ferner sei darauf hingewiesen, dass die Abweichung von der Schwelle nicht besonders groß sein wird, obgleich sie den- noch vorhanden sein wird. Wird im Schritt 54 festgestellt, dass die eingefügte Störung unter Verwendung der ersten Quantisierer-Schrittweite kleiner als die Schwelle ist, wird also die Frage im Schritt 54 mit nein beantwortet, so

wird der rechte Zweig in Fig. 3 genommen. Ist die eingefüg- te Störung kleiner als die Schwelle, so bedeutet dies, dass die Abschätzung in Block 12 in Fig. 1 zu pessimistisch war, so dass in einem Schritt 56 eine gröbere Quantisierer- Schrittweite als zweite Quantisierer-Schrittweite einge- stellt wird.

Das Maß, wie gröber die zweite Quantisierer-Schrittweite im Vergleich zur ersten Quantisierer-Schrittweite ist, ist wählbar. Es wird jedoch bevorzugt, relativ kleine Inkremen- te zu nehmen, da die Abschätzung im Block 50 bereits rela- tiv exakt sein wird.

In einem Schritt 58 wird dann mit der zweiten gröberen (größeren) Quantisierer-Schrittweite eine Quantisierung der Spektralwerte vorgenommen, eine anschließende Requantisie- rung und eine Berechnung der mit der zweiten Quantisierer- Schrittweite korrespondierenden zweiten Störung durchge- führt.

In einem Schritt (60) wird dann überprüft, ob die zweite Störung, die mit der zweiten Quantisierer-Schrittweite kor- respondiert, immer noch kleiner als die ursprüngliche Schwelle ist. Ist dies der Fall, so wird die zweite Quanti- sierer-Schrittweite gespeichert (62), und es wird eine neue Iteration begonnen, um wieder in einem Schritt (56) eine noch gröbere Quantisierer-Schrittweite einzustellen. Dann wird mit der noch gröberen Quantisierer-Schrittweite wieder der Schritt 58, der Schritt 60 und gegebenenfalls der Schritt 62 durchgeführt, um wieder eine erneute Iteration zu beginnen. Wird dann während einer Iteration im Schritt 60 festgestellt, dass die zweite Störung nicht kleiner als die Schwelle ist, also größer als die Schwelle ist, so ist

ein Abbruchkriterium erreicht, und es wird bei Erreichen des Abbruchkriteriums mit der zuletzt gespeicherten Quanti- sierer-Schrittweite quantisiert (64).

Nachdem die erste abgeschätzte Quantisierer-Schrittweite bereits ein relativ guter Wert war, wird die Anzahl der Iterationen im Vergleich zu schlecht abgeschätzten Start- werten reduziert sein, was zu einer signifikanten Rechen- zeiteinsparung beim Codieren führt, da die Iterationen zur Berechnung der Quantisierer-Schrittweite den größten Anteil an Rechenzeit des Codierers in Anspruch nehmen.

Nachfolgend wird anhand des linken Zweigs in Fig. 2 ein er- findungsgemäßes Prozedere dargestellt, das dann verwendet wird, wenn die eingeführte Störung tatsächlich größer als die Schwelle ist.

Erfindungsgemäß wird dennoch, trotz der Tatsache, dass die eingeführte Störung bereits größer als die Schwelle ist, eine noch gröbere zweite Quantisierer-Schrittweite einge- stellt (70), wobei dann in einem Schritt 72 eine Quantisie- rung, Requantisierung und Berechnung der mit der zweiten Quantisierer-Schrittweite korrespondierenden zweiten Rauschstörung durchgeführt wird. Hierauf wird in einem Schritt 74 überprüft, ob die zweite Rauschstörung nunmehr kleiner als die Schwelle ist. Ist dies der Fall, so wird die Frage im Schritt 74 mit"ja"beantwortet, und es wird die zweite Quantisierer-Schrittweite gespeichert (76). Wird dagegen festgestellt, dass die zweite Rauschstörung größer als die Schwelle ist, so wird entweder mit der gespeicher- ten Quantisierer-Schrittweite quantisiert oder, wenn keine bessere zweite Quantisierer-Schrittweite gespeichert worden ist, eine Iteration durchlaufen, bei der, wie im Stand der

Technik, eine feinere zweite quantisierte Schrittweite ge- wählt wird, um die eingeführte Störung unter die Schwelle zu"drücken".

Nachfolgend wird dargelegt, wieso besonders dann, wenn die eingeführte Störung größer als die Schwelle ist, dennoch eine Verbesserung erreicht werden kann, wenn mit einer noch gröberen Quantisierer-Schrittweite gearbeitet wird. Bisher wurde immer davon ausgegangen, dass eine feinere Quantisie- rer-Schrittweite zu einer geringeren eingeführten Quanti- sierungsenergie führt, und dass eine größere Quantisierer- Schrittweite zu einer höheren eingeführten Quantisie- rungsstörung führt. Dies mag zwar im Mittel so sein, wird jedoch nicht immer und insbesondere bei eher schwach be- setzten Skalenfaktorbändern und insbesondere dann, wenn der Quantisierer eine nicht-lineare Kennlinie hat, genau entge- gengesetzt sein. Es wurde erfindungsgemäß herausgefunden, dass bei einer nicht zu unterschätzenden Anzahl von Fällen eine gröbere Quantisierer-Schrittweite zu einer geringeren eingeführten Störung führt. Dies ist darauf zurückzuführen, dass auch der Fall auftreten kann, dass eine gröbere Quan- tisierer-Schrittweite einen zu quantisierenden Spektralwert besser trifft als eine feinere Quantisierer-Schrittweite, wie es anhand des nachfolgenden Beispiels bezugnehmend auf Fig. 4 dargelegt wird.

Fig. 4 zeigt beispielhaft eine Quantisierungskennlinie (60), die vier Quantisierungsstufen 0, 1, 2,3 liefert, wenn Eingangssignale zwischen 0 und 1 quantisiert werden.

Die quantisierten Werte entsprechen 0,0, 0,25, 0,5, 0,75.

Zum Vergleich ist eine andere gröbere Quantisierungskennli- nie in Fig. 4 gestrichelt eingezeichnet (62), die nur 3 Quantisierungsstufen hat, die den absoluten Werten 0,0,

0,33, 0,66 entsprechen. So ist die Quantisierer- Schrittweite im ersten Fall, also bei der Quantisiererkenn- linie 60 gleich 0,25, während die Quantisierer-Schrittweite im zweiten Fall, also bei der Quantisiererkennlinie 62 gleich 0,33 ist. Die zweite Quantisiererkennlinie (62) hat daher eine gröbere Quantisierer-Schrittweite als die erste Quantsiererkennlinie (60), die eine feine Quantisie- rungskennlinie darstellen soll. Wenn der zu quantisierende Wert xi=0,33 betrachtet wird, so ist aus Fig. 4 zu sehen, dass der Fehler bei der Quantisierung mit dem feinen Quan- tisierer mit vier Stufen gleich der Differenz zwischen 0,33 und 0,25 beträgt und somit 0,08 ist. Dagegen ist der Fehler bei der Quantisierung mit drei Stufen aufgrund der Tatsa- che, dass eine Quantisierer-Stufe den zu quantisierenden Wert gewissermaßen genau"trifft", gleich 0.

Aus Fig. 4 ist daher zu sehen, dass eine gröbere Quantisie- rung zu einem geringeren Quantisierungsfehler führen kann als eine feinere Quantisierung.

Eine gröbere Quantisierung ist zudem dafür ausschlaggebend, dass eine geringere Ausgangsbitrate benötigt wird, da die möglichen Zustände nur drei Zustände sind, nämlich 0, 1, 2 im Gegensatz zu dem Fall des feineren Quantisierers, bei dem vier Stufen, nämlich 0, 1, 2, 3 signalisiert werden müssen. Darüber hinaus hat die gröbere Quantisierer- Schrittweite den Vorteil, dass tendenziell mehr Werte zu 0 "wegquantisiert"werden, als bei einer feineren Quantisie- rer-Schrittweite, bei der weniger Werte zu"0"wegquanti- siert werden. Obgleich, wenn mehrere Spektralwerte in einem Skalenfaktorband betrachtet werden, das"Zu-0-Quantisieren" zu einer Erhöhung des Quantisierungsfehlers führt, kann dies nicht unbedingt problematisch werden, da die gröbere

Quantisierer-Schrittweite vielleicht andere wichtigere Spektralwerte genauer trifft, so dass der Quantisierungs- fehler durch die gröbere Quantisierung der anderen Spekt- ralwerte aufgehoben wird und sogar überkompensiert wird, wobei zugleich eine kleinere Bitrate anfällt.

In anderen Worten ausgedrückt wird also ein insgesamt"bes- seres"Codierergebnis erreicht, da eine zu signalisierende geringere Anzahl von Zuständen und zugleich ein besseres "Treffen"der Quantisierungsstufen durch das erfindungsge- mäße Konzept erreicht werden.

Erfindungsgemäß wird somit, wie es anhand von Fig. 2 im linken Zweig dargestellt worden ist, ausgehend von Schätz- werten (Schritt 50 in Fig. 2) dann, wenn die eingeführte Störung größer als die Schwelle ist, dennoch eine noch grö- bere Quantisierer-Schrittweite versucht, um von dem anhand von Fig. 4 dargestellten Effekt zu profitieren. Es hat sich ferner herausgestellt, dass dieser Effekt bei nicht- linearen Quantisierern noch signifikanter zutage tritt als bei dem in Fig. 4 skizzierten Fall zweier linearer Quanti- sierer-Kennlinien.

Das dargestellte Konzept der Quantisierer-Schrittweite- Nachbearbeitung bzw. Skalenfaktor-Nachbearbeitung dient so- mit zur Verbesserung des Ergebnisses des Skalenfaktorschät- zers.

Ausgehend von den Quantisierer-Schrittweiten, die im Ska- lenfaktorschätzer (50 in Fig. 2) bestimmt wurden, werden in der Analyse-Durch-Synthese-Stufe neue möglichst große Quan- tisierer-Schrittweiten bestimmt, für die die Fehlerenergie kleiner als der vorgegebene Schwellwert ist.

Zunächst wird also das Spektrum mit den berechneten Quanti- sierer-Schrittweiten quantisiert, und die Energie des Feh- lersignals, also vorzugsweise die Quadratsumme der Diffe- renz aus originalen und quantisierten Spektralwerten be- stimmt. Alternativ kann zur Fehlerbestimmung auch ein kor- respondierendes Zeitsignal verwendet werden, obgleich die Verwendung von Spektralwerten bevorzugt wird.

Die Quantisierer-Schrittweite und das Fehlersignal werden als bisher bestes Ergebnis gespeichert. Liegt die berechne- te Störung über einem Schwellwert, so wird folgendermaßen vorgegangen : Der Skalenfaktor innerhalb eines vorgegebenen Bereichs wird um den ursprünglich berechneten Wert variiert, wobei insbe- sondere auch gröbere Quantisierer-Schrittweiten verwendet werden (70).

Für jeden neuen Skalenfaktor wird das Spektrum erneut quan- tisiert und die Energie des Fehlersignals berechnet. Ist das Fehlersignal kleiner als das kleinste bisher berechne- te, so werden die aktuelle Quantisierer-Schrittweite zusam- men mit der Energie des zugehörigen Fehlersignals als bis- her bestes Ergebnis zwischengespeichert.

Hierbei werden erfindungsgemäß nicht nur kleinere, sondern auch größere Skalierungsfaktoren berücksichtigt, um insbe- sondere dann, wenn der Quantisierer ein nicht-linearer Quantisierer ist, von dem anhand von Fig. 4 beschriebenen Konzept zu profitieren.

Liegt die berechnete Störung dagegen unterhalb des Schwell- werts, war also die Schätzung im Schritt 50 zu pessimis- tisch, so wird der Skalenfaktor innerhalb eines vorgegebe- nen Bereichs um den ursprünglich berechneten Wert variiert.

Für jeden neuen Skalenfaktor wird das Spektrum erneut quan- tisiert und die Energie des Fehlersignals berechnet.

Ist das Fehlersignal kleiner als das kleinste bisher be- rechnete, so wird die aktuelle Quantisierer-Schrittweite zusammen mit der Energie des zugehörigen Fehlersignals als bisher bestes Ergebnis zwischengespeichert.

Dabei werden jedoch nur gröbere Skalierungsfaktoren berück- sichtigt, um die Anzahl an Bits, die für die Codierung des Audiospektrums benötigt werden, zu reduzieren.

Abhängig von der Gegebenheit, kann das erfindungsgemäße Verfahren in Hardware oder in Software implementiert wer- den. Die Implementierung kann auf einem digitalen Speicher- medium, insbesondere einer Diskette oder CD mit elektro- nisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das Verfahren ausgeführt wird.

Allgemein besteht die Erfindung somit auch in einem Compu- ter-Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des er- findungsgemäßen Verfahrens, wenn das Computer-Programm- Produkt auf einem Rechner abläuft. In anderen Worten ausge- drückt, kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens rea-

lisiert werden, wenn das Computer-Programm auf einem Compu- ter abläuft.