Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
PROCESS FOR ADAPTIVE QUANTISATION TO REDUCE DATA IN THE TRANSMISSION OF DIGITAL IMAGES
Document Type and Number:
WIPO Patent Application WO/1992/009173
Kind Code:
A1
Abstract:
A process for adaptive quantisation with a visually acceptable level of quantisation errors in a digital block-related process for data reduction in digital images or image sequences. In this process, an image to be transmitted is divided into a plurality of blocks and for each block a parameter for adjusting the quantisation associated therewith is calculated. This parameter is calculated with the aid of a sub-division of each block into partial regions, whereby an activity measure is calculated for each partial region, with the aid of which a quantisation parameter is found for each partial region. Finally, the quantisation parameters of all the parial regions in all the blocks are totalled within the blocks and multiplicatively scaled.

Inventors:
JASS WIELAND (DE)
Application Number:
PCT/EP1991/002080
Publication Date:
May 29, 1992
Filing Date:
November 04, 1991
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS AG (DE)
International Classes:
H04N7/26; H04N7/30; H04N1/41; H04N7/50; (IPC1-7): H04N7/13; H04N7/133
Domestic Patent References:
WO1988010544A11988-12-29
Foreign References:
DE3414982A11985-10-31
DE3940554A11990-06-13
DE3511713A11986-10-02
EP0246701A11987-11-25
Other References:
IEEE TRANSACTIONS ON COMMUNICATION TECHNOLOGY. Bd. 23, Nr. 7, 30. Juli 1975, NEW YORK US Seiten 785 - 786; J.GIMLETT: 'Use of Activity Classes in adaptive transform image coding' siehe das ganze Dokument
Download PDF:
Claims:
Patentansprüche
1. Verfahren zur adaptiven Quantisierung zwecks Datenreduktion bei der Übertragung digitaler Bilder mit folgenden Schritten: a) ein zu übertragender Bildbereich wird in eine Vielzahl von Blöcken unterteilt; b) jeder Block wird in Teilbereiche E(l) mit 1=1, ..., L unterteilt; c) für jeden Teilbereich E(l) wird ein Aktivitätsmaß A(l) be¬ stimmt; d) für jeden Teilbereich E(l) wird aus dem Aktivitätsmaß A(l) ein Parameter P(l) mit Hilfe einer Funktion Qn nach der Beziehung P(l) = Q0(A(1)) bestimmt, e) durch Summation über alle Teilbereiche E(l) jedes Blockes wird ein für diesen Block charakteristischer Parameter P = P(D berechnet, f) für jeden Block wird aus dem Parameter P ein Quantisierungs parameter Q = FQ/L = P mit Hilfe eines Skalierungsfaktors FQ berechnet, g) der zu übertragende Bildbereich wird blockweise einer Transformation unterworfen, wobei Transformationskoeffizienten ermittelt werden, welche für jeden Block in Abhängigkeit von dem Wert des zu dem jeweiligen Block gehörenden Quantisierungs¬ parameters Q quantisiert werden.
2. Verfahren nach Anspruch 1, dadurch g e k e n n z e i c h n e t , daß das Aktivitätsmaß durch die Beziehung A = _ (|y(m,n+l) y(m,n)| + |y(m+l,n) y(m,n)|). m,n E(l) gegeben ist, wobei m bzw. n Indizes von Bildpunkten innerhalb eines Teilbereiches eines Bildblockes sind, und wobei y das Bildsignal bezeichnet.
3. Verfahren nach einem der vorhergehenden Ansprüche, dadurch g e k e n n z e i c h n e t , daß zur Transformation der zu übertragenden Bildbereiche die Diskrete Cosinustransformation verwendet wird.
4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch g e k e n n z e i c h n e t , daß die Teilbereiche der Blöcke jeweils aus einem Bild¬ punkt und seinen nächsten Nachbarn in der nachfolgenden Zeile bzw. der nachfolgenden Spalte bestehen.
Description:
Verfahren zur adaptiven Quantisierung zwecks Datenreduktion bei der Übertragung von digitalen Bildern

Eine übliche Vorgehensweise bei der Datenreduktioπ zur Über¬ tragung digitaler Bilder oder Bildfolgen ist die Unterteilung von Bildbereichen in kleinere Bereiche, sog. Blöcke (Figur 2). Diese Blöcke sind typischerweise 8 . 8 oder 16 . 16 Pixel (Bildelemente) groß (Figur 3). Beispiele für solche blockbe¬ zogenen Verfahren zur Bildcodierung sind die sog. Transfor- mationsverfahren, deren am häufigsten angewandter Vertreter, die sog. Diskrete Cosinustransformation (D.C.T.) ist. In den Figuren la bzw. lb sind Signalflußpläne für Codierverfahren dieser Art für Einzelbilder oder Bildfolgen dargestellt.

Zweck der Codierung ist eine Datenreduktion, wodurch eine digitale Übertragung von Bildern oder Bildfolgen in vielen Fällen erst möglich wird. Ein bekanntes Prinzip ist dabei die sog. Redundanzreduktion, bei der statistische Eigenschaf¬ ten der Bildsignale zur Datenreduktion ausgenutzt werden. Bei alleiniger Verwendung der Redundanzreduktion ist die voll- ständige Rekonstruierbarkeit der Bildinformation aus den codierten Daten gewährleistet. Allein mit Hilfe einer Redun¬ danzreduktion kann jedoch normalerweise nur eine Datenkompres¬ sion um Faktoren 2 bis 3 erreicht werden. Bei den meisten An¬ wendungen der Bild- und Bildfolgencodierung werden aber höhere Kompressionsfaktoren benötigt, z.B. wenigstens ein Kompres¬ sionsfaktor 7 beim hochauflösenden Fernsehen (High Definition Television, HDTV). Um solche Kompressionsfaktoren und höhere, wie etwa beim Bildtelefon zu erreichen, müssen auch Methoden der Irrelevanzreduktion verwendet werden. Hierbei geht jedoch die ursprüngliche Signalinformation teilweise verloren und es entstehen Bildübertragungsfehler. Angestrebt wird aber, daß

diese Bildfehler für einen Betrachter nicht sichtbar oder mög¬ lich wenig störend sind.

Bei einer Transformationscodierung werden Redundanz- und Irrelevanzreduktion im allgemeinen gemeinsam angewendet auf die Signalwerte im Transformationsbereich eines Bild¬ blockes (A.N.Netravali , W.G.Haskeil: "Digital Pictures, representation und compression", Plenum Press, New York, 1988). Bei der DCT sind das die sog. DCT-Koeffizienten. Typische Vorgehensweisen bei der Irrele¬ vanzreduktion sind einmal ganze Untermengen von DCT Koeffi¬ zienten einfach wegzulassen, zum anderen die übrigbleibenden, signifikanten Koeffizienten .gröber zu quantisieren, d.h. sie in einem gröberen Raster von Werten darzustellen, als es ihnen ursprünglich zugeordnet ist. Ein Werteraster kann durch eine Maßzahl Q für seine Feinheit charakterisiert werden. Je größer Q ist, umso gröber ist das Raster. Bei einer sog. linearen Quantisierung ist diese Maßzahl direkt die Quantisierungs- Schrittweite, d.h. das einheitliche Intervall zwischen zwei benachbarten Rasterwerten. Verschiedene Arten der Quantisie¬ rung von DCT-Koeffizienten sind bekannt. In einigen Verfahren werden die einzelnen Koeffizienten verschieden fein quanti- siert. Die unterschiedlichen Feinheiten sind dabei aus Annah- men über die visuelle Bedeutung der Koeffizienten abgeleitet. Ein solches Verfahren ist z.B. in (D.McLaren, D.T.Nguyen: "Video Bitrate reduction through Psychovisual impression", Proc. 1990 Video Communications Workshop, Melbourne, 9. bis 11.7.1990) beschrieben. In einem anderen Verfahren werden alle Koeffizienten mit gleicher Feinheit quantisiert, wie es z.B. in (W.Tengler, W.Jaß: "Interlaced and Progressive HDTV- Coding, a Co parison for IAO Mbit/s- Transmission" Proceedings 1990 Austr. Video Communication Workshop Melbourne, 9.-11.7.1990) beschrieben ist.

Die verschiedenen Arten der Quantisierung erzeugen verschie¬ dene Arten von Bildfehlern. Bei einer Transformation wie der

DCT sind aber unabhängig vom verwendeten Quantisierungs¬ schema diese Bildfehler im allgemeinen jeweils über einen ganzen Block im Bildbereich verteilt. Ob diese Fehler ent- weder gar nicht sichtbar sind oder visuell mehr oder weniger stören, hängt einmal vom ursprünglichen Bildinhalt und zum anderen von der mittleren Amplitude der Fehler in einem Block ab. Diese mittlere Fehleramplitude steht direkt im Zusammenhang mit dem vorher genannten Quantisierungsparameter Q für einen Block. Je größer Q eingestellt wird, desto kleiner ist die zur Codierung eines Blocks benötigte Datenrate, aber desto größer ist im allgemeinen auch die mittlere Fehlerampli¬ tude.

In fortschrittlichen Verfahren der Einzelbild und Bildfolgen¬ codierung wird nun der Quantisierungsparameter Q je Block an den Bildinhalt so angepaßt (adaptiert), daß bei Einhalten bestimmter Grenzen für die resultierende Datenrate die Bild¬ fehler visuell möglichst wenig stören. Dabei wird der Bild- inhalt in einem Block analysiert und der Quantisierungspara¬ meter Q in Abhängigkeit von dem Ergebnis der Analyse einge¬ stellt. Diese Analyse kann entweder an Pixelblöcken, d.h. an Blöcken von Bildelementen, oder an Blöcken von DCT-Koeffi¬ zienten vorgenommen werden. Analysemethoden, welche Blöcke von Bildele enteπ analysieren, sind z.B. in den Veröffentli¬ chungen von McLaren (McLaren 1990) und Tengler (Tengler 1990) angegeben. In diesen Veröffentlichungen wird jedoch nicht auf die möglichen Mängel der dort beschriebenen adaptiven Quanti¬ sierungsverfahren eingegangen, welche mit dem erfindungsge- mäßen Verfahren verbessert werden.

Die allgemeine Vorgehensweise der in den Veröffentlichungen von McLaren und Netravali beschriebenen Analysemethoden soll im folgenden kurz beschrieben werden, um für die Beschrei- bung der vorliegenden Erfindung auf die hierbei eingeführten Begriffe und Schreibweisen zurückgreifen zu können. Bei den bereits bekannten Analysemethoden wird zunächst aus den Bild-

signalwerten aller Pixel in einem Block ein sog. Aktivi¬ tätsmaß berechnet. Die Größe dieses Aktivitätsmaßes steht in direktem Verhältnis zur Stärke der mittleren Amplitude- Schwankung der Bildsignalwerte aller Bildpunkte des betrach¬ teten Blockes. In dem Aufsatz von Tengler und Jasz wird bei¬ spielsweise als Aktivitätsmaß A die Summe von absoluten ört¬ lichen Bildsignaldifferenzen verwendet (Figur 3):

M N (1) A = 2" * (|y(m,n+l) - y(m,n)| + |y(m+l,n)-y(m,n) | ) = 1 n = 1

mit y(m,n): Bildsignalwert des Pixel mit dem Index m,n, m: Zeilenindex, n: Spaltenindex im Block, M,N: Blockseitenlängen, z.B. 8 oder 16.

Als Funktion des auf diese Weise berechneten Aktivitäts¬ maßes wird ein vorläufiger Parameter P, z.B. aus einer Tabelle entnommen: (2) P = Q Q (A).

Der für einen Block tatsächlich angewendete Quantisierungs¬ parameter Q wird schließlich aus P durch Multiplikation mit einem Skalenfaktor F Q gewonnen:

(2') Q = F

Q

F_ ist ein Faktor, der für die Regelung zur Einhaltung von

Ratenbegrenzungen von dem Füllstand eines Datenpuffers ab- geleitet ist (Figur lb). Ein Beispiel einer Funktion Q Q (A) ist z.B. in der Veröffentlichung von W.Tengler 1990 beschrie¬ ben und in Figur 4 graphisch dargestellt.

Das in dem Aufsatz von W.Tengler beschriebene adaptive Quantisierungsschema führt bereits bei nicht zu strengen Nebenbedingungen an die Größe der resultierenden Datenrate zu einer guten Bildqualität. Bei bestimmten Bildinhalten können

jedoch trotzdem durch die Quantisierung entstehende Bild¬ fehler sichtbar werden. Solche Bildinhalte sind typischer weise dadurch charakterisiert, daß einem Block sowohl Be- reiche mit hoher Aktivität, d.h. mit feinen hochkontrastigen Details, als auch Bereiche mit geringer Aktivität, d.h. mit nur schwach variierenden Bildinhalt enthalten sein können.

Die Einstellung des Quantisierungsparameters ist nun aber hin- sichtlich der benötigten Datenrate und mit dem Ziel der Vermei¬ dung von Bildfehlern optimiert unter der Annahme, daß die Akti¬ vität in einem Block relativ gleichförmig verteilt ist. Je höher die Aktivität ist, umso größer dürfen dann die Bildfehler sein ohne störend sichtbar zu werden, d.h. umso größer darf der Quantisierungsparameter zur Reduzierung der Datenrate ein¬ gestellt werden. Bei dem hier angenommenen Verfahrenstyp zur Codierung von digitalen Bildern oder Bildfolgen sind jedoch die Bildfehler durch die Quantisierung im allgemeinen gleich¬ förmig über einen Block verteilt. Daher kann der für den ganzen Block eingestellte Quantisierungsparameter zu Bildfehlern füh¬ ren, die zwar nicht in den Teilen des Blocks mit höherer Akti¬ vität, wohl aber in den mit geringerer Aktivität störend sicht¬ bar werden.

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, diese Nachteile der beschriebenen bekannten Verfahren zu vermeiden. Zur Lösung dieser Aufgabe wird ein Verfahren zur Datenreduk¬ tion bei der Übertragung digitaler Bilder oder Bildfolgen mit Merkmalen nach Anspruch 1 angegeben.

Nach der Erfindung wird für die Bestimmung des Quantisierungs¬ parameters Q ein Block im Bildbereich selbst wieder in eine Anzahl L kleinerer Teilbereiche E(l) unterteilt (Figur 5). Diese Teilbereiche sind durch eine Nummer 1: = 1, ... L ge- kennzeichnet. Für jeden Teilbereich E(l) wird wie vorher für einen ganzen Block ein Aktivitätsmaß A(l) berechnet als Summe von absoluten örtlichen Pixelwertdifferenzen zwischen hori- tontal und vertikal benachbarten Pixeln:

(3) A = 2 " (|y(m,n+l) - y(m,n)| + |y(m+l,n) - y(m,n)|) m,n € E(l)

Für die Differenzenoperation werden am Rand eines Teilbe¬ reichs Pixel (= Bildpunkte) benötigt, die außerhalb des Teil¬ bereichs liegen, insbesondere am Blockrand selbst. Für jeden Teilbereich E(l) wird aus dem Aktivitätsmaß A(l) ein Para¬ meter ermittelt, der für die Aktivität in dem Teilbereich 1 charakteristisch ist. Durch Summation über alle Teilbereiche des Blocks werden aus den für die Teilbereiche 1 charakteri¬ stischen Parametern P(l) ein vorläufiger Parameter P für den gesamten Block berechnet. Der für einen Block tatsächlich an¬ gewendete Quantisierungsparameter Q wird schließlich aus P wieder durch eine Skalierung gewonnen.

Ein auf diese Weise ermittelter Quantisierungsparameter Q hat tatsächlich die Eigenschaft in den vorher beschriebenen kritischen Situationen mit unterschiedlich aktivem Bildan- teil eine besser angepaßte Quantisierung zu bewirken. Das bedeutet, daß mit Hilfe des erfindungsgemäßen Verfahrens bei Blöcken mit kritischem Bildinhalt im allgemeinen eine relativ feinere Quantisierung eingestellt wird, als nach den vorher geschilderten bekannten Verfahren.

Daß mit dem erfindungsgemäßen Verfahren auch die lokale Be¬ ziehung zwischen Datenrate und Bildfehler nicht verschlech¬ tert wird, kann wie folgt plausibel gemacht werden: Die für die lokale Datenrate und die lokalen Bildfehler optimierte Funktion Q Q wird nun statt auf einem ganzen Block auf kleinere Teilbereiche angewendet, in einer bevorzugten Ausführung sogar auf einzelne Pixel mit ihren Nachbarn. Die erfindungsgemäße Berechnung des Quantisierungsparameters kann dann in der Wirkung bezüglich Datenrate und Bildfehler einfach als Mit- telung über einen Blockbereich aufgefaßt werden.

Ein Vorzug des erfindungsgemäßen Verfahren ist seine Regel-

m ßigkeit. Es besteht aus einer Wiederholung einer kleinen Anzahl von einfachen Operationen. Wegen der damit verbundenen einfachen Kontrollstruktur ist es sehr gut geeignet für eine Realisierung mit Hilfe von integrierten Schaltkreisen. Ins¬ besondere können die den Teilbereichen zugeordneten Opera¬ tionen auch parallel ausgeführt werden.

Ein weiterer Vorteil des erfindungsgemäßen Verfahrens ist es, daß dieses Verfahren in bestehende Codierverfahren, wie sie z.B. in dem Aufsatz von W.Tengler beschrieben sind, auf ein¬ fache Weise so eingefügt werden kann, daß die notwendigen Ve.ränderugnen das Gesamtverfahren nicht wesentlich kompli¬ zieren. Zum Beispiel werden. in den in dem Aufsatz von W.Tengler beschriebenen Verfahren blockbezogene Summen A von absoluten örtlichen Differenzen, wie sie in Formel (1) definiert sind, nicht nur als Aktivitätsmaß für eine adaptive Quantisierung benutzt, sondern auch als Umschaltkriterium zwischen verschie¬ denen Modi des Codierverfahrens. Dabei wird einer der berech- neten Parameter A nicht nur für die Umschaltkriterien benutzt, sondern gleichzeitig auch als Aktivitätsmaß für die adaptive Quantisierung, so daß dieser Parameter nicht zusätzlich berechnet werden muß.

Weiterbildungen der Erfindung ergeben sich aus den Unteran¬ sprüchen.

Figur la zeigt den Signalflußplan eines Transformationscodier¬ verfahrens mit adaptiver Quantisierung, wobei der Quantisie- rungsparameter mit Hilfe einer Bildblock-Analyse gewonnen wird.

Figur lb zeigt den Signalflußplan eines Differenzpulscode- modulationsverfahrens zur Bildcodierung unter Einschluß einer blockweisen Transformation.

Figur 2 zeigt die Aufteilung eines Bildes in Blöcke.

Figur 3 zeigt die Zusammensetzung eines Blockes aus Bild¬ punkten (ep) und die Differenzoperationen zwischen benach¬ barten Bildpunkten, angedeutet durch Pfeile.

Figur -4 zeigt den typischen Verlauf der Funktion Q Q als Funk¬ tion des Aktivitätsmaßes A.

Figur 5 zeigt die Aufteilung eines Bildblockes in kleinere Teilbereiche E(l).

Figur 6 zeigt die Aufteilung eines Bildblockes in kleinere Teilbereiche E(l), welche aus einzelnen Bildpunkten und ihren nächsten Nachbarn bestehen.

Im folgenden wird die Erfindung anhand eines bevorzugten Ausführungsbeispiels und anhand der Figuren beschrieben.

Zur Übertragung eines Bildes bzw. eines Elementes einer Bild- folge wird das zu übertragende digitale Bild zunächst in eine Anzahl von Blöcken (Figur 2) eingeteilt. Jeder Block besteht aus einer Anzahl von Bildpunkten ep (Pixeln) wie in Figur 3 abgebildet. Zur Durchführung des Verfahrens wird jeder Block in kleinere Teilbereiche E(l) mit 1: = 1, ...,L eingeteilt. Dabei umfaßt jeder Teilbereich E(l) im allgemeinen mehrere benach¬ barte Bildpunkte (Figur 5). Bei einem bevorzugten Ausführungs¬ beispiel der Erfindung besteht jeder Teilbereich E(l) aus einem Bildpunkt und den beiden direkten Nachbarn dieses Bildpunktes (Figur 6) in der nachfolgenden Zeile bzw. in der nachfolgenden Spalte.

Figur 7 zeigt einen Signalflußplan des Verfahrens. Für alle Teilbereiche E(l) eines jeden Blocks wird zunächst das in Formel (3) definierte Aktivitätsmaß A berechnet. Dieses Aktivitätsmaß A(l) ist für jeden Teilbereich E(l) die Summe der absoluten Bildsignal-Differenzen aller Bild¬ punkte in dem Teilbereich E(l). Aufgrund seiner Definition ist dieses Aktivitεtsmäß 0, falls das Bildsignal in dem betref-

fenden Teilbereich E(l) homogen ist. Ändern sich hin¬ gegen die Bildsignalwerte innerhalb eines Teilbereichs E(l) stark, so ist das Aktivitätsmaß A(l) für diesen Teilbereich merklich von 0 verschieden und umso größer je größer die Ände¬ rung der Bildsignalwerte innerhalb des Teilbereichs E(l) ist. Für jeden Teilbereich E(l) wird nun mit Hilfe des für ihn ermittelten Aktivitätsmaßes A(l) ein Parameter P(l) ermittelt, welcher eine Funktion Q n der Aktivität A(l) ist. Dieser Zu- sammenhang ist auch in der Formel (2) wiedergegeben. Die

Funktion Q n kann vorteilhaft mit Hilfe einer Tabelle reali¬ siert werden, welche jedem möglichen Wert des Aktivitäts¬ maßes den zugehörigen Parameter zuordnet.

Die Funktion Q η ist eine geeignet gewählte, vorzugsweise monoton steigende, konvexe Funktion des Aktivitätsmaßes A, welche vorzugsweise so gewählt wird, daß ihre Steigung mit größeren Werten der Aktivität A geringer wird. Ein typischer Verlauf der Funktion Q Q als Funktion des Aktivitätsmaßes A ist in Figur 4 wiedergegeben. Die optimale Wahl der Funktion Q n ist abhängig von den Eigenschaften des zu übertragenden Bildma¬ terials und von den Präferenzen des Verfahrensanwenders hin¬ sichtlich der Übertragungseigenschaften und der Bildqualität. Mögliche vorteilhafte Wahlen für den Verlauf der Funktion Q n ergeben sich z.B. aus der Veröffentlichung von W.Tengler 1990.

Durch Summation der Parameter P(l) aller Teilbereiche E(l) ergibt sich in einem weiteren Schritt des Verfahrens ein für die Aktivität des betrachteten Blockes charakteristischer Parameter P. Aus diesem Parameter P ergibt sich nun für jeden Block unmittelbar der zugehörige Quantisierungsparameter Q mit Hilfe der Skalierung

(4) Q = (F Q /L)

Der Parameter Q wird demnach völlig analog zu bekannten Ver¬ fahren aus dem Parameter P berechnet, wobei allerdings wegen der Summation über L Teilbereiche bei der Berechnung des

Parameters P bei dieser Skalierung durch L geteilt werden muß. Dies ist in der Formel (4) berücksichtigt.

Es ist ein besonderer Vorteil des hier beschriebenen Ver¬ fahrens, daß mit seiner Hilfe in aus dem Stand der Technik gewohnter Weise durch Analyse von Bildblöcken zu jedem Bild¬ block ein Quantisierungsparameter gefunden wird. Aus diesem Grunde ist die Schnittstelle des Analyseverfahrens zum übri- gen Codierverfahren unverändert. Deshalb läßt sich dieses

Verfahren ohne Probleme im Zusammenhang mit bekannten Codier verfahren (Figur la, Figur lb) verwenden.

Andererseits ist mit Hilfe des hier beschriebenen Verfahrens eine wesentlich detailiertere Analyse des Bildinhalts eines Bildblocks möglich, als dies bei den aus der Stand der Tech¬ nik bekannten Verfahren der Fall ist. Deshalb entspricht der mit Hilfe des hier beschriebenen Verfahrens bestimmte Quantisierungsparameter Q besser als bei den bekannten Ver- fahren der tatsächlichen Aktivität des Bildsignals in einem

Bildblock. Letztlich ermöglicht das erfindungsgemäße Verfahren damit die Übertragung eines jeden Bildblocks mit der ihm angepaßten Datenrate. Dies ist insbesondere auch dann der Fall, wenn der zu übertragende Bildblock aus besonders aktiven und besonders inaktiven Bereichen besteht.