METHOD AND DEVICE FOR OPTIMIZING THE COMPRESSION OF A VIDEO STREAM

Title:

METHOD AND DEVICE FOR OPTIMIZING THE COMPRESSION OF A VIDEO STREAM

Document Type and Number:

WIPO Patent Application WO/2008/049628

Kind Code:

Abstract:

The invention is aimed at activating or not activating motion compensation depending on the cost-effectiveness of the latter, cost-effectiveness established on the costs in terms of bit rate and distortion. The method of compressing an image part comprises: - a step (302) of determining at least one prediction of a so-called image part, - a step (307) of determining a distortion associated with each prediction and - a step (314) of deciding whether or not to code a residual, as a function of at least the distortion value associated with each prediction.

Inventors:

LARRIEU JEROME (FR)

Application Number:

PCT/EP2007/009315

Publication Date:

May 02, 2008

Filing Date:

October 26, 2007

Export Citation:

Click for automatic bibliography generation Help

Assignee:

ACTIMAGINE (FR)
LARRIEU JEROME (FR)

International Classes:

H04N7/36; H04N7/26

Domestic Patent References:

WO2003091850A2	2003-11-06
WO2003054795A2	2003-07-03
WO2005055612A1	2005-06-16

Foreign References:

US5832234A	1998-11-03
US20040156552A1	2004-08-12

Other References:

ZENG W ET AL: "RATE SHAPING BY BLOCK DROPPING FOR TRANSMISSION OF MPEG-PRECODED VIDEO OVER CHANNELS OF DYNAMIC BANDWIDTH", PROCEEDINGS OF ACM MULTIMEDIA 96. BOSTON, NOV. 18 - 22, 1996, NEW YORK, ACM, US, 18 November 1996 (1996-11-18), pages 385 - 393, XP000734732, ISBN: 0-89791-871-1
WENJUN ZENG ET AL: "Geometric-Structure-Based Error Concealment with Novel Applications in Block-Based Low-Bit-Rate Coding", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 9, no. 4, June 1999 (1999-06-01), XP011014587, ISSN: 1051-8215
See also references of EP 2084910A1

Attorney, Agent or Firm:

MAILLET, Alain (5 place Newqua, B.P. 70250 Dinard Cedex, FR)

Download PDF:

View/Download PDF PDF Help

Claims:

REVENDICATIONS

- Procédé de compression d'une partie d'image, caractérisé en ce qu'il comporte:

- une étape (302, 402, 502, 602) de détermination d'au moins une prédiction d'une dite partie d'image,

- une étape (312, 405, 514, 614) de détermination d'une distorsion associée à chaque prédiction et

- une étape (314, 414, 514, 614) de décision de codage ou non de résidu, en fonction d'au moins la valeur de distorsion associée à chaque prédiction.

- Procédé selon la revendication 1, caractérisé en ce qu'il comporte, en outre:

- une étape (303) de détermination de résidu, différence entre une prédiction représentative de chaque prédiction et la partie d'image à compresser,

- une étape (313) de détermination de débit associé au résidu, - une étape (313) de détermination de distorsion associée au résidu,

- ladite étape (314) de décision mettant en oeuvre ledit débit associé au résidu et la distorsion associée au résidu.

- Procédé selon la revendication 2, caractérisé en ce qu'il comporte, en outre: - une étape (308) de transformation dudit résidu dans le domaine fréquentiel,

- une étape (309) de quantification du résidu transformé,

- une étape (310) de déquantification du résidu transformé quantifié,

- une étape (311) de transformation, dans le domaine spatial, du résidu transformé, quantifié et déquantifié, - ladite étape (313) de détermination de débit associé à chaque résidu étant fonction dudit résidu et de la transformation, dans le domaine spatial, du résidu transformé, quantifié et déquantifié.

- Procédé selon l'une quelconque des revendications 1 à 3, caractérisé en ce que l'étape de décision (314, 414, 514) comporte la comparaison de paramètres de décision RDI et RD2 calculés de la manière suivante:

RDI = k + Dp ; RD2= k + Rr*ε + Dr Où:

- Rp est le débit associé à chaque prédiction - Dp est la distorsion associée à chaque prédiction,

- Rr est le débit associé au résidu,

- Dr est la distorsion associée au résidu et

- ε est un coefficient prédéterminé positif

- k est un terme facultatif.

- Procédé selon la revendication 4, caractérisé en ce que, au cours de l'étape de décision (314, 414, 514) :

- si RDI < RD2, on n'effectue que la transmission de chaque prédiction et

- si RDI > RD2, on effectue la transmission de chaque prédiction et du résidu.

- Procédé selon les revendications 1 à 2, caractérisé en ce que l'étape de décision (614) comporte la comparaison d'un paramètre de décision RDI et d'une valeur seuil RDs, avec RDl= k + Dp où : - k est un terme facultatif

- Dp est la distorsion associée à chaque prédiction et

- ε est un coefficient prédéterminé positif.

- Procédé selon la revendication 6, caractérisé en ce que, si RD 1< RDs, seule chaque prédiction est codée et si RD1> RDs, chaque prédiction et le résidu sont codés.

- Procédé selon l'une quelconque des revendications 4 à 7, caractérisé en ce qu'il comporte une étape de détermination d'un débit, Rp, associé à chaque prédiction, permettant le calcul du terme k, avec k= Rp* ε.

- Dispositif de compression d'une partie d'image, caractérisé en ce qu'il comporte:

- un moyen (710, 715, 720) de détermination d'au moins une prédiction d'une dite partie d'image,

- un moyen (710, 715, 720) de détermination de distorsion associée à chaque prédiction et

- un moyen (710, 715, 720) de décision de codage ou non de résidu, en fonction d'au moins les valeurs de débit et de distorsion associées à chaque prédiction.

Description:

Procédé et dispositif d'optimisation de la compression d'un flux vidéo

La présente invention concerne un procédé et un dispositif de compression de parties d'images. Elle s'applique, en particulier au codage d'images et de séquences d'images, notamment en vue de leur transmission sur un réseau informatique, par exemple Internet, ou de leur stockage sur un support d'informations numériques. Ce procédé et ce dispositif peuvent être intégrés à tout système permettant de compresser puis décompresser toute partie d'image sur toutes plates-formes matérielles.

Certaines méthodes d'encodage vidéo emploient des méthodes de prédiction avec codage du résidu. La figure 1 représente, sous forme de schéma bloc fonctionnel, un dispositif mettant en oeuvre une telle méthode. Une prédiction, réalisée par la fonction 102, d'une partie d'une image originale 101 est établie à partir d'autres parties d'une ou plusieurs images postérieures ou antérieures à l'image en cours de codage, ou d'autres éléments de l'image courante. Le résidu 103 est obtenu par la différence 105 entre la prédiction et l'original. Le résidu 103 et la prédiction 102 sont encodés dans le flux vidéo émis, par la fonction d'encodage 104.

Cette méthode est typiquement utilisée pour exploiter la redondance temporelle d'une séquence d'images. Elle est plus particulièrement utilisée dans le système de compression des Standards ISO/ITU MPEG et H.261/3/4. Comme illustré en figure 2, qui représente, sous forme d'un logigramme d'étapes, l'état de l'art de la compression de type MPEG (acronyme de « Moving Picture Expert Group » pour groupe d'expert en images animées) la compensation de mouvement est basée sur la comparaison d'un bloc donné de l'image courante à un ensemble de blocs ou de sous blocs de l'image courante ou d'autres images postérieures ou antérieures à l'image courante. Une mesure comparative est établie entre les blocs. Si la mesure de la différence est inférieure à un certain seuil, les blocs sont considérés comme similaires et la différence de position est indiquée par un vecteur mouvement.

Les standards connus de compression vidéo, tel que MPEG, utilisent les deux groupes d'étapes 200 et 210, décrites en regard de la figure 2, pour compresser les images d'un flux vidéo en images non intra, c'est à dire images qui sont encodées par référence à d'autres images du flux vidéo.

L'estimation de mouvement 200 (en anglais "motion estimation") consiste à encoder chaque image à partir d'éléments présents dans d'autres images du flux vidéo, appelées images de référence (souvent l'image précédente, la dernière image intra ou la prochaine image intra). Les étapes effectuées au cours de l'estimation de mouvement 200 sont les suivantes:

- étape 201 : découpage de l'image à encoder en blocs de taille fixe L x H pixels (souvent 16 x 16) ;

- étape 202 : pour chaque bloc de l'image, recherche dans l'image de référence de la zone flottante de L x H pixels la plus similaire au bloc considéré; - étape 203 : pour chaque bloc, stockage du vecteur de déplacement (en anglais

"motion vector") qui indique le déplacement (en coordonnées spatiales) entre le bloc et la zone la plus similaire trouvée au cours de l'étape 202 ;

La compensation de mouvement 210 (en anglais "motion compensation") consiste à compresser le résidu. Les étapes effectuées au cours de la compensation de mouvement 210 sont, pour chaque bloc, les suivantes:

- étape 214: pour chaque bloc, calcul du résidu, c'est à dire de la différence entre le bloc et la zone la plus similaire trouvée.

- étape 21 1 : compression du résidu, le plus souvent grâce à une fonction mathématique, telle que la OCT (acronyme de "discrète cosine transform" pour transformée en cosinus discrète) ;

- étape 212 : stockage du résidu compressé et - étape 213 : retour à l'étape 200 pour encoder le bloc suivant, s'il en reste à traiter.

La décompression de la vidéo se fait ensuite de la façon suivante:

- étape 221 : décompression d'une ou plusieurs images intra (images encodées sans référence à d'autres images du flux vidéo) ;

- groupe d'étapes 230 : reconstitution des images non intra en effectuant, pour chaque bloc:

- étape 231 : localisation, grâce au vecteur de déplacement, de la zone la plus similaire d'une autre image du flux vidéo;

- étape 232 : décompression du résidu et

- étape 233 : ajout du résidu à la zone la plus similaire pour obtenir le bloc final et retour à l'étape 230 pour le bloc suivant, s'il en reste à traiter.

Ainsi, lors du décodage du flux vidéo, les blocs des images prédites sont prédits à partir de parties d'autres images et des vecteurs mouvements décodés, auxquels il faut ajouter les coefficients de la compensation de mouvement.

Cet état de l'art a, notamment, pour inconvénient que les étapes de décodage des coefficients de compensation de mouvement, de calcul de la compensation et de compensation du bloc prédit sont coûteuses en ressources.

Dans les encodeurs actuels, différents types d'optimisation sont effectués lors des étapes de compensation. Par exemple, le choix du vecteur mouvement peut se faire suivant différents critères « SAD » (sommes des différences absolues) ou « SSD » (sommes des carrés des différences) qui ne tiennent comptent que de la distorsion engendrée. Lors de l'encodage, plusieurs choix de couples (blocs, vecteurs mouvements) sont possibles. Une optimisation de type « rate distortion optimization " (connue sous l'acronyme de « RDO » en anglais et signifiant optimisation du débit et de la distorsion en français) est utilisée et tient compte du débit engendré pour transmettre l'information (taille prise dans le flux) et de la distorsion apportée par cette information (pertinence de l'information). Le but de la RDO est de trouver un compromis entre débit utilisé par le flux codé et pertinence de l'information à coder.

L'algorithme de RDO peut être utilisé lors de la compensation de mouvement. Par exemple, dans la demande de Brevet US2003/0063667 intitulée « Optimal Encoding of motion compensated video » du 29 mai 2002, l'étape d'estimation de mouvement entre deux images fournit plusieurs vecteurs mouvements candidats. Chacun des vecteurs mouvements est alors transformé de la même manière que s'il avait été transformé pour être codé dans le flux vidéo, puis décodé de la même manière que s'il avait été décodé depuis le flux vidéo. La distorsion entre le bloc original et le bloc codé puis décodé, calculée après décodage du vecteur mouvement, est déterminée pour chaque vecteur mouvement candidat. Le vecteur mouvement qui minimise la distorsion et le débit est retenu.

Généralement, la compensation de mouvement est utilisée pour améliorer les coûts en débit et en distorsion. La demande de brevet EP0866622 intitulée « Video Oata compression method » définit une mesure de performance (qui tient compte des paramètres de codage...) qui est appliquée à l'étape de compensation de mouvement dans le but d'améliorer la mesure des coûts en débit et en distorsion.

Dans l'article de En-hui Yang et Xiang Yu de" Rate Distortion Optimization in H.264 ", publié lors de l'atelier organisé pour l'inauguration du « centre de la théorie de l'information et de ses applications », en février 2006, l'algorithme de RDO permet d'établir un critère de décision souple quant au choix de critères de codage des coefficients. On crée un arbre dont les noeuds représentent les différentes étapes de codage et mesurent les coûts en débit et en distorsion engendrés. L'arbre est ensuite parcouru en prenant le chemin optimal (minimisant les coûts en débit et en distorsion) pour obtenir le choix de codage le plus pertinent pour le débit et la distorsion engendrés par le codage des coefficients. Dans la demande de brevet FR2850827 intitulée « Procédé et dispositif de compression de parties d'images », l'étape de compensation de mouvement est éliminée. Cependant, dans certains cas, le rendu visuel est sensiblement détérioré. La présente invention vise à remédier à ces inconvénients. A cet effet, la présente invention vise, selon un premier aspect, un procédé de compression de parties d'images qui comporte:

- une étape de détermination d'au moins une prédiction d'une dite partie d'image à partir d'un ensemble de sous parties d'images postérieures, antérieures, ou de

l'image courante.

- une étape facultative de détermination d'un débit associé à chaque prédiction, en fonction de chaque prédiction,

- une étape de détermination d'une distorsion associée à chaque prédiction et - une étape de décision de codage ou non de résidu, en fonction d'au moins la valeur de distorsion associée à chaque prédiction.

Ainsi, l'invention optimise la taille du flux vidéo et les ressources nécessaires à la décompression en ne codant dans le flux vidéo que les données les plus pertinentes.

La mise en oeuvre du procédé, objet de la présente invention, tel que succinctement exposé ci-dessus, permet ainsi d'optimiser les ressources utilisées dans le décodeur en optimisant le codage du résidu.

Grâce à ces dispositions, si les informations apportées par le résidu ne sont pas suffisamment pertinentes ou utiles, le résidu n'est pas codé dans le flux. On évite ainsi, pour certains blocs, le décodage des coefficients du résidu et l'ajout du résidu au bloc reconstruit, qui sont coûteux en ressources.

La détermination de la distorsion liée au seul code de chaque prédiction est exacte puisque l'on dispose, au niveau du codage, de la partie d'image telle qu'elle serait décodée en l'absence de compensation de mouvement.

Selon des caractéristiques particulières, le procédé tel que succinctement exposé ci-dessus comporte, en outre:

- une étape de détermination de résidu, différence entre une prédiction représentative de chaque prédiction et la partie d'image à compresser,

- une étape de détermination de débit associé au résidu,

- une étape de détermination de distorsion associée au résidu, - ladite étape de décision mettant en oeuvre ledit débit associé au résidu et la distorsion associée au résidu.

Ainsi on ne code les coefficients associés au résidu, que si l'utilisation de ce résidu limite la distorsion de manière satisfaisante et que le codage des coefficients de ce résidu ne génère pas un débit trop important. Selon des caractéristiques particulières, le procédé tel que succinctement exposé ci-dessus comporte, en outre:

- une étape de transformation dudit résidu dans le domaine fréquentiel,

- une étape de quantification du résidu transformé,

- une étape de déquantification du résidu transformé quantifié,

- une étape de transformation, dans le domaine spatial, du résidu transformé, quantifié et déquantifié, ladite étape de détermination de débit et de la distorsion associés à chaque résidu étant fonction dudit résidu et de la transformation, dans le domaine spatial, du résidu transformé, quantifié et déquantifié.

Grâce à ces dispositions, la détermination de la distorsion liée au codage du résidu est exacte puisque l'on dispose, au niveau du codage, du résidu qui serait obtenu au niveau du décodage.

Selon des caractéristiques particulières, l'étape de décision comporte la comparaison de paramètres de décision RDI et RD2 calculés de la manière suivante: RDl= Rp*ε + Dp = k +Dp; RD2= (Rp+Rr)* ε + Dr= k+ Rr* ε +Dr Où:

- Rp est le débit associé à chaque prédiction

- Dp est la distorsion associée à chaque prédiction,

- Rr est le débit associé au résidu,

- Dr est la distorsion associée au résidu et - ε est un coefficient prédéterminé positif

- k est le produit de Rp et ε. Il n'est pas nécessaire de le déterminer pour effectuer les comparaisons ci-dessous puisque le terme est présent dans RDI et RD2.

Selon des caractéristiques particulières, au cours de l'étape de décision: - si RDI < RD2, on effectue uniquement la transmission de chaque prédiction et - si RDI > RD2, on effectue la transmission de chaque prédiction et du résidu.

L'étape de détermination du Rp, débit associé à chaque prédiction, n'est pas nécessaire puisque le terme « Rp* ε " est commun aux deux paramètres de décisions RDI et RD2. Il est donc possible de comparer RDI à RD2, sans calculer k. Grâce à ces dispositions, la décision est simple à mettre en oeuvre et liée à un critère débit-distorsion connu.

Selon des caractéristiques particulières, l'étape de décision comporte la comparaison d'un paramètre de décision RDI et d'une valeur seuil RDs qui dépend de ε, avec RDI = Rp*ε + Dp où :

- Rp est le débit associé à chaque prédiction, - Dp est la distorsion associée à chaque prédiction et

- ε est un coefficient prédéterminé positif. si RDI < RDs, seule chaque prédiction est codée et si RD 1> RDs, chaque prédiction et le résidu sont codés.

Grâce à ces dispositions, le codeur est simplifié et on limite les ressources consommées au codage puisque la décision de coder le résidu ne dépend que d'un critère débit distorsion ne tenant compte que des débits et distorsion liés à chaque prédiction.

Selon des caractéristiques particulières, si l'on considère comme précédemment que la valeur « Rp* ε » est un terme qui n'a pas d'influence sur l'étape de décision, alors l'étape de décision comporte la comparaison d'un paramètre de décision RDI et d'une valeur seuil RDs qui dépend de ε, avec RDl= Dp où:

- Dp est la distorsion associée à chaque prédiction, et

- ε est un coefficient prédéterminé positif. si RDI < RDs, seule chaque prédiction est codée et si RD 1> RDs, chaque prédiction et le résidu sont codés.

Grâce à ces dispositions, le codeur est simplifié et on limite les ressources consommées au codage puisque la décision de coder le résidu ne dépend que d'un critère distorsion.

Selon des caractéristiques particulières, l'étape de décision comporte la comparaison d'un paramètre de décision RDI et d'une valeur seuil RDs qui dépend de ε, avec RDl= Rp *ε + Dp =k+Dp Où:

- Rp est le débit associé à chaque prédiction

- Dp est la distorsion associée à chaque prédiction,

- ε est un coefficient prédéterminé positif, et

- k est le produit de Rp et ε. Il n'est pas nécessaire de le déterminer pour effectuer les comparaisons entre RDI et RD2 puisque le terme est présent dans RDI et RD2, et il est facultatif pour effectuer les comparaisons entre RDI et RDs.

Si RDI < RDs, seule chaque prédiction est codée et si RD 1> RDs, alors le calcul du résidu est effectué ainsi que la détermination du débit Rr et de la distorsion Dr du résidu, RD2 est calculé de la manière suivante RD2= k+Rr*ε + Dr : où: - Rr est le débit associé au résidu,

- Dr est la distorsion associée au résidu.

Si RDI < RD2, on effectue uniquement la transmission de chaque prédiction et si RD 1> RD2, on effectue la transmission de chaque prédiction et du résidu.

L'étape de détermination du Rp, débit associé à chaque prédiction, n'est pas nécessaire puisque le terme « Rp* ε » est commun aux deux paramètres de décisions RDI et RD2. Il est donc possible de comparer RDI et RD2 sans calculer k.

Grâce à chacune de ces dispositions, le codeur est simplifié et on limite les ressources consommées au codage puisque la décision de coder le résidu ne dépend que d'un critère débit distorsion ne tenant compte que de la distorsion et éventuellement des débits liés à chaque prédiction.

Selon un deuxième aspect, la présente invention vise un dispositif de compression d'une partie d'image, qui comporte:

- un moyen de détermination d'au moins une prédiction d'une dite partie d'image,

- un moyen de détermination de distorsion associée à chaque prédiction et - un moyen de décision de codage ou non de résidu, en fonction d'au moins la valeur de distorsion associée à chaque prédiction.

Les avantages, buts et caractéristiques de ce dispositif étant similaires à ceux du procédé, objet de la présente invention, tel que succinctement exposé ci-dessus, ne sont pas rappelés ici.

D'autres avantages, buts et caractéristiques de la présente invention ressortiront de la description qui va suivre, faite, dans un but explicatif et nullement limitatif en regard des dessins annexés, dans lesquels:

- la figure 1 représente, sous forme d'un schéma-bloc fonctionnel, un procédé de codage avec codage de la prédiction et de son résidu connu dans l'art antérieur,

- la figure 2 représente, sous forme d'un logigramme, des étapes mises en oeuvre dans un procédé de compression et dans un procédé de décompression d'images associées, connus dans l'art antérieur,

- les figures 3 à 6 représentent, sous forme de logigrammes, des étapes mises en oeuvre dans des modes de réalisation particuliers du procédé objet de la présente invention et

- la figure 7 représente un mode de réalisation particulier du dispositif objet de la présente invention.

Dans le mode de réalisation particulier illustré en figure 3, au cours d'une étape 301, l'image à coder est décomposée en blocs et stockée dans une zone mémoire d'un dispositif de codage ou de compression. Les étapes suivantes, 302 à 316, sont effectuées, successivement, pour chaque bloc de l'image à coder.

Au cours d'une étape 302, on effectue une estimation de mouvement de manière connue, par exemple comme décrit dans la demande de brevet FR2850827 pour fournir une prédiction, par rapport à chaque image de référence.

Au cours d'une étape 312, la distorsion occasionnée par chaque prédiction encodée est déterminée et stockée en mémoire, et facultativement, le débit correspondant à chaque prédiction est déterminé et stocké en mémoire.

Une mesure de la distorsion correspondant au bloc obtenu au cours de l'étape 312, est alors calculée, par exemple par la méthode SSD. Cette distorsion correspond, ainsi que la distorsion que générerait le décodage, avec la ou les seule(s) prédiction(s) codée(s) dans le flux vidéo.

Parallèlement à l'étape 312, au cours d'une étape 303, on détermine la différence entre la prédiction et le bloc original à coder, et on écrit en mémoire le résidu, c'est-à-dire le résultat de cette différence.

Au cours d'une étape 308, on transforme le résidu dans le domaine fréquentiel.

Puis, au cours d'une étape 309, on quantifie la transformée du résidu et on effectue le codage du résidu transformé quantifié.

Au cours d'une étape 310, on effectue la quantification inverse de la transformée du résidu quantifiée. Au cours d'une étape 311, on effectue la transformée dans le domaine spatial du résultat de l'étape 310. Le résultat ainsi obtenu est le résidu que décoderait le dispositif de décodage à partir du flux vidéo codé.

Au cours de l'étape 313, on détermine le débit nécessaire à l'encodage du résidu transformé et quantifié résultant de l'étape 309 et on calcule la distorsion que générerait le résidu décodé issu de l'étape 311. On stocke en mémoire ces débit et distorsion.

Au cours d'une étape 314, on détermine si, pour le bloc considéré, le résultat de l'étape 309 doit être transmis au dispositif de décodage. A cet effet, à partir des données en mémoire, les paramètres de décision RDI et RD2 suivants sont calculés:

RDl= Rp*ε + Dp = k +Dp ;

RD2= (Rp+Rr)* ε + Dr= k+ Rr* ε +Dr où:

- Rp est le débit du bloc prédit,

- Dp est la distorsion du bloc prédit, - Rr le débit du résidu,

- Dr, la distorsion du résidu et

- ε, positif, est fixé par le concepteur ou l'utilisateur du codeur/décodeur ou est paramétré en fonction des ressources disponibles au niveau du dispositif de décodage. - k est le produit de Rp et ε. D n'est pas nécessaire de le déterminer pour effectuer les comparaisons ci-dessous puisque le terme est présent dans RDI et RD2.

Si RDI < RD2, le codage des données de la compensation de mouvement n'est pas pertinent vis-à-vis des coûts en débit et des gains en distorsion. Dans ce cas, au cours d'une étape 316, seule chaque prédiction est codée dans le flux vidéo, par exemple par le biais du codage de son ou ses vecteurs mouvements.

Si RDI > RD2, le codage des données de la compensation de mouvement est pertinent vis-à-vis des coûts en débit et des gains en distorsion. Dans ce cas, au cours d'une étape 315, chaque prédiction et la compensation de mouvement sont codées dans le flux vidéo, par exemple par le biais du codage de son ou ses vecteurs mouvements et du résidu transformé et quantifié.

RDI représente un critère débit-distorsion lié au seul codage de chaque prédiction et RD2 représente un critère débit-distorsion lié au codage de chaque prédiction et du résidu.

Dans la mesure de RD2, le facteur représentant le débit est (Rp+Rr), on peut donc tenir compte des deux débits: celui du bloc prédit et celui du résidu, puisque le résidu est encodé nécessairement avec le bloc prédit. Mais, l'étape de détermination du Rp, débit associé à chaque prédiction, n'est pas nécessaire puisque le terme « Rp* ε » est commun aux deux paramètres de décisions RDI et RD2. D est donc possible de comparer RDI et RD2 sans calculer k. Dans un second mode de réalisation particulier décrit en regard de la figure 4, au cours d'une étape 401, on décompose l'image à coder en blocs et on stocke les blocs de l'image à coder dans une zone mémoire. Les étapes suivantes, 402 à 416, sont effectuées, successivement, pour chaque bloc de l'image à coder.

Au cours d'une étape 402, on effectue une estimation de mouvement et on fournit au moins une prédiction.

Au cours de l'étape 405, on détermine la distorsion Dp engendrée par la prédiction.

De manière facultative le débit Rp nécessaire à l'envoi de chaque prédiction est déterminé.

Parallèlement à l'étape 405, au cours d'une étape 403, on détermine la différence entre la prédiction et le bloc correspondant de l'image originale à coder et on met en mémoire cette différence, appelée « résidu ».

Au cours d'une étape 408, on effectue une transformation en fréquences du résidu par une transformation de type DCT, et on effectue une quantification de la transformée du résidu. Au cours d'une étape 413, on détermine le débit Rr nécessaire à l'encodage du résidu transformé et quantifié et la distorsion Dr que générerait le résidu codé et on stocke ces résultats en mémoire.

Au cours d'une étape 414, on détermine si, pour le bloc considéré, le résultat de l'étape 413 doit être transmis au dispositif de décodage. A cet effet, à partir des données en mémoire, les paramètres de décision RDI et RD2 suivants sont calculés:

RDl= Rp*ε + Dp = k +Dp ; RD2= (Rp+Rr)* ε + Dr= k+ Rr* ε +Dr où:

- Rp est le débit du bloc prédit,

- Dp est la distorsion du bloc prédit,

- Rr le débit du résidu, - Dr, la distorsion du résidu et

- ε, positif, est fixé par le concepteur ou l'utilisateur du codeur/décodeur ou est paramétré en fonction des ressources disponibles au niveau du dispositif de décodage

- k est le produit de Rp et ε. Il n'est pas nécessaire de le déterminer pour effectuer les comparaisons ci-dessous puisque le terme est présent dans RDI et RD2.

RDI représente un critère débit-distorsion lié au seul codage de chaque prédiction et RD2 représente un critère débit-distorsion lié au codage de chaque prédiction et du résidu.

Dans la mesure de RD2, le facteur représentant le débit est (Rp+Rr), on peut donc tenir compte des deux débits: celui du bloc prédit et celui du résidu, puisque le résidu est encodé nécessairement avec le bloc prédit. Mais, l'étape de détermination de Rp, débit associé à chaque prédiction, n'est pas nécessaire puisque le terme « Rp* ε » est commun aux deux paramètres de décisions RDI et RD2. D est donc possible de comparer RDI et RD2 sans déterminer k. Si RDI < RD2, le codage des données de la compensation de mouvement n'est pas pertinent vis-à-vis des coûts en débit et des gains en distorsion, et seule chaque prédiction est codée dans le flux vidéo, au cours de l'étape 416.

Si RDI > RD2, le codage des données de la compensation de mouvement est pertinent vis-à-vis des coûts en débit et des gains en distorsion et, au cours d'une étape 415, le bloc prédit et la compensation de mouvement sont codés dans le flux vidéo.

Ainsi, en comparaison au mode de réalisation illustré en figure 3, dans le deuxième mode de réalisation illustré en figure 4, on n'effectue ni les étapes de

quantification inverse, ni celles de transformée inverse du résidu transformé et quantifié.

On calcule à partir du résidu transformé et quantifié, le débit et la distorsion qui seraient générés par la compensation de mouvement dans le flux codé. En conséquence, dans le deuxième mode de réalisation, on ne tient pas compte des erreurs d'arrondis engendrés par la quantification et la transformée.

Dans un troisième mode de réalisation illustré en figure 5, au cours d'une étape

501, on décompose l'image à coder en blocs et on stocke les blocs de l'image à coder en mémoire. Les étapes suivantes 502 à 516 sont effectuées, successivement, pour chaque bloc de l'image à coder. Au cours d'une étape 502, on effectue l'estimation de mouvement du bloc courant de l'image à coder et on fournit au moins une prédiction.

Puis, au cours d'une étape 503, on effectue la différence entre la prédiction et le bloc de l'image originale à coder et on écrit en mémoire le résultat de cette différence, ou résidu. Au cours d'une étape 514, on estime, avec des tables, la distorsion Dp et facultativement le débit Rp que générerait le codage de chaque prédiction dans le flux vidéo et on stocke Dp et facultativement Rp en mémoire, on estime, avec des tables, le débit Rr et la distorsion Dr que générerait le codage du résidu dans le flux vidéo et on stocke Rp et Dp en mémoire. Au cours de l'étape 514, on détermine si, pour le bloc considéré, le résidu doit être transmis au dispositif de décodage. A cet effet, à partir des données en mémoire, les paramètres de décision RDI et RD2 suivants sont calculés: RDl= Rp*ε + Dp = k +Dp; RD2= (Rp+Rr)* ε + Dr= k+ Rr* ε +Dr où:

- Rp est le débit du bloc prédit,

- Dp est la distorsion du bloc prédit,

- Rr le débit du résidu,

- Dr, la distorsion du résidu et - ε, positif, est fixé par le concepteur ou l'utilisateur du codeur/décodeur ou est paramétré en fonction des ressources disponibles au niveau du dispositif de décodage.

- k est le produit de Rp et ε. D n'est pas nécessaire de le déterminer pour effectuer les comparaisons ci-dessous puisque le terme est présent dans RDI et RD2. RDI représente un critère débit-distorsion lié au seul codage de chaque prédiction et RD2 représente un critère débit-distorsion lié au codage de chaque prédiction et du résidu. Dans la mesure de RD2, le facteur représentant le débit est (Rp+Rr), on peut donc tenir compte des deux débits: celui du bloc prédit et celui du résidu, puisque le résidu est encodé nécessairement avec le bloc prédit. Mais, l'étape de détermination du Rp, débit associé à chaque prédiction, n'est pas nécessaire puisque le terme « Rp* ε» est commun aux deux paramètres de décisions RDI et RD2. Il est donc possible de comparer RDI et RD2 sans déterminer k.

Si RDI < RD2, le codage des données de la compensation de mouvement n'est pas pertinent vis-à-vis des coûts en débit et des gains en distorsion, et seule chaque prédiction est codée dans le flux vidéo, au cours de l'étape 516.

Si RDI > RD2, le codage des données de la compensation de mouvement est pertinent vis-à-vis des coûts en débit et des gains en distorsion et, au cours d'une étape 515, le bloc prédit et la compensation de mouvement sont codés dans le flux vidéo.

Ainsi, il est possible d'avoir un flux moins coûteux en ressources au moment du décodage mais aussi moins coûteux en ressources à coder puisque l'on supprime, pour certains blocs, l'étape de codage de la compensation de mouvement.

Dans un quatrième mode de réalisation illustré en figure 6, l'image à coder est décomposée en blocs et stockée dans une zone mémoire, au cours d'une étape 601. Les étapes suivantes 602 à 616 sont effectuées, successivement, pour chaque bloc de l'image à coder. Au cours d'une étape 602, on effectue l'estimation de mouvement du bloc de l'image à coder et on fournit au moins une prédiction.

Au cours d'une étape 614, on calcule le débit Rp et facultativement la distorsion

Dp que générerait le codage de chaque prédiction dans le flux vidéo et on stocke Rp et facultativement Dp en mémoire. Au cours de l'étape 614, on détermine si une compensation de mouvement, ou un résidu, doit être codé, de la manière suivante: on calcule le paramètre de décision

RDI = Rp*ε + Dp où:

- Rp est le débit du bloc prédit (facultatif),

- Dp est la distorsion du bloc prédit et - ε, positif, est fixé par le concepteur ou l'utilisateur du codeur/décodeur ou est paramétré en fonction des ressources disponibles au niveau du dispositif de décodage.

Si RDI < RDs, où RDs est une valeur seuil déterminée par le concepteur du codeur, seule chaque prédiction est codée dans le flux vidéo, au cours de l'étape 616. Si RDI > RDs, le bloc prédit est codé dans le flux vidéo et la compensation de mouvement du bloc prédit est déterminée puis codée dans le flux vidéo lors de l'étape 615.

Si l'on considère comme précédemment que la valeur « Rp* ε » est un terme qui n'a pas d'influence sur l'étape de décision, alors l'étape de décision comporte la comparaison du paramètre de décision RDI calculé par RDI = Dp et de la valeur seuil RDs qui dépend de ε.

Ainsi il est possible d'avoir un flux moins coûteux en ressource au décodage mais aussi moins coûteux en ressources à coder puisque l'on supprime, pour certains blocs, l'étape de codage de la compensation de mouvement. On observe que, en variantes, on met en oeuvre le taux de RDO connu de l'homme du métier.

On observe, en figure 7, un mode de réalisation particulier d'un dispositif de compression de parties d'images 705, objet de la présente invention. Ce dispositif 705 comporte une entrée de signaux représentatifs d'images 725, un processeur 710, une mémoire de programme 715, une mémoire d'images 720 et une sortie de signaux d'images compressés 730.

Le processeur 710 est de type connu. En combinaison avec les mémoires 715 et 720, il est adapté à mettre en oeuvre un mode de réalisation du procédé objet de la présente invention, par exemple l'un de ceux illustrés en figures 3 à 6. A cet effet, la mémoire de programme 715 contient des instructions lisibles par le processeur 710 et implémentant les étapes du procédé à mettre en oeuvre.

Ainsi, en combinaison avec les mémoires 715 et 720, le processeur 710 constitue, au moins:

- un moyen de détermination d'au moins une prédiction d'une dite partie d'image,

- un moyen de détermination de distorsion associée à chaque prédiction et - un moyen de décision de codage ou non de résidu, en fonction d'au moins les valeurs de débit et de distorsion associées à chaque prédiction.

Dans un mode particulier de réalisation de l'invention, une prédiction d'un bloc peut être réalisée à partir d'un ensemble de blocs précédemment traités et appartenant à la même image que le bloc en cours de traitement. Cette prédiction peut s'effectuer grâce à une fonction appliquée à cet ensemble de blocs, par exemple la fonction peut être une combinaison de l'information colorimétrique des blocs adjacents au bloc en cours de traitement.

Previous Patent: METHOD AND DEVICE FOR PRODUCING A GAS GENERATOR, AND GAS GENERATOR PRODUCED BY MEANS OF THE METHOD

Next Patent: STONE CARRIER