Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
LABELLED AUDIO-VIDEO STREAM FOR SYNCHRONIZING THE COMPONENTS THEREOF, METHOD AND EQUIPMENT FOR ANALYZING THE ARTIFACTS AND SYNCHRONIZATION OF SUCH A STREAM
Document Type and Number:
WIPO Patent Application WO/2016/097165
Kind Code:
A1
Abstract:
The present invention relates to a labelled audio-video stream comprising: - a video stream comprising a series of video frames, and - an audio stream comprising a series of audio frames, and - a text stream comprising a series of subtitle frames. Said labelled audio-video stream is characterized in that: - each video frame comprises a means for identifying the video synchronization, and - each audio frame comprises a means for identifying the audio synchronization, and - each text frame comprises a means for identifying the synchronization of the subtitles. The present invention also relates to equipment and methods for analyzing the possible presence of artifacts on each of the streams and for synchronizing the various streams with one another.

Inventors:
HENNEQUIN FRANCK (FR)
GONTIER WILLIAM (FR)
Application Number:
PCT/EP2015/080253
Publication Date:
June 23, 2016
Filing Date:
December 17, 2015
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SOFTATHOME (FR)
International Classes:
H04N21/43; H04N17/00; H04N21/8547
Foreign References:
EP0838960A21998-04-29
DE102011122659A12013-07-04
Other References:
None
Attorney, Agent or Firm:
PONTET ALLANO & ASSOCIES (FR)
Download PDF:
Claims:
Revendications

Flux audio-vidéo marqué comprenant :

- au moins un signal vidéo composé d'au moins une trame vidéo, et

- au moins un signal audio composé d'au moins une trame audio, et

- au moins un signal textuel composé d'au moins une trame de sous- titres,

ledit flux audio-vidéo marqué étant caractérisé en ce que :

- l'au moins une trame vidéo comporte un moyen d'identification du synchronisme vidéo, et

- l'au moins une trame audio comporte un moyen d'identification du synchronisme audio, et

- l'au moins une trame de sous-titres comporte un moyen d'identification du synchronisme textuel.

Flux audio-vidéo selon la revendication précédente, caractérisé en ce que le moyen d'identification du synchronisme audio est transporté par une porteuse modulée.

Flux audio-vidéo selon l'une quelconque des revendications précédentes, caractérisé en ce que le moyen d'identification du synchronisme audio est un compteur pour identifier l'instant de diffusion de la trame audio correspondante.

Flux audio-vidéo selon l'une quelconque des revendications précédentes, caractérisé en ce que le moyen d'identification du synchronisme vidéo comporte un identifiant unique pour indexer une base de données.

Flux audio-vidéo selon l'une quelconque des revendications précédentes, caractérisé en ce que le moyen d'identification du synchronisme vidéo comporte en outre une structure bi-dimensionnelle d'images prédéfinies.

6. Flux audio-vidéo selon l'une quelconque des revendications précédentes, caractérisé en ce que le moyen d'identification du synchronisme textuel est un compteur pour identifier l'instant d'apparition de la trame de sous-titre correspondante.

Procédé d'analyse de flux audio-vidéo d'un flux audio-vidéo marqué selon l'une quelconque des revendications 1 à 6, caractérisé en que ledit procédé utilise une unité de traitement pour tester:

- la continuité de l'au moins une trame vidéo de l'au moins un signal vidéo dudit flux audio-vidéo marqué ; et/ou

- la continuité de l'au moins une trame audio de l'au moins un signal audio dudit flux audio-vidéo marqué ; et/ou

- la continuité de l'au moins une trame de sous-titres de l'au moins un signal textuel dudit flux audio-vidéo marqué.

Procédé d'analyse selon la revendication précédente, caractérisé en ce que l'unité de traitement teste en outre :

- le synchronisme audio de l'au moins une trame audio par rapport à l'au moins une trame vidéo dudit flux audio-vidéo marqué ; et/ou

- le synchronisme textuel de l'au moins une trame de sous-titres par rapport à l'au moins une trame vidéo dudit flux audio-vidéo marqué.

Procédé d'analyse selon l'une quelconque des revendications 7 ou 8, caractérisé en ce que l'unité de traitement teste en outre la qualité de l'au moins une trame vidéo dudit flux audio-vidéo marqué.

10. Procédé d'analyse selon l'une quelconque des revendications 7 à 9, caractérisé en qu'il comprend au moins une itération des étapes suivantes :

- une étape de lecture d'un flux audio-vidéo marqué,

- une étape d'acquisition des identifiants de synchronisme comprenant : - l'acquisition de l'identifiant de synchronisme vidéo de l'au moins une trame vidéo dudit flux audio-vidéo marqué,

- l'acquisition de l'identifiant de synchronisme audio de l'au moins une trame audio dudit flux audio-vidéo marqué, - l'acquisition de l'identifiant de synchronisme textuel de l'au moins une trame de sous-titres dudit flux audio-vidéo marqué,

- une étape de décodage de l'identifiant vidéo,

- une étape d'indexation d'une base de données comprenant toutes les informations relatives audit flux audio-vidéo marqué,

- une étape de détection des artefacts comprenant :

- la détection des artefacts vidéo,

- la détection des artefacts audio.

11. Décodeur d'un flux audio-vidéo marqué, à l'aide d'un procédé d'analyse selon l'une quelconque des revendications 7 à 10, ledit décodeur comprenant :

- un moyen pour lire le flux audio-vidéo marqué selon l'une quelconque des revendications 1 à 6,

- un moyen pour extraire l'au moins un identifiant de synchronisme vidéo de l'au moins un signal vidéo dudit flux audio-vidéo marqué,

- un moyen pour extraire l'au moins un identifiant de synchronisme audio de l'au moins un signal audio dudit flux audio-vidéo marqué,

- un moyen pour extraire l'au moins un identifiant de synchronisme textuel de l'au moins un signal textuel dudit flux audio-vidéo marqué,

- une base de données comprenant :

- les informations de décodage de l'identifiant de synchronisme vidéo de l'au moins un signal vidéo dudit flux audio-vidéo marqué, - le signal audio dudit flux audio-vidéo marqué, et/ou - le signal textuel dudit flux audio-vidéo marqué,

- un moyen d'analyse pour comparer les identifiants de synchronisme extraits avec le contenu de la base de données.

Description:
« Flux audio-vidéo marqué pour en synchroniser les différentes composantes, procédé et installation pour l'analyse des artefacts et du synchronisme d'un tel flux »

Domaine technique La présente invention concerne un flux audio-vidéo marqué, un procédé de génération d'un tel flux, un procédé et une installation pour l'analyse et la synchronisation d'un tel flux.

La présente invention se situe dans le domaine de la visualisation de contenus médiatiques, et plus particulièrement audio-visuels. Etat de la technique antérieure

L'invention a trait à la visualisation de contenus audiovisuels comportant notamment un signal vidéo et/ou un signal audio et/ou un élément textuel diffusé en surimpression, comme un sous-titre par exemple. On constate que l'offre et la demande de tels contenus audio-visuels ont crû de manière exponentielle durant la dernière décennie, contribuant ainsi à métamorphoser le panorama télévisuel (et internet) ainsi que la manière dont le public regarde de tels contenus.

En particulier, et notamment avec l'accroissement des dimensions des écrans, l'exigence quant à la qualité attendue de tels contenus s'est renforcée, du point de vue de la résolution d'une part, mais aussi dans la qualité audio et du rendu global d'autre part.

Aujourd'hui, il n'existe pas à notre connaissance de dispositifs capables de détecter avec précision des artefacts dans les contenus vidéo joués par des décodeurs numériques, télévisions ou ordinateurs. En revanche, il existe de manière connue, des logiciels couplés à des cartes d'acquisition qui permettent de détecter des discontinuités dans le déroulement d'une vidéo, et de permettre ainsi de supposer la présence d'artefacts. Ces logiciels sont, de manière connue, intégrés à des automates qui permettent ainsi d'améliorer la lecture vidéo et le rendu offert à l'utilisateur. Les inconvénients associés à de tels dispositifs sont nombreux. En effet, malgré un coût élevé, ils nécessitent souvent une vérification manuelle a posteriori du contenu traité. Par ailleurs, ces systèmes ne permettent pas d'identifier les contenus joués (composantes audio, vidéo, télétexte...) et il n'existe pas non plus de moyens de vérifier avec précision la synchronisation entre les différentes composantes jouées par les décodeurs numériques, télévisions ou ordinateurs...

La présente invention a pour objet de répondre au moins en grande partie aux problèmes précédents et de conduire en outre à d'autres avantages. Un autre but de l'invention est de résoudre au moins un de ces problèmes par un nouveau flux audio-vidéo qui permet de vérifier la continuité et/ou le synchronisme des différentes composantes textuelles, audio et vidéo.

Un autre but de la présente invention est de proposer un dispositif qui facilite l'analyse des flux audio-vidéo et d'en réduire les coûts. Un autre but est d'améliorer la qualité et le rendu des flux audio-vidéo diffusés.

Exposé de l'invention

On atteint au moins l'un des objectifs précités avec un flux audio-vidéo marqué comprenant (i) au moins un signal vidéo composé d'au moins une trame vidéo, et (ii) au moins un signal audio composé d'au moins une trame audio et/ou (iii) au moins un signal textuel composé d'au moins une trame de sous-titres, et caractérisé en ce que l'au moins une trame vidéo comporte un moyen d'identification du synchronisme vidéo, et l'au moins une trame audio comporte un moyen d'identification du synchronisme audio et/ou l'au moins une trame de sous-titres comporte un moyen d'identification du synchronisme textuel.

Ainsi le flux audio-vidéo marqué selon l'invention permet :

- d'identifier séparément les signaux textuel, audio et vidéo à l'aide de moyens d'identifications transportés sur chacun des signaux respectivement textuels, audio et vidéo. Dans le cas où le flux audio-vidéo marqué selon l'invention comporterait plusieurs signaux d'un même type (par exemple plusieurs sous-titres et/ou plusieurs langues de diffusion...) alors les identifiants correspondant permettent de distinguer chaque signal de la même catégorie ;

- de vérifier la continuité des composantes de sous-titres, audio et vidéo diffusées puisque chacune d'entre elles est identifiable. En d'autres termes, il s'agit de pouvoir vérifier que tous les composants d'un signal donné - c'est-à-dire toutes les trames qui le composent - sont présents et joués dans le bon ordre. L'ordre dans lequel les trames doivent être jouées peut être contenu dans l'identifiant de synchronisme lui-même (en utilisant une incrémentation numérique par exemple) et/ou dans une base de données qui regroupe toutes les informations concernant le flux audio-vidéo marqué. Il est donc possible de savoir dans quel ordre chacune des trames doit être diffusée ;

- de vérifier le synchronisme entre les différents signaux, et plus particulièrement le synchronisme entre le signal vidéo et au moins un signal audio et/ou au moins un signal textuel . La bonne association des différentes trames des différents signaux, correspondant à un synchronisme parfait, peut être définie dans une base de données ou encodée dans les identifiants eux-mêmes.

Un flux audio-vidéo selon l'invention peut comporter plusieurs instances de chaque signal audio et/ou textuel . A titre d'exemple non limitatif, un flux audio-vidéo marqué selon l'invention, dans le domaine du cinéma, peut être composé d'un flux vidéo, de deux flux audio différents, correspondant par exemple aux dialogues en Français et en Anglais, ainsi que cinq flux textuels correspondant aux sous-titres dans différentes langues étrangères.

Le flux vidéo peut aussi être composé de plusieurs signaux vidéo.

Selon une version, le moyen d'identification du synchronisme audio peut être transporté par une porteuse modulée en accord avec ledit moyen d'identification du synchronisme audio.

Selon une autre version préférentielle, le moyen d'identification du synchronisme audio peut être un compteur pour identifier l'instant de diffusion de la trame audio correspondante, permettant ainsi de déterminer à quel moment - et dans quel ordre - les trames audio sont diffusées.

Selon une autre version préférentielle, le moyen d'identification du synchronisme vidéo peut comporter un identifiant unique pour indexer une base de données afin de pouvoir initier des comparaisons avec ladite base de données et d'analyser le flux audio-vidéo correspondant. L'identifiant peut être de tout type afin de permettre d'identifier - à minima - une cellule dans une base de données. Il peut s'agir par exemple d'un couple d'entiers décrivant respectivement un numéro de ligne et de colonne de ladite base de données, ou encore d'un code QR qui permet de stocker d'avantage d'informations, tel que par exemple un compteur.

Selon une autre version, le moyen d'identification du synchronisme vidéo peut comporter en outre une structure bi-dimensionnelle d'images prédéfinies afin de pouvoir détecter la présence d'éventuels artefacts en mesurant la déformation de l'image diffusée par rapport à celle prédéfinie et dont les caractéristiques essentielles sont enregistrées dans la base de données. Il peut s'agir d'une mosaïque comportant des images particulières à des positions particulières. Les caractéristiques concernant les images qui constituent la mosaïque et leurs positions sont stockées par ailleurs dans une base de données. Enfin, les images peuvent être différentes pour chacune des trames qui composent le flux vidéo.

Suivant un autre aspect de l'invention, il est proposé un décodeur d'un flux audio-vidéo marqué et comprenant (i) un moyen pour lire ledit au moins un flux audio-vidéo marqué selon l'invention, (ii) un moyen pour extraire au moins un identifiant de synchronisme vidéo de l'au moins un signal vidéo dudit flux audio-vidéo marqué, (iii) un moyen pour extraire l'au moins un identifiant de synchronisme audio de l'au moins un signal audio dudit flux audio-vidéo marqué, (iv) un moyen pour extraire l'au moins un identifiant de synchronisme textuel de l'au moins un signal textuel dudit flux audiovidéo marqué, (v) une base de données comprenant d'une part les informations de décodage de l'identifiant de synchronisme vidéo de l'au moins un signal vidéo dudit flux audio-vidéo marqué et d'autre part le signal audio et/ou le signal textuel de l'au moins un flux audio-vidéo marqué, et (vi) un moyen d'analyse pour comparer les identifiants de synchronismes extraits avec le contenu de la base de données. Il est ainsi possible de contrôler la diffusion dudit flux audio-vidéo et d'en améliorer le rendu, à des coûts moins élevés que ceux proposés par les solutions connues. En effet, les moyens d'analyse permettent d'une part de vérifier que l'au moins un flux audio diffusé correspond au signal audio original, et d'autre part de vérifier la présence éventuelle d'artefacts vidéos tels que les coupures ou les macroblocs en vérifiant que les images présentes sur l'identifiant du synchronisme vidéo sont conformes à celles qui ont été utilisées dans le signal original et qui sont stockées sur la base de données. Il est aussi possible de vérifier que le texte diffusé en sous-titrage est conforme à celui du signal original.

L'invention concerne par ailleurs un procédé de génération d'un flux audiovidéo marqué selon l'invention et pouvant comprendre au moins une itération des étapes suivantes :

- découpage d'un flux audio-vidéo en une pluralité de trames vidéo d'une part, et/ou en une pluralité de trames audio d'autre part, et/ou en une pluralité de trames de sous-titres ;

- insertion d'un identifiant de synchronisme vidéo dans chaque trame vidéo,

- insertion d'un identifiant de synchronisme audio dans chaque trame audio ;

- insertion d'un identifiant de synchronisme textuel dans chaque trame de sous-titres. II est ainsi possible à l'aide de ce procédé de convertir un flux audio-vidéo quelconque en un flux audio-vidéo marqué et comprenant des marqueurs qui permettront d'analyser, vérifier et, le cas échéant, compenser d'une part le synchronisme du flux audio par rapport au flux vidéo, ainsi que de détecter et réparer certains artefacts, et d'autre part le synchronisme du flux textuel par rapport au flux vidéo.

Suivant encore un autre aspect de l'invention, il est proposé un procédé d'analyse d'un flux audio-vidéo marqué selon l'invention, ledit procédé d'analyse utilisant une unité de traitement pour tester (i) la continuité de l'au moins une trame vidéo de l'au moins un signal vidéo dudit flux audiovidéo marqué ; et/ou (ii) la continuité de l'au moins une trame audio de l'au moins un signal audio dudit flux audio-vidéo marqué ; et/ou (iii) la continuité de l'au moins une trame de sous-titres de l'au moins un signal textuel dudit flux audio-vidéo marqué.

L'unité de traitement peut comprendre un microprocesseur ou un microcontrôleur et peut être intégré par exemple dans un équipement de lecture de flux audio-vidéos, tels que par exemple une « set-top-box », une télévision numérique ou n'importe quel type de décodeur numérique. Avantageusement, le procédé d'analyse selon l'invention peut tester en outre le synchronisme audio de l'au moins une trame audio par rapport à l'au moins une trame vidéo dudit flux audio-vidéo marqué, et/ou le synchronisme textuel de l'au moins une trame de sous-titres par rapport à l'au moins une trame vidéo dudit flux audio-vidéo marqué. Préférentiellement, le procédé d'analyse selon l'invention peut aussi tester la qualité de l'au moins une trame vidéo dudit flux audio-vidéo marqué.

Avantageusement, le procédé d'analyse selon l'invention peut comprendre au moins une itération des étapes suivantes :

- une étape de lecture de l'au moins un flux audio-vidéo marqué,

- une étape d'acquisition des identifiants de synchronisme comprenant :

- l'acquisition de l'identifiant de synchronisme vidéo de l'au moins une trame vidéo dudit flux audio-vidéo marqué,

- l'acquisition de l'identifiant de synchronisme audio de l'au moins une trame audio dudit flux audio-vidéo marqué,

- l'acquisition de l'identifiant de synchronisme textuel de l'au moins une trame de sous-titres dudit flux audio-vidéo marqué,

- une étape de décodage de l'identifiant vidéo,

- une étape d'indexation d'une base de données comprenant toutes les informations relatives audit flux audio-vidéo marqué,

- une étape de détection des artefacts comprenant :

- la détection des artefacts vidéo, - la détection des artefacts audio,

- une étape de correction des artefacts détectés.

Il est ainsi possible d'améliorer la qualité des flux audio-vidéos marqués car les éventuels artefacts audio et vidéo qui sont détectés sont analysés par comparaison avec la base de données et corrigés.

D'une manière générale, la présente invention entend couvrir les procédés de synchronisation et/ou de correction d'artefacts des signaux composants des flux audio-vidéo, quel que soit le nombre de signaux composants lesdits flux. La présente invention s'étend aussi à la synchronisation de plusieurs flux audio-vidéo marqués, l'un d'entre eux étant pris comme référence.

Suivant cet autre aspect de l'invention, le procédé d'analyse selon l'invention peut comporter au préalable à l'étape de lecture une étape de génération de flux audio-vidéo marqué à partir d'un flux audio-vidéo standard et comprenant les étapes suivantes :

- découpage d'un flux audio-vidéo en une pluralité de trames vidéo d'une part, et/ou en une pluralité de trames audio d'autre part, et/ou en une pluralité de trames de sous-titres ;

- insertion d'un identifiant de synchronisme vidéo dans chaque trame vidéo,

- insertion d'un identifiant de synchronisme audio dans chaque trame audio,

- insertion d'un identifiant de synchronisme textuel dans chaque trame de sous-titres.

Description des figures et des modes de réalisation

D'autres caractéristiques et avantages de l'invention apparaîtront encore au travers de la description qui suit d'une part, et de plusieurs exemples de réalisation donnés à titre indicatif et non limitatif en référence aux dessins schématiques annexés d'autre part, sur lesquels :

- la FIGURE 1 illustre un diagramme de principe pour la génération d'un flux audio-vidéo marqué selon l'invention, - la FIGURE 2 illustre un exemple particulier d'identificateur de synchronisme vidéo,

- la FIGURE 3 illustre un flux vidéo marqué selon l'invention,

- la FIGURE 4 illustre un diagramme de principe pour l'analyse des différents artefacts d'un flux audio-vidéo marqué selon l'invention ainsi que la détection des erreurs de synchronisation,

- la FIGURE 5 illustre un exemple de transmission d'un compteur de trame audio par modulation d'amplitude, et

- la FIGURE 6 illustre le spectre équivalent du signal audio généré.

Les modes de réalisation qui seront décrits dans la suite ne sont nullement limitatifs ; on pourra notamment imaginer des variantes de l'invention ne comprenant qu'une sélection de caractéristiques décrites par la suite isolées des autres caractéristiques décrites, si cette sélection de caractéristiques est suffisante pour conférer un avantage technique ou pour différencier l'invention par rapport à l'état de la technique antérieur. Cette sélection comprend au moins une caractéristique de préférence fonctionnelle sans détails structurels, ou avec seulement une partie des détails structurels si cette partie uniquement est suffisante pour conférer un avantage technique ou pour différencier l'invention par rapport à l'état de la technique antérieur.

En particulier toutes les variantes et tous les modes de réalisation décrits sont combinables entre eux si rien ne s'oppose à cette combinaison sur le plan technique.

Sur les figures, les éléments communs à plusieurs figures conservent la même référence.

La FIGURE 1 illustre un diagramme de principe pour la génération 100 d'un flux audio-vidéo marqué selon l'invention. Le principe général est de diviser 102 chaque signal composant le flux audio-vidéo original 101 en trames sur lesquelles sont introduits par ailleurs des marqueurs qui permettront de vérifier et/ou corriger la continuité et/ou le synchronisme entre les différents signaux et/ou corriger les artefacts de lecture qui peuvent parfois apparaître lors de la diffusion desdits signaux.

Le procédé délivre ainsi plusieurs signaux composés chacun d'une pluralité de trames marquées, lesdits signaux comprenant par exemple au moins un signal vidéo découpé en trames et marquées 104, et/ou au moins un signal audio découpé en trames et marquées 105, et/ou au moins un signal textuel découpé en trames et marquées 103.

Le signal textuel découpé en trame et marquées peut représenter la bande de sous-titrage associée au signal vidéo, ou n'importe quelle autre information textuelle diffusée en surimpression à l'image diffusée par le média.

Le marquage des différents signaux qui composent le flux audio-vidéo marqué comprend un identifiant de synchronisme, pouvant contenir cependant d'avantage d'informations que celle nécessaire pour vérifier la continuité des signaux et réaliser la synchronisation des différents signaux.

Ainsi, le marquage du signal vidéo découpé en trames peut comporter un compteur pour servir de référence temporelle pour la synchronisation des autres signaux du flux audio-vidéo marqué ; il peut aussi contenir un identifiant unique permettant d'indexer une base de données 110 décrites ci-après.

Le marquage du signal audio découpé en trames peut être réalisé par modulation d'amplitude par exemple ou par tout autre moyen permettant de superposer au signal audio initial une information permettant d'identifier ultérieurement le synchronisme du signal audio avec le signal vidéo. A minima, le code superposé au signal audio original et transporté sur chaque trame comporte un compteur ou un identifiant permettant d'accéder à un tel compteur.

Le marquage du signal textuel découpé en trames comporte en outre un compteur afin de déterminer l'instant d'apparition de ladite trame textuelle. Une fois réalisés le découpage des trames et le marquage des différents signaux composant le flux audio-vidéo initial, les composantes sont recombinées pour former un flux audio-vidéo marqué 106.

Enfin, une base de données 110 est renseignée avec toutes les informations qui permettront l'analyse et le décodage ultérieur du flux audio-vidéo marqué. Typiquement, mais de manière non limitative, la base de données peut contenir les informations concernant le flux audio-vidéo original ainsi que la description complète du flux audio-vidéo marqué généré par le présent procédé, à savoir, et à titre non limitatif, le contenu et la position relative de chaque trame de chaque signal composant le flux audio-vidéo original.

Dans l'exemple illustré sur la FIGURE 1, la base de données 110 renferme toutes les informations concernant les signaux vidéo, audio et textuel découpés en trames et marqués. Plus particulièrement, la base de données peut contenir un compteur du signal vidéo qui permet d'identifier le synchronisme des autres signaux supportés (audio et textuel) et l'ensemble des informations décrivant l'ensemble des trames du flux audio-vidéo marqué, à savoir :

- la liste et la position des différentes images prédéfinies composant la structure bi-dimensionnelle 200 de la trame vidéo analysée,

- les éléments audio du signal original ainsi que le compteur des trames audio,

- les éléments de sous-titres du signal original ainsi que le compteur des trames de sous-titres. La FIGURE 2 illustre un exemple particulier d'identificateur de synchronisme vidéo comprenant une structure bi-dimensionnelle 200 et pour une trame vidéo donnée. Elle est composée de huit images prédéfinies 202 à 209 et différentes, positionnées autour d'un code d'identification 201 qui permet d'indexer la base de données 110. Dans l'exemple illustré, le code d'identification est un code QR, bien connu de l'homme du métier. La présente invention ne se limite pas à ce type de code mais englobe tous les moyens aptes à indexer une base de données. A minima, il peut s'agir d'un couple d'entiers qui décrivent un numéro de ligne et de colonne de ladite base de données. La cellule ainsi pointée dans la base de données 110 renferme les informations correspondantes à la trame vidéo, audio et/ou textuel actuellement diffusée. La FIGURE 3 illustre de manière schématique un flux audio-vidéo marqué 106 selon l'invention. Dans l'exemple illustré, le flux audio-vidéo marqué 106 se décompose en trois signaux distincts qui ont été respectivement marqués et recombinés par la suite :

- un signal vidéo 104 composé d'une succession d'images 341 et 344 à une fréquence. De manière traditionnelle, la fréquence de diffusion des images est de 25 images par secondes, mais cette fréquence peut être supérieure dans le cas de tournages en haute résolution, typiquement 50 à 60 images par secondes. Pour chaque trame 341 et 344, un identifiant de synchronisme vidéo 342 et 345 est associé, comprenant dans l'exemple illustré une mosaïque d'images prédéfinies 343 et 346.

- un signal audio 105 composé des trames audio 351 et 354 qui doivent être diffusés en même temps que les trames vidéos respectifs 341 et 344. Pour contrôler la diffusion du flux audio 105, chaque trame est associé à un identifiant de synchronisme. Ainsi, la trame audio 351 est associé à l'identifiant 352 et la trame audio 354 est associé à l'identifiant 355. Chaque identifiant comprend par ailleurs un compteur 353 et 356 qui permet de déterminer l'instant de diffusion de ladite trame. - un signal textuel 103 pour la diffusion des sous titres qui correspondent aux trames vidéo et audio. Pour contrôler la diffusion du flux textuel 103, chaque trame est associé à un identifiant de synchronisme. Ainsi, la trame textuelle 361 est associée à l'identifiant 362 et la trame textuelle 364 est associée à l'identifiant 365. Chaque identifiant comprend par ailleurs un compteur 363 et

366 qui permet de déterminer l'instant de diffusion de ladite trame de sous-titre. La FIGURE 4 illustre un diagramme de principe pour l'analyse des différents artefacts d'un flux audio-vidéo marqué selon l'invention ainsi que la détection des erreurs de synchronisation. Il comprend les étapes suivantes :

- lecture 401 d'un flux audio-vidéo marqué 106 selon l'invention par tout moyen apte à diffuser un tel contenu, comme par exemple une télévision, une télévision numérique, un décodeur numérique...

- acquisition des identifiants de synchronisme 410 pour chacun des signaux extraits, à savoir au moins un signal vidéo 411 découpé en trames et marquées , au moins un signal audio 412 découpé en trames et marquées, et/ou au moins un signal textuel 413 découpé en trames et marquées. La présente invention ne se limite pas à un type particulier de moyens pour l'acquisition des différents identifiants. A titre d'exemple, l'acquisition de l'identifiant de synchronisme vidéo peut être réalisée à l'aide d'une caméra ou par capture d'écran ; l'acquisition de l'identifiant de synchronisme audio peut être réalisé à l'aide d'un microphone ou d'une carte d'acquisition ; et l'acquisition de l'identifiant de synchronisme textuel peut être réalisé à l'aide d'un logiciel de reconnaissance optique des caractères... - décodage des identifiants de synchronisme 420 pour chacun des signaux composant le flux audio-vidéo marqué 106. A titre d'exemple non limitatif, il peut s'agir pour le signal vidéo de décoder le code QR ; pour le signal audio, il peut s'agir de démoduler le signal porteur de l'identifiant ; et pour le signal textuel, il peut s'agir d'extraire au moins un code alphanumérique.

- l'identifiant vidéo extrait permet d'indexer la base de données 110 qui contient toutes les informations relatives au flux audio-vidéo tel qu'il devrait être idéalement diffusé. Les informations contenues, pour chacune des trames, permet ainsi de :

- détecter les artefacts 430 pour chacun des signaux 431-433 en comparant avec lesdites informations stockées sur la base de données 110 et décrites précédemment, - éventuellement, corriger ces artefacts 440 par des moyens connus,

- et éventuellement, corriger les défauts de synchronisation 440 en analysant les compteurs contenus dans chaque identifiant de synchronisme et à l'aide d'une horloge de référence, interne aux moyens d'analyse ou externe.

Le flux audio-vidéo marqué 450 est ainsi corrigé et/ou lu de manière optimale.

Les moyens d'analyse des flux audio-vidéo marqués selon l'invention peuvent consister en des moyens internes au moyen de diffusion desdits flux audio-vidéo, tels que le processeur contenu dans une télévision numérique ou un décodeur numérique par exemple, ou encore à l'aide de moyens externalisés tels qu'un ordinateur.

L'analyse du flux obtenu après avoir traversé la chaîne de traitement consiste dans un premier temps à identifier la date d'occurrence de chaque changement d'identifiant du signal vidéo à l'aide du code QR par exemple et de la base de données et, dans un second temps, à détecter l'occurrence des compteurs des autres signaux : pour le signal audio, il s'agit par exemple de détecter le début de chaque nouvelle trame audio. La comparaison des dates pour des valeurs de compteurs identiques donne alors la valeur de décalage entre les signaux vidéo et audio et/ou textuel tels qu'ils sont restitués par le moyen de diffusion et pour chacune des trames analysées.

La présente invention permet ainsi de détecter des défauts de synchronisme supérieurs au seuil d'acceptabilité (situé entre -185 ms pour un retard du signal audio sur le signal vidéo, et +90 ms pour une avance du signal audio sur le signal vidéo) avec une précision de +/- 10 ms dans le cas d'une analyse réalisée à 50 images par secondes.

Le tableau ci-dessous illustre un exemple d'analyse temporelle réalisée par la présente invention sur un flux audio-vidéo marqué, comprenant un signal vidéo et un signal audio (et ne comprenant pas de signal textuel) : Erreur de

Compteur de Horloge Compteur de Horloge

Compteur synchronisation trame vidéo vidéo trame audio audio

mesurée (ms)

2356 1 178 000 2356 1 178 125 2356 -115

2357 1 178 500 2357 1 178 430 2357 70

2358 1 179 000 2358 1 179 000 2358 0

5203 2 601 500 5203 2 601 500 5203 0

N/A N/A 5204 2 602 000 5204 N/A

5205 2 602 500 5205 2 602 400 5205 90

Le flux audio-vidéo est diffusé à 50 images par secondes, et l'analyse est réalisée toutes les 500 ms, ce qui signifie que toutes les 25 images d'une séquence vidéo, un identifiant de synchronisme est inséré.

Le compteur de la trame vidéo est extrait lors du décodage de l'identifiant vidéo qui marque chacune des trames vidéo. Dans l'exemple illustré, le compteur n° 5204 n'a pas été extrait.

L'horloge vidéo correspond à la date de changement de l'identifiant vidéo et représente la référence temporelle pour les autres flux.

Le compteur de la trame audio est extrait par démodulation du signal contenu dans chacune des trames audio.

L'horloge audio correspond à la date de détection du début de la trame audio.

On constate ainsi que la trame audio correspondant au compteur 2356 est en retard de 115 ms par rapport à la trame vidéo correspondante, tandis que la trame audio n° 5205 est en avance de 90 ms par rapport à la trame vidéo correspondante. La trame audio n° 5203 est en phase avec la trame vidéo.

La connaissance du défaut de synchronisme entre les différents signaux qui composent le flux audio-vidéo marqué selon l'invention permet par la suite de mettre en œuvre des moyens de synchronisation afin de recaler les signaux secondaires par rapport au flux vidéo. Ces moyens de synchronisation peuvent être intégrés aux moyens d'analyse ou constituer des moyens à part entière. A titre d'exemples non limitatifs, ils peuvent consister en une télévision numérique par exemple, un décodeur numérique ou encore un ordinateur.

La FIGURE 5 illustre un exemple de transmission d'un compteur de trame audio par modulation d'amplitude, l'axe des abscisses 501 représentant le temps en millisecondes, l'axe des ordonnées 502 l'amplitude du signal codant le compteur de trame 504. La FIGURE 6 illustre le spectre équivalent 600 du signal audio généré sur quatre porteuses 603-606 et pour lesquelles l'amplitude 602 est représentée en fonction de la fréquence 601.

Pour chacune des trames audio générées par le procédé selon l'invention, le compteur ou l'identifiant permettant d'accéder à un tel compteur est codé sur une porteuse modulée en accord avec ce dernier. Préférentiellement, la transmission du compteur ou de son identifiant au sein du signal audio ne doit pas excéder 1/Ft secondes, où Ft est la fréquence du signal vidéo. Ainsi, à titre d'exemple, pour un signal vidéo à 50 images par secondes, la transmission du code correspondant au compteur audio ou à son identifiant ne doit pas dépasser 20 ms. Par ailleurs, chaque début de transmission de la valeur du compteur ou de son identifiant débute par une valeur spécifique indiquant un « début de trame ». Dans l'exemple illustré sur les FIGURES 5 et 6, le début de trame est matérialisé par un maximum dans l'amplitude du signal.

Bien sûr, l'invention n'est pas limitée aux exemples qui viennent d'être décrits et de nombreux aménagements peuvent être apportés à ces exemples sans sortir du cadre de l'invention. Notamment, les différentes caractéristiques, formes, variantes et modes de réalisation de l'invention peuvent être associées les unes avec les autres selon diverses combinaisons dans la mesure où elles ne sont pas incompatibles ou exclusives les unes des autres. En particulier, toutes les variantes et modes de réalisation décrits précédemment sont combinables entre eux.