Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
CONTEXTUAL ENRICHMENT BY AUDIO RECOGNITION
Document Type and Number:
WIPO Patent Application WO/2017/064400
Kind Code:
A1
Abstract:
The invention relates to a method for enriching audiovisual content, a service platform comprising a local database storing associations between audiovisual content signatures and audiovisual content sources and associations between audiovisual content sources and contextual content: upon receiving a set of current audiovisual content signatures, updating (207) the local database by modifying the stored signatures in accordance with the current signatures received; upon receiving a set of at least one current contextual content item, updating (214) the local database by modifying the contextual contents in accordance with the set of at least one current contextual content item; upon receiving a request from a first user terminal comprising a candidate signature, identifying (221) a source of audiovisual content by comparing the candidate signature with the signatures stored in the local database; extracting (222) from the local database contextual content associated with the identified audiovisual content source; and transmitting (223) the extracted contextual content to the first user terminal.

Inventors:
VINCENT DAVID (FR)
HAIDAR MOUHTAR (FR)
FAGUE DIMITRI (FR)
Application Number:
PCT/FR2016/052599
Publication Date:
April 20, 2017
Filing Date:
October 07, 2016
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
TDF (FR)
International Classes:
H04N21/439; H04N21/278; H04N21/41; H04N21/462; H04N21/858
Domestic Patent References:
WO2014067968A12014-05-08
WO2010025418A12010-03-04
Foreign References:
FR3016720A12015-07-24
EP2603012A12013-06-12
US20150039646A12015-02-05
US20050004941A12005-01-06
US20090307201A12009-12-10
EP2085894A12009-08-05
Attorney, Agent or Firm:
CABINET PLASSERAUD (FR)
Download PDF:
Claims:
REVENDICATIONS

1 . Procédé d'enrichissement d'un contenu audiovisuel, ledit procédé comprenant les étapes suivantes mises en œuvre dans une première plateforme de service (13.1 ), ladite plateforme de service comprenant une base de données locale (304) stockant des associations entre des signatures de contenu audiovisuel et des sources de contenu audiovisuel d'une part et des associations entre des sources de contenu audiovisuel et des contenus contextuels d'autre part :

sur réception d'un ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel, mise à jour (207) de la base de données locale par modification des signatures stockées en fonction des signatures courantes reçues ;

sur réception d'un ensemble d'au moins un contenu contextuel courant associé à un identifiant de source de contenu audiovisuel, mise à jour (214) de la base de données locale par modification des contenus contextuels en fonction de l'ensemble d'au moins un contenu contextuel courant;

sur réception d'une requête d'utilisateur depuis un premier terminal utilisateur (10), ladite requête comprenant une signature candidate, identification (221 ) d'une source de contenu audiovisuel par comparaison entre la signature candidate et les signatures stockées dans la base de données locale ;

extraction (222) de la base de données locale d'un contenu contextuel associé à la source de contenu audiovisuel identifiée ;

transmission (223) au premier terminal utilisateur du contenu contextuel extrait.

2. Procédé selon la revendication 1 , dans lequel l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources audiovisuelles est reçu depuis un gestionnaire de diffusion (14), le procédé comprenant en outre les étapes suivantes mises en œuvre par ledit gestionnaire de diffusion :

- réception (204) depuis un générateur de signature (15) de l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel ; - diffusion (206) à un ensemble de plateformes de service (13.1 -13. n), comprenant au moins ladite première plateforme de service (13.1 ), de l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel .

3. Procédé selon la revendication 2, dans lequel les signatures courantes ont une durée D1 , dans lequel le générateur de signature (15) stocke l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel, ledit procédé comprenant en outre les étapes suivantes mises en œuvre par le générateur de signature :

- réception (200) d'extraits audio courants de durée D2 ;

- association (200) de chacun des extraits audio courants avec un identifiant de source de contenu audiovisuel ;

- génération (201 ), pour chaque extrait audio courant, d'un extrait de signature de durée D2 ;

- pour chaque signature courante donnée, mise à jour (202) de ladite signature courante donnée en effaçant une période finale de durée D2 de la signature courante donnée et en ajoutant au début de la signature courant donnée l'extrait de signature de durée D2 correspondant à l'extrait audio courant associé au même identifiant de source de contenu audiovisuel que ladite signature courante donnée.

4. Procédé selon la revendication 3, dans lequel les extraits audio courants de durée D2 sont reçus en continu à l'issue de chaque période de durée D2.

5. Procédé selon l'une des revendications précédentes, dans lequel l'ensemble de contenus contextuels courants respectivement associés à des identifiants de sources de contenu audiovisuel est reçu depuis un gestionnaire de notifications (16), le procédé comprenant en outre les étapes suivantes mises en œuvre par le gestionnaire de notifications :

- réception (210) depuis un module de détection (17) de l'ensemble d'au moins un contenu contextuel courant associé à un identifiant de source de contenu audiovisuel donnée; - diffusion (213) à un ensemble de plateformes de service (13.1 -13. n), comprenant au moins ladite première plateforme de service (13.1 ), d'un ensemble comprenant au moins le contenu contextuel courant associé à l'identifiant de la source de contenu audiovisuel donnée.

6. Procédé selon la revendication 5, dans lequel le module de détection (17) stocke un ensemble de contenus contextuels, comprenant en outre les étapes suivantes mises en œuvre par le module de détection :

- acquisition (208) d'un extrait audiovisuel correspondant à au moins la source de contenu audiovisuel donnée ;

- extraction (209) d'un contenu contextuel courant parmi l'ensemble de contenus contextuels stockés, en fonction de l'extrait audio correspondant à la source de contenu audiovisuel donnée ;

- transmission (210) d'un ensemble comprenant au moins le contenu contextuel courant en association avec l'identifiant de la source de contenu audiovisuel donné, au gestionnaire de notifications.

7. Procédé selon la revendication 5, dans lequel le module de détection (17) stocke un semble de contenus contextuels en association avec des signatures de référence respectives, comprenant en outre les étapes suivantes mises en œuvre par le module de détection :

- réception (204) de l'ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel ;

- comparaison de la signature courante associée à l'identifiant de la source de contenu audiovisuel donné, avec les signatures de référence, afin d'extraire (209) un contenu contextuel courant ;

- transmission (210) d'un ensemble comprenant au moins le contenu contextuel courant en association avec l'identifiant de la source de contenu audiovisuel donné, au gestionnaire de notifications.

8. Procédé selon l'une des revendications précédentes, dans lequel les identifiants des sources de contenu audiovisuel sont ordonnés selon un critère de popularité et dans lequel l'identification d'une source de contenu audiovisuel comprend des comparaisons successives entre la signature candidate et les signatures stockées selon l'ordre des identifiants des sources de contenu audiovisuel qui leur sont respectivement associées.

9. Procédé selon l'une des revendications précédentes, dans lequel le premier terminal utilisateur (10) met en œuvre les étapes suivantes :

acquisition (216) d'un contenu audio issu d'un deuxième terminal utilisateur ;

- génération (217) de la signature candidate en fonction du contenu audio acquis ;

génération (218) d'une requête comprenant ladite signature candidate. 10. Procédé selon la revendication 9, dans lequel le contenu contextuel extrait est transmis au premier terminal utilisateur (10) en association avec l'identifiant de la source de contenu audiovisuel identifiée, dans lequel la requête comprend en outre un identifiant de la dernière source de contenu audiovisuel identifiée et dans lequel l'identification de la source de contenu audiovisuel comprend des comparaisons successives entre la signature candidate et les signatures stockées en commençant par la signature stockée en association avec l'identifiant de la dernière source de contenu audiovisuel identifiée.

1 1 . Procédé selon les revendications 8 et 10, dans lequel l'identification de la source de contenu audiovisuel comprend des comparaisons successives entre la signature candidate et les signatures stockées en commençant par la signature stockée en association avec l'identifiant de la dernière source de contenu audiovisuel identifiée puis selon l'ordre des sources de contenu audiovisuel qui leur sont respectivement associées

12. Procédé selon l'une des revendications précédentes, dans lequel la signature candidate a une durée D3 inférieure à une durée D1 des signatures stockées dans la base de données locale.

13. Programme d'ordinateur comportant des instructions pour la mise en œuvre du procédé selon l'une des revendications 1 à 12, lorsque ce programme est exécuté par un processeur.

14. Plateforme de service (13.1 ) pour l'enrichissement d'un contenu audiovisuel, comprenant une base de données locale (304) stockant des associations entre des signatures de contenu audiovisuel et des sources de contenu audiovisuel d'une part et des associations entre des sources de contenu audiovisuel, ladite plateforme de service comprenant en outre une unité de réception (301 ) et un processeur (302) configuré pour la mise en œuvre des étapes suivantes :

sur réception par l'unité de réception d'un ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel, mise à jour de la base de données locale par modification des signatures stockées en fonction des signatures courantes reçues ;

sur réception par l'unité de réception d'un ensemble d'au moins un contenu contextuel courant associé à un identifiant de source de contenu audiovisuel, mise à jour de la base de données locale par modification des contenus contextuels en fonction de l'ensemble d'au moins un contenu contextuel courant;

sur réception par l'unité de réception d'une requête d'utilisateur depuis un premier terminal utilisateur (10), ladite requête comprenant une signature candidate, identification d'une source de contenu audiovisuel par comparaison entre la signature candidate et les signatures stockées dans la base de données locale ;

extraction de la base de données locale d'un contenu contextuel associé à la source de contenu audiovisuel identifiée ;

transmission au premier terminal utilisateur du contenu contextuel extrait.

15. Système comprenant au moins une plateforme de service (13.1 ) selon la revendication 13, un gestionnaire de diffusion (14) configuré pour transmettre à la plateforme de service l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel, et un gestionnaire de notifications (16) configuré pour transmettre à la plateforme de service ledit au moins un contenu contextuel courant associé à un identifiant de source de contenu audiovisuel.

Description:
Enrichissement contextuel par reconnaissance audio

La présente invention concerne le domaine de l'enrichissement contextuel de contenus audiovisuels, et en particulier, mais non exclusivement, de contenus diffusés par des chaînes de télévision.

Elle concerne plus précisément l'enrichissement contextuel mettant en œuvre une reconnaissance auditive des contenus audiovisuels affichés sur un dispositif de rendu d'utilisateur (un téléviseur par exemple), par un terminal utilisateur (tel qu'un téléphone intelligent ou « Smartphone » par exemple) sans requérir de connexion entre le dispositif et le terminal.

Des techniques de reconnaissance auditive sont connues dans le but de reconnaître des extraits de contenus audio tels que des pistes musicales. L'enrichissement consiste alors, après reconnaissance de l'extrait par utilisation d'une base de données stockant l'ensemble des pistes musicales (ou des signatures de celles-ci) reconnaissables par le service, à retourner à l'utilisateur le nom de l'artiste, de la piste musicale, et éventuellement de l'album dont elle est extraite.

Toutefois, des telles techniques sont uniquement utilisables pour un ensemble de contenus statiques, sans prévoir de mise à jour dynamique de la base de données. Ces techniques ne sont ainsi aucunement transposables à l'enrichissement de contenus diffusés en direct tel que des programmes de télévision.

La présente invention vient améliorer la situation.

Un premier aspect de l'invention concerne un procédé d'enrichissement d'un contenu audiovisuel, le procédé comprenant les étapes suivantes mises en œuvre dans une première plateforme de service, la plateforme de service comprenant une base de données locale stockant des associations entre des signatures de contenu audiovisuel et des sources de contenu audiovisuel d'une part et des associations entre des sources de contenu audiovisuel et des contenus contextuels d'autre part :

sur réception d'un ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel, mise à jour de la base de données locale par modification des signatures stockées en fonction des signatures courantes reçues ;

sur réception d'un ensemble d'au moins un contenu contextuel courant associé à un identifiant de source de contenu audiovisuel, mise à jour de la base de données locale par modification des contenus contextuels en fonction de l'ensemble d'au moins un contenu contextuel courant;

sur réception d'une requête d'utilisateur depuis un premier terminal utilisateur, la requête comprenant une signature candidate, identifier une source de contenu audiovisuel par comparaison entre la signature candidate et les signatures stockées dans la base de données locale ;

extraction de la base de données locale d'un contenu contextuel associé à la source de contenu audiovisuel identifiée ;

transmission au premier terminal utilisateur du contenu contextuel extrait.

Ainsi, la présente invention prévoit une mise à jour dynamique à la fois de contenus contextuels enrichissant les contenus audiovisuels diffusés et à la fois des signatures permettant la reconnaissance d'un contenu audiovisuel en cours de diffusion. Ceci permet d'appliquer l'enrichissement à n'importe quel contenu diffusé, même lorsqu'il n'est pas connu à l'avance (comme ce peut être le cas lors de la diffusion d'émissions de télévision). Aucune restriction n'est attachée au contenu audiovisuel considéré qui peut être un film, une émission de télévision, une émission de radio, un vidéoclip, une publicité, etc. Aucune restriction n'est non plus attachée à la source de contenu audiovisuel qui peut être une chaîne de télévision, une chaîne sur internet, une station radio, etc.

Le contenu contextuel est toute donnée informative relative au contenu audiovisuel, et peut couvrir toute donnée textuelle, audio, vidéo, photo, etc.

Dans un mode de réalisation, l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources audiovisuelles peut être reçu depuis un gestionnaire de diffusion et le procédé peut comprendre en outre les étapes suivantes mises en œuvre par le gestionnaire de diffusion :

- réception depuis un générateur de signature de l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel ; - diffusion à un ensemble de plateformes de service, comprenant au moins la première plateforme de service, de l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel.

La génération et la diffusion des signatures courantes sont ainsi centralisées ce qui permet de réduire la complexité et les ressources logicielles des plateformes de service. La réactivité des plateformes de service pour comparer les signatures et extraire un contenu contextuel est ainsi améliorée.

En complément, les signatures courantes peuvent avoir une durée D1 , le générateur de signature peut stocker l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel, et le procédé peut comprendre en outre les étapes suivantes mises en œuvre par le générateur de signature :

- réception d'extraits audio courants de durée D2 ;

- association de chacun des extraits audio courants avec un identifiant de source de contenu audiovisuel ;

- génération, pour chaque extrait audio courant, d'un extrait de signature de durée D2 ;

- pour chaque signature courante donnée, mise à jour de la signature courante donnée en effaçant une période finale de durée D2 de la signature courante donnée et en ajoutant au début de la signature courante donnée l'extrait de signature de durée D2 correspondant à l'extrait audio courant associé au même identifiant de source de contenu audiovisuel que la signature courante donnée.

Une telle génération dynamique par fenêtre glissante de signatures permet d'assurer d'avoir en permanence une signature courante mise à jour relativement au contenu audiovisuel qui est en cours de diffusion sur une source de contenu audiovisuel donnée. En outre, le générateur de signature étant dédié à la génération de signatures, et non pas à la génération des contenus contextuels associés, la complexité des calculs effectués est réduite et la réactivité de la génération des signatures est améliorée.

En complément, les extraits audio courants de durée D2 peuvent être reçus en continu à l'issue de chaque période de durée D2. La génération de signature est effectuée en continu et le service d'enrichissement est ainsi accessible à n'importe quel moment pour l'utilisateur.

Selon un mode de réalisation de l'invention, l'ensemble de contenus contextuels courants respectivement associés à des identifiants de sources de contenu audiovisuel peut être reçu depuis un gestionnaire de notifications, le procédé comprenant en outre les étapes suivantes mises en œuvre par le gestionnaire de notifications :

- réception depuis un module de détection de l'ensemble d'au moins un contenu contextuel courant associé à un identifiant de source de contenu audiovisuel donnée;

- diffusion à un ensemble de plateformes de service, comprenant au moins ladite première plateforme de service, d'un ensemble comprenant au moins le contenu contextuel courant associé à l'identifiant de la source de contenu audiovisuel donnée.

Ainsi, la sélection et la diffusion des contenus contextuels sont centralisées ce qui permet de réduire la complexité et les ressources logicielles des plateformes de service. La réactivité des plateformes de service pour comparer les signatures et extraire un contenu contextuel est ainsi améliorée.

En complément, le module de détection peut stocker un ensemble de contenus contextuels, et le procédé peut comprendre en outre les étapes suivantes mises en œuvre par le module de détection :

- acquisition d'un extrait audiovisuel correspondant à au moins la source de contenu audiovisuel donnée ;

- extraction d'un contenu contextuel courant parmi l'ensemble de contenus contextuels stockés, en fonction de l'extrait audio correspondant à la source de contenu audiovisuel donnée ;

- transmission d'un ensemble comprenant au moins le contenu contextuel courant en association avec l'identifiant de la source de contenu audiovisuel donné, au gestionnaire de notifications.

L'extrait audiovisuel peut être un extrait audio acquis par microphone, un extrait vidéo sans son, ou un extrait vidéo et audio. Ainsi, ce mode de réalisation assure une sélection pertinente de contenus contextuels. En outre, le module de détection étant dédié à l'extraction de contenus contextuels, et non pas à la génération des signatures, la complexité des calculs effectués est réduite et la réactivité de l'extraction de contenus contextuels est améliorée.

En variante, le module de détection peut stocker un ensemble de contenus contextuels en association avec des signatures de référence respectives, comprenant en outre les étapes suivantes mises en œuvre par le module de détection :

- réception de l'ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel ;

- comparaison de la signature courante associée à l'identifiant de la source de contenu audiovisuel donné, avec les signatures de référence, afin d'extraire un contenu contextuel courant ;

- transmission d'un ensemble comprenant au moins le contenu contextuel courant en association avec l'identifiant de la source de contenu audiovisuel donné, au gestionnaire de notifications.

Une telle variante permet de mutualiser les signatures courantes générées par le générateur de signature, entre le module de détection et le gestionnaire de diffusion.

Dans un mode de réalisation, les identifiants des sources de contenu audiovisuel peuvent être ordonnés selon un critère de popularité et l'identification d'une source de contenu audiovisuel peut comprendre des comparaisons successives entre la signature candidate et les signatures stockées selon l'ordre des identifiants des sources de contenu audiovisuel qui leur sont respectivement associées.

Un tel ordre permet de réduire, en moyenne, le nombre de comparaisons à effectuer avant de détecter une correspondance entre la signature candidate et une signature stockée, ce qui réduit la complexité des calculs et améliore la réactivité associée à l'enrichissement de contenus audiovisuels diffusés.

Dans un mode de réalisation, le premier terminal utilisateur peut mettre en œuvre les étapes suivantes :

acquisition d'un contenu audio issu d'un deuxième terminal utilisateur ;

génération de la signature candidate en fonction du contenu audio acquis ;

génération d'une requête comprenant la signature candidate.

En complément, le contenu contextuel extrait peut être transmis au premier terminal utilisateur en association avec l'identifiant de la source de contenu audiovisuel identifiée, la requête peut comprendre en outre un identifiant de la dernière source de contenu audiovisuel identifiée et l'identification de la source de contenu audiovisuel peut comprendre des comparaisons successives entre la signature candidate et les signatures stockées en commençant par la signature stockée en association avec l'identifiant de la dernière source de contenu audiovisuel identifiée.

La prise en compte de la dernière source de contenu audiovisuel permet également de réduire, en moyenne, le nombre de comparaisons à effectuer dans l'identification de la source de contenu audiovisuel. En effet, il est probable que l'utilisateur n'ait pas changé la source de contenu audiovisuel entre deux requêtes successives.

En complément, l'identification de la source de contenu audiovisuel peut comprendre des comparaisons successives entre la signature candidate et les signatures stockées en commençant par la signature stockée en association avec l'identifiant de la dernière source de contenu audiovisuel identifiée puis selon l'ordre des sources de contenu audiovisuel qui leur sont respectivement associées

La combinaison de ces deux critères permet également la réduction du nombre moyen de comparaisons à effectuer dans l'identification de la source de contenu audiovisuel.

Dans un mode de réalisation de l'invention, la signature candidate peut avoir une durée inférieure à une durée des signatures stockées dans la base de données locale.

Comme expliqué dans la description qui va suivre, ce mode de réalisation permet d'assurer que la signature candidate est comprise dans l'une des signatures stockées, et ce quel que soit la technologie de transport du contenu audiovisuel.

Un deuxième aspect de l'invention concerne un programme d'ordinateur comportant des instructions pour la mise en œuvre du procédé selon le premier aspect de l'invention, lorsque ce programme est exécuté par un processeur.

Un troisième aspect de l'invention concerne une plateforme de service pour l'enrichissement d'un contenu audiovisuel, comprenant une base de données locale stockant des associations entre des signatures de contenu audiovisuel et des sources de contenu audiovisuel d'une part et des associations entre des sources de contenu audiovisuel, la plateforme de service comprenant en outre une unité de réception et un processeur configuré pour la mise en œuvre des étapes suivantes :

sur réception par l'unité de réception d'un ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel, mise à jour de la base de données locale par modification des signatures stockées en fonction des signatures courantes reçues ;

sur réception par l'unité de réception d'un ensemble d'au moins un contenu contextuel courant associé à un identifiant de source de contenu audiovisuel, mise à jour de la base de données locale par modification des contenus contextuels en fonction de l'ensemble d'au moins un contenu contextuel courant;

sur réception par l'unité de réception d'une requête d'utilisateur depuis un premier terminal utilisateur, ladite requête comprenant une signature candidate, identifier une source de contenu audiovisuel par comparaison entre la signature candidate et les signatures stockées dans la base de données locale ;

extraction de la base de données locale d'un contenu contextuel associé à la source de contenu audiovisuel identifiée ;

transmission au premier terminal utilisateur du contenu contextuel extrait.

Un quatrième aspect de l'invention concerne un système comprenant une plateforme de service selon le troisième aspect de l'invention, un gestionnaire de diffusion configuré pour transmettre à la plateforme de service l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel, et un gestionnaire de notifications configuré pour transmettre à la plateforme de service ledit au moins un contenu contextuel courant associé à un identifiant de source de contenu audiovisuel.

D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels:

• la figure 1 présente un système selon un mode de réalisation de l'invention;

• la figure 2 est un diagramme représentant les étapes d'un procédé selon un mode de réalisation de l'invention ;

• la figure 3 présente une plateforme de service selon un mode de réalisation de l'invention ;

• la figure 4 présente un gestionnaire de diffusion selon un mode de réalisation de l'invention ;

· la figure 5 illustre un gestionnaire de notifications selon un mode de réalisation de l'invention ;

• la figure 6 présente un premier terminal utilisateur selon un mode de réalisation de l'invention ;

• la figure 7 illustre un générateur de signature selon un mode de réalisation de l'invention ;

• la figure 8 présente un module de détection selon un mode de réalisation de l'invention ;

• la figure 9 illustre la génération d'une signature courante et d'une signature candidate en fonction du temps, selon certains modes de réalisation de l'invention.

La figure 1 présente un système selon un mode de réalisation de l'invention.

Le système comprend un premier terminal utilisateur 10 et un deuxième terminal utilisateur 1 1 .

Le premier terminal utilisateur 10 peut être un téléphone portable de type Smartphone, un ordinateur portable, un ordinateur de bureau, une tablette tactile, ou plus généralement tout terminal utilisateur permettant l'accès à un réseau, tel qu'un réseau de type internet par exemple. A cet effet, le premier terminal utilisateur 10 peut accéder à un point d'accès 12 via une interface filaire (câble Ethernet par exemple) ou sans fil (Wi-fi, Bluetooth, etc). En outre, le premier terminal utilisateur 10 est apte à acquérir des données audio (un contenu audio) issues du deuxième terminal utilisateur 1 1 . A cet effet, le premier terminal utilisateur 10 peut être équipé d'au moins un microphone. Ces données audio peuvent être acquises en continu, ou sur une période donnée, sur activation de l'utilisateur par exemple, via l'utilisation d'une interface utilisateur (écran tactile, clavier, souris, etc).

Le deuxième terminal utilisateur 1 1 peut être un terminal apte à recevoir des contenus audiovisuels depuis une ou plusieurs sources de contenu audiovisuelle (chaînes de télévision, stations radio, chaînes Internet de type Youtube par exemple) et à reproduire au moins la composante audio des contenus audiovisuels. A cet effet, le deuxième terminal utilisateur 1 1 peut être un téléviseur ou encore un ordinateur portable ou de bureau. Dans ce qui suit, l'exemple d'un téléviseur recevant des chaînes de télévision est considéré à titre illustratif.

Comme détaillé dans ce qui suit, le premier terminal utilisateur est apte à acquérir des contenus audio reproduits par le téléviseur 1 1 (à partir du contenu audiovisuel reçu sur la chaîne de télévision courante) et à générer une signature candidate sur la base du contenu audio. On appelle « signature » tout ensemble de caractéristiques déterminé à partir d'un contenu audio. La détermination de telles signatures est bien connue et n'est pas décrit plus en détails dans ce qui suit.

La signature candidate peut avoir une durée D3, égale par exemple à 10 secondes. Le premier terminal utilisateur 10 peut par exemple générer une signature de 10 secondes toutes les 10 secondes, et transmettant à chaque fois la signature générée à une première plateforme de service 13.1 via le point d'accès 12, comme détaillé dans ce qui suit. Des variantes de génération de signatures candidates sont décrites dans ce qui suit.

Une pluralité de plateformes de service 13.1 , 13.2 ... 13.n, comprenant la première plateforme de service 13.1 est comprise dans le système selon l'invention. Chacune des plateformes de service peut par exemple couvrir une zone géographique qui lui est propre, ou peut être dédiée à un groupe d'utilisateurs qui lui est propre.

Chaque plateforme de service 13.1 -13. n est apte à accéder, via un réseau de type internet par exemple, à un gestionnaire de diffusion 14 relié à un générateur de signature 15 et à un gestionnaire de notification 16 relié à un module de détection 17.

Chaque plateforme de service 13.1 -13. n peut comprendre une base de données locale stockant des associations entre des signatures de contenu audiovisuel et des sources de contenu audiovisuel d'une part et des associations entre des sources de contenu audiovisuel et des contenus contextuels d'autre part. Ces associations seront mieux comprises au vu de la description ci-après.

Le générateur de signature 15 est apte à générer des signatures audio en association avec des sources de contenu audiovisuel en parallèle. De manière alternative un générateur de signature peut être utilisé pour chaque chaîne de télévision. A cet effet, chaque chaîne de télévision (plus généralement chaque source de contenu audiovisuel) est identifiée par un identifiant.

Le générateur de signature 15 stocke ainsi une signature courante d'une durée D1 , D1 étant par exemple égal à 30 secondes, en association avec chaque identifiant de chaîne de télévision.

La signature courante de durée D1 associée à l'identifiant d'une chaîne de télévision donnée est ainsi représentative de la dernière période de durée D1 du flux audio diffusé sur la chaîne de télévision donnée.

Afin de mettre à jour en continu les signatures courantes stockées, le générateur de signature 15 peut recevoir en parallèle les flux audio issus de l'ensemble des chaînes de télévision, et extraire en continu un extrait audio courant (la dernière période de durée D2 du flux audio) afin de générer en continu (toutes les périodes D2) des extraits de signature de durée D2, à partir de l'extrait audio courant de durée D2 du flux audio, D2 pouvant être égal à une seconde par exemple. Chaque extrait audio courant (et l'extrait de signature correspondant) est associé à l'identifiant de chaîne de télévision dont il est issu. Ensuite, pour chaque signature courante donnée, la signature courante donnée est mise à jour en effaçant une période finale de durée D2 de la signature courante donnée et en ajoutant, au début de la signature courante donnée, l'extrait de signature généré correspondant à l'extrait audio courant associé au même identifiant de chaîne de télévision que la signature courante donnée.

Ainsi, les signatures courantes sont mises à jour par fenêtre glissante, ce qui permet de maintenir avec une granularité élevée (1 seconde par exemple) des signatures représentatives de la dernière période de durée D1 (30 seconde par exemple) diffusée sur chaque chaîne de télévision.

L'ensemble des signatures courantes ainsi mises à jour est ensuite transmis, de préférence à l'issue de chaque période de durée D2 (toutes les secondes par exemple) au gestionnaire de diffusion 14. Le gestionnaire de diffusion 14, de préférence à l'issue de chaque période de durée D2, peut ainsi diffuser à l'ensemble des plateformes de service 13.1 -13. n l'ensemble de signatures courantes, afin qu'elles stockent l'ensemble de signatures courantes. Aucune restriction n'est attachée à la diffusion de l'ensemble de signatures courantes (de type « multicast » ou « broadcast » par exemple).

La mise à jour des signatures courantes sera mieux comprise en référence à la figure 9 décrite ci-après.

Le gestionnaire de diffusion 14 peut en outre être en charge de gérer le nombre de connexions d'utilisateurs autorisé par plateforme de service 13.1 - 13.n.

Sur réception de l'ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel, chaque plateforme de service 13.1 -13. n peut mettre à jour sa base de données locale par modification des signatures stockées en fonction des signatures courantes reçues. Par exemple, les signatures précédemment stockées sont toutes supprimées et remplacées par les signatures courantes reçues. En variante, la plateforme de service peut stocker les N dernières signatures associées à un identifiant de chaîne de télévision donné, N étant un entier supérieur à 1 . Ainsi, sur réception d'une signature courante depuis le générateur de signature 15, la plus ancienne signature parmi les N dernières signatures est supprimée et remplacée par la signature courante reçue.

En parallèle, le module de détection 17 stocke un ensemble de contenus contextuels. On entend par contenu contextuel toute information, toute donnée, de quelque format que ce soit (audio, texte, lien URL, vidéo, photo) ayant un lien avec un contenu principal (les contenus audiovisuels diffusés sur les chaînes de télévision). Par exemple, lorsque le contenu audiovisuel diffusé sur une chaîne de télévision est une publicité pour un produit donné, un contenu contextuel en lien avec la publicité peut être un lien URL permettant une redirection vers le site marchand permettant d'acheter le produit. En variante, lorsque le contenu audiovisuel diffusé sur une chaîne de télévision est un film, un contenu contextuel en lien avec le film peut être un fichier de sous-titres, un résumé du film, un lien URL vers un article critiquant le film, une vidéo résumant le film, une photo de l'affiche du film, etc.

Ainsi, le module de détection 17 est apte, sur acquisition d'un extrait audiovisuel d'un flux diffusé par une chaîne de télévision donnée, à identifier un contenu audiovisuel en cours de diffusion et à extraire un contenu contextuel en lien avec le contenu audiovisuel en cours de diffusion. L'extrait audiovisuel peut être un extrait audio, un extrait vidéo ou un extrait comprenant des données vidéo et des données audio. De préférence, l'extrait audiovisuel comprend au moins des données vidéo, ce qui facilite l'identification du contenu audiovisuel en cours de diffusion. Aucune restriction n'est cependant attachée à la manière d'identifier le contenu audiovisuel en cours de diffusion sur une chaîne. Des algorithmes d'identification vidéo et/ou audio sont bien connus et ne sont pas détaillés dans ce qui suit.

Aucune restriction n'est par ailleurs attachée à la manière dont un contenu contextuel courant est extrait à partir du contenu audiovisuel identifié. Par exemple, un contenu audiovisuel tel qu'un film peut être associé à des métadonnées relatives au réalisateur, à un acteur, ou autre, et tous les contenus contextuels étant associés à ces mêmes métadonnées (ou à certaines de ces métadonnées) peuvent être extraits, ou l'un d'entre eux peut être sélectionné.

Lorsqu'un contenu contextuel courant est extrait en fonction du contenu audiovisuel en cours de diffusion sur la chaîne de télévision donnée, le module de détection 17 transmet le contenu contextuel courant en association avec l'identifiant de la chaîne de télévision donnée, au gestionnaire de notifications 16. En complément, le module de détection 17 peut déterminer un contenu contextuel courant pour chacune des chaînes de télévision, et transmettre au gestionnaire de notifications 16 l'ensemble des contenus contextuels courants respectivement associés à des identifiants de chaînes de télévision.

Aucune restriction n'est attachée à la fréquence à laquelle les contenus contextuels courants sont extraits. Par exemple, sur détection d'un changement de programme sur une chaîne de télévision, il peut être choisi d'extraire un nouveau contenu contextuel courant à associer à l'identifiant de cette chaîne de télévision. En variante, des contenus contextuels courants pour l'ensemble des chaînes de télévision peuvent être extraits à une fréquence fixe (période D4, de 30 minutes par exemple).

En variante, le contenu contextuel courant à associer à un identifiant de chaîne de télévision peut être imposé par un serveur de la chaîne de télévision (ou par le serveur d'un annonceur) apte à communiquer avec le gestionnaire de notifications 16. Dans ce cas, le module de détection 17 n'est pas utilisé et le serveur de la chaîne de télévision peut ordonner au serveur de notifications 17 de diffuser aux plateformes de service 13.1 -13. n un contenu contextuel à associer à l'identifiant de la chaîne de télévision.

Sur réception du contenu contextuel courant (ou de l'ensemble de contenus contextuels courants) associé à l'identifiant de la chaîne de télévision donné, le gestionnaire de notifications 16 peut diffuser un ensemble comprenant au moins le contenu contextuel courant associé à l'identifiant de la chaîne de télévision donné aux plateformes de service 13.1 -13. n.

Ainsi, sur réception de l'ensemble d'au moins un contenu contextuel courant associé à l'identifiant de source de contenu audiovisuel donnée, chaque plateforme de service 13.1 -13. n met à jour sa base de données locale par modification des contenus contextuels en fonction de l'ensemble d'au moins un contenu contextuel courant reçu. Par exemple, le dernier contenu contextuel associé à l'identifiant de la chaîne de télévision donnée est supprimé et remplacé par le contenu contextuel courant. En variante, le contenu contextuel courant est également associé à une durée de validité, et, à l'expiration de la durée de validité, chaque plateforme de service 13.1 -13. n peut supprimer le contenu contextuel courant stocké en association avec l'identifiant de la chaîne de télévision donnée.

Chaque plateforme de service 13.1 -13. n dispose ainsi d'associations mises à jour dynamiquement entre des signatures de contenu audiovisuel et des sources de contenu audiovisuel d'une part et entre des sources de contenu audiovisuel et des contenus contextuels d'autre part.

Ces associations permettent de traiter des requêtes issues de terminaux utilisateurs en vue d'enrichir un contenu contextuel affiché (ou plus généralement rendu) sur un dispositif tel que le deuxième terminal utilisateur 1 1 .

A cet effet, le terminal utilisateur 10 peut transmettre à la première plateforme de service 13.1 une requête comprenant la signature candidate. L'envoi de la requête, et la détermination préalable de la signature candidate, peuvent être déclenchés par le lancement d'une application dédiée sur le premier terminal utilisateur 10.

Sur réception de la requête comprenant la signature candidate, la plateforme de service 13.1 compare la signature candidate (de durée D3) avec les signatures stockées dans sa base de données locale (de durée D1 supérieure à D3). Dans le cas où une correspondance est détectée entre la signature candidate et une signature stockée donnée, la source de contenu audiovisuel associée dans la base de données locale à la signature stockée donnée est identifiée. Le contenu contextuel associé à la source de contenu audiovisuel identifiée est ainsi extrait de la base de données locale par la plateforme de service 13.1 et transmis au premier terminal utilisateur 10.

L'utilisateur dispose ainsi sur son premier terminal utilisateur 10 d'un contenu contextuel enrichissant le contenu audiovisuel visualisé sur le deuxième terminal utilisateur 1 1 .

La durée D1 est de préférence supérieure à D3. En effet, en fonction de la technologie de transport du flux audiovisuel affiché sur le deuxième 5 terminal utilisateur 1 1 , le temps de transport varie (par exemple une diffusion terrestre et une diffusion par satellite implique des temps de transport différent). Afin d'assurer que, quelle que soit la technologie de transport utilisée pour le flux audiovisuel, la signature candidate puisse être comprise dans l'une des signatures stockées dans la base de données locale de la plateforme de service 13.1 , la durée D1 est plus grande que D3 (par exemple un multiple de D3).

En outre, en complément, la signature candidate générée par le premier terminal utilisateur 10 peut être mise à jour à l'issue de chaque période D2 (toutes les secondes par exemple, soit à la même fréquence que la mise à jour des signatures dans le générateur de signatures 15). A cet effet, le premier terminal utilisateur 10 peut acquérir toutes les secondes un extrait audio issu du deuxième terminal utilisateur 1 1 et déterminer un extrait de signature sur cette base. La dernière signature candidate générée est ensuite modifiée en supprimant la période finale de durée D2 de la signature (la seconde la plus ancienne) et en insérant l'extrait de signature au début de la signature candidate. Ceci permet d'assurer que la signature candidate de durée D3 (pouvant être 10 secondes comme détaillé ci-avant) est mise à jour dynamiquement à chaque période D2.

La signature candidate ainsi mise à jour peut être transmise à la plateforme de service toutes les m*D2 périodes, m étant un entier supérieur ou égal à 1 . En variante, l'envoi de chaque requête comprenant la signature candidate mise à jour est à l'initiative de l'utilisateur.

Les relations entre les différentes durées D1 à D3 seront mieux comprises en référence à la figure 9 décrite ci-après.

La figure 2 est un diagramme d'échange illustrant les étapes mises en œuvre par les entités du système.

A une étape 200, le générateur de signature 15 acquiert un extrait audio courant de durée D2 pour chaque identifiant de source de contenu audiovisuel. A une étape 201 , le générateur de signature génère pour chaque extrait audio courant un extrait de signature de durée D2.

A une étape 202, pour chaque signature courante donnée, le générateur de signature 15 peut mettre à jour la signature courante donnée en effaçant une période finale de durée D2 de la signature courante donnée et en ajoutant au début de la signature courante donnée l'extrait de signature de durée D2 correspondant à l'extrait audio courant associé au même identifiant de source de contenu audiovisuel que ladite signature courante donnée.

A une étape 203, le générateur de signature temporise pendant une période D2 avant d'exécuter à nouveau les étapes 200 à 202.

A une étape 204 consécutive à l'étape 202, le générateur de signature transmet au gestionnaire de diffusion 14 l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel. De manière optionnelle, l'ensemble des signatures courantes respectivement associées aux identifiants de sources de contenu audiovisuel peuvent être également transmises au module de détection 17.

A une étape optionnelle 205, le gestionnaire de diffusion 14 peut vérifier la disponibilité des plateformes de service 13.1 -13. n.

A une étape 206, le gestionnaire de diffusion 14 diffuse à l'ensemble des plateformes de services 13.1 -13. n (ou au moins à la première plateforme de service 13.1 ) l'ensemble de signatures courantes de contenus audiovisuels respectivement associés aux identifiants de sources de contenu audiovisuel.

A une étape 207, sur réception de l'ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel, la plateforme de service 13.1 met à jour sa base de données locale par modification des signatures stockées en fonction des signatures courantes reçues, comme détaillé ci-dessus.

A une étape 208, en parallèle des étapes précédentes (avant, après ou pendant l'exécution des étapes 200 à 207), le module de détection 17 acquiert un extrait audiovisuel correspondant à au moins la source de contenu audiovisuel donnée (voir description ci-avant, en référence à la figure 1 ).

A une étape 209, le module de détection 17 extrait un contenu contextuel courant parmi l'ensemble de contenus contextuels stockés dans le module de détection 17, en fonction de l'extrait audiovisuel correspondant à la source de contenu audiovisuel donné. 7

Selon un mode de réalisation, lorsque l'étape 204 détaillée ci-avant comprend la transmission de l'ensemble de signatures courantes au module de détection 17, l'étape 209 peut être mise en œuvre en considérant chaque signature courante comme une signature candidate pour une recherche dans une base de signatures de référence associées à des contenus contextuels. Dans ce cas, l'étape préalable 208 n'est pas mise en œuvre.

Ce mode de réalisation permet de mutualiser les signatures courantes générées par le générateur de signature 15, entre le module de détection 17 et le gestionnaire de diffusion 14.

A une étape 210, le module de détection 17 transmet au gestionnaire de notification 16 un ensemble comprenant au moins le contenu contextuel courant en association avec l'identifiant de la source de contenu audiovisuel donné.

En outre, à l'issue de l'étape 209, à une étape 21 1 , le module de détection peut temporiser durant une période D4, avant de recommencer les étapes 208 à 210.

A une étape 212, le gestionnaire de notifications 16 stocke l'ensemble comprenant au moins le contenu contextuel courant en association avec l'identifiant de la source de contenu audiovisuel donné, reçu depuis le module de détection 17. En outre, comme décrit ci-avant, le gestionnaire de notifications 16 peut recevoir directement depuis un serveur d'une chaîne de télévision un contenu contextuel à associer avec un identifiant de la chaîne de télévision.

A une étape 213, le gestionnaire de notifications 16 diffuse à l'ensemble de plateformes de service 13.1 -13. n (ou au moins à la première plateforme de service 13.1 ) un ensemble comprenant au moins le contenu contextuel courant associé à l'identifiant de source de contenu audiovisuel donnée.

A une étape 214, sur réception de l'ensemble comprenant au moins le contenu contextuel courant associé à un identifiant de source de contenu audiovisuel, mise à jour de la base de données locale par modification des contenus contextuels en fonction de l'ensemble comprenant au moins le contenu contextuel courant. En parallèle des étapes précédentes, (avant, après, ou pendant les étapes 200 à 214), une application est lancée à une étape optionnelle 215 sur le premier terminal utilisateur 10, l'application étant dédiée à l'enrichissement contextuel selon l'invention.

A une étape 21 6, le premier terminal utilisateur 10 peut acquérir, par un microphone, un contenu audio issu du deuxième terminal utilisateur 1 1 . Comme détaillé ci-avant, le contenu audio peut être un contenu de durée D3 permettant de générer une signature candidate, ou un contenu de durée D2 permettant de mettre à jour une signature candidate précédemment générée.

A une étape 217, une signature candidate est générée en fonction du contenu audio acquis par le premier terminal utilisateur 10.

A une étape 218, une requête comprenant la signature candidate est générée par le premier terminal utilisateur 10.

A une étape 219, la requête générée est transmise à la première plateforme de service 13.1 par le premier terminal utilisateur 10.

A l'issue de l'étape 219, le premier terminal utilisateur 10 peut temporiser durant une période D2 avant de répéter les étapes 216 et 217 permettant de générer une nouvelle signature candidate. A l'étape 218 suivante, une requête n'est pas nécessairement générée, comme décrit ci- avant, puisque la transmission d'une requête peut intervenir préférentiellement toutes les m*D2 périodes, m étant un entier.

Sur réception de la requête d'utilisateur depuis le premier terminal utilisateur 20, la première plateforme de service 13.1 identifie, à une étape 221 une source de contenu audiovisuel par comparaison entre la signature candidate et les signatures stockées dans la base de données locale.

A une étape 222, la première plateforme de service 13.1 extrait de sa base de données locale le contenu contextuel associé à la source de contenu audiovisuel identifiée.

A une étape 223, le contenu contextuel extrait est transmis au premier terminal utilisateur 10, qui dispose ainsi d'un contenu contextuel permettant l'enrichissement du contenu audiovisuel affiché sur le deuxième terminal utilisateur 1 1 . En outre, le contenu contextuel peut être transmis avec l'identifiant de la source de contenu audiovisuel identifiée. Ainsi, le premier terminal utilisateur 10 dispose en outre de l'identifiant de la source de contenu audiovisuel qui diffuse le contenu audiovisuel affiché sur le deuxième terminal utilisateur 1 1 , et peut intégrer cet identifiant lors de la transmission d'une nouvelle requête. Ceci permet à la première plateforme de service 13.1 , lors de l'étape 221 de comparaisons de signatures, de commencer par comparer la signature candidate à la signature stockée en association avec la source de contenu audiovisuel identifié dans la requête. En effet, la probabilité que l'utilisateur n'ait pas changé la source est élevée, et des ressources logicielles de la plateforme de service sont ainsi économisées (le nombre moyen de comparaisons à effectuer est réduit).

En variante, les identifiants des sources de contenu audiovisuel sont ordonnés dans les plateformes de service 13.1 -13. n selon un critère de popularité (de la plus consultée à la moins consultée). Aucune restriction n'est attachée au critère de popularité : par exemple, il peut s'agir du nombre de consultations de la source de contenu audiovisuel pour une tranche horaire donnée, ou bien un classement établi par l'utilisateur lui-même.

Lorsque les identifiants des sources de contenu audiovisuel sont ordonnés ainsi, l'identification d'une source de contenu audiovisuel comprend des comparaisons successives entre la signature candidate et les signatures stockées selon l'ordre des identifiants des sources de contenu audiovisuel qui sont respectivement associés aux signatures.

Le critère de popularité peut par ailleurs être utilisé en combinaison avec l'identifiant de source de contenu audiovisuel inséré dans la requête de l'utilisateur : l'identification de la source de contenu audiovisuel comprend des comparaisons successives entre la signature candidate et les signatures stockées en commençant par la signature stockée en association avec l'identifiant de la dernière source de contenu audiovisuel identifiée dans la requête, puis selon l'ordre des identifiants de sources de contenu audiovisuel qui sont respectivement associés aux signatures.

La figure 3 illustre une première plateforme de service 13.1 selon un mode de réalisation de l'invention.

La première plateforme de service 13.1 comprend une mémoire vive 303 et un processeur 302 pour stocker des instructions permettant la mise en œuvre des étapes 207, 214, 221 , 222 et 223 du procédé décrit ci-avant. La plateforme de service 13.1 peut en outre comporter une base de données locale 304 pour stocker les associations entre des signatures de contenu audiovisuel et des sources de contenu audiovisuel d'une part et les associations entre des sources de contenu audiovisuel et des contenus contextuels d'autre part.

La première plateforme de service 13.1 comporte en outre une interface d'entrée 301 destinée à recevoir l'ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel du gestionnaire de diffusion 14, l'ensemble d'au moins un contenu contextuel courant associé à un identifiant de source de contenu audiovisuel du gestionnaire de notifications 16 et la requête du premier dispositif de l'utilisateur. La première plateforme de service 13.1 comprend en outre une interface de sortie 305 apte à transmettre au premier terminal utilisateur 10 le contenu contextuel extrait de la base de données locale 304.

La figure 4 illustre un gestionnaire de diffusion 14 selon un mode de réalisation de l'invention.

Le gestionnaire de diffusion 14 comprend une mémoire vive 403 et un processeur 402 pour stocker des instructions permettant la mise en œuvre de l'étape 205 du procédé décrit ci-avant. Le gestionnaire de diffusion 14 peut en outre comporter une base de données locale 404 pour stocker les associations entre des signatures courantes de contenu audiovisuel et des sources de contenu audiovisuel .

Le gestionnaire de diffusion 14 comporte en outre une interface d'entrée 401 destinée à recevoir l'ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel du générateur de signature 15 et une interface de sortie 405 apte à diffuser aux plateformes de service 13.1 -13. n l'ensemble de signatures courantes de contenus audiovisuels respectivement associés à des identifiants de sources de contenu audiovisuel. La figure 5 illustre un gestionnaire de notifications 16 selon un mode de réalisation de l'invention.

Le gestionnaire de notifications 16 comprend une mémoire vive 503 et un processeur 502 pour stocker des instructions permettant la mise en œuvre de l'étape 212 du procédé décrit ci-avant. Le gestionnaire de notifications 16 peut en outre comporter une base de données locale 504 pour stocker les associations entre des sources de contenu audiovisuel et des contenus contextuels.

Le gestionnaire de notifications 16 comporte en outre une interface d'entrée 501 destinée à recevoir l'ensemble de contenus contextuels respectivement associés à des identifiants de sources de contenu audiovisuel du module de détection17 (ou directement depuis un serveur de chaîne de télévision ou depuis le serveur d'un annonceur) et une interface de sortie 505 apte à diffuser aux plateformes de service 13.1 -13. n l'ensemble de contenus contextuels respectivement associés à des identifiants de sources de contenu audiovisuel.

La figure 6 illustre un premier terminal utilisateur 10 selon un mode de réalisation de l'invention.

Le premier terminal utilisateur 10 comprend une mémoire vive 604 et un processeur 603 pour stocker des instructions permettant la mise en œuvre des étapes 215, 216, 217, 218 et 220 du procédé décrit ci-avant. Le premier terminal utilisateur 10 peut en outre comporter une base de données locale 606 pour stocker l'identifiant de la dernière source de contenu audiovisuel reçu depuis la première plateforme de service 13.1 et pour stocker les signatures candidates générées. La base de données locale 606 peut également stocker l'application dédiée à l'enrichissement de contenu audiovisuel selon l'invention.

Le premier terminal utilisateur 10 comprend en outre un microphone 601 pour acquérir un contenu audio issu du deuxième terminal utilisateur 10 et une interface utilisateur 602 pour recevoir des commandes de l'utilisateur (lancement de l'application dédiée, lecture du contenu contextuel reçu, etc). De manière alternative, le contenu audio peut être issu d'un flux audio acquis directement par voie filaire depuis le deuxième terminal utilisateur 20 (fonctionnalité DLNA par exemple), et dans ce cas, le microphone 601 est optionnel. Le premier terminal utilisateur 10 comprend en outre un écran 605 pour afficher une composante visuelle du contenu contextuel et un haut-parleur 608 pour rendre la composante audio du contenu contextuel.

Le premier terminal utilisateur 10 comporte en outre une interface d'entrée 601 destinée à recevoir le contenu contextuel, optionnellement accompagné de l'identifiant de la source de contenu audiovisuel donnée, depuis la première plateforme de service 13.1 , et une interface de sortie 607 apte transmettre la requête générée à la première plateforme de service 13.1 .

La figure 7 illustre un générateur de signature 15 selon un mode de réalisation de l'invention.

Le générateur de signature 15 comprend une mémoire vive 703 et un processeur 702 pour stocker des instructions permettant la mise en œuvre des étapes 200 à 203 du procédé décrit ci-avant. Le générateur de signature 15 peut en outre comporter une base de données locale 704 pour stocker les signatures courantes de contenu audiovisuel en association avec les sources de contenu audiovisuel .

Le générateur de signature 15 comporte en outre une interface d'entrée 501 destinée à recevoir les flux audiovisuels des différentes sources de contenu audiovisuel et une interface de sortie 705 apte transmettre au gestionnaire de diffusion 14 (et optionnellement au module de détection 1 7) les associations entre les signatures courantes et les identifiants de sources de contenu audiovisuel .

La figure 8 illustre un module de détection 17 selon un mode de réalisation de l'invention.

Le module de détection 17 comprend une mémoire vive 803 et un processeur 802 pour stocker des instructions permettant la mise en œuvre des étapes 208, 209 et 21 1 du procédé décrit ci-avant. Le module de détection 17 peut en outre comporter une base de données locale 804 pour stocker les contenus contextuels en vue d'extraire un contenu contextuel courant. En outre, dans le cas où les signatures courantes sont reçues depuis le générateur de signature 15, chaque contenu contextuel est associé à une signature de référence, et le processeur 802 est apte à rechercher les signatures courantes reçues depuis le générateur de signature 15, parmi les signatures de référence, afin d'extraire un contenu contextuel à associer à un identifiant de chaîne.

Le module de détection 17 comporte en outre une interface 801 pouvant être un module d'acquisition d'un extrait audiovisuel (caméra, microphone, par exemple) ou pouvant être une interface réseau apte à recevoir les signatures courantes et les identifiants de sources de contenu audiovisuel depuis le générateur de signature 15. Le module de détection comprend une interface de sortie 805 apte transmettre au gestionnaire de notifications 16 l'ensemble d'au moins un contenu contextuel courant associé à l'identifiant de la source de contenu audiovisuel donnée.

La figure 9 illustre la génération d'une signature courante 900 et d'une signature candidate 903 en fonction du temps, selon certains modes de réalisation de l'invention. A un instant ti , le générateur de signature 15 dispose d'une signature courante 900 qui a été transmise aux plateformes de service 13.1 -13. n. Comme précédemment détaillé, la signature courante 900 a une durée D1 , pouvant être égale à 30 secondes par exemple. A l'instant t 2 , correspondant à une durée D2 après l'instant ti , un extrait audio courant est reçu avec un identifiant de source de contenu audiovisuel et le générateur de signature génère un extrait de signature 901 de durée D2. La signature courante 900 est ainsi mise à jour en effaçant une période finale 902 de durée D2 et en ajoutant au début de la signature courante (entre ti et t 2 ) donnée, l'extrait de signature 901 de durée D2. Comme précédemment détaillé, la durée D2 peut être égale à une seconde.

En outre, à l'instant ti , la première plateforme de service 13.1 peut recevoir une signature candidate 903 de durée D3 du premier terminal utilisateur 10. Comme précédemment détaillé la durée D3 peut être égale à 10 secondes.

En raison de la variabilité des technologies de transport des flux audiovisuels, la signature courante reçue à l'instant ti peut avoir un retard Δ indiquant que la signature candidate 903 correspond à un extrait audio du flux retardé du retard Δ par rapport aux signatures courantes 900.

Ainsi, comme illustré sur la figure 9, le fait d'avoir une durée D1 sensiblement supérieure (par exemple un multiple) à la durée D3 permet de permettre une comparaison entre la signature candidate 903 et les signatures courantes 900 quel que soit le retard Δ compris entre 0 et (D1 -D3).

Comme détaillé précédemment, la signature candidate 903 peut être mise à jour de la même manière que les signatures courantes 900.

La présente invention ne se limite pas aux formes de réalisation décrites ci-avant à titre d'exemples ; elle s'étend à d'autres variantes.