Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND SYSTEM FOR SEQUENTIAL PROVISION OF DATA, PARTICULARLY IN THE FORM OF VIDEOS OR THE LIKE, REPRESENTING PERSONALIZED INFORMATION, PARTICULARLY FOR A PERSONALIZED TELEVISION PROGRAM
Document Type and Number:
WIPO Patent Application WO/2014/049057
Kind Code:
A1
Abstract:
The present invention relates to a method for sequential provision of data, particularly in the form of videos or the like, representing personalized information, particularly for a personalized television program, the method comprising the following method steps: 1. analysing and linking data (videos or the like) representing information in at least one data stock accessible via at least one data source; 2. making a selection on the basis of the information defined by a user; 3. sorting and grouping the results intended by the user on the basis of the analysis and linking of information; 4. outputting data (videos or the like) representing information on the basis of the sorting and grouping; 5. modifying the output of data (videos or the like) representing information on the basis of at least one input by a user with respect to modified intended results, preferably with respect to a navigation in the results intended by the user. The present invention further relates to a data processing system for sequential provision of data, particularly in the form of videos or the like, representing personalized information, particularly for a personalized television program, the system being characterized by devices which are formed and/or designed to perform a method according to the invention.

Inventors:
WURZER JOERG (DE)
Application Number:
PCT/EP2013/070079
Publication Date:
April 03, 2014
Filing Date:
September 26, 2013
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
IQSER IP AG (CH)
International Classes:
G06F11/34; G06Q90/00; G06F17/30; H04H60/33; H04L29/08; H04N21/45
Domestic Patent References:
WO2005050471A22005-06-02
WO2009030247A12009-03-12
WO2009135511A12009-11-12
WO2009135511A12009-11-12
WO2009030288A12009-03-12
WO2009030245A12009-03-12
WO2009030248A12009-03-12
Other References:
EPO: "Mitteilung des Europäischen Patentamts vom 1. Oktober 2007 über Geschäftsmethoden = Notice from the European Patent Office dated 1 October 2007 concerning business methods = Communiqué de l'Office européen des brevets,en date du 1er octobre 2007, concernant les méthodes dans le domaine des activités", JOURNAL OFFICIEL DE L'OFFICE EUROPEEN DES BREVETS.OFFICIAL JOURNAL OF THE EUROPEAN PATENT OFFICE.AMTSBLATTT DES EUROPAEISCHEN PATENTAMTS, OEB, MUNCHEN, DE, vol. 30, no. 11, 1 November 2007 (2007-11-01), pages 592 - 593, XP007905525, ISSN: 0170-9291
Attorney, Agent or Firm:
RING & WEISBRODT PATENTANWALTSGES. MBH (DE)
Download PDF:
Claims:
A n s p r ü c h e

1 . Verfahren zur sequenziellen Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos oder dergleichen, insbesondere für ein personalisiertes Fernsehprogramm, welches die folgenden Verfahrensschritte umfasst:

1 . Analyse und Vernetzung von Informationen repräsentierenden Daten (Videos oder dergleichen) in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand;

2. Selektion basierend auf durch einen Nutzer definierten Informationen;

3. Sortierung und Gruppierung der vom Nutzer intendierten Ergebnisse basierend auf der Analyse und Vernetzung von Informationen;

4. Ausgabe von Informationen repräsentierenden Daten (Videos oder dergleichen) basierend auf der Sortierung und Gruppierung;

5. Änderung der Ausgabe von Informationen repräsentierenden Daten (Videos oder dergleichen) basierend auf wenigstens einer Eingabe des Nutzers bezüglich geänderter intendierter Ergebnisse, vorzugsweise bezüglich einer Navigation in dem vom Nutzer intendierten Ergebnisse.

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die Analyse und Vernetzung von Informationen repräsentierenden Daten zusätzlich wenigstens einen der folgenden Verfahrensschritte umfasst:

- Extraktion und Annotation von Informationen repräsentierenden Merkmalen, insbesondere sogenannte Metadaten, aus den Informationen repräsentierenden Daten (Videos oder dergleichen);

Klassifikation und Annotation der Informationen repräsentierenden Merkmale (Metadaten) und/oder der Informationen repräsentierenden Daten (Videos oder dergleichen); - Qualitätsbewertung und Annotation der Informationen repräsentierenden Daten (Videos oder dergleichen);

- syntaktische und semantische Analyse zur Vernetzung der Informationen repräsentierenden Daten (Videos oder dergleichen) und/oder der Informationen repräsentierenden Merkmale (Metadaten);

- automatische Produktion von Informationen repräsentierenden Daten (Videos oder dergleichen), welche eine automatische Anmoderation entsprechend dem Inhalt der Informationen repräsentierenden Daten beinhalten.

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die Analyse und Vernetzung von Informationen repräsentierenden Daten und/oder Merkmalen (Videos oder dergleichen) zusätzlichen wenigstens einen der folgenden Verfahrensschritte umfasst:

- Korrektur von fehlerhaften Informationen repräsentierenden Merkmalen (Metadaten) vorzugsweise durch einen Abgleich mit wenigstens einem wenigstens ein Vokabular beinhaltenden Datenbestand;

- Ergänzung von Informationen repräsentierenden Merkmalen (Metadaten) vorzugsweise mit Synonymen von Metadaten durch einen Abgleich mit wenigstens einem wenigstens ein Synonym beinhaltenden Datenbestand; und/oder mit einem Volltext durch eine Analyse der Informationen repräsentierenden Daten (Videos oder dergleichen) insbesondere den Toninformationen der Informationen repräsentierenden Daten (Videos oder dergleichen), vorzugsweise durch wenigstens eine Signifikanzberechnung der in den Toninformationen enthaltenen Inhalte unter Verwendung der Formel /Wortfrequenz (Wort, Inhaltsobjekt)\

CT(Wort) = (Ζ™Ζ» Κ£Ρ Λ log(Wortfrequenz(Korpus) - Wortfrequenz(Inhaltsobjekt)).

V Wortanzahl (Korpus) /

Verfahren nach Anspruch 2 oder Anspruch 3, dadurch gekennzeichnet, dass die Klassifikation und Annotation der Informationen repräsentierenden Daten (Videos oder dergleichen) zusätzlich wenigstens einen der folgenden Verfahrensschritte umfasst:

- Erstellung eines Kategorienbaums über die Informationen repräsentierenden Merkmale (Metadaten);

- Klassifikation der Inhalte eines Kategorienbaums;

- Ergänzung der Informationen repräsentierenden Daten mit einem Metadatum und/oder einem Attribut der Informationen repräsentierenden Daten (Videos oder dergleichen) mit einer Klassifikation aus einem Kategorienbaum.

Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die automatische Produktion von Informationen repräsentierenden Daten (Videos oder dergleichen) wenigstens eines der folgenden Elemente beinhaltet:

- Titel der Informationen repräsentierenden Daten;

- Autor der Informationen repräsentierenden Daten;

- Bild aus den Informationen repräsentierenden Daten durch die Verwendung eines geeigneten Erkennungsverfahrens.

Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass die Selektion basierend auf durch einen Nutzer definierten Informationen zusätzlich wenigstens einen der folgenden Verfahrensschritte umfasst:

- Erstellen einer Query (Anfrage); - Interpretation der Query (Anfrage) durch die Verwendung eines Verfahrens zur zumindest teilautomatischen Erzeugung einer Anfrage.

7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass die Sortierung und Gruppierung der vom Nutzer intendierten Ergebnisse auf wenigstens ein Cluster und/oder auf die Inhalte innerhalb wenigstens eines Clusters angewendet wird.

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die Sortierung der Cluster nach wenigstens einem der folgenden Kriterien erfolgt:

- durchschnittliche Aktualität oder Chronologie;

- genre- und/oder themenabhängige Regeln;

- durchschnittliche Qualität der Informationen repräsentierenden Daten (Videos oder dergleichen);

- durchschnittliche Beliebtheit der repräsentierenden Informationen repräsentierenden Daten (Videos oder dergleichen).

9. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die Sortierung der Inhalte innerhalb eines Clusters nach wenigstens einem der folgenden Kriterien erfolgt:

- sogenanntes Smart-Ranking basierend auf einem Verfahren zur Suchoptimierung;

- Qualität der Informationen repräsentierenden Daten (Videos oder dergleichen).

10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass die Sortierung und Gruppierung die eine automatische Produktion von Informationen repräsentierenden Daten (Videos oder dergleichen), welche eine automatische Anmoderation entsprechend dem Inhalt eines Clusters und/oder dem Cluster beinhaltet.

1 1 . Verfahren nach einem der Ansprüche 1 bis 10, dadurch gekennzeichnet, dass die Eingabe des Nutzers zur Änderung der Ausgabe von Informationen repräsentierenden Daten durch eine Geste und/oder eine Betätigung einer Taste bewirkt wird.

12. Verfahren nach Anspruch 1 1 , dadurch gekennzeichnet, dass die Geste durch ein Wischen nach links oder rechts und/oder die Betätigung der Taste nach links oder rechts erfolgt, wobei dies zu der Ausgabe weiterer Informationen repräsentierenden Daten (Videos oder dergleichen), welche dem Cluster der vor der Ausführung der Geste oder der Betätigung der Taste aktiven Informationen repräsentierenden Daten (Videos oder dergleichen) entspricht, führt.

13. Verfahren nach Anspruch 1 1 , dadurch gekennzeichnet, dass die Geste durch ein Wischen nach oben oder unten und/oder die Betätigung der Taste nach oben oder unten erfolgt, wobei dies zu der Ausgabe weiterer Informationen repräsentierenden Daten (Videos oder dergleichen), welche einem weiteren Cluster, welches sich von dem Cluster der vor der Ausführung der Geste oder der Betätigung der Taste aktiven Informationen repräsentierenden Daten (Videos oder dergleichen) unterscheidet, führt.

14. Datenverarbeitungssystem zur sequenziellen Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos oder dergleichen, insbesondere für ein personalisiertes Fernsehprogramm, gekennzeichnet durch Einrichtungen die ausgebildet und/oder eingerichtet sind, ein Verfahren nach einem der Ansprüche 1 bis 13 auszuführen.

Description:
Verfahren und System zur sequenziellen Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos oder dergleichen, insbesondere für ein personalisiertes Fernsehprogramm

Die vorliegende Erfindung betrifft ein Verfahren zur sequenziellen Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos oder dergleichen, insbesondere für ein personalisiertes Fernsehprogramm.

Gegenstand der vorliegenden Erfindung ist ferner ein Datenverarbeitungssystem zur sequenziellen Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos oder dergleichen, insbesondere für ein personalisiertes Fernsehprogramm, welches durch Einrichtungen gekennzeichnet ist, die ausgebildet und/oder eingerichtet sind, ein erfindungsgemäßes Verfahren auszuführen.

Das heute bekannte Fernsehen ist vor allen Dingen von einem redaktionellen festgelegten Programm charakterisiert. Der Nutzer hat lediglich die Auswahl zwischen vielen Kanälen, welche zwar unterschiedliche, aber fest vorgegebene Inhalte aufweisen. Durch das Internet wurden neue Bedingungen geschaffen, um sich von diesem redaktionell festgelegten Charakter loslösen zu können. Trotz vieler Versuche namhafter Hersteller konnte sich ein Internet-TV nicht durchsetzen oder es folgt dem Vorbild des konventionellen Fernsehens. Dies trifft vor allen Dingen auf das heute bekannte IP-TV zu. Einen weiteren Versuch, um sich von einem redaktionell festgelegten Programm loszulösen, werden durch Online- Videoverleihe unternommen. Gegen Bezahlung einzelner Inhalte, werden diesem einen Nutzer zur Verfügung gestellt. Weiterhin gibt es auf nahezu allen heute erhältlichen Fernsehgeräten die Möglichkeit, Videos aus dem Internet, insbesondere von Videoplattformen wie beispielsweise YouTube abzuspielen.

Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos oder dergleichen, insbesondere für ein personalisiertes Fernsehprogramm zu schaffen, welches den dargestellten Inhalt nach inhaltlichen und qualitativen Kriterien personalisiert zusammenstellt. Ferner soll der Inhalt aufgrund spontaner inhaltlicher Wünsche des Nutzers zusammengestellt werden. Der dargestellte Inhalt soll daher dynamisch und jederzeit anpassbar sein.

Die Aufgabe wird gelöst durch ein Verfahren zur sequenziellen Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos oder dergleichen, welche nicht sequentiell miteinander vernetzt sind, insbesondere für ein personalisiertes Fernsehprogramm, welches die folgenden Verfahrensschritte umfasst:

1 . Analyse und Vernetzung von Informationen repräsentierenden Daten (Videos oder dergleichen) in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand;

2. Selektion bzw. Aufruf von analysierten und vernetzten Informationen basierend auf durch einen Nutzer definierten Informationen;

3. Sortierung und Gruppierung der vom Nutzer aufgrund der Selektion bzw. des Aufrufs intendierten Ergebnisse basierend auf der Analyse und Vernetzung von Informationen;

4. Ausgabe von Informationen repräsentierenden Daten (Videos oder dergleichen) basierend auf der Sortierung und Gruppierung;

5. Änderung der Ausgabe von Informationen repräsentierenden Daten (Videos oder dergleichen) basierend auf wenigstens einer Eingabe des Nutzers bezüglich geänderter intendierter Ergebnisse.

Der Erfindung liegt die Erkenntnis zugrunde, dass Informationen repräsentierende Daten (Videos oder dergleichen) aus einer oder mehrerer Mediatheken, beispielsweise Videoportale oder dergleichen, dazu verwendet werden können, um durch eine geeignete Vorverarbeitung eine spontane dynamische Zusammenstellung von personalisierten Inhalten einem Nutzer zur Verfügung stellen zu können. Dazu werden die Informationen repräsentierenden Daten zunächst inhaltlich analysiert, wobei die Analyse für jede der Informationen repräsentierenden Daten einzeln erfolgt. Vorzugsweise werden die Informationen repräsentierenden Daten parallel in einer Analysekette, welche aus mehreren sequenziellen Analyseschritten besteht, abgearbeitet. Aufgrund der Vorverarbeitung der Informationen repräsentierenden Daten ist dann ein dynamisches spontanes Nutzungserlebnis möglich.

Eine weitere Erkenntnis der Erfindung ist, dass eine sehr einfache und intuitive Bedienung für die Navigation und Interaktion für ein zufriedenstellendes Nutzungserlebnis erforderlich ist. Beispielsweise kann durch eine Gestensteuerung der ausgegebene Inhalt spontan und dynamisch an geänderte Vorlieben eines Konsumenten angepasst werden, um dieses zu gewährleisten.

Eine bevorzugte Ausgestaltung der Erfindung sieht vor, dass die Analyse und Vernetzung von Informationen repräsentierenden Daten zusätzlich wenigstens einen der folgenden Verfahrensschritte umfasst:

- Extraktion und Annotation von Informationen repräsentierenden Merkmalen, insbesondere sogenannte Metadaten, aus den Informationen repräsentierenden Daten (Videos oder dergleichen);

- Klassifikation und Annotation der Informationen repräsentierenden Merkmale (Metadaten) und/oder der Informationen repräsentierenden Daten (Videos oder dergleichen);

- Qualitätsbewertung und Annotation der Informationen repräsentierenden Daten (Videos oder dergleichen);

- syntaktische und semantische Analyse zur Vernetzung der Informationen repräsentierenden Daten (Videos oder dergleichen) und/oder der Informationen repräsentierenden Merkmale (Metadaten);

- automatische Produktion von Informationen repräsentierenden Daten (Videos oder dergleichen), welche eine automatische Anmoderation entsprechend dem Inhalt der Informationen repräsentierenden Daten beinhalten.

In der Regel enthalten Informationen repräsentierende Daten (Videos oder dergleichen), welche in Mediatheken abgelegt sind, semantische Metadaten, welche über den Titel, den Autor, das Thema, die Beschreibung und/oder Stichwörter (Tags) informieren. Um einen für die Extraktion und Annotation notwendigen vollständigen Datensatz an Metadaten bereitzustellen und/oder eine ausreichende Qualität dieser Angabe zu erreichen, ist es erfindungsgemäß vorteilhafterweise vorgebbar optional zusätzliche Metadaten aus den Informationen repräsentierenden Daten (Videos oder dergleichen) zu extrahieren. Ferner können mittels einer Spracherkennung, ein sogenanntes Speech-to-Text Verfahren, die Toninformationen der Informationen repräsentierenden Daten extrahiert werden.

Ferner werden Informationen repräsentierende Daten (Videos oder dergleichen) in Mediatheken in der Regel bereits mit einer geeigneten Klassifikation als Bestandteil der Metadaten bereitgestellt. Um die erfindungsgemäße Analyse und Vernetzung von Informationen repräsentierenden Daten (Videos oder dergleichen) adäquat durchführen zu können, ist erfindungsgemäß ferner vorgesehen, fehlende Klassifikationen nachzutragen beziehungsweise Klassifikationen hinsichtlich ihrer Datenqualität zu harmonisieren werden. Optional ist vorteilhafterweise vorgesehen, die Informationen repräsentierenden Daten (Videos oder dergleichen) zu klassifizieren.

Für die Selektion bzw. den Aufruf basierend auf durch einen Nutzer definierten Informationen ist die Bewertung der Qualität der Informationen repräsentierenden Daten (Videos oder dergleichen) vorteilhaft. Insbesondere bei öffentlich zugänglichen Mediatheken und/oder Videoportalen oder dergleichen, deren Informationen repräsentierenden Daten in der Qualität stark unterschiedlich sind, ist daher in einer weiteren Ausgestaltung der Erfindung eine Qualitätsbewertung und Annotation der Information repräsentierenden Daten (Videos oder dergleichen) vorgegeben.

Die Qualitätsbewertung und Annotation der Informationen repräsentierenden Daten (Videos oder dergleichen) erfolgt vorteilhafterweise optional anhand folgender Parameter:

- Auflösung der Informationen repräsentierenden Daten, beispielsweise ob es sich um eine SD- oder HD-Auflösung handelt;

- Bildstabilität, welche als Indiz für eine professionale Kameraführung dienen kann; - Bestimmung des Rauschabstandes der Toninformationen der Informationen repräsentierenden Daten (Videos oder dergleichen);

- eine definierte Mindestlänge der Informationen repräsentierenden Daten (Videos oder dergleichen);

- der Autor bzw. die Quelle der Informationen repräsentierenden Daten, beispielsweise weist eine Produktion einer professionellen Medienanstalt ein Indiz für eine höhere Qualität und damit einhergehend eine höhere Bewertung gegenüber Informationen repräsentierenden Daten, die von Amateuren erstellt wurden, auf;

- Qualität der Informationen repräsentierenden Merkmale (Metadaten), beispielsweise ob diese vollständig und/oder fehlerfrei sind.

Hierbei kann vorteilhafterweise eine Orientierung an genormten Klassifikationen erfolgen.

Die syntaktische und semantische Analyse zur Vernetzung der Informationen repräsentierenden Daten (Videos oder dergleichen) und/oder der Informationen repräsentierenden Merkmale (Metadaten), die nicht optional ist, erfolgt vorteilhafterweise nach einem Verfahren der syntaktischen (Metadaten-) Analyse, der semantischen (Nutzungs-) Analyse und der (computerlinguistischen) Musteranalyse. Derartige Verfahren bzw. Systeme sind insbesondere seitens der WO 2005/050471 A2 und der WO 2009/030247 A1 offenbart. Die Offenbarungen der WO 2005/050471 A2 und der WO 2009/030247 A1 werden hiermit explizit als Offenbarung der vorliegenden Anmeldung angeführt, insbesondere in Bezug auf Anwendungen betreffend eines Verfahrens zur sequenziellen Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos oder dergleichen, insbesondere für ein personalisiertes Fernsehprogramm. Das Ziel derartiger Verfahren ist die semantische Vernetzung der Informationen repräsentierenden Daten (Videos oder dergleichen).

Bei der automatischen Produktion von Informationen repräsentierenden Daten (Videos oder dergleichen), welche eine automatische Anmoderation entsprechend dem Inhalt der Informationen repräsentierenden Daten beinhalten, werden vorteilhafterweise kurze Informationen repräsentierende Daten, insbesondere Videosequenzen, erstellt, welche vorzugsweise für eine spätere Anmoderation oder Übersicht über verfügbare Inhalte, insbesondere in Form von Informationen repräsentierenden Daten (Videos oder dergleichen) genutzt werden.

Eine vorteilhafte Ausgestaltung der Erfindung ist dadurch gekennzeichnet, dass die Analyse und Vernetzung von Informationen repräsentierenden Daten und/oder Merkmalen (Videos, Metadaten oder dergleichen) zusätzlich wenigstens einen der folgenden Verfahrensschritte umfasst:

- Korrektur von fehlerhaften Informationen repräsentierenden Merkmalen (Metadaten), vorzugsweise durch einen Abgleich mit wenigstens einem wenigstens ein Vokabular beinhaltenden Datenbestand;

- Ergänzung von Informationen repräsentierenden Merkmalen (Metadaten), vorzugsweise mit Synonymen von Metadaten durch einen Abgleich mit wenigstens einem wenigstens ein Synonym beinhaltenden Datenbestand; und/oder

- mit einem Volltext durch eine Analyse der Informationen repräsentierenden Daten (Videos oder dergleichen) insbesondere den Toninformationen der Informationen repräsentierenden Daten (Videos oder dergleichen), vorzugsweise durch wenigstens eine Signifikanzberechnung der in den Toninformationen enthaltenen Inhalte unter der Verwendung der Formel

/Wortfrequenz (Wort, Inhaltsobjekt)\

CT(Wort) = ( Ζ™ ζ » κ£ ρ log(Wortfrequenz (Korpus) - Wortfrequenz(Inhaltsobjekt))

V Wortanzahl (Korpus) /

Dabei kann vorteilhafterweise eine Korrektur von fehlerhaften Metadaten, die beispielsweise durch Schreibfehler entstanden sind, durch einen Abgleich mit einem Vokabular erfolgen. Ferner ist vorteilhafterweise eine Ergänzung von den Metadaten mit Synonymen von Stichwörtern durch einen Abgleich mit beispielsweise Thesaurus oder dergleichen vorgesehen. Eine Ergänzung mit einem Volltext durch eine Analyse, insbesondere eine Spracherkennung (Speech- to-Text) der Toninformationen der Informationen repräsentierenden Daten (Videos oder dergleichen), erfolgt vorteilhafterweise auf der Basis einer Signifikanzberechnung. Das Ergebnis bzw. die Ergebnisse einer solchen Signifikanzberechnung wird bzw. werden vorteilhafterweise dazu verwendet, automatisch weitere Stichwörter zu den Informationen repräsentierenden Merkmalen (Metadaten) hinzuzufügen und vorteilhafterweise eine Musteranalyse mit den signifikantesten Wörtern durchzuführen. Die Signifikanzberechnung der Toninformationen erfolgt vorteilhafterweise nach einem computerlinguistischen Verfahren für einen Konzeptgraphen oder Kategorienbaum. Eine hierfür vorteilhafterweise anwendbare Formel, wobei die Parameter insbesondere durch Wörter in den Toninformationen repräsentiert sein können, lautet:

CT(Wort) log(Wortfrequenz (Korpus) - Wortfrequenz(Inhaltsobjekt))

Eine weitere vorteilhafte Ausgestaltung sieht alternativ die Anwendung folgender Formel vor, wobei der Basiswert frei wählbar ist und vorzugsweise in einem Bereich von 1 ,0 bis 1 ,0001 liegt:

a(Wort) = rt

Wortfrequenz (Korpus) - Wortfrequenz (Objekt) + 2

Bei den Formeln wird vorteilhafterweise die Signifikanz σ für jedes einzelne in den Toninformationen enthaltene Wort bestimmt, insbesondere um die Wörter mit der größten Signifikanz bestimmen und auf Basis dieses Ergebnisses die Informationen repräsentierenden Merkmale (Metadaten) ergänzen zu können. Das Inhaltsobjekt gibt den zu analysierenden Gegenstand an, im vorliegenden Fall sind dies die Toninformationen der Informationen repräsentierenden Daten (Videos oder dergleichen). Die Wortfrequenz gibt die Häufigkeit des Auftretens eines Wortes innerhalb des Inhaltsobjektes an. Die Wortanzahl gibt die Summe aller in dem Inhaltsobjekt enthaltenen unterschiedlichen Wörter an. Der Korpus ist eine Zusammenstellung von Informationen nach bestimmten Kriterien, im vorliegenden Fall handelt es sich um eine Aufsummierung über alle bisher indizierten Inhaltsobjekte. Derartige Verfahren bzw. Systeme sind insbesondere seitens der WO 2009/13551 1 A1 und der WO 2009/030247 A1 offenbart. Die Offenbarungen der WO 2009/13551 1 A1 und der WO 2009/030247 A1 werden hiermit explizit als Offenbarung der vorliegenden Anmeldung angeführt, insbesondere in Bezug auf Anwendungen betreffend die Analyse und Vernetzung von Informationen repräsentierenden Daten und/oder Merkmalen (Videos, Metadaten oder dergleichen).

Eine weitere bevorzugte Ausgestaltung der Erfindung ist dadurch gekennzeichnet, dass die Klassifikation und Annotation der Informationen repräsentierenden Daten (Videos oder dergleichen) zusätzlich wenigstens einen der folgenden Verfahrensschritte umfasst:

- Erstellung eines Kategorienbaums über die Informationen repräsentierenden Merkmale (Metadaten);

- Klassifikation der Inhalte eines Kategorienbaums;

- Ergänzung der Informationen repräsentierenden Daten mit einem Metadatum und/oder einem Attribut der Informationen repräsentierenden Daten (Videos oder dergleichen) mit einer Klassifikation aus einem Kategorienbaum.

Die Erstellung eines Kategorienbaums über die Informationen repräsentierenden Merkmale (Metadaten) erfolgt vorteilhafterweise über die Berechnung der in den Informationen repräsentierenden Merkmalen (Metadaten) enthaltenen Kategorien entsprechend eines Verfahrens zur Berechnung eines Kategorienbaums. Ein derartiges Verfahren ist insbesondere seitens der WO 2009/13551 1 A1 offenbart. Die Offenbarungen der WO 2009/13551 1 A2 werden hiermit explizit als Offenbarung der vorliegenden Anmeldungen angeführt, insbesondere in Bezug auf Anwendungen betreffend eine Erstellung eines Kategorienbaums.

Die Klassifikation der Inhalte eines Kategorienbaums erfolgt vorteilhafterweise durch einen Abgleich der Metadaten mit Taxonomie oder Ontologie, die anhand der Literaten der hierarchisierten Konzepte durchgeführt werden. Eine vorteilhafte Ausgestaltung der Erfindung sieht vor, dass die automatische Produktion von Informationen repräsentierenden Daten (Videos oder dergleichen) wenigstens eines der folgenden Elemente beinhaltet:

- Titel der Informationen repräsentierenden Daten;

- Autor der Informationen repräsentierenden Daten;

- Bild aus den Informationen repräsentierenden Daten durch die Verwendung eines geeigneten Erkennungsverfahrens.

Dabei wird vorteilhafterweise die Verwendung eines Titels und/oder eines Autors von Informationen repräsentierenden Daten (Videos oder dergleichen) für einen (animierten) Text bzw. Text-Layer verwendet. Die Produktion wird vorteilhafterweise mit Hilfe eines exemplarischen Bildes aufgewertet, welches vorzugsweise anhand von Gesicht- oder Panoramaerkennung bestimmt werden kann.

Eine weitere vorteilhafte Ausgestaltung der Erfindung sieht vor, dass die Selektion bzw. der Aufruf basierend auf durch einen Nutzer definierten Informationen zusätzlich wenigstens einen der folgenden Verfahrensschritte umfasst:

- Erstellen einer Query;

- Interpretation der Query durch die Verwendung eines Verfahrens zur zumindest teilautomatischen Erzeugung einer Anfrage.

Der Nutzer gibt dabei vorteilhafterweise seine intendierten Ergebnisse, beispielsweise für ein TV-Magazin oder ein bestimmtes Programm an, vorzugsweise per Spracheingabe, die einen gesprochenen Text bzw. Wörter übersetzt, so dass diese digital weiter verarbeitet werden können. Hieraus wird automatisiert eine Query, nachfolgend auch Anfrage genannt, erstellt. Die Selektion bzw. der Aufruf basierend auf durch einen Nutzer definierte Informationen erfolgt vorteilhafterweise aufgrund der vorherigen Analyse und Vernetzung der Informationen repräsentierenden Daten (Videos oder dergleichen) und führt vorzugsweise zu einem dynamischen und spontanen Nutzungserlebnis für den Nutzer.

Die Query kann in einer weiteren Ausgestaltung der Erfindung optional interpretiert werden, um von dem Nutzer intendierte Ergebnisse besser und gezielter bedienen zu können. Hierzu kann vorteilhafterweise ein Verfahren zur automatischen Query- Interpretation verwendet werden. Dabei kommt vorteilhafterweise ein Verfahren zur zumindest teilautomatischen Erzeugung einer Anfrage an ein datenverarbeitendes System mit einem Datenbestand, wobei dem Datenbestand ein Datenmodell zugrunde liegt zum Einsatz, welches zur Auswahl von Daten aus dem Datenbestand mit einer Abfragesprache des datenverarbeitenden Systems verwendbar ist, wobei eine natürlichsprachliche Anfrage eines Nutzers, welche durch eine nutzerseitige Eingabe von als eine Folge von Zeichen (Zeichenfolge) erfasster Begriffe (Nutzerbegriffe), welche Begriffe die von dem Nutzer intendierten Ergebnisse der Antwort des datenverarbeitenden Systems auf die zu erfolgende Anfrage an das datenverarbeitende System semantisch beschreiben, erfolgt, die natürlichsprachliche Anfrage des Nutzers analysiert und/oder interpretiert und in eine Anfrage in der Abfragesprache umgesetzt wird, vorgeschlagen, welches dadurch gekennzeichnet ist, dass die als eine Zeichenfolge erfasste natürlichsprachliche Anfrage in Lexeme zerlegt wird, diese Lexeme entsprechend ihrer Reihenfolge in der Zeichenfolge sequentiell verarbeitet werden, wobei eine Bedeutung des jeweiligen Lexems anhand des Datenmodells bestimmt wird, und daraus die Anfrage in der Abfragesprache gebildet wird.

Ein Lexem im Sinne der vorliegenden Erfindung ist eine Bedeutungseinheit, sprachlicher Einheiten, die sich in verschiedenen Wortformen manifestieren kann und dabei von der konkreten Form der sprachlichen Einheit sowie von der konkreten syntaktischen Funktion der sprachlichen Einheit absieht. Im Sinne der vorliegenden Erfindung entsprechen Lexeme weitestgehend syntaktischen Worten, mit dem Unterschied, dass insbesondere auch asiatische Sprachen und dergleichen Berücksichtigung finden, die keine syntaktisch erkennbare Trennung von Worten in einem Satz kennen. Syntaktische Wörter im Sinne der vorliegenden Erfindung sind Einheiten, die sich innerhalb eines Satzes verschieben, durch andere austauschen und/oder sich durch das Einfügen weiterer Wörter voneinander trennen lassen. Wörter im Sinne der vorliegenden Erfindung sind dabei unter syntaktischem Aspekt kleinste verschiebbare und ersetzbare Einheiten des Satzes. Darüber hinaus berücksichtigt die Verwendung des Begriffes Lexem im Sinne der vorliegenden Erfindung, dass ein vorgegebenes Wort auf eine grammatikalische Grundform reduziert und damit syntaktisch-grammatische Varianten ausgeglichen werden können.

Eine erfindungsgemäße Anfrage beziehungsweise Suchanfrage ist vorteilhafterweise dadurch charakterisiert, dass der Nutzer beziehungsweise Anwender in einem Eingabefeld beziehungsweise Textfeld die von ihm gesuchte Information mit mehreren Wörtern intuitiv beschreibt. Diese Anfrage wird im Anschluss in ihre begrifflichen Bestandteile zerlegt und in eine Anfrage in der Abfragesprache übersetzt, die über eine bloße Volltextsuche durch Kombination von Schlüsselwörtern hinausgeht. Eine vorteilhafte Ausgestaltung der Erfindung sieht vor, dass die Nutzereingabe durch Sprachsteuerung oder dergleichen Eingabehilfe erfolgt. Dazu weist das datenverarbeitende System vorteilhafterweise Mittel zur Sprachsteuerung und Mittel zur Umsetzung von sprachlichen Äußerungen in eine Folge von Zeichen auf.

Eine vorteilhafte Ausgestaltung der Erfindung sieht vor, dass für das jeweils aktuell zu verwendende bzw. zu verarbeitende Lexem überprüft wird, ob es ein nachfolgendes Lexem in der Reihenfolge gibt, wobei in diesem Fall überprüft wird, ob es sich bei dem aktuell zu verarbeitenden Lexem um die Bezeichnung einer Datenquelle, einer Datenklasse des Datenmodells oder eines Datenattributs des Datenmodells handelt. Erfindungsgemäß wird damit zunächst überprüft, ob es sich bei der natürlichsprachlichen Anfrage des Nutzers um mehrere Begriffe handelt. Ist das der Fall, wird vorteilhafterweise der erste Begriff dahingehend überprüft, ob es eine Datenquelle, eine Datenklasse, also eine semantische Klassifizierung hinsichtlich eines Inhaltstyps, oder ein Datenattribut, also Metadaten, mit diesem Begriff beziehungsweise dieser Begriffsbezeichnung gibt.

Eine weitere vorteilhafte Ausgestaltung der Erfindung sieht vor, dass in dem Fall der Bezeichnung einer Datenquelle oder einer Datenklasse die Bezeichnung in einen Parameter der Abfragesprache zur Auswahl von Daten aus dem Datenbestand transformiert wird, wobei der Parameter die Auswahl von Daten auf Daten mit der Bezeichnung der Datenquelle oder der Datenklasse eingrenzt. Vorteilhafterweise wird die Datenquelle nur für das erste Lexem in der Reihenfolge überprüft. Eine auf diese Weise erkannte Datenquelle schränkt dann den Suchraum für die Anfrage entsprechend ein. Beispielsweise würde der Begriff „Amazon" nur in den Daten suchen, die das Unternehmen Amazon zur Verfügung stellt. Falls der erste Begriff einer Datenklasse entspricht, würde die Suche auf entsprechend semantisch klassifizierte Inhalte hinsichtlich eines Inhaltstyps eingeschränkt werden. Zum Beispiel würde der Begriff „Buch" nur in den Daten suchen, die vom Inhaltstyp her als Bücher klassifiziert sind. Die Information dazu erhält das datenverarbeitende System durch Verwendung des verfügbaren Datenmodells oder in einer optionalen Ausgestaltung der Erfindung vorteilhafterweise von einer Ontologie, in der semantische Inhaltstypen repräsentierende Datenklassen unterschiedliche Bezeichnungen, sogenannte Literate, in unterschiedlichen Sprachen enthalten beziehungsweise aufweisen können. Alternativ und/oder ergänzend kann das datenverarbeitende System ferner Wörterbücher, Vokabulare oder dergleichen als eine Ontologie-gebende bzw. bereitstellende Informationsquelle aufweisen oder nutzen.

Eine weitere vorteilhafte Ausgestaltung der Erfindung sieht vor, dass für das jeweils aktuell zu verarbeitende Lexem überprüft wird, ob es ein nachfolgendes Lexem in der Reihenfolge gibt, wobei in diesem Fall überprüft wird, ob es sich bei dem aktuell zu verarbeitenden Lexem um die Bezeichnung einer Datenquelle, einer Datenklasse oder eines Datenattributs des Datenmodells handelt.

Eine weitere vorteilhafte Ausgestaltung der Erfindung sieht vor, dass überprüft wird, ob das aktuell zu verarbeitende bzw. zu verwendende Lexem ein Füllwort, das heißt ein Wort mit geringem Aussagewert, ist, wobei in diesem Fall das aktuell zu verarbeitende Lexem ignoriert und das nachfolgendes Lexem in der Reihenfolge verwendet bzw. verarbeitet wird.

In einer weiteren vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass in dem Fall der Bezeichnung einer Datenklasse überprüft wird, ob die Anfrage in der Abfragesprache bereits einen Parameter enthält, der die Auswahl von Daten auf Daten mit der Bezeichnung der Datenklasse eingrenzt, wobei in diesem Fall das aktuell zu verarbeitende Lexem in einen Parameter der Abfragesprache zur Auswahl von Daten aus dem Datenbestand transformiert wird, wobei der Parameter eine Beziehung zwischen Datenobjekten, welche mit dem bereits in der Anfrage in der Abfragesprache enthaltenen Parameter beschrieben werden, und Datenobjekten, welche mit Parametern beginnend mit der Bezeichnung des aktuell zu verarbeitenden Lexems beschrieben werden, beschreibt. Erfindungsgemäß wird somit der zweite Begriff in der natürlichsprachlichen Anfrage des Nutzers analysiert bzw. untersucht, wobei der zweite Begriff eine Datenklasse sein kann, falls der erste Begriff in der natürlichsprachlichen Anfrage des Nutzers die Anfrage auf eine Datenquelle eingegrenzt hat, oder wobei der zweite Begriff ein Suchwort sein kann, falls der erste Begriff in der natürlichsprachlichen Anfrage des Nutzers einer einen semantischen Inhaltstyp repräsentierenden Datenklasse entsprach, oder wobei der zweite Begriff ein Datenattribut sein kann.

Eine weitere vorteilhafte Ausgestaltung der Erfindung sieht vor, dass in dem Fall der Bezeichnung eines Datenattributs die Bezeichnung und das nachfolgende Lexem in der Reihenfolge als Name-Wert- Paar in einen Parameter der Abfragesprache zur Auswahl von Daten aus dem Datenbestand transformiert wird, wobei der Parameter die Auswahl von Daten auf Daten mit der Bezeichnung des Datenattributs eingrenzt. Die Information dazu erhält das datenverarbeitende System durch Verwendung des verfügbaren Datenmodells oder in einer optionalen Ausgestaltung der Erfindung vorteilhafterweise von einer Ontologie, in der Datenattribute (Metadaten) unterschiedliche Bezeichnungen, sogenannte Literate, in unterschiedlichen Sprachen enthalten beziehungsweise aufweisen können. Alternativ und/oder ergänzend kann das datenverarbeitende System ferner Wörterbücher, Vokabulare oder dergleichen als eine Ontologie-gebende bzw. bereitstellende Informationsquelle für Datenattribute aufweisen oder nutzen. Handelt es sich bei einem Begriff der natürlichsprachlichen Anfrage des Nutzers um die Bezeichnung eines Datenattributs wird in diesem Fall erfindungsgemäß die Anfrage beziehungsweise Suche an das datenverarbeitende System durch Ergänzung der Anfrage mit dem Attributwert beziehungsweise dem Metadatum eingegrenzt. Diese Eingrenzung wird dann für den nachfolgenden Begriff in der natürlichsprachlichen Anfrage des Nutzers verwendet.

Gemäß einem weiteren vorteilhaften Vorschlag der Erfindung wird in dem Fall der Bezeichnung einer Datenklasse überprüft, ob die Bezeichnung auch die Bezeichnung eines Datenattributs ist, wobei in diesem Fall das aktuell zu verarbeitende Lexem und das nachfolgende Lexem in der Reihenfolge als Name- Wert-Paar in einen Parameter der Abfragesprache zur Auswahl von Daten aus dem Datenbestand transformiert wird, wobei der Parameter zur zusätzlichen, alternativen Auswahl von Daten auf Daten mit der Bezeichnung des Datenattributs eingrenzt. Beide Parameter, die zum einen die Datenklasse und zum anderen das Datenattribut beschreiben, werden also als ODER-Verknüpfung zur Abfrage der Daten verknüpft.

Eine weitere vorteilhafte Ausgestaltung der Erfindung ist dadurch gekennzeichnet, dass in dem Fall der Bezeichnung keiner Datenquelle, keiner Datenklasse, keines Datenattributs oder keines verbleibenden Lexems in der Reihenfolge der Zeichenfolge das aktuell zu verarbeitende Lexem in einen Parameter der Abfragesprache zur Auswahl von Daten aus dem Datenbestand transformiert wird, wobei der Parameter die Auswahl von Daten auf Daten mit dem aktuell zu verarbeitenden Lexem als Freitextsuche eingrenzt. Erfindungsgemäß kann der nächste Begriff in der natürlichsprachlichen Anfrage des Nutzers ein Stichwort sein, dass weder eine Datenklasse noch ein Datenattribut repräsentiert und daher vorteilhafterweise für eine einschränkende Freitextsuche beziehungsweise Volltextsuche verwendet wird. Handelt es sich hingegen bei dem nächsten Begriff in der natürlichsprachlichen Anfrage des Nutzers wieder um eine Datenklasse, also einen semantisch klassifizierten Inhaltstyp, wird dies erfindungsgemäß vorteilhafterweise so interpretiert, dass die mit der Anfrage gesuchten beziehungsweise intendierten Ergebnisse der Anfrage mit Inhalten von diesem Typ, also dieser Datenklasse, verknüpft sein müssen.

Vorteilhafterweise wird sogleich überprüft, ob die Datenklasse, welche eine Verknüpfung beschreibt, auch die Bezeichnung eines Datenattributs ist. Ist dies der Fall, wird der bisherige Teil der zu erzeugenden Anfrage in der Abfragesprache mit der Eingrenzung dieses neuen Datenattributs ergänzt und mit einem logischen „oder" zu der bis dahin teilweise erzeugten Anfrage in der Abfragesprache ergänzt. Vorteilhafterweise wird dabei der auf die Bezeichnung des Datenattributs (Attributname) folgende Begriff als Attributwert verwendet.

Mit dem erfindungsgemäßen Verfahren wird vorteilhafterweise die Komplexität der Anfrage in der Abfragesprache auf eine einzige Relation begrenzt.

Gemäß einer besonders vorteilhaften Ausgestaltung der Erfindung erfolgt die nutzerseitige Eingabe unter Verwendung wenigstens einer Eingabehilfe, insbesondere zur teilautomatischen Erzeugung komplexerer Anfragen. Vorteilhafterweise wird der Nutzer beziehungsweise Anwender bei der Formulierung der Anfrage automatisch geführt. Vorteilhafterweise wird dem Anwender bei der nutzerseitigen Eingabe der Zeichen der Zeichenfolge, vorzugsweise dem ersten eingegebenen Wort, zu der eingegebenen Zeichenfolge eine Liste von möglichen Datenquellen, Datenklassen (semantischen Inhaltstypen) und/oder Datenattributen für eine beispielsweise durch Anklicken mit einem Mauszeiger oder dergleichen erfolgenden Auswahleingabe angezeigt. Ist die eingegebene Zeichenfolge, also das erste Wort der nutzerseitigen Eingabe, eine Datenklasse, also ein semantischer Inhaltstyp, wird dem Anwender für das zweite Wort der Zeichenfolge der nutzerseitigen Eingabe vorteilhafterweise eine Liste von möglichen Datenattributen (Metadaten) für eine beispielsweise durch Anklicken mit einem Mauszeiger oder dergleichen erfolgenden Auswahleingabe angezeigt. Die Anzeige der möglichen Auswahleingaben erfolgt vorteilhafterweise durch Visualisierung nach Art einer sogenannten „Drop-Down"-Liste, wie sie beispielsweise als Funktionalität bei sogenannten Browsern bekannt ist.

Gemäß einer weiteren vorteilhaften Ausgestaltung der Erfindung erfolgt die nutzerseitige Eingabe für komplexe bzw. komplexere Abfragen unter Verwendung einer graphischen Benutzeroberfläche (GUI : Graphical User Interface) durch Erstellung eines Anfrage-Baums. Dabei kann der Nutzer beziehungsweise Anwender sich vorteilhafterweise einen Anfrage-Baum zusammenstellen oder in einer Liste für die Anfrage zu verwendende Aussagen in der Form von Subjekt- Prädikat-Objekt miteinander verketten. Ein derartiger Subjekt-Prädikat-Objekt- Beziehungen repräsentierender Baum oder Graph ist beispielsweise aus der WO 2009/030288 A1 bekannt, deren Offenbarungen hiermit ausdrücklich referenziert werden. Bei der erfindungsgemäßen Erstellung eines Anfrage-Baums definiert der Nutzer vorteilhafterweise zunächst die Wurzel des Anfrage-Baums. Dafür kann er beispielsweise aus einer Liste, welche von dem datenverarbeitenden System beziehungsweise der Eingabehilfe bereitgestellt wird, die Datenklasse, also die semantische Klassifizierung eines Inhaltstyps, auswählen, vorzugsweise seitens einer graphischen Benutzeroberfläche mittels sogenanntem Mauszeiger oder dergleichen.

Zugleich oder alternativ kann der Nutzer beliebig viele Attribute hinzufügen. Dabei kann der Nutzer ebenfalls aus einer Liste von möglichen Datenattributen, die es für die zuvor gewählte Datenklasse als semantischen Inhaltstyp im Datenmodel gibt, auswählen. Die Datenattribute sind wahlweise durch ein logisches „und" oder „oder" verknüpft. Für jeden Attributnamen beziehungsweise jede Attributbezeichnung können vorteilhafterweise mehrere Attributwerte angegeben werden, die durch ein logisches„oder" verknüpft werden. Falls der Nutzer keinen Attributnamen auswählt, wird mit den hinterlegten Stichworten vorteilhafterweise eine Freitextsuche beziehungsweise Volltextsuche für die gewählte Datenklasse initiiert.

Anschließend kann der Nutzer zu dem so definierten Objekt, bestehend aus der die Wurzel des Anfrage-Baums bildenden Datenklasse und/oder den Datenattributen zu dieser Datenklasse, einschränkende Verknüpfungen hinzufügen. Dafür kann der Nutzer diese einschränkenden Verknüpfungen für das definierte Objekt ebenfalls aus einer Liste auswählen.

Ist das so verknüpfte Objekt definiert, kann der Nutzer die Verknüpfung selbst durch die Wahl eines Prädikats, also der Begründung für eine Verknüpfung, einschränken. Vorteilhafterweise stellt ihm das datenverarbeitende System und/oder die Eingabehilfe ebenfalls wieder eine Auswahlliste zur Verfügung.

Sofern es mehrere einschränkende Verknüpfungen gibt, können diese vorteilhafterweise durch eine logisches„und" oder„oder" oder„und nicht" verknüpft werden.

Sofern der Nutzer seine Anfrage beziehungsweise seine Suche noch weiter verfeinern möchte, kann er vorteilhafterweise die Objekte in der zweiten Ebene seines Anfrage-Baums ebenfalls wieder durch Verknüpfungen einschränken.

In einer weiteren vorteilhaften Ausgestaltung der Erfindung kann der Nutzer den Anfrage-Baum als Lesezeichen in einer Datenbank oder als neue Datenklasse eines semantischen Inhaltstyps in einer Ontologie speichern, welche Ontologie anschließend für weitere Anfragen und/oder Anfrage-Bäume von dem datenverarbeitenden System nutzbar ist.

Der Abschluss der Interpretation der Query sieht vorteilhafterweise vor, dass ein entsprechender Suchindex anhand der Informationen repräsentierenden Daten (Videos oder dergleichen), welche sich in den integrierten Mediatheken befinden, ausgeführt wird. Als Ergebnis wird vorteilhafterweise eine Liste von Informationen repräsentierenden Daten (Videos oder dergleichen) zurückgeliefert.

Vorteilhafterweise ist das erfindungsgemäße Verfahren dadurch gekennzeichnet, dass die Sortierung und Gruppierung der vom Nutzer intendierten Ergebnisse auf wenigstens einen Cluster und/oder auf die Inhalte innerhalb wenigstens eines Clusters angewendet wird. Durch das Clustering der Ergebnisse werden diese inhaltlich gruppiert. Ein Clustering-Verfahren baut hierzu vorteilhafterweise ein Inhaltnetz bzw. einen Graphen auf, der entsprechend verwendet werden kann. Derartige Verfahren bzw. Systeme sind insbesondere seitens der WO 2009/030245 A1 offenbart. Die Offenbarungen der WO 2009/030245 A1 werden hiermit explizit als Offenbarung der vorliegenden Anmeldung angeführt, insbesondere in Bezug auf Anwendungen betreffend eines Verfahrens des Clusterings.

Eine weitere Ausgestaltung ist dadurch gekennzeichnet, dass die Sortierung der Cluster nach wenigstens einem der folgenden Kriterien erfolgt:

- durchschnittliche Aktualität oder Chronologie;

- genreabhängige und/oder themenabhängige Regeln;

- durchschnittliche Qualität der Informationen repräsentierenden Daten (Videos oder dergleichen);

- durchschnittliche Beliebtheit;

- durchschnittliche Beliebtheit der repräsentierenden Informationen repräsentierenden Daten (Videos oder dergleichen).

Die Sortierung der Cluster wird vorzugsweise anhand einer Heuristik durchgeführt, so dass diese in eine bestimmte Reihenfolge sortiert werden.

Vorteilhafterweise erfolgt die Sortierung der Inhalte innerhalb eines Clusters nach wenigstens einem der folgenden Kriterien: - sogenanntes Smart-Ranking basierend auf einem Verfahren zur Suchoptimierung;

- Qualität der Informationen repräsentierenden Daten (Videos oder dergleichen).

Die Informationen repräsentierenden Daten (Videos oder dergleichen) innerhalb eines Clusters werden vorzugsweise nach einer Heuristik in eine Reihenfolge sortiert. Verfahren zur Suchoptimierung sind insbesondere seitens der WO 2009/030248 A1 offenbart. Die Offenbarungen der WO 2009/030248 A1 werden hiermit explizit als Offenbarung der vorliegenden Anmeldung angeführt, insbesondere in Bezug auf Anwendungen betreffend einem sogenannten Smart- Ranking basierend auf einem Verfahren zur Suchoptimierung.

Vorteilhafterweise beinhaltet die Sortierung und Gruppierung eine automatische Produktion von Informationen repräsentierenden Daten (Videos oder dergleichen), welche eine automatische Anmoderation entsprechend dem Inhalt eines Clusters und/oder dem Cluster beinhaltet. Dabei kann die automatische Anmoderation aus den Informationen repräsentierenden Daten (Videos oder dergleichen), welche beispielsweise die höchste Qualitätsbewertung umfassen, oder aus einer Kombination von bereits erstellten automatischen Anmoderationen bestehen.

Eine vorteilhafte Ausgestaltung ist dadurch gekennzeichnet, dass die Eingabe des Nutzers zur Änderung der Ausgabe von Informationen repräsentierenden Daten durch eine Geste und/oder eine Betätigung einer Taste bewirkt wird. Der Nutzer kann auf einem Endgerät oder einer zur Steuerung von diesem ausgebildeten Vorrichtung, beispielsweise eine Fernbedienung, einfach und intuitiv die Ausgabe der Informationen repräsentierenden Daten (Videos oder dergleichen) navigieren.

Vorteilhafterweise führt die Geste durch ein Wischen nach links oder rechts und/oder die Betätigung der Taste nach links oder rechts dazu, dass die Ausgabe zu der Ausgabe weiterer Informationen repräsentierenden Daten (Videos oder dergleichen), welche dem Cluster der vor der Ausführung der Geste oder der Betätigung der Taste aktiven Informationen repräsentierenden Daten (Videos oder dergleichen) entspricht, verändert wird. Eine weitere vorteilhafte Ausgestaltung ist dadurch gekennzeichnet, dass die Geste durch ein Wischen nach oben oder unten und/oder die Betätigung der Taste nach oben oder unten erfolgt, wobei dies zu der Ausgabe weiterer Informationen repräsentierenden Daten (Videos oder dergleichen), welche einem weiteren Cluster, welches sich von dem Cluster der vor der Ausführung der Geste oder der Betätigung der Taste aktiven Informationen repräsentierenden Daten (Videos oder dergleichen) unterscheidet, führt.

Zur technischen Lösung der eingangs genannten Aufgabe wird mit der vorliegenden Erfindung ferner ein Datenverarbeitungssystem zur sequenziellen Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos oder dergleichen, welche nicht sequentiell miteinander vernetzt sind, insbesondere für ein personalisiertes Fernsehprogramm, vorgeschlagen, welches gekennzeichnet ist durch Einrichtungen die ausgebildet und/oder eingerichtet sind, ein erfindungsgemäßes Verfahren auszuführen.

Weitere Einzelheiten, Merkmale und Vorteile der Erfindung werden nachfolgend anhand der Figuren näher erläutert. Dabei zeigt:

Fig. 1 ein Flussdiagramm einer erfindungsgemäßen Analyse und Vernetzung von Informationen repräsentierenden Daten (Videos oder dergleichen) in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand;

Fig. 2 ein Flussdiagramm über den Ablauf einer erfindungsgemäßen Selektion basierend auf durch einen Nutzer definierten Informationen und einer erfindungsgemäßen Sortierung und Gruppierung der vom Nutzer intendierten Ergebnisse basierend auf der Analyse und Vernetzung von Informationen;

Fig. 3 ein Flussdiagramm über den Ablauf einer weiteren einer erfindungsgemäßen Selektion basierend auf durch einen Nutzer definierten Informationen, also einem von einem Nutzer vorgegebenen Themenwunsch basierenden Informationen, und einer erfindungsgemäßen Sortierung und Gruppierung der vom Nutzer intendierten Ergebnisse basierend auf der Analyse und Vernetzung von Informationen; und

Fig. 4 in einer schematischen Darstellung eine Ausgestaltung einer erfindungsgemäßen Navigationskonzeptes.

Fig. 1 zeigt den schematischen Ablauf einer inkrementellen Analyse und Vernetzung von Informationen repräsentierenden Daten. Es wird für jede einzelne der Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand durchgeführt und bildet daher die Grundlage für die Bereitstellung insbesondere eines personalisierten Fernsehprogramms.

Der Schritt 1 startet die sequentielle Durchführung der Analyse und Vernetzung für eine der Informationen repräsentierenden Daten (Videos oder dergleichen). Zunächst wird ein Video V, vgl. Schritt 2, eingegeben und es wird in Schritt 3 überprüft, ob das Video V neu ist. Hiermit können bei Bedarf bisher erstellte Zusammenhänge in der Vernetzung auf ihre Gültigkeit hin geprüft werden. Falls das Video nicht neu ist, wird überprüft, ob das Video V bereits gesehen wurde, vgl. Schritt 4. Ist dies der Fall, erfolgt eine semantische (Nutzungs-) Analyse in Schritt 6, um beispielsweise im Sinne des maschinellen Lernens Zusammenhänge erstellen bzw. aktualisieren und/oder Gewichtungen der Videos aktualisieren zu können. Somit kann eine Trendverfolgung erfolgen. In Schritt 7 wird dieser Durchlauf der Analyse und Vernetzung beendet und ein erneuter Durchlauf für eine weitere der Informationen repräsentierenden Daten kann gestartet werden. Wurde das Video V bisher nicht angesehen, vgl. Schritt 4, entfällt die semantische (Nutzungs-) Analyse in Schritt 6 und das Verfahren endet nach der Abfrage 4, (vgl. Ende 5).

Wurde die Abfrage 3, ob ein eingegebenes Video V neu ist, positiv beantwortet, erfolgt zunächst eine Metadatenextraktion und Annotation des Videos V in Schritt 8. Schritt 8 basiert auf Regeln 9, welche beispielsweise eine Korrektur von fehlerhaften Metadaten, beispielsweise durch Schreibfehler, durch einen Abgleich mit beispielsweise einem Vokabular durchführt. Zusätzlich können Metadaten mit Synonymen von Stichwörtern durch beispielsweise einen Abgleich mit Thesaurus ergänzt werden. Ferner kann eine Ergänzung eines Volltextes durch eine Spracherkennung der Tonspur des Videos V erfolgen. Der Volltext kann durch eine Signifikanzberechnung, welche über die in der Tonspur enthaltenen Wörter durchgeführt wird, analysiert werden. Hieraus können automatisch weitere Stichwörter (Tags) ergänzt werden.

Anschließend erfolgt eine Klassifikation und Annotation des Videos V 10. Die Klassifikation und Annotation des Videos V 10 kann mit Hilfe von Ontologie 1 1 erfolgen. Vorzugsweise kann hierzu zunächst eine Berechnung der in den Stichwörtern (Tags) enthaltenen Kategorien entsprechend eines Verfahrens zur Berechnung eines Kategorienbaums erfolgen. Die Klassifikation kann durch einen Abgleich der Stichworte mit Ontologie und/oder Taxonomie anhand der Literate von hierarchisierten Konzepten durchgeführt werden. Zusätzlich können die Kategorien durch ein Metadatum bzw. Attribut des Videos V ergänzt werden.

Nachfolgend wird eine Qualitätsbewertung und Annotation des Videos V 12 anhand von definierten Regeln 13 durchgeführt. Für die spätere Auswahl der wiedergegeben Videos ist die Bewertung der Qualität der Videos essentiell. Insbesondere bei öffentlich zugänglichen Quellen gibt es starke Qualitätsschwankungen. Die Qualitätsbewertung erfolgt dabei anhand verschiedener Parameter beispielsweise der Auflösung des Videos V, der Bildstabilität als Indiz für eine professionelle Kameraführung, dem Rauschabstand des Tonsignals, die Länge des Videos, der Autor bzw. die Quelle des Videos und/oder der Qualität der Metadaten.

In den nachfolgenden Schritten 14 und 15 wird eine Metadatenanalyse (Syntaxanalyse) und eine Textanalyse (Musteranalyse) durchgeführt. Hierbei ist es das Ziel, eine semantische Vernetzung der Videos zu erreichen.

Anhand vorgefertigter Vorlagen 17 kann das Erstellen eines Ausschnittes für eine Anmoderation 16 erfolgen. Hierbei kann eine kurze Videosequenz erstellt werden, die für eine spätere Anmoderation des Videos V oder für eine Programmübersicht genutzt werden kann. Ist der Schritt 16 abgeschlossen, endet der Durchlauf der sequentiellen Durchführung der Analyse und Vernetzung von Informationen repräsentierenden Daten (Videos oder dergleichen) in Schritt 7. Fig. 2 zeigt den prinzipiellen Ablauf der Selektion basierend auf durch einen Nutzer definierte Informationen und der Sortierung und Gruppierung der vom Nutzer intendierten Ergebnisse basierend auf der Analyse und Vernetzung von Informationen. Der Ablauf nach Fig. 2 baut dabei auf den Ergebnissen des Ablaufs nach Fig. 1 auf, das heißt, dass der Ablauf nach Fig. 2 die Ergebnisse des Ablaufs nach Fig. 1 benötigt.

Nach dem Start 18 erfolgt zunächst eine Eingabe, indem ein Nutzer in Schritt 19 eine Anfrage A, welche die von ihm intendierten Ergebnisse liefern soll, eingibt. Daraufhin wird eine Query Q in Schritt 20 erstellt. Der inhaltliche Wunsch des Nutzers kann beispielsweise ein Fernsehmagazin oder bestimmtes Programm gemäß den aktuellen Vorlieben des Nutzers beinhalten. Die Eingabe kann hierbei vorzugsweise per Spracheingabe erfolgen.

In Schritt 21 wird die Ausführung der Suche mit der Query Q unter Zugriff auf ein Indexrepository 22 durchgeführt. Als Ergebnis hiervon entsteht eine Liste von Videoinhalten, die auf einer Selektion basierend auf durch einen Nutzer definierten Informationen basiert.

Anschließend erfolgt ein Clustering der Ergebnisse E bis E n in Schritt 23. Hierzu wird ein Inhaltnetz 24 mit Hilfe eines Clustering-Verfahrens analysiert. Das Inhaltsnetz ist das Ergebnis der inkrementell durchgeführten Analyse und Vernetzung von Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand. Hierbei werden die Ergebnisse inhaltlich gruppiert.

Es erfolgt eine Sortierung der Cluster Ci bis CN nach einer Heuristik Hi in Schritt 25. Die Cluster werden anhand der Heuristik in einer Reihenfolge sortiert. Dies kann anhand der folgenden Kriterien erfolgen:

- durchschnittliche Aktualität oder Chronologie;

- genreabhängige Regeln;

- konkrete Ereignisse vor allgemeinen Hintergründen, beispielsweise in Form von Nachrichten; - Portraits oder Interview von Ausschnitten aus dem Wirken einer Person;

- durchschnittliche Qualität; und/oder

- durchschnittliche Beliebtheit.

Das Erstellen von Anmoderationen in Schritt 26 erfolgt anhand eines Videorepositories 27. Dabei kann das gesamte Ergebnis oder die einzelnen Cluster jeweils eine Anmoderation erhalten. Die erstelle Anmoderation kann die besten Videoinhalte eines Clusters oder eine Kombination, also eine Zusammenfassung der vorproduzierten Anmoderationen einzelner Videoinhalte enthalten.

Die Videoinhalte innerhalb eines Clusters werden ebenfalls nach einer Heuristik H2 in einer Reihenfolge sortiert. Dies kann anhand eines Smart-Rankings im Sinne eines Verfahrens zur Suchoptimierung oder anhand der Qualität der Videoinhalte erfolgen. Dies findet in dem mit dem Bezugszeichen 28 versehenen Verfahrensschritt statt.

Fig. 3 zeigt eine weitere Ausführung einer erfindungsgemäßen Selektion basierend auf durch einen Nutzer definierten Informationen und einer erfindungsgemäßen Sortierung und Gruppierung der vom Nutzer intendierten Ergebnisse basierend auf der Analyse und Vernetzung von Informationen, wobei das Erstellen von Anmoderationen in Schritt 26 anhand von Videorepositories 27 nach der Sortierung der Ergebnisse in Ci nach einer Heuristik H 2 , vgl. Schritt 28, erfolgt. Die übrigen Verfahrensschritte sind mit den in Fig. 2 beschriebenen identisch. Der Ablauf nach Fig. 3 baut dabei auf den Ergebnissen des Ablaufs nach Fig. 1 auf, das heißt, dass der Ablauf nach Fig. 3 die Ergebnisse des Ablaufs nach Fig. 1 benötigt.

Es erfolgt eine Ausgabe des Ergebnisses Ei im Cluster Ci 29, womit der schematische Ablauf in Schritt 30 endet.

Fig. 4 zeigt ein besonders einfaches und innovatives Steuerungs- bzw. Navigationskonzept, welches zur Verwendung innerhalb des erfindungsgemäßen Verfahrens geeignet ist. Ein Nutzer kann einfach und intuitiv die Steuerung bzw. Navigation innerhalb des erfindungsgemäßen Verfahrens auf einem Videoendgerät oder einer Fernbedienung 31 durchführen.

Das Endgerät 31 kann dazu eine Anzeigevorrichtung 32 aufweisen, insbesondere eine berührungssensitive Anzeigevorrichtung, wie sie bereits heute weit verbreitet ist.

Die Steuerung bzw. Navigation erfolgt entlang zwei Achsen, einer horizontalen und einer vertikalen.

Grundsätzlich ist die Steuerung bzw. Navigation auch durch die Betätigung auf einem Tasten aufweisenden Endgerät durchführbar. Vorteilhafterweise erfolgt die Steuerung bzw. Navigation anhand der Eingabe von Gesten.

Eine sogenannte Wisch-Geste nach links 33 bzw. nach rechts 34 führt im Ausführungsbeispiel zu alternativen Videos auf der gleichen thematischen Ebene der aktuellen Angabe, also zu Videos innerhalb des Clusters der aktuellen wiedergegebenen Ausgabe.

Eine Wisch-Geste nach oben 35 bzw. nach unten 36 führt zu einem Wechsel zum vorherigen bzw. folgenden Themengebiet ausgehend von der aktuellen wiedergegebenen Ausgabe, also zum vorherigen bzw. folgenden Cluster von Videos.

Die in den Figuren der Zeichnung dargestellten Ausführungsbeispiele und die im Zusammenhang mit diesen erläuterten Ausführungsbeispiele dienen lediglich der Erläuterung der Erfindung und sind für diese nicht beschränkend.