Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SYSTEM AND METHOD FOR LANGUAGE DETECTION FOR STRUCTURED DATA
Document Type and Number:
WIPO Patent Application WO/2011/054324
Kind Code:
A1
Abstract:
To date, I am not aware of any method which utilizes available data schemes to directly produce a grammar for configuring a piece of voice recognition software so as thereby to improve the level of recognition and to directly produce instances of the data scheme. The level of recognition for the spoken input is very high and will in practice result in this form of detection being implemented for geodata (compulsion for in-situ detection). Areas of application may be street tree documentation or street state detection, for example. For document review, areas of application in the field of inspection documentation - for example for the maintenance and inspection of complex technical facilities - are probable.

Inventors:
STOLL, Bertram (Adinda-Flemmich-Strasse 25, Freiburg, 79100, DE)
Application Number:
DE2009/001559
Publication Date:
May 12, 2011
Filing Date:
November 05, 2009
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
STOLL, Bertram (Adinda-Flemmich-Strasse 25, Freiburg, 79100, DE)
International Classes:
G10L15/18
Download PDF:
Claims:
ANSPRÜCHE

Geltend gemachte Ansprüche:

1. Eine Methode, die für ein vorhandenes Datenschema eine Spracherkennungsgrammatik mit typischer - aber nicht notwendigerweise - eingeschränktem Vokabular erstellt und die einer Spracherkennungsanwendung ermöglicht, in diesem Schema definierte Datenstrukturen mit hoher Erkennungsrate natürlichsprachlich zu erfassen, zu ändern oder zu löschen.

2. Anspruch 1 gilt unabhängig von der zum Einsatz kommenden Hardware und

Betriebssystemplattform.

3. Anspruch 1 gilt unabhängig von der Art und Weise der Speicherung des

Datenschemaformates und der Daten (XML Datei, HTML Datei, durch

Positionsdefinitionen wie beispielsweise Textmarken strukturiertes Textdokument, Datenbankschema) .

4. Anspruch 1 gilt unabhängig von der zum Einsatz kommenden Spracherkennungssoftware.

5. Anspruch 1 gilt unabhängig davon, ob die erfassten oder geänderten Daten direkt (online) oder nachträglich (offline) in der Datenschemainstanz gespeichert werden.

6. Anspruch 1 gilt unabhängig davon, ob ein automatisch arbeitender Schemaextraktor

(Zeichnung 1, Detail 3) zum Einsatz kommt.

7. Anspruch 1 gilt unabhängig davon, ob ein automatisch arbeitender Grammatikgenerator (Zeichnung 1 Detail 5) zum Einsatz kommt.

Description:
SYSTEM UND METHODE ZUR SPRACHLICHEN ERFASSUNG VON STRUKTURIERTEN DATEN

BESCHREIBUNG

HINTERGRUND

Die vor Ort Erfassung von strukturierten Daten mit mobilen Eingabegeräten ist in den allermeisten Fällen nur sehr mühsam zu bewältigen. Erschwerende Faktoren sind in der Regel klein ausfallende Bildschirme, welche die Werteauswahl durch Stifteingabe erschweren, nicht vorhandene oder klein ausfallende Tastaturen und/oder Sonneneinstrahlung, die zu Unleserlichkeit des Bildschirms führen kann.

Um diesem Umstand entgegenzuwirken, wird ein System beschrieben, welches diese

Erschwernisse durch Spracheingabe umgeht. Ein wesentliches Merkmal ist dabei die Erlangung einer hohen Erkennungsgenauigkeit durch die automatische Auswertung und Umsetzung der vorhandenen Datenschemata in eine für diesen Spracherkennungszweck eingeschränkte und voll verwertbare Semantik.

ERLÄUTERUNGEN ZU ZEICHNUNG 1

Zeichnung 1 zeigt ein Blockdiagramm zur Struktur des Gesamtsystems mit folgenden Details:

1) Versinnbildlicht ein Datenschema. Dabei handelt es sich um stralcturierte Daten, unabhängig davon ob diese in einer Datenbank abgelegt oder beispielsweise in einem Textdokument durch Textmarken strukturiert sind.

2) Versinnbildlicht die Verbindung zwischen einem Schemaextraktor und dem Datenschema, unabhängig davon ob es sich um eine off- oder online Verbindung zum Datenschema handelt.

3) Versinnbildlicht eine Anwendung, die über 2) ein Schema generiert.

4) Versinnbildlicht den Datenfluss vom Schemaextraktor zum Grammatikgenerator.

5) Versinnbildlicht eine Anwendung, die aus dem extrahierten Schema eine für die

Spracherkennungsanwendung 7) verwertbare Grarnmatikbeschreibung erstellt.

6) Versinnbildlicht den off- oder online Datenfluss von 5) nach 7).

7) Versinnbildlicht die eigentliche Spracherkennungsanwendung.

8) Versinnbildlicht den Datenfluss von der Spracherkennungsanwendung zu einem

9) Adapter, der im off- oder online Modus

10) die Datenübertragung zur persistenten Speicherung der erfassten Operationen und Daten in einer BESCHREIBUNG

11) Instanz des Datenschemas durchführt.

12) Steht für die Spracheingabe durch den Benutzer, welche durch einen entsprechendes

13) Audiogerät an 7) weitergegeben wird. Umgekehrt werden dynamisch Meldungen der Spracherkennungssoftware durch einen Feedback Kanal (Lautsprecher) an den Benutzer zurückgegeben.

BESCHREIBUNG IM DETAIL

Zeichnung 1 gibt einen schematischen Überblick zu den eingesetzten Komponenten. Es ist zu beachten, dass eine Implementierung im Einzelnen von diesen Komponenten abweichen kann. Es können Komponenten hinzukommen, Komponenten weggelassen oder anders arrangiert werden. Die zentrale Aussage der weiter unten geltend gemachten Ansprüche soll davon nicht berührt werden.

Die ,proof-of-concep Implementierung dieses Konzeptes erzeugt aus einem

Baumpflegedatenschema in einer relationalen Geodatenbank eine Grammatik zur Steuerung einer Spracherkennungsanwendung. Diese Anwendung erlaubt das Einfügen, Löschen und Ändern vorhandener Datenbankentitäten vom Typ Baum, wobei alle Befehle und das Setzen der

Attributwerte einer konkreten Entität über Spracheingabe erfolgen. Es handelt sich dabei um eine reine Mensch - Maschine Kommunikation ohne weitere zwischengeschaltete menschliche Vermittler (Agenten). Die Maschine gibt über eine TTS (text to Speech engine) Rückmeldung an den Anwender.

Es ist unerheblich, ob die Anbindung an die Datenschemainstanz im offline oder online Modus erfolgt. Im Falle einer offline Anbindung, werden die Daten in Dateisystemdateien

zwischengespeichert und später von einem offline Adapter in die Instanz transportiert.

Des weiteren wird aus den in einem Textdokument definierten Textmarken eine Grammatik zur Besprechung des Textdokumentes erzeugt. Die Rolle der relationalen Datenbank übernimmt in diesem Falle das Textdokument.