Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND APPARATUS FOR IMPROVING RECOGNITION ACCURACY FOR THE HANDWRITTEN INPUT OF ALPHANUMERIC CHARACTERS AND GESTURES
Document Type and Number:
WIPO Patent Application WO/2017/072307
Kind Code:
A1
Abstract:
A method for automatically selecting one of multiple recognition algorithms for handwritten input of alphanumeric characters and/or gestures into a selected input field displayed on a screen using a touch-sensitive input apparatus comprises the performance of optical character recognition in an area of the screen that comprises at least the input field and the closer surroundings of the input field, or the performance of voice recognition for a voice statement audibly output after the selected input field is displayed. In the result of the optical character recognition or of the voice recognition, terms describing field types are sought, and a recognition algorithm adapted for a field type found in the result of the optical character recognition or of the voice recognition is selected. Optionally, the allowable stock of values for the characters to be recognised can also be disclosed dynamically for the next character(s) on the basis of the input, e.g. if the input denotes an element in a database and/or must comply with certain structure rules.

Inventors:
SCHILD BERNHARD (DE)
Application Number:
PCT/EP2016/076102
Publication Date:
May 04, 2017
Filing Date:
October 28, 2016
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
CONTINENTAL AUTOMOTIVE GMBH (DE)
International Classes:
G06F3/023; G06F3/0488; G06F9/54; G10L15/26; H04L29/08; G06V30/10
Foreign References:
US20130157727A12013-06-20
EP2088536A12009-08-12
US20090125224A12009-05-14
US7489415B22009-02-10
US20140201102A12014-07-17
Download PDF:
Claims:
Patentansprüche

1. Verfahren zur automatischen Auswahl eines von mehreren

Erkennungsalgorithmen oder eines von mehreren Parameter- Sätzen für einen Erkennungsalgorithmus für eine hand¬ schriftliche Eingabe von alphanumerischen Zeichen und/oder Gesten in ein auf einem Bildschirm angezeigtes, ausgewähltes Eingabefeld über eine berührungsempfindli¬ che Eingabevorrichtung, umfassend:

- Durchführen einer optischen Zeichenerkennung in einem

Bereich des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds einschließt, oder Durchführen einer Spracherkennung für einen nach dem Anzeigen des ausgewählten Eingabefelds akustisch ausgegebenen Sprachhinweis,

- Suchen von Feldtypen beschreibenden Begriffen in dem Ergebnis der optischen Zeichenerkennung oder der Spracherkennung, und

- Auswahl eines für einen in dem Ergebnis der optischen Zeichenerkennung oder der Spracherkennung aufgefundenen Feldtyp angepassten Erkennungsalgorithmus oder Pa¬ rametersatzes für den Erkennungsalgorithmus.

2. Verfahren nach Anspruch 1, wobei die optische Zeichener- kennung umfasst:

- Übertragen zumindest des Bereichs des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds einschließt, an eine Vorrichtung oder ein Computerprogramm zur optischen Zeichenerkennung, und - Empfangen des Ergebnisses der optischen Zeichenerkennung .

3. Verfahren nach Anspruch 1, wobei die Spracherkennung umfasst :

- Aufzeichnen des akustisch ausgegebenen Sprachhinweises oder Empfangen eines den akustischen Sprachhinweis repräsentierenden Signals, und - Empfangen des Ergebnisses der Spracherkennung.

Verfahren nach Anspruch 3, wobei das den akustischen Sprachhinweis repräsentierende Signal eine digitale oder analoge Repräsentation von über einen oder mehrere Lautsprecher ausgegebene elektrische Signale oder ein Steu¬ ersignal für eine Text-zu-Sprache Ausgabeeinheit ist.

Verfahren nach Anspruch 1, wobei die optische Zeichenerkennung oder die Spracherkennung nach dem Auswählen eines von mehreren Eingabefeldern auf dem Bildschirm erfolgt .

Vorrichtung zur automatischen Auswahl eines von mehreren Erkennungsalgorithmen für eine handschriftliche Eingabe von alphanumerischen Zeichen und/oder Gesten in ein auf einem Bildschirm angezeigtes, ausgewähltes Eingabefeld über eine berührungsempfindliche Eingabevorrichtung, um¬ fassend:

- erste Mittel, die dazu eingerichtet sind, eine opti¬ sche Zeichenerkennung in einem Bereich des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds einschließt, durchzuführen, oder die dazu eingerichtet sind, eine Spracherkennung für einen nach dem Anzeigen des ausgewählten Eingabefelds akustisch ausgegebenen Sprachhinweis durchzuführen ;

- zweite Mittel, die dazu eingerichtet sind, nach Feld¬ typen beschreibenden Begriffen in dem Ergebnis der optischen Zeichenerkennung oder der Spracherkennung zu suchen, und

- dritte Mittel, die dazu eingerichtet sind, einen für einen in dem Ergebnis der optischen Zeichenerkennung oder der Spracherkennung aufgefundenen Feldtyp ange- passten Erkennungsalgorithmus oder Parametersatz für den Erkennungsalgorithmus auszuwählen. Vorrichtung nach Anspruch 6, ferner umfassend ein viertes Mittel, das dazu eingerichtet ist, einen Erkennungs¬ algorithmus oder Parametersatz für den Erkennungsalgo¬ rithmus in Abhängigkeit von möglichen einzugebenden Zeichen oder Gesten auszuwählen, wobei die möglichen einzugebenden Zeichen oder Gesten aus vorhergehenden Eingaben bestimmt werden, und wobei die Bestimmung nach sprachlichen Regeln oder mittels Abgleich von in einer Datenbank gespeicherten Worten erfolgt.

Vorrichtung nach Anspruch 6 oder 7, wobei eines oder mehrere der ersten, zweiten, dritten und/oder vierten Mittel einen oder mehrere Mikroprozessoren und mit den einen oder mehreren Mikroprozessoren in kommunikativer Verbindung stehenden Arbeitsspeicher und nicht-flüchtigen Speicher aufweisen, wobei jeweilige nicht-flüchtige Speicher Computer-Programminstruktionen speichern die, wenn sie von den ein oder mehreren Mikroprozessoren in den jeweiligen Arbeitsspeicher geladen und ausgeführt werden, die Ausführung jeweilige Schritte des Verfahrens nach einem oder mehreren der Ansprüche 1 bis 6 bewirken, wobei die ersten, zweiten und dritten Mittel zusammenge¬ nommen alle Schritte des Verfahrens ausführen.

Vorrichtung nach einem der Ansprüche 6 bis 8, wobei der Bildschirm, die ersten, zweiten, dritten und/oder vierten Mittel räumlich voneinander getrennt angeordnet und mittels eines oder mehrerer Kommunikationsnetze mitein¬ ander verbunden sind.

Kraftfahrzeug mit einer Vorrichtung nach einem oder mehreren der Ansprüche 6 bis 9.

GEÄNDERTE ANSPRÜCHE

beim Internationalen Büro eingegangen am 16. Februar 2017 (16.02.2017)

Verfahren zur automatischen Auswahl eines von mehreren Erkennungsalgorithmen oder eines von mehreren Parametersätzen für einen Erkennungsalgorithmus für eine handschriftliche Eingabe von alphanumerischen Zeichen und/oder Gesten in ein auf einem Bildschirm angezeigtes, ausgewähltes Eingabefeld über eine berührungsempfindliche Eingabevorrichtung, umfassend:

- Durchführen einer optischen Zeichenerkennung in einem Bereich des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds einschließt, oder Durchführen einer Spracherkennung für einen nach dem Anzeigen des ausgewählten Eingabefelds akustisch ausgegebenen Sprachhinweis,

- Suchen von Begriffen in dem

Ergebnis der optischen Zeichenerkennung oder der

Spracherkennung, anhand welcher der Feldtyp des Eingabefelds bestimmt werden kann;

Bestimmung des Feldtyps anhand der gefundenen Begriffe; und

- Auswahl eines für einen in dem Ergebnis der optischen Zeichenerkennung oder der Spracherkennung aufgefundenen Feldtyp angepassten Erkennungsalgorithmus oder Parametersatzes für den Erkennungsalgorithmus.

Verfahren nach Anspruch 1, wobei die optische Zeichenerkennung umfasst:

- Übertragen eines Abbilds dessen, was auf zumindest einem Bereich des Bildschirms dargestellt ist, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds einschließt, an eine Vorrichtung oder ein Computerprogramm zur optischen Zeichenerkennung, und

- Empfangen des Ergebnisses der optischen Zeichenerkennung .

GEÄNDERTES BLATT (ARTIKEL 19) Verfahren nach Anspruch 1, wobei die Spracherkennung um- fasst :

- Aufzeichnen des akustisch ausgegebenen Sprachhinweises oder Empfangen eines den akustischen Sprachhinweis repräsentierenden Signals, und

- Empfangen des Ergebnisses der Spracherkennung.

Verfahren nach Anspruch 3, wobei das den akustischen Sprachhinweis repräsentierende Signal eine digitale oder analoge Repräsentation von über einen oder mehrere Lautsprecher ausgegebene elektrische Signale oder ein Steuersignal für eine Text -zu- Sprache Ausgabeeinheit ist.

Verfahren nach Anspruch 1, wobei die optische Zeichenerkennung oder die Spracherkennung nach dem Auswählen eines von mehreren Eingabefeldern auf dem Bildschirm erfolgt.

Vorrichtung zur automatischen Auswahl eines von mehreren Erkennungsalgorithmen für eine handschriftliche Eingabe von alphanumerischen Zeichen und/oder Gesten in ein auf einem Bildschirm angezeigtes, ausgewähltes Eingabefeld über eine berührungsempfindliche Eingabevorrichtung, umfassend:

- erste Mittel, die dazu eingerichtet sind, eine optische Zeichenerkennung in einem Bereich des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds einschließt, durchzuführen, oder die dazu eingerichtet sind, eine Spracherkennung für einen nach dem Anzeigen des ausgewählten Eingabe - felds akustisch ausgegebenen Sprachhinweis durchzuführen;

- zweite Mittel, die dazu eingerichtet sind, nach Feldtypen beschreibenden Begriffen in dem Ergebnis der optischen Zeichenerkennung oder der Spracherkennung zu suchen, und

- dritte Mittel, die dazu eingerichtet sind, einen für

GEÄNDERTES BLATT (ARTIKEL 19) einen in dem Ergebnis der optischen Zeichenerkennung oder der Spracherkennung aufgefundenen Feldtyp ange- passten Erkennungsalgorithmus oder Parametersatz für den Erkennungsalgorithmus auszuwählen.

Vorrichtung nach Anspruch 6, ferner umfassend ein viertes Mittel, das dazu eingerichtet ist, einen Erkennungs- algprithmus oder Parametersatz für den Erkennungsalgorithmus in Abhängigkeit von möglichen einzugebenden Zeichen oder Gesten auszuwählen, wobei die möglichen einzugebenden Zeichen oder Gesten aus vorhergehenden Eingaben bestimmt werden, und wobei die Bestimmung nach sprachlichen Regeln oder mittels Abgleich von in einer Datenbank gespeicherten Worten erfolgt.

Vorrichtung nach Anspruch 6 oder 7, wobei eines oder mehrere der ersten, zweiten, dritten und/oder vierten Mittel einen oder mehrere Mikroprozessoren und mit den' einen oder mehreren Mikroprozessoren in kommunikativer Verbindung stehenden Arbeitsspeicher und nicht- flüchtigen Speicher aufweisen, wobei jeweilige nicht-flüchtige Speicher Computer-Programminstruktionen speichern die, wenn sie von den ein oder mehreren Mikroprozessoren in den jeweiligen Arbeitsspeicher geladen und ausgeführt werden, die Ausführung jeweilige Schritte des Verfahrens nach einem oder mehreren der Ansprüche 1 bis 6 bewirken, wobei die ersten, zweiten und dritten Mittel zusammengenommen alle Schritte des Verfahrens ausführen.

Vorrichtung nach einem der Ansprüche 6 bis 8, wobei der Bildschirm, die ersten, zweiten, dritten und/oder vierten Mittel räumlich voneinander getrennt angeordnet und mittels eines oder mehrerer Kommunikationsnetze miteinander verbunden sind.

Kraftfahrzeug mit einer Vorrichtung nach einem oder mehreren der Ansprüche 6 bis 9.

GEÄNDERTES BLATT (ARTIKEL 19)

Description:
Beschreibung

Verfahren und Vorrichtung zur Verbesserung der Erkennungsgenauigkeit bei der handschriftlichen Eingabe von alphanumerischen Zeichen und Gesten

Gebiet der Technik

Die vorliegende Erfindung bezieht sich auf das Gebiet der Be ¬ nutzerinterfaces, insbesondere auf die handschriftliche Ein ¬ gabe von Buchstaben und Zahlen oder Gesten auf einem berührungsempfindlichen Bildschirm oder einer von einem Bildschirm separat angeordneten berührungsempfindlichen Eingabeeinheit.

Hintergrund

Moderne Kraftfahrzeuge sind mit einer Vielzahl von Benutzer ¬ interfaces zur Bedienung der unterschiedlichsten Funktionen ausgestattet. Unter den Benutzerinterfaces finden sich in jüngster Zeit zunehmend berührungsempfindliche Bildschirme oder berührungsempfindliche Eingabeeinheiten, die in zentra ¬ ler Lage gut erreichbar für den Fahrer eines Kraftfahrzeugs angebracht sind. Entsprechend sind in den modernen Kraftfahr ¬ zeugen Computersysteme vorgesehen, die dazu eingerichtet sind, die für die Bedienung des Kraftfahrzeugs oder der in dem Kraftfahrzeug verbauten Systeme erforderlichen Benutzereingaben über die berührungsempfindlichen Bildschirme oder die berührungsempfindlichen Eingabeeinheiten zu erfassen.

Die Computersysteme in modernen Kraftfahrzeugen sind häufig leistungsfähig genug, um mit zusätzlichen Applikationen und Programmen erweitert zu werden und zusätzliche Funktionen be ¬ reitzustellen. Diese zusätzlichen Applikationen und Programme benötigen in der Regel ebenfalls Benutzereingaben während der Aus führung .

Wenn die Eingabe alphanumerischer Zeichen erforderlich ist kann beispielsweise die Einblendung einer virtuellen Tastatur auf einem berührungsempfindlichen Bildschirm erfolgen. Die Eingabe alphanumerischer Zeichen kann jedoch auch über eine Handschrifterkennung erfolgen, bei der der Benutzer Buchstaben und Zahlen auf dem berührungsempfindlichen Bildschirm oder auf einer von dem Bildschirm separat angeordneten berührungsempfindlichen Eingabeeinheit, auch als Touchpad bekannt, mit einem Finger oder einem geeigneten Gegenstand schreibt .

Wegen der begrenzten Größe der in Kraftfahrzeugen angeordneten berührungsempfindlichen Bildschirme oder der berührungsempfindlichen Eingabeeinheiten ist eine direkte handschriftliche Eingabe alphanumerischer Zeichen in dafür vorgesehene Felder einer Eingabemaske nicht pragmatisch. Insbesondere er ¬ fordert die aus der begrenzten Größe der Bildschirme resul ¬ tierende geringe Größe der Eingabefelder eine Konzentration auf die handschriftliche Eingabe der Zeichen, die mit dem si ¬ cheren Betrieb eines Kraftfahrzeugs im Straßenverkehr nicht vereinbar ist. Aus diesem Grund erfolgt die handschriftliche Eingabe alphanumerischer Zeichen üblicherweise als eine nacheinander erfolgende Eingabe einzelner Zeichen. Hierbei ist "nacheinander" im Sinne eines zeitlichen Ablaufs gemeint. Je nach Größe des 2-dimensionalen Eingabefeldes kann die Eingabe auf diesem Feld hintereinander oder auch übereinander erfolgen .

Die Erkennung über eine berührungsempfindliche Eingabeeinheit oder einen berührungsempfindlichen Bildschirm handschriftlich eingegebener alphanumerischer Zeichen und Gesten kann zuverlässiger erfolgen, wenn nur eine begrenzte Auswahl von Zeichen oder Gesten zugelassen ist. Die für eine Benutzereingabe jeweils zulässigen Zeichen oder Gesten sind dabei von dem zu bedienenden System oder Programm bzw. der zu bedienenden Applikation abhängig. Innerhalb eines Programms oder einer Applikation können unterschiedliche Eingabefelder vorgesehen sein, für welche wiederum eine individuelle begrenzte Auswahl von Zeichen oder Gesten zulässig ist. Um einen angepassten Erkennungsalgorithmus für die handschriftliche Eingabe alpha ¬ numerischer Zeichen und Gesten bereitzustellen muss das zu bedienende System oder Programm bzw. die zu bedienende Applikation eine entsprechende Information an den Systemteil über ¬ geben, der die Auswertung der handschriftlichen Eingabe übernimmt. Wenn diese Information nicht vorliegt muss ein allge ¬ meiner Erkennungsalgorithmus verwendet werden, was zu einer weniger zuverlässigen Erkennung der handschriftlich eingegebenen Zeichen führen kann. So ist es beispielsweise sehr schwierig, zwischen der handschriftlichen Eingabe des Buchstaben „0" und der Ziffer „null" zu unterscheiden, wenn ein Eingabefeld nicht ausschließlich für Buchstaben oder ausschließlich für Zahlen vorgesehen ist, und diese Information der Handschrift-Erkennungsvorrichtung zur Verfügung steht.

An diesem Beispiel wird klar, dass eine Mustererkennung allein anhand der geometrischen Analyse der Trajektorien allein nicht zum Ziel führt. Hier kann nur eine Berücksichtigung des Anwendungskontextes weiterhelfen. Ferner kann auch die Kennt ¬ nis von Datenbank-Inhalten weiterhelfen, falls sich die Eingabe hierauf bezieht, oder aber auch die Kenntnis von Struk ¬ turregeln wie z. B. Regeln für den Aufbau von gültigen Telefonnummern, die von Land zu Land unterschiedlich sein können. Ansonsten kann die Handschriftenerkennung die Kontextinformation nutzen um die Handschrifteingaben unter Verwendung von mit Häufigkeitsangaben versehenen, kontextspezifischen Wörterbüchern unter Berücksichtigung von generellen statistischen Sprachinformationen wie z. B. Bigramm- und Trigramm- Häufigkeiten usw. zu verbessern.

Die Bereitstellung angepasster virtueller Tastaturen für bestimmte Eingabefelder ist von Tablet-Computern und Mobiltelefonen mit berührungsempfindlichen Bildschirmen bekannt. So kann beispielsweise die Platzierung des Cursors in einem Ein ¬ gabefeld für eine E-Mail-Adresse dazu führen, dass die einge ¬ blendete virtuelle Tastatur Tasten für spezielle Zeichen zeigt, die üblicherweise in E-Mail-Adressen verwendet werden, beispielsweise ein „@"-Zeichen . Wenn der Cursor in einem Ein- gabefeld für eine Telefonnummer platziert ist kann die einge ¬ blendete virtuelle Tastatur aus einem Ziffernblock bestehen.

Die Bereitstellung angepasster virtueller Tastaturen erfolgt jedoch nur dann, wenn die jeweilige Applikation bzw. das jeweilige Programm, bei dessen Bedienung eine Eingabe erforderlich ist, der Programmroutine, die für die Einblendung der virtuellen Tastatur verantwortlich ist, eine entsprechende Information übergibt. Die Übergabe einer entsprechenden In- formation ist beispielsweise aus dem HTML 5-Standard bekannt (Attribut „input type") . Wenn die Applikation bzw. das Pro ¬ gramm die erforderliche Information nicht übergibt wird eine Standardtastatur eingeblendet, bei der eventuell benötigte Zeichen nicht auf der ersten Ebene verfügbar sind, sondern erst nach einem Umschalten in eine andere Ebene der Tastatur.

Eine automatische Anpassung oder Auswahl von Erkennungsalgo ¬ rithmen für die optische Zeichenerkennung (Optical Character Recognition, OCR) für eine begrenzte Auswahl von Zeichen ohne die Bereitstellung einer entsprechenden Information durch ein System oder Programm bzw. eine Applikation ist aus der

US 7,489,415 B2 bekannt. Bei dem bekannten System erfolgt die Einstellung anhand der Koordinaten eines Eingabeorts auf ei ¬ nem zuvor ausgefüllten Formular. Dabei ist für jeden Eingabe- ort eines jeden Formulars in dem System eine Feldtype hinter ¬ legt .

Eine andere Art der automatischen Anpassung oder Auswahl von Erkennungsalgorithmen für die optische Zeichenerkennung für eine begrenzte Auswahl von Zeichen, die in unterschiedliche Felder von Formularen eingegeben sind, ist aus der

US 2014/0201102 AI bekannt. Hierbei wird die Feldtype eines jeweiligen Eingabefelds durch optische Zeichenerkennung des Formulars bestimmt, und erst danach der handschriftlich aus- gefüllte Teil des jeweiligen Felds mit dem angepassten oder ausgewählten Erkennungsalgorithmus ausgewertet. Die bekannten Arten der automatischen Anpassung oder Auswahl von Erkennungsalgorithmen sind jedoch nicht für eine noch bevorstehende handschriftliche Eingabe von Zeichen oder Gesten auf einem berührungsempfindlichen Bildschirm oder einer be- rührungsempfindlichen Eingabeeinheit geeignet, weil hier kei ¬ ne optische Erfassung eines Formulars und entsprechende Aus ¬ wertung von Eingabeorten oder Namen von Formularfeidern möglich ist . Zusammenfassung der Erfindung

Technische Aufgabe

Es ist eine Aufgabe der Erfindung, ein Verfahren und eine Vorrichtung zur automatischen Auswahl oder Anpassung von Erkennungsalgorithmen für eine handschriftliche Eingabe von Zeichen oder Gesten auf einem berührungsempfindlichen Bildschirm oder einer berührungsempfindlichen Eingabeeinheit anzugeben, die nicht auf von zu dem jeweiligen bedienenden Sys- tem oder Programm bzw. der zu Bedienenden Applikation gelieferte Informationen zu Feldtypen angewiesen sind.

Technische Lösung Diese Aufgabe wird gelöst durch das in Anspruch 1 angegebene Verfahren und die in Anspruch 7 angegebene Vorrichtung. Vorteilhafte Weiterentwicklungen und Ausgestaltungen des Verfahrens und der Vorrichtung sind in den jeweiligen abhängigen Ansprüchen angegeben.

Ein erfindungsgemäßes Verfahren zur automatischen Auswahl eines von mehreren Erkennungsalgorithmen für eine handschriftliche Eingabe von alphanumerischen Zeichen und/oder Gesten in ein auf einem Bildschirm angezeigtes, ausgewähltes Eingabe- feld über eine berührungsempfindliche Eingabevorrichtung um- fasst das Durchführen einer optischen Zeichenerkennung in einem Bereich des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds umfasst. Alternativ kann eine Spracherkennung für einen nach dem Anzeigen des ausgewählten Eingabefelds akustisch ausgegebenen Sprachhinweis erfolgen. Dabei kann es sinnvoll sein, die optische Zei chenerkennung oder die Spracherkennung erst nach dem Auswählen eines von mehreren Eingabefeldern auf dem Bildschirm durchzuführen .

Dabei sind 2 Fälle zu unterscheiden. Wenn der Sprachhinweis lokal im gleichen System erstellt wurde, sind i. A. schon ge eignete Kontext Information lokal in diesem System vorhanden In anderen Fällen, z. B. wenn der Sprachhinweis von z. B. ei nem Cloud-Server erhalten wird, ist ein Spracherkenner zu verwenden, der lokal oder wiederum in einem anderen Cloudser ver zur Verfügung gestellt wird, um die notwendigen Kontextinformationen zu bestimmen. Alternativ zu einem Cloudserver kann auch ein geeignetes Smartphone verwendet werden, dass z. B. lokal an das System gekoppelt ist.

Durch die optische Zeichenerkennung werden Textbestandteile in dem Erkennungsbereich erkannt und können einer Analyse zu geführt werden, mit der nach Hinweisen auf die Art der einzu gebenden Zeichen oder Gesten gesucht wird. Die Art der einzu gebenden Zeichen oder Gesten ist dabei von dem Typ des Einga befelds abhängig. Wenn in der Umgebung des Eingabefelds bei ¬ spielsweise eines der Worte „Rufnummer", „Telefonnummer", ei ne entsprechende Abkürzung davon oder ein Telefonsymbol auf dem Bildschirm wiedergegeben ist, kann davon ausgegangen wer den, dass Zahlen oder Ziffern in das Eingabefeld einzugeben sind. Wenn in der Umgebung des Eingabefelds Worte wie „Ort" oder „Straße" gefunden werden, kann davon ausgegangen werden dass Buchstaben in das Eingabefeld einzugeben sind. Der Erkennungsalgorithmus bzw. ein für die Erkennung von Zahlen oder Buchstaben angepasster Parametersatz für einen Erkennungsalgorithmus für die handschriftliche Eingabe kann ent ¬ sprechend ausgewählt werden. Gleiches gilt entsprechend für einen mit dem Anzeigen des Eingabefelds akustisch ausgegebe- nen Sprachhinweis: Wenn beim Einblenden oder Auswählen des Eingabefelds ein Sprachhinweis wie zum Beispiel „Bitte geben Sie eine Telefonnummer ein" erfolgt, kann durch Analyse des mittels Spracherkennung in Text umgesetzten Sprachhinweises darauf geschlossen werden, dass Zahlen oder Ziffern in das Eingabefeld einzugeben sind.

Selbstverständlich ist es möglich, bei der Analyse und Suche nach Feldtypen beschreibenden Begriffen auch Begriffe in un- terschiedlichen Sprachen zu berücksichtigen. Eine Erweiterung der entsprechenden Datenbank stellt nur geringfügig höhere Anforderungen an den benötigten Speicherplatz und ist einfach zu implementieren. Es ist auch vorstellbar, bevorzugt zunächst Begriffe in der Sprache zu erkennen, die für das Mensch-Maschine-Interface von dem Benutzer ausgewählt wurde, und erst danach eine Erkennung für andere Sprachen durchzuführen .

Die Auswertung des Bildschirminhaltes umfasst auch die Aus- wertung eines sogenannten Spellers, der bei fortlaufender Eingabe von Buchstaben die nächsten Möglichkeiten vorgibt. Ein Beispiel ist die Eingabe von Städtenamen bei einer Ziel ¬ eingabe bei einer Navigation, bei der nach vorheriger Eingabe eines Buchstabens der Wertevorrat für einen Folgebuchstaben oftmals erheblich eingeschränkt wird. Bei Erkennen eines

Spellers wird dem Handschriftenerkenner der zulässige Werte ¬ vorrat für das nächste Schriftzeichen immer aktuell mitge ¬ teilt. Falls vorhanden, können auch zulässige Folgen von mehreren Zeichen für die nächste Eingaben bekannt gegeben wer- den.

Bei einer Ausgestaltung der Erfindung wird für die optische Zeichenerkennung zumindest ein Bereich des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Einga- befelds umfasst, an eine Vorrichtung oder Programmroutine zur optischen Zeichenerkennung übertragen, die das Ergebnis der Erkennung bereitstellt. Die Übertragung kann beispielsweise direkt aus dem Grafik-Speicher einer Bildschirmansteuerungs- einheit erfolgen, beispielsweise als RGB Bitmap, bei der der Bildschirminhalt oder die übertragenen Teile des Bildschirm ¬ inhalts als Pixel-Darstellung vorliegen. Bei einigen Betriebssystemen sind bereits Funktionen vorgesehen, die es ermöglichen, ein Abbild des Bildschirms oder eines Fensters auf dem Bildschirm, einen sogenannten Snapshot, zu erstellen und an andere Programme oder Applikationen zu übergeben. Hierzu gehören beispielsweise Betriebssysteme, die die Grafikausgabe über einen nach dem Wayland Display Server Protocol arbeitenden Compositor durchführen. Das übertragene Abbild des Bild ¬ schirminhalts kann dann beispielsweise mit einem handelsübli ¬ chen Programm zur optischen Zeichenerkennung auf Textinhalte und die Position der Texte relativ zu dem Eingabefeld auf dem Bildschirm untersucht werden. Zu den Texten und gegebenenfalls zu deren Position sind dann in einer Datenbank Verweise auf den Feldtyp bzw. die Art der Texteingabe abgelegt. Die Größe des das Eingabefeld einschließenden Bereichs kann dabei vorgegeben oder von einem Benutzer einstellbar sein. Es ist auch vorstellbar, dass der Benutzer das Eingabefeld zur Auswahl auf einem berührungsempfindlichen Bildschirm mit dem Finger oder einem geeigneten Gegenstand umkreist und dadurch den Bereich festlegt.

Bei einer anderen Ausgestaltung der Erfindung wird für die auf den akustischen Sprachhinweis folgende Spracherkennung entweder ein über Lautsprecher ausgegebenes analoges elektrisches Signal, ein entsprechend vorliegendes digitales elek ¬ trisches Signal oder ein Steuersignal für eine Text-zu ¬ Sprache Ausgabeeinheit an eine Vorrichtung oder eine Pro ¬ grammroutine zur Spracherkennung geleitet, die das Ergebnis der Erkennung bereitstellt. Bei dieser Ausgestaltung der Erfindung kann ein in einem Fahrzeug ohnehin zur Erkennung von Sprachbefehlen vorhandenes Spracherkennungs System in vorteilhafter Weise genutzt werden. Falls nicht von dem betroffenen Anwendungsprogramm ein sogenannter Speller vorgegeben wird, dessen jeweilige aktuelle Ausgabe durch Analyse des aktuellen Bildschirminhalts usw. erfasst wird, kann die Handschrifteingabe unter Berücksichti- gung des aktuellsten Eingabekontextes auch

- anhand von Datenbankinhalten,

- anhand von Strukturregeln

gesteuert werden. Dabei kann der Zugriff auf die entsprechenden Datenbankinhalten, z. B. auf die abgespeicherten Städte, unabhängig von den damit verbundenen Applikationen, z. B. von der Navigation, direkt z. B. lokal erfolgen. Es ist aber auch möglich, solche Datenbankinhalten von extern, z. B. von einem gekoppelten Smartphone oder einem über Internet verbundenen Cloudserver zu erhalten. Genauso können Strukturregeln lokal im System vorhanden, oder von extern, etwa einem Smartphone oder Cloudserver abgefragt werden. Es können dem Handschrif- tenerkenner jeweils der für die nächste Eingabe zulässige Wertebereich der Zeichen als auch die nächsten zulässigen Zeichenfolgen bzgl . der Eingabe bekannt gegeben werden.

Eine Vorrichtung zur automatischen Auswahl eines von mehreren Erkennungsalgorithmen oder Parametersätzen für eine handschriftliche Eingabe von alphanumerischen Zeichen und/oder Gesten in ein auf einem Bildschirm angezeigtes, ausgewähltes Eingabefeld über eine berührungsempfindliche Eingabevorrich ¬ tung umfasst erste Mittel, die dazu eingerichtet sind, eine optische Zeichenerkennung in einem Bereich des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds einschließt, durchzuführen. Alternativ können die ersten Mittel dazu eingerichtet sein, eine Spracherken ¬ nung für einen nach dem Anzeigen des ausgewählten Eingabefelds akustisch ausgegebenen Sprachhinweis durchzuführen. Die Vorrichtung umfasst darüber hinaus zweite Mittel, die dazu eingerichtet sind, nach Feldtypen beschreibenden Begriffen in dem Ergebnis der optischen Zeichenerkennung oder der Spracherkennung zu suchen. Schließlich umfasst die Vorrichtung dritte Mittel, die dazu eingerichtet sind, einen für einen in dem Ergebnis der optischen Zeichenerkennung oder der Spracherkennung aufgefundenen Feldtyp angepassten Erkennungsalgorithmus oder Parametersatz für den Erkennungsalgorithmus aus ¬ zuwählen .

Optional wird ein viertes Mittel bereitgestellt, das die Handschrifteingabe Zeichen für Zeichen unter Berücksichtigung des Eingabekontextes führt. Diese Führung ergibt sich in drei Ausprägungen :

- es wird die Bildschirmausgabe des von der die Eingabe er ¬ wartenden Applikation bereitgestellte sog. "Spellers" durch Analyse des jeweils aktuellsten Bildschirminhaltes verwen ¬ det,

- es wird abhängig vom Eingabekontextes undabhängig von der betroffenen Applikation auf die betroffenen Datenbankinhalte Zugriffen und selber die Funktionalität" eines "Spel ¬ lers" bereitgestellt, wobei ein Zugriff auf eine lokale im System vorhandenen Datenbank wie auch auf eine entfernte, z. B. in einem gekoppelten Smartphone oder in einem über Internet zu erreichenden Cloud-Server erfolgen kann,

- es wird abhängig vom Eingabekontext eine Strukturregel ver ¬ wendet, die entweder lokal im System oder entfernt etwa in einem gekoppelten Smartphone oder einem über Internet verbundenen Cloudserver abgefragt werden kann.

Bei einer Ausgestaltung der Vorrichtung weisen eines oder mehrere der ersten, zweiten, dritten und/oder optionalen vierten Mittel einen oder mehrere Mikroprozessoren und mit den einen oder mehreren Mikroprozessoren in kommunikativer Verbindung stehenden Arbeitsspeicher und nicht-flüchtigen Speicher auf. Die jeweiligen nicht-flüchtigen Speicher speichern Computer-Programminstruktionen welche, wenn sie von den ein oder mehreren Mikroprozessoren in den jeweiligen Arbeitsspeicher geladen und ausgeführt werden, die Ausführung von Teilen des Verfahrens bewirken. Die ersten, zweiten und dritten Mittel zusammengenommen führen schließlich alle Schritte des Verfahrens aus . Bei einer Ausgestaltung der Vorrichtung sind der Bildschirm, die ersten, zweiten, dritten und/oder optionalen vierten Mittel räumlich voneinander getrennt angeordnet und mittels ei ¬ nes oder mehrerer Kommunikationsnetze miteinander verbunden. Die Kommunikation zwischen den einzelnen Komponenten der Vorrichtung kann auf herkömmliche Weise über die ein oder mehre ¬ ren Kommunikationsnetze erfolgen. Der Bildschirm ist signal ¬ mäßig mit einer Ansteuerelektronik verbunden. Der Bildschirm kann beispielsweise ein für eine Navigationseinrichtung vorgesehener Bildschirm sein, der im Armaturenbrett des Kraftfahrzeugs angeordnet ist, oder ein sogenanntes Head-Up Dis ¬ play, bei dem der Bildschirminhalt im Sichtbereich des Fah ¬ rers auf die Windschutzscheibe oder ein davor angeordnetes transparentes Pro ektionsmedium projiziert wird. Das schließt auch eine holographische Ausgabe mit ein, die z. B. vor der Windschutzscheibe platziert wird.

Eine berührungsempfindliche Eingabevorrichtung, welche mit dem erfindungsgemäßen Verfahren verwendet werden kann bzw. welche mit der erfindungsgemäßen Vorrichtung verbunden sein kann umfasst ein separat von einem Bildschirm angeordnetes Touchpad oder einen entsprechend markierten Bereich auf einem berührungsempfindlichen Bildschirm .

Unterschiedliche Ausgestaltungen, die aus Gründen der Klar- heit vorstehend isoliert beschrieben wurden, sind miteinander kombinierbar, beispielsweise um eine zuverlässigere Erkennung von Feldtypen zu erreichen.

Das vorliegende erfindungsgemäße Verfahren und die erfin ¬ dungsgemäße Vorrichtung können in vorteilhafter Weise in einem Kraftfahrzeug genutzt werden, jedoch ist auch eine Anwen ¬ dung in anderen Bereichen der Technik denkbar, in denen eine Eingabe von Zeichen und/oder Gesten handschriftlich erfolgt. Die Auswahl von angepassten Erkennungsalgorithmen oder ange- passter Parameter für einen Erkennungsalgorithmus verbessert die handschriftliche Eingabe von alphanumerischen Zeichen und Gesten und verringert insbesondere während des Betriebs eines Kraftfahrzeugs die Wahrscheinlichkeit, dass bei der Eingabe Korrekturen vorgenommen werden müssen. Dadurch wird insgesamt die Ablenkung des Fahrers vom Verkehrsgeschehen reduziert.

Im Folgenden wird die Erfindung anhand der Figuren der Zeichnung beschrieben. In der Zeichnung zeigt

Fig. 1 eine schematische Darstellung eines Armaturenbretts in einem Kraftfahrzeug;

Fig. 2 eine schematische Darstellung eines Bildschirms zur

Erläuterung des erfindungsgemäßen Verfahrens;

Fig. 3 ein schematisches Flussdiagramm des erfindungsgemä ¬ ßen Verfahrens und

Fig. 4 eine schematische Darstellung eines Blockdiagramms einer erfindungsgemäßen Vorrichtung.

In den Figuren sind gleiche oder ähnliche Elemente mit den ¬ selben Referenzzeichen bezeichnet.

Figur 1 zeigt eine schematische Darstellung eines Armaturenbretts 100 in einem Kraftfahrzeug. Hinter einem Lenkrad 104 ist ein Instrumentencluster 106 angeordnet. Im Bereich einer Mittelkonsole 108 ist ein Bildschirm 110 angeordnet, sowie ein berührungsempfindliches Touchpad 116. Außerdem ist auf einer Windschutzscheibe 112 ein Bereich dargestellt, in den ein Head-up Display 114 Informationen eingeblendet. Der In ¬ strumentencluster 106 kann, ebenso wie der Bildschirm 110 und das Head-up Display 114, ein grafikfähiges Matrixdisplay um ¬ fassen, also ein Display, welches komplexe grafische Struktu ¬ ren mittels entsprechender Ansteuerung einzelner Bildpunkte darstellt. Das heißt, Eingabefelder für Benutzereingaben können auf jeder der Anzeigevorrichtungen eingeblendet sein. Un- abhängig davon, auf welcher Anzeigevorrichtung ein Eingabefeld eingeblendet ist, kann ein Benutzer eine handschriftli ¬ che Eingabe über das berührungsempfindliche Touchpad 116 oder über einen entsprechend markierten Bereich auf dem Bildschirm 110 vornehmen. Nicht in der Figur gezeigt sind eine optionale holographische Darstellung visueller Inhalte sowie eine opti ¬ onale Verbindung zu z. B. einem gekoppelten Smartphone oder zu einem Cloudserver über eine Internetverbindung. Figur 2 zeigt die schematische Darstellung des Bildschirms 110 aus Figur 1 zur Erläuterung des erfindungsgemäßen Verfahrens. Die Ausgangslage ist die, dass ein Benutzer eine Te ¬ lefonnummer in ein dafür vorgesehenes Eingabefeld 202 einge ¬ ben möchte. Ihm stehen dafür mehrere Optionen zur Verfügung. Der Benutzer kann die Ziffern durch Berühren der entsprechenden virtuellen Zifferntasten des auf dem Bildschirm 110 dargestellten Ziffernblocks 204 eingeben. Es ist dazu anzumerken, dass der Bildschirm 110 ein berührungsempfindlicher Bildschirm ist. Alternativ kann der Benutzer die Ziffern über das Touchpad 116 oder über den ein Touchpad darstellenden markierten Bereich 216 auf dem berührungsempfindlichen Bildschirm 110 eingeben, wobei die Eingabe mittels Handschrifterkennung in eine Ziffer umgesetzt wird. In der Figur 2 hat der Benutzer bereits die ersten drei Ziffern der Telefonnummer, „0", „1" und „2", eingegeben und ist gerade fertig damit, die vierte Ziffer, „3", einzugeben. Der Benutzer hat dazu die Ziffer „3" mit dem Finger oder einem anderen geeigneten Eingabegerät auf dem Touchpad 116 (nicht dargestellt) oder auf dem entsprechenden Bereich 216 des berührungsempfindlichen Bildschirms 110 gezeichnet. In der Figur ist die zuletzt ein ¬ gegebene Ziffer leicht vergrößert gegenüber den zuvor einge ¬ gebenen Ziffern dargestellt. Dies kann dazu genutzt werden, um den Abschluss der Erkennung anzuzeigen. Um den Erkennungsalgorithmus für die Handschrifterkennung für die Eingabe von Ziffern anzupassen wurden um das Eingabefeld 202 liegende Bereiche des Bildschirms 110 einer optischen Zeichenerkennung unterworfen. Beispielsweise wird ein erster Bereich 206 nach einer optischen Zeichenerkennung auf Begriffe untersucht, die auf die Art der in das Eingabefeld 202 einzugebenden Zeichen oder Gesten schließen lassen. Der erste Bereich 206 ist durch die strichpunktierte Linie angedeutet. In diesem Fall ist in dem ersten Bereich 206 links neben dem Eingabefeld 202 der Begriff „Rufnummer" dargestellt. Durch einen Vergleich mit entsprechenden Begriffen in einer Datenbank kann gefolgert werden, dass nur eine begrenzte Auswahl an alphanumerischen Zeichen eingegeben werden können. Für eine Telefonnummer sind dies beispielsweise die Ziffern 0-9, die Sterntaste und die Rautetaste. In der Figur ist ein zweiter, das Eingabefeld einschließender Bereich 208 dargestellt, der größer ist als der erste Bereich 206. Der zweite Bereich 208 ist durch die gestrichelte Linie angedeutet. Eine in diesem Bereich ausge- führte optische Zeichenerkennung erkennt zusätzlich zu dem

Begriff „Rufnummer" noch den Begriff „Telefon", der ebenfalls auf die Art der einzugebenden alphanumerischen Zeichen schließen lässt. Das Vorkommen zweier die in das Eingabefeld einzugebenden Zeichen beschreibender Begriffe in dem zweiten Bereich 208 kann die Bestimmung des Typs des Eingabefelds und damit die letztlich Erkennung der in das Eingabefeld einzuge ¬ benden Zeichen verbessern.

Figur 3 zeigt ein schematisches Flussdiagramm des erfindungs- gemäßen Verfahrens 300. In Schritt 302 wird eine Zeichener ¬ kennung oder eine Spracherkennung zumindest eines Bereichs des Bildschirms durchgeführt, der ein ausgewähltes oder akti ¬ ves Eingabefeld einschließt. Das Ergebnis der Zeichenerken ¬ nung oder Spracherkennung wird in Schritt 304 zur Bestimmung eines Typs des Eingabefelds verwendet. Im optionalen Schritt 308 wird abhängig vom Typ des Eingabefeldes nach einem sog. Speller im Bildschirminhalt gesucht oder direkt, lokal oder remote, eine Leseverbindung zu einer Datenbank des betroffenen Typs aufgebaut, falls möglich. Alternativ wird lokal oder remote nach möglichen Strukturregeln für die Eingabe gesucht. In Abhängigkeit von dem Ergebnis der Bestimmung des Typs des Eingabefelds wird ein angepasster Erkennungsalgorithmus für die Handschrifterkennung oder ein angepasster Parametersatz für den Erkennungsalgorithmus ausgewählt. Die Auswahl des Be ¬ reichs und die Übergabe des durch die optische Zeichenerken ¬ nung auszuwertenden Bereichs an die Zeichenerkennungsfunktion oder -Vorrichtung sind in der Figur nicht dargestellt .

Figur 4 zeigt eine schematische Darstellung eines Blockdia ¬ gramms einer erfindungsgemäßen Vorrichtung. Erste Mittel 400, die dazu eingerichtet sind, eine optische Zeichenerkennung in einem Bereich des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds umfasst, durchzufüh ¬ ren sind mit zweiten Mitteln 402, die dazu eingerichtet sind, nach Feldtypen beschreibenden Begriffen in dem Ergebnis der optischen Zeichenerkennung zu suchen, über ein oder mehrere Datenbusse 410 kommunikativ miteinander verbunden. Anstelle oder zusätzlich zu den ersten Mitteln 400 für die optische Zeichenerkennung können weitere erste Mittel 404 vorgesehen sein, die dazu eingerichtet sind, eine Spracherkennung für einen nach dem Anzeigen des Eingabefelds akustisch ausgegebe- nen Sprachhinweis durchzuführen. Die weiteren ersten Mittel 404 sind mit den zweiten Mitteln ebenfalls über den oder die ein oder mehreren Datenbusse 410 kommunikativ verbunden. Ein oder mehrere Bildschirme 406 sind ebenfalls über den oder die ein oder mehreren Datenbusse 410 zumindest mit den ersten Mitteln 400 kommunikativ verbunden, um den ersten Mitteln 400 Zugriff auf den Bereich des Bildschirms, der zumindest das Eingabefeld und die nähere Umgebung des Eingabefelds umfasst, zu ermöglichen, bzw. die Bildinformation an die ersten Mittel 400 zu übertragen. Schließlich sind dritte Mittel 408 über den oder die ein oder mehreren Datenbusse 410 zumindest mit den zweiten Mitteln 402 kommunikativ verbunden, um anhand der von den zweiten Mitteln gefundenen, Feldtypen beschreibenden Begriffen einen für die handschriftliche Eingabe von alphanu ¬ merischen Zeichen und/oder Gesten angepassten Erkennungsalgo- rithmus oder einen angepassten Parametersatz für den Erkennungsalgorithmus auszuwählen. Die dritten Mittel umfassen beispielsweise eine Datenbank und eine Vorrichtung oder ein Computerprogramm, das die mit der Zeichen- oder Spracherkennung gefundenen Begriffe mit in der Datenbank gespeicherten Begriffen vergleicht und im Falle eines Treffers einen ent ¬ sprechenden, für einen Feldtyp angepassten Erkennungsalgorithmus bzw. einen angepassten Parametersatz für den Erkennungsalgorithmus auswählt .

Optional können noch Mittel 412 vorhanden sein, die die Eingabe bzgl. einer Datenbank unter Berücksichtigung schon vorhandener Inhalte dynamisch durch Einschränkung der noch zu erwartenden Eingaben steuern. Dies kann bspw. unter Verwendung von schon von der entsprechenden Applikation vorgesehener "Speller" Funktionalitäten erfolgen, alternativ auch per direktem Zugriff auf die entsprechende Datenbasis, lokal oder remote, erfolgen, oder es werden Strukturregeln für die Eingabe lokal oder remote abgefragt. Diese Strukturregeln können z. B. länderabhängig sein. Dieser Schritt dient zum Bestimmung eines erweiterten Parametersatzes für den Erkennungsal ¬ gorithmus .