Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
IMAGE RECORDING METHOD AND DEVICE
Document Type and Number:
WIPO Patent Application WO/2001/065473
Kind Code:
A1
Abstract:
The invention relates to an image recording method and device, in particular to a hand-held scanner, for supplying scanned image data to OCR software without distortion. The image recording device contains a recording device for scanning a line of characters and a processing unit. Said processing unit uses the scanned image data to determine the character spacing of the scanned line of characters, either by means of the intervals between characters, or alternatively by using the transition focus of the edges of the characters. The character spacing is determined using the intervals between characters and is verified by means of the transition focus in cases of doubt.

Inventors:
KOCHERT WILFRIED (DE)
Application Number:
PCT/EP2001/002028
Publication Date:
September 07, 2001
Filing Date:
February 22, 2001
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
CGK COMPUTERGESELLSCHAFT KONST (DE)
KOCHERT WILFRIED (DE)
International Classes:
G06V30/148; G06V30/166; G06V30/142; G06V30/10; (IPC1-7): G06K9/22; G06K9/34; G06K9/42
Foreign References:
EP0279655A21988-08-24
US4949391A1990-08-14
EP0428499A21991-05-22
EP0677812A11995-10-18
Attorney, Agent or Firm:
Schaumburg, Karl-heinz (Postfach 86 07 48 München, DE)
Download PDF:
Claims:
Ansprüche
1. Verfahren zur Aufnahme von Bilddaten einer Zeichenzeile, wobei eine Zeichenzeile einer Vorlage zum Lesen von Bildda ten abgetastet und die Bilddaten für eine OCRErkennung vor bereitet werden, d a d u r c h g e k e n n z e i c h n e t, d a s s die Zeichenteilung beruhend auf den Bilddaten bestimmt wird.
2. Verfahren nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t, d a s s die Zeichenteilung aus dem Abstand aufeinanderfolgender Zeichen bestimmt wird.
3. Verfahren nach Anspruch 2, d a d u r c h g e k e n n z e i c h n e t, d a s s zusätz lich die Ubergangsschärfe an den Zeichenkanten bestimmt wird, wobei die Ubergangsschärfe zur Überprüfung der aus dem Zeichenabstand ermittelten Zeichenteilung dient.
4. Verfahren nach einem der Ansprüche 1 bis 3, d a d u r c h g e k e n n z e i c h n e t, d a s s die ge lesenen Bilddaten komprimiert werden.
5. Verfahren nach Anspruch 4, d a d u r c h g e k e n n z e i c h n e t, d a s s die komprimierten Bilddaten als Grauwerte in einem SRAM einer Zeichenerkennungseinheit für GrauwertVideodaten abgespei chert werden.
6. Verfahren nach einem der Ansprüche 1 bis 5, d a d u r c h g e k e n n z e i c h n e t, d a s s es die Schritte Komprimieren der eingelesenen Bilddaten und Speicher : als Grauwerte in einem SRAMPuffer Abspeichern von Grauwertstützpunkten zum Bilden einer komprimierten Tapete Bilden von Zeichenmittenabständen aufeinanderfolgende Zeichen Bilden von Scanngeschwindigkeitswerten und Eintragen dieser Scanngeschwindigkeitswerte in die komprimierte Tapete Dekomprimieren der komprimierten Tapete umfasst.
7. Verfahren nach Anspruch 6, d a d u r c h g e k e n n z e i c h n e t, d a s s beim Bilden der Grauwertstützpunkte die als Grauwerte abge speicherten Bilddaten zeilenweise unter Bildung von Grau wertdifferenzen zu einem fuir jede Zeile ermittelten Weißwet untersucht werden, wobei bei Überschreiten einer vorbestimm ten Grauwertdifferenz jeweils ein Grauwertstützpunkt in den SRAMPuffer eingetragen wird.
8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass vor dem Bilden von Zeichenmittenabständen aufeinanderfolgender Zei chen Grauwerte unterhalb eines jeweiligen Schwellenwertes auf 0 gesetzt werden, wobei die Schwellenwerte jeweils zei lenweise abhängig von einem maximalen, in horizontaler Rich tung ermittelten Grauwert gebildet werden.
9. Verfahren nach einem der Ansprüche 6 bis 8, d a d u r c h g e k e n n z e i c h n e t, d a s s die Scanngeschwindigkeitswerte aus den Mittenabständen aufeinan derfolgender Zeichen mittels einer Mehrheitssuche bestimmt werden.
10. Verfahren nach Anspruch 9, d a d u r c h g e k e n n z e i c h n e t, d a s s bei der Ermittlung der Scanngeschwindigkeiten die Steigungsmaße der Schwarzweißbeziehungsweise WeißschwarzUbergange der je weiligen Zeichenteile in horizontaler Richtung ermittelt werden.
11. Bildaufnahmevorrichtung zur Aufnahme von Bilddaten einer Zeichenzeile mit einer Aufnahmevorrichtung zur Abtastung einer Vorlage, um die Bilddaten einer Zeichenzeile zu lesen, und einer Verarbeitungsvorrichtung, um unter Berücksichtigung einer tatsächlichen Zeichenzeile die Bilddaten für eine OCR Erkennung vorzubereiten, um so verzerrungsfreie Bilddaten zu erhalten, d a d u r c h g e k e n n z e i c h n e t, d a s s die Verarbeitungsvorrichtung ausgestattet ist, um die Zeichen teilung beruhend auf den Bilddaten zu bestimmen.
12. Bildaufnahmevorrichtung nach Anspruch 11, d a d u r c h g e k e n n z e i c h n e t, d a s s die Verarbeitungsvorrichtung ausgestattet ist, um den Abstand zwischen aufeinanderfolgenden Zeichen zu ermitteln und aus diesem Abstand die Zeichenteilung bestimmen.
13. Bildaufnahmevorrichtung nach Anspruch 11, d a d u r c h g e k e n n z e i c h n e t, d a s s die Verarbeitungsvorrichtung die Ubergangsscharfe an den Zei chenkanten bestimmt, wobei die Ubergangsschärfe ein Maß für die Zeichenteilung ist.
14. Vorrichtung nach Anspruch 12, d a d u r c h g e k e n n z e i c h n e t, d a s s die Verarbeitungsvorrichtung zusätzlich die Ubergangsschärfe an den Zeichenkanten bestimmt, wobei die Ubergangsschärfe zur Überprüfung der aus dem Zeichenabstand ermittelten Zeichen teilung dient.
15. Bildaufnahmevorrichtung nach Anspruch 11, d a d u r c h g e k e n n z e i c h n e t, d a s s die Aufnahmevorrichtung ein handgeführter Scanner ist.
16. Bildaufnahmevorrichtung nach Anspruch 11, d a d u r c h g e k e n n z e i c h n e t, d a s s die Vorrichtung einen Speicher aufweist, um die Bilddaten zwi schenzuspeichern.
Description:
Beschreibung Bildaufnahmeverfahren und-Vorrichtung Die Erfindung betrifft ein Bildaufnahmeverfahren und eine Bildaufnahmevorrichtung zur Aufnahme von Bilddaten einer Zeichenzeile, wobei eine Aufnahmevorrichtung zur Abtastung einer Vorlage, um die Bilddaten einer Zeichenzeile zu lesen, und einer Verarbeitungsvorrichtung vorgesehen sind, um unter Berücksichtigung einer tatsächlichen Zeichenteilung die Bilddaten für eine OCR-Erkennung vorzubereiten, um so ver- zerrungsfreie Bilddaten zu erhalten.

In den letzten Jahren ist die OCR-Erkennung, also die Um- wandlung von Bilddaten in Textdaten, zunehmend wichtiger ge- worden. Voraussetzung für eine einwandfreie OCR-Erkennung ist es allerdings, dass die Bilddaten der OCR-Software mit einer gleichbleibend guten Qualität zugeführt werden.

Wenn die Bilddaten für die OCR-Erkennung über eine Bildauf- nahmevorrichtung, beispielsweise einen Scanner, eingelesen werden, stellt sich das Problem, dass die erhaltenen Bildda- ten aufgrund von Scannereigenschaften nicht verzerrungsfrei sind, was zu Schwierigkeiten bei der OCR-Erkennung führen kann. Dies ist insbesondere bei handgeführten Scannern ein ernstes Problem.

Bei einem handgeführten Scanner werden die Zeichen je nach Geschwindigkeit beim Scannen, die zwischen 5 und 150cm/sek. liegen kann, beliebig stark verzerrt. Um dieses Problem zu lösen, gab es bisher zwei Ansätze. Zum einen offenbart US- 5, 250, 804 einen handgehaltenen Scanner mit einem Taktrad.

Wenn der Scanner über eine Vorlage bewegt wird, dreht sich das Taktrad und gibt ein Maß für die Geschwindigkeit, das an den Computer übermittelt wird. Ein Nachteil dieser Bauweise

ist es, dass nur sehr geringe Scanngeschwindigkeiten möglich sind, eine sehr saubere Scannführung erforderlich ist, und dass das Taktrad eine sehr begrenzte Lebensdauer hat.

Ein zweiter Ansatz sieht vor, ein zweidimensionales Photo- diodenarray in der Lesevorrichtung einzusetzen. Wird dieses Photodiodenarray hinreichend groß gewählt, ist es möglich, ein Normzeichen mit einem Scannzvklus zu erfassen. Der Nach- teil hierbei ist, dass zweidimensionale Arrays relativ teuer sind, und dass breite Normschriften nicht gelesen und er- kannt werden können, da Teile eines Zeichens vom Flächensen- sor nicht erfasst werden.

Aus der US-A-5,999,666 ist ein Verfahren zur Aufnahme von Bilddaten einer Zeichenzeile bekannt, wobei eine Zeichen- zeile einer Vorlage zum Lesen von Bilddaten abgetastet und diese Bilddaten für eine OCR-Erkennung vorbereitet werden.

Ein Scanner wird entlang einer Textzeile geführt, wobei ein lineares Abtastarray jedes Zeichen abtastet und die Bildda- ten abgespeichert werden. Mithilfe eines OCR-Programms wer- den die Zeichen in einen ASCII-Text gewandelt.

Aus HIROMICHI FUJISAWA et al Segmentation Methods for Cha- racter Recognition : From Segmentation to Document Structure Analysis"Proc. of the IEEE, Vol. 80, No. 7, July 1992, Sei- ten 1079-1092, ist ein Verfahren zur Zeichenerkennung be- kannt. In dieser Druckschrift werden Algorithmen beschrie- ben, die es gestatten, aus digitalen Abtastdaten den Infor- mationsgehalt über die dargestellten Zeichen zu ermitteln.

Aufgabe der Erfindung ist es, ein verbessertes Bildaufnahme- verfahren und eine verbesserte Bildaufnahmevorrichtung zu schaffen, die weitgehend verbesserungsfrei arbeiten.

Erfindungsgemäß wird diese Aufgabe durch ein Verfahren nach Anspruch 1 beziehungsweise eine Vorrichtung nach Anspruch 11 gelöst. Die abhängigen Ansprüche betreffen weitere vorteil- hafte Aspekte der Erfindung.

Bei dem erfindungsgemäßen Verfahren zur Aufnahme von Bildda- ten einer Zeichenzeile wird eine Zeichenzeile einer Vorlage zum Lesen von Bilddaten abgetastet und die Bilddaten für ei- ne OCR-Erkennung vorbereitet, wobei die Zeichenteilung beru- hend auf den Bilddaten bestimmt wird.

Bei einem solchen Verfahren ist die Verwendung eines Taktra- des, welches relativ schnell kaputt gehen kann, entbehrlich.

Zudem lassen sich Scanngeschwindigkeiten von mehr als 1 m/Sek. erreichen. Die Anforderungen an die Genauigkeit der Scannerführung sind geringer und das Verfahren ist einfacher durchführbar, da keinerlei bewegliche Teile verwendet wer- den.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Ver- fahrens ist dadurch gekennzeichnet, dass die Zeichenteilung aus dem Abstand aufeinanderfolgender Zeichen bestimmt wird.

Hierdurch wird in einfacher Weise ein jeweils aktuelles Maß für die Zeichenteilung erhalten.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Ver- fahrens ist dadurch gekennzeichnet, dass zusätzlich die Ubergangsschärfe an den Zeichenkanten bestimmt wird, wobei die Ubergangsschärfe zur Überprüfung der aus dem Abstand zwischen aufeinanderfolgenden Zeichen ermittelten Zeichen- teilung dient. Hierdurch läßt sich die Zuverlässigkeit der ermittelten Zeichenteilung erhöhen, was insbesondere dann von Bedeutung ist, wenn die Zeichen in horizontaler Richtung Unterbrechung aufweisen, so dass irrelevante Zeichenzwi-

schenräume entstehen, die zu einer fehlerhaften Ermittlung der Zeichenteilung führen könnten.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Ver- fahrens ist dadurch gekennzeichnet, dass die gelesenen. Bild- daten komprimiert werden. Da insbesondere bei langsamem Scannen sehr große Datenmengen entstehen können, läßt sich auf diese Weise ein wesentliches Maß an Speicherplatz und- zeit einsparen.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Ver- fahren ist dadurch gekennzeichnet, dass die komprimierten Bilddaten als die Grauwerte in einem SRAM einer Zeichener- kennungseinheit für Grauwert-Videodaten abgespeichert wer- den. Das Abspeichern in Form von Grauwerten hat gegenüber dem Abspeichern in binarisierter Form den Vorteil, dass sich durch die Analyse von Weiß-schwarz-beziehungsweise Schwarz- weiß-Übergängen relevante Zeichenteile von Zeichen näher un- tersuchen lassen.

Die erfindungsgemäße Bildaufnahmevorrichtung zur Aufnahme von Bilddaten einer Zeichenzeile enthält eine Aufnahmevor- richtung zur Abtastung einer Vorlage, um die Bilddaten einer Zeichenzeile zu lesen und eine Verarbeitungsvorrichtung, um unter Berücksichtigung einer tatsächlichen Zeichenteilung die Bilddaten für eine OCR-Erkennung vorzubereiten, um so verzerrungsfreie Bilddaten zu erhalten. Die erfindungsgemäße Vorrichtung ist dadurch gekennzeichnet, dass die Verarbei- tungsvorrichtung ausgestattet ist, um den Abstand zwischen aufeinanderfolgenden Zeichen der Zeichenzeile und somit ein Maß für die tatsächliche Zeichenzeile zu bestimmen.

Ein Vorteil der Erfindung besteht darin, dass kein Taktrad nötig ist, somit also keine mechanischen Teile vorliegen, die relativ schnell kaputtgehen können. Mit der erfindungs-

gemäßen Vorrichtung sind Scanngeschwindigkeiten von mehr als lm/sek. möglich. Auch die Anforderungen an die Genauigkeit der Scannerführung sind geringer als beim Stand der Technik.

Die gesamte Vorrichtung wird durch das Vermeiden mechani- scher Teile billiger, robuster und einfacher in der Handha- bung.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild- aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Verarbeitungsvorrichtung in der Lage ist, den Abstand zwi- schen aufeinanderfolgenden Zeichen zu ermitteln und aus die- sem Abstand die Zeichenteilung bestimmen.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild- aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Verarbeitungsvorrichtung derart ausgestaltet ist, dass sie zusätzlich die Ubergangsschärfe an den Zeichenkanten be- stimmt, wobei die Übergangsschärfe ein Maß für die Zeichen- teilung ist. In Abhängigkeit der Geschwindigkeit des Scann- vorgangs gibt es an Schwarz-Weiß-bzw. Weiß-Schwarz-Ubergän- gen sogenannte Graukegel. Die Größe dieser Graukegel ist ebenfalls ein Maß für die Scanngeschwindigkeit bzw. fur die Zeichenteilung. Insbesondere bei schlechten Vorlagen, bei denen einzelne Zeichen der abzuscannenden Zeichenzeile un- vollständig wiedergegeben sind, bietet die Bestimmung der Ubergangsschärfe eine zusätzliche Überprüfungsmöglichkeit für den vorhergehend bestimmten Zeichenabstand. Die Vorrich- tung wird auf diese Art noch leichter in der Handhabung.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild- aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Verarbeitungsvorrichtung zusätzlich die Ubergangsschärfe an den Zeichenkanten bestimmt, wobei die Ubergangsschärfe zur Überprüfung der aus dem Zeichenabstand ermittelten Zeichen- teilung dient.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild- aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Aufnahmevorrichtung als handgeführter Scanner ausgeschaltet ist. Von diesem handgeführten Scanner werden die gewonnenen Bilddaten durch ein geeignetes Mittel, beispielsweise ein Kabel oder eine Infrarotschnittstelle, an die Verarbeitungs- vorrichtung der Bildaufnahmevorrichtung übertragen. Insbe- sondere bei handgeführten Scannern variiert die Scannge- schwindigkeit sehr stark. Um dennoch eine effiziente OCR-Er- kennung durchführen zu können, ist daher eine zuverlässige Gewinnung verzerrungsfreier Daten erforderlich.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild- aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Vorrichtung einen Speicher um die Bilddaten zwischenzuspei- chern. In dem Speicher können daher in vorteilhafter Weise die abgetasteten Bilddaten und die entzerrten Bilddaten vor der Verarbeitung durch die OCR-Software zwischengespeichert werden.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Ver- fahrens ist dadurch gekennzeichnet, dass es das Komprimieren der eingelesenen Bilddaten und Speichern als Grauwerte in einem SRAM-Puffer, das Abspeichern von Grauwertstützpunkten zum Bilden einer komprimierten Tapete, das Bilden von Zei- chenmittenabständen aufeinanderfolgender Zeichen, das Bilden von Scanngeschwindigkeitswerten und Eintragen dieser Scann- geschwindigkeitswerte in die komprimierte Tapete und das De- komprimieren der komprimierten Tapete umfasst. Auf diese Weise läßt sich ein geschwindigkeitskorrigiertes Band von Zeichen erhalten, welches anschließend einer OCR-Zeichener- kennung zugeführt werden kann.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Ver- fahrens ist dadurch gekennzeichnet, dass zum Bilden der Grauwertstützpunkte die als Grauwerte abgespeicherten Bild- daten zeilenweise unter Bildung von Grauwertdifferenzen zu einem für jede Zeile ermittelten Weißwert untersucht werden, wobei bei Überschreiten einer vorbestimmten Grauwertdiffe- renz ein Grauwertstutzpunkt in den SRAM-Puffer eingetragen wird. Anhand der auf diese Weise ermittelten Grauwertstutz- punkte lassen sich die zu einer Zeile gehörenden relevanten Pixel in einfacher Weise durch Addition der Differenz der Grauwertstützpunkte zwischen minimalem und maximalem Grau- wert anhand einer dynamisch einstellbaren Schwelle ermit- teln.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Ver- fahrens ist dadurch gekennzeichnet, dass vor dem Bilden von Zeichenmittenabständen aufeinanderfolgender Zeichen Grauwer- te unterhalb eines jeweiligen Schwellenwertes auf 0 gesetzt werden, wobei die Schwellenwerte jeweils zeilenweise abhän- gig von einem maximalen, in horizontaler Richtung ermittel- ten Grauwert gebildet werden, wodurch sich eine Schattenbil- dung der Zeichen durchführen läßt.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Ver- fahrens ist dadurch gekennzeichnet, dass die Scanngeschwin- digkeitswerte aus den Mittenabständen aufeinanderfolgender Zeichen mittels einer Mehrheitssuche bestimmt werden. Durch die Mehrheitssuche lassen sich Verfälschungen aufgrund von Unterbrechungen im Zeichen oder bei Zeichen ohne Weißlücke vermeiden.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Ver- fahrens ist dadurch gekennzeichnet, dass bei der Ermittlung der Scanngeschwindigkeiten die Steigungsmaße der Schwarz- weiß-beziehungsweise Weiß-schwarz-Ubergange der Zeichen-

teile in horizontaler Richtung ermittelt werden. Hierdurch werden Störungen bei der Ermittlung der Zeichenteilung bei verstümmelten Zeichen mit irrelevanten Zeichenzwischenräumen vermieden.

Ausführungsbeispiele der Erfindung ergeben sich aus der vor- liegenden Beschreibung der beiliegenden Zeichnungen, in de- nen zeigt : Figur 1 Rohbilddaten nach der Abtastung mit einem handge- führten Scanner ; Figur 2 die entzerrten Bilddaten ; Figur 3 die Grauwertverteilung der Zeile 28 aus Figur 1 ; Figur 4 die Grauwertverteilung der Zeilen 27,28 und 29 ei- nes Ausschnittes aus Figur 1 ; Figur 5 eine Darstellung der Grauwertstützpunktverteilung ; Figur 6 ein Flussdiagramm des erfindungsgemäßen Verfahrens.

Im Folgenden wird die Erfindung detailliert anhand einer be- vorzugten Ausführungsform beschrieben.

Erfindungsgemäß werden OCR-Zeichen optisch abgetastet, die so erhaltenen Videodaten komprimiert, die Zwischenräume der OCR-Zeichen aufgefunden und der Abstand zweier Zeichen er- mittelt, um dadurch ein Maß für die aktuelle Zeichenteilung zu bekommen. Die Kompression der Videodaten ist nicht nötig, aber sinnvoll, da bei langsamem Scannen sehr große Datenmen- gen entstehen können und damit viel Speicher und Rechenzeit benötigt wird. Bei der Dekomprimierung der Videodaten wird die Zeichenteilung strichgenau berücksichtigt. Die Soll-Zei- chenteilung für gängige OCR-Normschriften beträgt im Normal- fall zehn Zeichen pro Zoll. Auf diese Zeichenteilung werden die Zeichen normiert.

In manchen Fällen kann es bei Zeichen vorkommen, dass sie in horizontaler Richtung Unterbrechungen haben, so dass ein ir- relevanter Zeichenzwischenraum erkannt wird. Diese Zwischen- räume können zu einer falschen Zeichenteilung führen. Aus diesem Grund wird in der erfindungsgemäßen Ausführungsform ein zweiter Algorithmus angewendet, der die Scanngeschwin- digkeit von Zeichen näherungsweise ermittelt. Das Ergebnis dient dazu, herauszufinden, ob bzw. welche Zeichenteilung plausibel ist.

Der zweite Algorithmus betrachtet den Weiß-Schwarz-bzw. den Schwarz-Weiß-Übergang einer Linie eines Zeichens in horizon- taler Richtung. In der Zeichenzeile werden relevante Zei- chenteile von Zeichen gesucht. Relevant sind Zeichenteile, wenn sie größer als zwei Zeichenpixel breit sind und von ei- nem Zeichen mit einer annähernd senkrechten Zeichenkante stammen. Hierfür werden die Nachbarpixel in vertikaler Rich- tung untersucht. Wenn ein derartig relevanter Zeichenteil vorliegt, kann die Länge des"Graukeils"am Weiß-Schwarz- bzw. Schwarz-Weiß-Übergang, nämlich die Unschärfe der Kante, ein Maß für die Abtastgeschwindigkeit geben. Hierfür ist es erforderlich, dass die Videodaten nicht binarisiert, sondern Grauwerte enthalten.

Am Ende entsteht eine geschwindigkeitskorrigierte und somit entzerrte Zeichenzeile. Diese Zeichenzeile kann nun einer OCR-Zwischenerkennung zugeführt werden, die die Bilddaten in Textdaten umwandelt.

Entsprechend einer bevorzugten Ausführungsform führt die er- findungsgemäße Bildaufnahmevorrichtung folgende Verarbei- tungsprozedur durch. Zunächst wird mit einer Aufnahmevor- richtung eine Zeichenzeile abgescannt. Das Ergebnis dieses Scannvorgangs ist in Figur 1 gezeigt. Durch die unterschied- lich schnelle Bewegung der Aufnahmevorrichtung über die Zei-

chenzeile entsteht eine Verzerrung der einzelnen Zeichen.

Diese Verzerrung erschwert es den gängigen OCR-Programmen die abgetastete Zeichenzeile in Text umzuwandeln.

Das erfindungsgemäße Verfahren zur Aufnahme von Bilddaten wird im Folgenden anhand des in Figur 6 dargestellten Fluss- diagramms detailliert erläutert.

Mittels der in Figur 6 dargestellten Programmabfolge werden die eingelesenen Videodaten komprimiert und in das SRAM ei- ner Zeichenerkennungseinheit für Grauwert-Videodaten mit 6 Bit Grauwerten abgespeichert. Nachdem der Beleg gescannt wurde, werden die komprimierten Daten dekomprimiert und ge- schwindigkeitskorrigiert in den Bildspeicher abgespeichert und von dort wieder in das SRAM als sogenannte Tapete abge- speichert. Nachdem die Tapete wieder in den Bildspeicher übertragen wurde, kann das Programm zur Zeichenerkennung durchgeführt werden.

Gemäß Figur 6 läuft das beim handgeführten Lesen der Bildda- ten verwendete Programm folgendermaßen ab : Zunächst wird mittels eines Programms 200 ein Programm 202 zur Bildung von Stützpunkten für die komprimierte Tapete in- itialisiert. Bei Durchführung des Programms 200 wird ein SRAM-Puffer aufgebaut. In diesem Puffer werden die Daten von 64 Zeilen abgespeichert. Pro Zeile gibt es vier Werte : Spal- tenadresse, Weißwert, letzter abgespeicherter Grauwert und Status.

Die Hardware arbeitet im Transparentmodus, das heißt, die Grauwerte des Scanners werden unverfälscht in die Zeichener- kennungseinheit für Grauwert-Videodaten eingetragen. Der Weißwert wird aus den ersten 32 Pixeln der jeweiligen Zeile

gebildet, indem der weißeste Wert gesucht wird. Der Status ist am Anfang Null.

Nach dieser Initialisierung des SRAM-Puffers werden die Spaltenadressen und die Zeilenadressen der Pixel der An- fangsspalte in den Puffer eingetragen. Dies sind Pixel von 64 Zeilen. Am Ende einer Spalte wird ein Zeilenendecode (OxcOOO) und die Zeilenadresse des letzten Pixels eingetra- gen.

Anschließend wird das Programm 202 zur Bildung der Stütz- punkte für die komprimierte Tapete durchgeführt. Hierbei werden pro Spalte die Pixel von Zeile 0 bis Zeile 63 unter- sucht, ob sie in horizontaler Richtung rechts Grauwertdiffe- renzen von größer als 3 in Bezug auf den Weißwert aufweisen.

Ist das nicht der Fall, wird das nächste Pixel (die nächste Zeile) in horizontaler Richtung untersucht.

Ist die jeweilige Grauwertdifferenz größer als 3, wird in der vorherigen Zeile (n-1) der Status 1 gesetzt. Mit der nächsten Spalte wird dieses Pixel (Grauwertstützpunkt) dann in den Speicher SRAMZ mit der Spaltenadresse und Zeilena- dresse abgespeichert. In der entsprechenden Zeile im Puffer WEZ wird der Status 8 eingetragen. Diese Zeile wird nun spaltenweise verfolgt. In den SRAMZ-Puffer wird immer dann ein Pixel mit Spaltenadresse und Zeilenadresse übertragen, wenn die Grauwertdifferenz größer als 3 wird oder wenn ein Umkehrpunkt vorhanden ist (weiß, schwarz, weiß oder schwarz, weiß, schwarz). Erreicht ein Grauwert bis auf 3 Grauwertstu- fen den Weißwert, wird der Status auf 4 gesetzt. Mit der nächsten Spalte wird das Pixel nach FRAMZ übertragen und der Status in dieser Zeile wird auf 0 gesetzt. Jetzt wird eine neue Grauwertdifferenz gesucht.

So wie mit dieser Zeile wird mit allen Zeilen verfahren.

In Zeile 63 ist das Spaltenende erreicht. In den Speicher SRAMZ wird der Zeilenendecode OxcOOO eingetragen. Es werden so viele Spalten abgearbeitet, wie im Bildspeicher vorhanden -sind. Die Bilddaten werden vom Programm 204 in das SRAM eingetragen. Liegen keine Bilddaten mehr vor, wird das Pro- gramm 202 verlassen und das Programm 204 aufgerufen.

Das Programm 204 dient zum Abspeichern der Grauwerte von den Stützpunkten. Hierbei werden die Adressen der Pixel aus dem Puffer SRAMZ geholt und die Pixel im Bildspeicher adres- siert. Die ausgelesenen Grauwerte (Byte) werden wortweise verpackt und in den Puffer WEZ (gleicher Name, neuer Puffer) in das SRAM eingetragen. Am Anfang einer Spalte wird die Spaltenadresse und am Ende einer Spalte der Zeilenendecode (OxcOOO) ins SRAM eingetragen.

Sind alle bisher gescannten Pixel im SRAM, wird untersucht, ob der Beleg noch vorliegt (Belegimpulsbildung). Ist dies der Fall, wird die Anzahl der Spalten berechnet, die der Einschreibzähler inzwischen in den Bildspeicher geschrieben hat. Diese Anzahl wird dem Programm 202 mitgeteilt, welches wieder aufgerufen wird.

Liegt kein Beleg mehr vor, wird die Schleife verlassen, und das Programm 206 wird aufgerufen. In dem Puffer WEZ liegen jetzt die komprimierten Bilddaten.

Das Programm 206 dient zum Suchen der gedruckten Zeile in- nerhalb der gesamten Tapete. Es ermittelt die Oberkante und die Unterkante der gesamten Zeile. Eingangsdaten sind die komprimierten Bilddaten aus dem Puffer WEZ. Das Programm 206 findet die relevanten Pixel, die zu einer Zeile gehören. Es addiert in jeder Zeile die Differenz der Grauwert-Stütz- punkte zwischen minimalem und maximalem Grauwert. Mit einer

dynamisch einstellbaren Schwelle wird am Ende die obere und untere Kante der Zeile gefunden.

Das Programm 208 dient zum Holen abgespeicherter Grauwerte und zur Schattenbildung von Zeichen. Hierbei wird der vom Programm 206 ausgegebene Bereich ermittelt, pro Spalte der maximale Grauwert bestimmt und für diese Spalte abgespei- chert. Hierbei handelt es sich um die Grauwerte der kompri- mierten Bilddaten. Parallel dazu wird pro Zeile eine Schwel- le gebildet, die abhängig von einem maximalen Grauwert ist, der in horizontaler Richtung gebildet wird. Diese Schwelle wird nach jeder Spalte in jeder Zeile um zwei Grauwertstufen dekrementiert (schwarz = 3f, weiß = 0). Mit der nächsten Spalte kann ein neuer Grauwert (Grauwertstützpunkt) in die- ser Zeile vorhanden sein. Der neue wird mit dem alten ver- glichen, der größere wird abgespeichert. Der Maximalwert der Schwelle beträgt 15, der Minimalwert 4. Liegt der Grauwert unterhalb der ermittelten Schwelle, wird er auf 0 gesetzt.

Diese neuen Grauwerte werden in das SRAM geschrieben (neuer Puffer REZ).

Anschließend wird das Programm 210 durchgeführt, mittels dem die Zeichenmittenstände von Zeichen ermittelt werden. Aus dem SRAM-Puffer (REZ) werden die Spaltenadressen und maxima- len Grauwerte ausgelesen und entsprechende Segmente gebil- det. Je nach Größe des maximalen Grauwerts eines Zeichens (Zeichensegments) werden bis zu 3 Weißspalten zwischen den Zeichensegmenten zugelassen, so dass ein Zeichen aus mehre- ren Segmenten bestehen kann. Bei sehr schwach gedruckten Zeichen kommen häufig Unterbrechungen innerhalb des Zeichens s vor. Von dem gegebenenfalls zusammengesetzten Zeichen wird die Zeichenmitte berechnet. Die Zeichenmittenadresse und die Zeichenbreite werden in den SRAM-Puffer (WEZ) eingetragen.

Das Dateiende wird mit Oxffff gekennzeichnet.

Anschließend wird aus den Daten des Puffers (WEZ) der Zei- chenabstand zweier Zeichen ermittelt und an die Stelle der Zeichenbreite wieder in den Puffer (WEZ) eingetragen. Zuvor wird noch überprüft, ob eine größere Weißlucke zwischen den Zeichen besteht. Hierzu wird von dem Zeichenabstand die vierfache Zeichenbreite subtrahiert. Ist der verbleibende Abstand größer als 32, liegt eine größere Weißlücke vor. Im Zeichenabstand (später = V-Wert) wird das höchste Bit 1 ge- setzt. Der V-Wert ist ein Maß fur die Geschwindigkeit des Belegs. Ist der V-Wert 1,0, liegt die Normgeschwindigkeit vor. Das es sich um handgeführtes Lesen handelt, kann die Beleggeschwindigkeit variieren. Wenn also eine größere Zei- chenlücke vorhanden ist, muss nach dieser Lücke die Ge- schwindigkeit neu berechnet werden. Dies wird mittels der Programme 212 und 214 durchgefuhrt, die dieses Bit abfragt.

Das Programm 212 ermittelt die V-Werte (a und b) für die er- sten maximal 8 Werte. Der V-Wert (a) entspricht genau dem Mittenabstand zweier benachbarter Zeichen. Ist dieser Ab- stand 16 Spalten groß, dann liegt die Normgeschwindigkeit vor. Bei 10 Zeichen/Zoll und 160 Micrometer Pixelauflosung beträgt der Zeichenabstand 16 Spalten. Parallel dazu wird das höchste Bit des V-Wertes abgefragt. Ist dieses 1, wird die Bearbeitung beendet und Programm 214 wird aufgerufen. Es wird erst bei dem nächsten Aufruf dieses Programms 212 fort- gefahren. Die Programme 212 und 214 werden in einer Schleife solange aufgerufen, bis der Endecode Oxffff kommt.

Die V-Werte (a) können durch Unterbrechungen im Zeichen oder bei Zeichen ohne Weißlücke stark verfälscht sein. Deshalb wird eine Mehrheitssuche unter den ersten 8 Werten durchge- führt. Die Zeichenabstände, die am häufigsten vorkommen, be- stimmen den V-Wert der anderen. Die Häufigkeitsverteilung wird mittels Histogramm ermittelt. Die ermittelten V-Werte werden in den Puffer (WEZ) eingetragen.

In Fällen, bei denen Zeichen verstummelt sind, kann es zu erheblichen Störungen bei der Ermittlung der Zeichenteilung kommen, so dass keine eindeutige Entscheidung für einen V- Wert getroffen werden kann. Fehlt zum Beispiel bei einer"0" oben und unten der Querstrich, dann ist der V-Wer~ fur die- ses Zeichen um den Faktor 2 zu klein. Bei etwa Ncrmgeschwin- digkeit kann der V-Wert mit Hilfe der Plausibilität korri- giert werden. Wird aber erheblich langsamer als Normge- schwindigkeit gescannt, dann kann auf diese Art der V-Wert nicht mehr korrigiert werden. In diesem Falle werden die Weiß-schwarz-bzw. Schwarz-weiß-Übergänge des Zeichens näher untersucht. Es werden drei unmittelbar übereinander liegende Pixelzeilen in der entsprechenden Spalte betrachtet (siehe Figur 4). Haben die drei Pixelzeilen annähernd den gleichen Kurvenverlauf und ist die Grauwertdifferenz zwischen dem hellsten und dunkelsten Pixel größer als 15, dann wird ein Steigungsmaß bei jedem Weiß-schwarz-/Schwarz-weiß-Ubergang von jeder Zeile ermittelt.

Dies wird folgendermaßen durchgeführt.

In Figur 1 sind die original gescannten Grauwertb lddaten abgebildet. Man sieht, dass die Zeile am Anfang erheblich langsamer als am Ende des Belegs gescannt wurde.

Gemäß Figur 3 wurde beispielhaft eine Zeile (Zeile 28) her- ausgegriffen. Die Bilddaten sind so aufgebaut, dass links die Spalte 0 und oben die Zeile 0 ist. Gemäß Figur 3 ist von der Zeile 28 die Grauwertverteilung dargestellt. Man er- kennt, wie sich die Steilheit der Flanke abhängig von der Scanngeschwindigkeit verändert. Als erstes wird der Beginn einer Flanke gesucht. Es wird der Weißwert des Belegs ermit- telt. Mittels einer Schwelle kann das Pixel gefunden werden, das über dieser Schwelle liegt. Jetzt wird von Pixel zu Pi- xel die Differenz (d) berechnet und gespeichert, bis die

Differenz wieder einen Schwellenwert unterschreitet oder die Polarität wechselt. Aus den Differenzen D1 bis Dn wird der maximale Wert dmax ermittelt. Nun wird ein Wert f nach fol- gender Formel berechnet.

1 1 1 f = dmax (+ +.... + dl d2 dn Die Wert wird nun über eine Tabelle korrigiert, und man er- hält den V-Wert (b).

Beispiel : Zeichen 1 : f = 3,4 Korrekturtabelle ergibt 2,37 = V-Wert (b).

Zeichen 2 : f = 2,3 Korrekturtabelle ergibt 1,50 = V-Wert (b).

Zeichen 3 : f = 1, 5 Korrekturtabelle ergibt 1,00 = V-Wert (b) = Normgeschwindigkeit.

Hierbei bedeutet zum Beispiel ein V-Wert von 2,37, dass das Zeichen um diesen Faktor in horizontaler Richtung verklei- nert werden muss. Bei einem V-Wert = 1 wird das Zeichen nicht verändert.

Anschließend wird noch eine Wertbildung der V-Werte von drei unmittelbar untereinander liegenden Zeilen durchgeführt.

Dieser V-Wert (b) ist ein Maß für die Scanngeschwindigkeit.

Der V-Wert (b) wird jetzt mit dem V-Wert (a) verglichen.

Weicht der V-Wert (b) mehr als 50% vom V-Wert (a) ab, dann wird der V-Wert (b) für den V-Wert eingesetzt.

Anschließend wird das Programm 214 zur Glättung der V-Werte und zum Abspeichern der Scanngeschwindigkeit in das SRAM durchgeführt. Hierbei wird der Mittelwert von 4 V-Werten ge- bildet. Die letzten drei V-Werte (Belegende) bekommen den Wert des zuletzt ermittelten V-Wertes. Bei der Glättung wird vorher abgefragt, ob der nächste Wert einen zu großen Ab- stand zum vorhergehenden hat. Ist dies der Fall, wird er gleich dem vorhergehenden gesetzt, da eine zu große Abwei- chung der Geschwindigkeit von Zeichen zu Zeichen nicht vor- kommen kann.

Ist bei einem V-Wert das höchste Bit 1, so wird dieser V- Wert noch überschrieben, und Programm 212 wird aufgerufen.

Mit den Endcode Oxffff wird die Schleife verlassen. An- schließend wird Programm 216 aufgerufen.

Mittels Programm 216 wird der ermittelte V-Wert in die"kor- primierte Tapete" (Puffer REZ) eingetragen. In Puffer WEZ befindet sich die Spaltenmittenadresse der Zeichen und der V-Werte.

Dies wird folgendermaßen durchgeführt : Im RAM Puffer REZ und WEZ sind jeweils die Spaltenadressen am Anfang einer Spalte abgespeichert. Die Spaltenadressen laufen syncron zueinander. Es wird nun die l des Puffers REZ als Startadresse genommen und die V-Wert au- faddiert. Da es sich um eine komprimierte Tapete handelt, muss nicht notwendigerweise eine Spaltenadresse 2 existie- ren. Ist die nächste Spaltenadresse zum Beispiel 5, dann muss der V-Wert n-mal auf die Spaltenadresse 1 addiert wer- den. Mit jeder Addition wird eine fortlaufende Adresse in- krementiert. Während der Addition wird die neue Spaltena- dresse mit der im Puffer WEZ verglichen. Ist die neue Spal-

tenadresse ganzzahlig größer als die Puffer WEZ, wird die fortlaufende Adresse als neue Adresse in REZ übernommen.

Die Beleggeschwindigkeit kann schneller, gleich oder langsa- mer als die Sollgeschwindigkeit sein. Ist sie schneller, werden die Bilddaten gespreizt. Ist die Beleggeschwindigkeit lang, werden die Bilddaten gestaucht, und entspricht die Be- leggeschwindigkeit der Normgeschwindigkeit, dann verändern sich die Bilddaten nicht.

Alle Programme 206 bis 216 wurden auf den komprimierten Bilddaten durchgeführt. Das Programm 218 dient zur Initiali- sierung des Programms 120, welches die komprimierte Tapete wieder dekomprimiert.

Außerdem speichert das Programm 220 die dekomprimierte Tape- te im Bildspeicher ab.

Hierbei werden Spalte für Spalte die im Puffer REZ abgespei- cherten Grauwertstützpunkte zeilenweise miteinander verbun- den und im Bildspeicher abgespeichert. Hierbei werden der Spaltenabstand zwischen den Grauwertpixeln und die Höhe der Grauwerte berücksichtigt, so dass es unterschiedliche Grau- wertkeile in horizontaler Richtung gibt. Auf diese Weise entsteht ein in horizontaler Richtung korrigiertes Bild im Bildspeicher, das zur Zeichenerkennung verwendet wird.

Das Programm 222 überträgt die Bilddaten des Bildspeichers in den FRAM Puffer (neuer WEZ). Hier liegen nach Beendigung der Bearbeitung des Scannvorgangs die endgültigen Bilddaten (siehe Figur 2).

Da der Bildspeicher nur 64 Spalten groß ist, zur Rekonstruk- tion der Bilddaten aus der komprimierten Tapete aber etwa 30 Spalten benötigt werden, muss nach 32 Spalten die Hälfte des

Bildspeichers in das SRAM abgespeichert werden. Das Programm 220 kann dann den Bildspeicher wieder laden.

Die Schleife aus den Programmen 220 und 222 wird solange durchgeführt, bis keine Daten mehr im SRAM-Puffer REZ vor- handen sind.

Danach wird die Zeichenerkennungssoftware 224 aufgerufen.

Bei der Ermittlung der Scanngeschwindigkeitswerte ist die Ermittlung der Steigungsmaße bei jedem der Weiß-schwarz-be- ziehungsweise Schwarz-weiß-tSbergänge jeder Zeile nur dann erforderlich, wenn bei der Ermittlung der Scanngeschwindig- keitswerte über den Mittenabstand zweier benachbarter Zei- chen Unsicherheiten in der Zeichenteilung bestehen. Dies kann der Fall sein, wenn Zeichen unterbrochen sind oder es keine Weißlücke zwischen den Zeichen gibt. Bei Proportional- schriften sollte die Ermittlung der Scanngeschwindigkeiten über Steigungsmaße der Übergänge generell erfolgen, da bei diesen Schriften die Zeichenteilung nicht konstant ist. Eine exakte Geschwindigkeitskorrektur ist bei Proportionalschrif- ten nicht notwendig, da die Zeichen ohnehin unterschiedlich breit sind, und die ein Problem darstellt, welches durch die Zeichenerkennung gelöst werden muss.

Obwohl die Erfindung anhand einer bevorzugten Ausführungs- form beschrieben wurde, ist klar zu verstehen, dass sie hierauf nicht beschränkt ist. Die Einrichtung eines SRAM- Puffers ist nicht zwingend notwendig, sondern vorteilhaft.

Selbstverständlich kann auch ein anderer Speicher verwendet werden, etwa ein DRAM oder ähnliches. Ebenso sind die in dem ausgeführten Beispiel angegebenen Zahlenwerte abänderbar. So können beispielsweise auch Scanner mit mehr als 64 Zeilen verwendet werden.