Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
WORD RECOGNIZING METHOD AND WORD RECOGNIZING PROGRAM
Document Type and Number:
WIPO Patent Application WO/2008/111399
Kind Code:
A1
Abstract:
A word recognizing method is provided to carry out the recognition processing for each word candidate obtained by reading a character of character information described on a matter to be read. This word recognizing method is provided with a matching process step (12) for checking each word candidate with a plurality of words in a word dictionary and calculates a matching score indicative of the degree of consistency between both words, a character quality score calculating step (13) for calculating a character quality score indicative of what degree a character candidate composing the word candidate is consistent with an arbitrary character, and a correcting step (14) for correcting the matching score obtained by the matching process step (12) on the basis of the character quality score obtained by the character quality score calculating step (13).

Inventors:
HAMAMURA TOMOYUKI (JP)
Application Number:
PCT/JP2008/053433
Publication Date:
September 18, 2008
Filing Date:
February 27, 2008
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
TOSHIBA KK (JP)
HAMAMURA TOMOYUKI (JP)
International Classes:
G06V30/10
Foreign References:
JPH06111079A1994-04-22
JPH05205109A1993-08-13
JP2001283157A2001-10-12
Other References:
See also references of EP 2138959A4
Attorney, Agent or Firm:
SUZUYE, Takehiko et al. (1-12-9 Toranomon, Minato-ku, Tokyo 01, JP)
Download PDF:
Claims:
 被読取物上に記載された文字情報の文字読取を行って得られる各単語候補に対する認識処理を行う単語認識方法であって、
 上記各単語候補に対し、単語辞書内の複数の単語との照合を行い、双方が一致する度合いを示すマッチングスコアを単語毎に算出するマッチング処理ステップ(12)と、
 上記各単語候補を構成する文字候補が任意の文字に一致する度合いを示す文字品質スコアを算出する文字品質スコア算出ステップ(13)と、
 上記文字品質スコア算出ステップ(13)で得られる文字品質スコアを元に上記マッチング処理ステップ(12)で得られるマッチングスコアを補正する補正ステップ(14)と、
 を有する単語認識方法。
 前記補正ステップ(14)は、上記マッチング処理ステップ(12)で得られるマッチングスコアから、上記文字品質スコア算出ステップ(13)で得られる文字品質スコアを差し引く処理を行うことを含む、請求項1記載の単語認識方法。
 前記任意の文字は、アルファベットのうちのいずれかの文字である、請求項1記載の単語認識方法。
 前記補正ステップ(14)により補正された各マッチングスコアのうち、最も高いマッチングスコアの単語を認識結果として出力するステップ(15)を更に有する、請求項1記載の単語認識方法。
 コンピュータに、被読取物上に記載された文字情報の文字読取を行って得られる単語候補に対する認識処理を行わせる単語認識プログラムであって、
 上記各単語候補に対し、単語辞書内の複数の単語との照合を行い、双方が一致する度合いを示すマッチングスコアを単語毎に算出するマッチング処理ステップ(12)と、
 上記各単語候補を構成する文字候補が任意の文字に一致する度合いを示す文字品質スコアを算出する文字品質スコア算出ステップ(13)と、
 上記文字品質スコア算出ステップ(13)で得られる文字品質スコアを元に上記マッチング処理ステップ(12)で得られるマッチングスコアを補正する補正ステップ(14)と、
 を有する単語認識プログラム。
Description:
単語認識方法および単語認識プ グラム

 本発明は、例えば、被読取物上に記載さ た複数の文字からなる単語を光学的に読取 光学的文字読取装置などにおいて単語認識 行う単語認識方法、および、その単語認識 理を行わせるための単語認識プログラムに する。

 一般に、例えば、光学的文字読取装置に いて、被読取物上に記載された文字を読取 場合、個々の文字認識精度が低くても、単 の知識を用いることで精度良く読取ること できる。従来、その実施方法として種々の 法が提案されている。

 その中で、単語の評価値として事後確率( a posteriori probability)を用い、かつ文字数が一 定でない場合においても精度良く単語認識が 行える方法として、日本国特開2001-283157号公 に開示されるものがある。

(発明が解決しようとする課題)
 しかしながら、上記の文献に開示されるも は、単語の記載位置が既知である場合を想 しており、単語の記載位置が未知である場 は十分な精度で単語認識を行えるとは言え い。例えば、正解単語が乱雑に記載されて り、非正解単語が丁寧に記載されていたよ な場合、非正解単語と似た辞書内単語の評 値(マッチングスコア)が高くなってしまい その結果、誤認識が生じやすくなる。

 そこで本発明は、単語の記載位置が未知 ある場合においても精度良く単語認識が行 る単語認識方法および単語認識プログラム 提供することを目的とする。

(課題を解決するための手段)
 本発明に係る単語認識方法は、被読取物上 記載された文字情報の文字読取を行って得 れる各単語候補に対する認識処理を行う単 認識方法であって、上記各単語候補に対し 単語辞書内の複数の単語との照合を行い、 方が一致する度合いを示すマッチングスコ を単語毎に算出するマッチング処理ステッ と、上記各単語候補を構成する文字候補が 意の文字に一致する度合いを示す文字品質 コアを算出する文字品質スコア算出ステッ と、上記文字品質スコア算出ステップで得 れる文字品質スコアを元に上記マッチング 理ステップで得られるマッチングスコアを 正する補正ステップとを有する。

 本発明に係る単語認識プログラムは、コ ピュータに、被読取物上に記載された文字 報の文字読取を行って得られる単語候補に する認識処理を行わせる単語認識プログラ であって、上記各単語候補に対し、単語辞 内の複数の単語との照合を行い、双方が一 する度合いを示すマッチングスコアを単語 に算出するマッチング処理ステップと、上 各単語候補を構成する文字候補が任意の文 に一致する度合いを示す文字品質スコアを 出する文字品質スコア算出ステップと、上 文字品質スコア算出ステップで得られる文 品質スコアを元に上記マッチング処理ステ プで得られるマッチングスコアを補正する 正ステップとを有する。

図1は、本発明の実施の形態に係る単語 認識方法を実現するための単語認識システム の構成を概略的に示すブロック図である。 図2は、単語認識方法の概略を説明する ためのフローチャートである。 図3は、スキャナ等で取り込まれたアル ファベット圏の帳票等の画像の例を示す図で ある。 図4は、取り込まれた画像から検出され る単語候補の例を示す図である。 図5は、都市名単語の登録された単語辞 書の例を示す図である。 図6は、補正処理を含む単語認識方法を 説明するためのフローチャートである。 図7は、マッチングスコアテーブルに記 憶されたマッチングスコアの例を示す図であ る。 図8は、文字品質スコアテーブルに記憶 された文字品質スコアの例を示す図である。 図9は、補正スコアテーブルに記憶され た補正スコアの例を示す図である。 図10は、図6中の単語マッチング処理の 詳細を説明するためのフローチャートである 。 図11は、図6中の文字品質スコア算出処 理の詳細を説明するためのフローチャートで ある。 図12は、図6中の補正スコア計算処理の 詳細を説明するためのフローチャートである 。

 以下、本発明の実施の形態について図面 参照して説明する。

 図1は、本発明の実施の形態に係る単語認 識方法を実現するための単語認識システムの 構成を概略的に示すものである。

 図1において、この単語認識システムは、 CPU(セントラル・プロセッシング・ユニット)1 、入力装置2、画像入力手段としてのスキャ 3、表示装置4、記憶手段としての第1メモリ5 記憶手段としての第2メモリ6、および、読 装置7などによって構成されている。

 CPU1は、第2メモリ6に格納されたオペレー ィングシステムプログラム、および、第2メ モリ6に格納されたアプリケーションプログ ム(単語認識プログラムなど)を実行すること により、後で詳細を説明するような単語認識 処理などを行うものである。

 入力装置2は、例えば、キーボードやマウ スなどからなり、利用者が各種操作を行った り、各種データを入力するために使用される 。

 スキャナ3は、被読取物上に記載された単 語の各文字を光学的な走査により読取って入 力するものである。

 表示装置4は、例えば、ディスプレイ装置 やプリンタなどからなり、各種データを出力 するものである。

 第1メモリ5は、例えば、RAM(ランダム・ア セス・メモリ)により構成されていて、CPU1 作業用メモリとして使用され、処理中の各 データなどを一時記憶するものである。例 ば、後述する文字辞書9、単語辞書10、確率 ーブル11などを一時記憶する。

 第2メモリ6は、例えば、ハードディスク 置により構成されていて、CPU1を動作させる めの各種プログラムなどを記憶するもので る。第2メモリ6には、入力装置2、スキャナ3 、表示装置4、第1メモリ5、第2メモリ6、読取 置7などを動作させるためのオペレーティン グシステムプログラム、単語認識プログラム および単語を構成する文字の認識用の文字辞 書9、単語認識用の単語辞書10、単語を構成す る文字の出現確率を記憶している確率テーブ ル11などが記憶されている。上記単語辞書10 しては、あらかじめ認識すべき単語の候補 複数格納されているものであり、単語認識 ステムが設置されている地域、例えば州に ける都市名が登録されている都市名辞書と っている。

 読取装置7は、例えば、CD-ROMドライブ装置 などからなり、記憶媒体としてのCD-ROM8に格 (記憶)されている単語認識プログラムおよび 単語認識用の単語辞書10などを読取るもので る。読取装置7により読取られた単語認識プ ログラム、文字辞書9、単語辞書10、確率テー ブル11は、第2メモリ6に格納(記憶)される。

 次に、単語認識方法の概略について、図2 に示すフローチャートを参照しつつ説明する 。

 まず、スキャナ3により郵便物Pの画像を り込む(読取る)画像取り込み処理が行われる (ステップST1)。この画像取り込み処理により り込んだ画像により宛名の記載されている 域を検出する領域検出処理が行われる(ステ ップST2)。この領域検出処理により検出した 名の記載領域から都市名に対応する単語の1 字ずつの矩形領域の文字パターンを、垂直 影や水平射影を用いて切出す切出し処理が われる(ステップST3)。この切出し処理によ 切出された単語の1文字ずつの文字パターン 文字辞書9に記憶されている文字パターンと を比較して得られる類似度により文字の認識 候補を得る文字認識処理が行われる(ステッ ST4)。この文字認識処理により得られる単語 1文字ずつの認識結果と単語辞書10に記憶さ ている都市名の各文字と確率テーブル11と 用いて、単語辞書10の各都市名ごとの事後確 率を算出し、事後確率の一番大きなものを単 語として認識する単語認識処理が行われる( テップST5)。上記各処理はCPU1により制御され ている。

 以下では、具体例の1つとして、アルファ ベット圏の帳票等に記載された宛先住所の中 から、都市名を読み取る例について説明する 。

 図3はスキャナ等により取り込まれたアル ファベット圏の帳票等の画像の例を示す図で ある。図4はスキャナ等により取り込まれた 像から検出される単語候補の例を示す図で る。図5は都市名単語の登録された単語辞書 例を示す図である。この場合、図3の画像の 中から、図4の画像に示されるような単語候 が検出され、これら単語候補の中から単語 書に登録されている単語(例えば、図5の単語 辞書に登録されている都市名)が探し出され 当該帳票等に記載されている単語(例えば、 市名)が特定されることになる。その際、本 実施形態では特に、単語候補と単語辞書内の 単語とのマッチング処理の結果に対し、所定 の補正処理が施される。

 ここで、本実施形態による補正処理を含 単語認識方法について、図6に示すフローチ ャートを参照しつつ説明する。

 図3に示されるような帳票等の画像がスキ ャナ等を通じて取り込まれると、図4に示さ るように画像の中に含まれる個々の単語候 が検出される(ステップ11)。検出された単語 補には通し番号が振られる。

 次に、各単語候補に対する単語マッチン 処理が行われる(ステップ12)。単語マッチン グ処理は、各単語候補に対し、単語辞書内の 複数の単語との照合を行い、双方が一致する 度合いを示すマッチングスコアを単語毎に算 出する処理である。

 この単語マッチング処理には、DP(Dynamic P rogramming)マッチング(もしくは「動的計画法」 )と呼ばれる周知の技術を適用することが可 である。このDPマッチングは、特に要素数( えば文字数)が異なる対象物(例えば単語)ど しを照合するにあたり、類似度などを算出 る計算処理を最小限にするアルゴリズムと てよく知られ、要素間のずれなどを考慮し つ、要素間の対応付け(整列化)を行い、最適 な照合処理を実現するものである。この技術 を援用することにより、マッチング処理にお ける速度の向上などを図ることができる。

 単語マッチング処理で算出されたマッチ グスコアは、マッチングスコアテーブルに 憶される。図7は、マッチングスコアテーブ ルに記憶されたマッチングスコアの例を示す 図である。このマッチングスコアテーブルに は、通し番号1~7の各単語候補と単語辞書内の 都市名単語“STOCKHOLM”,“TOCHICA”,“MOHEDA”, とのマッチング処理結果であるマッチング コアが単語毎に記憶されている。

 通し番号3の単語候補は、実際の帳票上で は、町名を示す“TOSHIBA”が書かれており、 語辞書内の各都市名単語とのマッチングス アは低くなることが予想される。しかしな ら、単語辞書内には、“TOSHIBA”とは5文字が 一致し、2文字が異なる都市名単語“TOCHICA” 存在する。帳票上では“TOSHIBA”を構成する 個々の文字が丁寧に書かれているがために、 一致する5文字により、単語辞書内の都市名 語“TOCHICA”とのマッチングスコア(符号a)が くなってしまっている。

 一方、通し番号6の単語候補は、実際の帳 票上では、都市名を示す“StockHolm”が書かれ ており、単語辞書内の都市名単語“STOCKHOLM” とのマッチングスコアが高くなることが期待 される。しかしながら、帳票上では“STOCKHOLM ”が乱雑に書かれているがために、そのマッ チングスコア(符号b)は期待されるほど高くな ってはいない。

 この時点では、符号bのマッチングスコア よりも符号aのマッチングスコアの方が高い め、帳票上に書かれた“TOSHIBA”が都市名単 “TOCHICA”として誤認識されてしまう可能性 がある。本実施形態では、以下の各ステップ によりこの誤認識を防止する。

 上記単語マッチング処理の後、各単語候 に対する文字品質スコア算出処理が行われ (ステップ13)。この文字品質スコア算出処理 は、各単語候補を構成する各文字が任意の文 字(文字辞書内のアルファベットのうちのい れかの文字)に一致する度合いを示す文字品 スコアを算出する処理である。例えば、あ 単語候補内のある文字候補の品質スコアを 出する際には、その文字候補が文字辞書内 いずれかのアルファベットに一致する確率( もしくは類似度)を算出する。このような算 処理を文字候補毎に行って得られる個々の 質スコアをそれぞれ加算等した結果が、そ 単語候補の文字品質スコアとして採用され 。

 この文字品質スコア算出処理においても 文字候補のマッチング処理の際に前述したD Pマッチングを適用することが可能である。

 文字品質スコア算出処理で算出された文 品質スコアは、文字品質スコアテーブルに 憶される。図8は、文字品質スコアテーブル に記憶された文字品質スコアの例を示す図で ある。この文字品質スコアテーブルには、通 し番号1~7の各単語候補に対する文字品質スコ アが記憶されている。

 例えば、帳票上に書かれた通し番号3の単 語候補や通し番号7の単語候補は、各文字が 寧に書かれている。特に文字と文字との境 がはっきりとしているため個々の文字を間 いなく特定できる。特定される個々の文字 形状が単語辞書内の任意のアルファベット ほぼ一致するため、他の候補よりも文字品 スコアが高くなっている。例えば、通し番 3の単語候補“TOSHIBA”の場合、手書きで書か れた文字“T”,“O”,“S”,“H”,“I”,“B”, “A”はそれぞれ、文字辞書内のアルファベ ト“T”,“O”,“S”,“H”,“I”,“B”,“A” ほぼ一致するほど丁寧である(一致もしくは 類似する度合いが高い)ため、高めのスコア 付されている。通し番号7の単語候補の場合 、同様、高めのスコアが付されている。

 一方、帳票上に書かれた通し番号4の単語 候補や通し番号6の単語候補は、各文字が乱 な筆記体で書かれている。特に文字と文字 の境目が不明確であるため個々の文字の特 が困難であり、個々の文字の特定を誤りや い。個々の文字を正しく特定できたとして 、その形状が文字辞書内の任意のアルファ ットにほぼ一致するものが見つからない場 が多い。このため、他の候補よりも文字品 スコアが低くなっている。例えば、乱雑に かれた通し番号6の単語候補“StockHolm”がこ に該当し、低めのスコアが付されている。 し番号4の単語候補の場合も、同様、低めの スコアが付されている。

 文字品質スコア算出処理の後、各単語候 に対する補正スコア計算処理が行われる(ス テップ14)。補正スコア計算処理は、上記文字 品質スコア算出処理で得られた文字品質スコ アを元に上記単語マッチング処理で得られた マッチングスコアを補正する処理である。例 えば、上記単語マッチング処理で得られたマ ッチングスコアから、上記文字品質スコア算 出処理で得られる文字品質スコアを差し引く 処理を行う。これにより、文字が丁寧に書か れた単語候補のマッチングスコアは補正処理 により大きく低下し、一方、文字が乱雑に書 かれた単語候補のマッチングスコアは補正処 理により小さく低下することになる。

 補正スコア計算処理で算出された補正ス アは、補正スコアテーブルに記憶される。 9は、補正スコアテーブルに記憶された補正 スコアの例を示す図である。この補正スコア テーブルには、通し番号1~7の各単語候補と単 語辞書内の都市名単語“STOCKHOLM”,“TOCHICA”, “MOHEDA”,…とのマッチング処理結果である ッチングスコアを補正した結果である補正 コアが単語毎に記憶されている。

 上記単語マッチング処理を行った時点で 、通し番号6の単語候補と辞書内単語“STOCKH OLM”とのマッチングスコア(符号b)よりも、通 し番号3の単語候補と辞書内単語“TOCHICA”と マッチングスコア(符号a)の方が高かったが 補正スコア計算処理後においては、スコア 高低が逆転している。すなわち、補正スコ 計算処理後においては、通し番号3の単語候 補と辞書内単語“TOCHICA”とのマッチングス ア(補正スコア)(符号a’)よりも通し番号6の 語候補と辞書内単語“STOCKHOLM”とのマッチ グスコア(補正スコア)(符号b’)の方が高くな っている。これにより、正しい認識結果が得 られることが期待される。

 補正スコア計算処理の後、補正スコアテ ブル上において補正スコアを最大とする都 名単語が単語辞書から選択され、選択され 都市名単語が認識結果として出力される(ス テップ15)。

 次に、図6中の単語マッチング処理の詳細 について、図10のフローチャートを参照しつ 説明する。

 まず、単語候補の番号iに1がセットされ (ステップ21)。そして、i番目の単語候補が選 択される(ステップ22)。

 次に、単語辞書内の単語の番号jに1がセ トされる(ステップ23)。そして、単語辞書内 j番目の単語が選択される(ステップ24)。

 次に、選択されたi番目の単語候補とj番 の辞書内単語とのマッチング処理が行われ マッチングスコアが計算される(ステップ25) そして、マッチングスコアテーブルの位置( i,j)にマッチングスコアが書き込まれる(ステ プ26)。

 ここで、jと辞書内全単語数が比較される (ステップ27)。jが辞書内全単語数より小さい 合、jに1が加算され(ステップ28)、ステップ2 4からの処理が繰り返される。一方、そうで い場合、iと全単語候補数が比較される(ステ ップ29)。iが全単語候補数より小さい場合、i 1が加算され(ステップ30)、ステップ22からの 処理が繰り返される。一方、そうでない場合 、単語マッチング処理を終了する。

 次に、図6中の文字品質スコア算出処理の 詳細について、図11のフローチャートを参照 つつ説明する。

 まず、単語候補の番号iに1がセットされ (ステップ41)。そして、i番目の単語候補が選 択される(ステップ42)。

 次に、単語候補を構成する文字候補の文 品質スコアが計算される(ステップ43)。そし て、文字品質スコアテーブルの位置iに文字 質スコアが書き込まれる(ステップ44)。

 次に、iと全単語候補数が比較される(ス ップ45)。iが全単語候補数より小さい場合、i に1が加算され(ステップ46)、ステップ42から 処理が繰り返される。一方、そうでない場 、文字品質スコア算出処理を終了する。

 次に、図6中の補正スコア計算処理の詳細 について、図12のフローチャートを参照しつ 説明する。

 まず、単語候補の番号iに1がセットされ (ステップ51)。そして、補正値hに、文字品質 スコアテーブルの位置iの値が読み込まれる( テップ52)。

 次に、単語辞書内の単語の番号jに1がセ トされる(ステップ53)。そして、スコアsに、 マッチングスコアテーブルの位置(i,j)の値が み込まれる(ステップ54)。さらに、スコアs ら補正値hが減算され、算出結果が補正スコ テーブルの位置(i,j)に書き込まれる(ステッ 55)。

 次に、jと辞書内全単語数が比較される( テップ56)。jが辞書内全単語数より小さい場 、jに1が加算され(ステップ57)、ステップ54 らの処理が繰り返される。一方、そうでな 場合、iと全単語候補数が比較される(ステッ プ58)。iが全単語候補数より小さい場合、iに1 が加算され(ステップ59)、ステップ52からの処 理が繰り返される。一方、そうでない場合、 補正スコア計算処理を終了する。

 次に、上述した各種のスコアを算出する めの計算式の具体例について説明する。

 ここでは、単語辞書内の単語、全ての文字 補の文字認識結果、文字候補の位置の全集 、ある位置の左端から右端に至る経路の全 合を、それぞれ次のように定義する。

 ある1つの単語候補とある1つの辞書内単語 のマッチングスコアを算出するには、事後 率比を用いた計算を行う。この場合、基本 なる計算式として、例えば次の式(1)を採用 る。

 式(1)の左辺における分数部分の分子は事 確率に相当し、分母は事前確率に相当する

 式(1)に基づき、前述の単語マッチング処理 おけるマッチングスコア(図7のスコアテー ルに相当)を算出するには、次の式(2)を用い 。

 また、前述の文字品質スコア算出処理にお る文字品質スコア(図8のスコアテーブルに 当)を算出するには、次の式(3)を用いる。

 なお、式(3)中の「C*」は、任意のアルフ ベットであることを示している。

 最終的に、上記の式(2)および式(3)に基づき 前述の補正スコア計算処理における補正ス ア(図9のスコアテーブルに相当)の最大値を 出するには、評価関数として次の式(4)を用 る。

 上述した実施形態によれば、単語の記載 置が未知である場合であっても、精度良く 語認識を行うことが可能となる。例えば、 解単語が乱雑に記載されており、非正解単 が丁寧に記載されていたような場合であっ も、マッチングスコアが補正されて適切な 価値が得られるため、誤認識の発生を防止 ることが可能となる。

 なお、本発明は上記実施形態そのままに 定されるものではなく、実施段階ではその 旨を逸脱しない範囲で構成要素を変形して 体化できる。また、上記実施形態に開示さ ている複数の構成要素の適宜な組み合わせ より、種々の発明を形成できる。例えば、 施形態に示される全構成要素から幾つかの 成要素を削除してもよい。さらに、異なる 施形態にわたる構成要素を適宜組み合わせ もよい。

 本発明によれば、例えば、被読取物上に 載された複数の文字からなる単語を光学的 読取る光学的文字読取装置などにおいて単 認識を行う際に、単語の記載位置が未知で る場合においても精度良く単語認識が行え 。