Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
CHARACTER IDENTIFICATION METHOD AND CHARACTER IDENTIFICATION APPARATUS
Document Type and Number:
WIPO Patent Application WO/2014/131339
Kind Code:
A1
Abstract:
Disclosed are a character identification method and a character identification apparatus. The character identification method comprises: obtaining a threshold array; selecting a first threshold from the threshold array as a selected threshold; performing binarization processing on a character image by using the selected threshold to obtain a binary image of the character image; performing character identification on the binary image to obtain an identification result; calculating a confidence of the identification result; determining whether the confidence of the identification result is greater than a preset confidence value; if the confidence of the identification result is greater than the preset confidence value, using the identification result as an identification result of the character image; and if the confidence of the identification result is not greater than the preset confidence value, selecting a second threshold from the threshold array, and replacing the first threshold by using the second threshold as a selected threshold. By means of the present invention, the problem is solved that the conventional character identification method is only applicable for identifying an original copy with a high image contrast and the identification rate of an original copy with a low image contrast is low.

Inventors:
XING YUEQI (CN)
XU CHUNKAI (CN)
DONG SHUXUN (CN)
WANG CHUNTAO (CN)
Application Number:
PCT/CN2014/072328
Publication Date:
September 04, 2014
Filing Date:
February 20, 2014
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SHANDONG NEW BEIYANG INF TECH (CN)
International Classes:
G06V30/162; G06V30/10
Foreign References:
CN101727582A2010-06-09
CN102136068A2011-07-27
CN102156868A2011-08-17
US20030012440A12003-01-16
CN101042735A2007-09-26
Attorney, Agent or Firm:
KANGXIN PARTNERS, P.C. (CN)
北京康信知识产权代理有限责任公司 (CN)
Download PDF:
Claims:
权 利 要 求 书

1. 一种字符识别方法, 其特征在于, 包括: 获取阈值数组, 其中, 所述阈值数组包括多个阈值;

从所述阈值数组中选取第一阈值作为选定阈值;

步骤 a, 采用所述选定阈值对字符图像进行二值化处理, 得到所述字符图 像的二值图像;

步骤 b, 对所述二值图像进行字符识别, 得到识别结果;

步骤 c, 计算所述识别结果的置信度;

步骤 d, 判断所述识别结果的置信度是否大于置信度预定值, 如果所述识别结果的置信度大于所述置信度预定值, 则将所述识别结果作 为所述字符图像的识别结果; 以及

如果所述识别结果的置信度不大于所述置信度预定值, 则从所述阈值数组 中选取第二阈值, 采用所述第二阈值替换所述第一阈值作为所述选定阈值, 并 返回执行所述步骤 a。

2. 根据权利要求 1所述的字符识别方法, 其特征在于,

所述步骤 a包括: 切分所述二值图像, 得到 N个切分区域, 其中, 所述 N 个切分区域中的每一个切分区域分别与一个待识别字符相对应,

所述步骤 b包括: 对所述 N个切分区域进行字符识别, 得到分别对应于所 述 N个切分区域的 N个识别结果,

所述步骤 c包括: 计算所述 N个识别结果的置信度, 所述步骤 d包括: 判断所述 N个识别结果的置信度是否均大于置信度预定 值,

如果所述 N个识别结果的置信度均大于所述置信度预定值, 则确定所述识 别结果的置信度大于所述置信度预定值,

如果所述 N个识别结果中任意一个的置信度不大于所述置信度预定值, 则 确定所述识别结果的置信度不大于所述置信度预定值。

3. 根据权利要求 2所述的字符识别方法, 其特征在于, 在选取所述第一阈值作为所述选定阈值时, 如果所述 N个识别结果中任意 一个的置信度不大于所述置信度预定值, 所述方法还包括:

记录第一切分区域的识别结果和第二切分区域, 其中, 所述第一切分区域 为所述 N个识别结果中置信度大于所述置信度预定值的识别结果对应的切分区 域,所述第二切分区域为所述 N个识别结果中置信度不大于所述置信度预定值 的识别结果对应的切分区域,

在选取所述第二阈值作为所述选定阈值时:

所述步骤 a包括: 采用所述第二阈值作为所述选定阈值对所述字符图像进 行二值化处理, 得到所述字符图像的二值图像, 切分所述二值图像, 得到 N个 切分区域,

所述步骤 b包括: 对所述 N个切分区域中与所述第二切分区域对应的切分 区域进行字符识别。

4. 根据权利要求 1所述的字符识别方法, 其特征在于, 在采用选定阈值对字符图 像进行二值化处理之前, 所述方法还包括:

获取所述字符图像的直方图; 对所述字符图像的直方图进行计算, 得到基础阈值; 以及

以所述基础阈值为中心阈值进行拓展得到所述阈值数组。

5. 根据权利要求 4所述的字符识别方法, 其特征在于, 采用以下方式由所述基础 阈值为中心阈值进行拓展得到所述阈值数组 TH:

ΤΗ= {Τ0,Τ0+Δ, Τ0-Δ,Τ0+2Δ, Τ0-2Δ, ...} , 其中, Δ为所述阈值数组 ΤΗ中相邻阈值之间的差值, TO为所述基础阈值。

6. 一种字符识别装置, 其特征在于, 包括: 获取单元, 用于获取阈值数组, 其中, 所述阈值数组包括多个阈值; 二值化处理单元, 用于采用选定阈值对字符图像进行二值化处理, 得到所 述字符图像的二值图像;

识别单元, 用于对所述二值图像进行字符识别, 得到识别结果; 计算单元, 用于计算所述识别结果的置信度; 判断单元, 判断所述识别结果的置信度是否大于置信度预定值, 其中, 如 果所述识别结果的置信度大于所述置信度预定值, 则将所述识别结果作为所述 字符图像的识别结果;

选取单元, 用于从所述阈值数组中选取第一阈值或第二阈值作为所述选定 阈值, 其中, 首先选取所述第一阈值作为所述选定阈值, 在所述第一阈值作为 所述选定阈值时, 如果所述识别结果的置信度不大于所述置信度预定值, 则从 所述阈值数组中选取所述第二阈值。

7. 根据权利要求 6所述的字符识别装置, 其特征在于, 所述二值化处理单元还用于切分所述二值图像,得到 N个切分区域,其中, 所述 N个切分区域中的每一个切分区域分别与一个待识别字符相对应,

所述识别单元还用于对所述 N个切分区域进行字符识别,得到分别对应于 所述 N个切分区域的 N个识别结果,

所述计算单元还用于计算所述 N个识别结果的置信度, 所述判断单元还用于判断所述 N个识别结果的置信度是否均大于置信度预 定值, 如果所述 N个识别结果的置信度均大于所述置信度预定值, 则确定所述 识别结果的置信度大于所述置信度预定值, 如果所述 N个识别结果中任意一个 的置信度不大于所述置信度预定值, 则确定所述识别结果的置信度不大于所述 置信度预定值。

8. 根据权利要求 7所述的字符识别装置, 其特征在于, 还包括: 记录单元, 用于在选取所述第一阈值作为所述选定阈值时, 如果所述 N个 识别结果中任意一个的置信度不大于所述置信度预定值, 记录第一切分区域的 识别结果和第二切分区域, 其中, 所述第一切分区域为所述 N个识别结果中置 信度大于所述置信度预定值的识别结果对应的切分区域, 所述第二切分区域为 所述 N个识别结果中置信度不大于所述置信度预定值的识别结果对应的切分区 域,

其中, 所述二值化处理单元还用于在选取所述第二阈值作为所述选定阈值 时, 采用所述第二阈值作为所述选定阈值对所述字符图像进行二值化处理, 得 到所述字符图像的二值图像, 切分所述二值图像, 得到 N个切分区域,

其中,所述识别单元还用于对所述 N个切分区域中与所述第二切分区域对 应的切分区域进行字符识别。 根据权利要求 6所述的字符识别装置, 其特征在于, 所述获取单元包括: 获取模块, 用于在采用选定阈值对字符图像进行二值化处理之前, 获取所 述字符图像的直方图; 计算模块, 用于对所述字符图像的直方图进行计算, 得到基础阈值; 拓展模块, 用于以所述基础阈值为中心阈值进行拓展得到所述阈值数组。 根据权利要求 9所述的字符识别装置, 其特征在于, 所述拓展模块用于采用以 下方式由所述基础阈值为中心阈值进行拓展得到所述阈值数组 TH:

ΤΗ= {Τ0,Τ0+Δ, Τ0-Δ,Τ0+2Δ, Τ0-2Δ, ...} , 其中, Δ为所述阈值数组 ΤΗ中相邻阈值之间的差值, TO为所述基础阈值。

Description:
字符识别方法和字符识别装置

本申请要求 2013 年 2 月 26 日提交至中国知识产权局的, 申请号为 201310060434.6, 名称为 "字符识别方法和字符识别装置" 的中国发明专利申请的优 先权, 其全部公开内容结合于此作为参考。 技术领域 本发明涉及字符识别领域, 具体而言, 涉及一种字符识别方法和字符识别装置。 背景技术 传统的字符识别方法包括: a) 扫描, 获取原稿的灰度图像; b) 通过对获取到的 图像的灰度直方图的分析和计算来得到阈值, 根据阈值对灰度图像进行二值化处理得 到二值图像; c)对二值图像进行字符切割, 对切割的字符块和模板字符进行对比, 选 取与模板字符最相近的字符为识别字符。 在传统的字符识别方法中, 进行阈值计算的方法有 Otsu方法、 NiBlack方法、 最 小误差法或最大熵方法等。 发明人发现, 无论采用哪种方法获得的阈值, 在对灰度图 像进行二值化处理时均存在一定的局限性。 具体的, 对于对比度低的原稿, 使用单一 阈值对原稿图像二值化时容易产生失真现象。 比如, 当需要进行字符识别的原稿为纸 币时, 由于纸币在使用过程中容易受到磨损、 污染或涂鸦, 因此, 纸币图像的对比度 较低, 如图 la所示的纸币号码区域图像, 由于字符" C"所在区域受到污染, 当利用传 统的字符识别方法使用单一阈值对图 la所示图像进行二值化处理得到图 lb所示的二 值图像, 从图中可以看出, 很难准确识别出字符 "C"。 因此, 传统的字符识别方法仅适 用于识别图像对比度高的原稿, 而对图像对比度低的原稿识别率较低。 发明内容 本发明的主要目的在于提供一种字符识别方法 和字符识别装置, 以解决传统的字 符识别方法仅适用于识别图像对比度高的原稿 , 而对图像对比度低的原稿识别率较低 的问题。 为了实现上述目的, 根据本发明的一个方面, 提供了一种字符识别方法。 该字符 识别方法包括: 获取阈值数组, 其中, 阈值数组包括多个阈值; 从阈值数组中选取第 一阈值作为选定阈值; 步骤 a, 采用选定阈值对字符图像进行二值化处理, 得到字符 图像的二值图像; 步骤 b, 对二值图像进行字符识别, 得到识别结果; 步骤 C, 计算识 别结果的置信度; 步骤 d, 判断识别结果的置信度是否大于置信度预定值 , 如果识别 结果的置信度大于置信度预定值, 则将识别结果作为字符图像的识别结果; 如果识别 结果的置信度不大于置信度预定值, 则从阈值数组中选取第二阈值, 采用第二阈值替 换第一阈值作为选定阈值, 并返回执行步骤^ 进一步地, 步骤 a包括: 切分二值图像, 得到 N个切分区域, 其中, N个切分区 域中的每一个切分区域分别与一个待识别字符 相对应。 步骤 b包括: 对 N个切分区域 进行字符识别, 得到分别对应于 N个切分区域的 N个识别结果。 步骤 c包括: 计算 N 个识别结果的置信度。 步骤 d包括: 判断 N个识别结果的置信度是否均大于置信度预 定值, 如果 N个识别结果的置信度均大于置信度预定值, 则确定识别结果的置信度大 于置信度预定值, 如果 N个识别结果中任意一个的置信度不大于置信 预定值, 则确 定识别结果的置信度不大于置信度预定值。 进一步地, 在选取第一阈值作为选定阈值时, 如果 N个识别结果中任意一个的置 信度不大于置信度预定值, 该方法还包括: 记录第一切分区域的识别结果和第二切分 区域, 其中, 第一切分区域为 N个识别结果中置信度大于置信度预定值的识 结果对 应的切分区域, 第二切分区域为 N个识别结果中置信度不大于置信度预定值的 别结 果对应的切分区域。 在选取第二阈值作为选定阈值时: 步骤 a包括: 采用第二阈值作 为选定阈值对字符图像进行二值化处理, 得到字符图像的二值图像, 切分二值图像, 得到 N个切分区域, 步骤 b包括: 对 N个切分区域中与第二切分区域对应的切分区 进行字符识别。 进一步地, 在采用选定阈值对字符图像进行二值化处理之 前, 该方法还包括: 获 取字符图像的直方图; 对字符图像的直方图进行计算, 得到基础阈值; 以基础阈值为 中心阈值进行拓展得到阈值数组。 进一步地, 采用以下方式由基础阈值为中心阈值进行拓展 得到阈值数组 TH: ΤΗ={Τ0,Τ0+Δ, Τ0-Δ,Τ0+2Δ, Τ0-2Δ, .. ·}, 其中, Δ为阈值数组 TH中相邻阈值之间的差值, TO为基础阈值。 为了实现上述目的, 根据本发明的另一方面, 提供了一种字符识别装置。 该字符 识别装置包括: 获取单元, 用于获取阈值数组, 其中, 阈值数组包括多个阈值; 二值 化处理单元, 用于采用选定阈值对字符图像进行二值化处理 , 得到字符图像的二值图 像; 识别单元, 用于对二值图像进行字符识别, 得到识别结果; 计算单元, 用于计算 识别结果的置信度; 判断单元, 判断识别结果的置信度是否大于置信度预定值 , 其中, 如果识别结果的置信度大于置信度预定值, 则将识别结果作为字符图像的识别结果; 选取单元, 用于从阈值数组中选取第一阈值或第二阈值作 为选定阈值, 其中, 首先选 取第一阈值作为选定阈值, 在第一阈值作为选定阈值时, 如果识别结果的置信度不大 于置信度预定值, 则从阈值数组中选取第二阈值。 进一步地, 二值化处理单元还用于切分二值图像, 得到 N个切分区域, 其中, N 个切分区域中的每一个切分区域分别与一个待 识别字符相对应, 识别单元还用于对 N 个切分区域进行字符识别, 得到分别对应于 N个切分区域的 N个识别结果, 计算单元 还用于计算 N个识别结果的置信度,判断单元还用于判断 N个识别结果的置信度是否 均大于置信度预定值, 如果 N个识别结果的置信度均大于置信度预定值, 则确定识别 结果的置信度大于置信度预定值, 如果 N个识别结果中任意一个的置信度不大于置信 度预定值, 则确定识别结果的置信度不大于置信度预定值 。 进一步地, 该字符识别装置还包括: 记录单元, 用于在选取第一阈值作为选定阈 值时, 如果 N个识别结果中任意一个的置信度不大于置信 预定值, 记录第一切分区 域的识别结果和第二切分区域, 其中, 第一切分区域为 N个识别结果中置信度大于置 信度预定值的识别结果对应的切分区域, 第二切分区域为 N个识别结果中置信度不大 于置信度预定值的识别结果对应的切分区域, 其中, 二值化处理单元还用于在选取第 二阈值作为选定阈值时, 采用第二阈值作为选定阈值对字符图像进行二 值化处理, 得 到字符图像的二值图像, 切分二值图像, 得到 N个切分区域, 其中, 识别单元还用于 对 N个切分区域中与第二切分区域对应的切分区 进行字符识别。 进一步地, 获取单元包括: 获取模块, 用于在采用选定阈值对字符图像进行二值 化处理之前, 获取字符图像的直方图; 计算模块, 用于对字符图像的直方图进行计算, 得到基础阈值; 拓展模块, 用于以基础阈值为中心阈值进行拓展得到阈值 数组 TH。 进一步地, 拓展模块用于采用以下方式由基础阈值为中心 阈值进行拓展得到阈值 数组 TH:

ΤΗ= {Τ0,Τ0+Δ, Τ0-Δ,Τ0+2Δ, Τ0-2Δ, ...} , 其中, Δ为阈值数组 TH中相邻阈值之间的差值, TO为基础阈值。 通过本发明, 对识别字符进行置信度评估, 通过置信度的评估结果对阈值动态调 整, 只有置信度符合要求的识别字符为最终的识别 字符, 解决了传统的字符识别方法 仅适用于识别图像对比度高的原稿, 而对图像对比度低的原稿识别率较低的问题。 附图说明 构成本申请的一部分的附图用来提供对本发明 的进一步理解, 本发明的示意性实 施例及其说明用于解释本发明, 并不构成对本发明的不当限定。 在附图中: 图 la是对比度较低的纸币号码区域图像的示意图 图 lb是利用传统的阈值计算方法得到的阈值对图 la中图像进行二值化处理得到 的二值图像的示意图; 图 2是根据本发明一实施例的字符识别装置的模 组成示意图; 图 3是根据本发明第一实施例的字符识别方法的 程图; 图 4是根据本发明第二实施例的字符识别方法的 程图; 图 5是根据本发明第三实施例的字符识别方法的 程图; 图 6a是根据本发明一实施例的字符图像的示意图 图 6b是图 6a中字符图像的灰度直方图; 图 7是根据本发明第二实施例的字符识别方法中 用不同阈值对字符图像进行二 值化处理和字符识别结果之间的关系图; 以及 图 8是根据本发明第三实施例的字符识别方法中 用不同阈值对字符图像进行二 值化处理和字符识别结果之间的关系图。 具体实施方式 需要说明的是, 在不冲突的情况下, 本申请中的实施例及实施例中的特征可以相 互组合。 下面将参考附图并结合实施例来详细说明本发 明。 图 2是本发明一实施例的字符识别装置的模块组 示意图。 如图所示, 该字符识 别装置 10包括: 获取单元 11、 选取单元 12、 二值化处理单元 13、 识别单元 14、 计算 单元 15和判断单元 16。 获取单元 11, 用于获取阈值数组 TH, 其中, 阈值数组 TH包括多个阈值。 例如, 可以先对输入的原始图像进行计算以得到基础 阈值 T0, 其中, 原始图像为待识别字符 所在区域的灰度图像, 如在识别纸币的冠字号时, 原始图像为纸币冠字号所在区域的 灰度图像, 也称为字符图像。 然后由基础阈值 TO 计算得到多个阈值, 从而由基础阈 值 TO拓展得到阈值数组 TH, 优选地, 阈值数组 TH中的阈值是以基础阈值 TO为中 心阈值扩展得到的。 二值化处理单元 13, 用于采用选定阈值对字符图像进行二值化处理 , 得到字符图 像的二值图像。 选定阈值为从阈值数组 TH中选取得到的阈值。 利用阈值数组 TH中 的某一数据对字符图像进行二值化处理,把以 灰度表示的字符图像转换为仅包括以 "0" 表示的白像素和" 1"表示的黑像素的二值图像, 比如, 利用基础阈值 TO对字符图像进 行二值化处理, 则把字符图像中灰度值大于等于 TO的像素转换为像素" 0", 把字符图 像中灰度值小于 TO的像素转换为像素 "1"。 识别单元 14, 用于对二值图像进行字符识别, 得到识别结果。 计算单元 15, 用于计算识别结果的置信度。 计算每个识别字符的置信度 C, 把计 算得到的置信度 C与置信度预定值进行比较, 如果置信度 C大于置信度预定值, 表示 识别的字符可信, 如果 C小于等于置信度预定值, 表示识别的字符不可信, 需要重新 进行识别, 其中, 置信度 C表示识别结果的可信度, 其数值越大, 则识别结果的可信 度越高。 判断单元 16, 判断识别结果的置信度是否大于置信度预定值 , 其中, 如果识别结 果的置信度大于置信度预定值, 则将识别结果作为字符图像的识别结果。 选取单元 12, 用于从阈值数组 TH中选取第一阈值或第二阈值作为选定阈值, 其 中, 首先选取第一阈值作为选定阈值, 在第一阈值作为选定阈值时, 如果识别结果的 置信度不大于置信度预定值, 则从阈值数组中选取第二阈值。 这里的第一阈值和第二 阈值仅仅是举例描述, 可以是阈值数组 TH中的任意两个不同的阈值, SP, 在阈值数 组 TH中存储有多个阈值, 选取单元 12从阈值数组 TH中依次选取阈值对字符图像进 行二值化处理, 直到二值化处理之后的二值图像的识别结果的 置信度 C大于置信度预 定值。 优选地, 二值化处理单元 13还用于切分二值图像, 得到 N个切分区域, 其中, N 个切分区域中的每一个切分区域分别与一个待 识别字符相对应, 此时, 识别单元 14 还用于对 N个切分区域进行字符识别, 得到分别对应于 N个切分区域的 N个识别结 果, 计算单元 15还用于计算 N个识别结果的置信度, 判断单元 16还用于判断 N个识 别结果的置信度是否均大于置信度预定值, 如果 N个识别结果的置信度均大于置信度 预定值, 则确定识别结果的置信度大于置信度预定值, 如果 N个识别结果中任意一个 的置信度不大于置信度预定值, 则确定识别结果的置信度不大于置信度预定值 。 识别 单元 14通过对切分区域进行字符识别,可以得到每 切分区域对应的字符, 从而得到 二值图像对应的字符串, 如对纸币冠字号区域进行识别, 得到包括多个字符和数字的 纸币冠字号。 优选地, 字符识别装置还包括: 记录单元 17, 用于在选取第一阈值作为选定阈值 时, 如果 N个识别结果中任意一个的置信度不大于置信 预定值, 记录第一切分区域 的识别结果和第二切分区域, 其中, 第一切分区域为 N个识别结果中置信度大于置信 度预定值的识别结果对应的切分区域, 第二切分区域为 N个识别结果中置信度不大于 置信度预定值的识别结果对应的切分区域。此 时, 二值化处理单元 13还用于在选取第 二阈值作为选定阈值时, 采用第二阈值作为选定阈值对字符图像进行二 值化处理, 得 到字符图像的二值图像,切分二值图像,得到 N个切分区域, 识别单元 14还用于对 N 个切分区域中与第二切分区域对应的切分区域 进行字符识别。 获取单元 12可以进一步包括: 获取模块 121, 用于在采用选定阈值对字符图像进 行二值化处理之前, 获取字符图像的直方图; 计算模块 122, 用于对字符图像的直方 图进行计算, 得到基础阈值; 拓展模块 123, 用于以基础阈值为中心阈值进行拓展得 到阈值数组 TH,该拓展模块可以采用以下方式由基础阈值 中心阈值进行拓展得到阈 值数组 TH:

ΤΗ= {Τ0,Τ0+Δ, Τ0-Δ,Τ0+2Δ, Τ0-2Δ, ...} , 其中, Δ为阈值数组 TH中相邻阈值之间的差值, TO为基础阈值。 以下对本发明实施例提供的字符识别方法进行 介绍。 需要说明的是, 本发明实施 例提供的字符识别方法可以通过本发明实施例 的字符识别装置来执行。 相应地, 本发 明实施例提供的字符识别装置也可以用于本发 明实施例的字符识别方法。 本发明实施 例的字符识别装置可以是计算机、 打印机、 扫描设备等。 图 3是根据本发明第一实施例的字符识别方法的 程图。 如图 3所示, 该字符识 别方法包括以下步骤: 步骤 Sll, 获取阈值数组, 其中, 阈值数组包括多个阈值。 阈值数组中的多个阈值可以是预先设置或存储 的, 也可以是在字符识别的过程中 通过一个基础阈值计算得到的。 步骤 S12, 从阈值数组中选取第一阈值作为选定阈值。 从阈值数组中任意选取一个阈值作为第一阈值 , 如果阈值数组是通过一个基础阈 值拓展得到的, 优选地, 可以选取该基础阈值作为第一阈值。 步骤 S13, 采用选定阈值对字符图像进行二值化处理, 得到字符图像的二值图像。 步骤 S14, 对二值图像进行字符识别, 得到识别结果。 步骤 S15, 计算识别结果的置信度。 步骤 S16, 判断识别结果的置信度是否大于置信度预定值 。 如果识别结果的置信 度大于置信度预定值, 则执行步骤 S17。 如果识别结果的置信度不大于置信度预定值, 则执行步骤 S18。 步骤 S17, 将识别结果作为字符图像的识别结果。 步骤 S18, 从阈值数组中选取第二阈值, 采用第二阈值替换第一阈值作为选定阈 值, 并返回执行步骤 S13。 从阈值数组中任意选取一个与第一阈值不同的 阈值作为第二阈值, 如果阈值数组 是通过一个基础阈值拓展得到的, 优选地, 该第二阈值为与基础阈值最临近的一个阈 值。 优选地, 步骤 S13还包括: 切分二值图像, 得到 N个切分区域, 其中, N个切分 区域中的每一个切分区域分别与一个待识别字 符相对应。 步骤 S14包括: 对 N个切分 区域进行字符识别, 得到分别对应于 N个切分区域的 N个识别结果。 步骤 15包括: 计算 N个识别结果的置信度。 步骤 16包括: 判断 N个识别结果的置信度是否均大于 置信度预定值, 如果 N个识别结果的置信度均大于置信度预定值, 则确定识别结果的 置信度大于置信度预定值, 如果 N个识别结果中任意一个的置信度不大于置信 预定 值, 则确定识别结果的置信度不大于置信度预定值 。 优选地, 在选取第一阈值作为选定阈值时, 如果 N个识别结果中任意一个的置信 度不大于置信度预定值, 该方法还包括: 记录第一切分区域的识别结果和第二切分区 域, 其中, 第一切分区域为 N个识别结果中置信度大于置信度预定值的识 结果对应 的切分区域, 第二切分区域为 N个识别结果中置信度不大于置信度预定值的 别结果 对应的切分区域。 在选取第二阈值作为选定阈值时: 步骤 S13包括: 采用第二阈值作 为选定阈值对字符图像进行二值化处理, 得到字符图像的二值图像, 切分二值图像, 得到 N个切分区域, 步骤 S14包括: 对 N个切分区域中与第二切分区域对应的切分区 域进行字符识别。 图 4是根据本发明第二实施例的字符识别方法的 程图。 该实施例可以作为图 3 所示第一实施例的一种优选实施方式, 如图 4所示, 具体处理过程如下: 步骤 S21, 根据字符图像的直方图, 确定基础阈值 T0, 得到阈值数组 ΤΗ。 该步骤 S21可以作为图 3所示步骤 S11的一种优选实施方式。 如图 6a所示, 对字符图像 30进行处理, 得到如图 6b所示的字符图像 30的灰度 直方图, 其中, 坐标系的横轴为像素的灰度值, 纵轴为具有各种灰度值的像素占总像 素数的比例, 可以利用现有技术中的任意一种阈值计算方法 , 得到原始图像的基础阈 值 T0, 如通过 Ostu算法 (出处 N.Otsu, "A threshold selection method from grey-level histograms", IEEE Trans. Syst., Man, Cybem., vol. SMC-1, pp. 62-66, Jan. 1979)得 到基础阈值 T0。 为了满足对不同对比度图像的二值化, 因此, 需要设置多个阈值, 多 个阈值的获得方法是在以基础阈值 TO为中心阈值扩展得到的。 优选的, 从 TO扩展为 Τ0±η*Δ, 由此得到由多个阈值组成的阈值数组 ΤΗ, ΤΗ={Τ0,Τ0+Δ, Τ0-Δ,Τ0+2Δ, Τ0-2Δ, ...} , Δ为相邻阈值之间的差值, 优选取值为 0x10, 当然也可以取比 0x10更 小的数值。 阈值数组 ΤΗ的数据个数可以根据需要设定, 经测试验证, 阈值数组包括 5 个数据、 Δ等于 0x10能够达到识别准确率的要求,从而得到阈 数组 ΤΗ={Τ0,Τ0+0χ10, Τ0-0χ10,Τ0+0χ20, Τ0-0χ20}。 如图 6b所示, 基础阈值 T0等于 0x41, 阈值数组 TH的 第二个数据 Τ0+Δ为 0x51, 阈值数组 TH的第三个数据 Τ0-Δ为 0x31。 步骤 S22, 令阈值 T等于阈值数组 TH的第一个数据。 该步骤 S22可以作为图 3所示步骤 S12的一种优选实施方式。 令阈值 T等于阈值数组 TH的第一个数据, 本实施例中, TH的第一个数据为 T0, 第二个数据为 Τ0+Δ,第三个数据为 Τ0-Δ,第四个数据为 Τ0+2Δ,第五个数据为 Τ0-2Δ, 因此首先令阈值 T= TO对字符图像进行二值化处理。 步骤 S23, 使用阈值 T对字符图像进行二值化处理。 该步骤 S23可以作为图 3所示步骤 S13的一种优选实施方式。 使用阈值 T对字符图像进行二值化, 以得到字符图像的二值图像。 如图 7所示, 二值图像 40是以阈值 0x41对图 6a中字符图像 30进行二值化得到的图像, 二值图像 50是以阈值 0x51对图 6a中字符图像 30进行二值化得到的图像, 二值图像 60是以阈 值 0x31对图 6a中字符图像 30进行二值化得到的图像。 步骤 S24, 切分二值图像得到 N个切分区域。 对二值图像进行切分, 得到 N个切分区域, 每一个切分区域与一个待识别字符相 对应。 如图 7所示, 对二值图像 40进行切分时得到 10个切分区域。 对二值图像进行 切分时, 常用的切分方式为利用二值图像的垂直投影, 结合字符间距、 字符宽度、 字 符高度等, 对二值图像进行切割。 步骤 S25, 对第一个切分区域进行字符识别。 对 N个切分区域, 按照一定的顺序, 如从左到右的顺序, 进行字符识别。 首先从 第一个切分区域开始字符识别, 如图 7所示, 对二值图像 40的切分区域进行处理时, 从左边的第一个切分区域开始处理。 提取第一切分区域的特征向量, 计算特征向量与标准模板向量的欧氏距离: 其中, D为特征向量与标准模板向量的欧氏距离, D,为与第 i个标准模板向量的 欧氏距离, 是字符的特征向量, .是特征向量的第 j个分量, N,是第 i个标准模板 向量, 而 N^是 N,的第 j个分量, i的取值范围为 l~k, k为标准模板向量的数量, 如 对纸币的冠字号进行识别时, 冠字号包括从 0~9的 10个数字及从 A~Z的 26个字母, 则 k=36。 对 k个欧氏距离 D 2 D k-1 , D k 进行排序, 得到最小的欧氏距离, 选择与 最小的欧氏距离对应的标准模板向量所代表的 字符作为被识别字符的识别结果。 上述步骤 S24和步骤 S25可以作为图 3所示步骤 S14的一种优选实施方式。 步骤 S26, 计算置信度 C。 计算置信度, 以 C表示, C = _DJD,其中, D x 为最小的欧氏距离, D y 为次小 的欧氏距离。 图 3所示步骤 S15中的置信度 C也可以采用上述方式进行计算。 步骤 S27, 判定置信度 C是否大于置信度预定值。 该步骤 S27可以作为图 3所示步骤 S16的一种优选实施方式。 把计算得到的置信度 C与置信度预定值进行比较, 其中, 置信度预定值是利用字 符识别方法中的标准模板向量对字符进行识别 时经试验得到的数值, 它表示置信度小 于置信度预定值的识别字符是不可信的, 其取值范围为 [0,1], 如等于 0.2, 当置信度 C 大于置信度预定值时, 表示识别结果可信, 则转到步骤 S29; 如果置信度 C小于等于 置信度预定值, 表示识别结果不可信, 则转到步骤 S28。 如图 7所示, 设置信度预定 值为 0.2, 进行第一次识别时, 对二值图像 40的 10个切分区域从左向右进行识别, 前 四个切分区域分别被识别为如字符串 42所示的字符" Z""J""5""7", 四个识别结果的置 信度依次为 0.597321、 0.614531、 0.502632和 0.165150, 由于第一个切分区域到第三 个切分区域的识别结果的置信度均大于置信度 预定值, 表明第一个切分区域到第三个 切分区域的识别结果是可信的, 因此, 每识别一个切分区域后执行步骤 S29, 对下一 个切分区域进行识别; 在对二值图像 40的第四个切分区域 41识别时, 由于二值图像 40的第四个切分区域 41 的识别结果的置信度小于置信度预定值, 表明识别结果 (如 字符 421所示的字符" 7") 不可信, 因此, 对二值图像 40的第四个切分区域进行符识 别后, 转到步骤 S28, 令阈值 T等于阈值数组 TH的下一个数据(即阈值数组 TH的第 二个数据)。 当令阈值 T等于阈值数组 TH的第二个数据进行第二次识别时,二值图像 50的第 一个切分区域至第四个切分区域分别被识别为 如字符串 52所示的字符" Z""J""5""7", 四个识别结果的置信度依次为 0.589010、 0.552231、 0.538618和 0.002581, 由于二值 图像 50 的第一个切分区域至第三个切分区域的识别结 果的置信度均大于置信度预定 值,表明二值图像 50的第一个切分区域到第三个切分区域的识别 果是可信的,因此, 每识别一个切分区域后执行步骤 S29, 对下一个切分区域进行识别; 在对二值图像 50 的第四个切分区域 51识别时,由于二值图像 50的第四个切分区域 51的识别结果的置 信度小于置信度预定值, 表明识别结果 (如字符 521所示的字符" 7") 不可信, 因此, 对二值图像 50的第四个切分区域进行字符识别后, 转到步骤 S28, 令阈值 T等于阈值 数组 TH的下一个数据 (即阈值数组 TH的第三个数据)。 当令阈值 T等于阈值数组 TH的第三个数据进行第三次字符识别时, 二值图像 60 的 10 个切分区域从左向右分别被识别为如字符串 62 所示的字符 "Z""J""5""7""5""1""9""6""9""5", 每个识别结果的置信度依次为 0.504003、 0.588911、 0.586431 0.503960、 0.540323 0.733446、 0.640636、 0.562679、 0.634037和 0.332221 , 由于全部 10个切分区域的识别结果的置信度均大于置信 预定值, 因此, 10个切分 区域的识别结果均是可信的,则进行二值图像 60的第一个切分区域至第十个切分区域 的字符识别时, 每识别一个切分区域后执行步骤 S29, 对下一个切分区域进行识别, 直至所有切分区域均完成识别。 步骤 S28, 令阈值 T等于阈值数组 TH的下一个数据。 当识别结果不可信时, 表示以当前的阈值 T进行二值化处理得到的二值图像的质 量达不到字符识别的要求, 则取阈值数组 TH的下一个数据为阈值 T, 重新进行二值 化处理及字符识别。 结合图 6a、图 7和图 8说明利用不同的阈值 T对字符图像进行二值化处理时得到 不同质量的二值图像。 如果待处理的字符图像为图 6a中的字符图像 30, 阈值数组 TH 为 {0x41,0x51,0x31,0x61,0x21}, 当以阈值数组 TH的第一个数据 0x41为阈值对字符图 像 30进行二值化处理时得到二值图像 40, 以阈值数组 TH的第二个数据 0x51为阈值 对字符图像 30进行二值化处理时得到二值图像 50,以阈值数组 TH的第三个数据 0x31 为阈值对字符图像 30进行二值化处理时得到二值图像 60, 从中可以看出二值图像 60 的质量最好、 二值图像 40的质量次之、 二值图像 50的质量最差。 步骤 S29, 判定是否处理完所有的切分区域。 判定所有的切分区域是否全部处理完, 如共有 N个切分区域, 在处理第一个切分 区域之前, 将用于记录已处理的切分区域数的计数器的值 设为 0, 每次处理完一个切 分区域, 将用于记录已处理的切分区域数的计数器的值 就加 1, 当已处理的切分区域 数小于 N时, 表示未处理完所有的切分区域, 则转到步骤 S30; 当已处理的切分区域 数等于 N时, 表示已处理完所有的切分区域, 则本次字符识别过程结束。 步骤 S30, 对下一个切分区域进行字符识别。 当还有未处理的切分区域时, 则取下一个切分区域进行字符识别, 如本次处理的 切分区域为从左边开始的第一个切分区域, 则下一次处理的切分区域为从左边开始的 第二个切分区域。 提取下一个切分区域的特征向量, 计算特征向量与标准模板向量的欧氏距离 对 k个欧氏距离 D 2 D k-1 , D k 进行排序, 选择与最小的欧氏距离对应的标准 模板向量所代表的字符作为被识别字符的识别 结果。 本实施例提供的字符识别方法, 对识别字符进行置信度评估, 通过置信度的评估 结果对阈值动态调整, 只有置信度符合要求的识别字符为最终的识别 字符, 从而保证 了识别字符的准确度。 图 5是根据本发明第三实施例的字符识别方法的 程图, 该实施例也可以作为图 3所示第一实施例的一种优选实施方式。 具体处理过程如下: 步骤 S41至步骤 S43同步骤 S21至步骤 S23。 步骤 S44, 切分二值图像, 得到 N个切分区域, 将 N个切分区域设定为待识别区 域。 对二值图像进行切分, 得到 N个切分区域, 如图 8所示, 对二值图像 40进行切 分时得到 10 (N=10) 个切分区域, 将这 N个切分区域设定为待识别区域。 步骤 S45, 对第一个待识别区域进行字符识别。 如果待识别区域为 N个切分区域,则第一个待识别区域为 N个切分区域中的第一 个区域, 如图 8所示, 对二值图像 40的 10个切分区域进行处理时, 按照从左向右的 顺序进行处理时, 则左边第一个切分区域为第一个待识别区域。 如果待识别区域为 M个识别失败的切分区域, 则第一个待识别区域为 M个识别 失败的切分区域中的第一个区域, 如图 8所示, 由于第一次识别时二值图像 40的第四 个切分区域 41 识别失败, 因此, 进行第二次识别时, 第一个待识别区域为二值图像 50中与第一次识别时识别失败的二值图像 40的第四个切分区域 41对应的区域, 即二 值图像 50的切分区域 51 ; 由于第二次识别时二值图像 50的第四个切分区域 51识别 失败, 因此, 进行第三次识别时, 第一个待识别区域为二值图像 60中与第二次识别时 识别失败的二值图像 50的第四个切分区域 51对应的区域,即二值图像 60的第四个切 分区域 61。 提取第一待识别区域的特征向量, 计算特征向量与标准模板向量的欧氏距离 Di, 对 k个欧氏距离 Dl、 D2、 ...、 Dk-1、 Dk进行排序, 选择与最小的欧氏距离对应的标 准模板向量所代表的字符为第一个待识别区域 的识别字符。 步骤 S46, 计算置信度 C。 同步骤 S26。 步骤 S47, 判定置信度 C是否大于置信度预定值。 把计算得到的置信度 C与置信度预定值进行比较, 其中, 置信度预定值为小于 1 的数值, 当置信度 C大于置信度预定值时, 表示识别结果可信, 则转到步骤 S48; 如 果置信度 C小于等于置信度预定值时, 表示待识别区域的识别结果不可信, 则转到步 骤 S49。 如图 8所示, 进行第一次识别时, 二值图像 40的 10个切分区域从左向右分别识 别为如字符串 44所示的字符" Z""J""5""7""5""1""9""6""9"和" 5",每个识别结果的置信 度 C依次为 0.597321、 0.614531、 0.502632、 0.165150、 0.662693、 0.716749、 0.651325、 0.504233 0.616645和 0.436257, 置信度预定值为 0.2, 由于只有第四个切分区域 41 的识别结果的置信度小于置信度预定值, 其余 9个切分区域的识别结果的置信度均大 于置信度预定值, 因此, 对第四个切分区域 41进行字符识别后, 转到步骤 S49, 记录 第四个切分区域为识别失败的区域; 对第一个切分区域至第三个切分区域以及第五 个 切分区域至第十个切分区域进行字符识别后, 每完成一切分区域的识别, 就转到步骤 S48, 将该切分区域对应的字符记录为可信的识别字 符。 进行第二次识别时, 二值图像 50的切分区域 51的识别结果(如字符 54所示的字 符" 7") 的置信度为 0.002581, 由于该识别结果的置信度小于置信度预定值, 因此, 对 切分区域 51进行字符识别后, 转到步骤 S49, 记录该切分区域为识别失败的区域。 进行第三次识别时, 二值图像 60的切分区域 61的识别结果(如字符 64所示的字 符" 7") 的置信度为 0.503960, 由于该识别结果的置信度大于置信度预定值, 因此, 对 切分区域 61进行字符识别后, 转到步骤 S48, 将该切分区域对应的字符记录为可信的 识别字符。 步骤 S48, 记录可信的识别字符 记录每次识别时识别结果可信的字符与对应的 切分区域序号。 如图 8所示, 进行 第一次识别时,二值图像 40的第一个切分区域至第三个切分区域以及第 个切分区域 至第十个切分区域的识别结果可信, 则记录识别字符与所在切分区域的对应关系。 比 如记录字母" Z"与第一个切分区域对应、 字母" J"与第二个切分区域对应等。 步骤 S49, 记录识别失败的切分区域 记录每次识别时识别失败的切分区域, 如图 8所示, 进行第一次识别时, 由于二 值图像 40的第四个切分区域 41的识别结果不可信, 即该切分区域识别失败, 因此, 第一次识别时记录二值图像 40的第四个切分区域 41为识别失败的切分区域; 进行第 二次识别时, 由于二值图像 50的第四个切分区域 51的识别结果不可信, 因此, 第二 次识别时记录该切分区域为识别失败的切分区 域。 步骤 S50, 判定是否处理完所有的待识别区域 如图 8所示, 当待识别区域为二值图像 40中的所有切分区域 (10个切分区域) 时, 则本次 (即第一次) 识别的待识别区域为 10个; 当待识别区域为二值图像 50的 第四个切分区域 51时, 则本次(即第二次)识别的待识别区域为 1个区域。 如果未处 理完所有的待识别区域, 则转到步骤 S51 ; 否则, 转到步骤 S52。 步骤 S51, 对下一个待识别区域进行字符识别 当还有未进行识别的待识别区域时, 则对下一个待识别区域进行字符识别, 如本 次处理的待识别区为二值图像 40的 10个切分区域, 当第一个待识别区域为左边开始 的第一个切分区域时, 则下一待识别区域为左边开始的第二个切分区 域。 提取下一个待识别区域的特征向量, 计算其特征向量与标准模板向量的欧氏距离 ¾,对 k个欧氏距离 D 2 D k-1 , D k 进行排序, 选择与最小的欧氏距离对应的 标准模板向量所代表的字符为下一个待识别区 域的识别字符。 步骤 S52, 判断是否有识别失败的切分区域 根据本次识别时是否记录识别失败的切分区域 来判断本次字符识别是否有识别失 败的区域。如图 8所示, 进行第一次识别时, 步骤 S49记录了二值图像 40的第四个切 分区域 41为识别失败的切分区域, 因此, 第一次识别结束后有识别失败的切分区域; 进行第二次识别时, 步骤 S49记录二值图像 50的第四个切分区域 51为识别失败的切 分区域, 因此第二次识别结束后有识别失败的切分区域 ; 进行第三次识别时, 由于没 有记录有识别失败的切分区域, 因此, 第三次识别结束后没有识别失败的切分区域。 当有识别失败的切分区域时, 则转到步骤 S53 ; 当没有识别失败的切分区域时, 则字符识别过程结束。 其中, 字符图像的最终识别结果为多次字符识别的可 信识别字 符的组合, 如图 8所示, 字符图像的识别结果 (字符串 70) 为第一次识别的识别结果 45与第三次识别的识别结果 65 的组合, 即用第三次识别的可信识别字符替代第一次 识别时识别失败的切分区域的识别字符。 步骤 S53, 令阈值 T等于阈值数组 TH的下一个数据。 同步骤 S28。 步骤 S54, 使用阈值 T对字符图像进行二值化处理。 同步骤 S23。 步骤 S55, 切分二值图像, 得到 N个切分区域, 选择 M个识别失败的区域为待识 别区域 如图 8所示, 对二值图像 50进行切分时, 得到 10个切分区域, 由于上一次 (即 第一次) 识别时第四个切分区域识别失败, 因此, 本次 (即第二次) 识别的待识别区 域为 10个切分区域中的与上一次识别失败对应的切 区域, 即二值图像 50的第四个 切分区域 51 ; 同样地, 对二值图像 60进行切分时, 得到 10个切分区域, 由于上一次 (即第二次)识别时二值图像 50的第四个切分区域识别失败, 因此,本次(即第三次) 识别的待识别区域为 10个切分区域中的与上一次识别失败对应的切 区域,即二值图 像 60的第四切分区域 61。 显然, 本领域的技术人员应该明白, 上述的本发明的各模块或各步骤可以用通用 的计算装置来实现, 它们可以集中在单个的计算装置上, 或者分布在多个计算装置所 组成的网络上, 可选地, 它们可以用计算装置可执行的程序代码来实现 , 从而, 可以 将它们存储在存储装置中由计算装置来执行, 或者将它们分别制作成各个集成电路模 块, 或者将它们中的多个模块或步骤制作成单个集 成电路模块来实现。 这样, 本发明 不限制于任何特定的硬件和软件结合。 以上所述仅为本发明的优选实施例而已, 并不用于限制本发明, 对于本领域的技 术人员来说, 本发明可以有各种更改和变化。 凡在本发明的精神和原则之内, 所作的 任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。