Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
CASCADED BINARY CODING BASED IMAGE MATCHING METHOD
Document Type and Number:
WIPO Patent Application WO/2015/165037
Kind Code:
A1
Abstract:
A cascaded binary coding based image matching method, the method comprising: step S1, using a hash searching method based on a plurality of hash tables to roughly screen candidate feature points in an image, and obtaining a candidate subset of the candidate feature points; step S2, mapping the candidate subset of the candidate feature points to a high-dimensional Hamming space; step S3, establishing a Hamming distance/data address hash table; searching the Hamming distance-data address hash table to obtain the best matching feature points. The image matching method has high processing speed and good effect, and can realize efficient and accurate image matching.

Inventors:
CHENG JIAN (CN)
LENG CONG (CN)
WU JIAXIANG (CN)
LU HANQING (CN)
Application Number:
PCT/CN2014/076474
Publication Date:
November 05, 2015
Filing Date:
April 29, 2014
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
CHINESE ACAD INST AUTOMATION (CN)
International Classes:
G06F17/30
Foreign References:
CN103020321A2013-04-03
CN101158967A2008-04-09
CN103345496A2013-10-09
CN102508910A2012-06-20
CN101887457A2010-11-17
CN101710334A2010-05-19
US20130254191A12013-09-26
Attorney, Agent or Firm:
E-TONE INTELLECTUAL PROPERTY FIRM (CN)
北京亿腾知识产权代理事务所 (CN)
Download PDF:
Claims:
权 利 要 求 书

1、一种基于级联二值编码的图像匹配方法,其特征在于,所述方法包括: 步骤 Sl, 利用基于多个哈希表的哈希查找方法对图像中的候选特征点进 行粗 选, 得到候选特征点的候选子集;

步骤 S2, 将所述候选特征点的候选子集映射到高维汉明空间;

步骤 S3, 建立汉明距离-数据地址的哈希表; 查询所述汉明距离-数据地 址的哈希表, 从而得到最佳匹配特征点。

2、 根据权利要求 1所述的方法, 其特征在于, 所述步骤 S1具体为: 步骤 Sl l, 通过短的哈希码做粗哈希查询, 图像中的所有特征点通过局 部位置敏感哈希方法映射成 m位的哈希函数的哈希码。

3、 根据权利要求 2所述的方法, 其特征在于, 所述步骤 S11具体为: 对 于第一图像 I 中的第一特征点 p, 用 m位哈希码建立一个哈希查找表, 第二 图像 J中所有和第一特征点 P落到同一个哈希桶中的特征点被返回;

其中 , 通过局部位置敏感哈希生成 L 个不同 的哈希函数

' ' '·' ·" , 对应于每个哈希函数, 建立一个 哈希表, 将第一图像 I 中的第一特征点 ρ 投入到哈希桶 中, 其中,

I - :。

4、 根据权利要求 1所述的方法, 其特征在于, 所述步骤 S2具体为: 通过 n位哈希函数 ( n>m )将这些候选特征点映射到高维汉明空间中, 然 后在所述高维汉明空间中进行汉明距离的计算并排序。

5、 根据权利要求 1所述的方法, 其特征在于, 所述步骤 S 3具体为: 计算查询点与候选特征点之间的第一汉明距离;

以所述第一汉明距离为键, 以候选特征点的内存地址为值建哈希表; 遍历所述汉明距离 -数据地址的哈希表的数据库, 并建立汉明距离 -数据 地址哈希表;

从键值最小的桶开始查找, 直到找满预设个候选特征点为止, 找到的预 设个候选特征点是与查询点汉明距离最小的预设个候选特征点。

Description:
一种基于级联二值编码的图像匹配方法 技术领域

本发明涉及图像处理领域, 尤其涉及一种基于级联二值编码的图像匹配 方法。 背景技术

图像匹配是计算机视觉、 图像处理等领域的关键技术, 在三维重建、 图 像拼接、 目标识别等方面具有广泛的应用。 特别是在大范围场景的三维重建 问题中, 由于大规模图像之间的匹配需要耗费大量时间 , 导致三维重建的速 度非常慢。 因此, 快速、 准确的图像匹配是亟待解决的问题。

图像匹配技术大致可以分为三类: 点匹配, 线匹配和区域匹配。 由于其 对光照变化、 仿射变换和视角变化的鲁棒性, 点匹配的重视程度较高, 许多 有效的算法被提出。 然而, 点匹配通常是非常耗时的, 一对图像匹配的计算 时间复杂性为 0 (^ 2 ), 其中 N 为平均每幅图像的特征点个数。 在暴力匹配情况 下, 特征点匹配问题可以被看作是一个最近邻查找 问题。 作为替代方案, 提 出了近似最邻近查找, 其中比较著名的是基于树的模型, 在这种模型下, 数 据被非常有效地存储, 从而取得非常快的搜索速度。 但是所有基于树的方法 在高维情况其搜索效率大大下降, 有时候甚至不如简单的线性查找。 发明内容

本发明的目的是针对现有技术的不足, 提供一种基于级联二值编码的图 像匹配方法, 可以实现高效和准确的图像匹配。

为实现上述目的,本发明提供了一种基于级联 二值编码的图像匹配方法, 所述方法包括: 步骤 Sl, 利用基于多个哈希表的哈希查找方法对图像中 的候选特征点进 行粗 选, 得到候选特征点的候选子集;

步骤 S2, 将所述候选特征点的候选子集映射到高维汉明 空间; 步骤 S3, 建立汉明距离-数据地址的哈希表; 查询所述汉明距离-数据地 址的哈希表, 从而得到最佳匹配特征点。

进一步的, 所述步骤 S1具体为: 步骤 Sl l, 通过短的哈希码做粗哈希查 询, 图像中的所有特征点通过局部位置敏感哈希方 法映射成 m位的哈希函数 的哈希码。

进一步的, 所述步骤 S11具体为: 对于第一图像 I 中的第一特征点 p, 用 m位哈希码建立一个哈希查找表, 第二图像 J中所有和第一特征点 p落到 同一个哈希桶中的特征点被返回;

其中 , 通过局部位置敏感哈希生成 L 个不同 的哈希函数 gr(?) 二 i 、.K- ( : k . " US)) ' ' 1 二 H , 对 4 工于母个入哈入希函7数, 建、 入 ϋ一个 哈希表, 将第一图像 I 中的第一特征点 p 投入到哈希桶 (Ρ)中, 其中, = 1,2 „. JL。

进一步的, 所述步骤 S2具体为: 通过 n位哈希函数(n>m )将这些候选 特征点映射到高维汉明空间中, 然后在所述高维汉明空间中进行汉明距离的 计算并排序。

进一步的, 所述步骤 S3具体为:

计算查询点与候选特征点之间的第一汉明距离 ;

以所述第一汉明距离为键, 以候选特征点的内存地址为值建哈希表; 遍历所述汉明距离 -数据地址的哈希表的数据库, 并建立汉明距离 -数据 地址哈希表;

从键值最小的桶开始查找, 直到找满预设个候选特征点为止, 找到的预 设个候选特征点是与查询点汉明距离最小的预 设个候选特征点。 本发明图像匹配方法, 其匹配釆用了一个三层的哈希结构, 通过逐层筛 选的过程实现快速准确的特征点匹配, 处理速度快, 效果好, 可实现高效和 准确的图像匹配。 附图说明

图 1为本发明一种基于级联二值编码的图像匹配 法的流程图。 具体实施方式

下面通过附图和实施例, 对本发明的技术方案做进一步的详细描述。 本发明图像匹配方法提出了一种由粗到细的级 联二值编码方法, 综合了 哈希方法的查询和排序两种查找策略, 大大提升了图像特征点匹配的速度, 匹配釆用了一个三层的哈希结构, 通过逐层筛选的过程实现快速准确的特征 点匹配。

图 1为本发明一种基于级联二值编码的图像匹配 法的流程图, 如图所 示, 本发明具体包括如下步骤:

步骤 101, 利用基于多个哈希表的哈希查找方法对图像中 的候选特征点 进行粗 选, 得到候选特征点的候选子集;

本步骤是基于多哈希表的候选特征点查询。

具体的,通过短的哈希码做一次最粗略的哈希 查询,即哈希查找( Hashing Lookup ) 0 其中, 图像中的所有特征点通过局部位置敏感哈希方 法映射成 m位 的哈希码。 对于图像 I 中的特征点 p, 为了找到它在图像 J中的匹配点, 需 要用这些 m位哈希码建立一个哈希查找表。 图像 J中所有和点 p落到同一个 哈希桶中的特征点将被返回。

哈希查找具有常数的时间复杂度, 在本发明中, 釆用一种基于多个哈希 表的哈希查找方法。 具体的, 通过局部位置敏感哈希(LSH )生成 L个不同的 哈希函数 g: ) = ¾ 2 £ ½), J = ... t L, 对应于每个哈希函数, 可以建立一个哈希表。 对于图像 I中的特征点 p, 将其投入到哈希桶^ (p)中, 其中, = H L。

因为越长的哈希码判别力越强, 从而使得相似点落到同一个桶中的概 率 和相异点落到同一个桶的概率 2 的差距变大。 当 m增大时, ?^将减少, 即要使 L充分大从而保证真正的近邻至少有一次和查 点落在同一个桶 中。 具体的, 这个概率为 1 - (i -

需要为不同的应用选择不同的参数 m和 L。例如在三维重建中的图像匹 配, 分别选择参数 m=8或 10, L=6。

步骤 102, 将候选特征点的候选子集映射到高维汉明空间 ;

在步骤 101的粗搜索之后, 可以在步骤 102中对步骤 101得到的候选 子集进行精确搜索, 例如计算每一个候选特征点与查询点之间的欧 氏距 离。 但是, 因为候选子集的规模仍然很大, 直接计算欧式距离需要很大的 计算量, 本发明釆用通过更长的 n位哈希函数(n>m ) 将这些候选特征点 映射到高维汉明空间中, 然后就可以在这个空间中进行汉明距离的计算 并 排序。

步骤 103, 建立汉明距离-数据地址的哈希表; 查询汉明距离-数据地址 的哈希表, 从而得到最佳匹配特征点。

为了进行最精确的查找, 需要找到汉明空间中的前 K个近邻, 并且在 其中找到欧氏距离最近的前两名来判断是否匹 配。

通常来说, 为了找到前 κ个近邻, 需要遍历数据库 K次, 当数据库非 常大时, 这个过程也是很耗时的。 在本发明中, 提出一种基于哈希的前 κ 名的查找方法, 仅需要遍历数据库一次就可以定位前 κ名。

具体的, 在遍历数据库的过程中, 首先计算查询点与候选特征点之间 的汉明距离, 与此同时, 以这个汉明距离为键, 以候选特征点的内存地址 为值建哈希表。于是,在遍历整个数据库一次 之后能够完整的建立一个 "汉 明距离 -数据地址" 的哈希表。

为了定位前 κ名, 只要从键值最小的桶开始查找, 如果第一个桶中的 候选点个数少于 κ, 则到第二个桶中查找, 以此类推, 直到找满 κ个候选 点为止。 通过这个过程找到的 Κ个候选点一定是与查询点汉明距离最小的 Κ个点。

综上, 本发明图像匹配方法在图像特征点提取与表示 阶段, 首先对两 幅待匹配的图像( ^和 2 )分别进行特征点检测, 然后对检测到的特征点进 行特征向量表示。 例如, 可以用 S I FT方法检测图像的特征点, 并表示成 128维的特征向量。

在基于级联二值编码的特征点匹配阶段, 釆用三层的级联二值编码方 法, 对待匹配图像 2 和1 2 中重叠区域上的特征点进行一对一的匹配 。 对于图 像^中的任何一个特征点 x s , 首先釆用一种基于多个哈希表的哈希查找方 法, 按照汉明距离大小, 对图像中 i :i 的所有特征点 yj进行粗略筛选, 得到 一个候选子集?; 然后把候选子集?中的所有特征点映射到高维 汉明空间; 最后从候选子集 Ϊ中快速查询到前 K个最近匹配点, 这里的 K可以根据不 同应用设置不同的数目, 例如, 三维重建中的图像匹配往往设置 K=2。

对于两幅待匹配的图像(分别记为 ^和 L s . ) , 4叚设每幅图像中的特征点 的数量均为 。 计算欧式距离的时间复杂度记为' τ ε , 计算汉明距离的时间 复杂度记为 。 需要说明的是, 在现代 CPU架构下, 计算 128维 0-1向量 的汉明距离仅需 1个时钟周期, 因此汉明距离的计算开销 是远小于欧式 距离的计算开销 的。

基于暴力搜索的匹配算法是为确定图像 i中每个特征点的匹配结果, 需要对图像 ¾中的所有特征点进行遍历, 逐个计算欧式距离, 从而确定最 近邻与次近邻, 因此最终的总时间复杂度为 o( ' τ ε :)。 基于树的匹配算法是对于图像^中每个特征点 在图像½的特征点集合 中寻找最近邻和次近邻的搜索过程是基于树的 , 平均情况下需要计算 k W 次欧式巨离, 因此总时间复杂度为

本发明的匹配算法是对于图像 ^中每个特征点, 经过第一轮的基于多 个哈希表的哈希查询 (该步骤的时间开销可忽略) , 平均会有 个特 征点进入候选集合;对于候选集合中每个特征 点,需要逐个计算汉明距离, 并选出距离最小的 k个元素, 时间复杂度为 0( ΛΓ/2Ί 对于距离最小的 k 个元素, 需要分别计算欧式距离, 时间复杂度为 0(,¾ . ); 因此, 总时间复 杂度为 o(^ 2 7 ■ s

通过上述时间复杂度分析可以看出, 基于暴力搜索的匹配算法的时间 复杂度最高; 基于树的匹配算法与基于哈希的暴力匹配算法 相比, 在图像 中特征点数量较多时,时间复杂度较低,但在 大多数情况下两者较为接近; 而本发明提出的匹配方法, 如果参数选择得当 (m和 L较小的情况下, 如 m=8, L=6 ) , 匹配速度可以达到基于 KdTree的匹配算法的 1 0倍以上。

专业人员应该还可以进一步意识到, 结合本文中所公开的实施例描述的 各示例的单元及算法步骤, 能够以电子硬件、 计算机软件或者二者的结合来 实现, 为了清楚地说明硬件和软件的可互换性, 在上述说明中已经按照功能 一般性地描述了各示例的组成及步骤。 这些功能究竟以硬件还是软件方式来 执行, 取决于技术方案的特定应用和设计约束条件。 专业技术人员可以对每 个特定的应用来使用不同方法来实现所描述的 功能, 但是这种实现不应认为 超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法 的步骤可以用硬件、 处理 器执行的软件模块, 或者二者的结合来实施。 软件模块可以置于随机存储器 ( RAM ) 、 内存、 只读存储器(ROM ) 、 电可编程 R0M、 电可擦除可编程 R0M、 寄存器、 硬盘、 可移动磁盘、 CD-ROM , 或技术领域内所公知的任意其它形式 的存储介质中。

以上所述的具体实施方式, 对本发明的目的、 技术方案和有益效果进行 了进一步详细说明, 所应理解的是, 以上所述仅为本发明的具体实施方式而 已, 并不用于限定本发明的保护范围, 凡在本发明的精神和原则之内, 所做 的任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。