Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
TARGET DETECTION METHOD AND DEVICE
Document Type and Number:
WIPO Patent Application WO/2015/078130
Kind Code:
A1
Abstract:
A target detection method and device. The method comprises: dividing an image into N windows (S100); respectively extracting visual feature matrixes corresponding to the N windows (S110); conducting filtering processing on a visual feature matrix corresponding to a selected window by using a first filter, so as to obtain a filtered first matrix (S120); conducting filtering processing on the visual feature matrix corresponding to the selected window by using at least one second filter, so as to obtain at least one second matrix (S130); according to the first matrix and a first weight matrix corresponding thereto, and each second matrix and each second weight matrix corresponding thereto, calculating at least one judgement matrix (S140); and according to the at least one judgement matrix, determining whether the image has a detection target in the selected window (S150). By means of the method, the information about a window area in an image and the peripheral area thereof can be effectively transmitted, thereby improving the detection accuracy of the detection target in the image, and the method is simple and is easily achievable.

Inventors:
ZENG XINGYU (CN)
OUYANG WANLI (CN)
JU WENQI (CN)
LIU JIANZHUANG (CN)
TANG XIAOOU (CN)
Application Number:
PCT/CN2014/075193
Publication Date:
June 04, 2015
Filing Date:
April 11, 2014
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
HUAWEI TECH CO LTD (CN)
International Classes:
G06K9/00
Domestic Patent References:
WO2008020598A12008-02-21
Foreign References:
US7734097B12010-06-08
US5181254A1993-01-19
EP2590111A22013-05-08
CN102855468A2013-01-02
Other References:
YAN, SHUICHENG ET AL.: "Misaligment-Robust Face Recognition", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 19, no. 4, 30 April 2010 (2010-04-30), pages 1087 - 1096
YE, QIXIANG ET AL.: "Human Detection in Images via Piecewise Linear Support Vector Machines", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 22, 28 February 2013 (2013-02-28), pages 778 - 789, XP011492286, DOI: doi:10.1109/TIP.2012.2222901
Attorney, Agent or Firm:
LINDA LIU & PARTNERS (CN)
北京林达刘知识产权代理事务所(普通合伙) (CN)
Download PDF:
Claims:
权 利 要 求 书

1、 一种目标检测方法, 其特征在于, 包括:

将图像划分为 N个窗口, N为大于或等于 1的正整数;

分别提取所述 N个窗口对应的视觉特征矩阵, 所述视觉特征矩阵是由多 个视觉特征组成的矩阵;

采用第一滤波器对选定窗口对应的视觉特征矩阵进行滤波处理,得到滤 波后的第一矩阵;

采用至少一个第二滤波器对所述选定窗口对应的视觉特征矩阵进行滤 波处理, 得到至少一个第二矩阵, 每采用一个所述第二滤波器对所述选定窗 口对应的一个视觉特征矩阵进行滤波处理, 得到一个所述第二矩阵;

根据所述第一矩阵及其对应的第一权值矩阵、 以及每个所述第二矩阵及 其对应的第二权值矩阵, 计算出至少一个判别矩阵;

根据所述至少一个判别矩阵,确定所述图像中在所述选定窗口内是否存 在检测目标。

2、 根据权利要求 1所述的方法, 其特征在于, 根据所述至少一个判别矩 阵, 确定所述图像中在所述选定窗口内是否存在检测目标, 包括:

根据所述至少一个判别矩阵, 得到输出判别值;

根据所述输出判别值,确定所述图像中在所述选定窗口内是否存在检测 目标。

3、 根据权利要求 1或 2所述的方法, 其特征在于, 所述釆用第一滤波器 对选定窗口对应的视觉特征矩阵进行滤波处理, 得到滤波后的第一矩阵, 包 括:

采用公式 / Q = , F^f ,得到第一矩阵,其中, iQ为所述第一矩阵, F0表 示所述第一滤波器, /表示所述视觉特征矩阵, (8)表示滤波运算符; 所述采用至少一个第二滤波器对同一个所述选定窗口对应的视觉特征 矩阵进行滤波处理, 得到至少一个第二矩阵, 包括:

采用公式 +ι /, 确定至少一个所述第二矩阵; 其中, si+1为 第 i + l个所述第二矩阵; Fi+1表示第 i + 1个所述第二滤波器, ί为大于或等 于 0的整数;

所述根据所述第一矩阵及其对应的第一权值矩阵、 以及每个所述第二矩 阵及其对应的第二权值矩阵, 计算出至少一个判别矩阵, 包括:

采用公式^丄 = 1+e- ( + +Ws,i+1si+1),确定所述判别矩阵;其中, hi+1 示第 i + 1个所述判别矩阵; W +1为第 i + 1个所述第一权值矩阵; U 第 i + 1个所述第二权值矩阵。

4、 根据权利要求 1-3中任一项所述的方法, 其特征在于, 所述分别提取 所述 N个窗口对应的视觉特征矩阵, 所述视觉特征矩阵是由多个视觉特征组 成的矩阵, 包括:

将所述图像按照多个尺寸进行缩放, 得到多个缩放图像;

采用预设大小的窗口, 从每个所述缩放图像的选定位置按照设定顺序进 行滑动, 每次滑动设定数量个像素, 将每个所述缩放图像分别划分成 N个窗 口; 以及

每次在每个所述缩放图像上滑动一次窗口后,将每个所述缩放图像上的 对应窗口中的视觉特征合并到一起, 形成一个视觉特征矩阵; 或者将每个所 述缩放图像上的对应窗口中不同种类的视觉特征形成多个视觉特征矩阵。

5、 根据权利要求 1-4中任一项所述的方法, 其特征在于, 分别提取所述 N个窗口对应的视觉特征矩阵之前, 包括:

从预先选择的训练图像的窗口区域,提取多个视觉特征矩阵作为训练样 本;

使用所述训练样本, 使用支持向量机 SVM训练方法, 得到所述第一滤波 器;

通过已经训练得到的所述第一滤波器和预设初始值的第一权值矩阵, 利 用所述训练样本进行非监督预训练和后向传递 BP训练,得到所有的所述第一 权值矩阵的参数。

6、 根据权利要求 5所述的方法, 其特征在于, 得到所有的所述第一权值 矩阵的参数之后, 还包括:

根据已训练得到的所述第一滤波器和所述第一权值矩阵筛选所述训练 样本, 保留未正确计算出判别结果的样本;

每次添加一个预设初始值的第二滤波器及其对应的第二权值矩阵, 并使 用已经训练得到的所述第一滤波器和所述第一权值矩阵, 利用保留的所述训 练样本进行 BP训练,确定添加的所述第二滤波器和第二权值矩阵的参数, 并 更新所述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器 的个数确定。

7、 根据权利要求 5所述的方法, 其特征在于, 得到所有的所述第一权值 矩阵的参数之后, 还包括:

根据已训练得到的所述第一滤波器、所述第一权值矩阵和每次添加的预 设初始值的第二滤波器及其对应的第二权值矩阵, 筛选所述训练样本, 保留 未正确计算出判别结果的样本; 根据已训练得到的所述第一滤波器、所述第一权值矩阵和每次添加的预 设初始值的第二滤波器及其对应的第二权值矩阵,利用保留的所述训练样本 进行 BP训练,确定添加的所述第二滤波器和第二权值矩阵的参数, 并更新所 述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器的个数 确定。

8、 一种目标检测装置, 其特征在于, 包括:

划分单元, 用于将图像划分为 N个窗口, N为大于或等于 1的正整数; 提取单元, 与所述划分单元连接, 用于分别提取所述 N个窗口对应的视 觉特征矩阵, 所述视觉特征矩阵是由多个视觉特征组成的矩阵;

第一滤波器, 与所述提取单元连接, 用于对选定窗口对应的视觉特征矩 阵进行滤波处理, 得到滤波后的第一矩阵;

至少一个第二滤波器, 与所述提取单元连接, 用于对所述选定窗口对应 的视觉特征矩阵进行滤波处理, 得到至少一个第二矩阵, 每采用一个所述第 二滤波器对所述选定窗口对应的一个视觉特征矩阵进行滤波处理, 得到一个 所述第二矩阵;

计算单元, 与所述第一滤波器、 所述第二滤波器分别连接, 用于根据所 述第一矩阵及其对应的第一权值矩阵、 以及每个所述第二矩阵及其对应的第 二权值矩阵, 计算出至少一个判别矩阵; 以及

判别单元, 与所述计算单元连接, 用于根据所述至少一个判别矩阵, 确 定所述图像中在所述选定窗口内是否存在检测目标。

9、 根据权利要求 8所述的装置, 其特征在于, 所述判别单元具体用于根 据所述至少一个判别矩阵, 得到输出判别值; 根据所述输出判别值, 确定所 述图像中在所述选定窗口内是否存在检测目标。

10、 根据权利要求 8或 9所述的装置, 其特征在于,

滤波器, 具体用于采用公式ι。 = 1+e"½7, 得到第一矩阵, 其 中, ι。为所述第一矩阵, F。表示所述第一滤波器, /表示所述视觉特征矩阵,

(8)表示滤波运算符;

所述第二滤波器, 具体用于采用公式 ι /, 确定至少一个 所述第二矩阵; 其中, 为第 i + 1个所述第二矩阵; Fi+1表示第 i + 1个所 述第二滤波器, ί为大于或等于 0的整数;

所述计算单元包括至少 -水中间计算子单元, 每个中间计算子单元分别 与一个所述第二滤波器连接,第 i + 2个中间计算子单元与第 i + 1个中间计算 子单元连接; 第 1个中间计算子单元与所述第一滤波器和- -水笛一、滤〉 波器连

; i + 1的中间计算子单元, 用于采用公式 Li + 1 =― 1 + e-(wh,i+ihi+ws,i+isi+i) ' 确定所述判别矩阵;其中, 表示第 i + 1个所述判别矩阵; W +1为第 i + 1 个所述第一权值矩阵; Wsi+1为第 i + 1个所述第二权值矩阵。

11、 根据权利要求 8-10中任一项所述的装置, 其特征在于, 所述提取单 元包括:

ί放子单元, 用于将所述图像按照多个尺寸进行缩放, 得到多个缩放图 窗口滑动子单元, 用于采用预设大小的窗口, 从每个所述缩放图像的选 定位置按照设定顺序进行滑动, 每次滑动设定数量个像素, 将每个所述缩放 矩阵生成子单元, 用于每次在每个所述缩放图像上滑动一次窗口后, 将 每个所述缩放图像上的对应窗口中的视觉特征合并到一起, 形成一个视觉特 征矩阵; 或者将每个所述缩放图像上的对应窗口中不同种类的视觉特征形成 多个视觉特征矩阵。

12、 根据权利要求 8-11中任一项所述的装置, 其特征在于, 还包括: 训练单元, 与所述提取单元连接, 用于控制所述提取单元从预先选择的 训练图像的窗口区域, 提取多个视觉特征矩阵作为训练样本;

所述训练单元与所述第一滤波器连接, 还用于利用所述训练样本, 使用 支持向量机 SVM训练方法, 得到所述第一滤波器;

所述训练单元与所述计算单元连接,还用于控制所述计算单元通过已经 训练得到的所述第一滤波器和预设初始值的第一权值矩阵, 利用所述训练样 本进行非监督预训练和后向传递 BP训练,得到所有的所述第一权值矩阵的参 数。

13、 根据权利要求 12所述的装置, 其特征在于, 所述训练单元包括: 第一筛选子单元, 与所述第一滤波器和所述计算单元分别连接, 用于控 制所述计算单元根据已训练得到的所述第一滤波器和所述第一权值矩阵筛 选所述训练样本, 保留未正确计算出判别结果的样本;

第一添加子单元,与所述第一滤波器、所述第二滤波器、所述计算单元、 所述第一筛选子单元分别连接,用于控制所述计算单元每次添加一个预设初 始值的第二滤波器及其对应的第二权值矩阵, 并使用已经训练得到的所述第 一滤波器和所述第一权值矩阵,利用保留的所述训练样本进行 BP训练,确定 添加的所述第二滤波器和第二权值矩阵的参数, 并更新所述第一权值矩阵的 参数; 其中, 筛选和添加次数由预设的第二滤波器的个数确定。

14、 根据权利要求 12所述的装置, 其特征在于, 所述训练单元包括: 第二筛选子单元, 与所述第一滤波器和所述计算单元分别连接, 用于控 制所述计算单元根据已训练得到的所述第一滤波器、所述第一权值矩阵和每 次添加的预设初始值的第二滤波器及其对应的第二权值矩阵, 筛选所述训练 样本, 保留未正确计算出判别结果的样本;

第二添加子单元,与所述第一滤波器、所述第二滤波器、所述计算单元、 所述第二筛选子单元分别连接,用于控制所述计算单元根据已训练得到的所 述第一滤波器、所述第一权值矩阵和每次添加的预设初始值的第二滤波器及 其对应的第二权值矩阵,利用保留的所述训练样本进行 BP训练,确定添加的 所述第二滤波器和第二权值矩阵的参数, 并更新所述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器的个数确定。

Description:
目标检测方法及装置

技术领域

本发明涉及图像检测领域, 尤其涉及一种目标检测方法及装置。 背景技术

从照片、视频等图像中检测室外环境中的行人 的技术具有广泛的应用前 景, 可以应用在安全监控领域长时间监视一个场合 中的人, 还可以应用于机 器人技术、 汽车自动驾驶 (或辅助驾驶) 技术、 无人机技术等中。

现有的室外行人检测技术主要分为两类: 生成模型方法和判别模型方法。 其中,生成模型方法的基本思想是:首先建立 识别对象的概率密度模型, 然后在模型的基础上进行后验概率的计算, 得出样本出现的概率值以判断对 象是否出现。 这种方法从统计的角度表示数据的分布情况, 能够反映同类数 据本身的相似度, 并且建立在贝叶斯理论的基础之上, 理论基础很强, 模型 适用面广。 这种方法主要通过设定一系列参数表示行人各 种状态下的特征, 然后由训练样本得到形状空间等多个空间的描 述, 再通过 KDE ( Gaussian Kernel Density Estimation, 高斯核密度估计法) 等方法得到生成模型。 在处 理测试样本的时候,用得到的生成模型和样本 的拟合得出测试样本里面某个 区域有人的概率, 同时还能得出如果有人, 这个人保持了何种姿态等。 但是 这类方法用很多参数去描述人体模型, 比较复杂, 实现困难。 同时, 这种方 法训练过程难度大, 要求样本尽可能多, 所以通常在室外环境下检测效果不 是很好。 基于判别模型的目标检测方法是指,在图像检 测过程中不需要详细地去 描述检测目标, 而只需要判别出图像中是否存在检测目标。 该方法通常是将 从图像中提取的视觉特征输入至串联的多个或 单个滤波器、 判别器中, 依次 经过多次滤波、 判别处理后, 判别出图像中是否存在检测目标, 不能有效地 传递和利用图像中检测窗口区域及其周边领域 的信息做出判别,所以检测精 确度较低。 并且这类方法对数据依赖性高,训练出来的模 过拟合的风险大, 不易训练。 发明内容

技术问题

本发明提供一种目标检测方法及装置,用以解 决如何提高对图像中的检 测目标的检测精确。

解决方案

为了解决上述技术问题, 根据本发明的一实施例, 第一方面, 提供了一 种目标检测方法, 具体包括:

将图像划分为 N个窗口, N为大于或等于 1的正整数;

分别提取所述 N个窗口对应的视觉特征矩阵, 所述视觉特征矩阵是由多 个视觉特征组成的矩阵;

采用第一滤波器对选定窗口对应的视觉特征矩 阵进行滤波处理, 得到滤 波后的第一矩阵;

采用至少一个第二滤波器对所述选定窗口对应 的视觉特征矩阵进行滤 波处理, 得到至少一个第二矩阵, 每采用一个所述第二滤波器对所述选定窗 口对应的一个视觉特征矩阵进行滤波处理, 得到一个所述第二矩阵; 根据所述第一矩阵及其对应的第一权值矩阵、 以及每个所述第二矩阵及 其对应的第二权值矩阵, 计算出至少一个判别矩阵;

根据所述至少一个判别矩阵, 确定所述图像中在所述选定窗口内是否存 在检测目标。

结合第一方面, 在第一种可能的实现方式中, 根据所述至少一个判别矩 阵, 确定所述图像中在所述选定窗口内是否存在检 测目标, 包括:

根据所述至少一个判别矩阵, 得到输出判别值;

根据所述输出判别值, 确定所述图像中在所述选定窗口内是否存在检 测 目标。

结合第一方面或第一方面的第一种可能的实现 方式,在第二种可能的实 现方式中,所述采用第一滤波器对选定窗口对 应的视觉特征矩阵进行滤波处 理, 得到滤波后的第一矩阵, 包括:

采用公式i。 = TT ^ ,得到第一矩阵,其中, ι。为所述第一矩阵, F。表 示所述第一滤波器, /表示所述视觉特征矩阵, (8)表示滤波运算符;

所述采用至少一个第二滤波器对同一个所述选 定窗口对应的视觉特征 矩阵进行滤波处理, 得到至少一个第二矩阵, 包括:

采用公式 +ι / , 确定至少一个所述第二矩阵; 其中, s i+1 为 第 i + 1个所述第二矩阵; F i+1 表示第 i + 1个所述第二滤波器, ί为大于或等 于 0的整数;

所述根据所述第一矩阵及其对应的第一权值矩 阵、 以及每个所述第二矩 阵及其对应的第二权值矩阵, 计算出至少一个判别矩阵, 包括: 采用公式^丄 = 1+e - ( + +Ws , i+1 s i+1) ,确定所述判别矩阵;其中, h i+1 示第 i + i个所述判别矩阵; w +1 为第 i + i个所述第一权值矩阵; U 第 i + 1个所述第二权值矩阵。

结合第一方面、第一方面的第一种可能的实现 方式或第一方面的第二种 可能的实现方式, 在第三种可能的实现方式中, 所述分别提取所述 N个窗口 对应的视觉特征矩阵, 所述视觉特征矩阵是由多个视觉特征组成的矩 阵, 包 括:

将所述图像按照多个尺寸进行缩放, 得到多个缩放图像;

采用预设大小的窗口, 从每个所述缩放图像的选定位置按照设定顺序 进 行滑动, 每次滑动设定数量个像素, 将每个所述缩放图像分别划分成 N个窗 口; 以及

每次在每个所述缩放图像上滑动一次窗口后, 将每个所述缩放图像上的 对应窗口中的视觉特征合并到一起, 形成一个视觉特征矩阵; 或者将每个所 述缩放图像上的对应窗口中不同种类的视觉特 征形成多个视觉特征矩阵。

结合第一方面、 第一方面的第一种可能的实现方式、 第一方面的第二种 可能的实现方式或第一方面的第三种可能的实 现方式中,在第四种可能的实 现方式中, 分别提取所述 N个窗口对应的视觉特征矩阵之前, 包括:

从预先选择的训练图像的窗口区域,提取多个 视觉特征矩阵作为训练样 本;

使用所述训练样本, 使用支持向量机 SVM训练方法, 得到所述第一滤波 器;

通过已经训练得到的所述第一滤波器和预设初 始值的第一权值矩阵, 利 用所述训练样本进行非监督预训练和后向传递 BP训练,得到所有的所述第一 权值矩阵的参数。

结合第一方面的第四种可能的实现方式中,在 第五种可能的实现方式中, 得到所有的所述第一权值矩阵的参数之后, 还包括:

根据已训练得到的所述第一滤波器和所述第一 权值矩阵筛选所述训练 样本, 保留未正确计算出判别结果的样本;

每次添加一个预设初始值的第二滤波器及其对 应的第二权值矩阵, 并使 用已经训练得到的所述第一滤波器和所述第一 权值矩阵, 利用保留的所述训 练样本进行 BP训练,确定添加的所述第二滤波器和第二权 矩阵的参数, 并 更新所述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器 的个数确定。

结合第一方面的第四种可能的实现方式中,在 第六种可能的实现方式中, 得到所有的所述第一权值矩阵的参数之后, 还包括:

根据已训练得到的所述第一滤波器、所述第一 权值矩阵和每次添加的预 设初始值的第二滤波器及其对应的第二权值矩 阵, 筛选所述训练样本, 保留 未正确计算出判别结果的样本;

根据已训练得到的所述第一滤波器、所述第一 权值矩阵和每次添加的预 设初始值的第二滤波器及其对应的第二权值矩 阵,利用保留的所述训练样本 进行 BP训练,确定添加的所述第二滤波器和第二权 矩阵的参数, 并更新所 述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器的个数 确定。

为了解决上述技术问题, 根据本发明的另一实施例, 第二方面, 提供了 一种目标检测装置, 包括:

划分单元, 用于将图像划分为 N个窗口, N为大于或等于 1的正整数; 提取单元, 与所述划分单元连接, 用于分别提取所述 N个窗口对应的视 觉特征矩阵, 所述视觉特征矩阵是由多个视觉特征组成的矩 阵;

第一滤波器, 与所述提取单元连接, 用于对选定窗口对应的视觉特征矩 阵进行滤波处理, 得到滤波后的第一矩阵;

至少一个第二滤波器, 与所述提取单元连接, 用于对所述选定窗口对应 的视觉特征矩阵进行滤波处理, 得到至少一个第二矩阵, 每采用一个所述第 二滤波器对所述选定窗口对应的一个视觉特征 矩阵进行滤波处理, 得到一个 所述第二矩阵;

计算单元, 与所述第一滤波器、 所述第二滤波器分别连接, 用于根据所 述第一矩阵及其对应的第一权值矩阵、 以及每个所述第二矩阵及其对应的第 二权值矩阵, 计算出至少一个判别矩阵; 以及

判别单元, 与所述计算单元连接, 用于根据所述至少一个判别矩阵, 确 定所述图像中在所述选定窗口内是否存在检测 目标。

结合第二方面, 在第一种可能的实现方式中, 所述判别单元具体用于根 据所述至少一个判别矩阵, 得到输出判别值; 根据所述输出判别值, 确定所 述图像中在所述选定窗口内是否存在检测目标 。

结合第二方面或第二方面的第一种可能的实现 方式,在第二种可能的实 现方式中, 所述第一滤波器, 具体用于采用公式 Θ = 1+e - Fo ^ 得到第一矩 阵, 其中, ι。为所述第一矩阵, F。表示所述第一滤波器, /表示所述视觉特 征矩阵, (8)表示滤波运算符; 滤波器, 具体用于采用公式 + 1 =

l + e _ Fii++il ®/ 确定至少一个 所述第二矩阵; 其中, + 1 为第 i + 1个所述第二矩阵; F i + 1 表示第 i + 1个所 述第二滤波器, ί为大于或等于 0的整数;

所述计算单元包括至少 -水中间计算子单元, 每个中间计算子单元分别 与一个所述第二滤波器连接,第 i + 2个中间计算子单元与第 i + 1个中间计算 子单元连接; 第 1个中间计算子单元与所述第一滤波器和- -水笛一、滤〉 波器连

; i + 1的中间计算子单元, 用于采用公式 Li + 1 =― 1 + e -( w h,i+i h i+ w s,i+i s i+i) ' 确定所述判别矩阵;其中, 表示第 i + 1个所述判别矩阵; W +1 为第 i + 1 个所述第一权值矩阵; W s i+1 为第 i + 1个所述第二权值矩阵。

结合第二方面、第二方面的第一种可能的实现 方式或第二方面的第二种 可能的实现方式, 在第三种可能的实现方式中, 所述提取单元包括:

缩放子单元, 用于将所述图像按照多个尺寸进行缩放, 得到多个缩放图 窗口滑动子单元, 用于采用预设大小的窗口, 从每个所述缩放图像的选 定位置按照设定顺序进行滑动, 每次滑动设定数量个像素, 将每个所述缩放 图像分别划分成 N个窗口; 以及

矩阵生成子单元, 用于每次在每个所述缩放图像上滑动一次窗口 后, 将 每个所述缩放图像上的对应窗口中的视觉特征 合并到一起, 形成一个视觉特 征矩阵; 或者将每个所述缩放图像上的对应窗口中不同 种类的视觉特征形成 多个视觉特征矩阵。 可能的实现方式或第二方面的第三种可能的实 现方式中,在第四种可能的实 现方式中, 该目标检测装置还包括:

训练单元, 与所述提取单元连接, 用于控制所述提取单元从预先选择的 训练图像的窗口区域, 提取多个视觉特征矩阵作为训练样本;

所述训练单元与所述第一滤波器连接, 还用于利用所述训练样本, 使用 支持向量机 SVM训练方法, 得到所述第一滤波器;

所述训练单元与所述计算单元连接,还用于控 制所述计算单元通过已经 训练得到的所述第一滤波器和预设初始值的第 一权值矩阵, 利用所述训练样 本进行非监督预训练和后向传递 BP训练,得到所有的所述第一权值矩阵的参 数。

结合第二方面的第四种可能的实现方式中,在 第五种可能的实现方式中, 所述训练单元包括:

第一筛选子单元, 与所述第一滤波器和所述计算单元分别连接, 用于控 制所述计算单元根据已训练得到的所述第一滤 波器和所述第一权值矩阵筛 选所述训练样本, 保留未正确计算出判别结果的样本;

第一添加子单元,与所述第一滤波器、所述第 二滤波器、所述计算单元、 所述第一筛选子单元分别连接,用于控制所述 计算单元每次添加一个预设初 始值的第二滤波器及其对应的第二权值矩阵, 并使用已经训练得到的所述第 一滤波器和所述第一权值矩阵,利用保留的所 述训练样本进行 BP训练,确定 添加的所述第二滤波器和第二权值矩阵的参数 , 并更新所述第一权值矩阵的 参数; 其中, 筛选和添加次数由预设的第二滤波器的个数确 定。

结合第二方面的第四种可能的实现方式中,在 第六种可能的实现方式中, 所述训练单元包括:

第二筛选子单元, 与所述第一滤波器和所述计算单元分别连接, 用于控 制所述计算单元根据已训练得到的所述第一滤 波器、所述第一权值矩阵和每 次添加的预设初始值的第二滤波器及其对应的 第二权值矩阵, 筛选所述训练 样本, 保留未正确计算出判别结果的样本;

第二添加子单元,与所述第一滤波器、所述第 二滤波器、所述计算单元、 所述第二筛选子单元分别连接,用于控制所述 计算单元根据已训练得到的所 述第一滤波器、所述第一权值矩阵和每次添加 的预设初始值的第二滤波器及 其对应的第二权值矩阵,利用保留的所述训练 样本进行 BP训练,确定添加的 所述第二滤波器和第二权值矩阵的参数, 并更新所述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器的个数确 定。

有益效果

本发明实施例, 从图像中提取窗口对应的视觉特征矩阵后, 通过并联的 第一滤波器、 至少一个第二滤波器对视觉特征矩阵进行滤波 后, 可以依次计 算出至少一个判别矩阵, 从而确定该窗口内是否存在检测目标, 该方法能够 有效地传递图像中窗口区域及其周边领域的信 息,提高对图像中检测目标的 检测准确度, 并且简单易于实现。

根据下面参考附图对示例性实施例的详细说明 , 本发明的其它特征及方 面将变得清楚。 附图说明

包含在说明书中并且构成说明书的一部分的附 图与说明书一起示出了 本发明的示例性实施例、 特征和方面, 并且用于解释本发明的原理。

图 1为本发明实施例一提供的目标检测方法的流 图;

图 2为本发明实施例一提供的目标检测方法中计 判别矩阵的示意图; 图 3为本发明实施例二提供的目标检测方法的流 图;

图 4为本发明实施例二提供的目标检测方法中缩 图像的示意图; 图 5和图 6为本发明实施例三提供的目标检测方法中训 过程的流程图; 图 7&~图7(为本发明实施例三提供的目标检测方 法中训练过程的网络结 构示意图;

图 8为本发明实施例四提供的目标检测装置的结 示意图;

图 9为本发明实施例五提供的目标检测装置的结 示意图;

图 10和图 11为本发明实施例六提供的目标检测装置的结 示意图; 图 12为本发明实施例七提供的目标检测装置的结 示意图。 具体实 式

以下将参考附图详细说明本发明的各种示例性 实施例、 特征和方面。 附 图中相同的附图标记表示功能相同或相似的元 件。尽管在附图中示出了实施 例的各种方面, 但是除非特别指出, 不必按比例绘制附图。

在这里专用的词"示例性 "意为 "用作例子、 实施例或说明性"。 这里作为 "示例性"所说明的任何实施例不必解释为优于 好于其它实施例。

另外, 为了更好的说明本发明, 在下文的具体实施方式中给出了众多的 具体细节。 本领域技术人员应当理解, 没有某些具体细节, 本发明同样可以 实施。 在一些实例中, 对于本领域技术人员熟知的方法、 手段、 元件和电路 未作详细描述, 以便于凸显本发明的主旨。

图 1为本发明实施例一提供的目标检测方法的流 图。 如图 1所示, 该目 标检测方法包括:

S100、 将图像划分为 N个窗口, N为大于或等于 1的正整数;

S110、 分别提取所述 N个窗口对应的视觉特征矩阵, 所述视觉特征矩阵 是由多个视觉特征组成的矩阵。

具体地, 可以将一张输入的图像缩放到 S个不同的尺寸上(S为预设的整 数), 从每个尺寸的图像提取视觉特征得到视觉特征 图, 在使用预设大小的 窗口, 从一个视觉特征图设定位置如左上角开始, 每次滑动设定数量如 N1 个像素, 按从左到右, 从上到下的顺序每张缩放图都得到 N个窗口, 假设 N 个窗口分别为 w 1; w 2 w N 。 其中, 一个窗口可以对应一个视觉特征矩阵, 也可以对应多个视觉特征矩阵。把所有缩放图 上的同一名称的窗口中的所有 视觉特征连接到一起构成一个视觉特征矩阵。

S120、 采用第一滤波器对选定窗口对应的视觉特征矩 阵进行滤波处理, 得到滤波后的第一矩阵。

具体地, 可以采用公式 (1 ), 得到第一矩阵:

h 0 = ( 1 ) 在公式(1 ) 中, 1。为所述第一矩阵, F。表示所述第一滤波器, /表示所 述视觉特征矩阵, (8)表示滤波运算符。 其中, ι。有时也用 s。来表示。

S130、采用至少一个第二滤波器对所述选定窗 对应的视觉特征矩阵进 行滤波处理, 得到至少一个第二矩阵, 每采用一个所述第二滤波器对所述选 定窗口对应的一个视觉特征矩阵进行滤波处理 , 得到一个所述第二矩阵。 具体地, 可以采用公式 (2), 确定至少一个所述第二矩阵;

si+l = l+e _ Fii++il ®/ (2) 在公式 (2) 中, 为第 i + 1个所述第二矩阵; F i+1 表示第 i + 1个所 述第二滤波器。 每个第二滤波器都可以计算出一个第二矩阵, 每个第二矩阵 存在一个对应的第二权值矩阵; ί为大于或等于 0的整数,

本发明实施例中, 滤波器可以为多维矩阵,

滤波器的矩阵中的各个元素的值, 可以通过训练确定

S140、根据所述第一矩阵及其对应的第一权值 阵、 以及每个所述第二 权值矩阵, 计算出至少 - 判别矩阵

具体地, 可以采用公式 (3), 确定所述判别矩阵;

1 +e - ( W fl,i+l + W S,i+l S i+l) (3) 在公式(3) 中, 表示第 i + 1个所述判别矩阵; W +1 为第 i + 1个所 述第一权值矩阵; W s i+1 为第 i + 1个所述第二权值矩阵; ί为大于或等于 0的 整数。 其中, 所有的第一权值矩阵和第二权值矩阵可以通过 预先训练得到, 第一权值矩阵与第二权值矩阵的数量一般相同 , 并且由第二滤波器数量决定 ( 其中, 可以先根据公式 (1) 计算出的第一矩阵i Q 、 利用i Q 对应的 - -水 第一权值矩阵^^和公式 (2) 计算出的第 1个第二矩阵 ^及其对应第二权值 矩阵 W S , 计算出第 1个判别矩阵 , 并将该第 1个判别矩阵作为下一个第一 矩阵,代入公式(3)重复本歩骤,直到计算出 后一个判别矩阵^。其中^也 是最后一个判别矩阵 y, N是第二滤波器个数。 图 2为本发明实施例一 提供的目标检测方法中计算判别矩阵的示意图 , 如图 2所示, 左边的级联深 度网络结构从下到上一共有 4层,其中第一滤波器为输入层,隐藏层一共 2层, 最上层为输出层, 本发明实施例中使用 表示第 i个隐藏层输入的第一矩阵, 表示第 i个隐藏层输出的判别矩阵,每个隐藏层计算 的判别矩阵都作为 其上一层的隐藏层输入的第一矩阵。 图 2中最下面一层是输入层, 输入层的 第一矩阵可以使用符号/ ^表示。 参见公式(3 ), 第 i + 1个隐藏层的输入除了 上一层得第一矩阵 ^之外还有第二矩阵 s i+1 , 他们的权值矩阵分别是第一权 值矩阵 W +1 和第二权值矩阵 W s i+1 。 此外, 还可以使用符号^,。表示图 2中 的^^,使用 表示和输入视觉特征矩阵 /作滤波运算之后得到的第二矩阵 的第二滤波器。 假设网络结构从下到上一共有 L个隐藏层, 则经过所有的隐 藏层之后, 由输出层计算出的判别矩阵 y为最后一个判别矩阵。

S150、根据所述至少一个判别矩阵, 确定所述图像中在所述选定窗口内 是否存在检测目标。

具体地, 可以根据所述至少一个判别矩阵, 得到输出判别值; 根据所述 输出判别值, 确定所述图像中在所述选定窗口内是否存在检 测目标。 例如, 可以将最后一个判别矩阵中的某个具体元素作 为输出判别值, 也可以对最后 一个判别矩阵进行运算得到判别值。

举例而言, 如图 2所示, 以采用第一滤波器 F。和三个第二滤波器 、 、 ^级联形成 2个隐藏层, 对某一窗口对应的视觉特征矩阵进行滤波处理 为例: 首先,参见公式(1 ),采用第一滤波器 F。对视觉特征矩阵进行滤波处理, 得到第一矩阵i。, 其中, 第一矩阵ι。对应的第一权值矩阵为 W M

并且, 参见公式 (2), 采用第二滤波器 ^对所述多个视觉特征矩阵进行 滤波处理,得到第二矩阵 5l ,其中,第二矩阵 ^对应的第二权值矩阵为 W S

然后, 将上述的i。、 W M Sl . W s>1 代入公式 (3 ), 可以得到第 1个判 别矩阵 = 1 + e -( Vh,i h o +w s,i s i~),可以将判别矩阵 作为第 1个隐藏层输入的; 矩阵 (

并且, 参见公式(2), 采用第二滤波器¾对所述多个视觉特征矩阵进 滤波处理,得到第二矩阵 s 2 ,其中,第二矩阵 对应的第二权值矩阵为 W 。

同理, 将上述的 、 W 2 . s 2 、 W s 2 代入公式 (3), 得到第 2个判别矩

1 +e - ( \¾ 2 + ν 5 , 2 ) ,可以将判别矩阵ι 2 作为第 2个隐藏层输入的第一矩

并且, 参见公式(2), 采用第二滤波器¾对所述多个视觉特征矩阵进 滤波处理,得到第二矩阵 s 3 ,其中,第二矩阵 5 3 对应的第二权值矩阵为 W s 3

同理, 将上述的i 2 、 W 、 s 3 , W s 3 代入公式 (3), 得到第 3个判别矩 阵 / 3 = w +Ws ), 删辦 & ¾¾ 白勺删辦 y。

如果由第一滤波器和第二滤波器级联形成的隐 藏层为 L个, 则参见公式 (3), 可以得到最后一个判别矩阵为 y = 1+e +1¾ +1 )。

最后, 在最后一个判别矩阵 y的第一行最左边的值大于等于预设门限值 的情况下 (这个矩阵也可以是一个矢量, 即只有一行), 确定所述图像中存在 检测目标。若所述判别矩阵是根据与选定窗口 Wj中提取的视觉特征矩阵计算 得出, 则确定所述检测目标存在于所述选定窗口 Wj中。在判别矩阵的第一行 最左边的值小于预设门限值的情况下, 确定所述图像中不存在检测目标。

本实施例, 从图像中提取窗口对应的视觉特征矩阵后, 通过并联的第一 滤波器、 至少 -水笛二一、滤〉 波器对视觉特征矩阵进行滤波后, 可以依次计算出 至少一个判别矩阵, 从而确定该窗口内是否存在检测目标, 该方法能够有效 地传递图像中窗口区域及其周边领域的信息, 提高对图像中检测目标的检测 准确度, 并且简单易于实现。

图 3为本发明实施例二提供的目标检测方法的流 图。 图 3中标号与图 1 相同的歩骤具有相同的功能, 为简明起见, 省略对这些歩骤的详细说明。 如 图 3所示, 在上一实施例的基础上, 该图像中目标训练方法的歩骤 S110具体 可以包括:

歩骤 S210、将一张所述图像按照多个尺寸进行缩放 得到多个缩放图像; 歩骤 S220、采用预设大小的窗口, 从每个所述缩放图像的选定位置按照 设定顺序进行滑动, 每次滑动设定数量个像素, 将每个所述缩放图像分别划 分成N个窗口w 1 , w 2 , ... , w N ; 以及

歩骤 S230、 每次在每个所述缩放图像上滑动一次窗口后, 将每个所述缩 放图像上的对应窗口 (如相同名字的窗口) 中的视觉特征合并到一起, 形成 一个视觉特征矩阵; 或者将每个所述缩放图像上的对应窗口中不同 种类的视 觉特征形成多个视觉特征矩阵。

具体而言, 首先, 可以将所述图像按照不同的尺寸进行缩放, 例如, 输 入一张图像 Pl ,在取得图像之后首先对图像缩放,得到 不同缩放尺度下的图像。 如图 4所示, 为本发明实施例二提供的目标检测方法中缩放 图像的示意图, 可以将 Pi缩放到 11个不同尺度上, 得到图像 ^ ^... ^^, 假定 p i+ 1 尺寸是 Pi 的 0.94倍, 其中 i = 1,2,…, 10。

其次, 针对每一个缩放图像, 可以采用预设大小的窗口, 如采用 120x40 像素大小的窗口, 从所述缩放图像的左上角开始, 按照从左到右, 从上到下 的顺序进行滑动,每次滑动 8个像素,从而将所述每个缩放图像划分成 N个窗 Ρ ν^, ν^, ... , ν^ Ν , 其中 Ν为正整数。 其中, 窗口的大小确定方法可以为: 通 过训练出了一个线性 SVM (Support Vector Machine, 支持向量机), 再由该

SVM自动决定。具体而言, 首先将所有的训练数据中行人框的大小整理成 直 方图, 再假设行人框的大小是符合高斯分布的, 选择对应的均值表示的行人 框的大小作为窗口的大小。本发明实施例中如 果选择的窗口大小为 15x5个块, 每个块 8x8像素, 则窗口大小对应到像素域是 120x40像素大小。 也可以使用 经验值确定窗口大小。

最后, 在缩放图像 Pl , ... , Pi均存在窗口 Wj的情况下, 将所述缩放图像

P!, ... , Pi分别在窗口 Wj中的视觉特征进行合并, 得到与所述选定窗口 Wj对应 的一个视觉特征矩阵, 由此, 得到与每个窗口相对应的多个视觉特征矩阵, 其中 i为小于或等于 11的正整数, j为小于或等于 N的正整数。

此外, 上述窗口还可以进一歩细分为多个块, 例如, 将每一窗口细分为 15x5个块, 将从每一块中 HOG (Histogram of Oriented Gradient, 方向梯度直 方图)) 特征和 CSS (Color Self-Similarity, 颜色自相似) 特征合并, 就可以 得到每个块 36维视觉特征。 其中, 每个块中的 HOG特征提取 9个无符号梯度 方向, 18个有符号梯度方向和 4个综合梯度能量值。 使用 \¾ k 表示第 (i, j)块的 第 k个特征的类内方差, 其中 i = l 15 , j = l 5; 使用\¾^表示第 块 的第 k个特征的类间方差, 其中 i = l 15 , j = l 5; 使用判别函数

DP k = - v¾j作为第 G,D块的第 ^个特征的判别能量。 然 后去掉 6个最小的判别能量值的特征, 最后得到 25维的 HOG特征。 每个块中 的 CSS特征使用计算图中颜色值的直方图的方式统 计得到。 由于每个窗口有 15 x 5个块, 所以最后每个窗口会提取到 2775维的 CSS特征。 但是由于 2775 维的 CSS特征会导致计算量过大的问题, 所以本专利把 CSS特征降低到 825 维。 在本专利中使用 CS B^ Bi+^j+d 表示第 GJ)块 Bi CSS特征, 其中 = -2, -1,1,2 , dj = — 7,— 6, …― 1,1, ... ,6,7。由于 CSS特征具有对称特性, Bi.j) , 所以每个块 CSS特征可以降低到 11维。

需要注意的是: 由于缩放图像的尺寸大小不同, 在采用预设大小的窗口 分别划分上述缩放图像时, 得到的窗口数量有所不同。

如图 2所示, 为了有效利用人体目标周围的上下文信息, 本发明实施例 中使用了滤波器对每个窗口的视觉特征进行处 理, 由于每个尺度的视觉特征 图对应的一个窗口中包含有维度为 15 X 5 X 36维的视觉特征, 所以首先可 以把该视觉特征周边扩展一行和一列得到维度 为 17 X 7 X 31的视觉特征矩 阵, 再使用 15 X 5 X 36 X 11尺寸的滤波器和这 11个视觉特征图中得到的 11 个矩阵进行滤波运算(filtering operation),得到尺寸为 3 X 3 X 11的第一矩阵。 在图 2中最右边的 11个尺度下的视觉特征经过 3个 15 X 5 X 36 X 11尺寸的第 二滤波器^, ^, ,通过滤波运算之后得到 3 X 3 X 11的第二矩阵,分别是 5l

S 2 、 S 3 o 另外, 1。的尺寸可以和 相同, 1。可以由另外一个和 同样尺寸的 第一滤波器 F。滤波得到, F。可以是经过特别预训练得到。

本实施例, 从图像中提取窗口对应的视觉特征矩阵后, 通过并联的第一 滤波器、 至少一个第二滤波器对视觉特征矩阵进行滤波 后, 可以依次计算出 至少一个判别矩阵, 从而确定该窗口内是否存在检测目标, 该方法能够有效 地传递图像中窗口区域及其周边领域的信息, 提高图像中目标的检测准确度, 并且简单易于实现。

其中, 将图像按多个尺寸缩放成多个缩放图像, 再采用预设大小的窗口 将每个缩放图像分别划分成 N个窗口, 并将每个窗口的视觉特征形成一个或 多个视觉特征矩阵, 能够有效地保留图像中检测窗口区域及其周边 的领域信 息, 为后续的目标检测提供精确的数据基础。

图 5和图 6为本发明实施例三提供的目标检测方法中训 过程的流程图。 图 5和图 6中标号与图 1、 图 3相同的歩骤具有相同的功能, 为简明起见, 省略 对这些歩骤的详细说明。 如图 5或图 6所示, 在上述实施例的基础上, 该图像 中目标训练方法, 在歩骤 S110之前的训练过程, 具体可以包括:

歩骤 S310、 从预先选择的训练图像的窗口区域, 提取多个视觉特征矩阵 作为训练样本; 其中, 如果训练图像中包括检测目标如行人, 则该训练图像 为正样本, 如果训练图像中不包括检测目标, 则该训练图像为负样本。

具体地, 首先准备好训练图像, 再把每个训练图像缩放为 11个不同尺度 的图像, 然后在每个所述缩放图像的选定位置按照设定 顺序进行滑动, 每次 滑动设定数量个像素, 将每个所述缩放图像分别划分成 N个窗口 w 1; w 2 , W N ;, 从每个缩放图片中的同名窗口所在位置提取视 觉特征矩阵, 并对有行人 (检测目标) 的窗口赋予对应的最后输出矩阵 y = [1,0,0 0], 对于没有行人的窗口赋予对应的最后输出矩阵 y = [0,0,0 0],其中 y的维数 和前面提到的检测行人的最后一个判别矩阵 y的维数完全相同。 视觉特征矩 阵可以只有一个, 由多个视觉特征合并而成; 视觉特征矩阵也可以有多个, 每个视觉特征矩阵可以包括一种类型的视觉特 征,或者有的视觉特征矩阵中 可以包括多种类型的视觉特征。 例如: HOG和 CSS特征连接之后得到的矩阵 并且, 可以为每一个视觉特征矩阵设置一个对应的滤 波器。实验中用了 HOG 和 CSS两种视觉特征连接在一起的一个视觉特征矩 阵, 如图 2中的 /。

歩骤 S320、利用所述训练样本, 使用通用的 SVM训练方法, 得到所述第 一滤波器;

一种可选的训练 SVM的方法如下:

假定如入向量为 x 2 , ......, x n ,他们对应的类标分别为 y 2 , ......, y n , 贝 IJSVM判别式为 yi = w'Xi + Θ; 可以通过在条件 Σί^λί y λ≥0下, 求 max SiUi— xixj)来得到 λ, 其中为入丄, λ 2 , ……, λ η 组成的

向量。然后通过 ω = Σί^λ^Χί和 [Ai yi oo'Xi + Θ))— 1] = 0来求得所有参数。

歩骤 S330、通过已经训练得到的所述第一滤波器和 设初始值的第一权 值矩阵, 利用所述训练样本进行非监督预训练和 BP (Back Propagation, 后 向传递) 训练, 得到所有的所述第一权值矩阵的参数。 具体地, 采用从训练 图像中提取的视觉特征矩阵作为训练样本,使 用 SVM训练方法训练得到第一 滤波器后, 可以使用非监督预训练和 BP训练调整第一权值矩阵。

一种可选的非监督预训练歩骤如下:

(1) 使用固定值 (比如 0) 初始化所有第一权值矩阵。

(2) 选取 个训练样本构成的 n个视觉特征矩阵。 实验中可以选取 n = 10000。

(3) 随机选取 η = ηι /10个视觉特征矩阵, 把 n个视觉特征矩阵排列为 一个新的训练视觉特征矩阵 Xi。例如,如果每个视觉特征矩阵为 m维的向量, 则训练视觉特征矩阵 是一个 n X m的训练视觉特征矩阵。 令 = 1/(1 + e - i*w h , i+l)o 其中 ^是^的转置。 得到 后再重新对 采样得到样本 H 2

其中, 采样方法为: 构造矩阵 H 3 , 以使矩阵 的行列数与矩阵 的行 列数相同, 其中矩阵 中各元素均在区间 [0,1]内均匀采样一次。

将矩阵 与矩阵 H 3 进行比较, 生成矩阵 H 2: 若矩阵 对应位置上的元 素比矩阵 对应位置上的元素大, 则将矩阵 对应位置上的元素置为 1, 否 则将矩阵 对应位置上的元素置为 0。

根据公式 X 2 = 1/(1 + e— 计算出矩阵 x 2 , 其中所述 w +1 表示 第一权值矩阵 w i+1 的转置矩阵。

根据公式 AW ^ μ X AW + ε X p ° sW " negW c X W计算出矩阵 AW, 其中

m

posW = h * H x , i;表示第一矩阵 的转置矩阵, negW = X^ *H 2 , 表示 矩阵 X 2 的转置矩阵, 表示赋值符号, 即左边的变量的新值根据右边变量的 值计算而得。

根据公式 W +1 = W hii+1 + AW来更新第一权值矩阵。

第一次计算的时候可以令 为 0矩阵, μ、 ε、 c可以分别为 0.5, 0.1和 0.0002

(4)重复第 (2)、 (3) 歩直到 的绝对值小于某个预设值或者完成设 定次数的更新之后结束。

一种可选的 BP训练方法歩骤如下:

假定一共有 L层第 r层有 个,一共 n个训练样本, sf^i)是第 r-1层的第 i个 训练样本的第 k个神经元的输出, wf k 是第 r层第 j个神经元到第 r-1层第 k个神经 元的连接值, 即 W hj _的第 j行第 k列上的元素。

(1) 首先 F i+1 和 W s i+1 保持不变, 利用预训练得到的 W^ +1 形成网络结

( 2 ) 前 向计算 : 利用 η个训 练样本的输入特征 向 s 0 (l),s。(2) ....... s 0 (n) 得 到 和 每 一 层 的 输 出 公

&i+i(t) - 1+e - (\¾ ί+1 ω+νν 5 , ί+ι5ί+1 (ί)), 得到每一层的输出和最后的 y值。 (3) 利用公式 Awjk=— uSil^fWS 1 "— )来计算 AW矩阵的第 j行和第 k 列元素。 其中

S r — ) = U是给定的学习率 ( 当 r=L时 Si(i) = ej (i)h i), 其中 h i)是 hL (i)的一阶导数, ej(i) =

(h L (i) - y(i) ) ,y( )为第 i个训练数据给出的真实输出值。

否则 δ - ι) = efH -! (i) ,其中 h i)是 h r — i)的一阶导数, e 】r- i (i) = [ (i)w

(4) 利用 W new = W。 ld + AW来更新传递矩阵 W h i+1 。 其中, W。 ld 为更 新前的传递矩阵, W new 为更新后的传递矩阵。

在一种可能的实现方式中, 如图 5所示, 在歩骤 S330之后, 该方法还可 以包括:

S410、根据已训练得到的所述第一滤波器和所 第一权值矩阵筛选所述 训练样本, 保留未正确计算出判别结果的样本;

S420、每次添加一个预设初始值的第二滤波器 其对应的第二权值矩阵, 并使用已经训练得到的所述第一滤波器和所述 第一权值矩阵, 利用保留的所 述训练样本进行 BP训练,确定添加的所述第二滤波器和第二权 矩阵的参数, 并更新所述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波 器的个数确定。

在一种可能的实现方式中, 如图 6所示, 在歩骤 S330之后, 该方法还可 以包括:

S510、根据已训练得到的所述第一滤波器、所 第一权值矩阵和每次添 加的预设初始值的第二滤波器及其对应的第二 权值矩阵, 筛选所述训练样本, 保留未正确计算出判别结果的样本;

S520、根据已训练得到的所述第一滤波器、所 第一权值矩阵和每次添 加的预设初始值的第二滤波器及其对应的第二 权值矩阵, 利用保留的所述训 练样本进行 BP训练,确定添加的所述第二滤波器和第二权 矩阵的参数, 并 更新所述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器 的个数确定。

具体地, 经过歩骤 S310~S330, 可以得到如图 7a所示的网络结构中的参 数。 然后, 以采用三个第二滤波器对训练样本进行滤波处 理为例, 在添加第 二滤波器^的情况下, 如图 7b所示, 可以参见歩骤 S410、 歩骤 S420, 或参见 歩骤 S510、 歩骤 520, 采用已训练好的第一滤波器 F。和第一权值矩阵 ^^至 W hi3 , 或者同时采用添加的预设初始值的第二滤波器 及其对应的第二权值 矩阵 w s 筛选训练样本, 保留未正确计算出判别结果的样本, 例如, 如果该 训练样本为正样本, 但判别结果为负样本, 则该训练样本需要保留; 或者如 果该训练样本为负样本, 但判别结果为正样本, 则该训练样本也需要保留。 因此, 保留的训练样本实际上是分类错误的样本。然 后使用 BP训练方法, 并 使用分类错误的样本, 训练由第一滤波器 F。和第一权值矩阵 ^^至^ 以 及同时采用添加的预设初始值的第二滤波器^ 其对应的第二权值矩阵 W SA 建立的新模型。 最后根据 BP训练的结果更新第一权值矩阵 ^^至^^、 第 二权值矩阵 W S 和第二滤波器 。

在添加第二滤波器 和¾的情况下, 如图 7c所示, 采用图 7b中已经更新 的训练好的 F。、第一权值矩阵^^至^^、第二滤波器 、第二权值矩阵 W SA , 或者添加了预设初始值的第二滤波器F 2 及其对应的第二权值矩阵 W s 2 , 筛选 训练样本。 然后使用 BP训练方法, 并使用保留的错误分类的样本, 训练由第 一滤波器 F。、第一权值矩阵 ^^至^^、第二滤波器 、第二权值矩阵 W S , 以及添加了预设初始值的第二滤波器F 2 及其对应的第二权值矩阵 W s 2 建立的 新模型。 最后根据 BP训练的结果再次更新第一权值矩阵 ^^至^^、 第二权 值矩阵 w s , nw s 2 、 第二滤波器 和 。

在添加第二滤波器 、 和¾的情况下, 如图 2所示, 采用图 7c中已经更 新的训练好的 F。, 第一权值矩阵 ^^至^^、 第二滤波器 、 第二权值矩阵 W Sjl , 第二滤波器 F 2 、 第二权值矩阵 W s 2 , 以及添加的预设初始值的第二滤 波器 F 3 及其对应的第二权值矩阵 W s 3 , 筛选训练样本。 使用 BP训练方法, 使 用保留的错误分类的样本,训练由第一滤波器 F。,第一权值矩阵 ^^至^^、 第二滤波器 、 第二权值矩阵 W s>1 、 第二滤波器 F 2 、 第二权值矩阵 W s 2 , 以 及添加的预设初始值的第二滤波器 F 3 及其对应的第二权值矩阵 W s 3 建立的新 模型。 最后根据 BP训练的结果再次更新第一权值矩阵 ^^至^ 第二权值 矩阵 ^ 至^ 第二滤波器 、 F 2 和 ¾。

本实施例中, 从图像中提取窗口对应的视觉特征矩阵后, 通过并联的第

-滤波器、 至少 -水笛二一、滤〉 波器对视觉特征矩阵进行滤波后, 可以依次计算 出至少一个判别矩阵, 从而确定该窗口内是否存在检测目标, 该方法能够有 攻地传递图像中窗口区域及其周边领域的信息 ,提高对图像中检测目标的; 测准确度, 并且简单易于实现。

其中, 将图像按多个尺寸缩放成多个缩放图像, 再采用预设大小的窗口 将每个缩放图像分别划分成 N个窗口, 并将每个窗口的视觉特征形成一个或 多个视觉特征矩阵, 能够有效地保留图像中; 口区域及其周边的领域信 息, 为后续的目标检测提供精确的数据基础。

并且, 通过对多个训练样本进行非监督训练, 可以确定第一权值矩阵的 中间值,采用非监督训练方法主要是把第一权 值矩阵的值放入到一个比较好 的位置上, 以防止后面 BP训练值陷入局部最优,从而提高图像中目标 检测 准确度。然后, 对第一权值矩阵的中间值进行 BP训练, 可以得到精确地第一 权值矩阵的参数。

进一歩地, 通过依次添加第二滤波器, 筛选训练样本, 并使用 BP训练方 法和保留的训练样本, 对添加了第二滤波器的新模型进行训练, 能够得到更 加精确的第一权值矩阵和第二权值矩阵, 从而提高对图像中检测目标的检测 准确度。 此外, 传统的基于判别模型的目标检测方法通常对多 个滤波器单独 进行优化, 过拟合的风险较大, 本发明依次添加第二滤波器, 可以对第二滤 波器进行联合优化, 能够解决滤波器过拟合的问题, 降低检测结果对训练样 本数量和质量的依赖,从而可以进一歩提高对 图像中检测目标的检测准确度。

图 8为本发明实施例四提供的目标检测装置的结 示意图。 如图 8所示, 该目标检测装置可以包括:

划分单元 80, 用于将图像划分为 N个窗口, N为大于或等于 1的正整数; 提取单元 81, 与所述划分单元 80连接, 用于分别提取所述 N个窗口对应 的视觉特征矩阵, 所述视觉特征矩阵是由多个视觉特征组成的矩 阵;

第一滤波器 83, 与所述提取单元 81连接, 用于对选定窗口对应的视觉特 征矩阵进行滤波处理, 得到滤波后的第一矩阵;

至少一个第二滤波器 85, 与所述提取单元 81连接, 用于对所述选定窗口 对应的视觉特征矩阵进行滤波处理, 得到至少一个第二矩阵, 每采用一个所 述第二滤波器对所述选定窗口对应的一个视觉 特征矩阵进行滤波处理, 得到 一个所述第二矩阵;

计算单元 87, 与所述第一滤波器 83、 所述第二滤波器 85分别连接, 用于 根据所述第一矩阵及其对应的第一权值矩阵、 以及每个所述第二矩阵及其对 应的第二权值矩阵, 计算出至少一个判别矩阵; 以及

判别单元 89,与所述计算单元 87连接,用于根据所述至少一个判别矩阵, 确定所述图像中在所述选定窗口内是否存在检 测目标。

具体地, 本实施例的目标检测装置可以执行本发明上述 实施例中的目标 检测方法, 具体可以参见上述实施例一的目标检测方法中 的相关描述和示例。 此外, 参见图 2及其相关描述, 右边的视觉特征矩阵 /是由提取单元 81从图 像中提取出的。 对于左边的级联深度网络结构中, 输入层可以由第一滤波器 83实现, 隐藏层和输出层可以由计算单元 87实现, 而判别单元 89则可以根据 计算单元最后输出的判别矩阵确定输出判别值 , 从而确定图像中该选定窗口 内是否有检测目标。

本实施例中, 通过第一滤波器、 至少一个第二滤波器和计算单元可以形 成并联的目标检测装置, 第一滤波器、 第二滤波器对视觉特征矩阵进行滤波 后, 计算单元可以依次计算出至少一个判别矩阵, 从而由判别单元确定该窗 口内是否存在检测目标, 该方法能够有效地传递图像中窗口区域及其周 边领 域的信息, 提高对图像中检测目标的检测准确度, 并且简单易于实现。

图 9为本发明实施例五提供的目标检测装置的结 示意图。 图 9中标号与 图 8相同的组件具有相同的功能,为简明起见, 略对这些组件的详细说明。

如图 9所示, 该目标检测装置的第一滤波器 83, 具体用于采用公式 1

l+e~ F o <¾/ 得到第一矩阵, 其中, 。为所述第一矩阵, F。表示所述第一 滤波器 83, /表示所述视觉特征矩阵, (8)表示滤波运算符;

所述第二滤波器 85, 具体用于采用公式 ι / , 确定至少一 个所述第二矩阵; 其中, 为第 i + 1个所述第二矩阵; F i+1 表 /」v ; i + 1个 所述第二滤波器 85, ί为大于或等于 0的整数;

所述计算单元 87包括至少 -水中间计算子单元 871, 每个中间计算子单 元 871分别与一个所述第二滤波器 85连接, 第 i + 2个中间计算子单元与第 i + 1个中间计算子单元连接; 第 1个中间计算子单元与所述第一滤波器 83和

其 中 第 ί + 1 的 中 间 计 算 子 单 元 , 用 于 采 用 公 式 hi , , = 1+e - 一 , 确定所述判别矩阵; 其中, 表示第〖+ 1个 所述判别矩阵; w h i+ 1 为第 i + 1个所述第一权值矩阵; W s, ,i + l

述第二权值矩阵,

具体可以参见上述方法实施例中公式(1 ) 到公式 (3 ) 的相关描述。 此 夕卜, 参见图 2和图 9, 图 2左边的级联深度网络结构中的第 i + 1个隐藏层相当 于图 9中的第 i + 1个中间计算子单元, 图 2的输出层相当于图 9中最上层的中 间计算子单元。 在图 9中, 最下层的第二滤波器与第一滤波器并联到第 1个中 间计算子单元, 其他的第二滤波器与中间计算子单元并联到上 层的中间计算 子单元。 其中, 每个中间计算子单元中都可以预先保存已训练 好的这一隐藏 层的第一权值矩阵和第二权值矩阵。判别单元 也可以预先保存已训练输出层 的第一权值矩阵和第二权值矩阵。

在一种可能的实现方式中, 所述提取单元 81可以包括: 缩放子单元 815, 用于将所述图像按照多个尺寸进行缩放, 得到多个缩 放图像;

窗口滑动子单元 813, 用于采用预设大小的窗口, 从每个所述缩放图像 的选定位置按照设定顺序进行滑动, 每次滑动设定数量个像素, 将每个所述 缩放图像分别划分成 N个窗口; 以及

矩阵生成子单元 811, 用于每次在每个所述缩放图像上滑动一次窗口 后, 将每个所述缩放图像上的对应窗口中的视觉特 征合并到一起, 形成一个视觉 特征矩阵; 或者将每个所述缩放图像上的对应窗口中不同 种类的视觉特征形 成多个视觉特征矩阵。

具体可以参见上述实施例二的目标检测方法中 视觉特征矩阵提取过程 的相关描述和示例。

本实施例中,通过第一滤波器和各个中间计算 子单元可以形成级联的结 构, 通过至少一个第二滤波器在级联的同时形成并 联的结构, 第一滤波器、 第二滤波器对视觉特征矩阵进行滤波后, 各个中间计算子单元可以分别计算 出至少一个判别矩阵, 从而由判别单元确定该窗口内是否存在检测目 标, 该 方法能够有效地传递图像中窗口区域及其周边 领域的信息,提高对图像中检 测目标的检测准确度, 并且简单易于实现。

其中, 缩放子单元 815将图像按多个尺寸缩放成多个缩放图像, 窗口滑 动子单元 813再采用预设大小的窗口将每个缩放图像分别 划分成 N个窗口,矩 阵生成子单元 811将每个窗口的视觉特征形成一个或多个视觉 特征矩阵, 能 够有效地保留图像中检测窗口区域及其周边的 领域信息, 为后续的目标检测 坦 卄桂 Bfe i¼ ¾if?ii7 J 图 10和图 11为本发明实施例六提供的目标检测装置的结 示意图。 图 10 和图 11中标号与图 8、 图 9相同的组件具有相同的功能, 为简明起见, 省略对 这些组件的详细说明。

如图 10或图 11所示, 该目标检测装置还可以包括:

训练单元 91, 与所述提取单元 81连接, 用于控制所述提取单元 81从预先 选择的训练图像的划分好的窗口区域,提取多 个视觉特征矩阵作为训练样本; 所述训练单元 91与所述第一滤波器 83连接, 还用于利用所述训练样本, 使用支持向量机 SVM训练方法, 得到所述第一滤波器 83;

所述训练单元 91与所述计算单元 87连接, 还用于控制所述计算单元 87通 过已经训练得到的所述第一滤波器 83和预设初始值的第一权值矩阵, 利用所 述训练样本进行非监督预训练和后向传递 BP训练,得到所有的所述第一权值 矩阵的参数。

如图 10所示, 在一种可能的实现方式中, 所述训练单元 91可以包括: 第一筛选子单元 911, 与所述第一滤波器 83和所述计算单元 87分别连接, 用于控制所述计算单元 87根据已训练得到的所述第一滤波器 83和所述第一 权值矩阵筛选所述训练样本, 保留未正确计算出判别结果的样本;

第一添加子单元 913, 与所述第一滤波器 83、 所述第二滤波器 85、 所述 计算单元 87、 所述第一筛选子单元 911分别连接, 用于控制所述计算单元 87 每次添加一个预设初始值的第二滤波器 85及其对应的第二权值矩阵, 并使用 已经训练得到的所述第一滤波器 83和所述第一权值矩阵, 利用保留的所述训 练样本进行 BP训练, 确定添加的所述第二滤波器 85和第二权值矩阵的参数, 并更新所述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波 器 85的个数确定。

如图 11所示, 在一种可能的实现方式中, 所述训练单元 91还可以包括: 第二筛选子单元 915, 与所述第一滤波器 83和所述计算单元 87分别连接, 用于控制所述计算单元 87根据已训练得到的所述第一滤波器 83、所述第一权 值矩阵和每次添加的预设初始值的第二滤波器 85及其对应的第二权值矩阵, 筛选所述训练样本, 保留未正确计算出判别结果的样本;

第二添加子单元 917, 与所述第一滤波器 83、 所述第二滤波器 85、 所述 计算单元 87、 所述第二筛选子单元 915分别连接, 用于控制所述计算单元 87 根据已训练得到的所述第一滤波器 83、所述第一权值矩阵和每次添加的预设 初始值的第二滤波器 85及其对应的第二权值矩阵, 利用保留的所述训练样本 进行 BP训练,确定添加的所述第二滤波器 85和第二权值矩阵的参数, 并更新 所述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器 85的 个数确定。

具体可以参见上述实施例三的目标检测方法中 训练过程的相关描述和 示例。

本实施例中,通过第一滤波器和各个中间计算 子单元可以形成级联的结 构, 通过至少一个第二滤波器在级联的同时形成并 联的结构, 第一滤波器、 第二滤波器对视觉特征矩阵进行滤波后, 各个中间计算子单元可以分别计算 出至少一个判别矩阵, 从而由判别单元确定该窗口内是否存在检测目 标, 该 方法能够有效地传递图像中窗口区域及其周边 领域的信息,提高对图像中检 测目标的检测准确度, 并且简单易于实现。

其中, 缩放子单元将图像按多个尺寸缩放成多个缩放 图像, 窗口滑动子 单元再采用预设大小的窗口将每个缩放图像分 别划分成 N个窗口, 矩阵生成 子单元将每个窗口的视觉特征形成一个或多个 视觉特征矩阵, 能够有效地保 留图像中检测窗口区域及其周边的领域信息, 为后续的目标检测提供精确的 数据基础。

并且, 训练单元通过对多个训练样本进行非监督训练 , 可以确定第一权 值矩阵的中间值,采用非监督训练方法主要是 把第一权值矩阵的值放入到一 个比较好的位置上, 以防止后面 BP训练值陷入局部最优,从而提高图像中目 标的检测准确度。然后, 对第一权值矩阵的中间值进行 BP训练, 可以得到精 确地第一权值矩阵的参数。

进一歩地,通过第一添加子单元 913或第二添加子单元 917依次添加第二 滤波器 85, 通过第一筛选子单元 911或第二筛选子单元 915筛选训练样本, 并 使用 BP训练方法和保留的训练样本,对添加了第二 波器 85的新模型进行训 练, 能够得到更加精确的第一权值矩阵和第二权值 矩阵, 从而提高对图像中 检测目标的检测准确度。 此外, 传统的基于判别模型的目标检测方法通常对 多个滤波器单独进行优化,过拟合的风险较大 ,本发明依次添加第二滤波器, 可以对第二滤波器进行联合优化, 能够解决滤波器过拟合的问题, 降低检测 结果对训练样本数量和质量的依赖, 从而可以进一歩提高对图像中检测目标 的检测准确度。

图 12为本发明实施例七提供的目标检测装置的结 示意图。所述目标检 测装置 1100可以是具备计算能力的主机服务器、个人 算机 PC、或者可携带 的便携式计算机或终端等。本发明具体实施例 并不对计算节点的具体实现做 限定。 所述目标检测装置 1100包括处理器(processor)lllO、 通信接口 (Communications Interface) 1120 ,存储器 (memory) 1130和总线 1140。 其中, 处 理器 1110、通信接口 1120、以及存储器 1130通过总线 1140完成相互间的通信。

通信接口 1120用于与网络设备通信, 其中网络设备包括例如虚拟机管理 中心、 共享存储等。

处理器 1110用于执行程序。 处理器 1110可能是一个中央处理器 CPU, 或 者是专用集成电路 ASIC (Application Specific Integrated Circuit) , 或者是被 配置成实施本发明实施例的一个或多个集成电 路。

存储器 1130用于存放程序和数据。存储器 1130可能包含高速 RAM存储器, 也可能还包括非易失性存储器 (non-volatile memory),例如至少一个磁盘存储 器。 存储器 1130也可以是存储器阵列。 存储器 1130还可能被分块, 并且所述 块可按一定的规则组合成虚拟卷。

在一种可能的实施方式中, 上述程序可为包括计算机操作指令的程序代 码。 该程序具体可用于执行目标检测方法, 具体可以包括:

将图像划分为 N个窗口, N为大于或等于 1的正整数;

分别提取所述 N个窗口对应的视觉特征矩阵, 所述视觉特征矩阵是由多 个视觉特征组成的矩阵;

采用第一滤波器对选定窗口对应的视觉特征矩 阵进行滤波处理, 得到滤 波后的第一矩阵;

采用至少一个第二滤波器对所述选定窗口对应 的视觉特征矩阵进行滤 波处理, 得到至少一个第二矩阵, 每采用一个所述第二滤波器对所述选定窗 口对应的一个视觉特征矩阵进行滤波处理, 得到一个所述第二矩阵; 根据所述第一矩阵及其对应的第一权值矩阵、 以及每个所述第二矩阵及 其对应的第二权值矩阵, 计算出至少一个判别矩阵;

根据所述至少一个判别矩阵, 确定所述图像中在所述选定窗口内是否存 在检测目标。

在一种可能的实现方式中, 根据所述至少一个判别矩阵, 确定所述图像 中在所述选定窗口内是否存在检测目标, 包括:

根据所述至少一个判别矩阵, 得到输出判别值;

根据所述输出判别值, 确定所述图像中在所述选定窗口内是否存在检 测 目标。

在一种可能的实现方式中,所述采用第一滤波 器对选定窗口对应的视觉 特征矩阵进行滤波处理, 得到滤波后的第一矩阵, 包括:

采用公式i。 = IT ^ ,得到第一矩阵,其中, ι。为所述第一矩阵, F。表 示所述第一滤波器, /表示所述视觉特征矩阵, (8)表示滤波运算符;

所述采用至少一个第二滤波器对同一个所述选 定窗口对应的视觉特征 矩阵进行滤波处理, 得到至少一个第二矩阵, 包括:

采用公式 +ι / , 确定至少一个所述第二矩阵; 其中, s i+1 为 第 i + 1个所述第二矩阵; F i+1 表示第 i + 1个所述第二滤波器, ί为大于或等 于 0的整数;

所述根据所述第一矩阵及其对应的第一权值矩 阵、 以及每个所述第二矩 阵及其对应的第二权值矩阵, 计算出至少一个判别矩阵, 包括:

采用公式^丄 = 1+e - ( + +Ws , i+1 s i+1) ,确定所述判别矩阵;其中, h i+1 示第 i + 1个所述判别矩阵; W +1 为第 i + 1个所述第一权值矩阵; U 第 i + 1个所述第二权值矩阵。

在一种可能的实现方式中, 所述分别提取所述 N个窗口对应的视觉特征 矩阵, 所述视觉特征矩阵是由多个视觉特征组成的矩 阵, 包括:

将所述图像按照多个尺寸进行缩放, 得到多个缩放图像;

采用预设大小的窗口, 从每个所述缩放图像的选定位置按照设定顺序 进 行滑动, 每次滑动设定数量个像素, 将每个所述缩放图像分别划分成 N个窗 口; 以及

每次在每个所述缩放图像上滑动一次窗口后, 将每个所述缩放图像上的 对应窗口中的视觉特征合并到一起, 形成一个视觉特征矩阵; 或者将每个所 述缩放图像上的对应窗口中不同种类的视觉特 征形成多个视觉特征矩阵。

在一种可能的实现方式中, 分别提取所述 N个窗口对应的视觉特征矩阵 之前, 包括:

从预先选择的训练图像的窗口区域,提取多个 视觉特征矩阵作为训练样 本;

使用所述训练样本, 使用支持向量机 SVM训练方法, 得到所述第一滤波 器;

通过已经训练得到的所述第一滤波器和预设初 始值的第一权值矩阵, 利 用所述训练样本进行非监督预训练和后向传递 BP训练,得到所有的所述第一 权值矩阵的参数。

在一种可能的实现方式中, 得到所有的所述第一权值矩阵的参数之后, 还包括:

根据已训练得到的所述第一滤波器和所述第一 权值矩阵筛选所述训练 样本, 保留未正确计算出判别结果的样本;

每次添加一个预设初始值的第二滤波器及其对 应的第二权值矩阵, 并使 用已经训练得到的所述第一滤波器和所述第一 权值矩阵, 利用保留的所述训 练样本进行 BP训练,确定添加的所述第二滤波器和第二权 矩阵的参数, 并 更新所述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器 的个数确定。

在一种可能的实现方式中, 得到所有的所述第一权值矩阵的参数之后, 还包括:

根据已训练得到的所述第一滤波器、所述第一 权值矩阵和每次添加的预 设初始值的第二滤波器及其对应的第二权值矩 阵, 筛选所述训练样本, 保留 未正确计算出判别结果的样本;

根据已训练得到的所述第一滤波器、所述第一 权值矩阵和每次添加的预 设初始值的第二滤波器及其对应的第二权值矩 阵,利用保留的所述训练样本 进行 BP训练,确定添加的所述第二滤波器和第二权 矩阵的参数, 并更新所 述第一权值矩阵的参数; 其中, 筛选和添加次数由预设的第二滤波器的个数 确定。

本实施例中, 从图像中提取窗口对应的视觉特征矩阵后, 通过并联的第 一滤波器、 至少一个第二滤波器对视觉特征矩阵进行滤波 后, 可以依次计算 出至少一个判别矩阵, 从而确定该窗口内是否存在检测目标, 该方法能够有 效地传递图像中窗口区域及其周边领域的信息 ,提高对图像中检测目标的检 测准确度, 并且简单易于实现。

其中, 将图像按多个尺寸缩放成多个缩放图像, 再采用预设大小的窗口 将每个缩放图像分别划分成 N个窗口, 并将每个窗口的视觉特征形成一个或 多个视觉特征矩阵, 能够有效地保留图像中检测窗口区域及其周边 的领域信 息, 为后续的目标检测提供精确的数据基础。

并且, 通过对多个训练样本进行非监督训练, 可以确定第一权值矩阵的 中间值,采用非监督训练方法主要是把第一权 值矩阵的值放入到一个比较好 的位置上, 以防止后面 BP训练值陷入局部最优,从而提高图像中目标 检测 准确度。然后, 对第一权值矩阵的中间值进行 BP训练, 可以得到精确地第一 权值矩阵的参数。

进一歩地, 通过依次添加第二滤波器, 筛选训练样本, 并使用 BP训练方 法和保留的训练样本, 对添加了第二滤波器的新模型进行训练, 能够得到更 加精确的第一权值矩阵和第二权值矩阵, 从而提高对图像中检测目标的检测 准确度。 此外, 传统的基于判别模型的目标检测方法通常对多 个滤波器单独 进行优化, 过拟合的风险较大, 本发明依次添加第二滤波器, 可以对第二滤 波器进行联合优化, 能够解决滤波器过拟合的问题, 降低检测结果对训练样 本数量和质量的依赖,从而可以进一歩提高对 图像中检测目标的检测准确度。

本领域普通技术人员可以意识到, 本文所描述的实施例中的各示例性单 元及算法歩骤,能够以电子硬件、或者计算机 软件和电子硬件的结合来实现。 这些功能究竟以硬件还是软件形式来实现, 取决于技术方案的特定应用和设 计约束条件。专业技术人员可以针对特定的应 用选择不同的方法来实现所描 述的功能, 但是这种实现不应认为超出本发明的范围。

如果以计算机软件的形式来实现所述功能并作 为独立的产品销售或使 用时, 则在一定程度上可认为本发明的技术方案的全 部或部分(例如对现有 技术做出贡献的部分)是以计算机软件产品的 形式体现的。 该计算机软件产 品通常存储在计算机可读取的非易失性存储介 质中,包括若干指令用以使得 计算机设备 (可以是个人计算机、 服务器、 或者网络设备等)执行本发明各 实施例方法的全部或部分歩骤。 而前述的存储介质包括 U盘、 移动硬盘、 只 读存储器 (ROM, Read-Only Memory )、 随机存取存储器 (RAM, Random Access Memory), 磁碟或者光盘等各种可以存储程序代码的介质 。 以上所述, 仅为本发明的具体实施方式, 但本发明的保护范围并不局限 于此, 任何熟悉本技术领域的技术人员在本发明揭露 的技术范围内, 可轻易 想到变化或替换, 都应涵盖在本发明的保护范围之内。 因此, 本发明的保护 范围应所述以权利要求的保护范围为准。