Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
UPDATE METHOD, APPARATUS AND SYSTEM FOR VOICE RECOGNITION DEVICE
Document Type and Number:
WIPO Patent Application WO/2014/180218
Kind Code:
A1
Abstract:
An update method, apparatus and system for a voice recognition device, relating to the field of voice recognition. The method comprises: receiving a voice input signal (11); conducting voice recognition on the voice input signal by using a local voice recognition device, so as to obtain a local voice recognition result (12); acquiring an optimal recognition result from the local voice recognition result and a cloud end voice recognition result as a final voice recognition result (13), wherein the cloud end voice recognition result is obtained by using a cloud end voice recognition device to conduct the voice recognition on the voice input signal while the local voice device conducts the voice recognition on the voice input signal; combining acquired user feedback information and the final voice recognition result to determine whether the reliability of the local voice recognition result meets requirements or not (14); and when it is determined that the reliability of the local voice recognition result does not meet the requirements, using the cloud end voice recognition device to update the local voice recognition device (15).

Inventors:
XU DANHUA (CN)
JIANG HONGRUI (CN)
ZHENG WEIJUN (CN)
WANG XIYONG (CN)
WANG QING (CN)
Application Number:
PCT/CN2014/075247
Publication Date:
November 13, 2014
Filing Date:
April 14, 2014
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
HUAWEI DEVICE CO LTD (CN)
International Classes:
G10L15/34
Domestic Patent References:
WO2013056343A12013-04-25
Foreign References:
CN103247291A2013-08-14
CN102708865A2012-10-03
CN102496364A2012-06-13
CN101923854A2010-12-22
CN101763855A2010-06-30
Download PDF:
Claims:
权 利 要 求

1、 一种语音识别设备的更新方法, 其特征在于, 包括:

接收语音输入信号;

利用本地语音识别设备对所述语音输入信号进行语音识别 ,获得本地语音 识别结果;

从所述本地语音识别结果和云端语音识别结果中获取最优识别结果作为 最终语音识别结果,其中所述云端语音识别结果是在所述本地语音设备对所述 语音输入信号进行语音识别的同时,利用所述云端语音识别设备对所述语音输 入信号进行语音识别获得的;

结合获取的用户反馈信息以及所述最终语音识别结果确定所述本地语音 识别结果的可靠性是否满足要求;

当确定所述本地语音识别结果的可靠性不满足要求时,利用所述云端语音 识别设备对所述本地语音识别设备进行更新。

2、 根据权利要求 1所述的方法, 其特征在于, 所述利用本地识别引擎对 所述语音输入信号进行语音识别, 获得本地语音识别结果包括:

利用本地识别设备中的本地声学模型和本地语言模型分别对所述语音输 入信号进行语音识别, 获得本地语音识别结果。

3、 根据权利要求 1所述的方法, 其特征在于, 所述从所述本地语音识别 结果和从云端语音识别设备获得云端语音识别结果中获取最优识别结果作为 最终语音识别结果包括:

结合语音识别参数确定所述本地语音识别结果的可靠性;

当所述本地语音识别结果的可靠性满足预设条件时,将所述本地语音识别 结果作为所述最终语音识别结果;

当所述本地语音识别结果的可靠性不满足所述预设条件时,将所述云端语 音识别结果作为所述最终语音识别结果。

4、 根据权利要求 1所述的方法, 其特征在于, 所述结合获取的用户反馈 信息以及所述最终语音识别结果确定所述本地语音识别结果的可靠性是否满 足要求包括:

当获取的用户反馈信息表示所述最终语音识别结果正确且利用所述云端 语音识别结果作为所述最终语音识别结果时,确定所述本地语音识别结果的可 靠性不满足要求;

当获取的用户反馈信息表示所述最终语音识别结果错误且由所述用户获 取到正确的语音识别结果时,确定所述本地语音识别结果的可靠性不满足要求。

5、 根据权利要求 1所述的方法, 其特征在于, 所述当确定所述本地语音 识别结果的可靠性不满足要求时,利用所述云端语音识别设备对所述本地语音 识别设备进行更新包括:

当确定所述本地语音识别结果的可靠性不满足要求时,如果确定所述本地 语音识别结果中的命令词识别错误,则利用从所述云端语音识别设备获得的声 学模型增量更新包对所述本地语音识别设备中的本地声学模型进行更新;

当确定所述本地语音识别结果的可靠性不满足要求时,如果确定所述本地 语音识别结果中的拼音串识别正确但文本识别错误,则利用从所述云端语音识 别设备获得的语言模型增量更新包对所述本地语音识别设备中的本地语言模 型进行更新;

当确定所述本地语音识别结果的可靠性不满足要求时,如果确定所述本地 语音识别结果中的拼音串识别错误,则利用从所述云端语音识别设备获得的声 学模型增量更新包和语言模型增量更新包分别对所述本地语音识别设备中的 本地声学模型和本地语言模型进行更新。

6、 根据权利要求 4所述的方法, 其特征在于, 所述方法还包括:

将正确的语音识别结果发送给所述云端语音识别设备。

7、 根据权利要求 1-6任一所述的方法, 其特征在于, 所述方法还包括: 统计所述本地语音识别结果中词语的使用频率,并将所述使用频率发送给 所述云端识别设备。 8、 一种语音识别设备的更新方法, 其特征在于, 包括:

接收语音输入信号;

利用云端语音识别设备对所述语音输入信号进行语音识别 ,获得云端语音 识别结果;

当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可 靠性不满足要求时,利用所述云端语音识别设备对本地语音识别设备进行更新; 其中,所述本地语音识别结果是在所述云端语音设备对所述语音输入信号进行 语音识别获得所述云端语音识别结果的同时,利用本地语音识别设备对所述语 音输入信号进行语音识别获得的;所述最终语音识别结果是从所述云端语音识 别结果和所述本地语音识别结果中获取的。

9、 根据权利要求 8所述的方法, 其特征在于, 所述利用云端识别引擎对 所述语音输入信号进行语音识别, 获得云端语音识别结果包括:

利用云端识别设备中的云端声学模型和云端语言模型分别对所述语音输 入信号进行语音识别, 获得云端语音识别结果。

10、 根据权利要求 8所述的方法, 其特征在于, 当结合用户反馈信息以及 最终语音识别结果确定本地语音识别结果的可靠性不满足要求时,利用所述云 端语音识别设备对本地语音识别设备进行更新包括:

当结合用户反馈信息以及最终语音识别结果确定本地语音识别结果的可 靠性不满足要求时, 获取本地语音识别设备中需要更新的模型类型;

当所述需要更新的模型类型为本地声学模型时, 获取正确语音识别结果, 生成声学模型增量更新包,并利用所述声学模型增量更新包对所述本地声学模 型进行更新;

当所述需要更新的模型类型为本地语言模型和本地声学模型时,获取正确 语音识别结果, 生成语言模型增量更新包和声学模型增量更新包, 并利用所述 语言模型增量更新包和声学模型增量更新包对所述本地语言模型和本地声学 模型进行更新; 当所述需要更新的模型类型为本地语言模型时, 获取正确语音识别结果, 生成语言模型增量更新包,并利用所述语言模型增量更新包对所述本地语言模 型进行更新。

11、根据权利要求 8-10任一所述的方法,其特征在于,所述方法还包括: 定期更新所述云端识别设备中的词汇; 和 /或

接收所述本地语音识别设备发送的本地语音识别结果中词语的使用频率, 利用所述使用频率对所述云端识别设备中的词汇进行更新。

12、 一种语音识别设备的更新装置, 其特征在于, 包括:

接收单元, 用于接收语音输入信号;

识别单元,用于利用本地语音识别设备对所述接收单元接收的语音输入信 号进行语音识别, 获得本地语音识别结果;

选择单元,用于从所述识别单元获得的本地语音识别结果和从云端语音识 别设备获得的云端语音识别结果中获取最优识别结果作为最终语音识别结果, 其中所述云端语音识别结果是在所述本地语音设备对所述语音输入信号进行 语音识别的同时,利用所述云端语音识别设备对所述语音输入信号进行语音识 别获得的;

处理单元,用于结合获取的用户反馈信息以及从所述选择单元获得的最终 语音识别结果确定所述本地语音识别结果的可靠性是否满足要求;

更新单元,用于当所述处理单元确定所述本地语音识别结果的可靠性不满 足要求时, 利用所述云端语音识别设备对所述本地语音识别设备进行更新。

1 3、 根据权利要求 12所述的装置, 其特征在于,

所述识别单元具体用于利用本地识别设备中的本地声学模型和本地语言 模型分别对所述语音输入信号进行语音识别, 获得本地语音识别结果。

14、 根据权利要求 12所述的装置, 其特征在于, 所述选择单元包括: 判断模块, 用于结合语音识别参数确定所述本地语音识别结果的可靠性; 选择模块,用于当所述判断模块确定本地语音识别结果的可靠性满足预设 条件时,将所述本地语音识别结果作为所述最终语音识别结果; 当所述判断模 块确定所述本地语音识别结果的可靠性不满足所述预设条件时,将所述云端语 音识别结果作为所述最终语音识别结果。

15、根据权利要求 12所述的装置,其特征在于,所述处理单元具体用于: 当获取的用户反馈信息表示所述最终语音识别结果正确且利用所述云端 语音识别结果作为所述最终语音识别结果时,确定所述本地语音识别结果的可 靠性不满足要求;

当获取的用户反馈信息表示所述最终语音识别结果错误且由所述用户获 取到正确的语音识别结果时,确定所述本地语音识别结果的可靠性不满足要求。

16、根据权利要求 12所述的装置,其特征在于,所述更新单元具体用于: 当确定所述本地语音识别结果的可靠性不满足要求时,如果确定所述本地 语音识别结果中的命令词识别错误,则利用从所述云端语音识别设备获得的声 学模型增量更新包对所述本地语音识别设备中的本地声学模型进行更新;

当确定所述本地语音识别结果的可靠性不满足要求时,如果确定所述本地 语音识别结果中的拼音串识别正确但文本识别错误,则利用从所述云端语音识 别设备获得的语言模型增量更新包对所述本地语音识别设备中的本地语言模 型进行更新;

当确定所述本地语音识别结果的可靠性不满足要求时,如果确定所述本地 语音识别结果中的拼音串识别错误,则利用从所述云端语音识别设备获得的声 学模型增量更新包和语言模型增量更新包分别对所述本地语音识别设备中的 本地声学模型和本地语言模型进行更新。

17、 根据权利要求 15所述的装置, 其特征在于, 所述装置还包括: 发送单元,用于将所述处理单元确定的正确的语音识别结果发送给所述云 端语音识别设备。

18、根据权利要求 12-16任一所述的装置,其特征在于,所述装置还包括: 统计单元,用于统计从所述识别单元获取的本地语音识别结果中词语的使 用频率, 并将所述使用频率发送给所述云端识别设备。

19、 一种语音识别设备的更新装置, 其特征在于, 包括:

接收单元, 用于接收语音输入信号;

识别单元,用于利用云端语音识别设备对所述接收单元接收的语音输入信 号进行语音识别, 获得云端语音识别结果;

更新单元,用于当结合用户反馈信息以及最终语音识别结果确定本地语音 识别结果的可靠性不满足要求时,利用所述云端语音识别设备对本地语音识别 设备进行更新; 其中, 所述本地语音识别结果是在所述云端语音设备对所述语 音输入信号进行语音识别获得所述云端语音识别结果的同时,利用本地语音识 别设备对所述语音输入信号进行语音识别获得的;所述最终语音识别结果是从 所述云端语音识别结果和所述本地语音识别结果中获取的。

20、 根据权利要求 19所述的装置, 其特征在于,

所述识别单元具体用于:利用云端识别设备中的云端声学模型和云端语言 模型分别对所述语音输入信号进行语音识别, 获得云端语音识别结果。

21、 根据权利要求 19所述的装置, 其特征在于, 所述更新单元包括: 信息获取模块,用于当结合用户反馈信息以及最终语音识别结果确定本地 语音识别结果的可靠性不满足要求时,获取本地语音识别设备中需要更新的模 型类型;

更新模块,用于当所述信息获取模块获取的需要更新的模型类型为本地声 学模型时, 获取正确语音识别结果, 生成声学模型增量更新包, 并利用所述声 学模型增量更新包对所述本地声学模型进行更新;当所述需要更新的模型类型 为本地语言模型和本地声学模型时, 获取正确语音识别结果, 生成语言模型增 量更新包和声学模型增量更新包,并利用所述语言模型增量更新包和声学模型 增量更新包对所述本地语言模型和本地声学模型进行更新;当所述信息获取模 块获取的需要更新的模型类型为本地语言模型时, 获取正确语音识别结果, 生 成语言模型增量更新包,并利用所述语言模型增量更新包对所述本地语言模型 进行更新。

22、 根据权利要求 19所述的装置, 其特征在于, 所述装置还包括: 词汇更新单元, 用于定期更新所述云端识别设备中的词汇; 和 /或用于接 收所述本地语音识别设备发送的本地语音识别结果中词语的使用频率,利用所 述使用频率对所述云端识别设备中的词汇进行更新。

23、 一种语音识别设备更新装置系统, 其特征在于, 包括:

如权利要求 12-18 任一所述的语音识别设备更新装置以及如权利要求 19-22任一所述的语音识别设备更新装置。

Description:
一种语音识别设备的更新方法、 装置及系统

本申请要求于 2013年 5月 7日提交中国专利局、申请号为 201310163915.X、 发明名称为 "一种语音识别设备的更新方法、 装置及系统"的中国专利申请的 优先权, 其全部内容通过引用包含于本申请中。 技术领域

本发明涉及语音识别技术, 尤其涉及一种语音识别设备的更新方法、装置 及系统。 背景技术

语音识别技术是使得机器通过识别和理解过程 把语音信号转变为相应的 文本或命令的技术。其中,语音识别引擎通常 包含声学模型和语言模型,其中, 声学模型负责完成语音到音素(如英语中的音 标、中文中拼音的声韵母)的转换 , 语言模型负责完成音素到文本的转换,声学模 型和语言模型两者配合完成语音 到文本的识别过程。

现有技术中有三种语音识别技术:第一种^^于 端识别引擎的语音识别 技术, 第二种^^于本地语音识别引擎的语音识别技术 第三种是同时基于本 地语音识别引擎和云端识别引擎的语音识别技 术。 然而在现有技术中, 由于本 地语音识别引擎的准确度较低, 导致本地语音识别引擎的识别率低, 影响了语 音识别率。 发明内容

有鉴于此, 本发明提供一种语音识别设备的更新方法、 装置及系统, 以提 高语音识别率。

为达到上述目的, 本发明实施例釆用如下技术方案: 第一方面, 本发明提供了一种语音识别设备的更新方法, 包括: 接收语音输入信号;

利用本地语音识别设备对所述语音输入信号进 行语音识别 ,获得本地语音 识别结果;

从所述本地语音识别结果和云端语音识别结果 中获取最优识别结果作为 最终语音识别结果,其中所述云端语音识别结 果是在所述本地语音设备对所述 语音输入信号进行语音识别的同时,利用所述 云端语音识别设备对所述语音输 入信号进行语音识别获得的;

结合获取的用户反馈信息以及所述最终语音识 别结果确定所述本地语音 识别结果的可靠性是否满足要求;

当确定所述本地语音识别结果的可靠性不满足 要求时,利用所述云端语音 识别设备对所述本地语音识别设备进行更新。

在第一方面的第一种可能实现方式中,所述利 用本地识别引擎对所述语音 输入信号进行语音识别, 获得本地语音识别结果包括:

利用本地识别设备中的本地声学模型和本地语 言模型分别对所述语音输 入信号进行语音识别, 获得本地语音识别结果。

在第一方面的第二种可能实现方式中,所述从 所述本地语音识别结果和从 云端语音识别设备获得云端语音识别结果中获 取最优识别结果作为最终语音 识别结果包括:

结合语音识别参数确定所述本地语音识别结果 的可靠性;

当所述本地语音识别结果的可靠性满足预设条 件时,将所述本地语音识别 结果作为所述最终语音识别结果;

当所述本地语音识别结果的可靠性不满足所述 预设条件时,将所述云端语 音识别结果作为所述最终语音识别结果。

在第一方面的第三种可能实现方式中,所述结 合获取的用户反馈信息以及 所述最终语音识别结果确定所述本地语音识别 结果的可靠性是否满足要求包 括:

当获取的用户反馈信息表示所述最终语音识别 结果正确且利用所述云端 语音识别结果作为所述最终语音识别结果时, 确定所述本地语音识别结果的可 靠性不满足要求;

当获取的用户反馈信息表示所述最终语音识别 结果错误且由所述用户获 取到正确的语音识别结果时,确定所述本地语 音识别结果的可靠性不满足要求。

在第一方面的第四种可能实现方式中,所述当 确定所述本地语音识别结果 的可靠性不满足要求时,利用所述云端语音识 别设备对所述本地语音识别设备 进行更新包括:

当确定所述本地语音识别结果的可靠性不满足 要求时,如果确定所述本地 语音识别结果中的命令词识别错误,则利用从 所述云端语音识别设备获得的声 学模型增量更新包对所述本地语音识别设备中 的本地声学模型进行更新;

当确定所述本地语音识别结果的可靠性不满足 要求时,如果确定所述本地 语音识别结果中的拼音串识别正确但文本识别 错误,则利用从所述云端语音识 别设备获得的语言模型增量更新包对所述本地 语音识别设备中的本地语言模 型进行更新;

当确定所述本地语音识别结果的可靠性不满足 要求时,如果确定所述本地 语音识别结果中的拼音串识别错误,则利用从 所述云端语音识别设备获得的声 学模型增量更新包和语言模型增量更新包分别 对所述本地语音识别设备中的 本地声学模型和本地语言模型进行更新。

结合第一方面的第四种可能实现方式,在第一 方面的第五种可能实现方式 中, 所述方法还包括: 将正确的语音识别结果发送给所述云端语音识 别设备。

结合第一方面或第一方面的第一种或第二种或 第三种可能实现方式或者 结合第一方面的第五种可能实现方式, 在第一方面的第六种可能实现方式中, 所述方法还包括:

统计所述本地语音识别结果中词语的使用频率 ,并将所述使用频率发送给 所述云端识别设备。

第二方面, 本发明提供了一种语音识别设备的更新方法, 包括:

接收语音输入信号;

利用云端语音识别设备对所述语音输入信号进 行语音识别 ,获得云端语音 识别结果;

当结合用户反馈信息以及最终语音识别结果确 定本地语音识别结果的可 靠性不满足要求时,利用所述云端语音识别设 备对本地语音识别设备进行更新; 其中,所述本地语音识别结果是在所述云端语 音设备对所述语音输入信号进行 语音识别获得所述云端语音识别结果的同时, 利用本地语音识别设备对所述语 音输入信号进行语音识别获得的;所述最终语 音识别结果是从所述云端语音识 别结果和所述本地语音识别结果中获取的。

在第二方面的第一种可能实现方式中,所述利 用云端识别引擎对所述语音 输入信号进行语音识别, 获得云端语音识别结果包括:

利用云端识别设备中的云端声学模型和云端语 言模型分别对所述语音输 入信号进行语音识别, 获得云端语音识别结果。

在第二方面的第二种可能实现方式中,当结合 用户反馈信息以及最终语音 识别结果确定本地语音识别结果的可靠性不满 足要求时,利用所述云端语音识 别设备对本地语音识别设备进行更新包括:

当结合用户反馈信息以及最终语音识别结果确 定本地语音识别结果的可 靠性不满足要求时, 获取本地语音识别设备中需要更新的模型类型 ;

当所述需要更新的模型类型为本地声学模型时 , 获取正确语音识别结果, 生成声学模型增量更新包,并利用所述声学模 型增量更新包对所述本地声学模 型进行更新;

当所述需要更新的模型类型为本地语言模型和 本地声学模型时,获取正确 语音识别结果, 生成语言模型增量更新包和声学模型增量更新 包, 并利用所述 语言模型增量更新包和声学模型增量更新包对 所述本地语言模型和本地声学 模型进行更新;

当所述需要更新的模型类型为本地语言模型时 , 获取正确语音识别结果, 生成语言模型增量更新包,并利用所述语言模 型增量更新包对所述本地语言模 型进行更新。

结合第二方面的第一种或者第二种可能实现方 式,在第二方面的第三种可 能实现方式中, 所述方法还包括:

定期更新所述云端识别设备中的词汇; 和 /或

接收所述本地语音识别设备发送的本地语音识 别结果中词语的使用频率, 利用所述使用频率对所述云端识别设备中的词 汇进行更新。

第三方面, 本发明提供了一种语音识别设备的更新装置, 包括:

接收单元, 用于接收语音输入信号;

识别单元,用于利用本地语音识别设备对所述 接收单元接收的语音输入信 号进行语音识别, 获得本地语音识别结果;

选择单元,用于从所述识别单元获得的本地语 音识别结果和从云端语音识 别设备获得的云端语音识别结果中获取最优识 别结果作为最终语音识别结果, 其中所述云端语音识别结果是在所述本地语音 设备对所述语音输入信号进行 语音识别的同时,利用所述云端语音识别设备 对所述语音输入信号进行语音识 别获得的;

处理单元,用于结合获取的用户反馈信息以及 从所述选择单元获得的最终 语音识别结果确定所述本地语音识别结果的可 靠性是否满足要求;

更新单元,用于当所述处理单元确定所述本地 语音识别结果的可靠性不满 足要求时, 利用所述云端语音识别设备对所述本地语音识 别设备进行更新。

在第三方面的第一种可能实现方式中,所述识 别单元具体用于利用本地识 别设备中的本地声学模型和本地语言模型分别 对所述语音输入信号进行语音 识别, 获得本地语音识别结果。

在第三方面的第二种可能实现方式中, 所述选择单元包括: 判断模块, 用于结合语音识别参数确定所述本地语音识别 结果的可靠性; 选择模块,用于当所述判断模块确定本地语音 识别结果的可靠性满足预设 条件时,将所述本地语音识别结果作为所述最 终语音识别结果; 当所述判断模 块确定所述本地语音识别结果的可靠性不满足 所述预设条件时,将所述云端语 音识别结果作为所述最终语音识别结果。

在第三方面的第三种可能实现方式中, 所述处理单元具体用于:

当获取的用户反馈信息表示所述最终语音识别 结果正确且利用所述云端 语音识别结果作为所述最终语音识别结果时, 确定所述本地语音识别结果的可 靠性不满足要求;

当获取的用户反馈信息表示所述最终语音识别 结果错误且由所述用户获 取到正确的语音识别结果时,确定所述本地语 音识别结果的可靠性不满足要求。

在第三方面的第四种可能实现方式中, 所述更新单元具体用于:

当确定所述本地语音识别结果的可靠性不满足 要求时,如果确定所述本地 语音识别结果中的命令词识别错误,则利用从 所述云端语音识别设备获得的声 学模型增量更新包对所述本地语音识别设备中 的本地声学模型进行更新;

当确定所述本地语音识别结果的可靠性不满足 要求时,如果确定所述本地 语音识别结果中的拼音串识别正确但文本识别 错误,则利用从所述云端语音识 别设备获得的语言模型增量更新包对所述本地 语音识别设备中的本地语言模 型进行更新;

当确定所述本地语音识别结果的可靠性不满足 要求时,如果确定所述本地 语音识别结果中的拼音串识别错误,则利用从 所述云端语音识别设备获得的声 学模型增量更新包和语言模型增量更新包分别 对所述本地语音识别设备中的 本地声学模型和本地语言模型进行更新。

在第三方面的第五种可能实现方式中, 所述装置还包括:

发送单元,用于将所述处理单元确定的正确的 语音识别结果发送给所述云 端语音识别设备。 结合本发明的第三方面或者第三方面的第一- 五可能实现方式中的任意 一种可能实现方式, 在第三方面的第六种可能实现方式中, 所述装置还包括: 统计单元,用于统计从所述识别单元获取的本 地语音识别结果中词语的使 用频率, 并将所述使用频率发送给所述云端识别设备。

第四方面, 本发明提供了一种语音识别设备的更新装置, 包括: 接收单元, 用于接收语音输入信号;

识别单元,用于利用云端语音识别设备对所述 接收单元接收的语音输入信 号进行语音识别, 获得云端语音识别结果;

更新单元,用于当结合用户反馈信息以及最终 语音识别结果确定本地语音 识别结果的可靠性不满足要求时,利用所述云 端语音识别设备对本地语音识别 设备进行更新; 其中, 所述本地语音识别结果是在所述云端语音设备 对所述语 音输入信号进行语音识别获得所述云端语音识 别结果的同时,利用本地语音识 别设备对所述语音输入信号进行语音识别获得 的;所述最终语音识别结果是从 所述云端语音识别结果和所述本地语音识别结 果中获取的。

在第四方面的第一种可能实现方式中, 所述识别单元具体用于: 利用云端 识别设备中的云端声学模型和云端语言模型分 别对所述语音输入信号进行语 音识别, 获得云端语音识别结果。

在第四方面的第二种可能实现方式中, 所述更新单元包括:

信息获取模块,用于当结合用户反馈信息以及 最终语音识别结果确定本地 语音识别结果的可靠性不满足要求时,获取本 地语音识别设备中需要更新的模 型类型;

更新模块,用于当所述信息获取模块获取的需 要更新的模型类型为本地声 学模型时, 获取正确语音识别结果, 生成声学模型增量更新包, 并利用所述声 学模型增量更新包对所述本地声学模型进行更 新;当所述需要更新的模型类型 为本地语言模型和本地声学模型时, 获取正确语音识别结果, 生成语言模型增 量更新包和声学模型增量更新包,并利用所述 语言模型增量更新包和声学模型 增量更新包对所述本地语言模型和本地声学模 型进行更新;当所述信息获取模 块获取的需要更新的模型类型为本地语言模型 时, 获取正确语音识别结果, 生 成语言模型增量更新包,并利用所述语言模型 增量更新包对所述本地语言模型 进行更新。

在第四方面的第三种可能实现方式中, 所述装置还包括:

词汇更新单元, 用于定期更新所述云端识别设备中的词汇; 和 /或用于接 收所述本地语音识别设备发送的本地语音识别 结果中词语的使用频率,利用所 述使用频率对所述云端识别设备中的词汇进行 更新。

第五方面, 本发明提供了一种语音识别设备更新装置系统 , 包括: 如第三方面所述的语音识别设备更新装置以及 如第四方面所述的语音识 别设备更新装置。

本发明实施例提供的语音识别设备的更新方法 ,当结合本地语音识别结果 和云端语音识别结果确定本地语音识别结果不 可靠时,可利用云端语音识别设 备对本地语音识别设备进行更新,因而避免了 现有技术中在无法获得云端语音 识别结果时本地语音识别设备由于模型的限制 而无法扩展的限制, 因此, 利用 本发明实施例的方法、 装置和系统, 提高了语音识别率。 附图说明

为了更清楚地说明本发明实施例的技术方案, 下面将对实施例描述中所需 要使用的附图作一简单地介绍, 显而易见地, 下面描述中的附图仅仅是本发明 的一些实施例,对于本领域普通技术人员来讲 ,在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。

图 1为本发明实施例一的语音识别设备的更新方 的流程图;

图 2为本发明实施例三的语音识别设备的更新方 的流程图;

图 3为本发明实施例四的语音识别设备的更新装 示意图;

图 4为本发明实施例四的语音识别设备的更新装 示意图;

图 5为本发明实施例五的语音识别设备的更新装 示意图; 图 6为本发明实施例五的语音识别设备的更新装 的结构图。 具体实施方式

下面将结合本发明实施例中的附图,对本发明 实施例中的技术方案进行清 楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是 全部的实施例。基于本发明中的实施例, 本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。

如图 1所示, 本发明实施例一的语音识别设备的更新方法包 括:

步骤 11、 本地语音识别设备接收语音输入信号。

在此步骤中, 首先启动本地语音识别设备的语音识别类软件 , 当用户开始 说话时, 本地语音识别设备即接收语音输入信号。

步骤 12、 利用本地语音识别设备对所述语音输入信号进 行语音识别, 获 得本地语音识别结果。

在此步骤中,主要是利用本地识别设备中的本 地声学模型和本地语言模型 分别对所述语音输入信号进行语音识别, 获得本地语音识别结果。 其中, 本地 声学模型和本地语言模型的具体的识别方法和 现有技术中的相同,在此不再赘 述。

步骤 13、 从所述本地语音识别结果和云端语音识别结果 中获取最优识别 结果作为最终语音识别结果,其中所述云端语 音识别结果是在所述本地语音设 备对所述语音输入信号进行语音识别的同时, 利用所述云端语音识别设备对所 述语音输入信号进行语音识别获得的。

在此步骤中, 首先结合应用上下文环境、置信度等语音识别 参数确定所述 本地语音识别结果的可靠性,即确定本地语音 识别结果的准确性是否满足要求。 其中,应用上下文环境指的是用户使用的场景 的一些信息,如用户前一次语音 为 "打电话", 则之后进行语音识别时用户使用的场景应该就 是人名的识别; 如用户前一次语音为 "发短信给张三", 则之后进行语音识别时用户使用的场 景应该就是短信内容的听写识别。 置信度指的是识别结果的可信任程度,取值 一般在 0-100之间, 如识别结果 "张三" 的置信度为 80, 则表明其可靠性较 高, 则该识别结果可以接受; 又如 "李四" 的置信度为 20 , 则表明其可靠性 较差, 则该识别结果可以拒绝。

在选取最终识别结果时, 如果本地语音识别结果的可靠性满足预设条件 , 则将所述本地语音识别结果作为所述最终语音 识别结果。如果所述本地语音识 别结果的可靠性不满足所述预设条件, 由于存在一定的网络时延, 则会继续等 待云端语音识别结果,然后将所述云端语音识 别结果作为所述最终语音识别结 果。 例如, 所述预设条件可以为置信度为 90。 如果本地语音识别结果的置信 度为 90以上, 则将本地语音识别结果作为最终语音识别结果 , 否则将云端语 音识别结果作为最终语音识别结果。

步骤 14、 结合获取的用户反馈信息以及所述最终语音识 别结果确定所述 本地语音识别结果的可靠性是否满足要求。

在此步骤中,所述最终语音识别结果需要通过 用户界面(User Interface , UI )提供给用户, 供用户操作, 然后再根据用户的操作获取用户反馈信息。 而 对最终语音识别结果的判断是通过获取的用户 反馈信息来决定的。例如, 如在 本地命令词识别中, 用户取消了相应的操作, 则获取的用户反馈信息表示最终 识别结果错误; 在短信听写中, 用户修改了短信文本, 则获取的用户反馈信息 表示最终识别结果错误, 但是修改后的文本为正确识别结果。 由此可以看出, 在获取用户反馈信息的同时, 还可确定正确的语音识别结果。 此外, 当获得正 确的语音识别结果后,还可将正确的语音识别 结果发送给所述云端语音识别设 备。

因此,在此步骤中, 当获取的用户反馈信息表示所述最终语音识别 结果正 确且利用所述云端语音识别结果作为所述最终 语音识别结果时,确定所述本地 语音识别结果的可靠性不满足要求。当获取的 用户反馈信息表示所述最终语音 识别结果错误且由所述用户获取到正确的语音 识别结果时,确定所述本地语音 识别结果的可靠性不满足要求。 而如果最终语音识别结果正确且本地语音识别 结果正确,则用户无需进行 任何操作, 也就无需获得用户反馈信息。 或者, 最终语音识别结果错误, 但是 用户没有反馈正确识别结果, 那么也无需获得用户反馈信息。

步骤 15、 当确定所述本地语音识别结果的可靠性不满足 要求时, 利用所 述云端语音识别设备对所述本地语音识别设备 进行更新。

在此步骤中, 当确定所述本地语音识别结果的可靠性不满足 要求时,如果 确定所述本地语音识别结果中的命令词识别错 误,则利用从所述云端语音识别 设备获得的声学模型增量更新包对所述本地语 音识别设备中的本地声学模型 进行更新。 当确定所述本地语音识别结果的可靠性不满足 要求时,如果确定所 述本地语音识别结果中的拼音串识别正确但文 本识别错误,则利用从所述云端 语音识别设备获得的语言模型增量更新包对所 述本地语音识别设备中的本地 语言模型进行更新。 当确定所述本地语音识别结果的可靠性不满足 要求时,如 果确定所述本地语音识别结果中的拼音串识别 错误,则利用从所述云端语音识 别设备获得的声学模型增量更新包和语言模型 增量更新包分别对所述本地语 音识别设备中的本地声学模型和本地语言模型 进行更新。

具体的, 本地命令词识别及本地听写识别都是位于本地 识别设备中,是本 地识别设备的两种功能。其中,本地命令词识 别主要用于对固定的句型、人名、 命令词的识别等, 如 "打电话给张三"、 "打开音乐播放器" 等固定命令词; 本 地听写识别主要用于对连续语音的识别, 如短信内容的听写, 如 "今天晚饭吃 了吗? " 等。

在本地命令词识别中, 如果用户期望的命令词为 "打电话给张三", 但最 终语音识别结果为 "打电话给李四", 则用户会取消这个最终语音识别结果, 或从备选列表(如果有的话)选取 "李四", 以标识最终语音识别结果识别错 误。那么通过用户的此种操作,即可获知最终 语音识别结果是错误的。又例如, 在短信听写中,如果用户对最终语音识别结果 作了修改, 则表明最终语音识别 结果中的听写内容有误,且可以获取用户修改 后的文本作为最终语音识别结果。 在此种情况下, 可确定需要对本地声学模型进行更新。 因此, 需利用从所述云 端语音识别设备获得的声学模型增量更新包对 所述本地语音识别设备中的本 地声学模型进行更新。

在本地听写识别中,例如,最终语音识别结果 中为"中国队表现十分给立", 用户修改后的最终语音识别结果为 "中国队表现十分给力", "立" 与 "力" 拼 音串相同, 此时, 确定对所述本地语音识别设备中的本地语言模 型进行更新。 又例如, 最终语音识别结果中为 "春节晚会很明白", 而用户修改后的最终语 音识别结果最终结果为 "春节晚会很精彩", 此时, 确定对所述本地语音识别 设备中的本地语言模型和本地声学模型都进行 更新。

由上可以看出, 本发明实施例一的语音识别设备的更新方法, 当结合本地 语音识别结果和云端语音识别结果确定本地语 音识别结果不可靠时,可利用云 端语音识别设备对本地语音识别设备进行更新 ,因而避免了现有技术中在无法 获得云端语音识别结果时本地语音识别设备由 于模型的限制而无法扩展的限 制, 因此, 利用本发明实施例的方法, 提高了语音识别率。

在本发明实施例一的基础上 ,本发明实施例而的语音识别设备的更新方法 还包括: 统计所述本地语音识别结果中词语的使用频率 , 并将所述使用频率发 送给所述云端识别设备。 例如, 可按照设定的时间间隔, 如每月, 统计所述本 地语音识别结果中热频词的使用频率,并将所 述使用频率发送给所述云端识别 设备, 以扩充本地语音识别中热频词的识别。

如图 2所示, 本发明实施例三的语音识别设备的更新方法包 括:

步骤 21、 云端语音识别设备接收语音输入信号。

在此步骤中, 与步骤 11类似的, 首先启动云端语音识别设备的语音识别 类软件, 当用户开始说话时, 云端语音识别设备即接收语音输入信号。

步骤 22、 利用云端语音识别设备对所述语音输入信号进 行语音识别, 获 得云端语音识别结果。

在此步骤中,主要是利用云端识别设备中的云 端声学模型和云端语言模型 分别对所述语音输入信号进行语音识别, 获得云端语音识别结果。 其中, 云端 声学模型和云端语言模型的具体的识别方法和 现有技术中的相同,在此不再赘 述。

步骤 23、 当结合用户反馈信息以及最终语音识别结果确 定本地语音识别 结果的可靠性不满足要求时,利用所述云端语 音识别设备对本地语音识别设备 进行更新; 其中, 所述本地语音识别结果是在所述云端语音设备 对所述语音输 入信号进行语音识别获得所述云端语音识别结 果的同时,利用本地语音识别设 备对所述语音输入信号进行语音识别获得的; 所述最终语音识别结果是从所述 云端语音识别结果和所述本地语音识别结果中 获取的。

在此步骤中,当结合用户反馈信息以及最终语 音识别结果确定本地语音识 别结果的可靠性不满足要求时,获取本地语音 识别设备中需要更新的模型类型。 当所述需要更新的模型类型为本地声学模型时 , 获取正确语音识别结果, 生成 声学模型增量更新包,并利用所述声学模型增 量更新包对所述本地声学模型进 行更新; 当所述需要更新的模型类型为本地语言模型和 本地声学模型时, 获取 正确语音识别结果, 生成语言模型增量更新包和声学模型增量更新 包, 并利用 所述语言模型增量更新包和声学模型增量更新 包对所述本地语言模型和本地 声学模型进行更新; 当所述需要更新的模型类型为本地语言模型时 , 获取正确 语音识别结果, 生成语言模型增量更新包, 并利用所述语言模型增量更新包对 所述本地语言模型进行更新。

由上可以看出, 本发明实施例二的语音识别设备的更新方法, 当结合本地 语音识别结果和云端语音识别结果确定本地语 音识别结果不可靠时,可利用云 端语音识别设备对本地语音识别设备进行更新 ,因而避免了现有技术中在无法 获得云端语音识别结果时本地语音识别设备由 于模型的限制而无法扩展的限 制, 因此, 利用本发明实施例的方法, 提高了语音识别率。

在本发明实施例三的基础上 ,本发明实施例四的语音识别设备的更新方法 还可包括: 定期(如每月等)更新所述云端识别设备中的 词汇。 以及所述云端 识别设备还可接收所述本地语音识别设备发送 的本地语音识别结果中词语的 使用频率, 利用所述使用频率对所述云端识别设备中的词 汇进行更新, 以进一 步提高识别率。

如图 3所示, 本发明实施例四的语音识别设备的更新装置, 包括: 接收单元 31 , 用于接收语音输入信号; 识别单元 32 , 用于利用本地语音 识别设备对所述接收单元接收的语音输入信号 进行语音识别 ,获得本地语音识 别结果; 选择单元 33 , 用于从所述识别单元获得的本地语音识别结果 和从云 端语音识别设备获得的云端语音识别结果中获 取最优识别结果作为最终语音 识别结果,其中所述云端语音识别结果是在所 述本地语音设备对所述语音输入 信号进行语音识别的同时,利用所述云端语音 识别设备对所述语音输入信号进 行语音识别获得的; 处理单元 34 , 用于结合获取的用户反馈信息以及从所述 选择单元获得的最终语音识别结果确定所述本 地语音识别结果的可靠性是否 满足要求; 更新单元 35 , 用于当所述处理单元确定所述本地语音识别结 果的 可靠性不满足要求时,利用所述云端语音识别 设备对所述本地语音识别设备进 行更新。

其中, 所述识别单元 32具体用于利用本地识别设备中的本地声学模 和 本地语言模型分别对所述语音输入信号进行语 音识别,获得本地语音识别结果。

所述选择单元 33可包括: 判断模块, 用于结合语音识别参数确定所述本 地语音识别结果的可靠性; 选择模块, 用于当所述判断模块确定本地语音识别 结果的可靠性满足预设条件时,将所述本地语 音识别结果作为所述最终语音识 别结果;当所述判断模块确定所述本地语音识 别结果的可靠性不满足所述预设 条件时, 将所述云端语音识别结果作为所述最终语音识 别结果。

所述处理单元 34具体用于: 当获取的用户反馈信息表示所述最终语音识 别结果正确且利用所述云端语音识别结果作为 所述最终语音识别结果时,确定 所述本地语音识别结果的可靠性不满足要求; 当获取的用户反馈信息表示所述 最终语音识别结果错误且由所述用户获取到正 确的语音识别结果时,确定所述 本地语音识别结果的可靠性不满足要求。

所述更新单元 35具体用于: 当确定所述本地语音识别结果的可靠性不满 足要求时, 如果确定所述本地语音识别结果中的命令词识 别错误, 则利用从所 述云端语音识别设备获得的声学模型增量更新 包对所述本地语音识别设备中 的本地声学模型进行更新;当确定所述本地语 音识别结果的可靠性不满足要求 时,如果确定所述本地语音识别结果中的拼音 串识别正确但文本识别错误, 则 利用从所述云端语音识别设备获得的语言模型 增量更新包对所述本地语音识 别设备中的本地语言模型进行更新;当确定所 述本地语音识别结果的可靠性不 满足要求时,如果确定所述本地语音识别结果 中的拼音串识别错误, 则利用从 所述云端语音识别设备获得的声学模型增量更 新包和语言模型增量更新包分 别对所述本地语音识别设备中的本地声学模型 和本地语言模型进行更新。

由上可以看出, 本发明实施例四的语音识别设备的更新装置, 当结合本地 语音识别结果和云端语音识别结果确定本地语 音识别结果不可靠时,可利用云 端语音识别设备对本地语音识别设备进行更新 ,因而避免了现有技术中在无法 获得云端语音识别结果时本地语音识别设备由 于模型的限制而无法扩展的限 制, 因此, 利用本发明实施例的装置, 提高了语音识别率。

如图 4所示, 所述装置还可包括: 发送单元 41 , 用于将所述处理单元确 定的正确的语音识别结果发送给所述云端语音 识别设备; 统计单元 42 , 用于 统计从所述识别单元获取的本地语音识别结果 中词语的使用频率,并将所述使 用频率发送给所述云端识别设备。

如图 5所示, 本发明实施例五的语音识别设备的更新装置, 包括: 接收单元 51 , 用于接收语音输入信号; 识别单元 52 , 用于利用云端语音 识别设备对所述接收单元接收的语音输入信号 进行语音识别 ,获得云端语音识 别结果; 更新单元 53 , 用于当结合用户反馈信息以及最终语音识别结 果确定 本地语音识别结果的可靠性不满足要求时,利 用所述云端语音识别设备对本地 语音识别设备进行更新; 其中, 所述本地语音识别结果是在所述云端语音设备 对所述语音输入信号进行语音识别获得所述云 端语音识别结果的同时,利用本 地语音识别设备对所述语音输入信号进行语音 识别获得的;所述最终语音识别 结果是从所述云端语音识别结果和所述本地语 音识别结果中获取的。

其中, 所述识别单元 52具体用于: 利用云端识别设备中的云端声学模型 和云端语言模型分别对所述语音输入信号进行 语音识别,获得云端语音识别结 果。

所述更新单元 53可包括: 信息获取模块, 用于当结合用户反馈信息以及 最终语音识别结果确定本地语音识别结果的可 靠性不满足要求时,获取本地语 音识别设备中需要更新的模型类型; 更新模块, 用于当所述信息获取模块获取 的需要更新的模型类型为本地声学模型时, 获取正确语音识别结果, 生成声学 模型增量更新包,并利用所述声学模型增量更 新包对所述本地声学模型进行更 新; 当所述需要更新的模型类型为本地语言模型和 本地声学模型时, 获取正确 语音识别结果, 生成语言模型增量更新包和声学模型增量更新 包, 并利用所述 语言模型增量更新包和声学模型增量更新包对 所述本地语言模型和本地声学 模型进行更新;当所述信息获取模块获取的需 要更新的模型类型为本地语言模 型时, 获取正确语音识别结果, 生成语言模型增量更新包, 并利用所述语言模 型增量更新包对所述本地语言模型进行更新。

由上可以看出, 本发明实施例五的语音识别设备的更新装置, 当结合本地 语音识别结果和云端语音识别结果确定本地语 音识别结果不可靠时,可利用云 端语音识别设备对本地语音识别设备进行更新 ,因而避免了现有技术中在无法 获得云端语音识别结果时本地语音识别设备由 于模型的限制而无法扩展的限 制, 因此, 利用本发明实施例的装置, 提高了语音识别率。

如图 6所示, 本发明实施例五的语音识别设备的更新装置还 可包括: 词汇更新单元 54 , 用于定期更新所述云端识别设备中的词汇; 和 /或用于 接收所述本地语音识别设备发送的本地语音识 别结果中词语的使用频率,利用 所述使用频率对所述云端识别设备中的词汇进 行更新。 其中,本发明实施例的语音设备的更新装置的 工作原理可参照前述方法是 市里的描述。

此外, 本发明实施例还提供了一种语音识别设备的更 新系统, 包括实施例 四和实施例五所述的语音设备的更新装置。

本领域普通技术人员可以理解实现上述实施例 方法中的全部或部分流程 , 是可以通过计算机程序来指令相关的硬件来完 成,所述的程序可存储于一计算 机可读取存储介质中,该程序在执行时,可包 括如上述各方法的实施例的流程。 其中,所述的存储介质可为磁碟、光盘、只读 存储记忆体(Read-Only Memory, ROM )或随机存储记忆体 ( Random Acces s Memory , RAM )等。

以上所述,仅为本发明的具体实施方式,但本 发明的保护范围并不局限于 此,任何熟悉本技术领域的技术人员在本发明 揭露的技术范围内, 可轻易想到 变化或替换, 都应涵盖在本发明的保护范围之内。 因此, 本发明的保护范围应 以所述权利要求的保护范围为准。