刘泽新 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
MIAO, Lei (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
苗磊 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
HU, Chen (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
胡晨 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
华为技术有限公司 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
LIU, Zexin (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
刘泽新 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
MIAO, Lei (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
苗磊 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
HU, Chen (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
| 权利要求 1、 一种语音频信号切换方法, 其特征在于, 包括: 当语音频信号出现切换时, 将当前帧语音频信号的第一高频带信号和 前 M帧语音频信号的第二高频带信号进行加权处理, 以得到处理后的第一 高频带信号; 其中, M大于等于 1 ; 将所述处理后的第一高频带信号与所述当前帧语音频信号的第一低频 带信号合成宽频带信号。 2、根据权利要求 1所述的语音频信号切换方法, 其特征在于,还包括: 当语音频信号没有出现切换时, 将所述第一高频带信号与所述第一低 频带信号合成所述宽频带信号。 3、 根据权利要求 1或 2所述的语音频信号切换方法, 其特征在于, 当 宽频带语音频信号向窄频带语音频信号切换时; 所述将当前帧语音频信号的第一高频带信号和前 M帧语音频信号的第 二高频带信号进行加权, 以得到处理后的第一高频带信号具体为: 预测所述当前帧语音频信号的所述第一高频带信号对应的预测的精细 结构信息和预测的包络信息; 将所述预测的包络信息与所述前 M帧语音频信号的第二高频带信号对 应的前 M帧包络信息进行加权处理, 以得到所述第一高频带信号对应的第 一包洛信息; 根据所述第一包络信息和所述预测的精细结构信息, 生成所述处理后 的第一高频带信号。 4、 根据权利要求 3所述的语音频信号切换方法, 其特征在于, 所述预 测所述第一高频带信号对应的预测的精细结构信息和预测的包络信息具体 为: 对所述当前帧语音频信号的第一低频带信号进行信号分类; 根据所述第一低频带信号对应的信号类型预测所述预测的精细结构信 息和所述预测的包络信息。 5、 根据权利要求 3所述的语音频信号切换方法, 其特征在于, 所述将 所述预测的包络信号和所述前 M帧语音频信号的第二高频带信号对应的前 M 帧包络信息进行加权处理, 以得到所述第一高频带信号对应的第一包络 信息具体为: 根据所述第一低频带信号和前 N帧的语音频信号的低频带信号, 计算 所述第一低频带信号与所述前 N帧的语音频信号的低频带信号之间的相关 性系数; 其中, N大于等于 1 ; 判断所述相关性系数是否在给定的第一阀值范围内; 如果所述相关性系数不在所述第一阀值范围内, 则根据已设定好的第 一权重一和第一权重二进行加权处理, 以计算出所述第一包络信息; 其中, 所述第一权重一为前一帧语音频信号的高频带信号对应的前一帧包络信息 的权重值, 所述第一权重二为所述包络信息的权重值; 如果所述相关性系数在所述第一阀值范围内, 根据已设定好的第二权 重一和第二权重二进行加权处理, 以计算出过渡包络信息; 其中, 所述第 二权重一为所述切换前 L帧语音频信号的高频带信号对应的切换前的包络 信息的权重值, 所述第二权重二为所述前 M帧包络信息的权重值; 其中, L大于等于 1 ; 以第一权重步长为单位减小所述第二权重一, 以第一权重步长为单位 增加所述第二权重二; 判断已设定好的第三权重一是否大于所述第一权重一; 如果所述第三权重一不大于所述第一权重一, 则根据已设定好的所述 第一权重一和所述第一权重二进行加权处理, 以计算出所述第一包络信息; 如果所述第三权重一大于所述第一权重一, 根据已设定好的第三权重 一和第三权重二进行加权处理, 以计算出所述第一包络信息; 其中, 所述 第三权重一为所述过渡包络信息的权重值, 所述第三权重二为所述预测的 包络信息的权重值; 以第二权重步长为单位减小所述第三权重一, 以第二权重步长为单位 增加所述第三权重二, 直至所述第三权重一等于零; 其中, 所述第一权重一和所述第一权重二的和为一, 所述第二权重一 和所述第二权重二的和为一, 所述第三权重一和所述第三权重二的和为一; 所述第三权重一的初始值大于所述第一权重一的初始值; 所述第一权重一 和所述第一权重二是固定的常数。 6、 根据权利要求 3所述的语音频信号切换方法, 其特征在于, 所述对 所述预测的包络信号和前 M帧语音频信号的第二高频带信号对应的前 M帧 包络信息进行加权处理, 以得到所述第一高频带信号对应的第一包络信息 具体为: 根据当前帧的所述第一低频带信号和前一帧的语音频信号的低频信 号, 计算所述第一低频带信号与所述前一帧的语音频信号的低频信号之间 的相关性系数; 判断所述相关性系数是否在给定的第二阀值范围内; 如果所述相关性系数不在所述第二阀值范围内, 则根据已设定好的第 一权重一和第一权重二进行加权处理, 以计算出所述第一包络信息; 其中, 所述第一权重一为所述前一帧的语音频信号的高频带信号对应的前一帧包 络信息的权重值, 所述第一权重二为所述预测的包络信息的权重值; 所述 第一权重一和所述第一权重二是固定的常数; 如果所述相关性系数在所述第二阀值范围内, 判断已设定好的第二权 重一是否大于所述第一权重一; 其中, 所述第二权重一为切换前一帧语音 频信号的高频带信号对应的切换前的包络信息的权重值, 如果所述第二权重一不大于所述第一权重一, 则根据已设定好的第一 权重一和第一权重二进行加权处理, 以计算出所述第一包络信息; 如果所述第二权重一大于所述第一权重一, 根据所述第二权重一和已 设定好的第二权重二进行加权处理, 以计算出所述第一包络信息; 其中, 所述第二权重二为所述预测的包络信息的权重值; 以第二权重步长为单位减小所述第二权重一, 以第二权重步长为单位 增加所述第二权重二; 其中, 所述第一权重一和所述第一权重二的和为一, 所述第二权重一 和所述第二权重二的和为一; 所述第二权重一的初始值大于所述第一权重 一的初始值。 7、 根据权利要求 3所述的语音频信号切换方法, 其特征在于, 所述将 处理后的所述第一高频带信号与所述当前帧语音频信号的第一低频带信号 合成宽频带信号具体为: 根据所述当前帧语音频信号与切换前一帧的语音频信号, 判断所述处 理后的第一高频带信号是否需要衰减; 如果不需要衰减, 将所述处理后的第一高频带信号与所述第一低频带 信号合成所述宽频带信号; 如果需要衰减, 判断处理后的所述第一高频带信号对应的衰减因子是 否大于所述阀值; 如果衰减因子不大于给定的阔值, 则将处理后的所述第一高频带信号 乘以阔值, 然后与所述第一低频带信号合成所述宽频带信号; 如果衰减因子大于给定的阔值, 则将处理后的所述第一高频带信号乘 以衰减因子后, 再与所述第一低频带信号合成所述宽频带信号; 修改所述衰减因子, 以使所述衰减因子减小; 其中, 所述衰减因子的初始值为一; 所述阀值小于一并大于等于零。 8、 根据权利要求 1或 2所述的语音频信号切换方法, 其特征在于, 当窄频带语音频信号向宽频带语音频信号切换时; 所述将当前帧语音频信号的第一高频带信号和前 M帧语音频信号的第 二高频带信号进行加权处理, 以得到处理后的第一高频带信号具体为: 根据已设定好的第四权重一和第四权重二进行加权处理, 以计算出处 理后的所述第一高频带信号; 其中, 所述第四权重一为所述第二高频带信 号的权重值, 所述第四权重二为所述第一高频带信号的权重值; 以第三权重步长为单位减小所述第四权重一, 以第三权重步长为单位 增加所述第四权重二, 直至所述第四权重一等于零; 其中, 所述第四权重 一和所述第四权重二的和为一。 9、 根据权利要求 1或 2所述的语音频信号切换方法, 其特征在于, 当 窄频带语音频信号向宽频带语音频信号切换时; 所述将当前帧语音频信号的第一高频带信号和前 M帧语音频信号的第 二高频带信号进行加权处理, 以得到处理后的第一高频带信号具体为: 根据已设定好的第五权重一和第五权重二进行加权处理, 以计算出所 述处理后的第一高频带信号; 其中, 所述第五权重一为已设定好的固定参 数的权重值, 所述第五权重二为所述第一高频带信号的权重值; 以第四权重步长为单位减小所述第五权重一, 以第四权重步长为单位 增加所述第五权重二, 直至所述第五权重一等于零; ; 其中, 所述第五权 重一和所述第五权重二的和为一; 其中, 所述固定参数为一个大于等于零并小于所述第一高频带信号能 量值的常数。 10、 一种语音频信号切换装置, 其特征在于, 包括: 处理模块, 用于当语音频信号出现切换时, 将当前帧语音频信号的第 一高频带信号和前 M帧语音频信号的第二高频带信号进行加权处理, 以得 到处理后的第一高频带信号; 其中, M大于等于 1 ; 第一合成模块, 用于将所述处理后的第一高频带信号与所述当前帧语 音频信号的第一低频带信号合成宽频带信号。 11、 根据权利要求 10所述的语音频信号切换装置, 其特征在于, 还包 括: 第二合成模块, 用于当语音频信号没有出现切换时, 将所述第一高频 带信号与所述第一低频带信号合成所述宽频带信号。 12、 根据权利要求 10或 11所述的语音频信号切换装置, 其特征在于, 当宽频带语音频信号向窄频带语音频信号切换时; 所述处理模块包括: 预测模块, 用于预测所述当前帧语音频信号的所述第一高频带信号对 应的预测的精细结构信息和预测的包络信息; 第一生成模块, 用于将所述预测的包络信息与所述前 M帧语音频信号 的第二高频带信号对应的前 M帧包络信息进行加权处理, 以得到所述第一 高频带信号对应的第一包络信息; 第二生成模块, 用于根据所述第一包络信息和所述预测的精细结构信 息, 生成所述处理后的第一高频带信号。 13、 根据权利要求 12所述的语音频信号切换装置, 其特征在于, 还包 括: 分类模块, 用于对所述当前帧语音频信号的第一低频带信号进行信号 分类; 所述预测模块还用于根据所述第一低频带信号对应的信号类型预测所 述预测的精细结构信息和所述预测的包络信息。 14、 根据权利要求 12所述的语音频信号切换装置, 其特征在于, 所述 第一合成模块包括: 第一判断模块, 用于根据所述当前帧语音频信号与切换前一帧的语音 频信号, 判断所述处理后的第一高频带信号是否需要衰减; 第三合成模块, 用于若所述第一判断模块得出处理后的所述第一高频 带信号不需要衰减, 将所述处理后的第一高频带信号与所述第一低频带信 号合成所述宽频带信号; 第二判断模块, 用于若所述第一判断模块得出处理后的所述第一高频 带信号需要衰减, 判断处理后的所述第一高频带信号对应的衰减因子是否 大于给定的阀值; 第四合成模块, 用于若所述第二判断模块得出所述衰减因子不大于所 述给定的阀值, 则将处理后的所述第一高频带信号乘以阔值, 然后与所述 第一低频带信号合成所述宽频带信号; 第五合成模块, 用于若所述第二判断模块得出所述衰减因子大于所述 给定的阀值, 则将处理后的所述第一高频带信号乘以衰减因子后, 再与所 述第一低频带信号合成所述宽频带信号; 第一修改模块, 用于修改所述衰减因子, 以使所述衰减因子减小; 其中, 所述衰减因子的初始值为一; 所述阀值小于一并大于等于零。 15、 根据权利要求 10或 11所述的语音频信号切换装置, 其特征在于, 当窄频带语音频信号向宽频带语音频信号切换时; 所述处理模块包括: 第一计算模块, 用于根据已设定好的第四权重一和第四权重二进行加 权处理, 以计算出处理后的所述第一高频带信号; 其中, 所述第四权重一 为所述第二高频带信号的权重值, 所述第四权重二为所述第一高频带信号 的权重值; 第二修改模块, 用于以第三权重步长为单位减小所述第四权重一, 以 第三权重步长为单位增加所述第四权重二, 直至所述第四权重一等于零; 其中, 所述第四权重一和所述第四权重二的和为一。 16、 根据权利要求 13所述的语音频信号切换装置, 其特征在于, 当窄 频带语音频信号向宽频带语音频信号切换时; 所述处理模块包括: 第二计算模块, 用于根据已设定好的第五权重一和第五权重二进行加 权处理, 以计算出所述处理后的第一高频带信号; 其中, 所述第五权重一 为已设定好的固定参数的权重值, 所述第五权重二为所述第一高频带信号 的权重值; 第三修改模块, 用于以第四权重步长为单位减小所述第五权重一, 以 第四权重步长为单位增加所述第五权重二, 直至所述第五权重一等于零; ; 其中, 所述第五权重一和所述第五权重二的和为一; 其中, 所述固定参数 为一个大于等于零并小于所述第一高频带信号能量值的常数。 |
本发明实施例涉及通信技术领域, 尤其涉及一种语音频信号切换方法 及装置。 背景技术
目前, 语音频信号在网络状态传输过程中, 由于网络状态的不同, 网 络会对从编码端传输到网络的语音频信号的码 流做不同码率的截断, 从而 解码端就会才艮据截断后的码流解码出不同带 宽的语音频信号。
在现有技术中, 由于网络中传输的语音频信号的带宽不同, 在语音频 信号传输过程中, 存在窄频带语音频信号向宽频带语音频信号切 换, 以及 宽频带语音频信号向窄频带语音频信号切换的 现象。 本发明中提到的窄频 带信号为通过上采样和低通滤波, 切换为只有低频带成分而高频带成分为 空的宽频带信号, 而宽频带语音频信号既有低频带信号成分又有 高频带信 号成分。 在实现本发明过程中, 发明人发现现有技术中至少存在如下问题: 由 于窄频带语音频信号与宽频带语音频信号之间 相差高频带信号中的信息, 在切换不同带宽的语音频信号时, 会出现音频信号能量激变的现象, 从而 会导致用户听觉上感到不舒服, 造成用户接听音频信号的质量变差。
发明内容
本发明实施例提供一种语音频信号切换方法及 装置, 实现平滑的进行 不同带宽的语音频信号切换, 以提高用户接听音频信号的质量。 本发明实施例提供一种语音频信号切换方法, 包括:
当语音频信号出现切换时, 将当前帧语音频信号的第一高频带信号和 前 M帧语音频信号的第二高频带信号进行加权处 , 以得到处理后的第一 高频带信号; 其中, M大于等于 1 ;
将所述处理后的第一高频带信号与所述当前帧 语音频信号的第一低频 带信号合成宽频带信号。
本发明实施例提供一种音频信号切换装置, 包括:
处理模块, 用于当语音频信号出现切换时, 将当前帧语音频信号的第 一高频带信号和前 M帧语音频信号的第二高频带信号进行加权处 , 以得 到处理后的第一高频带信号; 其中, M大于等于 1 ;
第一合成模块, 用于将所述处理后的第一高频带信号与所述当 前帧语 音频信号的第一低频带信号合成宽频带信号。 本发明实施例的语音频信号切换方法及装置, 通过根据前 M帧的语音 频信号的第二高频带信号对当前帧语音频信号 的第一高频带信号进行处 理, 以使前 M帧的语音频信号的第二高频带信号能平滑过 到处理后的第 一高频带信号, 并将处理后的第一高频带信号与第一低频带信 号合成宽频 带信号, 从而在切换不同带宽的语音频信号过程中, 能够平滑的进行不同 带宽的语音频信号切换, 减小了能量激变造成语音频信号的主观听觉质 量 差的影响, 提高了用户接听语音频信号的质量。 附图说明
为了更清楚地说明本发明实施例或现有技术中 的技术方案, 下面将对 实施例或现有技术描述中所需要使用的附图作 一简单地介绍, 显而易见地, 下面描述中的附图是本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1为本发明语音频信号切换方法实施例一流程 ; 图 2为本发明语音频信号切换方法实施例二流程 ;
图 3为图 2中步骤 201—个实施例的流程图;
图 4为图 3中步骤 302—个实施例的流程图;
图 5为图 3中步骤 302另一个实施例的流程图二;
图 6为图 2中步骤 202—个实施例的流程图;
图 7为图 2中步骤 201另一个实施例的流程图二;
图 8为图 2中步骤 201另一个实施例的流程图三;
图 9为本发明语音频信号切换装置实施例一的结 示意图;
图 10为本发明语音频信号切换装置实施例二的结 示意图;
图 11为本发明语音频信号切换装置实施例二中的 理模块的结构示意 图一;
图 12为本发明语音频信号切换装置实施例二中的 一模块的结构示意 图;
图 13a为本发明语音频信号切换装置实施例二中的 处理模块的结构示 意图二; 图 13b为本发明语音频信号切换装置实施例二中的 处理模块的结构示 意图三。 具体实施方式
为使本发明实施例的目的、 技术方案和优点更加清楚, 下面将结合本 发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完整地描 述, 显然, 所描述的实施例是本发明一部分实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人员在没有作出创造性劳动前 提 下所获得的所有其他实施例, 都属于本发明保护的范围。
图 1为本发明语音频信号切换方法实施例一流程 。 如图 1所示, 本 实施例语音频信号切换方法, 当语音频信号出现切换时, 对切换帧之后的 每一帧采用如下方式进行处理:
步骤 101、 当语音频信号出现切换时, 将当前帧语音频信号的第一高频 带信号和前 M帧语音频信号的第二高频带信号进行加权处 , 以得到处理 后的第一高频带信号; 其中, M大于等于 1。
步骤 102、将处理后的第一高频带信号与当前帧语音 频信号的第一低频 带信号合成宽频带信号。
本发明提供的实施例中的前 M帧语音频信号指当前帧之前的 M帧语音 频信号。 切换前 L帧语音频信号指出现语音频信号切换时切换 之前的 L 帧语音频信号。 当前语音帧为宽频带信号而前一帧语音帧为窄 频带信号; 或者当前语音帧为窄频带信号而前一帧语音帧 为宽频带信号, 则语音频信 号出现切换, 当前语音帧为切换帧。
本发明实施例的语音频信号切换方法, 通过根据前 M帧语音频信号中 的第二高频带信号对当前帧语音频信号中的第 一高频带信号进行处理, 以 使的前 M帧语音频信号中的第二高频带信号能平滑的 渡到处理后的第一 高频带信号, 从而在切换不同带宽的语音频信号过程中, 使不同带宽的语 音频信号的高频带信号能够平滑的过渡切换; 最后, 处理后的第一高频带 信号与第一低频带信号合成宽频带信号, 将该宽频带信号传输到用户终端, 使用户享受到高质量的语音频信号。 本实施例语音频信号切换方法能够平 滑的进行不同带宽的语音频信号切换, 减小了能量激变造成语音频信号的 主观听觉质量差的影响, 提高了用户接听语音频信号的质量。
图 2为本发明语音频信号切换方法实施例二流程 。 如图 2所示, 本 实施例语音频信号切换方法, 包括:
步骤 200、 当语音频信号没有出现切换时, 将当前帧语音频信号的第一 高频带信号与第一低频带信号合成宽频带信号 。
具体的, 本实施例中的第一频带语音频信号可以是宽频 带语音频信号 或者是窄频带语音频信号。 在语音频信号的传输过程中, 当第一频带语音 频信号不发生切换时, 分以下两种情况进行处理: 一、 若第一频带语音频 信号为宽频带语音频信号时, 则将宽频带语音频信号中的低频带信号和高 频带信号合成宽频带信号; 二、 若第一频带语音频信号为窄频带语音频信 号时, 则将窄频带语音频信号中的低频带信号和高频 带信号合成宽频带信 号, 此时, 虽然为宽频带信号, 但高频带是空, 没有信息。
步骤 201、 当语音频信号出现切换时, 将当前帧语音频信号的第一高频 带信号和前 M帧语音频信号的第二高频带信号进行加权处 , 以得到处理 后的第一高频带信号。 其中, M大于等于 1。
具体的, 当出现不同带宽的语音频信号进行切换时, 根据前 M帧语音 频信号的第二高频带信号, 对当前帧语音频信号的第一高频带信号进行处 理, 以使得前 M帧语音频信号的第二高频带信号能平滑过渡 处理后的第 一高频带信号, 例如, 当宽频带语音频信号切换到窄频带语音频信号 , 由 于窄频带语音频信号对应的的高频带信号为空 , 因此为了使宽频带语音频 信号平滑切换到窄频带语音频信号, 需要恢复窄频带语音频信号对应的的 高频带信号的成分, 而当窄频带语音频信号切换到宽频带语音频信 号, 由 于宽频带语音频信号中的高频带信号不为空, 因此为了使窄频带语音频信 号平滑切换到宽频带语音频信号, 需要减弱切换后连续多帧宽频带语音频 信号中的高频带信号的能量, 使得宽频带语音频信号的高频带信号逐渐过 渡到真实的高频带信号。 通过步骤 201 对当前帧语音频信号进行处理, 使 得不同带宽的语音频信号中的高频带信号能够 平滑的进行过渡, 解决了宽 频带语音频信号与窄频带语音频信号之间进行 切换时, 由于能量激变而造 成用户的听觉不舒适, 从而使用户接收到高质量的音频信号。 其中, 为了 简化得到处理后的第一高频带信号的过程, 可以将第一高频带信号与前 M 帧语音频信号的第二高频带信号直接进行加权 处理, 处理后获得的结果即 为处理后的第一高频带信号。
步骤 202、将处理后的第一高频带信号与当前帧语音 频信号的第一低频 带信号合成宽频带信号。
具体的, 当前帧语音频信号通过步骤 201处理后, 使前 M帧语音频信 号的第二高频带信号能够平滑的过渡到当前帧 的处理后的第一高频带信 号, 然后通过步骤 202将处理后的第一高频带信号与当前帧语音频 信号的 第一低频带信号合成宽频带信号, 使用户接收到的语音频信号均为宽频带 语音频信号, 实现了不同带宽的语音频信号平稳的切换, 有利于提高用户 接听音频信号的质量。
本发明实施例的语音频信号切换方法, 通过根据前 M帧语音频信号的 第二高频带信号对当前帧语音频信号中的第一 高频带信号进行处理, 以使 的前 M帧语音频信号的第二高频带信号能平滑的过 到处理后的第一高频 带信号, 从而在切换不同带宽的语音频信号过程中, 使不同带宽的语音频 信号的高频带信号能够平滑的过渡切换; 最后, 处理后的第一高频带信号 与第一低频带信号合成宽频带信号, 该宽频带信号传输到用户终端, 使用 户享受到高质量的语音信号。 本实施例语音频信号切换方法能够平滑的进 行不同带宽的语音频信号切换, 减小了能量激变造成音频信号的主观听觉 质量差的影响, 提高了用户接听音频信号的质量。 另外, 通过在不发生不 同带宽的语音频信号切换时, 将当前帧语音频信号的第一高频带信号和第 一低频带信号合成宽频带信号, 使用户获得高质量的音频信号。
基于上述技术方案, 可选的, 当宽频带语音频信号向窄频带语音频信 号转换时, 如图 3所示, 本实施例中的步骤 201包括:
步骤 301、预测第一高频带信号对应的预测的精细结 构信息和预测的包 络信息。
具体的, 语音频信号可以分解为精细结构信息和包络信 息两部分, 从 而可以根据精细结构信息和包络信息恢复语音 频信号。 在由宽频带语音频 信号切换到窄频带语音频信号的过程中, 由于窄频带语音频信号中只有低 频带信号, 其对应的高频带信号为空, 为了使宽频带语音频信号能够平滑 的切换到窄频带语音频信号, 需要恢复出当前的窄频带语音频信号所需要 的高频带信号, 以实现语音频信号的平滑切换。 本实施例中的步骤 301 将 预测窄频带语音频信号中的第一高频带信号对 应的预测的精细结构信息和 预测的包络信息。
为了更加准确的预测当前帧语音频信号对应的 预测的精细结构信息和 预测的包络信息, 步骤 301 还可以对当前帧语音频信号的第一低频带信号 进行信号分类; 再根据第一低频带信号对应的信号类型预测第 一高频带信 号对应的预测的精细结构信息和预测的包络信 息。 例如, 当前帧的窄频带 语音频信号可以为谐波信号、 或非谐波信号或瞬态信号等信息类型, 则可 以根据窄频带语音频信号对应的信息类型, 得知该种类型的信号应具有的 精细结构信息和包络信息, 从而更加准确的预测当前帧的高频带信号对应 的精细结构信息和包络信息。 其中, 本发明语音频信号切换方法对窄频带 语音频信号的信号类型不做限制。
步骤 302、 将预测的包络信号和前 M帧语音频信号的第二高频带信号 对应的前 M帧包络信息进行加权处理, 以得到第一高频带信号对应的第一 包洛信息。
具体的, 在步骤 301 预测当前帧的第一高频带信号对应的预测的精 细 结构信息和预测的包络信息后, 可以根据预测的包络信息和前 M帧语音频 信号的第二高频带信号对应的前 M帧包络信息, 生成第一高频带信号对应 的第一包洛信息。
具体而言, 步骤 302 中生成第一高频带信号对应的第一包络信息的 过 程可以通过如下两种方式实现, 具体如下:
方式一, 如图 4所示, 通过步骤 302获得第一包络信息的一个实施例 可以包括:
步骤 401、 根据第一低频带信号和前 N帧的语音频信号的低频带信号, 计算第一低频带信号与前 N帧的语音频信号的低频带信号之间的相关性 数; 其中, N大于等于 1。
具体的, 对当前帧语音频信号的第一低频带信号与前 N帧的语音频信 号的低频带信号进行比较, 以得出当前帧语音频信号的第一低频带信号与 前 N帧的语音频信号的低频带信号之间的相关性 数, 例如, 可以通过判 断当前帧语音频信号的第一低频带信号中的某 频段信息, 与前 N帧的语音 频信号的低频带信号的相同频段信息的能量大 小或信息类型的差异等, 确 定它们之间的相关性, 以计算得出所要的相关性系数。 其中, 前 N帧的语 音频信号可以为窄频带语音频信号、 宽频带语音频信号或者窄频带语音频 信号和宽频带语音频信号组成的混合信号。
步骤 402、 判断相关性系数是否在给定的第一阀值范围内 。
具体的, 在步骤 401 计算出相关性系数后, 判断该相关性系数是否在 给定的阀值范围内。 计算相关性系数的作用是为了得知当前帧语音 频信号 是从前 N帧的语音频信号渐变过来的还是突变过来的 也就是说看它们的 特性是否相同, 进而判断预测当前帧语音频信号的高频带信号 时前面帧的 高频带信号所占的权重。 例如, 如果当前帧语音频信号的第一低频带信号 与前一帧的语音频信号的低频带信号能量相当 , 且类型相同, 则说明前一 帧的语音频信号与当前帧语音频信号有较高的 相关性, 因此, 为了准确的 恢复当前帧语音频信号对应的第一包络信息, 恢复当前帧语音频信号对应 的第一包络信息时, 前一帧的语音频信号对应的高频带包络信息或 过渡的 包络信息占较大的权重; 否则, 如果当前帧语音频信号的第一低频带信号 与前一帧的语音频信号的低频带信号能量相差 很大, 且类型不同, 则说明 前一帧的语音频信号与当前帧语音频信号有较 低的相关性, 因此, 为了准 确的恢复当前帧语音频信号对应的第一包络信 息, 恢复当前帧语音频信号 对应的第一包络信息时, 前一帧的语音频信号对应的高频带包络信息或 过 渡的包络信息占较小的权重;
步骤 403、如果相关性系数不在给定的第一阀值范围 内, 则根据已设定 好的第一权重一和第一权重二进行加权处理, 以计算出第一包络信息。 其 中, 第一权重一为前一帧语音频信号的高频带信号 对应的前一帧包络信息 的权重值, 第一权重二为包络信息的权重值。
具体的, 当步骤 402得出相关性系数不在给定的第一阀值范围内 时, 则可以得知当前帧语音频信号与前 N帧语音频信号有较小的相关性,所以, 前 M帧的第一频带语音频信号对应的前 M帧包络信息或过渡的包络信息或 前一帧的语音频信号对应的高频带包络信息对 第一包络信息影响较小, 在 恢复当前帧语音频信号对应的第一包络信息时 , 前 M帧的第一频带语音频 信号对应的前 M帧包络信息或过渡的包络信息或前一帧的语 频信号对应 的高频带包络信息占的权重较小。 因此, 根据已设定好的第一权重一和第 一权重二, 便可以计算出当前帧的第一包络信息。 其中, 第一权重一为前 一帧语音频信号的高频带信号对应的包络信息 的权重值, 该前一帧语音频 信号可以是宽频带语音频信号或者是已处理过 的窄频带语音频信号, 当第 一次切换时, 前一帧语音频信号即为宽频带语音频信号; 而第一权重二为 预测的包络信息的权重值。 将预测的包络信息与第一权重二的乘积, 加上 前一帧的包络信息与第一权重一的乘积之和, 所求得的加权之和为当前帧 的第一包络信息。 另外, 以后传输的语音频信号都按此方式和权重, 恢复 该语音频信号对应的第一包络信息, 直到语音频信号再次发生切换。
步骤 404、如果相关性系数在第一阀值范围内,根据 已设定好的第二权 重一和第二权重二进行加权处理, 以计算出过渡包络信息。 其中, 第二权 重一为切换前的包络信息的权重值, 第二权重二为前 M帧包络信息的权重 值; 其中, L大于等于 1。
具体的, 当步骤 402得出相关性系数在给定的阀值范围内时, 则可以 得知当前帧语音频信号与前连续 N帧的语音频信号特性相似, 当前帧语音 频信号对应的第一包络信息受前连续 N帧的语音频信号的包络信息影响较 大, 同时考虑到前 M帧包络的真实性, 因此, 需要根据前 M帧包络信息和 切换前的包络信息求解当前帧语音频信号对应 的过渡包络信息, 在恢复当 前帧语音频信号的第一包络信息时, 让前 M帧包络信息和切换前 L帧的包 络信息占较大的权重; 再通过过渡包络信息求解第一包络信息。 其中, 第 二权重一为切换前的包络信息的权重值, 而第二权重二为前 M帧包络信息 的权重值。 则切换前的包络信息与第二权重一的乘积, 加上前 M帧包络信 息与第二权重二的乘积之和, 所求得的加权值即为过渡包络信息。
步骤 405、 以第一权重步长为单位减小第二权重一, 以第一权重步长为 单位增加第二权重二。
具体的, 随着语音频信号的传输, 后续的窄频带语音频信号受切换前 的宽频带语音频信号的影响逐渐变小, 为了使计算得出的第一包络信息更 加准确, 需要对第二权重一和第二权重二进行适用性的 调整。 由于后续的 音频信号受切换前 L帧的宽频带语音频信号的影响逐渐变小, 因此, 第二 权重一的数值逐渐变小, 而第二权重二的数值逐渐增大, 从而减弱切换前 的包络信息对第一包络信息的影响。 其中, 步骤 405对第二权重一和第二 权重二进行修改可以通过如下方法: 新的第二权重一等于旧的第二权重一 减去第一权重步长, 新的第二权重二等于旧的第二权重二加上第一 权重步 长; 其中, 第一权重步长为已设定好的值。
步骤 406、 判断已设定好的第三权重一是否大于第一权重 一。
具体的, 第三权重一为过渡包络信息的权重值, 通过比较第三权重一 与第二权重一的大小, 可以得知当前帧的第一包络信息受过渡包络信 息的 影响大小。 其中, 过渡包络信息中由前 M帧包络信息和切换前的包络信息 计算而来, 因此, 第三权重一实际上代表了第一包络信息受切换 前的包络 信息的影响程度。
步骤 407、如果第三权重一不大于第一权重一, 则根据已设定好的第一 权重一和第一权重二进行加权处理, 以计算出所述第一包络信息。
具体的, 在步骤 406判断得知第三权重一小于等于第一权重一时 , 说 明当前帧语音频信号离切换前 L帧的语音频信号较远, 第一包络信息主要 受前 M帧包络信息的影响, 因此, 根据已设定好的第一权重一和第一权重 二, 便可以计算出当前帧的第一包络信息。
步骤 408、如果第三权重一大于第一权重一,根据已 设定好的第三权重 一和第三权重二进行加权处理, 以计算出第一包络信息。 其中, 第三权重 一为过渡包络信息的权重值, 第三权重二为预测的包络信息的权重值。
具体的, 在步骤 406判断得知第三权重一大于第一权重一时, 说明当 前帧语音频信号离切换前 L帧语音频信号较近, 第一包络信息受切换前的 包络信息影响较大, 因此, 需要根据过渡包络信息求解当前帧的第一包络 信息。 其中, 第三权重一为过渡包络信息的权重值, 而第三权重二为预测 的包络信息的权重值。 则过渡包络信息与第三权重一的乘积, 加上预测的 包络信息与第三权重二的乘积之和所求得的加 权值即为第一包络信息。
步骤 409、 以第二权重步长为单位减小第三权重一, 以第二权重步长为 单位增加第三权重二, 直至第三权重一等于零。
具体的, 步骤 409中修改第三权重一和第三权重二的目的, 与步骤 405 中修改第二权重一和第二权重二的目的相同, 都是为了在后续传输的语音 频信号受切换前 L帧语音频信号的影响逐渐变小的情况下, 为了使计算得 出的第一包络信息更加准确, 对第三权重一和第三权重二进行适用性的调 整。 由于后续的音频信号受切换前 L帧语音频信号的影响逐渐变小, 因此, 第三权重一的数值逐渐变小, 而第三权重二的数值逐渐增大, 从而也实现 了减弱切换前的包络信息对第一包络信息的影 响。 其中, 步骤 409对第三 权重一和第三权重二进行修改可以通过如下方 法: 新的第三权重一等于旧 的第三权重一减去第二权重步长, 新的第三权重二等于旧的第三权重二加 上第二权重步长; 其中, 第二权重步长为已设定好的值。
第一权重一和第一权重二的和为一, 第二权重一和第二权重二的和为 一, 第三权重一和第三权重二的和为一; 第三权重一的初始值大于第一权 重一的初始值; 第一权重一和第一权重二是固定的常数。 具体的, 本实施 例中的权重一和权重二, 实际上代表了切换前的包络信息和前 M帧包络信 息组成当前帧的第一包络信息时所占的百分比 。 对于当前帧语音频信号, 离切换前 L帧的语音频信号越近且相关性较大时, 切换前的包络信息所占 的百分比就越高, 而相反的前 M帧包络信息所占的百分比就越低。 在当前 帧语音频信号离切换前 L帧的语音频信号较远时, 说明网络中已经稳定的 传输语音频信号, 或者当前帧语音频信号与切换前 L帧语音频信号相关性 较低时, 说明当前帧语音频信号特性已发生改变, 因此, 当前帧语音频信 号受切换前 L帧的语音频信号影响较小, 切换前的包络信息所占的百分比 就越低。
另夕卜, 本实施例中的步骤 404和步骤 405的执行顺序可以互换, 即可 以先修改第二权重一和第二权重二, 再根据第二权重一和第二权重二, 计 算出过渡包络信息。 同样的, 本实施例中的步骤 408和步骤 409的执行顺 序可以互换, 即可以先修改修改第三权重一和第三权重二, 再根据修改第 三权重一和第三权重二, 计算出第一包络信息。
方式二, 如图 5所示, 通过步骤 302获得第一包络信息的另一个实施 例还可以包括:
步骤 501、根据当前帧语音频信号的第一低频带信号 和前一帧的语音频 信号的低频信号, 计算第一低频带信号与前一帧的语音频信号的 低频信号 之间的相关性系数。
具体的, 为了更加准确的得出第一包络信息, 求解当前帧语音频信号 的第一低频带信号某频段和前一帧的语音频信 号的低频信号相同频段的能 量的关系。 本实施例可以以 "corr" 代表相关性系数, 通过当前帧语音频信 号的第一低频带信号与前一帧的语音频信号的 低频带信号相同频段的能量 关系, 得出当前帧语音频信号的第一低频带信号与前 一帧的语音频信号的 低频带信号之间的相关性系数 corr, 能量相差越小, corr越大, 否则, corr 越小。 具体过程可以参见步骤 401中关于前 N帧的语音频信号相关性计算 的介绍。
步骤 502、 判断相关性系数是否在给定的第二阀值范围内 。
具体的, 在步骤 501计算出 corr的值后, 判断计算出的 corr是否在给 定的第二阀值范围内。 例如, 本实施例可以将第二阀值范围用 cl〜c2代表。
步骤 503、如果相关性系数不在第二阀值范围内, 则根据已设定好的第 一权重一和第一权重二进行加权处理, 以计算出第一包络信息。 其中, 第 一权重一为前一帧的语音频信号的高频带信号 对应的前一帧包络信息的权 重值, 第一权重二为预测的包络信息的权重值; 第一权重一和第一权重二 是固定的常数。
具体的, 当步骤 502得出 corr小于 cl或大于 c2时, 得知当前帧语音 频信号对应的第一包络信息受切换前一帧语音 频信号的包络信息影响较 小, 因此, 根据已设定好的第一权重一和第一权重二, 便可以计算出当前 帧的第一包络信息。 预测的包络信息与第一权重二的乘积, 加上前一帧包 络信息与第一权重一的乘积之和, 所求得的加权和即为当前帧的第一包络 信息。 另外, 以后传输的窄带语音频信号都按此方式和权重 恢复该窄带语 音频信号对应的第一包络信息, 直到不同带宽的语音频信号再次发生切换。 例如: 本实施例中的第一权重一可以用 al代表、 第一权重二可以用 bl代 表、 前一帧包络信息可以用 pre_fenv代表、 预测的包络信息可以用 fenv代 表、 第一包络信息可以用 cur_fenv代表。 则步骤 503可以利用以下公式表 示: cur_fenv=pre_fenv *a 1 +fenv *b 1。
步骤 504、如果相关性系数在第二阀值范围内, 判断已设定好的第二权 重一是否大于第一权重一。 其中, 第二权重一为切换前一帧语音频信号的 高频带信号对应的切换前的包络信息的权重值 ,
具体的,如果 cl<corr<c2,则通过比较第二权重一与第一 重一的大小, 可以得知当前帧的第一包络信息受切换前的包 络信息和前一帧包络信息的 影响程度。
步骤 505、如果第二权重一不大于第一权重一, 则根据已设定好的第一 权重一和第一权重二, 计算出第一包络信息。
具体的, 在步骤 504判断得知第二权重一小于第一权重一时, 说明当 前帧语音频信号离切换前一帧的语音频信号较 远, 第一包络信息受切换前 的包络信息的影响较小, 因此, 根据已设定好的第一权重一和第一权重二, 便可以计算出当前帧的第一包络信息。 则步骤 505可以利用以下公式表示: cur_fenv=pre_fenv *a 1 +fenv*b 1。
步骤 506、如果第二权重一大于第一权重一,根据第 二权重一和已设定 好的第二权重二进行加权处理, 以计算出第一包络信息。 其中, 第二权重 二为预测的包络信息的权重值。 例如: 第二权重一可以用 a2代表, 第二权 重二可以用 b2代表。
具体的, 在步骤 504判断得知第二权重一大于第一权重一时, 说明当 前帧语音频信号离切换前一帧的第一频带语音 频信号较近, 第一包络信息 受切换前一帧语音频信号对应的切换前的包络 信息影响较大。 因此, 根据 已设定好的第二权重一和第二权重二, 便可以计算出当前帧的第一包络信 息。 则预测的包络信息与第二权重二的乘积, 加上切换前的包络信息与第 二权重一的乘积之和, 所求得的加权和即为当前帧的第一包络信息。 其中, 切换前的包络信息可以用 con_fenv代表, 则步骤 506可以利用以下公式表 示: cur_fenv=con_fenv*a2+fenv*b2。
步骤 507、 以第二权重步长为单位减小第二权重一, 以第二权重步长为 单位增加第二权重二。
具体的, 随着语音频信号的传输, 后续的当前帧语音频信号受切换前 一语音频信号的影响逐渐变小, 为了使计算得出的第一包络信息更加准确, 需要对第二权重一和第二权重二进行适用性的 调整。 由于后续的音频信号 受切换前一帧语音频信号的影响逐渐变小; 而靠近当前帧语音频信号的前 一帧语音频信号的影响变大。 因此, 第二权重一的数值逐渐变小, 而第二 权重二的数值逐渐增大, 从而减弱切换前的包络信息对第一包络信息的 影 响, 而增强预测的包络信息对第一包络信息的影响 。 其中, 步骤 507对第 二权重一和第二权重二进行修改可以通过如下 方法: 新的第二权重一等于 旧的第二权重一减去第一权重步长, 新的第二权重二等于旧的第二权重二 加上第一权重步长; 其中, 第一权重步长为已设定好的值。
其中, 第一权重一和第一权重二的和为一, 第二权重一和第二权重二 的和为一; 第二权重一的初始值大于第一权重一的初始值 。
步骤 303、根据第一包络信息和预测的精细结构信息 , 生成处理后的第 一高频带信号。
具体的, 通过步骤 302得出当前帧的第一包络信息后, 可以根据第一 包络信息和预测的精细结构信息, 生成所需要的处理后的第一高频带信号, 从而使第二高频带信号能平滑过渡到处理后的 第一高频带信号。
本实施例语音频信号切换方法, 在语音频信号发生从宽频带语音频信 号向窄频带语音频信号切换的过程中, 通过预测的精细结构信息和第一包 络信息获得当前帧的处理后的第一高频带信号 , 从而能够使切换前的宽频 带语音频信号的第二高频带信号能够平滑的过 渡到窄频带语音频信号所对 应的处理后的第一高频带信号, 更有利于提高用户接听音频信号的质量。
基于上述技术方案, 可选的, 如图 6所示, 本实施例中的步骤 202包 括:
步骤 601、根据当前帧语音频信号与切换前一帧的语 音频信号, 判断处 理后的第一高频带信号是否需要衰减。
具体的, 由于窄带语音频信号的第一高频带信号为空, 在宽频带语音 频信号切换到窄频带语音频信号的过程中, 为了防止恢复出的窄频带语音 频信号对应的处理后的第一高频带信号带来不 好的影响, 在由窄频带语音 频信号扩展为宽频带信号的帧数达到给定的帧 数后, 将处理后的第一高频 带信号的能量逐帧进行衰减, 直到衰减系数达到给定的阔值。 通过当前帧 语音频信号与切换前一帧的语音频信号, 可以得知当前帧语音频信号与切 换前一帧的语音频信号之间的间隔时间, 例如, 可以通过计数器记录窄频 带语音频信号传输的帧数, 此帧数可以为已预定好的大于等于 0的值。
步骤 602、如果不需要衰减,将处理后的第一高频带 信号与第一低频带 信号合成宽频带信号。
具体的, 如果步骤 601 判断得出处理后的第一高频带信号无需进行衰 减, 则直接将处理后的第一高频带信号与第一低频 带信号合成宽频带信号。
步骤 603、如果需要衰减, 判断处理后的第一高频带信号对应的衰减因 子是否大于阀值。
具体的, 衰减因子的初始值为一; 阀值小于一并大于等于零。 如果步 骤 601 判断得出处理后的第一高频带信号需要进行衰 减, 则通过步骤 603 判断处理后的第一高频带信号对应的衰减因子 是否大于给定的阀值。
步骤 604、如果衰减因子不大于给定的阔值, 则将处理后的第一高频带 信号乘以阔值, 然后与第一低频带信号合成宽频带信号。
具体的, 如果步骤 603得出衰减因子的值不大于给定的阀值时, 说明 处理后的第一高频带信号的能量已经衰减到一 定的程度, 处理后的第一高 频带信号已经不会带来不好的影响, 以后就可以保持此衰减比例。 则将处 理后的第一高频带信号乘以阔值, 然后与第一低频带信号合成宽频带信号。
步骤 605、如果衰减因子大于给定的阔值, 则将处理后的第一高频带信 号乘以衰减因子后, 再与第一低频带信号合成宽频带信号。
具体的, 如果步骤 603得出衰减因子的值大于给定的阀值时, 则说明 在此衰减因子时, 处理后的第一高频带信号还有可能引起不好的 听觉影响, 还需要继续衰减, 直到给定的阀值。 则将处理后的第一高频带信号乘以衰 减因子后, 再与第一低频带信号合成宽频带信号。
步骤 606、 修改衰减因子, 以使衰减因子减小。 具体的, 随着语音频信号的传输, 后续的窄带语音频信号受切换前的 语音频信号的影响逐渐变小, 相对应的, 衰减因子也应该逐渐变小。
基于上述技术方案, 可选的, 当窄频带语音频信号向宽频带语音频信 号切换时, 如图 7所示, 本实施例中通过步骤 201获得处理后的第一高频 带信号的一个实施例包括:
步骤 701、根据已设定好的第四权重一和第四权重二 进行加权处理, 以 计算出处理后的第一高频带信号。 其中, 第四权重一为第二高频带信号的 权重值, 第四权重二为当前帧语音频信号的第一高频带 信号的权重值。
具体的, 在由窄频带语音频信号切换到宽频带语音频信 号的过程中, 由于宽频带语音频信号中的高频带信号不为空 , 而窄频带语音频信号对应 的高频带信号为空或者处理后的高频带信号, 为了使窄频带语音频信号能 够平滑的切换到宽频带语音频信号, 需要对宽频带语音频信号中的高频带 信号进行能量衰减, 以实现语音频信号的平滑的进行切换。 通过第二高频 带信号与第四权重一的乘积, 加上第一高频带信号与第四权重二的乘积之 和, 所求得的加权值即为处理后的第一高频带信号 。
步骤 702、 以第三权重步长为单位减小第四权重一, 以第三权重步长为 单位增加第四权重二, 直至第四权重一等于零。 其中, 第四权重一和第四 权重二的和为一。
具体的, 随着语音频信号的传输, 后续的宽频带语音频信号受切换前 的窄频带语音频信号的影响逐渐变小。 因此, 第四权重一逐渐变小, 而第 四权重二逐渐增大, 直至第四权重一变为零, 而第四权重二变为一, 即传 输的语音频信号一直为宽频带语音频信号。
同样的, 如图 8所示, 本实施例中通过步骤 201获得处理后的第一高 频带信号的另一个实施例还可以包括:
步骤 801、根据已设定好的第五权重一和第五权重二 进行加权处理, 以 计算出处理后的第一高频带信号。 其中, 第五权重一为已设定好的固定参 数的权重值, 第五权重二为当前帧语音频信号的第一高频带 信号的权重值。 具体的, 由于窄频带语音频信号的第一高频带信号为空 , 因此可以设 定一固定参数来代替窄频带语音频信号的高频 带信号, 其中, 该固定参数 为一个大于等于零小于第一高频带信号能量的 常数。 通过固定参数与第五 权重一的乘积, 加上第一高频带信号与第五权重二的乘积之和 , 所求得的 加权值即为处理后的第一高频带信号。
步骤 802、 以第四权重步长为单位减小第五权重一, 以第四权重步长为 单位增加第五权重二, 直至第五权重一等于零; 其中, 第五权重一和第五 权重二的和为一。
具体的, 随着语音频信号的传输, 后续的宽频带语音频信号受切换前 的窄频带语音频信号的影响逐渐变小。 因此, 第五权重一逐渐变小, 而第 五权重二逐渐增大, 直至第五权重一变为零, 而第五权重二变为一, 即传 输的语音频信号一直为真实的宽频带语音频信 号。
本实施例语音频信号切换方法, 在语音频信号发生从窄频带语音频信 号向宽频带语音频信号切换的过程中, 通过对宽频带语音频信号的高频带 信号进行衰减处理得到处理后的高频带信号, 从而能够使切换前的窄频带 语音频信号对应的高频带信号能够平滑的过渡 到宽频带语音频信号所对应 的处理后的高频带信号, 更有利于提高用户接听音频信号的质量。
其中, 本实施例中的包络信息还可以通过能够代表高 频带信号的其他 参数代替, 例如: 线性预测编码 (Linear Predictive Coding, 以下简称: LPC) 参数, 或幅度参数等。
本领域普通技术人员可以理解: 实现上述方法实施例的全部或部分步 骤可以通过程序指令相关的硬件来完成, 前述的程序可以存储于一计算机 可读取存储介质中, 该程序在执行时, 执行包括上述方法实施例的步骤; 而前述的存储介质包括: ROM、 RAM, 磁碟或者光盘等各种可以存储程序 代码的介质。 图 9为本发明语音频信号切换装置实施例一的结 示意图。 如图 9所 示, 本实施例音频信号切换装置, 包括: 处理模块 91和第一合成模块 92。
处理模块 91用于当语音频信号出现切换时, 将当前帧语音频信号的第 一高频带信号和前 M帧语音频信号的第二高频带信号进行加权处 , 以得 到处理后的第一高频带信号。 其中, M大于等于 1。
第一合成模块 92用于将处理后的第一高频带信号与当前帧语 频信号 的第一低频带信号合成宽频带信号。
本发明实施例的语音频信号切换装置, 通过处理模块根据前 M帧语音 频信号中的第二高频带信号对当前帧语音频信 号中的第一高频带信号进行 处理, 以使的第二高频带信号能平滑的过渡到处理后 的第一高频带信号, 从而在切换不同带宽的语音频信号过程中, 使不同带宽的语音频信号的高 频带信号能够平滑的过渡切换; 最后, 处理后的第一高频带信号与第一低 频带信号通过第一合成模块合成宽频带信号, 将该宽频带信号传输到用户 终端, 使用户享受到高质量的语音频信号。 本实施例语音频信号切换方法 能够平滑的进行不同带宽的语音频信号切换, 减小了能量激变造成语音频 信号的主观听觉质量差的影响, 提高了用户接听语音频信号的质量。
图 10为本发明语音频信号切换装置实施例二的结 示意图。 如图 10 所示, 本实施例音频信号切换装置基于上述音频信号 切换装置实施例一, 其区别在于: 本实施例音频信号切换装置还包括: 第二合成模块 103。
第二合成模块 103 用于当语音频信号没有出现切换时, 将第一高频带 信号与第一低频带信号合成宽频带信号。
本实施例音频信号切换装置, 通过设置第二合成模块, 可以在不发生 不同带宽的语音频信号切换的前提下, 由第二合成模块将当前帧的第一频 带语音频信号中的第一低频带信号和第一高频 带信号合成宽频带信号, 从 而有利于提高用户接听语音频信号的质量。
基于上述技术方案, 可选的, 当宽频带语音频信号向窄频带语音频信 号切换时, 如图 10和图 11所示, 本实施例中的处理模块 101包括: 预测模块 1011用于预测第一高频带信号对应的预测的精 结构信息和 预测的包络信息。
第一生成模块 1012用于根据预测的包络信息和前 M帧语音频信号的第 二高频带信号对应的前 M帧包络信息进行加权处理, 以得到第一高频带信 号对应的第一包络信息。
第二生成模块 1013用于根据第一包络信息和预测的精细结构 息, 生 成处理后的第一高频带信号。
更进一步的, 本实施例音频信号切换装置可以还包括: 分类模块 1010, 用于对当前帧语音频信号的第一低频带信号进 行信号分类; 而预测模块 1011还用于根据第一低频带信号对应的信号类 预测当前帧语音频信号的 第一低频带信号对应的预测的精细结构信息和 预测的包络信息。
本实施例音频信号切换装置, 通过预测模块预测出第一高频带信号对 应的预测的精细结构信息和预测的包络信息, 从而可以通过第一生成模块 和第二生成模块准确的生成处理后的第一高频 带信号, 从而使第一高频带 信号能够更加平滑的过渡到处理后的第一高频 带信号, 更有利于提高用户 接听语音频信号的质量。 另外, 通过分类模块对当前帧语音频信号的第一 低频带信号进行信号分类, 然后, 预测模块根据信号类型得到预测的精细 结构信息和预测的包络信息, 从而使预测的精细结构信息和预测的包络信 息更加准确, 使用户接听到的语音频信号的质量更高。
基于上述技术方案, 可选的, 如图 10和图 12所示, 本实施例中的第 一合成模块 102包括:
第一判断模块 1021用于根据当前帧语音频信号与切换前一帧 语音频 信号, 判断处理后的第一高频带信号是否需要衰减。
第三合成模块 1022用于若第一判断模块 1021得出处理后的第一高频 带信号不需要衰减, 将处理后的第一高频带信号与第一低频带信号 合成宽 频带信号。
第二判断模块 1023用于若第一判断模块 1021得出处理后的第一高频 带信号需要衰减, 判断处理后的第一高频带信号对应的衰减因子 是否大于 给定的阀值。
第四合成模块 1024用于若第二判断模块 1023得出衰减因子不大于给 定的阀值, 则将处理后的第一高频带信号乘以阔值, 然后与第一低频带信 号合成宽频带信号。
第五合成模块 1025用于若第二判断模块 1023得出衰减因子大于给定 的阀值, 则将处理后的第一高频带信号乘以衰减因子后 , 再与第一低频带 信号合成宽频带信号。
第一修改模块 1026用于修改衰减因子, 以使衰减因子减小。
其中, 衰减因子的初始值为一; 阀值小于一并大于等于零。
本实施例音频信号切换装置, 通过对处理后的第一高频带信号进行衰 减处理, 可以使当前帧语音频信号经过处理后得到的宽 频带信号更加准确, 更有利于提高用户接听音频信号的质量。
基于上述技术方案, 可选的, 当窄频带语音频信号向宽频带语音频信 号切换时, 如图 10和图 13a所示, 本实施例中的处理模块 101包括:
第一计算模块 1011a用于根据已设定好的第四权重一和第四权 二进 行加权处理, 以计算出处理后的第一高频带信号; 其中, 第四权重一为第 二高频带信号的权重值, 第四权重二为第一高频带信号的权重值;
第二修改模块 1012a用于以第三权重步长为单位减小第四权重 , 以 第三权重步长为单位增加第四权重二, 直至第四权重一等于零; 其中, 第 四权重一和第四权重二的和为一。
同样的, 当窄频带语音频信号向宽频带语音频信号切换 时, 如图 10和 图 13b所示, 本实施例中的处理模块 101可以还包括:
第二计算模块 101 lb用于根据已设定好的第五权重一和第五权重 进 行加权处理, 以计算出处理后的第一高频带信号; 其中, 第五权重一为已 设定好的固定参数的权重值, 第五权重二为第一高频带信号的权重值; 第三修改模块 1012b用于以第四权重步长为单位减小第五权重 , 以 第四权重步长为单位增加第五权重二, 直至第五权重一等于零; ; 其中, 第五权重一和第五权重二的和为一; 其中, 固定参数为一个大于等于零并 小于第一高频带信号能量值的常数。
本实施例语音频信号切换装置, 在语音频信号发生从窄频带语音频信 号向宽频带语音频信号切换的过程中, 通过对宽频带语音频信号的高频带 信号进行衰减处理得到处理后的高频带信号, 从而能够使切换前的窄频带 语音频信号对应的高频带信号能够平滑的过渡 到宽频带语音频信号所对应 的处理后的高频带信号, 更有利于提高用户接听音频信号的质量。 最后应说明的是: 以上实施例仅用以说明本发明的技术方案, 而非对 其限制; 尽管参照前述实施例对本发明进行了详细的说 明, 本领域的普通 技术人员应当理解: 其依然可以对前述各实施例所记载的技术方案 进行修 改, 或者对其中部分技术特征进行等同替换; 而这些修改或者替换, 并不 使相应技术方案的本质脱离本发明各实施例技 术方案的精神和范围。
Next Patent: FUSE
