Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
AUDIO SIGNAL QUALITY DETECTION METHOD AND DEVICE
Document Type and Number:
WIPO Patent Application WO/2015/078121
Kind Code:
A1
Abstract:
An audio signal quality detection method and device, the method comprising: acquiring the frequency spectrum energy sequence of an audio signal to be detected, the frequency spectrum energy sequence being an N-dimensional vector, N being the window length of a window function for conducing window processing on the audio signal to be detected, and each element in the frequency spectrum energy sequence being used to represent the frequency spectrum energy of each sampling point (S151); according to the frequency spectrum energy sequence, determining a low-energy sub-band in the audio signal to be detected (S152); according to the low-energy sub-band, determining whether the audio signal to be detected has a frequency band loss, and if yes, then determining that the quality of the audio signal to be detected is distorted (S153). The method analyzes the frequency spectrum of an audio signal to be detected, and determines whether the audio signal to be detected has a frequency band loss so as to determine whether the quality of the audio signal to be detected has distortion, thus, without comparing with a source audio signal, knowing whether an audio has distortion, and efficiently detecting the quality of the audio signal.

Inventors:
LIU XIAOQING (CN)
JIA JIA (CN)
CAI LIANHONG (CN)
WANG YONGXIN (CN)
HAO HONGXIA (CN)
Application Number:
PCT/CN2014/074546
Publication Date:
June 04, 2015
Filing Date:
April 01, 2014
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
HUAWEI TECH CO LTD (CN)
International Classes:
G10L25/48
Foreign References:
JP2005164870A2005-06-23
US20120099734A12012-04-26
CN101894560A2010-11-24
CN103151049A2013-06-12
CN102496369A2012-06-13
Download PDF:
Claims:
权 利 要 求

1、 一种音频信号质量检测装置, 其特征在于, 包括: 获取模块、 确定模 块和判断模块, 其中,

所述获取模块, 用于获取待检测音频信号的频谱能量序列,所述频谱能量 序列为 N维向量, 其中, N为对所述待检测音频信号进行加窗处理的窗函数的窗 长,所述频谱能量序列内各元素用于表征各采样点的频谱能量;所述确定模块, 用于根据所述获取模块获取的所述频谱能量序列,确定所述待检测音频信号中 的低能子带; 所述判断模块, 用于根据所述确定模块确定的所述低能子带, 判 别所述待检测音频信号是否存在频带丢失,若确定所述待检测音频信号存在频 带丢失, 则确定所述待检测音频信号质量失真。

2、 根据权利要求 1所述的装置, 其特征在于, 所述获取模块包括: 加窗单元, 用于加窗处理所述待检测音频信号, 得到加窗后的信号; 转换单元,用于对所述加窗单元得到的所述加窗后的信号进行快速傅里叶 变换 FFT, 得到频域信号;

运算单元, 用于计算所述转换单元得到的所述频域信号的功率谱密度, 得 到所述频谱能量序列。

3、 根据权利要求 2所述的装置, 其特征在于, 所述获取模块还包括: 截取单元, 用于截取所述转换单元得到的所述频域信号, 得到短时频域信 号, 所述短时频域信号为所述频域信号的前半部分或后半部分;

则所述运算单元用于计算所述截取单元得到的所述短时频域信号的功率 谱密度, 得到所述频谱能量序列。

4、 根据权利要求 3所述的装置, 其特征在于, 所述运算单元具体用于: 根据如下公式计算所述截取单元得到的所述短时频域信号的功率谱密度, 得到所述频谱能量序列:

P(j) = Kx|S(j 1 = 1,2,· · ·,—

」 2

其中, s(_ 为所述短时频域信号中的: 个占 P(j)为 S(j)对应的功率谱 密度, κ 为信号采样率, ω(η)为窗函数;

并根据如下公式得到所述频谱能量序列:

SP(j) = log10 [p(j) + ^]

其中, SP( j)为 P(j)对应的频谱能量, 为趋于零的正数。

5、 根据权利要求 4所述的装置, 其特征在于, 所述运算单元还用于: 根据如下公式对所述频谱能量序列进行预设平滑歩长的平滑处理:

SF (j) ∑ [sP(i)], j = o,i.

其中, SP (j)为平滑之后的频谱能量序列中的第 j个点, 为所述预设平 滑歩长, SP(i)为所述频谱能量序列中的第 i个点;

则所述确定模块用于根据所述平滑之后的频谱能量序列,确定所述待检测 音频信号中的低能子带。

6、 根据权利要求 1所述的装置, 其特征在于, 所述确定模块包括: 第一确定单元,用于根据所述获取模块获取的所述频谱能量序列中的最大 值和均值, 确定低能判别阈值;

第二确定单元, 用于根据所述第一确定单元确定的所述低能判别阈值, 确 定所述低能子带。

7、根据权利要求 6所述的装置,其特征在于,所述第一确定单元具体用于: 根据如下公式确定所述低能判别阈值:

0.5 x max , 0.75 x max < mean < max

max max > 4 其中, σ为所述低能判别阈值, max为所述频谱能量序列中的最大值, mean 为所述频谱能量序列中的均值。

8、 根据权利要求 6或 7所述的装置, 其特征在于, 所述确定模块还包括: 删除单元,用于若所述第二确定单元确定的所述低能子带的带宽小于第一 预设带宽, 则删除所述低能子带; 和 /或, 合并单元,用于若所述第二确定单元确定的相邻低能子带间的带宽间隔小 于第二预设带宽, 则合并所述相邻低能子带。

9、根据权利要求 6-8任一项所述的装置, 其特征在于, 所述确定模块还包 括:

第三确定单元,用于分别对所述第二确定单元确定的所述低能子带的起始 点和结束点的邻域内所有点, 确定所述起始点和结束点的拟合斜率;

将所述起始点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的起始点;

将所述结束点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的结束点。

10、 根据权利要求 9所述的装置, 其特征在于, 所述第三确定单元具体用 于:

根据如下公式计算所述拟合斜率: 其中, S为所述拟合斜率, M为所述邻域内所有点的个数, Xm为所述邻域 内所有点的能量值。

11、 根据权利要求 1所述的装置, 其特征在于, 所述判断模块具体用于: 若所述确定模块确定的所述低能子带的带宽小于第三预设带宽,则确定所 述待检测音频信号不存在频带丢失; 或者,

若所述确定模块确定的所述低能子带的开始点大于预设界限值,则确定所 述待检测音频信号不存在频带丢失; 或者,

若采样率大于或等于预设采样率,且所述确定模块确定的所述低能子带的 带宽大于第四预设带宽, 则确定所述待检测音频信号存在频带丢失; 或者, 若所述确定模块确定的所述低能子带的起始点和结束点的拟合斜率的绝 对值之和大于预设值, 则确定所述待检测音频信号存在频带丢失。

12、 根据权利要求 11所述的装置, 其特征在于, 若所述确定模块确定所述 待检测音频信号存在频带丢失, 则所述确定模块还用于:

计算丢失频带中所有点的平均能量; 若确定所述平均能量大于预设能量值,则判别所述待检测音频信号中所丢 失的频带中存在能量残留, 并保存判别结果; 或者,

若确定所述平均能量小于或等于所述预设能量值,则判别所述待检测音频 信号中所丢失的频带中不存在能量残留, 并保存判别结果。

13、根据权利要求 1-12任一项所述的装置,其特征在于,所述装置还包括: 分帧模块, 用于对所述待检测音频信号进行预设帧长的分帧处理, 得到分 帧后的音频信号;

则所述获取模块具体用于获取所述分帧模块得到的所述分帧后的音频信 号中各帧音频信号的频谱向量,并计算所述各帧音频信号的频谱向量的均值序 列; 将所述均值序列作为所述待检测音频信号的频谱能量序列。

14、根据权利要求 1-13任一项所述的装置,其特征在于,所述装置还包括: 滤除模块, 用于滤除所述待检测音频信号中直流分量, 得到滤波后信号; 则所述获取模块用于获取所述滤波模块得到的所述滤波后信号的频谱能 量序列。

15、 根据权利要求 14所述的装置, 其特征在于, 所述滤除模块具体用于: 根据如下公式滤除 , 得到滤波后信号:

其中, X (k)为所述滤波后信号, X(k)为所述待检测音频信号, h (r)为滤

波器, h(r π , r = 0, 1, · · · , - 1, c r)为 ωΑ τ 中, N为对所述待检测音频信号进行加窗处理的窗函数的窗长, 所述频谱能量 序列内各元素用于表征各采样点的频谱能量;

根据所述频谱能量序列, 确定所述待检测音频信号中的低能子带; 根据所述低能子带, 判别所述待检测音频信号是否存在频带丢失, 若确定 所述待检测音频信号存在频带丢失, 则确定所述待检测音频信号质量失真。

17、 根据权利要求 16所述的方法, 其特征在于, 所述获取待检测音频信号 的频谱能量序列, 包括:

加窗处理所述待检测音频信号, 得到加窗后的信号;

对所述加窗后的信号进行快速傅里叶变换 FFT, 得到频域信号;

计算所述频域信号的功率谱密度, 得到所述频谱能量序列。

18、 根据权利要求 17所述的方法, 其特征在于, 所述对所述加窗后的信号 进行 FFT, 得到频域信号之后, 所述方法还包括:

获取短时频域信号,所述短时频域信号为所述频域信号的前半部分或后半 部分;

则所述计算所述频域信号的功率谱密度, 得到所述频谱能量序列, 包括: 计算所述短时频域信号的功率谱密度, 得到所述频谱能量序列。

19、 根据权利要求 18所述的方法, 其特征在于, 所述计算所述短时频域信 号的功率谱密度, 得到所述频谱能量序列, 包括:

根据如下公式计算所述短时频域信号的功率谱密度,得到所述频谱能量序 列:

p(j) = Kx|s(j)|: 1 = 1,2,· · ·,—

」 2

其中, S(j)为所述短时频域信号中的第 j个点, P(j)为 S(j)对应的功率谱 密度, κ 为信号采样率, ω(η)为窗函数;

并根据如下公式得到所述频谱能量序列:

SP(j) = log10 [p(j) + ^

其中, SP(j)为 P(j)对应的频谱能量, 为趋于零的正数。

20、 根据权利要求 19所述的方法, 其特征在于, 所述计算所述短时频域信 号的功率谱密度, 得到所述频谱能量序列, 还包括:

根据如下公式对所述频谱能量序列进行预设平滑歩长的平滑处理:

SF (j) = ^ ∑ [SP(i)] , j = 0,l, - ,f

1=J— ϊ

其中, SF (j)为平滑之后的频谱能量序列中的第 j个点, 为所述预设平 滑歩长, SP(i)为所述频谱能量序列中的第 i个点;

则所述根据所述频谱能量序列, 确定所述待检测音频信号中的低能子带, 包括:

根据所述平滑之后的频谱能量序列,确定所述待检测音频信号中的低能子 带。

21、 根据权利要求 16所述的方法, 其特征在于, 所述根据所述频谱能量序 列, 确定所述待检测音频信号中的低能子带, 包括:

根据所述频谱能量序列中的最大值和均值, 确定低能判别阈值;

根据所述低能判别阈值, 确定所述低能子带。

22、 根据权利要求 21所述的方法, 其特征在于, 所述根据所述频谱能量序 列中的最大值和均值, 确定低能判别阈值, 包括:

根据如下公式确定所述低能判别阈值:

≥ 4

其中, σ为所述低能判别阈值, max为所述频谱能量序列中的最大值, mean 所述频谱能量序列中的均值。

23、 根据权利要求 21或 22所述的方法, 其特征在于, 所述根据所述频谱能 序列, 确定所述待检测音频信号中的低能子带, 还包括:

若所述低能子带的带宽小于第一预设带宽,则删除所述低能子带;和 /或, 若相邻低能子带间的带宽间隔小于第二预设带宽,则合并所述相邻低能子 带。

24、 根据权利要求 21-23任一项所述的方法, 其特征在于, 所述根据所述 频谱能量序列, 确定所述待检测音频信号中的低能子带, 还包括:

分别对所述低能子带的起始点和结束点的邻域内所有点,确定所述起始点 和结束点的拟合斜率;

将所述起始点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的起始点;

将所述结束点的拟合斜率中的最大绝对值对应的点重新定位为所述低能 子带的结束点。

25、 根据权利要求 24所述的方法, 其特征在于, 所述分别对所述低能子带 的起始点和结束点的邻域内所有点, 确定所述起始点和结束点的拟合斜率, 包 括:

根据如下公式计算所述拟合斜率: 其中, S为所述拟合斜率, M为所述邻域内所有点的个数, Xm为所述邻域 内所有点的能量值。

26、 根据权利要求 16所述的方法, 其特征在于, 所述根据所述低能子带, 判别所述待检测音频信号是否存在频带丢失, 包括:

若所述低能子带的带宽小于第三预设带宽,则确定所述待检测音频信号不 存在频带丢失; 或者,

若所述低能子带的开始点大于预设界限值,则确定所述待检测音频信号不 存在频带丢失; 或者,

若采样率大于或等于预设采样率,且所述低能子带的带宽大于第四预设带 宽, 则确定所述待检测音频信号存在频带丢失; 或者,

若所述低能子带的起始点和结束点的拟合斜率的绝对值之和大于预设值, 则确定所述待检测音频信号存在频带丢失。

27、 根据权利要求 26所述的方法, 其特征在于, 若确定所述待检测音频信 号存在频带丢失, 则所述根据所述低能子带, 判别所述待检测音频信号是否存 在频带丢失, 还包括:

计算丢失频带中所有点的平均能量;

若确定所述平均能量大于预设能量值,则判别所述待检测音频信号中所丢 失的频带中存在能量残留, 并保存判别结果; 或者,

若确定所述平均能量小于或等于所述预设能量值,则判别所述待检测音频 信号中所丢失的频带中不存在能量残留, 并保存判别结果。

28、 根据权利要求 16-27任一项所述的方法, 其特征在于, 所述方法还包 括:

对所述待检测音频信号进行预设帧长的分帧处理,得到分帧后的音频信号; 则所述获取待检测音频信号的频谱能量序列, 包括: 获取所述分帧后的音 频信号中各帧音频信号的频谱向量,并计算所述各帧音频信号的频谱向量的均 值序列; 将所述均值序列作为所述待检测音频信号的频谱能量序列。

29、 根据权利要求 16-28任一项所述的方法, 其特征在于, 所述获取待检 测音频信号的频谱能量序列之前, 所述方法还包括:

滤除所述待检测音频信号中直流分量, 得到滤波后信号;

则所述获取待检测音频信号的频谱能量序列, 包括:

获取所述滤波后信号的频谱能量序列。

30、 根据权利要求 29所述的方法, 其特征在于, 所述滤除所述待检测音频 信号中直流分量, 得到滤波后信号, 包括:

根据如下公式滤除 述待检测音频信号中直流分量, 得到滤波后信号:

其中, X (k)为所述滤波后信号, X(k)为所述待检测音频信号, h(r)为滤波器,

(r)为切比雪

Description:
音频信号质量检测方法及装置

本申请要求于 2013年 11月 29日提交中国专利局、申请号为 201310632876. 3、 发明名称为 "音频信号质量检测方法及装置"的中国专利申 的优先权, 其全 部内容通过引用结合在本申请中。

技术领域

本发明实施例涉及移动通信技术,尤其涉及一 种音频信号质量检测方法及 装置。

背景技术

目前运营商提供大量铃音给用户使用, 在录制、编辑、存储和传输这些铃 音的过程中, 可能导致铃音的某一个或者几个频带被滤除( 即频带丢失) , 从 而低铃音的质量。 另外, 由于铃音的数据是海量的, 对铃音质量进行人工检测 是无法完成的, 因此, 铃音质量检测引起普遍关注。

现有技术通过用户终端拨打待检测的铃音,并 录制该铃音的目标铃音文件; 利用主观语音质量评估 ( Perceptual Evaluation of Speech Quality , 以下 简称: PESQ ) 算法对上述目标铃音文件和铃音平台上的源铃 音文件进行对比, 输出人为评估分数 (Man Option Score , 以下简称: M0S ) 值, 获得该铃音的 质量等级。

上述铃音质量检测方法的实施过程中, 需要存在铃音的源文件, 若是用户 自制的铃音, 则无法判别其音频质量。

发明内容 本发明实施例提供一种音频信号质量检测方法 及装置,用于检测音频信号 中是否存在频带丢失, 以判别音频信号的质量。

第一方面, 本发明实施例提供一种音频信号质量检测装置 , 包括: 获取模 块、 确定模块和判断模块, 其中,

所述获取模块, 用于获取待检测音频信号的频谱能量序列,所 述频谱能量 序列为 N维向量, 其中, N为对所述待检测音频信号进行加窗处理的窗 数的窗 长,所述频谱能量序列内各元素用于表征各采 样点的频谱能量;所述确定模块, 用于根据所述获取模块获取的所述频谱能量序 列,确定所述待检测音频信号中 的低能子带; 所述判断模块, 用于根据所述确定模块确定的所述低能子带, 判 别所述待检测音频信号是否存在频带丢失,若 确定所述待检测音频信号存在频 带丢失, 则确定所述待检测音频信号质量失真。

结合第一方面, 在第一方面的第一种可能的实现方式中, 所述获取模块包 括:

加窗单元, 用于加窗处理所述待检测音频信号, 得到加窗后的信号; 转换单元,用于对所述加窗单元得到的所述加 窗后的信号进行快速傅里叶 变换 FFT, 得到频域信号;

运算单元, 用于计算所述转换单元得到的所述频域信号的 功率谱密度, 得 到所述频谱能量序列。

结合第一方面的第一种可能的实现方式,在第 一方面的第二种可能的实现 方式中, 所述获取模块还包括:

截取单元, 用于截取所述转换单元得到的所述频域信号, 得到短时频域信 号, 所述短时频域信号为所述频域信号的前半部分 或后半部分;

则所述运算单元用于计算所述截取单元得到的 所述短时频域信号的功率 谱密度, 得到所述频谱能量序列。

结合第一方面的第二种可能的实现方式,在第 一方面的第三种可能的实现 方式中, 所述运算单元具体用于:

根据如下公式计算所述截取单元得到的所述短 时频域信号的功率谱密度, 得到所述频谱能量序列:

P(j) = Kx|s(j) , j = l,2,-, 其中, S(j)为所述短时频域信号中的第 j个点, P(j)为 S(j)对应的功率谱

, 为信号采样率, ω(η)为窗函数; 并根据如下公式得到所述频谱能量序列:

SP(j) = log 10 [p(j) + ^

其中, SP(j)为 P( 对应的频谱能量, 为趋于零的正数。

结合第一方面的第三种可能的实现方式,在第 一方面的第四种可能的实现 方式中, 所述运算单元还用于: 根据如下公式对所述频谱能量序列进行预设平 滑歩长的平滑处理:

SF ( j ) = - x ∑ [SP(i)], j = 0,l.

其中, SF (j )为平滑之后的频谱能量序列中的第 j个点, 为所述预设平 滑歩长, SP(i)为所述频谱能量序列中的第 i个点;

则所述确定模块用于根据所述平滑之后的频谱 能量序列,确定所述待检测 音频信号中的低能子带。

结合第一方面, 在第一方面的第五种可能的实现方式中, 所述确定模块包 括:

第一确定单元,用于根据所述获取模块获取的 所述频谱能量序列中的最大 值和均值, 确定低能判别阈值;

第二确定单元, 用于根据所述第一确定单元确定的所述低能判 别阈值, 确 定所述低能子带。

结合第一方面的第五种可能的实现方式,在第 一方面的第六种可能的实现 方式中, 所述第一确定单元具体用于:

根据如下公式确定所述低能判别阈值:

其中, σ为所述低能判别阈值, max为所述频谱能量序列中的最大值, mean 为所述频谱能量序列中的均值。

结合第一方面的第五种或第六种可能的实现方 式,在第一方面的第七种可 能的实现方式中, 所述确定模块还包括:

删除单元,用于若所述第二确定单元确定的所 述低能子带的带宽小于第一 预设带宽, 则删除所述低能子带; 和 /或,

合并单元,用于若所述第二确定单元确定的相 邻低能子带间的带宽间隔小 于第二预设带宽, 则合并所述相邻低能子带。

结合第一方面的第五种至第七种可能的实现方 式中的任意一种,在第一方 面的第八种可能的实现方式中, 所述确定模块还包括:

第三确定单元,用于分别对所述第二确定单元 确定的所述低能子带的起始 点和结束点的邻域内所有点, 确定所述起始点和结束点的拟合斜率;

将所述起始点的拟合斜率中的最大绝对值对应 的点重新定位为所述低能 子带的起始点;

将所述结束点的拟合斜率中的最大绝对值对应 的点重新定位为所述低能 子带的结束点。

结合第一方面的第八种可能的实现方式中的任 意一种,在第一方面的第九 种可能的实现方式中, 所述第三确定单元具体用于:

根据如下公式计算所述拟合斜率:

其中, S为所述拟合斜率, M为所述邻域内所有点的个数, X m 为所述邻域 内所有点的能量值。

结合第一方面, 在第一方面的第十种可能的实现方式中, 所述判断模块具 体用于:

若所述确定模块确定的所述低能子带的带宽小 于第三预设带宽,则确定所 述待检测音频信号不存在频带丢失; 或者,

若所述确定模块确定的所述低能子带的开始点 大于预设界限值,则确定所 述待检测音频信号不存在频带丢失; 或者,

若采样率大于或等于预设采样率,且所述确定 模块确定的所述低能子带的 带宽大于第四预设带宽, 则确定所述待检测音频信号存在频带丢失; 或者, 若所述确定模块确定的所述低能子带的起始点 和结束点的拟合斜率的绝 对值之和大于预设值, 则确定所述待检测音频信号存在频带丢失。

结合第一方面的第十种可能的实现方式,在第 一方面的第十一种可能的实 现方式中, 若所述确定模块确定所述待检测音频信号存在 频带丢失, 则所述确 定模块还用于: 计算丢失频带中所有点的平均能量;

若确定所述平均能量大于预设能量值,则判别 所述待检测音频信号中所丢 失的频带中存在能量残留, 并保存判别结果; 或者,

若确定所述平均能量小于或等于所述预设能量 值,则判别所述待检测音频 信号中所丢失的频带中不存在能量残留, 并保存判别结果。

结合第一方面、第一方面的第一种至第十一种 可能的实现方式中的任意一 种, 在第一方面的第十二种可能的实现方式中, 所述装置还包括:

分帧模块, 用于对所述待检测音频信号进行预设帧长的分 帧处理, 得到分 帧后的音频信号;

则所述获取模块具体用于获取所述分帧模块得 到的所述分帧后的音频信 号中各帧音频信号的频谱向量,并计算所述各 帧音频信号的频谱向量的均值序 列; 将所述均值序列作为所述待检测音频信号的频 谱能量序列。

结合第一方面、第一方面的第一种至第十二种 可能的实现方式中的任意一 种, 在第一方面的第十三种可能的实现方式中, 所述装置还包括:

滤除模块, 用于滤除所述待检测音频信号中直流分量, 得到滤波后信号; 则所述获取模块用于获取所述滤波模块得到的 所述滤波后信号的频谱能 量序列。

结合第一方面的第十三种可能的实现方式,在 第一方面的第十四种可能的 实现方式中, 所述滤除模块具体用于:

根据如下公式滤除 述待检测音频信号中直流分量, 得到滤波后信号:

其中, X (k)为所述滤波后信号, X(k)为所述待检测音频信号, h ( )为滤

波器, h(r 0,1,· · ·, Ν「1, co r)为 切比雪夫窗函数, ^为^ ^)的窗长。 第二方面, 本发明实施例提供一种音频信号质量检测方法 , 包括: 获取待检测音频信号的频谱能量序列, 所述频谱能量序列为 N维向量, 其 中, N为对所述待检测音频信号进行加窗处理的窗 数的窗长, 所述频谱能量 序列内各元素用于表征各采样点的频谱能量;

根据所述频谱能量序列, 确定所述待检测音频信号中的低能子带; 根据所述低能子带, 判别所述待检测音频信号是否存在频带丢失, 若确定 所述待检测音频信号存在频带丢失, 则确定所述待检测音频信号质量失真。

结合第二方面, 在第二方面的第一种可能的实现方式中, 所述获取待检测 音频信号的频谱能量序列, 包括:

加窗处理所述待检测音频信号, 得到加窗后的信号;

对所述加窗后的信号进行快速傅里叶变换 FFT, 得到频域信号;

计算所述频域信号的功率谱密度, 得到所述频谱能量序列。

结合第二方面的第一种可能的实现方式,在第 二方面的第二种可能的实现 方式中, 所述对所述加窗后的信号进行 FFT, 得到频域信号之后, 所述方法还 包括:

获取短时频域信号,所述短时频域信号为所述 频域信号的前半部分或后半 部分;

则所述计算所述频域信号的功率谱密度, 得到所述频谱能量序列, 包括: 计算所述短时频域信号的功率谱密度, 得到所述频谱能量序列。

结合第二方面的第二种可能的实现方式,在第 二方面的第三种可能的实现 方式中, 所述计算所述短时频域信号的功率谱密度, 得到所述频谱能量序列, 包括:

根据如下公式计算所述短时频域信号的功率谱 密度,得到所述频谱能量序 列:

P(j) = Kx|S(j)| j = U,-

其中, S(j)为所述短时频域信号中的第 j个点, P(j)为 S(j)对应的功率谱 密度, K为窗函数参数, Κ : , 为信号采样率, ω(η)为窗函数;

F s∑ ( n )l 并根据如下公式得到所述频谱能量序列:

SP(j) = log 10 [P(j)

其中, SP( j)为 P(j)对应的频谱能量, 为趋于零的正数。

结合第二方面的第三种可能的实现方式,在第 二方面的第四种可能的实现 方式中, 所述计算所述短时频域信号的功率谱密度, 得到所述频谱能量序列, 还包括:

根据如下公式对所述频谱能量序列进行预设平 滑歩长的平滑处理:

1〕

SP* (j) = ∑ [SP( , j = o,i,-,

η

其中, SF (j)为平滑之后的频谱能量序列中的第 j个点, 为所述预设平 滑歩长, SP(i)为所述频谱能量序列中的第 i个点;

则所述根据所述频谱能量序列, 确定所述待检测音频信号中的低能子带, 包括:

根据所述平滑之后的频谱能量序列,确定所述 待检测音频信号中的低能子 带。

结合第二方面, 在第二方面的第五种可能的实现方式中, 所述根据所述频 谱能量序列, 确定所述待检测音频信号中的低能子带, 包括:

根据所述频谱能量序列中的最大值和均值, 确定低能判别阈值;

根据所述低能判别阈值, 确定所述低能子带。

结合第二方面的第五种可能的实现方式,在第 二方面的第六种可能的实现 方式中, 所述根据所述频谱能量序列中的最大值和均值 , 确定低能判别阈值, 包括:

根据如下公式确定所述低能判别阈值: 其中, σ为所述低能判别阈值, max为所述频谱能量序列中的最大值, mean 为所述频谱能量序列中的均值。

结合第二方面的第五种或第六种可能的实现方 式,在第二方面的第七种可 能的实现方式中,所述根据所述频谱能量序列 , 确定所述待检测音频信号中的 低能子带, 还包括:

若所述低能子带的带宽小于第一预设带宽,则 删除所述低能子带;和 /或, 若相邻低能子带间的带宽间隔小于第二预设带 宽,则合并所述相邻低能子 带。

结合第二方面的第五种至第七种可能的实现方 式中的任意一种,在第二方 面的第八种可能的实现方式中, 所述根据所述频谱能量序列, 确定所述待检测 音频信号中的低能子带, 还包括:

分别对所述低能子带的起始点和结束点的邻域 内所有点,确定所述起始点 和结束点的拟合斜率;

将所述起始点的拟合斜率中的最大绝对值对应 的点重新定位为所述低能 子带的起始点;

将所述结束点的拟合斜率中的最大绝对值对应 的点重新定位为所述低能 子带的结束点。

结合第二方面的第八种可能的实现方式,在第 二方面的第九种可能的实现 方式中, 所述分别对所述低能子带的起始点和结束点的 邻域内所有点, 确定所 述起始点和结束点的拟合斜率, 包括:

根据如下公式计算所述拟合斜率:

M x T M (mx X )

S = -

T M mx T M (X 其中, S为所述拟合斜率, M为所述邻域内所有点的个数, X m 为所述邻域 内所有点的能量值。

结合第二方面, 在第二方面的第十种可能的实现方式中, 所述根据所述低 能子带, 判别所述待检测音频信号是否存在频带丢失, 包括:

若所述低能子带的带宽小于第三预设带宽,则 确定所述待检测音频信号不 存在频带丢失; 或者,

若所述低能子带的开始点大于预设界限值,则 确定所述待检测音频信号不 存在频带丢失; 或者,

若采样率大于或等于预设采样率,且所述低能 子带的带宽大于第四预设带 宽, 则确定所述待检测音频信号存在频带丢失; 或者,

若所述低能子带的起始点和结束点的拟合斜率 的绝对值之和大于预设值, 则确定所述待检测音频信号存在频带丢失。

结合第二方面的第十种可能的实现方式,在第 二方面的第十一种可能的实 现方式中, 若确定所述待检测音频信号存在频带丢失, 则所述根据所述低能子 带, 判别所述待检测音频信号是否存在频带丢失, 还包括:

计算丢失频带中所有点的平均能量;

若确定所述平均能量大于预设能量值,则判别 所述待检测音频信号中所丢 失的频带中存在能量残留, 并保存判别结果; 或者,

若确定所述平均能量小于或等于所述预设能量 值,则判别所述待检测音频 信号中所丢失的频带中不存在能量残留, 并保存判别结果。

结合第二方面、第二方面的第一种至第十一种 可能的实现方式中的任意一 种, 在第二方面的第十二种可能的实现方式中, 所述方法还包括:

对所述待检测音频信号进行预设帧长的分帧处 理,得到分帧后的音频信号; 则所述获取待检测音频信号的频谱能量序列, 包括: 获取所述分帧后的音 频信号中各帧音频信号的频谱向量,并计算所 述各帧音频信号的频谱向量的均 值序列; 将所述均值序列作为所述待检测音频信号的频 谱能量序列。

结合第二方面、第二方面的第一种至第十二种 可能的实现方式中的任意一 种, 在第二方面的第十三种可能的实现方式中,所 述获取待检测音频信号的频 谱能量序列之前, 所述方法还包括: 滤除所述待检测音频信号中直流分量, 得到滤波后信号;

则所述获取待检测音频信号的频谱能量序列, 包括:

获取所述滤波后信号的频谱能量序列。

结合第二方面的第十三种可能的实现方式,在 第二方面的第十四种可能的 实现方式中, 所述滤除所述待检测音频信号中直流分量, 得到滤波后信号, 包 括:

根据如下公式滤除 量, 得到滤波后信号:

其中, X (k)为所述滤波后信号, X(k)为所述待检测音频信号, h(r)为滤

波器, h(r π , r = 0,1,· · · , Ν「1, co r)为

2

: ω, ( r

4R 切比雪夫窗函数, ^为^ ^)的窗长。 本发明实施例直接对待检测音频信号的频谱进 行分析,根据待检测音频信号的 频谱能量序列, 确定该待检测音频信号中包含的低能子带, 并根据该些低能子 带, 判别待检测音频信号是否存在频带丢失, 进而确定所述待检测音频信号质 量是否失真, 从而无需与源音频信号进行比较即可获知待检 测音频是否失真, 实现音频信号质量的高效检测, 并降低频带丢失的误判概率。

國删

为了更清楚地说明本发明实施例或现有技术中 的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图做一简 单地介绍, 显而易见地, 下面描 述中的附图是本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出 创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。

图 1为本发明音频信号质量检测装置实施例一的 构示意图; 图 2为四种窗函数的波形示例图;

图 3为汉明窗函数在时域上的幅值变化示例图 ·'

图 4为汉明窗函数在频域上的频谱示例图 ·'

图 5为音频信号中所丢失的频带中存在能量残留 示例图;

图 6为音频信号中所丢失的频带中不存在能量残 的示例图;

图 7为本发明音频信号质量检测装置实施例二的 构示意图;

图 8为本发明音频信号质量检测装置实施例三的 构示意图;

图 9为切比雪夫窗函数在时域上的幅值变化示例 ;

图 10为切比雪夫窗函数在频域上的频谱示例图;

图 u为本发明音频信号质量检测装置实施例四中 检测音频信号的波形 示意图;

图 12为本发明音频信号质量检测装置实施例四中 检测音频信号滤波之 后的波形示意图;

图 13为本发明音频信号质量检测装置实施例四中 检测音频信号滤波之 后的频谱示意图;

图 14为本发明音频信号质量检测装置实施例四中 检测音频信号滤波之 后的频谱能量序列示意图;

图 15为本发明音频信号质量检测方法实施例一的 程示意图;

图 16为本发明音频信号质量检测方法实施例二的 程示意图。

具体实 式

为使本发明实施例的目的、技术方案和优点更 加清楚, 下面将结合本发明 实施例中的附图,对本发明实施例中的技术方 案进行清楚、完整地描述,显然, 所描述的实施例是本发明一部分实施例, 而不是全部的实施例。基于本发明中 的实施例,本领域普通技术人员在没有做出创 造性劳动前提下所获得的所有其 他实施例, 都属于本发明保护的范围。

图 1为本发明音频信号质量检测装置实施例一的 构示意图。 本发明实施 例提供了一种音频信号质量检测装置, 该装置可以集成在终端设备中, 其中, 终端设备可以为个人电脑 (Personal Computer , 以下简称: PC ) 或平板电脑 等任意终端设备。 如图 1所示, 本实施例的装置包括: 获取模块 10、 确定模块 20和判断模块 30。

其中, 获取模块 10用于获取待检测音频信号的频谱能量序列, 该频谱能量 序列为 N维向量, 其中, N为对上述待检测音频信号进行加窗处理的窗 数的窗 长, 该频谱能量序列内各元素用于表征各采样点的 频谱能量; 确定模块 20用于 根据获取模块 10获取的上述频谱能量序列,确定上述待检测 频信号中的低能 子带; 判断模块 30用于根据确定模块 20确定的上述低能子带, 判别上述待检测 音频信号是否存在频带丢失, 若确定所述待检测音频信号存在频带丢失, 则确 定所述待检测音频信号质量失真。

上述待检测音频信号可以为一般的音频文件, 也可以为运营商提供给用户 的彩铃、 振铃或全曲等特色音乐。 另外, 本发明不仅可以应用于一般音乐质量 的检测, 对于语音和其他传输数字信号都有着很好的扩 展应用。

频谱是时域的信号在频域下表示方式,可以针 对信号进行傅立叶变换而得。 频谱可以表示一个信号是由哪些频率的弦波所 组成,音频可以由许多不同频率 的音频组成。

对音频信号进行加窗处理, 也就是一次仅处理音频信号位于窗内的数据。 因为实际场景中音频信号较长,本发明采用对 待检测的音频信号加窗处理的方 式进行分析, 避免对长数据的一次性处理。通常情况下, 音频信号没有明显的 周期性, 加窗处理后, 音频信号的数据形状就会呈现周期性。在上述 待检测的 音频信号自身较短的场景中, 可以不对其进行上述加窗处理, 直接求得该待检 测的音频信号的频谱能量序列,此时, N为该待检测音频信号的总采样点个数。

其中, 窗函数类型可以为以下任意一种: 矩型窗函数、 汉明窗函数、 汉宁 窗函数或布莱克曼窗函数等。上述四种窗函数 的波形图如图 2所示: Λ表示一个 周期内的采样点个数, n)表示各窗函数对应的波形值, ① 表示矩形窗函数 的波形; ② 表示汉宁窗函数的波形; ③ 表示汉明窗函数的波形; ④ 表示布 莱克曼窗函数的波形。 该四种 1。

窗函数 主瓣宽度 旁瓣峰值衰减(dB) 阻带最小衰减(dB) 矩形窗函数 4π /Ν -13 -21

汉宁窗函数 8 π /Ν -31 -44 汉明窗函数 8 π /Ν -41 -53

布莱克曼窗函数 12 π /Ν -57 -74

窗函数在某一数值区间内为非零值, 而在其余数值区间内皆为 0。 以汉明 窗函数为例进行说明, 汉明窗函数主要部分的形状像 s in ( X ) 在 0到 Γ区间的 形状, 而其余部分都是 0, 这样, 汉明窗函数与其他任何一个函数的乘积只有 一部分有非零值。

本发明以汉明窗函数为例,说明该窗函数在一 个周期内对应的时域波形和 频域波形, 其中, 图 3为汉明窗函数在时域上的幅值变化示例图, 图 4为汉明窗 函数在频域上的频谱示例图。 图 4中, 横轴表示采样点, 纵轴表示各采样点对 应的归一化幅值。 图 4中, 横轴表示归一化频率, 该归一化频率为每个采样点 的实际频率与 Γ相除获得; 纵轴表示每个采样点对应的频谱能量, 其单位为分 贝。

加窗处理待检测音频信号之后,待检测音频信 号位于窗函数中间的数据保 留, 位于窗函数两侧的数据丢失, 因此, 移动窗函数时, 移动歩长通常为 1/3 或 1/2窗长, 这样, 被前一帧或二帧丢失的数据又重新得到了体现 。 对待检测 音频信号自身或加窗处理后的待检测音频信号 进行快速傅里叶变换 (Fast Fouri er Transformat ion , 以下简称: FFT ) 即得到待检测音频信号的频域信 息, 求得该频域信息的功率谱密度作为待检测音频 信号的频谱, 并根据该频谱 计算频谱能量, 得到上述频谱能量序列。

对获得的频谱能量序列,若其中某一点的频谱 能量低于预设的低能判别阈 值,则将其标注为低能点。对于频谱能量序列 上的第 i, i+1点为低能点,且 i- i 点不为低能点, 则将 i标注为低能子带的开始点; 若第 i, i-1点为低能点, 且 i+1点不为低能点, 则将 i标注为低能子带的结束点, 从而得到频谱能量序列中 所有的低能子带及其边界特征,该边界特征包 括边界点的位置及边界点的拟合 斜率等。

根据上述低能子带, 判别上述待检测音频信号是否存在频带丢失, 例如, 若低能子带的带宽小于第一预设数值,则认为 待检测音频信号不存在频带丢失; 若低能子带的带宽大于第二预设数值, 则认为待检测音频信号存在频带丢失, 其中,该第二预设数值大于该第一预设数值。 若待检测音频信号存在频带丢失, 则确定该待检测音频信号质量失真,并输出所 丢失频带的起始频率和结束频率; 对不存在频带丢失的待检测音频信号, 则确定该待检测音频信号质量正常。

本发明实施例直接对待检测音频信号的频谱进 行分析,根据待检测音频信 号的频谱能量序列, 确定该待检测音频信号中包含的低能子带, 并根据该些低 能子带, 判别待检测音频信号是否存在频带丢失, 进而确定所述待检测音频信 号质量是否失真,从而无需与源音频信号进行 比较即可获知待检测音频是否失 真, 检测, 并降低频带丢失的误判概率。

具体地, 获取模块 10可以包括: 加窗单元, 用于加窗处理所述待检测音频 信号, 得到加窗后的信号; 转换单元, 用于对所述加窗单元得到的所述加窗后 的信号进行 FFT, 得到频域信号; 运算单元, 用于计算所述转换单元得到的所 述频域信号的功率谱密度, 得到所述频谱能量序列。

其中, 对 域信号, 该计算过程如下: k +— ( 1 ) w, mk

, m = 0,l,- --,N , X[m]为频域信号, x[k]为加窗后的 信号 (

由上述公式 (1 ) 可知, 对所述加窗后的信号进行 FFT, 其中, FFT长度为 上述待检测音频信号的长度, 得到频域信号为对称序列, 因此, 取该频域信号 的半边 S(j), 例如, S(j)采用如公式 (2 ) 或公式 (3 )所表达的频域信号, 其 N

中, Γ = 0,1,···, , 即可表达该加窗后的信号的频域信息, 得到该加窗后的信号 对应的短时频域信号, 从而减小上述运算单元的计算量。

因此, 在上述基础上, 获取模块 10还可以包括截取单元, 该截取单元用于 截取所述转换单元得到的所述频域信号, 得到短时频域信号, 所述短时频域信 号为所述频域信号的前半部分或后半部分;则 所述运算单元用于计算所述截取 单元得到的所述短时频域信号的功率谱密度, 得到所述频谱能量序列。

进一歩地, 运算单元可以具体用于根据如下公式 (4 ) 计算所述截取单元 得到的所述短时频域信号的功率谱密度, 得到所述频谱能量序列:

(4 )

其中, S(j)为所述短时频域信号中的第 j个点, P(j)为 S(j)对应的功率谱 . 为信号采样率, ω(η)为窗函数; 并根据如下公式 (5 ) 得到所述频谱能量序列:

SP(j) = lo gl 。[P(j) ] (5 ) 其中, SP(j)为 P(j)对应的频谱能量, 为趋于零的正数。 可以为一很 小的数值, 用于避免根据公式 (5 ) 计算频谱能量出现负无穷和很小的负值, 保证计算结果的有效性 ( 对于采样率为 F s 的待检测音频信号, 其频谱上频率范围为

SP(0)对应待检测音频信号的直流分量, SP(j)中的每一点对应待检测音频信号 频谱上每一段的频谱能量, gP SP(j)为待检测音频信号从^ ^至^子带内

2N 2N 1

sP* (j) ∑ [sp(i) j =o,i,- (6 ) 其中, SF (j)为平滑之后的频谱能量序列中的第 j个点, 为所述预设平 滑歩长, SP(i)为所述频谱能量序列中的第 i个点。 预设平滑歩长可以根据实际 需求进行设置, 例如可以为 40。

根据上述平滑处理后的频谱能量序列,确定模 块 20可以用于根据所述平滑 之后的频谱能量序列, 确定所述待- 72检测音频信号中的低能子带。本发明实施例 对频谱能量序列进行平滑处理, 使得频谱能量序列的精细结构被平滑, 使得频 谱能量序列中的尖峰和峡谷都趋于圆滑。

确定模块 20可以具体包括: 第一确定单元和第二确定单元, 该第一确定单 元用于根据所述获取模块获取的所述频谱能量 序列中的最大值和均值,确定低 能判别阈值;该第二确定单元用于根据所述第 一确定单元确定的所述低能判别 阈值, 确定所述低能子带。

-确定单元可以具体用于根据如下公式 (7 ) 确定所述低能判别

1 , max < 4

0.5 χ max , 0.75 χ max≤ mean≤ max

σ = (7 ) 0.3 x max , 0.5 x max≤ mean < 0.75 x max max≥4

0.36x max , 0.25 x max≤ mean < 0.5 x max

0.3 x max , 0≤ mean < 0.25 x max 其中, σ为所述低能判别阈值, max为所述频谱能量序列中的最大值, mean为频谱能量序列中的均值。

由公式 (7 ) 可知, 当 max小于 4时, σ取值为 1 ; 当 max大于或等于 4时, σ根据 max和 mean的上述大小关系进行取值, 此处不再一一赘述。 需要说明 的是, 公式 (7 ) 是依据大量的实验数据所得。

在上述实施例的基础上, 确定模块 20还可以包括: 删除单元, 该删除单元 用于若所述第二确定单元确定的所述低能子带 的带宽小于第一预设带宽,则删 除所述低能子带; 和 /或, 合并单元, 用于若所述第二确定单元确定的相邻低 能子带间的带宽间隔小于第二预设带宽, 则合并所述相邻低能子带, 以进一歩 减小计算复杂度及判断次数。其中, 上述第一预设带宽和第二预设带宽可以根 据实际需求进行设置, 例如, 第一预设带宽可以为 200赫兹 (Hz ) , 第二预设 带宽可以为 400 Hz , 等等。

进一歩地, 确定模块 20还可以包括: 第三确定单元, 该第三确定单元用于 分别对所述第二确定单元确定的所述低能子带 的起始点和结束点的邻域内所 有点, 确定所述起始点和结束点的拟合斜率; 将所述起始点的拟合斜率中的最 大绝对值对应的点重新定位为所述低能子带的 起始点;将所述结束点的拟合斜 率中的最大绝对值对应的点重新定位为所述低 能子带的结束点。

具体地, 第三确定单元可以具体用于根据如下公式 (8 ) 计算所述拟合斜 率: 其中, S为所述拟合斜率, M为所述邻域内所有点的个数, X m 为所述邻域 内所有点的能量值。

本发明实施例中,在合并单元和 /或删除单元对上述低能子带进行过滤(该 过滤可省略)之后, 对于每个低能子带的开始点和结束点的附近的 领域内的所 有点, 计算低能子带的边界点的拟合斜率, 从而增加对上述待检测音频信号中 是否存在频带丢失的判决条件,进而保证待检 测音频信号中频带丢失判断的准 确度。

在上述基础上, 判断模块 30可以具体用于: 若确定模块 20确定的所述低能 子带的带宽小于第三预设带宽, 则确定所述待检测音频信号不存在频带丢失; 或者, 若确定模块 20确定的所述低能子带的开始点大于预设界限 , 则确定所 述待检测音频信号不存在频带丢失; 或者, 若采样率大于或等于预设采样率, 且确定模块 20确定的所述低能子带的带宽大于第四预设带 ,则确定所述待检 测音频信号存在频带丢失; 或者, 若确定模块 20确定的所述低能子带的起始点 和结束点的拟合斜率的绝对值之和大于预设值 ,则确定所述待检测音频信号存 在频带丢失。

其中, 上述第三预设带宽可以为 300Hz或上述待检测音频信号的频带 (即 采样率的一半) 的二十分之一; 上述预设界限值可以为 19 千赫兹(KHz ) ; 若 上述采样率为 22 KHz , 则上述第四预设带宽为上述待检测音频信号的 频带的三 分之一; 上述预设值可以为 0. 08, 即低能子带的边界处能量变化非常快, 是被 滤除的, 所以应该为频带丢失。

另需说明的是, 若确定模块 20确定上述待检测音频信号存在频带丢失, 则 确定模块 20还可以用于计算丢失频带中所有点的平均能 ;若确定该平均能量 大于预设能量值,则判别上述待检测音频信号 中所丢失的频带中存在能量残留, 并保存判别结果; 或者, 若确定该平均能量小于或等于上述预设能量值 , 则判 别上述待检测音频信号中所丢失的频带中不存 在能量残留, 并保存判别结果。 对于待检测音频信号中所丢失频带存在能量残 留的情况,用户可以主观判断该 待检测音频信号失真;对于待检测音频信号中 所丢失频带不存在能量残留的情 况, 用户不能主观判断该待检测音频信号失真, 需采用本发明实施例提供的音 频质量检测方法进行判断。 因此, 本发明实施例提供的音频信号质量检测方法 实现音频信号质量的高效检测, 降低频带丢失的误判概率。

对于存在频带丢失的音频信号, 计算丢失频带中所有点的平均能量, 用于 判别音频信号中所丢失的频带中是否有能量残 留, 保存判别结果。例如将判别 结果保存在参数频带滤除判别结果 freLostType 中, 若该平均能量大于 1. 2, 则判别为存在能量残留 freLostType = 2 , 例如图 5所示; 否则, 判别为不存 在能量残留, freLostType = 1 , 例如图 6所示; 对于不存在频带缺失的音频, freLostType = 0 。

还需说明的是, 本发明任意实施例中, 所有的预设数值均可以根据实际需 求进行设置, 本发明中出现的具体数值只为方便说明为准, 不对其实际大小进 行限制。

图 7为本发明音频信号质量检测装置实施例二的 构示意图。 该实施例在 如图 1所示的实施例的基础上, 音频信号质量检测装置还可以包括: 分帧模块 40, 用于对上述待检测音频信号进行预设帧长的分 帧处理,得到分帧后的音频 信号;则获取模块 10可以具体用于获取分帧模块 40得到的所述分帧后的音频信 号中各帧音频信号的频谱向量,并计算所述各 帧音频信号的频谱向量的均值序 列; 将所述均值序列作为所述待检测音频信号的频 谱能量序列。 本实施例中, 先将待检测音频信号分帧, 预设帧长可以根据需求设置, 在 分帧过程中, 若最后一帧信号的长度不满足预设帧长, 则对其进行补零, 使得 每帧的长度达到预设帧长。 例如, 预设帧长可以为 2048点, 帧移为 1024点, 最 后一帧若不满 2048点, 则补零至一个预设帧长。此时, 获取模块 10在获取频谱 能量序列时, 需计算所述分帧后的音频信号中各帧音频信号 的频谱向量, 并根 据公式 (9 ) 计算所述各

其中, FP(t, j)表示第 t 帧音频信号的频谱向量, 为时域上的帧数。 公式(9 )是在根据公式(5 )计算得到每一帧音频信号的频谱向量的基础 上,对各帧音频信号的频谱向量在时域上求均 值,得到频谱能量序列。可选地, 还可以首先对分帧后的音频信号通过上述加窗 单元进行加窗处理,然后再通过 转换单元和运算单元得到频谱能量序列。

更进一歩地, 如图 8所示, 音频信号质量检测装置还可以包括: 滤除模块 50, 用于滤除所述待检测音频信号中直流分量, 得到滤波后信号; 则获取模块 10用于获取该滤波模块 50得到的所述滤波后信号的频谱能量序列。

具体地, 滤除模块可以具体用于根据如下公式(10 )滤除所述待检测音频 信号中直流分量, 得到滤波

其中, X (k)为所述滤波后信号, X(k)为所述待检测音频信号, h(r)为滤

波器, h(r , r = 0,1, · · · , - 1, c r)为 切比雪夫窗函数, ^为^ ^)的窗长, 音频信号在录制、存储和编辑过程均可能引入 直流分量, 而直流分量会干 扰音频信号自身的短时能量和频谱的计算。 因此, 本发明实施例对待检测音频 信号进行滤波处理, 从而提高音频信号频谱和短时能量的精确度。 另外, 由于 音频信号在 50赫兹(Hz ) 以下的信息都极少, 对听感几乎没有影响, 且滤除后 不干扰音频信号的质量, 也不影响音频信号的进一歩检测, 因此, 可选地, 滤 除 50Hz以下的频带, 以降低计算复杂度。

滤除模块采用切比雪夫窗函数滤波器 (Chebyshev Window Function Filter ), 可以很好的滤除 50Hz以下的子带, 并且获得很窄的 50HZ左右的过度 频带。 切比雪夫窗函数在时域和频域上的图形示例图 如图 9和图 10所示。

以下通过几组实验数据说明采用本发明实施例 提供的音频信号质量检测 装置对音频信号质量的检测结果:

第一组: 对中间子带缺失的音频信号进行检测, 其中, 在 266个音频信号 中有 250正常的音频信号和 16个含有中间频带缺失的音频信号, 一共含有 26个 中间频带缺失。 检测结果为 96. 3 %的召回率, 86. 5 %的准确率;

第二组: 对于高频缺失的音频信号进行检测, 在 297个音频信号中有 234 个音频信号含有高频缺失, 其他的为正常音频信号。 检测结果为 97. 4 %的召回 率, 100 %的准确率;

第三组: 对所有种类的频带缺失进行了检测, 在 2654个音频信号中, 共包 含各类子带缺失 332个。 检测结果为 93. 8 %的召回率, 96. 3 %的准确率。

综合上述实验结果可知,本发明实施例提供的 音频信号质量检测装置可以 有效的检测出待检测音频信号中存在的频带丢 失,且具有较高的准确率和召回 率。

采用如图 8所示的音频信号质量检测装置, 检测一时长为 60秒的待检测音 频信号, 采样率为 44. 1 KHz, 待检测音频信号波形如图 11所示, 其中, 横轴为 时间, 单位为秒; 纵轴为各采样点的幅值大小。

由图 11可见, 波形中间存在较强的直流分量, 且待检测音频波形整体向上 偏移, 因此, 首先通过切比雪夫窗函数进行高通滤波, 将直流分量滤除。 滤波 之后的结果如图 12所示, 其中, 横轴为时间, 单位为秒; 纵轴为各采样点的幅 值大小。 由图 12可见, 直流分量被滤除, 待检测音频信号波形整体以 0值基准 线上下对称; 计算滤波后信号的频谱, 所得频谱如图 13所示。

然后, 计算该频谱在时域上均值, 得到频谱能量序列, 如图 14所示; 根据 确定模块 20可以检测到该待检测音频信号中存在三个低 子带, 参考图 14, 分 别为: (2052 Hz , 4850 Hz ) , ( 9560 Hz , 10050 Hz ) 和 (16000 Hz , 22050 Hz ),计算上述三个低能子带的起始点和结束点 拟合斜率,分别为(-1. 25, 2. 25 ) , ( -0. 75 , 056 ) , (-0. 15 , 0 ) 。

最后, 判断模块 30根据上述三个低能子带, 对该待检测音频信号是否存在 频带丢失进行判别: 对于第三个低能子带, 由于是高频子带, 所以只考虑其起 始点的拟合斜率, 其斜率为 -0. 15, 小于低能判别阈值, 因此, 确定第三个低 能子带为正常子带,即单独从第三个低能子带 看,该待检测音频信号质量正常; 第二个低能子带的带宽为 490 Hz , 小于该待检测音频信号带宽的二十分之一 ( 1000Hz ) , 因此, 确定第二个低能子带为正常子带, 即单独从第二个低能子 带看, 该待检测音频信号质量正常; 第一个低能子带的带宽为 2850 Hz , 大于 该待检测音频信号带宽的二十分之一,且该第 一个低能子带为中间子带,另外, 该第一个低能子带的起始点和结束点的拟合斜 率绝对值之和大于低能判别阈 值, 因此, 确定第一个低能子带为异常子带, 即从第一个低能子带看, 该待检 测音频信号质量失真。

从上述分析结果可知,本发明实施例提供的音 频信号质量检测装置可以有 效的检测出待检测音频信号中存在的频带丢失 。

图 15为本发明音频信号质量检测方法实施例一的 程示意图。本发明实施 例提供一种音频信号质量检测方法,该方法可 以通过上述实施例中的音频信号 质量检测装置执行。 如图 15所示, 该方法包括:

S15 K 获取待检测音频信号的频谱能量序列。

具体地, 该频谱能量序列为 N维向量, 其中, N为对上述待检测音频信号进 行加窗处理的窗函数的窗长,该频谱能量序列 内各元素用于表征各采样点的频 谱能量。

5152、 根据上述频谱能量序列, 确定该待检测音频信号中的低能子带。

5153、 根据上述低能子带, 判别该待检测音频信号是否存在频带丢失, 若 确定该待检测音频信号存在频带丢失, 则确定该待检测音频信号质量失真。 本实施例的方法, 可以由图 1所示的音频信号质量检测装置执行, 各歩骤 作用可以参考上述音频信号质量检测装置实施 例中对应部件的功能,其实现原 理和技术效果类似, 此处不再赘述。

其中, 上述获取待检测音频信号的频谱能量序列可以 具体包括: 加窗处理 上述待检测音频信号, 得到加窗后的信号; 对该加窗后的信号进行 FFT, 得到 频域信号; 计算该频域信号的功率谱密度, 得到上述频谱能量序列。

在上述基础上, 上述对加窗后的信号进行 FFT, 得到频域信号之后, 音频 信号质量检测方法还可以包括: 获取短时频域信号, 该短时频域信号为上述频 域信号的前半部分或后半部分; 则上述计算频域信号的功率谱密度, 得到频谱 能量序列, 包括: 计算该短时频域信号的功率谱密度, 得到频谱能量序列。

其中,计算短时频域信号的功率谱密度,得到 频谱能量序列可以具体包括: 根据如下公式计算短时频域信号的功率谱密度 , 得到频谱能量序列:

p(j) = Kx|s(j)| : 1 = 1,2,· · ·,—

」 2

其中, S(j)为短时频域信号中的第 j个点, P(j)为 S(j)对应的功率谱密度, K为 为信号采样率, ω(η)为窗函数;

并根据如下公式得到频谱能量序列

SP(j) = log 10 [p(j) + ^

其中, SP( j)为 P(j)对应的频谱能量, 为趋于零的正数。

可选地, 上述计算短时频域信号的功率谱密度, 得到频谱能量序列, 还可 以包括: 根据如下公式对频谱能量序列进行预设平滑歩 长的平滑处理:

N

S (j) = -x ∑ [SP(i)], j = 0,l ..,

1 V 其中, SP (j)为平滑之后的频谱能量序列中的第 j个点, 为预设平滑歩 长, SP(i)为所述频谱能量序列中的第 i个点。 则根据所述频谱能量序列, 确定 待检测音频信号中的低能子带, 包括: 根据该平滑之后的频谱能量序列, 确定 上述待检测音频信号中的低能子带。 上述根据频谱能量序列,确定待检测音频信号 中的低能子带具体可以包括: 根据频谱能量序列中的最大值和均值, 确定低能判别阈值; 根据该低能判别阈 值, 确定低能子带。

具体地,根据频谱能量序列中的最大值和均值 ,确定低能判别阈值,包括: 根据如下公式确定低能判别阈值:

1 , max < 4

0.5 χ max, 0.75 x max≤ mean≤ max

σ =

0.3 x max, 0.5 x max≤ mean < 0.75 x max max≥ 4

0.36 x max, 0.25 x max≤ mean < 0.5 x max

0.3 x max, 0≤ mean < 0.25 x max 其中, σ为低能判别阈值, max为频谱能量序列中的最大值, mean为频谱 能量序列中的均值。

可选地, 根据频谱能量序列, 确定待检测音频信号中的低能子带, 还可以 包括: 若低能子带的带宽小于第一预设带宽, 则删除该低能子带; 和 /或, 若 相邻低能子带间的带宽间隔小于第二预设带宽 , 则合并该相邻低能子带。

进一歩地, 根据频谱能量序列, 确定待检测音频信号中的低能子带, 还可 以包括: 分别对低能子带的起始点和结束点的邻域内所 有点, 确定起始点和结 束点的拟合斜率;将起始点的拟合斜率中的最 大绝对值对应的点重新定位为低 能子带的起始点;将结束点的拟合斜率中的最 大绝对值对应的点重新定位为低 能子带的结束点。

需要说明的是, 分别对低能子带的起始点和结束点的邻域内所 有点, 确定 起始点和结束点的拟合斜率, 可以包括: 根据如下公式计算拟合斜率: 其中, S为拟合斜率, M为邻域内所有点的个数, X m 为邻域内所有点的能 丢失; 或者, 若低能子带的开始点大于预设界限值, 则确定待检测音频信号不 存在频带丢失; 或者, 若采样率大于或等于预设采样率, 且低能子带的带宽大 于第四预设带宽, 则确定待检测音频信号存在频带丢失; 或者, 若低能子带的 起始点和结束点的拟合斜率的绝对值之和大于 预设值,则确定待检测音频信号 存在频带丢失。

在上述基础上, 若确定待检测音频信号存在频带丢失, 则根据低能子带, 判别待检测音频信号是否存在频带丢失, 还可以包括: 计算丢失频带中所有点 的平均能量; 若确定该平均能量大于预设能量值, 则判别待检测音频信号中所 丢失的频带中存在能量残留, 并保存判别结果; 或者, 若确定该平均能量小于 或等于预设能量值,则判别待检测音频信号中 所丢失的频带中不存在能量残留, 并保存判别结果。

图 16为本发明音频信号质量检测方法实施例二的 程示意图。如图 16所示, 本实施例在图 15所示实施例的基础上, 音频质量检测方法还可以包括:

S161、 滤除待检测音频信号中直流分量, 得到滤波后信号。

具体地,根据如下公 滤除待检测音频信号中直流分量,得到滤波后 信号:

其中, X* (k)为滤波后信号, X(k)为待检测音频信号, h(r)为滤波器,

1, ωι (τ)为切比雪 夫窗函数, ^为^ ^)的窗长。 S162、 对滤波后信号进行预设帧长的分帧处理, 得到分帧后的音频信号。

S163、 获取分帧后的音频信号的频谱能量序列。

具体地, 获取分帧后的音频信号中各帧音频信号的频谱 向量, 并计算各帧 音频信号的频谱向量的均值序列;将该均值序 列作为待检测音频信号的频谱能 量序列。

该歩骤的详细说明可参考 S 151 , 此处不再赘述。

S 164和 S 165同上述实施例中 S152和 S153 , 此处不再赘述。 本发明实施例直接对待检测音频信号的频谱进 行分析,根据待检测音频信 号的频谱能量序列, 确定该待检测音频信号中包含的低能子带, 并根据该些低 能子带的带宽或边界特征等属性, 判别待检测音频信号是否存在频带丢失, 进 而确定所述待检测音频信号质量是否失真,从 而无需与源音频信号进行比较即 可获知待检测音频是否失真, 实现音频信号质量的高效检测, 并降低频带丢失 的误判概率。

本领域普通技术人员可以理解:实现上述各方 法实施例的全部或部分歩骤 可以通过程序指令相关的硬件来完成。前述的 程序可以存储于一计算机可读取 存储介质中。 该程序在执行时, 执行包括上述各方法实施例的歩骤; 而前述的 存储介质包括: 亂 RAM, 磁碟或者光盘等各种可以存储程序代码的介质 。

最后应说明的是: 以上各实施例仅用以说明本发明的技术方案, 而非对其 限制; 尽管参照前述各实施例对本发明进行了详细的 说明,本领域的普通技术 人员应当理解: 其依然可以对前述各实施例所记载的技术方案 进行修改, 或者 对其中部分或者全部技术特征进行等同替换; 而这些修改或者替换, 并不使相 应技术方案的本质脱离本发明各实施例技术方 案的范围。