Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND DEVICE FOR CODING/DECODING AUDIO SIGNALS
Document Type and Number:
WIPO Patent Application WO/2012/149843
Kind Code:
A1
Abstract:
Provided are a method and device for coding/decoding audio signals. The coding method includes: dividing the frequency band of an audio signal into a plurality of sub-bands and quantizing the sub-band normalization factor of each sub-band (101); determining the signal bandwidth for bit allocation according to the quantized sub-band normalization factors or according to the quantized sub-band normalization factors and bit rate information (102); allocating bits to the sub-bands in the determined signal bandwidth (103); and coding the spectral coefficients of the audio signal according to the allocated bits of each sub-band (104). In the present method, the signal bandwidth for bit allocation is determined according to the quantized sub-band normalization factors or the bit rate information during coding, so that the bits can be centralized to effectively code the signal bandwidth, improving the audio quality.

Inventors:
QI FENGYAN (CN)
LIU ZEXIN (CN)
MIAO LEI (CN)
Application Number:
PCT/CN2012/072778
Publication Date:
November 08, 2012
Filing Date:
March 22, 2012
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
HUAWEI TECH CO LTD (CN)
QI FENGYAN (CN)
LIU ZEXIN (CN)
MIAO LEI (CN)
International Classes:
G10L19/02; G10L19/032
Foreign References:
CN102208188A2011-10-05
CN101325059A2008-12-17
CN1255673A2000-06-07
JPH09153811A1997-06-10
US7580893B12009-08-25
JPH11234139A1999-08-27
Other References:
See also references of EP 2613315A4
Download PDF:
Claims:
权利要求书

1、 一种音频信号编码方法, 其特征在于, 包括:

将音频信号的频带分为多个子带, 量化每个子带的子带归一 化因子;

根据量化后的子带归一化因子, 或者根据量化后的子带归一 化因子和码率信息, 确定比特分配的信号带宽;

对所确定的信号带宽内的子带分配比特;

根据每个子带分配的比特, 对音频信号的频谱系数进行编码。

2、 如权利要求 1所述的方法, 其特征在于, 所述确定比特分 配的信号带宽, 包括:

将所述比特分配的信号带宽限定为所述音频信号的部分带 宽。

3、 如权利要求 2所述的方法, 其特征在于, 所述将所述比特 分配的信号带宽限定为所述音频信号的部分带宽包括:

根据所述码率信息确定比率因子, 所述比率因子大于 0且小 于或等于 1;

根据所述比率因子和量化后的子带归一化因子, 确定所述部 分带宽。

4、如权利要求 2所述的方法, 其特征在于, 所述将所述比特 分配的信号带宽限定为所述音频信号的部分带宽包括:

根据所述子带归一化因子获取所述音频信号的谐波等级或噪 声水平;

根据所述谐波等级或噪声水平确定比率因子, 所述比率因子 大于 0且小于或等于 1; 根据所述比率因子和量化后的子带归一化因子, 确定所述部 分带宽。

5、如权利要求 3或 4所述的方法, 其特征在于, 根据所述比 率因子和量化后的子带归一化因子, 确定所述部分带宽包括: 根据所述量化后的子带归一化因子, 获取每个子带内的频谱 能量;

从低频向高频累加每个子带内的频谱能量, 直至累加的频谱 能量大于所有子带的总频谱能量与所述比率因子的乘积,将当前子 带以下的带宽作为所述部分带宽。

6、 如权利要求 1-4任一项所述的方法, 其特征在于, 在将音 频信号的频带分为多个子带, 量化每个子带的子带归一化因子之 前, 所述方法还包括:

确定所述音频信号的帧属于谐波类型或非谐波类型; 如果所述音频信号的帧属于谐波类型,则继续执行所述方法。

7、 如权利要求 6所述的方法, 其特征在于, 确定所述音频 信号的帧属于谐波类型或非谐波类型, 包括:

获取所述帧的全部或部分子带中每个子带的峰均比; 在峰均比大于第一阈值的子带的数目大于或等于第二阈值 时,确定所述帧属于谐波类型,在峰均比大于第一阈值的子带的数 目小于第二阈值时, 确定所述帧属于非谐波类型。

8、 如权利要求 6所述的方法, 其特征在于, 所述将所述比 特分配的信号带宽限定为所述音频信号的部分带宽, 包括:

对属于谐波类型的帧, 将所述比特分配的信号带宽限定为所 述帧的部分带宽。

9、 如权利要求 1所述的方法, 其特征在于, 所述对所确定 的信号带宽内的子带分配比特包括:

对所确定的信号带宽内的子带的子带归一化因子进行调整; 根据调整后的子带归一化因子进行比特分配。

10、 如权利要求 9所述的方法, 其特征在于, 所述对所确定 的信号带宽内的子带的子带归一化因子进行调整, 包括: 将所述部分带宽的中间子带的子带归一化因子作为该中间子带之 后的每个子带的子带归一化因子。

11、 一种音频信号解码方法, 其特征在于, 包括: 获取量化后的子带归一化因子;

根据量化后的子带归一化因子, 或者根据量化后的子带归一 化因子和码率信息, 确定比特分配的信号带宽;

对所确定的信号带宽内的子带分配比特;

根据每个子带分配的比特, 对归一化频谱进行解码; 对解码后的归一化频谱进行噪声填充和带宽扩展, 得到归一 化的全频带频谱;

根据归一化的全频带频谱和子带归一化因子, 获得音频信号 的频谱系数。

12、 如权利要求 11所述的方法, 其特征在于, 所述确定比特 分配的信号带宽, 包括:

将所述比特分配的信号带宽限定为所述音频信号的部分带 宽。

13、如权利要求 12所述的方法, 其特征在于, 所述将所述比 特分配的信号带宽限定为所述音频信号的部分带宽, 包括:

根据所述码率信息确定比率因子, 所述比率因子大于 0且小 于或等于 1; 根据所述比率因子和量化后的子带归一化因子, 确定所述部 分带宽。

14、如权利要求 12所述的方法, 其特征在于, 所述将所述比 特分配的信号带宽限定为所述音频信号的部分带宽, 包括:

根据所述子带归一化因子获取所述音频信号的谐波等级或噪 声水平;

根据所述谐波等级或噪声水平确定比率因子, 所述比率因子 大于 0且小于或等于 1;

根据所述比率因子和量化后的子带归一化因子, 确定所述部 分带宽。

15、 如权利要求 13或 14所述的方法, 其特征在于, 根据所 述比率因子和量化后的子带归一化因子,确定所述部分带宽,包括: 根据所述量化后的子带归一化因子, 获取每个子带内的频谱 能量;

从低频向高频累加每个子带内的频谱能量, 直至累加的频谱 能量大于所有子带的总频谱能量与所述比率因子的乘积,将当前子 带以下的带宽作为所述部分带宽。

16、 如权利要求 11所述的方法, 其特征在于, 所述对解码后 的归一化频谱进行噪声填充和带宽扩展, 得到归一化的全频带频 谱, 包括:

艮据当前帧和所述当前帧的前 N帧的比特分配,确定第一频 带, 其中 N为正整数;

根据第一频带的频谱系数, 获得高频频带的频谱系数。

17、如权利要求 16所述的方法, 其特征在于, 所述根据当前 帧和所述当前帧的前 N帧的比特分配, 确定第一频带, 包括: 获取所述当前帧分配的比特和所述前 N帧分配的比特之间的 相关性;

根据所获取的相关性, 确定所述第一频带。

18、 如权利要求 16所述的方法, 其特征在于, 还包括: 根据子带归一化因子, 获得噪声水平;

利用所获得的噪声水平, 调整所述高频频带内的背景噪声。

19、如权利要求 16所述的方法, 其特征在于, 所述根据第一 频带的频谱系数, 获得高频频带的频谱系数, 包括:

根据频谱平坦度信息和高频带信号类型获得归一化长度; 使用所获得的归一化长度对所述第一频带的频谱系数进行归一化 处理;

将归一化处理后的第一频带的频谱系数作为所述高频频带的 频谱系数。

20、如权利要求 19所述的方法, 其特征在于, 所述频谱平坦 度信息包括:

所述第一频带中每个子带的均峰比、 所述第一频带对应的时 域信号的相关性、 或者所述第一频带对应的时域信号的过零率。

21、 一种音频信号编码设备, 其特征在于, 包括: 量化单元,用于将音频信号的频带分为多个子带,量化每个子带的 子带归一化因子;

第一确定单元, 用于根据量化后的子带归一化因子, 或者根 据量化后的子带归一化因子和码率信息, 确定比特分配的信号带 宽;

第一分配单元, 用于对所述第一确定单元确定的信号带宽内 的子带分配比特; 编码单元, 用于根据所述第一分配单元为每个子带分配的比 特, 对音频信号的频谱系数进行编码。

22、如权利要求 21所述的设备, 其特征在于, 所述第一确定 单元具体用于将所述比特分配的信号带宽限定为所述音频信号的 部分带宽。

23、如权利要求 22所述的设备, 其特征在于, 所述第一确定 单元包括:

第一比率因子确定模块, 用于根据所述码率信息确定比率因 子, 所述比率因子大于 0且小于或等于 1 ;

第一带宽确定模块, 用于根据所述比率因子和量化后的子带 归一化因子, 确定所述部分带宽。

24、如权利要求 22所述的设备, 其特征在于, 所述第一确定 单元包括:

第二比率因子确定模块, 用于根据所述子带归一化因子获取 所述音频信号的谐波等级或噪声水平,根据所述谐波等级或噪声水 平确定比率因子, 所述比率因子大于 0且小于或等于 1 ;

第一带宽确定模块, 用于根据所述比率因子和量化后的子带 归一化因子, 确定所述部分带宽。

25、 如权利要求 23或 24所述的设备, 其特征在于, 所述第 一带宽确定模块具体用于根据所述量化后的子带归一化因子,获取 每个子带内的频谱能量,并从低频向高频累加每个子带内的频谱能 量,直至累加的频谱能量大于所有子带的总频谱能量与所述比率因 子的乘积, 将当前子带以下的带宽作为所述部分带宽。

26、 如权利要求 22所述的设备, 其特征在于, 还包括: 分类单元, 用于确定所述音频信号的帧属于谐波类型或非谐 波类型;如果所述音频信号的帧属于谐波类型,则触发所述量化单 元。

27、如权利要求 21所述的设备, 其特征在于, 所述第一分配 单元包括:

子带归一化因子调整模块, 用于对所确定的信号带宽内的子 带的子带归一化因子进行调整;

比特分配模块,用于根据调整后的子带归一化因子进行比特 分配。

28、 一种音频信号解码设备, 其特征在于, 包括: 获取单元, 用于获取量化后的子带归一化因子;

第二确定单元, 用于根据量化后的子带归一化因子, 或者根 据量化后的子带归一化因子和码率信息, 确定比特分配的信号带 宽;

第二分配单元,用于对所述第二确定单元确定的信号带宽内 的子带分配比特;

解码单元,用于根据所述第二分配单元为每个子带分配的比 特, 对归一化频谱进行解码;

扩展单元,用于对所述解码单元解码后的归一化频谱进行噪 声填充和带宽扩展, 得到归一化的全频带频谱;

恢复单元,用于根据所述扩展单元得到的归一化的全频带频 谱和子带归一化因子, 获得音频信号的频谱系数。

29、 如权利要求 28所述的设备, 其特征在于, 所述第二确 定单元具体用于将所述比特分配的信号带宽限定为所述音频信号 的部分带宽。

30、 如权利要求 29所述的设备, 其特征在于, 所述第二确 定单元包括:

第三比率因子确定模块, 用于根据所述码率信息确定比率因 子, 所述比率因子大于 0且小于或等于 1 ;

第二带宽确定模块, 用于根据所述比率因子和量化后的子带 归一化因子, 确定所述部分带宽。

31、 如权利要求 29所述的设备, 其特征在于, 所述第二确 定单元包括:

第四比率因子确定模块,用于根据所述子带归一化因子获取 所述音频信号的谐波等级或噪声水平,根据所述谐波等级或噪声水 平确定比率因子, 所述比率因子大于 0且小于或等于 1 ;

第二带宽确定模块,用于根据所述比率因子和量化后的子带 归一化因子, 确定所述部分带宽。

32、如权利要求 30或 31所述的设备, 其特征在于, 所述第 二带宽确定模块具体用于根据所述量化后的子带归一化因子,获取 每个子带内的频谱能量,并从低频向高频累加每个子带内的频谱能 量,直至累加的频谱能量大于所有子带的总频谱能量与所述比率因 子的乘积, 将当前子带以下的带宽作为所述部分带宽。

33、 如权利要求 28所述的设备, 其特征在于, 所述扩展单 元包括:

第一频带确定模块, 用于根据当前帧和所述当前帧的前 N 帧的比特分配, 确定第一频带, 其中 N为正整数;

频谱系数获耳 ^莫块,用于根据第一频带的频谱系数,获得高频频带 的频谱系数。

34、 如权利要求 33所述的设备, 其特征在于, 还包括: 调整单元, 用于根据子带归一化因子, 获得噪声水平, 并利 用所获得的噪声水平, 调整所述高频频带内的背景噪声。

35、 如权利要求 33所述的设备, 其特征在于, 所述频谱系 数获取模块具体用于根据频谱平坦度信息和高频带信号类型获得 归一化长度 ,使用所获得的归一化长度对所述第一频带的频谱系数 进行归一化处理,并将归一化处理后的第一频带的频谱系数作为所 述高频频带的频谱系数。

Description:
音频信号编解码方法和 i殳备

技术领域

本发明实施例涉及音频编解码技术领域, 并且更具体地, 涉及 音频信号编解码方法和设备。

发明背景

目前的通信传输越来越重视音频的质量,所以 要求编解码时在 保证语音质量的前提下要尽可能地提高音乐质 量。由于音乐信号信 息量极为丰富, 不能采用传统语音的 CELP ( Code Exc i ted Linear Predict ion, 码激励线性预测)编码模式, 通常是利用变换编码的 方法, 在频域来处理音乐信号, 提升音乐信号的编码质量。但如何 有效地用有限的编码比特高效率的编码信息成 为目前音频编码的 主要研究课题。

目前的音频编码技术通常采用 FFT ( Fas t Four i er Transform, 快速傅立叶变换 )或 MDCT ( Modif ied Di screte Cos ine Transform, 改进离散余弦变换 )将时域信号转换到频域,然后对频域信号进 编码。由于在低比特率下有限的量化比特不能 满足量化所有的音频 信号, 所以一般还要采用 BWE ( Bandwidth Extens ion 频带扩展) 技术和频谱填充技术。

在编码端,首先将输入的时域信号变换到频域 ,在频域提取子 带归一化因子, 即频谱的包络信息。然后用量化后的子带归一 化因 子对频谱进行归一化,得到归一化的频谱信息 。然后确定各子带的 比特分配,对归一化的频谱进行量化,这样音 频信号就被编码为量 化的包络信息和归一化的频谱信息, 输出比特率流。

解码端是编码端的逆过程。低速率编码时编码 端不能编码所有 频带, 在解码端需要用带宽扩展技术来恢复编码端没 有编码的频 带。 同时编码的子带由于量化器的限制也会出现较 多的零频点,需 要噪声填充模块来提升性能。最后用解码后的 子带归一化因子应用 到解码后的归一化频谱系数得到重建频谱系数 ,然后进行反变换得 到输出的时域音频信号。

但是,在编码过程中, 高频谐波会分到一些零散的比特进行编 码,但在时间轴上分布并不连续,使得解码时 重建的高频谐波时断 时续, 会引入过多噪声, 重建音频质量差。 发明内容

本发明实施例提供一种音频信号编解码方法和 设备,能够提高 音频质量。

一方面, 提供了一种音频信号编码方法, 包括: 将音频信号的 频带分为多个子带,量化每个子带的子带归一 化因子;根据量化后 的子带归一化因子, 或者根据量化后的子带归一化因子和码率信 息,确定比特分配的信号带宽;对所确定的信 号带宽内的子带分配 比特;根据每个子带分配的比特,对音频信号 的频谱系数进行编码。 另一方面, 提供了一种音频信号解码方法, 包括: 获取量化后的子 带归一化因子;根据量化后的子带归一化因子 ,或者根据量化后的 子带归一化因子和码率信息,确定比特分配的 信号带宽;对所确定 的信号带宽内的子带分配比特;根据每个子带 分配的比特,对归一 化频谱进行解码; 对解码后的归一化频谱进行噪声填充和带宽扩 展,得到归一化的全频带频谱;根据归一化的 全频带频谱和子带归 一化因子, 获得音频信号的频谱系数。

另一方面, 提供了一种音频信号编码设备, 包括: 量化单元, 用于将音频信号的频带分为多个子带,量化每 个子带的子带归一化 因子; 第一确定单元, 用于根据量化单元量化的子带归一化因子, 或者根据量化后的子带归一化因子和码率信息 ,确定比特分配的信 号带宽; 第一分配单元,用于对第一确定单元确定的信 号带宽内的 子带分配比特;编码单元,用于根据分配单元 为每个子带分配的比 特, 对音频信号的频谱系数进行编码。

另一方面, 提供了一种音频信号解码设备, 包括: 获取单元, 用于获取量化后的子带归一化因子; 第二确定单元,用于根据获取 单元获取的量化后的子带归一化因子,或者根 据量化后的子带归一 化因子和码率信息, 确定比特分配的信号带宽; 第二分配单元, 用 于对第二确定单元确定的信号带宽内的子带分 配比特; 解码单元, 用于根据第二分配单元为每个子带分配的比特 ,对归一化频谱进行 解码;扩展单元,用于对解码后的归一化频谱 进行噪声填充和带宽 扩展, 得到归一化的全频带频谱; 恢复单元, 用于根据归一化的全 频带频谱和子带归一化因子, 获得音频信号的频谱系数。

本发明实施例在编解码过程中,根据量化后的 子带归一化因子 或码率信息,确定比特分配的信号带宽,从而 能够集中比特数对所 确定的信号带宽进行有效编解码, 提高音频质量。 附图简要说明

为了更清楚地说明本发明实施例的技术方案, 下面将对实施例 描述中所需要使用的附图作筒单地介绍,显而 易见地,下面描述中 的附图是本发明的一些实施例,对于本领域普 通技术人员来讲,在 不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附 图 1是本发明一个实施例的音频信号编码方法的 程图。 图 2是本发明一个实施例的音频信号解码方法的 程图。 图 3是本发明一个实施例的音频信号编码设备的 图。

图 4是本发明另一实施例的音频信号编码设备的 图。

图 5是本发明一个实施例的音频信号解码设备的 图。

图 6是本发明另一实施例的音频信号解码设备的 图。 实施本发明的方式

下面将结合本发明实施例中的附图,对本发明 实施例中的技术 方案进行清楚、 完整地描述, 显然, 所描述的实施例是本发明一部 分实施例, 而不是全部的实施例。基于本发明中的实施例 , 本领域 普通技术人员在没有作出创造性劳动前提下所 获得的所有其他实 施例, 都属于本发明保护的范围。

图 1是本发明一个实施例的音频信号编码方法的 程图。 101 , 将音频信号的频带分为多个子带, 量化每个子带的子带 归一化因子。

下面以 MDCT变换为例进行描述。 首先对输入的音频信号进行 MDCT变换, 得到频域系数。 这里的 MDCT变换可包括加窗、 时域混 叠和离散 DCT变换几个过程。

例如对输入时域信号 x ( n )加正弦窗 n = 0,..., 2L-l L为信号的帧长

得到加窗后的信号为: h (n) o m (n), n = 0,..., L-l

h(n)x(n- L), n = L,..., 2L-l

( 2 )

然后进行时域混叠操作:

这里的 和」 U2分别表示为阶数为 L/ 2 的对角矩阵:

对时域混叠信号做离散 DCT变换,最终得到频域的 MDCT系数:

然后从 MDCT系数中提取频域包络并量化。 将整个频带分成一 些不同频域分辨率的子带,提取每个子带的归 一化因子,并量化子 带归一化因子。

例如对于 32kHz采样的音频信号, 对应 16kHz带宽的频带, 如 帧长为 20ms ( 640样点), 则可以按照如下表 1中的形式分子带。

分组的子带划

子带内 系 组内子 组 内 总 带宽(Hz) 开始频点 结束频点 数个数 带数 系 数个 (Hz) (Hz) 数 8 16 128 3200 0 3200I 16 8 128 3200 3200 6400I I 24 12 288 7200 6400 13600

首先分成几个组, 然后组内再细化子带,每个子带的归

子可定义为:

Norm(p)

这里 是子带内的系数个数, S P是子带的起始点, E P是子带的 结束点, P为总共的子带数。

得到归一化因子后, 可以在对数域对其进行量化,得到量化后 的子带归一化因子 wnorm。

102 , 根据量化后的子带归一化因子, 或者根据量化后的子带 归一化因子和码率信息, 确定比特分配的信号带宽。

可选地,在一个实施例中,可将比特分配的信 号带宽 sfm_ 1 imi t 限定为音频信号的部分带宽,例如低频上的部 分带宽(Tsfm_ l imi t 或者中间的部分带宽。

在一个例子中,在限定比特分配带宽 sfm_ l imi t时, 可根据码 率信息确定比率因子 fact ,该比率因子 fact大于 0且小于或等于 1。 在一个实施例中, 码率越小, 则比率因子越小。 例如, 可按照 如下表 1得到不同的码率取对应的 fact值。

表 2 码率和 fact值对应表:

码率 24kpbs 0.8

32kbps 0.9

48kpbs 0.95

>64kbps 1

或者, 也可以根据等式得到 fact , 例如 f ac t=qx (0.5+ bitrate-value/128000) , 其中 bi trate—value 为码率的值如 24000, q为修正因子。 例如可以设 d=l。 本发明实施例不限于这些 具体数值示例。

然后根据该比率因子 fact和量化后的子带归一化因子 wnorm, 确定上述部分带宽。可根据量化后的子带归一 化因子,获取每个子 带内的频谱能量,并从低频向高频累加每个子 带内的频谱能量,直 至累加的频谱能量大于所有子带的总频谱能量 与比率因子 fact的 乘积, 将当前子带以下的带宽作为部分带宽。

举例来说, 可以首先设定一个最低累计频点, 求出低于此频点 的各子带的频谱能量和 energy_low。 可按照以下等式, 根据自带 归一化因子获得频谱能量:

q

energy― low = ^ wnorm( p) , q≤ P - 1

ρ= 0 (7) 其中, q为设定的最低累计频点对应的子带。

依次类推, 继续增加子带, 直至求出所有子带的总频谱能量 energy_sum。

在 energy_low的基础上, 从低频向高频逐一增加子带, 累加 得到频谱能量 energy— limit, 并判断是否满足 energy.1 imi t > factxenergy_sum 0 如果不满足, 则继续累加子带的频谱能量。 如 果满足,则当前子带作为所限定的部分带宽的 最后一个子带,输出 当前子带的编号 sfm_limit, 用以表征所限定的部分带宽, 即 0 sfm_limit;。

上面的例子中, 使用码率信息确定比率因子 fact。 在另一个 例子中, fact 可以通过子带归一化因子进行确定。 例如, 首先根 据子带归一化因子获取音频信号的谐波等级或 噪声水平 noise-leveh 一般而言, 音频信号的谐波等级越大, 则噪声水平 越小。 下面以噪声水平为例进行说明。 可按照下式获得噪声水平 noise_level。

sftii-1

|wnorm(i + 1) _ wnorm(i)|

noise ― level =― s―nii-l

V wnorm(i)

- (8) 其中 wnorm为解码的子带归一化因子, sfm为整个频带的子带 数。

当 noise-level较大时, fact也较大; 当 noise-level较小 时, fact 也较小。 如果以谐波等级作为参数, 则当谐波等级较大 时, fact较小; 当谐波等级越小时, fact较大。

应注意,虽然上面以 0 _ sfm_limit的低频部分带宽为例进行了 说明, 但本发明实施例不限于此。 根据需要, 上述部分带宽也可以 是其他形式的,例如,可以是某一非零低频点 到 sfm_limit之间的 部分带宽。 这些变化均落入本发明实施例的范围内。

103, 对所确定的信号带宽内的子带分配比特。

根据确定的信号带宽内子带的 wnorm值, 进行比特分配, 可以 采用如下的迭代方法: a)找到最大的丽 orm值对应的子带,分配一 定比特; b)然后对此子带的 wmorm值做相应的较少; c)重复 a ~ b 步骤, 直到比特分配完毕。 104, 根据每个子带分配的比特, 对音频信号的频谱系数进行 编码。

例如, 编码系数可以采用的格形矢量量化方案, 或其它量化

MDCT频谱系数的现有方案。

本发明实施例在编解码过程中,根据量化后的 子带归一化因子 或码率信息,确定比特分配的信号带宽,从而 能够集中比特数对所 确定的信号带宽进行有效编解码, 提高音频质量。

例如, 当所确定的信号带宽为低频部分的(Tsfm_limit , 在 该信号带宽(Tsfn limit内进行比特分配。通过限制进行比特分配 的带宽 sfm_limit,使得在低码率下更能集中比特数对选 的频带 进行有效编码,也使得对未被编码的频带进行 带宽扩展更有效。这 主要是因为如果不做比特分配带宽的限制,高 频谐波会分到一些零 散的比特进行编码,但在时间轴上分布并不连 续,使得重建高频谐 波时断时续。如果通过限制比特分配带宽将这 些零散比特更集中地 分到低频,使得低频信号编码更好, 而高频谐波通过低频信号进行 带宽扩展, 这样就会使高频谐波信号更加连续。

可选地, 在一个实施例中, 在图 1的 103中, 在确定比特分配 的信号带宽 sfm_limit后进行比特分配时,还可以先对该带宽 内的 子带的子带归一化因子做一定的调整,使得在 带宽中高频段能分 配更多的比特。调整的强度可自适应码率。 这主要考虑的是, 如果 这个带宽内的较低频带能量较大分得的比特较 多,对于量化所需比 特已经饱和,则可以通过这个调整来增加这个 频带内中高频的量化 比特,这样能编出更多谐波,对更高频的带宽 扩展也有好处。例如, 将部分带宽的中间子带的子带归一化因子作为 该中间子带之后的 每个子带的子带归一化因子,即可将第 sfm_limit/2个子带的归一 化因子作为频带 sfm_ l imi t/2 _ sfm_ l imi t范围内的各个子带的子 带归一化因子。如果 sfm_ l imi t/2不是整数,则可以向上或向下取 整。 此时, 在进行比特分配时, 可使用调整后的子带归一化因子。

另外,根据本发明的另一个实施例, 在应用本发明实施例的编 解码方法时, 可以进一步考虑音频信号帧分类。 这样, 本发明实施 例能够针对不同的分类采取不同的编解码策略 ,从而提升不同信号 的编解码质量。如音频信号可以分成 No i se (噪声)、 Harmonic (谐 波)、 Trans ient (瞬时)等多种类型。一般将类噪声信号分成 Noi se 模式, 此时频谱比较平坦; 将有时域陡变的信号分成 Trans i ent 模式, 此时频谱也比较平坦; 将谐波性较强的信号分成 Harmonic 模式, 此时频谱变化较大, 包含信息较多。

下面以谐波类型和非谐波类型这两类进行描述 。本发明实施例 可在图 1的 101之前,确定音频信号的帧属于谐波类型或非 谐波类 型, 如果该音频信号的帧属于谐波类型, 则继续执行图 1的方法。 具体地,对于谐波类型的帧,可按照图 1的实施例限定比特分配的 信号带宽, 即,将该帧的比特分配的信号带宽限定为该帧 的部分带 宽。对于非谐波类型的帧,可以按照图 1的实施例限定比特分配的 信号带宽为部分带宽, 也可以不对比特分配的信号带宽进行限定, 例如, 将这类帧的比特分配带宽确定为该帧的全部带 宽。

可按照峰均比对音频信号帧进行分类。 例如, 获取该帧的全部 或部分子带(例如, 高频的部分子带)中每个子带的峰均比。 峰均 比是指该子带的峰值能量或幅度与该子带的平 均能量或幅度的比 值。 在峰均比大于第一阈值的子带的数目大于或等 于第二阈值时, 确定该帧属于谐波类型,在峰均比大于第一阈 值的子带的数目小于 第二阈值时,确定该帧属于非谐波类型。上述 第一阈值和第二阈值 可根据需要而设定或改变。

但是, 本发明实施例不限于根据峰均比参数进行分类 的例子, 也可以根据其他参数进行分类。

通过限制进行比特分配的带宽 sfm_ l imi t , 使得在低码率下更 能集中比特数对选定的频带进行有效编码,也 使得对未被编码的频 带进行带宽扩展更有效,这主要是因为如果不 做比特分配带宽的限 制, 高频谐波会分到一些零散的比特进行编码,但 在时间轴上分布 并不连续,使得重建高频谐波时断时续,如果 通过限制比特分配带 宽将这些零散比特更集中地分到低频,使得低 频信号编码更好, 而 高频谐波通过低频信号进行带宽扩展,这样就 使高频谐波信号更 力口连续。

上面描述了编码端的处理过程, 解码端是编码端的逆过程。 图

2是本发明一个实施例的音频信号解码方法 流程图。

201 , 获取量化后的子带归一化因子。

可通过解码比特流, 获取量化后的子带归一化因子。

202 , 根据量化后的子带归一化因子, 或者根据量化后的子带 归一化因子和码率信息, 确定比特分配的信号带宽。 202 类似于 图 1中的 102 , 因此不再重复描述。

203 ,对所确定的信号带宽内的子带分配比特。 203类似于图 1 中的 103 , 因此不再重复描述。

204 , 根据每个子带分配的比特, 对归一化频谱进行解码。

205 , 对解码后的归一化频谱进行噪声填充和带宽扩 展, 得到 归一化的全频带频谱。

206 , 根据归一化的全频带频谱和子带归一化因子, 获得音频 信号的频谱系数。 例如 ,将每个子带的归一化频谱与该子带的子带归 化因子相 乘, 恢复得到音频信号的频谱系数。

本发明实施例在编解码过程中,根据量化后的 子带归一化因子 或码率信息,确定比特分配的信号带宽,从而 能够集中比特数对所 确定的信号带宽进行有效编解码, 提高音频质量。

本发明实施例对于 205 中噪声填充和带宽扩展的执行顺序没 有限制。可以先执行噪声填充再执行带宽扩展 ,也可以先执行带宽 扩展再执行噪声填充。另外,本发明实施例可 以对一部分频带先执 行带宽扩展,对于另一部分频带先执行噪声填 充。这些变化均落入 本发明实施例的范围内。

在编码子带时由于量化器的限制会出现较多零 频点,通常可以 填充一些噪声, 使得重建音频信号听起来更自然。

如果先执行噪声填充,对于填充噪声后的归一 化频谱, 可进行 带宽扩展, 得到归一化的全频带频谱。 例如, 可根据当前帧及其前

Ν帧的比特分配, 确定第一频带, 作为要拷贝 (copy )的频带。 其 中 N为正整数。一般希望选择较连续的有比特分 的多个子带作为 第一频带的范围。 然后, 根据第一频带的频谱系数, 获得高频频带 的频谱系数。

以 N=l为例, 可选地, 在一个实施例中, 可获取当前帧分配的 比特和前 N帧分配的比特之间的相关性, 并根据所获取的相关性, 确定上述第一频带。 例如, 设当前帧分配的比特为 R-current , 前 一帧分配的比特为 R_previous , 将它们相乘得到这些比特之间的 相关性 R_correlat ion。

得到相关性之后, 从有比特分配的最高频带 las t _ sfm向低频 搜索, 寻找第一个满足 R_correlat ion≠0 的子带, 说明该当前帧 和前一帧均有比特分配。 假设该子带的编号为 top_band。

在一个实施例中, 可将得到的 top_band作为第一频带上限, top.band/2 作为第一频带下限。 如果前一帧的第一频带下限和当 前帧的第一频带下限的差值小于 1kHz, 则可将前一帧的第一频带 下限作为当前帧的第一频带下限。这主要是为 了保证进行扩展的第 一频带的连续性,从而保证扩展出的高频频谱 连续。然后緩存当前 中贞的 R-current, 作为下一中贞的 R_previous。 如果 top-band/2不 是整数, 可以向上或向下取整。

在带宽扩展时, 向高频频带 last_sfm _ high_sfm拷贝第一频 带 top-band/2 ~ top-band的频谱系数。

上面描述了先执行噪声填充的例子。 本发明实施例不限于此, 也可以先执行带宽扩展,在扩展后的全频带上 填充背景噪声。噪声 填充的方法可以与上面的例子相似。

另外, 对于高频频带部分, 例如上述 last_sfm _ high_sfm范 围, 可以用解码端估计出的 noise_level 值, 进一步调整频带 last-sfm- high_sfm范围内填充的背景噪声。 noise—level的计算 方式可参照上面的等式( 8 )。 noise-level是通过解码后的子带归 一化因子得到的,用来区分填充噪声的强度等 级, 因此不用传编码 比特。

可按照如下方式,利用所获得的噪声水平调整 高频频带内的背 景噪声。

y(k) = ( (1 - noise _ level ) * y norm (k) + noise _ level * noise _ CB(k) ) * wnor m (9) 其中, U k )为解码后的归一化系数, nQise— CBG 为噪声码书。 这样, 高频谐波通过低频信号进行带宽扩展, 能够使得高频谐 波信号更加连续, 保证了音频质量。

上面给出了直接拷贝第一频带的频谱系数的例 子。本发明也可 以先调整第一频带的频谱系数,然后使用调整 后的频谱系数进行带 宽扩展, 以进一步提升高频频带的性能。

可根据频谱平坦度信息和高频带信号类型获得 归一化长度,使 用所获得的归一化长度对第一频带的频谱系数 进行归一化处理,并 将归一化处理后的第一频带的频谱系数作为高 频频带的频谱系数。

上述频谱平坦度信息可包括: 第一频带中每个子带的均峰比、 第一频带对应的时域信号的相关性、或者第一 频带对应的时域信号 的过零率。下面以均峰比为例进行说明,但是 本发明实施例不限于 此,也可以类似地使用其他频谱平坦度信息进 行调整。峰均比是指 某一子带的峰值能量或幅度与该子带的平均能 量或幅度的比值。

首先根据第一频带的频谱系数求出第一频带中 每个子带的峰 均比,依据峰均比的值及其子带内最大峰值来 判断此子带是否为谐 波性子带,并累记具有谐波性子带的个数 n_band,然后根据 n_band 及高频带本身的信号类型来 自 适应确定归一化长度 l ength. norm. harm: n band

length _ norm— harm = a * \ 1 + -

M 其中 M为第一频带的子带数。 a自适应信号类型,如是谐波信 号, 则《> 1。

然后可使用所获得的归一化长度对第一频带的 频谱系数进行 归一化处理,并将归一化处理后的第一频带的 频谱系数作为高频频 带的频谱系数。

上面描述了提升带宽扩展性能的一个例子,其 他相应能提升带 宽扩展性能的算法也能用在本发明中。

另外, 类似于编码端, 解码端也可以进一步考虑音频信号帧分 类。这样,本发明实施例能够针对不同的分类 采取不同的编解码策 略,从而提升不同信号的编解码质量。对音频 信号帧进行分类的方 法可参照编码端所述, 因此不再赘述。

可从码流中提取指示帧类型的分类信息。 对于谐波类型的帧, 可按照图 2的实施例限定比特分配的信号带宽, 即,将该帧的比特 分配的信号带宽限定为该帧的部分带宽。对于 非谐波类型的帧,可 以按照图 2的实施例限定比特分配的信号带宽为部分带 ,也可以 按照现有技术, 不对比特分配的信号带宽进行限定, 例如, 将这类 帧的比特分配带宽确定为该帧的全部带宽。

在获得全带的频谱系数之后, 经过频域反变换, 可以得到重建 的时域音频信号。因此,本发明实施例能够提 升谐波性信号的质量, 同时没有降低非谐波性信号的质量。

图 3是本发明一个实施例的音频信号编码设备的 图。图 3的 音频信号编码设备 30包括量化单元 31、第一确定单元 32、第一分 配单元 33和编码单元 34。

量化单元 31将音频信号的频带分为多个子带, 量化每个子带 的子带归一化因子。第一确定单元 32根据量化单元 31量化的子带 归一化因子,或者根据量化后的子带归一化因 子和码率信息,确定 比特分配的信号带宽。第一分配单元 33对第一确定单元 32确定的 信号带宽内的子带分配比特。 编码单元 34 根据第一分配单元 33 为每个子带分配的比特, 对音频信号的频谱系数进行编码。

本发明实施例在编解码过程中,根据量化后的 子带归一化因子 或码率信息,确定比特分配的信号带宽,从而 能够集中比特数对所 确定的信号带宽进行有效编解码, 提高音频质量。

图 4是本发明另一实施例的音频信号编码设备的 图。图 4的 音频信号编码设备 40中, 与图 3相同或相似的部分使用相同的附 图标记表示。

在确定比特分配的信号带宽时, 第一确定单元 32可将比特分 配的信号带宽限定为音频信号的部分带宽。 例如, 如图 4所示, 第 一确定单元 32可包括第一比率因子确定模块 321。 第一比率因子 确定模块 321可根据码率信息确定比率因子 fact , 比率因子 fact 大于 Q且小于或等于 1。 可替换地, 第一确定单元 32可包括第二 比率因子确定模块 322 , 替代第一比率因子确定模块 321。 第二比 率因子确定模块 322 根据子带归一化因子获取音频信号的谐波等 级或噪声水平, 根据谐波等级或噪声水平确定比率因子 fact。

另外, 第一确定单元 32还包括第一带宽确定模块 323。 在得 到比率因子 fac t 之后, 第一带宽确定模块 323 可根据比率因子 fact和量化后的子带归一化因子, 确定上述部分带宽。

可选地,在一个实施例中, 第一带宽确定模块 323在确定上述 部分带宽时,根据量化后的子带归一化因子, 获取每个子带内的频 谱能量,并从低频向高频累加每个子带内的频 谱能量,直至累加的 频谱能量大于所有子带的总频谱能量与比率因 子 fact的乘积, 将 当前子带以下的带宽作为上述部分带宽。

在考虑分类信息的情况下, 音频信号编码设备 40还可以包括 分类单元 35 , 用于对音频信号的帧进行分类。 例如分类单元 35可 确定音频信号的帧属于谐波类型或非谐波类型 ,如果该音频信号的 帧属于谐波类型, 则触发量化单元 31。 在一个实施例中, 可根据 均峰比确定帧的类型。 例如, 分类单元 35获取该帧的全部或部分 子带中每个子带的峰均比,在峰均比大于第一 阈值的子带的数目大 于或等于第二阈值时,确定该帧属于谐波类型 ,在峰均比大于第一 阈值的子带的数目小于第二阈值时,确定该帧 属于非谐波类型。此 时第一确定单元 32对属于谐波类型的帧, 可以将比特分配的信号 带宽限定为该帧的部分带宽。

可选地, 在另一实施例中, 第一分配单元 33可包括子带归一 化因子调整模块 331和比特分配模块 332。子带归一化因子调整模 块 331对所确定的信号带宽内的子带的子带归一化 因子进行调整, 比特分配模块 332根据调整后的子带归一化因子进行比特分配 。例 如,第一分配单元 33可将第一确定单元 32所确定的部分带宽的中 间子带的子带归一化因子作为该中间子带之后 的每个子带的子带 归一化因子。

本发明实施例在编解码过程中,根据量化后的 子带归一化因子 或码率信息,确定比特分配的信号带宽,从而 能够集中比特数对所 确定的信号带宽进行有效编解码, 提高音频质量。

图 5是本发明一个实施例的音频信号解码设备的 图。图 5的 音频信号解码设备 50包括获取单元 51、第二确定单元 52、第二分 配单元 53、 解码单元 54、 扩展单元 55和恢复单元 56。

获取单元 51获取量化后的子带归一化因子。 第二确定单元 52 根据获取单元 51获取的量化后的子带归一化因子, 或者根据量化 后的子带归一化因子和码率信息,确定比特分 配的信号带宽。第二 分配单元 53对第二确定单元 52确定的信号带宽内的子带分配比 特。解码单元 54根据第二分配单元 53为每个子带分配的比特,对 归一化频谱进行解码。扩展单元 55对解码单元 54解码后的归一化 频谱进行噪声填充和带宽扩展,得到归一化的 全频带频谱。恢复单 元 56根据扩展单元 55得到的归一化的全频带频谱和子带归一化因 子, 获得音频信号的频谱系数。

本发明实施例在编解码过程中,根据量化后的 子带归一化因子 或码率信息,确定比特分配的信号带宽,从而 能够集中比特数对所 确定的信号带宽进行有效编解码, 提高音频质量。

图 6是本发明另一实施例的音频信号解码设备的 图。图 6的 音频信号解码设备 60中, 与图 5相同或相似的部分使用相同的附 图标记表示。

类似于图 4的第一确定单元 32 , 在确定比特分配的信号带宽 时,音频信号解码设备 60的第二确定单元 52可将比特分配的信号 带宽限定为音频信号的部分带宽。 例如, 第二确定单元 52可包括 第三比率因子确定单元 521 , 用于根据码率信息确定比率因子 fact , 比率因子 fac t大于 0且小于或等于 1。 可替换地, 第二确 定单元 52可包括第四比率因子确定单元 522 , 用于根据子带归一 化因子获取音频信号的谐波等级或噪声水平, 根据谐波等级或噪声 水平确定比率因子 fact。

另外, 第二确定单元 52还包括第二带宽确定模块 523。 在得 到比率因子 fac t 之后, 第二带宽确定模块 523 可根据比率因子 fact和量化后的子带归一化因子, 确定上述部分带宽。

可选地,在一个实施例中, 第二带宽确定模块 523在确定上述 部分带宽时,根据量化后的子带归一化因子, 获取每个子带内的频 谱能量,并从低频向高频累加每个子带内的频 谱能量,直至累加的 频谱能量大于所有子带的总频谱能量与比率因 子 fact的乘积, 将 当前子带以下的带宽作为上述部分带宽。

可选地, 在一个实施例中, 扩展单元 55可包括第一频带确定 模块 551和频谱系数获取模块 552。第一频带确定模块 551根据当 前帧及其前 N帧的比特分配, 确定第一频带, 其中 N为正整数, 频 谱系数获取模块 552根据第一频带的频谱系数,获得高频频带的 频 谱系数。 例如, 在确定第一频带时, 第一频带确定模块 551可获取 当前帧分配的比特和前 N帧分配的比特之间的相关性,并根据所获 取的相关性, 确定上述第一频带。

如果需要调整背景噪声, 音频信号解码设备 60还可以包括调 整单元 57 , 用于根据子带归一化因子, 获得噪声水平, 并利用所 获得的噪声水平, 调整高频频带内的背景噪声。

可选地,在另一实施例中, 频谱系数获取模块 552可根据频谱 平坦度信息和高频带信号类型获得归一化长度 ,使用所获得的归一 化长度对所述第一频带的频谱系数进行归一化 处理,并将归一化处 理后的第一频带的频谱系数作为高频频带的频 谱系数。其中,频谱 平坦度信息可包括: 第一频带中每个子带的均峰比、第一频带对应 的时域信号的相关性、 或者第一频带对应的时域信号的过零率等。

本发明实施例在编解码过程中,根据量化后的 子带归一化因子 或码率信息,确定比特分配的信号带宽,从而 能够集中比特数对所 确定的信号带宽进行有效编解码, 提高音频质量。

根据本发明实施例的编解码系统可包括上述音 频信号编码设 备或音频信号解码设备。

本领域普通技术人员可以意识到,结合本文中 所公开的实施例 描述的各示例的单元及算法步骤, 能够以电子硬件、或者计算机软 件和电子硬件的结合来实现。这些功能究竟以 硬件还是软件方式来 执行,取决于技术方案的特定应用和设计约束 条件。专业技术人员 可以对每个特定的应用来使用不同方法来实现 所描述的功能,但是 这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到, 为描述的方便和筒 洁, 上述描述的系统、 装置和单元的具体工作过程, 可以参考前述 方法实施例中的对应过程, 在此不再赘述。

在本申请所提供的几个实施例中,应该理解到 ,所揭露的系统、 装置和方法, 可以通过其它的方式实现。 例如, 以上所描述的装置 实施例仅仅是示意性的, 例如, 所述单元的划分, 仅仅为一种逻辑 功能划分, 实际实现时可以有另外的划分方式,例如多个 单元或组 件可以结合或者可以集成到另一个系统,或一 些特征可以忽略,或 不执行。另一点,所显示或讨论的相互之间的 耦合或直接耦合或通 信连接可以是通过一些接口, 装置或单元的间接耦合或通信连接, 可以是电性, 机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可 以不是物理上 分开的,作为单元显示的部件可以是或者也可 以不是物理单元, 即 可以位于一个地方,或者也可以分布到多个网 络单元上。可以根据 实际的需要选择其中的部分或者全部单元来实 现本实施例方案的 目的。

另外,在本发明各个实施例中的各功能单元可 以集成在一个处 理单元中,也可以是各个单元单独物理存在, 也可以两个或两个以 上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作 为独立的产品 销售或使用时,可以存储在一个计算机可读取 存储介质中。基于这 样的理解,本发明的技术方案本质上或者说对 现有技术做出贡献的 部分或者该技术方案的部分可以以软件产品的 形式体现出来,该计 算机软件产品存储在一个存储介质中,包括若 干指令用以使得一台 计算机设备 (可以是个人计算机, 服务器, 或者网络设备等)执行 本发明各个实施例所述方法的全部或部分步骤 。而前述的存储介质 包括: U盘、 移动硬盘、 只读存储器(ROM, Read-Only Memory ), 随机存取存储器(RAM, Random Acces s Memory ), 磁碟或者光盘等 各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本 发明的保护范围 并不局限于此,任何熟悉本技术领域的技术人 员在本发明揭露的技 术范围内,可轻易想到变化或替换,都应涵盖 在本发明的保护范围 之内。因此,本发明的保护范围应所述以权利 要求的保护范围为准。