| JP06232825 | AUDIO SIGNAL ENCODER |
| WO/2006/075457 | RECORDING APPARATUS |
| WO/1991/006092 | SOUND SYNTHESIZER |
苗磊 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
WU, Wenhai (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
华为技术有限公司 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
MIAO, Lei (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
苗磊 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
| 权 利 要 求 书 1、 一种立体声信号下混方法, 其特征在于, 包括: 将立体声信号中的第一路时域声道信号和第二路时域声道信号转换为第 一路频域声道信号和第二路频域声道信号; 获得所述第一路频域声道信号和第二路频域声道信号的频域声道信号电 平差和频域声道信号相位差; 针对各频带中的各频率点, 利用基于所述频域声道信号电平差和频域声道 信号相位差的函数计算获得相位位于第一路频域声道信号相位和第二路频域 声道信号相位之间的下混信号相位; 针对各频带中的各频率点, 计算获得下混信号幅度; 根据所述下混信号相位和所述下混信号幅度获得频域下混信号。 2、 如权利要求 1 所述的方法, 其特征在于, 所述获得所述第一路频域声 道信号和第二路频域声道信号的频域声道信号电平差和频域声道信号相位差 包括: 获得所述第一路频域声道信号和第二路频域声道信号的每个频带的频域 声道信号电平差和频域声道信号相位差; 或者 获得所述第一路频域声道信号和第二路频域声道信号的每个频率点的频 域声道信号电平差和频域声道信号相位差; 或者 获得所述第一路频域声道信号和第二路频域声道信号的部分频带的频域 声道信号电平差和频域声道信号相位差、 以及所述第一路频域声道信号和第二 路频域声道信号的另一部分频带中的每个频率点的频域声道信号电平差和频 域声道信号相位差。 3、 如权利要求 1所述的方法, 其特征在于: 所述函数使下混信号相位与能量高的一路频域声道信号相位的夹角小于 下混信号相位与能量低的一路频域声道信号相位的夹角。 4、 如权利要求 1 所述的方法, 其特征在于, 所述基于频域声道信号电平 差和频域声道信号相位差的函数包括: 利用一路频域声道信号相位、 第一路频域声道信号与第二路频域声道信号 电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第一函 数。 5、 如权利要求 4所述的方法, 其特征在于: ZXAk) l- ·ΙΡΏφ) 所述第一函数包括: 1 + C(W ; 其中, 为在频率点索引 的第一路频域声道信号相位, b)为频带索 引6的第一路频域声道信号与第二路频域声道信号能量比, 为频带索引 b 的第一路频域声道信号与第二路频域声道信号相位差。 6、 如权利要求 1 所述的方法, 其特征在于, 所述基于频域声道信号电平 差和频域声道信号相位差的函数包括: 利用一路频域声道信号相位、 群相位、 第一路频域声道信号与第二路频域 声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差构建 的第二函数。 7、 如权利要求 6所述的方法, 其特征在于: 第二函数包括: ZXAk)—— l- ~•(IPD(b) - 0(,) ; 1 \ + c(b) 8 其中, )为在频率点索引 的第一路频域声道信号相位, C(b)为频带索 引 6的第一路频域声道信号与第二路频域声道信号能量比, /PZ)(b)为频带索引 b 的第一路频域声道信号与第二路频域声道信号相位差, ^为群相位。 8、 如权利要求 1 所述的方法, 其特征在于, 所述基于频域声道信号电平 差和频域声道信号相位差的函数包括: 利用一路频域声道信号相位、 第一路频域声道信号与第二路频域声道信号 电平差以及第一路频域声道信号与第二路频域声道信号相位差构建的第一函 数; 和, 利用一路频域声道信号相位、 群相位、 第一路频域声道信号与第二路 频域声道信号电平差以及第一路频域声道信号与第二路频域声道信号相位差 构建的第二函数; 且所述利用基于频域声道信号电平差和频域声道信号相位差的函数计算 获得相位位于第一路频域声道信号相位和第二路频域声道信号相位之间的下 混信号相位包括: 获取群延时, 如果群延时为 0, 则利用第二函数计算获得相位位于第一路 频域声道信号相位和第二路频域声道信号相位之间的下混信号相位, 否则, 利 用第一函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信 号相位之间的下混信号相位。 9、 如权利要求 1至 8中任一权利要求所述的方法, 其特征在于, 所述方 法还包括: 对所述频域下混信号进行编码获得频域下混单声道比特流, 并向解码端发 送所述频域下混单声道比特流; 或者 将所述频域下混信号转换为时域下混信号, 对所述时域下混信号进行编码 获得时域下混单声道比特流, 并向解码端发送所述时域下混单声道比特流。 10、 一种获得立体声信号的方法, 其特征在于, 所述方法包括: 获取解码后的频域下混信号、 每个频带的频域声道信号电平差和每个频带 的频域声道信号相位差; 根据所述频域下混信号、 基于所述频域声道信号电平差和频域声道信号相 位差的函数、 所述频域声道信号电平差和所述频域声道信号相位差获得第一路 和第二路频域声道信号幅度和相位; 根据所述第一路和第二路频域声道信号幅度和相位合成第一路频域声道 信号和第二路频域声道信号; 将所述第一路频域声道信号和第二路频域声道信号转换为第一路时域声 道信号和第二路时域声道信号。 11、 一种编码装置, 其特征在于, 包括: 时频变换模块, 用于将立体声第一路时域声道信号和第二路时域声道信号 转换为第一路频域声道信号和第二路频域声道信号; 第一获取模块, 用于获得所述第一路频域声道信号和第二路频域声道信号 的频域声道信号电平差和频域声道信号相位差; 第二获取模块, 用于针对各频带中的各频率点, 利用基于所述频域声道信 号电平差和频域声道信号相位差的函数计算获得相位位于第一路频域声道信 号相位和第二路频域声道信号相位之间的下混信号相位; 第三获取模块, 用于针对各频带中的各频率点, 计算获得下混信号幅度; 下混模块, 用于根据所述下混信号相位和所述下混信号幅度获得频域下混 信号。 12、 如权利要求 11所述的装置, 其特征在于, 所述第二获取模块包括: 第一子模块, 用于存储有利用一路频域声道信号相位、 第一路频域声道信 号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道 信号相位差构建的第一函数, 利用所述第一函数计算获得下混信号相位; 或者 第二子模块, 用于存储有利用一路频域声道信号相位、 群相位、 第一路频 域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路 频域声道信号相位差构建的第二函数, 利用第二函数计算获得下混信号相位。 13、 如权利要求 11所述的装置, 其特征在于, 所述第二获取模块包括: 第一子模块, 用于存储有利用一路频域声道信号相位、 第一路频域声道信 号与第二路频域声道信号电平差以及第一路频域声道信号与第二路频域声道 信号相位差构建的第一函数, 利用所述第一函数计算获得下混信号相位; 第二子模块, 用于存储有利用一路频域声道信号相位、 群相位、 第一路频 域声道信号与第二路频域声道信号电平差以及第一路频域声道信号与第二路 频域声道信号相位差构建的第二函数, 利用第二函数计算获得下混信号相位; 第三子模块, 用于获取群延时, 如果群延时为 0, 则通知第二子模块计算 获得下混信号相位, 否则, 通知第一子模块计算获得下混信号相位。 14、如权利要求 11或 12或 13所述的装置,其特征在于,所述装置还包括: 频域单声道编码器, 用于对所述频域下混信号进行编码获得频域下混单声 道比特流, 并向解码端发送所述频域下混单声道比特流; 或者所述装置还包括: 频时变换模块, 用于将所述频域下混信号转换为时域下混信号; 时域单声道编码器, 用于对所述时域下混信号进行编码获得时域下混单声 道比特流, 并向解码端发送所述时域下混单声道比特流。 15、 一种解码装置, 其特征在于, 所述装置包括: 第四获取模块, 用于获取解码后的频域下混信号、 每个频带的频域声道信 号电平差和每个频带的频域声道信号相位差; 重建模块, 用于根据所述频域下混信号、 基于所述频域声道信号电平差和 频域声道信号相位差的函数、 所述频域声道信号电平差和所述频域声道信号相 位差获得第一路和第二路频域声道信号幅度和相位; 合成模块, 用于根据所述第一路和第二路频域声道信号幅度和相位合成第 一路频域声道信号和第二路频域声道信号; 频时变换模块, 用于将所述第一路频域声道信号和第二路频域声道信号转 换为第一路时域声道信号和第二路时域声道信号。 16、 一种编解码系统, 其特征在于, 包括: 编码装置, 用于将立体声第一路时域声道信号和第二路时域声道信号转换 为第一路频域声道信号和第二路频域声道信号, 获得所述第一路频域声道信号 和第二路频域声道信号的频域声道信号电平差和频域声道信号相位差, 针对各 频带中的各频率点, 利用基于所述频域声道信号电平差和频域声道信号相位差 的函数计算获得相位位于第一路频域声道信号相位和第二路频域声道信号相 位之间的下混信号相位; 针对各频带中的各频率点, 计算获得下混信号幅度; 根据所述下混信号相位和所述下混信号幅度获得频域下混信号; 对所述频域下 混信号进行编码或者将所述频域下混信号转换为时域下混信号并对所述时域 下混信号进行编码获得下混单声道信号; 对每个频带的频域声道信号电平差和 频域声道信号相位差进行量化编码, 发送所述下混单声道信号和所述量化编 码; 解码装置, 用于根据接收的所述下混单声道信号获取解码后的频域下混信 号, 根据接收的所述量化编码获取每个频带的频域声道信号电平差和每个频带 的频域声道信号相位差, 根据所述频域下混信号、 所述函数、 所述频域声道信 号电平差和所述频域声道信号相位差获得第一路和第二路频域声道信号幅度 和相位, 根据所述第一路和第二路频域声道信号幅度和相位合成第一路频域声 道信号和第二路频域声道信号; 将所述第一路频域声道信号和第二路频域声道 信号转换为第一路时域声道信号和第二路时域声道信号。 |
本申请要求了 2010年 2月 12日提交的, 申请号为 201010110653.7, 发明名称 为 "立体声信号下混方法、 编解码装置和编解码系统" 的中国专利申请的优先 权, 其全部内容通过引用结合在本申请中。
技术领域
本发明涉及音频编解码技术领域, 具体涉及立体声信号下混技术。 背景技术
在立体声编码技术中, 通常需要将左 L和右 R两路声道信号下混 ( downmix ) , 获得单声道 M信号, 并将 M信号和作为边带信号的左右声道的 声场信息传输至解码端。 上述左右声道的声场信息如左右声道信号电平 差以及 左右声道信号相位差等。 左右声道信号电平差具体可以为 ICLD ( InterChannel Level Difference, 立体声声道间电平差)或 CLD ( Channel Level Difference , 声 道间电平差) 等。 左右声道信号相位差具体可以为 IPD ( Interchannel Phase Difference, 立体声声道相位差)等。
目前的立体声信号下混方法主要包括如下两种 :
方法一: 利用 ") = 5 · ( χ ι(") + χ 2("》来获得单声道信号 w ), 其中的 n 为时 间索引, 和 分别为时间索引为 n时的左右两路时域声道信号, 0.5为下 混因子, 该下混因子也可以采用其它数值。
方法二: 将左右两路声道信号进行时频变换, 在频域调整声道信号的幅度 和 /或相位, 利用调整后的声道信号进行下混获得频域单声 道信号, 并将频域单 声道信号转换为时域单声道信号。 上述调整声道信号的相位即以一路声道信号 的相位为基准, 旋转另一路声道信号的相位, 使两路声道信号的相位相同。
在实现本发明的过程中, 发明人发现: 在方法一中, 当左右两路声道信号 完全反相且幅度相同时, 获得的下混信号为 0, 从而解码端无法恢复出左右两 路声道信号; 另外, 在左右两路声道信号不完全反相的情况下, 获得的下混信 号会出现能量缺失现象。 在方法二中, 如果在频域只调整声道信号的幅度而不 进行相位调整, 则仍然会存在下混信号为 0以及能量缺失的现象; 如果在频域 进行了声道信号相位的调整, 则在基准声道信号为噪声的情况下, 会出现另一 路声道信号基本上被噪声掩盖的现象, 而且, 在基准声道信号相位变化大的情 况下, 下混信号相位会出现较大的跳变。 发明内容
本发明实施方式提供的立体声信号下混方法、 编解码装置和编解码系统, 可以避免在左右两路声道信号完全反相且幅度 相同的情况下, 解码端无法恢复 出左右两路声道信号的现象; 而且, 可以避免下混信号的能量缺失现象; 另外 本发明实施例获得的下混信号能够充分反映立 体声信号的声场特点。
本发明实施方式提供的立体声信号下混方法, 包括:
将立体声信号中的第一路时域声道信号和第二 路时域声道信号转换为第 一路频域声道信号和第二路频域声道信号;
获得所述第一路频域声道信号和第二路频域声 道信号的频域声道信号电 平差和频域声道信号相位差;
针对各频带中的各频率点, 利用基于所述频域声道信号电平差和频域声道 信号相位差的函数计算获得相位位于第一路频 域声道信号相位和第二路频域 声道信号相位之间的下混信号相位;
针对各频带中的各频率点, 计算获得下混信号幅度;
根据所述下混信号相位和所述下混信号幅度获 得频域下混信号。
本发明实施方式提供的获得立体声信号的方法 , 包括:
获取解码后的频域下混信号、 每个频带的频域声道信号电平差和每个频带 的频域声道信号相位差;
根据所述频域下混信号、 基于所述频域声道信号电平差和频域声道信号 相 位差的函数、 所述频域声道信号电平差和所述频域声道信号 相位差获得第一路 和第二路频域声道信号幅度和相位;
根据所述第一路和第二路频域声道信号幅度和 相位合成第一路频域声道 信号和第二路频域声道信号;
将所述第一路频域声道信号和第二路频域声道 信号转换为第一路时域声 道信号和第二路时域声道信号。
本发明实施方式提供的编码装置, 包括:
时频变换模块, 用于将立体声第一路时域声道信号和第二路时 域声道信号 转换为第一路频域声道信号和第二路频域声道 信号;
第一获取模块, 用于获得所述第一路频域声道信号和第二路频 域声道信号 的频域声道信号电平差和频域声道信号相位差 ;
第二获取模块, 用于针对各频带中的各频率点, 利用基于所述频域声道信 号电平差和频域声道信号相位差的函数计算获 得相位位于第一路频域声道信 号相位和第二路频域声道信号相位之间的下混 信号相位;
第三获取模块, 用于针对各频带中的各频率点, 计算获得下混信号幅度; 下混模块, 用于根据所述下混信号相位和所述下混信号幅 度获得频域下混 信号。
本发明实施方式提供的解码装置, 包括:
第四获取模块, 用于获取解码后的频域下混信号、 每个频带的频域声道信 号电平差和每个频带的频域声道信号相位差;
重建模块, 用于根据所述频域下混信号、 基于所述频域声道信号电平差和 频域声道信号相位差的函数、 所述频域声道信号电平差和所述频域声道信号 相 位差获得第一路和第二路频域声道信号幅度和 相位;
合成模块, 用于根据所述第一路和第二路频域声道信号幅 度和相位合成第 一路频域声道信号和第二路频域声道信号;
频时变换模块, 用于将所述第一路频域声道信号和第二路频域 声道信号转 换为第一路时域声道信号和第二路时域声道信 号。
本发明实施方式提供的编解码系统, 包括:
编码装置, 用于将立体声第一路时域声道信号和第二路时 域声道信号转换 为第一路频域声道信号和第二路频域声道信号 , 获得所述第一路频域声道信号 和第二路频域声道信号的频域声道信号电平差 和频域声道信号相位差, 针对各 频带中的各频率点, 利用基于所述频域声道信号电平差和频域声道 信号相位差 的函数计算获得相位位于第一路频域声道信号 相位和第二路频域声道信号相 位之间的下混信号相位; 针对各频带中的各频率点, 计算获得下混信号幅度; 根据所述下混信号相位和所述下混信号幅度获 得频域下混信号; 对所述频域下 混信号进行编码或者将所述频域下混信号转换 为时域下混信号并对所述时域 下混信号进行编码获得下混单声道信号; 对每个频带的频域声道信号电平差和 频域声道信号相位差进行量化编码, 发送所述下混单声道信号和所述量化编 码;
解码装置, 用于根据接收的所述下混单声道信号获取解码 后的频域下混信 号, 根据接收的所述量化编码获取每个频带的频域 声道信号电平差和每个频带 的频域声道信号相位差, 根据所述频域下混信号、 所述函数、 所述频域声道信 号电平差和所述频域声道信号相位差获得第一 路和第二路频域声道信号幅度 和相位, 根据所述第一路和第二路频域声道信号幅度和 相位合成第一路频域声 道信号和第二路频域声道信号; 将所述第一路频域声道信号和第二路频域声道 信号转换为第一路时域声道信号和第二路时域 声道信号。 通过上述技术方案的描述可知, 通过利用基于频域声道信号电平差和频域 声道信号相位差的函数使下混信号相位位于第 一路频域声道信号相位和第二 路频域声道信号相位之间, 避免了在左右两路声道信号完全反相且幅度相 同的 情况下, 下混信号为 0的现象, 从而避免了解码端无法恢复出左右两路声道信 号的现象, 而且, 还可以避免下混信号的能量缺失现象; 由于下混信号位于第 一路频域声道信号相位和第二路频域声道信号 相位之间, 因此, 本发明实施例 获得的下混信号能够充分反映立体声信号的声 场特点, 最终提高了立体声编解 码的主观质量。 附图说明
为了更清楚地说明本发明实施例或现有技术中 的技术方案, 下面将对实施 例或现有技术描述中所需要使用的附图作简单 地介绍, 显而易见地, 下面描述 中的附图仅仅是本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付 出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
图 1A是本发明实施例一的立体声信号下混方法框 ;
图 1B是本发明实施例一的下混信号相位和左右声 信号相位关系示意图; 图 1C是本发明实施例一的编码端对下混信号进行 码的框图;
图 2是本发明实施例二的获得立体声信号的方法 图;
图 3 A是本发明实施例三的立体声信号下混方法框 ;
图 3B是本发明实施例三的下混信号相位和左右声 信号相位关系示意图; 图 4是本发明实施例五的立体声信号下混方法框 ;
图 5是本发明实施例七的编码装置示意图;
图 6是本发明实施例八的解码装置示意图;
图 7是本发明实施例九的编解码系统示意图。
具体实施方式 述的实施例是本发明一部分实施例, 而不是全部的实施例。 基于本发明中的实 施例, 本领域普通技术人员在没有作出创造性劳动前 提下所获得的所有其他实 施例, 都属于本发明保护的范围。
实施例一、 立体声信号下混方法。 下面结合附图 1A、 附图 IB和附图 1C, 以左声道信号为第一路声道信号, 右声道信号为第二路声道信号为例对本实施 例进行说明。 明显的, 以右声道信号为第一路声道信号, 以左声道信号为第二 路声道信号的情况, 本实施例也是可以完全可行的。 实施例一的实现框图如附 图 1A所示。
在图 1A中, S100、 在编码端, 对接收到的立体声时域左声道信号和时域右 声道信号分别进行时频变换,这样,时域左声 道信号被变换为频域左声道信号, 时域右声道信号被变换为频域右声道信号。本 实施例可以采用 FFT ( Fast Fourier Transform, 快速傅立叶变换 )或者 QMF ( Quadrature Mirror Filter, 正交镜像滤 波器)等方式进行立体声信号的时频变换。 本实施例不限制对时域左声道信号 和时域右声道信号进行时频变换的具体实现过 程。
S 110、 获得频域左声道信号和频域右声道信号的频域 声道信号电平差和频 域声道信号相位差。
本实施例中的频域左声道信号和频域右声道信 号均被划分为若干个频带 (频域左声道信号和频域右声道信号的频带划 相同) , 频带宽度可以根据实 际应用来设置, 如频带宽度可以设置为 1 (即一个频率点表示一个频带) , 再 如针对高频信号频带宽度可以设置的宽一些, 而针对低频信号频带宽度可以设 置的窄一些等。 如果使用 表示频率点索引且使用 6表示频带索引, 则^( 表 示频域左声道信号, 表示频域右声道信号, 表示第 6个频带的起始频率 点索引。
在本实施例中, 获得频域左声道信号和频域右声道信号的频域 声道信号电 平差和频域声道信号相位差为获得频域左声道 信号和频域右声道信号的基于 频带或频率点的频域声道信号电平差和频域声 道信号相位差。 获取频域声道信 号电平差和频域声道信号相位差的方式可以包 括多种, 例如、 获取各频带的频 域声道信号电平差和各频带的频域声道信号相 位差; 再例如、 获取各频带中各 频率点的频域声道信号电平差和各频带中各频 率点的频域声道信号相位差; 再 例如, 针对部分频带(如对立体声参数较敏感的声道 信号所在的频带) , 获取 频带的频域声道信号电平差和频带的频域声道 信号相位差, 针对另一部分频带 (如对立体声参数较不敏感的声道信号所在的 带) , 获取频带中各频率点的 频域声道信号电平差和频带中各频率点的频域 声道信号相位差。 一个具体例子 为: 如果一个频带中的声道信号为低频信号, 则可以获取该频带的频域声道信 号电平差和频域声道信号相位差, 如果一个频带中的声道信号为高频信号, 则 可以获取该频带中的各频率点的频域声道信号 电平差和频域声道信号相位差。 利用频率点的频域声道信号电平差和频域声道 信号相位差来获得下混信号相 位能够更加准确的反映出立体声信号的声场特 点。
上述每个频带的声道信号电平差可以根据每个 频带的频域左声道信号能 量与频域右声道信号能量的比值获得, 上述每个频率点的声道信号电平差可以 根据每个频率点的频域左声道信号能量与频域 右声道信号能量的比值获得。 上 述每个频带的频域声道信号相位差可以利用每 个频带的频域左声道信号与频 域右声道信号的互相关相位来表示, 上述每个频率点的频域声道信号相位差可 以利用每个频率点的频域左声道信号与频域右 声道信号的互相关相位来表示, 当然, 也可以采用其它方式来表示每个频带或每个频 率点的频域声道信号相位 差, 本实施例不限制每个频带或每个频率点的频域 声道信号相位差的具体表示 方式。
获取每个频带的频域声道信号电平差和频域声 道信号相位差的一个具体 的例子为:
CLD(b) = 101og 10 ; 公式( 1 ) 其中, CJD(b)为频带索引 6 的声道信号电平差, 表示频率点索引, b表示 频带索引, ^(^表示频域左声道信号, 表示频域右声道信号, ^>表示 频域左声道信号的共轭信号, 表示频域右声道信号的共轭信号。 cor(b) - £ x k x ik)
IPD(b) = Zcor(b) ? 且 n b 公式(2 ) 其中, 1 )为频带索引 6的频域左声道信号和频域右声道信号间的相 差, 表示频率点索引, 表示频带索引, ^(^表示频域左声道信号, 表 示频域右声道信号, W为频域右声道信号的共轭信号。
通过上述公式(1 )可以获得每个频带的频域声道信号电平差, 通过上述 公式(2 ) 可以获得每个频带的声道信号相位差, 本实施例不限制获取每个频 带的声道信号电平差和声道信号相位差的具体 实现过程。 另外, 如果一个频带 的宽度为 1, 则利用上述公式(1 )可以获得该频带中的每个频率点的频域声道 信号电平差, 利用上述公式(2 )可以获得该频带中的每个频率点的频域声道 信号相位差。
S120、 针对各频带中的各频率点, 利用基于频域声道信号电平差和频域声 道信号相位差的函数计算获得相位位于频域左 声道信号相位和频域右声道信 号相位之间的下混信号相位。 针对各频带中的各频率点, 计算获得下混信号幅 度。 本实施例不限制获得下混信号相位和下混信号 幅度的先后顺序。 在获得了 下混信号相位和下混信号幅度之后, 根据下混信号相位和下混信号幅度获得频 域下混信号。 需要特别说明的是, 针对一个频率点来说, 如果 S110中获得了该 频率点的频域声道信号电平差和频域声道信号 相位差, 则可以利用基于该频率 点的频域声道信号电平差和频域声道信号相位 差的函数计算获得该频率点的 下混信号相位; 如果 S110中获得了该频率点所在频带的频域声道信 电平差和 频域声道信号相位差, 则可以利用基于该频率点所在频带的频域声道 信号电平 差和频域声道信号相位差的函数计算获得该频 率点的下混信号相位。
本实施例通过函数计算获得的下混信号相位位 于频域左声道信号相位和 频域右声道信号相位之间, 在频域左声道信号相位与频域右声道信号相位 不重 合的情况下, 本实施例获得的下混信号相位通常既不与频域 左声道信号相位重 合,也不与频域右声道信号相位重合, 在某些极端的情况下, 可能会出现重合, 如在频域左声道信号能量远远高于右声道信号 能量时, 下混信号相位可能与左 声道信号相位非常接近, 此时, 由于量化等原因, 编码端确定出下混信号相位 可能是左声道信号相位。 一种优选的方式包括: 通过函数计算获得的下混信号 相位偏向于能量高的一路声道信号相位。 即该函数使下混信号相位与能量高的 一路频域声道信号相位的夹角小于下混信号相 位与能量低的一路频域声道信 号相位的夹角。 也就是说, 如果一个频率点上的频域左声道信号能量高于 频域 右声道信号能量, 则在该频率点上, 该函数可以使下混信号相位与频域左声道 信号相位的夹角小于下混信号相位与频域右声 道信号相位的夹角; 如果一个频 率点上的频域右声道信号能量高于频域左声道 信号能量, 则在该频率点上, 该 函数可以使下混信号相位与频域右声道信号相 位的夹角小于下混信号相位与 频域左声道信号相位的夹角。 另外, 下混信号相位最好位于频域左声道信号相 位与频域右声道信号相位之间的较小夹角中, 也就是说, 频域左声道信号相位 与频域右声道信号相位组成了两个夹角, 这两个夹角之和为 360度, 在频域左 声道信号与频域右声道信号完全反向的情况下 , 两个夹角均为 180度, 除了完 全反向和完成重合的情况外, 两个夹角中的一个夹角的度数应小于另一个夹 角 的度数, 下混信号相位最好位于较小度数的夹角中。 上述函数的一个具体的例子为:
ZX, (k)—— l - ~ · IPD(b); 公式( 3 ) l + c(b)
公式( 3 )为第一函数, W 表示频率点索引为 的频域左声道信号相位, 上述 C (b)表示频带索引 6的频域声道信号能量比, c =10„, CJD(b)为频率 点索引 所在频带的频带索引 的频域声道信号电平差, cJz b)可以通过上述公
1
式( 1 )获得, 1 + C (W可以称为函数中的频带索引 b的频域声道信号能量比系数, /PD(b)为频率点索引 所在频带的频带索引 6的频域左声道信号和频域右声道 信号间的相位差, 可以通过上述公式(2 )获得。
通过上述公式(3 )可以计算获得各频带中各频率点的下混信号 位。 上 述公式(3 )仅仅是一种例举而已, 本实施例不限制基于频域声道信号电平差 和频域声道信号相位差的函数的具体表现形式 , 只要该函数能够使下混信号相 位位于频域左声道信号相位和频域右声道信号 相位之间即可。
如果频率点索引 的下混信号用 M( :)来表示, 则下混信号 相位为:
^M(k) = ZX, (k) -―^— · IPD(b)
1 + C (W 公式(4 ) 在上述公式(4 ) 中, ΖΜ ( )为频率点索引 的下混信号相位, m 的取 值范围为 (-pi, pi]。
频带中的各频率点, 可以通过下述公式(5) 混信号幅度: = | | + | |'| |或 = (μ )| + 2. 公式( 5 ) 在上述公式(5)中, l MW l为频率点索引 的下混信号 M 的幅度, Ι )Ι 为频率点索引 的频域左声道信号幅度, I (k) \为频率点索引 的频域右声道信 号幅度。
上述公式( 5 )仅仅是一种例举而已, 本实施例可以采用现有的多种方法 来获取下混信号幅度, 本实施例不限制获取下混信号幅度的具体实现 方式。
在利用上述例举的方式获得了下混信号相位和 幅度后, 可以通过下述公式 (6)获得频域下混信号:
) =1 ) IW 公式(6) 在公式 ( 6 ) 中, M ( 为频率点索引 的下混信号, 表示 cos(Z ; (k)) + j · ύη{ΖΧ[ (k)), ·表示复数。
频域左声道信号相位、 频域右声道信号相位、 以及通过基于频域声道信号 电平差和频域声道信号相位差的函数计算获得 的下混信号相位的一个具体例 子如附图 1B所示。
图 1B中, R表示频域右声道信号, L表示频域左声道信号, M表示下混信号, R、 L和 M的长度表示信号幅度, 夹角 IPD即上述描述中的较小夹角。 由于(a)、 (b)和 (c) 中的 R的长度比 L的长度长, 因此, (a) 、 (b)和 (c) 中的频 域右声道信号能量均高于频域左声道信号能量 。 由于(a) 、 (b)和(c) 中的 频域右声道信号能量均高于频域左声道信号能 量, 因此, (a) 、 (b)和(c) 中的下混信号相位偏向于右声道信号相位。 另外, 在(c) 中, 虽然频域右声 道信号和频域左声道信号反相, 但是, 下混信号能量并没有出现能量抵消的情 况。 还有, 虽然(a) 、 (b)和(c) 中的频域左声道信号与频域右声道信号的 相位差变换较大, 但是, 由于下混信号相位会受左右声道信号能量比系 数的调 整, 因此, (a) 、 (b)和(c) 中下混信号相位较为连续, 从而不会产生较大 的噪声。 需要说明的是, (a) 、 (b)和(c) 中下混信号幅度只是一种示意而 已, 下混信号幅度会随幅度计算公式的不同而有所 不同。
S130、 对频域下混信号进行频时变换, 获得时域下混信号, 时域下混信号 即下混单声道信号。
需要说明的是, 在编码端支持对频域信号编码的情况下, 本实施例可以不 包括 S130, 即 S120获得的频域下混信号为下混单声道信号。
编码端对时域下混信号或者频域下混信号进行 编码的一个具体例子如附 图 1C所示。
在图 1C中, 在单声道编码器支持时域信号编码的情况下, 上述 S130获得的 时域下混信号(即下混单声道信号)传输至单 声道编码器。 这里的单声道编码 器可以为符合 ITU-T (国际电信联盟-电信标准化部门 ) G.711.1或者 ITU-T G.722标准规定的编码器等。 单声道编码器对接收到的时域下混信号进行编 码, 并输出下混单声道比特流。 在单声道编码器支持频域信号编码的情况下, 上述 S120获得的频域下混信号(即下混单声道信号 )传输至单声道编码器, 单声道 编码器对接收到的频域下混信号进行编码, 并输出下混单声道比特流。
在图 1C中, 左右声道的声场信息(即立体声参数)如左右 声道信号电平差 CLD和左右声道信号相位差 IPD等被传输至量化器, 量化器对立体声参数进行 量化编码, 并输出立体声参数比特流。 由于对 CLD和 IPD等立体声参数进行了 量化处理, 因此, 可以保证解码端采用的立体声参数与编码端发 送的立体声参 数相同。 这里的左右声道信号电平差可以是各频带的左 右声道信号电平差, 也 可以是各频带统一对应的一个左右声道信号电 平差, 同样的, 这里的左右声道 信号相位差可以是各频带的左右声道信号相位 差, 也可以是各频带统一对应的 一个左右声道信号相位差 (如群相位 ^等) 。
编码端向解码端发送各频带的左右声道信号电 平差和各频带的左右声道 信号相位差或者编码端向解码端发送各频带的 左右声道信号电平差和群相位 的方法可以适用于高码率的应用环境中; 编码端向解码端发送各频带统一对应 的一个左右声道信号电平差和群相位的方法可 以适用于低码率的应用环境中。
实施例一通过利用第一函数使下混信号相位位 于第一路频域声道信号相 位和第二路频域声道信号相位之间, 避免了在左右两路声道信号完全反相且幅 度相同的情况下, 下混信号为 0的现象, 从而避免了解码端无法恢复出左右两 路声道信号的现象, 而且, 还可以避免下混信号的能量缺失现象; 由于下混信 号位于第一路频域声道信号相位和第二路频域 声道信号相位之间, 因此, 实施 例一获得的下混信号能够充分反映立体声信号 的声场特点, 最终提高了立体声 编解码的主观质量。
实施例二、 获得立体声信号的方法。 该实施例是与上述实施例一对应的解 码端获得立体声信号的方法。 该方法框图如附图 2所示。
图 2中, S200、 编码端发送的下混单声道比特流被传输至单声 道解码器, 如果编码端对时域下混信号进行编码, 则单声道解码器对接收到的比特流进行 解码处理后, 输出时域下混信号。 如果编码端对频域下混信号进行编码, 则单 声道解码器对接收到的比特流进行解码处理后 , 输出频域下混信号。 编码端发 送的立体声参数比特流被传输至解量化器, 解量化器对接收到的比特流进行解 量化处理后, 输出左右声道的声场信息 (即立体声参数) , 如各频带的左右声 道信号电平差和各频带的左右声道信号相位差 等, 再如, 各频带统一对应的一 个左右声道信号电平差和各频带统一对应的一 个左右声道信号相位差等。
S210、对时域下混信号进行时频变换处理, 获得频域下混信号 M '( )。 需要 说明的是, 如果编码端是对频域下混信号进行编码, 则不需要执行 S210。
S220、 利用左右声道信号电平差获得频域左右声道信 号幅度, 利用左右声 道信号电平差和左右声道信号相位差获得频域 左右声道信号相位。 需要说明的 是, 如果解量化处理后获得的是各频带的左右声道 信号电平差和各频带的左右 声道信号相位差, 则针对一个频带的时域下混信号来说, 应该利用该频带的左 右声道信号电平差获得频域左右声道信号幅度 , 并利用该频带的左右声道信号 电平差和该频带的左右声道信号相位差获得频 域左右声道信号相位。 如果解量 化处理后获得的是各频带统一对应的一个左右 声道信号电平差和各频带统一 对应的一个左右声道信号相位差, 则针对所有频带的时域下混信号来说, 应该 利用同一个左右声道信号电平差获得频域左右 声道信号幅度, 并利用同一个左 右声道信号电平差和同一个左右声道信号相位 差获得频域左右声道信号相位。 解量化处理后获得各频带的左右声道信号电平 差和各频带统一对应的一个左 右声道信号相位差、 以及解量化处理后获得各频带统一对应的一个 左右声道信 号电平差和各频带的一个左右声道信号相位差 等情况, 可以参照上述描述的方 式获得频域左右声道信号幅度和频域左右声道 信号相位, 在此不再详细说明。
解码端获得频域左右声道信号幅度的一个具体 例子如下述公式(7)和公 式(8)所示:
X k) = M
l + c(b) 公式( 7 )
1
X k) = M
1 + C (W 公式(8) 在上述公式(7)和公式(8) 中, 表示频域左声道信号幅度, | (¾| 表示频域右声道信号幅度, 表示频域下混信号幅度, 表示频带索引 6 的频域声道信号能量比, c = 10„ D , CJD(b)为频率点索引 所在频带的频带
1
索引 6 的声道信号电平差, 1+c (w可以称为频带索引 6 的频域声道信号能量比系 数。
解码端获得频域左右声道信号相位的一个具体 例子如下述公式(9)和公 式(10)所示:
Z ; (k) = ΔΜ (k) +―^— · IPD(b)
1 + c 公式(9)
Z ; ( = . IPD{b)
公式(10) 在公式(9)和公式(10) 中, 表示频域左声道信号相位, 咖表 示解码后获得的频域下混信号, ΖΜ »表示频域下混信号相位, Φ) = ιο ,°, oJ b)为频率点索引 所在频带的频带索引 6的声道信号电平差, ΙΡΟΦ表示频 率点索引 所在频带的频带索引 6的频域左声道信号和频域右声道信号间的相 位差, 表示频域右声道信号相位, /PD(b)的取值范围为 (-pi, pi]。
S230、 合成频域左右声道信号。 合成频域左右声道信号的一个具体例子如 下述公式所示:
;wH ;wh- ; - 公式( 1 1 ) x^ k) e 公式(12 ) 在公式( 1 1 )和公式(12 ) 中, W表示解码端合成获得的频域左声道信 号, 表示频域左声道信号幅度, eJZXi(k) 表示 cos(Z ; ( :)) + j · s ( X[(k)), 表示频域左声道信号相位, W表示解码端合成获得的频域右声道信 号, 表示频域右声道信号幅度, 表示频域右声道信号相位。
S240、将合成的频域左右声道信号进行频时变 ,获得时域左右声道信号, 时域左声道信号即解码端最终获得的左声道解 码信号, 时域右声道信号即解码 端最终获得的右声道解码信号。
需要说明的是, 本实施例中的编码端和解码端最好使用相同的 左右声道信 号电平差和左右声道信号相位差。 当然, 编码端和解码端也可以使用不同的左 右声道信号电平差和左右声道信号相位差,一 个具体的例子为:对于低频信号, 编码端和解码端可以使用相同的左右声道信号 电平差和左右声道信号相位差, 而对于高频信号, 编码端和解码端可以使用不同的左右声道信号 电平差和左右 声道信号相位差, 例如, 对于高频信号, 编码端使用未经量化处理的左右声道 信号电平差,对于低频信号,编码端使用经过 量化处理的左右声道信号电平差, 而在解码端统一使用解量化后的左右声道信号 电平差; 再例如, 在低码率时, 编码端可以使用各频带的左右声道信号相位差 , 而在解码端可以使用群相位 作为每个频带的左右声道信号相位差。
在实施例二中, 由于编码端获得的下混信号相位位于第一路频 域声道信号 相位和第二路频域声道信号相位之间, 因此, 解码端在解码过程中不会出现由 于下混信号为 0而无法恢复出左右两路声道信号的现象, 而且, 由于编码端避 免了下混信号的能量缺失现象, 因此, 解码端获得的时域左声道信号和时域右 声道信号更接近于编码端的时域左声道信号和 时域右声道信号, 从而提升了立 体声信号的性能。
实施例三、 立体声信号下混方法。 下面结合附图 3A和附图 2B, 以左声道信 号为第一路声道信号, 右声道信号为第二路声道信号为例对本实施例 进行说 明。 明显的, 以右声道信号为第一路声道信号, 以左声道信号为第二路声道信 号的情况,本实施例也是可以完全可行的。实 施例三的实现框图如附图 3A所示。
图 3A中, S300、 在编码端, 对接收的立体声时域左声道信号和时域右声道 信号分别进行时频变换, 这样, 时域左声道信号被变换为频域左声道信号, 时 域右声道信号被变换为频域右声道信号。 本实施例可以采用 FFT或者 QMF等方 式进行立体声信号的时频变换。
S310、 获得频域左声道信号和频域右声道信号的频域 声道信号电平差、 频 域声道信号相位差和群相位 。
本实施例中的频域左声道信号和频域右声道信 号可以均被划分为若干个 频带, 频带宽度可以根据实际应用来设置, 如频带宽带设置为 1, 再如针对高 频信号频带宽度可以设置的宽一些, 而针对低频信号频带宽度可以设置的窄一 些等。 如果使用 表示频率点索引且 6 表示频带索引, 则 表示频域左声道 信号, 表示频域右声道信号, 表示第 6 个频带的起始频率点索引。 在本 实施例中, 获取频域声道信号电平差和频域声道信号相位 差的方式同样可以包 括多种, 具体如上述实施例一中的描述, 在此不再重复说明。
在本实施例中, 获得频域声道信号电平差和频域声道信号相位 差为获得频 域左声道信号和频域右声道信号的基于频带或 频率点的频域声道信号电平差 和频域声道信号相位差。 获得频域声道信号电平差和频域声道信号相位 差的方 式可以包括多种, 例如、 获取各频带的频域声道信号电平差和各频带的 频域声 道信号相位差; 再例如、 获取各频带中各频率点的频域声道信号电平差 和各频 带中各频率点的频域声道信号相位差; 再例如, 针对部分频带, 获取频带的频 域声道信号电平差和频带的频域声道信号相位 差, 针对另一部分频带, 获取频 带中各频率点的频域声道信号电平差和频带中 各频率点的频域声道信号相位 差。 一个具体例子为: 如果一个频带中的声道信号为低频信号, 则可以获取该 频带的频域声道信号电平差和频域声道信号相 位差, 如果一个频带中的声道信 号为高频信号, 则可以获取该频带中的各频率点的频域声道信 号电平差和频域 声道信号相位差。 利用频率点的频域声道信号电平差和频域声道 信号相位差来 获得下混信号相位能够更加准确的反映出立体 声信号的声场特点。
上述每个频带的频域声道信号电平差可以根据 每个频带的频域左声道信 号能量与右声道信号能量的比值获得, 上述每个频率点的声道信号电平差可以 根据每个频率点的频域左声道信号能量与频域 右声道信号能量的比值获得。 每 个频带的频域声道信号相位差可以利用每个频 带的频域左声道信号与频域右 声道信号的互相关相位来表示, 每个频率点的频域声道信号相位差可以利用每 个频率点的频域左声道信号与频域右声道信号 的互相关相位来表示, 当然, 也 可以采用其它方式来表示每个频带或每个频率 点的频域声道信号相位差, 本实 施例不限制每个频带或每个频率点的频域声道 信号相位差的具体表示方式。 上 述群相位(group phase ) 可以是各频带的声道信号相位的平均值。
获取每个频带或每个频率点的频域声道信号电 平差和频域声道信号相位 差的具体例子如上述实施例一中的描述, 在此不再重复说明。
S320、 针对各频带中的各频率点, 利用基于频域声道信号电平差和频域声 道信号相位差的函数计算获得相位位于频域左 声道信号相位和频域右声道信 号相位之间的下混信号相位。 针对各频带中的各频率点, 计算获取下混信号幅 度。 本实施例不限制获得下混信号相位和下混信号 幅度的先后顺序。 在获得了 下混信号相位和下混信号幅度之后, 根据下混信号相位和下混信号幅度获得频 域下混信号。
本实施例中的函数为: 利用频域左声道信号相位、 群相位、 频域左声道信 号与频域右声道信号电平差以及频域左声道信 号与频域右声道信号相位差构 建的第二函数。 通过第二函数计算获得的下混信号相位位于频 域左声道信号相 位和频域右声道信号相位之间, 在频域左声道信号相位与频域右声道信号相位 不重合的情况下, 本实施例获得的下混信号相位通常既不与频域 左声道信号相 位重合, 也不与频域右声道信号相位重合。 一种优选的方式包括: 通过第二函 数计算获得的下混信号相位偏向于能量高的一 路频域声道信号相位。 即第二函 数使下混信号相位与能量高的一路频域声道信 号相位的夹角小于下混信号相 位与能量低的一路频域声道信号相位的夹角。 也就是说, 如果一个频率点上的 频域左声道信号能量高于频域右声道信号能量 , 则在该频率点上, 第二函数可 以使下混信号相位与频域左声道信号相位的夹 角小于下混信号相位与频域右 声道信号相位的夹角; 如果一个频率点上的频域右声道信号能量高于 频域左声 道信号能量, 则在该频率点上, 第二函数可以使下混信号相位与频域右声道信 号相位的夹角小于下混信号相位与频域左声道 信号相位的夹角。 另外, 下混信 号相位最好位于频域左声道信号相位与频域右 声道信号相位之间的较小夹角 中, 较小夹角如实施例一中的描述。
上述第二函数的一个具体的例子为:
^(^ -—^-•(ΙΡΟ^ -Θ^ ; 公式( 13 ) 公式(13 )中, 表示频率点索引为 的频域左声道信号相位,上述 C (W 表示频带索引 6的频域声道信号能量比, c(W = 10 , D , CJD(b)为频率点索引 所在频带的频带索引 6的频域声道信号电平差, α ) 可以通过上述公式(1 )
1
获得, l + 可以称为函数中的频带索引 6的频域声道信号能量比系数, IPD(b 为频率点索引 所在频带的频带索引 6的频域左声道信号和频域右声道信号间 的相位差, 可以通过上述公式(2 )获得。 ^表示群相位。
通过上述公式(13 )可以计算获得各频带的各频率点的下混信号 位。 上 述公式( 13 )仅仅是一种例举而已, 本实施例不限制第二函数的具体表现形式, 只要第二函数能够使下混信号相位位于频域左 声道信号相位和频域右声道信 号相位之间即可。
如果频率点索引 的下混信号用 M( )来表示, 则下混信号 M( 相位为:
^M(k) = ZX X (k) -―^— · (IPD(b) - 0 g )
1 + c 公式(14 ) 在上述公式( 14 )中, ZM 为频率点索引 k的下混信号相位, ( P ) W- 的取值范围可以为 (-pi, pi]。
针对各频带中的各频率点, 可以通过上述公式(5 ) 获取下混信号幅度, 在此不再详细说明。 本实施例也可以采用除公式(5 )之外的其它方法来获取 下混信号幅度, 本实施例不限制获取下混信号幅度的具体实现 方式。
在利用上述例举的方式获得了下混信号相位和 幅度后, 可以通过上述公式 ( 6 )获得频域下混信号, 在此不再详细说明。
频域左声道相位、 频域右声道相位、 以及通过第二函数计算获得的下混信 号相位的一个例子如附图 3B所示。
图 3B中, R1和 R2均为频域右声道信号相位, R1和 R2可以表示出频域右声 道信号的相位变化, L表示频域左声道信号相位, Ml表示 R1和 L对应的下混信 号相位, M2表示 R2和 L对应的下混信号相位。 从图 3B可以看出, 在频域左右声 道信号接近反相且跳变幅度大的情况下, 通过包含有 IPD和 group phase的第二 函数可以使下混信号相位统一偏向一个方向, 如图 3B中统一偏向 L, 从而可以 在一定程度上避免下混信号相位跳变大而引入 的噪声。 图 3B ( a )是采用第一 函数获得的下混信号相位, 而图 3B(b)是采用第二函数获得的下混信号相位。
S330、 对频域下混信号进行频时变换, 获得时域下混信号, 时频下混信号 即下混单声道信号。 需要说明的是, 在编码端支持对频域信号编码的情况下, 本实施例可以不 包括 S330, 即 S320获得的频域下混信号为下混单声道信号。
编码端对时域下混信号或者频域下混信号进行 编码、 以及对左右声道的声 场信息进行量化编码的具体例子如上述实施例 一中的描述, 在此不再重复说 明。 另外, 在本实施例中编码端需要将群相位量化编码并 传输至解码端。
实施例三通过利用第二函数使下混信号相位位 于第一路频域声道信号相 位和第二路频域声道信号相位之间, 避免了在左右两路声道信号完全反相且幅 度相同的情况下, 下混信号为 0的现象, 从而避免了解码端无法恢复出左右两 路声道信号的现象, 而且, 还可以避免下混信号的能量缺失现象; 由于下混信 号位于第一路频域声道信号相位和第二路频域 声道信号相位之间, 因此, 实施 例一获得的下混信号能够充分反映立体声信号 的声场特点, 最终提高了立体声 编解码的主观质量。
实施例三通过使用包含 group phase的第二函数来获得频域下混信号相位, 使下混信号相位统一偏向一个方向, 从而减小了下混信号相位跳变的幅度, 进 一步提升了在左右声道信号反相且跳变程度大 的情况下, 立体声信号的性能。
实施例四、 获得立体声信号的方法。 该实施例是与上述实施例三对应的解 码端获得立体声信号的方法。
在实施例四中, 首先, 编码端发送的下混单声道比特流被传输至单声 道解 码器, 如果编码端对时域下混信号进行编码, 则单声道解码器对接收到的比特 流进行解码处理后,输出时域下混信号。如果 编码端对频域下混信号进行编码, 则单声道解码器对接收到的比特流进行解码处 理后, 输出频域下混信号。 编码 端发送的立体声参数比特流被传输至解量化器 , 解量化器对接收到的比特流进 行解量化处理后, 输出左右声道的声场信息(即立体声参数) , 如各频带的左 右声道信号电平差、 各频带的左右声道信号相位差和群相位等, 再如, 各频带 统一对应的一个左右声道信号电平差、 各频带统一对应的一个左右声道信号相 位差和群相位等。
其次, 对时域下混信号进行时频变换处理, 获得频域下混信号 M '( )。 需要 说明的是, 如果编码端是对频域下混信号进行编码, 则不需要执行该时频变换 处理。
再次, 利用左右声道信号电平差获得频域左右声道信 号幅度, 利用左右声 道信号电平差、 左右声道信号相位差和 获得频域左右声道信号相位。
获得频域左右声道信号幅度的过程如上述公式 (7 )和公式(8 )所示。 获得频域左右声道信号相位的过程如下述公式 (15 )和公式(16 )所示: ; (k) = ΔΜ (k) +―^— · (IPD(b) - 0 g )
1 + 公式( 15 )
Ζ ; ( = ZM k) +―^— · (IPD(b) -0 g ) -IPD(b)
1 + c 公式(16 ) 在公式(15 )和公式(16 ) 中, 表示频域左声道信号相位, 表 示解码后获得的频域下混信号, ZM 'W表示频域下混信号相位, c(W = W w/1D , OJ)(b)为频率点索引 ]^所在频带的频带索引 6 的声道信号电平差, PD(b)表示频 率点索引 k所在频带的频带索引 6的频域左声道信号和频域右声道信号间的相 位差, 表示频域右声道信号相位, 的取值范围为 (-pi, pi] , ^为群 相位。
之后, 合成频域左右声道信号。 合成频域左右声道信号的过程可以如上述 公式( 11 )和公式( 12 )所示, 在此不再重复说明。
最后,将合成的频域左右声道信号进行频时变 换,获得时域左右声道信号, 时域左声道信号即解码端最终获得的左声道解 码信号, 时域右声道信号即解码 端最终获得的右声道解码信号。
需要说明的是, 本实施例中的编码端和解码端最好使用相同的 左右声道信 号电平差和左右声道信号相位差。 当然, 编码端和解码端也可以使用不同的左 右声道信号电平差和左右声道信号相位差, 具体如上述实施例一中的描述, 在 此不再重复说明。 另外, 在低码率的应用环境中, 本实施例获得的频域左声道 相位可以与下混信号相位相同, 而频域右声道相位可以是下混信号相位与和群 相位 生成的 IPD的差。
在实施例四中, 由于编码端获得的下混信号相位位于第一路频 域声道信号 相位和第二路频域声道信号相位之间, 因此, 解码端在解码过程中不会出现由 于下混信号为 0而无法恢复出左右两路声道信号的现象, 而且, 由于编码端避 免了下混信号的能量缺失现象, 因此, 解码端获得的时域左声道信号和时域右 声道信号更接近于编码端的时域左声道信号和 时域右声道信号。
实施例五、 立体声信号下混方法。 下面结合附图 4, 以左声道信号为第一 路声道信号,右声道信号为第二路声道信号为 例对本实施例进行说明。明显的, 以右声道信号为第一路声道信号, 以左声道信号为第二路声道信号的情况, 本 实施例也是可以完全可行的。 实施例五的实现框图如附图 4所示。
图 4中, S400、 在编码端, 对接收到的立体声时域左声道信号和时域右声 道信号分别进行时频变换, 这样, 时域左声道信号被变换为频域左声道信号, 时域右声道信号被变换为频域右声道信号。 本实施例可以采用 FFT或者 QMF等 方式进行立体声信号的时频变换。 本实施例不限制对时域左声道信号和时域右 声道信号进行时频变换的具体实现过程。
S410、 获得频域左声道信号和频域右声道信号的频域 声道信号电平差、 声 道信号相位差、 群相位 和群延时 d g。
本实施例中的频域左声道信号和频域右声道信 号可以均被划分为若干个 频带, 频带宽度可以根据实际应用来设置, 如频带宽度可以设置为 1, 再如针 对高频信号频带宽度可以设置的宽一些, 而针对低频信号频带宽度可以设置的 窄一些。 如果使用 表示频率点索引且使用 表示频带索引, 则 ^ )表示频域 左声道信号, 表示频域右声道信号, 表示第 ό个频带的起始频率点索引。
在本实施例中, 获得频域声道信号电平差和频域声道信号相位 差为获得频 域左声道信号和频域右声道信号的基于频带或 频率点的频域声道信号电平差 和频域声道信号相位差。 获得频域声道信号电平差和频域声道信号相位 差的方 式可以包括多种, 例如、 获取各频带的频域声道信号电平差和各频带的 频域声 道信号相位差; 再例如、 获取各频带中各频率点的频域声道信号电平差 和各频 带中各频率点的频域声道信号相位差; 再例如, 针对部分频带, 获取频带的频 域声道信号电平差和频带的频域声道信号相位 差, 针对另一部分频带, 获取频 带中各频率点的频域声道信号电平差和频带中 各频率点的频域声道信号相位 差。 一个具体例子为: 如果一个频带中的声道信号为低频信号, 则可以获取该 频带的频域声道信号电平差和频域声道信号相 位差, 如果一个频带中的声道信 号为高频信号, 则可以获取该频带中的各频率点的频域声道信 号电平差和频域 声道信号相位差。 利用频率点的频域声道信号电平差和频域声道 信号相位差来 获得下混信号相位能够更加准确的反映出立体 声信号的声场特点。
上述每个频带的声道信号电平差可以根据每个 频带的频域左声道信号能 量与频域右声道信号能量的比值获得, 上述每个频率点的声道信号电平差可以 根据每个频率点的频域左声道信号能量与频域 右声道信号能量的比值获得。 上 述每个频带的频域声道信号相位差可以利用每 个频带的频域左声道信号与频 域右声道信号的互相关相位来表示, 上述每个频率点的频域声道信号相位差可 以利用每个频率点的频域左声道信号与频域右 声道信号的互相关相位来表示, 当然, 也可以采用其它方式来表示每个频带或每个频 率点的频域声道信号相位 差, 本实施例不限制每个频带或每个频率点的频域 声道信号相位差的具体表示 方式。
上述群延时(group delay, )为频域左声道信号和频域右声道信号之间 的时间差。 群延时可以通过左右声道信号频域相位差计算 获得, 也可以通过左 右声道信号时域相位差等现有多种方式计算获 得, 本实施例不限制群延时的具 体获得过程。
获取每个频带的频域声道信号电平差和频域声 道信号相位差的具体例子 如上述实施例一中的描述, 在此不再重复说明。
S420、 针对各频带中的各频率点, 利用第一函数或者第二函数计算获得相 位位于频域左声道信号相位和频域右声道信号 相位之间的下混信号相位。 针对 各频带中的各频率点, 计算获取下混信号幅度。 本实施例不限制获得下混信号 相位和下混信号幅度的先后顺序。 在获得了下混信号相位和下混信号幅度之 后, 根据下混信号相位和下混信号幅度获得频域下 混信号。
上述第一函数的具体例子和第二函数的具体例 子如上述实施例一和实施 例三的描述, 在此不再重复说明。
利用第一函数或者第二函数计算获得相位位于 频域左声道信号相位和频 域右声道信号相位之间的下混信号相位的一个 具体例子为:
在 = 0 时, 利用第二函数计算获得的下混信号相位为:
^M(k) = ZX X (k)― · (IPD(b)― 0 g ) 否则, 利用第一函数计算获得的下混信号相位为:
^M(k) = ZX, (k) -―^— · IPD(b)
1 + c(b) 。
针对各频带中的各频率点, 可以通过上述公式(5 ) 获取下混信号幅度, 在此不再详细说明。 本实施例也可以采用除公式(5 )之外的其它方法来获取 下混信号幅度, 本实施例不限制获取下混信号幅度的具体实现 方式。
在利用上述例举的方式获得了下混信号相位和 下混信号幅度后, 可以通过 上述公式(6 )获得频域下混信号, 在此不再详细说明。
S430、 对频域下混信号进行频时变换, 获得时域下混信号, 时频下混信号 即下混单声道信号。
需要说明的是, 在编码端支持对频域信号编码的情况下, 本实施例可以不 包括 S430, 即 S420获得的频域下混信号为下混单声道信号。
上述实施例五, 利用 group delay即左右声道信号的时间差, 通过对不同时 间差采用不同的下混方法, 可以使立体声信号的性能得到进一步提升。
实施例六、 获得立体声信号的方法。 该实施例是与上述实施例五对应的解 码端获得立体声信号的方法。
在实施例六中, 首先, 编码端发送的下混单声道比特流被传输至单声 道解 码器, 如果编码端对时域下混信号进行编码, 则单声道解码器对接收到的比特 流进行解码处理后,输出时域下混信号。如果 编码端对频域下混信号进行编码, 则单声道解码器对接收到的比特流进行解码处 理后, 输出频域下混信号。 编码 端发送的立体声参数比特流被传输至解量化器 , 解量化器对接收到的比特流进 行解量化处理后, 输出左右声道的声场信息(即立体声参数) , 如各频带的左 右声道信号电平差、各频带的左右声道信号相 位差、群相位和群延时等,再如, 各频带统一对应的一个左右声道信号电平差、 各频带统一对应的一个左右声道 信号相位差、 群相位和群延时等。
其次, 对时域下混信号进行时频变换处理, 获得频域下混信号 M '( )。 需要 说明的是, 如果编码端是对频域下混信号进行编码, 则不需要执行该时频变换 处理。
再次, 利用左右声道信号电平差获得频域左右声道信 号幅度, 利用左右声 道信号电平差、 左右声道信号相位差、 和 获得频域左右声道信号相位。
获得频域左右声道信号幅度的过程如上述公式 (7 )和公式(8 )所示。 获得频域左右声道信号相位的过程如下述所示 :
在 = 0 时, 频域左右声道信号相位为:
Z ; (k) = Ζ ' (k) + · (IPD(b)― 6 g ) ; W = · (IPD(b) -0 g ) -IPD(b)
在低速率应用环境下, 由于可以不传输 ^( 6 ), 因此, 频域左声道信号相 位保持下混信号相位, 而频域右声道信号相位是下混信号相位与群相 位 生成 的 IPD的差。
在 不为零时, 频域左右声道信号相位为:
Z ; (k) = ΔΜ (k) +―^— · IPD(b)
\ + c(b) . ; (A) = M k) --^- . IPD{b)
1 + c(b) . 这时, 在低码率应用环境下, 可以使用群延时" g和群相位 生成的左右声 道信号相位差来代替每个频带的左右声道信号 相位差进行解码。
之后, 合成频域左右声道信号。 合成频域左右声道信号的过程可以如上述 公式( 11 )和公式( 12 )所示, 在此不再重复说明。
最后,将合成的频域左右声道信号进行频时变 换,获得时域左右声道信号, 时域左声道信号即解码端最终获得的左声道解 码信号, 时域右声道信号即解码 端最终获得的右声道解码信号。
需要说明的是, 本实施例中的编码端和解码端最好使用相同的 左右声道信 号电平差和左右声道信号相位差。 当然, 编码端和解码端也可以使用不同的左 右声道信号电平差和左右声道信号相位差, 具体如上述实施例一中的描述, 在 此不再重复说明。 在低码率应用环境中, 实施例六中的解码端可以将解码获得 的群相位 ^作为每个频带的左右声道信号相位差。
在实施例六中, 由于编码端获得的下混信号相位位于第一路频 域声道信号 相位和第二路频域声道信号相位之间, 因此, 解码端在解码过程中不会出现由 于下混信号为 0而无法恢复出左右两路声道信号的现象, 而且, 由于编码端避 免了下混信号的能量缺失现象, 因此, 解码端获得的时域左声道信号和时域右 声道信号更接近于编码端的时域左声道信号和 时域右声道信号。 本实施例利用 了群延时即左右声道信号的时间差, 通过对不同时间差采用不同的获得立体声 信号方法, 可以使立体声信号的性能得到进一步提升。
实施例七、 编码装置。 下面结合附图 5对本实施例进行说明。 本实施例中 的第一路声道信号可以为左声道信号, 第二路声道信号可以为右声道信号。 明 显的, 以右声道信号为第一路声道信号, 以左声道信号为第二路声道信号的情 况, 本实施例也是可以完全可行的。 该装置如附图 5所示。
图 5中的编码装置包括: 时频变换模块 500、 第一获取模块 510、 第二获取 模块 520、 第三获取模块 530和下混模块 540。 可选的, 该编码装置还包括: 频 域单声道编码器 550; 或者可选的, 该编码装置还包括: 频时变换模块 560和时 域单声道编码器 570。
时频变换模块 500, 用于将立体声时域左声道信号和时域右声道信 号转换 为频域左声道信号和频域右声道信号。时频变 换模块 500可以采用 FFT或者 QMF 等方式进行立体声信号的时频变换。 本实施例不限制时频变换模块 500对时域 左声道信号和时域右声道信号进行时频变换的 具体实现过程。
第一获取模块 510, 用于获取时频变换模块 500转换获得的频域左声道信号 和频域右声道信号的频域声道信号电平差和频 域声道信号相位差。 第一获取模 块 510可以获取各频带的频域声道信号电平差和各 频带的频域声道信号相位 差; 也就是说, 第一获取模块 510可以根据预先设置好的频带宽度来获取每个 频带的频域声道信号电平差和频域声道信号相 位差。 频带宽度可以根据实际应 用来设置, 如频带宽度可以设置为 1等, 再如针对高频信号频带宽度可以设置 的宽一些, 而针对低频信号频带宽度可以设置的窄一些等 。 第一获取模块 510 也可以获取各频带中各频率点的频域声道信号 电平差和各频带中各频率点的 频域声道信号相位差。 第一获取模块 510还可以针对部分频带, 获取频带的频 域声道信号电平差和频带的频域声道信号相位 差, 针对另一部分频带, 获取频 带中各频率点的频域声道信号电平差和频带中 各频率点的频域声道信号相位 差。
第一获取模块 510获取频域声道信号电平差和频域声道信号相 位差的多种 方式如上述实施例一中的描述, 在此不再重复说明。
第一获取模块 510可以根据每个频带的频域左声道信号能量与 频域右声道 信号能量的比值获得每个频带的声道信号电平 差, 第一获取模块 510可以根据 每个频率点的频域左声道信号能量与频域右声 道信号能量的比值获得每个频 率点的声道信号电平差。 第一获取模块 510可以利用每个频带的频域左声道信 号与频域右声道信号的互相关相位来表示每个 频带的频域声道信号相位差, 第 一获取模块 510可以利用每个频率点的频域左声道信号与频 域右声道信号的互 相关相位来表示每个频率点的频域声道信号相 位差。 当然, 第一获取模块 510 也可以采用其它方式来表示每个频带或每个频 率点的频域声道信号相位差。
第一获取模块 510可以利用上述公式(1 )获得每个频带的频域声道信号电 平差, 第一获取模块 510可以利用上述公式(2 )获得每个频带的声道信号互相 关相位, 本实施例不限制第一获取模块 510获取每个频带的声道信号能量比和 声道信号互相关相位的具体实现过程。
第二获取模块 520, 用于针对各频带中的各频率点, 利用基于频域声道信 号电平差和频域声道信号相位差的函数(如第 一函数或第二函数)计算获得相 位位于第一路频域声道信号相位和第二路频域 声道信号相位之间的下混信号 相位。 第二获取模块 520通过函数计算获得的下混信号相位位于频域 左声道信 号相位和频域右声道信号相位之间, 在频域左声道信号相位与频域右声道信号 相位不重合的情况下, 第二获取模块 520获得的下混信号相位通常既不与频域 左声道信号相位重合,也不与频域右声道信号 相位重合。一种优选的方式包括: 第二获取模块 520通过函数计算获得的下混信号相位偏向于能 量高的一路声道 信号相位。 即第二获取模块 520通过该函数使下混信号相位与能量高的一路 频 域声道信号相位的夹角小于下混信号相位与能 量低的一路频域声道信号相位 的夹角。 也就是说, 如果一个频率点上的频域左声道信号能量高于 频域右声道 信号能量, 则在该频率点上, 第二获取模块 520利用该函数可以使下混信号相 位与频域左声道信号相位的夹角小于下混信号 相位与频域右声道信号相位的 夹角; 如果一个频率点上的频域右声道信号能量高于 频域左声道信号能量, 则 在该频率点上, 第二获取模块 520利用该函数可以使下混信号相位与频域右声 道信号相位的夹角小于下混信号相位与频域左 声道信号相位的夹角。 另外, 第 二获取模块 520获得的下混信号相位最好位于频域左声道信 号相位与频域右声 道信号相位之间的较小夹角中, 较小夹角如实施例一中的描述。
第二获取模块 520可以包括: 第一子模块 521或者第二子模块 522 ; 或者第 二获取模块 520可以包括: 第一子模块 521、 第二子模块 522和第三子模块 523。
第一子模块 521中存储有利用一路频域声道信号相位、 第一路频域声道信 号与第二路频域声道信号电平差以及第一路频 域声道信号与第二路频域声道 信号相位差构建的第一函数, 第一子模块 521利用该第一函数计算获得下混信 号相位。 第一函数的一个具体例子如上述公式(3 )所示, 第一子模块 521可以 利用上述公式(4 )计算获得下混信号 M 相位, 在此不再详细说明。
第二子模块 522中存储有利用一路频域声道信号相位、 群相位、 第一路频 域声道信号与第二路频域声道信号电平差的量 化值以及第一路频域声道信号 与第二路频域声道信号相位差构建的第二函数 , 第二子模块 522利用该第二函 数计算获得下混信号相位。 第二函数的一个具体例子如上述公式(13 )所示, 第二子模块 522可以计算各频带的声道信号相位的平均值, 将该平均值作为群 相位 。 第二子模块 522可以利用上述公式( 14 )计算获得下混信号 M ( 相位, 在 JHI不再详细说明。
第三子模块 523, 用于获取群延时, 如果群延时为 0, 则通知第二子模块 522 计算获得下混信号相位, 否则, 通知第一子模块 521计算获得下混信号相位。 第三子模块 523可以计算频域左声道信号和频域右声道信号 之间的时间差, 将 该时间差作为群延时 d s。 第三子模块 523也可以利用左右声道信号频域互相关 相位或者时域互相关相位计算获得群延时 , 本实施例不限制第三子模块 523 获得群延时的具体过程。
第三获取模块 530, 用于针对各频带中的各频率点, 计算获得下混信号幅 度。第三获取模块 530可以利用上述公式(5 )获取下混信号幅度。上述公式(5 ) 仅仅是一种例举而已, 第三获取模块 530可以采用现有的多种方法获取下混信 号幅度, 本实施例不限制第三获取模块 530获取下混信号幅度的具体实现方式。
本实施例不限制第二获取模块 520获取下混信号相位与第三获取模块 530 获取下混信号幅度的先后顺序。
下混模块 540, 用于根据第二获取模块 520获得的下混信号相位和第三获取 模块 530获得的下混信号幅度获得频域下混信号。 下混模块 540可以通过上述公 式(6 )获得频域下混信号。 具体过程在此不再详细说明。
频域单声道编码器 550, 用于对下混模块 540获得的频域下混信号进行编 码获得频域下混单声道比特流, 并向解码端发送该频域下混单声道比特流。 频 域单声道编码器 550如符合 ITU-T G.711.1或 ITU-T G.722标准规定的编码器等。
频时变换模块 560, 用于将下混模块 540获得的频域下混信号转换为时域 下混信号。
时域单声道编码器 570, 用于对频时变换模块 560获得的时域下混信号进 行编码获得时域下混单声道比特流, 并向解码端发送该时域下混单声道比特 流。
在本实施例中, 左右声道的声场信息 (即立体声参数)如左右声道信号电 平差、左右声道信号相位差、群延时和群相位 等被传输至编码装置中的量化器, 量化器对立体声参数进行量化编码, 并输出立体声参数比特流。 由于对立体声 参数进行了量化处理, 因此, 可以保证解码装置采用的立体声参数与编码端 发 送的立体声参数相同。 这里的左右声道信号电平差可以是各频带的左 右声道信 号电平差, 也可以是各频带统一对应的一个左右声道信号 电平差, 同样的, 左 右声道信号相位差可以是各频带的左右声道信 号相位差, 也可以是各频带统一 对应的一个左右声道信号相位差 (如群相位 等) 。
在实施例七中, 第二获取模块 520通过利用第一函数使下混信号相位位于 第一路频域声道信号相位和第二路频域声道信 号相位之间, 避免了在左右两路 声道信号完全反相且幅度相同的情况下, 下混模块 540获得的下混信号为 0的现 象, 从而避免了解码端无法恢复出左右两路声道信 号的现象, 而且, 还可以避 免下混信号的能量缺失现象; 由于下混模块 540获得的下混信号位于第一路频 域声道信号相位和第二路频域声道信号相位之 间, 因此, 实施例七的编码装置 获得的下混信号能够充分反映立体声信号的声 场特点, 最终提高了立体声编解 码的主观质量。 实施例八、 解码装置。 下面结合附图 6对本实施例进行说明。 本实施例中 的第一路声道信号可以为左声道信号, 第二路声道信号可以为右声道信号。 该 装置如附图 6所示。
图 6中的装置包括: 第四获取模块 600、 重建模块 610、 合成模块 620和频时 变换模块 630。
第四获取模块 600, 用于获取解码后的频域下混信号、 每个频带的频域声 道信号电平差和每个频带的频域声道信号相位 差。
在编码端支持对时域信号编码的情况下, 第四获取模块 600对解码装置接 收到的比特流进行解码处理后, 获得时域下混信号, 并将时域下混信号转换为 频域下混信号。
在编码端支持对频域信号编码的情况下, 第四获取模块 600对解码装置接 收到的比特流进行解码处理后, 获得频域下混信号。
第四获取模块 600对解码装置接收到的立体声参数比特流进行 解码处理 后, 获得左右声道的声场信息 (即立体声参数) , 如左右声道信号电平差、 左 右声道信号相位差、 群延时和群相位等。
重建模块 610, 用于根据基于频域声道信号电平差和频域声道 信号相位差 的函数、 第四获取模块 600获取的频域下混信号、 频域声道信号电平差和频域 声道信号相位差获得频域左右声道信号幅度和 相位。
重建模块 610可以利用上述公式 (7 )和公式(8 )获得频域左右声道信号 幅度。 重建模块 610可以利用上述公式(9 )和公式(10 )获得频域左右声道信 号相位, 重建模块 610也可以利用上述公式(15 )和公式(16 )获得频域左右 声道信号相位。 另外, 如果第一获取模块 600还获得了群延时, 则重建模块 610 可以对群延时进行判断, 如果群延时为零, 则利用上述公式( 15 )和公式(16 ) 获得频域左右声道信号相位, 否则, 利用上述公式(9 )和公式(10 )获得频 域左右声道信号相位。 具体过程在此不再详细说明。
合成模块 620, 用于根据重建模块 610获得的频域左右声道信号幅度和相位 合成频域左声道信号和频域右声道信号。 合成模块 620可以利用上述公式(11 ) 和公式(12 )合成频域左右声道信号, 具体过程在此不再详细说明。
频时变换模块 630, 用于将合成模块 620合成的频域左声道信号和频域右声 道信号转换为时域左声道信号和时域右声道信 号。
需要说明的是, 编码装置和解码装置最好使用相同的左右声道 信号电平差 和左右声道信号相位差, 例如在编码装置使用群相位 表示左右声道信号相位 差时, 解码装置应将解码获得的群相位 作为每个频带的左右声道信号相位 差。 具体如上述实施例中的描述, 在此不再重复说明。
在实施例八中, 由于编码装置获得的下混信号相位位于第一路 频域声道信 号相位和第二路频域声道信号相位之间, 因此,解码装置中的第四获取模块 600 不会获得解码为 0的下混信号, 这样不会导致重建模块 610无法获得频域左右声 道信号相位和幅度的现象, 从而不会使合成模块 620无法合成左右两路声道信 号的现象; 而且, 由于编码装置避免了下混信号的能量缺失现象 , 因此, 合成 模块 620合成获得的时域左声道信号和时域右声道信 号更接近于编码端的时域 左声道信号和时域右声道信号, 从而提升了立体声信号的性能。
实施例九、 编解码系统。 下面结合附图 7、 以左声道信号为第一路声道信 号、 以右声道信号为第二路声道信号为例对本实施 例进行说明。 明显的, 以右 声道信号为第一路声道信号, 以左声道信号为第二路声道信号的情况, 本实施 例也是可以完全可行的。
图 7中的编解码系统包括: 编码装置 700和解码装置 710。
编码装置 700, 用于将立体声时域左声道信号和时域右声道信 号转换为频 域左声道信号和频域右声道信号, 获得频域左声道信号和频域右声道信号的频 域声道信号电平差和频域声道信号相位差, 针对各频带中的各频率点, 利用基 于频域声道信号电平差和频域声道信号相位差 的函数计算获得相位位于频域 左声道信号相位和频域右声道信号相位之间的 下混信号相位; 针对各频带中的 各频率点, 计算获得下混信号幅度; 根据获得的下混信号相位和下混信号幅度 获得频域下混信号。
编码装置 700可以对频域下混信号进行编码, 获得下混单声道信号, 并向 解码装置 710发送下混单声道信号。 编码装置 700也可以对频域下混信号进行频 时变换处理, 获得时域下混信号, 并对时域下混信号进行编码, 获得下混单声 道信号, 之后, 向解码装置 710发送下混单声道信号。
另外, 编码装置 700还需要对立体声参数进行量化编码, 并向解码装置 710 发送量化编码后获得的立体声参数比特流。
解码装置 710根据接收的下混单声道信号获取解码后的频 域下混信号。 如 果编码装置 700是对频域下混信号进行编码, 则解码装置 710可以直接对接收到 的下混单声道信号进行解码, 即可获得频域下混信号。 如果编码装置 700是对 时域下混信号进行编码, 则解码装置 710应先对接收到的下混单声道信号进行 解码, 然后,对解码后的时域下混信号进行时频转换 ,从而获得频域下混信号。 解码装置 710根据接收的立体声参数比特流获得每个频带 的频域声道信号 电平差和每个频带的频域声道信号相位差, 即解码装置 710对接收到的立体声 参数比特流进行解量化处理, 获得左右声道的声场信息(即立体声参数) , 如 每个频带的频域声道信号电平差、 每个频带的频域声道信号相位差、 群相位和 群延时等。
解码装置 710根据频域下混信号、 第一函数或者第二函数、 频域声道信号 电平差和频域声道信号相位差获得频域左右声 道信号幅度和相位。 在立体声参 数不包括群相位的情况下, 解码装置 710可以利用第一函数获得频域左右声道 信号相位。 在立体声参数包括群相位且不包括群延时的情 况下, 解码装置 710 可以利用第二函数获得频域左右声道信号相位 。 在立体声参数既包括群相位又 包括群延时的情况下, 解码装置 710可以对群延时进行判断, 在确定出群延时 为零时, 采用第二函数获得频域左右声道信号相位, 否则, 采用第一函数获得 频域左右声道信号相位。
解码装置 710根据频域左右声道信号电平差和相位合成频 域左声道信号和 频域右声道信号, 并将频域左声道信号和频域右声道信号转换为 时域左声道信 号和时域右声道信号。
编码装置 700和解码装置 710具体执行的操作如上述方法实施例中的描述 , 编码装置 700和解码装置 710的具体结构如上述装置实施例中的描述, 在此不再 详细说明。
通过以上的实施方式的描述, 本领域的技术人员可以清楚地了解到本发明 可借助软件加必需的硬件平台的方式来实现, 当然也可以全部通过硬件来实 施, 但很多情况下前者是更佳的实施方式。 基于这样的理解, 本发明的技术方 案对背景技术做出贡献的全部或者部分可以以 软件产品的形式体现出来, 所述 的软件产品在可以用于执行上述的方法流程。 该计算机软件产品可以存储在存 储介质中, 如 ROM/RAM、 磁碟、 光盘等, 包括若干指令用以使得一台计算机 设备(可以是个人计算机, 服务器, 或者网络设备等)执行本发明各个实施例 或者实施例的某些部分所述的方法。
虽然通过实施例描绘了本发明, 本领域普通技术人员知道, 本发明有许多 变形和变化而不脱离本发明的精神, 本发明的申请文件的权利要求包括这些变 形和变化。
