吴文海 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
MIAO, Lei (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
苗磊 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
华为技术有限公司 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
WU, Wenhai (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
吴文海 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
MIAO, Lei (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
| 权 利 要 求 1、 一种立体声解码方法, 其特征在于, 包括: 从接收到的码流中解码恢复出单声道信号; 从所述接收到的码流中解码恢复出两声道信号间的电平差、 群延时和群 相位; 根据所述两声道信号间的电平差、 群延时和群相位, 对所述单声道信号 进行处理得到第一声道信号和第二声道信号。 2、 根据权利要求 1所述的立体声解码方法, 其特征在于, 所述根据所述 两声道信号间的电平差、 群延时和群相位, 对所述单声道信号进行处理得到 第一声道信号和第二声道信号包括: 将所述单声道信号进行时频变换处理, 得到单声道频域信号; 根据所述群延时和群相位, 得出两声道信号间的相位差估计值; 根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值, 对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信 号; 将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理, 得到所述第一声道信号和第二声道信号。 3、 根据权利要求 2所述的立体声解码方法, 其特征在于, 所述根据所述 两声道信号间的电平差和所述两声道信号间的相位差估计值, 对所述单声道 频域信号进行处理得到第一声道频域信号和第二声道频域信号包括: 根据所述两声道信号间的电平差, 对所述单声道频域信号的能量进行处 理, 得到第一声道频域信号的能量和第二声道频域信号的能量; 根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值, 对所述单声道频域信号的相位进行处理, 得到第一声道频域信号的相位和第 二声道频域信号的相位。 4、 根据权利要求 2所述的立体声解码方法, 其特征在于, 所述根据所述 两声道信号间的电平差和所述两声道信号间的相位差估计值, 对所述单声道 频域信号进行处理得到第一声道频域信号和第二声道频域信号包括: 根据所述两声道信号间的电平差, 对所述单声道频域信号的能量进行处 理, 得到第一声道频域信号的能量和第二声道频域信号的能量; 当所述群延时为 0 时, 根据所述两声道信号间的相位差估计值, 对所述 单声道频域信号的相位进行处理, 得到第一声道频域信号的相位和第二声道 频域信号的相位; 当所述群延时不为 0 时, 根据所述两声道信号间的电平差 和所述两声道信号间的相位差估计值, 对所述单声道频域信号的相位进行处 理, 得到第一声道频域信号的相位和第二声道频域信号的相位。 5、 根据权利要求 1所述的立体声解码方法, 其特征在于, 还包括: 从所 述接收到的码流中解码恢复出两声道信号间的相位差的差分值; 所述根据所述两声道信号间的电平差、 群延时和群相位, 对所述单声道 信号进行处理得到第一声道信号和第二声道信号包括: 根据所述两声道信号 间的电平差、 两声道信号间的相位差的差分值、 群延时和群相位, 对所述单 声道信号进行处理得到第一声道信号和第二声道信号。 6、 根据权利要求 5所述的立体声解码方法, 其特征在于, 所述根据所述 两声道信号间的电平差、 两声道信号间的相位差的差分值、 群延时和群相位, 对所述单声道信号进行处理得到第一声道信号和第二声道信号包括: 将所述单声道信号进行时频变换处理, 得到单声道频域信号; 根据所述群延时和群相位, 得出两声道信号间的相位差估计值; 根据所述两声道信号间的相位差估计值和所述两声道信号间的相位差的 差分值, 得到两声道信号间的相位差; 根据所述两声道信号间的电平差和所述两声道信号间的相位差, 对所述 单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号; 将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理, 得到所述第一声道信号和第二声道信号。 7、 根据权利要求 6所述的立体声解码方法, 其特征在于, 所述根据所述 两声道信号间的电平差和所述两声道信号间的相位差, 对所述单声道频域信 号进行处理得到第一声道频域信号和第二声道频域信号包括: 根据所述两声道信号间的电平差, 对所述单声道频域信号的能量进行处 理, 得到第一声道频域信号的能量和第二声道频域信号的能量; 根据所述两声道信号间的电平差和所述两声道信号间的相位差, 对所述 单声道频域信号的相位进行处理, 得到第一声道频域信号的相位和第二声道 频域信号的相位。 8、 根据权利要求 6所述的立体声解码方法, 其特征在于, 所述根据所述 两声道信号间的电平差和所述两声道信号间的相位差, 对所述单声道频域信 号进行处理得到第一声道频域信号和第二声道频域信号包括: 根据所述两声道信号间的电平差, 对所述单声道频域信号的能量进行处 理, 得到第一声道频域信号的能量和第二声道频域信号的能量; 当所述群延时为 0 时, 根据所述两声道信号间的电平差、 所述两声道信 号间的相位差和群相位, 对所述单声道频域信号的相位进行处理, 得到第一 声道频域信号的相位和第二声道频域信号的相位; 当所述群延时不为 0 时, 根据所述两声道信号间的电平差和所述两声道信号间的相位差, 对所述单声 道频域信号的相位进行处理, 得到第一声道频域信号的相位和第二声道频域 信号的相位。 9、 一种立体声解码装置, 其特征在于包括: 信号解码模块, 用于从接收到的码流中解码恢复出单声道信号; 参数解码模块, 用于从所述接收到的码流中解码恢复出两声道信号间的 电平差、 群延时和群相位; 信号获取模块, 用于根据所述两声道信号间的电平差、 群延时和群相位, 对所述单声道信号进行处理得到第一声道信号和第二声道信号。 10、 根据权利要求 9所述的立体声解码装置, 其特征在于, 所述信号获 取模块包括: 第一处理子模块, 用于将所述单声道信号进行时频变换处理, 得到单声 道频域信号; 第一相位差获取子模块, 用于根据所述群延时和群相位, 得出两声道信 号间的相位差估计值; 第一频域信号获取子模块, 用于根据所述两声道信号间的电平差和所述 两声道信号间的相位差估计值, 对所述单声道频域信号进行处理得到第一声 道频域信号和第二声道频域信号; 第一信号获取子模块, 用于将所述第一声道频域信号和第二声道频域信 号分别进行频时变换处理, 得到所述第一声道信号和第二声道信号。 11、 根据权利要求 10所述的立体声解码装置, 其特征在于, 所述第一频 域信号获取子模块包括: 第一能量获取单元, 用于根据所述两声道信号间的电平差, 对所述单声 道频域信号的能量进行处理, 得到第一声道频域信号的能量和第二声道频域 信号的能量; 第一相位获取单元, 用于根据所述两声道信号间的电平差和所述两声道 信号间的相位差估计值, 对所述单声道频域信号的相位进行处理, 得到第一 声道频域信号的相位和第二声道频域信号的相位。 12、 根据权利要求 10所述的立体声解码装置, 其特征在于, 第一频域信 号获取子模块包括: 第二能量获取单元, 用于根据所述两声道信号间的电平差, 对所述单声 道频域信号的能量进行处理, 得到第一声道频域信号的能量和第二声道频域 信号的能量; 第二相位获取单元, 用于当所述群延时为 0 时, 根据所述两声道信号间 的相位差估计值, 对所述单声道频域信号的相位进行处理, 得到第一声道频 域信号的相位和第二声道频域信号的相位; 当所述群延时不为 0 时, 根据所 述两声道信号间的电平差和所述两声道信号间的相位差估计值, 对所述单声 道频域信号的相位进行处理, 得到第一声道频域信号的相位和第二声道频域 信号的相位。 13、 根据权利要求 9所述的立体声解码装置, 其特征在于, 所述参数解 码模块还用于从所述接收到的码流中解码恢复出两声道信号间的相位差的差 分值; 所述信号获取模块具体用于根据所述两声道信号间的电平差、 两声道信 号间的相位差的差分值、 群延时和群相位, 对所述单声道信号进行处理得到 第一声道信号和第二声道信号。 14、 根据权利要求 13所述的立体声解码装置, 其特征在于, 所述信号获 取模块包括: 第二处理子模块, 用于将所述单声道信号进行时频变换处理, 得到单声 道频域信号; 第二相位差获取子模块, 用于根据所述群延时和群相位, 得出两声道信 号间的相位差估计值; 第三相位差获取子模块, 用于根据所述两声道信号间的相位差估计值和 所述两声道信号间的相位差的差分值, 得到两声道信号间的相位差; 第二频域信号获取子模块, 用于根据所述两声道信号间的电平差和所述 两声道信号间的相位差, 对所述单声道频域信号进行处理得到第一声道频域 信号和第二声道频域信号; 第二信号获取子模块, 用于将所述第一声道频域信号和第二声道频域信 号分别进行频时变换处理, 得到所述第一声道信号和第二声道信号。 15、 根据权利要求 14所述的立体声解码装置, 其特征在于, 所述第二频 域信号获取子模块包括: 第三能量获取单元, 用于根据所述两声道信号间的电平差, 对所述单声 道频域信号的能量进行处理, 得到第一声道频域信号的能量和第二声道频域 信号的能量; 第三相位获取单元, 用于根据所述两声道信号间的电平差和所述两声道 信号间的相位差, 对所述单声道频域信号的相位进行处理, 得到第一声道频 域信号的相位和第二声道频域信号的相位。 16、 根据权利要求 14所述的立体声解码装置, 其特征在于, 所述第二频 域信号获取子模块包括: 第四能量获取单元, 用于根据所述两声道信号间的电平差, 对所述单声 道频域信号的能量进行处理, 得到第一声道频域信号的能量和第二声道频域 信号的能量; 第四相位获取单元, 用于当所述群延时为 0 时, 根据所述两声道信号间 的电平差、 所述两声道信号间的相位差和群相位, 对所述单声道频域信号的 相位进行处理, 得到第一声道频域信号的相位和第二声道频域信号的相位; 当所述群延时不为 0 时, 根据所述两声道信号间的电平差和所述两声道信号 间的相位差, 对所述单声道频域信号的相位进行处理, 得到第一声道频域信 号的相位和第二声道频域信号的相位。 |
本申请要求于 2010 年 2 月 12 日提交中国专利局、 申请号为 201010111432.1、发明名称为"立体声解码方法及装 置,,的中国专利申请的优先 权, 其全部内容通过引用结合在本申请中。
技术领域
本发明涉及通信技术领域, 尤其涉及一种立体声解码方法及装置。
背景技术
目前立体声编码方法主要包括强度立体声、 BCC (Binaual Cure Coding)和
PS( Parametric-Stereo coding)等编码方法, 在中高码率的通信场景下, 通常的 编码方法是提取两声道(如左右声道)信号间 的电平差 (InterChannel Level Difference , 简称: ILD ) (也可简称: CLD ) 和两声道信号间的相位差 ( InterChannel Phase Difference, 简称: IPD ) , 在某些情况下也可以提取两 声道互相关参数以及其中一声道与下混信号的 相位差参数, 将这些参数作为 边信息进行编码并发送到解码端, 以恢复立体声信号。 然而在低码率的通信 场景下, 不能同时传输 ILD和 IPD, 优先需要传输的是 ILD, 将该 ILD进行编码 并发送到解码端, 以恢复立体声信号。
根据以上立体声编码方法, 对应的立体声解码方法即为: 从码流中提取 单声道比特信号, 解码后得到单声道信号, 将单声道信号进行时频变换得到 单声道频域信号; 在中高码率的通信场景下, 从码流中提取 ILD和 IPD, 根据 单声道频域信号以及 ILD和 IPD, 得到左声道频域信号和右声道频域信号; 在 低码率的通信场景下, 从码流中提取 ILD, 根据单声道频域信号以及 ILD, 得 到左声道频域信号和右声道频域信号; 将左声道频域信号和右声道频域信号 分别进行频时变换得到左声道信号和右声道信 号。
上述低码率通信场景的立体声解码方法达到声 场效果所参考的参数仅为 ILD,也就是说,该解码方法得到的信号仅包含 声道信号间的能量大小信息, 导致得到的左声道信号和右声道信号的立体声 声场效果较差。
发明内容
本发明实施例提供了一种立体声解码方法及装 置。
本发明实施例提供的立体声解码方法, 包括:
从接收到的码流中解码恢复出单声道信号;
从所述接收到的码流中解码恢复出两声道信号 间的电平差、 群延时和群 相位;
根据所述两声道信号间的电平差、 群延时和群相位, 对所述单声道信号 进行处理得到第一声道信号和第二声道信号。 本发明实施例提供的立体声解码装置, 包括:
信号解码模块, 用于从接收到的码流中解码恢复出单声道信号 ; 参数解码模块, 用于从所述接收到的码流中解码恢复出两声道 信号间的 电平差、 群延时和群相位;
信号获取模块, 用于根据所述两声道信号间的电平差、 群延时和群相位, 对所述单声道信号进行处理得到第一声道信号 和第二声道信号。
附图说明
为了更清楚地说明本发明实施例或现有技术中 的技术方案, 下面将对实 施例或现有技术描述中所需要使用的附图作简 单地介绍, 显而易见地, 下面 描述中的附图仅仅是本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1为本发明实施例一提供的立体声解码方法的 程图;
图 2为本发明实施例二提供的立体声解码方法的 程图;
图 3为本发明实施例三提供的立体声解码方法的 程图;
图 4为本发明实施例四提供的立体声解码方法的 程图; 图 5为本发明实施例五提供的立体声解码方法的 程图;
图 6为本发明实施例六提供的立体声解码装置的 构示意图;
图 7为本发明实施例七提供的立体声解码装置的 构示意图;
图 8为本发明实施例八提供的立体声解码装置的 构示意图;
图 9为本发明实施例九提供的立体声解码装置的 构示意图;
图 10为本发明实施例十提供的立体声解码装置的 构示意图。
具体实施方式
下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行 清楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而 不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人员在没有作 出创造性劳动前提下所获得的所有其他实施例 , 都属于本发明保护的范围。 图 1为本发明实施例一提供的立体声解码方法的 程图。 如图 1所示, 本实施例包括如下步骤: 步骤 100、 从接收到的码流中解码恢复出单声道信号; 步骤 101、 从接收到的码流中解码恢复出 ILD、 群延时(group delay )和 群相位 ( group phase ); 其中, 群延时表示两声道信号间包络的时间延时的全 局方位信息, 群相 位表示两声道信号在时间对齐后的波形相似性 的全局信息。 步骤 102、 根据 ILD、 群延时和群相位, 对单声道信号进行处理得到第一 声道信号和第二声道信号。 本实施例提供的立体声解码方法适用于低码率 的通信场景, 其中接收到 的码流中包括编码的单声道信号, 并且至少包括编码的 ILD、 群延时和群相 位, 群延时和群相位所占用的带宽资源较少, 用两个全局的相位和相似信息 来增强声场效果, 达到在较小的码率下, 提升声场效果; 本实施例提供的立 体声解码方法根据单声道信号、 ILD、 群延时和群相位, 得到第一声道信号和 第二声道信号, 通过参考 ILD使得得到的信号包含两声道信号间的能量大 小 信息, 通过参考群延时和群相位使得得到的信号包含 两声道信号间的全局时 间延时信息和全局波形相似性信息, 进而使得得到的第一声道信号和第二声 道信号的立体声声场效果较优。
本发明实施例可以适用于低码率的通信场景。 具体地, 在上述实施例一 的基础上, 步骤 102 可以包括: 将单声道信号进行时频变换处理, 得到单声 道频域信号; 根据群延时和群相位, 得出 IPD估计值; 根据 ILD和 IPD估计 值, 对单声道频域信号进行处理得到第一声道频域 信号和第二声道频域信号; 将第一声道频域信号和第二声道频域信号分别 进行频时变换处理, 得到第一 声道信号和第二声道信号。 下面通过实施例二和实施三对该技术方案进行 进 一步说明。
图 2 为本发明实施例二提供的立体声解码方法的流 程图。 本实施例中, 第一声道为左声道, 第二声道为右声道, 如图 2所示, 本实施例包括如下步 骤:
步骤 200、 从接收到的码流中解码恢复出单声道信号。
具体地, 从码流中提取单声道比特信号, 经过单声道信号 (Mono )解码 器将单声道比特信号进行解码恢复出单声道信 号, 该单声道信号也称为下混 信号。
步骤 201、 从接收到的码流中解码恢复出 ILD、 群延时和群相位。
其中群延时表示为 ', 群相位表示为 '。 一个正弦信号 sin(wt),经过群 相位后为 sin(wt- Q)。在 sin(wt-Q) = sin( w( t-Q/w ) )中, Q/w就是群相位( group phase )。 群延时( group delay )称为包络时延, 信号传输时, 是总相移随角频 率而变化的速度, 亦即相位-频率特性曲线的斜率。 对于一般的传输系统, 传输函数可以写成: H(jw) = A(w)- B(w), 其中, A(w)为幅度 -频率特性, B (w)为相位 -频率特性: B(w)对 w的一次导数, t (w) = dB(w)/dw 即为传输系 统的群延时。
步骤 202、 将单声道信号进行时频变换处理, 得到单声道频域信号。
将该单声道信号进行时频变换处理, 得到单声道频域信号。 单声道频域 信号表示为 M'(A:)。
步骤 203、 根据群延时和群相位, 得出 IPD估计值。
从码流中解码恢复出群延时 '和群相位 釆用如下公式( 1.1 )估计出
IPD估计值:
IPD\k) = 8 - ~ +Θ ' ( 1.1 )
N g 将频域信号分成若干个频带, 设将频域信号分成 M个频带, A为频率点 索引, 6为频带索引, N为时频变换的长度, 其中 k=0,...,N-l, b=0,...,M-l。 公式(1.1 ) 中, /ΡΖ)'(Α)为索引为 A的频率点的 IPD估计值。
步骤 204、 根据 ILD, 对单声道频域信号的能量进行处理, 得到左声道频 域信号的能量和右声道频域信号的能量。
具体地,釆用如下公式( 1.2 )和( 1.3 )得到左声道频域信号的能量 I JT (k) I 和右声道频域信号的能量 I ; 2 (A) I: 其中, c^ iO 1 "^^ , /JD'(W为索引为 6的频带的 ILD, |Μ'(Α)|为单声道 频域信号的能量。
步骤 205、 根据 ILD和 IPD估计值, 对单声道频域信号的相位进行处理 , 得到左声道频域信号的相位和右声道频域信号 的相位。
具体地,釆用如下公式( 1.4 )和( 1.5 )得到左声道频域信号的相位 X' ) 和右声道频域信号的相位 X (k): X \ (k) = ZM \k) + ~ l - ~ IPD \k) (1.4)
l + c(b)
ZX (k) = ZM \k) --^-IPD \k) ( 1.5 )
\ + c(b) 其中, ZM \k)为单声道频域信号的相位。
本步骤釆用由群延时 ' 和群相位 '得到的 /PD'(t)代替 IPD来计算得到 左右声道频域信号的相位。
步骤 206、根据左声道频域信号的能量和右声道频域 信号的能量, 以及左 声道频域信号的相位和右声道频域信号的相位 , 得到左声道频域信号和右声 道频域信号。
具体地, 釆用如下公式(1.6)和(1.7)得到左声道频域信 A 和右 声道频域信号 Χ Ί \k)
Χ \k) =| Χ \k) I *e jZXV(k) ( 1.6)
X 2 \k) =| X 2 \k) I H iZX ^ (1.7) 步骤 207、 将左声道频域信号和右声道频域信号分别进行 频时变换处理, 得到左声道输出信号和右声道输出信号。
本实施例提供的立体声解码方法适用于低码率 的通信场景, 其中接收到 的码流包括编码的单声道信号, 并且至少包括编码的 ILD、 群延时和群相位, 群延时和群相位所占用的带宽资源较少, 不会影响码率; 本实施例提供的立 体声解码方法根据 ILD, 通过对单声道频域信号的能量进行处理, 得到左右 声道信号的能量, 根据由群延时和群相位得出的 IPD估计值和 ILD, 通过对 单声道频域信号的能量进行处理, 得到左右声道信号的相位, 使得得到的信 号不仅包含两声道信号间的能量大小信息, 还包含两声道信号间的时间延时 信息和波形相似性信息, 进而使得得到的左声道信号和右声道信号的立 体声 声场效果较优。
图 3 为本发明实施例三提供的立体声解码方法的流 程图。 本实施例中, 第一声道为左声道, 第二声道为右声道, 如图 3 所示, 本实施例包括如下步 骤:
步骤 300、 从接收到的码流中解码恢复出单声道信号。
具体地, 从码流中提取单声道比特信号, 经过单声道信号 (Mono )解码 器将单声道比特信号进行解码恢复出单声道信 号, 该单声道信号也称为下混 信号。
步骤 301、 从接收到的码流中解码恢复出 ILD、 群延时和群相位。
其中群延时表示为 ', 群相位表示为 '。
步骤 302、 将单声道信号进行时频变换处理, 得到单声道频域信号。 将该单声道信号进行时频变换处理, 得到单声道频域信号。 单声道频域 信号表示为 M'(A:)。
步骤 303、 根据群延时和群相位, 得出 IPD估计值。
从码流中解码恢复出群延时 d g '和群相位 θ ε , 釆用如下公式(2.1 )估计出
IPD估计值: IPD\k) = 8 - ~ + Θ ' (2.1 )
N g
将频域信号分成若干个频带, 设将频域信号分成 M个频带, A为频率点 索引, 6为频带索引, N为时频变换的长度, 其中 k=0,...,N-l, b=0,...,M-l。 公式(2.1) 中, /PD'(t)为索引为 A的频率点的 IPD估计值。
步骤 304、 根据 ILD, 对单声道频域信号的能量进行处理, 得到左声道频 域信号的能量和右声道频域信号的能量。
具体地,釆用如下公式 ( 2.2 )和 ( 2.3 )得到左声道频域信号的能量 I X\(k) I 和右声道频域信号的能量 I ; 2 (A) I:
\X {k)\=\M\k)\*-^- (2.2) l-\-c(b) \x^ {k) \=\ M \k)\*—^— (2.3)
1 + c(b) 其中, c^ iO 1 "^^ , /JD'(W为索引为 6的频带的 ILD, |Μ'(Α)|为单声道 频域信号的能量。
步骤 305、 当群延时为 0时, 根据 IPD估计值, 对单声道频域信号的相位 进行处理, 得到左声道频域信号的相位和右声道频域信号 的相位; 当群延时 不为 0时, 根据 ILD和 IPD估计值, 对单声道频域信号的相位进行处理, 得 到左声道频域信号的相位和右声道频域信号的 相位。
具体地, 当 '=0 时, 釆用如下公式(2.4)和(2.5)得到左声道频域信 号的相位 X 和右声道频域信号的相位 X ' 2 :
ZX[(k) = ZM\k) (2.4 ) ZX 2 (k) = ΖΜ' (k) - IPD \k) (2.5 ) 其中, ZM \k)为单声道频域信号的相位。 在 '=0的情况下, 左声道保持单声道频域信号的相位, 而右声道的相位 是单声道频域信号的相位与由群延时 d s' 和群相位 得到的 IPD'(k、的差。
当 '≠0时, 釆用如下公式(2.6)和(2.7)得到左声道频域信 的相位
ZX (k)和右声道频域信号的相位 ZX (k): ZX (k) = ZM\k) + ~ l - ~ IPD\k) (2.6 )
l + c(b)
ZX' 2 (k) = ZM\k) -" C -^—IPD\k) (2.7 )
l + c(b) 在 '≠0的情况下,釆用由群延时 ' 和群相位 '得到的 /PD'(t)代替 IPD 来计算得到左右声道频域信号的相位。
步骤 306、根据左声道频域信号的能量和右声道频域 信号的能量, 以及左 声道频域信号的相位和右声道频域信号的相位 , 得到左声道频域信号和右声 道频域信号。
具体地, 釆用如下公式(2.8)和(2.9)得到左声道频域信 A 和右 声道频域信号 Χ Ί \k):
Χ \k) =| Χ \k) I *e jZXV(k) (2.8) X 2 \k) =| X 2 \k) I ^e iZX ^ k) (2.9) 步骤 307、 将左声道频域信号和右声道频域信号分别进行 频时变换处理, 得到左声道输出信号和右声道输出信号。
本实施例提供的立体声解码方法适用于低码率 的通信场景, 其中接收到 的码流包括编码的单声道信号, 并且至少包括编码的 ILD、 群延时和群相位, 群延时和群相位所占用的带宽资源较少, 不会影响码率; 本实施例提供的立 体声解码方法根据 ILD, 通过对单声道频域信号的能量进行处理, 得到左右 声道信号的能量, 当群延时为 0时, 根据由群延时和群相位得出的 IPD估计 值, 通过对单声道频域信号的能量进行处理, 得到左右声道信号的相位, 当 群延时不为 0时, 根据由群延时和群相位得出的 IPD估计值和 ILD, 通过对 单声道频域信号的能量进行处理, 得到左右声道信号的相位, 使得得到的信 号不仅包含两声道信号间的能量大小信息, 还包含两声道信号间的时间延时 信息和波形相似性信息, 进而使得得到的左声道信号和右声道信号的立 体声 声场效果较优。
本发明实施例也可以适用于中高码率的通信场 景。 具体地, 在上述实施 例一的基础上, 步骤 101 中还包括从接收到的码流中解码恢复出 IPD的差分 值, 步骤 102也可以具体为根据 ILD、 IPD的差分值、 群延时和群相位, 对单 声道信号进行处理得到第一声道信号和第二声 道信号。
具体地, 步骤 103 可以包括: 将单声道信号进行时频变换处理, 得到单 声道频域信号; 根据群延时和群相位, 得出 IPD估计值; 根据 IPD估计值和 IPD的差分值, 得到 IPD; 根据 ILD和 IPD, 对单声道频域信号进行处理得到 第一声道频域信号和第二声道频域信号; 将第一声道频域信号和第二声道频 域信号分别进行频时变换处理, 得到第一声道信号和第二声道信号。 下面通 过实施例四和实施例五对该技术方案进行进一 步说明。
图 4 为本发明实施例四提供的立体声解码方法的流 程图。 本实施例中, 第一声道为左声道, 第二声道为右声道, 如图 4所示, 本实施例包括如下步 骤:
步骤 400、 从接收到的码流中解码恢复出单声道信号。
具体地, 从码流中提取单声道比特信号, 经过单声道信号 (Mono )解码 器将单声道比特信号进行解码恢复出单声道信 号, 该单声道信号也称为下混 信号。 步骤 401、 从接收到的码流中解码恢复出 ILD、 IPD的差分值、 群延时和 群相位。
其中群延时表示为 ', 群相位表示为 '。
步骤 402、 将单声道信号进行时频变换处理, 得到单声道频域信号。 将该单声道信号进行时频变换处理, 得到单声道频域信号。 单声道频域 信号表示为 M'(A:)。
步骤 403、 根据群延时和群相位, 得出 IPD估计值。
从码流中解码恢复出群延时 '和群相位^, 采用如下公式(3.1 )估计出
IPD估计值:
-2 d '*k
IPD k) = g - ~ +0 (3.1 )
Ν 4 将频域信号分成若干个频带, 设将频域信号分成 Μ个频带, Α为频率点 索引, 6为频带索引, N为时频变换的长度, 其中 k=0,...,N-l, b=0,...,M-l。 公式(3.1) 中, ^^为索引为 A的频率点的 IPD估计值。
步骤 404、 根据 IPD的差分值和 IPD估计值, 得到 IPD。
从码流中解码恢复出 IPD的差分值 /P (A , 将 与 IPD估计值 ^^相加得到 IPD, 用 IPD'(k表示, 参见公式( 3.2 ):
IPD '(k) = IPD diff k) + IPD\k) (3.2) 步骤 405、 根据 ILD, 对单声道频域信号的能量进行处理, 得到左声道频 域信号的能量和右声道频域信号的能量。
具体地,釆用如下公式 ( 3.3 )和 ( 3.4 )得到左声道频域信号的能量 I 和右声道频域信号的能量 I ' 2 (k) I: \X' 2 (k)\=\M'(k)\*——- (3.4)
1 + c(b) 其中, c^ iO 1 "^^ , /JD'(W为索引为 6的频带的 ILD, |Μ'(Α)|为单声道 频域信号的能量。
步骤 406、 根据 ILD和 IPD, 对单声道频域信号的相位进行处理, 得到左 声道频域信号的相位和右声道频域信号的相位 。
具体地,釆用如下公式( 3.5 )和( 3.6 )得到左声道频域信号的相位 X' ) 和右声道频域信号的相位 X (k):
ZX (k) = ZM\k) + ~ l - ~ IPD\k) (3.5)
l + c(b)
ZX' 2 (k) = ZM\k) -" C -^—IPD\k) (3.6)
l + c(b) 其中, ZM '(A)为单声道频域信号的相位。
本步骤釆用由 IPD的差分值和 IPD估计值得到的 IPD计算得到左右声道 频域信号的相位。
步骤 407、根据左声道频域信号的能量和右声道频域 信号的能量, 以及左 声道频域信号的相位和右声道频域信号的相位 , 得到左声道频域信号和右声 道频域信号。
具体地, 釆用如下公式(3.7)和(3.8)得到左声道频域信 A 和右 声道频域信号 Χ Ί \k)
Χ \k) =| Χ \k) I *e jZXV(k) (3.7) X 2 \k) =| X 2 \k) I ^e iZX ^ k (3.8) 步骤 408、 将左声道频域信号和右声道频域信号分别进行 频时变换处理, 得到左声道输出信号和右声道输出信号。 本实施例提供的立体声解码方法适用于中高码 率的通信场景, 其中接收 到的码流包括编码的单声道信号, 并且包括编码的 ILD、 IPD的差分值、 群延 时和群相位, 群延时和群相位所占用的带宽资源较少, 不会影响码率; 本实 施例提供的立体声解码方法根据 ILD, 通过对单声道频域信号的能量进行处 理, 得到左右声道信号的能量, 釆用根据由群延时和群相位得出的 IPD估计 值和 IPD的差分值得到的 IPD计算得到左右声道频域信号的相位, 使得得到 的信号不仅包含两声道信号间的能量大小信息 , 还包含两声道信号间的时间 延时信息和波形相似性信息, 进而使得得到的左声道信号和右声道信号的立 体声声场效果较优。
图 5 为本发明实施例五提供的立体声解码方法的流 程图。 本实施例中, 第一声道为左声道, 第二声道为右声道, 如图 5 所示, 本实施例包括如下步 骤:
步骤 500、 从接收到的码流中解码恢复出单声道信号。
具体地, 从码流中提取单声道比特信号, 经过单声道信号 (Mono )解码 器将单声道比特信号进行解码恢复出单声道信 号, 该单声道信号也称为下混 信号。
步骤 501、 从接收到的码流中解码恢复出 ILD、 IPD的差分值、 群延时和 群相位。
其中群延时表示为 ', 群相位表示为 '。
步骤 502、 将单声道信号进行时频变换处理, 得到单声道频域信号。 将该单声道信号进行时频变换处理, 得到单声道频域信号。 单声道频域 信号表示为 M'(A:)。
步骤 503、 根据群延时和群相位, 得出 IPD估计值。 从码流中解码恢复出群延时 d g '和群相位 ' , 釆用如下公式(4.1)估计出 IPD估计值:
-2 d '*k 将频域信号分成若干个频带, 设将频域信号分成 M个频带, A为频率点 索引, 6为频带索引, N为时频变换的长度, 其中 k=0,...,N-l, b=0,...,M-l。 公式(4.1) 中, ^^为索引为 A的频率点的 IPD估计值。
步骤 504、 根据 IPD的差分值和 IPD估计值, 得到 IPD。
从码流中解码恢复出 IPD的 分值 IPD dif '(k), 将 与 IPD估计值 /TO '(A)相加得到 IPD, 用 /PDW)表示, 参见公式(4.2):
IPD \k) = IPD diff \k) + IPD \k) (4.2) 步骤 505、 根据 ILD, 对单声道频域信号的能量进行处理, 得到左声道频 域信号的能量和右声道频域信号的能量。
具体地,釆用如下公式 ( 4.3 )和 ( 4.4 )得到左声道频域信号的能量 I X\(k) I 和右声道频域信号的能量 I ; 2 (A) I:
\X' 2 (k)\=\M\k)\*——- (4.4)
1 + c(b)
其中, c^ iO 1 "^^ , /JD'(W为索引为 6的频带的 ILD, |Μ'(Α)|为单声道 频域信号的能量。
步骤 506、 当群延时为 0时, 根据 ILD、 IPD和群相位, 对单声道频域信 号的相位进行处理, 得到左声道频域信号的相位和右声道频域信号 的相位; 当群延时不为 0时, 根据 ILD和 IPD, 对单声道频域信号的相位进行处理, 得到左声道频域信号的相位和右声道频域信号 的相位。
具体地, 当 '=0 时, 釆用如下公式(4.5)和(4.6)得到左声道频域信 号的相位 X 和右声道频域信号的相位 X ' 2 : ZX'(k) = ZM'(k)+ ~ l - ~ (IPD'(k)-e' )-IPD k) (4.6) l + c(b) g 其中, ZM'(t)为单声道频域信号的相位。 /ra'(t)-^的取值范围也为 当 '≠0时, 釆用如下公式(4.7)和(4.8)得到左声道频域信 的相位 ZX (k)和右声道频域信号的相位 ZX (k): ZX (k) = ZM\k) + ~ l - ~ IPD\k) (4.7 ) l + c(b)
ZX' 2 (k) = ZM\k) -" C -^—IPD\k) (4.8) l + c(b) 在 '≠ 0的情况下, 釆用由 IPD的差分值和 IPD估计值得到的 IPD计算 得到左右声道频域信号的相位。
步骤 507、根据左声道频域信号的能量和右声道频域 信号的能量, 以及左 声道频域信号的相位和右声道频域信号的相位 , 得到左声道频域信号和右声 道频域信号。
具体地, 釆用如下公式(4.9)和(4.10)得到左声道频域信 号 A 和右 声道频域信号 Χ Ί \k)
Χ \k) =| Χ \k) I *e jZXV(k) (4.9) 步骤 508、 将左声道频域信号和右声道频域信号分别进行 频时变换处理, 得到左声道输出信号和右声道输出信号。
本实施例提供的立体声解码方法适用于中高码 率的通信场景, 其中接收 到的码流包括编码的单声道信号, 并且包括编码的 ILD、 IPD的差分值、 群延 时和群相位, 群延时和群相位所占用的带宽资源较少, 不会影响码率; 本实 施例提供的立体声解码方法根据 ILD, 通过对单声道频域信号的能量进行处 理, 得到左右声道信号的能量, 当群延时为 0时, 根据 ILD、 IPD以及群相位 计算得到左右声道频域信号的相位, 当群延时不为 0时, 根据 ILD、 IPD计算 得到左右声道频域信号的相位,其中 IPD是根据由群延时和群相位得出的 IPD 估计值和 IPD的差分值得到的, 使得得到的信号不仅包含两声道信号间的能 量大小信息, 还包含两声道信号间的时间延时信息和波形相 似性信息, 进而 使得得到的左声道信号和右声道信号的立体声 声场效果较优。
图 6为本发明实施例六提供的立体声解码装置的 构示意图。 如图 6所 示, 本实施例具体包括: 信号解码模块 11、 参数解码模块 12和信号获取模块 13 , 其中:
信号解码模块 11用于从接收到的码流中解码恢复出单声道信 ; 参数解码模块 12用于从接收到的码流中解码恢复出 ILD、 群延时和群相 位;
信号获取模块 13用于根据 ILD、 群延时和群相位, 对单声道信号进行处 理得到第一声道信号和第二声道信号。
具体地, 信号解码模块 11从码流中提取单声道比特信号, 将单声道比特 信号进行解码恢复出单声道信号;参数解码模 块 12从码流中解码恢复出 ILD、 群延时和群相位; 信号获取模块 13根据 ILD、 群延时和群相位, 对单声道信 号进行处理得到第一声道信号和第二声道信号 。 本实施例提供的立体声解码装置适用于低码率 的通信场景, 其中接收到 的码流中包括编码的单声道信号, 并且包括编码的 ILD、 群延时和群相位, 群延时和群相位所占用的带宽资源较少, 不会影响码率; 本实施例提供的立 体声解码装置根据单声道信号、 ILD、 群延时和群相位, 得到第一声道信号和 第二声道信号, 通过参考 ILD使得得到的信号包含两声道信号间的能量大 小 信息, 通过参考群延时和群相位使得得到的信号包含 两声道信号间的时间延 时信息和波形相似性信息, 进而使得得到的第一声道信号和第二声道信号 的 立体声声场效果较优。
图 7为本发明实施例七提供的立体声解码装置的 构示意图。 如图 7所 示, 本实施例在上述实施例六的基础上, 信号获取模块 13进一步包括: 第一 处理子模块 14、 第一相位差获取子模块 15、 第一频域信号获取子模块 16和 第一信号获取子模块 17, 其中:
第一处理子模块 14用于将单声道信号进行时频变换处理, 得到单声道频 域信号;
第一相位差获取子模块 15用于根据群延时和群相位, 得出 IPD估计值; 第一频域信号获取子模块 16用于根据 ILD和 IPD估计值,对单声道频域 信号进行处理得到第一声道频域信号和第二声 道频域信号;
第一信号获取子模块 17用于将第一声道频域信号和第二声道频域信 分 别进行频时变换处理, 得到第一声道信号和第二声道信号。
具体地, 第一处理子模块 14将单声道信号进行时频变换处理, 得到单声 道频域信号; 第一相位差获取子模块 15可以釆用上述公式( 1.1 )估计出 IPD 估计值; 第一频域信号获取子模块 16根据 ILD和 IPD估计值,对单声道频域 信号进行处理得到第一声道频域信号和第二声 道频域信号; 第一信号获取子 模块 17将第一声道频域信号和第二声道频域信号分 进行频时变换处理, 得 到第一声道信号和第二声道信号。
进一步的, 上述第一频域信号获取子模块 16可以包括第一能量获取单元 18和第一相位获取单元 19, 其中:
第一能量获取单元 18用于根据 ILD,对单声道频域信号的能量进行处理, 得到第一声道频域信号的能量和第二声道频域 信号的能量;
第一相位获取单元 19用于根据 ILD和 IPD估计值 ,对单声道频域信号的 相位进行处理, 得到第一声道频域信号的相位和第二声道频域 信号的相位。
具体地, 第一能量获取单元 18可以釆用上述公式(1.2 )和(1.3 )得到 第一声道频域信号的能量 I;^^) I和第二声道频域信号的能量 I JT 2 (t) I; 第一相 位获取单元 19可以釆用上述公式(1.4 )和(1.5 )得到第一声道频域信号的 相位 和第二声道频域信号的相位 ' 2 (;:)。
图 8为本发明实施例八提供的立体声解码装置的 构示意图。 如图 8所 示, 本实施例与上述实施例七的区别在于, 第一频域信号获取子模块 16包括 第二能量获取单元 20和第二相位获取单元 21。
第二能量获取单元 20用于根据 ILD,对单声道频域信号的能量进行处理, 得到第一声道频域信号的能量和第二声道频域 信号的能量;
第二相位获取单元 21用于当群延时为 0时, 根据 IPD估计值, 对单声道 频域信号的相位进行处理, 得到第一声道频域信号的相位和第二声道频域 信 号的相位; 当群延时不为 0时, 根据 ILD和 IPD估计值, 对单声道频域信号 的相位进行处理, 得到第一声道频域信号的相位和第二声道频域 信号的相位。
具体地, 第二能量获取单元 20 可以釆用上述公式(2.2 )和(2.3 )得到 第一声道频域信号的能量 I JT (k) I和第二声道频域信号的能量 I JT 2 (t) I; 第二相 位获取单元 21 可以釆用上述公式(2.4 )和(2.5 ), 或者(2.6 )和(2.7 )得 到第一声道频域信号的相位 X (k)和第二声道频域信号的相位 X (k)。
上述图 7或图 8所提供的立体声解码装置适用于低码率的通 场景, 其 中接收到的码流中包括编码的单声道信号, 并且包括编码的 ILD、 群延时和 群相位, 群延时和群相位所占用的带宽资源较少, 不会影响码率; 图 7或图 8 提供的立体声解码装置根据单声道信号、 ILD、 群延时和群相位, 得到第一声 道信号和第二声道信号, 通过参考 ILD使得得到的信号包含两声道信号间的 能量大小信息, 通过参考群延时和群相位使得得到的信号包含 两声道信号间 的时间延时信息和波形相似性信息, 进而使得得到的第一声道信号和第二声 道信号的立体声声场效果较优。
图 9为本发明实施例九提供的立体声解码装置的 构示意图。 如图 9所 示, 本实施例在上述实施例六的基础上, 参数解码模块 12还用于从接收到的 码流中解码恢复出 IPD的差分值; 信号获取模块 13具体用于根据 ILD、 IPD 的差分值、 群延时和群相位, 对单声道信号进行处理得到第一声道信号和第 二声道信号。
进一步的, 信号获取模块 13可以包括:
第二处理子模块 22用于将单声道信号进行时频变换处理, 得到单声道频 域信号;
第二相位差获取子模块 23用于根据群延时和群相位, 得出 IPD估计值; 第三相位差获取子模块 24用于根据 IPD估计值和 IPD的差分值, 得到
IPD;
第二频域信号获取子模块 25用于根据 ILD和 IPD, 对单声道频域信号进 行处理得到第一声道频域信号和第二声道频域 信号; 第二信号获取子模块 26用于将第一声道频域信号和第二声道频域信 分 别进行频时变换处理, 得到第一声道信号和第二声道信号。
具体地, 第二处理子模块 22将该单声道信号进行时频变换处理, 得到单 声道频域信号;第二相位差获取子模块 23可以釆用上述公式(3.1 M古计出 IPD 估计值; 第三相位差获取子模块 24可以将 IPD的差分值 与 IPD估计 值^^相加得到 IPD; 第二频域信号获取子模块 25根据 ILD和 IPD, 对单 声道频域信号进行处理得到第一声道频域信号 和第二声道频域信号; 第二信 号获取子模块 26将第一声道频域信号和第二声道频域信号分 进行频时变换 处理, 得到第一声道信号和第二声道信号。
进一步的, 上述第二频域信号获取子模块 25可以包括: 第三能量获取单 元 27和第三相位获取单元 28 , 其中:
第三能量获取单元 27用于根据 ILD,对单声道频域信号的能量进行处理, 得到第一声道频域信号的能量和第二声道频域 信号的能量;
第三相位获取单元 28用于根据 ILD和 IPD, 对单声道频域信号的相位进 行处理, 得到第一声道频域信号的相位和第二声道频域 信号的相位。
具体地, 第三能量获取单元 27 可以釆用上述公式(3.3 )和(3.4 )得到 第一声道频域信号的能量 I X {k) I和第二声道频域信号的能量 I JT 2 (t) I; 第三相 位获取单元 28 可以釆用上述公式(3.5 )和(3.6 )得到左声道频域信号的相 位 X \ (k)和右声道频域信号的相位 ZX (k)。
图 10 为本发明实施例十提供的立体声解码装置的结 构示意图。 如图 10 所示, 本实施例与上述实施例九的区别在于, 第二频域信号获取子模块 25包 括第四能量获取单元 29和第四相位获取单元 30, 其中:
第四能量获取单元 29用于根据 ILD,对单声道频域信号的能量进行处理, 得到第一声道频域信号的能量和第二声道频域 信号的能量;
第四相位获取单元 30用于当群延时为 0时, 根据 ILD、 IPD和群相位, 对单声道频域信号的相位进行处理, 得到第一声道频域信号的相位和第二声 道频域信号的相位; 当群延时不为 0时, 根据 ILD和 IPD, 对单声道频域信 号的相位进行处理, 得到第一声道频域信号的相位和第二声道频域 信号的相 位。
具体地, 第四能量获取单元 29可以釆用上述公式(4.3 )和(4.4 )得到 第一声道频域信号的能量 I;^^) I和第二声道频域信号的能量 I JT 2 (t) I; 第四相 位获取单元 30 可以釆用上述公式(4.5 )和(4.6 ), 或者(4.7 )和(4.8 )得 到第一声道频域信号的相位 X (k)和第二声道频域信号的相位 X (k)。
上述图 9或图 10所提供的立体声解码装置适用于中高码率的 信场景, 其中接收到的码流包括编码的单声道信号, 并且包括编码的 ILD、 IPD的差分 值、 群延时和群相位, 群延时和群相位所占用的带宽资源较少, 不会影响码 率; 图 9或图 10提供的立体声解码方法根据单声道信号、 ILD、 IPD的差分 值、 群延时和群相位, 得到左声道信号和右声道信号, 通过参考 ILD使得得 到的信号包含两声道信号间的能量大小信息, 通过参考群延时和群相位使得 得到的信号包含两声道信号间的时间延时信息 和波形相似性信息, 进而使得 得到的左声道信号和右声道信号的立体声声场 效果较优。
本领域普通技术人员可以理解实现上述实施例 方法中的全部或部分流 程, 是可以通过计算机程序来指令相关的硬件来完 成, 所述的程序可存储于 一计算机可读取存储介质中, 该程序在执行时, 可包括如上述各方法的实施 例的流程。其中,所述的存储介质可为磁碟、 光盘、只读存储记忆体(Read-Only Memory, ROM )或随机存 己忆体 ( Random Access Memory, RAM )等。
以上所述仅为本发明的几个实施例, 本领域的技术人员依据申请文件公 开的可以对本发明进行各种改动或变型而不脱 离本发明的精神和范围。 本领 域普通技术人员可以理解) 的情况下可以互相结合形成新的实施例
Next Patent: METHOD AND DEVICE FOR CONTROLLING POWER
