吴文海 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
MIAO, Lei (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
苗磊 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
华为技术有限公司 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
WU, Wenhai (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
吴文海 (中国广东省深圳市龙岗区坂田华为总部办公楼, Guangdong 9, 518129, CN)
MIAO, Lei (Huawei Administration Building, Bantian Longgan, Shenzhen Guangdong 9, 518129, CN)
| 权 利 要 求 1、 一种立体声编码的方法, 其特征在于, 所述方法包括: 变换时域立体声左声道信号和右声道信号到频域形成频域上的左声道信 号和右声道信号; 将频域上的左声道信号和右声道信号经过下混生成单声道下混信号, 传 送对所述下混信号进行编码量化后的比特; 提取频域上左声道信号和右声道信号的空间参数; 利用所述频域上的左声道信号和右声道信号估计立体声左右声道间的群 延时以及群相位; 量化编码所述群延时和群相位以及所述空间参数。 2、 如权利要求 1所述的方法, 其特征在于: 在所述利用频域上的左声道 信号和右声道信号估计立体声左右声道间的群延时以及群相位之前, 所述方 法还包括: 确定关于频域上立体声左右声道信号间的互相关函数, 所述互相 关函数包括频域上左声道信号与右声道信号的共轭的乘积的加权。 3、 如权利要求 2所述的方法, 其特征在于: 所述互相关函数为: Χ^)\\Χ^)\ k = 0 k = N/2 k>N/2 , 或 / k†+∑2(j)2 k = 0 \≤k≤NI2-\ 0 k>NI2 . 其中, N为立体声信号时频变换的长度, k为频率点的索引值, 和 I x (K) I分别为 A (K)和 A W对应的幅度。 4、 如权利要求 3所述的方法, 其特征在于: 所述方法还包括: 对所述互相关函数进行逆时频变换得到互相关函数时域信号, 或对所述互相关函数进行逆时频变换得到互相关函数时域信号, 对所述 互相关函数时域信号进行预处理。 5、 如权利要求 4所述的方法, 其特征在于: 所述利用所述频域上的左声 道信号和右声道信号估计立体声左右声道间的群延时以及群相位, 包括: 根据所述互相关函数时域信号或基于处理后的互相关函数时域信号中幅 度最大的值对应的索引估计得到群延时, 获得群延时对应的互相关函数对应 的相角, 根据所述相角估计得到群相位。 6、 如权利要求 3所述的方法, 其特征在于: 所述利用频域上的左声道信 号和右声道信号估计立体声左右声道间的群延时以及群相位, 包括: 提取所述互相关函数的相位, 根据相位差均值和变换长度的乘积与频率 信息的比值关系确定群延时; 根据互相关函数当前频点的相位与当前频点索引和相位差均值乘积的差 值得到群相位信息。 7、 如权利要求 5或 6所述的方法, 其特征在于, 所述方法还包括: 根据所述群相位和群延时估计得到立体声分带信息, 量化编码所述分带 信息, 所述分带信息包括: 左右声道间的相位差参数, 互相关参数和 /或左声 道与下混信号的相位差参数。 8、 一种估计立体声信号的方法, 其特征在于, 所述方法包括: 确定关于频域立体声左右声道信号间的加权的互相关函数; 对所述加权的互相关函数进行预处理得到预处理结果; 根据所述预处理结果估计得到立体声左右声道信号间的群延时以及群相 9、 如权利要求 8所述的方法, 其特征在于: 所述加权的互相关函数为: c (k) = 2* ' (k) 1 (k)2 + X2 (k)2 1≤U 2— 1 0 k>NI2 . 其中, N为立体声信号时频变换的长度, k为频率点的索引值, 和 I x (k) I分别为 A (k)和 A W对应的幅度。 10、 如权利要求 9 所述的方法, 其特征在于, 所述方法还包括: 对所述 加权的互相关函数进行逆时频变换得到互相关函数时域信号。 11、 如权利要求 10所述的方法, 其特征在于, 所述对所述加权的互相关 函数进行预处理包括: 对所述互相关函数时域信号进行归一化处理和平滑处理, 其中所述平滑 处理包括: Cravg (n) = a* Cravg {n-\) + fi*Cr (n) , Cravg («)为平滑处理后的互相关函数; 或者 对所述互相关函数时域信号的绝对值信号进行归一化处理和平滑处理, 包括: Cmvg_abs (n) = a* Cravg + β* \Cr (η)\为平 滑处理后的互相关函数; 其中, "和 是加权的常数, ο≤«≤ι, β = ~α, 为所述互相关函数 时域信号, n为帧号。 12、 如权利要求 11所述的方法, 其特征在于, 根据所述预处理结果估计 得到立体声左右声道信号间的群延时以及群相位包括: d _ argmax |Cravg(«)| arg max | Cravg («) \<NI2 群延时 argmax |Cravg(«)|-N argmax | Cr。vg(w) |> N/2 , Cravg(dg) dg>0 群相位 ZCravg(dg +N) dg <0. 其中, N 为立体声信号时频变换的长度, argmaxl^ ^l 是 中幅 度最大的值对应的索引, ZCf(dg)为互相关函数值 Cr»g(dg)的相角, ZCravg (dg + N)为互相关函数值 Cravg (dg + N)的相角。 13、 如权利要求 8 所述的方法, 其特征在于, 根据所述预处理结果估计 得到立体声左右声道信号间的群延时以及群相位包括: 提取所述预处理结果的相位 0( = ZC (t) , 其中函数 ZC (t)用于提取复数 的相角; 在低带一个频率内求取相位差的均值0^ , 根据相位差和变换长度的乘积 与频率信息的比值关系确定群延时, 根据所述预处理结果当前频点的相位与 频点索弓 )和相位差均值乘积的差值得到群相位。 14、 如权利要求 13所述的方法, 其特征在于, 所述在低带一个频率内求 取相位差的均值"!, 根据相位差和变换长度的乘积与频率信息的比值关系确 定群延时, 根据所述预处理结果当前频点的相位与频点索引和相位差均值乘 积的差值得到群相位包括: a, = E{ (k + 1) - Φ( )} k < Max , a、N d„ =― 0g = Ε{Φ(Λ) -a, *k} k < Max 其中 E{0(A + 1)- 0( } 表示相位差的均值, 为釆用的频率, Max 为计 算群延时和群相位的截止上限, 用于防止相位旋转。 15、 一种估计立体声信号的装置, 其特征在于, 所述装置包括: 加权互相关单元, 用于确定关于频域立体声左右声道信号间的加权的互 相关函数; 预处理单元, 用于对所述加权的互相关函数进行预处理得到预处理结果; 估计单元, 根据预处理结果估计得到立体声左右声道信号间的群延时以 及群相位。 16、 如权利要求 15所述的装置, 其特征在于, 所述装置还包括: 频时变换单元, 对加权的互相关函数进行逆时频变换得到互相关函数时 域信号。 17、 如权利要求 16所述的装置, 其特征在于, 所述估计单元包括: 判断单元, 用于判断互相关函数时域信号中幅度最大的值对应的索引和 与立体声信号时频变换长度 N相关的对称区间的关系; 群延时单元, 如果互相关函数时域信号中幅度最大的值对应的索引位于 第一对称区间, 那么群延时等于该互相关函数时域信号中幅度最大的值对应 的索引, 如果互相关函数中时域信号中幅度最大的值对应的索引位于第二对 称区间, 群延时为该互相关函数时域信号中幅度最大的值对应的索引减去 N; 群相位单元, 用于根据群延时对应的互相关函数时域信号对应的相角, 当群延时 ds大于等于零,确定 对应的互相关值对应的相角为群相位;当 小 于零时, 群相位为 对应的互相关值对应的相角。 18、 如权利要求 15所述的装置, 其特征在于, 所述根据预处理结果估计 得到立体声左右声道信号间的群延时以及群相位的估计单元包括: 相位提取单元, 用于提取所述预处理结果的相位 0(t) = Zi (t) , 其中函数 ZC )用于提取复数 的相角; 群延时单元, 用于在低带一个频率内求取相位差的均值0^ 根据相位差 和变换长度的乘积与频率信息的比值关系确定群延时; 群相位单位, 用于根据所述预处理结果当前频点的相位与频点索引和相 位差均值乘积的差值得到群相位。 19、 如权利要求 15-18任一所述的装置, 其特征在于, 所述装置还包括参 数特性单元, 用于根据所述群相位和群延时估计得到立体声参数 IPD。 20、 一种立体声信号编码的设备, 其特征在于, 所述设备包括: 变换装置, 用于变换时域立体声左声道信号和右声道信号到频域形成频 域上的左声道信号和右声道信号; 下混装置, 用于将频域上的左声道信号和右声道信号经过下混生成单声 道下混信号; 参数提取装置, 用于提取频域上左声道信号和右声道信号的空间参数; 估计立体声信号装置, 用于利用频域上的左声道信号和右声道信号估计 立体声左右声道间的群延时以及群相位; 编码装置, 用于量化编码所述群延时、 群相位、 所述空间参数和所述单 声道下混信号。 21、 如权利要求 20所述的设备, 其特征在于: 所述估计立体声信号装置 在利用频域上左声道信号和右声道信号估计立体声左右声道间的群延时以及 群相位之前还用于确定关于频域上立体声左右声道信号间的互相关函数, 所 述互相关函数包括频域上左声道信号与右声道信号的共轭的乘积的加权。 22、 如权利要求 21所述的设备, 其特征在于: 所述估计立体声信号装置 确定的关于频域上立体声左右声道信号间的加权的互相关函数表示为: Χ^)Χ2 ( Χ ^ \\ Χ2 (^ \ k = 0 0 k > N/ 2 或 k = 0 0 k > N ί 2 其中, N为立体声信号时频变换的长度, k为频率点的索引值, 和 I x (k) I分别为 A (k)和 A W对应的幅度。 23、 如权利要求 22所述的装置, 其特征在于: 所述估计立体声信号装置 包括频时变换单元, 用于对所述互相关函数进行逆时频变换得到互相关函数 的时域信号, 或对所述互相关函数进行逆时频变换得到互相关函数时域信号, 对所述互相关函数时域信号进行预处理。 24、 如权利要求 23所述的装置, 其特征在于: 所述估计立体声信号装置 还包括估计单元, 用于根据互相关函数时域信号或基于处理后的互相关函数 时域信号中幅度最大的值对应的索引估计得到群延时, 获得群延时对应的互 相关函数对应的相角, 根据所述相角估计得到群相位。 25、 如权利要求 22所述的装置, 其特征在于: 所述估计立体声信号装置 包括估计单元, 用于提取所述互相关函数的相位, 根据相位差均值和变换长 度的乘积与频率信息的比值关系确定群延时; 根据互相关函数当前频点的相 位与当前频点索引和相位差均值乘积的差值得到群相位信息。 26、 一种立体声编码的系统, 其特征在于, 所述系统包括如权利要求 20 - 25任一所述的立体声信号编码设备、 接收设备以及传送设备; 所述接收设备用于接收立体声输入信号并提供给立体声信号编码设备, 所述立体声输入信号包括立体声左声道信号和右声道信号; 所述传送设备, 用于传送所述立体声信号编码设备的结果。 |
本申请要求于 2010 年 2 月 12 日提交中国专利局、 申请号为 201010113805.9、 发明名称为"立体声编码的方法、 装置"的中国专利申请的优 先权, 其全部内容通过引用结合在本申请中。
技术领域
本发明实施例涉及多媒体领域, 尤其涉及一种立体声编码的方法、 装置。
背景技术
现有的立体声编码方法, 有强度立体声, BCC ( Binaual Cure Coding ) 和 PS ( Parametric-Stereo coding )编码方法, 通常情况, 釆用强度编码需要提 取左右声道间的能量比 ILD ( InterChannel Level Difference )参数, 将 ILD参数 作为边信息进行编码, 并优先传送到解码端以帮助恢复立体声信号。 ILD是个 普遍存在并反映声场信号的信号特性参数, ILD能对声场能量较好的体现, 然 而立体声往往存在背景空间和左右方向的声场 ,仅釆用传送 ILD恢复还原立体 声的方式已经不能满足恢复原始立体声信号的 要求, 于是提出了传送更多参 数以更好恢复立体声信号的方案, 除了提取最基本的 ILD参数外, 还提出传送 左右声道的相位差( IPD: InterChannel Phase Difference )及左右声道的互相关 ( ICC )参数, 有时也会包含左声道与下混信号的相位差(OPD )参数, 将这 些反应立体声信号背景空间和左右方向声场信 息的参数和 ILD参数共同作为 边信息进行编码并发送到解码端以还原立体声 信号。
编码码率是多媒体信号编码性能的重要评判因 素之一, 对低码率的釆用 是业界共同追求的目标, 现有的立体声编码技术在传送 ILD的同时传送 IPD、 ICC和 OPD参数势必需要提高编码码率, 因为 IPD、 ICC以及 OPD参数都是信 号的局部特性参数,用于反应立体声信号的分 带信息,编码立体声信号的 IPD、 ICC以及 OPD参数, 需要对立体声信号的每一个分带编码 IPD、 ICC以及 OPD 参数, 对立体声信号的每一个分带而言, 每个分带 IPD编码需要多个比特, 每 个分带 ICC编码需要多个比特, 依此类推, 则立体声编码参数需要大量的比特 数才能增强声场的信息, 在较低码率要求下则只能增强部分分带, 达不到逼 真还原的效果, 导致低码率下恢复出的立体声信息和原输入信 号之间有较大 的差距, 从听觉效果来说, 会给收听者带来极不舒适的听觉感受。
发明内容
本发明实施例提供一种立体声编码方法、 装置和系统。
本发明实施例提供了一种立体声编码的方法, 所述方法包括:
变换时域立体声左声道信号和右声道信号到频 域形成频域上的左声道信 号和右声道信号; 将频域上的左声道信号和右声道信号经过下混 生成单声道 下混信号, 传送对所述下混信号进行编码量化后的比特; 提取频域上左声道 信号和右声道信号的空间参数; 利用频域上左声道信号和右声道信号估计立 体声左右声道间的群延时以及群相位; 量化编码所述群延时和群相位以及所 述空间参数。
本发明实施例提供了一种估计立体声信号的方 法, 所述方法包括: 确定关于频域立体声左右声道信号间的加权的 互相关函数; 对加权的所 述互相关函数进行预处理得到预处理结果; 根据预处理结果估计得到立体声 左右声道信号间的群延时以及群相位。
本发明实施例提供了一种估计立体声信号的装 置, 所述装置包括: 加权互相关单元, 用于确定关于频域立体声左右声道信号间的加 权的互 相关函数; 预处理单元, 用于对加权的所述互相关函数进行预处理得到 预处 理结果; 估计单元, 根据预处理结果估计得到立体声左右声道信号 间的群延 时以及群相位。 本发明实施例提供了一种立体声信号编码的设 备, 所述设备包括: 变换装置, 用于变换时域立体声左声道信号和右声道信号 到频域形成频 域上的左声道信号和右声道信号; 下混装置, 用于将频域上的左声道信号和 右声道信号经过下混生成单声道下混信号; 参数提取装置, 用于提取频域上 左声道信号和右声道信号的空间参数; 估计立体声信号装置, 用于利用频域 上左声道信号和右声道信号估计立体声左右声 道间的群延时以及群相位; 编 码装置, 用于量化编码所述群延时、 群相位、 所述空间参数和所述单声道下 混信号。
本发明实施例提供了一种立体声信号编码的系 统, 所述系统包括: 如上所述立体声信号编码的设备、 接收设备以及传送设备; 所述接收设 备用于接收立体声输入信号并提供给立体声信 号编码设备; 所述传送设备, 用于传送所述立体声信号编码设备的结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中 的技术方案, 下面将对实 施例或现有技术描述中所需要使用的附图作简 单地介绍, 显而易见地, 下面 描述中的附图仅仅是本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1为一立体声编码方法实施例示意图;
图 2为又一立体声编码方法实施例示意图;
图 3为又一立体声编码方法实施例示意图;
图 4a为又一立体声编码方法实施例示意图;
图 4b为又一立体声编码方法实施例示意图;
图 5为又一立体声编码方法实施例示意图;
图 6为一估计立体声信号装置实施例示意图;
图 7为又一估计立体声信号装置实施例示意图;
图 8为又一估计立体声信号装置实施例示意图;
图 9为又一估计立体声信号装置实施例示意图;
图 10为又一估计立体声信号装置实施例示意图; 图 11为一立体声信号编码设备实施例示意图;
图 12为一立体声信号编码系统实施例示意图。
具体实施方式
下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行 清楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而 不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人员在没有作 出创造性劳动前提下所获得的所有其他实施例 , 都属于本发明保护的范围。
实施例一:
图 1为一立体声编码方法实施例的示意图, 包括:
步骤 101 :变换时域立体声左声道信号和右声道信号到 域形成频域上的 左声道信号和右声道信号。
步骤 102:频域上的左声道频域信号和右声道频域信 经过下混生成单声 道下混信号 (DMX ) , 传送 DMX信号进行编码量化后的比特, 以及将提取 的频域上左声道信号和右声道信号的空间参数 进行量化编码。
空间参数为代表立体声信号空间特性的参数, 如 ILD参数。
步骤 103:利用频域上左右声道信号估计频域上的左 道信号和右声道信 号间的群延时(Group Delay ) 以及群相位( Group Phase ) 。
群相位反映立体声左右声道在时间对齐后的 波形的相似性的全局信息。
步骤 104: 量化编码所述估计得到的群延时和群相位。
群延时和群相位经过量化编码形成待传送边信 息码流的内容。 本发明实施例立体声编码的方法中, 在提取立体声信号空间特性参数的 同时估计群延时和群相位, 估计得到群延时和群相位被应用到立体声编码 中 , 使得空间参数和全局的方位信息有效的结合, 通过全局的方位信息估计方法 在低码率下能得到更为准确的声场信息, 增强了声场效果, 极大的提升编码 效率。
实施例二:
图 2为另一立体声编码方法实施例的示意图, 包括:
步骤 201 ,变换时域立体声左声道信号和右声道信号到 域形成在频域上 的立体声左声道信号 A W和右声道信号 其中 k为频率信号的频率点的 索引值。
步骤 202,对频域上的左声道信号和右声道信号进行 混操作, 编码量化 下混信号并传送, 以及编码立体声空间参数, 量化形成边信息并传送, 可以 包括如下步骤:
步骤 2021 , 频域上的左声道信号和右声道信号进行下混, 生成合成后的 单声道下混信号 DMX。
步骤 2022, 编码量化单声道下混信号 DMX, 并传送量化的信息。
步骤 2023 , 提取频域上的左声道信号和右声道信号的 ILD参数。
步骤 2024, 对所述 ILD参数进行量化编码形成边信息并传送。
2021、 2022步骤和 2023、 2024步骤相互不影响, 可独立执行, 前者形成 的边信息可与后者形成的边信息进行复用后传 送。
在另一实施方案中, 经过下混得到的单声道下混信号可以再进行频 时变 换得到单声道下混信号 DMX的时域信号,将单声道下混信号 DMX的时域信 号进行编码量化后的比特进行传送。
步骤 203 , 估计频域上的左右声道信号间的群延时以及群 相位。
利用频域上左右声道信号估计左右声道信号间 的群延时以及群相位包括 确定关于立体声左右声道频域信号的互相关函 数, 根据互相关函数的信号估 计得到立体声信号的群延时以及群相位, 如图 3 所示, 具体可以包括如下步 骤:
步骤 2031 , 确定关于频域上立体声左右声道信号间的互相 关函数。
立体声左右声道频域信号的互相关函数可以为 加权的互相关函数, 在确 定互相关函数的过程中对估计群延时和群相位 的互相关函数进行加权操作相 比与其他操作而言使得立体声信号编码结果更 加倾于稳定, 加权的互相关函 数即左声道频域信号与右声道频域信号的共轭 的乘积的加权, 所述加权的互 相关函数在立体声信号时频变换的长度 N—半的频点上的值为 0。 立体声左 右声道频域信号的互相关函数的形式可以如下 表示:
c (k) = W(k)X x (k)X\ (k) 0<k< N/2
0 k > N/2 , 其中 w (k)表示加权函数, ^ 2 ^)表示 的共轭函数, 或者也可以 表示为: C r W = )JT 2 (A) 0≤k≤N/ 2 + l。 在另一互相关函数的形式中, 结合 不同的加权形式, 立体声左右声道频域信号的互相关函数可以如 下表示:
0 k>N II 其中, N为立体声信号时频变换的长度, 和 为 AW和 AW 对应的幅度。加权的互相关函数在频点 0, 频点 N/2上为左右声道信号在对应 频点上幅度乘积的倒数, 加权的互相关函数在其他频点上为左右声道信 号在 幅度积的倒数的 2倍。 在其他的实施例中, 立体声左右声道频域信号的加权 的互相关函数还可以表示为其他的形式, 例如:
χ λ (k)x 2 " (k) I ^(k†+x 2 (k† k = o
c -\
0 k>N 12
对此, 本实施例不进行限制, 上述各公式的任意变形都在保护范围之内。 步骤 2032, 对关于立体声左右声道频域信号的加权的互相 关函数进行逆 时频变换得到互相关函数时域信号 此处互相关函数时域信号是复数的 信号。
步骤 2033, 根据互相关函数时域信号估计得到立体声信号 的群延时以及 群相位。
在另一实施例中, 可以直接根据步骤 2031确定的关于频域上立体声左右 声道信号间的互相关函数估计得到立体声信号 的群延时以及群相位。
在步骤 2033中, 可以直接根据互相关函数时域信号估计得到立 体声信号 的群延时以及群相位; 也可以对互相关函数时域信号进行一些信号预 处理, 基于预处理后的信号估计立体声信号的群延时 以及群相位。
若对互相关函数时域信号进行一些信号预处理 , 基于预处理后的信号估 计立体声信号的群延时以及群相位可以包括:
1)对互相关函数时域信号进行归一化处理或平 处理;
其中对互相关函数时域信号进行平滑处理可以 如下进行:
C ravg (n) = a * C ravg (n - \) + * C r (n)
其中, C ravg («)为平滑处理结果, "和 是加权的常数, o≤«≤i , = ι-« , n是帧号, 是 C («)第 n帧的互相关函数。 对本实施例中, 在估计群延时以及 群相位前对获得的左右声道间的互相关函数时 域信号进行平滑等预处理使得 估计出的群延时更稳定。
2)对互相关函数时域信号进行归一化处理之后 一步进行平滑处理;
3)对互相关函数时域信号的绝对值进行归一 处理或平滑处理;
其中对互相关函数时域信号的绝对值进行平滑 处理可以如下进行:
C ravg — abs (n) = a * C ravg (η - , 4) 互相关函数时域信号进行归一化处理之后的绝 对值信号进一步进行平 滑处理。
可以理解的, 在估计立体声信号的群延时以及群相位前, 对于互相关函 数时域信号的前处理还可以包括其他的处理, 例如自相关处理等, 此时对互 相关函数时域信号的预处理还包括自相关或 /和平滑处理等。
结合上述的互相关函数时域信号的前处理, 步骤 2033中估计立体声信号 的群延时以及群相位釆用相同的估计方式, 也可以分别进行估计, 具体的, 步骤 2033实施方式一, 如图 4a所示:
根据互相关函数时域信号或基于处理后的互相 关函数时域信号中幅度最 大的值对应的索引估计得到群延时, 获得群延时对应的互相关函数对应的相 角, 估计得到群相位, 包括如下步骤:
判断时域信号互相关函数中幅度最大的值对应 的索引和与变换长度 N相 关的对称区间的关系, 在一个实施例中, 如果时域信号互相关函数中幅度最 大的值对应的索引小于等于 N/2,那么群延时等于该时域信号互相关函数中 度最大的值对应的索引, 如果互相关函数中幅度最大的值对应的索引大 于 N/2, 那么群延时为该索引减去变换长度 N, 可以将 [0,N/2]和(N/2,N]看作与 立体声信号时频变换长度 N相关的第一对称区间和第二对称区间, 在另一种 实施中, 判断的范围可以为 [0, m]和(N _ m, N]的第一对称区间和第二对称 区间,其中 m小于 N/2, 时域信号互相关函数中幅度最大的值对应的索 引与 m 的相关信息进行比较, 当时域信号互相关函数中幅度最大的值对应的 索引位 于区间 [0, m] , 则群延时等于该时域信号互相关函数中幅度最 大的值对应的 索引, 当时域信号互相关函数中幅度最大的值对应的 索引位于区间 (N - m, N] , 则群延时为该索引减去变换长度 N。 但在实际应用中, 进行判断的可以 是时域信号互相关函数中幅度最大的值对应的 索引的临近值, 在不影响主观 效果的条件下或者根据需求的限定可以适当选 择稍小于幅度最大的值对应的 索引作为判断条件, 如幅度第二大的值对应的索引或者和幅度最大 值相差在 固定或预设范围的值对应的索引都适用, 以时域信号互相关函数中幅度最大 的值对应的索引为例, 一种具体的形式体现如下:
d _ arg max | C ravg («) | arg max | C ravg («) \< NI 2
8 ~ arg max | C ravg (n) | -N arg max | C ravg (n、\> NI 2 , 其中 arg max | C ravg (") | 是 中幅度最大的值对应的索引, 本实施例同样保护上述形式的各种变形。 根据群延时对应的时域信号互相关函数对应的 相角, 当群延时 大于等 于零, 通过确定 对应的互相关值对应的相角估计得到群相位; 当 小于零 时, 群相位就是 + 索引上对应的互相关值对应的相角, 具体可以釆用下面 的一种形式或该形式的任意变形体现:
θ = zc ravg (d g )d g ≥o
8 ZC ( d g +N ) d g <0 ,其中 ZC ravg ( d g )为时域信号互相关函数值 C ravg ( d g ) 的相角, ZC ^ + N )为时域信号互相关函数值 + N )的相角。
步骤 2033实施方式二, 如图 4b所示:
对所述互相关函数, 或基于处理后的所述互相关函数, 提取其相位 (k) = ZC r (k) , 其中函数 zc )用于提取复数 的相角, 在低带一个频率内 求取相位差的均值"!, 根据相位差和变换长度的乘积与频率信息的比 值关系 确定群延时, 同样的, 根据所述互相关函数当前频点的相位与频点索 引和相 位差均值乘积的差值得到群相位信息, 具体可以釆用如下的方式:
, = E{ (k + 1) - Φ( )} k < Max; d =- a ;
0 g = Ε{Φ(Λ) -a x *k} k < Max , 其中 E{0(A + 1)- 0( } 表示相位差的均值, 为釆用的频率, Max 为计 算群延时和群相位的截止上限, 防止相位旋转。
步骤 204: 量化编码所述群延时和群相位形成边信息进行 传送。
在预设或随机范围内对群延时进行标量量化, 该范围为对称的正负值 [-Max, Max]或者随机条件下的可用值, 对标量量化后的群延时釆用一个较长 的时间传输或者釆用差分编码处理得到边信息 ,群相位的取值范围通常在 [0, 2* ]范围内, 具体可以为 [0, 2^π) , 也可以为 (- Γ , Γ]的范围内对群相位进 行标量量化和编码, 将量化编码后的群延时和群相位形成的边信息 进行复用 形成编码码流, 传送到立体声信号恢复装置。
本发明实施例立体声编码的方法中, 利用频域上的左右声道信号估计立 体声信号左右声道间的能体现信号全局方位信 息的群延时和群相位使得声场 的方位信息得到有效的增强, 将立体声信号空间特性参数和群延时以及群相 位的估计相结合应用于码率需求不大的立体声 编码中, 使得空间信息和全局 的方位信息有效的结合, 得到更为准确的声场信息, 增强了声场效果, 极大 的提升编码效率。
实施例三
图 5为另一立体声编码方法实施例的示意图, 包括:
分别在实施例一和实施例二的实施基础上, 立体声编码还包括: 步骤 105/205: 根据所述群相位和群延时信息估计得到立体声 参数 IPD, 量化所述 IPD参数并传送。
量化 IPD时, 用群延时( Group Delay )和群相位( Group Phase )来估计
IPD ^ , 并与原始的 ^^)进行差分处理, 对差分的 IPD进行量化编码, 可如 下表示:
- 2ττά„ * k
IPD(k) = s - ~ + θ
' N s . \≤k≤N/2 -\
IPD dlff (k) = IPD(k) - IPD(k) ^ 并对 进行量化, 量化后的比特送到解 码端, 在另一实施例中, 也可直接量化 IPD, 比特流稍高, 量化更精确。
本实施例中, 估计立体声参数 IPD并编码量化在有较高码率可用的情况 下可以提升编码效率, 增强声场效果。
实施例四,
图 6为一估计立体声信号的装置 04实施例示意图, 包括:
加权互相关单元 41 , 用于确定关于频域立体声左右声道信号间的加 权的 互相关函数。
加权互相关单元 41接收频域上立体声左右声道信号, 对频域立体声左右 声道信号进行处理得到关于频域立体声左右声 道信号间的加权的互相关函 数。 预处理单元 42, 用于对加权的所述互相关函数进行预处理。
预处理单元 42接收根据加权互相关单元 41得到的加权的所述互相关函 数, 对加权的所述互相关函数进行预处理, 得到预处理结果, 即预处理后的 互相关函数时域信号。
估计单元 43 , 根据预处理结果估计立体声左右声道信号间的 群延时以及 群相位。
估计单元 43接收预处理单元 42的预处理结果, 获取预处理后的互相关 函数时域信号, 提取所述互相关函数时域信号的信息加以判断 或比较或计算 操作估计得到立体声左右声道信号间的群延时 以及群相位。
本另一实施例中,估计立体声信号的装置 04还可以包括频时变换单元 44 , 用于接收加权互相关单元 41的输出, 对关于频域立体声左右声道信号的加权 的所述互相关函数进行逆时频变换得到互相关 函数时域信号, 并将所述互相 关函数时域信号传送给所述预处理单元 42。
通过引入本发明实施例, 群延时和群相位被估计并被应用到立体声编码 中来, 使得通过全局的方位信息估计方法在低码率下 能得到更为准确的声场 信息, 增强了声场效果, 极大的提升编码效率。
实施例五,
图 7为另一估计立体声信号的装置 04实施例示意图, 包括:
加权互相关单元 41 , 接收频域上立体声左右声道信号, 对频域立体声左 右声道信号进行处理得到关于频域立体声左右 声道信号间的加权的互相关函 数。 立体声左右声道频域信号的互相关函数可以为 加权的互相关函数, 使得 编码结果更加稳定, 加权的互相关函数即左声道频域信号与右声道 频域信号 的共轭的乘积的加权,所述加权的互相关函数 在立体声信号时频变换的长度 N 一半的频点上的值为 0。立体声左右声道频域信号的加权的互相关 数的形式 可以如下表示: c (k) = W(k)X x (k)X (k) 0<k< N/2
0 k > N/2 , 其中 w (k)表示加权函数, ^ 2 ^)表示 的共轭函数, 或者也可以 表示为: C r W = )JT 2 (A) 0≤k≤N/ 2 + l。 在另一加权的互相关函数的形式中, 结合不同的加权形式, 立体声左右声道频域信号的加权的互相关函数 可以如 下表示:
Χ^)\\Χ^)\ k = 0
k = N/2
k>N/2 其中, N为立体声信号时频变换的长度, 和 为 和 对应的幅度。加权的互相关函数在频点 0, 频点 N/2上为左右声道信号在对应 频点上幅度乘积的倒数, 加权的互相关函数在其他频点上为左右声道信 号在 幅度积的倒数的 2倍。
或者也可以釆用如下的形式以及其变形:
χ λ (k)x 2 " (k) I ^(k†+x 2 (k† k = o
0 k>N 12 °
频时变换单元 44,接收加权互相关单元 41确定的确定关于频域立体声左 右声道信号间的加权的互相关函数, 对关于立体声左右声道频域信号的加权 的互相关函数进行逆时频变换得到互相关函数 时域信号 , 此处互相关函 数时域信号是复数的信号。
预处理单元 42, 接收频时变换根据所述互相关函数得到的所述 互相关函 数时域信号, 对所述互相关函数进行预处理, 得到预处理结果, 即经过预处 理后的互相关函数时域信号。
预处理单元 42根据不同的需求可以包括下述单元中的一种 多种: 归一 化单元、 预处理单元和绝对值单元。 1)归一化单元对互相关函数时域信号进行归一 处理或预处理单元对互 相关函数时域信号进行预处理处理。
其中对互相关函数时域信号进行预处理处理可 以如下进行: C ravg (n) = a * C ravg (n - \) + * C r (n)
其中, "和 是加权的常数, 0≤«≤1 , β = λ - α , 对本实施例中, 在估计 群延时以及群相位前对获得的左右声道间的加 权的互相关函数进行预处理等 预处理使得估计出的群延时更好稳定。
2)归一化单元对互相关函数时域信号进行归一 处理之后,预处理单元进 一步对归一化单元的结果进行预处理处理。
3)绝对值单元获得互相关函数时域信号的绝对 信息,归一化单元对所述 绝对值信息进行归一化处理或预处理单元对所 述绝对值信息进行预处理处 理, 或者先进行归一化再进行预处理处理。
其中对互相关函数时域信号的绝对值进行预处 理处理可以如下进行,
C ravg — abs (n) = a * C ravg (η - \) + β * \C r (η)\。
4) 互相关函数时域信号进行归一化处理之后的绝 对值信号进一步进行预 处理处理。
预处理单元 42在估计立体声信号的群延时以及群相位前, 对于互相关函 数时域信号的前处理还可以包括其他的处理单 元, 例如用于执行自相关操作 的自相关单元等, 此时预处理单元 42对互相关函数时域信号的预处理还包括 自相关或 /和预处理处理等。
在另一实施例中,所述估计立体声信号装置 04也可以不包括预处理单元, 频时变换单元 44的结果被直接送入所述估计立体声信号装置 4的如下估计单 元 43 中, 估计单元 43用于根据加权的互相关函数时域信号或基于 理后的 加权的互相关函数时域信号中幅度最大的值对 应的索引估计得到群延时, 获 得群延时对应的时域信号互相关函数对应的相 角, 估计得到群相位。
估计单元 43 , 根据预处理单元 42的输出或者频时变换单元 44的输出估 计立体声左右声道信号间的群延时以及群相位 , 如图 8所示, 估计单元 43进 一步包括: 431判断单元,接收预处理单元 42或频时变换单元 44输出的互相 关函数时频信号, 判断时域信号互相关函数中幅度最大的值对应 的索引和与 变换长度 N相关的对称区间的关系, 判断结果被传送到群延时单元 432, 激 发群延时单元 432估计立体声信号左右声道间的群延时, 在一个实施例中, 如果判断单元 431 的结果为时域信号互相关函数中幅度最大的值 对应的索引 小于等于 N/2,群延时单元 432估计群延时等于该时域信号互相关函数中幅 度 最大的值对应的索引, 如果判断单元 431 的结果为相关函数中幅度最大的值 对应的索引大于 N/2, 群延时单元 432估计群延时为该索引减去变换长度 N, 可以将 [0,N/2]和(Ν/2,Ν]看作与立体声信号时频变换长 度 Ν相关的第一对称 区间和第二对称区间, 在另一种实施中, 判断的范围可以为 [0, m]和(Ν - m, N]的第一对称区间和第二对称区间,其中 m小于 N/2, 时域信号互相关函数中 幅度最大的值对应的索引与 m的相关信息进行比较, 当时域信号互相关函数 中幅度最大的值对应的索引位于区间 [0 , m] , 则群延时等于该时域信号互相 关函数中幅度最大的值对应的索引, 当时域信号互相关函数中幅度最大的值 对应的索引位于区间 (N - m, N] , 则群延时为该索引减去变换长度 N。 但在 实际应用中, 进行判断的可以是时域信号互相关函数中幅度 最大的值对应的 索引的临近值, 在不影响主观效果的条件下或者根据需求的限 定可以适当选 择稍小于幅度最大的值对应的索引作为判断条 件, 如幅度第二大的值对应的 索引或者和幅度最大值相差在固定或预设范围 的值对应的索引都适用, 包括 如下的一种形式或该形式的任意变形:
d _ arg max | C ravg («) | arg max | C ravg («) \< NI 2
8 ~ arg max | C ravg (n) | -N arg max | C ravg (n、\> NI 2 , 其中 arg max | C ravg (") | 是 中幅度最大的值对应的索引。群相位单元 433 ,接收群延时单元 432结 果, 根据估计得到的群延时时域信号互相关函数对 应的相角进行判断, 当群 延时 d s大于等于零,通过确定 对应的互相关值对应的相角估计得到群相位; 当 小于零时,群相位就是 + 索引上对应的互相关值对应的相角, 具体可 以釆用下面的一种形式或该形式的任意变形体 现:
θ = zc ravg (d g ) d g ≥o
8 ZC ( d g + N ) d g < 0 ,其中 ZC ravg ( d g )为时域信号互相关函数值 C ravg ( d g ) 的相角, ZCrav g + N )为时域信号互相关函数值 C ^ ( d g + N )的相角。
另一实施例中, 所述估计立体声信号的装置 04还包括参数特性单元 45 , 如图 9所示, 参数特性单元根据所述群相位和群延时信息估 计得到立体声参 数 IPD。
通过引入本发明实施例, 群延时和群相位被估计并被应用到立体声编码 中来, 使得通过全局的方位信息估计方法在低码率下 能得到更为准确的声场 信息, 增强了声场效果, 极大的提升编码效率。
实施例六,
图 10为另一估计立体声信号的装置 04,实施例示意图, 与实施例五不同 在于, 本实施例中加权互相关单元确定的立体声左右 声道频域信号的加权的 互相关函数传送给预处理单元 42或估计单元 43 , 估计单元 43提取互相关函 数的相位, 根据相位差和变换长度的乘积与频率信息的比 值关系确定群延时, 根据互相关函数当前频点的相位与频点索引和 相位差均值乘积的差值得到群 相位信息。 计立体声左右声道信号间的群延时以及群相位 , 估计单元 43进一步包括: 相 位提取单元 430 对互相关函数, 或基于处理后的互相关函数, 提取其相位 ^(k) = ZC r (k) ^ 其中函数 zc )用于提取复数 的相角, 群延时单元 432, 在低带一个频率内求取相位差的均值" 1 , 群相位单位 433'根据相位差和变换 长度的乘积与频率信息的比值关系确定群延时 , 同样的, 根据互相关函数当 前频点的相位与频点索引和相位差均值乘积的 差值得到群相位信息, 具体可 以釆用如下的方式: α = E{ (k + 1) - (k)} k < Max
d = - a
0 g = Ε{Φ(Λ) - a, * k} k < Max 其中 E{0(A + 1) - 0( } 表示相位差的均值, 为釆用的频率, Max 为计 算群延时和群相位的截止上限, 防止相位旋转。
本发明实施例立体声编码的设备中, 利用频域上的左右声道信号估计立 体声信号左右声道间的能体现信号全局方位信 息的群延时和群相位使得声场 的方位信息得到有效的增强, 将立体声信号空间特性参数和群延时以及群相 位的估计相结合应用于码率需求不大的立体声 编码中, 使得空间信息和全局 的方位信息有效的结合, 得到更为准确的声场信息, 增强了声场效果, 极大 的提升编码效率。
实施例七,
图 11为一立体声信号编码的设备 51实施例示意图, 包括:
变换装置 01 , 用于变换时域立体声左声道信号和右声道信号 到频域形成 频域上的左声道信号和右声道信号;
下混装置 02 , 用于频域上的左声道信号和右声道信号经过下 混生成单声 道下混信号;
参数提取装置 03 ,用于提取频域上左声道信号和右声道信号的 间参数; 估计立体声信号装置 04, 用于利用频域上左右声道信号估计立体声左右 声道间的群延时以及群相位;
编码装置 05 , 用于量化编码所述群延时和群相位, 所述空间参数和所述 单声道下混信号。
其中估计立体声装置 04适用于上述实施例四 -实施例六, 估计立体声信 号装置 04接收经过变换装置 01后得到的频域上的左声道信号和右声道信号 利用所述频域上的左右声道信号釆取实施例四 -实施例六中任一的实施方式 估计得到立体声左右声道间的群延时以及群相 位, 并将得到的群延时以及群 相位传送到编码装置 05, 同样, 编码装置 05还收到来至参数提取装置 03提 取到的频域上左声道信号和右声道信号的空间 参数, 编码装置 05对接收到的 信息进行量化编码形成边信息, 编码装置 05还量化所述下混信号进行编码量 化后的比特。 所述编码装置 05可以为一个整体, 用于接收不同的信息进行量 化编码, 也可以分离为多个编码装置处理接收到的不同 的信息, 如第一编码 装置 501和下混装置 02连接, 用于量化编码下混信息, 第二编码装置 502和 参数提取装置连接, 用于量化编码所述空间参数, 第三编码装置 503 , 用于和 估计立体声信号装置连接, 用于量化编码所述群延时以及群相位。 在另一实 施例中, 若估计立体声信号装置 04包括参数特性单元 45, 所述编码装置还可 以包括第四编码装置用于量化编码 IPD。量化 IPD时,用群延时( Group Delay ) 和群相位(Group Phase )来估计 并与原始的 ^^)进行差分处理, 对 差分的 IPD进行量化编码, 可以如下表示:
■2nd„ * k
' Ν g \ < k≤NI2 -\
IPD dlff ik) = IPDik) - IPDik) ^ 并对 进行量化得到量化后的比特, 在 另一实施例中, 也可直接量化 IPD, 比特流稍高, 量化更精确。
所述立体声编码的设备 51根据不同需求可以为立体声编码器或者其他 立体声多声道信号进行编码处理的设备。
实施例八
图 12为一立体声信号编码的系统 666实施例示意图, 在如实施例七所述 立体声信号编码设备 51的基础上还包括:
接收设备 50, 接收立体声输入信号用于立体声信号编码设备 51 ; 传送设 备 52, 用于传送所述立体声编码设备 51的结果, 一般情况下传送设备 52将 立体声编码设备的结果发送到解码端用于解码 。
本领域普通技术人员可以理解实现上述实施例 方法中的全部或部分流 程, 是可以通过计算机程序来指令相关的硬件来完 成, 所述的程序可存储于 一计算机可读取存储介质中, 该程序在执行时, 可包括如上述各方法的实施 例的流程。其中,所述的存储介质可为磁碟、 光盘、只读存储记忆体(Read-Only Memory, ROM )或随机存 己忆体 ( Random Access Memory, RAM )等。 对其进行限制, 尽管参照较佳实施例对本发明实施例进行了详 细的说明, 本 领域的普通技术人员应当理解: 其依然可以对本发明实施例的技术方案进行 修改或者等同替换, 而这些修改或者等同替换亦不能使修改后的技 术方案脱 离本发明实施例技术方案的精神和范围。 本领域普通技术人员可以理解所述 的实施例。
Next Patent: STEREO DECODING METHOD AND DEVICE
