Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND DEVICE FOR IDENTIFYING MARKER SOUND
Document Type and Number:
WIPO Patent Application WO/2011/079624
Kind Code:
A1
Abstract:
A method and device for identifying a marker sound relates to a testing technology for speech quality. The method for identifying the marker sound comprises that: recording any one speech data segment from an attenuation sample, and the number of sampling points of the speech data segment is the same as that pf sampling points of a marker sound sample, and then extracting the sampling point with envelope character from all sampling points of the speech data segment, and if judging that the spacing between the adjacent sampling points with envelope character within the speech data segment is equal to the spacing between the corresponding adjacent sampling points with envelope character of the marker sound within the speech source sample based on the extracted sampling points with envelope character, then determing that the speech data segment is a marker sound.

Inventors:
HAN, Zhi (ZTE Plaza, Keji Road South Hi-Tech Industrial Park, Nansha, Shenzhen Guangdong 7, 518057, CN)
韩治 (中国广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦, Guangdong 7, 518057, CN)
LU, Shangyi (ZTE Plaza, Keji Road South Hi-Tech Industrial Park, Nansha, Shenzhen Guangdong 7, 518057, CN)
Application Number:
CN2010/076778
Publication Date:
July 07, 2011
Filing Date:
September 09, 2010
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
ZTE CORPORATION (ZTE Plaza, Keji Road South Hi-Tech Industrial Park, Nansha, Shenzhen Guangdong 7, 518057, CN)
中兴通讯股份有限公司 (中国广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦, Guangdong 7, 518057, CN)
HAN, Zhi (ZTE Plaza, Keji Road South Hi-Tech Industrial Park, Nansha, Shenzhen Guangdong 7, 518057, CN)
韩治 (中国广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦, Guangdong 7, 518057, CN)
International Classes:
G10L15/20; G10L15/02
Attorney, Agent or Firm:
AFD CHINA INTELLECTUAL PROPERTY LAW OFFICE (Suite B 1601A, 8 Xue Qing Rd. Haidian, Beijing 2, 100192, CN)
Download PDF:
Claims:
权 利 要 求 书

1、 一种标志音识别方法, 该方法包括:

从衰减样本中记录任一语音数据段, 且该语音数据段的采样点数与标志 音样本的釆样点数相同, 再从所述语音数据段的所有釆样点中抽取包络特征 采样点;

若根据所抽取的包络特征采样点判断所述语音数据段中相邻包络特征采 样点的间距与源音样本中标志音的相应的相邻包络特征采样点的间距相等, 则判断所述语音数据段为标志音;

其中, 包络特征釆样点包括包絡上的波峰釆样点和波谷釆样点, 相邻包 络特征采样点为包络上相邻的波峰采样点,或者为包络上相邻的波谷采样点, 或者为包络上相邻的波峰釆样点和波谷釆样点。

2、 如权利要求 1所述的方法, 该方法还包括:

当所述语音数据段具有如下任一包络外形特征时, 判断所述语音数据段 中相邻包络特征采样点的间距与源音样本中标志音的相应的相邻包络特征采 样点的间距相等:

包络外形特征一, 所述语音数据段的包络上相邻两波峰采样点的间距, 与源音样本中标志音的包络上相邻两波峰采样点的间距相等; 或者, 所述语 音数据段的包络上相邻两波谷采样点的间距, 与源音样本中标志音的包络上 相邻两波谷采样点的间距相等;

包络外形特征二, 源音样本中标志音的包络上相应的波峰釆样点与其相 邻的波谷采样点的; ^轴坐标点的连线与 轴夹角的正切值与所述语音数据段 的包络上波峰釆样点与其相邻波谷采样点的 轴坐标点的连线与 轴夹角的 正切值的比值为第一比值, 源音样本中标志音的包络上相应的波峰采样点的 振幅与所述语音数据段的包络上波峰采样点的振幅的比值为第二比值,其中, 所述第一比值与所述第二比值相等。

3、 如权利要求 2所述的方法, 该方法还包括:

将从所述语音数据段中抽取的波峰和波谷采样点按照如下公式计算, 当 函数 ^Ζ^ ,Ζ^. )计算结果为 1时,判断所述语音数据段具有包络外形特征一:

上式中, DDX,表示从所述语音数据段中抽取的包络上相邻两波峰或者相 邻两波谷釆样点的间距;

DOXi表示源音样本中标志的包络上相邻两波峰或者相邻两波谷采样点的 间距;

a表示相邻两波峰或者相邻两波谷采样点的间距的误差门限值。 4、 如权利要求 3所述的方法, 其中, 在判断所述语音数据段具有包络外形特征一的步骤之前,该方法还包括: 对所述函数 ^ ^,ζ)^)的计算结果按如下公式进行计算;

∑S(DDXi,DOXi)

—>b

n-\

在判断所述语音数据段具有包络外形特征一的步骤中, 当满足上述公式 要求时, 才判断所述语音数据段具有包络外形特征一;

式中, 为所述语音数据段包络上波峰或者波谷采样点的个数, 6为相 邻两波峰或者相邻两波谷采样点的间距的有效率门限值。

5、 如权利要求 2所述的方法, 该方法还包括:

将从所述语音数据段中抽取的波峰和波谷采样点按照如下公式计算, 当 函数 Cte ^J计算结果为 1时, 判断所述语音数据段具有包络外形特征二:

式中, c为有效正切值的误差门限值;

^^表示所述第一比值;

¾^表示采样点序号为偶数时的第二比值;

~ ^表示采样点序号为奇数时的第二比值。

(丄 +1)

6、 如权利要求 5所述的方法, 其中,

在判断所述语音数据段具有包络外形特征二的步骤之前,该方法还包括: 对所述函数 C U的计算结果按如下公式进行计算; 2(«-l)

∑ C(tgd goi)

i=\ 在判断所述语音数据段具有包络外形特征二的步骤中, 当满足上述公式 要求时, 才判断所述语音数据段具有包络外形特征二:

式中, w为所述语音数据段包络上波峰或者波谷釆样点的个数, d为正 切值有效率门限值。

7、 如权利要求 1至 6任一项所述的方法, 其中,

所述从衰减样本中记录任一语音数据段的步骤包括: 确定衰减样本中的 有效音频数据, 从衰减样本中的有效音频数据中记录任一语音数据段;

所述确定衰减样本中的有效音频数据的步骤包括:

当所述衰减样本一段音频数据的釆样点数达到事先设定的数据有效门限 vt , 且所述采样点中连续的无效采样点的个数小于事先设定的数据失效门限 则确定该段音频数据为有效音频数据, 所述采样点的振幅的绝对值小于 事先设定的振幅门限 4时, 判断该采样点为无效采样点。

8、 一种标志音识别装置, 该装置包括釆样及抽取模块和判断处理模块, 其中:

所述采样及抽取模块设置为: 从衰减样本中采样一语音数据段, 以及从 所述语音数据段的所有采样点中抽取包络特征采样点, 其中, 所采样的语音 数据段的采样点数与标志音样本的采样点数相同, 包络特征采样点包括包络 上的波峰釆样点和波谷釆样点;

所述判断处理模块设置为: 根据所述采样及抽取模块所抽取的包络特征 采样点判断所述语音数据段中相邻的包络特征采样点的间距是否与源音样本 中标志音的相应的相邻的包络特征釆样点的间距相等, 如果相等, 则判断所 述语音数据段为标志音, 其中, 相邻包络特征采样点为包络上相邻的波峰采 样点, 或者为包络上相邻的波谷釆样点, 或者为包络上相邻的波峰釆样点和 波谷采样点。

9、 如权利要求 8所述的装置, 其中,

所述判断处理模块是设置为以如下方式判断所述语音数据段中相邻的包 点的间距相等:

确定所述语音数据段具有如下任一包络外形特征时, 判断所述语音数据 段中相邻包络特征采样点的间距与源音样本中标志音的相应的相邻包络特征 采样点的间距相等:

包络外形特征一, 所述语音数据段的包络上相邻两波峰釆样点的间距, 与源音样本中标志音的包络上相邻两波峰采样点的间距相等; 或者, 所述语 音数据段的包络上相邻两波谷采样点的间距, 与源音样本中标志音的包络上 相邻两波谷采样点的间距相等;

包络外形特征二, 源音样本中标志音的包络上相应的波峰采样点与其相 邻的波谷釆样点的 轴坐标点的连线与 轴夹角的正切值与所述语音数据段 的包络上波峰采样点与其相邻波谷采样点的 轴坐标点的连线与 轴夹角的 正切值的比值为第一比值, 源音样本中标志音的包络上相应的波峰采样点的 振幅与所述语音数据段的包络上波峰采样点的振幅的比值为第二比值,其中, 所述第一比值与所述第二比值相等。

10、 如权利要求 9所述的装置, 其中,

所述判断处理模块还设置为: 将从所述语音数据段中抽取的波峰和波谷 采样点按照如下公式计算, 当函数 ί ζ ,, ^)计算结果为 1 时, 判断所述语 音数据段具有包络外形特征一:

上式中, )DX,表示从所述语音数据段中抽取的包络上相邻两波峰或者相 邻两波谷采样点的间距;

D0Xi表示源音样本中标志的包络上相邻两波峰或者相邻两波谷采样点的 间距;

a表示相邻两波峰或者相邻两波谷采样点的间距的误差门限值。 11、 如权利要求 9所述的装置, 其中,

所述判断处理模块还设置为: 将从所述语音数据段中抽取的波峰和波谷 采样点按照如下公式计算, 当函数 cte u计算结果为 1时, 判断所述语音 数据段具有包络外形特征二:

if i is odd

etc

C(tgdi goi) =

if i is even

etc

式中, c为有效正切值的误差门限值;

^^表示所述第一比值; 表示采样点序号为偶数时的第二比值;

^^表示采样点序号为奇数时的第二比值。

Description:
一种标志音识别方法及装置

技术领域

本发明涉及无线 (有线)通信领域的语音质量测试技术, 具体涉及一种 标志音识别方法及装置。 背景技术

无线 (有线) 网络中语音质量测试都是通过对发送端发送的 源音样本和 接收端接到的衰减样本的比对来实现的。 为了能客观地评估出网络的语音质 量, 需要源音样本与采集到的衰减样本准确对齐。 通常, 发送端在发送正式 的源音样本前, 会发送一段特征明显的语音数据来作为标志音 , 并在经过一 段由发送端和接收端共同约定的时间后发送源 音样本数据。 接收端在识别出 标志音后, 等待相应时间, 开始记录衰减样本。 以此来实现源音样本和衰减 样本的对齐。

在实际的测试过程中, 发送端一般釆用具有特殊频率的单音信号作为 标 志音。接收端在收到语音数据后,通过数据进 行快速傅里叶变换(Fast Fourier Transform, FFT ) 及滤波操作, 来判断接收到的语音数据是否为标志音。 在 单纯的通信环境中, 接收端通过 FFT和滤波操作, 能够滤除大部分的外界干 扰。 但是, 在实际生活中网络环境复杂多变, 往往存在着各种各样的千扰和 噪声。 测试过程中, 一旦引入了与单音信号同频的噪声, 则该噪声无法被滤 除, 接收端必然会发生对标志音误判, 导致测试结果出现异常。

其次, 单音信号所采用的频率通常超出了人耳可以听 到的频率范围, 测 试人员没有主观感受。 当出现样本对齐误差时, 测试人员无法通过人工的方 式去排查误差出现的原因。 即便单音信号釆用的频率在人耳可以听到的范 围 之内, 它所发出的声音也是刺耳的尖嘯声, 极大的影响测试人员的听觉感受。 发明内容

本发明所要解决的技术问题是, 提供一种标志音识别方法及装置, 避免 对标志音的误判。

为了解决上述问题, 本发明公开了一种标志音识别方法, 包括: 从衰减样本中记录任一语音数据段, 且该语音数据段的采样点数与标志 音样本的釆样点数相同, 再从所述语音数据段的所有釆样点中抽取包络 特征 采样点;

若根据所抽取的包络特征采样点判断所述语音 数据段中相邻包络特征采 样点的间距与源音样本中标志音的相应的相邻 包络特征采样点的间距相等, 则判断所述语音数据段即为标志音;

其中, 包络特征釆样点包括包络上的波峰釆样点和波 谷釆样点, 相邻包 络特征采样点为包络上相邻的波峰采样点,或 者为包络上相邻的波谷采样点, 或者为包络上相邻的波峰采样点和波谷采样点 。

上述方法还包括: 当所述语音数据段具有如下任一包络外形特征 时, 判 断所述语音数据段中相邻包络特征采样点的间 距与源音样本中标志音的相应 的相邻包络特征釆样点的间距相等:

包络外形特征一, 所述语音数据段的包络上相邻两波峰采样点的 间距, 与源音样本中标志音的包络上相邻两波峰采样 点的间距相等; 或者, 所述语 音数据段的包络上相邻两波谷采样点的间距, 与源音样本中标志音的包络上 相邻两波谷采样点的间距相等;

包络外形特征二, 源音样本中标志音的包络上相应的波峰釆样点 与其相 邻的波谷采样点的 轴坐标点的连线与 轴夹角的正切值与所述语音数据段 的包络上波峰采样点与其相邻波谷采样点的 轴坐标点的连线与 轴夹角的 正切值的比值为第一比值, 源音样本中标志音的包络上相应的波峰采样点 的 振幅与所述语音数据段的包络上波峰釆样点的 振幅的比值为第二比值,其中, 所述第一比值与所述第二比值相等。

上述方法还包括: 将从所述语音数据段中抽取的波峰和波谷采样 点按照 如下公式计算, 当函数 S(Z) D i ,Z)。 x ,)计算结果为 1 时, 判断所述语音数据段具 有包络外形特征一:

上式中, D DX ,表示从所述语音数据段中抽取的包络上 邻两波峰或者相 邻两波谷釆样点的间距;

D OXi 表示源音样本中标志的包络上相邻两波峰 或者相邻两波谷采样点的 间距;

a表示相邻两波峰或者相邻两波谷采样点的间 的误差门限值。 优选地, 在判断所述语音数据段具有包絡外形特征一的 步骤之前, 该方 法还包括: 对所述函数 ^(1)^ ,/)^.)的计算结果按如下公式进行计算,

w-1

∑S(D DXi , D OXi )

—> b

n - \

在判断所述语音数据段具有包络外形特征一的 步骤中, 当满足上述公式 要求时, 才判断所述语音数据段具有包络外形特征一;

式中, w为所述语音数据段包络上波峰或者波谷采样 的个数, 6为相 邻两波峰或者相邻两波谷釆样点的间距的有效 率门限值。

该方法还包括: 将从所述语音数据段中抽取的波峰和波谷采样 点按照如 下公式计算, 当函数 Cd,, OT )计算结果为 1时, 判断所述语音数据段具有包 络外形特征二:

式中, c为有效正切值的误差门限值;

^^表示所述第一比值;

¾^表示采样点序号为偶数时的第二比值;

-表示采样点序号为奇数时的第二比值。

y 优选地, 在判断所述语音数据段具有包络外形特征二的 步骤之前, 该方 法还包括: 对所述函数 Cfe di .U的计算结果按如下公式进行计算, 在判断所述语音数据段具有包络外形特征二的 步骤中, 当满足上述公式 要求时, 才判断所述语音数据段具有包络外形特征二:

式中, 为所述语音数据段包络上波峰或者波谷采样点 的个数, d为正 切值有效率门限值。

所述从衰减样本中记录任一语音数据段的步骤 包括: 确定衰减样本中的 有效音频数据, 从衰减样本中的有效音频数据中记录任一语音 数据段;

所述确定衰减样本中的有效音频数据的步骤包 括:

当所述衰减样本一段音频数据的采样点数达到 事先设定的数据有效门限 V t , 且所述采样点中连续的无效采样点的个数小于 事先设定的数据失效门限 I t , 则确定该段音频数据为有效音频数据, 所述釆样点的振幅的绝对值小于 事先设定的振幅门限 4时, 判断该采样点为无效采样点。

本发明还公开了一种标志音识别装置, 包括采样及抽取模块和判断处理 模块, 其中:

所述采样及抽取模块设置为: 从衰减样本中采样一语音数据段, 以及用 于从所述语音数据段的所有采样点中抽取包络 特征采样点, 其中, 所采样的 语音数据段的采样点数与标志音样本的采样点 数相同, 包络特征采样点包括 包络上的波峰采样点和波谷采样点;

所述判断处理模块设置为: 根据所述釆样及抽取模块所抽取的包络特征 釆样点判断所述语音数据段中相邻的包络特征 采样点的间距是否与源音样本 中标志音的相应的相邻的包络特征采样点的间 距相等, 如果相等, 则判断所 述语音数据段即为标志音, 其中, 相邻包络特征采样点为包络上相邻的波峰 采样点, 或者为包络上相邻的波谷采样点, 或者为包络上相邻的波峰采样点 和波谷釆样点。

上述装置中, 所述判断处理模块是设置为以如下方式判断所 述语音数据 段中相邻的包络特征采样点的间距是否与源音 样本中标志音的相应的相邻的 包络特征采样点的间距相等:

确定所述语音数据段具有如下任一包络外形特 征时, 判断所述语音数据 段中相邻包络特征采样点的间距与源音样本中 标志音的相应的相邻包络特征 采样点的间距相等:

包络外形特征一, 所述语音数据段的包络上相邻两波峰采样点的 间距, 与源音样本中标志音的包络上相邻两波峰采样 点的间距相等; 或者, 所述语 音数据段的包络上相邻两波谷釆样点的间距, 与源音样本中标志音的包络上 相邻两波谷采样点的间距相等;

包络外形特征二, 源音样本中标志音的包络上相应的波峰采样点 与其相 邻的波谷采样点的 轴坐标点的连线与 轴夹角的正切值与所述语音数据段 的包络上波峰采样点与其相邻波谷采样点的 轴坐标点的连线与 轴夹角的 正切值的比值为第一比值, 源音样本中标志音的包络上相应的波峰釆样点 的 振幅与所述语音数据段的包络上波峰采样点的 振幅的比值为第二比值,其中, 所述第一比值与所述第二比值相等。

其中, 所述判断处理模块还设置为: 将从所述语音数据段中抽取的波峰 和波谷釆样点按照如下公式计算, 当函数^ 计算结果为 1 时, 判断 所述语音数据段具有包络外形特征一:

: a

上式中, D D i 表示从所述语音数据段中抽取的包络上相 邻两波峰或者相 邻两波谷采样点的间距;

D OXi 表示源音样本中标志的包络上相邻两波峰 或者相邻两波谷采样点的 间距;

a表示相邻两波峰或者相邻两波谷采样点的间 的误差门限值。

所述判断处理模块还设置为: 将从所述语音数据段中抽取的波峰和波谷 采样点按照如下公式计算, 当函数 Cfe^U计算结果为 1时, 判断所述语音 数据段具有包络外形特征二:

式中, c为有效正切值的误差门限值;

^^表示所述第一比值;

¾^表示采样点序号为偶数时的第二比值;

表示采样点序号为奇数时的第二比值。

采用本发明技术方案, 在时域下进行标志音的识别, 解决了由于引入同 频噪声导致标志音误判的问题。 另外, 本发明技术方案对标志音的频率没有 要求, 因此, 可以改善测试人员的听觉感受。 附图概述

图 1是本发明提出的方法的特征 1的原理示意图;

图 2是本发明提出的方法的特征 2的原理示意图;

图 3是本发明在衰减样本中检查是否有效音频数 的流程图;

4 是本发明抽取波峰和波谷采样点流程图;

图 5是本发明对衰减样本中有效音频数据的波峰 距进行检查的流程图; 图 6 是本发明对衰减样本中有效音频数据的正切值 tg进行检查的流程 图。 本发明的较佳实施方式

本发明的主要构思是, 由于语音信号在通信网络中传输时, 语音信号的 频率不会发生改变, 因此, 语音信号的周期也不会发生改变。 如果发送端所 发送的源音样本和接收端接收到的衰减样本均 为离散信号, 且发送端和接收 端采用相同的采样间隔, 则语音信号中相邻的两两采样点在 轴上的间距也 不会发生改变。 因此, 本发明技术方案提出, 从衰减样本中记录一语音数据 段, 从该语音数据段上抽取包络特征采样点 (即包络上的波峰釆样点和波谷 釆样点) , 在所抽取的釆样点中, 若相邻的包络特征釆样点的间距与源音样 本中标志音的相应的相邻的包络特征采样点的 间距相等, 即可判断该语音数 据段即为标志音, 其中, 相邻包络特征采样点为包络上相邻的波峰采样 点, 或者为包络上相邻的波谷采样点, 或者为包络上相邻的波峰采样点和波谷采 样点,具体地,衰减样本中任一语音数据段具 有如下任一个包络外形特征(即 称为标志音的包络外形特征) 时, 即判断衰减样本中任一语音数据段中相邻 的两个采样点的间距与源音样本中标志音的相 邻两个采样点的间距相等: 标志音的包络外形特征 1 : 衰减样本的语音数据段的包络上相邻两波峰

(或者相邻两波谷 ) 的采样点间距与源音样本中标志音的包络上相 邻两波峰 (或者相邻两波谷) 的采样点间距相等; 例如, 如图 1 所示, 源音样本中标志音包络中存在《个波峰采样点 。 2 )·· 。 。„)}, 其中, 和 1+ „为相邻波峰的采样点, 则 和 ^,+η在 X轴 (时间轴)上的差, 如公式 (1 ) 所示:

公式( 1 ) 若衰减样本的一段语音数据的包络中, 也存在《个波峰釆样点

{ ¾(½,¼ι), }, 其中 和/ D 为相邻波峰的采样点, 则 P 和 在 X轴上的差, 如公式( 2 ) 所示:

= X d 公式 ( 2 ) 由于源音样本和衰减样本具有相同的频率, 源音样本中标志音包络上相 邻两波峰采样点在 轴上的间距应该与衰减样本中对应两釆样点在 轴上的 间距相等, 此时, 定义如公式(3) 所示的函数 S(Z¾ Xi , i ):

式中, a 为相邻两波峰采样点的间距的误差门限值, 具体可根据测试环 境的实际情况设置, 当 I D ^ - D oxi I不大于误差门限值时 , 则认为 I ,.为一有效

D。xi

波峰间距。 对于所有的 Z¾ x , 如果满足公式 (4) , 则认为衰减样本中的该段 数据符合标志音的包络外形特征 1:

∑S(D DXi ,D OXi )

^ ≥b (公式 4)

n-\

式中, 为相邻波峰采样点的间距的有效率门限值, 具体可根据测试环 境的实际情况设置。

标志音的包络外形特征 2:源音样本包络上波峰釆样点与其相邻的 7轴正 方向上的波谷采样点的 轴坐标点的连线与 轴夹角的正切值与衰减样本的 语音数据段的包络上相应波峰采样点与其相邻 的 轴正方向上的波谷采样点 的 轴坐标点的连线与 轴夹角的正切值的比值为第一比值, 以及源音样本 的波峰釆样点的振幅与衰减样本的语音数据段 的包络上相应波峰釆样点的振 幅的比值为第二比值, 这两个比值相等。 例如, 如图 2 所示, 假设在标志音样本包络中存在《个波峰釆样点

{Po^,y^), 在任意相邻的两波峰采样点 和 尸。(,+〗)之间都存在一个波谷采样点?0〗( , ^) ( y M > ) , 波谷采样点共有"- 1 个, 集合为: {^(υ^;), r。 2 (x to2 ,3 to2 )… Γ — D )}。 则 的 轴坐标 点与波峰采样点的连线与 轴的正切值, 如公式( 5 ) 所示:

y

if i is odd

χ

(公式 5)

由上可以获知, 源音样本中共有 2X(«-1)个正切值, 集合为:

* * * -3),

若在衰减样本的一段语音数据的包络中, 也存在《个波峰采样点, 集合 为 { (Wwi), 尸 ^ ,·) )··· ^ ) }' 则在任意相邻的两波峰采样点

^和^ 之间都存在一个波谷采样点? D,., 波谷采样点共有 "-I个, 集合为:

¾(¾,^ 2 )- 则 轴坐标点与 的连线 与 轴的正切值如公式( 6 ) 所示:

y

if i is odd

(公式 6)

y

if i is even 由上可以看出, 衰减样本的这段数据中共有 2X(«-1)个正切值, 集合为: , ,

将源音样本中标志音的正切值与衰减样本数据 中对应的正切值按照公式 ( 7 )进行比较: if i is odd

y x I x x y t I x !■ — x ;

if i is even 在上式中,由于源音样本与衰减样本的相邻采 样点在 轴上的间距相同, 即 I ¾ i+ i -X J M ) I等于 I ^ r i + l -^ (M) I χ , -χ , I等于 |χ , -χ , I, 于是得 出如公式(8 ) 所示的结果:

y

if i is odd

y

(公式 8 )

y

if i is even

y 此时, 定义公式(9 ) 所示的函数 C ^tgj:

(公式 9 )

式中, C 为有效正切值的误差门限值,具体可根据 测试环境的实际情况设

置。 如果( ) (当 为偶 数时)小于误差门限的话, 则认为该正切值为一有效正切值。对于所有的 , 如果满足公式 (10) , 则认为衰减样本中的该段数据符合标志音的包 络外形 特征 2:

∑ C{tg £ ,tg 0l )

>d (公式 10)

2("— 1)

式中, d为正切值有效率门限值, 具体可根据测试环境的实际情况设置。 下面结合附图及具体实施例对本发明技术方案 做进一步详细说明。

一种基于语音包络特征的标志音识别装置, 至少包括采样及抽取模块和 判断处理模块。 下面介绍各模块的功能。

釆样及抽取模块, 用于从衰减样本中釆样一语音数据段, 以及用于从所 述语音数据段的所有采样点中抽取包络特征采 样点, 其中, 所采样的语音数 据段的采样点数与标志音样本的采样点数相同 , 包络特征釆样点包括包络上 的波峰采样点和波谷采样点;

判断处理模块, 用于根据采样及抽取模块所抽取的包络特征采 样点判断 所述语音数据段中相邻包络特征釆样点的间距 是否与源音样本中标志音的相 应的相邻包络特征采样点的间距相等, 如果相等, 则判断所述语音数据段即 为标志音, 其中, 相邻包络特征采样点为包络上相邻的波峰采样 点, 或者为 包络上相邻的波谷采样点, 或者为包络上相邻的波峰采样点和波谷采样点 。

其中, 判断处理模块, 可以通过对所采样的语音数据段判断是否具有 如 下任一包络外形特征, 从而判断该语音数据段中相邻包络特征釆样点 的间距 与源音样本中标志音的相应的相邻包络特征采 样点的间距相等 (即判断该语 音数据段是否为标志音) :

包络外形特征一, 所采样的语音数据段的包络上相邻两波峰采样 点的间 距, 与源音样本中标志音的包络上相邻两波峰采样 点的间距相等; 或者, 所 釆样的语音数据段的包络上相邻两波谷釆样点 的间距, 与源音样本中标志音 的包络上相邻两波谷釆样点的间距相等;

具体地, 判断处理模块, 将从所述语音数据段中抽取的波峰和波谷采样 点按照如下公式计算, 当函数 ^(/) ,1)。 .)计算结果为 1 时, 则判断所述语音 数据 一

上式中, ) OT ,表示从所述语音数据段中抽取的包络上 邻两波峰或者相 邻两波谷采样点的间距;

D OXi 表示源音样本中标志的包络上相邻两波峰 或者相邻两波谷采样点的 间距;

a表示相邻两波峰或者相邻两波谷釆样点的间 的误差门限值。

包络外形特征二, 源音样本中标志音的包络上相应的波峰采样点 与其相 邻的波谷采样点的 轴坐标点的连线与 轴夹角的正切值与所采样的语音数 据段的包络上波峰采样点与其相邻波谷釆样点 的 轴坐标点的连线与 轴夹 角的正切值的比值为第一比值, 源音样本中标志音的包络上相应的波峰釆样 点的振幅与所采样的语音数据段的包络上波峰 采样点的振幅的比值为第二比 值, 第一比值与所述第二比值相等。

具体地, 判断处理模块, 将从所述语音数据段中抽取的波峰和波谷采样 点按照如下公式计算, 当函数 Cte .U计算结果为 1时, 判断所述语音数据 段具有包络外形特征二:

式中, c为有效正切值的误差门限值;

表示所述第一比值;

^^表示采样点序号为偶数时的第二比值;

^^表示釆样点序号为奇数时的第二比值。

下面介绍上述装置识别标志音识別的具体过 程, 包括以下步骤: 步骤一: 检查衰减样本中是否有有效音频数据, 当有有效音频数据时, 进入步骤二; 该步骤中, 在无线通信语音质量测试中, 发送端发送的语音数据格式如 下:

静音阶段 1 + 标志音 [ + 静音阶段 2] + 源音样本 …重复。

接收端在静音阶段 1接收到非静音数据时, 就认为是有效语音数据的开 始, 但是, 由于信号在传输的过程中会受到外界的干扰, 接收端接收到的衰 减样本数据中不会存在绝对的静音数据(振幅 为 0 ) , 同时还有可能存在 "嘯 叫" 现象。 因此, 本实施例对接收到的语音数据将排除干扰, 具体过程, 如 图 3所示, 包括如下步骤:

步骤 301、 接收端设置振幅门限 4、 数据失效门限 /,和数据有效门限 ^, 其中, 接收端根据网络的实际质量设定各门限值;

其中: 振幅门限 4 , 用于表示当一个采样点的振幅的绝对值 ^大于或者 等于 4时, 接收端则认为该采样点为有效采样点, 当采样点的振幅的绝对值 小于 4时, 接收端则认为该采样点为无效采样点;

数据失效门限 用于表示当连续的无效釆样点数超过了 时,接收端则 认为之前的数据均为无效数据, 需要从连续无效釆样点数达到 / f 的采样点开 始重新进行 ^验证;

数据有效门限 V t >I t , 用于表示当衰减样本中采样点数达到 且这 个釆样点中无效釆样点数'〗、于 时, 接收端则认为该段数据为有效数据。

步骤 302, 设置采样点计数器 c=o , 连续无效采样点计数器 ς=ο;

步骤 303、 对当前采样点进行验证, 首先对 C加 1, 接着进行判断, 如果 当前采样点振幅的绝对值 4小于 4 (即当前采样点为无效采样点) , 且前一 采样点为无效采样点, ς.加 1 ; 如果前一采样点为有效数据点, 则将 ς.置 1。 接着, 如果 ς.〉=Α, 则认为之前数据无效, 先将 (:、 ς置 0, 再从下一釆样点 开始重新验证; 如果 </,且<^> , 则认为当前数据为有效数据, 流程结束, 进入步骤二; 如果 <^. </,且 < , 从下一采样点开始重新开始验证。

步骤二: 从衰减样本中抽取包络特征采样点, 即包络上的波峰采样点和 波谷采样点;

该步骤中, 接收端从有效数据的起始点开始对之后的釆样 点进行记录, 当记录采样点数达到标志音样本采样点数时, 开始抽取包絡的波峰采样点, 具体操作过程如图 4 所示, 其中, 假设此时共有标志音样本有 "个采样点, 采样点集合 ^hfejj^fe^) ...... Λ„(Χ„, Λ „)},标志音样本的包络上的波峰数 为 k , 具体抽取过程包括如下步骤:

步骤 401、对釆样点集合 S中的釆样点逐个进行分析、抽取,如果 ^.〉;^— υ 且 Λ,>Λ(, +1) , 则 为语音波形上的波峰采样点, 将 加入到集合 中;

步骤 402, 将 4中的 采样点按照步骤 401的方法再次进行抽取,将抽取出的采样点存 入集合 中, 集合 ={Ρ ^^ Ρ ΛΡ ^ ρΛ )―.. P^ pek ,y P } ' ^即为包络上的波峰釆样点 集合;

步骤 403, 再次对集合 中的数据进行分析, 如果 ^ ;^.^且

J . < pw(M) , 则 将 采样点 / ^ 加入集合 中 , 这时 , 集合 E = ( , tel ), t e2 (x fe2 , y te2 ) ...... t k _ Y) {x t k _ V) , y t k _ v } , 即为包络上的波谷采样点集 合。

步骤三: 根据抽取的波峰采样点和波谷采样点判断从衰 减样本中采样的 这段语音是否具有标志音包络外形特征, 如果是, 则表示该段语音中包含标 志音, 否则表示该段语音中不包含标志音。

该步骤中, 接收端根据抽取的波峰采样点和波谷采样点判 断出衰减样本 的这段语音具有标志音的任一个包络外形特征 , 即可判断该段语音中包含标 志音。 在优选的场景中, 接收端根据抽取的波峰采样点和波谷采样点判 断出 衰减样本的这段语音具有标志音所有的包络外 形特征(即具有包络外形特征 一和包絡外形特征二) 时, 才判断该段语音中包含标志音;

其 中 , 假设标志音样本的相邻波峰采样点 的 间距集合 D 0 ={d ol ,d o2 ...... , 则对波峰波谷抽取完毕后, 按照如图 5所示的过程, 判 断从衰减样本中采样的这段语音是否具有标志 音的包络外形特征一:

步骤 501、 设置一个有效间距计数 N和游标计数 , N=0, ;=1; 步骤 502、 按照公式 (11)计算抽取的衰减样本包络的波峰采样点集 合 中, 相邻波峰采样点的间距, 即 和 的间距 .; d A = x pe(M) - x pei ( ≤i≤k-\) (公式 11 ) 步骤 503、 按照上文中公式(3)计算函数 5" ( 并计算有效间距计 算 N, N = N + S(d di ,d oi );

步骤 504、 如果/≠Α-1, 则将 加 1, 重复执行步骤 502;

如果 = 1, 则按照公式 (12)计算 N与 1的比值 r d ,

当 ≥6时, 认为衰减样本的这段语音数据符合标志音包络 外形特征一, 该段语音即为标志音; 否则认为语音数据为无效数据。 假设标志音样本包络上波峰采样点与其相邻的 7轴正方向上的波谷采样 点 的 ; r 轴 坐 标 点 的 连 线 与 轴 夹 角 的 正 切 值 集 合 g 0 ={tg ol ,tg o2 ―..g oi2k . 3) ,tg o(2k _ 2) } , 则按照图 6所示流程, 判断从衰减样本中采样 的这段语音是否具有标志音的包络外形特征二 , 具体包括如下步骤:

步骤 601、 设置一个有效间距计数 N和游标计数 , N=0, =1。

步骤 602、按照公式( 13 )计算衰减样本中波谷采样点 和其相邻的采样 序号为奇数的波峰采样点 的正切值 ^.^ , 以及按照公式( 14 )计算 ^和其 相邻的釆序号为偶数的波峰釆样点 ¾+ „的正切值 ¾ .), 其中:

¾(2M) =^ ^- ( ≤i≤k-\) (公式 13) tg d(2i) = ^ ) (0< <^-1) (公式 14) 步骤 6 ( 、 按照上文公式( 9 )计算 μ 和 C( ¾ t 2i )), 并计 算有效间距计数 N, N = N + C(tg d(li _ x) , tg^ ) + C(tg d(2i) , tg 0(2l) ); 步骤 604、 如果 ≠¾:- 1, 则将 加 1, 重复步骤 602;

如果 = 1, 则按照公式 (15)计算 N与 t- 1的比值 ^, r = (公式 15)

t g 2{k-\)

如象 r d ≥d , 则认为衰减样本的这段语音数据符合标志音的 包络外形特征 二, 该段语音数据即为标志音; 否则认为语音数据为无效数据。 尽管为示例目的, 已经公开了本发明的优选实施例 , 本领域的技术人员 将意识到各种改进、 增加和取代也是可能的, 因此, 本发明的范围应当不限 于上述实施例。

本领域普通技术人员可以理解上述方法中的全 部或部分步骤可通过程序 来指令相关硬件完成, 所述程序可以存储于计算机可读存储介质中, 如只读 存储器、 磁盘或光盘等。 可选地, 上述实施例的全部或部分步骤也可以使用 一个或多个集成电路来实现。 相应地, 上述实施例中的各模块 /单元可以采用 硬件的形式实现, 也可以采用软件功能模块的形式实现。 本发明不限制于任 何特定形式的硬件和软件的结合。

工业实用性

釆用本发明技术方案, 在时域下进行标志音的识别, 解决了由于引入同 频噪声导致标志音误判的问题。 另外, 本发明技术方案对标志音的频率没有 要求, 因此, 可以改善测试人员的听觉感受。