Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
DIGITAL VIDEO QUALITY CONTROL METHOD AND DEVICE THEREOF
Document Type and Number:
WIPO Patent Application WO/2013/143396
Kind Code:
A1
Abstract:
A digital video quality control method and device thereof. The method comprises: in accordance with a video quality monitoring cycle, extracting a feature parameter of video data encoded by a video encoder; inputting the extracted feature parameter of the video data into a neural network to obtain a video quality evaluation parameter as an output result; and judging whether the video quality evaluation parameter meets a preset condition, and if yes, instructing the video encoder to regulate the feature parameter of the video data so as to increase the video quality.

Inventors:
MAY HUBERT (CN)
Application Number:
PCT/CN2013/072580
Publication Date:
October 03, 2013
Filing Date:
March 14, 2013
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
CHINA MOBILE COMM CORP (CN)
International Classes:
H04N17/02
Foreign References:
CN101715146A2010-05-26
CN101282481A2008-10-08
CN101808244A2010-08-18
CN102137271A2011-07-27
Attorney, Agent or Firm:
UNITALEN ATTORNEYS AT LAW (CN)
北京集佳知识产权代理有限公司 (CN)
Download PDF:
Claims:
权 利 要 求

1、 一种数字视频质量控制方法, 其特征在于, 该方法包括:

按照视频质量监控周期, 提取视频编码器编码后的视频数据的特征参数; 将提取到的视频数据的特征参数输入神经网络,得到作为输出结果的视频 质量评价参数;

判断视频质量评价参数是否满足预置条件, 若是, 则指示视频编码器调整 视频数据的特征参数以提高视频质量。

2、 根据权利要求 1所述的方法, 其特征在于, 所述视频质量评价参数值 越大, 表明视频质量越高;

所述判断视频质量评价参数是否满足预置条件包括:

判断所述视频质量评价参数是否低于门限, 若是, 则确定满足预置条件。

3、 根据权利要求 2所述的方法, 其特征在于, 所述特征参数包括量化因 子平均值和 P帧平均运动矢量; 其中,所述量化因子平均值是指视频流中所有 宏块的量化因子的平均值,所述 P帧平均运动矢量是指 P帧中运动矢量不为 0 的宏块的运动矢量平均值。

4、 根据权利要求 3所述的方法, 其特征在于, 所述门限包括第一门限和 第二门限, 其中第一门限低于第二门限;

所述指示视频编码器调整视频数据的特征参数以提高视频质量, 具体为: 当视频质量评价参数低于第一门限时,将当前视频数据的量化因子平均值 和 P帧平均运动矢量同步给视频编码器,并指示视频编码器降低视频的量化因 子平均值以及降低 P帧平均运动矢量;

当视频质量评价参数高于第一门限但低于第二门限时,将当前视频数据的 P帧平均运动矢量同步给数字视频编码器,并指示视频编码器降低 P帧平均运 动矢量。

5、根据权利要求 4所述的方法, 其特征在于, 所述门限还包括第三门限, 第三门限高于第二门限; 该方法还包括:

当视频质量评价参数高于第二门限但低于第三门限时,缩短视频质量监控 周期长度; 当视频质量评价参数高于第三门限时, 延长视频质量监控周期长度。 6、 根据权利要求 2所述的方法, 其特征在于, 所述神经网络通过以下方 式训练得到:

分别提取各训练用视频序列的特征参数,并获取相应训练用视频序列的视 频质量评价参数;

将各训练用视频序列的特征参数以及相应训练用视频序列的视频质量评 价参数输入神经网络, 并以训练用视频序列的特征参数作为输入参数时, 期望 的输出结果为该训练用视频序列的视频质量评价参数为目标,对神经网络进行 训练。

7、 一种数字视频质量控制装置, 其特征在于, 包括:

监控模块, 用于按照视频质量监控周期,提取视频编码器编码后的视频数 据的特征参数;

质量评价模块, 用于将提取到的视频数据的特征参数输入神经网络, 并得 到所述视频数据的视频质量评价参数; 其中, 所述神经网络根据输入的视频数 据特征参数, 输出所述视频数据的视频质量评价参数;

控制模块, 用于判断视频质量评价参数是否满足预置条件, 若是, 则指示 视频编码器调整视频数据的特征参数以提高视频质量。

8、 根据权利要求 7所述的装置, 其特征在于, 所述视频质量评价参数值 越大, 表明视频质量越高;

所述控制模块具体用于判断所述视频质量评价参数是否低于门限, 若是, 则指示视频编码器调整视频数据的特征参数以提高视频质量。

9、 根据权利要求 8所述的装置, 其特征在于, 所述特征参数包括量化因 子平均值和 P帧平均运动矢量; 其中,所述量化因子平均值是指视频流中所有 宏块的量化因子的平均值,所述 P帧平均运动矢量是指 P帧中运动矢量不为 0 的宏块的运动矢量平均值; 所述门限包括第一门限和第二门限, 其中第一门限 低于第二门限;

所述控制模块具体用于, 当视频质量评价参数低于第一门限时,将当前视 频数据的量化因子平均值和 P帧平均运动矢量同步给视频编码器,并指示视频 编码器降低视频的量化因子平均值以及降低 P帧平均运动矢量;当视频质量评 价参数高于第一门限但低于第二门限时,将当前视频数据的 P帧平均运动矢量 同步给数字视频编码器, 并指示视频编码器降低 P帧平均运动矢量。

10、根据权利要求 9所述的装置,其特征在于,所述门限还包括第三门限, 第三门限高于第二门限;

所述控制模块还用于,当视频质量评价参数高于第二门限但低于第三门限 时, 缩短视频质量监控周期长度; 当视频质量评价参数高于第三门限时, 延长 视频质量监控周期长度。

11、 根据权利要求 8所述的装置, 其特征在于, 该装置还包括:

神经网络训练模块, 用于分别提取各训练用视频序列的特征参数, 并获取 相应训练用视频序列的视频质量评价参数;将各训练用视频序列的特征参数以 及相应训练用视频序列的视频质量评价参数输入神经网络,并以训练用视频序 列的特征参数作为输入参数时,期望的输出结果为该训练用视频序列的视频质 量评价参数为目标, 对神经网络进行训练。

Description:
一种数字视频质量控制方法及其装置

本申请要求于 2012 年 3 月 28 日提交中国专利局、 申请号为 201210088123.6、 发明名称为 "一种数字视频质量控制方法及其装置" 的中国 专利申请的优先权, 其全部内容通过引用结合在本申请中。

技术领域

本发明涉及通信领域的数字视频技术,尤其涉 及一种数字视频质量控制方 法及其装置。

背景技术

近年来数字视频技术得到了蓬勃的发展。已经 形成标准的 H.264、 MPEG-2 (其中 MPEG为 Moving Pictures Experts Group/Motion Pictures Experts Group 的英文筒称, 中文译名是动态图像专家组)、 MPEG-4、 JPEG2000 、 音视频编 码标准(AVS, Audio Video coding Standard )等压缩编解码标准, 在保持较好 图像质量的前提下可以达到很高的压缩比。但 在高压缩比情况下,都会引入不 同程度的图像质量损伤。

目前视频质量的测量方法包括主观测量。主观 测量是直接利用观察者对被 测编解码系统质量的直接反映来确定系统的测 量方法。主观评价方法需要大量 人员参与到视频质量的监控当中,并且由于人 眼识别视频质量的方法带有主观 性, 对于相同视频的相同损伤会给出较大差异的结 论, 准确性及实用性较差。 主观测量方法耗时长、 费用高、 稳定性和可移植性差, 不适合实时的视频质量 的测量。

由于目前不具备及时有效的数字视频质量控制 方案,造成广播或流媒体数 字视频播放质量大面积恶化时, 无法及时进行视频质量控制, 进而影响数字视 频业务的使用。

发明内容

本发明实施例提供了一种数字视频质量控制方 法及其装置,用以实现对数 字视频质量进行客观评价, 进而提高数字视频质量控制的有效性。

本发明实施例提供的数字视频质量控制方法, 包括:

按照视频质量监控周期, 提取视频编码器编码后的视频数据的特征参数 ; 将提取到的视频数据的特征参数输入神经网络 ,得到作为输出结果的视频 质量评价参数;

判断视频质量评价参数是否满足预置条件, 若是, 则指示视频编码器调整 视频数据的特征参数以提高视频质量。

本发明实施例提供的数字视频质量控制装置, 包括:

监控模块, 用于按照视频质量监控周期,提取视频编码器 编码后的视频数 据的特征参数;

质量评价模块, 用于将提取到的视频数据的特征参数输入神经 网络, 并得 到所述视频数据的视频质量评价参数; 其中, 所述神经网络根据输入的视频数 据特征参数, 输出所述视频数据的视频质量评价参数;

控制模块, 用于判断视频质量评价参数是否满足预置条件 , 若是, 则指示 视频编码器调整视频数据的特征参数以提高视 频质量。

本发明的上述实施例, 一方面, 通过神经网络进行视频质量评价, 从而与 主观视频质量评价相比,提高了视频评价效率 以及降低了主观因素的影响; 另 一方面,本发明实施例涵盖数字视频质量监控 、反馈监控结构到业务前端设备, 并最终调整编码参数,从而实现了动态优化视 频质量, 为视频业务质量提供了 有效保证。

附图说明

图 1为本发明实施例提供的神经网络训练流程示 图;

图 2为本发明实施例中帧内、 非帧内量化矩阵示意图;

图 3为本发明实施例提供的视频质量控制流程示 图;

图 4为本发明实施例提供的视频质量控制装置示 图。

具体实施方式

目前虽然已经有客观评价视频质量的方案,但 现有客观评价视频质量的方 案使用于高分辨率视频, 而不适用于低分辨率视频 (如手机电视视频)格式。 现在的数字视频主观、 客观评价方法, 大部分针对标清视频 (SD: 720 540 分辨率)或高清视频 (HD: 1920 X 1080 分辨率); 而目前主流手机电视视频 压缩编码多采用 H.264及 AVS标准, 压缩后为 QVGA格式, 分辨率仅为 320 x 240 , 并且绝大部分视频评价方法无法做到实时, 实现的过程费时间长、 复 杂度高, 并且无法做到对于手机视频质量的即时监控。

另外, 手机电视压缩视频损伤类型, 与普通高、 标清数字视频损伤类型不 同。 在基于离散余弦变换(DCT, Discrete Cosine Transform )的压缩编码系统 中, 采用的 DCT变量都 ^^于块的, 即首先将图像分成 8 x 8的像素块, 然后 对每块进行 DCT变换得到 64个 DCT系数, 这样虽然大大减少了运算量, 但 是在 DCT算法过程中, 量化过程是有损的, 因此可能带来多种图像质量损伤: 块效应、 图像模糊、 噪声、 色度失真、 振铃等等。 以上图像损伤类型在高、 标 清数字压缩视频中普遍存在。 而目前现有的主、客观视频质量评价方法均致 力 于识别以上几种损伤, 而对于手机电视视频格式分辨率, 由于分辨率过低, 因 此主观质量评价中人眼很难识别这几种图像损 伤类型, 所以,有必要提出一种 筒单易行, 而又具备良好效果的手机电视视频分析技术。

针对低分辨率视频,本发明实施例提出了一种 视频质量评价方案以及基于 该方案提供的一种视频质量控制方案。本发明 实施例在考虑低码率视频编码特 征的同时, 考虑到人眼视觉特征, 快速检验分析数字视频特征, 使数字视频的 评价结果准确度明显优于现有数字视频评价方 案。

本发明实施例的视频质量客观评价方案, 是基于神经网络的方案。 即, 通 过训练方式得到合理的用于评价视频质量的神 经网络,在进行数字视频质量控 制过程中, 实时提取数字视频的特征值, 将其作为输入参数输入神经网络, 输 出结果即为该数字视频的质量评价参数,从而 实现对数字视频快速和有效的评 价, 并进一步根据视频质量评价结果采取相应的控 制措施以保证视频质量。

人工神经网络( ANN, Artificial Neural Network )是一种旨在模仿人脑结 构及其功能的信息处理系统,实质是一个由大 量筒单的处理单元组成的高度复 杂的大规模非线性自适应系统, 其功能取决于网络的结构、连接强度以及各单 元的处理方式。

神经网络具有以下几个特点,信息处理是在大 量筒单的处理单元(称为细 胞元)之间进行的, 通过它们之间的连接传送细胞元之间的信号, 各连接具有 一个相应的加权, 其值通常与输入信号相乘, 各细胞元利用 "激励函数" ( Activation function )来处理加权的输入信号之和, 以产生它的输出信号。 神经网络在实现方式上采用并行处理, 即对样本数据进行多目标学习,通 过细胞元的相互作用实现控制。神经网络适用 于非精确处理, 可模拟并行处理 多大规模数据。

神经网络通过样本训练得到数据处理模型,本 发明实施例中的神经网络是 指视频质量评价模型。为了进行神经网络训练 ,本发明实施例预先建立样本库, 其中包含大量编码后的视频序列以及对应的视 频质量评价参数,这些视频质量 评价参数是通过对视频序列进行主观评价得到 的。具体实施时,在建立样本库 的过程中, 首先对各个作为视频素材的视频序列进行主观 评价,将主观评价的 结果存入样本库中, 并建立与相应视频序列的对应关系。 进一步的, 还可以对 主观评价所使用的视频序列进行特征参数提取 ,并将提取的特征参数对应于相 应视频序列存入样本库中。在神经网络训练的 时候, 这些特征参数将作为神经 网络的输入, 也就是说, 神经网络的输入层上将有相应多个节点, 以同一视频 序列的主观评价结果作为对应的期望输出, 使用学习算法对神经网络进行训 练。对神经网络进行训练的目标是使视频质量 的客观评价结果逼近主观评价结 果。

参见图 1 , 为本发明实施例提供的一种神经网络训练流程 示意图, 如图所 示, 该流程可包括:

步骤 101 , 从样本库中提取视频序列的特征参数;

步骤 102, 将提取到的视频序列特征参数输入神经网络;

步骤 103 , 从样本库中选择相应视频序列 (该视频序列即为步骤 101中的 视频序列), 并对其视频质量进行主观评价估测以得到视频 质量评价参数(视 频质量评价参数也可以事先估测出来并记录在 样本库中,此种情况下可直接从 样本库中得到该视频序列的视频质量评价参数 );

步骤 104, 将所述视频序列的视频质量评价参数传输至神 经网络; 步骤 105 , 神经网络根据步骤 102中获取到的视频序列特征参数, 以及步 骤 104中获取到的视频质量评价参数,通过计算获 得视频质量评价参数与其特 征参数的关系, 从而实现对神经网络的训练。 本发明实施例可根据需要, 定时或不定时的对神经网络进行训练。

本发明实施例中, 在进行神经网络训练时, 提取何种特征参数, 主要出于 以下考虑: 在压缩比率比较高的数字视频中, 块效应是最主要的视频损伤。 因 为人眼对于块效应非常敏感, 而且运动图像很容易产生块效应。

在图像域内, 块效应的出现主要是由分块量化后的量化误差 所引起的, 随 着图像内容的不同, "块效应" 有着不同的表现, 区分不同类型的块效应并相 应地用不同的方法进行处理十分重要。

( 1 )梯形噪声: 出现在图像的强边缘处, 在低码率情况下, DCT的 ^艮多 高阶系数被量化为零,结果与强边缘有关的高 频分量在变换域内不能被完全体 现, 又因为每个块被分别处理, 不能保证穿过块边界的强边缘的连续性, 导致 在图像边缘处出现锯齿状噪声, 这种噪声称为 "梯形噪声"。

( 2 )格形噪声: 多出现在图像的平坦区域, 在变换域内 DC分量体现了 该块的平均亮度, 而这个分量包含了该块的大部分能量, 所以在平坦区域亮度 的变化很小。 但是, 如果在平坦区域有亮度的递增或递减, 可能会导致 DC分 量越过相邻量化级的判决门限,造成在重建图 像中块边界处出现亮度突变,表 现为在平坦区域内出现的片状轮廓效应, 这种噪声称为 "格形噪声"。

针对视频高压缩与高运动频率两种特性,本发 明实施例选取量化因子平均 值及 P帧平均运动矢量作为视频序列特征参数,它 能够 4艮好的反应数字视频 压缩质量。

( 1 )量化因子平均值

数字视频压缩的量化策略是一种比较成熟的量 化技术,考虑了人类视觉的 特点, 它的量化分两步完成: 首先采用视觉量化矩阵处理系数, 然后采用量化 因子对系数进行二次处理。 首先, 利用视觉量化矩阵, 如图 2 所示, 来处理 DCT 系数, 目的是根据人类视觉对高频数据不敏感的特性 , 对视觉量化矩阵 中的高频位置选择较大的参数值, 以消除视觉上的冗余。

用 X表示待量化的系数, 表示一次量化的结果, 量化处理可以表示为: y i = 32x/Q[i, j] [1] 其中, Q[i,j]表示视觉量化矩阵中 i行 j列的值。 然后, 再利用量化因子 。 (通过位率控制算法获得)进行二次量化来控 制输出位率, 最终量化的结果 y由下式 2得到:

y = {y! + sign(x)(pK q II q) )l{2K q ) [2] 其中, 表示取符号, p和 q为修正参数。 结合式 1和式 2, 可以进 行如等价变换:

y = 32 /(2(2[ , j]K q ) = {2 n+4 x/(Q[i, j]K q ))» n [3] 其中, ">>" 为位右移运算符, n表示移位的位数。 于是, 对一个确定的 量化因子 。可以构造一个新的移位量化矩阵:

!¾ =2" +4 職^) [4] 由于视觉量化矩阵是不变的,所以量化因子即 成为影响高频系数的主要因 素。 如之前所述, 块效应、 图像模糊、 蚊子噪声等压缩图像的损伤, 均源自量 化过程中采用可变量化步长, 引起高频系数的丟失。所以在数字压缩视频流 中 提取出所有宏块条的量化因子, 并求得平均值, 如下式 5:

average— of— quantister _ scale = total— of— Q— S/Q— Snum [5] 其中, total— of _Q_S = iuantiser _scale[f\,即量化因子之和, Q_Snum 为量化因子总数。 得到的 average _of— quantister— scale即为量化因子平均值。 一般意义上讲, 视频的量化因子平均值越低, 表示在量化过程中损失的 DCT 高频系数越少, 相应的其压缩视频质量也越好。

(2) P帧平均运动矢量

"运动矢量"反映了当前图像相对于参考图像的 动程度, 块匹配方法是 运动估计中最常用的方法。

首先, 定义给定 P帧的 "空间活性矩阵,, C mv 为 C mv = {v(, } , 其中如 式 6所示:

ν(ϊ, ) =」ν χ 2 , ϋ + ϋ [6] 其中, (Vxi,j ,Vyi,j)代表了帧内位置为 (i,j)宏块的运动矢量的大小。 当 宏块为帧内编码时, v(i,j)=0。

接下来, 一个有 M X N个宏块的 P帧的平均运动矢量大小被定义为:

这样可得到 C: g 。 但在这里存在一个问题, 即, 计算的是一帧内所有宏 块的平均运动矢量的大小, 这样如果帧内的运动是局部运动的话, 那么通过计 算局部运动会分散到整个帧内。例如镜头中部 分运动比较剧烈, 而背景是静止 的, 通过计算, 变成了整帧运动緩慢了, 大的局部运动矢量变成了小的全局运 动矢量,这样显然和实际感觉不符。并且 P帧运动矢量值会普遍偏小且没区分 度,会产生较大的误差。因此本发明实施例做 以下修改:只统计有效的宏块数, 也就是说, 只统计真正有运动矢量产生的宏块数, 而运动矢量为 0的宏块则不 被记入其中。 这样则可以避免上面提到的问题, 提高计算的准确性。

由于运动估计中采用了块匹配的方法, 运动估值的最小单位为宏块( 16 x l6像素), 所以在压缩编码过程中很容易造成图像宏块间 相关性降低。 特别 是高频细节较为丰富的视频序列, 若图像同时存在快速运动, 则很容易出现块 效应损伤。 所以, P帧平均运动矢量也是反映压缩视频损伤程度 重要参数。

当神经网络训练好了以后,对编码后的视频序 列采用同样方式提取特征参 数, 然后将这些特征参数输入到神经网络的输入层 ,在神经网络的输出节点上 即可得到该视频序列的客观评价结果。

参见图 3 , 为本发明实施例提供的基于神经网络实现的视 频质量控制流程 示意图, 如图所示, 该流程可包括:

步骤 301 , 按照视频质量监控周期, 提取视频编码器编码后的视频序列的 特征参数。

具体实现时, 视频质量监控周期的长度可根据需要预先设定 , 比如, 当对 视频质量要求高时, 可将视频质量监控周期的长度设置得短一些, 如 1分钟, 当对视频质量要求不高,且不希望视频质量控 制操作占用太多资源开销时, 可 将视频质量监控周期的长度设置得长一些。 此处所提取的特征参数, 与进行神 经网络训练时所提取的特征参数相同,包括量 化因子平均值以及 P帧平均运动 矢量。

步骤 302, 将提取到的视频序列特征参数输入神经网络, 得到作为输出结 果的视频质量评价参数。

步骤 303 , 判断视频质量评价参数是否低于门限, 并在低于门限时指示视 频编码器调整视频数据的特征参数以提高视频 质量。

本实施例中,视频质量评价参数值可以与视频 质量成正比, 即视频质量评 价参数值越大,表明视频质量越高, 或者视频质量评价参数值也可以与视频质 量成反比, 即视频质量评价参数值越小, 表明视频质量越高。

此处仅以视频质量评价参数值与视频质量成正 比为例进行说明。

具体实施时,神经网络的输出结果通常为视频 质量评分, 比如按照视频质 量从低到高, 其分值范围为 1~100。 为了技术实现方便, 可将视频质量评分量 化为若干个视频质量等级,并针对每个视频质 量等级制定相应的视频质量控制 策略。 本发明实施例优选的, 通过设置的门限值 40、 60、 80, 将视频质量评 分的分值范围 [1,100]划分为 4个等级, 其中 0-40分为 1级, 表示视频质量极 差; 41-60为 2级, 表示视频质量差; 61-80分为 3级, 表示视频质量良好; 81-100分为 4级,表示视频质量优秀。 由于人眼对于视频质量的评价具有不均 勾性, 所以视频质量等级划分也非均勾。 以上门限值的取值仅为优选实例, 本 发明并不对此进行限制。

对应上述 4个视频质量等级, 可采用如下对应的控制策略:

A、 当视频质量评价值低于 40分, 即视频质量为 1级时, 可向视频编码 器报警, 将当前视频的量化因子平均值及 P 帧平均运动矢量同步给视频编码 器, 并指示视频编码器调整相应编码参数以提升视 频质量, 具体的, 可指示视 频编码器降低压缩编码过程中的视频的量化因 子平均值,并降低 P帧平均运动 矢量。 此种情况下, 视频编码器判断当前播放的视频发生重大质量 问题, 可立 刻暂停当前数字视频的播放, 并可根据指示调整相应编码参数以提升视频质 量。

B、 当视频质量评价值为 41-60分, 即视频质量为 2级时, 可向视频编码 器报警, 将当前视频的量化因子平均值及 P 帧平均运动矢量同步给视频编码 器, 并指示视频编码器调整相应编码参数以提升视 频质量, 具体的, 可指示视 频编码器降低 P帧平均运动矢量值。此种情况下,视频编码 判断当前播放的 视频存在较大质量问题, 无需停止当前数字视频的播放, 并可根据指示调整相 应编码参数, 以提升视频质量。

C、 当视频质量评价值为 61-80分, 即视频质量为 3级时, 当前视频播出 情况良好, 因此无需向视频编码器报警, 但存在质量劣化风险, 因此可缩短视 频质量监控周期长度, 以高频率密切监控现网播放的数字视频质量等 级。

D、 当视频质量评价值为 61-80分, 即视频质量为 4级时, 当前视频播出 情况优秀, 无需向视频编码器报警, 可延长视频质量监控周期长度。

当然, 也可以仅设置门限值 60, 这样, 当视频质量评价参数低于 60时, 向视频编码器报警,将当前视频的量化因子平 均值及 P帧平均运动矢量同步给 视频编码器, 指示视频编码器降低量化因子平均值或 /和 P帧平均运动矢量。 还可以仅设门限 40和 60,当视频质量评价参数低于 40,以及在 40-60之间时, 具体控制方式如前所述。

本发明实施例的上述方案可在移动终端设备上 实现,可应用于手机电视业 务, 通过上述方式实现对手机电视视频质量的监控 和反馈。 具体的, 当移动终 端进行手机电视业务时, 可将网络侧发送的视频序列进行緩存, 一方面按照现 有方式解码并播放緩存的视频数据, 另一方面,按照视频质量监控周期提取当 前播放的视频序列的特征值并输入到神经网络 ,利用神经网络得到视频质量评 价结果,根据评价结果确定视频质量控制策略 , 并进一步将视频质量控制策略 反馈给网络侧, 以使网络侧的视频编码器根据移动终端的反馈 调整编码参数, 以保证视频质量。 其中, 移动终端上的神经网络即为视频质量评价模型 , 可从 网络侧将训练好的神经网络下载到移动终端上 ,以减少移动终端上训练神经网 络的开销。

本发明实施例的上述方案也可在网络侧的设备 上实现,以手机电视业务为 频质量监控周期提取视频序列的特征值并输入 到神经网络,利用神经网络得到 视频质量评价结果,根据评价结果确定视频质 量控制策略, 并进一步将视频质 量控制策略反馈给视频编码器, 以使视频编码器根据反馈调整编码参数, 以保 证视频质量。 基于相同的技术构思, 本发明实施例还提供了一种视频质量控制装置 , 该 视频质量控制装置可在终端设备上实现,也可 在网络侧设备上实现,还可以为 独立设置的装置。

参见图 4, 为本发明实施例提供的视频质量控制装置的结 构示意图。 如图 所示, 该视频质量控制装置可包括监控模块 401、 质量评价模块 402和控制模 块 403 , 其中:

监控模块 401 , 用于按照视频质量监控周期, 提取视频编码器编码后的视 频数据的特征参数; 具体的,特征参数包括量化因子平均值和 P帧平均运动矢 量, 其具体含义同前所述;

质量评价模块 402, 用于将提取到的视频数据的特征参数输入神经 网络, 并得到所述视频数据的视频质量评价参数; 其中, 所述神经网络根据输入的视 频数据特征参数, 输出所述视频数据的视频质量评价参数;

控制模块 403 , 用于判断视频质量评价参数是否低于门限, 并在低于门限 时指示视频编码器调整视频数据的特征参数以 提高视频质量。

具体的, 所述门限包括第一门限(如 40 )和第二门限(如 60 ), 其中第一 门限低于第二门限。 相应的, 控制模块 403具体用于: 当视频质量评价参数低 于第一门限时,将当前视频数据的量化因子平 均值和 P帧平均运动矢量同步给 视频编码器,并指示视频编码器降低视频的量 化因子平均值以及降低 P帧平均 运动矢量; 当视频质量评价参数高于第一门限但低于第二 门限时,将当前视频 数据的 P 帧平均运动矢量同步给数字视频编码器, 并指示视频编码器降低 P 帧平均运动矢量。

进一步的, 所述门限还包括第三门限(如 80 ), 其中第三门限高于第二门 限。 相应的, 控制模块还用于: 当视频质量评价参数高于第二门限但低于第三 门限时, 缩短视频质量监控周期长度; 当视频质量评价参数高于第三门限时, 延长视频质量监控周期长度。

进一步的, 该装置还可包括神经网络训练模块 404, 用于分别提取各训练 用视频序列的特征参数, 并获取相应训练用视频序列的视频质量评价参 数; 将 各训练用视频序列的特征参数以及相应训练用 视频序列的视频质量评价参数 输入神经网络, 并以训练用视频序列的特征参数作为输入参数 时, 期望的输出 结果为该训练用视频序列的视频质量评价参数 为目标, 对神经网络进行训练。

在本发明的另一实施例所提供的视频质量控制 装置中,可以不包含神经网 络训练模块 404,训练好的神经网络可通过下载方式下载到 装置中,相应的, 该装置中提供有相应接口模块, 以进行神经网络的下载。

通过以上描述可以看出, 本发明实施例一方面,通过神经网络进行视频 质 量评价,从而与主观视频质量评价相比,提高 了视频评价效率以及降低了主观 因素的影响; 另一方面, 针对低分辨率视频的特点, 基于视频数据的量化因子 平均值和 P帧平均运动矢量进行神经网络训练和视频质 评价,从而使本发明 实施例适用于小屏幕的数字视频质量分析和控 制,如手机电视、手机视频业务; 再一方面, 本发明实施例涵盖数字视频质量监控、将结果 及时反馈回业务前端 设备, 并最终调整编码参数, 动态优化视频质量, 为视频业务质量提供了有效 保证。

本领域技术人员可以理解实施例中的装置中的 模块可以按照实施例描述 进行分布于实施例的装置中,也可以进行相应 变化位于不同于本实施例的一个 或多个装置中。上述实施例的模块可以合并为 一个模块,也可以进一步拆分成 多个子模块。

通过以上的实施方式的描述,本领域的技术人 员可以清楚地了解到本发明 可借助软件加必需的通用硬件平台的方式来实 现, 当然也可以通过硬件,但很 多情况下前者是更佳的实施方式。基于这样的 理解, 本发明的技术方案本质上 或者说对现有技术做出贡献的部分可以以软件 产品的形式体现出来,该计算机 软件产品存储在一个存储介质中, 包括若干指令用以使得一台终端设备(可以 是手机, 个人计算机, 服务器, 或者网络设备等)执行本发明各个实施例所述 的方法。

以上所述仅是本发明的优选实施方式,应当指 出,对于本技术领域的普通 技术人员来说, 在不脱离本发明原理的前提下, 还可以做出若干改进和润饰, 这些改进和润饰也应视本发明的保护范围。