CN107657228A

CN107657228A - 视频场景相似性分析方法及系统、视频编解码方法及系统

Info

Publication number: CN107657228A
Application number: CN201710873784.2A
Authority: CN
Inventors: 叶龙; 彭剑民; 林秀桃; 钟微; 张勤
Original assignee: Communication University of China
Current assignee: Communication University of China
Priority date: 2017-09-25
Filing date: 2017-09-25
Publication date: 2018-02-02
Anticipated expiration: 2037-09-25
Also published as: CN107657228B

Abstract

本发明提供视频场景相似性分析方法及系统、视频编解码方法及系统，分析方法包括：从视频每一个镜头中分别选取一帧图像作为关键帧；提取每一个关键帧的特征向量，构建相似度矩阵；根据相似度矩阵，以吸引度和归属度的和作为线性核对各关键帧进行聚类，设定各关键帧的聚类标签。视频编解码方法包括上述视频场景相似性分析方法；将聚为一类的关键帧作为一个GOP压缩；将关键帧压缩后在编码端重建放在帧缓存区，其余GOP的B帧和P帧通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码；解码时，先解码所有关键帧，再根据聚类标签解码B帧和P帧。上述方法及系统能够挖掘非连续帧以及非连续GOP之间的相关性。

Description

视频场景相似性分析方法及系统、视频编解码方法及系统

技术领域

本发明涉及视频处理技术领域，更为具体地，涉及一种视频场景相似性分析方法、视频编解码方法、视频场景相似性分析系统及视频编解码系统。

背景技术

伴随着近几年互联网产业飞速发展，各种多媒体内容的载体，像数字图像视频及音频等也伴随着呈现出爆炸式的增长，因此如果图像视频数据不进行去冗余压缩的话，带宽和存储必然要承受极大的压力。传统的冗余压缩方法都是对关键帧的帧内预测编码和连续帧的帧间预测编码，没有考虑非连续帧和非连续GOP(Group of Pictures，画面组)间的冗余。

在图像视频压缩编码研究领域里，目前主流的思路大都是基于“预测-变换-熵编码”来进行拓展和改进的。虽然发展应用很成功，但是压缩效率达到瓶颈。因此人们开始从图像视频内容的分析入手，与视频压缩技术相结合，突破传统图像视频的压缩技术瓶。

在2007年，Liu et al.提出了基于图像修复技术的图像编码方法，该方法的思想是划分图像，将图像划分为结构区域和纹理区域，利用的是图像边缘提取技术和纹理检测等分析工具。每一区域又划分为三类内容：必要内容，部分必要内容和冗余内容。必要的结构信息和纹理信息为必要内容，而需要参考必要内容来确定梯度变化是否较大则为部分必要内容；需要根据前两者还原的部分则为冗余部分。对于分出来的不同的内容区域，采用不同的编码方法，冗余则不用编码，这样可以大大提高编码效率。在该工作的基础上，Liu etal.将图像内容分析与传统压缩编码方法相结合，提出了基于边缘的帧内预测方法，利用图像边缘结构信息和拉普拉斯方程描述的图像局部连续性，使帧内预测的方向更加自适应，而且可以兼容现有的基于块的图像和视频编码标准。

传统的视频编码系统一般利用的是连续帧之间的相关性来去除时间冗余，即使采用多参考帧技术也只是搜索一个GOP内的帧进行参考，这样一来I帧(关键帧)的数量较大，且没有考虑I帧之间的相关性。

发明内容

鉴于上述问题，本发明的目的是提供一种挖掘非连续帧以及非连续GOP之间的相关性的视频场景相似性分析方法、视频编解码方法、视频场景相似性分析系统及视频编解码系统。

根据本发明的一个方面，提供一种视频场景相似性分析方法，包括：从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧；提取每一个关键帧的特征向量，根据特征向量度量各关键帧之间的相似度，构建相似度矩阵；根据相似度矩阵，以吸引度和归属度的和作为线性核对各关键帧进行聚类，设定各关键帧的聚类标签，所述聚类标签采用关键帧对应的聚类中心表征，所述吸引度表示从关键帧传送到其聚类中心的信息，所述归属度表示从聚类中心传送到关键帧的信息。

根据本发明的另一个方面，提供一种视频编解码方法，包括：上述视频场景相似性分析方法；将聚为一类的关键帧作为一个GOP压缩；将关键帧压缩后在编码端重建放在帧缓存区，其余GOP的B帧(双向差别帧)和P帧(与前一帧的差别帧)通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码；解码时，先解码所有关键帧，再根据聚类标签解码B帧和P帧。

根据本发明的第三个方面，提供一种视频场景相似性分析系统，包括：关键帧提取模块，从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧，将各关键帧发送到相似度矩阵构建模块；相似度矩阵构建模块，提取每一个关键帧的特征向量，根据特征向量度量各关键帧之间的相似度，构建相似度矩阵，将相似度矩阵发送到聚类模块；聚类模块，根据相似度矩阵，以吸引度和归属度的和作为线性核对各关键帧进行聚类，设定各关键帧的聚类标签，所述聚类标签采用关键帧对应的聚类中心表征，所述吸引度表示从关键帧传送到其聚类中心的信息，所述归属度表示从聚类中心传送到关键帧的信息。

根据本发明的第四个方面，提供一种视频编解码系统，包括：

上述视频场景相似性分析系统；压缩部，将聚为一类的关键帧作为一个GOP压缩；编码部，将关键帧压缩后在编码端重建放在帧缓存区，其余GOP的B帧和P帧通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码；解码部，先解码所有关键帧，再根据聚类标签解码B帧和P帧。

本发明所述视频场景相似性分析方法和视频场景相似性分析系统对I帧(关键帧)聚类，将聚为一类的I帧作为一个GOP进行压缩，减少了独立进行帧内预测的I帧的数量，从而进一步压缩I帧的数据量。

本发明所述视频编解码方法及视频编解码系统，利用视频场景的相似性，将每个GOP里占用码率最多的I帧进项聚类，挖掘非连续帧以及非连续GOP之间的相关性，与视频压缩技术相结合，大大提高视频压缩效率，将场景相似性分析技术应用到I帧的压缩能够在PSNR基本保持的情况下相比传统的编码能将压缩效率提高3％～4％。

附图说明

通过参考以下结合附图的说明及权利要求书的内容，并且随着对本发明的更全面理解，本发明的其它目的及结果将更加明白及易于理解。在附图中：

图1是本发明所述视频场景相似性分析方法的流程图；

图2是本发明所述构建相似度矩阵的流程图；

图3是本发明所述以吸引度和归属度的和作为线性核对各关键帧进行聚类的流程图；

图4是本发明所述各关键帧聚类压缩的示意图；

图5是本发明所述视频场景相似性分析系统的构成框图；

图6是本发明所述视频编解码系统的构成框图。

在所有附图中相同的标号指示相似或相应的特征或功能。

具体实施方式

在下面的描述中，出于说明的目的，为了提供对一个或多个实施例的全面理解，阐述了许多具体细节。然而，很明显，也可以在没有这些具体细节的情况下实现这些实施例。以下将结合附图对本发明的具体实施例进行详细描述。

以下将结合附图对本发明的具体实施例进行详细描述。

图1是本发明所述视频场景相似性分析方法的流程图，如图1所示，所述视频场景相似性分析方法包括：

步骤1，从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的I帧；

步骤2，提取每一个I帧的特征向量，根据特征向量度量各I帧之间的相似度，构建相似度矩阵；

步骤3，根据相似度矩阵，以吸引度和归属度的和作为线性核对各I帧进行聚类，设定各I帧的聚类标签，所述聚类标签采用I帧对应的聚类中心表征，所述吸引度表示从I帧传送到其聚类中心的信息，所述归属度表示从聚类中心传送到I帧的信息。

对于内容回归率比较高的视频，非连续帧以及非连续GOP之间的相关性依然非常大，上述视频场景相似性分析方法将每个GOP里占用码率最多的I帧进项聚类，挖掘非连续帧以及非连续GOP之间的相关性，减少了独立进行帧内预测的I帧的数量，从而进一步压缩I帧的数据量。

在本发明的一个优选实施例中，上述步骤1包括：检测镜头的边界，将两个相邻边界之间确定为一个镜头；选取各镜头中设定位置的一帧作为I帧，例如，将每设定数量的帧(15帧)确定为一个镜头，然后将所述每设定数量帧中的第一帧当做这个镜头的关键帧，又如，根据需求直接选取镜头里的第一帧、最后一帧或者内部的某一帧作为镜头的I帧。

在本发明的一个优选实施例中，如图2所示，上述步骤2包括：

步骤21，将关键帧的图像分块，形成同样尺寸的子块，得到所述子块的颜色的直方图，经过累计得到所述关键帧的累计直方图，直方图代表一幅图像上全部像素色度空间值的分布情况，它反映的是图像颜色空间的分布情况和基本色调，但直方图不包括位置特征，所以不同的图像可能计算得到同样的直方图特征，针对这一问题，本发明采用累积直方图的表示方法，即不是直接计算图像直方图，而是先对其进行预处理，把图像分块，变成同样尺寸的一些子块，再计算得出原图子块颜色的直方图，进而计算得出其累积直方图，累积直方图相与颜色直方图相比，是一种鲁棒性更高的方法；

步骤22，采用颜色空间提取每一个I帧的累计直方图的颜色特征向量，例如采用HSV颜色空间，对HSV值进行非均匀量化来减少计算量，色调H通常分为八个量化区域，饱和度S和亮度V都分为三个量化区域，依照其取值范围的差异，具体的量化过程如下：

本发明把色度H量化为8份，饱和度S量化为3份、亮度V量化为3份，就得到一个72维的特征向量；

步骤23，采用灰度共生矩阵提取每一个I帧的纹理特征向量，具体地：构建各关键帧的灰度共生矩阵；采用能量、惯性、相关性、熵、局部均匀性、最大概率中的一个或多个指标构建纹理特征向量；采用高斯归一化对上述纹理特征向量进行归一化；

步骤24，利用每一个I帧的所述颜色特征向量和纹理特征向量根据下式(1)构建相似度矩阵，

其中，m,n为两个I帧，s_m,n表示I帧m和I帧n的相似度，(x₁,x₂,...,x_d)为I帧m的特征向量，(y₁,y₂,...,y_d)为I帧n特征向量。

优选地，在步骤23中，构建(0,π/4,π/2,3π/4)4个方向上的共生矩阵，对其采用高斯归一化，取上述惯性、能量熵、相关性和熵4个参数的均值和标准差作为分量来描述纹理特征向量，得到一个8维的纹理特征向量。

另外，优选地，可以根据颜色纹理综合特征向量根据上述公式(1)构建相似度矩阵，例如(x₁,x₂,...,x_d)为I帧m的特征向量中(x₁,x₂,...,x_j)为颜色特征向量，(x_j+1,x_j+2,...,x_d)为纹理特征向量，则颜色纹理综合特征向量为(αx₁,αx₂,...,αx_j,βx_j+1,...,βx_d)，α和β为特征系数，α+β＝1。

在本发明的一个优选实施例中，如图3所示，上述步骤3包括：

步骤31，对相似度矩阵进行初始化，将相似度矩阵中各相似度的平均值(参考度P)作为各I帧的自相似度，设定归属度矩阵和吸引度矩阵中各I帧之间的初始归属度和初始吸引度均为0，

其中，S为相似度矩阵，将相似度矩阵S中的各相似度求平均值作为s_1,1,s_2,2,…,s_m,m的值；A为归属度矩阵，a_m,n表示I帧m对I帧n的归属度；R为吸引度矩阵，r_m，n表示I帧n对I帧m的吸引度；

步骤32，根据相似度矩阵采用下式(2)吸引度矩阵进行更新，

其中，r′_m,n为初始归属度和初始吸引度均为0采用相似度矩阵更新后的关键帧n对关键帧m的吸引度；

步骤33，根据更新后的吸引度矩阵对归属度矩阵根据下式(3)和(4)进行更新，

其中，a′_m,n和a′_m,m分别为根据更新后的吸引度矩阵进行更新的关键帧n对关键帧m的归属度和关键帧m自相关归属度；

步骤34，设定阻尼因子λ(例如，0.5)和迭代次数T，利用下式(5)和(6)对上述吸引度矩阵和归属度矩阵进行迭代更新，

其中，为经过T次迭代更新后的关键帧n对关键帧m的吸引度，为经过T次迭代更新后的关键帧n对关键帧m的归属度；

步骤35，经过上述迭代更新后，滤除自相关归属度和自相关吸引度的和不大于0的I帧，即判断各关键帧的自相关归属度和自相关吸引度是否符合下式(7)，滤除不符合下式(7)的关键帧，其中，

步骤36，将符合自相关归属度和自相关吸引度大于0的条件的I帧与其他I帧的归属度和吸引度的和的最大值对应的另一个I帧作为该I帧的聚类中心，从而获得符合条件的每一个I帧的聚类中心，从而获得符合条件的每一个I帧的聚类中心，将属于同一聚类中心的I帧聚为一类。

上述根据相似度矩阵，以吸引度和归属度的和作为线性核对各关键帧进行聚类的方法，首先克服了传统聚类算法在进行初始值的选取时比较敏感的缺点，将所有数据都作为候选聚类中心，每个数据都要通过相互之间传递的消息来不停的计算迭代更新，最终确定竞争成为聚类中心或者是成为其他聚类中心的所属数据，最后等迭代结束后得到若干个高质量的聚类中心。

另外，上述聚类方法“消息传递机制”进行的是吸引度(Responsibility)和归属度(Availability)这两种信息在数据点和候选聚类中心之间的传递，吸引度表示的是从数据传送到候选聚类中心k的信息，归属度表示的是从候选聚类中心k传送到数据点i的信息；吸引度体现了k点成为数据点i聚类中心的适当程度，而归属度体现了i点把k点作为它的聚类中心的适当程度；和越大，表示数据点i把k点作为自己的聚类中心的概率越大，k点成为聚类中心的概率就越大。

再者，与吸引度和归属度对应的还有一个参考度(Reference)，参考度并不是用来传递的信息，而是一个评判标准。即用相似度矩阵S对角线上的值s_k,k来评判k点可否成为聚类中心，s_k,k越大，k点成为聚类中心的概率就越大，在聚类的初始化过程中，任何数据点i不属于任何一个类，任何数据k也都不是聚类中心，所以将矩阵S的均值赋给所有数据点的参考度P。

可以将上述视频场景相似性分析方法应用到视频编解码方法中，所述视频编解码方法除了包括上述视频分析方法外，还包括：

将聚为一类的I帧作为一个GOP压缩，如图4所示，F01-F20的I帧分别具有各自的聚类中心，聚类中心可以采用一个代号表示，如S1-S4，将聚为一类的I帧作为一个GOP压缩，分别压缩为GOP1-GOP4；

将I帧压缩后在编码端重建放在帧缓存区，其余GOP的B帧和P帧通过各自的I帧索引找到帧缓存区对应的I帧进行帧间预测编码；

解码时，先解码所有I帧，再根据聚类标签解码B帧和P帧。

图5是本发明所述视频场景相似性分析系统的构成框图，如图5所示，所述视频场景相似性分析系统100，包括：

关键帧帧提取模块110，从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的I帧，将各I帧发送到相似度矩阵构建模块120；

相似度矩阵构建模块120，提取每一个I帧的特征向量，根据特征向量度量各I帧之间的相似度，构建相似度矩阵，将相似度矩阵发送到聚类模块130；

聚类模块130，根据相似度矩阵，以吸引度和归属度的和作为线性核对各I帧进行聚类，设定各I帧的聚类标签，所述聚类标签采用I帧对应的聚类中心表征，所述吸引度表示从I帧传送到其聚类中心的信息，所述归属度表示从聚类中心传送到I帧的信息。

在本发明的一个优选实施例中，上述关键帧提取模块11包括：

镜头确定单元111，检测镜头的边界，将两个相邻边界之间确定为一个镜头；

关键帧帧提取单元112，选取各镜头中设定位置的一帧作为I帧。

在本发明的一个优选实施例中，上述相似度矩阵构建模120块包括：

累计直方图构建单元121，将I帧的图像分块，形成同样尺寸的子块，得到所述子块的颜色的直方图，经过累计得到所述I帧的累计直方图，将所述累计直方图发送给颜色特征向量提取单元122；

颜色特征向量提取单元122，采用颜色空间提取每一个I帧的累计直方图的颜色特征向量，将各I帧的颜色特征向量发送给相似度矩阵构建单元124；

纹理特征向量提取单元123，采用灰度共生矩阵提取每一个I帧的纹理特征向量，将各I帧的纹理特征向量发送给相似度矩阵构建单元124；

相似度矩阵构建单元124，利用每一个I帧的所述颜色特征向量和纹理特征向量根据下式(1)构建相似度矩阵，

其中，m,n为两个I帧，s_m,n表示I帧m和I帧n的相似度，(x₁,x₂,…,x_d)为I帧m的特征向量，(y₁,y₂,…,y_d)为I帧n特征向量。

在本发明的一个优选实施例中，上述聚类模块130包括：

初始化单元131，对相似度矩阵进行初始化，将相似度矩阵中各相似度的平均值作为各I帧的自相似度，将初始化后的相似度矩阵发送给第一更新单元133，其中，

其中，S为相似度矩阵，将相似度矩阵S中的各相似度求平均值P作为s_1,1,s_2,2,…,s_m,m的值；

设定单元132，设定归属度矩阵和吸引度矩阵中各I帧之间的初始归属度和初始吸引度均为0，发送给第一更新单元133，设定阻尼因子λ和迭代次数T，送给第二更新单元134，其中，

其中，A为归属度矩阵，a_m,n表示I帧m对I帧n的归属度；R为吸引度矩阵，r_m,n表示I帧n对I帧m的吸引度；

第一更新单元133，根据相似度矩阵采用下式(2)吸引度矩阵进行更新，根据更新后的吸引度矩阵对归属度矩阵根据下式(3)和(4)进行更新，将更新后的吸引度矩阵和归属度矩阵发送为第二更新单元134，

其中，r′_m,n为初始归属度和初始吸引度均为0采用相似度矩阵更新后的关键帧n对关键帧m的吸引度，a′_m,n和a′_m,m分别为根据更新后的吸引度矩阵进行更新的关键帧n对关键帧m的归属度和关键帧m自相关归属度；

第二更新单元134，利用下式(5)和(6)对第一更新单元更新后的吸引度矩阵和归属度矩阵进行迭代更新，将经过T次迭代的吸引度矩阵和归属度矩阵发送给筛选单元135，其中，

筛选单元135，滤除自相关归属度和自相关吸引度的和不大于0的I帧，将滤除不符合上述条件的I帧对应的向量的吸引度矩阵和归属度矩阵发送到聚类单元136；

聚类单元136，将经过筛选单元滤除后的吸引度矩阵和归属度矩阵中的I帧与其他I帧的归属度和吸引度的和的最大值对应的另一个I帧作为该I帧的聚类中心，从而获得符合条件的每一个I帧的聚类中心，将属于同一聚类中心的I帧聚为一类。

上述视频场景相似性分析系统可以应用到视频编解码系统，如图6所示，所述视频编解码系统1000除了包括上述视频场景相似性分析系统100外，还包括：

压缩部200，将聚为一类的I帧作为一个GOP压缩；

编码部300，将I帧压缩后在编码端重建放在帧缓存区，其余GOP的B帧和P帧通过各自的I帧索引找到帧缓存区对应的I帧进行帧间预测编码；

解码部400，先解码所有I帧，再根据聚类标签解码B帧和P帧。

综上所述，参照附图以示例的方式描述了根据本发明提出的视频场景相似性分析方法、视频编解码方法、视频场景相似性分析系统及视频编解码系统。但是，本领域技术人员应当理解，对于上述本发明所提出的系统及方法，还可以在不脱离本发明内容的基础上做出各种改进。因此，本发明的保护范围应当由所附的权利要求书的内容确定。

Claims

1.一种视频场景相似性分析方法，其特征在于，包括：

从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧；

提取每一个关键帧的特征向量，根据特征向量度量各关键帧之间的相似度，构建相似度矩阵；

根据相似度矩阵，以吸引度和归属度的和作为线性核对各关键帧进行聚类，设定各关键帧的聚类标签，所述聚类标签采用关键帧对应的聚类中心表征，所述吸引度表示从关键帧传送到其聚类中心的信息，所述归属度表示从聚类中心传送到关键帧的信息。

2.根据权利要求1所述的视频场景相似性分析方法，其特征在于，所述构建相似度矩阵的方法包括：

将关键帧的图像分块，形成同样尺寸的子块，得到所述子块的颜色的直方图，经过累计得到所述关键帧的累计直方图；

采用颜色空间提取每一个关键帧的累计直方图的颜色特征向量；

采用灰度共生矩阵提取每一个关键帧的纹理特征向量；

利用每一个关键帧的所述颜色特征向量和纹理特征向量根据下式(1)构建相似度矩阵，

<mrow> <msub> <mi>s</mi> <mrow> <mi>m</mi> <mo>,</mo> <mi>n</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <msub> <mi>x</mi> <mi>i</mi> </msub> <msub> <mi>y</mi> <mi>i</mi> </msub> </mrow> <msqrt> <mrow> <mo>(</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <msub> <msup> <mi>x</mi> <mn>2</mn> </msup> <mi>i</mi> </msub> <mo>)</mo> <mo>(</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <msub> <msup> <mi>y</mi> <mn>2</mn> </msup> <mi>i</mi> </msub> <mo>)</mo> </mrow> </msqrt> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

其中，m,n为两个关键帧，s_m,n表示关键帧m和关键帧n的相似度，(x₁,x₂,...,x_d)为关键帧m的特征向量，(y₁,y₂,...,y_d)为关键帧n特征向量。

3.根据权利要求1所述的视频场景相似性分析方法，其特征在于，所述从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧的方法包括：

检测镜头的边界，将两个相邻边界之间确定为一个镜头；

选取各镜头中设定位置的一帧作为关键帧。

4.根据权利要求1所述的视频场景相似性分析方法，其特征在于，所述根据相似度矩阵，以吸引度和归属度的和作为线性核对各关键帧进行聚类，设定各关键帧的聚类标签的方法包括：

对相似度矩阵进行初始化，将相似度矩阵中各相似度的平均值作为各关键帧的自相似度，

设定归属度矩阵和吸引度矩阵中各关键帧之间的初始归属度和初始吸引度均为0，其中，

其中，A为归属度矩阵，a_m，n表示关键帧m对关键帧n的归属度；R为吸引度矩阵，r_m，n表示关键帧n对关键帧m的吸引度；

根据相似度矩阵采用下式(2)吸引度矩阵进行更新，

<mrow> <msubsup> <mi>r</mi> <mrow> <mi>m</mi> <mo>,</mo> <mi>n</mi> </mrow> <mo>&prime;</mo> </msubsup> <mo>=</mo> <msub> <mi>s</mi> <mrow> <mi>m</mi> <mo>,</mo> <mi>n</mi> </mrow> </msub> <mo>-</mo> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <mrow> <mi>t</mi> <mo>&NotEqual;</mo> <mi>n</mi> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mrow> <mi>m</mi> <mo>,</mo> <mi>t</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

根据更新后的吸引度矩阵对归属度矩阵根据下式(3)和(4)进行更新，

设定阻尼因子λ和迭代次数T，利用下式(5)和(6)对上述吸引度矩阵和归属度矩阵进行迭代更新，

<mrow> <msubsup> <mi>r</mi> <mrow> <mi>m</mi> <mo>,</mo> <mi>n</mi> </mrow> <mrow> <mo>&prime;</mo> <mi>T</mi> </mrow> </msubsup> <mo>=</mo> <mi>&lambda;</mi> <mo>&times;</mo> <mo>&lsqb;</mo> <msub> <mi>s</mi> <mrow> <mi>m</mi> <mo>,</mo> <mi>n</mi> </mrow> </msub> <mo>-</mo> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <mrow> <mi>t</mi> <mo>&NotEqual;</mo> <mi>n</mi> </mrow> </munder> <mrow> <mo>(</mo> <msubsup> <mi>a</mi> <mrow> <mi>m</mi> <mo>,</mo> <mi>t</mi> </mrow> <mrow> <mo>&prime;</mo> <mi>T</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>+</mo> <msub> <mi>s</mi> <mrow> <mi>m</mi> <mo>,</mo> <mi>t</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>&rsqb;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

经过上述迭代更新后，滤除自相关归属度和自相关吸引度的和不大于0的关键帧；

将符合自相关归属度和自相关吸引度大于0的条件的关键帧与其他关键帧的归属度和吸引度的和的最大值对应的另一个关键帧作为该关键帧的聚类中心，从而获得符合条件的每一个关键帧的聚类中心，将属于同一聚类中心的关键帧聚为一类。

5.一种视频编解码方法，其特征在于，包括：

权利要求1-4中任一权利要求所述的视频场景相似性分析方法；

将聚为一类的关键帧作为一个GOP压缩；

将关键帧压缩后在编码端重建放在帧缓存区，其余GOP的B帧和P帧通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码；

解码时，先解码所有关键帧，再根据聚类标签解码B帧和P帧。

6.一种视频场景相似性分析系统，其特征在于，包括：

关键帧提取模块，从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧，将各关键帧发送到相似度矩阵构建模块；

相似度矩阵构建模块，提取每一个关键帧的特征向量，根据特征向量度量各关键帧之间的相似度，构建相似度矩阵，将相似度矩阵发送到聚类模块；

聚类模块，根据相似度矩阵，以吸引度和归属度的和作为线性核对各关键帧进行聚类，设定各关键帧的聚类标签，所述聚类标签采用关键帧对应的聚类中心表征，所述吸引度表示从关键帧传送到其聚类中心的信息，所述归属度表示从聚类中心传送到关键帧的信息。

7.根据权利要求6所述的视频场景相似性分析系统，其特征在于，所述关键帧提取模块包括：

镜头确定单元，检测镜头的边界，将两个相邻边界之间确定为一个镜头；

关键帧提取单元，选取各镜头中设定位置的一帧作为关键帧。

8.根据权利要求6所述的视频场景相似性分析系统，其特征在于，所述相似度矩阵构建模块包括：

累计直方图构建单元，将关键帧的图像分块，形成同样尺寸的子块，得到所述子块的颜色的直方图，经过累计得到所述关键帧的累计直方图，将所述累计直方图发送给颜色特征向量提取单元；

颜色特征向量提取单元，采用颜色空间提取每一个关键帧的累计直方图的颜色特征向量，将各关键帧的颜色特征向量发送给相似度矩阵构建单元；

纹理特征向量提取单元，采用灰度共生矩阵提取每一个关键帧的纹理特征向量，将各关键帧的纹理特征向量发送给相似度矩阵构建单元；

相似度矩阵构建单元，利用每一个关键帧的所述颜色特征向量和纹理特征向量根据下式(1)构建相似度矩阵，

9.根据权利要求6所述的视频场景相似性分析系统，其特征在于，所述聚类模块包括：

初始化单元，对相似度矩阵进行初始化，将相似度矩阵中各相似度的平均值作为各关键帧的自相似度，将初始化后的相似度矩阵发送给第一更新单元，其中，

设定单元，设定归属度矩阵和吸引度矩阵中各关键帧之间的初始归属度和初始吸引度均为0，发送给第一更新单元，设定阻尼因子λ和迭代次数T，送给第二更新单元，其中，

其中，A为归属度矩阵，a_m,n表示关键帧m对关键帧n的归属度，R为吸引度矩阵，r_m,n表示关键帧n对关键帧m的吸引度；

第一更新单元，根据相似度矩阵采用下式(2)吸引度矩阵进行更新，根据更新后的吸引度矩阵对归属度矩阵根据下式(3)和(4)进行更新，将更新后的吸引度矩阵和归属度矩阵发送为第二更新单元，

第二更新单元，利用下式(5)和(6)对第一更新单元更新后的吸引度矩阵和归属度矩阵进行迭代更新，将经过T次迭代的吸引度矩阵和归属度矩阵发送给筛选单元，其中，

筛选单元，滤除自相关归属度和自相关吸引度的和不大于0的关键帧，将滤除不符合上述条件的关键帧对应的向量的吸引度矩阵和归属度矩阵发送到聚类单元；

聚类单元，将经过筛选单元滤除后的吸引度矩阵和归属度矩阵中的关键帧与其他关键帧的归属度和吸引度的和的最大值对应的另一个关键帧作为该关键帧的聚类中心，从而获得符合条件的每一个关键帧的聚类中心，将属于同一聚类中心的关键帧聚为一类。

10.一种视频编解码系统，其特征在于，包括：

权利要求6-9中任一权利要求所述的视频场景相似性分析系统；

压缩部，将聚为一类的关键帧作为一个GOP压缩；

编码部，将关键帧压缩后在编码端重建放在帧缓存区，其余GOP的B帧和P帧通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码；

解码部，先解码所有关键帧，再根据聚类标签解码B帧和P帧。