CN107657228A - 视频场景相似性分析方法及系统、视频编解码方法及系统 - Google Patents
视频场景相似性分析方法及系统、视频编解码方法及系统 Download PDFInfo
- Publication number
- CN107657228A CN107657228A CN201710873784.2A CN201710873784A CN107657228A CN 107657228 A CN107657228 A CN 107657228A CN 201710873784 A CN201710873784 A CN 201710873784A CN 107657228 A CN107657228 A CN 107657228A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- key frame
- mtr
- mtd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Abstract
本发明提供视频场景相似性分析方法及系统、视频编解码方法及系统,分析方法包括:从视频每一个镜头中分别选取一帧图像作为关键帧;提取每一个关键帧的特征向量,构建相似度矩阵;根据相似度矩阵,以吸引度和归属度的和作为线性核对各关键帧进行聚类,设定各关键帧的聚类标签。视频编解码方法包括上述视频场景相似性分析方法;将聚为一类的关键帧作为一个GOP压缩;将关键帧压缩后在编码端重建放在帧缓存区,其余GOP的B帧和P帧通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码;解码时,先解码所有关键帧,再根据聚类标签解码B帧和P帧。上述方法及系统能够挖掘非连续帧以及非连续GOP之间的相关性。
Description
技术领域
本发明涉及视频处理技术领域,更为具体地,涉及一种视频场景相似性分析方法、视频编解码方法、视频场景相似性分析系统及视频编解码系统。
背景技术
伴随着近几年互联网产业飞速发展,各种多媒体内容的载体,像数字图像视频及音频等也伴随着呈现出爆炸式的增长,因此如果图像视频数据不进行去冗余压缩的话,带宽和存储必然要承受极大的压力。传统的冗余压缩方法都是对关键帧的帧内预测编码和连续帧的帧间预测编码,没有考虑非连续帧和非连续GOP(Group of Pictures,画面组)间的冗余。
在图像视频压缩编码研究领域里,目前主流的思路大都是基于“预测-变换-熵编码”来进行拓展和改进的。虽然发展应用很成功,但是压缩效率达到瓶颈。因此人们开始从图像视频内容的分析入手,与视频压缩技术相结合,突破传统图像视频的压缩技术瓶。
在2007年,Liu et al.提出了基于图像修复技术的图像编码方法,该方法的思想是划分图像,将图像划分为结构区域和纹理区域,利用的是图像边缘提取技术和纹理检测等分析工具。每一区域又划分为三类内容:必要内容,部分必要内容和冗余内容。必要的结构信息和纹理信息为必要内容,而需要参考必要内容来确定梯度变化是否较大则为部分必要内容;需要根据前两者还原的部分则为冗余部分。对于分出来的不同的内容区域,采用不同的编码方法,冗余则不用编码,这样可以大大提高编码效率。在该工作的基础上,Liu etal.将图像内容分析与传统压缩编码方法相结合,提出了基于边缘的帧内预测方法,利用图像边缘结构信息和拉普拉斯方程描述的图像局部连续性,使帧内预测的方向更加自适应,而且可以兼容现有的基于块的图像和视频编码标准。
传统的视频编码系统一般利用的是连续帧之间的相关性来去除时间冗余,即使采用多参考帧技术也只是搜索一个GOP内的帧进行参考,这样一来I帧(关键帧)的数量较大,且没有考虑I帧之间的相关性。
发明内容
鉴于上述问题,本发明的目的是提供一种挖掘非连续帧以及非连续GOP之间的相关性的视频场景相似性分析方法、视频编解码方法、视频场景相似性分析系统及视频编解码系统。
根据本发明的一个方面,提供一种视频场景相似性分析方法,包括:从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧;提取每一个关键帧的特征向量,根据特征向量度量各关键帧之间的相似度,构建相似度矩阵;根据相似度矩阵,以吸引度和归属度的和作为线性核对各关键帧进行聚类,设定各关键帧的聚类标签,所述聚类标签采用关键帧对应的聚类中心表征,所述吸引度表示从关键帧传送到其聚类中心的信息,所述归属度表示从聚类中心传送到关键帧的信息。
根据本发明的另一个方面,提供一种视频编解码方法,包括:上述视频场景相似性分析方法;将聚为一类的关键帧作为一个GOP压缩;将关键帧压缩后在编码端重建放在帧缓存区,其余GOP的B帧(双向差别帧)和P帧(与前一帧的差别帧)通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码;解码时,先解码所有关键帧,再根据聚类标签解码B帧和P帧。
根据本发明的第三个方面,提供一种视频场景相似性分析系统,包括:关键帧提取模块,从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧,将各关键帧发送到相似度矩阵构建模块;相似度矩阵构建模块,提取每一个关键帧的特征向量,根据特征向量度量各关键帧之间的相似度,构建相似度矩阵,将相似度矩阵发送到聚类模块;聚类模块,根据相似度矩阵,以吸引度和归属度的和作为线性核对各关键帧进行聚类,设定各关键帧的聚类标签,所述聚类标签采用关键帧对应的聚类中心表征,所述吸引度表示从关键帧传送到其聚类中心的信息,所述归属度表示从聚类中心传送到关键帧的信息。
根据本发明的第四个方面,提供一种视频编解码系统,包括:
上述视频场景相似性分析系统;压缩部,将聚为一类的关键帧作为一个GOP压缩;编码部,将关键帧压缩后在编码端重建放在帧缓存区,其余GOP的B帧和P帧通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码;解码部,先解码所有关键帧,再根据聚类标签解码B帧和P帧。
本发明所述视频场景相似性分析方法和视频场景相似性分析系统对I帧(关键帧)聚类,将聚为一类的I帧作为一个GOP进行压缩,减少了独立进行帧内预测的I帧的数量,从而进一步压缩I帧的数据量。
本发明所述视频编解码方法及视频编解码系统,利用视频场景的相似性,将每个GOP里占用码率最多的I帧进项聚类,挖掘非连续帧以及非连续GOP之间的相关性,与视频压缩技术相结合,大大提高视频压缩效率,将场景相似性分析技术应用到I帧的压缩能够在PSNR基本保持的情况下相比传统的编码能将压缩效率提高3%~4%。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1是本发明所述视频场景相似性分析方法的流程图;
图2是本发明所述构建相似度矩阵的流程图;
图3是本发明所述以吸引度和归属度的和作为线性核对各关键帧进行聚类的流程图;
图4是本发明所述各关键帧聚类压缩的示意图;
图5是本发明所述视频场景相似性分析系统的构成框图;
图6是本发明所述视频编解码系统的构成框图。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。以下将结合附图对本发明的具体实施例进行详细描述。
以下将结合附图对本发明的具体实施例进行详细描述。
图1是本发明所述视频场景相似性分析方法的流程图,如图1所示,所述视频场景相似性分析方法包括:
步骤1,从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的I帧;
步骤2,提取每一个I帧的特征向量,根据特征向量度量各I帧之间的相似度,构建相似度矩阵;
步骤3,根据相似度矩阵,以吸引度和归属度的和作为线性核对各I帧进行聚类,设定各I帧的聚类标签,所述聚类标签采用I帧对应的聚类中心表征,所述吸引度表示从I帧传送到其聚类中心的信息,所述归属度表示从聚类中心传送到I帧的信息。
对于内容回归率比较高的视频,非连续帧以及非连续GOP之间的相关性依然非常大,上述视频场景相似性分析方法将每个GOP里占用码率最多的I帧进项聚类,挖掘非连续帧以及非连续GOP之间的相关性,减少了独立进行帧内预测的I帧的数量,从而进一步压缩I帧的数据量。
在本发明的一个优选实施例中,上述步骤1包括:检测镜头的边界,将两个相邻边界之间确定为一个镜头;选取各镜头中设定位置的一帧作为I帧,例如,将每设定数量的帧(15帧)确定为一个镜头,然后将所述每设定数量帧中的第一帧当做这个镜头的关键帧,又如,根据需求直接选取镜头里的第一帧、最后一帧或者内部的某一帧作为镜头的I帧。
在本发明的一个优选实施例中,如图2所示,上述步骤2包括:
步骤21,将关键帧的图像分块,形成同样尺寸的子块,得到所述子块的颜色的直方图,经过累计得到所述关键帧的累计直方图,直方图代表一幅图像上全部像素色度空间值的分布情况,它反映的是图像颜色空间的分布情况和基本色调,但直方图不包括位置特征,所以不同的图像可能计算得到同样的直方图特征,针对这一问题,本发明采用累积直方图的表示方法,即不是直接计算图像直方图,而是先对其进行预处理,把图像分块,变成同样尺寸的一些子块,再计算得出原图子块颜色的直方图,进而计算得出其累积直方图,累积直方图相与颜色直方图相比,是一种鲁棒性更高的方法;
步骤22,采用颜色空间提取每一个I帧的累计直方图的颜色特征向量,例如采用HSV颜色空间,对HSV值进行非均匀量化来减少计算量,色调H通常分为八个量化区域,饱和度S和亮度V都分为三个量化区域,依照其取值范围的差异,具体的量化过程如下:
本发明把色度H量化为8份,饱和度S量化为3份、亮度V量化为3份,就得到一个72维的特征向量;
步骤23,采用灰度共生矩阵提取每一个I帧的纹理特征向量,具体地:构建各关键帧的灰度共生矩阵;采用能量、惯性、相关性、熵、局部均匀性、最大概率中的一个或多个指标构建纹理特征向量;采用高斯归一化对上述纹理特征向量进行归一化;
步骤24,利用每一个I帧的所述颜色特征向量和纹理特征向量根据下式(1)构建相似度矩阵,
其中,m,n为两个I帧,sm,n表示I帧m和I帧n的相似度,(x1,x2,...,xd)为I帧m的特征向量,(y1,y2,...,yd)为I帧n特征向量。
优选地,在步骤23中,构建(0,π/4,π/2,3π/4)4个方向上的共生矩阵,对其采用高斯归一化,取上述惯性、能量熵、相关性和熵4个参数的均值和标准差作为分量来描述纹理特征向量,得到一个8维的纹理特征向量。
另外,优选地,可以根据颜色纹理综合特征向量根据上述公式(1)构建相似度矩阵,例如(x1,x2,...,xd)为I帧m的特征向量中(x1,x2,...,xj)为颜色特征向量,(xj+1,xj+2,...,xd)为纹理特征向量,则颜色纹理综合特征向量为(αx1,αx2,...,αxj,βxj+1,...,βxd),α和β为特征系数,α+β=1。
在本发明的一个优选实施例中,如图3所示,上述步骤3包括:
步骤31,对相似度矩阵进行初始化,将相似度矩阵中各相似度的平均值(参考度P)作为各I帧的自相似度,设定归属度矩阵和吸引度矩阵中各I帧之间的初始归属度和初始吸引度均为0,
其中,S为相似度矩阵,将相似度矩阵S中的各相似度求平均值作为s1,1,s2,2,…,sm,m的值;A为归属度矩阵,am,n表示I帧m对I帧n的归属度;R为吸引度矩阵,rm,n表示I帧n对I帧m的吸引度;
步骤32,根据相似度矩阵采用下式(2)吸引度矩阵进行更新,
其中,r′m,n为初始归属度和初始吸引度均为0采用相似度矩阵更新后的关键帧n对关键帧m的吸引度;
步骤33,根据更新后的吸引度矩阵对归属度矩阵根据下式(3)和(4)进行更新,
其中,a′m,n和a′m,m分别为根据更新后的吸引度矩阵进行更新的关键帧n对关键帧m的归属度和关键帧m自相关归属度;
步骤34,设定阻尼因子λ(例如,0.5)和迭代次数T,利用下式(5)和(6)对上述吸引度矩阵和归属度矩阵进行迭代更新,
其中,为经过T次迭代更新后的关键帧n对关键帧m的吸引度,为经过T次迭代更新后的关键帧n对关键帧m的归属度;
步骤35,经过上述迭代更新后,滤除自相关归属度和自相关吸引度的和不大于0的I帧,即判断各关键帧的自相关归属度和自相关吸引度是否符合下式(7),滤除不符合下式(7)的关键帧,其中,
步骤36,将符合自相关归属度和自相关吸引度大于0的条件的I帧与其他I帧的归属度和吸引度的和的最大值对应的另一个I帧作为该I帧的聚类中心,从而获得符合条件的每一个I帧的聚类中心,从而获得符合条件的每一个I帧的聚类中心,将属于同一聚类中心的I帧聚为一类。
上述根据相似度矩阵,以吸引度和归属度的和作为线性核对各关键帧进行聚类的方法,首先克服了传统聚类算法在进行初始值的选取时比较敏感的缺点,将所有数据都作为候选聚类中心,每个数据都要通过相互之间传递的消息来不停的计算迭代更新,最终确定竞争成为聚类中心或者是成为其他聚类中心的所属数据,最后等迭代结束后得到若干个高质量的聚类中心。
另外,上述聚类方法“消息传递机制”进行的是吸引度(Responsibility)和归属度(Availability)这两种信息在数据点和候选聚类中心之间的传递,吸引度表示的是从数据传送到候选聚类中心k的信息,归属度表示的是从候选聚类中心k传送到数据点i的信息;吸引度体现了k点成为数据点i聚类中心的适当程度,而归属度体现了i点把k点作为它的聚类中心的适当程度;和越大,表示数据点i把k点作为自己的聚类中心的概率越大,k点成为聚类中心的概率就越大。
再者,与吸引度和归属度对应的还有一个参考度(Reference),参考度并不是用来传递的信息,而是一个评判标准。即用相似度矩阵S对角线上的值sk,k来评判k点可否成为聚类中心,sk,k越大,k点成为聚类中心的概率就越大,在聚类的初始化过程中,任何数据点i不属于任何一个类,任何数据k也都不是聚类中心,所以将矩阵S的均值赋给所有数据点的参考度P。
可以将上述视频场景相似性分析方法应用到视频编解码方法中,所述视频编解码方法除了包括上述视频分析方法外,还包括:
将聚为一类的I帧作为一个GOP压缩,如图4所示,F01-F20的I帧分别具有各自的聚类中心,聚类中心可以采用一个代号表示,如S1-S4,将聚为一类的I帧作为一个GOP压缩,分别压缩为GOP1-GOP4;
将I帧压缩后在编码端重建放在帧缓存区,其余GOP的B帧和P帧通过各自的I帧索引找到帧缓存区对应的I帧进行帧间预测编码;
解码时,先解码所有I帧,再根据聚类标签解码B帧和P帧。
图5是本发明所述视频场景相似性分析系统的构成框图,如图5所示,所述视频场景相似性分析系统100,包括:
关键帧帧提取模块110,从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的I帧,将各I帧发送到相似度矩阵构建模块120;
相似度矩阵构建模块120,提取每一个I帧的特征向量,根据特征向量度量各I帧之间的相似度,构建相似度矩阵,将相似度矩阵发送到聚类模块130;
聚类模块130,根据相似度矩阵,以吸引度和归属度的和作为线性核对各I帧进行聚类,设定各I帧的聚类标签,所述聚类标签采用I帧对应的聚类中心表征,所述吸引度表示从I帧传送到其聚类中心的信息,所述归属度表示从聚类中心传送到I帧的信息。
在本发明的一个优选实施例中,上述关键帧提取模块11包括:
镜头确定单元111,检测镜头的边界,将两个相邻边界之间确定为一个镜头;
关键帧帧提取单元112,选取各镜头中设定位置的一帧作为I帧。
在本发明的一个优选实施例中,上述相似度矩阵构建模120块包括:
累计直方图构建单元121,将I帧的图像分块,形成同样尺寸的子块,得到所述子块的颜色的直方图,经过累计得到所述I帧的累计直方图,将所述累计直方图发送给颜色特征向量提取单元122;
颜色特征向量提取单元122,采用颜色空间提取每一个I帧的累计直方图的颜色特征向量,将各I帧的颜色特征向量发送给相似度矩阵构建单元124;
纹理特征向量提取单元123,采用灰度共生矩阵提取每一个I帧的纹理特征向量,将各I帧的纹理特征向量发送给相似度矩阵构建单元124;
相似度矩阵构建单元124,利用每一个I帧的所述颜色特征向量和纹理特征向量根据下式(1)构建相似度矩阵,
其中,m,n为两个I帧,sm,n表示I帧m和I帧n的相似度,(x1,x2,…,xd)为I帧m的特征向量,(y1,y2,…,yd)为I帧n特征向量。
在本发明的一个优选实施例中,上述聚类模块130包括:
初始化单元131,对相似度矩阵进行初始化,将相似度矩阵中各相似度的平均值作为各I帧的自相似度,将初始化后的相似度矩阵发送给第一更新单元133,其中,
其中,S为相似度矩阵,将相似度矩阵S中的各相似度求平均值P作为s1,1,s2,2,…,sm,m的值;
设定单元132,设定归属度矩阵和吸引度矩阵中各I帧之间的初始归属度和初始吸引度均为0,发送给第一更新单元133,设定阻尼因子λ和迭代次数T,送给第二更新单元134,其中,
其中,A为归属度矩阵,am,n表示I帧m对I帧n的归属度;R为吸引度矩阵,rm,n表示I帧n对I帧m的吸引度;
第一更新单元133,根据相似度矩阵采用下式(2)吸引度矩阵进行更新,根据更新后的吸引度矩阵对归属度矩阵根据下式(3)和(4)进行更新,将更新后的吸引度矩阵和归属度矩阵发送为第二更新单元134,
其中,r′m,n为初始归属度和初始吸引度均为0采用相似度矩阵更新后的关键帧n对关键帧m的吸引度,a′m,n和a′m,m分别为根据更新后的吸引度矩阵进行更新的关键帧n对关键帧m的归属度和关键帧m自相关归属度;
第二更新单元134,利用下式(5)和(6)对第一更新单元更新后的吸引度矩阵和归属度矩阵进行迭代更新,将经过T次迭代的吸引度矩阵和归属度矩阵发送给筛选单元135,其中,
其中,为经过T次迭代更新后的关键帧n对关键帧m的吸引度,为经过T次迭代更新后的关键帧n对关键帧m的归属度;
筛选单元135,滤除自相关归属度和自相关吸引度的和不大于0的I帧,将滤除不符合上述条件的I帧对应的向量的吸引度矩阵和归属度矩阵发送到聚类单元136;
聚类单元136,将经过筛选单元滤除后的吸引度矩阵和归属度矩阵中的I帧与其他I帧的归属度和吸引度的和的最大值对应的另一个I帧作为该I帧的聚类中心,从而获得符合条件的每一个I帧的聚类中心,将属于同一聚类中心的I帧聚为一类。
上述视频场景相似性分析系统可以应用到视频编解码系统,如图6所示,所述视频编解码系统1000除了包括上述视频场景相似性分析系统100外,还包括:
压缩部200,将聚为一类的I帧作为一个GOP压缩;
编码部300,将I帧压缩后在编码端重建放在帧缓存区,其余GOP的B帧和P帧通过各自的I帧索引找到帧缓存区对应的I帧进行帧间预测编码;
解码部400,先解码所有I帧,再根据聚类标签解码B帧和P帧。
综上所述,参照附图以示例的方式描述了根据本发明提出的视频场景相似性分析方法、视频编解码方法、视频场景相似性分析系统及视频编解码系统。但是,本领域技术人员应当理解,对于上述本发明所提出的系统及方法,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。
Claims (10)
1.一种视频场景相似性分析方法,其特征在于,包括:
从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧;
提取每一个关键帧的特征向量,根据特征向量度量各关键帧之间的相似度,构建相似度矩阵;
根据相似度矩阵,以吸引度和归属度的和作为线性核对各关键帧进行聚类,设定各关键帧的聚类标签,所述聚类标签采用关键帧对应的聚类中心表征,所述吸引度表示从关键帧传送到其聚类中心的信息,所述归属度表示从聚类中心传送到关键帧的信息。
2.根据权利要求1所述的视频场景相似性分析方法,其特征在于,所述构建相似度矩阵的方法包括:
将关键帧的图像分块,形成同样尺寸的子块,得到所述子块的颜色的直方图,经过累计得到所述关键帧的累计直方图;
采用颜色空间提取每一个关键帧的累计直方图的颜色特征向量;
采用灰度共生矩阵提取每一个关键帧的纹理特征向量;
利用每一个关键帧的所述颜色特征向量和纹理特征向量根据下式(1)构建相似度矩阵,
<mrow>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>d</mi>
</munderover>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
</mrow>
<msqrt>
<mrow>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>d</mi>
</munderover>
<msub>
<msup>
<mi>x</mi>
<mn>2</mn>
</msup>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>d</mi>
</munderover>
<msub>
<msup>
<mi>y</mi>
<mn>2</mn>
</msup>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</msqrt>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,m,n为两个关键帧,sm,n表示关键帧m和关键帧n的相似度,(x1,x2,...,xd)为关键帧m的特征向量,(y1,y2,...,yd)为关键帧n特征向量。
3.根据权利要求1所述的视频场景相似性分析方法,其特征在于,所述从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧的方法包括:
检测镜头的边界,将两个相邻边界之间确定为一个镜头;
选取各镜头中设定位置的一帧作为关键帧。
4.根据权利要求1所述的视频场景相似性分析方法,其特征在于,所述根据相似度矩阵,以吸引度和归属度的和作为线性核对各关键帧进行聚类,设定各关键帧的聚类标签的方法包括:
对相似度矩阵进行初始化,将相似度矩阵中各相似度的平均值作为各关键帧的自相似度,
<mrow>
<mi>S</mi>
<mo>=</mo>
<mfenced open = "(" close = ")">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>s</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>s</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,S为相似度矩阵,将相似度矩阵S中的各相似度求平均值P作为s1,1,s2,2,…,sm,m的值;
设定归属度矩阵和吸引度矩阵中各关键帧之间的初始归属度和初始吸引度均为0,其中,
<mrow>
<mi>A</mi>
<mo>=</mo>
<mfenced open = "(" close = ")">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>a</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>a</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>a</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>a</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>a</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>a</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
<mrow>
<mi>R</mi>
<mo>=</mo>
<mfenced open = "(" close = ")">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>r</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>r</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>r</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,A为归属度矩阵,am,n表示关键帧m对关键帧n的归属度;R为吸引度矩阵,rm,n表示关键帧n对关键帧m的吸引度;
根据相似度矩阵采用下式(2)吸引度矩阵进行更新,
<mrow>
<msubsup>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
<mo>&prime;</mo>
</msubsup>
<mo>=</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>-</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mi>t</mi>
<mo>&NotEqual;</mo>
<mi>n</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,r′m,n为初始归属度和初始吸引度均为0采用相似度矩阵更新后的关键帧n对关键帧m的吸引度;
根据更新后的吸引度矩阵对归属度矩阵根据下式(3)和(4)进行更新,
其中,a′m,n和a′m,m分别为根据更新后的吸引度矩阵进行更新的关键帧n对关键帧m的归属度和关键帧m自相关归属度;
设定阻尼因子λ和迭代次数T,利用下式(5)和(6)对上述吸引度矩阵和归属度矩阵进行迭代更新,
<mrow>
<msubsup>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
<mrow>
<mo>&prime;</mo>
<mi>T</mi>
</mrow>
</msubsup>
<mo>=</mo>
<mi>&lambda;</mi>
<mo>&times;</mo>
<mo>&lsqb;</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>-</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mi>t</mi>
<mo>&NotEqual;</mo>
<mi>n</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
<mrow>
<mo>&prime;</mo>
<mi>T</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mo>+</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,为经过T次迭代更新后的关键帧n对关键帧m的吸引度,为经过T次迭代更新后的关键帧n对关键帧m的归属度;
经过上述迭代更新后,滤除自相关归属度和自相关吸引度的和不大于0的关键帧;
将符合自相关归属度和自相关吸引度大于0的条件的关键帧与其他关键帧的归属度和吸引度的和的最大值对应的另一个关键帧作为该关键帧的聚类中心,从而获得符合条件的每一个关键帧的聚类中心,将属于同一聚类中心的关键帧聚为一类。
5.一种视频编解码方法,其特征在于,包括:
权利要求1-4中任一权利要求所述的视频场景相似性分析方法;
将聚为一类的关键帧作为一个GOP压缩;
将关键帧压缩后在编码端重建放在帧缓存区,其余GOP的B帧和P帧通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码;
解码时,先解码所有关键帧,再根据聚类标签解码B帧和P帧。
6.一种视频场景相似性分析系统,其特征在于,包括:
关键帧提取模块,从视频的每一个镜头中分别选取一帧图像作为所述每一个镜头的关键帧,将各关键帧发送到相似度矩阵构建模块;
相似度矩阵构建模块,提取每一个关键帧的特征向量,根据特征向量度量各关键帧之间的相似度,构建相似度矩阵,将相似度矩阵发送到聚类模块;
聚类模块,根据相似度矩阵,以吸引度和归属度的和作为线性核对各关键帧进行聚类,设定各关键帧的聚类标签,所述聚类标签采用关键帧对应的聚类中心表征,所述吸引度表示从关键帧传送到其聚类中心的信息,所述归属度表示从聚类中心传送到关键帧的信息。
7.根据权利要求6所述的视频场景相似性分析系统,其特征在于,所述关键帧提取模块包括:
镜头确定单元,检测镜头的边界,将两个相邻边界之间确定为一个镜头;
关键帧提取单元,选取各镜头中设定位置的一帧作为关键帧。
8.根据权利要求6所述的视频场景相似性分析系统,其特征在于,所述相似度矩阵构建模块包括:
累计直方图构建单元,将关键帧的图像分块,形成同样尺寸的子块,得到所述子块的颜色的直方图,经过累计得到所述关键帧的累计直方图,将所述累计直方图发送给颜色特征向量提取单元;
颜色特征向量提取单元,采用颜色空间提取每一个关键帧的累计直方图的颜色特征向量,将各关键帧的颜色特征向量发送给相似度矩阵构建单元;
纹理特征向量提取单元,采用灰度共生矩阵提取每一个关键帧的纹理特征向量,将各关键帧的纹理特征向量发送给相似度矩阵构建单元;
相似度矩阵构建单元,利用每一个关键帧的所述颜色特征向量和纹理特征向量根据下式(1)构建相似度矩阵,
<mrow>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>d</mi>
</munderover>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
</mrow>
<msqrt>
<mrow>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>d</mi>
</munderover>
<msub>
<msup>
<mi>x</mi>
<mn>2</mn>
</msup>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>d</mi>
</munderover>
<msub>
<msup>
<mi>y</mi>
<mn>2</mn>
</msup>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</msqrt>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,m,n为两个关键帧,sm,n表示关键帧m和关键帧n的相似度,(x1,x2,...,xd)为关键帧m的特征向量,(y1,y2,...,yd)为关键帧n特征向量。
9.根据权利要求6所述的视频场景相似性分析系统,其特征在于,所述聚类模块包括:
初始化单元,对相似度矩阵进行初始化,将相似度矩阵中各相似度的平均值作为各关键帧的自相似度,将初始化后的相似度矩阵发送给第一更新单元,其中,
<mrow>
<mi>S</mi>
<mo>=</mo>
<mfenced open = "(" close = ")">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>s</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>s</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,S为相似度矩阵,将相似度矩阵S中的各相似度求平均值P作为s1,1,s2,2,…,sm,m的值;
设定单元,设定归属度矩阵和吸引度矩阵中各关键帧之间的初始归属度和初始吸引度均为0,发送给第一更新单元,设定阻尼因子λ和迭代次数T,送给第二更新单元,其中,
<mrow>
<mi>A</mi>
<mo>=</mo>
<mfenced open = "(" close = ")">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>a</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>a</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>a</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>a</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>a</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>a</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
<mrow>
<mi>R</mi>
<mo>=</mo>
<mfenced open = "(" close = ")">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>r</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>r</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>r</mi>
<mrow>
<mn>1</mn>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mn>2</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<msub>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,A为归属度矩阵,am,n表示关键帧m对关键帧n的归属度,R为吸引度矩阵,rm,n表示关键帧n对关键帧m的吸引度;
第一更新单元,根据相似度矩阵采用下式(2)吸引度矩阵进行更新,根据更新后的吸引度矩阵对归属度矩阵根据下式(3)和(4)进行更新,将更新后的吸引度矩阵和归属度矩阵发送为第二更新单元,
<mrow>
<msubsup>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
<mo>&prime;</mo>
</msubsup>
<mo>=</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>-</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mi>t</mi>
<mo>&NotEqual;</mo>
<mi>n</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,r′m,n为初始归属度和初始吸引度均为0采用相似度矩阵更新后的关键帧n对关键帧m的吸引度,a′m,n和a′m,m分别为根据更新后的吸引度矩阵进行更新的关键帧n对关键帧m的归属度和关键帧m自相关归属度;
第二更新单元,利用下式(5)和(6)对第一更新单元更新后的吸引度矩阵和归属度矩阵进行迭代更新,将经过T次迭代的吸引度矩阵和归属度矩阵发送给筛选单元,其中,
<mrow>
<msubsup>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
<mrow>
<mo>&prime;</mo>
<mi>T</mi>
</mrow>
</msubsup>
<mo>=</mo>
<mi>&lambda;</mi>
<mo>&times;</mo>
<mo>&lsqb;</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>-</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mi>t</mi>
<mo>&NotEqual;</mo>
<mi>n</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
<mrow>
<mo>&prime;</mo>
<mi>T</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mo>+</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>m</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,为经过T次迭代更新后的关键帧n对关键帧m的吸引度,为经过T次迭代更新后的关键帧n对关键帧m的归属度;
筛选单元,滤除自相关归属度和自相关吸引度的和不大于0的关键帧,将滤除不符合上述条件的关键帧对应的向量的吸引度矩阵和归属度矩阵发送到聚类单元;
聚类单元,将经过筛选单元滤除后的吸引度矩阵和归属度矩阵中的关键帧与其他关键帧的归属度和吸引度的和的最大值对应的另一个关键帧作为该关键帧的聚类中心,从而获得符合条件的每一个关键帧的聚类中心,将属于同一聚类中心的关键帧聚为一类。
10.一种视频编解码系统,其特征在于,包括:
权利要求6-9中任一权利要求所述的视频场景相似性分析系统;
压缩部,将聚为一类的关键帧作为一个GOP压缩;
编码部,将关键帧压缩后在编码端重建放在帧缓存区,其余GOP的B帧和P帧通过各自的关键帧索引找到帧缓存区对应的关键帧进行帧间预测编码;
解码部,先解码所有关键帧,再根据聚类标签解码B帧和P帧。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201710873784.2A CN107657228B (zh) | 2017-09-25 | 2017-09-25 | 视频场景相似性分析方法及系统、视频编解码方法及系统 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201710873784.2A CN107657228B (zh) | 2017-09-25 | 2017-09-25 | 视频场景相似性分析方法及系统、视频编解码方法及系统 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN107657228A true CN107657228A (zh) | 2018-02-02 |
| CN107657228B CN107657228B (zh) | 2020-08-04 |
Family
ID=61130165
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201710873784.2A Active CN107657228B (zh) | 2017-09-25 | 2017-09-25 | 视频场景相似性分析方法及系统、视频编解码方法及系统 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN107657228B (zh) |
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108509917A (zh) * | 2018-03-30 | 2018-09-07 | 北京影谱科技股份有限公司 | 基于镜头类相关性分析的视频场景分割方法和装置 |
| CN109688429A (zh) * | 2018-12-18 | 2019-04-26 | 广州励丰文化科技股份有限公司 | 一种基于非关键视频帧的预览方法及服务设备 |
| CN110062163A (zh) * | 2019-04-22 | 2019-07-26 | 珠海格力电器股份有限公司 | 多媒体数据的处理方法以及装置 |
| CN110188625A (zh) * | 2019-05-13 | 2019-08-30 | 浙江大学 | 一种基于多特征融合的视频精细结构化方法 |
| CN110377587A (zh) * | 2019-07-15 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 基于机器学习的迁移数据确定方法、装置、设备及介质 |
| CN110796088A (zh) * | 2019-10-30 | 2020-02-14 | 行吟信息科技(上海)有限公司 | 视频相似性判定方法及装置 |
| CN110853033A (zh) * | 2019-11-22 | 2020-02-28 | 腾讯科技(深圳)有限公司 | 基于帧间相似度的视频检测方法和装置 |
| CN110879952A (zh) * | 2018-09-06 | 2020-03-13 | 阿里巴巴集团控股有限公司 | 一种视频帧序列的处理方法及装置 |
| CN111126126A (zh) * | 2019-10-21 | 2020-05-08 | 武汉大学 | 一种基于图卷积神经网络的视频智能拆条方法 |
| WO2023050431A1 (zh) * | 2021-09-30 | 2023-04-06 | 浙江大学 | 编解码方法、解码器、编码器及计算机可读存储介质 |
| WO2024222936A1 (zh) * | 2023-04-28 | 2024-10-31 | 北京沃东天骏信息技术有限公司 | 适用于空间图像的编码方法及装置 |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101404030A (zh) * | 2008-11-05 | 2009-04-08 | 中国科学院计算技术研究所 | 一种视频中周期性结构片段检测的方法及系统 |
| CN102572435A (zh) * | 2012-01-16 | 2012-07-11 | 中南民族大学 | 基于压缩采样的视频编解码系统及其方法 |
| US20130114703A1 (en) * | 2005-03-31 | 2013-05-09 | Euclid Discoveries, Llc | Context Based Video Encoding and Decoding |
| CN104732545A (zh) * | 2015-04-02 | 2015-06-24 | 西安电子科技大学 | 结合稀疏近邻传播和快速谱聚类的纹理图像分割方法 |
| CN105469383A (zh) * | 2014-12-30 | 2016-04-06 | 北京大学深圳研究生院 | 基于多特征融合的无线胶囊内窥镜冗余图像筛除方法 |
| CN106202256A (zh) * | 2016-06-29 | 2016-12-07 | 西安电子科技大学 | 基于语义传播及混合多示例学习的Web图像检索方法 |
| CN107194312A (zh) * | 2017-04-12 | 2017-09-22 | 广东银禧科技股份有限公司 | 一种基于3d打印模型内容的模型推荐方法 |
-
2017
- 2017-09-25 CN CN201710873784.2A patent/CN107657228B/zh active Active
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20130114703A1 (en) * | 2005-03-31 | 2013-05-09 | Euclid Discoveries, Llc | Context Based Video Encoding and Decoding |
| CN101404030A (zh) * | 2008-11-05 | 2009-04-08 | 中国科学院计算技术研究所 | 一种视频中周期性结构片段检测的方法及系统 |
| CN102572435A (zh) * | 2012-01-16 | 2012-07-11 | 中南民族大学 | 基于压缩采样的视频编解码系统及其方法 |
| CN105469383A (zh) * | 2014-12-30 | 2016-04-06 | 北京大学深圳研究生院 | 基于多特征融合的无线胶囊内窥镜冗余图像筛除方法 |
| CN104732545A (zh) * | 2015-04-02 | 2015-06-24 | 西安电子科技大学 | 结合稀疏近邻传播和快速谱聚类的纹理图像分割方法 |
| CN106202256A (zh) * | 2016-06-29 | 2016-12-07 | 西安电子科技大学 | 基于语义传播及混合多示例学习的Web图像检索方法 |
| CN107194312A (zh) * | 2017-04-12 | 2017-09-22 | 广东银禧科技股份有限公司 | 一种基于3d打印模型内容的模型推荐方法 |
Non-Patent Citations (1)
| Title |
|---|
| 钱丽丽,施鹏飞: "近邻传播算法在非监督图像聚类中的应用", 《微型电脑应用》 * |
Cited By (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108509917A (zh) * | 2018-03-30 | 2018-09-07 | 北京影谱科技股份有限公司 | 基于镜头类相关性分析的视频场景分割方法和装置 |
| CN108509917B (zh) * | 2018-03-30 | 2020-03-03 | 北京影谱科技股份有限公司 | 基于镜头类相关性分析的视频场景分割方法和装置 |
| CN110879952B (zh) * | 2018-09-06 | 2023-06-16 | 阿里巴巴集团控股有限公司 | 一种视频帧序列的处理方法及装置 |
| CN110879952A (zh) * | 2018-09-06 | 2020-03-13 | 阿里巴巴集团控股有限公司 | 一种视频帧序列的处理方法及装置 |
| CN109688429A (zh) * | 2018-12-18 | 2019-04-26 | 广州励丰文化科技股份有限公司 | 一种基于非关键视频帧的预览方法及服务设备 |
| CN110062163B (zh) * | 2019-04-22 | 2020-10-20 | 珠海格力电器股份有限公司 | 多媒体数据的处理方法以及装置 |
| CN110062163A (zh) * | 2019-04-22 | 2019-07-26 | 珠海格力电器股份有限公司 | 多媒体数据的处理方法以及装置 |
| CN110188625A (zh) * | 2019-05-13 | 2019-08-30 | 浙江大学 | 一种基于多特征融合的视频精细结构化方法 |
| CN110188625B (zh) * | 2019-05-13 | 2021-07-02 | 浙江大学 | 一种基于多特征融合的视频精细结构化方法 |
| CN110377587A (zh) * | 2019-07-15 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 基于机器学习的迁移数据确定方法、装置、设备及介质 |
| CN111126126A (zh) * | 2019-10-21 | 2020-05-08 | 武汉大学 | 一种基于图卷积神经网络的视频智能拆条方法 |
| CN111126126B (zh) * | 2019-10-21 | 2022-02-01 | 武汉大学 | 一种基于图卷积神经网络的视频智能拆条方法 |
| CN110796088A (zh) * | 2019-10-30 | 2020-02-14 | 行吟信息科技(上海)有限公司 | 视频相似性判定方法及装置 |
| CN110853033A (zh) * | 2019-11-22 | 2020-02-28 | 腾讯科技(深圳)有限公司 | 基于帧间相似度的视频检测方法和装置 |
| CN110853033B (zh) * | 2019-11-22 | 2022-02-22 | 腾讯科技(深圳)有限公司 | 基于帧间相似度的视频检测方法和装置 |
| WO2023050431A1 (zh) * | 2021-09-30 | 2023-04-06 | 浙江大学 | 编解码方法、解码器、编码器及计算机可读存储介质 |
| WO2024222936A1 (zh) * | 2023-04-28 | 2024-10-31 | 北京沃东天骏信息技术有限公司 | 适用于空间图像的编码方法及装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN107657228B (zh) | 2020-08-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN107657228B (zh) | 视频场景相似性分析方法及系统、视频编解码方法及系统 | |
| CN111598026A (zh) | 动作识别方法、装置、设备及存储介质 | |
| CN116233445B (zh) | 视频的编解码处理方法、装置、计算机设备和存储介质 | |
| CN103338376B (zh) | 一种基于运动矢量的视频隐写方法 | |
| Wang et al. | Scalable facial image compression with deep feature reconstruction | |
| JP2002541738A (ja) | 画像圧縮 | |
| CN102630011A (zh) | 一种视频传感器网络中的压缩感知编解码方法及系统 | |
| CN110677624B (zh) | 基于深度学习的面向监控视频的前景和背景并行压缩方法 | |
| CN108965887B (zh) | 一种基于块间去耦合的视频信息隐藏方法和装置 | |
| CN104780379A (zh) | 一种屏幕图像集合的压缩方法 | |
| CN103067713B (zh) | 一种位图jpeg压缩检测的方法及系统 | |
| CN104159117A (zh) | 一种hevc视频的信息隐藏方法 | |
| CN120676183B (zh) | 面向边缘计算的ai网关视频高效压缩方法 | |
| Dai et al. | HEVC video steganalysis based on PU maps and multi-scale convolutional residual network | |
| CN103020138A (zh) | 一种视频检索的方法和装置 | |
| CN105163122B (zh) | 一种基于图像块相似性的图像压缩及解压缩方法 | |
| CN109982071A (zh) | 基于时空复杂性度量及局部预测残差分布的hevc双压缩视频检测方法 | |
| CN106331730B (zh) | H.264视频同量化因子双重压缩检测方法 | |
| CN103533353B (zh) | 一种近似视频编码系统 | |
| CN111723735A (zh) | 一种基于卷积神经网络的伪高码率hevc视频检测方法 | |
| CN104053012B (zh) | 一种基于字典库的视频编解码方法及装置 | |
| CN107682699B (zh) | 一种近无损图像压缩方法 | |
| CN112770116A (zh) | 用视频压缩编码信息提取视频关键帧的方法 | |
| KR102072576B1 (ko) | 데이터 인코딩 및 디코딩 장치와 방법 | |
| CN1717033B (zh) | 视频压缩的设备和方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |