CN103179405A - 一种基于多级感兴趣区域的多视点视频编码方法 - Google Patents
一种基于多级感兴趣区域的多视点视频编码方法 Download PDFInfo
- Publication number
- CN103179405A CN103179405A CN2013100999995A CN201310099999A CN103179405A CN 103179405 A CN103179405 A CN 103179405A CN 2013100999995 A CN2013100999995 A CN 2013100999995A CN 201310099999 A CN201310099999 A CN 201310099999A CN 103179405 A CN103179405 A CN 103179405A
- Authority
- CN
- China
- Prior art keywords
- level
- interest
- roi
- depth
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000013139 quantization Methods 0.000 claims abstract description 19
- 230000011218 segmentation Effects 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 abstract 3
- 238000000638 solvent extraction Methods 0.000 abstract 1
- 238000002474 experimental method Methods 0.000 description 9
- 230000000007 visual effect Effects 0.000 description 8
- 238000005457 optimization Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000004438 eyesight Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种基于多级感兴趣区域的多视点视频编码方法,包括以下步骤:对深度图进行基于宏块的深度显著性计算,获得深度显著性值SMB;基于所述深度显著性值SMB、多级感兴趣区域的分割标准计算分割阈值;通过所述分割阈值对多视点视频进行分割,获取感兴趣级别不同的多个视频区域;根据感兴趣级别SL调整量化参数QP,通过调整后的量化参数对多个视频区域分别进行编码,得到重建视频。本方法在保证重建视频的整体质量的前提下降低了码率,提高了多视点视频的编码效率。
Description
技术领域
本发明涉及多视点视频编码领域,特别涉及一种基于多级感兴趣区域的多视点视频编码方法。
背景技术
随着3D技术的迅速崛起与快速发展,多视点视频由于其生动丰富的视觉体验,吸引了越来越多的注意力,并成为下一代多媒体系统的关键技术之一,这些应用包括自由视点电视(FTV)和三维立体电视(3DTV)等。多视点视频是指由不同视点的多个摄像机从不同视角拍摄同一场景得到的一组视频信号,是3D视频的一种有效表示方法。而随着相机数目的增加,多视点视频的海量数据已成为制约其广泛应用的一个瓶颈。为此,国际电信联盟远程通信标准化组织(ITU-T)和动态图像专家组(MPEG)组成的联合视频工作组(JVT)提出了多视点视频编码(MVC)的概念来有效处理多视点视频。目前MVC标准以H.264/AVC视频编码标准补篇的形式出现,并兼容H.264/AVC标准。这确保了MVC标准技术的先进性以及应用实施的可行性。
现存的MVC方法主要是在数字信号处理理论和香农信息论的基础上通过减少时间和视点间的冗余来提高率失真性能,但是忽略了人类视觉系统(HVS)对视频场景感知的多样性。尽管HVS的神经资源有限,但依然能够实时分析复杂场景,因为HVS可以将部分输入场景选择为“显著区域”。因此,如何结合HVS的视觉感知特性来提高编码效率,具有非常重要的理论意义和实用价值。基于视觉注意的MVC编码方法可以根据视频内容的不同有效改善比特率的分布,并且能够在不影响视频质量主观评价的前提下提高编码效率。
大量的人类视觉生理学和心理学研究结果表明,人眼对视频图像中的不同内容并非一视同仁,而是表现出选择性和迁移性。人眼会下意识地将一幅图像分为若干个不同的区域,并将注意力集中在人眼感兴趣区域(ROI)。如果感兴趣区域的数目多于一个,注意力在这些区域会有一个转移的过程,即注意力首先集中在最感兴趣区域,一段之间之后再转移到次感兴趣区域,依此类推。人类视觉的这种特性对图像观察者理解图像内容和评价图像质量起着至关重要的作用。利用视觉显著性模型来计算图像中的感兴趣区域,并将其表示为显著性图,这是得到视觉注意区域的一种有效方式。
为了基于视觉显著性实现MVC比特分配优化,首先需要得到准确的ROI。大多数ROI检测方法都是针对一个具体对象,通过建立显著性模型来决定ROI。传统ROI提取方法将一帧划分为两部分:ROI和非ROI,而这两者之间的视频质量的巨大差别会导致重建帧图像不平滑。目前研究者提出了一些基于多级ROI的视频编码的方法:Zhou[1]等提出了一种多级ROI模型,该模型由眼鼻中心区域、脸部轮廓区域,边缘区域和背景区域组成,然后将视频场景分为感兴趣程度不同的区域。Kim[2]和Lee[3]等将屏幕的中心区域设定为优先权最高的主要ROI,其他区域根据其与主要ROI的距离来成比例地分配优先性。
发明人在实现本发明的过程中,发现现有技术中至少存在以下缺点和不足:
上述方法应用在背景简单、对象单一的视频场景时取得了较好的效果;当应用在复杂的视频场景时,提取到的ROI不准确,进而导致视频编码质量较差、整体编码效率较低。
发明内容
本发明提供了一种基于多级感兴趣区域的多视点视频编码方法,本方法通过多级ROI分割,提高了视频编码的效率和质量,详见下文描述:
一种基于多级感兴趣区域的多视点视频编码方法,所述方法包括以下步骤:
(1)对深度图进行基于宏块的深度显著性计算,获得深度显著性值SMB;
(2)基于所述深度显著性值SMB、多级感兴趣区域的分割标准计算分割阈值;
(3)通过所述分割阈值对多视点视频进行分割,获取感兴趣级别不同的多个视频区域;
(4)根据感兴趣级别SL调整量化参数QP,通过调整后的量化参数对多个视频区域分别进行编码,得到重建视频。
所述对深度图进行基于宏块的深度显著性计算,获得深度显著性值SMB具体为:
其中,d(x,y)是当前编码宏块中像素(x,y)的深度值,x和y分别是像素的水平和垂直坐标。
所述基于所述深度显著性值SMB、多级感兴趣区域的分割标准计算分割阈值的步骤具体包括:
1)基于深度显著性值SMB计算深度显著性值分布p(s);
2)通过分析宏块深度显著性值的分布p(s)和多级感兴趣区域的分割标准为各级感兴趣区域确定阈值Tk;
3)通过各级感兴趣区域确定阈值Tk获取最感兴趣区域、多个延展感兴趣区域和背景区域。
所述多级感兴趣区域的分割标准具体为:
分割多级区域以对象为原则,保证一个对象主体包含在感兴趣级别相同的区域。
各级感兴趣区域的阈值Tk具体为:
P(x)是p(s)的累积分布函数;Ri是p(s)的二阶差分取最大值时所对应的s值;n代表了p(s)极大值的总数目;δk是常数;K是划分级数的总数。
宏块的感兴趣级别SL判断公式如下:
其中,T1,Tk-1,...,TK-1分别为当视频序列被分为K个级别时所计算得到的各级感兴趣区域的分割阈值。
所述根据感兴趣级别SL调整量化参数QP的步骤具体为:
bQP是基础量化参数;h是分层B帧的分层等级;ΔQP是相邻感兴趣级别之间的量化参数差值。
本发明提供的技术方案的有益效果是:本方法提出的基于宏块深度显著性的多级ROI提取和比特分配优化方法能够更有效地满足人眼视觉要求。既可以通过多视点视频的深度信息,较为便捷地获得精确可靠的多级ROI;又能在对应的比特优化分配策略的配合下,提高视频ROI与边界的平滑性,在保证重建视频的整体质量的前提下降低码率,提高多视点视频的编码效率。
附图说明
图1给出了视频序列Ballet第0个视点第一帧的多级ROI分割结果;
图2给出了视频序列Ballet和Breakdancers采用JMVC原始编码方法与本方法在不同QP的情况下,第0个视点重建ROI的率失真对比结果;
图3给出了视频序列Ballet和Breakdancers采用JMVC原始编码方法与本方法在不同QP的情况下,八个视点重建视频的平均率失真对比结果;
图4为一种基于多级感兴趣区域的多视点视频编码方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
为了提高视频编码的效率和质量,本发明实施例提供了一种基于多级感兴趣区域的多视点视频编码方法,将多视点视频有效分割为多级ROI,然后给出了基于多级ROI分割结果进行量化参数调整、进而实现编码比特优化分配的策略,参见图4,详见下文描述:
101:对深度图进行基于宏块的深度显著性计算,获得深度显著性值SMB;
深度图是由深度照相机捕获或者通过立体匹配计算得到的8比特灰度图。深度图中的每个像素代表了视频对象和相机之间的相对距离。深度图像的特征与纹理图像有较大的区别:首先,一个对象的深度值通常不会有剧烈的变化;其次,深度值在边界区域是不连续的。多视点视频具有深度信息,而且深度信息十分接近于语义信息,有利于视频对象检测。人们通常对视频场景中凸现的区域更加感兴趣,感兴趣程度会随着区域远离而下降,也即视频区域的深度值越大,人们对该区域越感兴趣。因此,本方法采用深度值来划分视频场景中区域的重要级别,对深度图进行基于宏块的深度显著性计算,获得深度显著性值SMB。
SMB定义为每个宏块的平均深度值,即
其中,d(x,y)是当前编码宏块中像素(x,y)的深度值,x和y分别是像素的水平和垂直坐标。
102:基于深度显著性值SMB、多级感兴趣区域的分割标准计算分割阈值;
其中,该步骤具体包括:
1)通过深度显著性值SMB获取每个宏块的深度显著性值分布p(s);
其中,每个宏块的深度显著性值分布p(s)由以下公式决定:
2)多级感兴趣区域的分割标准;
在本方法中采用了深度显著性值分布p(s)来实现多级ROI的分割,分割多级区域以对象(例如:人、物体等)为原则,保证一个对象的主体包含在感兴趣级别相同的区域。场景中最前方的对象包含在最感兴趣区域内。分割结果为:最感兴趣区域、多个延展感兴趣区域和背景区域,该些区域的具体定义为本领域技术人员所公知,本发明实施例在此不做赘述。
3)通过分析宏块深度显著性值的分布p(s)和多级感兴趣区域的分割标准来为各级ROI确定合适的阈值Tk;
候选范围定义为:
其中,mi和mi+1是p(s)的两个极大值;p(s+2)-2p(s+1)+p(s)是p(s)的二阶差分;Ri是p(s)的二阶差分取最大值时所对应的s值;n代表了p(s)极大值的总数目。
当一个视频序列被划分为多级ROI时,分配到每一级的宏块数目取决于划分级数的总数K,K为一个正整数。为了保证视频中场景最前方的对象包含在最感兴趣区域,且一个对象的主体部分是在同一感兴趣级别,假定为每一层感兴趣区域级别至少分配δk%的宏块,由此,可以计算得到多级ROI的分割阈值:
其中,P(x)是p(s)的累积分布函数,定义为:
103:通过分割阈值对多视点视频进行分割,获取感兴趣级别不同的多个视频区域;
宏块的感兴趣级别SL判断公式如下:
其中,T1,Tk-1,...,TK-1分别为当视频序列被分为K个级别时所计算得到的各级ROI的分割阈值。
104:根据感兴趣级别SL调整量化参数QP,通过调整后的量化参数对多个视频区域分别进行编码,得到重建视频。
MVC充分利用了每个视点的时间冗余和相邻视点间的视点间冗余,考虑到多视点视频的海量数据,通过对一些不易察觉的视频质量做出妥协能进一步提高压缩效率,这可以通过调整量化参数QP来实现。较小的QP值可以更加精确地接近块的空间频谱,从而较好地保持图像质量,但是要以消耗更多的比特为代价。较大的QP值使得空间细节累积,于是所耗比特下降,但是失真和质量损失会增加。
在编码过程中,传统多视点视频编码方法不考虑人眼对不同区域、不同深度的感知差异特性,采用全局性量化参数。基于ROI的多视点视频编码中一个待解决的问题就是怎样在保持重建视频图像质量的前提下通过调整QP来优化比特分配。在本方法中,为最感兴趣区域分配最小的QP值;延展ROI和背景区域的QP值随着感兴趣级别SL的增加而增加。假定JMVC(MVC参考软件)中基础量化参数为bQP,那么不同时间层的QP值由下式决定:
其中h是分层B帧的分层等级,在此基础上,不同等级的多个ROI区域的QP值可以由下式得到:
其中ΔQP是相邻感兴趣级别之间的量化参数差值,是一个正数。视频压缩率和感知质量会随着ΔQP值的变化而变化。ROI区域的QP值与JMVC相比保持不变,由此可以保证ROI的重建视频质量。
在本方法中编码最终采用的QP值QPMVC进一步限定为:
QPMVC=min{51,QP}
下面以一个实验来验证本发明实施例提供的一种基于多级感兴趣区域的多视点视频编码方法的可行性,详见下文描述:
首先采用微软研究院(MSR)提供的Ballet序列进行多级ROI提取实验。图1是使用本方法对Ballet序列第0个视点第一帧的多级ROI区域分割结果。其中要求最感兴趣区域分配的宏块至少为宏块总数的10%,其他感兴趣区域至少分配20%。(a)为SL=1的最感兴趣区域;(b)为最感兴趣区域与SL=2的延展感兴趣区域;(c)为最感兴趣区域与SL=2、SL=3的延展感兴趣区域;(d)为最感兴趣区域与SL=2、SL=3、SL=4的延展感兴趣区域。实验表明本专利中提出的多级ROI分割方法有效、可行。
为使本发明实施例的效果具有可比性,进一步进行多视点视频编码对比实验。实验基于JMVC8.5多视点视频编码参考软件,选取MSR提供的2组多视点视频序列Ballet和Breakdancers进行实验。测试序列每个视点包含56帧,图像组(GOP)长度设为8,实验中在本方法的基础上将各视频序列分割为3级感兴趣级别不同的区域。
在实验中,设置bQP为{12,15,18,21,24,27,30,33}。考虑到ΔQP较大会节省更多比特,但是会导致严重的质量差异。为了保证质量下降和比特节省之间的平衡,设置ΔQP为2。相邻宏块之间的QP变化不宜过大,实验中相邻宏块之间QP的差异最大允许值设为3。这里,ROI区域(包括延展ROI)的编码性能采用峰值信噪比(PSNR)进行评价,整体编码性能采用Engelke等人提出的区域选择性客观图像质量评价标准预测平均意见得分峰值信噪比(PMOS_PSNR)进行评价。
图2给出了JMVC原始编码方法和本方法中各测试序列第0视点ROI区域的率失真曲线图,该失真采用PSNR度量,其中(a)为Ballet序列;(b)为Breakdancers序列。由图可见,本方法可以在与JMVC保持码率一致的情况下,大幅度提高最感兴趣区域和延展感兴趣区域的图像质量。同时由于人们对背景区域不甚关注,背景的质量下降并不容易被观看者察觉,这样就可以保证视频质量的一致性。
图3给出了JMVC原始编码方法和本方法中测试序列Ballet和Breakdancers的率失真曲线,该失真是由测试序列八个视点的PMOS_PSNR平均值来度量,其中,(a)为Ballet序列;(b)为Breakdancers序列。可以看到在高码率的情况下,本方法优于JMVC,且在低码率时性能与JMVC保持一致。在码率大于2000kbps时,本方法能够实现非常有效的编码增益。
综上所述,本方法提出的基于宏块深度显著性的多级ROI提取和比特分配优化方法能够更有效地满足人眼视觉要求。既可以通过多视点视频的深度信息,较为便捷地获得精确可靠的多级ROI;又能在对应的比特优化分配策略的配合下,提高视频ROI与边界的平滑性,在保证重建视频的整体质量的前提下降低码率,提高多视点视频的编码效率。
参考文献
[1]Q.Zhou,J.Liu,Z.Guo,A multilevel region-of-interest based rate controlscheme for video communication,Proceedings of SPIE7498(2009)74984W-1-74984W-8.
[2]C.Kim,T.Na,J.Lim,Y.Joo,K.Kim,J.Byun,M.Kim,An ROI/xROI basedrate control algorithm in H.264/AVC for video telephony applications,LectureNotes in Computer Science5414(2009)1010-1021.
[3]J.H.Lee,C.Yoo,Scalable ROI algorithm for H.264/SVC-based videostreaming,IEEE Transactions on Consumer Electronics57(2)(2011)882-887.
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于多级感兴趣区域的多视点视频编码方法,其特征在于,所述方法包括以下步骤:
(1)对深度图进行基于宏块的深度显著性计算,获得深度显著性值SMB;
(2)基于所述深度显著性值SMB、多级感兴趣区域的分割标准计算分割阈值;
(3)通过所述分割阈值对多视点视频进行分割,获取感兴趣级别不同的多个视频区域;
(4)根据感兴趣级别SL调整量化参数QP,通过调整后的量化参数对多个视频区域分别进行编码,得到重建视频。
2.根据权利要求1所述的一种基于多级感兴趣区域的多视点视频编码方法,其特征在于,所述对深度图进行基于宏块的深度显著性计算,获得深度显著性值SMB具体为:
其中,d(x,y)是当前编码宏块中像素(x,y)的深度值,x和y分别是像素的水平和垂直坐标。
3.根据权利要求1所述的一种基于多级感兴趣区域的多视点视频编码方法,其特征在于,所述基于所述深度显著性值SMB、多级感兴趣区域的分割标准计算分割阈值的步骤具体包括:
1)基于深度显著性值SMB计算深度显著性值分布p(s);
2)通过分析宏块深度显著性值的分布p(s)和多级感兴趣区域的分割标准为各级感兴趣区域确定阈值Tk;
3)通过各级感兴趣区域阈值Tk获取最感兴趣区域、多个延展感兴趣区域和背景区域。
4.根据权利要求3所述的一种基于多级感兴趣区域的多视点视频编码方法,其特征在于,所述多级感兴趣区域的分割标准具体为:
分割多级区域以对象为原则,保证一个对象主体包含在感兴趣级别相同的区域。
5.根据权利要求3所述的一种基于多级感兴趣区域的多视点视频编码方法,其特征在于,各级感兴趣区域的阈值Tk具体为:
P(x)是p(s)的累积分布函数;Ri是p(s)的二阶差分取最大值时所对应的s值;n代表了p(s)极大值的总数目;δk是常数;K是划分级数的总数。
6.根据权利要求1所述的一种基于多级感兴趣区域的多视点视频编码方法,其特征在于,
宏块的感兴趣级别SL判断公式如下:
其中,T1,Tk-1,...,TK-1分别为当视频序列被分为K个级别时所计算得到的各级感兴趣区域的分割阈值。
7.根据权利要求6所述的一种基于多级感兴趣区域的多视点视频编码方法,其特征在于,所述根据感兴趣级别SL调整量化参数QP的步骤具体为:
bQP是基础量化参数;h是分层B帧的分层等级;ΔQP是相邻感兴趣级别之间的量化参数差值。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201310099999.5A CN103179405B (zh) | 2013-03-26 | 2013-03-26 | 一种基于多级感兴趣区域的多视点视频编码方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201310099999.5A CN103179405B (zh) | 2013-03-26 | 2013-03-26 | 一种基于多级感兴趣区域的多视点视频编码方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN103179405A true CN103179405A (zh) | 2013-06-26 |
| CN103179405B CN103179405B (zh) | 2016-02-24 |
Family
ID=48638984
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201310099999.5A Active CN103179405B (zh) | 2013-03-26 | 2013-03-26 | 一种基于多级感兴趣区域的多视点视频编码方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN103179405B (zh) |
Cited By (27)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104427337A (zh) * | 2013-08-21 | 2015-03-18 | 杭州海康威视数字技术股份有限公司 | 基于目标检测的感兴趣区域视频编码方法及其装置 |
| CN105245890A (zh) * | 2015-10-16 | 2016-01-13 | 北京工业大学 | 一种基于视觉关注度优先级的高效视频编码方法 |
| WO2016062222A1 (zh) * | 2014-10-21 | 2016-04-28 | 华为技术有限公司 | Roi视频实现方法及装置 |
| US9589595B2 (en) | 2013-12-20 | 2017-03-07 | Qualcomm Incorporated | Selection and tracking of objects for display partitioning and clustering of video frames |
| US9607015B2 (en) | 2013-12-20 | 2017-03-28 | Qualcomm Incorporated | Systems, methods, and apparatus for encoding object formations |
| WO2017120981A1 (en) | 2016-01-12 | 2017-07-20 | Shanghaitech University | Compression method and apparatus for panoramic stereo video system |
| CN107431811A (zh) * | 2015-04-13 | 2017-12-01 | 高通股份有限公司 | 用于显示流压缩的量化参数更新分类 |
| WO2018041244A1 (en) * | 2016-09-02 | 2018-03-08 | Mediatek Inc. | Incremental quality delivery and compositing processing |
| CN107836109A (zh) * | 2015-08-21 | 2018-03-23 | 三星电子株式会社 | 电子设备自动聚焦于感兴趣区域的方法 |
| CN109068137A (zh) * | 2013-07-10 | 2018-12-21 | 微软技术许可有限责任公司 | 兴趣区域感知的视频编码 |
| CN109429063A (zh) * | 2017-08-29 | 2019-03-05 | 三星电子株式会社 | 视频编码装置 |
| CN110087075A (zh) * | 2019-04-22 | 2019-08-02 | 浙江大华技术股份有限公司 | 一种图像的编码方法、编码装置以及计算机存储介质 |
| CN110460832A (zh) * | 2019-07-31 | 2019-11-15 | 南方医科大学南方医院 | 双视点视频的处理方法、系统和存储介质 |
| CN110572579A (zh) * | 2019-09-30 | 2019-12-13 | 联想(北京)有限公司 | 图像处理方法、装置及电子设备 |
| CN110611815A (zh) * | 2019-09-26 | 2019-12-24 | 深圳市半冬科技有限公司 | 一种视频输出方法、装置以及存储装置 |
| CN110855989A (zh) * | 2019-10-14 | 2020-02-28 | 深圳市天视通电子科技有限公司 | 一种网络视频图像编码方法和装置 |
| US10855965B1 (en) | 2019-06-28 | 2020-12-01 | Hong Kong Applied Science and Technology Research Institute Company, Limited | Dynamic multi-view rendering for autostereoscopic displays by generating reduced number of views for less-critical segments based on saliency/depth/eye gaze map |
| WO2021164216A1 (zh) * | 2020-02-21 | 2021-08-26 | 华为技术有限公司 | 一种视频编码方法、装置、设备及介质 |
| CN113747151A (zh) * | 2021-07-30 | 2021-12-03 | 咪咕文化科技有限公司 | 视频编解码方法、装置、设备及计算机可读存储介质 |
| CN114007059A (zh) * | 2020-07-28 | 2022-02-01 | 阿里巴巴集团控股有限公司 | 视频压缩方法、解压方法、装置、电子设备及存储介质 |
| WO2022067656A1 (zh) * | 2020-09-30 | 2022-04-07 | 华为技术有限公司 | 一种图像处理方法及装置 |
| CN114554191A (zh) * | 2022-02-28 | 2022-05-27 | 西华师范大学 | 一种窗口六自由度合成视频的主观质量评价方法 |
| CN114650422A (zh) * | 2020-12-18 | 2022-06-21 | 重庆中星微人工智能芯片技术有限公司 | 视频帧编码方法、装置、电子设备和计算机可读介质 |
| CN114697665A (zh) * | 2020-12-31 | 2022-07-01 | 浙江宇视科技有限公司 | 编码参数确定方法、装置、电子设备及介质 |
| CN116017003A (zh) * | 2023-01-09 | 2023-04-25 | 西安交通大学 | 基于多种人工智能方法的自适应vr360视频点播方法及系统 |
| WO2025023930A1 (en) * | 2023-07-24 | 2025-01-30 | Google Llc | Cloud-based extended reality system with depth-based region of interest encoding |
| CN120547334A (zh) * | 2025-07-04 | 2025-08-26 | 摩尔线程智能科技(北京)股份有限公司 | 一种视频编码方法、视频编码器以及电子设备、存储介质、计算机程序产品 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1784014A (zh) * | 2004-12-02 | 2006-06-07 | 三菱电机株式会社 | 用于可缩放图像代码转换的方法 |
| CN1926579A (zh) * | 2003-01-28 | 2007-03-07 | 鲁西德信息技术有限公司 | 使用关联决策机制合成三维图形图像的方法和系统 |
| CN1926883A (zh) * | 2004-01-13 | 2007-03-07 | 三星电子株式会社 | 使用感兴趣区域的视频/图像编码方法和系统 |
| CN101312539A (zh) * | 2008-07-03 | 2008-11-26 | 浙江大学 | 用于三维电视的分级图像深度提取方法 |
| US20100322597A1 (en) * | 2009-06-22 | 2010-12-23 | Sony Corporation | Method of compression of graphics images and videos |
| KR20120059214A (ko) * | 2010-11-30 | 2012-06-08 | 고려대학교 산학협력단 | 적응적 관심 영역을 적용한 비디오 스트리밍을 제공하는 비디오 코덱 장치 및 그 방법 |
-
2013
- 2013-03-26 CN CN201310099999.5A patent/CN103179405B/zh active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1926579A (zh) * | 2003-01-28 | 2007-03-07 | 鲁西德信息技术有限公司 | 使用关联决策机制合成三维图形图像的方法和系统 |
| CN1926883A (zh) * | 2004-01-13 | 2007-03-07 | 三星电子株式会社 | 使用感兴趣区域的视频/图像编码方法和系统 |
| CN1784014A (zh) * | 2004-12-02 | 2006-06-07 | 三菱电机株式会社 | 用于可缩放图像代码转换的方法 |
| CN101312539A (zh) * | 2008-07-03 | 2008-11-26 | 浙江大学 | 用于三维电视的分级图像深度提取方法 |
| US20100322597A1 (en) * | 2009-06-22 | 2010-12-23 | Sony Corporation | Method of compression of graphics images and videos |
| KR20120059214A (ko) * | 2010-11-30 | 2012-06-08 | 고려대학교 산학협력단 | 적응적 관심 영역을 적용한 비디오 스트리밍을 제공하는 비디오 코덱 장치 및 그 방법 |
Non-Patent Citations (1)
| Title |
|---|
| ZHOU Q,LIU J,GUO Z: "A multilevel region-of-interest based rate control shcme for video communication", 《PROCEEDUBG OF SPIE》, vol. 7498, 30 December 2009 (2009-12-30), pages 1 - 8 * |
Cited By (45)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109068137B (zh) * | 2013-07-10 | 2022-09-23 | 微软技术许可有限责任公司 | 兴趣区域感知的视频编码 |
| CN109068137A (zh) * | 2013-07-10 | 2018-12-21 | 微软技术许可有限责任公司 | 兴趣区域感知的视频编码 |
| CN104427337B (zh) * | 2013-08-21 | 2018-03-27 | 杭州海康威视数字技术股份有限公司 | 基于目标检测的感兴趣区域视频编码方法及其装置 |
| CN104427337A (zh) * | 2013-08-21 | 2015-03-18 | 杭州海康威视数字技术股份有限公司 | 基于目标检测的感兴趣区域视频编码方法及其装置 |
| US10346465B2 (en) | 2013-12-20 | 2019-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for digital composition and/or retrieval |
| US9589595B2 (en) | 2013-12-20 | 2017-03-07 | Qualcomm Incorporated | Selection and tracking of objects for display partitioning and clustering of video frames |
| US9607015B2 (en) | 2013-12-20 | 2017-03-28 | Qualcomm Incorporated | Systems, methods, and apparatus for encoding object formations |
| US10089330B2 (en) | 2013-12-20 | 2018-10-02 | Qualcomm Incorporated | Systems, methods, and apparatus for image retrieval |
| US10560505B2 (en) | 2014-10-21 | 2020-02-11 | Huawei Technologies Co., Ltd. | ROI video implementation method and apparatus |
| CN105592285A (zh) * | 2014-10-21 | 2016-05-18 | 华为技术有限公司 | Roi视频实现方法及装置 |
| WO2016062222A1 (zh) * | 2014-10-21 | 2016-04-28 | 华为技术有限公司 | Roi视频实现方法及装置 |
| CN105592285B (zh) * | 2014-10-21 | 2020-04-21 | 华为技术有限公司 | Roi视频实现方法及装置 |
| CN107431811A (zh) * | 2015-04-13 | 2017-12-01 | 高通股份有限公司 | 用于显示流压缩的量化参数更新分类 |
| CN107836109A (zh) * | 2015-08-21 | 2018-03-23 | 三星电子株式会社 | 电子设备自动聚焦于感兴趣区域的方法 |
| CN105245890B (zh) * | 2015-10-16 | 2018-01-19 | 北京工业大学 | 一种基于视觉关注度优先级的高效视频编码方法 |
| CN105245890A (zh) * | 2015-10-16 | 2016-01-13 | 北京工业大学 | 一种基于视觉关注度优先级的高效视频编码方法 |
| EP3403401A4 (en) * | 2016-01-12 | 2019-06-12 | Shanghaitech University | COMPRESSION METHOD AND DEVICE FOR PANORAMASTEREOVIDEOSYSTEM |
| US10636121B2 (en) | 2016-01-12 | 2020-04-28 | Shanghaitech University | Calibration method and apparatus for panoramic stereo video system |
| US10489886B2 (en) | 2016-01-12 | 2019-11-26 | Shanghaitech University | Stitching method and apparatus for panoramic stereo video system |
| US10643305B2 (en) | 2016-01-12 | 2020-05-05 | Shanghaitech University | Compression method and apparatus for panoramic stereo video system |
| WO2017120981A1 (en) | 2016-01-12 | 2017-07-20 | Shanghaitech University | Compression method and apparatus for panoramic stereo video system |
| WO2018041244A1 (en) * | 2016-09-02 | 2018-03-08 | Mediatek Inc. | Incremental quality delivery and compositing processing |
| US10951874B2 (en) | 2016-09-02 | 2021-03-16 | Mediatek Inc. | Incremental quality delivery and compositing processing |
| CN109429063B (zh) * | 2017-08-29 | 2022-05-06 | 三星电子株式会社 | 视频编码装置 |
| CN109429063A (zh) * | 2017-08-29 | 2019-03-05 | 三星电子株式会社 | 视频编码装置 |
| CN110087075A (zh) * | 2019-04-22 | 2019-08-02 | 浙江大华技术股份有限公司 | 一种图像的编码方法、编码装置以及计算机存储介质 |
| US10855965B1 (en) | 2019-06-28 | 2020-12-01 | Hong Kong Applied Science and Technology Research Institute Company, Limited | Dynamic multi-view rendering for autostereoscopic displays by generating reduced number of views for less-critical segments based on saliency/depth/eye gaze map |
| CN110460832A (zh) * | 2019-07-31 | 2019-11-15 | 南方医科大学南方医院 | 双视点视频的处理方法、系统和存储介质 |
| CN110460832B (zh) * | 2019-07-31 | 2021-09-07 | 南方医科大学南方医院 | 双视点视频的处理方法、系统和存储介质 |
| CN110611815A (zh) * | 2019-09-26 | 2019-12-24 | 深圳市半冬科技有限公司 | 一种视频输出方法、装置以及存储装置 |
| CN110572579A (zh) * | 2019-09-30 | 2019-12-13 | 联想(北京)有限公司 | 图像处理方法、装置及电子设备 |
| CN110855989A (zh) * | 2019-10-14 | 2020-02-28 | 深圳市天视通电子科技有限公司 | 一种网络视频图像编码方法和装置 |
| WO2021164216A1 (zh) * | 2020-02-21 | 2021-08-26 | 华为技术有限公司 | 一种视频编码方法、装置、设备及介质 |
| CN114007059A (zh) * | 2020-07-28 | 2022-02-01 | 阿里巴巴集团控股有限公司 | 视频压缩方法、解压方法、装置、电子设备及存储介质 |
| WO2022067656A1 (zh) * | 2020-09-30 | 2022-04-07 | 华为技术有限公司 | 一种图像处理方法及装置 |
| CN114650422A (zh) * | 2020-12-18 | 2022-06-21 | 重庆中星微人工智能芯片技术有限公司 | 视频帧编码方法、装置、电子设备和计算机可读介质 |
| CN114650422B (zh) * | 2020-12-18 | 2025-04-29 | 重庆中星微人工智能芯片技术有限公司 | 视频帧编码方法、装置、电子设备和计算机可读介质 |
| CN114697665A (zh) * | 2020-12-31 | 2022-07-01 | 浙江宇视科技有限公司 | 编码参数确定方法、装置、电子设备及介质 |
| CN113747151A (zh) * | 2021-07-30 | 2021-12-03 | 咪咕文化科技有限公司 | 视频编解码方法、装置、设备及计算机可读存储介质 |
| CN113747151B (zh) * | 2021-07-30 | 2024-04-12 | 咪咕文化科技有限公司 | 视频编解码方法、装置、设备及计算机可读存储介质 |
| CN114554191A (zh) * | 2022-02-28 | 2022-05-27 | 西华师范大学 | 一种窗口六自由度合成视频的主观质量评价方法 |
| CN114554191B (zh) * | 2022-02-28 | 2025-05-02 | 西华师范大学 | 一种窗口六自由度合成视频的主观质量评价方法 |
| CN116017003A (zh) * | 2023-01-09 | 2023-04-25 | 西安交通大学 | 基于多种人工智能方法的自适应vr360视频点播方法及系统 |
| WO2025023930A1 (en) * | 2023-07-24 | 2025-01-30 | Google Llc | Cloud-based extended reality system with depth-based region of interest encoding |
| CN120547334A (zh) * | 2025-07-04 | 2025-08-26 | 摩尔线程智能科技(北京)股份有限公司 | 一种视频编码方法、视频编码器以及电子设备、存储介质、计算机程序产品 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN103179405B (zh) | 2016-02-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN103179405B (zh) | 一种基于多级感兴趣区域的多视点视频编码方法 | |
| CN101374242B (zh) | 一种应用于3dtv与ftv系统的深度图编码压缩方法 | |
| CN101374243B (zh) | 一种应用于3dtv与ftv系统的深度图编码压缩方法 | |
| CN104378643B (zh) | 一种3d视频深度图像帧内预测模式选择方法及系统 | |
| CN101742349B (zh) | 一种对三维场景的表达方法及其电视系统 | |
| Shao et al. | Joint bit allocation and rate control for coding multi-view video plus depth based 3D video | |
| CN103024387B (zh) | 一种基于感知的多视点视频码率控制方法 | |
| CN102801997B (zh) | 基于感兴趣深度的立体图像压缩方法 | |
| CN101729891B (zh) | 一种多视点深度视频的编码方法 | |
| CN102055982A (zh) | 三维视频编解码方法及装置 | |
| CN102065296B (zh) | 一种三维立体视频编码方法 | |
| CN102801996B (zh) | 基于jndd模型的快速深度图编码模式选择方法 | |
| CN104159095B (zh) | 一种多视点纹理视频和深度图编码的码率控制方法 | |
| CN108063944B (zh) | 一种基于视觉显著性的感知码率控制方法 | |
| CN105049850A (zh) | 基于感兴趣区域的hevc码率控制方法 | |
| CN101710985B (zh) | 一种用于图像编码的图像亮度补偿方法 | |
| CN105049866B (zh) | 基于绘制失真模型的多视点加深度编码的码率分配方法 | |
| CN101621683A (zh) | 一种基于avs的快速立体视频编码方法 | |
| CN102137258A (zh) | 一种立体视频码率控制方法 | |
| CN105306954B (zh) | 一种基于视差最小可察觉误差模型的感知立体视频编码 | |
| CN101404766A (zh) | 一种多视点视频信号的编码方法 | |
| CN102438167B (zh) | 一种基于深度图像绘制的立体视频编码方法 | |
| CN103024381A (zh) | 一种基于恰可察觉失真的宏块模式快速选择方法 | |
| CN101841723B (zh) | 基于jnd和ar模型的感知视频压缩方法 | |
| CN102710949B (zh) | 一种基于视觉感知的立体视频编码方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant |