CN106803959A - 视频图像编码、解码方法及装置 - Google Patents
视频图像编码、解码方法及装置 Download PDFInfo
- Publication number
- CN106803959A CN106803959A CN201710114491.6A CN201710114491A CN106803959A CN 106803959 A CN106803959 A CN 106803959A CN 201710114491 A CN201710114491 A CN 201710114491A CN 106803959 A CN106803959 A CN 106803959A
- Authority
- CN
- China
- Prior art keywords
- image
- video
- cutting
- field picture
- transcoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000005520 cutting process Methods 0.000 claims abstract description 167
- 230000006835 compression Effects 0.000 claims abstract description 22
- 238000007906 compression Methods 0.000 claims abstract description 22
- 239000013598 vector Substances 0.000 claims description 12
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 11
- 238000003860 storage Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000009467 reduction Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 241000197727 Euscorpius alpha Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明实施例公开了一种视频图像编码、解码方法及装置,用于提升视频图像处理过程中的性能。本发明实施例方法包括:获取视频源文件中的多帧视频帧图像,针对多帧视频帧图像中的任意一帧视频帧图像的处理方式为:确定该视频帧图像的裁剪图像,裁剪图像包括该视频帧图像中的有效像素,然后对裁剪图像进行轮廓扫描生成裁剪图像的轮廓数据,根据轮廓数据对裁剪图像进行转码得到转码后的图像,对转码后的图像进行压缩得到该视频帧图像对应的压缩图像。本发明实施例在对视频图像处理中,不是对视频图像的全图进行处理,而是只对视频图像中的有效像素进行转码和压缩,能够减少视频图像处理过程中的像素量,从而能够提升视频图像处理的性能。
Description
技术领域
本申请涉及视频技术领域,尤其涉及一种视频图像编码、解码方法及装置。
背景技术
视频压制是将原始录制的高清晰视频,在不损伤分辨率的情况下,尽量减小视频文件的大小。
现有技术中的视频压制是通过格式工厂等视频压制工具进行压制,压制的过程包括:将获取到的RGBA图像直接转码为YUV420数据,对YUV420进行视频编码并依据相应的格式进行数据封装,形成视频文件。对压制后的视频播放过程包括:读取视频文件中的一帧一帧的数据,将一帧一帧的数据输入视频解码器进行解码,将解码后的数据进行转码操作,完成最终的视频图像显示。
现有技术对视频图像的转码、压缩和视频解码、转码的处理过程中,非常耗费性能。
发明内容
本发明实施例提供了一种视频图像编码、解码方法及装置,能够提升视频图像处理过程中的性能。
第一方面,本发明实施例提供了一种视频图像编码方法,该方法包括:
获取视频源文件中的多帧视频帧图像,针对多帧视频帧图像中的目标视频帧图像,确定目标视频帧图像的裁剪图像,裁剪图像包括目标视频帧图像中的有效像素,目标视频帧图像为多帧视频帧图像中的任意一帧视频帧图像;对裁剪图像进行轮廓扫描生成裁剪图像的轮廓数据,根据轮廓数据对裁剪图像进行转码得到转码后的图像;对转码后的图像进行压缩得到目标视频帧图像对应的压缩图像。
第二方面,本发明实施例提供了一种视频图像解码方法,该方法包括:
对视频文件进行解码得到解码后的图像;获取轮廓数据,根据轮廓数据对解码后的图像进行转码得到裁剪图像;获取裁剪图像的空间位置数据,根据空间位置数据和裁剪图像生成视频图像,空间位置数据指示裁剪图像在视频图像中的空间位置。
第三方面,本发明实施例提供了一种视频图像编码装置,该装置包括:
获取单元,用于获取视频源文件中的多帧视频帧图像;
图像裁剪单元,用于针对多帧视频帧图像中的目标视频帧图像,确定目标视频帧图像的裁剪图像,裁剪图像包括目标视频帧图像中的有效像素,目标视频帧图像为多帧视频帧图像中的任意一帧视频帧图像;
轮廓数据生成单元,用于对裁剪图像进行轮廓扫描生成裁剪图像的轮廓数据;
图像转码单元,用于根据轮廓数据对裁剪图像进行转码得到转码后的图像;
图像压缩单元,用于对转码后的图像进行压缩得到目标视频帧图像对应的压缩图像。
第四方面,本发明实施例还提供了一种视频图像解码装置,该装置包括:
解码单元,用于对视频文件进行解码得到解码后的图像;
转码单元,用于获取轮廓数据,根据轮廓数据对解码后的图像进行转码得到裁剪图像;
视频图像生成单元,用于获取裁剪图像的空间位置数据,根据空间位置数据和裁剪图像生成视频图像,空间位置数据指示裁剪图像在视频图像中的空间位置。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例在视频压制过程中,获取视频源文件中的多帧视频帧图像,针对多帧视频帧图像中的任意一帧视频帧图像的处理方式为:确定该视频帧图像的裁剪图像,裁剪图像包括该视频帧图像中的有效像素,然后对裁剪图像进行轮廓扫描生成裁剪图像的轮廓数据,根据轮廓数据对裁剪图像进行转码得到转码后的图像,对转码后的图像进行压缩得到该视频帧图像对应的压缩图像。本发明实施例在对视频图像处理中,不是对视频图像的整幅图像进行处理,而是先裁剪出视频图像中包括有效像素的裁剪图像,再进行轮廓扫描,获取轮廓数据,根据轮廓数据进行转码,对转码后的图像进行压缩,因此本发明实施例只对视频图像中的有效像素进行转码和压缩,能够减少视频图像处理过程中的像素量,从而能够提升视频图像处理的性能。
附图说明
图1为本发明实施例中的一种视频图像编码方法的流程图;
图2为本发明实施例中的从视频图像中确定裁剪图像的示意图;
图3为本发明实施例中从裁剪图像中确定轮廓数据的过程示意图;
图4为本发明实施例中确定裁剪图像的空间位置数据的过程示意图;
图5为本发明实施例中的视频信息文件组成示意图;
图6为本发明实施例中的一种视频图像解码方法流程图;
图7为本发明实施例中的对视频信息文件进行处理的示意图;
图8为本发明实施例中的待压制的视频源文件中的其中两帧视频图像的示意图;
图9为本发明实施例中图8中的两帧图像裁剪后的得到的裁剪图像示意图;
图10为本发明实施例中对计算图像中的轮廓数据的方法示意图;
图11为本发明实施例中按照空间位置数据还原裁剪图像后得到视频图像的示意图;
图12为本发明实施例中的视频图像编码装置的功能模块结构示意图;
图13为本发明实施例中的视频图像解码装置的功能模块结构示意图;
图14为本发明实施例中的终端设备的硬件结构示意图。
具体实施方式
以下结合附图对本发明实施例进行进一步详细说明。
视频压制是将原始视频文件进行转码、压缩后,在不影响效果的条件下,减小视频文件的大小,在播放过程中,对压制后的视频文件进行解压、转码播放。
现有的技术的视频压制方法,没有能够有效的去除冗余,会使得在视频压制的转码、压码以及播放中解码、转码、图像显示的各个处理过程都是全图处理,非常耗费性能。本发明实施例中,在视频压制时,只对视频图像中的有效像素进行处理,能够极大的减少压制以及播放中的冗余信息,减少处理过程中的性能消耗。
下面结合图1对本发明实施例中的视频图像处理方法进行详细介绍。
101、获取视频源文件中的多帧视频帧图像;
视频源文件由一帧一帧的图像组成,在视频压制时,获取待处理的视频源文件,一帧一帧地读取视频源文件中的视频图像,逐帧对视频图像进行处理。
102、针对多帧视频帧图像中的目标视频帧图像,确定目标视频帧图像的裁剪图像;
目标视频帧图像为视频图像中的任意一帧视频图像,对目标视频帧图像执行步骤102至步骤104进行处理,可以理解为对视频图像中每一帧图像都执行步骤102到步骤104的处理过程。
人眼对Alpha通道值过小的像素不敏感,Alpha通道值过小的像素透明度高,属于无效像素。本发明实施例中将像素的Alpha通道值小于或等于预设的通道阈值的像素定义为无效像素,将Alpha通道值大于该预设的通道阈值的像素定义为有效像素。可选的,预设的通道值可以为30,即Alpha通道值小于30的像素为无效像素。
在扫描视频图像时,扫描确定目标视频帧图像的有效像素,获取包含这些有效像素的矩形图,该矩形图为目标视频帧图像的裁剪图像。
如图2所示,视频图像的大小为512*480,裁剪图像的大小为386*230,裁剪图像中包括了视频图像中的有效像素。
103、对裁剪图像进行轮廓扫描生成裁剪图像的轮廓数据,根据轮廓数据对裁剪图像进行转码得到转码后的图像;
获取的目标视频帧图像的裁剪图像中包含了目标视频帧图像的有效像素,因为是矩形图,因此裁剪图像中可能还包括了一部分无效像素。
因此,对裁剪图像进行轮廓扫描,获取该裁剪图像中的有效像素的轮廓数据,轮廓数据为裁剪图像中的有效像素的最边缘的像素点的集合。根据轮廓数据对裁剪图像进行转码得到转码后的图像。
可选的,对所述裁剪图像进行轮廓扫描生成该裁剪图像的轮廓数据具体可以是:逐行扫描所述裁剪图像,记录每行的有效像素在所述裁剪图像中的开始位置点和结束位置点,所述裁剪图像的每行的有效像素在所述裁剪图像中的开始位置点和结束位置点为所述裁剪图像的轮廓数据。
图3所示为计算出裁剪图像的其中一行的有效像素的开始位置点为距离裁剪图像的左边界40个像素,结束位置点为距离裁剪图像的右边界30个像素。
可选的,根据轮廓数据对裁剪图像进行转码实际是:对所述轮廓数据对应的轮廓以内的像素进行转码,对轮廓数据对应的轮廓以外的像素置零,从而相当于只需要对裁剪图像中的有效像素进行转码。
104、对转码后的图像进行压缩得到目标视频帧图像对应的压缩图像。
根据轮廓数据对裁剪图像进行转码得到转码后的图像后,对转码后的图像进行压缩得到压缩图像,压缩的方法可以采用无损压缩方法,也可以采用有损压缩,或者采用有损压缩结合无损压缩的方法进行压缩。
在对视频图像中每一帧图像都执行步骤102到步骤104的处理过程,将获得的视频图像中的每一帧图像对应的压缩图像存储为视频文件。
本发明实施例在对视频图像处理中,不是对视频图像的整幅图像进行处理,而是先裁剪出视频图像中包括有效像素的裁剪图像,再进行轮廓扫描,获取轮廓数据,根据轮廓数据进行转码,对转码后的图像进行压缩,因此本发明实施例只对视频图像中的有效像素进行转码和压缩,能够减少视频图像处理过程中的像素量,从而能够提升视频图像处理的性能。
可选的,确定目标视频帧图像的裁剪图像的具体方式为:对进行压制的视频图像序列进行扫描,根据各视频帧图像的有效像素点确定裁剪矩形,裁剪矩形用于指示视频图像的裁剪大小,即在确定各视频图像的裁剪图像时,按照裁剪矩形的大小确定各视频图像的裁剪图像,裁剪图像与裁剪矩形等长等宽,每一帧视频图像的裁剪图像应能包括该视频帧图像中的有效像素。
根据各视频帧图像的有效像素点确定裁剪矩形的具体过程可以为:
获取多帧视频帧图像中的每一帧视频帧图像,确定每一帧视频帧图像的有效矩形,每一帧视频帧图像的有效矩形为包含该视频帧图像的有效像素点的最小矩形区域;然后,从各视频帧图像对应的有效矩形中确定裁剪矩形,裁剪矩形的宽度值为各视频帧图像的有效矩形的宽度值中的最大宽度值,裁剪矩形的长度值为各视频帧图像的有效矩形中的长度值中的最大的长度值;即将所有帧中的有效矩形的最大长和最大宽,定位成裁剪矩形的长和宽。
另外,为了能够在视频文件播放过程中能够还原视频文件,在视频图像处理过程中,确定目标视频帧图像的裁剪图像后,还需要确定裁剪图像在目标视频帧图像中的空间位置得到所述裁剪图像的空间位置数据。
可选的,确定裁剪图像在目标视频帧图像中的空间位置数据具体的方式为:计算裁剪图像在目标视频帧图像中的偏移向量,偏移向量具体是以视频图像的左下角为坐标原点,计算裁剪图像的矩形的左下角相对于坐标原点的坐标值。此偏移向量即为所述裁剪图像在所述目标视频帧图像中的空间位置数据。
如图4所示,在图2的基础上,裁剪图像相对于视频图像的偏移向量为(50,60)。
在得到裁剪图像的空间位置数据后,将各视频图像对应的裁剪图像的空间位置数据存储为空间位置文件。
另外,为了能够在视频文件播放过程中能够还原视频文件,还需要将各视频帧图像对应的裁剪图像的轮廓数据存储为轮廓数据文件。
如图5所示,经过图1所示的视频图像编码后形成的视频信息文件包括视频文件、空间位置文件以及轮廓数据文件。
下面结合图6介绍本发明实施例中,对经过图1所示的视频编码方法生成的视频信息文件进行视频图像解码的方法进行详细介绍。
601、对视频文件进行解码得到解码后的图像;
在播放视频时,先获取视频文件信息,如图7所示,视频文件信息中包括视频文件、空间位置文件以及轮廓数据文件,根据视频文件信息对图像进行解码、转码,最终获得视频图像的显示。
从视频文件信息中获取视频文件,对视频文件进行解码得到解码后的各图像。
602、获取轮廓数据,根据轮廓数据对解码后的图像进行转码得到裁剪图像;
从视频文件信息中获取轮廓数据文件,从轮廓数据文件中获取各图像的对应的轮廓数据。
可选的,轮廓数据包括每行的有效像素的开始位置点和结束位置点。根据轮廓数据对所述解码后的图像进行转码得到裁剪图像具体为:针对解码后的图像中的每行的像素,对从该行对应的开始位置点到结束位置点中间的像素进行转码得到裁剪图像。
603、获取裁剪图像的空间位置数据,根据空间位置数据和裁剪图像生成视频图像。
从视频文件信息中获取空间位置文件,从空间位置文件中获取各裁剪图像对应的空间位置数据,各裁剪图像的空间位置数据指示裁剪图像在视频图像中的空间位置。
然后,根据空间位置数据将裁剪图像还原成视频图像。例如:视频图像的大小为512*480,该裁剪图像对应的空间位置数据为(50,60),需将其还原成512*480大小的视频图像,且裁剪图像的左下角坐标距离视频图像左下角的坐标的向量为(50,60)。
本发明实施例中,在通过图1所示的视频编码方法将视频图像处理后,能够将视频文件进行解码得到解码后的图像,获取轮廓数据,根据轮廓数据对所述解码后的图像进行转码得到裁剪图像,再获取所述裁剪图像的空间位置数据,根据所述空间位置数据和所述裁剪图像生成视频图像。本发明实施例的视频文件中只包含有效像素的信息,而不是全图信息,在视频播放过程中,是根据视频文件、轮廓数据件以及空间位置数据进行相应的解码、转码得到最终显示的视频图像,并不需要对全图信息进行解码、转码,从而能够减少播放过程中的冗余信息,减少视频图像的处理过程中的耗时。
下面结合具体的应用场景对本发明实施中的方法进行介绍。
输入待压制的视频源文件,视频源文件的帧图像格式为RGBA,根据输入图像RGBA中的Alpha通道信息进行空间位置扫描得到裁剪图像,以及空间位置文件,对于裁剪后的图像进行轮廓扫描生成轮廓文件。具体的过程为:
对待压制的视频源文件中的帧图像序列进行扫描,获取每一帧视频图像的有效像素的有效矩形的长和宽,从所有帧的有效矩形中选择出最大长和最大宽,定位成裁剪矩形的长和宽,对每一帧进行裁剪时,按照裁剪矩形的大小进行裁剪。
例如,待压制的视频源文件中的一共有3920帧视频图像,图8展示的为输入图像序列中的第1024帧以及2275帧视频图像,展示的图像大小为512*480。
对视频源文件中的3920帧视频图像进行扫描,确定每一帧图像的有效像素的有效矩形区域,从这些有效像素的有效矩形区域中确定最大的长为352px,最大的宽为420px,则最终确定的裁剪图像的矩形大小为352*420。
按照352*420的矩形大小分别裁剪第1024帧图像以及2275帧视频图像,得到的裁剪图像如图9所示。从图9可以看出,通过Alpha的裁剪,图像明显减少了,但是图像中的有效像素却完整的保留了。
与此同时,为了便于在播放视频时,能够恢复视频图像,在对图像处理时,还需要保存裁剪图像的相应的空间位置数据,空间位置数据是裁剪后相对于裁剪前的偏移向量。如图9所示的两帧图像分别保留了两个向量(10,50)、(160,50),保存在空间位置文件中。
若在图像处理过程中,没有获取到Alpha通道等标明无效像素的信息,则可以进行默认的全幅图像处理。
每幅视频图像经过裁剪后得到的裁剪图像还是存在有很大的冗余,接下来,对裁剪图像进行逐行扫描,记录每行有效像素开始点以及结束点。
如图10所示,Start以及End分别标明了这一行像素的有效开始点以及结束点。所有行的开始点以及结束点标明了这幅图像的有效轮廓,然后将每行像素的开始点及结束点存储在轮廓数据文件中。如果一行像素中的开始点及结束点都等于裁剪图像的长度值,则说明该行中没有有效像素。
如果在扫描裁剪图像的过程中,没有类似获取到Alpha通道等标明无效像素的信息,则可以默认每一个像素点都是有效像素点,对裁剪图像的全幅图像进行处理。
在获取到轮廓数据后,根据轮廓数据进行有针对的转码,不必进行全屏转码,只对轮廓内的有效像素进行转码。根据轮廓数据对裁剪图像进行转码生成编码需要的YUV文件,再将得到的YUV文件输入到编码器中进行压缩形成最终的视频文件。
在视频的播放过程中先对视频文件进行解压操作得到YUV图像。
再依据轮廓数据文件中的轮廓的有效像素的标示进行相应YUV图像转码得到裁剪图像,每一行均会根据轮廓数据文件中标示的起始以及结束点进行转码,能够极大的提升转码效率。
之后,获取空间位置数据,根据空间位置数据对转码后的裁剪图像进行最终显示。具体是:在获取到裁剪图像后,会根据每一帧的空间位置数据进行显示还原,如图11所示,该裁剪图像对应的空间位置数据为向量(10,50),按照(10,50)进行位置还原后得到最终显示的视频图像,需要说明的是,图11中的里面的裁剪图像的矩形框线是用来说明裁剪图像的边界,并不会显示在视频图像中。
从图11可以看出,图像通过本发明实施例中的视频图像编码方法处理后,在视频图像解码播放的时候又能完整的恢复回来,显示效果和现有技术中的全幅图像处理一样,但是采用本发明实施例中的方法,能够降低图像处理中的像素量提升处理效率。
如图图8至图11中的图像,图像纹理刷新从512*480降为了352*420,纹理刷新降低了30%,提升了刷新速度。
通过本发明实施例中的技术方案,在视频压制中的转码、压码以及视频播放中的解码、转码操作处理都因为处理像素量的减少,性能得到极大的提升。处理像素量的减少是因为由于轮廓数据文件以及空间位置文件,指明了一幅图像的有效像素,只对图像中的有效像素进行处理。
本发明实施例中的方案,在移动客户端平台:安卓(Android)平台以及IOS平台,以及嵌入式平台(Arm平台以及X86平台上)上性能提升非常明显。在Android中,如图8至图11中的示例图像每一帧图像从512*480的长宽处理降为了352*420长宽的处理,使得编码、解码以及显示刷新像素量减少了30%,而压制以及视频播放中的转码像素处理量减少了75%,处理速度提升了3倍。
以上是对本发明实施例中的方法进行的介绍,下面从功能模块的角度对本发明实施例中的视频图像编码装置以及视频图像解码装置进行介绍。
本发明实施例提供的视频图像编码装置的功能模块结构如图12所示,该装置具体实现对应于上述图1至图11所提供的视频图像编码方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件程序实现。硬件和软件包括一个或多个与上述功能相对应的单元模块,所述单元模块可以是软件和/或硬件。
具体的,该视频图像编码装置包括:
获取单元1201,用于获取视频源文件中的多帧视频帧图像;
图像裁剪单元1202,用于针对多帧视频帧图像中的目标视频帧图像,确定目标视频帧图像的裁剪图像,裁剪图像包括目标视频帧图像中的有效像素,目标视频帧图像为多帧视频帧图像中的任意一帧视频帧图像;
轮廓数据生成单元1203,用于对裁剪图像进行轮廓扫描生成裁剪图像的轮廓数据;
图像转码单元1204,用于根据轮廓数据对裁剪图像进行转码得到转码后的图像;
图像压缩单元1205,用于对转码后的图像进行压缩得到目标视频帧图像对应的压缩图像。
在一些具体的实施例中,该装置还包括:
空间位置确定单元1206,用于确定裁剪图像在目标视频帧图像中的空间位置得到裁剪图像的空间位置数据;
存储单元1207,用于保存压缩图像、裁剪图像的轮廓数据和裁剪图像的空间位置数据。
在一些具体的实施例中,图像裁剪单元1202,具体用于根据多帧视频帧图像中各视频帧图像的有效像素点确定裁剪矩形,根据裁剪矩形确定目标视频帧图像的裁剪图像,裁剪图像与裁剪矩形等长等宽。
在一些具体的实施例中,图像裁剪单元1202,具体用于针对多帧视频帧图像中的每一帧视频帧图像,获取该视频帧图像的有效矩形,有效矩形包括该视频帧图像的有效像素点的最小矩形区域,从多帧视频帧图像的各视频帧图像的有效矩形中确定裁剪矩形,裁剪矩形的宽度值为各视频帧图像的有效矩形的宽度值中的最大宽度值,裁剪矩形的长度值为各视频帧图像的有效矩形中的长度值中的最大的长度值;根据裁剪矩形确定目标视频帧图像的裁剪图像,裁剪图像与裁剪矩形等长等宽。
在一些具体的实施例中,空间位置确定单元1206,具体用于计算裁剪图像在目标视频帧图像中的偏移向量,偏移向量为裁剪图像在目标视频帧图像中的空间位置数据。
在一些具体的实施例中,轮廓数据生成单元1203,具体用于逐行扫描裁剪图像,记录每行的有效像素在裁剪图像中的开始位置点和结束位置点,裁剪图像的每行的有效像素在裁剪图像中的开始位置点和结束位置点为裁剪图像的轮廓数据。
在一些具体的实施例中,图像转码单元1204,具体用于对轮廓数据对应的轮廓以内的像素进行转码得到转码后的图像。
本发明实施例提供的视频图像解码装置的功能模块结构如图13所示,该装置具体实现对应于上述图1至图11所提供的视频图像解码方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件程序实现。硬件和软件包括一个或多个与上述功能相对应的单元模块,所述单元模块可以是软件和/或硬件。
具体的,该视频图像解码装置包括:
解码单元1301,用于对视频文件进行解码得到解码后的图像;
转码单元1302,用于获取轮廓数据,根据轮廓数据对解码后的图像进行转码得到裁剪图像;
视频图像生成单元1303,用于获取裁剪图像的空间位置数据,根据空间位置数据和裁剪图像生成视频图像,空间位置数据指示裁剪图像在视频图像中的空间位置。
在一些具体的实施例中,轮廓数据包括每行的有效像素的开始位置点和结束位置点;
转码单元1302,具体用于针对解码后的图像中的每行的像素,对从该行对应的开始位置点到结束位置点中间的像素进行转码,得到裁剪图像。
本发明实施例中的视频图像编码装置及视频图像解码装置可以以一个终端设备(例如:计算机)的形式存在。该发明的终端设备,包括台式计算机、手持设备、车载设备、可穿戴设备,以及各种形式的用户设备。手持设备可以为包括手机、平板电脑、PDA(PersonalDigital Assistant,个人数字助理)、等任意终端设备。
图14是本发明实施例提供的一种终端设备的结构示意图,该终端设备14可因配置或性能不同而产生比较大的差异,可以包括处理器(central processing units,CPU)1410和存储器1450。其中,存储器1450上存储有一个或一个以上存储应用程序、数据和操作系统,存储在存储器1450的程序可以包括一个或一个以上模块,每个模块包括一系列指令操作。具体的,存储器1450中存储了游戏应用程序。
处理器1410与存储器1450通信,处理器1410调用存储在所述存储器1450中的视频图像编码方法和视频图像解码方法,以实现上述图1至图11所描述的方案。
此外,本发明还提供一种计算机存储介质,该介质存储有应用程序,该程序执行时包括上述视频图像编码方法和视频图像解码方法(图1到图11所示的实施例)中的部分或者全部步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (18)
1.一种视频图像编码方法,其特征在于,包括:
获取视频源文件中的多帧视频帧图像;
针对所述多帧视频帧图像中的目标视频帧图像,确定所述目标视频帧图像的裁剪图像,所述裁剪图像包括所述目标视频帧图像中的有效像素,所述目标视频帧图像为所述多帧视频帧图像中的任意一帧视频帧图像;
对所述裁剪图像进行轮廓扫描生成所述裁剪图像的轮廓数据,根据所述轮廓数据对所述裁剪图像进行转码得到转码后的图像;
对所述转码后的图像进行压缩得到所述目标视频帧图像对应的压缩图像。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述裁剪图像在所述目标视频帧图像中的空间位置得到所述裁剪图像的空间位置数据;
保存所述压缩图像、所述裁剪图像的轮廓数据和所述裁剪图像的空间位置数据。
3.根据权利要求1或2所述的方法,其特征在于,所述确定所述目标视频帧图像的裁剪图像包括:
根据所述多帧视频帧图像中各视频帧图像的有效像素点确定裁剪矩形;
根据所述裁剪矩形确定所述目标视频帧图像的所述裁剪图像,所述裁剪图像与所述裁剪矩形等长等宽。
4.根据权利要求3所述的方法,其特征在于,所述根据所述多帧视频帧图像中各视频帧图像的有效像素点确定裁剪矩形包括:
针对所述多帧视频帧图像中的每一帧视频帧图像,获取该视频帧图像的有效矩形,所述有效矩形包括该视频帧图像的有效像素点的最小矩形区域;
从所述多帧视频帧图像的各视频帧图像的有效矩形中确定裁剪矩形,所述裁剪矩形的宽度值为所述各视频帧图像的有效矩形的宽度值中的最大宽度值,所述裁剪矩形的长度值为所述各视频帧图像的有效矩形中的长度值中的最大的长度值。
5.根据权利要求2所述的方法,其特征在于,确定所述裁剪图像在所述目标视频帧图像中的空间位置数据包括:
计算所述裁剪图像在所述目标视频帧图像中的偏移向量,所述偏移向量为所述裁剪图像在所述目标视频帧图像中的空间位置数据。
6.根据权利要求1所述的方法,其特征在于,对所述裁剪图像进行轮廓扫描生成该裁剪图像的轮廓数据包括:
逐行扫描所述裁剪图像,记录每行的有效像素在所述裁剪图像中的开始位置点和结束位置点,所述裁剪图像的每行的有效像素在所述裁剪图像中的开始位置点和结束位置点为所述裁剪图像的轮廓数据。
7.根据权利要求1或6所述的方法,其特征在于,所述根据所述轮廓数据对所述裁剪图像进行转码得到转码后的图像包括:
对所述轮廓数据对应的轮廓以内的像素进行转码得到所述转码后的图像。
8.一种视频图像解码方法,其特征在于,包括:
对视频文件进行解码得到解码后的图像;
获取轮廓数据,根据轮廓数据对所述解码后的图像进行转码得到裁剪图像;
获取所述裁剪图像的空间位置数据,根据所述空间位置数据和所述裁剪图像生成视频图像,所述空间位置数据指示所述裁剪图像在所述视频图像中的空间位置。
9.根据权利要求8所述的方法,其特征在于,
所述轮廓数据包括每行的有效像素的开始位置点和结束位置点;
所述根据轮廓数据对所述解码后的图像进行转码得到裁剪图像包括:
针对所述解码后的图像中的每行的像素,对从该行对应的开始位置点到结束位置点中间的像素进行转码,得到所述裁剪图像。
10.一种视频图像编码装置,其特征在于,包括:
获取单元,用于获取视频源文件中的多帧视频帧图像;
图像裁剪单元,用于针对所述多帧视频帧图像中的目标视频帧图像,确定所述目标视频帧图像的裁剪图像,所述裁剪图像包括所述目标视频帧图像中的有效像素,所述目标视频帧图像为所述多帧视频帧图像中的任意一帧视频帧图像;
轮廓数据生成单元,用于对所述裁剪图像进行轮廓扫描生成所述裁剪图像的轮廓数据;
图像转码单元,用于根据所述轮廓数据对所述裁剪图像进行转码得到转码后的图像;
图像压缩单元,用于对所述转码后的图像进行压缩得到所述目标视频帧图像对应的压缩图像。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
空间位置确定单元,用于确定所述裁剪图像在所述目标视频帧图像中的空间位置得到所述裁剪图像的空间位置数据;
存储单元,用于保存所述压缩图像、所述裁剪图像的轮廓数据和所述裁剪图像的空间位置数据。
12.根据权利要求10或11所述的装置,其特征在于:
所述图像裁剪单元,具体用于根据所述多帧视频帧图像中各视频帧图像的有效像素点确定裁剪矩形,根据所述裁剪矩形确定所述目标视频帧图像的所述裁剪图像,所述裁剪图像与所述裁剪矩形等长等宽。
13.根据权利要求12所述的装置,其特征在于:
所述图像裁剪单元,具体用于针对所述多帧视频帧图像中的每一帧视频帧图像,获取该视频帧图像的有效矩形,所述有效矩形包括该视频帧图像的有效像素点的最小矩形区域,从所述多帧视频帧图像的各视频帧图像的有效矩形中确定裁剪矩形,所述裁剪矩形的宽度值为所述各视频帧图像的有效矩形的宽度值中的最大宽度值,所述裁剪矩形的长度值为所述各视频帧图像的有效矩形中的长度值中的最大的长度值;根据所述裁剪矩形确定所述目标视频帧图像的所述裁剪图像,所述裁剪图像与所述裁剪矩形等长等宽。
14.根据权利要求11所述的装置,其特征在于,
空间位置确定单元,具体用于计算所述裁剪图像在所述目标视频帧图像中的偏移向量,所述偏移向量为所述裁剪图像在所述目标视频帧图像中的空间位置数据。
15.根据权利要求10所述的装置,其特征在于:
轮廓数据生成单元,具体用于逐行扫描所述裁剪图像,记录每行的有效像素在所述裁剪图像中的开始位置点和结束位置点,所述裁剪图像的每行的有效像素在所述裁剪图像中的开始位置点和结束位置点为所述裁剪图像的轮廓数据。
16.根据权利要求10或15所述的装置,其特征在于:
图像转码单元,具体用于对所述轮廓数据对应的轮廓以内的像素进行转码得到所述转码后的图像。
17.一种视频图像解码装置,其特征在于,包括:
解码单元,用于对视频文件进行解码得到解码后的图像;
转码单元,用于获取轮廓数据,根据轮廓数据对所述解码后的图像进行转码得到裁剪图像;
视频图像生成单元,用于获取所述裁剪图像的空间位置数据,根据所述空间位置数据和所述裁剪图像生成视频图像,所述空间位置数据指示所述裁剪图像在所述视频图像中的空间位置。
18.根据权利要求17所述的装置,其特征在于,
所述轮廓数据包括每行的有效像素的开始位置点和结束位置点;
所述转码单元,具体用于针对所述解码后的图像中的每行的像素,对从该行对应的开始位置点到结束位置点中间的像素进行转码,得到所述裁剪图像。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201710114491.6A CN106803959B (zh) | 2017-02-28 | 2017-02-28 | 视频图像编码、解码方法、编码、解码装置及可读存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201710114491.6A CN106803959B (zh) | 2017-02-28 | 2017-02-28 | 视频图像编码、解码方法、编码、解码装置及可读存储介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN106803959A true CN106803959A (zh) | 2017-06-06 |
| CN106803959B CN106803959B (zh) | 2019-12-27 |
Family
ID=58987780
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201710114491.6A Active CN106803959B (zh) | 2017-02-28 | 2017-02-28 | 视频图像编码、解码方法、编码、解码装置及可读存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN106803959B (zh) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111837393A (zh) * | 2018-03-15 | 2020-10-27 | 索尼公司 | 图像处理设备和方法 |
| CN111885385A (zh) * | 2019-05-02 | 2020-11-03 | 西克Ivp股份公司 | 关于实现数字图像的无损压缩的像素值编码方法及编码器 |
| CN112948627A (zh) * | 2019-12-11 | 2021-06-11 | 杭州海康威视数字技术股份有限公司 | 一种报警视频生成方法、显示方法和装置 |
| CN113039794A (zh) * | 2018-11-16 | 2021-06-25 | 索尼集团公司 | 图像处理装置和方法 |
| CN114222181A (zh) * | 2021-11-11 | 2022-03-22 | 北京达佳互联信息技术有限公司 | 一种图像处理方法、装置、设备及介质 |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102572433A (zh) * | 2007-07-20 | 2012-07-11 | 富士胶片株式会社 | 图像处理设备、图像处理方法、图像处理系统和程序 |
| US8260078B2 (en) * | 2009-01-14 | 2012-09-04 | Cisco Technology, Inc. | System and method for adaptively sharpening digital images |
| CN103037206A (zh) * | 2012-12-14 | 2013-04-10 | 广东威创视讯科技股份有限公司 | 视频传输方法和系统 |
| US20130136338A1 (en) * | 2011-11-30 | 2013-05-30 | Adobe Systems Incorporated | Methods and Apparatus for Correcting Disparity Maps using Statistical Analysis on Local Neighborhoods |
| CN103152550A (zh) * | 2013-02-22 | 2013-06-12 | 华为技术有限公司 | 一种电子云台的实现方法、前端设备和接收装置 |
| CN103916604A (zh) * | 2013-01-04 | 2014-07-09 | 全视科技有限公司 | 具有三层视频场景的影中影视频流 |
| CN104573694A (zh) * | 2014-12-22 | 2015-04-29 | 嘉兴百盛光电有限公司 | 一种晶片图像的识别方法 |
| JP6132610B2 (ja) * | 2013-03-21 | 2017-05-24 | キヤノン株式会社 | 画像処理装置、及び、画像処理方法 |
-
2017
- 2017-02-28 CN CN201710114491.6A patent/CN106803959B/zh active Active
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102572433A (zh) * | 2007-07-20 | 2012-07-11 | 富士胶片株式会社 | 图像处理设备、图像处理方法、图像处理系统和程序 |
| US8260078B2 (en) * | 2009-01-14 | 2012-09-04 | Cisco Technology, Inc. | System and method for adaptively sharpening digital images |
| US20130136338A1 (en) * | 2011-11-30 | 2013-05-30 | Adobe Systems Incorporated | Methods and Apparatus for Correcting Disparity Maps using Statistical Analysis on Local Neighborhoods |
| CN103037206A (zh) * | 2012-12-14 | 2013-04-10 | 广东威创视讯科技股份有限公司 | 视频传输方法和系统 |
| CN103916604A (zh) * | 2013-01-04 | 2014-07-09 | 全视科技有限公司 | 具有三层视频场景的影中影视频流 |
| CN103152550A (zh) * | 2013-02-22 | 2013-06-12 | 华为技术有限公司 | 一种电子云台的实现方法、前端设备和接收装置 |
| JP6132610B2 (ja) * | 2013-03-21 | 2017-05-24 | キヤノン株式会社 | 画像処理装置、及び、画像処理方法 |
| CN104573694A (zh) * | 2014-12-22 | 2015-04-29 | 嘉兴百盛光电有限公司 | 一种晶片图像的识别方法 |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111837393A (zh) * | 2018-03-15 | 2020-10-27 | 索尼公司 | 图像处理设备和方法 |
| CN113039794A (zh) * | 2018-11-16 | 2021-06-25 | 索尼集团公司 | 图像处理装置和方法 |
| CN113039794B (zh) * | 2018-11-16 | 2024-05-24 | 索尼集团公司 | 图像处理装置和方法 |
| US12375673B2 (en) | 2018-11-16 | 2025-07-29 | Sony Group Corporation | Image processing apparatus and method |
| CN111885385A (zh) * | 2019-05-02 | 2020-11-03 | 西克Ivp股份公司 | 关于实现数字图像的无损压缩的像素值编码方法及编码器 |
| CN111885385B (zh) * | 2019-05-02 | 2023-11-28 | 西克Ivp股份公司 | 关于实现数字图像的无损压缩的像素值编码方法及编码器 |
| CN112948627A (zh) * | 2019-12-11 | 2021-06-11 | 杭州海康威视数字技术股份有限公司 | 一种报警视频生成方法、显示方法和装置 |
| CN114222181A (zh) * | 2021-11-11 | 2022-03-22 | 北京达佳互联信息技术有限公司 | 一种图像处理方法、装置、设备及介质 |
| CN114222181B (zh) * | 2021-11-11 | 2024-03-12 | 北京达佳互联信息技术有限公司 | 一种图像处理方法、装置、设备及介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN106803959B (zh) | 2019-12-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20200260117A1 (en) | Methods and Apparatuses for Coding and Decoding Depth Map | |
| US10582217B2 (en) | Methods and apparatuses for coding and decoding depth map | |
| CN106803959A (zh) | 视频图像编码、解码方法及装置 | |
| CN111667410B (zh) | 图像分辨率提升方法、装置及电子设备 | |
| CN111954052B (zh) | 显示弹幕信息的方法、计算机设备及可读存储介质 | |
| CN111954060B (zh) | 弹幕蒙版的渲染方法、计算机设备及可读存储介质 | |
| CN116916080A (zh) | 视频数据处理方法、装置、计算机设备及可读存储介质 | |
| GB2539241B (en) | Video processing system | |
| US20220138906A1 (en) | Image Processing Method, Apparatus, and Device | |
| CN115311161B (zh) | 基于人工智能的图像增强方法、装置、设备以及存储介质 | |
| JPH09252468A (ja) | 画像圧縮装置 | |
| US7400764B2 (en) | Compression and decompression of media data | |
| US9020283B2 (en) | Electronic device and method for splitting image | |
| CN112714357A (zh) | 视频播放方法、视频播放装置、电子设备和存储介质 | |
| US20140133768A1 (en) | Electronic device and method for splitting image | |
| US20250227255A1 (en) | Systems and methods for object boundary merging, splitting, transformation and background processing in video packing | |
| US8594194B2 (en) | Compression method using adaptive field data selection | |
| CN116601958A (zh) | 虚拟视点绘制、渲染、解码方法及装置、设备、存储介质 | |
| US20240121439A1 (en) | Point cloud attribute information encoding method and apparatus, point cloud attribute information decoding method and apparatus, and related device | |
| CN111954082B (zh) | 蒙版文件结构、蒙版文件的读取方法、计算机设备及可读存储介质 | |
| CN115883933A (zh) | 视频的字幕去除方法、装置、计算机设备及存储介质 | |
| CN116744009A (zh) | 增益图编码方法、解码方法、装置、设备及介质 | |
| CN111954081A (zh) | 获取蒙版数据的方法、计算机设备及可读存储介质 | |
| CN116847087A (zh) | 视频处理方法、装置、存储介质及电子设备 | |
| CN116362960A (zh) | 基于尺度缩小算法与颜色分布滤波器的图像像素化方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |