TWI501611B - 用於3d視訊之視圖間預測之運動向量 - Google Patents
用於3d視訊之視圖間預測之運動向量 Download PDFInfo
- Publication number
- TWI501611B TWI501611B TW102129557A TW102129557A TWI501611B TW I501611 B TWI501611 B TW I501611B TW 102129557 A TW102129557 A TW 102129557A TW 102129557 A TW102129557 A TW 102129557A TW I501611 B TWI501611 B TW I501611B
- Authority
- TW
- Taiwan
- Prior art keywords
- motion vector
- reference image
- poc
- current
- list
- Prior art date
Links
- 230000033001 locomotion Effects 0.000 title claims description 578
- 239000013598 vector Substances 0.000 title claims description 527
- 238000000034 method Methods 0.000 claims description 132
- 230000026058 directional locomotion Effects 0.000 claims description 43
- 230000002123 temporal effect Effects 0.000 claims description 34
- 230000004044 response Effects 0.000 claims description 30
- 238000003860 storage Methods 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 16
- 230000001174 ascending effect Effects 0.000 claims 2
- 238000012545 processing Methods 0.000 description 36
- 238000013139 quantization Methods 0.000 description 22
- 230000005540 biological transmission Effects 0.000 description 14
- 230000011664 signaling Effects 0.000 description 14
- 230000003044 adaptive effect Effects 0.000 description 12
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 238000009795 derivation Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 8
- 238000000638 solvent extraction Methods 0.000 description 7
- 238000013500 data storage Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 241000023320 Luma <angiosperm> Species 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 3
- 230000001364 causal effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000013074 reference sample Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- HRANPRDGABOKNQ-ORGXEYTDSA-N (1r,3r,3as,3br,7ar,8as,8bs,8cs,10as)-1-acetyl-5-chloro-3-hydroxy-8b,10a-dimethyl-7-oxo-1,2,3,3a,3b,7,7a,8,8a,8b,8c,9,10,10a-tetradecahydrocyclopenta[a]cyclopropa[g]phenanthren-1-yl acetate Chemical group C1=C(Cl)C2=CC(=O)[C@@H]3C[C@@H]3[C@]2(C)[C@@H]2[C@@H]1[C@@H]1[C@H](O)C[C@@](C(C)=O)(OC(=O)C)[C@@]1(C)CC2 HRANPRDGABOKNQ-ORGXEYTDSA-N 0.000 description 1
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 description 1
- 101100537098 Mus musculus Alyref gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 101150095908 apex1 gene Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本發明係關於視訊寫碼。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲主控台、蜂巢式或衛星無線電電話、所謂「智慧型手機」、視訊電傳會議器件、視訊串流器件及其類似者。數位視訊器件實施視訊壓縮技術,諸如,由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分之進階視訊寫碼(AVC)、目前在開發中之高效率視訊寫碼(HEVC)及此類標準之延伸定義之標準中描述的技術。視訊器件可藉由實施此類視訊壓縮技術而較有效率地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測以縮減或移除為視訊序列所固有之冗餘。對於以區塊為基礎之視訊寫碼,可將視訊圖塊(亦即,視訊圖框或視訊圖框之部分)分割成視訊區塊,
其亦可被稱作樹區塊、寫碼單元(CU)及/或寫碼節點。一圖像之經框內寫碼(I)圖塊中之視訊區塊係使用關於該同一圖像中之相鄰區塊中之參考樣本的空間預測予以編碼。一圖像之經框間寫碼(P或B)圖塊中之視訊區塊可使用關於該同一圖像中之相鄰區塊中之參考樣本的空間預測或關於其他參考圖像中之參考樣本的時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。
空間或時間預測引起用於待寫碼區塊之預測性區塊。殘餘資料表示原始待寫碼區塊與預測性區塊之間的像素差。經框間寫碼區塊係根據指向形成預測性區塊之參考樣本區塊之運動向量及指示經寫碼區塊與預測性區塊之間的差之殘餘資料予以編碼。經框內寫碼區塊係根據框內寫碼模式及殘餘資料予以編碼。出於進一步壓縮起見,可將殘餘資料自像素域變換至變換域,從而引起殘餘變換係數,其接著可被量化。可掃描最初以二維陣列而配置之經量化變換係數以便產生一維變換係數向量,且可應用熵寫碼以達成甚至更多之壓縮。
大體上,本發明描述用於改良多視圖及3D視訊寫碼中之運動預測之寫碼效率的技術。
在一實例中,本發明描述一種解碼多視圖視訊資料之方法,其包括:針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊;判定用於該當前區塊之一當前運動向量之一第一方向,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值;判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像,其中該第一參考圖像清單對應於該第一方向作為一方向運動預測子;回應於該
第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量來解碼該當前運動向量;及回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像:判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值,其中該第二方向不同於該第一方向,其中該第二方向對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像;及回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來解碼該當前運動向量。
在另一實例中,一種用於視訊寫碼之器件包括一視訊寫碼器,其經組態以:針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊;判定用於該當前區塊之一當前運動向量之一第一方向,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值;判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像,其中該第一參考圖像清單對應於該第一方向;回應於該第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來解碼該當前運動向量;回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像:判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值,其中該第二方向不同於該第一方向,其中該第二方向對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;判定用於該當前區塊之該第一參考圖像清單是否
包括具有該第二POC值之一參考圖像;及回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來解碼該當前運動向量。
在另一實例中,一種用於視訊寫碼之器件包括一視訊編碼器,其經組態以:針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊;判定用於該當前區塊之一當前運動向量之一第一方向,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值;判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像,其中該第一參考圖像清單對應於該第一方向;回應於該第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來編碼該當前運動向量;回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像:判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值,其中該第二方向不同於該第一方向,其中該第二方向對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像;及回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來編碼該當前運動向量。
在另一實例中,一種用於寫碼視訊資料之裝置包括:用於針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊的構件;用於判定用於該當前區塊之一當前運動向量之一第一方向的構件,其中該第一方向對應於一第一參
考圖像清單或一第二參考圖像清單中之一者;用於判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值的構件;用於判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像的構件,其中該第一參考圖像清單對應於該第一方向;用於回應於該第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來寫碼該當前運動向量的構件;用於回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像而判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值的構件,其中該第二方向不同於該第一方向,其中該第二方向對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;用於判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像的構件;及用於回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來寫碼該當前運動向量的構件。
在另一實例中,一種電腦可讀儲存媒體儲存指令,該等指令在由一或多個處理器執行時使該一或多個處理器:針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊;判定用於該當前區塊之一當前運動向量之一第一方向,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值;判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像,其中該第一參考圖像清單對應於該第一方向;回應於該第一參考圖像清單包括具有該第一POC值之該參
考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來寫碼該當前運動向量;且回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像:判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值,其中該第二方向不同於該第一方向,其中該第二方向對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像;及回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來寫碼該當前運動向量。
隨附圖式及以下描述中闡明一或多個實例之細節。其他特徵、目標及優勢將自該描述及該等圖式且自申請專利範圍變得顯而易見。
10‧‧‧視訊編碼及解碼系統
12‧‧‧來源器件
14‧‧‧目的地器件
16‧‧‧電腦可讀媒體
18‧‧‧視訊來源
19‧‧‧深度估計單元
20‧‧‧視訊編碼器/視訊寫碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器/視訊寫碼器
31‧‧‧以深度影像為基礎之顯現(DIBR)單元
32‧‧‧顯示器件
35‧‧‧分割單元
41‧‧‧預測處理單元
42‧‧‧運動及視差估計單元
44‧‧‧運動及視差補償單元
46‧‧‧框內預測處理單元
50‧‧‧求和器
52‧‧‧變換單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧反量化單元
60‧‧‧反變換處理單元
62‧‧‧求和器
63‧‧‧濾波器單元
64‧‧‧參考圖像記憶體
80‧‧‧熵解碼單元
81‧‧‧預測處理單元
82‧‧‧運動及視差補償單元
84‧‧‧框內預測處理模組/框內預測處理單元
86‧‧‧反量化單元
88‧‧‧反變換處理單元
90‧‧‧求和器
91‧‧‧濾波器單元
92‧‧‧參考圖像記憶體
120‧‧‧候選區塊
121‧‧‧左下方(A0)空間位置
122‧‧‧左側(A1)空間位置
123‧‧‧右上方(B0)空間位置
124‧‧‧上方(B1)空間位置/上方區塊
125‧‧‧左上方(B2)空間位置
126‧‧‧時間(T)位置
127‧‧‧當前區塊
140‧‧‧當前預測單元(PU)
142‧‧‧對應區塊
圖1為說明可利用本發明之框間預測技術之實例視訊編碼及解碼系統的方塊圖。
圖2為說明用於多視圖視訊之實例解碼次序的概念圖。
圖3為說明用於多視圖視訊之實例預測結構的概念圖。
圖4展示可在合併模式及AMVP模式兩者下使用之實例候選區塊集合。
圖5為說明視圖間預測之運動向量候選者之實例導出程序的概念圖。
圖6為說明可實施本發明之框間預測技術之視訊編碼器之實例的方塊圖。
圖7為說明可實施本發明之框間預測技術之視訊解碼器之實例的方塊圖。
圖8為展示根據本發明之技術之實例編碼程序的流程圖。
圖9為展示根據本發明之技術之實例解碼程序的流程圖。
本發明描述與在多視圖視訊寫碼中(包括在通常被稱作3D HEVC之新興三維高效率視訊寫碼標準中)之運動參數之傳信有關的技術。視訊壓縮技術可包括基於視訊資料之已經寫碼區塊而預測視訊資料之當前區塊。在本發明中,術語當前區塊通常指代當前正被寫碼(例如,編碼或解碼)之視訊資料區塊,此與已經寫碼之視訊區塊或仍待寫碼之視訊區塊相對。在框內預測模式下,基於與當前區塊相同之圖像中之一或多個經先前寫碼區塊而預測當前區塊,而在框間預測模式下,基於不同圖像中之已經寫碼區塊而預測當前區塊。不同圖像可為來自與當前區塊相同之視圖的不同時間例項之圖像,或可為來自相同時間例項但來自不同視圖之圖像。
當視訊解碼器將針對給定視訊區塊而執行框間預測時,在經編碼視訊位元串流中傳信運動參數。舉例而言,運動參數定義運動向量、參考圖像索引及預測方向,使得視訊解碼器可判定哪一圖像中之哪一區塊將用作用於當前區塊之預測性區塊。視訊寫碼器可使用用於在經編碼位元串流中傳信運動參數之各種模式。為了縮減實施框間預測性寫碼所需要之位元之數目,彼等模式中之一些可利用運動參數之預測,而非運動參數之明確傳信。在開發中之HEVC標準中,存在用於運動參數之預測之各種模式,其中之一者被稱作合併模式。在合併模式下,視訊寫碼器使用來自相鄰區塊(包括空間相鄰區塊及時間相鄰區塊,且在3D-HEVC之狀況下亦包括視圖間相鄰區塊)之運動參數作為候選者而建構運動參數(例如,參考圖像及運動向量)之候選者清單。藉由傳輸自候選者清單選擇之候選者之索引而將選定運動參數自視訊編碼器傳信至視訊解碼器。在視訊解碼器處,一旦解碼索引,就繼承選定候選者之對應區塊之所有運動參數。視訊編碼器及視訊解碼
器經組態以基於已經寫碼區塊而建構相同清單。因此,基於索引,視訊解碼器可識別由視訊編碼器選擇之候選者之運動參數。
用於預測運動參數之另一模式為跳過模式。跳過模式通常以上文針對合併模式所描述之相同方式而操作,但在跳過模式下,不將殘餘資料添加至預測之區塊,而在合併模式下,將殘餘資料添加至預測之區塊。通常亦在跳過模式下執行上文參考合併模式所描述的清單之建構及用以識別清單中之候選者的索引之傳輸。
用於預測運動參數之另一模式為進階運動向量預測(AMVP)模式。在AMVP模式下,基於經寫碼參考索引而導出用於每一運動假設之運動向量預測子之候選者清單。此清單包括與相同參考索引相關聯之相鄰區塊之運動向量,以及基於時間參考圖像中之共置型區塊之相鄰區塊之運動參數而導出的時間運動向量預測子。藉由將索引傳輸至候選者清單中而傳信選定運動向量。此外,亦傳信參考索引值及運動向量差。在本發明中,術語運動向量預測子通常用以指代供預測一或多個運動向量之任何運動向量。在一些例子中,運動向量預測子及預測之運動向量可相同,而在其他例子中,運動向量預測子及預測之運動向量可不同。舉例而言,在AMVP模式下,預測之運動向量對應於運動向量預測子加運動向量差值。本發明亦提及術語方向運動預測子,其通常指代與特定方向(亦即,特定參考圖像清單)相關聯之運動向量預測子。在雙向預測之狀況下,運動向量預測子可包括兩個方向運動預測子。
視差向量通常用以識別視圖間參考圖像中對應於當前視圖之當前區塊之區塊的位置。為了導出用於當前區塊之視差向量(DV),在3D-HEVC測試模型(3D-HTM)之一些當前版本中使用被稱為以相鄰區塊為基礎之視差向量(NBDV)導出的技術。NBDV利用來自當前區塊之空間及時間相鄰區塊之視差運動向量。在NBDV中,以固定次序來
檢查空間或時間相鄰區塊之視差運動向量。一旦識別視差運動向量(亦即,指向視圖間參考圖像之運動向量),就終止檢查程序且將經識別視差運動向量轉換至用於當前區塊之DV。該DV可用於視圖間運動預測及/或視圖間殘差預測中。若在檢查所有預定義相鄰區塊之後未發現視差運動向量,則可將零DV用於視圖間運動預測,而可針對對應預測單元(PU)而停用視圖間殘餘預測。
基於DV,在可用時,被稱作視圖間預測之運動向量的新運動向量候選者可添加至用於AMVP及跳過/合併模式之候選者清單。在可用時,視圖間預測之運動向量為時間運動向量。
在跳過/合併抑或AMVP模式期間,可能存在高達兩個視圖間預測之運動向量,其分別對應於RefPicList0及RefPicList1。此兩個運動向量分別被表示為視圖間預測之運動向量0及視圖間預測之運動向量1。
上文所概述的在以HEVC為基礎之多視圖/3DV寫碼中的視圖間預測之運動向量導出程序之當前設計具有一些潛在缺點。作為一實例,在3D-HTM中之合併/跳過模式之當前設計中,當一個參考圖像清單X(其中X為0或1)中之對應區塊之參考圖像為時間參考圖像,且其圖像次序計數(POC)值不等於當前PU/CU之RefPicListLX中之任何項目的POC值,但等於當前PU/CU之RefPicListLY中之一個項目的POC值時,亦將對應運動向量視為不可用於RefPicListLY,尤其是當RefPicListLY之預測利用旗標等於0時。作為另一實例,當對應區塊之參考圖像之POC不同於當前CU/PU之參考圖像清單之任何項目的POC時,將視圖間預測之運動向量視為不可用。作為又一實例,在3D-HTM中之AMVP模式之當前設計中,始終首先檢查對應區塊之參考圖像清單0之運動資訊,而不管目標參考圖像清單為0抑或1。
本發明提議可改良以HEVC為基礎之多視圖或3DV寫碼中的視圖
間預測之運動向量之寫碼效率的各種技術。根據一技術,在跳過/合併模式下,若對應區塊(藉由視差向量而定位)具有指代時間參考圖像之運動向量mvLX(其中X為0或1),則其用以不僅預測視圖間預測之運動向量X,而且預測視圖間預測之運動向量Y(其中Y等於1-X)。換言之,若對應區塊具有運動向量mvL1,則通常(亦即,使用根據習知3D-HTM而實施之視訊寫碼器)僅使用mvL1以預測視圖間預測之運動向量1,且若視圖間預測之運動向量1不可用,則不將視圖間預測之運動候選者添加至跳過/合併模式候選者清單。相似地,若對應區塊具有運動向量mvL0,則(再次根據習知3D-HTM)僅使用mvL0以預測視圖間預測之運動向量0,且若視圖間預測之運動向量0不可用,則不將視圖間預測之運動候選者添加至跳過/合併模式候選者清單。然而,根據本發明之技術,若對應區塊具有運動向量mvL1且若視圖間預測之運動向量1不可用,則可檢查另一候選者(框間預測之運動向量0)之可用性,且在可用時,將其添加至候選者清單。相似地,若對應區塊具有運動向量mv0且若視圖間預測之運動向量0不可用,則可檢查另一候選者(框間預測之運動向量1)之可用性,且在可用時,將其添加至候選者清單。
若mvLX指代具有與當前圖塊之RefPicListX中之任何圖像相同之POC值的參考圖像,則將mvLX設定至視圖間預測之運動向量X,且將目標參考索引設定至RefPicListX中具有與參考圖像mvLX所指代之POC相同之POC的第一圖像。否則,若mvLY(其中,再次,Y=1-X)指代具有與當前圖塊中之RefPicListX中之任何圖像相同之POC值的參考圖像,則將mvLY設定至視圖間預測之運動向量X,且將目標參考索引設定至RefPicListX中具有與參考圖像mvLY所指代之POC相同之POC的第一圖像。
根據另一技術,在AMVP模式下,對於給定目標參考索引
refIdxLX,代替首先比較由對應區塊之mvL0指代的圖像之POC值與(當前圖塊之)RefPicListX[refIdxLX]之POC且接著比較由對應區塊之mvL1指代的圖像之POC值與(當前圖塊之)RefPicListX[refIdxLX]之POC,提議首先比較由mvLX指代的圖像之POC值且接著比較由mvLY指代的圖像之POC值(其中Y等於1-X)。一旦發現視圖間預測之運動向量,就終止比較程序。當比較指示出RefPicListX[refIdxLX]之POC值等於由mvL0或mvL1指代的圖像之POC值時,將視圖間預測之運動向量設定為可用且設定至mvL0或mvL1。
圖1為說明可利用本發明之技術之實例視訊編碼及解碼系統10的方塊圖。如圖1所展示,系統10包括來源器件12,其提供待在以後時間由目的地器件14解碼之經編碼視訊資料。詳言之,來源器件12經由電腦可讀媒體16而將視訊資料提供至目的地器件14。來源器件12及目的地器件14可包含廣泛範圍之器件中任一者,包括桌上型電腦、筆記型(例如,膝上型)電腦、平板電腦、機上盒、諸如所謂「智慧型」手機之電話手機、所謂「智慧型」鍵台、電視、相機、顯示器件、數位媒體播放器、視訊遊戲主控台、視訊串流器件或其類似者。在一些狀況下,來源器件12及目的地器件14可經裝備用於無線通信。
目的地器件14可經由電腦可讀媒體16而接收待解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼視訊資料自來源器件12移動至目的地器件14的任何類型之媒體或器件。在一實例中,電腦可讀媒體16可包含通信媒體以使來源器件12能夠即時地將經編碼視訊資料直接地傳輸至目的地器件14。經編碼視訊資料可根據諸如無線通信協定之通信標準予以調變,且傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成諸如區域網路、廣域網路或全域網路(諸如,網際網路)的以封包為基礎之網路之部分。通信媒體可包括路由器、交
換器、基地台,或可有用於促進自來源器件12至目的地器件14之通信之任何其他設備。
在一些實例中,可將經編碼資料自輸出介面22輸出至儲存器件。相似地,可由輸入介面自儲存器件存取經編碼資料。儲存器件可包括多種分散式或本端存取式資料儲存媒體中任一者,諸如,硬碟、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼視訊資料之任何其他合適數位儲存媒體。在一另外實例中,儲存器件可對應於可儲存由來源器件12產生之經編碼視訊之檔案伺服器或另一中間儲存器件。目的地器件14可經由串流或下載而自儲存器件存取經儲存視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將彼經編碼視訊資料傳輸至目的地器件14的任何類型之伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、FTP伺服器、網路附接式儲存(NAS)器件或本端磁碟機。目的地器件14可經由包括網際網路連接之任何標準資料連接而存取經編碼視訊資料。此標準資料連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等等)或此兩者之組合。經編碼視訊資料自儲存器件之傳輸可為串流傳輸、下載傳輸或其組合。
本發明之技術未必限於無線應用或設定。該等技術可應用於視訊寫碼以支援多種多媒體應用中任一者,諸如,空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(諸如,經由HTTP之動態自適應性串流(DASH))、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上之數位視訊之解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,來源器件12包括視訊來源18、深度估計單元
19、視訊編碼器20及輸出介面22。目的地器件14包括輸入介面28、視訊解碼器30、以深度影像為基礎之顯現(DIBR)單元31及顯示器件32。在其他實例中,來源器件及目的地器件可包括其他組件或配置。舉例而言,來源器件12可自外部視訊來源18(諸如,外部攝影機)接收視訊資料。同樣地,目的地器件14可與外部顯示器件介接,而非包括整合式顯示器件。本發明所描述之技術中之許多者可由視訊編碼器20及視訊解碼器30兩者執行。因此,出於解釋簡易起見,視訊編碼器20及視訊解碼器30有時可聯合地被稱作視訊寫碼器20/30。關於視訊寫碼器20/30所描述之技術可由視訊編碼器20抑或視訊解碼器30執行。
圖1之所說明系統10僅為一實例。本發明之技術可由任何數位視訊編碼及/或解碼器件執行。雖然本發明之技術通常係由視訊編碼器件執行,但該等技術亦可由視訊編碼器/解碼器(通常被稱作「CODEC」)執行。此外,本發明之技術亦可由視訊預處理器執行。來源器件12及目的地器件14僅為此類寫碼器件之實例,其中來源器件12產生用於傳輸至目的地器件14之經寫碼視訊資料。在一些實例中,器件12、14可以實質上對稱方式而操作,使得器件12、14中每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、14之間的單向或雙向視訊傳輸,例如,用於視訊串流、視訊播放、視訊廣播或視訊電話。
來源器件12之視訊來源18可包括視訊捕捉器件,諸如,視訊攝影機、含有經先前捕捉視訊之視訊封存檔,及/或用以自視訊內容提供者接收視訊之視訊饋送介面。作為一另外替代例,視訊來源18可產生以電腦圖形為基礎之資料作為來源視訊,或實況視訊、經封存視訊及經電腦產生視訊之組合。在一些狀況下,若視訊來源18為視訊攝影機,則來源器件12及目的地器件14可形成所謂攝影機電話或視訊電話。然而,如上文所提到,本發明所描述之技術大體上可適用於視訊
寫碼,且可應用於無線及/或有線應用。在每一狀況下,經捕捉、經預捕捉或經電腦產生視訊可由視訊編碼器20編碼。經編碼視訊資訊接著可由輸出介面22輸出至電腦可讀媒體16上。
視訊來源18可將視訊資料之多個視圖提供至視訊編碼器20。舉例而言,視訊來源18可對應於攝影機之陣列,每一攝影機具有相對於正被拍攝之特定場景之唯一水平位置。或者,視訊來源18可根據全異水平攝影機觀點而產生視訊資料,例如,使用電腦圖形。深度估計單元19可經組態以判定用於對應於紋理影像中之像素之深度像素的值。舉例而言,深度估計單元19可表示聲音導航及測距(SONAR)單元、光偵測及測距(LIDAR)單元,或能夠直接地在記錄場景之視訊資料時實質上同時地判定深度值之其他單元。
另外或替代地,深度估計單元19可經組態以間接地藉由比較根據不同水平攝影機觀點實質上同時地捕捉之兩個或兩個以上影像而計算深度值。藉由計算影像中之實質上相似像素值之間的水平視差,深度估計單元19可近似場景中之各種物件之深度。在一些實例中,深度估計單元19可功能上與視訊來源18整合。舉例而言,當視訊來源18產生電腦圖形影像時,深度估計單元19可提供用於圖形物件之實際深度圖,例如,使用用以顯現紋理影像之像素及物件之z座標。
電腦可讀媒體16可包括:暫時性媒體,諸如,無線廣播或有線網路傳輸;或儲存媒體(亦即,非暫時性儲存媒體),諸如,硬碟、隨身碟、緊密光碟、數位視訊光碟、藍光光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(未圖示)可自來源器件12接收經編碼視訊資料,且(例如)經由網路傳輸而將經編碼視訊資料提供至目的地器件14。相似地,媒體生產設施(諸如,光碟壓印設施)之計算器件可自來源器件12接收經編碼視訊資料且產生含有經編碼視訊資料之光碟。因此,在各種實例中,可將電腦可讀媒體16理解為包括各種形式之一或
多個電腦可讀媒體。
目的地器件14之輸入介面28自電腦可讀媒體16接收資訊。電腦可讀媒體16之資訊可包括由視訊編碼器20定義之語法資訊,其亦係由視訊解碼器30使用,該語法資訊包括描述區塊及其他經寫碼單元(例如,GOP)之特性及/或處理的語法元素。顯示器件32向使用者顯示經解碼視訊資料,且可包含多種顯示器件中任一者,諸如,陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器,或另一類型之顯示器件。在一些實例中,顯示器件32可包含能夠同時地或實質上同時地顯示兩個或兩個以上視圖之器件,例如,以針對檢視者產生3D視覺效果。
目的地器件14之DIBR單元31可使用自視訊解碼器30接收之經解碼視圖之紋理及深度資訊來顯現經合成視圖。舉例而言,DIBR單元31可依據對應深度圖中之像素之值而判定用於紋理影像之像素資料的水平視差。DIBR單元31接著可藉由使紋理影像中之像素向左或向右偏移達經判定水平視差而產生經合成影像。以此方式,顯示器件32可顯示以任何組合之一或多個視圖,其可對應於經解碼視圖及/或經合成視圖。根據本發明之技術,視訊解碼器30可將用於深度範圍及攝影機參數之原始及經更新精確度值提供至DIBR單元31,DIBR單元31可使用深度範圍及攝影機參數以適當地合成視圖。
雖然圖1中未圖示,但在一些態樣中,視訊編碼器20及視訊解碼器30各自可與一音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體,以處置共同資料串流或分離資料串流中之音訊及視訊兩者之編碼。在適用時,MUX-DEMUX單元可符合ITU H.223多工器協定,或諸如使用者資料報協定(UDP)之其他協定。
視訊編碼器20及視訊解碼器30可根據諸如目前在開發中之高效率視訊寫碼(HEVC)標準的視訊寫碼標準而操作,且可符合HEVC測試
模型(HM)。
即將到來之HEVC標準之一最近草稿描述於Bross等人之文件HCTVC-J1003之「High Efficiency Video Coding(HEVC)Text Specification Draft 8」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合合作團隊(JCT-VC),第10次會議:瑞典斯德哥爾摩,2012年7月11日至2012年7月12日)中,至2013年8月15日為止,其可自http://phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J1003-v8.zip下載而得。被稱作「HEVC工作草稿10」或「WD10」的HEVC標準之另一最近草稿描述於Bross等人之文件JCTVC-L1003v34之「High efficiency video coding(HEVC)text specification draft 10(for FDIS & Last Call)」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合合作團隊(JCT-VC),第12次會議:瑞士日內瓦,2013年1月14日至23日)中,至2013年8月15日為止,其可自http://phenix.intevry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip下載而得。在本文中被稱作「WD10修訂」的HEVC標準之又一草稿描述於Bross等人之「Editors' proposed corrections to HEVC version 1」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合合作團隊(JCT-VC),第13次會議:韓國仁川,2013年4月)中,至2013年8月15日為止,其可得自http://phenix.intevry.fr/jct/doc_end_user/documents/13_Incheon/wg11/JCTVC-M0432-v3.zip。
出於說明之目的,主要關於HEVC之3DV延伸而描述本發明之技術。然而,應理解,此等技術亦可應用於寫碼用以產生三維效果之視訊資料的其他標準。
VCEG及MPEG之3D視訊寫碼聯合合作團隊(JCT-3C)正開發基於HEVC之3DV標準,針對該標準之標準化努力之部分包括基於HEVC
之多視圖視訊編碼解碼器(MV-HEVC)及用於基於HEVC之3D視訊寫碼(3D-HEVC)之另一部分的標準化。對於MV-HEVC,通常希望僅存在相對於HEVC之高層級語法(HLS)改變,使得HEVC中之CU/PU層級中無模組需要被重新設計,且可完全地再用於MV-HEVC。對於3D-HEVC,可包括及支援用於紋理視圖及深度視圖兩者之新寫碼工具,包括在單元/預測單元層級處之寫碼中的寫碼工具。至2013年8月15日為止,用於3D-HEVC之最新軟體3D-HTM可自以下連結下載而得:https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/trunk/。
或者,視訊編碼器20及視訊解碼器30可根據諸如ITU-T H.264標準(或者被稱作MPEG-4第10部分之進階視訊寫碼(AVC))之其他專屬或工業標準或諸如ITU-T H.264/AVC之MVC延伸的此類標準之延伸而操作。詳言之,本發明之技術係與基於進階編碼解碼器之多視圖及/或3D視訊寫碼有關。一般而言,本發明之技術可應用於多種不同視訊寫碼標準中任一者。舉例而言,此等技術可應用於ITU-T H.264/AVC之多視圖視訊寫碼(MVC)延伸(進階視訊寫碼)、即將到來之HEVC標準之3D視訊(3DV)延伸(例如,3D-HEVC)或其他寫碼標準。
ITU-T H.264/MPEG-4(AVC)標準係由ITU-T視訊寫碼專家團體(VCEG)與ISO/IEC動畫專家團體(MPEG)一起制訂為被稱為聯合視訊團隊(JVT)之共同合作夥伴關係之產品。在一些態樣中,本發明所描述之技術可應用於大體上符合H.264標準之器件。H.264標準係由ITU-T研究團體且在日期為2005年3月描述於ITU-T推薦H.264(用於泛型視聽服務之進階視訊寫碼)中,其可在本文中被稱作H.264標準或H.264規格,或H.264/AVC標準或規格。聯合視訊團隊(JVT)繼續致力於對H.264/MPEG-4 AVC之延伸。
視訊編碼器20及視訊解碼器30各自可被實施為多種合適編碼器電路系統中任一者,諸如,一或多個微處理器、數位信號處理器
(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術係部分地以軟體予以實施時,一器件可將用於該軟體之指令儲存於合適非暫時性電腦可讀媒體中,且使用一或多個處理器而以硬體來來執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中每一者可包括於一或多個編碼器或解碼器中,該一或多個編碼器或解碼器中任一者可被整合為各別器件中之組合式編碼器/解碼器(CODEC)之部分。包括視訊編碼器20及/或視訊解碼器30之器件可包含積體電路、微處理器,及/或無線通信器件,諸如,蜂巢式電話。
最初,將論述HEVC之實例寫碼技術。JCT-VC正致力於HEVC標準之開發。HEVC標準化努力係基於被稱作HEVC測試模型(HM)的視訊寫碼器件之演進模型。HM推測視訊寫碼器件相對於根據(例如)ITU-T H.264/AVC之現有器件的若干額外能力。然而,舉例而言,H.264提供九個框內預測編碼模式,而HM可提供多達三十三個角度框內預測編碼模式加DC及平面模式。
一般而言,HM之工作模型描述出視訊圖框或圖像可劃分成包括亮度樣本及色度樣本兩者之一連串樹區塊或最大寫碼單元(LCU)。位元串流內之語法資料可定義用於LCU之大小,LCU為在像素之數目方面的最大寫碼單元。圖塊包括以寫碼次序之數個連續樹區塊。視訊圖框或圖像可分割成一或多個圖塊。每一樹區塊可根據四元樹而分裂成寫碼單元(CU)。一般而言,四元樹資料結構包括每CU一個節點,其中根節點對應於樹區塊。若將CU分裂成四個子CU,則對應於CU之節點包括四個葉節點,該等葉節點中每一者對應於該等子CU中之一者。
四元樹資料結構之每一節點可提供用於對應CU之語法資料。舉例而言,四元樹中之節點可包括分裂旗標,其指示對應於該節點之
CU是否分裂成子CU。用於CU之語法元素可被遞歸地定義,且可取決於CU是否分裂成子CU。若CU未被進一步分裂,則其被稱作葉CU。在本發明中,即使不存在原始葉CU之明確分裂,葉CU之四個子CU亦將被稱作葉CU。舉例而言,若在16×16大小下之CU未被進一步分裂,則四個8×8子CU亦將被稱作葉CU,但16×16CU從未被分裂。
CU具有與H.264標準之巨集區塊相似的目的,惟CU不具有大小區別除外。舉例而言,樹區塊可分裂成四個子節點(亦被稱作子CU),且每一子節點又可為父節點且分裂成另外四個子節點。被稱作四元樹之葉節點的最終未分裂子節點包含寫碼節點,其亦被稱作葉CU。與經寫碼位元串流相關聯之語法資料可定義樹區塊可被分裂之最大次數(其被稱作最大CU深度),且亦可定義寫碼節點之最小大小。因此,位元串流亦可定義最小寫碼單元(SCU)。本發明使用術語「區塊」以指代在HEVC之上下文中的CU、PU或TU中任一者,或在其他標準之上下文中的相似資料結構(例如,H.264/AVC中之巨集區塊及其子區塊)。
CU包括寫碼節點以及與寫碼節點相關聯之預測單元(PU)及變換單元(TU)。CU之大小對應於寫碼節點之大小且必須為正方形形狀。CU之大小的範圍可為自8×8像素直至最大值為64×64像素或更大的樹區塊之大小。每一CU可含有一或多個PU及一或多個TU。舉例而言,與CU相關聯之語法資料可描述將CU分割成一或多個PU。分割模式在CU被跳過或合併模式編碼、框內預測模式編碼抑或框間預測模式編碼之間可不同。可將PU分割成非正方形形狀。舉例而言,與CU相關聯之語法資料亦可描述根據四元樹而將CU分割成一或多個TU。TU可為正方形或非正方形(例如,矩形)形狀。
HEVC標準允許根據TU之變換,其對於不同CU可不同。TU通常係基於針對經分割LCU所定義之給定CU內之PU的大小而被定大小,
但可並非始終為此狀況。TU通常具相同大小或小於PU。在一些實例中,可使用被稱為「殘餘四元樹」(RQT)之四元樹結構而將對應於CU之殘餘樣本再分成較小單元。RQT之葉節點可被稱作變換單元(TU)。與TU相關聯之像素差值可經變換以產生可被量化之變換係數。
葉CU可包括一或多個預測單元(PU)。一般而言,PU表示對應於對應CU之全部或部分的空間區,且可包括用於擷取用於PU之參考樣本的資料。此外,PU包括與預測有關之資料。舉例而言,當PU被框內模式編碼時,用於PU之資料可包括於殘餘四元樹(RQT)中,RQT可包括描述用於對應於PU之TU之框內預測模式的資料。作為另一實例,當PU被框間模式編碼時,PU可包括定義用於PU之一或多個運動向量的資料。舉例而言,定義用於PU之運動向量的資料可描述運動向量之水平分量、運動向量之垂直分量、用於運動向量之解析度(例如,四分之一像素精確度或八分之一像素精確度)、運動向量所指向之參考圖像,及/或用於運動向量之參考圖像清單(例如,清單0、清單1或清單C)。
具有一或多個PU之葉CU亦可包括一或多個變換單元(TU)。可使用RQT(亦被稱作TU四元樹結構)來指定變換單元,如上文所論述。舉例而言,分裂旗標可指示葉CU是否分裂成四個變換單元。接著,每一變換單元可進一步分裂成另外子TU。當TU未被進一步分裂時,其可被稱作葉TU。通常,對於框內寫碼,屬於葉CU之所有葉TU共用相同框內預測模式。亦即,通常應用相同框內預測模式以計算用於葉CU之所有TU之預測值。對於框內寫碼,視訊編碼器可使用框內預測模式來計算用於每一葉TU之殘餘值,作為對應於TU的CU之部分與原始區塊之間的差。TU未必限於PU之大小。因此,TU可大於或小於PU。對於框內寫碼,PU可與用於同一CU之對應葉TU共置。在一些實例中,葉TU之最大大小可對應於對應葉CU之大小。
此外,葉CU之TU亦可與被稱作殘餘四元樹(RQT)之各別四元樹資料結構相關聯。亦即,葉CU可包括指示葉CU如何分割成TU之四元樹。TU四元樹之根節點通常對應於葉CU,而CU四元樹之根節點通常對應於樹區塊(或LCU)。未被分裂的RQT之TU被稱作葉TU。一般而言,本發明分別使用術語CU及TU以指代葉CU及葉TU,除非另有提及。
視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)通常包含該等視訊圖像中之一系列一或多個視訊圖像。GOP可在GOP之標頭、圖像中之一或多者之標頭中或在別處包括語法資料,該語法資料描述包括於GOP中之數個圖像。圖像之每一圖塊可包括描述用於各別圖塊之編碼模式的圖塊語法資料。視訊編碼器20通常對個別視訊圖塊內之視訊區塊進行操作以便編碼視訊資料。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化大小,且其大小可根據經指定寫碼標準而不同。
作為一實例,HM支援在各種PU大小下之預測。假定特定CU之大小為2N×2N,則HM支援在2N×2N或N×N之PU大小下之框內預測及在2N×2N、2N×N、N×2N或N×N之對稱PU大小下之框間預測。HM亦支援用於在2N×nU、2N×nD、nL×2N及nR×2N之PU大小下之框間預測的不對稱分割。在不對稱分割中,CU之一個方向未被分割,而另一方向分割成25%及75%。對應於25%分割區的CU之部分係由「n」繼之以「上」、「下」、「左」或「右」之指示而指示。因此,舉例而言,「2N×nUJ指代在頂部具有2N×0.5N PU且在底部具有2N×1.5N PU的經水平地分割之2N×2N CU。
在本發明中,「N×N」及「N乘N」可互換式地用以指代在垂直及水平維度方面的視訊區塊之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16區塊將在垂直方向上具有16個像素(y=16)且在
水平方向上具有16個像素(x=16)。同樣地,N×N區塊通常在垂直方向上具有N個像素且在水平方向上具有N個像素,其中N表示非負整數值。區塊中之像素可以列及行而配置。此外,區塊未必需要在水平方向上與在垂直方向上具有相同數目個像素。舉例而言,區塊可包含N×M像素,其中M未必等於N。
在使用CU之PU的框內預測性或框間預測性寫碼之後,視訊編碼器20可計算用於CU之TU的殘餘資料。PU可包含描述在空間域(亦被稱作像素域)中產生預測性像素資料之方法或模式的語法資料,且TU可包含在將變換(例如,離散餘弦變換(DCT)、整數變換、小波變換或概念上相似變換)應用於殘餘視訊資料之後的在變換域中之係數。殘餘資料可對應於未經編碼圖像之像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括用於CU之殘餘資料的TU,且接著變換TU以產生用於CU之變換係數。
在用以產生變換係數之任何變換之後,視訊編碼器20可執行變換係數之量化。量化通常指代變換係數經量化以可能地縮減用以表示係數之資料之量而提供進一步壓縮的程序。量化程序可縮減與係數中之一些或全部相關聯的位元深度。舉例而言,可在量化期間將n
位元值降值捨位至m
位元值,其中n
大於m
。
在量化之後,視訊編碼器可掃描變換係數,從而自包括經量化變換係數之二維矩陣產生一維向量。掃描可經設計成將較高能量(且因此,較低頻率)係數置放於陣列前方且將較低能量(且因此,較高頻率)係數置放於陣列後方。在一些實例中,視訊編碼器20可利用預定義掃描次序以掃描經量化變換係數,以產生可被熵編碼之串列化向量。在其他實例中,視訊編碼器20可執行自適應性掃描。在掃描經量化變換係數以形成一維向量之後,視訊編碼器20可熵編碼一維向量,例如,根據上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性
二進位算術寫碼(CABAC)、以語法為基礎之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法。視訊編碼器20亦可熵編碼與經編碼視訊資料相關聯之語法元素以供視訊解碼器30用來解碼視訊資料。
為了執行CABAC,視訊編碼器20可將上下文模型內之上下文指派至待傳輸符號。舉例而言,上下文可關於符號之相鄰值是否為非零。為了執行CAVLC,視訊編碼器20可選擇用於待傳輸符號之可變長度碼。VLC中之碼字可經建構成使得相對較短碼對應於較可能符號,而較長碼對應於較不可能符號。以此方式,VLC之使用相比於(例如)針對每一待傳輸符號使用相等長度碼字可達成位元節省。機率判定可基於指派至符號之上下文。
在此章節中,將論述多視圖及多視圖加深度寫碼技術。最初,將論述MVC技術。如上文所提及,MVC為ITU-T H.264/AVC之延伸。在MVC中,用於複數個視圖之資料係以時間優先次序予以寫碼,且因此,解碼次序配置被稱作時間優先寫碼(time-first coding)。詳言之,可寫碼用於共同時間例項時之複數個視圖中每一者的視圖分量(亦即,圖像),接著可寫碼用於不同時間例項之另一視圖分量集合,等等。存取單元可包括用於一個輸出時間例項之所有視圖之經寫碼圖像。應理解,存取單元之解碼次序未必與輸出(或顯示)次序相同。
圖2展示典型MVC解碼次序(亦即,位元串流次序)。解碼次序配置被稱作時間優先寫碼。應注意,存取單元之解碼次序可不與輸出或顯示次序相同。在圖2中,S0至S7各自指代多視圖視訊之不同視圖。T0至T8各自表示一個輸出時間例項。存取單元可包括用於一個輸出時間例項之所有視圖之經寫碼圖像。舉例而言,第一存取單元可包括用於時間例項T0之所有視圖S0至S7,第二存取單元可包括用於時間例項T1之所有視圖S0至S7,等等。
出於簡潔之目的,本發明可使用以下定義:視圖分量:
單一存取單元
中的視圖
之經寫碼表示
。當視圖包括經寫碼紋理及深度表示兩者時,視訊分量由紋理視圖分量及深度視圖分量組成。
紋理視圖分量:
單一存取單元
中的視圖之紋理之經寫碼表示
。
深度視圖分量:
單一存取單元
中的視圖之深度之經寫碼表示
。
在圖2中,該等視圖中每一者包括圖像集合。舉例而言,視圖S0包括圖像0、8、16、24、32、40、48、56及64之集合,且視圖S1包括圖像1、9、17、25、33、41、49、57及65之集合,等等。每一集合包括兩個圖像:一個圖像被稱作紋理視圖分量,且另一圖像被稱作深度視圖分量。一視圖之圖像集合內的紋理視圖分量及深度視圖分量可被視為彼此對應。舉例而言,一視圖之圖像集合內的紋理視圖分量被視為對應於該視圖之圖像集合內的深度視圖分量,且反之亦然(亦即,深度視圖分量對應於其在該集合中之紋理視圖分量,且反之亦然)。如本發明所使用,對應於深度視圖分量之紋理視圖分量可被視為紋理視圖分量及深度視圖分量為單一存取單元之同一視圖之部分。
紋理視圖分量包括所顯示之實際影像內容。舉例而言,紋理視圖分量可包括亮度(Y)分量及色度(Cb及Cr)分量。深度視圖分量可指示其對應紋理視圖分量中之像素之相對深度。作為一實例,深度視圖分量為僅包括亮度值之灰階影像。換言之,深度視圖分量可不傳送任何影像內容,而是提供紋理視圖分量中之像素之相對深度的度量。
舉例而言,深度視圖分量中之純白色像素指示出其在對應紋理視圖分量中之對應像素根據檢視者之觀點較近,且深度視圖分量中之純黑色像素指示出其在對應紋理視圖分量中之對應像素根據檢視者之觀點較遠。在黑色與白色之間的各種灰度指示不同深度層級。舉例而言,深度視圖分量中之極灰像素指示出其在紋理視圖分量中之對應像
素遠於深度視圖分量中之稍灰像素。因為僅需要灰階以識別像素之深度,所以深度視圖分量無需包括色度分量,此係因為用於深度視圖分量之色彩值可不滿足任何目的。
僅使用亮度值(例如,強度值)以識別深度之深度視圖分量係出於說明目的而提供且不應被視為限制性。在其他實例中,可利用任何技術以指示紋理視圖分量中之像素之相對深度。
圖3展示用於多視圖視訊寫碼之典型MVC預測結構(包括每一視圖內之圖像間預測及視圖間預測兩者)。圖3中之預測方向係由箭頭指示,其中指向所到達之物件(pointed-to object)使用指向所來自之物件(pointed-from object)作為預測參考。在MVC中,視圖間預測係由使用H.264/AVC運動補償之語法的視差運動補償支援,但允許使用不同視圖中之圖像作為參考圖像。
在圖3之實例中,說明六個視圖(具有視圖ID「S0」至「S5」),且針對每一視圖說明十二個時間位置(「T0」至「T11」)。亦即,圖3中之每一列對應於一視圖,而每一行指示一時間位置。
雖然MVC具有可由H.264/AVC解碼器解碼之所謂基本視圖且立體視圖對可亦由MVC支援,但MVC之優勢為:其可支援使用兩個以上視圖作為3D視訊輸入且解碼由多個視圖表示之此3D視訊的實例。具有MVC解碼器的用戶端之顯現器可期望具有多個視圖之3D視訊內容。
圖3中之圖像係在每一列與每一行之相交點處被指示。H.264/AVC標準可使用術語圖框以表示視訊之部分。本發明可互換式地使用術語圖像及圖框。
圖3中之圖像係使用包括字母之區塊予以說明,字母指明對應圖像被框內寫碼(亦即,I圖像),抑或在一個方向上被框間寫碼(亦即,作為P圖像)或在多個方向上被框間寫碼(亦即,作為B圖像)。一般而
言,預測係由箭頭指示,其中指向所到達之圖像使用指向所來自之圖像以用於預測參考。舉例而言,在時間位置T0處的視圖S2之P圖像係自在時間位置T0處的視圖S0之I圖像予以預測。
如同單一視圖視訊編碼一樣,可關於不同時間位置處之圖像預測性地編碼多視圖視訊寫碼視訊序列之圖像。舉例而言,在時間位置T1處的視圖S0之b圖像具有自在時間位置T0處的視圖S0之I圖像指向至b圖像的箭頭,其指示出b圖像係自I圖像予以預測。然而,另外,在多視圖視訊編碼之上下文中,圖像可被視圖間預測。亦即,視圖分量可使用其他視圖中之視圖分量以用於參考。舉例而言,在MVC中,視圖間預測被實現,就好像另一視圖中之視圖分量為框間預測參考一樣。潛在視圖間參考係在序列參數集(SPS)MVC延伸中被傳信,且可藉由參考圖像清單建構程序而修改,此情形實現框間預測或視圖間預測參考之靈活排序。視圖間預測亦為HEVC之所提議多視圖延伸之特徵,包括3D-HEVC(多視圖加深度)。
圖3提供視圖間預測之各種實例。在圖3之實例中,視圖S1之圖像被說明為自視圖S1之不同時間位置處的圖像予以預測,以及自相同時間位置處的視圖S0及S2之圖像予以視圖間預測。舉例而言,在時間位置T1處的視圖S1之b圖像係自在時間位置T0及T2處的視圖S1之B圖像以及在時間位置T1處的視圖S0及S2之b圖像中每一者予以預測。
在一些實例中,可將圖3看作說明紋理視圖分量。舉例而言,圖2所說明之I圖像、P圖像、B圖像及b圖像可被視為用於視圖中每一者之紋理視圖分量。根據本發明所描述之技術,對於圖3所說明之紋理視圖分量中每一者,存在一對應深度視圖分量。在一些實例中,可以相似於圖3中針對對應紋理視圖分量所說明之方式的方式來預測深度視圖分量。
兩個視圖之寫碼亦可由MVC支援。MVC之優勢中之一者為:
MVC編碼器可採取兩個以上視圖作為3D視訊輸入,且MVC解碼器可解碼此類多視圖表示。因而,具有MVC解碼器之任何再現器可期望具有兩個以上視圖之3D視訊內容。
在MVC中,在同一存取單元(亦即,具有相同時間例項)中之圖像之間允許視圖間預測。當寫碼非基本視圖中之一者中的圖像時,若一圖像位於不同視圖中但位於相同時間例項內,則可將該圖像添加至參考圖像清單中。可將視圖間參考圖像放於參考圖像清單之任何位置中,正如任何框間預測參考圖像一樣。如圖3所展示,視圖分量可使用其他視圖中之視圖分量以用於參考。在MVC中,視圖間預測被實現,就好像另一視圖中之視圖分量為框間預測參考一樣。
下文描述關於框間預測之一些相關HEVC技術,其可與多視圖寫碼(MV-HEVC)及/或具有深度之多視圖寫碼(3D-HEVC)一起使用。用於論述之第一技術為用於框間預測之參考圖像清單建構。
使用框間預測來寫碼PU涉及計算當前區塊(例如,PU)與參考圖框中之區塊之間的運動向量。運動向量係經由被稱為運動估計(或運動搜尋)之程序予以計算。舉例而言,運動向量可指示當前圖框中之預測單元相對於參考圖框之參考樣本的位移。參考樣本可為被發現接近地匹配於包括在像素差方面寫碼之PU的CU之部分的區塊,像素差可由絕對差總和(SAD)、平方差總和(SSD)或其他差量度判定。參考樣本可出現於參考圖框或參考圖塊內之任何地方。在一些實例中,參考樣本可出現於分率像素位置處。在發現最好地匹配於當前部分的參考圖框之部分後,編碼器即判定用於當前區塊之當前運動向量作為自當前區塊至參考圖框中之匹配部分(例如,自當前區塊之中心至匹配部分之中心)之位置的差。
在一些實例中,編碼器可在經編碼視訊位元串流中傳信用於每一區塊之運動向量。經傳信運動向量係由解碼器用以執行運動補償,
以便解碼視訊資料。然而,直接地傳信原始運動向量可引起較不有效率之寫碼,此係因為通常需要大數目個位元以傳送資訊。
在一些例子中,編碼器可針對每一分割區(亦即,針對每一PU)預測一運動向量,而非直接地傳信原始運動向量。在執行此運動向量預測時,編碼器可選擇自與當前區塊相同之圖框中之空間相鄰區塊判定的運動向量候選者集合,或自參考圖框(亦即,不同於當前圖框之圖框)中之共置型區塊判定的時間運動向量候選者。視訊編碼器20可執行運動向量預測,且在需要時,將索引傳信至參考圖像以預測運動向量,而非傳信原始運動向量,以縮減傳信中之位元速率。來自空間相鄰區塊之運動向量候選者可被稱作空間MVP候選者,而來自另一參考圖框中之共置型區塊之運動向量候選者可被稱作時間MVP候選者。
在HEVC標準中提議運動向量預測之兩個不同模式或類型。一個模式被稱作「合併」模式。另一模式被稱作自適應性運動向量預測(AMVP)。
在合併模式下,視訊編碼器20經由預測語法之位元串流傳信而指示視訊解碼器30自用於圖框之當前區塊的選定運動向量候選者複製運動向量、參考索引(在給定參考圖像清單中識別運動向量所指向之參考圖框)及運動預測方向(其識別參考圖像清單(清單0或清單1),亦即,在參考圖框時間上在當前圖框之前抑或之後方面)。此情形係藉由在位元串流中將識別選定運動向量候選者(亦即,特定空間MVP候選者或時間MVP候選者)之索引傳信至運動向量候選者清單中而實現。
因此,對於合併模式,預測語法可包括識別模式(在此狀況下,「合併」模式)之旗標,及識別選定運動向量候選者之索引。在一些例子中,運動向量候選者將位於關於當前區塊之因果性區塊中。亦即,運動向量候選者將已經由視訊解碼器30解碼。因而,視訊解碼器
30已經接收及/或判定用於因果性區塊之運動向量、參考索引及運動預測方向。因此,視訊解碼器30可簡單地自記憶體擷取與因果性區塊相關聯之運動向量、參考索引及運動預測方向,且複製此等值作為用於當前區塊之運動資訊。為了在合併模式下重新建構區塊,視訊解碼器30使用用於當前區塊之經導出運動資訊來獲得預測性區塊,且將殘餘資料添加至預測性區塊以重新建構經寫碼區塊。
應注意,對於跳過模式,產生同一合併候選者清單,但不傳信殘餘項目。出於簡單起見,由於跳過模式具有與合併模式相同之運動向量導出程序,故此文件所描述之所有技術應用於合併模式及跳過模式兩者。
在AMVP中,視訊編碼器20經由位元串流傳信而指示視訊解碼器30僅自候選區塊複製運動向量且使用經複製向量作為用於當前區塊之運動向量的預測子,且傳信運動向量差(MVD)。分離地傳信參考圖框及與當前區塊之運動向量相關聯的預測方向。MVD為用於當前區塊之當前運動向量與自候選區塊導出之運動向量預測子之間的差。在此狀況下,視訊編碼器20使用運動估計來判定用於待寫碼區塊之實際運動向量,且接著判定實際運動向量與運動向量預測子之間的差作為MVD值。以此方式,視訊解碼器30不使用運動向量候選者之確切複本作為當前運動向量(如在合併模式下),而是可使用可在值方面「接近」自運動估計判定之當前運動向量的運動向量候選者,且添加MVD以再生當前運動向量。為了在AMVP模式下重新建構區塊,解碼器添加對應殘餘資料以重新建構經寫碼區塊。
在大多數情況下,MVD相比於整個當前運動向量需要較少位元進行傳信。因而,相比於發送整個運動向量,AMVP允許當前運動向量之更精確傳信,同時維持寫碼效率。與此對比,合併模式未慮及MVD之規格,且因而,合併模式犧牲運動向量傳信之準確性以增加
傳信效率(亦即,較少位元)。用於AMVP之預測語法可包括用於模式之旗標(在此狀況下,AMVP旗標)、用於候選區塊之索引、當前運動向量與來自候選區塊之預測性運動向量之間的MVD、參考索引及運動預測方向。
圖4展示可在合併模式及AMVP模式兩者下使用之候選區塊120之實例集合。在此實例中,候選區塊位於左下方(A0)空間位置121、左側(A1)空間位置122、左上方(B2)空間位置125、上方(B1)空間位置124及右上方(B0)空間位置123中,且位於時間(T)位置126中。在此實例中,左側候選區塊122鄰近於當前區塊127之左側邊緣。左側區塊122之下部邊緣係與當前區塊127之下部邊緣對準。上方區塊124鄰近於當前區塊127之上部邊緣。上方區塊124之右側邊緣係與當前區塊127之右側邊緣對準。
區塊A0
、A1
、B0
、B1
及B2
通常被稱作空間相鄰區塊或空間相鄰PU。視訊寫碼器20/30可藉由首先判定當前PU(例如,圖4中之區塊127)之左頂部亮度樣本相對於當前圖像之左頂部樣本的位置而判定空間相鄰區塊之位置。此亮度位置將被稱作位置(xP,yP)。視訊寫碼器20/30可另外判定亮度PU之寬度(縮寫為nPSW)及亮度PU之高度(縮寫為nPSH)。基於當前PU之左頂部亮度樣本之位置以及當前PU之高度及寬度,可如下判定空間相鄰區塊之亮度樣本之位置:區塊A0包括位置(xP-1,yP+nPSH)處之亮度樣本;區塊A1包括位置(xP-1,yP+nPSH-1)處之亮度樣本;區塊B0包括位置(xP+nPSW,yP-1)處之亮度樣本;區塊B1包括位置(xP+nPSW-1,yP-1)處之亮度樣本;區塊B2包括位置(xP-1,yP-1)處之亮度樣本。
空間相鄰區塊可具相同大小或可具與當前PU不同之大小。
可使用上文所論述之空間相鄰區塊來導出供合併模式下使用之
候選者清單。可如由以下有序步驟所指定而導出用於兩個參考清單之運動向量及參考索引,該等有序步驟為用於空間合併候選者之導出程序之實例。作為導出程序之部分,視訊編碼器20及視訊解碼器20按以下次序來檢查空間相鄰PU之運動資訊:A1
、B1
、B0
、A0
或B2
。視訊編碼器20及視訊解碼器30可執行受約束剪除,以便縮減或消除將重複候選者添加至候選者清單。視訊寫碼器20/30可導出待包括於合併模式候選者清單中之空間候選者,如下:- 視訊寫碼器20/30在A1
可用時將A1
插入至候選者清單中。
- 若B1
及A1
具有相同運動向量及相同參考索引,則視訊寫碼器20/30不將B1
插入至候選者清單中。若B1
及A1
不具有相同運動向量及相同參考索引,則視訊寫碼器20/30在B1
可用時將B1
插入至候選者清單中。
- 若B0
及B1
具有相同運動向量及相同參考索引,則視訊寫碼器20/30不將B0
插入至候選者清單中。若B0
及B1
不具有相同運動向量及相同參考索引,則視訊寫碼器20/30在B0
可用時將B0
插入至候選者清單中。
- 若A0
及A1
具有相同運動向量及相同參考索引,則視訊寫碼器20/30不將A0
插入至候選者清單中。若A0
及A1
不具有相同運動向量及相同參考索引,則視訊寫碼器20/30在A0
可用時將A0
插入至候選者清單中。
- 當不滿足以下條件兩者時,視訊寫碼器20/30將B2
插入至候選者清單中:
- B2
及B1
或B2
及A1
具有相同運動向量及相同參考索引。
- 自A1
、B1
、B0
、A0
導出之所有四個空間合併候選者包括於候選者清單中。
視訊寫碼器20/30可導出待包括於合併模式候選者清單中之時間
候選者,如下:
- 為了取到時間合併候選者,視訊寫碼器20/30首先識別共置型圖像。若當前圖像為B圖塊,則在圖塊標頭中傳信語法元素「collocated_from_l0_flag」以指示共置型圖像來自RefPicList0抑或RefPicList1。
- 在視訊寫碼器20/30識別參考圖像清單之後,視訊寫碼器20/30使用圖塊標頭中傳信之語法元素collocated_ref_idx以識別清單中之圖像中之圖像。
- 視訊寫碼器20/30接著藉由檢查共置型圖像而識別共置型PU。視訊寫碼器20/30使用含有此PU的CU之右底部PU的運動抑或含有此PU的CU之中心PU內之右底部PU的運動作為時間候選者。
- 當藉由以上程序而識別之運動向量用以產生用於合併模式之運動候選者時,視訊寫碼器20/30可需要基於時間位置(由圖像次序計數(亦即,POC)反映)而按比例調整運動向量。
- 在HEVC中,PPS包括旗標enable_temporal_mvp_flag。當具有等於0之temporal_id的特定圖像指代具有等於0之enable_temporal_mvp_flag的PPS時,視訊寫碼器20/30可將DPB中之所有參考圖像標記為「未用於時間運動向量預測」,且來自按解碼次序在彼特定圖像之前的圖像之運動向量將不在解碼該特定圖像或按解碼次序在該特定圖像之後的圖像時用作時間運動向量預測子。
若當前圖塊為B圖塊且自上文所描述之空間及時間候選者導出程序導出的候選者之總數少於候選者之最大數目且大於1,則視訊寫碼器20/30可調用用於產生雙向預測性候選者之程序。視訊寫碼器20/30可導出待包括於合併模式候選者清單中之雙向預測性候選者,如下:
- 基於下表1,為了產生具有索引combIdx之組合式雙向預測性候選者,可由視訊寫碼器20/30再使用具有等於l0CandIdx之項目(在可用
時)的候選者清單之RefList0運動資訊(MotList0)及具有等於l1CandIdx之項目(在可用時)且與MotList0不相同的候選者清單之RefList1運動資訊(MotList1)作為組合式雙向預測性候選者之RefList0及RefList1運動資訊。
若自用於判定空間、時間及雙向預測性候選者之上文所描述之以上三種程序導出的候選者之總數產生數目少於最大數目之候選者,則視訊寫碼器20/30可導出待包括於合併模式候選者清單中之零運動向量候選者。在此類例子中,視訊寫碼器20/30可將用於每一參考圖像之零運動向量插入至候選者清單中。
在HEVC WD 10中,MRG清單中之候選者之總數高達5個,且傳信five_minus_max_num_merge_cand以指定圖塊標頭中自5個候選者減去之MRG候選者之最大數目。
為了進一步改良用於寫碼3D視訊之寫碼效率,已將兩種新技術(即,「視圖間運動預測」及「視圖間殘餘預測」)引入至3D-HEVC中。為了啟用此兩個寫碼工具,組態視訊寫碼器20/30以導出用於當前區塊之視差向量。
視訊寫碼器20/30可經組態以使用被稱作以相鄰區塊為基礎之視差向量(NBDV)的技術來導出視差向量,該技術利用來自空間及時間相鄰區塊之視差運動向量以判定用於當前區塊之視差向量。在NBDV中,視訊寫碼器20/30以固定檢查次序來檢查空間或時間相鄰區塊之運動向量,且一旦識別視差運動向量,亦即,運動向量指向視圖間參考圖像,視訊寫碼器20/30就終止檢查程序。視訊寫碼器20/30傳回經識別視差運動向量,且將其轉換至可在視圖間運動預測及視圖間殘餘
預測中使用之視差向量。若在檢查所有預定義相鄰區塊之後未發現視差運動向量,則視訊寫碼器20/30可使用零視差向量以用於視圖間運動預測,而可針對對應預測單元(PU)停用視圖間殘餘預測。
由視訊寫碼器20/30用於NBDV之區塊包括空間相鄰區塊及時間相鄰區塊。視訊寫碼器20/30分析高達五個空間相鄰區塊,作為導出視差向量之部分。五個空間相鄰區塊包括當前PU之左下方區塊、左邊區塊、右上方區塊、上方區塊及左上方區塊,其係由A0
、A1
、B0
、B1
或B2表示。在此方面,作為NBDV之部分而分析的空間相鄰區塊可對應於上文在圖4中關於合併模式所論述之相同空間相鄰區塊,但用於NBDV之空間相鄰區塊以及用於AMVP及合併模式之候選者清單建構未必相同。
視訊寫碼器20/30亦判定時間相鄰區塊。視訊寫碼器20/30可將來自當前視圖之所有參考圖像視作候選圖像,或在一些實施中,候選圖像之數目可受到進一步約束,例如,約束至四個候選圖像。視訊寫碼器20/30首先檢查共置型參考圖像,且以(例如)參考索引(refIdx)之遞增次序來檢查候選圖像中之其餘者。當RefPicList0[refIdx]及RefPicList1[refIdx]兩者皆可用時,RefPicListX[refIdx]位於另一圖像之前,其中X等於collocated_from_l0_flag。
對於每一候選圖像,視訊寫碼器20/30判定用於導出時間相鄰區塊之三個候選區域。當一區域覆蓋一個以上16×16區塊時,視訊寫碼器20/30可以(例如)光柵掃描次序來檢查此類區域中之所有16×16區塊。三個候選區域被定義如下:(1)CPU-當前PU或當前CU之共置型區域;(2)CLCU-覆蓋當前PU之共置型區域之最大寫碼單元(LCU);及(3)BR-CPU之右底部4×4區塊。
視訊寫碼器20/30可經組態成以特定次序(亦即,檢查次序)來檢查區塊。視訊寫碼器20/30可首先檢查空間相鄰區塊,繼之以檢查時
間相鄰區塊。舉例而言,五個空間相鄰區塊之檢查次序可被定義為A1
、B1
、B0
、A0
及B2
或任何其他此類次序。對於每一候選圖像,視訊寫碼器20/30可以檢查次序來檢查候選圖像中之三個候選區域。舉例而言,三個區域之檢查次序可對於第一非基本視圖而被定義為CPU、CLCU及BR,且對於第二非基本視圖而被定義為BR、CPU及CLU,或被定義為任何其他此類次序。
如上文所介紹,視訊寫碼器20/30可經組態以執行視圖間候選者導出。基於視差向量(DV),視訊寫碼器20/30可判定新運動向量候選者或視圖間預測之運動向量(在可用時),且添加新運動向量候選者或視圖間預測之運動向量至候選者清單以供在AMVP及跳過/合併模式下使用。在可用時,視圖間預測之運動向量為時間運動向量。
圖5展示視圖間預測之運動向量候選者的導出程序之實例。藉由發現不同視圖(例如,視圖0或V0)中對應於經當前寫碼視圖(視圖1或V1)中之當前PU 140的區塊142而計算視差向量。若對應區塊142未被框內寫碼且未被視圖間預測,且其參考圖像具有在當前PU 140之參考圖像清單中的POC值(例如,Ref0,List 0;Ref0,List1;Ref1,List 1,如圖5所展示),則使用用於對應區塊142之運動資訊作為視圖間預測之運動向量。如上文所敍述,可基於POC而按比例調整參考索引。
若視圖間預測之運動向量不可用,亦即,所有可用參考圖像清單之預測利用旗標兩者等於0,則將視差向量轉換至視圖間視差運動向量,視圖間視差運動向量係在與視圖間預測之運動向量(當其可用時)相同的位置中添加至AMVP或合併候選者清單內。
在跳過/合併模式抑或AMVP模式期間,可能存在高達兩個視圖間預測之運動向量,其分別對應於RefPicList0及RefPicList1。此兩個運動向量分別被表示為視圖間預測之運動向量0及視圖間預測之運動向量1。
對於一實例合併/跳過模式技術,視訊寫碼器20/30可如下導出視圖間預測之運動向量:
- 視訊寫碼器20/30藉由視差向量而在同一存取單元之參考視圖中定位當前PU/CU之對應區塊。
- 若對應區塊未被框內寫碼,則對於當前PU/CU之每一參考圖像清單(亦即,RefPicListLX,其中X為0或1),視訊寫碼器20/30可:
- 若對應區塊具有指代時間參考圖像之運動向量(mvLX)且時間參考圖像具有等於RefPicListLX中之一個項目之POC值的POC值,則視訊寫碼器20/30可將mvLX設定至視圖間預測之運動向量X且將目標參考索引設定至RefPicListX中之第一圖像,該第一圖像具有與參考圖像mvLX所指代之POC相同的POC。視訊寫碼器20/30可另外將由predFlagLXInterView表示的RefPicListLX之旗標設定至1,其指示出用於mvLX之預測子當前可用。否則,視訊寫碼器20/30將predFlagLXInterView設定至0,其指示用於mvLX之預測子當前不可用。若用於mvLX之預測子不可用,則不產生基於mvLX之AMVP候選者。若用於mvLX及mvLY(其中Y等於1-X)之預測子皆不可用,則不產生基於mvLX及mvLY之合併候選者。若用於mvLX之預測子中僅一者可用,則可產生基於可用候選者之合併候選者作為單向預測候選者。
在上述技術中,當一個參考圖像清單X(其中X為0或1)中之對應區塊之參考圖像為時間參考圖像,且其POC值不等於當前PU/CU之RefPicListLX中之任何項目的POC值但等於當前PU/CU之RefPicListLY中之一個項目的POC值時,亦將對應運動向量視為對於RefPicListLY不可用,包括當RefPicListLY之預測利用旗標等於0時。然而,根據本發明之技術,對於跳過/合併模式,若對應區塊(藉由視差向量而定位)具有指代時間參考圖像之運動向量mvLX(其中X為0或1),則視訊寫碼器20/30可經組態以使用mvLX以不僅預測視圖間預測之運動向量X,
而且預測視圖間預測之運動向量Y(其中Y等於1-X)。
因此,若mvLX指代具有與當前圖塊之RefPicListX中之任何圖像相同之POC值的參考圖像,則視訊寫碼器20/30可將mvLX設定至視圖間預測之運動向量X且將目標參考索引設定至RefPicListX中具有與參考圖像mvLX所指代之POC相同的POC之第一圖像。否則,若mvLY指代具有與當前圖塊中之RefPicListX中之任何圖像相同之POC值的參考圖像,則視訊寫碼器20/30可將mvLY設定至視圖間預測之運動向量X且將目標參考索引設定至RefPicListX中具有與參考圖像mvLY所指代之POC相同的POC之第一圖像。下文將提供視訊寫碼器20/30可如何使用mvLX以不僅預測視圖間預測之運動向量X而且預測視圖間預測之運動向量Y的更詳細實例。
對於一實例AMVP模式技術,若目標參考索引對應於時間運動向量,則視訊寫碼器20/30可如下導出視圖間預測運動向量:
- 視訊寫碼器20/30藉由視差向量而在同一存取單元之參考視圖中定位當前PU/CU之對應區塊。
- 在給出目標參考圖像清單(RefPicListLX,其中X係由0或1替換)及目標參考圖像索引Idx的情況下,則視訊寫碼器20/30如下導出視圖間預測之運動向量X:
a.視訊寫碼器20/30將用於RefPicListLX的視圖間預測之運動向量之可用旗標(availableFlagLXInterView)設定至0。
b.若對應區塊具有指代時間參考圖像之運動向量mvL0且參考圖像具有等於當前PU/CU之RefPicListLX[Idx]之POC值的POC值,則視訊寫碼器20/30將運動向量導出為用於RefPicListLX之視圖間預測之運動向量且將availableFlagLXInterView設定至1。
c.若availableFlagLXInterView等於0且對應區塊之mvL1所指向的參考圖像可用且並非視圖間參考圖像且其具有等於當前PU/CU之
RefPicListLX[Idx]之POC值的POC值,則視訊寫碼器20/30將運動向量導出為用於RefPicListLX之視圖間預測之運動向量且將availableFlagLXInterView設定至1。
在AMVP模式下,若目標參考索引對應於視差運動向量,則可不導出視圖間預測之運動向量且將視差向量轉換至視圖間視差運動向量。
在上文所描述之實例AMVP模式技術中,始終首先檢查對應區塊之參考圖像清單0之運動資訊,而不管目標參考圖像清單為0抑或1。然而,根據本發明之技術,在AMVP模式下,對於給定目標參考索引refIdxLX,代替首先比較由當前區塊之mvL0指代的圖像之POC值與(當前圖塊之)RefPicListX[refIdxLX]之POC且接著比較由當前區塊之mvL1指代的圖像之POC值與(當前圖塊之)RefPicListX[refIdxLX]之POC,視訊寫碼器20/30可首先比較由mvLX指代的圖像之POC值且接著比較由mvLY指代的圖像之POC值(其中Y等於1-X)。一旦發現視圖間預測之運動向量,視訊寫碼器20/30就可終止比較程序。當該比較推斷出RefPicListX[refIdxLX]之POC值在該比較期間等於由mvL0或mvL1指代的圖像之POC值時,視圖間預測之運動向量可用且可由視訊寫碼器20/30設定至mvL0或mvL1。
對於上文所論述之實例合併/跳過模式技術及實例AMVP模式技術兩者,當對應區塊之參考圖像之POC不同於當前CU/PU之參考圖像清單中之任何項目的POC時,將視圖間預測之運動向量視為不可用。然而,根據本發明之技術,當mvL0或mvL1皆不指代具有與當前圖塊之RefPicList0或RefPicList1中之任何參考圖像之POC相同的POC之時間參考圖像時,視訊寫碼器20/30可藉由基於POC距離而將第一可用mvL0及mvL1按比例調整至RefPicList0中之第一時間參考圖像來導出視圖間預測之運動向量0。
至此,本發明已論述已知3D-HEVC AMVP及合併模式技術之若干缺點且介紹可處理此等缺點中之一些之技術。本發明所介紹之技術可進一步改良在以HEVC為基礎之多視圖或3DV寫碼中的視圖間預測之運動向量之寫碼效率。現在將提供上文所介紹之技術的更詳細實例。
如上文所介紹,視訊寫碼器20/30可經組態以針對合併/跳過模式而執行視圖間預測之運動向量導出程序。現在將論述可如何根據本發明之技術而執行此類導出程序之實例。對於合併/跳過模式,視訊寫碼器20/30可如下導出視圖間預測之運動向量X(其中X等於0或1):
- 視訊寫碼器20/30可藉由視差向量而在同一存取單元之參考視圖中定位當前PU/CU之對應區塊。在可用時,對應區塊之兩個運動向量可被表示為mvLX及mvLY(其中Y等於1-X),且對應參考圖像可被表示為corRefPicX及corRefPicY。
- 視訊寫碼器20/30可最初將predFlagLXInterView設定至0,其指示出RefPicListLX不用於運用mvLX之預測。
- 若corRefPicX可用且其為時間參考圖像,則視訊寫碼器20/30可執行下者:
○對於自0至num_ref_idx_lX_active_minus1(包括在內)之每一i,若(當前圖塊之)RefPicListX[i]之POC等於corRefPicX之POC,則視訊寫碼器20/30可將視圖間預測之運動向量X設定為等於mvLX、將目標參考索引設定至i,且將predFlagLXInterView設定至1。換言之,分析RefPicListX中之參考圖像之集合以判定其是否具有等於corRefPicX之POC的POC。若RefPicListX中之參考圖像確實具有等於corRefPicX之POC的POC,則設定目標參考以識別彼參考圖像。另外,視訊寫碼器20/30將predFlagLXInterView設定至1以指示出RefPicListLX用於運用mvLX之預測。RefPicListLX中之圖像集合包括具有自0至
num_ref_idx_lX_active_minus1之索引的圖像。
- 若predFlagLXInterView等於0而意謂在以上步驟中視訊寫碼器20/30未發現RefPicListX中具有等於corRefPicX之POC的POC之參考圖像,且若corRefPicY可用且為時間參考圖像,則視訊寫碼器20/30可執行下者:
○對於自0至num_ref_idx_lX_active_minus1(包括在內)之每一i,若RefPicListX[i]之POC等於corRefPicY之POC,則視訊寫碼器20/30將視圖間預測之運動向量X設定為等於mvLY、將目標參考索引設定至i,且將predFlagLXInterView設定至1。換言之,分析RefPicListX中之參考圖像之集合以判定其是否具有等於corRefPicY之POC的POC。若RefPicListX中之參考圖像確實具有等於corRefPicY之POC的POC,則設定目標參考以識別彼參考圖像。另外,視訊寫碼器20/30將predFlagLXInterView設定至l以指示出RefPicListLX用於運用mvLY之預測。RefPicListLX中之圖像集合包括具有自0至num_ref_idx_lX_active_minus1之索引的圖像。
在一實施中,當視圖間預測之運動向量0及視圖間預測之運動向量1兩者皆可用且指代同一參考圖像且具有相同運動向量(水平向量及垂直向量兩者)時,則視訊寫碼器20/30將該兩個視圖間預測之運動向量中之一者設定至不可用。在一替代例中,視訊寫碼器20/30將視圖間預測之運動向量1設定為不可用,而在另一替代例中,視訊寫碼器20/30將視圖間預測之運動向量0設定為不可用。
在根據本發明之技術之另一實施中,對於合併/跳過模式,視訊寫碼器20/30可如下導出視圖間預測之運動向量:
-視訊寫碼器20/30藉由視差向量而在同一存取單元之參考視圖中定位當前PU/CU之對應區塊。在可用時,對應區塊之兩個運動向量可被表示為mvLX及mvLY(其中Y等於1-X),且對應參考圖像可被表示
為corRefPicX及corRefPicY。
- 對於自0至1之每一X,下者適用:
○視訊寫碼器20/30可將predFlagLXInterView設定至0。
○若corRefPicX可用且為時間參考圖像,則下者適用,直至predFlagLXInterView等於1:
○對於自0至num_ref_idx_lX_active_minus1(包括在內)之每一i,若(當前圖塊之)RefPicListX[i]之POC等於corRefPicX之POC,則將視圖間預測之運動向量X設定為等於mvLX,且將目標參考索引設定至i,將predFlagLXInterView設定至1。
- 若視圖間預測之運動向量X及視圖間預測之運動向量Y兩者皆不可用,亦即,predFlagL0InterView及predFlagL1InterView等於1,則對於自0至1之每一X,下者適用:
○若corRefPicY(其中Y等於1-X)可用且其為時間參考圖像,則下者適用,直至predFlagLXInterView等於1:
○對於自0至num_ref_idx_lX_active_minus1(包括在內)之每一i。若RefPicListX[i]之POC等於corRefPicY之POC,則將視圖間預測之運動向量X設定為等於mvLY,且將目標參考索引設定至i,將predFlagLXInterView設定至1。
如上文所介紹,視訊寫碼器20/30可經組態以運用按比例調整來執行視圖間預測之運動向量導出,現在將論述其實例。當視圖間預測之運動向量0及視圖間預測之運動向量1兩者皆不可用(當藉由上文所描述之技術而導出時)時,視訊寫碼器20可如下導出視圖間預測之運動向量0:
- 視訊寫碼器20/30可藉由視差向量而在同一存取單元之參考視圖中定位當前PU/CU之對應區塊。在可用時,對應區塊之兩個運動向量可被表示為mvLX及mvLY(其中Y等於1-X),且對應參考圖像可被表
示為corRefPicX及corRefPicY。
- 視訊寫碼器20/30可將predFlagL0InterView設定至0。
- 對於自0至1之每一X,視訊寫碼器20/30可執行下者,直至將predFlagL0InterView設定等於1。
○若mvLX可用且corRefPicX為時間參考圖像,則視訊寫碼器20/30:
○對於自0至num_ref_idx_l0_active_minus1(包括在內)之每一i,若RefPicList0[i]為時間參考圖像,則視訊寫碼器20/30導出視圖間預測之運動向量0作為運動向量之經按比例調整版本,如由以下等式1至5所指定:tx=(16384+(Abs(td)>>1))/td (1)
distScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6) (2)
視圖間預測之運動向量0=Clip3(-32768,32767,Sign2(distScaleFactor*mvLX)*((Abs(distScaleFactor*mvLX)+127)>>8)) (3)
其中PicOrderCntVal為當前圖像之POC,td及tb被導出為td=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(corRefPicX)) (4)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListX[i])) (5)
且將用於視圖間預測之運動向量0的目標參考索引設定至i,且將predFlagL0InterView設定至1。
在一實施中,在應用以上方法之技術之後,若視圖間預測之運動向量仍不可用,則視訊寫碼器20/20可執行下者:
- 對於自0至1之每一X,下者適用,直至predFlagL1InterView等於1。
○若mvLX可用且corRefPicX為時間參考圖像,則下者適用:
○對於自0至num_ref_idx_l1_active_minus1(包括在內)之每一i,若RefPicList1[i]為時間參考圖像,則視訊寫碼器20/30可導出視圖間
預測之運動向量1作為運動向量之經按比例調整版本,如由以下等式6至10所指定:tx=(16384+(Abs(td)>>1))/td (6)
distScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6) (7)
視圖間預測之運動向量1=Clip3(-32768,32767,Sign2(distScaleFactor*mvLX)*((Abs(distScaleFactor*mvLX)+127)>>8)) (8)
其中PicOrderCntVal為當前圖像之POC,td及tb被導出為td=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(corRefPicX)) (9)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListX[i]))(10)
當視圖間預測之運動向量0及視圖間預測之運動向量1中任一者不可用於藉由上文所描述之技術或任何其他方法而導出時,視訊寫碼器20/30可針對跳過/合併模式而如下導出視圖間預測之運動向量X(其中X係由0或1替換):
- 視訊寫碼器20/30使用視差向量而在同一存取單元之參考視圖中定位當前PU/CU之對應區塊。在可用時,對應區塊之兩個運動向量可被表示為mvLX及mvLY(其中Y等於1-X),且對應參考圖像可被表示為corRefPicX及corRefPicY。
- 視訊寫碼器20/30可將predFlagLXInterView設定至0。
- 若mvLX可用且corRefPicX為時間參考圖像,則視訊寫碼器20/30可:
○對於自0至num_ref_idx_lX_active_minus1(包括在內)之每一i,若RefPicListX[i]為時間參考圖像,則視訊寫碼器20/30可導出視圖間預測之運動向量X作為運動向量之經按比例調整版本,如由以下等式11至15所指定:tx=(16384+(Abs(td)>>1))/td (11)
distScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6) (12)
視圖間預測之運動向量X=Clip3(-32768,32767,Sign2(distScaleFactor*mvLX)*((Abs(distScaleFactor*mvLX)+127)>>8)) (13)
其中PicOrderCntVal為當前圖像之POC,td及tb被導出為td=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(corRefPicX)) (14)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListX[i]))(15)
且將目標參考索引設定至i,將predFlagLXInterView設定至1。
在用於合併模式之一實施中,視訊寫碼器20/30可以任何其他方式來導出目標參考索引refIdxLX,該等方式包括經由傳信,例如,當predFlagL0InterView及/或predFlagL1InterView不可用時在圖塊標頭中進行傳信。在此狀況下,目標參考索引係已知的,且視訊寫碼器20/30可直接地執行按比例調整,因此消除針對進一步搜尋目標參考索引之需要。根據此類技術,視訊寫碼器20/30可如下判定視圖間預測之運動向量:
- 視訊寫碼器20/30使用視差向量而在同一存取單元之參考視圖中定位當前PU/CU之對應區塊。在可用時,對應區塊之兩個運動向量可被表示為mvLX及mvLY(其中Y等於1-X),且對應參考圖像可被表示為corRefPicX及corRefPicY。
- 視訊寫碼器20/30將predFlagLXInterView設定至0。
- 若mvLX可用且corRefPicX為時間參考圖像,則視訊寫碼器20/30可:
○若RefPicListX[refIdxLX]為時間參考圖像,則視訊寫碼器20/30可導出視圖間預測之運動向量作為運動向量之經按比例調整版本,如由以下等式16至20所指定:tx=(16384+(Abs(td)>>1))/td (16)
distScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6) (17)
視圖間預測之運動向量X=Clip3(-32768,32767,Sign2(distScaleFactor*
mvLX)*((Abs(distScaleFactor*mvLX)+127)>>8)) (18)
其中PicOrderCntVal為當前圖像之POC,td及tb被導出為td=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(corRefPicX)) (19)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListX[refIdxLX])) (20)
且將predFlagLXInterView設定至1。
在另一實施中,視訊寫碼器20/30可潛在地按比例調整mvLY以導出視圖間預測之運動向量X(若其仍不可用)。根據此類技術,若mvLY可用且corRefPicY為時間參考圖像,且若RefPicListX[refIdxLX]為時間參考圖像,則視訊寫碼器20/30可導出視圖間預測之運動向量作為運動向量之經按比例調整版本,如由以下等式21至25所指定:tx=(16384+(Abs(td)>>1))/td (21)
distScaleFacror=Clip3(-4096,4095,(tb*tx+32)>>6) (22)
視圖間預測之運動向量X=Clip3(-32768,32767,Sign2(distScaleFactor*mvLY)*((Abs(distScaleFactor*mvLY)+127)>>8)) (23)
其中PicOrderCntVal為當前圖像之POC,td及tb被導出為td=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(corRefPicY)) (24)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListX[refIdxLY])) (25)
且將predFlagLXInterView設定至1。
如上文所介紹,視訊寫碼器20/30可針對AMVP模式而執行視圖間預測之運動向量導出程序。在AMVP模式下,若目標參考索引對應於時間運動向量,則視訊寫碼器20/30可如下導出視圖間預測之運動向量X:
- 用於當前PU/CU之給定目標參考圖像索引係由refIdxLX表示。視訊寫碼器20/30使用視差向量而在同一存取單元之參考視圖中定位
當前PU/CU之對應區塊。在可用時,對應區塊之兩個運動向量被表示為mvLX及mvLY(其中Y等於1-X),且對應參考圖像被表示為corRefPicX及corRefPicY。
- 視訊寫碼器20/30將predFlagLXInterView設定至0。
- 若corRefPicX可用且其為時間參考圖像,則視訊寫碼器20/30可執行下者:
○若(當前圖塊之)RefPicListX[refIdxLX]之POC等於corRefPicX之POC,則視訊寫碼器20/30將視圖間預測之運動向量X設定為等於mvLX且將predFlagLXInterView設定至1。
- 否則,視訊寫碼器20/30將predFlagLXInterView設定為等於0,且若corRefPicY可用且為時間參考圖像,則視訊寫碼器20/30執行下者:
○若RefPicListX[refIdxLX]之POC等於corRefPicY之POC,則視訊寫碼器20/30將視圖間預測之運動向量X設定為等於mvLY且將predFlagLXInterView設定為等於1。
或者,此外,若predFlagLXInterView仍等於0且RefPicListX[refIdxLX]為時間參考圖框,則視訊寫碼器20/30可執行下者:
- 若corRefPicX可用且為時間參考圖像,則視訊寫碼器20/30可基於POC距離而藉由按比例調整mvLX來導出視圖間預測之運動向量,且將predFlagLXInterView設定至1。
- 若predFlagLXInterView為0且corRefPicY可用且為時間參考圖像,則視訊寫碼器20/30可基於POC距離而藉由按比例調整mvLY來導出視圖間預測之運動向量,且將predFlagLXInterView設定為等於1。
圖6為說明可實施本發明所描述之技術(包括上文所描述之視圖間預測技術)之實例視訊編碼器20的方塊圖。視訊編碼器20可執行視訊
圖塊內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以縮減或移除給定視訊圖框或圖像內之視訊中的空間冗餘。框間寫碼依賴於時間預測以縮減或移除視訊序列之鄰近圖框或圖像內之視訊中的時間冗餘。框內模式(I模式)可指代若干以空間為基礎之壓縮模式中任一者。諸如單向預測(P模式)或雙向預測(B模式)之框間模式可指代若干以時間為基礎之壓縮模式中任一者。
在圖6之實例中,視訊編碼器20包括分割單元35、預測處理單元41、濾波器單元63、參考圖像記憶體64、求和器50、變換單元52、量化單元54,及熵編碼單元56。預測處理單元41包括運動及視差估計單元42、運動及視差補償單元44,及框內預測處理單元46。對於視訊區塊重新建構,視訊編碼器20亦包括反量化單元58、反變換處理單元60,及求和器62。濾波器單元63意欲表示一或多個迴路濾波器,諸如,解區塊濾波器、自適應性迴路濾波器(ALF),及樣本自適應性偏移(SAO)濾波器。雖然濾波器單元63在圖6中被展示為迴路內濾波器,但在其他組態中,濾波器單元63可被實施為迴路後濾波器。
如圖6所展示,視訊編碼器20接收視訊資料,且分割單元35將該資料分割成視訊區塊。此分割亦可包括分割成圖塊、圖標或其他較大單元,以及視訊區塊分割,例如,根據LCU及CU之四元樹結構。視訊編碼器20通常說明編碼待編碼視訊圖塊內之視訊區塊的組件。圖塊可劃分成多個視訊區塊(且可能地劃分成被稱作圖標之視訊區塊集合)。預測處理單元41可基於誤差結果(例如,寫碼速率及失真位準)而選擇用於當前視訊區塊之複數個可能寫碼模式中之一者,諸如,複數個框內寫碼模式中之一者,或複數個框間寫碼模式中之一者。預測處理單元41可將所得經框內寫碼區塊或經框間寫碼區塊提供至求和器50以產生殘餘區塊資料,且將所得經框內寫碼區塊或經框間寫碼區塊提供至求和器62以重新建構經編碼區塊以用作參考圖像。
預測處理單元41內之框內預測處理單元46可執行當前視訊區塊相對於與當前待寫碼區塊相同之圖框或圖塊中之一或多個相鄰區塊的框內預測性寫碼以提供空間壓縮。預測處理單元41內之運動及視差估計單元42以及運動及視差補償單元44執行當前視訊區塊相對於一或多個參考圖像及/或參考視圖中之一或多個預測性區塊的框間預測性寫碼及/或視圖間寫碼以提供時間或視圖壓縮。
運動及視差估計單元42可經組態以根據用於視訊序列之預定型樣而判定用於視訊圖塊之框間預測模式及/或視圖間預測模式。預定型樣可將序列中之視訊圖塊指明為P圖塊或B圖塊。運動及視差估計單元42與運動及視差補償單元44可高度地整合,但出於概念目的而被分離地說明。由運動及視差估計單元42執行之運動及視差估計為產生運動向量之程序,該等運動向量估計用於視訊區塊之運動。舉例而言,運動向量可指示當前視訊圖框或圖像內之視訊區塊之PU相對於參考圖像內之預測性區塊的位移。由運動及視差估計單元42執行之視差估計為產生視差運動向量之程序,該等視差運動向量可用以自不同視圖中之區塊預測經當前寫碼區塊。
預測性區塊為被發現在像素差方面接近地匹配於待寫碼之視訊區塊之PU的區塊,像素差可由絕對差總和(SAD)、平方差總和(SSD)或其他差量度判定。在一些實例中,視訊編碼器20可計算用於儲存於參考圖像記憶體64中之參考圖像之次整數像素位置的值。舉例而言,視訊編碼器20可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分率像素位置的值。因此,運動及視差估計單元42可執行相對於完全像素位置及分率像素位置之運動搜尋,且以分率像素精確度來輸出運動向量。
運動及視差估計單元42藉由比較經框間寫碼或視圖間預測之圖塊中的視訊區塊之PU之位置與參考圖像之預測性區塊之位置而計算
用於該PU之運動向量(對於運動補償預測)及/或視差運動向量(對於視差補償預測)。參考圖像可選自第一參考圖像清單(RefPicList0)或第二參考圖像清單(RefPicList1),該等參考圖像清單中每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動及視差估計單元42將所計算之運動向量及/或視差向量發送至熵編碼單元56及運動補償單元44。
由運動及視差補償單元44執行之運動補償及/或視差補償可涉及基於藉由運動估計及/或視差估計而判定之運動向量而提取或產生預測性區塊,可能地執行達子像素精確度之內插。在接收用於當前視訊區塊之PU的運動向量及/或視差後,運動及視差補償單元44即可在參考圖像清單中之一者中定位運動向量及/或視差向量所指向之預測性區塊。視訊編碼器20藉由自正被寫碼之當前視訊區塊之像素值減去預測性區塊之像素值而形成殘餘視訊區塊,從而形成像素差值。像素差值形成用於區塊之殘餘資料,且可包括亮度差分量及色度差分量兩者。求和器50表示執行此減去運算之組件。運動及視差補償單元44亦可產生與視訊區塊及視訊圖塊相關聯之語法元素以供視訊解碼器30用來解碼視訊圖塊之視訊區塊。
作為如上文所描述的由運動及視差估計單元42以及運動及視差補償單元44執行之框間預測的替代例,框內預測處理單元46可框內預測當前區塊。詳言之,框內預測處理單元46可判定框內預測模式以用以編碼當前區塊。在一些實例中,框內預測處理單元46可使用各種框內預測模式來編碼當前區塊(例如,在分離編碼遍次期間),且框內預測處理單元46(或在一些實例中,模式選擇單元40)可自經測試模式選擇適當框內預測模式以供使用。舉例而言,框內預測處理單元46可使用針對各種經測試框內預測模式之速率失真分析而計算速率失真值,且在經測試模式之間選擇具有最好速率失真特性之框內預測模式。速
率失真分析通常判定經編碼區塊與經編碼以產生經編碼區塊之原始未經編碼區塊之間的失真(或誤差)之量,以及用以產生經編碼區塊之位元速率(亦即,位元之數目)。框內預測處理單元46可自失真及速率計算用於各種經編碼區塊之比率以判定哪一框內預測模式展現用於區塊之最好速率失真值。
在任何狀況下,在選擇用於區塊之框內預測模式之後,框內預測處理單元46可將指示用於區塊之選定框內預測模式的資訊提供至熵寫碼單元56。熵寫碼單元56可根據本發明之技術而編碼指示選定框內預測模式之資訊。視訊編碼器20可在經傳輸位元串流中包括:組態資料,其可包括複數個框內預測模式索引表及複數個經修改框內預測模式索引表(亦被稱作碼字映射表);編碼用於各種區塊之上下文之定義;及待用於該等上下文中每一者之最可能框內預測模式、框內預測模式索引表及經修改框內預測模式索引表之指示。
在預測處理單元41經由框間預測抑或框內預測而產生用於當前視訊區塊之預測性區塊之後,視訊編碼器20藉由自當前視訊區塊減去預測性區塊而形成殘餘視訊區塊。殘餘區塊中之殘餘視訊資料可包括於一或多個TU中且應用於變換單元52。變換單元52使用諸如離散餘弦變換(DCT)或概念上相似變換之變換而將殘餘視訊資料變換成殘餘變換係數。變換單元52可將殘餘視訊資料自像素域轉換至諸如頻域之變換域。
變換單元52可將所得變換係數發送至量化單元54。量化單元54量化變換係數以進一步縮減位元速率。量化程序可縮減與該等係數中之一些或全部相關聯的位元深度。可藉由調整量化參數而修改量化程度。在一些實例中,量化單元54接著可執行包括經量化變換係數之矩陣之掃描。或者,熵編碼單元56可執行該掃描。
在量化之後,熵編碼單元56熵編碼經量化變換係數。舉例而
言,熵編碼單元56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、以語法為基礎之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法或技術。在由熵編碼單元56進行之熵編碼之後,經編碼位元串流可傳輸至視訊解碼器30,或經封存以供以後由視訊解碼器30傳輸或擷取。熵編碼單元56亦可熵編碼用於正被寫碼之當前視訊圖塊的運動向量及其他語法元素。
反量化單元58及反變換處理單元60分別應用反量化及反變換,以在像素域中重新建構殘餘區塊以供以後用作參考圖像之參考區塊。運動及視差補償單元44可藉由將殘餘區塊添加至參考圖像清單中之一者內的參考圖像中之一者之預測性區塊而計算參考區塊。運動及視差補償單元44亦可將一或多個內插濾波器應用於經重新建構殘餘區塊以計算供運動估計中使用之次整數像素值。求和器62將經重新建構殘餘區塊添加至由運動及視差補償單元44產生之經運動補償預測區塊以產生供儲存於參考圖像記憶體64中之參考區塊。參考區塊可由運動及視差估計單元42以及運動及視差補償單元44用作參考區塊以框間預測後續視訊圖框或圖像中之區塊。
圖7為說明可實施本發明所描述之技術(包括上文所描述之視圖間預測技術)之實例視訊解碼器30的方塊圖。在圖7之實例中,視訊解碼器30包括熵解碼單元80、預測處理單元81、反量化單元86、反變換處理單元88、求和器90、濾波器單元91,及參考圖像記憶體92。預測處理單元81包括運動及視差補償單元82,及框內預測處理模組84。在一些實例中,視訊解碼器30可執行與關於來自圖6之視訊編碼器20所描述之編碼遍次大體上互反的解碼遍次。
在解碼程序期間,視訊解碼器30自視訊編碼器20接收表示經編碼視訊圖塊之視訊區塊及關聯語法元素的經編碼視訊位元串流。視訊
解碼器30之熵解碼單元80熵解碼位元串流以產生經量化係數、運動向量及其他語法元素。熵解碼單元80將運動向量及其他語法元素轉遞至預測處理單元81。視訊解碼器30可在視訊圖塊層級及/或視訊區塊層級處接收語法元素。
當將視訊圖塊寫碼為經框內寫碼(I)圖塊時,預測處理單元81之框內預測處理單元84可基於自當前圖框或圖像之經先前解碼區塊傳信之框內預測模式及資料而產生用於當前視訊圖塊之視訊區塊的預測資料。當將視訊圖框寫碼為經框間寫碼(亦即,B、P或GPB)圖塊時,預測處理單元81之運動及視差補償單元82基於自熵解碼單元80接收之運動向量及其他語法元素而產生用於當前視訊圖塊之視訊區塊的預測性區塊。預測性區塊可自參考圖像清單中之一者內的參考圖像中之一者予以產生。視訊解碼器30可使用基於儲存於參考圖像記憶體92中之參考圖像的預設建構技術來建構參考圖框清單:清單0及清單1。
運動及視差補償單元82藉由剖析運動向量及其他語法元素而判定用於當前視訊圖塊之視訊區塊的預測資訊,且使用該預測資訊以產生用於正被解碼之當前視訊區塊的預測性區塊。舉例而言,運動及視差補償單元82使用經接收語法元素中之一些以判定用以寫碼視訊圖塊之視訊區塊的預測模式(例如,框內預測或框間預測)、框間預測或視圖間預測圖塊類型(例如,B圖塊或P圖塊)、用於圖塊之參考圖像清單中之一或多者的建構資訊、用於圖塊之每一經框間編碼視訊區塊的運動向量及/或視差向量、用於圖塊之每一經框間寫碼視訊區塊的框間預測狀態,及用以解碼當前視訊圖塊中之視訊區塊的其他資訊。
在一些實例中,運動及視差補償單元82可使用運動向量預測程序來判定指示運動向量之經傳信語法元素。運動向量預測程序可包括AMVP模式及合併模式。運動及視差補償單元82亦可基於內插濾波器而執行內插。運動及視差補償單元82可使用如由視訊編碼器20在視訊
區塊之編碼期間使用之內插濾波器以計算用於參考區塊之次整數像素的內插值。在此狀況下,運動及視差補償單元82可自經接收語法元素判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器以產生預測性區塊。
反量化單元86反量化(亦即,去量化)位元串流中提供且由熵解碼單元80解碼之經量化變換係數。反量化程序可包括針對視訊圖塊中之每一視訊區塊使用由視訊編碼器20計算之量化參數以判定量化程度,且同樣地判定應被應用之反量化程度。反變換處理單元88將反變換(例如,反DCT、反整數變換或概念上相似反變換程序)應用於變換係數,以便在像素域中產生殘餘區塊。
在運動及視差補償單元82基於運動向量及其他語法元素而產生用於當前視訊區塊之預測性區塊之後,視訊解碼器30藉由將來自反變換處理單元88之殘餘區塊與由運動及視差補償單元82產生之對應預測性區塊進行求和而形成經解碼視訊區塊。求和器90表示執行此求和運算之組件。視需要,亦可使用迴路濾波器(在寫碼迴路中抑或在寫碼迴路之後)以使像素轉變平滑,或以其他方式改良視訊品質。濾波器單元91意欲表示一或多個迴路濾波器,諸如,解區塊濾波器、自適應性迴路濾波器(ALF)及樣本自適應性偏移(SAO)濾波器。雖然濾波器單元91在圖7中被展示為迴路內濾波器,但在其他組態中,濾波器單元91可被實施為迴路後濾波器。給定圖框或圖像中之經解碼視訊區塊接著儲存於參考圖像記憶體92中,參考圖像記憶體92儲存用於後續運動補償之參考圖像。參考圖像記憶體92亦儲存經解碼視訊以供以後呈現於諸如圖1之顯示器件32的顯示器件上。
圖8為展示根據本發明之技術之實例編碼程序的流程圖。圖8之技術將關於視訊編碼器20予以描述,但可由其他類型之視訊編碼器執行。視訊編碼器20針對當前視圖中之當前區塊而使用用於當前區塊之
視差向量來判定參考視圖中之對應區塊(180)。舉例而言,視差向量可由視訊編碼器20使用上文所描述之NBDV技術中之一或多者而判定。視訊編碼器20判定用於當前區塊之當前運動向量之第一方向(181)。視訊編碼器20判定由在第一方向上指向的對應區塊之第一運動向量參考之第一參考圖像之第一POC值(182)。視訊編碼器20判定用於當前區塊之第一參考圖像清單是否包括具有第一POC值之參考圖像(183)。第一參考圖像清單對應於第一方向。回應於第一參考圖像清單包括具有第一POC值之參考圖像(183,是),視訊編碼器20使用對應區塊之第一運動向量來編碼當前運動向量(184)。舉例而言,視訊編碼器20可藉由將第一運動向量添加至如上文所描述之AMVP或合併模式候選者清單而編碼當前運動向量。
回應於第一參考圖像清單不包括具有第一POC值之參考圖像(183,否),視訊編碼器20判定由在第二方向上指向的對應區塊之第二運動向量參考之第二參考圖像之第二POC值(185)。第二方向不同於第一方向。視訊編碼器20判定用於當前區塊之第一參考圖像清單是否包括具有第二POC值之參考圖像(186)。回應於第一參考圖像清單包括具有第二POC值之參考圖像(186,是),視訊編碼器20使用對應區塊之第二運動向量來編碼當前運動向量(187)。舉例而言,視訊編碼器20可藉由將第二運動向量添加至如上文所描述之AMVP或合併模式候選者清單而編碼當前運動向量。回應於第一參考圖像清單不包括具有第二POC值之參考圖像(186,否),視訊編碼器20使用另一技術來編碼當前運動向量(187)。舉例而言,技術之實例包括使用第一或第二運動向量之經按比例調整版本、使用零向量,或其他此類技術。
圖9為展示根據本發明之技術之實例解碼程序的流程圖。圖9之技術將關於視訊解碼器30予以描述,但可由其他類型之視訊解碼器執行。視訊解碼器30針對當前視圖中之當前區塊而使用用於當前區塊之
視差向量來判定參考視圖中之對應區塊(190)。舉例而言,視差向量可由視訊解碼器30使用上文所描述之NBDV技術中之一或多者而判定。視訊解碼器30判定用於當前區塊之當前運動向量之第一方向(191)。視訊解碼器判定由在第一方向上指向的對應區塊之第一運動向量參考之第一參考圖像之第一POC值(192)。視訊解碼器30判定用於當前區塊之第一參考圖像清單是否包括具有第一POC值之參考圖像(193)。第一參考圖像清單對應於第一方向。回應於第一參考圖像清單包括具有第一POC值之參考圖像(193,是),視訊解碼器30使用對應區塊之第一運動向量來解碼當前運動向量(194)。舉例而言,視訊解碼器30可藉由將第一運動向量添加至如上文所描述之AMVP或合併模式候選者清單而解碼當前運動向量。
回應於第一參考圖像清單不包括具有第一POC值之參考圖像(193,否),視訊解碼器30判定由在第二方向上指向的對應區塊之第二運動向量參考之第二參考圖像之第二POC值(195)。第二方向不同於第一方向。視訊解碼器30判定用於當前區塊之第一參考圖像清單是否包括具有第二POC值之參考圖像(196)。回應於第一參考圖像清單包括具有第二POC值之參考圖像(196,是),視訊解碼器30使用對應區塊之第二運動向量來解碼當前運動向量(197)。舉例而言,視訊解碼器30可藉由將第二運動向量添加至如上文所描述之AMVP或合併模式候選者清單而解碼當前運動向量。回應於第一參考圖像清單不包括具有第二POC值之參考圖像(196,否),視訊解碼器30使用另一技術來解碼當前運動向量(197)。舉例而言,技術之實例包括使用第一或第二運動向量之經按比例調整版本、使用零向量,或其他此類技術。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合予以實施。若以軟體予以實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體而傳輸,且
由以硬體為基礎之處理單元執行。電腦可讀媒體可包括:電腦可讀儲存媒體,其對應於諸如資料儲存媒體之有形媒體;或通信媒體,其包括(例如)根據通信協定而促進電腦程式自一處傳送至另一處之任何媒體。以此方式,電腦可讀媒體通常可對應於(1)為非暫時性之有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明所描述之技術之指令、程式碼及/或資料結構的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
作為實例而非限制,此類電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器件、磁碟儲存器件或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式之所要程式碼且可由電腦存取的任何其他媒體。又,將任何連接適當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纜、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術而自網站、伺服器或其他遠端來源傳輸指令,則同軸纜線、光纜、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是有關於非暫時性有形儲存媒體。
如本文所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟運用雷射以光學方式再生資料。以上各者之組合亦應包括於電腦可讀媒體之範疇內。
指令可由諸如以下各者之一或多個處理器執行:一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA),或其他等效積體或離散邏輯電路系統。因此,如本文所使用,術語「處理器」可指代前述結構或適合於實施本
文所描述之技術之任何其他結構中任一者。此外,在一些態樣中,本文所描述之功能性可提供於經組態用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編碼解碼器中。又,該等技術可完全地實施於一或多個電路或邏輯元件中。
本發明之技術可實施於各種各樣之器件或裝置中,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片組)。各種組件、模組或單元在本發明中經描述以強調經組態以執行所揭示技術之器件之功能態樣,但未必需要由不同硬體單元進行實現。實情為,如上文所描述,各種單元可組合於一編碼解碼器硬體單元中,或由包括如上文所描述之一或多個處理器之互操作性硬體單元的集合結合合適軟體及/或韌體而提供。
已描述各種實例。此等及其他實例係在以下申請專利範圍之範疇內。
Claims (53)
- 一種解碼多視圖視訊資料之方法,該方法包含:針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊;判定用於該當前區塊之一當前運動向量之一第一方向,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值;判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像,其中該第一參考圖像清單對應於該第一方向;回應於該第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來解碼該當前運動向量;回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像:判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值,其中該第二方向不同於該第一方向,其中該第二方向對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像;及 回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來解碼該當前運動向量。
- 如請求項1之方法,其進一步包含:將一合併候選者添加至一合併候選者清單,其中當該第一參考圖像清單包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第一POC值之該參考圖像之一參考圖像索引且包含該第一運動向量,且當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第二POC值之該參考圖像之一參考圖像索引且包含該第二運動向量;解碼一索引值,其中該索引值對應於該合併候選者;使用對應於該索引之該合併候選者來預測該當前區塊。
- 如請求項2之方法,其進一步包含:使用一運動向量預測子候選者來解碼該當前運動向量,其中該運動向量預測子候選者包含該方向運動預測子及一第二方向運動預測子。
- 如請求項1之方法,其中當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時且當該第二參考圖像清單不包括具有該第二POC值之該參考圖像時,該方法進一步包含:判定一第一POC差是否大於一第二POC差,該第一POC差表示該第一POC值與最接近該第一POC值的用於該第一參考圖像清單中之一參考圖像之一第一POC值之間的該差,該第二POC差表示該第二POC值與最接近該第二POC值的用於該第二參考圖像清單中之一參考圖像之一第二POC值之間的該差;當該第一POC差大於該第二POC差時,根據該第一POC差而按 比例調整該第一運動向量,且使用該經按比例調整之第一運動向量來解碼該當前運動向量;及當該第一POC差不大於該第二POC差時,根據該第二POC差而按比例調整該第二運動向量,且使用該經按比例調整之第二運動向量來解碼該當前運動向量。
- 如請求項3之方法,其中使用該運動向量預測子來解碼該當前運動向量包含:將該運動向量預測子候選者作為一合併候選者包括於用於該當前區塊之一合併候選者清單中;解碼一索引值,其中該索引值對應於該方向運動預測子;使用對應於該索引之該合併候選者來預測該當前區塊。
- 如請求項1之方法,其中使用該運動預測子來解碼該當前運動向量包含:將該方向運動預測子之該運動向量包括於用於該當前區塊之一進階運動向量預測(AMVP)模式之一候選運動向量清單中;解碼一索引值,其中該索引值對應於來自該候選運動向量清單之一運動向量;解碼一運動向量差值;使用對應於該索引之一運動向量及該運動向量差值來預測該當前區塊。
- 如請求項1之方法,其中使用該方向運動預測子來解碼該當前運動向量係進一步回應於具有該第一POC值之該參考圖像對應於一時間參考圖像而執行。
- 如請求項1之方法,其中判定用於該當前區塊之該第一參考圖像清單是否包括具有該第一POC值之該參考圖像包含以該參考索引之遞增次序來分析該第一參考圖像清單中之圖像。
- 如請求項8之方法,其中集合係基於識別該第一參考圖像清單中之作用中參考圖像之一數目的一語法元素而判定。
- 如請求項9之方法,其進一步包含:回應於該兩個方向運動預測子具有相同水平分量及相同垂直分量且具有對應於同一圖像之參考索引而將該第一運動向量及該第二運動向量中之一者設定至不可用。
- 一種編碼多視圖視訊資料之方法,該方法包含:針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊;判定用於該當前區塊之一當前運動向量之一第一方向,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值;判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像,其中該第一參考圖像清單對應於該第一方向;回應於該第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來編碼該當前運動向量;回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像:判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值,其中該第二方向不同於該第一方向,其中該第二方向對 應於該第一參考圖像清單及該第二參考圖像清單中之另一者;判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像;及回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來編碼該當前運動向量。
- 如請求項11之方法,其進一步包含:將一合併候選者添加至一合併候選者清單,其中當該第一參考圖像清單包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第一POC值之該參考圖像之一參考圖像索引且包含該第一運動向量,且當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第二POC值之該參考圖像之一參考圖像索引且包含該第二運動向量;編碼一索引值,其中該索引值對應於該合併候選者;使用對應於該索引之該合併候選者來預測該當前區塊。
- 如請求項12之方法,其進一步包含:使用一運動向量預測子候選者來編碼該當前運動向量,其中該運動向量預測子候選者包含該方向運動預測子及一第二方向運動預測子。
- 如請求項11之方法,其中當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時且當該第二參考圖像清單不包括具有該第二POC值之該參考圖像時,該方法進一步包含:判定一第一POC差是否大於一第二POC差,該第一POC差表示該第一POC值與最接近該第一POC值的用於該第一參考圖像清單 中之一參考圖像之一第一POC值之間的該差,該第二POC差表示該第二POC值與最接近該第二POC值的用於該第二參考圖像清單中之一參考圖像之一第二POC值之間的該差;當該第一POC差大於該第二POC差時,根據該第一POC差而按比例調整該第一運動向量,且使用該經按比例調整之第一運動向量來編碼該當前運動向量;及當該第一POC差不大於該第二POC差時,根據該第二POC差而按比例調整該第二運動向量,且使用該經按比例調整之第二運動向量來編碼該當前運動向量。
- 如請求項13之方法,其中使用該運動向量預測子來編碼該當前運動向量包含:將該運動向量預測子候選者作為一合併候選者包括於用於該當前區塊之一合併候選者清單中;編碼一索引值,其中該索引值對應於該方向運動預測子;使用對應於該索引之該合併候選者來預測該當前區塊。
- 如請求項11之方法,其中使用該運動預測子來編碼該當前運動向量包含:將該方向運動預測子之該運動向量包括於用於該當前區塊之一進階運動向量預測(AMVP)模式之一候選運動向量清單中;編碼一索引值,其中該索引值對應於來自該候選運動向量清單之一運動向量;編碼一運動向量差值;使用對應於該索引之一運動向量及該運動向量差值來預測該當前區塊。
- 如請求項11之方法,其中使用該方向運動預測子來編碼該當前運動向量係進一步回應於具有該第一POC值之該參考圖像對應於一 時間參考圖像而執行。
- 如請求項11之方法,其中判定用於該當前區塊之該第一參考圖像清單是否包括具有該第一POC值之該參考圖像包含以該參考索引之遞增次序來分析該第一參考圖像清單中之圖像。
- 如請求項18之方法,其中集合係基於識別該第一參考圖像清單中之作用中參考圖像之一數目的一語法元素而判定。
- 如請求項19之方法,其進一步包含:回應於該兩個方向運動預測子具有相同水平分量及相同垂直分量且具有對應於同一圖像之參考索引而將該第一運動向量及該第二運動向量中之一者設定至不可用。
- 一種用於解碼多視圖視訊資料之器件,該器件包含:一視訊解碼器,其經組態以:針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊;判定用於該當前區塊之一當前運動向量之一第一方向,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值;判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像,其中該第一參考圖像清單對應於該第一方向;回應於該第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來解碼該當前運動向量;且回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像:判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值,其中該第二方向不同於該第一方向,其中該第二方向 對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像;及回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來解碼該當前運動向量。
- 如請求項21之器件,其中該視訊解碼器經進一步組態以:將一合併候選者添加至一合併候選者清單,其中當該第一參考圖像清單包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第一POC值之該參考圖像之一參考圖像索引且包含該第一運動向量,且當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第二POC值之該參考圖像之一參考圖像索引且包含該第二運動向量;解碼一索引值,其中該索引值對應於該合併候選者;且使用對應於該索引之該合併候選者來預測該當前區塊。
- 如請求項22之器件,其中該視訊解碼器經進一步組態以:使用一運動向量預測子候選者來解碼該當前運動向量,其中該運動向量預測子候選者包含該方向運動預測子及一第二方向運動預測子。
- 如請求項21之器件,其中當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時且當該第二參考圖像清單不包括具有該第二POC值之該參考圖像時,其中該視訊解碼器經進一步組態以:判定一第一POC差是否大於一第二POC差,該第一POC差表示該第一POC值與最接近該第一POC值的用於該第一參考圖像清單中之一參考圖像之一第一POC值之間的該差,該第二POC差表示該第二POC值與最接近該第二POC值的用於該第二參考圖像清單 中之一參考圖像之一第二POC值之間的該差;當該第一POC差大於該第二POC差時,根據該第一POC差而按比例調整該第一運動向量,且使用該經按比例調整之第一運動向量來解碼該當前運動向量;且當該第一POC差不大於該第二POC差時,根據該第二POC差而按比例調整該第二運動向量,且使用該經按比例調整之第二運動向量來解碼該當前運動向量。
- 如請求項23之器件,其中該視訊解碼器經組態以藉由以下操作而使用該運動向量預測子來解碼該當前運動向量:將該運動向量預測子候選者作為一合併候選者包括於用於該當前區塊之一合併候選者清單中;解碼一索引值,其中該索引值對應於該方向運動預測子;使用對應於該索引之該合併候選者來預測該當前區塊。
- 如請求項21之器件,其中該視訊解碼器經組態以藉由以下操作而使用該運動向量預測子來解碼該當前運動向量:將該方向運動預測子之該運動向量包括於用於該當前區塊之一進階運動向量預測(AMVP)模式之一候選運動向量清單中;解碼一索引值,其中該索引值對應於來自該候選運動向量清單之一運動向量;解碼一運動向量差值;使用對應於該索引之一運動向量及該運動向量差值來預測該當前區塊。
- 如請求項21之器件,其中該視訊解碼器經組態以進一步回應於具有該第一POC值之該參考圖像對應於一時間參考圖像而使用該方向運動預測子來解碼該當前運動向量。
- 如請求項21之器件,其中該視訊解碼器經組態以藉由以該參考 索引之遞增次序來分析該第一參考圖像清單中之圖像而判定用於該當前區塊之該第一參考圖像清單是否包括具有該第一POC值之該參考圖像。
- 如請求項28之器件,其中集合係基於識別該第一參考圖像清單中之作用中參考圖像之一數目的一語法元素而判定。
- 如請求項29之器件,其中該視訊解碼器經進一步組態以:回應於該兩個方向運動預測子具有相同水平分量及相同垂直分量且具有對應於同一圖像之參考索引而將該第一運動向量及該第二運動向量中之一者設定至不可用。
- 如請求項21之器件,其中該器件包含以下各者中至少一者:一積體電路;一微處理器;及一無線通信器件,其包括該視訊解碼器。
- 一種編碼多視圖視訊資料之器件,器件包含:一視訊編碼器,其經組態以:針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊;判定用於該當前區塊之一當前運動向量之一第一方向,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值;判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像,其中該第一參考圖像清單對應於該第一方向;且回應於該第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來編碼該當前運動向量;回應於該第一參考圖像清單不包括具有該第一POC值之該 參考圖像:判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值,其中該第二方向不同於該第一方向,其中該第二方向對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像;及回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來編碼該當前運動向量。
- 如請求項32之器件,其中該視訊編碼器經進一步組態以:將一合併候選者添加至一合併候選者清單,其中當該第一參考圖像清單包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第一POC值之該參考圖像之一參考圖像索引且包含該第一運動向量,且當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第二POC值之該參考圖像之一參考圖像索引且包含該第二運動向量;編碼一索引值,其中該索引值對應於該合併候選者;且使用對應於該索引之該合併候選者來預測該當前區塊。
- 如請求項33之器件,其中該視訊編碼器經進一步組態以:使用一運動向量預測子候選者來編碼該當前運動向量,其中該運動向量預測子候選者包含該方向運動預測子及一第二方向運動預測子。
- 如請求項32之器件,其中當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時且當該第二參考圖像清單不包括具有該第二POC值之該參考圖像時,其中該視訊編碼器經進一步組態以:判定一第一POC差是否大於一第二POC差,該第一POC差表示 該第一POC值與最接近該第一POC值的用於該第一參考圖像清單中之一參考圖像之一第一POC值之間的該差,該第二POC差表示該第二POC值與最接近該第二POC值的用於該第二參考圖像清單中之一參考圖像之一第二POC值之間的該差;當該第一POC差大於該第二POC差時,根據該第一POC差而按比例調整該第一運動向量,且使用該經按比例調整之第一運動向量來編碼該當前運動向量;且當該第一POC差不大於該第二POC差時,根據該第二POC差而按比例調整該第二運動向量,且使用該經按比例調整之第二運動向量來編碼該當前運動向量。
- 如請求項34之器件,其中該視訊編碼器經組態以藉由以下操作而使用該運動向量預測子來編碼該當前運動向量:將該運動向量預測子候選者作為一合併候選者包括於用於該當前區塊之一合併候選者清單中;編碼一索引值,其中該索引值對應於該方向運動預測子;使用對應於該索引之該合併候選者來預測該當前區塊。
- 如請求項32之器件,其中該視訊編碼器經組態以藉由以下操作而使用該運動向量預測子來編碼該當前運動向量:將該方向運動預測子之該運動向量包括於用於該當前區塊之一進階運動向量預測(AMVP)模式之一候選運動向量清單中;編碼一索引值,其中該索引值對應於來自該候選運動向量清單之一運動向量;編碼一運動向量差值;使用對應於該索引之一運動向量及該運動向量差值來預測該當前區塊。
- 如請求項32之器件,其中該視訊編碼器經組態以進一步回應於 具有該第一POC值之該參考圖像對應於一時間參考圖像而使用該方向運動預測子來編碼該當前運動向量。
- 如請求項32之器件,其中該視訊編碼器經組態以藉由以該參考索引之遞增次序來分析該第一參考圖像清單中之圖像而判定用於該當前區塊之該第一參考圖像清單是否包括具有該第一POC值之該參考圖像。
- 如請求項39之器件,其中集合係基於識別該第一參考圖像清單中之作用中參考圖像之一數目的一語法元素而判定。
- 如請求項40之器件,其中該視訊編碼器經進一步組態以:回應於該兩個方向運動預測子具有相同水平分量及相同垂直分量且具有對應於同一圖像之參考索引而將該第一運動向量及該第二運動向量中之一者設定至不可用。
- 如請求項32之器件,其中該器件包含以下各者中至少一者:一積體電路;一微處理器;及一無線通信器件,其包括該視訊編碼器。
- 一種用於多視圖視訊資料之裝置,該裝置包含:用於針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊的構件;用於判定用於該當前區塊之一當前運動向量之一第一方向的構件,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;用於判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值的構件;用於判定用於該當前區塊之一第一參考圖像清單是否包括具 有該第一POC值之一參考圖像的構件,其中該第一參考圖像清單對應於該第一方向;回應於該第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來解碼該當前運動向量;用於回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像而判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值的構件,其中該第二方向不同於該第一方向,其中該第二方向對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;用於判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像的構件;及用於回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來解碼該當前運動向量的構件。
- 如請求項43之裝置,其進一步包含:用於將一合併候選者添加至一合併候選者清單的構件,其中當該第一參考圖像清單包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第一POC值之該參考圖像之一參考圖像索引且包含該第一運動向量,且當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時,該合併候選者包含對應於具有該第二POC值之該參考圖像之一參考圖像索引且包含該第二運動向量;用於解碼一索引值的構件,其中該索引值對應於該合併候選者; 用於使用對應於該索引之該合併候選者來預測該當前區塊的構件。
- 如請求項44之裝置,其進一步包含:用於使用一運動向量預測子候選者來解碼該當前運動向量的構件,其中該運動向量預測子候選者包含該方向運動預測子及一第二方向運動預測子。
- 如請求項43之裝置,其中當該第一參考圖像清單不包括具有該第一POC值之該參考圖像時且當該第二參考圖像清單不包括具有該第二POC值之該參考圖像時,該裝置進一步包含:用於判定一第一POC差是否大於一第二POC差的構件,該第一POC差表示該第一POC值與最接近該第一POC值的用於該第一參考圖像清單中之一參考圖像之一第一POC值之間的該差,該第二POC差表示該第二POC值與最接近該第二POC值的用於該第二參考圖像清單中之一參考圖像之一第二POC值之間的該差;用於當該第一POC差大於該第二POC差時根據該第一POC差而按比例調整該第一運動向量的構件,及用於當該第一POC差大於該第二POC差時使用該經按比例調整之第一運動向量來解碼該當前運動向量的構件;及用於當該第一POC差不大於該第二POC差時根據該第二POC差而按比例調整該第二運動向量的構件,及用於當該第一POC差不大於該第二POC差時使用該經按比例調整之第二運動向量來解碼該當前運動向量的構件。
- 如請求項45之裝置,其中用於使用該運動向量預測子來解碼該當前運動向量的該構件包含:用於將該運動向量預測子候選者作為一合併候選者包括於用於該當前區塊之一合併候選者清單中的構件; 用於解碼一索引值的構件,其中該索引值對應於該方向運動預測子;用於使用對應於該索引之該合併候選者來預測該當前區塊的構件。
- 如請求項43之裝置,其中用於使用該運動預測子來解碼該當前運動向量的該構件包含:用於將該方向運動預測子之該運動向量包括於用於該當前區塊之一進階運動向量預測(AMVP)模式之一候選運動向量清單中的構件;用於解碼一索引值的構件,其中該索引值對應於來自該候選運動向量清單之一運動向量;用於解碼一運動向量差值的構件;用於使用對應於該索引之一運動向量及該運動向量差值來預測該當前區塊的構件。
- 如請求項43之裝置,其中用於使用該方向運動預測子來解碼該當前運動向量的該構件係進一步回應於具有該第一POC值之該參考圖像對應於一時間參考圖像而執行。
- 如請求項43之裝置,其中用於判定用於該當前區塊之該第一參考圖像清單是否包括具有該第一POC值之該參考圖像的該構件包含以該參考索引之遞增次序來分析該第一參考圖像清單中之圖像。
- 如請求項50之裝置,其中集合係基於識別該第一參考圖像清單中之作用中參考圖像之一數目的一語法元素而判定。
- 如請求項51之裝置,其進一步包含:用於回應於該兩個方向運動預測子具有相同水平分量及相同垂直分量且具有對應於同一圖像之參考索引而將該第一運動向 量及該第二運動向量中之一者設定至不可用的構件。
- 一種電腦可讀儲存媒體,其儲存指令,該等指令在由一或多個處理器執行時使該一或多個處理器:針對一當前視圖中之一當前區塊而使用用於該當前區塊之一視差向量來判定一參考視圖中之一對應區塊;判定用於該當前區塊之一當前運動向量之一第一方向,其中該第一方向對應於一第一參考圖像清單或一第二參考圖像清單中之一者;判定由與在該第一方向上指向的該對應區塊之一第一運動向量相關聯之一參考索引參考的一第一參考圖像之一第一圖像次序計數(POC)值;判定用於該當前區塊之一第一參考圖像清單是否包括具有該第一POC值之一參考圖像,其中該第一參考圖像清單對應於該第一方向;回應於該第一參考圖像清單包括具有該第一POC值之該參考圖像而使用該對應區塊之該第一運動向量作為一方向運動預測子來寫碼該當前運動向量;回應於該第一參考圖像清單不包括具有該第一POC值之該參考圖像:判定由與在一第二方向上指向的該對應區塊之一第二運動向量相關聯之一參考索引參考的一第二參考圖像之一第二POC值,其中該第二方向不同於該第一方向,其中該第二方向對應於該第一參考圖像清單及該第二參考圖像清單中之另一者;判定用於該當前區塊之該第一參考圖像清單是否包括具有該第二POC值之一參考圖像;及 回應於該第一參考圖像清單包括具有該第二POC值之該參考圖像而使用該對應區塊之該第二運動向量作為該方向運動預測子來寫碼該當前運動向量。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201261684100P | 2012-08-16 | 2012-08-16 | |
| US13/968,362 US9357195B2 (en) | 2012-08-16 | 2013-08-15 | Inter-view predicted motion vector for 3D video |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW201419877A TW201419877A (zh) | 2014-05-16 |
| TWI501611B true TWI501611B (zh) | 2015-09-21 |
Family
ID=50099786
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW102129557A TWI501611B (zh) | 2012-08-16 | 2013-08-16 | 用於3d視訊之視圖間預測之運動向量 |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US9357195B2 (zh) |
| EP (1) | EP2885916B1 (zh) |
| KR (1) | KR101751145B1 (zh) |
| CN (1) | CN104584558B (zh) |
| ES (1) | ES2669399T3 (zh) |
| HU (1) | HUE036380T2 (zh) |
| TW (1) | TWI501611B (zh) |
| WO (1) | WO2014028870A1 (zh) |
Families Citing this family (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101532665B1 (ko) * | 2011-03-14 | 2015-07-09 | 미디어텍 인크. | 시간적 움직임 백터 예측을 도출하기 위한 방법 및 장치 |
| WO2012128540A2 (ko) * | 2011-03-21 | 2012-09-27 | 엘지전자 주식회사 | 움직임 벡터 예측자 선택 방법 및 이를 이용하는 장치 |
| SI2717574T1 (sl) | 2011-05-31 | 2021-04-30 | JVC Kenwood Corporation | Naprava za dekodiranje gibljivih slik, postopek za dekodiranje gibljivih slik, program za dekodiranje gibljivih slik |
| WO2012177052A2 (ko) | 2011-06-21 | 2012-12-27 | 한국전자통신연구원 | 인터 예측 방법 및 그 장치 |
| KR20120140592A (ko) * | 2011-06-21 | 2012-12-31 | 한국전자통신연구원 | 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치 |
| US9936219B2 (en) * | 2012-11-13 | 2018-04-03 | Lg Electronics Inc. | Method and apparatus for processing video signals |
| CN105637873A (zh) * | 2013-10-18 | 2016-06-01 | Lg电子株式会社 | 编译/解码包括多视图的视频的方法和设备 |
| CN106063272B (zh) * | 2014-01-02 | 2019-11-15 | 世宗大学校产学协力团 | 编码多视图视频的方法及其设备和解码多视图视频的方法及其设备 |
| CN106471806B (zh) * | 2014-06-16 | 2019-06-04 | 高通股份有限公司 | 3d-hevc中的简化移位合并候选者及合并列表导出 |
| WO2015196364A1 (en) * | 2014-06-24 | 2015-12-30 | Mediatek Singapore Pte. Ltd. | Methods for inter-view advanced residual prediction |
| CN106358042B (zh) * | 2015-07-17 | 2020-10-09 | 恩智浦美国有限公司 | 使用视频图像的帧间预测的并行解码器 |
| WO2017034089A1 (ko) * | 2015-08-23 | 2017-03-02 | 엘지전자(주) | 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치 |
| CN109565605B (zh) * | 2016-08-10 | 2021-06-29 | 松下电器(美国)知识产权公司 | 拍摄技术生成方法以及影像处理装置 |
| EP3349451A1 (en) | 2017-01-11 | 2018-07-18 | Thomson Licensing | Method and apparatus for selecting a coding mode used for encoding/decoding a residual block |
| CN116170585A (zh) * | 2017-01-16 | 2023-05-26 | 世宗大学校产学协力团 | 影像编码/解码方法 |
| CN109005412B (zh) * | 2017-06-06 | 2022-06-07 | 北京三星通信技术研究有限公司 | 运动矢量获取的方法及设备 |
| KR102578757B1 (ko) * | 2017-09-19 | 2023-09-15 | 삼성전자주식회사 | 움직임 정보의 부호화 및 복호화 방법, 및 움직임 정보의 부호화 및 복호화 장치 |
| US11477474B2 (en) * | 2018-06-08 | 2022-10-18 | Mediatek Inc. | Methods and apparatus for multi-hypothesis mode reference and constraints |
| MX392418B (es) * | 2018-06-29 | 2025-03-24 | Beijing Bytedance Network Tech Co Ltd | Poda parcial/total cuando se añade un candidato a hmvp para fusión/amvp. |
| TWI719525B (zh) | 2018-06-29 | 2021-02-21 | 大陸商北京字節跳動網絡技術有限公司 | Lut與amvp之間的交互 |
| EP3840386A4 (en) | 2018-09-04 | 2021-09-22 | Huawei Technologies Co., Ltd. | METHOD AND DEVICE FOR DETERMINING A REFERENCE FRAME FOR BIDIRECTIONAL INTER-FRAME PREDICTION |
| WO2020086317A1 (en) * | 2018-10-23 | 2020-04-30 | Tencent America Llc. | Method and apparatus for video coding |
| JP7275286B2 (ja) | 2019-01-10 | 2023-05-17 | 北京字節跳動網絡技術有限公司 | Lut更新の起動 |
| CN111479111B (zh) * | 2019-01-23 | 2024-04-09 | 华为技术有限公司 | 图像显示顺序的确定方法、装置和视频编解码设备 |
| CN113709469B (zh) | 2019-03-11 | 2022-11-01 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置及其设备 |
| CN113615193B (zh) | 2019-03-22 | 2024-06-25 | 北京字节跳动网络技术有限公司 | Merge列表构建和其他工具之间的交互 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI350108B (en) * | 2005-09-27 | 2011-10-01 | Qualcomm Inc | Redundant data encoding methods and device |
| TWI353181B (en) * | 2006-06-19 | 2011-11-21 | Lg Electronics Inc | Method and apparatus for processing a video signal |
| TWI355204B (en) * | 2006-11-17 | 2011-12-21 | Lg Electronics Inc | Method and apparatus for decoding/encoding a vide |
| TWI355205B (en) * | 2007-01-24 | 2011-12-21 | Lg Electronics Inc | A method and an apparatus for processing a video s |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| ZA200805337B (en) * | 2006-01-09 | 2009-11-25 | Thomson Licensing | Method and apparatus for providing reduced resolution update mode for multiview video coding |
| TWI344791B (en) * | 2006-07-12 | 2011-07-01 | Lg Electronics Inc | A method and apparatus for processing a signal |
| RU2011110246A (ru) * | 2008-09-24 | 2012-09-27 | Сони Корпорейшн (JP) | Устройство и способ обработки изображений |
| US8913657B2 (en) * | 2008-10-27 | 2014-12-16 | Lg Electronics Inc. | Virtual view image synthesis method and apparatus |
| US8462849B2 (en) | 2008-12-23 | 2013-06-11 | General Instrument Corporation | Reference picture selection for sub-pixel motion estimation |
| WO2010123198A2 (ko) | 2009-04-21 | 2010-10-28 | 엘지전자 주식회사 | 다시점 비디오 신호 처리 방법 및 장치 |
| JP2014523708A (ja) | 2011-07-01 | 2014-09-11 | モトローラ モビリティ エルエルシー | 動きベクトル予測設計の簡易化 |
| US10034018B2 (en) | 2011-09-23 | 2018-07-24 | Velos Media, Llc | Decoded picture buffer management |
| US20130089152A1 (en) | 2011-10-05 | 2013-04-11 | Qualcomm Incorporated | Signaling picture identification for video coding |
| KR102106536B1 (ko) * | 2012-04-25 | 2020-05-06 | 삼성전자주식회사 | 다시점 비디오 예측을 위한 참조픽처세트를 이용하는 다시점 비디오 부호화 방법 및 그 장치, 다시점 비디오 예측을 위한 참조픽처세트를 이용하는 다시점 비디오 복호화 방법 및 그 장치 |
-
2013
- 2013-08-15 US US13/968,362 patent/US9357195B2/en active Active
- 2013-08-16 TW TW102129557A patent/TWI501611B/zh active
- 2013-08-16 HU HUE13753249A patent/HUE036380T2/hu unknown
- 2013-08-16 KR KR1020157006523A patent/KR101751145B1/ko active Active
- 2013-08-16 EP EP13753249.5A patent/EP2885916B1/en active Active
- 2013-08-16 WO PCT/US2013/055406 patent/WO2014028870A1/en not_active Ceased
- 2013-08-16 CN CN201380043127.5A patent/CN104584558B/zh active Active
- 2013-08-16 ES ES13753249.5T patent/ES2669399T3/es active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI350108B (en) * | 2005-09-27 | 2011-10-01 | Qualcomm Inc | Redundant data encoding methods and device |
| TWI353181B (en) * | 2006-06-19 | 2011-11-21 | Lg Electronics Inc | Method and apparatus for processing a video signal |
| TWI355204B (en) * | 2006-11-17 | 2011-12-21 | Lg Electronics Inc | Method and apparatus for decoding/encoding a vide |
| TWI355205B (en) * | 2007-01-24 | 2011-12-21 | Lg Electronics Inc | A method and an apparatus for processing a video s |
Non-Patent Citations (1)
| Title |
|---|
| Title:Test Model under Consideration for HEVC based 3D video coding,February 2012, San Jose, CA, USA,http://new.owieczka.net/wp-content/publication/2012/w12559.pdf’ * |
Also Published As
| Publication number | Publication date |
|---|---|
| US9357195B2 (en) | 2016-05-31 |
| EP2885916A1 (en) | 2015-06-24 |
| ES2669399T3 (es) | 2018-05-25 |
| WO2014028870A1 (en) | 2014-02-20 |
| US20140049605A1 (en) | 2014-02-20 |
| CN104584558B (zh) | 2018-01-19 |
| KR101751145B1 (ko) | 2017-06-26 |
| HUE036380T2 (hu) | 2018-07-30 |
| KR20150043464A (ko) | 2015-04-22 |
| EP2885916B1 (en) | 2018-02-21 |
| TW201419877A (zh) | 2014-05-16 |
| CN104584558A (zh) | 2015-04-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI501611B (zh) | 用於3d視訊之視圖間預測之運動向量 | |
| CN104685883B (zh) | 用于3d视频的经视图间预测运动向量 | |
| CN104956678B (zh) | 用于三维视频的高级合并/跳过模式及高级运动向量预测(amvp)模式 | |
| JP6336987B2 (ja) | 3d映像に関するインタービュー動き予測 | |
| JP6337104B2 (ja) | テクスチャコーディングのためのより正確な高度残差予測(arp) | |
| JP6254254B2 (ja) | 3次元(3d)ビデオコーディング用の進化型マージモード | |
| JP6522629B2 (ja) | 3dビデオコード化のためのブロックベースの高度残差予測 | |
| TWI543591B (zh) | 寫碼視訊資料之方法、用於寫碼視訊資料之裝置及電腦可讀儲存媒體 | |
| JP2019068448A (ja) | 3dビデオコーディングにおける視差ベクトル導出および動きベクトル予測の簡略化 | |
| US9438926B2 (en) | Constraints on neighboring block based disparity vector (NBDV) techniques for 3D video | |
| TW201340724A (zh) | 視訊寫碼中之像差向量預測 | |
| CN109547800B (zh) | 用于3d-hevc的简化高级残余预测 | |
| HK1216809B (zh) | 用於纹理译码的先进残余预测(arp)的方法和设备 |