TW202518904A - 基於塊向量和運動向量的跨分量模型傳播決策規則 - Google Patents
基於塊向量和運動向量的跨分量模型傳播決策規則 Download PDFInfo
- Publication number
- TW202518904A TW202518904A TW113132909A TW113132909A TW202518904A TW 202518904 A TW202518904 A TW 202518904A TW 113132909 A TW113132909 A TW 113132909A TW 113132909 A TW113132909 A TW 113132909A TW 202518904 A TW202518904 A TW 202518904A
- Authority
- TW
- Taiwan
- Prior art keywords
- block
- cross
- picture
- component
- current
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了一種用於編解碼像素塊的跨分量預測方法。一個當前塊具有第一色塊和第二色塊。視訊編解碼器為第一色塊生成一個重建。視訊編解碼器從一個參考塊繼承一個跨分量模型,其中該跨分量模型是基於兩個或多個進一步參考塊的跨分量預測資訊傳播給該參考塊,例如,從多個進一步參考塊中選擇一個參考塊來為當前塊提供跨分量模型。這些進一步參考塊可能是通過參考塊的運動向量或塊向量來定位的。視訊編解碼器將繼承的跨分量模型應用於第一色塊的重建,以生成第二色塊的一個跨分量預測。視訊編解碼器使用生成的跨分量預測來編碼或解碼當前塊。
Description
技術領域
本公開內容一般涉及視訊編解碼。特別是,本公開內容涉及藉由跨分量(cross-component)預測來編解碼像素塊的方法,具體是通過傳播(propagate)跨分量模型。
除非在此處另有說明,本節所述的方法不屬於下列請求項中的先前技術,並且不因包含在本節中而被承認為先前技術。
高效率視訊編解碼(High-Efficiency Video Coding,簡稱 HEVC)是由視訊編解碼聯合協作小組(Joint Collaborative Team on Video Coding,簡稱 JCT-VC)制定的國際視訊編解碼標準。HEVC 是基於混合塊的運動補償 DCT 類變換編解碼架構。壓縮的基本單位稱為編解碼單元(Coding Unit,簡稱 CU),是一個 2Nx2N 正方像素塊,每個 CU 可以遞迴地分割成四個更小的 CU,直到達到預定的最小尺寸。每個 CU 包含一個或多個預測單元(Prediction Units,簡稱 PUs)。
多功能視訊編解碼(Versatile Video Coding,簡稱 VVC)是由國際電信聯盟-電信標準化部門工作組16的工作小組3(ITU-T SG16 WP3)和國際標準化組織/國際電工委員會聯合技術委員會1的分委會29的工作組11(ISO/IEC JTC1/SC29/WG11)的聯合視訊專家小組(Joint Video Expert Team,簡稱 JVET)開發的最新國際視訊編解碼標準。輸入的視訊訊號是從重建的信號中預測出來的,而重建的信號是由已編碼的圖片區域得出的。預測的殘差信號由塊變換處理。變換係數經過量化並與位元流中的其他輔助資訊(side information)一起熵編碼。重建信號是從預測信號和重建殘差信號在對去量化的變換係數進行反變換後生成的。重建信號進一步經過環路濾波處理以消除編解碼偽影。解碼後的圖片被存儲在幀緩衝器中,用於預測輸入視訊訊號中的後續圖片。
在 VVC 中,編碼的圖片被劃分為不重疊的正方形塊區域,由相關的編解碼樹單元(Coding Tree Units,簡稱 CTUs)表示。編解碼樹的葉節點對應於編解碼單元(CUs)。編碼的圖片可以由切片(Slices)的集合來表示,每個切片包括整數個 CTUs。切片中的個別 CTUs 是按光柵掃描順序(raster-scan order)處理。雙向預測(bi-predictive,簡稱B)切片可以使用幀內預測或幀間預測進行解碼,最多使用兩個運動向量(Motion Vectors,簡稱 MVs)和參考索引(Reference Indices)來預測每個塊的樣本值。預測(predictive,簡稱P)切片使用幀內預測或幀間預測,最多使用一個運動向量和參考索引來預測每個塊的樣本值。幀內(Intra,簡稱I)切片僅使用幀內預測解碼。
CTU 可以使用具有嵌套多類型樹(Multi-Type-Tree,簡稱 MTT)結構的四叉樹(Quadtree,簡稱 QT)被分割成一個或複數個不重疊的編解碼單元(CUs),以適應各種局部運動和紋理特性。CU可以選用五種分割類型(四叉樹分割、垂直二叉樹分割、水平二叉樹分割、垂直中側三叉樹分割、水平中側三叉樹分割)之一被進一步分割成更小的CU:。
每個 CU 包含一個或多個預測單元(PUs)。預測單元連同相關的 CU 語法(syntax),作為傳訊(signaling)預測子 (predictor)資訊的基本工作單元。採用指定的預測過程來預測 PU 內相關像素樣本的值。每個 CU包含一個或多個變換單元(Transform Units,簡稱 TUs)用來表示預測殘差塊。變換單元(TU)由一個亮度樣本的變換塊(Transform Block,簡稱 TB)和兩個相應的色度樣本的變換塊組成,每個 TB 對應於一個顏色分量的樣本殘差塊。整數變換被應用於一變換塊。量化係數的位準值(level value) 連同其他輔助資訊(side information)一同進行熵編碼形成元流。編解碼樹塊(Coding Tree Block,簡稱 CTB)、編解碼塊(Coding Block,簡稱 CB)、預測塊(Prediction Block,簡稱 PB)和變換塊(Transform Block,簡稱 TB)這些術語被定義為與 CTU、CU、PU 和 TU 相關的單色分量的二維樣本陣列。因此,一個 CTU 包含一個亮度 CTB、兩個色度 CTB 和相關的語法元素。CU、PU 和 TU 之間也有類似的關係。
對於每個幀間預測的 CU,由運動向量、參考圖片索引、參考圖片清單使用索引、以及附加資訊組成的運動參數被用於幀間預測樣本生成。該運動參數可以以顯式或隱式方式信號傳訊。當 CU 以跳過模式編碼時,該CU 與一個 PU 相關聯,並且沒有有效殘差係數(significant residual coefficients)、沒有編碼的運動向量增量、或沒有參考圖片索引。此時定義了一種合併模式,其中當前 CU的運動參數係從鄰近的CU中獲得,包含空間上和時間上的候選者,以及在 VVC 中引入的附加時間表。該合併模式可以應用於任何幀間預測的 CU。該合併模式的替代方案是將運動參數被顯式地傳輸,其中運動向量、每個參考圖片清單的相應參考圖片索引、參考圖片清單使用標誌、以及其他所需資訊在每個 CU 被顯式地傳訊。為了提高編解碼性能和/或降低執行跨分量預測的系統的複雜性,公開了通過跨分量預測編解碼像素塊的方法和裝置。
以下摘要僅供參考,並不旨在以任何方式限制。也就是說,以下摘要旨在介紹本文所述的新穎且非顯而易見技術的概念、亮點、好處和優勢。在以下的詳細描述中進一步說明選擇性且非全部實施方式。因此,以下摘要並非旨在確定要求保護主題的基本特徵,也不旨在於確定所聲明主題的範圍。
本公開的某些實施例提供了一種用於編解碼像素塊的跨分量預測方法。一個當前塊有一個第一色塊和一個第二色塊。視訊編解碼器為該第一色塊生成一個重建樣本。該視訊編解碼器從一個參考塊繼承一個跨分量模型,其中該跨分量模型是基於兩個或多個進一步參考塊的跨分量模型傳播給該參考塊。視訊編解碼器將繼承的跨分量模型應用於第一色塊的重建樣本,以生成該第二色塊的一個跨分量預測。視訊編解碼器使用該生成的跨分量預測來編碼或解碼當前塊。
該兩個或多個進一步參考塊可能是由該參考塊的一個以上運動向量或塊向量定位的(例如,當參考塊是一個雙向幀間預測塊時)。在某些實施例中,參考塊不是由跨分量預測進行編碼的。
在某些實施例中,該視訊編解碼器通過從參考塊的兩個或多個進一步參考塊中選擇一選定進一步參考塊來提供該跨分量模型給該參考塊,從而傳播該跨分量模型。可以根據一組預定義規則選擇該選定進一步參考塊。視訊編解碼器可以通過識別一個由跨分量預測編碼的塊來選POC擇該選定進一步參考塊。視訊編解碼器可以自兩個或多個進一步參考塊中唯一具有跨分量模型的進一步參考塊來選出該選定進一步參考塊。視訊編解碼器可以通過識別一個由當前圖片參考(例如,IBC模式)編碼的塊,或通過識別一個由幀內預測編碼的塊,或通過識別一個由幀間預測編碼的塊來選擇該選定進一步參考塊。
在某些實施例中,通過識別在兩個或多個進一步參考塊中與該參考塊有最短空間(spatial)距離的塊來選擇該選定進一步參考塊。空間距離可以是垂直或水平距離,或歐幾里得距離,或曼哈頓距離,或明可夫斯基距離。在某些實施例中,通過識別在兩個或多個進一步參考塊中與該參考塊有最短時間(temporal)距離的塊來選擇該選定進一步參考塊。一個塊的時間距離可以基於該塊的進一步參考圖片的POC和參考圖片的POC來確定。
可以通過識別在各該進一步參考塊中具有與該參考塊的量化參數QP最接近的塊來選擇該選定進一步參考塊,或通過識別在各該進一步參考塊中具有最大QP的塊,或通過識別在各該進一步參考塊中具有最小QP的塊,或識別在各該進一步參考塊中由L0(或L1)運動向量指示的塊。
在以下的詳細說明中,通過設定大量的具體細節作為例子,以提供對相關教示的徹底理解。基於此處描述的教示的任何變化、衍生和/或擴展都在本公開的保護範圍內。在某些情況下,關於一個或多個示例實施的已知方法、程序、組件和/或電路可能會以相對較高階的描述來進行,而不涉及細節,以避免不必要地模糊本公開的教示。
I. 跨分量預測
a. 跨分量線性模型(Cross Component Linear Model,簡稱 CCLM)
跨分量線性模型(CCLM)或線性模型(LM)模式是一種跨分量預測模式,在該模式中,塊的色度分量是通過線性模型從位於並位(collocated)位置的重建亮度樣本中預測得到的。線性模型的參數(例如,縮放比例和偏移)是基於已經重建的鄰近該塊的亮度和色度樣本導出的。例如,在VVC中,CCLM模式利用通道間依賴性從重建的亮度樣本預測出色度樣本。這種預測係使用線性模型來進行,表示為:
(1)
在等式(1)中
表示一個CU中的預測色度樣本(或當前CU的預測色度樣本),
代表同一CU的降採樣(down sampled)重建亮度樣本(或當前CU的對應重建亮度樣本)。
CCLM模型參數α(比例參數) 和 β (偏移參數) 是基於最多四個鄰近的色度樣本及其對應的降採樣亮度樣本導出的。在LM_A模式(也稱為LM-T模式)中,只使用上方或頂部鄰近的模板來計算線性模型係數。在LM_L模式(也稱為LM-L模式)下,只使用左側模板來計算線性模型係數。在LM-LA模式(也稱為LM-LT模式)中,左側和上方模板都使用於計算線性模型係數。在本公開中,{LM_LA, LM_A, LM_L} 和 {CCLM_LT, CCLM_T, CCLM_L} 這些術語可以互換使用。CCLM_LT, LM_LA 和 CCLM_LA 這些術語也可以互換使用。
第1圖概念性地說明了用於推導線性模型參數的色度和亮度樣本。該圖示出了一個當前塊100,具有4:2:0格式的亮度分量樣本和色度分量樣本。鄰近當前塊的亮度和色度樣本是重建樣本。這些重建樣本被用來導出跨分量線性模型(參數 α和 β)。由於當前塊是4:2:0格式的,因此在用於線性模型導出之前,亮度樣本首先被降採樣。在示例中,有16對鄰近當前塊的重建亮度(降採樣)和色度樣本。這16對亮度與色度值被用來導出線性模型參數。
假設當前色度塊的尺寸為W×H,則W'和H'設定為
– W’= W, H’= H 當LM-LT模式被應用時;
– W’= W + H 當LM-T模式被應用時;
– H’= H+W 當LM-L模式被應用時
上述鄰近位置被標記為S[ 0, −1 ]...S[ W’− 1, −1 ],左側鄰近位置被標記為S[ −1, 0 ]... S[ −1, H’− 1 ]。然後選擇四個樣本為
– S[W’/ 4, −1 ], S[ 3 * W’/ 4, −1 ], S[ −1, H’/ 4 ], S[ −1, 3 * H’/ 4 ] 當LM-LT模式被應用時(上方和左側鄰近樣本都可用);
– S[ W’/ 8, −1 ], S[ 3 * W’/ 8, −1 ], S[ 5 * W’/ 8, −1 ], S[ 7 * W’/ 8, −1 ] 當LM-T模式被應用時(只有上方鄰近樣本可用);
– S[ −1, H’/ 8 ], S[ −1, 3 * H’/ 8 ], S[ −1, 5 * H’/ 8 ], S[ −1, 7 * H’/ 8 ] 當LM-L模式被應用時(只有左側鄰近樣本可用);
在選定位置的四個鄰近亮度樣本被降採樣並比較四次以找到兩個較大值:
x 0 A 和
x 1
A ,以及兩個較小值:
x 0 B 和
x 1
B 。它們對應的色度樣本值被標記為
y 0 A ,
y 1 A ,
y 0 B 和
y 1 B 。然後
X
A ,
X
B ,
Y
A 和
Y
B 被導出為:
X
a = (
x 0
A +
x 1
A +1)>>1;
X
b = (
x 0
B +
x 1
B +1)>>1; (2)
Y
a = (
y 0 A +
y 1 A +1)>>1;
Y
b = (
y 0 B +
y 1 B +1)>>1 (3)
線性模型參數α和β根據以下等式獲得:
(4)
(5)
在某些實施例中,為了獲得更多樣本以計算CCLM模型參數α和β,上述模板被擴展以包含(W+H)樣本用於LM-T模式,左側模板被擴展以包含(H+W)樣本用於LM-L模式。對於LM-LT模式,左側模板和上方模板都被用來計算線性模型係數。
為了匹配4:2:0視訊序列的色度樣本位置,兩種類型的降採樣濾波器被應用於亮度樣本以實現在水平和垂直方向上以2:1 的降採樣比率。降採樣濾波器的選擇係傳訊律定於序列參數集(sequence parameter set,簡稱SPS)級別標誌。這兩種降採樣濾波器分別對應於“類型-0”和“類型-2”內容。
(6)
(7)
b. 多模型CCLM (MMLM)
多模型CCLM模式(MMLM)使用兩個模型從亮度樣本預測色度樣本,應用於整個CU。類似於CCLM,三種多模型CCLM模式(MMLM_LA, MMLM_A, 和MMLM_L)被用來指示是否一同使用上方和左側鄰近樣本、僅使用上方鄰近樣本,或僅使用左側鄰近樣本來導出模型參數。
在MMLM中,當前塊的鄰近亮度樣本和鄰近色度樣本被分類為兩類組,每組被用作訓練集(training set)來導出一個線性模型(即,為特定類組導出特定的α和β)。此外,當前亮度塊的樣本也根據鄰近亮度樣本的分類規則進行分類。
第2圖顯示出將相鄰樣本分類為兩組的示例。一閾值係計算鄰近重建的亮度樣本的平均值而得。位於[x,y]的鄰近樣本,當Rec’
L [x,y] <= 該閾值時,則被分類為第1組;而位於[x,y]的鄰近樣本,若Rec’
L [x,y] > 閾值時,則被分類為第2組。因此,對色度樣本的多模型CCLM預測為:
Pred
c [x,y] = α
1 ×Recʹ
L [x,y]+β
1 當Rec’
L [x,y] ≤閾值
Pred
c [x,y] = α
2 ×Recʹ
L [x,y]+β
2 當 Rec’
L [x,y] >閾值
c. 卷積跨分量模型 (CCCM)
在某些實施例中,應用卷積跨分量模型(CCCM)以提高跨分量預測性能。對於某些實施例,卷積模型具有7-抽頭濾波器,具有5-抽頭加符號形狀的空間分量、非線性項和偏置項。濾波器的空間5-抽頭分量包括中心(C)亮度樣本(要與待預測的色度樣本共位, Collocated)及該中心亮度樣本的上/北(N)、下/南(S)、左/西(W)和右/東(E)鄰居。第3圖概念性地說明了卷積濾波器的空間分量。非線性項(表示為P)表示為中心亮度樣本C的二次冪,並按內容的樣本值範圍進行縮放:
P = (C*C + midVal) >> bitDepth (8)
因此,對於10位元內容,非線性項P的計算方法為:
P = (C*C + 512) >> 10
偏置項(表示為B)表示輸入和輸出之間的標量偏移(類似於CCLM中的偏移項),並設置為中間色度值(對於10位元內容為512)。濾波器的輸出被計算為濾波器係數c
i和輸入值之間的卷積,並裁剪到有效色度樣本的範圍:
predChromaVal = c
0C + c
1N + c
2S + c
3E + c
4W + c
5P +c
6B (9)
d. 梯度線性模型 (GLM)
對於 YUV 4:2:0 色彩格式,可以使用梯度線性模型(gradient linear model,簡稱 GLM)方法從亮度樣本梯度預測色度樣本。支援兩種模式:二參數 GLM 模式和三參數 GLM 模式。
相較於 CCLM,二參數 GLM 利用亮度樣本梯度而非降採樣的亮度值來導出線性模型。具體來說,當應用二參數 GLM 時,CCLM 過程的輸入,即降採樣的亮度樣本
,被亮度樣本梯度
所取代。
C = ⍺⋅G + β
CCLM 的其他部分(例如,參數導出、預測樣本線性變換)保持不變。在三參數 GLM 中,色度樣本可以基於亮度樣本梯度和不同參數的降採樣亮度值進行預測:
C = α
0⋅G + α
1⋅L + α
2⋅β
三參數 GLM 的模型參數是根據 6 行和列鄰近樣本通過 LDL 分解基於 MSE 最小化方法導出的,如同在 CCCM 中使用的那樣。
對於訊號傳遞,若當前 CU 啟用 CCLM 模式時,會傳訊一個標誌(flag)以指示是否為 Cb 和 Cr 分量皆啟用 GLM;如果啟用了 GLM,則會傳訊另一個標誌以指示選擇了兩種 GLM 模式中的哪一種,並進一步傳訊一個語法元素以選擇四種梯度濾波器中的一種進行梯度計算。第4圖示出梯度濾波器所採用的梯度線性模型(GLM),具體來說,該圖說明了四種基於 Sobel 的 GLM 梯度模式 401-404。每個梯度模式中間的灰點代表色度位置(C)。
e. 跨分量殘差模型(Cross-Component Residual Model,簡稱 CCRM)
跨分量殘差模型(CCRM)可以用來從重建的亮度樣本預測色度樣本,若當前塊使用幀間預測或當前圖片內塊複製(intra block copy,簡稱 IBC,指的是通過使用塊向量在同一當前圖片內參考像素位置來編解碼像素塊)。
第5圖示出使用跨分量殘差模型(CCRM)的分量樣本重建。該圖說明了解碼器端的解碼方法。跨分量濾波器是使用亮度和色度的預測訊號導出的。導出的濾波器應用於重建的亮度訊號,產生最終的色度預測。
導出的濾波器可能是一個 8-抽頭濾波器,由 6 個空間亮度樣本、一個非線性項和一個偏置項組成。第6圖說明了 CCRM 濾波器預測的色度樣本相對於亮度樣本的位置。如圖所示,空間亮度樣本(L0, L1, L2, L3, L4, L5)是從亮度網格中通過選擇最接近色度位置 C 的 6 個亮度樣本獲得的,而不進行降採樣。濾波器預測的色度值可以獲得為,
predChromaVal = c
0L0+c
1L1+c
2L2+c
3L3+c
4L4+c
5L5
+c
6nonlinear((L0+L3+1) >> 1) + c
7B,
其中“nonlinear”是 CCCM 的非線性運算子,B是偏置項。
II. 當前圖片參考
a. 當前圖片內塊複製(IBC)
當前圖片內塊複製(IBC)或當前圖片參考(current picture referencing,簡稱 CPR)指的是通過使用塊向量在同一當前圖片內參考像素位置來編解碼像素塊。
b. 幀內模板匹配
幀內模板匹配預測(Intra Template Matching Prediction,簡稱 IntraTMP)是一種特殊的幀內預測模式,它從當前幀的重建部分複製最佳預測塊,其 L 形模板與當前模板匹配。對於預定義的搜索範圍,編碼器在當前幀的重建部分搜索與當前模板最相似的模板,並使用相應的塊作為預測塊。然後編碼器傳訊(signaling)該模式的使用,並在解碼器端執行相同的預測操作。預測訊號是通過匹配當前塊的 L 形、僅頂部或僅左側的因果鄰近causal neighbor像素與預定義搜索區域中的另一塊生成的。
第7圖說明用於幀內模板匹配的預定義搜索區域。如圖所示,對於具有當前模板區域 720 的當前塊 710 在當前 CTU 705 中,在幾個預定義的搜索區域進行搜索,以搜索匹配的參考模板區域 730(從而找到相應的參考塊 735)。預定義的搜索區域包括 R1(在當前 CTU 內)、R2(當前 CTU 的左上方)、R3(當前 CTU 的上方)和 R4(當前 CTU 的左側)。模板匹配是以絕對差值之和(Sum of Absolute Differences,簡稱 SAD)作為成本函數。
c. 色度塊的直接塊向量
在雙樹切片(slice)中,可以為色度塊使用直接塊向量。當啟用色度雙樹時,會傳訊一個標誌以指示色度塊是否使用 IBC 模式進行編碼。具體來說,如果五個預定義位置中的一個亮度塊使用 IBC 或 IntraTMP 模式進行編碼,其塊向量(BV)被縮放並用作色度塊的塊向量。模板匹配用於執行塊向量縮放(從亮度域到色度域)。第8圖顯示了用於導出相應色度塊的直接塊向量的亮度塊。該圖顯示了用於確定是否將亮度塊的 BV 縮放並用作色度塊的 BV 的五個預定義位置。
III. 繼承跨分量模型
a. 繼承鄰近模型參數
當在當前塊上應用跨分量預測編解碼工具以生成預測信號時,跨分量模型(cross-component model,簡稱 CCM)資訊,包括模型參數可以從鄰近塊繼承。在某些實施例中,如果繼承的鄰近塊是以CCLM模式編碼的,則當前塊的最終縮放參數是從鄰近塊繼承的。一旦確定了最終縮放參數,則基於繼承的縮放參數和當前塊的鄰近亮度和色度樣本的平均值,導出偏移參數(例如,
在CCLM中)。
在某些實施例中,如果繼承的鄰近塊是以CCLM模式編碼的,在繼承模型參數之後,偏移參數可以繼承或可以進一步通過dB精煉。例如,如果最終偏移參數是從選定的鄰近塊繼承的,且繼承的偏移參數是
,則最終偏移參數是(
+ dB)。例如,dB可以被傳訊或基於鄰近重建樣本導出。例如,dB可以是零。
在某些實施例中,如果繼承的鄰近塊是以CCCM編碼的,則過濾器係數(
)被繼承。偏移參數(例如,
或
在CCCM中)可以基於繼承的參數和當前塊的鄰近對應位置亮度和色度樣本的平均值重新導出。在某些實施例中,如果繼承的鄰近塊是使用CCCM編碼的,則過濾器係數(
)被繼承。偏移參數(例如,
或
在CCCM中)也被繼承,且在編碼或解碼當前塊時不重新導出。
在某些實施例中,如果繼承的候選塊對其亮度重建樣本應用GLM梯度模式,則當前塊也可能繼承候選塊的GLM梯度模式並應用於當前亮度重建樣本。在某些實施例中,如果繼承的鄰近塊是使用多個跨分量模型(例如,MMLM,或帶有多模型的CCCM)編碼的,則分類閾值也被繼承,以將當前塊的鄰近樣本分類為多個組,並將繼承的多個跨分量模型參數進一步分配給每個組。
b. 繼承CCM資訊
在某些實施例中,繼承的跨分量模型的CCM資訊可以與繼承的模型參數一起存儲。CCM資訊可以與繼承的模型參數一起繼承。可以基於繼承的CCM資訊和/或繼承的模型參數生成當前塊的預測。
CCM資訊可以包括但不限於:預測模式(例如,CCLM,MMLM,CCCM,帶有多模型的CCCM,2參數GLM,3參數GLM(帶有亮度項的GLM),CCRM),資訊指示模型中是否使用非線性項,模型索引用於指示在卷積模型中使用哪種模型形狀,多模型的分類閾值,資訊指示在卷積模型中是否使用非降採樣樣本,降採樣濾波器標誌,當使用多個降採樣濾波器時的降採樣濾波索引,資訊指示是否使用多個降採樣濾波器,用於導出模型的鄰近線數量,用於導出模型的模板類型(例如,左上,上,左),多模型標誌,後濾波標誌或模型參數。
在某些實施例中,一混合CCCM模型中包括各種項(例如,空間項,梯度項,位置項,非線性項和偏置項)可以被繼承。除了存儲模型參數外,預測模式可以存儲在CCM資訊中,以指示繼承的模型是包括各種項的混合CCCM模型。例如,基於梯度和位置的CCCM(GL-CCCM)是一種混合CCCM模型,其中包括中心位置的一個空間項,水平方向和垂直方向的兩個梯度項,相對水平位置和相對垂直位置的兩個位置項X和Y,以及一個非線性項和一個偏置項。預測模式可以存儲在CCM資訊中,以指示繼承的模型是GL-CCCM模型。如果有多種類型的混合CCCM模型,模型索引也可以存儲在CCM資訊中,以指示繼承的是哪種類型的混合CCCM模型。
c. 繼承空間鄰近模型參數
在某些實施例中,繼承的模型參數可以來自一個直接鄰近的塊。來自預定位置的塊的模型被添加到一個預定順序的CCP合併候選清單中。CCP合併候選清單可能包括來自空間、時間和非鄰接鄰居的模型,和/或來自歷史表和/或來自默認模型的各式模型。
視訊編碼器可能傳訊該索引以從該清單中選擇一個CCP合併候選。視訊解碼器可能基於選定的繼承候選模型參數生成當前塊的對應預測器。在某些實施例中,視訊編碼器可能傳訊一個標誌以指示是否使用CCP合併模式(例如,在cclm_mode_flag之後)。在某些實施例中,一個開/關標誌被傳訊以指示當前塊是否繼承鄰近塊的跨分量模型參數(即,是否使用CCP合併模式)。該標誌可以按CU/CB,按PU,按TU/TB,按色彩分量,或按色度色彩分量傳訊。在某些實施例中,當該標誌為真時,一個索引被傳訊以指示哪個CCP合併候選被選擇。如果當前塊繼承鄰近塊的跨分量模型參數,則繼承候選索引被傳訊。索引可以被(例如,truncate unary code, Exp-Golomb code, 或 fix length code)編碼並傳訊,並在當前的Cb和Cr塊之間共享。
在某些實施例中,預定義位置和預定義順序可以與幀間合併模式的空間候選位置相同。第9圖說明了從空間中鄰近塊的預定義位置來繼承模型參數。預定義順序可以是B
0,A
0,B
1,A
1和B
2,因為它們相應的模型參數被添加到CCP合併候選清單中。
在某些實施例中,假設當前塊的位置、寬度和高度分別為(x, y)、W和H,預定義位置可能包括當前塊正上方的位置,例如(x + W >> 1, y-1)或(x + (W+1) >> 1, y-1),如果W大於或等於一閾值TH。預定義位置也可能包括當前塊正左側的位置,例如(x-1, y+H>>1)或(x-1, y+(H+1)>>1),如果H大於或等於一閾值TH。TH可以是2、4、8、16、32或64。預定義位置包括在正上方(W >> 1)或((W >> 1) - 1)的位置如果W大於或等於TH,以及在正左側(H >> 1)或((H >> 1) - 1)的位置如果H大於或等於TH。
在某些實施例中,從空間鄰居繼承的模型數量有一個最大值,可以添加到CCP合併候選清單中,且該最大值小於預定義位置的數量。
d. 繼承時間鄰近模型參數
在某些實施例中,如果當前切片/圖片是非幀內切片/圖片,則繼承的模型參數可以來自先前編碼的切片/圖片中的塊。
第10圖概念性地說明了繼承時間鄰近模型參數。如圖所示,當前位置在(x, y),塊大小是
。繼承的模型參數可以來自先前編碼的切片/圖片中位置(x', y')、(x', y' + h/2)、(x' + w/2, y')、(x' + w/2, y' + h/2)、(x' + w, y')、(x', y' + h)或(x' + w, y' + h)的塊,其中x' = x +Δx且y' = y +Δy。在某些實施例中,如果當前塊的預測模式是幀內預測,則Δx和Δy設為0。如果當前塊的預測模式是幀間預測,則Δx和Δy設為當前塊的水平和垂直運動向量。在某些實施例中,如果當前塊是幀間雙向預測,則Δx和Δy設為參考圖片清單0中的水平和垂直運動向量。在某些實施例中,如果當前塊是幀間雙向預測,則Δx和Δy設為參考圖片清單1中的水平和垂直運動向量。
在某些實施例中,如果當前切片/圖片是非幀內切片/圖片,則繼承的模型參數可以來自先前編碼的切片/圖片中的塊。在一個實施例中,當前塊位置在(x, y),塊大小是
。兩個值集
和
被定義為:
在某些實施例中,
和
中的所有值都是正數。設
。繼承的模型參數可以來自先前編碼的切片/圖片中位置
的塊。
在某些實施例中,當前塊的位置在 (x, y),且塊大小為
。繼承的模型參數可以來自先前編碼的切片/圖片中位置
的塊。
在某些實施例中,
,例如
。在某些實施例中,
,例如
和
。
在某些實施例中,距離
較近的位置的模型首先被加入到最終的跨分量預測(CCP)合併候選清單中。在某些實施例中,距離
較近的位置的模型首先被加入到最終的跨分量預測(CCP)合併候選清單中。
在某些實施例中,設
和
為兩個固定的正數,繼承的模型參數可以來自先前編碼的切片/圖片中位置
的塊。
當前塊的位置位於 (x, y),且塊大小為
。設
和
為兩個固定的正數。繼承的模型參數可以來自先前編碼的切片/圖片中位置
的塊。
在某些實施例中,當前塊的位置位於 (x, y),且塊大小為
。繼承的模型參數可以來自先前編碼的切片/圖片中某些預定義位置
的塊。例如,位置在當前編碼塊對應區域內部,即
和
。繼承的模型參數可以來自位置
的塊。另一個例子,位置在當前編碼塊對應區域外部,即
和
。繼承的模型參數可以來自位置
的塊。
在某些實施例中,繼承的模型參數可以來自某些預定義位置的塊。預定義位置和包含順序 (inclusion order)可以與幀間合併模式的相同。繼承參數模型所來自的先前編碼圖片在此之後被稱為共位圖片(collocated picture)。在某些實施例中,繼承參數模型所來自的先前編碼圖片,即共位圖片,是參考清單中的圖片之一。
在某些實施例中,共位圖片可以與幀間合併模式的共位圖片相同。在某些實施例中,共位圖片係在圖片/切片標頭(header)中被傳訊(signaling)。參考清單和參考索引在圖片/切片標頭中被傳訊。例如,共位圖片被選擇為L0[0]。另一個例子,共位圖片被選擇為L1[0]。在某些實施例中,共位圖片被選擇為參考清單中與當前圖片的圖片順序計數值(POC)差異最小的圖片。(一個圖片的圖片順序計數值是一個指示圖片在一系列圖片中的時間順序的值。)例如,如果當前圖片的POC是8,參考清單0中圖片的POC是{7, 6, 5, 0},參考清單1中圖片的POC是{7, 6, 5, 4},那麼L0[0](等同於L1[0])被選擇,因為它的POC差異是最小的。在某些實施例中,如果有兩個圖片與當前圖片之間的POC差異都是最小的,則選擇POC較小的共位圖片。在某些實施例中,如果有兩個圖片與當前圖片之間的POC差異都是最小的,則選擇POC較大的共位圖片。在某些實施例中,如果有兩個圖片與當前圖片之間的POC差異都是最小的,則選擇與當前圖片QP值差異較小的共位圖片。在某些實施例中,如果有兩個圖片與當前圖片之間的POC差異都是最小的,則選擇QP較小的共位圖片。在某些實施例中,如果有兩個圖片與當前圖片之間的POC差異都是最小的,則選擇QP較大的共位圖片。
在某些實施例中,被選擇的共位圖片為參考清單中與當前圖片之間的QP差異最小的圖片。例如,如果當前圖片的QP是28,參考清單0中圖片的QP是{19, 26, 23},參考清單1中圖片的QP是{23, 22, 21}。那麼L0[1]被選擇。在某些實施例中,如果參考清單中有多於一個圖片與當前圖片之間的QP差異是最小的,則選擇QP較小的圖片。在某些實施例中,如果參考清單中有多於一個圖片與當前圖片之間的QP差異是最小的,則選擇QP較大的圖片。在某些實施例中,如果有多於一個圖片與當前圖片之間的QP差異是最小的,則選擇POC距離較小的圖片。在某些實施例中,共位圖片被選擇為參考清單中QP最小的圖片。在某些實施例中,共位圖片被選擇為參考清單中QP最大的圖片。
在某些實施例中,繼承參數模型來自的先前編碼圖片,即共位圖片,是最近編碼的I圖片。最近編碼的I切片/圖片的跨分量模型資訊被存儲在一個長期參考緩衝中。
在某些實施例中,共位圖片和繼承參數模型來自的預定義位置是由鄰近塊的運動向量確定的。例如,如果當前塊位置在(x, y)並且塊大小是
。繼承的模型參數可以來自於共位圖片中位置在(x’, y’)、(x’, y’ + h/2)、(x’ + w/2, y’)、(x’ + w/2, y’ + h/2)、(x’ + w, y’)、(x’, y’ + h)或(x’ + w, y’ + h)的塊,其中x’ = x + Δx且y’ = y + Δy。在某些實施例中,Δx和Δy被設置為鄰近塊的L0水平和垂直運動向量,且共位圖片是由鄰近塊的L0運動向量指示的L0參考圖片。在某些實施例中,如果鄰近塊是幀間雙向預測,Δx和Δy被設置為鄰近塊的L1水平和垂直運動向量,且共位圖片是由鄰近塊的L1運動向量指示的L1參考圖片。在某些實施例中,鄰近塊是當前塊的左側塊。在某些實施例中,鄰近塊是當前塊的上方塊。
在某些實施例中,先前編碼切片/圖片中繼承參數模型來自的預定義位置是由鄰近塊的運動向量確定的。讓Δx和Δy是基於選擇的鄰近塊的運動向量的水平和垂直位移,當前塊位置在(x, y)並且塊大小是
。繼承的模型參數可以來自於位置在(x’, y’)的塊,其中x’ = x + Δx且y’ = y + Δy,或位置在(x’ + w/2 +Δx和y’ + h/2 +Δy)的塊。
在某些實施例中,繼承的模型參數也可以來自於前文段落中描述的模式中的位置。這些位置以(x’,y’)為中心,其中x’ = x + Δx且y’ = y + Δy,或者x’ = x + w/2 +Δx且y’ = y + h/2 +Δy。也就是說,將預定義的位置表示為
,繼承的模型參數可以來自
,其中
和
是基於鄰近塊選定的運動向量的水平和垂直位移。例如,設當前塊的大小為
。兩個值集
和
被定義為:
所有在
和
中的值都是正數。繼承的模型參數可以來自於前一個已編碼切片/圖片中位置
的塊。例如,讓
和
是兩個固定的正數。繼承的模型參數可以來自於前一個已編碼切片/圖片中位置
的塊。另一個例子,繼承的模型參數可以來自於相對於前一個已編碼切片/圖片的
的一些預定義位置的塊。這些位置可以是
。另一個例子,這些位置可以是
。
在某些實施例中,鄰近塊可以位於一個預定義位置。例如,位置可以是如第9圖所示的A
0位置。預定義位置也可以是A
1、B
0、B
1、B
2。如果預定義位置的塊不是一個幀間塊,則不選擇任何鄰近塊。
在某些實施例中,當選擇鄰近塊時,可以有一個預定義位置的清單。這些位置根據檢查順序放置。例如,位置可以是B
0,A
0,B
1,A
1和 B
2,如第9圖所示。選定的鄰近塊可以是清單中的第一個幀間塊。選擇L0運動向量。如果L0運動向量不可用,則選擇L1運動向量。另一個例子,選擇L1運動向量。如果L1運動向量不可用,則選擇L0運動向量。
在某些實施例中,如果已經確定了共位圖片(例如,可以使用本節前面段落中描述的方法來確定),則按照預定義的檢查順序檢查預定義位置清單中的位置。選定的運動向量是其參考圖片屬於共位圖片的第一個。例如,位置可以是B
0,A
0,B
1,A
1和 B
2,如第9圖所示。對於每個位置,首先檢查L0運動向量,然後檢查L1運動向量。也就是說,檢查順序是(B
0,L
0),(B
0,L
1),(A
0,L
0),(A
0,L
1),…,(B
2,L
1)。在某些實施例中,首先檢查L1運動向量,然後檢查L0運動向量。
在某些實施例中,繼承的模型參數也可以來自上述模式中的位置。位置以(x’,y’)為中心,其中x’ = x + Δx且y’ = y + Δy。水平和垂直位移Δx和Δy是基於鄰近塊選定的運動向量來確定的。例如,如果選定的運動向量的參考圖片和共位圖片是同一張圖片,Δx等於選定運動向量的水平部分,Δy等於選定運動向量的垂直部分。如果選定的運動向量的水平部分或垂直部分是分數,Δx等於選定運動向量的水平部分四捨五入後的值,Δy等於選定運動向量的垂直部分四捨五入後的值。使用的四捨五入方法可以但不限於以下方法:向負無窮大四捨五入、向正無窮大四捨五入、向零四捨五入或四捨五入到最接近的整數(例如,遠離零四捨五入、四捨五入、五捨六入,…)。另一個例子,如果選定的運動向量的參考圖片和共位圖片不是同一張。參考圖片可以是參考清單中的圖片之一,而共位圖片則在圖片/切片標頭中被傳訊。設當前圖片與選定運動向量的參考圖片之間的POC距離為tb,當前圖片與共位圖片之間的POC距離為td,選定的運動向量為(mv_x, mv_y)。Δx = mv_x * (td/tb)且Δy = mv_y * (td/tb)。如果mv_x * (td/tb)或mv_y * (td/tb)是分數,Δx等於mv_x * (td/tb)四捨五入後的值或選定運動向量的水平部分四捨五入後的值,Δy等於mv_y * (td/tb)四捨五入後的值或選定運動向量的垂直部分四捨五入後的值。使用的四捨五入方法可以但不限於以下方法:向負無窮大四捨五入、向正無窮大四捨五入、向零四捨五入或四捨五入到最接近的整數(例如,遠離零四捨五入、四捨五入、五捨六入,…)。
在某些實施例中,繼承的模型參數是通過使用共位塊(collocated block)的亮度和色度重建樣本衍生出來的。設當前塊位置在(x, y)且塊大小為
。當繼承模型來自位置(x’,y’)時,共位塊是位於共位圖片中位置(x’,y’)的塊,塊大小為
。另一個例子,共位塊可以是位於共位圖片中位置(x’,y’)的塊,塊大小為
,其中m和n是固定的正值。例如,共位塊可以在(x, y)。另一個例子,如果Δx和Δy是鄰近塊的L0水平和垂直運動向量,且共位圖片是由鄰近塊的L0運動向量指示的L0參考圖片,則共位塊可以在共位圖片中的
。(x’,y’)可以是前面段落中描述的模式中的位置。例如,(x’,y’)可以是
。
在某些實施例中,跨分量參數模型可以從一個以上先前編碼的圖片繼承。跨分量參數模型可以從包含N個先前編碼圖片的圖片集合中的任何圖片繼承。可以在位元流中傳訊/解析一個索引以指示所選圖片。索引範圍從0到N-1。在某些實施例中,其圖片順序計數值(POC)與當前圖片之間差異較小的圖片與較小的索引相關聯。在另一個子實施例中,圖片其量化參數(QP)與當前圖片之間差異較小的與較小的索引相關聯。在某些實施例中,量化參數(QP)較小的圖片與較小的索引相關聯。在某些實施例中,量化參數(QP)較大的圖片與較小的索引相關聯。
e. 繼承非鄰接空間鄰近塊的模型
在某些實施例中,繼承的模型參數可以來自非鄰接的空間鄰近塊(即不與當前塊相接的塊)。來自預定位置塊的模型被添加到跨分量預測(CCP)合併候選清單中的預定順序。在某些實施例中,預定位置和預定順序與幀間合併模式的非鄰接空間鄰近候選者相同。
第11A-11B圖說明了一個當前塊1100及可以從中繼承模型參數的非鄰接空間鄰近塊。該圖還說明了預定位置及其預定順序。第11A圖顯示了根據第一種模式(模式1)的非鄰接空間位置及其預定順序。第11B圖顯示了根據第二種模式(模式2)的非鄰接空間位置及其預定順序。編號方塊的位置是預定位置。每個方塊內的數字表示預定順序。模式1中的位置在模式2之前被添加到CCP合併候選清單中。每個預定位置之間的距離與當前塊的寬度和高度成比例。
在某些實施例中,從非鄰接空間鄰居繼承的模型數量有一個最大值,可以添加到CCP合併候選清單中,且該最大值小於預定位置的數量。
在某些實施例中,設當前塊位置為(x, y)且塊大小為
。定義兩個值集
和
如下:
和
中的所有值均為正數。設x’ = x + Δx且y’ = y + Δy。繼承的模型參數可以來自由x’和y’確定的位置。例如,繼承的模型參數可以來自位置在
的塊。再例如,設
和
為兩個固定的正數。繼承的模型參數可以來自位置在
的塊。再例如,繼承的模型參數可以來自相對於前一個已編碼切片/圖片的
的一些預定義位置的塊。這些位置可以是
。再例如,這些位置可以是
。再例如,位置可以是(x’, y’), (x’, y’ + h/2), (x’ + w/2, y’), (x’ + w/2, y’ + h/2), (x’ + w, y’), (x’, y’ + h), 或 (x’ + w, y’ + h)。
在某些實施例中,如果當前塊的預測模式是基於引用當前圖片的塊向量(例如,幀內塊複製模式(IBC)或IntraTMP),則Δx和Δy可以根據當前塊的水平和垂直塊向量設定。例如,Δx和Δy可以等於當前塊的水平和垂直塊向量。在某些實施例中,Δx和Δy可以根據鄰近塊的水平和垂直塊向量設定。例如,Δx和Δy可以等於鄰近塊的水平和垂直塊向量。
f. 從歷史表繼承模型參數
在某些實施例中,繼承的模型參數可以來自跨分量模型歷史表。歷史表存儲有效先前編碼塊的CCM資訊。有效先前編碼塊指的是包含有效CCM資訊的任何塊。歷史表中的跨分量模型可以根據預定義的順序添加到CCP合併候選清單中。在某些實施例中,歷史候選的添加順序可以從表的開始到表的結尾。在某些實施例中,歷史候選的添加順序可以從表的結尾到表的開始。
在某些實施例中,可以維護一個跨分量模型歷史表,用於存儲先前的跨分量模型(即,CCM資訊),並且跨分量模型歷史表可以在當前圖片、當前切片、當前圖塊、每M CTU行或每N CTU的開始時重置,其中N和M可以是任何大於0的值。在某些實施例中,跨分量模型歷史表可以在當前圖片、當前切片、當前圖塊、當前CTU行或當前CTU的結束時重置。
在某些實施例中,使用多個歷史表來存儲不同類型的跨分量模型。例如,第一個歷史表用於存儲單一模型,第二個歷史表用於存儲多模型。另一個例子,第一個歷史表用於存儲梯度模型,第二個歷史表用於存儲非梯度模型。另一個例子,第一個歷史表用於存儲簡單線性模型(例如,y = ax + b),第二個歷史表用於存儲複雜模型(例如,CCCM)。
在某些實施例中,當從多個歷史表向CCP合併候選清單添加歷史候選時,添加順序可以從某個表的開始到結尾,然後以相同或相反的順序添加下一個歷史表。
g. 從融合模式繼承
融合模式指的是將兩個預測融合以生成最終預測的模式。在色度幀內融合模式中,未使用跨分量預測(CCP)編解碼工具(例如,CCLM、MMLM、CCCM)生成的色度幀內預測與使用跨分量預測編解碼工具生成的另一個色度幀內預測融合。例如,非CCLM編碼的幀內預測和CCLM編碼的幀內預測融合在一起以獲得最終的幀內預測。
在某些實施例中,當從由色度幀內融合模式編碼的塊/位置繼承跨分量模型參數時,用於獲得CCP編碼的幀內預測的模型參數被繼承並進一步精煉。在某些實施例中,除了繼承和精煉CCP模型參數外,融合權重、非CCP編碼的幀內預測的編解碼模式也被繼承。也就是說,繼承了色度幀內融合模式。
h. 構建候選清單
在某些實施例中,通過按預定義的順序添加候選直到達到最大候選數量來構建CCP合併候選清單。添加的候選可以包括所有或部分前述候選,但不限於前述候選。例如,預定義的順序可以是空間鄰近候選、時間候選、空間非鄰接候選、歷史候選,然後是默認候選(default candidates)。
在某些實施例中,如果所有預定義的鄰近和歷史候選都已添加但未達到最大候選數量,則一些默認候選被添加到CCP合併候選清單中,直到達到最大候選數量。在某些實施例中,默認候選可以是CCLM模型。縮放參數
來自集合{0, 1/8, -1/8, 2/8, -2/8,…., N/8, -N/8},其中N是一個正整數。
偏移參數β可以是
,或可以基於鄰近的亮度和色度樣本導出。例如,如果鄰近的亮度和色度樣本的平均值分別是lumaAvg和chromaAvg,則β = chromaAvg – ⍺⋅ lumaAvg。
在某些實施例中,默認候選的包含順序(inclusion order)可以依賴於縮放參數⍺的絕對值和符號。例如,根據⍺將默認候選按以下順序添加到CCP合併候選清單中:0, 1/8, –1/8, 2/8, -2/8, …, N/8, -N/8。
在某些實施例中,預設候選者可以是具有增量縮放參數精煉的較早候選者。該較早候選者是一個 CCLM 模型。如果較早候選者的縮放參數是 ⍺,則預設候選者的縮放參數是 (𝛼+Δ𝛼)。例如,Δ𝛼 可以是 1/8、-1/8、2/8、-2/8、… N/8、-N/8,其中 N 是一個正整數。偏移參數 β 可以基於 (𝛼+Δ𝛼) 和當前塊的相鄰亮度和色度樣本的平均值來推導。在某些實施例中,較早候選者是第一個被加入 CCP 合併候選者清單的 CCLM 候選者。在某些實施例中,預設候選者的包含順序(inclusion order)可以依賴於精煉 Δ𝛼 的絕對值和符號。例如,對於 Δ𝛼 的預設候選者按以下順序加入 CCP 合併候選者清單:0、1/8、-1/8、2/8、-2/8、…、N/8、-N/8。
i. 重新排序清單中的候選者
CCP 合併候選者清單中的候選者可以重新排序,以減少在傳訊所選擇的候選者索引時的語法開銷。在某些實施例中,重新排序規則可能依賴於相鄰塊的編解碼資訊。例如,如果相鄰上方或左側塊由 MMLM 編碼,則清單中的 MMLM 候選者可以移動到當前清單的頭部。同樣地,如果相鄰上方或左側塊由單一模型 LM(即 CCLM)或 CCCM 編碼,則清單中的單一模型 LM 或 CCCM 候選者可以移動到當前清單的頭部。同樣地,如果相鄰上方或左側塊使用 GLM,則清單中與 GLM 相關的候選者可以移動到當前清單的頭部。
在某些實施例中,重新排序規則是基於模型錯誤(即模板成本)通過將應用於當前塊的相鄰模板,然後與相鄰模板的重建樣本的錯誤進行比較(即與相鄰模板的重建樣本的差異)。
例如,假設當前塊上方相鄰模板的大小是
,當前塊左側相鄰模板的大小是
。假設 K 個模型(模型可以是 CCLM 或 2 參數 GLM)在當前候選者清單中,並且
和
是繼承候選者 k 之後的最終縮放和偏移參數。候選者 k 通過上方相鄰模板的模型錯誤是:
其中,
和
分別是上模板中位置 (i, j) 的亮度(例如,經過降採樣過程或應用 GLM 模式後)的重建樣本和色度的重建樣本,並且
和
。同樣地,候選者 k 通過左側相鄰模板的模型錯誤是:
其中
和
分別是左模板中位置 (m, n) 的亮度(例如,經過降採樣過程或應用 GLM 模式後)的重建樣本和色度的重建樣本,並且
和
。然後候選者 k 的模型錯誤是:
在計算所有候選者的模型錯誤之後,可能會得到一個模型錯誤清單
。然後,視訊編解碼器可以通過按升冪排序模型錯誤清單來重新排序繼承候選者清單(即 CCP 合併候選者清單)中的候選者索引。例如,模型錯誤也可以是通過將候選模型應用於相鄰模板上的亮度樣本生成的模板上預測的色度樣本與相鄰模板的重建色度樣本之間的 SATD。
在某些實施例中,如果候選者k使用CCCM預測,則
和
可以定義為:
其中
和
是繼承候選者k後的最終過濾係數。P和B是非線性項和偏差項。在某些實施例中,如果上述鄰近模板不可用,則
。同樣,如果左側鄰近模板不可用,則
。如果兩個模板都不可用,則不應用使用模型錯誤的候選索引重排序方法。
j. 傳訊(signaling)繼承候選索引
在某些實施例中,一個開/關標誌被傳訊(signaling)以指示當前塊是否從鄰近塊繼承跨分量模型參數。該標誌可以按CU/CB、按PU、按TU/TB、按色彩分量或按色度色彩分量傳訊(signaling)。一個高階語法可以在SPS、PPS、PH或SH中被傳訊以指示是否允許當前序列、圖片或切片從鄰近塊繼承跨分量模型參數。
在某些實施例中,允許的最大候選數量被傳訊以指示合併候選清單的最大數量大小。該數量可以按CU/CB、按PU、按TU/TB、按色彩分量或按色度色彩分量傳訊。一個高階語法可以在SPS、PPS、PH或SH中被傳訊以指示是否允許當前序列、圖片或切片的最大允許候選數量。最大允許候選數量可以與幀間合併模式的最大允許候選數量共享。
在某些實施例中,如果當前塊從鄰近塊繼承跨分量模型參數,則繼承候選索引被傳訊。該索引可以被以(例如,truncate unary code, Exp-Golomb code, 或 fix length code)編碼並傳訊,並在當前Cb和Cr塊之間共享。例如,該索引可以按色彩分量信號化。另一個例子,一個繼承索引為Cb分量信號化,另一個繼承索引為Cr分量信號化。另一個例子,視訊編解碼器可以使用色度幀內預測語法(例如,IntraPredModeC[ xCb ][ yCb ])來存儲繼承索引。
在某些實施例中,如果當前塊從鄰近塊繼承跨分量模型參數,則當前色度幀內預測模式(例如,如VVC標準中定義的IntraPredModeC[xCb][yCb])在位元流語法解析(parsing)階段暫時設置為跨分量模式(例如,CCLM_LA)。之後,在預測階段或重建階段,衍生候選清單,並通過繼承候選索引確定繼承的候選模型。獲得繼承模型後,則根據繼承候選模型更新當前塊的編解碼資訊。當前塊的編解碼資訊包括但不限於預測模式(例如,CCLM_LA或MMLM_LA)、相關子模式標誌(例如,CCCM模式標誌)、預測模式(例如,GLM模式索引)以及當前模型參數。然後,根據更新的編解碼資訊生成當前塊的預測。
k. 向量傳播(Propagating)跨分量模型
在某些實施例中,編解碼塊後,衍生並存儲當前塊的跨分量模型(CCM)資訊。存儲的CCM資訊可以被後續編解碼塊參考。後續編解碼塊可以從當前塊繼承CCM資訊。CCM資訊的定義在第III.b節“繼承CCM資訊”中描述。存儲的CCM資訊可以繼承為但不限於以下類型的候選者:空間候選者、非鄰接候選者、時間候選者、歷史候選者,如上節所述。
在某些實施例中,如果當前塊是跨分量預測(CCP)編碼,當前塊使用的跨分量模型可以存儲並被後續編解碼塊參考。當一個塊是以CCP編碼時,意味著該塊使用跨分量模型生成塊的預測。該塊可能使用從鄰近塊繼承的跨分量模型,基於鄰近亮度和色度預測/重建樣本值衍生的跨分量模型(例如,CCLM、MMLM、CCCM、CCRM),在色度融合中使用的跨分量模型意味著色度預測是基於將一個或多個跨分量預測假設添加到一個或多個現有的非跨分量預測假設,或以上的任何組合。
在某些實施例中,如果當前塊未被CCP編碼,且此塊位於非幀內切片/圖片中,可以通過複製共位塊(collocated block)的CCM資訊來衍生當前塊的CCM資訊。假設當前塊位於(x,y)且塊大小為w*h,共位塊可以是共位圖片中的(x,y)、(x + w,y + h)、(x + w - 1,y + h - 1)或(x + w/2,y + h/2)的塊。
在某些實施例中,如果當前塊未被CCP編碼,且當前塊中有塊向量可用(例如,當前亮度塊在IBC或IntraTMP模式下編碼,共位亮度塊在IBC或IntraTMP模式下編碼),可以通過複製由塊向量定位的參考塊的CCM資訊來衍生當前塊的CCM資訊。
第12圖概念性地說明了基於塊向量的CCM資訊傳播的示例。該圖示出了幾個塊A至H。塊A、E、G通過使用跨分量模型(例如,CCLM、MMLM、GLM、CCCM、Chroma Fusion)編碼。塊B未被CCP編碼且塊B處有塊向量可用。參考塊A由塊向量定位。參考塊A使用的跨分量模型的CCM資訊被複製並存儲以為塊B所用。在某些實施例中,如果由塊向量定位的參考塊也未被CCP編碼,但存儲有CCM資訊,則可以通過複製對應於參考塊的CCM資訊來衍生當前塊的CCM資訊。
例如,如第12圖所示,當前塊C有塊向量可用,其參考塊B未被CCP編碼,但參考塊B存儲有CCM資訊。塊B的CCM資訊被複製並存儲以為塊C所用。存儲於塊B的CCM資訊是從塊A複製的。因此,塊A的CCM資訊被傳播到塊C。在某些實施例中,如果由塊向量定位的參考塊未被CCP編碼且未存儲CCM資訊,則不會為當前塊存儲CCM資訊。
在某些實施例中,若當前塊有多個塊向量可用時(例如,塊向量可以是雙向的,塊可以有多個IntraTMP塊向量,或當前色度塊與多個亮度塊共位且多於一個亮度塊有塊向量),為了衍生當前塊的CCM資訊,如果只有一個由塊向量定位的參考塊有CCM資訊,則將該參考塊的CCM資訊複製並存儲以為當前塊所用。例如,如第12圖所示,假設塊F有兩個塊向量並有兩個參考塊G和H。塊G有CCM資訊而塊H沒有。塊G的CCM資訊被複製並存儲以為塊F所用。
在某些實施例中,若當前塊具有多個塊向量,且由塊向量定位的多個參考塊中有超過一個具有CCM資訊時,視訊編解碼器根據多個參考塊的CCM資訊來確定/導出要為當前塊存儲的CCM資訊。第13圖示出了一個當前塊具有兩個塊向量用以識別出兩個具有CCM資訊的參考塊。如圖所示,一個當前塊(塊X)在同一當前圖片1300中有兩個參考塊(塊Y和塊Z)。參考塊Y由塊向量BV0識別並具有CCM資訊1315。參考塊Z由塊向量BV1識別並具有CCM資訊1325。塊Y和塊Z可能被CCP編碼也可能不被CCP編碼。視訊編解碼器根據CCM資訊1315和CCM資訊1325來確定當前塊X的CCM資訊1305。
在不同的實施例中,視訊編解碼器以不同的方式確定當前塊CCM資訊1305。例如,在某些實施例中,當前塊CCM資訊1305是通過結合其參考塊的所有或一部分CCM模型(例如,參考塊1310和1320的CCM模型1315和1325)導出的。
在某些實施例中,若當前塊(例如,第13圖的當前塊X)具有多個塊向量,且由塊向量定位的多個參考塊(例如,第13圖的參考塊Y和Z)中有超過一個具有CCM資訊時,根據一組預定義規則選擇其中一個參考塊。然後將選定參考塊的CCM資訊複製並存儲以為該當前塊所用。在某些實施例中,選擇被CCP編碼的參考塊。在某些實施例中,選擇被幀內編碼的參考塊。在某些實施例中,選擇被幀間或IBC編碼的參考塊。
在某些實施例中,選擇與當前塊距離最小的參考塊。選定參考塊的CCM資訊被複製並存儲以為該當前塊所用。分別位於(x
r,y
r)和(x
c,y
c)的參考塊與當前塊之間的距離,可以通過歐幾里得距離
計算。(x
r,y
r)和(x
c,y
c)可以是參考塊和當前塊的左上角、右上角、左下角、右下角或中心位置。距離函數(distance metric)也可以是曼哈頓距離或明可夫斯基距離。
對於某些實施例,選擇具有最小水平距離,|x
r- x
c|,的參考塊。選定參考塊的CCM資訊被複製並存儲以為該當前塊所用。對於某些實施例,選擇具有最小垂直距離,|y
r- y
c|,的參考塊。選定參考塊的CCM資訊被複製並存儲以為該當前塊所用。
對於某些實施例,先前描述的規則可以結合使用,並不需要應用所有先前描述的規則。例如,選擇被CCP編碼的參考塊。如果有多於一個被CCP編碼的參考塊,則選擇與當前塊距離最短的CCP編碼參考塊。如果有多於一個與當前塊距離最小的CCP編碼參考塊,則選擇具有最小水平距離,|x
r- x
c|,的參考塊。另一個例子,選擇被CCP編碼的參考塊。如果有多於一個被CCP編碼的參考塊,則選擇與當前塊距離最短的CCP編碼參考塊。如果有多於一個與當前塊距離最小的CCP編碼參考塊,則選擇具有最小垂直距離,|y
r- y
c|,的參考塊。選定參考塊的CCM資訊被複製並存儲以為該當前塊所用。
在某些實施例中,如果當前塊未被CCP編碼且當前塊中有運動向量可用(例如,當前亮度塊是幀間編碼的),則可以通過複製當前塊的該運動向量定位的參考圖片中參考塊的CCM資訊來導出當前塊的CCM資訊。
第14圖示出了基於運動向量的CCM資訊傳播的例子。該圖示出了幾個塊A至H。塊A、E、G是使用跨分量模型(例如,CCLM、MMLM、GLM、CCCM)編碼的。如圖所示,塊B未被CCP編碼且在塊B處有運動向量可用。參考塊A由運動向量定位。使用跨分量模型的參考塊A的CCM資訊被複製並存儲以為該塊B所用。
在某些實施例中,如果由運動向量定位的參考塊也未被CCP編碼,但參考塊存儲有CCM資訊,則可以通過複製對應於參考塊的CCM資訊來導出當前塊的CCM資訊。在第14圖的例子中,塊C有運動向量可用,其參考塊B未被CCP編碼,但存儲有CCM資訊。塊B的CCM資訊被複製並存儲以為該塊C所用。存儲於塊B的CCM資訊是從塊A複製的。因此,塊A的CCM資訊被傳播到塊C。在某些實施例中,如果由運動向量定位的參考塊未被CCP編碼且未存儲CCM資訊,則不為當前塊存儲CCM資訊。
在某些實施例中,若當前塊以雙向預測進行幀間編碼時,為了導出當前塊的CCM資訊,如果由運動向量定位的參考塊中只有一個具有CCM資訊,則將具有CCM資訊的參考塊的CCM資訊複製並存儲以為該當前塊所用。例如,如第14圖所示,塊F以雙向預測進行幀間編碼,由塊F的運動向量(MV0和MV1)定位的兩個參考塊是塊G和塊H。塊G存儲了CCM資訊而塊H則沒有。塊G的CCM資訊被複製並存儲以為塊F所用。
在某些實施例中,若當前塊以雙向預測進行幀間編碼,且由運動向量定位的兩個參考塊均存儲了CCM資訊時,視訊編解碼器根據兩個以上參考塊的CCM資訊確定/導出要為當前塊所用的CCM資訊。第15圖示出一個當前塊具有兩個運動向量用以識別兩個分別具有CCM資訊的參考塊。如圖所示,當前圖片1502中的當前塊(塊P)以雙向預測進行幀間編碼。兩個參考塊(塊Q和塊R)由不同參考圖片1501和1503中的運動向量定位。參考塊Q由塊向量MV0定位並具有CCM資訊1515。參考塊R由塊向量MV1定位並具有CCM資訊1525。參考塊Q和R可能被跨分量預測編碼也可能沒有。視訊編解碼器根據CCM資訊1515和CCM資訊1525確定當前塊P的CCM資訊1505。
不同實施例中的視訊編解碼器以不同方式確定當前塊CCM資訊1505。例如,在某些實施例中,當前塊CCM資訊1505是通過結合參考塊Q和R的CCM模型1515和1525的全部或子集導出的。另一個例子,某些實施例中,根據一組預定義規則選擇其中一個參考塊。然後將選定參考塊的CCM資訊複製並存儲以為該當前塊所用。
在某些實施例中,為了從一個或多個參考塊中選擇獲得CCM資訊,選擇被跨分量預測編碼的參考塊。在某些實施例中,選擇被幀內預測編碼的參考塊。在某些實施例中,選擇被幀間或IBC編碼的參考塊。
在某些實施例中,選擇其參考圖片(即參考塊所在的圖片)與當前圖片具有較小POC距離的參考塊。然後將選定參考塊的CCM資訊複製並存儲以為該當前塊所用。在第15圖的例子中,塊P以雙向預測進行幀間編碼。兩個參考塊Q和R由運動向量定位且均存儲了CCM資訊。包含參考塊Q的參考圖片1501的POC = N1,當前圖片1502的POC = N2,參考圖片1503的POC = N3。如果|N1-N2|小於|N3-N2|,則選擇塊Q,並將塊Q的CCM資訊1515複製並存儲以為該塊P的當前塊CCM資訊1505。
在某些實施例中,選擇其參考圖片與當前圖片具有較小/最小QP差異的參考塊。然後將選定參考塊的CCM資訊複製並存儲以為該當前塊所用。在第14圖的例子中,圖片1401中的塊F以雙向預測進行幀間編碼。由運動向量定位的兩個參考塊是圖片1400中的塊G和圖片1402中的塊H。假設塊G和塊H均存儲了CCM資訊。假設圖片1400、1401和1402的QP分別為27、32、33。由於|33-32|小於|27-32|,因此選擇塊H,並將塊H的CCM資訊複製並存儲以為塊F所用。
在某些實施例中,選擇其參考圖片具有較小QP值的參考塊(因此在第14圖的例子中,由於圖片1400具有較小的QP值27,因此會選擇塊G)。在某些實施例中,選擇其參考圖片具有較大QP值的參考塊(因此在第14圖的例子中,由於圖片1402具有較大的QP值33,因此會選擇塊H)。
某些實施例中,選擇由L0運動向量指示的參考塊。在某些實施例中,選擇由L1運動向量指示的參考塊。在某些實施例中,先前描述的規則可以結合使用,並不需要應用先前描述的所有規則。例如,選擇被跨分量預測編碼的參考塊。如果兩個塊都被跨分量預測編碼,則選擇其參考圖片與當前圖片具有較小POC距離的塊。如果兩個塊都被跨分量預測編碼且與當前圖片具有相同的POC距離,則選擇其參考圖片與當前圖片具有較小QP差異的參考塊。如果兩個塊都被跨分量預測編碼,與當前圖片具有相同的POC距離,並且與當前圖片具有相同的QP差異,則選擇其參考圖片具有較小QP值的參考塊。另一個例子,選擇其參考圖片與當前圖片具有較小POC距離的塊。如果兩個塊與該當前圖片具有相同的POC距離,則選擇其參考圖片與當前圖片具有較小QP差異的參考塊。如果兩個塊與該當前圖片具有相同的POC距離並且具有相同的QP差異,則選擇其參考圖片具有較小QP值的參考塊。
在某些實施例中,如果當前塊是幀間編碼或當前塊中有塊向量可用,當前塊的CCM資訊可以通過複製由運動向量或塊向量定位的參考塊的CCM資訊來獲得。例如,如第14圖所示,當前塊C有塊向量可用,其參考塊B有運動向量可用。塊B的CCM資訊是從塊A複製的。然後將塊B的CCM資訊複製到塊C。因此,塊A的CCM資訊被傳播到當前塊C。
L. 繼承多個跨分量模型
在某些實施例中,如果當前候選清單大小為N,視訊編解碼器可能從總共N個候選中選擇k個候選(其中k≤N)。k個跨分量模型可以通過對應模型參數的加權平均結合成一個最終的跨分量模型。例如,如果一個跨分量模型有M個參數,最終跨分量模型的第j個參數是k個選定候選的第j個參數的加權平均,其中j是1…M。然後,通過將最終跨分量模型應用於對應的亮度重建樣本來生成最終預測。例如,在某些實施例中,若2個候選模型為
以及
。最終的跨分量模型則是
, 其中
可以是預先設訂或根據鄰近模板成本隱式推導的權重值,以及
是第y候選的第x 模型。
在某些實施例中, 運用定義在第III.i節(重新排序清單中的候選者)的模板成本,2個候選模型相關的模板成本表示為
和
,其中
是
。
在某些實施例中,視訊編解碼器可以將多個跨分量模型結合成一個最終的跨分量模型。例如,視訊編解碼器可以從第一候選中選擇一個模型,從第二候選中選擇一個模型,形成多模型模式(例如,MMLM或MM-CCCM)。選定的候選可以是CCLM/MMLM/GLM/CCCM編碼的候選。多模型分類閾值可以是兩個選定模式的偏移參數的平均值(例如,在CCLM中的偏移/
,或在CCCM中的
或
)。在某些實施例中,分類閾值設定為當前塊的鄰近亮度和色度樣本的平均值。
m. 在索引表中存儲時間模型
在某些實施例中,先前編碼的切片/圖片的CCM資訊存儲在一個表中,並創建一個圖片級索引緩衝區來存儲表的索引。索引緩衝區的大小與圖片相同。當在共位圖片內的位置(x, y)引用CCM資訊時(如第III.d節“繼承時間鄰近模型參數”所述),從共位圖片的索引緩衝區的位置(x, y)中檢索索引值。從表中獲得由索引值指示的項目作為要引用的CCM資訊。如果索引值表明在位置(x, y)沒有可用的CCM資訊,則不引用CCM資訊。
在某些實施例中,存儲CCM資訊的表是圖片級表。每個圖片的CCM資訊存儲在單獨的表中。在某些實施例中,創建一個表來存儲所有圖片的CCM資訊。在某些實施例中,為每個時間id創建一個表。具有相同時間id的層的CCM資訊存儲在同一個表中。在某些實施例中,使用幾個表來存儲一個圖片的CCM資訊。一張圖片可以被劃分為幾個區域,每個區域對應其自己的表。
在某些實施例中,在將當前編碼/解碼圖片的位置(x, y)的CCM資訊存儲到相應的表後,該CCM資訊的表索引值保存在當前編碼/解碼圖片的索引緩衝區的位置(x, y)。如果在位置(x, y)沒有可用的CCM資訊(例如,當覆蓋位置(x, y)的CU未使用任何CCLM, MMLM, CCCM, CCCM多模型, 色度融合或其他跨分量模型進行編碼時),則索引緩衝區中位置(x, y)的值設置為指示沒有CCM資訊可用。
在某些實施例中,如果當前編碼/解碼圖片的位置(x, y)沒有可用的CCM資訊,則可以將共位圖片的索引緩衝區中位置(x, y)的索引值存儲在當前編碼/解碼圖片的索引緩衝區的位置(x, y)。
在某些實施例中,如果當前編碼/解碼圖片的位置 (x, y) 沒有可用的 CCM 資訊,並且在位置 (x, y) 有一個塊向量 (Δx, Δy) 可用(例如,位置 (x, y) 的塊可以是 IBC 編碼或 IntraTMP 編碼,或者共位的亮度塊是以 IBC 或 IntraTMP 模式編碼的),則索引緩衝區中位置 (x+Δx, y+Δy) 的索引值可以存儲在當前編碼/解碼圖片的索引緩衝區的位置 (x, y)。在另一個實施例中,如果當前編碼/解碼圖片的位置 (x, y) 沒有可用的 CCM 資訊,並且有多個塊向量可用,(Δxi, Δyi),0 < i ≦ N, N ≧1,在位置 (x, y)(例如,位置 (x, y) 的亮度塊可以有雙向塊向量,或者色度塊在位置 (x, y) 可以有多個共位的亮度塊,它們具有塊向量),則索引緩衝區中的一個位置 (x+Δxi, y+Δyi) 的索引值可以存儲在當前編碼/解碼圖片的索引緩衝區的位置 (x, y)。在某些實施例中,可以有一組預定義的規則來確定如何選擇其中一個塊向量(即選擇並存儲由塊向量 (Δxi, Δyi) 定位的索引值和相應的跨分量模型)。這些規則可以與在第III.k節“向量傳播的跨分量模型”中描述的選擇由塊向量定位的參考塊的規則相同。
在某些實施例中,如果當前編碼/解碼圖片的位置 (x, y) 沒有可用的 CCM 資訊,並且位置 (x, y) 的塊是幀間編碼且運動向量是 (Δx, Δy),則參考圖片(亦被該運動向量所標示)的索引緩衝區中位置 (x+Δx, y+Δy) 的索引值可以存儲在當前編碼/解碼圖片的索引緩衝區的位置 (x, y)。在某些實施例中,如果當前編碼/解碼圖片的位置 (x, y) 沒有可用的 CCM 資訊,並且位置 (x, y) 的塊是幀間編碼且運動向量是雙向的 (Δxi, Δyi),i = 0 或 1。參考圖片的索引緩衝區中的一個位置 (x+Δxi, y+Δyi) 的索引值可以用來存儲到當前編碼/解碼圖片的索引緩衝區的位置 (x, y)。
某些實施例中,如果當前編碼/解碼圖片的位置 (x, y) 沒有可用的 CCM 資訊,並且位置 (x, y) 的塊是幀間編碼且運動向量是 (Δx, Δy),參考圖片的索引緩衝區中的一個位置 (x+Δx, y+Δy) 的索引值可以用來從參考圖片(亦被該運動向量所標示)對應的表中擷取 CCM 資訊。然後將擷取的 CCM 資訊存儲到對應當前編碼/解碼圖片的表中。所擷取CCM資訊的索引值可以用來存儲到當前編碼/解碼圖片的索引緩衝區的位置 (x, y)。
在某些實施例中,如果當前編碼/解碼圖片的位置 (x, y) 沒有可用的 CCM 資訊,並且位置 (x, y) 的塊是幀間編碼且運動向量是雙向的 (Δxi, Δyi),i = 0 或 1。參考圖片(亦被該運動向量所標示)的索引緩衝區中的一個位置 (x+Δxi, y+Δyi) 的索引值可以用來從參考圖片對應的表中擷取 CCM 資訊。然後將擷取的 CCM 資訊存儲到對應當前編碼/解碼圖片的表中。所擷取CCM資訊的索引值可以用來存儲到當前編碼/解碼圖片的索引緩衝區的位置 (x, y)。在某些實施例中,可以有一組預定義的規則來確定如何選擇其中一個運動向量(即檢索由運動向量 (Δxi, Δyi) 定位的索引值並將相應的跨分量模型存儲在當前表中)。這些規則可以與在第III.k節“向量傳播的跨分量模型”中描述的選擇由運動向量定位的參考塊的規則相同。
在某些實施例中,當從表中刪除一個 CCM 資訊時,所有指示使用待刪除 CCM 資訊的索引緩衝區中的值都將重置為指示沒有 CCM 資訊可用。假設待刪除 CCM 資訊的索引值為 N,索引緩衝區中大於 N 的所有值將減少 1。
在某些實施例中,用於存儲 CCM 資訊的表有一個最大大小限制。可以在 SPS、PPS、PH 或 SH 中發送高階語法來指示最大大小限制。如果在嘗試將新的 CCM 資訊存儲到表中時,表已達到其最大大小,則不會將新的 CCM 資訊存儲到表中。在某些實施例中,如果在嘗試將新的 CCM 資訊存儲到表中時,表已達到其最大大小,則存儲最早的 CCM 資訊將被刪除以釋放表中的空間。
在某些實施例中,表格可以在對IDR圖片進行編解碼的開始時重置。在某些實施例中,表格可以在對IDR圖片進行編解碼之後重置。在某些實施例中,表格可以在對CRA圖片進行編解碼的開始時重置。在某些實施例中,表格可以在對CRA圖片進行編解碼之後重置。在某些實施例中,重置機制可以與參數集或參考圖片中使用的相同。
在某些實施例中,存儲在索引緩衝區中的索引只能被大於或等於最小編解碼單位的單位引用。例如,如果最小編解碼單位是4x4,則索引可以被8x8網格引用。也就是說,一個8x8塊具有相同的索引值。要在位置(x, y)檢索索引值,位置(x, y)可以四捨五入到網格上的一點(例如,(x >> 3) << 3, (y >> 3) << 3)或到網格上的最近點。
在某些實施例中,要存儲在表格中的CCM資訊可以在位元流中的SPS、PPS、PH或SH中明確標示。CCM資訊的相應位置也可以被標示。
任何前述提出的方法都可以在編碼器和/或解碼器中實現。例如,任何提出的方法都可以在編碼器的幀間/幀內/預測模塊中實現,和/或在解碼器的幀間/幀內/預測模塊中實現。或者,任何提出的方法都可以作為與編碼器和/或解碼器的幀間/幀內/預測模塊相連的電路實現,以提供幀間/幀內/預測模塊所需的資訊。
IV. 示例視訊編碼器
第16圖說明了一個可能實現跨分量預測的一個視訊編碼器1600。如圖所示,視訊編碼器1600從視訊源1605接收輸入視訊訊號並將訊號編碼成位元流1695。視訊編碼器1600具有多個用於編碼來自視訊源1605的訊號的組件或模塊,至少包含自變換模塊1610、量化模塊1611、逆量化模塊1614、逆變換模塊1615、幀內估計模塊1624、幀內預測模塊1625、運動補償模塊1630、運動估計模塊1635、環路濾波器1645、重建圖片緩衝區1650、MV緩衝區1665、MV預測模塊1675和熵編碼器1690中選擇的一些組件。運動補償模塊1630和運動估計模塊1635是幀間預測模塊1640的一部分。幀內預測模塊1625和幀內預測估計模塊1624是當前圖片預測模塊1620的一部分,該模塊使用當前圖片重建樣本作為當前塊的預測參考樣本。
在某些實施例中,模塊1610 - 1690是由計算設備或電子裝置的一個或多個處理單元(例如,處理器)執行的軟體指令的模塊。在某些實施例中,模塊1610 - 1690是由電子裝置的一個或多個集成電路(ICs)實現的硬體電路的模塊。雖然模塊1610 - 1690被描繪為分開的模塊,但一些模塊可以合併成一個單一模塊。
視訊源1605提供一個原始視訊訊號,該訊號呈現每個圖片幀的像素資料而不壓縮。減法器1608計算來自視訊源1605的原始圖片像素資料與來自運動補償模塊1630或幀內預測模塊1625的預測像素資料之間的差異作為預測殘差1609。變換模塊1610將差異(或殘差像素資料或殘差訊號1608)變換成變換係數(例如,通過執行離散餘弦變換,或DCT)。量化模塊1611將變換係數量化成量化資料(或量化係數)1612,該量化資料被熵編碼器1690編碼成位元流1695。
逆量化模塊1614對量化資料(或量化係數)1612進行逆量化以獲得變換係數,逆變換模塊1615對變換係數進行逆變換以產生重建殘差1619。重建殘差1619與預測像素資料1613相加以產生重建像素資料1617。在某些實施例中,重建像素資料1617暫時存儲在線緩衝區1627(或幀內預測緩衝區)中,用於幀內預測和空間MV預測。重建像素通過環路濾波器1645過濾並存儲在重建圖片緩衝區1650中。在某些實施例中,重建圖片緩衝區1650是視訊編碼器1600外部的存儲。在某些實施例中,重建圖片緩衝區1650是視訊編碼器1600內部的存儲。
幀內估計模塊1624基於重建像素資料1617進行幀內預測以產生幀內預測資料。幀內預測資料被提供給熵編碼器1690以編碼成位元流1695。幀內預測資料也被幀內預測模塊1625使用以產生預測像素資料1613。
運動估計模塊1635通過產生MV來參考存儲在重建圖片緩衝區1650中的先前解碼幀的參考像素資料來進行幀間預測。這些MV被提供給運動補償模塊1630以產生預測像素資料。
視訊編碼器1600不是在位元流中編碼完整的實際MV,而是使用MV預測來生成預測MV,並且用於運動補償的MV與預測MV之間的差異被編碼為殘差運動資料並存儲在位元流1695中。
運動向量預測模組1675基於之前為編碼先前圖片幀所生成的參考運動向量,生成預測的運動向量,即用於執行運動補償的運動補償運動向量。運動向量預測模組1675從運動向量緩衝區1665中的先前圖片幀中檢索參考運動向量。視訊編碼器1600將為當前圖片幀生成的運動向量存儲在運動向量緩衝區1665中,作為生成預測運動向量的參考運動向量。
運動向量預測模組1675使用參考運動向量來創建預測的運動向量。預測的運動向量可以通過空間運動向量預測或時間運動向量預測來計算。預測的運動向量與當前幀的運動補償運動向量(MC MVs)之間的差異(殘差運動資料)由熵編碼器1690編碼進位元流1695中。
熵編碼器1690使用諸如上下文適應性二進制算術編解碼(CABAC)或霍夫曼編碼等熵編解碼技術將各種參數和資料編碼進位元流1695中。熵編碼器1690將各種標頭元素、標誌以及量化變換係數1612和殘差運動資料作為語法元素編碼進位元流1695中。位元流1695反過來存儲在存儲設備中或通過如網絡等通信介質傳輸給解碼器。
環路濾波器1645對重建的像素資料1617進行濾波或平滑操作,以減少編解碼的伪影,特別是在像素塊的邊界處。在某些實施例中,環路濾波器1645執行的濾波或平滑操作包括去塊濾波(DBF)、樣本適應性偏移(SAO)和/或適應性環路濾波(ALF)。在某些實施例中,在環路濾波器之前執行亮度映射色度縮放(LMCS)。
第17圖說明視訊編碼器1600的一部分,其用於實施從多個參考塊傳播CCM資訊的部分。當前圖片預測(幀內預測、IBC和其他通過參考當前圖片的預測)可用於生成亮度分量的重建1715。跨分量模型1710可應用於重建1715以生成色度分量的跨分量預測器1725。然後將跨分量預測器1725包含在預測的像素資料1613中。跨分量模型1710也可以存儲在CCM存儲1735中,供後續編碼塊使用。
跨分量模型1710可以由模型構造器1705基於從重建圖片緩衝區1650和/或線緩衝區1627檢索的參考樣本和/或當前樣本(在當前塊和/或參考塊內部和/或周圍)生成。上面的第I節描述了可以用作跨分量模型1710的幾種類型的跨分量模型。
跨分量模型1710也可以由CCM選擇模組1730提供,該模組提供跨分量模型(CCM)資訊或其他跨分量預測(CCP)資訊,這些資訊是從先前編碼的塊繼承的。在某些實施例中,CCM選擇模組1730可以提供CCP合併候選清單,該清單可能包括來自空間、時間和非相鄰鄰居的模型,以及/或來自歷史表和/或來自默認候選。CCM選擇模組1730可以將選定候選的CCM資訊提供給當前塊。傳播的CCM資訊可以作為當前塊的跨分量模型1710,或保存在CCM存儲1735中以進一步傳播。
CCM傳播模組1740可以通過更新CCM存儲1735的內容,將參考塊的多個參考塊的CCM資訊傳播到參考塊。參考塊的參考塊可以通過參考塊的運動向量和/或塊向量來識別。當由多個MV或BV定位的多個進一步參考塊全部/都具有CCM資訊時,CCM傳播模組1740可以結合來自多個進一步參考塊的CCM資訊。CCM傳播模組1740還可以從多個進一步參考塊中選擇一個以獲得CCM資訊。在某些實施例中,可以應用一組預定義規則從多個進一步參考塊中選擇一個進一步參考塊。這些規則的例子包括:選擇與參考塊空間上或時間上最接近的進一步參考塊;選擇與參考塊/參考圖片的量化參數最相似的進一步參考塊;選擇具有最大或最小量化參數的進一步參考塊;選擇內部編碼、或幀間編碼、或IBC編碼的進一步參考塊;選擇由L0運動或L1運動定位的進一步參考塊等。
CCM存儲1735代表(或由)任何形式的存儲,用於存儲CCM資訊,其中包括由模型構造器1705生成的跨分量模型。CCM存儲1735可以是塊級緩衝區的一部分、圖片級的一部分,或不同圖片、不同時間ID或不同圖片的不同區域的CCM表(或索引表)。CCM表可以與視訊圖片關聯,並存儲與關聯圖片相關的CCM資訊或其他CCP資訊。CCM表也可以與時間ID關聯,並存儲具有關聯時間ID的圖片的CCM資訊或其他CCP資訊。CCM表可以與視訊圖片中的一個區域關聯,並存儲與關聯區域相關的CCM資訊或其他CCP資訊。存儲的CCM資訊和/或CCP資訊可用於作為合併模式候選被後續塊繼承。
每個跨分量模型(CCM)表都有一個對應的索引緩衝區,用於將圖片中的位置映射到CCM表中的位置。為了檢索選定參考塊(或選定候選塊)的CCM資訊和/或跨分量預測(CCP)資訊,編碼器識別選定參考塊的CCM表和對應的索引緩衝區(基於圖片、時間ID或圖片中的區域),然後使用候選者在圖片中的位置查找在識別的索引緩衝區中的索引。該索引反過來用於訪問CCM表中的選定CCM資訊和/或CCP資訊。
第18圖概念性地說明在編碼一個塊時從多個參考塊傳播CCM資訊的過程1800。該過程在編碼塊時從具有CCM資訊的多個參考塊中選擇。在某些實施例中,實現編碼器1600的計算設備的一個或多個處理單元(例如,處理器)通過執行存儲在計算機可讀介質中的指令來執行過程1800。在某些實施例中,實現編碼器1600的電子裝置執行過程1800。
編碼器在步驟1810接收資料以為視訊的一當前圖片的一當前塊的像素編碼。該當前塊具有第一色塊(例如,亮度分量塊)和第二色塊(例如,色度分量塊)。編碼器在步驟1820生成第一色塊的重建。
編碼器在步驟1830從一參考塊繼承一個跨分量模型;該跨分量模型基於兩個或多個進一步參考塊的跨分量資訊傳播給參考塊。
這兩個或多個進一步參考塊可能通過參考塊的一個以上運動向量或塊向量來定位(例如,當參考塊是一個雙向幀間預測塊時)。在某些實施例中,編碼器通過結合兩個或多個進一步參考塊的所有或一部分CCM模型來推導跨分量模型。
在某些實施例中,編碼器通過從參考塊的兩個或多個進一步參考塊中選擇一個塊來傳播跨分量模型,以為參考塊提供跨分量模型。這一進一步參考塊(選定的進一步參考塊)可能根據一組預定義規則來選擇。參考塊可能被或可能不被跨分量預測編碼。編碼器可能通過識別一個通過跨分量預測編碼的塊來選擇一進一步參考塊成為該選定的進一步參考塊。編碼器可能選擇兩個或多個進一步參考塊中唯一具有跨分量模型的進一步參考塊。編碼器可能通過識別一個通過當前圖片參考編碼(例如,IBC模式)的塊,或通過識別一個通過幀內預測編碼的塊,或通過識別一個通過幀間預測編碼的塊來選擇一進一步參考塊。
在某些實施例中,進一步參考塊中的選定的進一步參考塊是通過識別各該進一步參考塊中與該參考塊之間具有最短空間距離的塊來選擇的。空間距離可能是垂直距離或水平距離,或歐幾里得距離,或曼哈頓距離,或明可夫斯基距離。在某些實施例中,進一步參考塊中選定的進一步參考塊是通過識別在一個或多個進一步參考塊中與參考塊具有最短時間距離的塊來選擇的。塊的時間距離可能基於包含各該進一步參考圖片的POC和參考圖片的POC來確定。
進一步參考塊選定進一步參考塊可能通過識別各該進一步參考塊中具有與參考塊的量化參數最接近的QP的塊來選擇,或通過識別各該進一步參考塊中具有最大QP的塊來選擇,或通過識別各該進一步參考塊中具有最小QP的塊來選擇,或通過識別各該進一步參考塊中被L0(或L1)運動向量指示的塊來選擇。
編碼器在步驟1840將繼承的跨分量模型應用於第一色塊的重建,以生成第二色塊的跨分量預測。編碼器可能在步驟1850使用生成的跨分量預測來編碼當前塊(通過生成預測殘差),或在步驟1860存儲確定的跨分量模型以編解碼後續塊。
V. 示例視訊解碼器
在某些實施例中,編碼器可能訊號(或生成)一個或多個語法元素在位元流中,使得解碼器可以從位元流中解析一個或多個語法元素。
第19圖說明了一個可能實現跨分量預測的視訊解碼器1900示例。如圖所示,視訊解碼器1900是一個圖像解碼或視訊解碼電路,接收位元流1995並解碼位元流的內容為圖片幀的像素資料以供顯示。視訊解碼器1900包含幾個解碼位元流1995的組件或模塊,包含從逆量化模塊1911、逆變換模塊1910、幀內預測模塊1925、運動補償模塊1930、環路濾波器1945、解碼圖片緩衝區1950、MV緩衝區1965、MV預測模塊1975和解析器1990中選擇的一些組件。運動補償模塊1930是幀間預測模塊1940的一部分。幀內預測模塊1925是當前圖片預測模塊1920的一部分,該模塊使用當前圖片重建樣本作為預測當前塊的參考樣本。
在某些實施例中,模塊1910 - 1990是由計算設備的一個或多個處理單元(例如,處理器)執行的軟體指令的模塊。在某些實施例中,模塊1910 - 1990是由一個或多個IC的電子裝置實現的硬體電路的模塊。雖然模塊1910 - 1990被描繪為獨立的模塊,但某些模塊可以合併為一個單一模塊。
解析器1990(或熵解碼器)接收位元流1995並根據視訊-編解碼或圖像-編解碼標準定義的語法進行初始解析。解析出的語法元素包括各種標頭元素、標誌以及量化資料(或量化係數)1912。解析器1990使用熵-編解碼技術如上下文-適應性二進制算術編解碼(CABAC)或霍夫曼編碼來解析出各種語法元素。
逆量化模組1911對量化資料(或量化係數)1912進行逆量化以獲得變換係數,逆變換模組1910對變換係數1916進行逆變換以產生重建殘差訊號1919。重建殘差訊號1919與來自幀內預測模組1925或運動補償模組1930的預測像素資料1913相加,以產生解碼像素資料1917。解碼像素資料經由環路濾波器1945過濾並存儲於解碼圖片緩衝區1950中。在某些實施例中,解碼圖片緩衝區1950是視訊解碼器1900外部的存儲。在某些實施例中,解碼圖片緩衝區1950是視訊解碼器1900內部的存儲。
幀內預測模組1925從位元流1995接收幀內預測資料,並根據此資料,從存儲於解碼圖片緩衝區1950中的解碼像素資料1917產生預測像素資料1913。在某些實施例中,解碼像素資料1917也存儲於線緩衝區1927(或幀內預測緩衝區)中,用於幀內圖片預測和空間MV預測。
在某些實施例中,解碼圖片緩衝區1950的內容用於顯示。顯示裝置1905要麼直接從解碼圖片緩衝區1950檢索內容進行顯示,要麼將解碼圖片緩衝區的內容檢索到顯示緩衝區。在某些實施例中,顯示裝置通過像素傳輸從解碼圖片緩衝區1950接收像素值。
運動補償模組1930根據運動補償MV(MC MV)從存儲於解碼圖片緩衝區1950中的解碼像素資料1917產生預測像素資料1913。這些運動補償MV是通過將從位元流1995接收的殘差運動資料與從MV預測模組1975接收的預測MV相加來解碼的。
MV預測模組1975基於用於解碼先前圖片幀的參考MV生成預測MV,例如,用於進行運動補償的運動補償MV。MV預測模組1975從MV緩衝區1965檢索先前圖片幀的參考MV。視訊解碼器1900將用於解碼當前圖片幀的運動補償MV存儲於MV緩衝區1965中,作為產生預測MV的參考MV。
環路濾波器1945對解碼像素資料1917進行過濾或平滑操作,以減少編解碼的伪影,特別是在像素塊的邊界處。在某些實施例中,環路濾波器1945進行的過濾或平滑操作包括去塊濾波器(DBF)、樣本適應性偏移(SAO)和/或適應性環路濾波器(ALF)。在某些實施例中,在環路濾波器之前進行亮度映射色度縮放(LMCS)。
第20圖說明了視訊解碼器1900的一部分,其用以實施從多個參考塊傳播CCM資訊。當前圖片預測(幀內預測、IBC和其他通過參考當前圖片進行的預測)可用於生成亮度分量的重建2015。跨分量模型2010可應用於重建2015以生成色度分量的跨分量預測器2025。然後將跨分量預測器2025包含在預測像素資料1913中。跨分量模型2010也可存儲於CCM存儲2035中,供後續編碼塊使用。
跨分量模型2010可由模型構造器2005基於從重建圖片緩衝區1950和/或線緩衝區1927檢索的參考樣本和/或當前樣本(在當前塊和/或參考塊內部和/或周圍)生成。上述第I節描述了可用作跨分量模型2010的幾種類型的跨分量模型。
跨分量模型2010也可由CCM選擇模組2030提供,該模組提供跨分量模型(CCM)資訊或其他跨分量預測(CCP)資訊,這些資訊是從先前編碼塊繼承的。在某些實施例中,CCM選擇模組2030可提供CCP合併候選清單,該清單可能包括來自空間、時間和非相鄰鄰居的模型,和/或來自歷史表和/或來自默認候選。CCM選擇模組2030可將選定候選的CCM資訊提供給當前塊。傳播的CCM資訊可作為當前塊的跨分量模型2010,或保存在CCM存儲2035中以進一步傳播。
CCM傳播模組2040可以通過更新CCM儲存2035的內容,從參考塊的多個參考塊向參考塊傳播CCM資訊。參考塊的參考塊可以通過參考塊的運動向量和/或塊向量來識別。當由多個MV或BV定位的多個進一步參考塊都/兩者都有CCM資訊時,CCM傳播模組2040可以結合來自多個進一步參考塊的CCM資訊。CCM傳播模組2040也可以從多個進一步參考塊中選擇一個來獲取CCM資訊。在某些實施例中,可以應用一組預定義規則從多個進一步參考塊中選擇一個進一步參考塊。這些規則的例子包括:選擇與參考塊空間上或時間上最接近的進一步參考塊;選擇與參考塊/參考圖片的量化參數最相似的進一步參考塊;選擇具有最大或最小量化參數的進一步參考塊;選擇被幀內預測、幀間預測或IBC編碼的進一步參考塊;選擇由L0運動或L1運動定位的進一步參考塊等。
CCM儲存2035代表(或由)任何形式的儲存,用於儲存CCM資訊,其中包括由模型構造器2005生成的跨分量模型。CCM儲存2035可以是塊級緩衝區的一部分、圖片級的一部分,或不同圖片、不同時間ID或不同圖片不同區域的CCM表(或索引表)。CCM表可以與一個視訊圖片相關聯,並儲存與該圖片相關的CCM資訊或其他CCP資訊。CCM表也可以與一個時間ID相關聯,並儲存具有相關時間ID的圖片的CCM資訊或其他CCP資訊。CCM表可以與視訊圖片中的一個區域相關聯,並儲存與該區域相關的CCM資訊或其他CCP資訊。儲存的CCM資訊和/或CCP資訊可供後續塊作為合併模式候選項繼承。
每個CCM表都有一個對應的索引緩衝區,用於將圖片中的位置映射到CCM表中的位置。為了檢索選定參考塊(或選定候選項)的CCM資訊和/或CCP資訊,解碼器識別選定參考塊的CCM表和對應的索引緩衝區(基於圖片、時間ID或圖片中的區域),然後使用候選項在圖片中的位置查找在識別的索引緩衝區中的索引。該索引反過來用於訪問CCM表中的選定CCM資訊和/或CCP資訊。
第21圖概念性地說明了一個過程2100,用於在解碼一個塊時從多個參考塊傳播CCM資訊。在某些實施例中,實施解碼器1900的計算設備的一個或多個處理單元(例如,處理器)通過執行存儲在可讀取計算機介質中的指令來執行過程2100。在某些實施例中,實施解碼器1900的電子裝置執行過程2100。
解碼器接收(在步驟2110)資料以解碼為視訊的當前圖片的當前塊的像素。當前塊具有第一色塊(例如,亮度分量塊)和第二色塊(例如,色度分量塊)。解碼器生成(在步驟2120)第一色塊的重建。
解碼器繼承(在步驟2130)來自參考塊的跨分量模型;跨分量模型是基於參考塊的兩個或多個進一步參考塊的跨分量資訊傳播到參考塊的。
兩個或多個進一步參考塊可以由參考塊的一個以上運動向量或塊向量定位(例如,當參考塊是一個雙向幀間預測塊時)。在某些實施例中,解碼器通過結合兩個或多個進一步參考塊的CCM模型的所有或子集來導出跨分量模型。
在某些實施例中,解碼器通過從參考塊的兩個或多個進一步參考塊中選擇一個塊來傳播跨分量模型,以為參考塊提供跨分量模型。可以根據一組預定義規則選擇一個進一步參考塊。參考塊可能被跨分量預測編碼,也可能沒有。解碼器可以通過識別被跨分量預測編碼的塊來選擇一個進一步參考塊。解碼器可以選擇兩個或多個進一步參考塊中唯一具有跨分量模型的進一步參考塊。解碼器可以通過識別被當前圖片參考(例如,IBC模式)編碼的塊,或通過識別被幀內預測編碼的塊,或通過識別被幀間預測編碼的塊來選擇一個進一步參考塊。
在某些實施例中,可以通過識別在一個或多個進一步參考塊中與參考塊具有最短空間距離的塊來選擇一個進一步參考塊。空間距離可以是垂直或水平距離,或歐幾里得距離,或曼哈頓距離,或明可夫斯基距離。在某些實施例中,可以通過識別在一個或多個進一步參考塊中與參考塊具有最短時間距離的塊來選擇一個進一步參考塊。塊的時間距離可以基於包含該塊的進一步參考圖片的POC和參考圖片的POC來確定。
可以通過識別在一個或多個進一步參考塊中具有與參考塊的量化參數最接近的QP的塊來選擇一個進一步參考塊,或通過識別在一個或多個進一步參考塊中具有最大QP的塊,或通過識別在一個或多個進一步參考塊中具有最小QP的塊,或識別在一個或多個進一步參考塊中被L0(或L1)運動向量指示的塊。
解碼器應用(在第2140步驟)繼承的跨分量模型於第一色塊的重建,以生成第二色塊的跨分量預測。解碼器可以使用(在第2150步驟)生成的跨分量預測來重建當前塊(例如,與預測殘差結合)或儲存(在第2160步驟)確定的跨分量模型以編解碼後續塊。解碼器隨後可以提供重建的當前塊以作為重建的當前圖片的一部分進行顯示。
VI. 範例電子系統
許多上述描述的特徵和應用程序被實現為軟體流程,這些流程被指定為一組記錄在可讀取的電腦儲存媒介(也稱為可讀取的電腦媒介)上的指令。當這些指令被一個或多個計算或處理單元(例如,一個或多個處理器、處理器的核心或其他處理單元)執行時,它們導致處理單元執行指令中指示的動作。可讀取的電腦媒介的例子包括但不限於CD-ROM、快閃驅動器、隨機存取記憶體(RAM)晶片、硬碟驅動器、可擦寫可程式讀取唯讀記憶體(EPROM)、電可擦寫可程式讀取唯讀記憶體(EEPROM)等。可讀取的電腦媒介不包括載波波和透過無線或有線連接傳遞的電子信號。
在本規格書中,“軟體”一詞意味著包括存儲在唯讀記憶體中的韌體或存儲在磁性儲存中的應用程序,這些應用程序可以被讀取到記憶體中以供處理器處理。此外,在某些實施例中,多個軟體發明可以作為更大程序的子部分實現,同時保持獨立的軟體發明。在某些實施例中,多個軟體發明也可以實現為單獨的程序。最後,任何組合的單獨程序,它們一起實現了此處描述的軟體發明,都在本公開範圍內。在某些實施例中,當軟體程序安裝在一個或多個電子系統上運行時,它們定義了一個或多個特定的機器實現,執行並進行軟體程序的操作。
第22圖概念性地說明了實施本公開內容的某些實施例的一個電子系統2200。電子系統2200可以是電腦(例如,桌面電腦、個人電腦、平板電腦等)、手機、PDA或任何其他類型的電子設備。這樣的電子系統包括用於各種其他類型的可讀取電腦媒介的各種類型的可讀取電腦媒介和介面。電子系統2200包括匯流排2205、處理單元2210、圖形處理單元(GPU)2215、系統記憶體2220、網絡2225、唯讀記憶體2230、永久儲存裝置2235、輸入裝置2240和輸出裝置2245。
匯流排2205集合代表所有系統、外圍設備和晶片組匯流排,這些匯流排通訊連接電子系統2200的眾多內部裝置。例如,匯流排2205通訊連接處理單元2210與GPU 2215、唯讀記憶體2230、系統記憶體2220和永久儲存裝置2235。
從這些各種記憶單元中,處理單元2210檢索指令以執行和資料以處理,以執行本公開的流程。處理單元可以在不同的實施例中是單個處理器或多核處理器。一些指令被傳遞給並由GPU 2215執行。GPU 2215可以卸載各種計算或補充處理單元2210提供的圖像處理。
唯讀記憶體(ROM)2230儲存靜態資料和指令,這些資料和指令被處理單元2210和電子系統的其他模組使用。另一方面,永久儲存裝置2235是一個讀寫記憶裝置。該裝置是一個非揮發性記憶單元,即使電子系統2200關閉時也儲存指令和資料。本公開的某些實施例使用大容量儲存裝置(如磁盤或光盤及其對應的磁盤驅動器)作為永久儲存裝置2235。
其他實施例使用可移除儲存裝置(如軟盤、快閃記憶裝置等及其對應的磁盤驅動器)作為永久儲存裝置。與永久儲存裝置2235一樣,系統記憶體2220是一個讀寫記憶裝置。然而,與儲存裝置2235不同,系統記憶體2220是一個揮發性讀寫記憶體,如隨機存取記憶體。系統記憶體2220儲存處理器在運行時使用的一些指令和資料。在某些實施例中,根據本公開的流程儲存在系統記憶體2220、永久儲存裝置2235和/或唯讀記憶體2230中。例如,各種記憶單元包括根據某些實施例處理多媒體剪輯的指令。從這些各種記憶單元中,處理單元2210檢索指令以執行和資料以處理,以執行某些實施例的流程。
匯流排2205還連接到輸入和輸出裝置2240和2245。輸入裝置2240使用者能夠傳達資訊和選擇命令給電子系統。輸入裝置2240包括字母數字鍵盤和指向裝置(也稱為“游標控制裝置”)、攝像頭(例如,網絡攝像頭)、麥克風或類似裝置用於接收語音命令等。輸出裝置2245顯示由電子系統生成的圖像或以其他方式輸出資料。輸出裝置2245包括打印機和顯示裝置,如陰極射線管(CRT)或液晶顯示器(LCD),以及揚聲器或類似的音頻輸出裝置。某些實施例包括像觸摸屏這樣的裝置,它們充當輸入和輸出裝置。
最後,如第22圖所示,匯流排2205還通過網絡適配器(未顯示)將電子系統2200連接到網絡2225。通過這種方式,電腦可以是電腦網絡的一部分(例如,局域網(“LAN”)、廣域網(“WAN”)或內聯網,或網絡的網絡,如互聯網)。電子系統2200的任何或所有組件都可以與本公開一起使用。
某些實施例包括電子元件,如微處理器、存儲和記憶體,這些記憶體存儲在機器可讀或電腦可讀介質中的電腦程式指令(另稱為電腦可讀存儲介質、機器可讀介質或機器可讀存儲介質)。這些電腦可讀介質的一些例子包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、只讀光碟(CD-ROM)、可錄光碟(CD-R)、可重寫光碟(CD-RW)、只讀數位多用途光碟(例如,DVD-ROM、雙層DVD-ROM)、各種可錄/可重寫DVD(例如,DVD-RAM、DVD-RW、DVD+RW等)、閃存(例如,SD卡、mini-SD卡、micro-SD卡等)、磁性和/或固態硬碟、只讀和可錄藍光®光碟、超密度光碟、任何其他光學或磁性介質,以及軟盤。電腦可讀介質可能存儲一個電腦程式,該程式可由至少一個處理單元執行,並包括用於執行各種操作的指令集。電腦程式或電腦代碼的例子包括機器碼,如由編譯器產生的,以及由電腦、電子元件或微處理器使用解釋器執行的包含更高級別代碼的文件。
雖然上述討論主要參考執行軟體的微處理器或多核處理器,但許多上述描述的特徵和應用由一個或多個集成電路執行,如應用特定集成電路(ASICs)或現場可程式閘陣列(FPGAs)。在某些實施例中,這些集成電路執行存儲在電路本身上的指令。此外,某些實施例執行存儲在可程式邏輯裝置(PLDs)、ROM或RAM裝置中的軟體。
在本規範和本申請的任何請求項中使用的術語“電腦”、“伺服器”、“處理器”和“記憶體”都指電子或其他技術裝置。這些術語不包括人或人群。就本規範而言,術語顯示或顯示意味著在電子裝置上顯示。在本規範和本申請的任何請求項中使用的術語“電腦可讀介質”、“電腦可讀介質”和“機器可讀介質”完全限於存儲資訊的形式可由電腦讀取的有形、實體物件。這些術語不包括任何無線信號、有線下載信號和任何其他短暫信號。
雖然本公開內容已經參考許多特定細節進行了描述,但本技術領域的普通技術人員將認識到,本公開內容可以在不脫離本公開內容的精神的情況下,體現在其他特定形式中。此外,許多圖(包含第18圖和第21圖)概念性地說明了過程。這些過程的特定操作可能不會按照所顯示和描述的確切順序執行。特定操作可能不會在一連串的操作中連續執行,並且在不同的實施例中可能執行不同的特定操作。此外,該過程可以使用幾個子過程實現,或作為更大宏過程的一部分。因此,本技術領域的普通技術人員將理解,本公開內容不受前述說明性細節的限制,而是應由附加的請求項來定義。
附加說明
在此描述的主題有時展示了包含在不同其他組件內部或與之連接的不同組件。應理解,這樣描繪的架構僅僅是例子,實際上許多其他架構可以實現相同的功能。從概念上講,任何組件的排列以實現相同的功能實際上是“相關聯的”,以便實現所需的功能。因此,此處結合以實現特定功能的任何兩個組件可以被視為彼此“相關聯”,以實現所需的功能,不論架構或中間組件如何。同樣,如此相關聯的任何兩個組件也可以被視為彼此“可操作連接”,或“可操作耦合”,以實現所需的功能,任何兩個能夠如此相關聯的組件也可以被視為彼此“可操作耦合”,以實現所需的功能。可操作耦合的具體例子包括但不限於物理可配合和/或物理互動組件以及/或無線可互動和/或無線互動組件以及/或邏輯互動和/或邏輯可互動組件。
此外,關於在此處使用的實質上任何複數和/或單數術語,本技術領域中具有技能的人可以根據上下文和/或應用從複數翻譯為單數和/或從單數翻譯為複數。為了清晰起見,可以在此明確設定各種單數/複數排列。
此外,那些熟悉本技術的人將會理解,一般來說,此處使用的術語,特別是在所附請求項中,例如請求項主體中的術語,通常被視為“開放”術語,例如,“包含”一詞應該解釋為“包含但不限於”,“having”一詞應該解釋為“至少具有”,“includes”一詞應該解釋為“包括但不限於”等。那些熟悉本技術的人還將進一步理解,如果一個特定數量的引入的請求項陳述是有意的,這樣的意圖將在請求項中明確陳述,並且在沒有這樣的陳述的情況下,沒有這樣的意圖存在。例如,作為理解的輔助,以下附加的請求項可能包含使用介紹性短語“至少一個”和“一個或多個”來引入請求項陳述。然而,不應將這樣的短語的使用解釋為暗示以不定冠詞“a”或“an”引入的請求項陳述的任何特定請求項只包含一個這樣的陳述的實現,即使相同的請求項包括介紹性短語“一個或多個”或“至少一個”以及不定冠詞如“a”或“an”,例如,“a”和/或“an”應該解釋為“至少一個”或“一個或多個”;對於用來引入請求項陳述的定冠詞的使用也是如此。此外,即使一個特定數量的引入的請求項陳述被明確陳述,那些熟悉本技術的人將認識到,這樣的陳述應該解釋為至少包括所陳述的數量,例如,單獨陳述“兩個陳述”,沒有其他修飾語,意味著至少兩個陳述,或兩個或多個陳述。此外,在使用類似於“至少一個A、B和C等”的慣例的情況下,一般這樣的構造是按照熟悉本技術的人所理解的慣例來意圖的,例如,“一個系統至少具有A、B和C”將包括但不限於只有A、只有B、只有C、A和B一起、A和C一起、B和C一起,和/或A、B和C一起的系統等。在使用類似於“至少一個A、B或C等”的慣例的情況下,一般這樣的構造是按照熟悉本技術的人所理解的慣例來意圖的,例如,“一個系統至少具有A、B或C”將包括但不限於只有A、只有B、只有C、A和B一起、A和C一起、B和C一起,和/或A、B和C一起的系統等。那些熟悉本技術的人還將進一步理解,幾乎任何在描述、請求項或圖紙中呈現兩個或多個替代術語的分離詞和/或短語,應該理解為考慮包含其中一個術語、任一術語或兩個術語的可能性。例如,“A或B”將被理解為包括“A”或“B”或“A和B”的可能性。
從上述可以看出,本公開的各種實施例已經在此為了說明目的而被描述,並且可以在不偏離本公開的範圍和精神的情況下進行各種修改。因此,此處披露的各種實施例不打算具有限制性,真正的範圍和精神由以下請求項所指示。
1600:視訊編碼器
1605:視訊源
1608:減法器
1609:預測殘差
1610:自變換模塊
1611:量化模塊
1612、1912:量化係數
1613、1913:預測像素資料
1614、1911:逆量化模塊
1615、1910:逆變換模塊
1616、1916:變換係數
1617:重建像素資料
1619、1919:重建殘差
1620、1920:當前圖片預測模塊
1624:幀內估計模塊
1625、1925:幀內預測模塊
1627、1927:線緩衝區
1630、1930:運動補償模塊
1635:運動估計模塊
1640、1940:幀間預測模塊
1645、1945:環路濾波器
1650:重建圖片緩衝區
1665、1965:MV緩衝區
1675、1975:MV預測模塊
1690:熵編碼器
1695、1995:位元流
1705、2005:模型構造器
1710、2010:跨分量模型
1715、2015:亮度分量的重建
1725、2025:色度分量的跨分量預測器
1730、2030:CCM選擇模組
1735、2035:CCM存儲
1740、2040:CCM傳播模組
1810~1850, 2110~2150:步驟
1900:視訊解碼器
1950:解碼圖片緩衝區
1990:解析器
1917:解碼像素資料
1905:顯示裝置
2205:匯流排
2210:處理單元
2215:圖形處理單元(GPU)
2220:系統記憶體
2225:網絡
2230:唯讀記憶體
2200:電子系統
2235:永久儲存裝置
2240:輸入裝置
2245:輸出裝置
隨附的附圖是為了提供對本公開內容的進一步理解,並且被納入並構成本公開內容的一部分。附圖圖示了本公開內容的實施方式,並與描述一起,用於解釋本公開內容的原理。值得注意的是,附圖不一定按比例繪製的,因為為了清楚地說明本公開內容的概念,某些組件可能被繪示成與實際實施中的尺寸不成比例。
第1圖概念性地說明用於推導線性模型參數的色度和亮度樣本。
第2圖示出將相鄰樣本分類為兩組的示例。
第3圖概念性地說明卷積濾波器的空間分量。
第4圖示出梯度濾波器所採用的梯度線性模型(Gradient Linear Model,簡稱 GLM)。
第5圖示出使用跨分量殘差模型(cross-component residual model,簡稱 CCRM)的分量樣本重建。
第6圖說明由CCRM濾波器預測的色度樣本相對於亮度樣本的位置。
第7圖說明用於幀內模板匹配的預定義搜索區域。
第8圖顯示用於導出相應色度塊的直接塊向量的亮度塊。
第9圖說明從空間中鄰近塊的預定義位置來繼承模型參數。
第10圖概念性地說明繼承時間鄰近模型參數。
第11A-B圖說明一當前塊及可從中繼承模型參數的非相鄰的空間鄰近塊。
第12圖概念性地說明基於塊向量的CCM資訊傳播的示例。
第13圖說明一當前塊具有兩個塊向用以量識別兩個分別具有CCM資訊的參考塊。
第14圖說明基於運動向量的CCM資訊傳播的示例。
第15圖說明一當前塊具有兩個運動向用以量識別兩個分別具有CCM資訊的參考塊。
第16圖說明可能實施跨分量預測的一個視訊編碼器示例。
第17圖說明視訊編碼器的一部分, 其用於實施從多個參考塊傳播CCM資訊。
第18圖概念性地說明在編碼一個塊時從多個參考塊傳播CCM資訊的過程。
第19圖說明可能實施跨分量預測的一個視訊解碼器示例。
第20圖說明視訊解碼器的一部分, 其用以實施從多個參考塊傳播CCM資訊。
第21圖概念性地說明在解碼一個塊時從多個參考塊傳播CCM資訊的過程。
第22圖概念性地說明實施本公開內容的某些實施例的電子系統。
2100:過程
2110~2150:步驟
Claims (19)
- 一種影片編解碼方法,包括: 接收資料用以編碼或解碼一影片的一當前圖片的一當前塊的像素,其中該當前塊包含第一色塊和第二色塊; 生成對應於該第一色塊的一重建塊; 從一參考塊繼承一跨分量模型,其中該參考塊的該跨分量模型係基於兩個或多個進一步參考塊的跨分量模型傳播(propagate)給該參考塊; 將該繼承的跨分量模型應用於該第一色塊的重建塊,以生成該第二色塊的一生成的跨分量預測;以及 使用該生成的跨分量預測來編碼或解碼該當前塊。
- 如請求項1所述的影片編解碼方法,其中該兩個或多個進一步參考塊是經由該參考塊的超過一個運動向量或塊向量所定位。
- 如請求項1所述的影片編解碼方法,其中該參考塊未經由跨分量預測編碼。
- 如請求項1所述的影片編解碼方法,其中傳播(propagate)該跨分量模型包括從該參考塊的兩個或多個進一步參考塊中選擇一選定進一步參考塊,以提供該選定進一步參考塊的該跨分量模型給該參考塊。
- 如請求項4所述的影片編解碼方法,其中該選定進一步參考塊是根據一組預定義規則作選擇的。
- 如請求項4所述的影片編解碼方法,其中選擇該參考塊的該選定進一步參考塊包括識別一個藉由跨分量預測編碼的塊。
- 如請求項4所述的影片編解碼方法,其中該選定進一步參考塊是該兩個或多個進一步參考塊中唯一具有跨分量模型的進一步參考塊。
- 如請求項4所述的影片編解碼方法,其中選擇該參考塊的該選定進一步參考塊包括識別一個藉由當前圖片參考編碼的塊。
- 如請求項4所述的影片編解碼方法,其中選擇該選定進一步參考塊包括識別一個藉由幀內預測編碼的塊。
- 如請求項4所述的影片編解碼方法,其中選擇該選定進一步參考塊包括識別一個藉由幀間預測編碼的塊。
- 如請求項4所述的影片編解碼方法,其中該選定進一步參考塊是通過識別該參考塊與各該進一步參考塊之空間距離最短的塊來作選擇的。
- 如請求項11所述的影片編解碼方法,其中該空間距離是水平距離或垂直距離。
- 如請求項4所述的影片編解碼方法,其中該選定進一步參考塊是通過識別該參考塊與各該進一步參考塊之時間距離最短的塊來作選擇的,其中一個塊的時間距離是基於該進一步參考塊的一圖片順序計數值(POC)和該參考塊的該圖片順序計數值(POC)來確定的。
- 如請求項4所述的影片編解碼方法,其中該選定進一步參考塊是通過識別該參考塊與各該進一步參考塊之量化參數(QP)中最接近的塊來作選擇的。
- 如請求項4所述的影片編解碼方法,其中該選定進一步參考塊是通過識別各該進一步參考塊中具有最大之量化參數(QP)的塊來作選擇的。
- 如請求項4所述的影片編解碼方法,其中該選定進一步參考塊是通過識別各該進一步參考塊中具有最小之量化參數(QP)的塊來作選擇的。
- 如請求項4所述的影片編解碼方法,其中該選定進一步參考塊是通過識別被L0或L1運動向量指示的塊來作選擇的。
- 一種電子裝置包括: 一個影片編解碼器電路配置用於執行下列操作包括: 接收資料用以編碼或解碼一影片的一當前圖片的一當前塊的像素,其中該當前塊包含第一色塊和第二色塊; 生成對應於該第一色塊的一重建塊; 從一參考塊繼承一個跨分量模型,其中參考塊的該跨分量模型係基於兩個或多個進一步參考塊的跨分量模型傳播(propagate)給該參考塊; 將該繼承的跨分量模型應用於該第一色塊的重建塊,以生成第二色塊的一生成的跨分量預測;以及 使用該生成的跨分量預測來編碼或解碼當前塊。
- 一種影片解碼方法包括: 接收資料用以解碼一影片的一當前圖片的一當前塊的像素,其中該當前塊包含第一色塊和第二色塊; 生成對應於該第一色塊的一重建塊; 從一參考塊繼承一個跨分量模型,其中跨分量模型基於兩個或多個進一步參考塊的跨分量模型傳播(propagate)給該參考塊; 將該繼承的跨分量模型應用於該第一色塊的重建塊,以生成該第二色塊的一生成的跨分量預測;以及 使用該生成的跨分量預測來重建該當前塊。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202363535788P | 2023-08-31 | 2023-08-31 | |
| US63/535,788 | 2023-08-31 | ||
| WOPCT/CN2024/115723 | 2024-08-30 | ||
| PCT/CN2024/115723 WO2025045180A1 (en) | 2023-08-31 | 2024-08-30 | Decision rules of cross-component model propagation based on block vectors and motion vectors |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW202518904A true TW202518904A (zh) | 2025-05-01 |
Family
ID=94818155
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW113132909A TW202518904A (zh) | 2023-08-31 | 2024-08-30 | 基於塊向量和運動向量的跨分量模型傳播決策規則 |
Country Status (2)
| Country | Link |
|---|---|
| TW (1) | TW202518904A (zh) |
| WO (1) | WO2025045180A1 (zh) |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2986395A1 (fr) * | 2012-01-30 | 2013-08-02 | France Telecom | Codage et decodage par heritage progressif |
| US11496747B2 (en) * | 2017-03-22 | 2022-11-08 | Qualcomm Incorporated | Intra-prediction mode propagation |
| US10986349B2 (en) * | 2017-12-29 | 2021-04-20 | Microsoft Technology Licensing, Llc | Constraints on locations of reference blocks for intra block copy prediction |
-
2024
- 2024-08-30 TW TW113132909A patent/TW202518904A/zh unknown
- 2024-08-30 WO PCT/CN2024/115723 patent/WO2025045180A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| WO2025045180A1 (en) | 2025-03-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN113455003B (zh) | 视频编解码方法及电子设备 | |
| TWI711300B (zh) | 照度補償方法及相應之視訊處理裝置 | |
| TWI706667B (zh) | 隱式變換設置 | |
| CN112567747B (zh) | 共享候选列表 | |
| CN113853795B (zh) | 视频编解码方法及装置 | |
| US20250274604A1 (en) | Extended template matching for video coding | |
| TW202402054A (zh) | 用於候選清單的相似性閾值 | |
| TWI863097B (zh) | 視訊編解碼方法及相關裝置 | |
| US20250211777A1 (en) | Implicit multi-pass decoder-side motion vector refinement | |
| TW202420818A (zh) | 用於跨分量非線性模式推導之相鄰樣本存取 | |
| TW202518904A (zh) | 基於塊向量和運動向量的跨分量模型傳播決策規則 | |
| WO2025051138A1 (en) | Inheriting cross-component model from rescaled reference picture | |
| WO2025016295A1 (en) | Cross-component model propagation | |
| TWI901089B (zh) | 針對合併模式運動向量差異細化的影片編解碼方法及其裝置 | |
| TWI866142B (zh) | 視訊編解碼方法及其電子裝置 | |
| WO2025153064A1 (en) | Inheriting cross-component model based on cascaded vector derived according to a candidate list | |
| WO2025045179A1 (en) | Storing cross-component models for non-intra coded blocks | |
| WO2025011496A1 (en) | Local illumination compensation model inheritance | |
| WO2025016404A1 (en) | Intra prediction fusion with inherited cross-component models | |
| WO2025016275A1 (en) | Storage for cross-component merge mode | |
| CN121533017A (zh) | 跨组件模型传播 | |
| WO2025153059A1 (en) | Inheriting cross-component models based on cascaded vectors for inter chroma prediction | |
| WO2025011635A1 (en) | Inter-chroma with cross-type referencing and constrained reference region | |
| TW202408232A (zh) | 更新合併候選的運動屬性 | |
| CN120569967A (zh) | 用于帧内模板匹配预测的多个块向量 |