[go: up one dir, main page]

TW201817227A - 峰值樣本適應性偏移 - Google Patents

峰值樣本適應性偏移 Download PDF

Info

Publication number
TW201817227A
TW201817227A TW106134400A TW106134400A TW201817227A TW 201817227 A TW201817227 A TW 201817227A TW 106134400 A TW106134400 A TW 106134400A TW 106134400 A TW106134400 A TW 106134400A TW 201817227 A TW201817227 A TW 201817227A
Authority
TW
Taiwan
Prior art keywords
sample
samples
value
offset
difference
Prior art date
Application number
TW106134400A
Other languages
English (en)
Inventor
馬塔 卡茲維克茲
章立
陳建樂
錢威俊
陳義文
趙欣
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW201817227A publication Critical patent/TW201817227A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一視訊寫碼器進行以下操作:比較一當前區塊之一第一樣本與相鄰樣本之一第一集合以判定一第一差值;基於該第一差值判定該第一樣本之一第一偏移;比較該當前區塊之一第二樣本與相鄰樣本之一第二集合以判定具有與該第一差值相同之一正負號的一第二差值;基於該第二差值判定該第二樣本之一偏移,該偏移不同於該第一樣本之該偏移;及將該第一偏移應用於該第一樣本值且將該第二偏移應用於該第二樣本值以產生一經濾波影像。

Description

峰值樣本適應性偏移
本發明係關於視訊編碼及視訊解碼。
數位視訊能力可併入至廣泛範圍之器件中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電話會議器件、視訊串流器件及其類似者。數位視訊器件實施視訊壓縮技術,諸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分進階視訊寫碼(AVC)定義之標準、高效率視訊寫碼(HEVC)標準及此等標準之延伸中所描述的技術。視訊器件可藉由實施此等視訊壓縮技術更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。 視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測來減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼,可將視訊截塊(亦即,視訊圖框或視訊圖框之部分)分割成視訊區塊,其亦可被稱作樹型區塊、寫碼單元(CU)及/或寫碼節點。圖像之經框內寫碼(I)截塊中之視訊區塊係使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼。圖像之框間寫碼(P或B)截塊中之視訊區塊可使用相對於同一圖像中之相鄰區塊中的參考樣本的空間預測或相對於其他參考圖像中之參考樣本的時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。 空間或時間預測導致待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差之殘餘資料來編碼經框間寫碼區塊。框內寫碼區塊係根據框內寫碼模式及殘餘資料編碼。為進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而導致殘餘變換係數,可接著量化該等殘餘變換係數。最初配置於二維陣列中之經量化變換係數可經掃描以便產生變換係數之一維向量,且熵寫碼可經應用以達成甚至更多壓縮。
本發明描述一種類型之樣本適應性偏移(SAO)濾波,在本文中稱為峰值SAO。如本發明中所描述,實施峰值SAO之視訊寫碼器可藉由比較樣本之值與多於兩個相鄰樣本來判定樣本之偏移。在一些實例中,實施峰值SAO之視訊寫碼器可基於樣本與各別相鄰樣本之間的差之量值判定區塊之不同樣本的不同偏移。 在一個實例中,一種用於解碼視訊資料之方法包括:比較當前區塊之第一樣本與相鄰樣本之第一集合以判定第一差值;基於第一差值判定第一樣本之第一偏移,其中第一偏移為第一非零值;比較當前區塊之第二樣本與相鄰樣本之第二集合以判定第二差值,其中相鄰樣本之第一集合相對於第一樣本具有與相鄰樣本之第二集合相對於第二樣本具有之圖案相同的圖案,且其中第一差值及第二差值具有相同正負號;基於第二差值判定第二樣本之第二偏移,其中第二偏移為不同於第一非零值之第二非零值;及將第一偏移應用於第一樣本值且將第二偏移應用於第二樣本值以產生經濾波影像。 在另一實例中,一種用於解碼視訊資料之器件包括經組態以儲存視訊資料之記憶體及一或多個處理器,該一或多個處理器經組態以進行以下操作:比較當前區塊之第一樣本與相鄰樣本之第一集合以判定第一差值;基於第一差值判定第一樣本之第一偏移,其中第一偏移為第一非零值;比較當前區塊之第二樣本與相鄰樣本之第二集合以判定第二差值,其中相鄰樣本之第一集合相對於第一樣本具有與相鄰樣本之第二集合相對於第二樣本具有之圖案相同的圖案,且其中第一差值及第二差值具有相同正負號;基於第二差值判定第二樣本之第二偏移,其中第二偏移為不同於第一非零值之第二非零值;及將第一偏移應用於第一樣本值且將第二偏移應用於第二樣本值以產生經濾波影像。 在另一實例中,一種電腦可讀媒體儲存指令,該等指令在由一或多個處理器執行時致使該一或多個處理器進行以下操作:比較當前區塊之第一樣本與相鄰樣本之第一集合以判定第一差值;基於第一差值判定第一樣本之第一偏移,其中第一偏移為第一非零值;比較當前區塊之第二樣本與相鄰樣本之第二集合以判定第二差值,其中相鄰樣本之第一集合相對於第一樣本具有與相鄰樣本之第二集合相對於第二樣本具有之圖案相同的圖案,且其中第一差值及第二差值具有相同正負號;基於第二差值判定第二樣本之第二偏移,其中第二偏移為不同於第一非零值之第二非零值;及將第一偏移應用於第一樣本值且將第二偏移應用於第二樣本值以產生經濾波影像。 在另一實例中,一種用於解碼視訊資料之裝置包括:用於比較當前區塊之第一樣本與相鄰樣本之第一集合以判定第一差值的構件;用於基於第一差值判定第一樣本之第一偏移的構件,其中第一偏移為第一非零值;用於比較當前區塊之第二樣本與相鄰樣本之第二集合以判定第二差值的構件,其中相鄰樣本之第一集合相對於第一樣本具有與相鄰樣本之第二集合相對於第二樣本具有之圖案相同的圖案,且其中第一差值及第二差值具有相同正負號;用於基於第二差值判定第二樣本之第二偏移的構件,其中第二偏移為不同於第一非零值之第二非零值;及用於將第一偏移應用於第一樣本值且將第二偏移應用於第二樣本值以產生經濾波影像的構件。 在隨附圖式及以下描述中闡述本發明之一或多個態樣的細節。本發明中所描述之技術的其他特徵、目標及優點將自描述、圖式及申請專利範圍顯而易見。
本申請案主張2016年10月4日申請之美國臨時專利申請案第62/404,126號之權利,該申請案之全部內容特此以引用之方式併入。 本發明描述與可用於後處理階段(作為迴路內寫碼之部分)或預測階段中之濾波方法相關的技術。本發明之技術可經實施至現有視訊編解碼器(諸如HEVC(高效率視訊寫碼))中,或為用於未來視訊寫碼標準(諸如當前在開發中之H.266標準)之高效寫碼工具。 樣本適應性偏移(SAO)濾波為用於視訊寫碼之一種類型迴路濾波。一般而言,添加偏差值至視訊圖框(例如,經重構影像)中之樣本在一些情況下可改良寫碼而不極大增加儲存或傳輸經編碼視訊資料所需要的位元額外負擔。潛在地由SAO濾波產生的寫碼改良可為(例如)在編碼視訊資料時可達成較好速率-失真(RD)折衷,及/或經解碼視訊影像對於給定位元速率含有相對於原始視訊影像之較小失真。SAO技術允許不同偏移值應用於不同樣本(或樣本之區塊),此取決於樣本(或區塊)分類量度,諸如邊緣量度、頻帶量度或其他類型之量度。 在一些實施中,SAO濾波器單元可經組態以執行兩種類型SAO濾波,在本發明中通常稱為頻帶偏移(BO)濾波及邊緣偏移(EO)濾波。SAO濾波器單元有時亦可應用非偏移,其自身可視為第三類型之SAO濾波。藉由SAO濾波器應用的偏移濾波之類型可經明確地或隱式地發信至視訊解碼器。當應用EO濾波時,可基於寫碼樹型單元(CTU)之邊緣資訊來分類樣本,且可基於邊緣分類判定樣本之偏移。如下文將更詳細地解釋,通常存在基於邊緣之SAO的四個變化,其中樣本之值與樣本之八個相鄰樣本中之兩者進行比較。哪兩個樣本用於比較取決於基於邊緣之偏移的哪個變化被使用。亦即,明確地/隱式地發信之EO圖案用以選擇用於比較之兩個樣本。在本發明中,基於樣本相對於相鄰樣本之量值差,偏移被添加至樣本值。 當應用BO濾波時,樣本可基於樣本值(諸如強度值)分類為不同頻帶,其中每一頻帶具有相關聯偏移。頻帶包括樣本值之範圍。舉例而言,範圍介於0至255之樣本值可分成32個相等頻帶(經標記0至31),使得對於全部三十二個頻帶,樣本值0至7為第一頻帶,樣本值8至15為第二頻帶,樣本值16至23為第三頻帶,等。頻帶可用於判定複數個不同偏移值中之哪一特定偏差值應用於樣本或樣本之群組。舉例而言,若樣本具有值10(其係在第二頻帶(亦即值8至15)內,在上述實例中),則與第二頻帶相關聯之偏移可被添加至樣本值。 出於發信及產生各種頻帶之偏移的目的,頻帶可經分組成兩個或多於兩個群組。對於BO濾波,樣本可(例如)經分類成如上文所描述之三十二個頻帶(頻帶0至31),且頻帶可經分組成兩個群組(例如,十六個頻帶之兩個群組,四個頻帶之一個群組及二十八個頻帶之一個群組,八個頻帶之一個群組及二十四個頻帶之一個群組,或其他此等群組)。頻帶之群組可用於判定頻帶之偏移值在經編碼視訊位元串流中被發信所按的次序,及/或可用以判定特定頻帶是否具有除零以外之偏移值。頻帶之偏移可使用其中當前值經發信為當前值與前一值之間的差的差分寫碼技術來發信。為了減小發信額外負擔,僅僅少數頻帶(例如四個頻帶)可與非零偏移值相關聯,而所有其他頻帶經假定為具有零偏移值。 如在HEVC標準中實施,可在截塊層級處啟用及停用SAO濾波,且另外,SAO濾波可獨立地針對明度及色度樣本而啟用及停用。舉例而言,對於視訊資料之特定截塊,明度及色度樣本兩者可經SAO濾波;明度及色度樣本兩者都可不經SAO濾波;或明度及色度樣本中之一者可經SAO濾波而另一者可不經SAO濾波。當SAO濾波經啟用用於截塊時,則在寫碼樹型單元(CTU)層級處發信SAO類型及偏移值。如上文所介紹,SAO類型可包括BO濾波、EO濾波或非SAO濾波。因此,即使SAO濾波經啟用用於特定截塊,彼截塊之一些CTU仍可不經SAO濾波(亦即,一些CTU將具有SAO類型之非SAO濾波)。在一些情況下,SAO類型及偏移值可係以一系列合併旗標發信,其中第一合併旗標之真值指示偏移類型且CTU之偏移值係自左相鄰CTU繼承,且第二合併旗標之真值指示SAO類型且偏移值係自上方相鄰CTU繼承。若兩個合併旗標為假,則新的SAO類型及新的偏移值經發送用於CTU。 應理解儘管HEVC在截塊層級處啟用及停用SAO濾波且在CTU層級處發信SAO資訊,但預期到本發明之技術可實施於SAO組態中,其中此發信發生在不同層級處或使用完全不同發信機制之SAO組態中。 SAO資訊(例如SAO類型及複數個偏移值)經發信用於CTU。基於SAO類型,視訊解碼器在逐樣本基礎上判定來自該複數個偏移值中之哪一偏移值添加用於每一樣本。如下文將更詳細地解釋,哪一偏移值適用於特定樣本或樣本區塊(例如CTU中之2×2區塊)的判定可係基於針對樣本區塊之特定樣本判定的邊緣及頻帶分類而判定。 本發明描述新版本之SAO,在本文中稱為峰值SAO。峰值SAO可為結合上文所描述之EO或BO濾波使用的額外SAO類型,或可經實施為與上文所描述之SAO濾波器分隔的新寫碼工具。當實施峰值SAO時,視訊解碼器可應用不同偏移至視訊資料之當前區塊中之兩個或多於兩個樣本,即使樣本與其相鄰樣本之關係相同。作為峰值SAO之一個實例,視訊解碼器可比較第一樣本與四個相鄰樣本以判定該樣本具有比所有四個相鄰樣本稍微較大的樣本值(例如,明度值或色訊值)。基於第一樣本具有稍微較大樣本值,視訊解碼器可應用第一偏移至第一樣本。對於第二樣本,視訊解碼器可比較第二樣本與四個類似定位之相鄰樣本以判定樣本具有比所有四個相鄰樣本大得多之樣本值。基於第二樣本具有大得多的樣本值,視訊解碼器可應用與用於第一樣本之偏移不同的偏移至第二樣本。不同偏移可(例如)為不同於第一偏移之單個偏移值或可為兩個偏移之組合(諸如第一偏移加額外偏移)。 在傳統SAO中,視訊解碼器將應用同一偏移至上文所描述之第一及第二樣本兩者,此係因為第一及第二樣本相對於其相鄰樣本具有相同之關係(亦即,大於所有)。然而,在峰值SAO中,視訊解碼器應用不同偏移至第一及第二樣本,此係因為第一樣本之值僅僅稍微大於其相鄰樣本,而第二樣本之值比其相鄰樣本大得多。另外,在傳統SAO中,樣本僅僅與兩個相鄰樣本相比較,而在峰值SAO中樣本可與其他數目個相鄰樣本(諸如4或8個相鄰者)相比較。將在下文更詳細地描述峰值SAO之此等及其他態樣。 因此,傳統SAO技術不提供用於選擇用於相對於相鄰樣本針對相同特性具有不同量值的不同樣本之不同偏移粒度。舉例而言,在傳統SAO中,視訊寫碼器將與應用於具有相對於相鄰樣本大得多之值的樣本相同的偏移應用於具有相對於相鄰樣本稍大之值的樣本。本發明描述適用於視訊寫碼器之潛在地導致視訊寫碼器具有較好速率失真折衷的實例技術。舉例而言,在本發明中描述之視訊寫碼器可允許基於區塊之不同樣本與相鄰樣本之各別差值而用於區塊之不同樣本之不同偏移。 可參考視訊寫碼器描述本發明中之各種技術,該視訊寫碼器意欲為可指代視訊編碼器或視訊解碼器之一般術語。除非另外明確地陳述,否則不應假定關於視訊編碼器或視訊解碼器描述之技術不可藉由視訊編碼器或視訊解碼器中之另一者執行。舉例而言,在許多情況下,視訊解碼器執行與視訊編碼器相同或有時互逆之寫碼技術以便解碼經編碼視訊資料。在許多情況下,視訊編碼器亦包括視訊解碼迴路,及因此視訊編碼器執行作為編碼視訊資料之部分的視訊解碼。因此,除非另有說明,否則本發明中關於視訊解碼器描述之技術亦可由視訊編碼器執行,且反之亦然。 本發明亦可使用諸如當前區塊、當前圖像等之術語。在本發明之上下文中,相較於(例如)先前或已經寫碼區塊或圖像或尚待寫碼之區塊或圖像,術語「當前」意欲識別當前正被寫碼之區塊或圖像。 本發明為易於解釋將使用HEVC術語描述各種視訊寫碼技術。然而,並未假定本發明之技術限於HEVC,而實際上,明確預期到本發明之技術可實施於HEVC之後續標準及其擴展中。 圖1為說明可利用本發明中所描述之技術的實例視訊編碼及解碼系統10之方塊圖。如圖1中所展示,系統10包括源器件12,其產生在稍後時間待由目的地器件14解碼之經編碼視訊資料。源器件12及目的地器件14可包含廣泛範圍之器件中的任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、電話手機(諸如所謂的「智慧型」電話)、所謂的「智慧型」板、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件或其類似者。在一些情況下,源器件12及目的地器件14可經裝備以用於無線通信。 目的地器件14可經由鏈路16接收待解碼之經編碼視訊資料。鏈路16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14的任何類型之媒體或器件。在一個實例中,鏈路16可包含使源器件12能夠即時將經編碼視訊資料直接傳輸至目的地器件14之通信媒體。可根據通信標準(諸如無線通信協定)調變經編碼視訊資料,且將其傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如區域網路、廣域網路或全球網路,諸如網際網路)之部分。通信媒體可包括路由器、交換器、基地台,或可適用於促進自源器件12至目的地器件14的通信之任何其他設備。 在另一實例中,可將經編碼資料自輸出介面22輸出至儲存器件26。類似地,可藉由輸入介面自儲存器件26存取經編碼資料。儲存器件26可包括各種分散式或本機存取資料儲存媒體(諸如硬碟、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼視訊資料之任何其他合適數位儲存媒體)中之任一者。在另一實例中,儲存器件26可對應於可保持由源器件12產生的經編碼視訊之檔案伺服器或另一中間儲存器件。目的地器件14可經由串流或下載而自儲存器件26存取所儲存之視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料並將彼經編碼視訊資料傳輸至目的地器件14之任何類型的伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、FTP伺服器、網路附接儲存(NAS)器件或本機磁碟機。目的地器件14可經由任何標準資料連接(包括網際網路連接)而存取經編碼視訊資料。此連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或兩者之組合。經編碼視訊資料自儲存器件26之傳輸可為串流傳輸、下載傳輸或兩者之組合。 本發明之技術不必限於無線應用或設定。該等技術可應用於支援多種多媒體應用(諸如(例如)經由網際網路之空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸)中之任一者的視訊寫碼、供儲存於資料儲存媒體上之數位視訊的編碼、儲存於資料儲存媒體上之數位視訊的解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援應用(諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用)。 在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。在一些狀況下,輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。在源器件12中,視訊源18可包括諸如視訊俘獲器件(例如,視訊攝影機)、含有先前所俘獲之視訊之視訊存檔、用以自視訊內容提供者接收視訊之視訊饋入介面及/或用於將電腦圖形資料產生為源視訊的電腦圖形系統,或此等源之組合。作為一個實例,若視訊源18為視訊攝影機,則源器件12及目的地器件14可形成所謂的攝影機電話或視訊電話。然而,本發明中所描述的技術可大體上適用於視訊寫碼,且可應用於無線及/或有線應用。 經俘獲、預先俘獲或電腦產生之視訊可由視訊編碼器20編碼。可經由源器件12之輸出介面22將經編碼視訊資料直接傳輸至目的地器件14。經編碼視訊資料亦可(或替代地)儲存至儲存器件26上用於稍後由目的地器件14或其他器件存取,用於解碼及/或播放。 目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。在一些狀況下,輸入介面28可包括接收器及/或數據機。目的地器件14之輸入介面28經由鏈路16接收經編碼視訊資料。經由鏈路16傳達或在儲存器件26上所提供之經編碼視訊資料可包括由視訊編碼器20所產生之多種語法元素,其供諸如視訊解碼器30之視訊解碼器在解碼該視訊資料時使用。此等語法元素可與在通信媒體上傳輸、儲存於儲存媒體上或儲存於檔案伺服器上之經編碼視訊資料包括在一起。 顯示器件32可與目的地器件14整合或在目的地器件14的外部。在一些實例中,目的地器件14可包括整合式顯示器件且亦經組態以與外部顯示器件介接。在其他實例中,目的地器件14可為顯示器件。一般而言,顯示器件32向用戶顯示經解碼視訊資料,且可包含多種顯示器件中之任一者,諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。 視訊編碼器20及視訊解碼器30可根據視訊壓縮標準(諸如最近定案之高效率視訊寫碼(HEVC)標準)來操作,且可符合HEVC測試模型(HM)。視訊編碼器20及視訊解碼器30可另外根據HEVC擴展(諸如範圍擴展、多視圖擴展(MV-HEVC),或已藉由視訊寫碼之聯合合作小組(JCT-VC)以及ITU-T視訊寫碼專家群(VCEG)及ISO/IEC動畫專家群(MPEG)的3D視訊寫碼延伸開發之聯合合作小組(JCT-3V)開發的可調式擴展(SHVC))操作。 視訊編碼器20及視訊解碼器30亦可根據其他專屬或行業標準(諸如ITU-T H.264標準,被替代地稱作ISO/IEC MPEG-4,第10部分,進階視訊寫碼(AVC))或此等標準之擴展(諸如可擴展視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展)操作。然而,本發明之技術不限於任何特定寫碼標準。視訊壓縮標準之其他實例包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263及ISO/IEC MPEG-4 Visual。 ITU-T VCEG (Q6/16)及ISO/IEC MPEG (JTC 1/SC 29/WG 11)現正研究對於將具有顯著超過當前HEVC標準(包括其當前擴展及針對螢幕內容寫碼及高動態範圍寫碼的近期擴展)之壓縮能力的壓縮能力之未來視訊寫碼技術標準化的潛在需要。該等群組正共同致力於聯合合作工作(被稱為聯合視訊探索小組(JVET))中之此探索活動,以評估由此領域中之專家提議的壓縮技術設計。JVET在2015年10月19日至21日期間第一次會面。參考軟體之一個版本(亦即聯合探索模型2 (JEM2))可自https://jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/tags/HM-16.6- JEM-2.0/下載。在2016年3月聖地亞哥,JVET-B1001,J. Chen, E. Alshina, G. J. Sullivan, J.-R. Ohm, J. Boyce之「Algorithm description of Joint Exploration Test Model 2」(其描述以引用的方式併入本文中)中描述用於JEM2之演算法。參考軟體之另一版本(亦即,聯合探索模型3 (JEM 3))可自https://jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/tags/HM-16.6- JEM-3.0/下載。用於JEM3之演算法描述亦可被稱作JVET-C1001且以引用的方式併入本文中。 儘管圖1中未展示,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元,或其他硬體及軟體,以處置共同資料串流或單獨資料串流中之音訊及視訊兩者的編碼。在一些實例中,若適用,則MUX-DEMUX單元可符合ITU H.223多工器協定或其他協定(諸如使用者資料報協定(UDP))。 視訊編碼器20及視訊解碼器30各自可實施為多種合適之編碼器電路或解碼器電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分以軟體實施時,器件可將用於軟體之指令儲存於合適之非暫時性電腦可讀媒體中,且在硬體中使用一或多個處理器執行指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可整合為各別器件中之組合式編碼器/解碼器(CODEC)之部分。 在HEVC及其他視訊寫碼規範中,視訊序列通常包括一系列圖像。圖像亦可被稱為「圖框」。在一個實例途徑中,圖像可包括三個樣本陣列,表示為SL 、SCb 及SCr 。在此實例途徑中,SL 為明度樣本之二維陣列(亦即,區塊)。SCb 為Cb色訊樣本之二維陣列。SCr 為Cr色訊樣本之二維陣列。色訊樣本亦可在本文中被稱作「色度」樣本。在其他情況下,圖像可為單色的,且可僅包括明度樣本陣列。 為了產生圖像之經編碼表示,視訊編碼器20可產生寫碼樹型單元(CTU)之集合。CTU中之每一者可包含明度樣本之寫碼樹型區塊、色度樣本之兩個對應寫碼樹型區塊,及用以寫碼該等寫碼樹型區塊之樣本的語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,CTU可包含單一寫碼樹型區塊及用以寫碼該寫碼樹型區塊之樣本的語法結構。寫碼樹型區塊可為樣本之N×N區塊。CTU亦可被稱作「樹型區塊」或「最大寫碼單元」(LCU)。HEVC之CTU可廣泛地類似於諸如H.264/AVC之其他標準之巨集區塊。然而,CTU未必限於特定大小,且可包括一或多個寫碼單元(CU)。截塊可包括按光柵掃描次序連續地定序之整數數目個CTU。 為產生經寫碼CTU,視訊編碼器20可對CTU之寫碼樹型區塊遞迴地執行四分樹分割,以將寫碼樹型區塊劃分成寫碼區塊,因此命名為「寫碼樹型單元」。寫碼區塊可為樣本之N×N區塊。CU可包含具有明度樣本陣列、Cb樣本陣列及Cr樣本陣列之圖像的明度樣本之寫碼區塊,及色度樣本之兩個對應寫碼區塊,及用於對寫碼區塊之樣本進行寫碼的語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,CTU可包含單一寫碼區塊及用於對寫碼區塊之樣本進行寫碼的語法結構。 視訊編碼器20可將CU之寫碼區塊分割為一或多個預測區塊。預測區塊為經應用相同預測的樣本之矩形(亦即,正方形或非正方形)區塊。CU之預測單元(PU)可包含明度樣本之預測區塊、色度樣本之兩個對應預測區塊及用於預測該等預測區塊之語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,PU可包含單一預測區塊及用以預測該預測區塊之語法結構。視訊編碼器20可針對CU之每一PU的明度預測區塊、Cb預測區塊及Cr預測區塊產生預測性明度區塊、Cb區塊及Cr區塊。 視訊編碼器20可使用框內預測或框間預測來產生PU之預測性區塊。若視訊編碼器20使用框內預測產生PU之預測性區塊,則視訊編碼器20可基於與PU相關聯之圖像的經解碼樣本產生PU之預測性區塊。若視訊編碼器20使用框間預測以產生PU之預測性區塊,則視訊編碼器20可基於不同於與PU相關聯之圖像的一或多個圖像之經解碼樣本,產生PU之預測性區塊。 在視訊編碼器20產生CU之一或多個PU的預測性明度區塊、預測性Cb區塊及預測性Cr區塊之後,視訊編碼器20可產生CU之明度殘餘區塊。CU之明度殘餘區塊中之每一樣本指示CU之預測性明度區塊中之一者中的明度樣本與CU之原始明度寫碼區塊中的對應樣本之間的差。另外,視訊編碼器20可產生CU之Cb殘餘區塊。CU之Cb殘餘區塊中的每一樣本可指示CU之預測性Cb區塊中之一者中的Cb樣本與CU之原始Cb寫碼區塊中之對應樣本之間的差。視訊編碼器20亦可產生CU之Cr殘餘區塊。CU之Cr殘餘區塊中之每一樣本可指示CU之預測性Cr區塊中之一者中的Cr樣本與CU之原始Cr寫碼區塊中之對應樣本之間的差。 此外,視訊編碼器20可使用四分樹分割以將CU之明度殘餘區塊、Cb殘餘區塊及Cr殘餘區塊分解為一或多個明度變換區塊、Cb變換區塊及Cr變換區塊。變換區塊為經應用相同變換的樣本之矩形(例如,正方形或非正方形)區塊。CU之變換單元(TU)可包含明度樣本之變換區塊、色度樣本之兩個對應變換區塊及用於對變換區塊樣本進行變換之語法結構。因此,CU之每一TU可與明度變換區塊、Cb變換區塊及Cr變換區塊相關聯。與TU相關聯之明度變換區塊可為CU之明度殘餘區塊之子區塊。Cb變換區塊可為CU之Cb殘餘區塊之子區塊。Cr變換區塊可為CU之Cr殘餘區塊的子區塊。在單色圖像或具有三個單獨色彩平面之圖像中,TU可包含單一變換區塊及用於變換該變換區塊之樣本的語法結構。 視訊編碼器20可將一或多個變換應用於TU之明度變換區塊,以產生TU之明度係數區塊。係數區塊可為變換係數之二維陣列。變換係數可為純量。視訊編碼器20可將一或多個變換應用於TU之Cb變換區塊以產生TU之Cb係數區塊。視訊編碼器20可將一或多個變換應用於TU之Cr變換區塊以產生TU之Cr係數區塊。 具有CTU、CU、PU及TU之上述區塊結構通常描述在HEVC中使用之區塊結構。然而,其他視訊寫碼標準可使用不同區塊結構。作為一個實例,儘管HEVC允許PU及TU具有不同大小或形狀,但其他視訊寫碼標準可需要預測性區塊及變換區塊以具有相同大小。本發明之技術不限於HEVC之區塊結構且可與其他區塊結構相容。 在產生係數區塊(例如,明度係數區塊、Cb係數區塊或Cr係數區塊)之後,視訊編碼器20可量化係數區塊。量化通常指變換係數經量化以可能減少用以表示變換係數的資料之量從而提供進一步壓縮之處理程序。在視訊編碼器20量化係數區塊之後,視訊編碼器20可對指示經量化變換係數之語法元素進行熵編碼。舉例而言,視訊編碼器20可對指示經量化變換係數之語法元素執行上下文適應性二進位算術寫碼(CABAC)。 視訊編碼器20可輸出包括形成經寫碼圖像及相關聯資料之表示的位元序列之位元串流。位元串流可包含網路抽象層(NAL)單元之序列。NAL單元為含有NAL單元中的資料之類型之指示及含有彼資料的呈按需要穿插有模擬阻止位元之原始位元組序列有效負載(RBSP)之形式的位元組之語法結構。NAL單元中之每一者包括NAL單元標頭,且囊封RBSP。NAL單元標頭可包括指示NAL單元類型碼之語法元素。藉由NAL單元之NAL單元標頭指定的NAL單元類型碼指示NAL單元之類型。RBSP可為含有囊封在NAL單元內之整數數目個位元組的語法結構。在一些情況下,RBSP包括零個位元。 不同類型之NAL單元可囊封不同類型之RBSP。舉例而言,第一類型之NAL單元可囊封用於PPS之RBSP,第二類型之NAL單元可囊封用於經寫碼截塊之RBSP,第三類型之NAL單元可囊封用於SEI訊息之RBSP等。囊封用於視訊寫碼資料之RBSP (與用於參數集及SEI訊息之RBSP相對)的NAL單元可被稱作VCL NAL單元。 視訊解碼器30可接收由視訊編碼器20產生之位元串流。此外,視訊解碼器30可剖析位元串流以自該位元串流獲得語法元素。視訊解碼器30可至少部分基於自位元串流獲得之語法元素而重構視訊資料之圖像。重構視訊資料之處理程序可大體上與由視訊編碼器20執行之處理程序互逆。另外,視訊解碼器30可逆量化與當前CU之TU相關聯之係數區塊。視訊解碼器30可對係數區塊執行逆變換以重構與當前CU之TU相關聯的變換區塊。藉由將當前CU之PU的預測性區塊之樣本添加至當前CU之TU的變換區塊之對應樣本,視訊解碼器30可重構當前CU之寫碼區塊。藉由重構圖像之每一CU的寫碼區塊,視訊解碼器30可重構圖像。 現將論述HEVC及JEM技術之態樣。圖2展示HEVC解碼器之實例方塊圖。圖2中展示之視訊解碼器可對應於上文所描述之視訊解碼器30,且其將在下文更詳細地描述。HEVC採用包括解區塊濾波器(DBF)及SAO之兩個迴路內濾波器。在IEEE電路系統視訊技術彙刊,22(12):1755頁至1764頁(2012年),C. Fu, E. Alshina, A. Alshin, Y. Huang, C. Chen, Chia. Tsai, C. Hsu, S. Lei, J. Park, W. Han之「Sample adaptive offset in the HEVC standard」中描述關於HEVC解碼及SAO之額外細節。 如所說明,至DBF之輸入可為在框內或框間預測之後的經重構影像,如以來自重構區塊之輸出所展示。DBF執行在經寫碼區塊邊界處之偽影的偵測且藉由應用所選擇濾波器將其衰減。與H.264/AVC解區塊濾波器相比,HEVC解區塊濾波器具有較低計算複雜度及較好並行處理能力同時仍達成視覺假影之顯著減少。對於額外實例,參看IEEE電路系統視訊技術彙刊,22(12):1746頁至1754頁(2012年),A. Norkin, G. Bjontegaard, A. Fuldseth, M. Narroschke, M. Ikeda, K. Andersson, Minhua Zhou, G. Van der Auwera之「HEVC Deblocking Filter」。 至SAO之輸入可為在調用解區塊濾波之後的經重構影像,如以來自解區塊濾波器之輸出所展示。SAO之概念為藉由首先運用所選擇分類器將區樣本分類成多個類別,獲得用於每一類別之偏移,且接著添加偏移至類別之每一樣本而減小區之平均樣本失真,其中分類器索引及區之偏移係在位元串流中寫碼。在HEVC中,區(用於SAO參數發信之單元)經定義為CTU。 在HEVC中採用可滿足低複雜度要求之兩種SAO類型。彼等兩種類型為如上文介紹之EO及BO。寫碼SAO類型之索引(其在[0,2]範圍內)。在發信SAO類型之上下文中,不執行SAO或跳過SAO可視為第三類型之SAO。對於EO,樣本分類係基於在當前樣本與相鄰樣本之間根據以下1-D方向圖案的比較:水平、垂直、135°對角線及45°對角線。 圖3A至圖3D展示EO樣本分類之四個1-D方向圖案:水平(圖3A,EO種類=0),垂直(圖3B,EO種類=1),135°對角線(圖3C,EO種類=2),及45°對角線(圖3D,EO種類=3)。在IEEE電路系統視訊技術彙刊,22(12):1755頁至1764頁(2012年),C. Fu, E. Alshina, A. Alshin, Y. Huang, C. Chen, Chia. Tsai, C. Hsu, S. Lei, J. Park, W. Han之「Sample adaptive offset in the HEVC standard」中描述與SAO相關之額外細節。 根據所選擇EO圖案,藉由表I中之edgeIdx表示的五個類別經進一步定義。對於等於0~3之edgeIdx,偏移之量值可經發信而正負號旗標經隱式地寫碼,亦即,對於等於0或1之edgeIdx,負偏移,且對於等於2或3之edgeIdx,正偏移。對於等於4之edgeIdx,偏移始終經設定成0,此意謂對於此狀況不需要操作。 I用於 EO 分類 對於BO,樣本分類係基於樣本值。每一色彩分量可具有用於BO類型SAO濾波之分類之其自身SAO參數。BO意味一個偏移被添加至同一頻帶之所有樣本。樣本值範圍經相等地分成32個頻帶。對於範圍介於0至255之8位元樣本,頻帶之寬度為8,且自8k至8k+7之樣本值屬於頻帶k,其中k在0至31範圍內。頻帶中之原始樣本與經重構樣本之間的平均差(亦即,頻帶之偏移)經發信至解碼器(例如,視訊解碼器30)。不存在對於偏移正負號之約束。四個連續頻帶與開始頻帶位置之偏移僅被發信至解碼器(例如,視訊解碼器30)。 對於旁側資訊之發信,為減小旁側資訊,多個CTU可合併在一起(複本來自上方CTU(經由設定sao_merge_up_flag等於1)或左CTU(經由設定sao_merge_left_flag等於1)之參數)以共用SAO參數。語法表 寫碼樹型 單元語法 樣本適應性偏移語法 語義 sao _ merge _ left _ flag 等於1指定語法元素sao_type_idx_luma、sao_type_idx_chroma、sao_band_position、sao_eo_class_luma、sao_eo_class_chroma、sao_offset_abs及sao_offset_sign係自左寫碼樹型區塊之對應語法元素導出。sao_merge_left_flag等於0指定此等語法元素非自左寫碼樹型區塊之對應語法元素導出。當sao_merge_left_flag不存在時,推斷其為等於0。sao _ merge _ up _ flag 等於1指定語法元素sao_type_idx_luma、sao_type_idx_chroma、sao_band_position、sao_eo_class_luma、sao_eo_class_chroma、sao_offset_abs及sao_offset_sign係自上方寫碼樹型區塊之對應語法元素導出。sao_merge_up_flag等於0指定此等語法元素非自上方寫碼樹型區塊之對應語法元素導出。當sao_merge_up_flag不存在時,推斷其為等於0。sao _ type _ idx _ luma 指定用於明度分量之偏移類型。陣列SaoTypeIdx[cIdx][rx][ry]指定如表7至表8中針對在位置(rx,ry)處之寫碼樹型區塊對於顏色分量cIdx所指定的偏移類型。SaoTypeIdx[0][rx][ry]之值經導出如下: – 若sao_type_idx_luma存在,則SaoTypeIdx[0][rx][ry]經設定等於sao_type_idx_luma。 – 否則(sao_type_idx_luma不存在),SaoTypeIdx[0][rx][ry]經導出如下: – 若sao_merge_left_flag等於1,則SaoTypeIdx[0][rx][ry]經設定為等於SaoTypeIdx[0][rx-1][ry]。 – 否則,若sao_merge_up_flag等於1,則SaoTypeIdx[0][rx][ry]經設定為等於SaoTypeIdx[0][rx][ry−1]。 否則,SaoTypeIdx[0][rx][ry]設定為等於0。sao _ type _ idx _ chroma 指定用於色度分量之偏移類型。SaoTypeIdx[cIdx][rx][ry]之值對於cIdx等於1..2經導出如下: – 若sao_type_idx_chroma存在,則SaoTypeIdx[cIdx][rx][ry]經設定等於sao_type_idx_chroma。 – 否則(sao_type_idx_chroma不存在),SaoTypeIdx[cIdx][rx][ry]經導出如下: – 若sao_merge_left_flag等於1,則SaoTypeIdx[cIdx][rx][ry]經設定為等於SaoTypeIdx[cIdx][rx-1][ry]。 – 否則,若sao_merge_up_flag等於1,則SaoTypeIdx[cIdx][rx][ry]經設定為等於SaoTypeIdx[cIdx][rx][ry−1]。 – 否則,SaoTypeIdx[cIdx][rx][ry]設定為等於0。 7 至表 8 -SAO 類型之說明 sao _ offset _ abs [cIdx][rx][ry][i]指定對於顏色分量cIdx之針對位置(rx,ry)處之寫碼樹型區塊的第i類別之偏移值。 當sao_offset_abs[cIdx][rx][ry][i]不存在時,其推斷如下: – 若sao_merge_left_flag等於1,則sao_offset_abs[cIdx][rx][ry][i]推斷為等於sao_offset_abs[cIdx][rx−1][ry][i]。 – 否則,若sao_merge_up_flag等於1,則sao_offset_abs[cIdx][rx][ry][i]推斷為等於sao_offset_abs[cIdx][rx][ry−1][i]。 否則,sao_offset_abs[cIdx][rx][ry][i]推斷為等於0。sao _ offset _ sign [cIdx][rx][ry][i]指定對於顏色分量cIdx之針對在位置(rx,ry)處之寫碼樹型區塊的第i類別之偏移值的正負號。 當sao_offset_sign[cIdx][rx][ry][i]不存在時,其推斷如下: – 若sao_merge_left_flag等於1,則sao_offset_sign[cIdx][rx][ry][i]推斷為等於sao_offset_sign[cIdx][rx−1][ry][i]。 – 否則,若sao_merge_up_flag等於1,則sao_offset_sign[cIdx][rx][ry][i]推斷為等於sao_offset_sign[cIdx][rx][ry−1][i]。 – 否則,若SaoTypeIdx[cIdx][rx][ry]等於2,則以下應用: – 若i等於0或1,則sao_offset_sign[cIdx][rx][ry][i]推斷為等於0。 – 否則(i等於2或3),sao_offset_sign[cIdx][rx][ry][i]推斷為等於1。 – 否則,sao_offset_sign[cIdx][rx][ry][i]推斷為等於0。 如下導出變數log2OffsetScale: – 若cIdx等於0,則將log2OffsetScale設定為等於log2_sao_offset_scale_luma。 – 否則(cIdx等於1或2),將log2OffsetScale設定為等於log2_sao_offset_scale_chroma。 對於範圍介於0至4(包括端點)之i的清單SaoOffsetVal[cIdx][rx][ry][i]經導出如下: SaoOffsetVal[ cIdx ][ rx ][ ry ][ 0 ] = 0 for( i = 0; i < 4; i++ ) SaoOffsetVal[ cIdx ][ rx ][ ry ][ i + 1 ] = ( 1 − 2 * sao_offset_sign[ cIdx ][ rx ][ ry ][ i ] ) * (7-72) sao_offset_abs[ cIdx ][ rx ][ ry ][ i ] << log2OffsetScalesao _ band _ position [cIdx][rx][ry]指定在SaoTypeIdx[cIdx][rx][ry]等於1時樣本範圍之頻帶偏移的位移。 當sao_band_position[cIdx][rx][ry]不存在時,其推斷如下: – 若sao_merge_left_flag等於1,則sao_band_position[cIdx][rx][ry]推斷為等於sao_band_position[cIdx][rx−1][ry]。 – 否則,若sao_merge_up_flag等於1,則sao_band_position[cIdx][rx][ry]推斷為等於sao_band_position[cIdx][rx][ry−1]。 否則,sao_band_position[cIdx][rx][ry]推斷為等於0。sao _ eo _ class _luma 指定用於明度分量之邊緣偏移種類。陣列SaoEoClass[cIdx][rx][ry]指定如表7至表9中對於顏色分量cIdx之針對在位置(rx,ry)處寫碼樹型區塊所指定的偏移類型。SaoEoClass[0][rx][ry]之值經導出如下: – 若sao_eo_class_luma存在,則SaoEoClass[0][rx][ry]經設定等於sao_eo_class_luma。 – 否則(sao_eo_class_luma不存在),SaoEoClass[0][rx][ry]經導出如下: – 若sao_merge_left_flag等於1,則SaoEoClass[0][rx][ry]經設定為等於SaoEoClass[0][rx-1][ry]。 – 另外,若sao_merge_up_flag等於1,則SaoEoClass[0][rx][ry]經設定為等於SaoEoClass[0][rx][ry−1]。 – 否則,SaoEoClass[0][rx][ry]設定為等於0。sao _ eo _ class _ chroma 指定用於色度分量之邊緣偏移種類。SaoEoClass[cIdx][rx][ry]之值對於cIdx等於1..2經導出如下: – 若sao_eo_class_chroma存在,則SaoEoClass[cIdx][rx][ry]經設定等於sao_eo_class_chroma。 – 否則(sao_eo_class_chroma不存在),SaoEoClass[cIdx][rx][ry]經導出如下: – 若sao_merge_left_flag等於1,則SaoEoClass[cIdx][rx][ry]經設定為等於SaoEoClass[cIdx][rx-1][ry]。 – 否則,若sao_merge_up_flag等於1,則SaoEoClass[cIdx][rx][ry]經設定為等於SaoEoClass[cIdx][rx][ry−1]。 否則,SaoEoClass[cIdx][rx][ry]設定為等於0。 7 至表 9 - SAO 邊緣偏移種類之說明 視訊編碼器20及視訊解碼器30可經組態以實施各種JEM濾波器濾波技術。現將描述彼等JEM濾波技術之態樣。除了經修改DB及HEVC SAO方法之外,JEM已包括另一濾波方法,稱為基於幾何變換之適應性迴路濾波(GALF)。GALF旨在藉由引入若干新態樣而改良HEVC級中研究的ALF之寫碼效率。ALF旨在藉由使用基於維納之適應性濾波器而最小化原始樣本與經解碼樣本之間的均方誤差。圖像中之樣本經分類為多個類別且每一類別中之樣本接著運用其相關聯適應性濾波器來濾波。濾波器係數可經發信或繼承以最佳化均方誤差與額外負擔之間的折中。基於幾何變換之ALF(GALF)方案經提議以進一步改良ALF之效能,其取決於在ALF之前經重構樣本之梯度的定向而引入待應用於濾波器支援區中之樣本的幾何變換(諸如旋轉、對角線及垂直翻轉)。 至ALF/GALF之輸入可為在調用SAO之後的經重構影像(例如,圖2中之樣本適應性偏移的輸出)。如2016年2月20日至2月26日美國聖地亞哥第二次會議:ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG 11之探索小組(JVET),文檔JVET-B0060,M. Karczewicz, L. Zhang, W.-J. Chien, X. Li之「EE2.5: Improvements on adaptive loop filter」及2016年5月26日至6月1日CH日內瓦第三次會議:ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG 11之探索小組(JVET),文檔JVET-C0038,M. Karczewicz, L. Zhang, W.-J. Chien, X. Li之「EE2.5: Improvements on adaptive loop filter」中所描述,基於幾何變換之ALF(GALF)經提議且已採用JEM之最新版本,亦即JEM3.0。在GALF中,運用所考慮的對角線梯度修改分類且幾何變換可應用於濾波器係數。每一2×2區塊基於其方向性及活動之經量化值而分類成25個種類中之一者。以下子章節中描述細節。 視訊編碼器20及視訊解碼器30可經組態以自固定濾波器預測濾波器。另外,為在時間預測不可用(框內)時改良寫碼效率,將16個固定濾波器之集合指派給每一種類。為指示固定濾波器之使用,用於每一種類之旗標經發信且必要時,發信所選擇固定濾波器之索引。即使當固定濾波器經選擇用於給定種類時,適應性濾波器之係數f ( k , l ) 仍可經發送用於此種類,在此狀況下將應用於經重構影像的濾波器之係數為係數之兩個集合的總和。種類之數目可共用在位元串流中發信之相同係數f ( k , l ) ,即使不同固定濾波器經選擇用於其。如2016年2月15日申請之美國臨時專利申請案62/295,461及2016年4月19日申請之美國臨時專利申請案62/324,776中所解釋,固定濾波器亦可應用於經框間寫碼圖框。 視訊編碼器20及視訊解碼器30可經組態以執行濾波器係數之時間預測。現將描述濾波器係數之時間預測的態樣。儲存參考圖像之ALF係數,且允許其重新用作當前圖像之ALF係數。當前圖像可選擇使用經儲存用於參考圖像之ALF係數,且略過ALF係數發信。在此狀況下,僅僅發信至參考圖像中之一者的索引,且針對當前圖像僅繼承所指示參考圖像之所儲存ALF係數。為指示時間預測之使用,在發送索引之前首先寫碼一個旗標。 HEVC/JEM之設計可具有若干潛在問題。作為潛在問題之一個實例,SAO僅僅採用1-D方向資訊用於分類,其可限制寫碼效能。作為潛在問題之另一實例,HEVC中之SAO的EO利用包括圖案及類別之兩個層級發信。在HEVC中之SAO中,對於圖案內之每一類別,僅僅一個偏移可在不考慮相鄰樣本與當前樣本之間的差多遠之情況下被添加至樣本。作為潛在問題之另一實例,觀察到SAO參數對於未在左/上方向中定位的兩個區塊可係類似的。因此,允許來自不同區塊之參數之撓性合併可帶來額外寫碼增益。作為潛在問題之另一實例,若干迴路內濾波方法需要若干次處理經重構影像,若干次可增加頻寬及計算複雜度。 為潛在解決上文介紹之問題,本發明描述用於新濾波方法(在本發明中稱為峰值SAO)之技術,其中所選擇相鄰樣本與當前樣本的差值之量(而非僅存在差)可用以導出多於一個偏移。另外,可利用更多相鄰樣本,且可介紹用於分類之更複雜準則。用於在本發明中描述之峰值SAO之技術可作為額外SAO類型(例如,除EO及BO外)實施至SAO濾波器中或可為現有SAO類型(諸如EO)之替換。所提議技術亦可適用於現有SAO技術。視訊編碼器20及視訊解碼器30可個別地或除非另有陳述否則以任何組合應用以下描述技術。 視訊編碼器20及視訊解碼器30可經組態以執行峰值SAO濾波。現將描述峰值SAO之結構的態樣。根據一個實例,峰值SAO資訊之三個類別可使用(例如)三個語法元素或顯式發信與不需要顯式發信之導出技術的組合自視訊編碼器20發信至視訊解碼器30。峰值SAO資訊之第一類別為類型資訊。類型可用於分類,且每一類型可具有一或多個相關聯群組(峰值SAO資訊之第二類別)。另外,對於類型內之每一群組,可定義一或多個種類(峰值SAO資訊之第三類別)。 類型定義選擇相鄰樣本及/或分開或聯合發信的規則。舉例而言,類型可定義相鄰樣本之多少及用於選擇濾波器參數(例如,偏移值)的相鄰樣本之模板。作為實例,第一類型可指定待用於判定濾波器參數之四個相鄰樣本;第二類型可指定待用於判定濾波器參數之四個不同相鄰樣本;且第三類型可指定待用於判定濾波器參數之八個相鄰樣本。群組定義應被濾波的樣本之規則,及/或定義選擇模板中之相鄰樣本的規則。在一些實例中,若樣本並未經分類為任一群組,則不濾波樣本。種類指示哪一偏移應用以修改樣本。舉例而言,當前樣本與所選擇相鄰樣本之間的樣本差值可經評估並用以導出種類索引。不同種類可具有其自身偏移值。 現將更詳細地描述類型定義之態樣。類型告知相鄰樣本中之哪些待用於濾波器參數之選擇。根據一個實例,包括空間及/或時間相鄰者之更多相鄰樣本可用以決定類型及/或群組及/或種類,而非如同HEVC SAO中始終根據1-D方向使用2個空間相鄰樣本。相鄰樣本之定義亦可適用於HEVC中之SAO。N表示用於類型判定之相鄰樣本之數目。N為正值且可(例如)大於2。 在另一實例中,相鄰樣本可由藉由相鄰樣本之若干環繞樣本導出的值(諸如環繞樣本之加權平均值)表示。 在另一實例中,相鄰樣本可使用模板匹配處理程序自給定圖像區(搜尋窗)選擇。為識別此等樣本,對於給定圖像區中之每一像素或像素之所選集合,將其環繞樣本與當前像素之環繞樣本相比較,且具有與當前樣本相比類似(較小差)環繞樣本的彼等像素經選為相鄰樣本。舉例而言,在圖4中,將s0 及sx 之相鄰樣本與當前像素X相比較,如基於SAD值,具有最小SAD值(例如,s0 )之N(例如,4或8)個樣本接著被識別並用作相鄰樣本。 根據本發明之技術,為判定第一樣本及第二樣本之偏移,視訊編碼器20及視訊解碼器30可比較當前區塊之第一樣本與相鄰樣本之第一集合且比較當前區塊之第二樣本與相鄰樣本之的第二集合,其中相鄰樣本之第一集合相對於第一樣本具有與相鄰樣本之第二集合相對於第二樣本具有之圖案相同的圖案。參看圖4,像素C1、C3、C4及C6相對於像素X具有與像素DX1、DX3、DX4及DX6相對於像素SX具有之圖案相同的圖案。作為另一實例,像素C2及C5相對於像素X具有與像素DX2至DX5相對於像素SX具有之圖案相同的圖案。作為另一實例,像素C1至C8相對於像素X具有與像素DX1至DX8相對於像素SX具有之圖案相同的圖案。 在一個實例中,N可設定成4或8。在另一實例中,不同類型判定可利用不同數目個相鄰樣本。在另一實例中,甚至在一種類型內,不同群組可使用不同相鄰樣本,例如,N可係不同的。在另一實例中,甚至在一個群組內,不同種類可使用不同相鄰樣本,例如,N 可為不同的。 被利用的哪些相鄰樣本之相對位置可經預定義及固定用於每一類型。舉例而言,對於N等於4,相對位置為:左、上、右及下,如圖5中所示(由Ci 表示,其中i為0..3),而對於N等於8,利用空間環繞樣本。在其他實例中,用於類型之相鄰樣本的位置可在截塊內係適應性的,例如,其可取決於框內預測模式/變換矩陣/截塊類型。在其他實例中,可在序列參數集/圖像參數集/截塊標頭/調適參數集中發信相對位置之指示。 圖5展示相鄰樣本Ci 及當前樣本C之實例。在另一實例中,用以判定類型、群組及/或種類之哪些相鄰樣本的相對位置不限於如圖5中所示之實例。相對位置可為任一預定義空間及/或時間相鄰樣本。 視訊編碼器20可將多少相鄰樣本用於濾波之指示發信至視訊解碼器30。在另一實例中,可發信多少相鄰樣本用於濾波的最大數目之指示。另外,在另一實例中,可進一步發信類型內多少群組之指示。在另一實例中,可發信類型索引,該類型索引可意味數目(及/或相鄰樣本之位置)以及由K表示的類型內之群組數目兩者。在此狀況下,不需要獨立地發信群組數目。在一個實例中,類型索引、N及K之間的關係下文在表II中給出。 II 現將描述群組定義之態樣。舉例而言,由Clgr (N)表示具有比當前樣本大的值之相鄰樣本(或代表性相鄰樣本)之數目,由Csml (N)表示具有比當前樣本小的值之相鄰樣本之數目。用於群組定義之準則可依賴於Clgr (N)及/或Csml (N)之值。 在另一實例中,其可依賴於函數f (Clgr (N),Csml (N)),例如,f 定義為最大值函數。當Clgr (N)大於Csml (N)時,其稱為「大趨勢」。當Clgr (N)小於Csml (N)時,其稱為「小趨勢」。對於定位於不同位置處之兩個樣本,若一者屬於大趨勢且另一者屬於小趨勢,但函數之返回值相同(實例係在圖6A及圖6B中展示且在下文描述),則以下可應用。在一個實例中,兩個樣本可分類成在同一群組內。另外,在此狀況下,若種類索引相同,則對稱濾波處理程序應用於兩個趨勢,其中偏移係相同的,同時對於大趨勢,經修改樣本值經設定成初始值加上偏移,且對於小趨勢,經修改樣本值經設定成初始值減去偏移。在另一實例中,兩個樣本可分類為兩個群組/種類且每一群組/種類可具有不同偏移。在此狀況下,濾波處理程序係不對稱的。 圖6A及圖6B展示具有8個所選相鄰樣本之兩個樣本的實例。圖6A展示「大趨勢」之實例,其中當前樣本值等於50且Clgr (N)=6。圖6B展示「小趨勢」之實例,其中當前樣本值等於93且Csml (N)=6。 在一個實例中,取決於群組之總數K ,可預定義若干臨限值(按遞升次序,T0 、T1 、…TK )。在其他實例中,臨限值可經發信或在運作中導出。群組索引可藉由比較Clgr (N)、Csml (N)之值與臨限值而導出。 滿足以下條件中之一者的樣本,其將被分類成第i群組:f (–)大於Tif (–)不大於Ti + 1 相反地,若f (–)小於或等於T0 ,則不分類樣本,亦即,無濾波操作將應用於此樣本。 在一個實例中,臨限值如下文在表III中展示而定義。 III 另外,在一個實例中,群組判定可取決於對於不同N之(小/大)趨勢。在一個實例中,對於兩個不同N,若趨勢不同,則可利用不同臨限值。在另一實例中,其可進一步取決於f(–)。如下文在表IV中所示給出類型等於4之實例。 IV 在另一實例中,對於等於4之類型,可存在6個群組且每一群組之定義可如下文在表V中所示而定義。 V 在另一實例中,多少相鄰樣本等於當前樣本之資訊可考慮用於群組判定。另外,在另一實例中,群組判定可取決於CBF(經寫碼區塊旗標,用以指示所有零係數)/寫碼之模式(框內/框間)/變換矩陣/預測方向(單向預測或雙向預測)/預測區塊/當前截塊之時間位準。 在一個實例中,當N 之多個值經允許用於某一類型(如上文關於表III及表IV所描述,其中N對於類型4可為4或8)時,一或多個索引可經發信以告知哪一N 應用於該類型內之群組。 視訊編碼器20及視訊解碼器30可將種類索引與偏移值相關聯。現將論述用於種類索引判定之準則。種類索引之判定可取決於所選擇相鄰樣本與當前樣本之間的差之平均值。在一個實例中,所選擇相鄰樣本之數目可不大於用於類型定義的相鄰樣本之總數,例如,上文所提及之N。在一個實例中,所選擇相鄰樣本應在其為「大(或小)趨勢」時比當前樣本更大(或更小)。表示所選擇樣本為Cs0 、Cs1 、…、CsM - 1 ,種類索引經導出為M 為非零正數。另外,在另一實例中,具有所有所選擇樣本之間的最大及最小差值之樣本經進一步移除,亦即,在判定種類索引時不考慮。在另一實例中,所選擇樣本之數目應等於(pow(2,x)),使得除法操作可由移位替換。在另一實例中,可選擇僅僅一個樣本。 在另一實例中,種類索引可取決於所選擇相鄰樣本與當前樣本之間的值差之總和。另外,在另一實例中,種類索引可取決於正規化因數。在一個實例中,種類索引經導出為:其中NF表示正規化因數。在另一實例中,正規化因數可等於(pow(2,x)),且因此種類索引可經導出為:在一個實例中,正規化因數可取決於類型索引/群組索引/N 。可針對每一群組發信正規化因數。在其他實例中,所有群組可共用同一正規化因數,其中旗標可經發信以指示正規化因數是否共用。 所允許種類之最大數目可經發信。在一個實例中,此數目藉由所有類型/群組共用。在一個實例中,此數目可經發信或在運作中意味導出。另外,在另一實例中,當經導出種類索引超過所允許種類之最大數目時,此等樣本經合併在一起。在一個實例中,種類索引經導出為:其中IdxOffset 可等於0或1。 視訊編碼器20可發信偏移值至視訊解碼器30。現將論述峰值SAO中之偏移值的發信。對於大趨勢及小趨勢,對應正及負偏移可共用同一量值。在其他實例中,不同偏移值可經發信。偏移可運用略過寫碼來寫碼。在其他實例中,偏移可運用上下文模型來寫碼。一元/截短一元/固定長度二值化方法可用於寫碼偏移之量值。視訊編碼器20及視訊解碼器30可藉由寫碼一個偏移與相同群組中之其先前寫碼值(與相鄰種類索引相關聯)之間的差來利用預測性寫碼。另外,一個旗標指示是否啟用此方法。預測性寫碼可藉由寫碼一個偏移與不同群組中之其先前寫碼值(與所選擇種類索引相關聯)之間的差而利用。在一個實例中,偏移可自在先前寫碼截塊中使用之偏移值繼承或預測。在一個實例中,可儲存偏移值之若干集合。可進一步發信集合之一個索引。在一個實例中,偏移可在不發信情況下在運作中導出。在一個實例中,可首先計算所選擇相鄰樣本之平均值。偏移可經設定為min(average,Thresh),其中變數Thresh可經預定義。對於高位元深度輸入,固定移位值可經預定義或在SPS/PPS/APS/截塊標頭中發信,藉由L 表示。在此狀況下,最終偏移經設定為等於(經發信/導出偏移<<L )。 現將論述視訊編碼器20及視訊解碼器30可如何應用峰值SAO之態樣。在一個實例中,所提議峰值SAO方法可僅僅應用於明度分量。另外,在其他實例中,一個旗標可經發信以指示峰值SAO係經啟用抑或經停用用於某一圖像/截塊/圖像塊中之明度分量。在另一實例中,所提議峰值SAO方法可應用於所有色彩分量。在一個實例中,該方法可經調用或停用用於全部三個色彩分量。另外,一個旗標可經發信以指示峰值SAO係經啟用抑或經停用用於某一圖像/截塊/圖像塊/區塊中之全部三個色彩分量。在另一實例中,每一色彩分量可具有啟用/停用峰值SAO之其自身控制。另外,用於每一分量之一個旗標可經發信以指示峰值SAO係經啟用抑或經停用用於某一圖像/截塊/圖像塊/區塊中之分量。在另一實例中,可使用用於明度及色度分量之單獨控制。另外,用於明度分量之一個旗標及用於兩個色度分量之一個旗標可經發信以指示峰值SAO經啟用抑或停用用於某一圖像/截塊/圖像塊/區塊中之分量。在以上情況中,啟用用於一個/多個色度分量之峰值SAO的指示之發信可依賴於用於明度分量之峰值SAO。在一個實例中,僅僅當峰值SAO應用於一個圖像/截塊/圖像塊/區塊之明度分量時,才可發信用於色度分量之指示。否則,峰值SAO將不應用於色度分量。 在一個實例中,對於某一色彩分量,視訊編碼器20可編碼,且視訊解碼器30可解碼開/關旗標,以指示峰值SAO是否經應用於每一寫碼區塊樹/寫碼單元/區。 現將描述視訊寫碼系統(諸如上文所描述之系統10)中之峰值SAO的使用。所描述技術可用作後處理,亦即,視訊寫碼系統之迴路外。在另一實例中,所提議方法可用作一個單獨迴路內濾波寫碼工具。在一個實例中,該方法可在所有其他濾波寫碼工具(諸如DBF、SAO、適應性迴路濾波器(ALF)之前被調用。在另一實例中,該方法可在濾波寫碼工具之間(諸如在DB之後及在SAO之前,或在SAO之後但在ALF之前)被調用。在另一實例中,該方法可在所有濾波寫碼工具之後(諸如在ALF之後)被調用。在另一實例中,峰值SAO可應用於一個區塊之預測區塊,例如,該預測區塊為經運動補償區塊或自框內預測導出。 在另一實例中,視訊編碼器20及視訊解碼器30可與其他迴路內濾波寫碼工具(包括SAO之HEVC版本或SAO之其他版本)聯合地實施本發明之峰值SAO技術。另外,在另一實例中,用於峰值SAO及聯合使用之迴路內濾波工具(例如,SAO)之輸入將相同。另外,在另一實例中,SAO之類型或EO之類型將被擴展以涵蓋峰值SAO之使用。 現將描述與SAO相關之技術。對於運用相對條件定義的兩個類別,兩個偏移之量值(例如,一正及一負)經強迫為相同。因此,可需要發信僅僅一個偏移而非兩個。在一個實例中,用於EO類別1之正偏移及用於EO類別4之負偏移被強迫為相同。在一個實例中,用於EO類別2之正偏移及用於EO類別3之負偏移被強迫為相同。 對於運用相對條件所定義之兩個類別,視訊編碼器20及視訊解碼器30可預測性地寫碼第二偏移之量值(正或負)。因此,可對於第二偏移寫碼僅僅兩個量值之差。在另一實例中,提議當前區塊之參數可自其他相鄰區塊(諸如左上方、右上方區塊)繼承,而非僅僅允許來自空間左或上方CTU之SAO參數的合併。另外,在另一實例中,一個區塊之參數可自並非為相鄰區塊之區塊複本。在另一實例中,一個區塊之參數可自定位於不同圖像中之區塊複本。 本文中所描述之技術可達成記憶體頻寬節省。當可應用多個迴路內濾波方法時,至少兩個迴路內濾波方法之輸入可係相同的。亦即,分類係基於用於兩個或多於兩個濾波方法之相同輸入。在一個實例中,在調用DBF之後經重構之影像可用作峰值SAO及SAO兩者之輸入。在一個實例中,在調用峰值SAO之後經重構之影像可用作SAO及ALF/GALF兩者之輸入。另外,在另一實例中,不同濾波方法之濾波處理程序仍可根據某一次序而執行。 圖7為說明可實施本發明中所描述之技術的實例視訊編碼器20之方塊圖。視訊編碼器20可執行視訊截塊內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減小或移除給定視訊圖框或圖像內之視訊中的空間冗餘。框間寫碼依賴於時間預測以減小或移除視訊序列之鄰近圖框或圖像內之視訊的時間冗餘。框內模式(I模式)可指代若干基於空間之壓縮模式中之任一者。框間模式(諸如單向預測(P模式)或雙向預測(B模式))可指若干基於時間之壓縮模式中的任一者。 在圖7之實例中,視訊編碼器20包括視訊資料記憶體33、分割單元35、預測處理單元41、求和器50、變換處理單元52、量化單元54、熵編碼單元56。預測處理單元41包括運動估計單元(MEU) 42、運動補償單元(MCU) 44及框內預測單元46。對於視訊區塊重構,視訊編碼器20亦包括逆量化單元58、逆變換處理單元60、求和器62、濾波器單元64及經解碼圖像緩衝器(DPB) 66。 如圖7中所展示,視訊編碼器20接收視訊資料並將所接收之視訊資料儲存於視訊資料記憶體33中。視訊資料記憶體33可儲存待由視訊編碼器20之組件編碼的視訊資料。可例如自視訊源18獲得儲存於視訊資料記憶體33中之視訊資料。DPB 66可為儲存參考視訊資料以用於由視訊編碼器20編碼視訊資料(例如在框內或框間寫碼模式中)的參考圖像記憶體。視訊資料記憶體33及DPB 66可由諸如動態隨機存取記憶體(DRAM)(包括同步DRAM (SDRAM))、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體器件的各種記憶體器件中之任一者形成。視訊資料記憶體33及DPB 66可由同一記憶體器件或單獨記憶體器件提供。在各種實例中,視訊資料記憶體33可與視訊編碼器20之其他組件一起在晶片上,或相對於彼等組件在晶片外。 分割單元35自視訊資料記憶體33擷取視訊資料且將視訊資料分割成視訊區塊。此分割亦可包括分割成截塊、圖像塊或其他較大單元,以及例如根據LCU及CU之四分樹結構的視訊區塊分割。視訊編碼器20通常說明編碼待編碼之視訊截塊內的視訊區塊之組件。截塊可劃分成多個視訊區塊(且可能劃分成被稱作圖像塊之視訊區塊集合)。預測處理單元41可基於錯誤結果(例如,寫碼速率及失真程度)選擇複數個可能寫碼模式中之一者(諸如複數個框內寫碼模式中之一者或複數個框間寫碼模式中之一者)用於當前視訊區塊。預測處理單元41可將所得經框內或框間寫碼區塊提供至求和器50以產生殘餘區塊資料並提供至求和器62以重構經編碼區塊以用於用作參考圖像。 預測處理單元41內之框內預測單元46可執行當前視訊區塊相對於與待寫碼之當前區塊在同一圖框或截塊中的一或多個相鄰區塊之框內預測性寫碼,以提供空間壓縮。預測處理單元41內之運動估計單元42及運動補償單元44執行當前視訊區塊相對於一或多個參考圖像中之一或多個預測性區塊之框間預測性寫碼,以提供時間壓縮。 運動估計單元42可經組態以根據視訊序列之預定圖案來判定用於視訊截塊之框間預測模式。預定圖案可將序列中之視訊截塊指定為P截塊或B截塊。運動估計單元42及運動補償單元44可高度整合,但出於概念目的而單獨說明。由運動估計單元42執行之運動估計為產生運動向量之程序,該等運動向量估計視訊區塊之運動。舉例而言,運動向量可指示將當前視訊圖框或圖像內之視訊區塊的PU相對於參考圖像內之預測性區塊的移位。 預測性區塊為就像素差而言被發現緊密地匹配待寫碼的視訊區塊之PU之區塊,該像素差可由絕對差和(SAD)、平方差和(SSD)或其他差度量判定。在一些實例中,視訊編碼器20可計算儲存於DPB 66中之參考圖像的子整數像素位置之值。舉例而言,視訊編碼器20可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分數像素位置之值。因此,運動估計單元42可執行關於全像素位置及分數像素位置之運動搜尋且輸出具有分數像素精度之運動向量。 運動估計單元42藉由將PU之位置與參考圖像之預測性區塊的位置比較而計算經框間寫碼截塊中之視訊區塊之PU的運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),該等參考圖像清單中之每一者識別儲存在DPB 66中之一或多個參考圖像。運動估計單元42將所計算運動向量發送至熵編碼單元56及運動補償單元44。 由運動補償單元44執行之運動補償可涉及基於藉由運動估計判定之運動向量提取或產生預測性區塊,可能執行內插達子像素精度。在接收到當前視訊區塊之PU的運動向量之後,運動補償單元44可在參考圖像清單中之一者中定位運動向量所指向之預測性區塊。視訊編碼器20藉由自正經寫碼之當前視訊區塊的像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值。像素差值形成用於區塊之殘餘資料,且可包括明度及色度差分量兩者。求和器50表示執行此減法運算之一或多個組件。運動補償單元44亦可產生與視訊區塊及視訊截塊相關聯之語法元素以供視訊解碼器30在解碼視訊截塊之視訊區塊時使用。 在預測處理單元41經由框內預測或框間預測產生當前視訊區塊之預測性區塊之後,視訊編碼器20藉由自當前視訊區塊減去預測性區塊而形成殘餘視訊區塊。殘餘區塊中之殘餘視訊資料可包括於一或多個TU中且被應用於變換處理單元52。變換處理單元52使用諸如離散餘弦變換(DCT)或概念上類似變換之變換將殘餘視訊資料變換成殘餘變換係數。變換處理單元52可將殘餘視訊資料自像素域轉換至變換域(諸如頻域)。 變換處理單元52可將所得變換係數發送至量化單元54。量化單元54量化變換係數以進一步減少位元速率。該量化處理程序可減小與該等係數中之一些或所有相關聯的位元深度。可藉由調整量化參數來修改量化程度。在一些實例中,量化單元54可接著執行對包括經量化變換係數之矩陣的掃描。在另一實例中,熵編碼單元56可執行該掃描。 在量化之後,熵編碼單元56對經量化變換係數進行熵編碼。舉例而言,熵編碼單元56可執行上下文適應性可變長度寫碼(CAVLC)、上下文適應性二進位算術寫碼(CABAC)、基於語法之上下文適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法或技術。在由熵編碼單元56熵編碼之後,經編碼位元串流可被傳輸至視訊解碼器30,或經存檔以供視訊解碼器30稍後傳輸或擷取。熵編碼單元56亦可熵編碼正被寫碼之當前視訊截塊之運動向量及其他語法元素。 逆量化單元58及逆變換處理單元60分別應用逆量化及逆變換以重構像素域中之殘餘區塊以供稍後用作參考圖像之參考區塊。運動補償單元44可藉由將殘餘區塊添加至參考圖像清單中之一者內的參考圖像中之一者之預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於經重構殘餘區塊,以計算子整數像素值以用於運動估計中。求和器62將經重構殘餘區塊添加至藉由運動補償單元44產生之運動補償預測區塊以產生經重構區塊。 濾波器單元64對經重構區塊(例如,求和器62之輸出)進行濾波且將經濾波之經重構區塊儲存於DPB 66中以供用作參考區塊。參考區塊可由運動估計單元42及運動補償單元44用作為參考區塊以對後續視訊圖框或圖像中之區塊進行框間預測。濾波器單元64可執行任何類型之濾波,諸如解區塊濾波、SAO濾波、峰值SAO濾波、ALF及/或GALF,及/或其他類型之迴路濾波器。解區塊濾波器可(例如)將解區塊濾波應用於濾波器區塊邊界,以自經重構視訊移除區塊效應假影。峰值SAO濾波器可將偏移應用於經重構像素值,以便改良總體寫碼品質。亦可使用額外迴路濾波器(迴路內或迴路後)。 圖8為說明可實施本發明中所描述之技術之實例視訊解碼器30的方塊圖。圖8之視訊解碼器30可(例如)經組態以接收上文關於圖7之視訊編碼器20所描述的發信。在圖8之實例中,視訊解碼器30包括視訊資料記憶體78、熵解碼單元80、預測處理單元81、逆量化單元86、逆變換處理單元88、求和器90及DPB 94。預測處理單元81包括運動補償單元82及框內預測單元84。在一些實例中,視訊解碼器30可執行大體上互逆於關於自圖7之視訊編碼器20所描述的編碼編次之解碼編次。 在解碼處理程序期間,視訊解碼器30自視訊編碼器20接收表示經編碼視訊截塊之視訊區塊及相關聯語法元素的經編碼視訊位元串流。視訊解碼器30將所接收之經編碼視訊位元串流儲存於視訊資料記憶體78中。視訊資料記憶體78可儲存待由視訊解碼器30之組件解碼的視訊資料,諸如經編碼視訊位元串流。儲存於視訊資料記憶體78中之視訊資料可(例如)經由鏈路16自儲存器件26或自本機視訊源(諸如攝影機)或藉由存取實體資料儲存媒體獲得。視訊資料記憶體78可形成儲存來自經編碼視訊位元串流之經編碼視訊資料的經寫碼圖像緩衝器(CPB)。DPB 94可為儲存參考視訊資料以用於由視訊解碼器30解碼視訊資料(例如在框內或框間寫碼模式中)的參考圖像記憶體。視訊資料記憶體78及DPB 94可由各種記憶體器件中之任一者形成,該等記憶體器件諸如DRAM、SDRAM、MRAM、RRAM或其他類型之記憶體器件。視訊資料記憶體78及DPB 94可由同一記憶體器件或單獨記憶體器件提供。在各種實例中,視訊資料記憶體78可與視訊解碼器30之其他組件一起在晶片上,或相對於彼等組件在晶片外。 視訊解碼器30之熵解碼單元80熵解碼儲存於視訊資料記憶體78中之視訊資料以產生經量化係數、運動向量及其他語法元素。熵解碼單元80將運動向量及其他語法元素轉遞至預測處理單元81。視訊解碼器30可在視訊截塊層級及/或視訊區塊層級處接收語法元素。 當視訊截塊經寫碼為經框內寫碼(I)截塊時,預測處理單元81之框內預測單元84可基於來自當前圖框或圖像之先前經解碼區塊的經發信框內預測模式及資料來產生用於當前視訊截塊之視訊區塊的預測資料。當視訊圖框經寫碼為經框間寫碼截塊(例如,B截塊或P截塊)時,預測處理單元81之運動補償單元82基於自熵解碼單元80接收之運動向量及其他語法元素產生用於當前視訊截塊之視訊區塊的預測性區塊。可由參考圖像清單中之一者內的參考圖像中之一者產生預測性區塊。視訊解碼器30可基於儲存於DPB 94中之參考圖像使用預設建構技術來建構參考圖框清單,清單0及清單1。 運動補償單元82藉由剖析運動向量及其他語法元素來判定當前視訊截塊之視訊區塊的預測資訊,且使用該預測資訊產生正經解碼之當前視訊區塊的預測性區塊。舉例而言,運動補償單元82使用所接收語法元素中之一些來判定用以寫碼視訊截塊之視訊區塊的預測模式(例如,框內或框間預測)、框間預測截塊類型(例如,B截塊或P截塊)、截塊之參考圖像清單中之一或多者的建構資訊、截塊之每一經框間編碼視訊區塊的運動向量、截塊之每一經框間寫碼視訊區塊的框間預測狀態及用以解碼當前視訊截塊中之視訊區塊的其他資訊。 運動補償單元82亦可執行基於內插濾波器之內插。運動補償單元82可使用如由視訊編碼器20在編碼視訊區塊期間使用之內插濾波器來計算參考區塊之子整數像素的內插值。在此情況下,運動補償單元82可根據接收之語法元素判定由視訊編碼器20使用之內插濾波器且使用該等內插濾波器來產生預測性區塊。 逆量化單元86逆量化(或解量化)位元串流中所提供,並由熵解碼單元80解碼的經量化之變換係數。逆量化處理程序可包括使用由視訊編碼器20針對視訊截塊中之每一視訊區塊計算的量化參數,以判定量化程度及同樣地應被應用之逆量化程度。逆變換處理單元88將逆變換(例如,逆DCT、逆整數變換或概念上類似之逆變換處理程序)應用於變換係數,以便在像素域中產生殘餘區塊。 在預測處理單元使用(例如)框內或框間預測產生當前視訊區塊之預測性區塊後,視訊解碼器30藉由將來自逆變換處理單元88之殘差區塊與由運動補償單元82產生之對應預測性區塊求和而形成經重構之視訊區塊。求和器90表示執行此求和運算之該或該等組件。 濾波器單元92對經重構區塊(例如,求和器90之輸出)進行濾波且將經濾波之經重構區塊儲存於DPB 94中以供用作參考區塊。參考區塊可由運動補償單元82用作參考區塊以對後續視訊圖框或圖像中之區塊進行框間預測。濾波器單元92可執行任何類型之濾波,諸如解區塊濾波、SAO濾波、峰值SAO濾波、ALF及/或GALF,及/或其他類型之迴路濾波器。解區塊濾波器可(例如)將解區塊濾波應用於濾波器區塊邊界,以自經重構視訊移除區塊效應假影。峰值SAO濾波器可將偏移應用於經重構像素值,以便改良總體寫碼品質。亦可使用額外迴路濾波器(迴路內或迴路後)。 圖9展示濾波器單元92之實例實施。濾波器單元64可以相同方式實施。濾波器單元64及92可可結合視訊編碼器20或視訊解碼器30之其他組件執行本發明之技術。在圖9之實例中,濾波器單元92包括解區塊濾波器102、峰值SAO濾波器104及ALF/GLAF濾波器106。峰值SAO濾波器104可(例如)經組態成以本發明中描述之方式判定區塊之樣本的偏移值。 濾波器單元92可包括較少濾波器及/或可包括額外濾波器。另外,圖9中展示之特定濾波器可以不同次序實施。其他迴路濾波器(在寫碼迴路中或在寫碼迴路之後)亦可用於使像素轉變平滑,或以其他方式改良視訊品質。接著將給定圖框或圖像中之經解碼視訊區塊儲存於DPB 94中,該DPB儲存用於後續運動補償之參考圖像。DPB 94可為額外記憶體之部分或與額外記憶體分離,該額外記憶體儲存用於稍後呈現於顯示器件(諸如圖1之顯示器件32)上之經解碼視訊。 圖10為說明本發明中描述的實例視訊解碼技術之流程圖。將參考一般視訊解碼器(諸如但不限於視訊解碼器30)描述圖10之技術。在一些情況下,圖10之技術可由視訊編碼器20之解碼迴路執行。 在圖10之實例中,視訊解碼器比較當前區塊之第一樣本與相鄰樣本之第一集合以判定第一差值(120)。第一差值可為第一樣本與相鄰樣本之第一集合之間的差。對於視訊資料之當前區塊,視訊解碼器可接收指示相鄰樣本之位置的語法資料,其中相鄰樣本之位置界定圖案。視訊解碼器可在(例如)截塊層級處或在其他層級(在截塊層級之下或之上)處接收指示相鄰樣本之位置的此語法。在一個實例實施中,指示相鄰樣本之位置的語法資料包括索引值,且視訊解碼器將索引值映射至相鄰樣本之位置之集合。 視訊寫碼器可(例如)藉由比較當前區塊之第一樣本值與相鄰樣本之第一集合的平均值、比較當前區塊之第一樣本值與相鄰樣本之第一集合的加權平均值、判定當前區塊之第一樣本值與相鄰樣本之第一集合之樣本值之間的值差之總和,或藉由某其他類型之比較而比較當前區塊之第一樣本與相鄰樣本之第一集合以判定第一差值。 視訊解碼器基於第一差值判定第一樣本之第一偏移(122)。視訊解碼器比較當前區塊之第二樣本與相鄰樣本之第二集合以判定第二差值(124)。類似於第一樣本,對於第二樣本,視訊寫碼器可藉由比較當前區塊之第二樣本值與相鄰樣本之第二集合的平均值、比較當前區塊之第二樣本值與相鄰樣本之第二集合的加權平均值、判定當前區塊之第二樣本值與相鄰樣本之第二集合之樣本值之間的值差之總和,或藉由某其他類型之比較而比較當前區塊之第二樣本與相鄰樣本之第二集合以判定第二差值。第二差值為第二樣本與相鄰樣本之第二集合之間的差,且第一差值及第二差值具有相同正負號(例如,兩者為正或兩者為負)。相鄰樣本之第一集合相對於第一樣本具有與相鄰樣本之第二集合相對於第二樣本具有之圖案相同的圖案。相鄰樣本之第一集合及相鄰樣本之第二集合可各自包括多於兩個樣本,且相鄰樣本之第一集合及相鄰樣本之第二集合亦可各自包括至少一個時間相鄰樣本。 視訊解碼器基於第二差值判定第二樣本之第二偏移(126)。第一偏移及第二偏移均為不同非零值。視訊解碼器將第一偏移應用於第一樣本值且將第二偏移應用於第二樣本值以產生經濾波影像(128)。對於視訊資料之當前區塊,視訊解碼器可接收指示用於將當前區塊之樣本分組成至少兩個群組的規則之集合的語法資料。第一群組可(例如)包括待濾波之樣本,且第二群組可包括不待濾波之樣本。 在圖10之實例中,第一樣本之值可大於(或小於)相鄰樣本之第一集合中之樣本的所有值,且第二樣本之值亦可大於(或小於)相鄰樣本之第二集合中之樣本的所有值。然而,即使第一樣本及第二樣本共用此特性,視訊解碼器仍基於(例如)差之量值添加不同偏移至第一樣本及第二樣本。作為一個實例,第一樣本之值可比相鄰樣本之第一集合中的樣本之所有值大得多(或小得多),而第二樣本之值比相鄰樣本之第二集合中的樣本之所有值微大(或稍小)。基於此差,視訊解碼器可應用不同偏移至第一樣本及第二樣本。 在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則該等功能可作為一或多個指令或程式碼而在一電腦可讀媒體上儲存或傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體(其包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體)。以此方式,電腦可讀媒體通常可對應於(1)非暫時性之有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術的指令、程式碼及/或資料結構的任何可用媒體。電腦程式產品可包括電腦可讀媒體。 藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體或可用於儲存呈指令或資料結構形式之所要程式碼且可由電腦存取的任何其他媒體。並且,任何連接被恰當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如紅外線、無線電及微波)自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纜、雙絞線、DSL或無線技術(諸如紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是實際上有關非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再現資料,而光碟使用雷射以光學方式再現資料。以上各者之組合亦應包括於電腦可讀媒體之範疇內。 可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合式或離散邏輯電路之一或多個處理器來執行指令。因此,如本文中所使用之術語「處理器」可指上述結構或適合於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,本文中所描述之功能性可提供於經組態用於編碼及解碼之專用硬體及/或軟體模組內,或併入組合式編解碼器中。此外,該等技術可完全實施於一或多個電路或邏輯元件中。 本發明之技術可實施於多種器件或裝置中,包括無線手機、積體電路(IC)或IC集合(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之器件的功能態樣,但未必要求由不同硬體單元來實現。確切而言,如上文所描述,可將各種單元組合於編解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合結合合適之軟體及/或韌體來提供該等單元。 已描述各種實例。此等及其他實例係在以下申請專利範圍之範疇內。
10‧‧‧系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧鏈路
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
26‧‧‧儲存器件
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
33‧‧‧視訊資料記憶體
35‧‧‧分割單元
41‧‧‧預測處理單元
42‧‧‧運動估計單元(MEU)
44‧‧‧運動補償單元(MCU)
46‧‧‧框內預測單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧逆量化單元
60‧‧‧逆變換處理單元
62‧‧‧求和器
64‧‧‧濾波器單元
66‧‧‧經解碼圖像緩衝器(DPB)
78‧‧‧視訊資料記憶體
80‧‧‧熵解碼單元
81‧‧‧預測處理單元
82‧‧‧運動補償單元
84‧‧‧框內預測單元
86‧‧‧逆量化單元
88‧‧‧逆變換處理單元
90‧‧‧求和器
92‧‧‧濾波器單元
94‧‧‧經解碼圖像緩衝器(DPB)
102‧‧‧解區塊濾波器
104‧‧‧峰值樣本適應性偏移(SAO)濾波器
106‧‧‧適應性迴路濾波器(ALF)/基於幾何變換之適應性迴路濾波(GALF)濾波器
120‧‧‧步驟
122‧‧‧步驟
124‧‧‧步驟
126‧‧‧步驟
128‧‧‧步驟
圖1為說明可利用本發明中所描述之技術的實例視訊編碼及解碼系統的方塊圖。 圖2展示HEVC解碼器之實例方塊圖。 圖3A至圖3D展示用於邊緣偏移(EO)樣本分類之四個1-D方向圖案。 圖4展示當前像素及當前像素之相鄰像素的實例。 圖5展示當前像素及當前像素之相鄰像素的實例。 圖6A及圖6B展示具有8個所選相鄰樣本之兩個樣本的實例。 圖7為說明可實施本發明中所描述之技術的實例視訊編碼器之方塊圖。 圖8為說明可實施本發明中所描述之技術之實例視訊解碼器的方塊圖。 圖9展示用於執行本發明之技術的濾波器單元之實例實施。 圖10為說明根據本發明之技術之實例視訊解碼處理程序之流程圖。

Claims (36)

  1. 一種用於解碼視訊資料之方法,該方法包含: 比較一當前區塊之一第一樣本與相鄰樣本之一第一集合以判定一第一差值; 基於該第一差值判定該第一樣本之一第一偏移,其中該第一偏移為一第一非零值; 比較該當前區塊之一第二樣本與相鄰樣本之一第二集合以判定一第二差值,其中相鄰樣本之該第一集合相對於該第一樣本具有與相鄰樣本之該第二集合相對於該第二樣本具有之圖案相同的一圖案,且其中該第一差值及該第二差值具有一相同正負號; 基於該第二差值判定該第二樣本之一第二偏移,其中該第二偏移為不同於該第一非零值之一第二非零值;及 將該第一偏移應用於該第一樣本值且將該第二偏移應用於該第二樣本值以產生一經濾波影像。
  2. 如請求項1之方法,其中相鄰樣本之該第一集合及相鄰樣本之該第二集合各自包括多於兩個樣本。
  3. 如請求項1之方法,其中相鄰樣本之該第一集合及相鄰樣本之該第二集合各自包括在與包括該當前區塊之一當前圖像不同的一圖像中之至少一個時間相鄰樣本。
  4. 如請求項1之方法,其進一步包含: 對於視訊資料之該當前區塊,接收指示相鄰樣本之位置的語法資料,其中該等相鄰樣本之該等位置界定該圖案;及 基於指示該等相鄰樣本之該等位置的該接收之語法資料判定相鄰樣本之該第一集合及相鄰樣本之該第二集合。
  5. 如請求項1之方法,其進一步包含 對於視訊資料之該當前區塊,接收指示用於將該當前區塊之樣本分組成至少兩個群組的規則之一集合的語法資料,其中一第一群組包含待濾波之樣本且一第二群組包含不待濾波之樣本;及 判定該第一樣本及該第二樣本屬於該第一群組。
  6. 如請求項1之方法,其中比較該當前區塊之該第一樣本與相鄰樣本之該第一集合以判定該第一差值包含比較該當前區塊之該第一樣本之一值與相鄰樣本之該第一集合之一平均值。
  7. 如請求項1之方法,其中比較該當前區塊之該第一樣本與相鄰樣本之該第一集合以判定該第一差值包含判定該當前區塊之該第一樣本之一值與相鄰樣本之該第一集合之樣本值之間的值差之一總和。
  8. 如請求項1之方法,其中該第一樣本之一值大於相鄰樣本之該第一集合中的樣本之所有值且該第二樣本之一值大於相鄰樣本之該第二集合中的樣本之所有值。
  9. 如請求項1之方法,其中該方法經執行為一視訊編碼處理程序之部分。
  10. 一種用於解碼視訊資料之器件,該器件包含: 一記憶體,其經組態以儲存該視訊資料;及 一或多個處理器,其經組態以進行以下操作: 比較一當前區塊之一第一樣本與相鄰樣本之一第一集合以判定一第一差值; 基於該第一差值判定該第一樣本之一第一偏移,其中該第一偏移為一第一非零值; 比較該當前區塊之一第二樣本與相鄰樣本之一第二集合以判定一第二差值,其中相鄰樣本之該第一集合相對於該第一樣本具有與相鄰樣本之該第二集合相對於該第二樣本具有之圖案相同的一圖案,且其中該第一差值及該第二差值具有一相同正負號; 基於該第二差值判定該第二樣本之一第二偏移,其中該第二偏移為不同於該第一非零值之一第二非零值;及 將該第一偏移應用於該第一樣本值且將該第二偏移應用於該第二樣本值以產生一經濾波影像。
  11. 如請求項10之器件,其中相鄰樣本之該第一集合及相鄰樣本之該第二集合各自包括多於兩個樣本。
  12. 如請求項10之器件,其中相鄰樣本之該第一集合及相鄰樣本之該第二集合各自包括在與包括該當前區塊之一當前圖像不同的一圖像中之至少一個時間相鄰樣本。
  13. 如請求項10之器件,其中該一或多個處理器經進一步組態以進行以下操作: 對於視訊資料之該當前區塊,接收指示相鄰樣本之位置的語法資料,其中該等相鄰樣本之該等位置界定該圖案;及 基於指示該等相鄰樣本之該等位置的該接收之語法資料判定相鄰樣本之該第一集合及相鄰樣本之該第二集合。
  14. 如請求項10之器件,其中該一或多個處理器經進一步組態以進行以下操作: 對於視訊資料之該當前區塊,接收指示用於將該當前區塊之樣本分組成至少兩個群組的規則之一集合的語法資料,其中一第一群組包含待濾波之樣本且一第二群組包含不待濾波之樣本;及 判定該第一樣本及該第二樣本屬於該第一群組。
  15. 如請求項10之器件,其中為比較該當前區塊之該第一樣本與相鄰樣本之該第一集合以判定該第一差值,該一或多個處理器經進一步組態以比較該當前區塊之該第一樣本之一值與相鄰樣本之該第一集合之一平均值。
  16. 如請求項10之器件,其中為比較該當前區塊之該第一樣本與相鄰樣本之該第一集合以判定該第一差值,該一或多個處理器經進一步組態以判定該當前區塊之該第一樣本之一值與相鄰樣本之該第一集合之樣本值之間的值差之一總和。
  17. 如請求項10之器件,其中該第一樣本之一值大於相鄰樣本之該第一集合中的樣本之所有值且該第二樣本之一值大於相鄰樣本之該第二集合中的樣本之所有值。
  18. 如請求項10之器件,其中該器件經組態以作為一視訊編碼處理程序之部分而解碼視訊資料。
  19. 如請求項10之器件,其中該器件包含一無線通信器件,其進一步包含經組態以接收經編碼視訊資料之一接收器。
  20. 如請求項19之器件,其中該無線通信器件包含一電話手機且其中該接收器經組態以根據一無線通信標準解調變包含該經編碼視訊資料之一信號。
  21. 一種電腦可讀媒體,其儲存指令,該等指令在由一或多個處理器執行時致使該一或多個處理器進行以下操作: 比較一當前區塊之一第一樣本與相鄰樣本之一第一集合以判定一第一差值; 基於該第一差值判定該第一樣本之一第一偏移,其中該第一偏移為一第一非零值; 比較該當前區塊之一第二樣本與相鄰樣本之一第二集合以判定一第二差值,其中相鄰樣本之該第一集合相對於該第一樣本具有與相鄰樣本之該第二集合相對於該第二樣本具有之圖案相同的一圖案,且其中該第一差值及該第二差值具有一相同正負號; 基於該第二差值判定該第二樣本之一第二偏移,其中該第二偏移為不同於該第一非零值之一第二非零值;及 將該第一偏移應用於該第一樣本值且將該第二偏移應用於該第二樣本值以產生一經濾波影像。
  22. 如請求項21之電腦可讀媒體,其中相鄰樣本之該第一集合及相鄰樣本之該第二集合各自包括多於兩個樣本。
  23. 如請求項21之電腦可讀媒體,其中相鄰樣本之該第一集合及相鄰樣本之該第二集合各自包括在與包括該當前區塊之一當前圖像不同的一圖像中之至少一個時間相鄰樣本。
  24. 如請求項21之電腦可讀媒體,其儲存另外指令,該等另外指令在執行時致使該一或多個處理器進行以下操作: 對於視訊資料之該當前區塊,接收指示相鄰樣本之位置的語法資料,其中該等相鄰樣本之該等位置界定該圖案;及 基於指示該等相鄰樣本之該等位置的該接收之語法資料判定相鄰樣本之該第一集合及相鄰樣本之該第二集合。
  25. 如請求項21之電腦可讀媒體,其儲存另外指令,該等另外指令在執行時致使該一或多個處理器進行以下操作: 對於視訊資料之該當前區塊,接收指示用於將該當前區塊之樣本分組成至少兩個群組的規則之一集合的語法資料,其中一第一群組包含待濾波之樣本且一第二群組包含不待濾波之樣本;及 判定該第一樣本及該第二樣本屬於該第一群組。
  26. 如請求項21之電腦可讀媒體,其中為比較該當前區塊之該第一樣本與相鄰樣本之該第一集合以判定該第一差值,該等指令致使該一或多個處理器比較該當前區塊之該第一樣本之一值與相鄰樣本之該第一集合之一平均值。
  27. 如請求項21之電腦可讀媒體,其中為比較該當前區塊之該第一樣本與相鄰樣本之該第一集合以判定該第一差值,該等指令致使該一或多個處理器判定該當前區塊之該第一樣本之一值與相鄰樣本之該第一集合之樣本值之間的值差之一總和。
  28. 如請求項21之電腦可讀媒體,其中該第一樣本之一值大於相鄰樣本之該第一集合中的樣本之所有值且該第二樣本之一值大於相鄰樣本之該第二集合中的樣本之所有值。
  29. 一種用於解碼視訊資料之裝置,該裝置包含: 用於比較一當前區塊之一第一樣本與相鄰樣本之一第一集合以判定一第一差值的構件; 用於基於該第一差值判定該第一樣本之一第一偏移的構件,其中該第一偏移為一第一非零值; 用於比較該當前區塊之一第二樣本與相鄰樣本之一第二集合以判定一第二差值的構件,其中相鄰樣本之該第一集合相對於該第一樣本具有與相鄰樣本之該第二集合相對於該第二樣本具有之圖案相同的一圖案,且其中該第一差值及該第二差值具有一相同正負號; 用於基於該第二差值判定該第二樣本之一第二偏移的構件,其中該第二偏移為不同於該第一非零值之一第二非零值;及 用於將該第一偏移應用於該第一樣本值且將該第二偏移應用於該第二樣本值以產生一經濾波影像的構件。
  30. 如請求項29之裝置,其中相鄰樣本之該第一集合及相鄰樣本之該第二集合各自包括多於兩個樣本。
  31. 如請求項29之裝置,其中相鄰樣本之該第一集合及相鄰樣本之該第二集合各自包括在與包括該當前區塊之一當前圖像不同的一圖像中之至少一個時間相鄰樣本。
  32. 如請求項29之裝置,其進一步包含: 用於對於視訊資料之該當前區塊接收指示相鄰樣本之位置的語法資料的構件,其中該等相鄰樣本之該等位置界定該圖案;及 用於基於指示該等相鄰樣本之該等位置的該接收之語法資料判定相鄰樣本之該第一集合及相鄰樣本之該第二集合的構件。
  33. 如請求項29之裝置,其進一步包含 對於視訊資料之該當前區塊接收指示用於將該當前區塊之樣本分組成至少兩個群組的規則之一集合的語法資料,其中一第一群組包含待濾波之樣本且一第二群組包含不待濾波之樣本;及 用於判定該第一樣本及該第二樣本屬於該第一群組的構件。
  34. 如請求項29之裝置,其中該用於比較該當前區塊之該第一樣本與相鄰樣本之該第一集合以判定該第一差值的構件包含用於比較該當前區塊之該第一樣本之一值與相鄰樣本之該第一集合之一平均值的構件。
  35. 如請求項29之裝置,其中該用於比較該當前區塊之該第一樣本與相鄰樣本之該第一集合以判定該第一差值的構件包含用於判定該當前區塊之該第一樣本之一值與相鄰樣本之該第一集合之樣本值之間的值差之一總和的構件。
  36. 如請求項29之裝置,其中該第一樣本之一值大於相鄰樣本之該第一集合中的樣本之所有值且該第二樣本之一值大於相鄰樣本之該第二集合中的樣本之所有值。
TW106134400A 2016-10-04 2017-10-05 峰值樣本適應性偏移 TW201817227A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662404126P 2016-10-04 2016-10-04
US62/404,126 2016-10-04
US15/724,112 US10623737B2 (en) 2016-10-04 2017-10-03 Peak sample adaptive offset
US15/724,112 2017-10-03

Publications (1)

Publication Number Publication Date
TW201817227A true TW201817227A (zh) 2018-05-01

Family

ID=61759221

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106134400A TW201817227A (zh) 2016-10-04 2017-10-05 峰值樣本適應性偏移

Country Status (9)

Country Link
US (1) US10623737B2 (zh)
EP (1) EP3523969A1 (zh)
JP (1) JP2019534631A (zh)
KR (1) KR20190059280A (zh)
CN (1) CN109792525B (zh)
BR (1) BR112019006702A2 (zh)
CA (1) CA3035359A1 (zh)
TW (1) TW201817227A (zh)
WO (1) WO2018067722A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2574425A (en) * 2018-06-05 2019-12-11 Canon Kk Video coding and decoding
EP3821609A1 (en) * 2018-07-11 2021-05-19 InterDigital VC Holdings, Inc. In-loop filter with multiple regions
US11064196B2 (en) * 2018-09-03 2021-07-13 Qualcomm Incorporated Parametrizable, quantization-noise aware bilateral filter for video coding
JP7223858B2 (ja) 2019-01-09 2023-02-16 ベイジン ダジア インターネット インフォメーション テクノロジー カンパニー リミテッド ビデオコーディングの方法、ビデオコーディングデバイス、コンピュータ可読記憶媒体およびコンピュータプログラム
CN116347102B (zh) * 2019-01-09 2024-01-23 北京达佳互联信息技术有限公司 视频编码方法、设备、非暂时性计算机可读存储介质
US11202100B2 (en) * 2019-03-11 2021-12-14 Qualcomm Incorporated Coefficient coding for transform skip mode
JP7433346B2 (ja) 2019-06-14 2024-02-19 北京字節跳動網絡技術有限公司 ビデオ単位境界および仮想境界の処理
EP3984223A4 (en) 2019-07-11 2022-11-09 Beijing Bytedance Network Technology Co., Ltd. SAMPLE PADDING IN AN ADAPTIVE LOOP FILTERING
EP3984219A4 (en) 2019-07-15 2022-08-17 Beijing Bytedance Network Technology Co., Ltd. Classification in adaptive loop filtering
WO2021052508A1 (en) * 2019-09-22 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Padding process in adaptive loop filtering
WO2021057946A1 (en) 2019-09-27 2021-04-01 Beijing Bytedance Network Technology Co., Ltd. Adaptive loop filtering between different video units
CN112616057B (zh) * 2019-10-04 2024-08-23 Oppo广东移动通信有限公司 图像预测方法、编码器、解码器以及存储介质
CN114556939B (zh) 2019-10-10 2025-05-02 北京字节跳动网络技术有限公司 自适应环路滤波中不可用样点位置处的填充处理
MX2021003675A (es) * 2019-12-24 2021-07-07 Ericsson Telefon Ab L M Procesamiento de limites virtuales para filtrado de bucle adaptativo.

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013074416A (ja) * 2011-09-27 2013-04-22 Sony Corp 画像処理装置および方法
JP2013098873A (ja) * 2011-11-02 2013-05-20 Sony Corp 画像処理装置と画像処理方法
US9716882B2 (en) * 2012-01-05 2017-07-25 Google Technology Holdings LLC Devices and methods for sample adaptive offset coding and/or selection of edge offset parameters
JP2014197723A (ja) * 2012-01-06 2014-10-16 ソニー株式会社 画像処理装置および方法
JP2015536087A (ja) 2012-09-28 2015-12-17 サムスン エレクトロニクス カンパニー リミテッド インターレイヤ予測誤差を符号化するためのsaoオフセット補償方法及びその装置
US10694214B2 (en) * 2012-12-21 2020-06-23 Qualcomm Incorporated Multi-type parallelized sample adaptive offset in video coding
US10334253B2 (en) * 2013-04-08 2019-06-25 Qualcomm Incorporated Sample adaptive offset scaling based on bit-depth
US10708588B2 (en) * 2013-06-19 2020-07-07 Apple Inc. Sample adaptive offset control
JP6328759B2 (ja) * 2013-07-15 2018-05-23 寰發股▲ふん▼有限公司HFI Innovation Inc. ビデオ符号化のサンプル適応オフセット処理の方法
JP6338408B2 (ja) * 2014-03-14 2018-06-06 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
US11064195B2 (en) 2016-02-15 2021-07-13 Qualcomm Incorporated Merging filters for multiple classes of blocks for video coding

Also Published As

Publication number Publication date
CN109792525A (zh) 2019-05-21
US10623737B2 (en) 2020-04-14
KR20190059280A (ko) 2019-05-30
BR112019006702A2 (pt) 2019-06-25
CN109792525B (zh) 2022-09-27
JP2019534631A (ja) 2019-11-28
US20180098065A1 (en) 2018-04-05
EP3523969A1 (en) 2019-08-14
CA3035359A1 (en) 2018-04-12
WO2018067722A1 (en) 2018-04-12

Similar Documents

Publication Publication Date Title
TWI827609B (zh) 基於區塊之自適應迴路濾波器(alf)之設計及發信令
TWI843809B (zh) 用於視訊寫碼中具有運動向量差之合併模式之信令傳輸
TW201817227A (zh) 峰值樣本適應性偏移
TWI666918B (zh) 決定在視訊寫碼中之調色板寫碼區塊的調色板大小、調色板單元及過濾
TWI669944B (zh) 基於調色板之視訊寫碼中之寫碼行程
TW202044831A (zh) 視訊寫碼中具有適應性參數集(aps)之區塊為基礎之適應性迴路濾波器(alf)
TW201832562A (zh) 具有減低複雜性之視訊寫碼中之雙邊濾波器
TW201711461A (zh) 片級內部區塊複製及其他視訊寫碼改善
TW201633782A (zh) 用於調色板寫碼之寫碼逃脫像素
TW201804794A (zh) 過濾資訊之發信號
TW201608880A (zh) 基於調色板之視訊寫碼中之逃脫樣本寫碼
TW201608878A (zh) 基於調色板之視訊寫碼中之最大調色板參數
US10887622B2 (en) Division-free bilateral filter
US20190306534A1 (en) Unification of deblocking filter and adaptive loop filter
CN110754091B (zh) 用于360度视频编码的解块滤波
US20190320172A1 (en) Hardware-friendly sample adaptive offset (sao) and adaptive loop filter (alf) for video coding
US20190373292A1 (en) In-loop bilateral filter type decision based on block information
RU2783335C2 (ru) Устройство и сигнализация адаптивного контурного фильтра (alf) на блочной основе
HK40057732B (zh) 在视频译码中具有自适应参数集(aps)的基於块的自适应环路滤波器(alf)
HK40014706A (zh) 无除法双边滤波器
HK40006133A (zh) 具有减低复杂性的视频译码中的双边滤波器