[go: up one dir, main page]

TW202002631A - 用於視訊寫碼及處理的解區塊濾波器 - Google Patents

用於視訊寫碼及處理的解區塊濾波器 Download PDF

Info

Publication number
TW202002631A
TW202002631A TW108111776A TW108111776A TW202002631A TW 202002631 A TW202002631 A TW 202002631A TW 108111776 A TW108111776 A TW 108111776A TW 108111776 A TW108111776 A TW 108111776A TW 202002631 A TW202002631 A TW 202002631A
Authority
TW
Taiwan
Prior art keywords
block
activity
filter
pixels
video
Prior art date
Application number
TW108111776A
Other languages
English (en)
Inventor
董傑
趙容宣
錢威俊
馬塔 卡茲維克茲
章立
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW202002631A publication Critical patent/TW202002631A/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

解區塊係視訊寫碼中之用於移除可由將一視訊圖框分成區塊引起的失真及基於該等區塊編碼該視訊圖框的一步驟。本文所描述之技術可包括判定沿該等區塊之邊界的相鄰區塊的活動性,其中該活動性量測邊界區域中之像素的平滑度或複雜度。可接著判定該活動性之一平均值,以及左邊區塊與右邊區塊之間的該活動性之一差異。該平均活動性及該活動性差異可接著用以判定該邊界區域之一分類。該分類可進一步用以選擇一濾波器以應用於該邊界區域中之該等像素。一旦該濾波器已應用,就可將該等區塊加至一經重建構視訊圖框。

Description

用於視訊寫碼及處理的解區塊濾波器
本申請案係關於對藉由壓縮、模糊等而失真之視訊圖框執行的一濾波處理程序,以改良客觀及/或主觀品質。本文中所描述的技術及系統可應用於現有視訊編解碼器(例如,進階視訊寫碼(AVC)、高效率視訊寫碼(HEVC)或任何其他合適之視訊編解碼器)中之任一者,或可經提議為將來視訊寫碼標準之寫碼工具。本文中所描述的技術及系統亦可用作對於自標準或專有編解碼器輸出之視訊圖框的後處理方法。
視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264 (亦稱為ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展。
另外,最近已由ITU-T視訊寫碼專家組(VCEG)及ISO/IEC動畫專家組(MPEG)之視訊寫碼聯合協作小組(JCT-VC)以及3D視訊寫碼擴展開發聯合協作小組(JCT-3V)開發新的視訊寫碼標準,亦即高效率視訊寫碼(HEVC)或ITU-T H.265,其包括其範圍及螢幕內容寫碼擴展、3D視訊寫碼(3D-HEVC)與多視圖擴展(MV-HEVC),及可調式擴展(SHVC)。
在2016年,MPEG及ITU-T VCEG形成聯合探索視訊小組(JVET),以探索用於下一代視訊寫碼標準之新寫碼工具。參考軟體被稱作JEM(聯合探索模型)。
在各種實施中,提供用於在視訊寫碼處理程序中解區塊的系統、方法及電腦可讀媒體。本文所描述之技術可包括判定沿該等區塊之邊界的相鄰區塊的活動性,其中該活動性量測該邊界區域中之像素的平滑度或複雜度。可接著判定該活動性之一平均值,以及左邊區塊與右邊區塊之間的該活動性之一差異。該平均活動性及該活動性差異可接著用以判定該邊界區域之一分類。該分類可進一步用以選擇一濾波器以應用於該邊界區域中之該等像素。一旦該濾波器已應用,就可將該等區塊加至一經重建構視訊圖框。
下文提供本發明之某些態樣及實施例。此等態樣及實施例之一些可獨立地應用並且其中之一些可以將對熟習此項技術者顯而易見之組合來應用。在以下描述中,為解釋之目的,闡述眾多特定細節以便提供對申請案之實施例之透徹理解。然而,各種實施例可在無此等特定細節之情況下得以實踐將為顯而易見的。圖式及描述不意欲為限定性的。
隨後描述僅提供例示性實施例且並不意欲限制本發明的範疇、可應用性或組態。實際上,例示性實施例之隨後描述將為熟習此項技術者提供能夠實施例示性實施例之描述。應理解,可在不背離如所附申請專利範圍中所闡述之本申請案之精神及範疇的情況下對元件之功能及配置做出各種變化。
在以下描述中給出特定細節以提供對實施例之透徹理解。然而,一般技術者應瞭解,實施例可在無需此等特定細節之情況下實踐。舉例而言,電路、系統、網路、處理程序及其他組件可在方塊圖形式中展示為組件以便在不必要細節下不與實施例混淆。在其他情況下,可在無不必要細節之情況下展示熟知電路、處理程序、演算法、結構及技術以便避免混淆實施例。
另外,應注意,個別實施例可描述為被描繪為流程圖、流圖、資料流圖、結構圖或方塊圖之處理程序。儘管流程圖可能將操作描述為順序處理程序,但許多操作可並行地或同時加以執行。另外,可再配置操作之次序。處理程序在其操作完成時終止,但可具有不包括於圖中之額外步驟。處理程序可對應於方法、函式、程序、次常式、子程式等。當處理程序對應於函式時,其終止可對應於函式傳回至呼叫函式或主函式。
術語「電腦可讀媒體」包括(但不限於)攜帶型或非攜帶型儲存器件、光儲存器件及能夠儲存、含有或攜載指令及/或資料的各種其他媒體。電腦可讀媒體可包括非暫時性媒體,其中可儲存資料並且不包括載波及/或無線地或經由有線連接傳播之暫時電子信號。非暫時性媒體之實例可包括(但不限於)磁碟或磁帶、諸如緊密光碟(CD)或數位化通用光碟(DVD)之光學儲存媒體、快閃記憶體、記憶體或記憶體器件。電腦可讀媒體可具有儲存於其上之程式碼及/或機器可執行指令,該等程式碼及/或機器可執行指令可表示程序、函式、子程式、程式、常式、次常式、模組、軟體套件、類別,或指令、資料結構或程式語句之任何組合。一個碼段可藉由傳遞及/或接收資訊、資料、論證、參數或記憶體內容耦接至另一碼段或硬體電路。資訊、引數、參數、資料等可經由包括記憶體共用、訊息傳遞、符記傳遞、網路傳輸或其類似者之任何合適方式傳遞、轉遞或傳輸。
此外,可由硬體、軟體、韌體、中間軟體、微碼、硬件描述語言或其任何組合實施方法之實施例。當以軟體、韌體、中間軟體或微碼實施時,用以執行必要任務之程式碼或碼段(例如,電腦程式產品)可儲存於電腦可讀或機器可讀媒體中。處理器可執行必要任務。
解區塊係視訊寫碼中之用於移除可由將一視訊圖框分成區塊引起的失真及基於該等區塊編碼該視訊圖框的一步驟。解區塊濾波器可使區塊之邊緣平滑,藉此改良經重建構視訊圖框的外觀。本文中,寫碼指代編碼或解碼,或兩者。
諸如高效率視訊寫碼(HEVC或H.265)之一些視訊編解碼器使用意欲發現計算複雜度與寫碼效率之間的平衡之解區塊方案。減小計算複雜度使得視訊能夠在指定時間量內在可用計算硬體上編碼或解碼。增加寫碼效率減少經壓縮視訊資料之大小。然而,減小計算複雜度的需要可導致過度簡化並導致較不良寫碼效率的解區塊方案。舉例而言,一些解區塊方案考慮兩個區塊之間的本端活動性之平均值,但另外將兩個區塊視為相同,而不考慮兩個區塊中之活動性差異。作為另一實例,即使當平滑器濾波將更適當時,一些解區塊方案僅僅執行粗略濾波。
電腦硬體之改良可實現當選擇及應用濾波器用於解區塊時考慮更大數目因數的解區塊技術。此等技術可利用計算資源以執行更複雜處理,此可導致較佳寫碼效率及/或此可改良經重建構視訊圖框之外觀。舉例而言,此等技術可包括判定沿區塊之邊界的相鄰區塊的活動性,其中活動性量測邊界區域中之像素的平滑度或複雜度。可接著判定該活動性之一平均值,以及左邊區塊與右邊區塊之間的該活動性之一差異。該平均活動性及該活動性差異可接著用以判定該邊界區域之一分類。該分類可進一步用以選擇一濾波器以應用於該邊界區域中之該等像素。一旦該濾波器已應用,就可將該等區塊加至一經重建構視訊圖框。
隨著更多器件及系統為消費者提供消耗數位視訊資料之能力,對高效視訊寫碼技術之需要變得更加重要。需要視訊寫碼來減少處置存在於數位視訊資料中之大量資料所必要的儲存及傳輸要求。各種視訊寫碼技術可用於將視訊資料壓縮成使用較低位元速率同時維持高視訊品質之形式。
圖1為說明包括編碼器件104及解碼器件112之系統100之實例的方塊圖。編碼器件104可為源器件之部分,且解碼器件112可為接收器件之部分。源器件及/或接收器件可包括電子器件,諸如,行動或靜止電話手機(例如,智慧型電話、蜂巢式電話或其類似者)、桌上型電腦、膝上型電腦或筆記型電腦、平板電腦、機上盒、電視機、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件或任何其他合適的電子器件。在一些實例中,源器件及接收器件可包括用於無線通信之一或多個無線收發器。本文中所描述之寫碼技術適用於各種多媒體應用中之視訊寫碼,包括串流視訊傳輸(例如,經由網際網路)、電視廣播或傳輸、編碼數位視訊以供儲存於資料儲存媒體上、解碼儲存於資料儲存媒體上之數位視訊或其他應用。在一些實例中,系統100可支援單向或雙向視訊傳輸以支援諸如視訊會議、視訊串流、視訊播放、視訊廣播、遊戲及/或視訊電話之應用。
編碼器件104 (或編碼器)可用以使用視訊寫碼標準或協定編碼視訊資料以產生經編碼視訊位元串流。視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264 (亦稱為ISO/IEC MPEG-4 AVC) (包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展),及高效率視訊寫碼(HEVC)或ITU-T H.265。處理多層視訊寫碼的對HEVC之各種擴展存在,包括對HEVC之多視圖擴展(稱作MV-HEVC),及對HEVC之可調式擴展(稱作SHVC),或任何其他合適之寫碼協定。另外,寫碼工具存在以針對螢幕內容材料(諸如具有運動之文字及圖形),以及改良螢幕內容之寫碼效率的技術。H.265/HEVC螢幕內容寫碼(SCC)擴展經開發以涵蓋此等新寫碼工具。在2016年,MPEG及ITU-T VCEG形成聯合探索視訊小組(JVET),以探索用於下一代視訊寫碼標準之新寫碼工具。參考軟體被稱作JEM(聯合探索模型)。
本文中所描述之許多實施例使用HEVC標準或其擴展來描述實例。然而,本文中所描述之技術及系統亦可適用於諸如AVC、MPEG、其擴展之其他寫碼標準,或當前存在或未來的寫碼標準之其他合適寫碼標準。因此,雖然可參考特定視訊寫碼標準描述本文中所描述之技術及系統,但一般熟習此項技術者將瞭解,描述不應解譯為僅應用於彼特定標準。
視訊源102可將視訊資料提供至編碼器件104。視訊源102可為源器件之一部分,或可為除源器件以外的器件之一部分。視訊源102可包括視訊捕捉器件(例如,視訊攝影機、攝影機電話、視訊電話或其類似者)、含有經儲存視訊之視訊存檔、提供視訊資料之視訊伺服器或內容提供者、自視訊伺服器或內容提供者接收視訊之視訊饋入介面、用於產生電腦圖形視訊資料之電腦圖形系統、此等源之組合或任何其他合適的視訊源。
來自視訊源102之視訊資料可包括一或多個輸入圖像或圖框。圖像或圖框為作為視訊之部分的靜態影像。編碼器件104之編碼器引擎106(或編碼器)編碼視訊資料以產生經編碼視訊位元串流。在一些實例中,經編碼視訊位元串流(或「位元串流」)為一系列一或多個經寫碼視訊序列。經寫碼視訊序列(CVS)包括一系列存取單元(AU),其始於在基礎層中具有隨機存取點圖像且具有某些屬性之AU,直至且不包括在基礎層中具有隨機存取點圖像且具有某些屬性之下一AU。舉例而言,開始CVS的隨機存取點圖像之某些屬性可包括等於1的RASL(隨機存取跳過引導圖像)旗標(例如NoRaslOutputFlag)。否則,隨機存取點圖像(具有等於0之RASL旗標)並不開始CVS。存取單元(AU)包括一或多個經寫碼圖像及對應於共用相同輸出時間之經寫碼圖像的控制資訊。舉例而言,HEVC位元串流可包括包括稱作網路抽象層(NAL)單元之資料單元的一或多個CVS。兩種類別之NAL單元存在於HEVC標準中,包括視訊寫碼層(VCL)NAL單元及非VCL NAL單元。VCL NAL單元包括經寫碼圖像資料之一個截塊或截塊片段(如下描述),且非VCL NAL單元包括關於一或多個經寫碼圖像之控制資訊。HEVC AU包括含有經寫碼圖像資料之VCL NAL單元及對應於經寫碼圖像資料之非VCL NAL單元(若存在)。
NAL單元可含有形成視訊資料之經寫碼表示(例如經編碼視訊位元串流、位元串流之CVS或其類似者)的位元之序列,諸如視訊中之圖像的經寫碼表示。編碼器引擎106藉由將每一圖像分割成多個截塊而產生圖像之經寫碼表示。一截塊獨立於其他截塊,以使得在不依賴於來自同一圖像內之其他截塊之資料的情況下寫碼該截塊中之資訊。一截塊包括一或多個截塊片段,該一或多個截塊片段包括獨立截塊片段及(若存在)取決於先前截塊片段之一或多個相關截塊片段。截塊接著被分割成明度樣本及色度樣本之寫碼樹型區塊(CTB)。明度樣本之CTB及色度樣本之一或多個CTB連同樣本之語法被稱為寫碼樹型單元(CTU)。CTU為用於HEVC編碼之基本處理單元。CTU可經分裂成具有不同大小之多個寫碼單元(CU)。CU含有被稱為寫碼區塊(CB)之明度及色度樣本陣列。
明度及色度CB可進一步被分裂成預測區塊(PB)。PB為使用用於框間預測之相同運動參數的明度或色度分量的樣本之區塊。該明度PB及一或多個色度PB連同相關聯語法形成預測單元(PU)。在位元串流中針對每個PU發信運動參數集合,且該運動參數集合用於明度PB及一或多個色度PB之框間預測。CB亦可被分割成一或多個變換區塊(TB)。TB表示色彩分量之樣本之正方形區塊,對該正方形區塊應用同一二維變換以用於寫碼預測殘餘信號。變換單元(TU)表示明度及色度樣本之TB以及對應語法元素。
CU之大小對應於寫碼節點之大小,且為正方形形狀。舉例而言,CU之大小可為8×8樣本、16×16樣本、32×32樣本、64×64樣本或達至相應CTU之大小的任何其他適當大小。片語「N×N」在本文所用之以指依據豎直尺寸及水平尺寸(例如8像素×8像素)的視訊區塊之像素尺寸。可按列及行來配置區塊中之像素。在一些實施例中,區塊在水平方向上可不具有與在豎直方向上相同的數目個像素。與CU相關聯之語法資料可描述例如將CU分割成一或多個PU。分割模式可在CU經框內預測模式編碼抑或經框間預測模式編碼之間有所不同。PU可被分割成非正方形形狀。與CU相關聯之語法資料亦可描述(例如)根據CTU將CU分割成一或多個TU。TU可為正方形或非正方形形狀。
根據HEVC標準,可使用變換單元(TU)來執行變換。TU可針對不同CU而變化。可基於給定CU內之PU的大小而對TU設定大小。TU可與PU大小相同或小於PU。在一些實例中,可使用被稱為「殘餘四分樹」(RQT)之四分樹結構將對應於CU之殘餘樣本再分成較小單元。RQT之葉節點可對應於TU。可變換與TU相關聯之像素差值以產生變換係數。變換係數可接著由編碼器引擎106量化。
一旦視訊資料之圖像被分割成CU,編碼器引擎106就使用預測模式來預測每一PU。接著自原始視訊資料中減去預測以得到殘餘(下文描述)。對於每一CU,可使用語法資料在位元串流內部發信預測模式。預測模式可包括框內預測(或圖像內預測)或框間預測(或圖像間預測)。使用框內預測時,使用(例如)直流(DC)預測以發現PU之平均值、使用平坦預測以使平坦表面擬合於PU、使用方向預測以自相鄰資料外插或使用任何其他合適類型之預測,自同一圖像中之相鄰影像資料預測每一PU。使用框間預測時,使用運動補償預測自一或多個參考圖像(按輸出次序在當前圖像之前或之後)中之影像資料預測每一PU。可(例如)在CU層級決定係使用圖像間預測抑或圖像內預測來寫碼圖像區域。
在一些實例中,可執行使用單向預測之框間預測,在此情況下每一預測區塊可使用一個經運動補償之預測信號,且產生P預測單元。在一些實例中,可執行使用雙向預測之框間預測,在此情況下每一預測區塊使用兩個經運動補償之預測信號,且產生B預測單元。
PU可包括與預測處理程序相關之資料。舉例而言,當使用框內預測編碼PU時,PU可包括描述用於PU之框內預測模式的資料。作為另一實例,當使用框間預測來編碼PU時,PU可包括定義用於PU之運動向量的資料。舉例而言,定義PU之運動向量的資料可描述運動向量之水平分量、運動向量之豎直分量、運動向量之解析度(例如四分之一像素精度或八分之一像素精度)、運動向量指向的參考圖像,及/或運動向量之參考圖像清單(例如清單0、清單1或清單C)。
編碼器104接著可執行變換及量化。舉例而言,在預測之後,編碼器引擎106可計算對應於PU之殘餘值。殘餘值可包含像素差值。在預測執行之後可能剩餘的任何殘餘資料係使用區塊變換進行變換,該區塊變換可基於離散餘弦變換、離散正弦變換、整數變換、小波變換或其他合適之變換功能。在一些情況下,一或多個區塊變換(例如大小32×32、16×16、8×8、4×4,或其類似者)可應用於每一CU中的殘餘資料。在一些實施例中,TU可用於由編碼器引擎106實施的變換及量化處理程序。給定之具有一或多個PU的CU亦可包括一或多個TU。如下文進一步詳細描述,可使用區塊變換將殘餘值變換成變換係數,且接著可使用TU來量化及掃描殘餘值以產生用於熵寫碼之串列化變換係數。
在一些實施例中,在使用CU之PU進行框內預測性或框間預測性寫碼之後,編碼器引擎106可計算CU之TU的殘餘資料。PU可包含空間域(或像素域)中之像素資料。在應用區塊變換之後,TU可包含變換域中之係數。如先前所提及,殘餘資料可對應於未經編碼圖像之像素及與對應於PU之預測值之間的像素差值。編碼器引擎106可形成包括CU之殘餘資料的TU,且接著可變換TU以產生CU之變換係數。
編碼器引擎106可執行變換係數之量化。量化藉由量化變換係數以減少用以表示係數之資料的量而提供進一步壓縮。舉例而言,量化可減少與係數中之一些或所有相關聯的位元深度。在一個實例中,具有n位元值之係數可在量化期間經降值捨位為m位元值,其中n大於m。
一旦量化執行,經寫碼位元串流就包括經量化變換係數、預測資訊(例如預測模式、運動向量或其類似者)、分割資訊,及任何其他合適之資料,諸如其他語法資料。接著可由編碼器引擎106對經寫碼視訊位元串流之不同元素進行熵編碼。在一些實例中,編碼器引擎106可利用預定義掃描次序掃描經量化變換係數以產生可經熵編碼的串列化向量。在一些實例中,編碼器引擎106可執行自適應掃描。在掃描經量化變換係數以形成一維向量之後,編碼器引擎106可熵編碼該一維向量。舉例而言,編碼器引擎106可使用上下文自適應性可變長度寫碼、上下文自適應性二進位算術寫碼、基於語法之上下文自適應性二進位算術寫碼、機率區間分割熵寫碼或另一合適的熵編碼技術。
如先前所描述,HEVC位元串流包括NAL單元之群組。形成經寫碼視訊位元串流的位元之序列存在於VCL NAL單元中。除了其他資訊以外,非VCL NAL單元亦可含有具有與經編碼視訊位元串流相關之高層級資訊的參數集。舉例而言,參數集可包括視訊參數集(VPS)、序列參數集(SPS)及圖像參數集(PPS)。參數集之目標為位元速率效率、誤差復原及提供系統層介面。每一截塊參考單一作用中PPS、SPS及VPS以存取解碼器件112可用於解碼截塊之資訊。可針對每一參數集寫碼識別符(ID),包括VPS ID、SPS ID及PPS ID。SPS包括SPS ID及VPS ID。PPS包括PPS ID及SPS ID。每一截塊標頭包括PPS ID。使用ID,可識別針對給定截塊之作用中參數集。
PPS包括適用於給定圖像中之所有截塊的資訊。因此,圖像中之所有截塊參考同一PPS。不同圖像中之截塊亦可參考同一PPS。SPS包括適用於同一經寫碼視訊序列(CVS)或位元串流中之所有圖像的資訊。如先前所描述,經寫碼視訊序列為一系列存取單元(AU),其始於在基礎層中且具有某些屬性(上文所描述)之隨機存取點圖像(例如,瞬時解碼參考(IDR)圖像或斷鏈存取(BLA)圖像,或其他適當的隨機存取點圖像),直至且不包括具有在基礎層中且具有某些屬性之隨機存取點圖像的下一AU (或位元串流之末端)。SPS中之資訊可不在經寫碼視訊序列內在圖像間改變。經寫碼視訊序列中之圖像可使用同一SPS。VPS包括適用於經寫碼視訊序列或位元串流內之所有層的資訊。VPS包括具有適用於全部經寫碼視訊序列之語法元素的語法結構。在一些實施例中,可與經編碼位元串流一起頻帶內傳輸VPS、SPS或PPS。在一些實施例中,可在與含有經寫碼視訊資料之NAL單元分開的傳輸中帶外傳輸VPS、SPS或PPS。
編碼器件104之輸出110可經由通信鏈路120將構成經編碼視訊資料之NAL單元發送至接收器件之解碼器件112。解碼器件112之輸入114可接收NAL單元。通信鏈路120可包括使用無線網路、有線網路或有線網路與無線網路之組合傳輸的信號。無線網路可包括任何無線介面或無線介面之組合,且可包括任何適合之無線網路(例如,網際網路或其他廣域網路、基於封包之網路、WiFiTM 、射頻(RF)、UWB、WiFi-Direct、蜂巢式、長期演進(LTE)、WiMaxTM 或其類似者)。有線網路可包括任何有線介面(例如,光纖、乙太網路、電力線乙太網路、經由同軸電纜之乙太網路、數位信號線(DSL)或其類似者)。可使用各種裝備來實施有線及/或無線網路,該等裝備諸如基地台、路由器、存取點、橋接器、閘道器、交換器或其類似者。可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且將其傳輸至接收器件。
在一些實例中,編碼器件104可將經編碼視訊資料儲存於儲存器108中。輸出110可自編碼器引擎106或自輸出110擷取經編碼視訊資料。儲存器108可包括多種分散式或本端存取之資料儲存媒體中之任一者。舉例而言,儲存器108可包括硬碟機、儲存光碟、快閃記憶體、揮發性或非揮發性記憶體或用於儲存經編碼視訊資料之任何其他合適的數位儲存媒體。
輸入114接收經編碼視訊資料且可提供視訊資料至解碼器引擎116或儲存器118以便後續供解碼器引擎116使用。解碼器引擎116可藉由熵解碼(例如使用熵解碼器)及提取構成經編碼視訊資料之經寫碼視訊序列的元素而解碼經編碼視訊資料。解碼器引擎116可接著重新按比例調整經編碼視訊資料且對經編碼視訊資料執行反變換。殘餘接著傳遞至解碼器引擎116之預測級。解碼器引擎116接著預測像素之區塊(例如,PU)。在一些實例中,將預測加至反變換之輸出。
解碼器件112可將經解碼視訊輸出至視訊目的地器件112,視訊目的地器件可包括用於將經解碼視訊資料顯示給內容之消費者的顯示器或其他輸出器件。在一些態樣中,視訊目的地器件122可為包括解碼器件112的接收器件之部分。在一些態樣中,視訊目的地器件122可為不同於接收器件的單獨器件之部分。
在一些實施例中,視訊編碼器件104及/或視訊解碼器件112可分別與音訊編碼器件及音訊解碼器件整合。視訊編碼器件104及/或視訊解碼器件112亦可包括實施上文所描述之寫碼技術所必要的其他硬體或軟體,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。視訊編碼器件104及視訊解碼器件112可整合為各別器件中之組合式編碼器/解碼器(編解碼器)之部分。下文參看圖12描述編碼器件104之特定細節的實例。下文參看圖13描述解碼器件112之特定細節的實例。
對HEVC標準之擴展包括多視圖視訊寫碼擴展(被稱作MV-HEVC)及可調式視訊寫碼擴展(被稱作SHVC)。MV-HEVC及SHVC擴展共用分層寫碼之概念,其中不同層包括於經編碼視訊位元串流中。經寫碼視訊序列中之每一層係由唯一層識別符(ID)定址。層ID可存在於NAL單元之標頭中以識別NAL單元所相關聯之層。在MV-HEVC中,不同層通常表示視訊位元串流中之同一場景的不同視圖。在SHVC中,提供以不同空間解析度(或圖像解析度)或不同重建構保真度表示視訊位元串流的不同可調式層。可調式層可包括基礎層(層ID=0)及一或多個增強層(層ID=1, 2, … n)。基礎層可符合HEVC之第一版本的設定檔,且表示位元串流中之最低可用層。與基礎層相比,增強層具有增加之空間解析度、時間解析度或圖框速率及/或重建構保真度(或品質)。增強層經階層式組織,且可(或可不)取決於較低層。在一些實例中,可使用單一標準編解碼器來寫碼不同層(例如,使用HEVC、SHVC或其他寫碼標準編碼所有層)。在一些實例中,可使用多標準編解碼器來寫碼不同層。舉例而言,可使用AVC來寫碼基礎層,而可使用對HEVC標準之SHVC及/或MV-HEVC擴展來寫碼一或多個增強層。
區塊假影為當圖像最初由靜態或視訊攝影機捕捉時並不存在於圖像中之水平及豎直不連續性。區塊假影可由中等至高壓縮所引起,且可引起圖像之經重建構版本具有由圖塊構成之外觀。在具有高對比度的圖像之區域中,平鋪效應可經遮罩,但在圖像之平坦或均勻區域中,平鋪可特定可辨。在視訊中,區塊假影可歸因於在相繼圖框中之不同位置中的不連續性而觀測為移動或閃爍。
區塊假影之一個來源為對框內預測及框間預測誤差的基於區塊之變換寫碼(其可包括變換及量化)。變換係數之粗略量化可引起區塊邊界處之視覺上干擾不連續性。對於視訊,經運動補償之預測為區塊假影之另一潛在來源。經運動補償之區塊係藉由複製來自可能不同參考圖框之不同位置的經內插像素資料而產生。正被複製的像素資料可能並不係正產生的像素之完美匹配,因此,所複製資料塊之邊界上的不連續性可出現。
解區塊可在圖像經重建構之後執行,以便減少區塊假影。舉例而言,解區塊藉由濾波、削減、其組合及/或任何其他方式修改靠近每一區塊邊界定位的樣本之值,使得不連續性經平滑且因此並不可見。
在視訊壓縮中,解區塊可在預測迴路外部執行,在此情況下解區塊可對於顯示器緩衝器操作。替代地或另外,解區塊可在預測迴路中執行,使得經解區塊圖框用作用於將來圖框之運動補償的參考圖框。兩種方法提供所顯示視訊之較佳主觀品質,而後一方法亦供應客觀效能之益處,此係因為藉由使用經解區塊參考圖框而改良框間預測之準確度。
舉例而言,HEVC中之解區塊為迴路內處理。在一些實例中,當邊界:(1)為寫碼單元(CU)、預測單元(PU)或變換單元(TU)之邊界,及(2)具有為八的倍數之x座標及y座標時,解區塊應用於區塊之間的邊界。第二條件意謂待解區塊的兩個平行相鄰邊界之最小距離為八個像素,其促進較佳並行處理。待處理之邊界可分成多個不重疊四樣本片段,其接著為解區塊應用於的資料單元。
在以下論述中,將論述對片段之解區塊操作,其中片段假設為豎直。下文論述之解區塊技術亦可對水平片段執行,且此等技術基本遵循下文針對豎直片段論述的相同處理程序。
圖2包括可為經編碼視訊圖框之部分的區塊之群組200的圖。區塊之群組200包括第一區塊(其將被稱作左邊區塊或P 202區塊)及第二區塊(其將被稱作右邊區塊或Q 204區塊)。P 202區塊及Q 204區塊表示彼此相鄰的經編碼視訊圖框中之區塊,且因此共用邊界206。在一些實例中,P 202區塊及Q 204區塊為相同的大小,且在一些實例中,諸如圖2中所說明,P 202區塊及Q 204區塊大小不同。應注意「P」及「Q」為用於相鄰區塊之習知術語,且其他標記(諸如左右)可用以指區塊。
片段210為可比邊界206之全長短的邊界206之區段。舉例而言,片段210長度可為四個像素(其亦可被稱作樣本)。當處理片段210時,可檢驗P 202及Q 204區塊的寫碼條件,諸如運動向量、參考索引及/或非零變換係數之存在以及其他實例。邊界強度接著可基於寫碼條件而判定。邊界強度表示強區塊假影沿片段210可出現的可能性。作為實例,邊界強度值可為0,意謂P 202及Q 204區塊之寫碼條件不引起區塊假影,且不必執行用於片段210之解區塊。作為另一實例,邊界強度值可為2,此意謂P 202及Q 204區塊中之寫碼條件可引起嚴重區塊假影,且應應用強濾波。作為另一實例,邊界強度值可為1,此意謂一些區塊假影可沿片段210存在。在2014年8月施普林格國際出版之V. Sze, M. Budagavi, G. Sullivan「高效率視訊寫碼(HEVC):演算法及架構」的章節7.2.2.1中進一步論述邊界強度判定。
與用於樣本之明度分量相比,不同邊界強度值可用於色度分量。舉例而言,對於色度分量,當P 202區塊或Q 204區塊經框內寫碼時,邊界強度值等於2,否則,邊界強度值等於0。
明度分量可以不同於色度分量之方式處理。舉例而言,如上文所論述,片段210具有區塊假影之可能性可基於P 202及Q 204區塊之寫碼條件來估計。但寫碼條件可僅僅提供區塊假影之嚴重度的概算值。解區塊是否應應用於片段210,及應應用的解區塊濾波之數量可藉由分析靠近片段210之樣本的值來更精確地判定。
圖3包括說明沿左邊(或P 302)區塊與右邊(或Q 304)區塊之間的邊界之片段310的像素或樣本之實例的圖。在此實例中,片段310長度為四個樣本。亦在此實例中,遠離片段310多達三個位置的來自P 302區塊之p樣本312及來自Q 304區塊之q樣本314正被分析。在其他實例中,可考慮更多或更少樣本。在圖3之實例中,樣本之位置係相對於片段310指示,其中較接近於片段310的位置具有較低值,且較接近於片段310之頂部的位置具有較低值。
是否對片段310執行解區塊首先可藉由計算靠近片段310的四個樣本之二次導數判定。在圖3中,可用於計算二次導數之四個樣本已帶圓圈(p 1 , 0p 1 , 3q 1 , 0q 1 , 3 )。在其他實例中,可使用靠近片段310之其他樣本。二次導數的和(與臨限值β相比,以下等式(1)中所說明)可用以判定解區塊是否應應用於片段310。
Figure 02_image001
(1)
如等式(1)中所提供,若所選擇樣本之四個二次導數的和小於臨限值β,則將對片段執行解區塊。當和大於或等於臨限值時,則片段310可能在色彩及/或紋理非均勻的圖像之區域中(例如區域外觀並不平坦)。在此區域中,區塊假影可能由本端樣本之非均勻性遮罩,及因此可並不需要解區塊。應注意即使當先前判定之邊界片段值為非零時仍可進行不執行解區塊之決策。
當片段310將被解區塊時,可使用強或正常濾波。以下等式(2-1)至(2-6)可用以判定濾波模式。當所有六個等式為真時,則圍繞片段310的區域可能非常均勻(例如外觀平滑)及因此區塊假影可能高度可見。因此,當所有六個等式為真時,則使用強濾波模式。否則,使用正常濾波模式。
Figure 02_image003
(2-1)
Figure 02_image005
(2-2)
Figure 02_image007
(2-3)
Figure 02_image009
(2-4)
Figure 02_image011
(2-5)
Figure 02_image013
(2-6)
在等式(2-1)至(2-6)中,tC 為削減參數,其在下文進一步論述。
在各個實例中,上文所論述之邊界強度判定及基於等式(1)及等式(2-1)至(2-6)進行的決策係在片段層級處進行。一旦已選擇濾波模式(強或正常),對於諸如圖3中說明的豎直片段310,就逐線應用濾波(對於水平片段,逐行應用濾波)。
圖4包括說明來自沿左邊(或P 402)區塊與右邊(或Q 404)區塊之間的邊界之片段410的樣本之四個線(在此實例中)中的像素或樣本之一行的圖。樣本之線包括來自P 402區塊的p樣本422之集合及來自Q 404區塊的q樣本424之集合。在其他實例中,可考慮一線中之更多或更少樣本。在圖4之實例中,關於片段410之樣本的位置由下標指示。
在以下論述中,假設可對於沿片段410之額外線執行相同操作,描述用於一線之操作。
在一些實例中,當強濾波模式應用於明度分量上時,片段410之任一側的三個樣本被處理。舉例而言,對於來自P 402區塊之樣本p 0p 1p 2 ,經更新(例如經濾波)值p 0 '、p 1 '及p 2 '可使用低通濾波來計算,如以下等式(3-1)至(3-3)中所說明。
Figure 02_image015
(3-1)
Figure 02_image017
(3-2)
Figure 02_image019
(3-3)
在一些實例中,經濾波樣本值p i ’ (i=0,1,2)經削減至範圍[p i -2tC, p i +2tC, ]內。當變化大於tC 時,削減可將變化限制於樣本。
來自Q 404區塊之樣本q 0q 1q 2 亦可藉由針對p 0p 1p 2 分別代入q 0q 1q 2 使用等式(3-1)至(3-3)來處理。
在一些實例中,當使用正常濾波模式時,片段410之任一側的一個或兩個樣本被處理。對於片段410之左邊的樣本,可檢查以下等式(4-1)中之條件。當條件為真時,接著將處理p 0p 1 ,否則將僅處理p 0 。對於片段410之右邊的樣本,以下等式(4-2)之條件可用以判定是q 0q 1 將被處理,抑或q 0 僅僅將被處理。因為自待在片段410之另一側處理的哪些樣本獨立地判定待在該片段之一側處理的哪些樣本,所以有可能處理片段410之任一側的不同數目個樣本。
Figure 02_image021
(4-1)
Figure 02_image023
(4-2)
為處理p 0q 0 ,如等式(5)中所提供,首先計算中間值δ:
Figure 02_image025
(5)
當δ之絕對值大於或等於十倍tC 時,邊界被視為自然邊緣,其應被保留。在此情況下,則並不對當前線執行解區塊。當δ小於十倍時,則δ經削減至-tC tC 之範圍內,如等式(6)中所示。
Figure 02_image027
(6)
p 0q 0p 0 ′及q 0 ′的經更新或經濾波值可藉由加上及減去∆0 而計算,如以下等式(7-1)及(7-2)中所說明:
Figure 02_image029
(7-1)
Figure 02_image031
(7-2)
以下等式(8-1)及(8-2)可用以處理p 1q 1 樣本以產生經更新或經濾波版本p 1 ′及q 1 ′。
Figure 02_image033
(8-1)
Figure 02_image035
(8-2)
在一些實例中,色度分量之解區塊可基於邊界片段值,且不需要對樣本之分析。在片段410之任一側的第一樣本p 0q 0 可使用以上等式(7-1)及(7-2)來處理。對於色度分量,∆0 可如以下等式(9)中所提供而計算:
Figure 02_image037
(9)
現將描述臨限值β及tC 。為避免過多濾波,參數β及tC 用於解區塊處理程序,如上文所描述。臨限值β用於控制應執行解區塊所藉以的方式。舉例而言,β可用以判定片段是否被解區塊,是否應使用強或正常解區塊,片段之一側的一個或兩個樣本是否應被處理,等。當β或經按比例調整之β達到或超出(參見例如等式(1)、(2)及(4))時,本端樣本值改變較大數量,且更保守解區塊經應用以保留初始圖像中之細節。當β未超出時,則本端樣本值具有較小變化(例如樣本較平滑),且可更積極地執行解區塊。
削減值tC 主要用於控制樣本量值之最大變化(除等式(2-5)及(2-6)中之外)。在正常濾波模式或用於色度之濾波中,樣本量值之變化對於片段之一側的第一樣本(適用於明度及色度)不應超過±tC ,或對於第二樣本(僅僅適用於明度)不應超過±tC /2。在強濾波模式中,其中暗示量值之較大變化,最大變化對於在片段之任一側處理的三個樣本為±2tC
β及tC 之值主要取決於來自左邊區塊P 402及右邊區塊Q 404之QP值。舉例而言,來自P 402及Q 404之QP的平均值(標示為QP ave =(QPP +QPQ +1)>>1)可用作搜尋兩個一維查找表(LUT)的索引,一個查找表用於β及tC 中之每一者。儘管用於發現tC 值之索引可藉由加上二(例如QP ave +2)來調整,但當邊界強度值等於2時,判定β及tC 之值的主導因數將為QPave 。在兩個LUT中,條目值隨搜尋索引之值單調增加,此意謂較高QP ave 與β及tC 之較大值相關。因此較強解區塊可能出現在QP ave 為高時,且允許較大變化量值。另一方面,較低QP值可導致β及tC 之較小或可能零值。運用低QP值寫碼之區塊可能具有幾個區塊假影,因此幾乎沒有解區塊可需要用於此等區塊之間的邊界。
在一些實例中,用以發現LUT中之β及tC 的索引(標示為idx βidxtc )可分別由兩個參數beta_offset_div2及tc_offset_div2調整,如以下等式(10-1)及(10-2)中所說明:
Figure 02_image039
(10-1)
Figure 02_image041
(10-2)
參數beta_offset_div2及tc_offset_div2可在截塊標頭中或在圖像參數集(PPS)中發送。此撓性給予編碼器適應取決於序列特性、編碼模式及其他因數之解區塊強度的能力。
在HEVC中,可在兩個級中執行解區塊:首先,圖像中之所有豎直區塊邊界經濾波;接著,所有水平區塊邊界經濾波。在第二級中,用於模式決策及濾波之樣本為已由第一級修改的樣本。在每一級中,邊界為至少八個樣本間隔。解區塊中所涉及之樣本可包括在邊界之每一側的多達四個樣本,待濾波之三個加用於濾波及模式決策進行之一個。解區塊相鄰邊界中所涉及之樣本因此不重疊,且每一邊界可獨立及與其他邊界並行地解區塊。
在HEVC中,解區塊操作可包括濾波靠近區塊邊界之樣本及削減樣本幅值之變化。可使用濾波器強度之三個層級中的一者:強、正常或零(例如無濾波),其中選擇的濾波器係基於靠近區塊邊界的樣本之本端活動性(例如當存在較小本端活動性時應用較強濾波,且當存在較多活動性時應用較小濾波;參見等式(1)及(2))。對於強濾波模式,使用低通濾波器濾波在區塊邊界之每一側的三個樣本(參見等式(3))。對於正常濾波模式,至少最接近邊界之樣本經濾波,且若較接近於邊界的樣本平滑,則在任一側的第二最接近樣本可經濾波(參見等式(4))。削減係由參數tC 控制。當應用強濾波時,樣本量值之變化不大於t 2 C ,且當應用正常濾波時,來自邊界之第一及第二樣本的量值之變化分別不大於tC tC /2 (參見等式(6)至(8))。不同邊界強度值可改變tC ;舉例而言,具有邊界強度值2之片段可具有比具有邊界強度值1之片段大的tC
HEVC方案解區塊基本上遵循H.264/AVC解區塊之框架。HEVC方案因此繼承H.264/AVC之主特徵,諸如基於寫碼條件之邊界強度、自強向下至零的多層級濾波強度,以及為相關參數β及tC 的QP及邊界強度,以及其他實例。與H.264/AVC解區塊相比較,HEVC解區塊中之新的設計元件實現較容易並行處理及與HEVC之較大區塊大小寫碼結構的較佳擬合,但不大量專用於改良寫碼效率。因此,HEVC解區塊(其被視為2013年HEVC之最後定案的計算複雜度與寫碼效率之間的良好折衷)可鑒於自2013年以來在硬體方面的改良而過度簡化。計算硬體之計算資源可經利用用於寫碼效率之大量改良,同時仍維持可並行化的解區塊方案。可經進一步改良的HEVC解區塊中之態樣的實例經列舉如下。
作為第一實例,使用對應於濾波強度之三個層級的僅僅三個層級來表示邊界區域之平滑度(例如像素之均一性)可能太粗略。
作為第二實例,片段之四個線中之僅僅兩個用於判定解區塊模式及選擇濾波器,且在每一線中,使用來自片段之任一側的僅僅四個樣本。由於一些視訊編解碼器中之區塊大小可為多達128×128,所以使用樣本之此較小部分用於模式決策可能並不非常好地反映邊界區域之真實活動性,且可使決策處理程序對雜訊敏感。
作為第三實例,片段之任一側的待濾波之樣本可多達三個,但可少至一個,此可能並不足以解區塊大區塊。
作為第四實例,當使用強濾波模式(參見等式(3))時,五個預定義4抽頭或5抽頭濾波器經預先指派給三個樣本。在正常濾波模式中,相同的五個預定義濾波器經預先指派給兩個樣本(參見等式(5)至(8))。濾波器之此有限數目、其短長度及濾波器可被選擇的非撓性可導致解區塊處理程序中之較低寫碼效率。
作為第五實例,具有不同邊界強度之片段可具有非常不同的本端活動性,但共用相同解區塊濾波器(但削減值對於等於2之邊界強度值更大)
作為第六實例,HEVC解區塊方案不區別P區塊與Q區塊。濾波強度由P及Q之平均二次導數判定(參見等式(1)及(2)),且參數β及tC 之值取決於P及Q的平均QP。同一方式處理P及Q區塊可提供不良結果,特定言之在一個非常平滑且另一個具有高細節度之情況下。
本文所描述之系統及技術可解決上文提及之與解區塊相關聯的問題,同時仍友好並行化並具有合理的計算複雜度。系統及技術可將濾波處理程序應用於藉由壓縮、模糊或其他缺陷失真的視訊圖框,以便改良經重建構視訊之客觀及主觀品質。技術及系統可應用於現有視訊編解碼器(例如,進階視訊寫碼(AVC)、高效率視訊寫碼(HEVC)或任何其他合適之視訊編解碼器)中之任一者,或可經提議為將來視訊寫碼標準之寫碼工具。系統及技術亦可作為後處理方法用於自標準或專有編解碼器輸出的視訊圖框上。本文所描述之系統及技術的特徵之實例如下。
作為第一實例,P區塊及Q區塊之本端活動性的平均值及/或差異可聯合地用以決定用於片段之濾波模式。在一個實例中,平均值及/或差異經量化至七個層級,從而形成28個可能組合。片段因此可經分類為28個類別中之一者,其中每一類別具有不同解區塊操作。
作為第二實例,片段之任一側的更多樣本可用於判定本端活動性。因此可進行較佳分類及濾波模式決策。舉例而言,可使用片段之所有四個線,且在每一線中,可使用邊界之任一側的多達八個樣本。
作為第三實例,當處理片段之一個線時,片段之任一側的多達四個樣本可經濾波。
作為第四實例,邊界強度值得以簡化。舉例而言,在經框間寫碼截塊(例如B截塊及P截塊)中,邊界強度值可僅僅為1或0。在此等實例中,邊界強度值2僅僅出現在經框內寫碼截塊中。
作為第五實例,濾波器候選者可基於邊界強度值。所允許濾波器之數目亦可取決於邊界強度值。在一個實例中,四個濾波器經預定義用於具有等於2之邊界強度之片段;對於等於1之邊界強度,存在十五個。應注意用於等於2之邊界強度的四個濾波器之集合為用於等於1之邊界強度的十五個濾波器之子集。所有濾波器為11抽頭長。
作為第六實例,濾波器並未經指派給類別。最佳濾波器可實際上選自在截塊/圖塊/圖像/序列層級處的濾波器之集區。
可關於邊界及片段應用本文中所描述的解區塊方案。在下一代視訊寫碼標準中,CU、PU及TU之概念可視為相同的(例如,CU並不進一步分裂成PU或TU)。歸因於撓性區塊分裂結構,CU之形狀不一定必須為如HEVC中之正方形;實際上,CU可為具有長如128個樣本及短如4個樣本之邊的矩形。
本文中描述的所提議解區塊方案可應用於CU之邊界,其可並不係至少八個樣本間隔。然而,允許相鄰邊界更靠近不損失並行化之優點,如以下進一步論述。待處理之邊界(不管如何長)可分成多個非重疊4樣本片段,其中每一片段接著為待處理之最小單元。
在以下論述中,將論述對於豎直片段之解區塊操作。水平片段之處理基本上相同。
可基於截塊係經框內寫碼抑或經框間寫碼而判定邊界強度。對於經框內寫碼截塊,邊界強度推導處理程序與HEVC解區塊中之處理程序相同:所有片段具有等於2之邊界強度並應經濾波。對於經框間寫碼截塊,邊界強度推導經簡化,且邊界強度可僅僅為0或1。當滿足以下條件中之至少一者時,邊界強度等於1,否則邊界強度等於0:
1. 相鄰區塊中之至少一者經框內寫碼;
2. 相鄰區塊中之至少一者具有非零變換係數;
3. 相鄰區塊之運動向量之間的絕對差值大於或等於一個整數明度樣本;或
4. 相鄰區塊中之運動預測指代不同參考圖像或運動向量之數目係不同的。
當邊界強度為0時,對於該片段跳過解區塊操作(例如不執行解區塊)。否則,應用下文論述之操作。
如上文所提及,片段之本端活動性可用以判定濾波模式。本端活動性量測靠近區塊邊界之區域的平滑度(例如均一性)或複雜度。本端活動性可以不同方式計算,諸如運用一次導數或二次導數。二次導數可對雜訊較不敏感,且因此二次導數用於以下等式。
如圖5 (其展示計算二次導數中所涉及之樣本)中所示,使用等式(11)計算虛線框中之每一樣本的二次導數之絕對值:
Figure 02_image043
(11)
因此,區塊P之內部活動性(標示為PA )經表示為虛線框中之所有
Figure 02_image045
的平均值,如等式(12)中所示,
Figure 02_image047
(12)
其中N為所涉及的樣本之總數目,亦即在此情況下24。相似地,區塊Q之內部活動性(標示為QA )可使用等式(13)來計算。
Figure 02_image049
(13)
應注意最接近區塊邊界(p0,j q0,j )之樣本並不包括於計算PA 或QA 中,此係因為此等樣本之二次導數係由跨越邊界之樣本支援且可並不精確反映任一側之內部活動性。
亦考慮其中區塊P或區塊Q為並不足夠寬的情況。舉例而言,當P或Q之寬度(標示為WP 及WQ )為4或8時,在計算二次導數中使用的遠端樣本(諸如p7,j q7,j )跨越或靠近相鄰邊界。在此等情況下,等式(12)及(13)中之i座標對於PA 不應超過WP /2或對於QA 不應超過WQ /2,亦即座標i為對於PA 為多達min(6,WP /2)及對於QA 為min(6,WQ /2)。
可執行片段分類。舉例而言,片段可基於PA 及QA 之值分類為類別。如已敍述,PA 及QA 之平均值及差異(標示為avePQ diffPQ )聯合地用於分類:
Figure 02_image051
(14)
Figure 02_image053
(15)
在等式(14)及(15)中,n為表示avePQ diffPQ 在其用於分類之前經量化程度如何的變數,且可經定製。在一個說明性實例中,n經設定為1。
由於PA 及QA 皆具有非負值,所以diffPQ 不能大於avePQ 。因此,(avePQ ,diffPQ )之所有可能組合係在圖6之陰影區域(其展示(avePQ ,diffPQ )之可能組合)中。
然而,(avePQ ,diffPQ )之分佈實際上遠離均勻。組合之大部分出現在低avePQ 及低diffPQ 區域(圖6中之曲線的左下方區域)中,圖6中之曲線的右上方區域中的情況可非常稀疏。應用此觀測,該等技術不對(avePQ ,diffPQ )執行均勻2-D量化,且實際上在如例如圖7 (其展示log域中之量化(avePQ ,diffPQ ))中所示之對數(log)域中量化(avePQ ,diffPQ )。儘管區域對於不同類別係非常不同的,但與藉由使用均勻量化相比,(avePQ ,diffPQ )可更均勻分佈至每一類別中。可能需要執行在log2 域中之量化,且量化之特定實例經展示於等式(16)及(17)中,
Figure 02_image055
(16)
Figure 02_image057
(17)
其中offsetave offsetdiff 為用以調整位元起點之兩個參數。在一個實例中,offsetave offsetdiff 兩者經設定成2。可能需要將levelave 值及leveldiff 值兩者削減至6,此係因為在範圍0至6外的levelave leveldiff 係非常罕見的。考慮到leveldiff 不大於levelave ,吾人可容易地發現存在(levelave ,leveldiff )之總共28個不同組合。待解區塊之每一片段具有其自身levelave leveldiff 組合,其用以將該片段與類別關聯。
亦可執行濾波器選擇。類似於HEVC解區塊,藉由逐線濾波解區塊片段。此處,僅僅描述如何濾波一個線。給定待濾波之線,在區塊邊界之任一側的多達M(例如M=4)個樣本可藉由濾波來修改(對於實例,參見圖4)。然而,在一側的待濾波之樣本不應跨越區塊寬度之一半,此係因為一個片段之經濾波樣本另外將與相鄰片段之彼等樣本重疊,此可使並行處理複雜化。舉例而言,若區塊P之寬度為4,則在區塊P側之僅僅兩個樣本經濾波。更特定言之,待濾波之樣本的數目對於區塊P為min(M,WP /2)且對於區塊Q為min(M,WQ /2)。
在HEVC解區塊中,用於樣本(圖4中之p0 p3 q0 q3 )之濾波器選擇取決於其距片段之距離,此意謂pi qi 共用同一濾波器。假設區塊P及區塊Q之本端活動性相似。然而,基於研究,假設不始終保持。實際上,區塊P及區塊Q常常可具有極其不同本端活動性(亦即,levelave 等於leveldiff ),且為此原因兩個區塊可藉由智慧編碼策略分裂。
在本申請案中,比較區塊P及區塊Q之本端活動性(PA 及QA )(參見等式(12)及(13))。若PA 小於QA (意謂區塊P較平滑),則區塊P中之樣本將具有類型0濾波且區塊Q中之樣本將具有類型1濾波,且反之亦然。對於每一濾波類型,4個樣本(或若區塊寬度為4,則2個樣本)具有其自身濾波器,且因此多達8個不同濾波器可用於解區塊一個線。
總而言之,可在選擇右濾波器用於一樣本之前判定四個引數:(1及2)片段之類別,其係具有levelave leveldiff 的二維,(3)濾波類型(亦即,類型0或類型1),及(4)距片段之距離(亦即,最接近、次最接近等),標示為pos 。四個引數之所有可能組合的總數目為224 (28×2×4)。224條目4-D LUT (其可由編碼器判定、寫碼及傳輸)儲存所有可能情況的濾波器索引(例如,每一條目儲存對應組合之一個濾波器索引),且採用四個引數作為用於搜尋之索引。
在一些情況下可定義及使用預定義濾波器。不同於HEVC解區塊(其中不同邊界強度僅僅形成削減值之差異),使用本文中所描述之技術的邊界強度值對於濾波器選擇具有直接影響。由於靠近BS2片段及BS1片段的區域之本端活動性可能非常不同,所以11抽頭FIR濾波器之兩個集合經預定義用於其,分別標示為用於BS2片段之FilterSetBS2及用於BS1片段之FilterSetBS1。由於BS2片段僅僅在經框內寫碼截塊中且BS1片段僅僅在經框間寫碼截塊中,所以濾波器之一個集合(FilterSetBS1或FilterSetBS2)用於解區塊某一截塊。
一或多個(例如所有)預定義濾波器可藉由離線訓練而獲得。對於FilterSetBS2,嘗試若干不同集合大小,例如,濾波器集合包括4,8,16,…,或64個預定義濾波器,且發現效能並不隨濾波器集合大小之增加而按比例改良。考慮用以發信濾波器索引之額外負擔位元,大的大小之濾波器集合可並不係效能與額外負擔大小之間的良好折衷,在此情況下4個濾波器可經預定義於FilterSetBS2中。包括恆等濾波器(其等效於無濾波),FilterSetBS2包括5個濾波器。圖14至圖16分別給出具有大小16、8及4之FilterSetBS2的實例。在一些實例中,可使用圖16中的FilterSetBS2。
對於FilterSetBS1,發現效能對濾波器集合大小增加多一點敏感,尤其當濾波器集合大小小於16時。因此,可判定選擇在FilterSetBS1中預定義15個濾波器。包括恆等濾波器,FilterSetBS1包括16個濾波器,如圖17中所示。應注意FilterSetBS2為FilterSetBS1之子集(比較圖16與圖17中之前四個濾波器),此係因為具有框內相鄰區塊之BS1片段可具有與BS2片段相似之本端活動性且可由來自FilterSetBS2之濾波器較佳解區塊。
應注意在圖14至圖17中,濾波器可直接用於濾波區塊P中之樣本,但需要在正用於濾波區塊Q中之樣本之前左右翻轉。給定濾波器,突出顯示之抽頭(圖14至圖18中粗體字及帶下劃線)為濾波器中心,其應乘以待濾波之樣本。如可見,此等預定義濾波器經設計以與遠離片段相比具有更多接近片段及甚至跨越片段的支援樣本。
現在描述濾波處理程序。首先描述如何濾波區塊P中之樣本pi ,且該濾波器標示為向量h={h -4 ,h -3 ,…,h 0 ,h 1 , …,h 6 }。經濾波樣本pi ′可藉由使用等式(18)而獲得如下。
Figure 02_image059
(18)
如可見,濾波pi 之支援樣本包括pi 自身、來自左邊的四個樣本及來自右邊的六個樣本。然而,若區塊P或區塊Q不足夠寬,則支援樣本可定位於兩個區塊外部。圖8 (其展示其中支援樣本定位於P或Q外部的實例)給出p 0 將經濾波且P及Q之寬度兩者均為4的實例。可能需要避免此情形,此係因為區塊Q右邊之樣本(諸如圖8中的p 5p 6 )可能尚未經重建構,且區塊P左邊之樣本(諸如圖8中的p - 4 )(儘管其可能已經重建構)可在截塊或圖塊邊界外部,且因此亦不可用。為解決此問題,11點緩衝器可經建立以儲存用於濾波pi 之所有支援樣本,標示為buf(元素為buf(j), j=‑4,‑3,…,6)。若pi -4 ,pi -3 ,…,pi ,pi +1 ,…,pi +6 為全部在區塊P或區塊Q內部,則buf為{pi -4 ,pi -3 ,…,pi ,pi +1 ,…,pi +6 };否則,定位於P及Q外部的樣本可藉由填補而獲得。在圖8之實例中,buf為{p -3 ,p -3 ,p -2 ,p -1 ,p 0 ,p 1 ,p 2 ,p 3 ,p 4 ,p 4 ,p 4 }。因此,等式(18)經重新寫為等式(19)。
Figure 02_image061
(19)
除預定義濾波器應在正被使用之前左右翻轉以外,用於區塊Q中之樣本qi 之濾波處理程序相似。
實際上,濾波處理程序可實施於整數算術中。因此,圖17中的實數值濾波器係數可藉由將濾波器係數乘以2N及捨入而轉換為整數,且結果可經人工調整以確保濾波器增益恰好為2N。此處,N可設定為9,以使得與使用初始實數值濾波器係數相比較,濾波可實施於32位元寬度中而沒有任何明顯效能降級。將整數濾波器標示為f={f -4 ,f ‑3 ,…,f 0 ,f 1 ,…,f 6 },且如等式(20)中重新寫等式(19)。圖18展示FilterSetBS1之整數表示,其中N為9。
Figure 02_image063
(20)
在另一實施例中,比較區塊P及區塊Q之本端活動性。若區塊P之本端活動性較小,則應用如上文所描述之濾波處理程序。否則,支援樣本(亦即,buf)在使用之前左右翻轉。接著,濾波應用於經翻轉樣本。濾波之輸出再次反向左右翻轉,且變為解區塊之輸出。
現在描述削減及最終輸出。可如等式(21)中計算由濾波引起的樣本量值之變化,
Figure 02_image065
(21)
其中pp ′分別為在濾波之前及之後的樣本值。∆p 之值不應超過一範圍,以避免過多濾波,且因此應經削減。不同於HEVC解區塊,其中±tc 取決於QP及邊界強度,使用本文中所描述之技術,tc 係在圖像/截塊/圖塊層級處發信。tc 之值可獨立於邊界強度及類別索引。另外,tc 對於濾波水平及豎直邊界可係不同的。在一個實例中,兩個削減值tC,VER tC,HOR 係在圖像層級處發信。在第一級中,當所有豎直邊界經濾波時,tC , VER 用於削減,如等式(22)中所示。
Figure 02_image067
(22)
在第二級中,當所有水平邊界經濾波時,tC , HOR 用於削減,如等式(23)中所示。
Figure 02_image069
(23)
編碼器具有發現最佳tC,VER tC,HOR 之自由,且將其寫碼至位元串流中。在一個實施例中,編碼器可藉由如等式(24)中求解最佳化問題而最小化pout 與初始樣本之間的MSE,
Figure 02_image071
(24)
其中tc 為分別用於級1及級2之tC,VER tC , HOR i 為解區塊中所涉及之任何樣本;且s (i )為樣本i 之初始值。
在另一實施例中,pout p 之加權和用作最終輸出,如等式(25)中,
Figure 02_image073
(25)
其中w為非負加權因數,範圍介於0至1,且由編碼器判定並在位元串流中傳輸。
可使用並行化。如上文所描述,HEVC解區塊對於並行處理非常友好,此係因為在每一級中,解區塊一個邊界中所涉及之樣本不與解區塊任何其他邊界中所涉及之樣本重疊。為達成此目標,以下三個條件應滿足:
1. 一個片段之待濾波樣本不與任何其他片段之待濾波樣本重疊,此係因為在重疊位置處的樣本可另外經多次覆寫,且最終輸出取決於相鄰邊界之處理次序;
2. 一個邊界之經濾波樣本不應用作用於濾波任何其他片段之樣本的支援樣本;及
3. 一個邊界之經濾波樣本不應用以對任何其他片段進行解區塊評定決策(諸如分類、本端活動性計算及濾波器選擇)。
本文中所描述的技術滿足全部三個條件,即使待解區塊之邊界可能並非至少八個樣本間隔(上文關於本文中所描述的技術之發明內容所見)。因此,其亦允許並行化之容易方式,如HEVC解區塊進行的方式。細節說明如下。
關於條件1,如上文關於濾波器選擇所論述,待濾波之樣本的數目對於區塊P為min(4,WP /2)且對於區塊Q為min(4,WQ /2)。為此原因,滿足條件1。
關於條件2,如上文關於等式(18)及(19)所論述,儲存於buf中之支援樣本全部自當前解區塊級之輸入獲得。換言之,在級1中,buf使用經重建構樣本,且在級2中,buf使用級1之輸出樣本。由於buf未曾使用當前級中之經濾波樣本,所以條件2亦滿足。
以與條件2相同之方式滿足條件3。如上文關於計算本端活動性所介紹,用於本端活動性計算及分類之樣本全部為先前級之輸出。
可在一些情況下執行額外負擔最佳化。正確地解區塊圖像或截塊所需要的額外負擔可包括儲存用於類別、類型及位置之所有可能組合之224個濾波器索引的4-D LUT (上文關於濾波器選擇所見)及分別用於水平及豎直解區塊之兩個削減值(上文關於削減及最終輸出所見)。直接寫碼額外負擔及在位元串流中傳輸其可花費數百位元,其可能對於圖像或截塊代價太大。本文中所描述之技術以三種有損耗方式(預設合併、撓性合併及時間額外負擔預測)壓縮額外負擔。
關於預設合併,給定類別、類型及位置情況下,對於如何選擇濾波器進行一些研究,且進行以下觀測:
1. 位置2及位置3處之樣本(參見圖4,p 3q 3 在位置3上;p 2q 2 在位置2上)極可能選擇同一濾波器索引。因此在此等兩個位置處之樣本可經強迫共用同一濾波器索引,且用於發信位置3之濾波器索引(56索引)之位元經節省;
2. 當邊界強度等於1且levelave 為6 (此意謂靠近片段之樣本方差極高)時,不管leveldiff 、類型及位置係什麼,主要選擇恆等濾波器(亦即,無濾波)。此選擇係適當的,此係因為區塊假影經很好遮罩且不需要解區塊。因此當邊界強度等於1且levelave 為6時,濾波器索引經強迫為0,且不需要發信,此節省56索引;及
3. 區塊P及區塊Q未被區分,此意謂給定某一levelave ,具有不同leveldiff 之類別經合併(參見圖9),且類型0及類型1亦經合併。藉由進行此,本文中所描述的技術具有類似於HEVC解區塊之簡化模式,其不區別區塊P及Q。在此簡化模式中,具有用於經框間寫碼截塊的18個條目(6個levelave 層級乘3個不同位置)或21個條目(7個levelave 層級乘3個不同位置)之2-D LUT經寫碼,此經輕加權且在大部分寫碼條件中負擔得起。
撓性合併亦可經執行。具有上文所描述之預設合併的本文中所描述之技術顯著勝過HEVC解區塊。然而,若位元之較大預算係可用的,則可能組合不必因此積極地合併。實際上,編碼器具有以更撓性方式合併其的自由以儘可能發送少的濾波器索引,同時仍維持良好速率-失真(R-D)效能。然而,在此模式下,不僅包括位元串流中寫碼之濾波器索引,而且亦包括表示組合應如何合併之資訊。以下實施例展示此可如何在一個說明性實施方案中進行。
首先,區塊P及區塊Q未被區分,僅當leveldiff 不超過臨限值時,對於相對較小leveldiff ,意謂兩個區塊中之相似本端活動性且因此該兩個區塊可共用濾波器索引之相同集合。圖10(其展示對於每一levelave ,合併具有不超過2之不同leveldiff 之類別)給出等於2之臨限值的實例。臨限值經寫碼至位元串流中。圖9展示對於每一levelave ,合併具有不同leveldiff 之類別。
第二,對於具有不超過臨限值之leveldiff 的組合,其濾波器索引經儲存於具有用於經框間寫碼截塊之18個條目及用於經框內寫碼截塊之21個條目的2-D LUT中。2-D LUT大小可經進一步減小,此係因為位置2之樣本及位置1之樣本有時可共用同一濾波器索引。因此對於每一levelave 層級,旗標經發信以指示位置2之樣本及位置1之樣本是否共用同一濾波器索引。若其為真,則用於一多個濾波器索引之額外負擔位元可被節省。
第三,亦可合併具有超過臨限值之leveldiff 的組合。在一個實施例中,類別經合併。舉例而言,(levelave ,leveldiff )=(4,3)與(levelave ,leveldiff )=(5,6)合併。對於另一實例,等於(3,4)、(4,3)及(4,4)的(levelave ,leveldiff )全部被合併。經合併類別之總數目(標示為M)被發信。在合併之前所有類別經指派整數數目(範圍0至M-1),指示其屬於的哪一合併類別。此等整數數目亦經發信。對於每一經合併類別,一個旗標經發信以指示是否合併類型0及類型1。若如此,則指示位置2之樣本及位置1之樣本是否合併的一多個旗標經發信。否則,兩個以上旗標經發信以指示位置2之樣本及位置1之樣本是否經合併分別用於類型0及類型1。
如上文所提及,亦可使用時間額外負擔預測。先前經寫碼圖像的4-D LUT及削減值經儲存並允許以再用於解區塊當前圖像。在編碼器側,當前圖像可選擇使用所儲存4-D LUT及削減值之一個集合,且僅僅發信所選擇集合之索引。若編碼器選擇不再次使用先前額外負擔,而是發送當前圖像之額外負擔,則所發送額外負擔可且可能需要經儲存用於將來使用。指示此時間額外負擔預測是否用於當前圖像的旗標首先經發信。解碼器首先接收知曉是否使用時間額外負擔預測的旗標。若如此,則接著接收索引,且對應於索引的4-D LUT及削減值之集合經提取以解區塊當前圖像。否則,解碼器接收一個4-D LUT及兩個削減值之集合,其用以解區塊當前圖像並儲存為一個預測以用於將來使用。
在另一實施例中,其可被稱作部分時間預測,僅僅4-D LUT (其與削減值相比在傳輸中代價更高)可以如上文所描述之相同方式暫時地再使用,且削減值在每一圖像之位元串流中傳輸。
在一個實例中,對於當前圖像/截塊,所選擇集合之索引可僅僅指具有相同及/或更小時間層索引之來自先前經寫碼圖像的4-D LUT。
在另一實例中,對於當前圖像/截塊,所選擇集合之索引可僅僅指來自包括於當前參考圖像清單中的經先前寫碼圖像之4-D LUT。
圖11包括說明用於寫碼視訊資料之實例處理程序1100之流程圖。舉例而言,處理程序1100可由包括記憶體及處理器之寫碼器件(例如能夠編碼及/或解碼之器件)實施。在此實例中,記憶體可經組態以儲存視訊資料,且處理器可經組態以執行圖11之處理程序1100之步驟。舉例而言,寫碼器件可包括可儲存指令的非暫時性電腦可讀媒體,該等指令在由處理器執行時可致使處理器執行處理程序1100之步驟。替代地或另外,非暫時性電腦可讀媒體可在其上儲存有指令,該等指令在由一或多個處理器執行時致使該一或多個處理器執行處理程序1100之步驟。在一些實例中,寫碼器件可包括用於捕捉視訊資料之攝影機及/或用於顯示視訊資料的顯示器。
在步驟1102處,處理程序1100包括獲得包括複數個經編碼視訊圖框之視訊資料。視訊資料可作為編碼處理程序或解碼處理程序之部分而獲得。
在步驟1104處,處理程序1100包括對於來自複數個經編碼視訊圖框中之經編碼視訊圖框的第一區塊判定第一區塊中之像素當中的第一活動性。
在步驟1106處,處理程序1100包括對於來自經編碼視訊圖框之第二區塊判定第二區塊中之像素當中的第二活動性,其中第二區塊在視訊圖框內緊接於第一區塊右邊。
活動性為像素之間的相似性之量測。第一活動性及第二活動性可使用應用於第一區塊中之像素及第二區塊中之像素的值的導數函數來判定。在一些實例中,第一區塊中之像素及第二區塊中之像素沿邊界之片段,該片段小於邊界之全長。在此等實例中,第一區塊中之像素及第二區塊中之像素可遠離邊界多達八個像素。
在步驟1108處,處理程序1100包括使用第一活動性及第二活動性判定第一區塊及第二區塊之平均活動性。
在步驟1110處,處理程序1100包括使用第一活動性及第二活動性判定第一區塊與第二區塊之間的活動性差異。在一些實例中,處理程序1100可進一步包括將非均勻量化應用於平均活動性及活動性差異。非均勻量化產生層級化平均活動性及活動性之層級化差異。舉例而言,平均活動性及活動性差異可各自經量化成0與6之間的值(包括端點)。選擇分類因此可包括使用層級化平均活動性及活動性之層級化差異。
在步驟1112處,處理程序1100包括使用平均活動性及活動性差異選擇第一區塊與第二區塊之間的邊界之分類。
在步驟1114處,處理程序1100包括使用分類選擇濾波器。在一些實例中,處理程序1100可進一步包括判定用於該第一區塊之一類型,該類型指示該第一區塊中之該等像素相似抑或相異。在此等實例中,選擇濾波器進一步包括使用該類型。在一些實例中,處理程序1100可包括基於第二區塊為不同於第一區塊之類型而選擇不同濾波器以用於第二區塊。
在一些實例中,處理程序1100可進一步包括對於來自第一區塊中之該等像素的特定像素判定特定像素距邊界之距離。在此等實例中,濾波器可基於該距離而進一步被選擇。在一些實例中,處理程序1100可進一步包括基於來自第一區塊中之該等像素的第二像素相較於特定像素具有距邊界不同之距離而選擇不同濾波器以用於該第二像素。
可藉由使用來自複數個濾波器索引當中之一濾波器索引選擇濾波器。在一些實例中,具有不同分類、類型或距邊界之距離的像素可使用同一濾波器,亦即具有同一濾波器索引。舉例而言,具有距邊界第一距離的像素可經強迫具有與具有距邊界第二距離的像素相同之濾波器索引,該第二距離不同於該第一距離。
在步驟1116處,處理程序1100包括將濾波器應用於第一區塊中之像素或第二區塊中之像素以使該等像素之間的轉變平滑。
在步驟1118處,處理程序1100包括在應用濾波器之後輸出第一區塊及第二區塊以將其加至經重建構視訊圖框。
在一些實例中,濾波器之索引包括於經編碼視訊資料中。舉例而言,當編碼時,濾波器索引可包括於經編碼位元串流中。作為另一實例,當解碼時,濾波器索引可自經編碼位元串流讀取。另外或替代地,可需要經編碼位元串流包括用於削減如本文所揭示之經濾波像素值的一或多個值(例如用於濾波豎直邊界之削減值及用於濾波水平邊界之削減值)。
在一些實例中,邊界強度值判定處理程序1100之步驟是否經執行用於特定邊界片段。當截塊為經框間寫碼截塊時,邊界強度值等於零或一。值零意謂無解區塊將被應用(例如處理程序1100不必被執行),且值一指示可使用濾波器之第一集合應用解區塊。當包括第一區塊及第二區塊之截塊為經框內寫碼截塊時,邊界強度值等於二。值二意謂可使用濾波器之第二集合應用解區塊。在一個實例中,濾波器之第一集合為一濾波器集合(例如16個濾波器之集合),且濾波器之第二集合為比第一集合更少的濾波器之一集合(例如五個濾波器之集合),其為第一集合之子集。
本文所論述之寫碼技術可實施於實例視訊編碼及解碼系統(例如,系統100)中。在一些實例中,系統包括提供稍後由目的地器件解碼之經編碼視訊資料的源器件。特定言之,源器件可經由電腦可讀媒體提供視訊資料至目的地器件。源器件及目的地器件可包含廣泛範圍之器件中之任一者,包括桌上型電腦、筆記型(例如,膝上型)電腦、平板電腦、機上盒、諸如所謂的「智慧型」電話之電話手機、所謂的「智慧型」板、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件或其類似者。在一些情況下,源器件及目的地器件可經裝備以用於無線通信。
目的地器件可經由電腦可讀媒體接收待解碼之經編碼視訊資料。電腦可讀媒體可包含能夠將經編碼視訊資料自源器件移動至目的地器件的任何類型之媒體或器件。在一個實例中,電腦可讀媒體可包含通信媒體以使得源器件能夠即時地將經編碼視訊資料直接傳輸至目的地器件的通信媒體。可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且將經編碼視訊資料傳輸至目的地器件。通信媒體可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全域網路)之部分。通信媒體可包括路由器、交換器、基地台或可用於促進自源器件至目的地器件之通信的任何其他裝備。
在一些實例中,經編碼資料可自輸出介面輸出至儲存器件。相似地,可由輸入介面自儲存器件存取經編碼資料。儲存器件可包括多種分散式或本端存取之資料儲存媒體中之任一者,諸如,硬碟機、Blu-ray光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體或用於儲存經編碼視訊資料之任何其他合適之數位儲存媒體。在另一實例中,儲存器件可對應於檔案伺服器或可儲存由源器件產生之經編碼視訊的另一中間儲存器件。目的地器件可經由串流或下載而自儲存器件存取所儲存之視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將彼經編碼視訊資料傳輸至目的地器件的任何類型之伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、FTP伺服器、網路附加儲存(NAS)器件或本端磁碟機。目的地器件可經由任何標準資料連接(包括網際網路連接)存取經編碼視訊資料。此連接可包括無線通道(例如Wi-Fi連接)、有線連接(例如DSL、電纜數據機等),或適於存取儲存於檔案伺服器上之經編碼視訊資料的兩者之組合。自儲存器件的經編碼視訊資料之傳輸可為串流傳輸、下載傳輸或其組合。
本發明之技術不必限於無線應用或設定。該等技術可應用於支援多種多媒體應用中之任一者的視訊寫碼,諸如,空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(諸如,經由HTTP動態自適應串流(DASH))、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上的數位視訊之解碼或其他應用。在一些實例中,系統可經組態以支援單向或雙向視訊傳輸從而支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在一個實例中,源器件包括視訊源、視訊編碼器及輸出介面。目的地器件可包括輸入介面、視訊解碼器及顯示器件。源器件之視訊編碼器可經組態以應用本文中所揭示之技術。在其他實例中,源器件及目的地器件可包括其他組件或配置。舉例而言,源器件可自外部視訊源(諸如,外部攝影機)接收視訊資料。同樣,目的地器件可與外部顯示器件介接,而非包括整合式顯示器件。
上述實例系統僅為一個實例。用於並行地處理視訊資料之技術可由任何數位視訊編碼及/或解碼器件來執行。儘管本發明之技術一般由視訊編碼器件執行,但該等技術亦可由視訊編碼器/解碼器(通常被稱作「編解碼器」)執行。此外,本發明之技術亦可由視訊預處理器執行。源器件及目的地器件僅為源器件產生經寫碼視訊資料以供傳輸至目的地器件的此類寫碼器件之實例。在一些實例中,源器件及目的地器件可以大體上對稱之方式操作,使得該等器件中之每一者包括視訊編碼及解碼組件。因此,實例系統可支援視訊器件之間的單向或雙向視訊傳輸,例如用於視訊串流、視訊播放、視訊廣播或視訊電話。
視訊源可包括視訊捕捉器件,諸如視訊攝影機、含有先前捕捉之視訊的視訊存檔及/或用以自視訊內容提供者接收視訊之視訊饋入介面。作為另一替代方案,視訊源可產生基於電腦圖形之資料作為源視訊,或實況視訊、存檔視訊及電腦產生之視訊的組合。在一些情況下,若視訊源為視訊攝影機,則源器件及目的地器件可形成所謂攝影機電話或視訊電話。然而,如上文所提及,本發明中描述之技術一般可適用於視訊寫碼,且可適用於無線及/或有線應用。在每一情況下,可由視訊編碼器編碼所捕捉、經預捕捉或電腦產生之視訊。經編碼視訊資訊可接著由輸出介面輸出至電腦可讀媒體上。
如所提及,電腦可讀媒體可包括暫態媒體,諸如無線廣播或有線網路傳輸;或儲存媒體(亦即,非暫時性儲存媒體),諸如硬碟、隨身碟、緊密光碟、數位視訊光碟、Blu-ray光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(圖中未示)可自源器件接收經編碼視訊資料並例如經由網路傳輸提供該經編碼視訊資料至目的地器件。相似地,諸如光碟衝壓設施之媒體生產設施的計算器件可自源器件接收經編碼視訊資料且生產含有經編碼視訊資料之光碟。因此,在各種實例中,電腦可讀媒體可理解為包括各種形式之一或多個電腦可讀媒體。
目的地器件之輸入介面自電腦可讀媒體接收資訊。電腦可讀媒體之資訊可包括由視訊編碼器定義之語法資訊,語法資訊亦由視訊解碼器使用,語法資訊包括描述區塊及其他經寫碼單元(例如,圖像群組(GOP))之特性及/或處理的語法元素。顯示器件將經解碼視訊資料顯示給使用者,且可包含多種顯示器件中之任一者,諸如陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。已描述本申請案之各種實施例。
編碼器件104及解碼器件112之特定細節分別展示於圖12及圖13中。圖12為說明可實施本發明中所描述之技術中之一或多者的實例編碼器件104之方塊圖。編碼器件104可(例如)產生本文中所描述之語法結構(例如,VPS、SPS、PPS或其他語法元素之語法結構)。編碼器件104可執行視訊截塊內之視訊區塊的框內預測及框間預測寫碼。如先前所描述,框內寫碼至少部分地依賴於空間預測以減少或移除給定視訊圖框或圖像內之空間冗餘。框間寫碼至少部分地依賴於時間預測以減少或移除視訊序列之鄰近或周圍圖框內的時間冗餘。框內模式(I模式)可指若干基於空間之壓縮模式中的任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可指若干基於時間之壓縮模式中的任一者。
編碼器件104包括分割單元35、預測處理單元41、濾波器單元63、圖像記憶體64、求和器50、變換處理單元52、量化單元54及熵編碼單元56。預測處理單元41包括運動估計單元42、運動補償單元44及框內預測處理單元46。對於視訊區塊重建構,編碼器件104亦包括反量化單元58、反變換處理單元60及求和器62。濾波器單元63意欲表示一或多個迴路濾波器,諸如解區塊濾波器、自適應迴路濾波器(ALF)及樣本自適應偏移(SAO)濾波器。儘管濾波器單元63在圖12中展示為迴路濾波器,但在其他組態中,濾波器單元63可實施為後迴路濾波器。後處理器件57可對由編碼器件104產生之經編碼視訊資料執行額外處理。本發明之技術可在一些情況下由編碼器件104實施。然而,在其他情況下,本發明之技術中之一或多者可由後處理器件57實施。
如圖12中所展示,編碼器件104接收視訊資料,且分割單元35將資料分割成視訊區塊。分割亦可包括(例如)根據LCU及CU之四分樹結構分割成截塊、截塊片段、圖塊或其他較大單元,以及視訊區塊分割。編碼器件104一般說明編碼待編碼之視訊截塊內的視訊區塊的組件。截塊可分成多個視訊區塊(且可能分成被稱作圖塊之視訊區塊集合)。預測處理單元41可基於誤差結果(例如,寫碼速率及失真等級,或其類似者)選擇複數個可能寫碼模式中之一者(諸如,複數個框內預測寫碼模式中之一者或複數個框間預測寫碼模式中之一者)以用於當前視訊區塊。預測處理單元41可將所得經框內或框間寫碼區塊提供至求和器50以產生殘餘區塊資料且提供至求和器62以重建構經編碼區塊以用作參考圖像。
預測處理單元41內之框內預測處理單元46可執行當前視訊區塊相對於與待寫碼的當前區塊相同之圖框或截塊中的一或多個相鄰區塊之框內預測寫碼以提供空間壓縮。預測處理單元41內之運動估計單元42及運動補償單元44執行當前視訊區塊相對於一或多個參考圖像中之一或多個預測性區塊之框間預測性寫碼,以提供時間壓縮。
運動估計單元42可經組態以根據視訊序列之預定圖案來判定用於視訊截塊之框間預測模式。預定圖案可將序列中之視訊截塊指定為P截塊、B截塊或GPB截塊。運動估計單元42及運動補償單元44可高度整合,但為概念目的而單獨說明。由運動估計單元42執行之運動估計為產生運動向量之處理程序,該等運動向量估計視訊區塊之運動。運動向量(例如)可指示當前視訊圖框或圖像內之視訊區塊的預測單元(PU)相對於參考圖像內之預測性區塊的移位。
預測性區塊為就像素差而言被發現緊密地匹配待寫碼的視訊區塊之PU之區塊,該像素差可由絕對差和(SAD)、平方差和(SSD)或其他差量度判定。在一些實例中,編碼器件104可計算儲存於圖像記憶體64中之參考圖像的子整數像素位置的值。舉例而言,編碼器件104可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分數像素位置之值。因此,運動估計單元42可執行關於全像素位置及分數像素位置之運動搜尋且輸出具有分數像素精確度之運動向量。
運動估計單元42藉由比較PU之位置與參考圖像之預測性區塊的位置而計算經框間寫碼截塊中之視訊區塊的PU的運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),該等清單中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動估計單元42將所計算之運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及基於由運動估計(可能執行內插至子像素精確度)判定之運動向量而提取或產生預測性區塊。在接收到當前視訊區塊之PU的運動向量之後,運動補償單元44可在一參考圖像清單中定位運動向量所指向之預測性區塊的位置。編碼器件104藉由自正經寫碼之當前視訊區塊之像素值減去預測性區塊之像素值從而形成像素差值來形成殘餘視訊區塊。像素差形成用於區塊之殘餘資料,且可包括明度及色度差分量兩者。求和器50表示執行此減法運算之一或多個組件。運動補償單元44亦可產生與視訊區塊及視訊截塊相關聯之語法元素,以供解碼器件112用於解碼視訊截塊之視訊區塊。
如上文所描述,作為由運動估計單元42及運動補償單元44執行的框間預測之替代方案,框內預測處理單元46可框內預測當前區塊。特定而言,框內預測處理單元46可判定框內預測模式以用以編碼當前區塊。在一些實例中,框內預測處理單元46可例如在單獨編碼遍次期間使用各種框內預測模式編碼當前區塊,且框內預測單元處理46可自該等測試模式中選擇適當框內預測模式來使用。舉例而言,框內預測處理單元46可使用對各種所測試框內預測模式之速率-失真分析來計算速率-失真值,且可在所測試模式當中選擇具有最佳速率-失真特性之框內預測模式。速率-失真分析大體上判定經編碼區塊與原始未經編碼區塊(其經編碼以產生經編碼區塊)之間的失真(或誤差)量,以及用以產生經編碼區塊之位元速率(亦即,位元之數目)。框內預測處理單元46可根據各種經編碼區塊之失真及速率計算比率以判定哪一框內預測模式展現該區塊之最佳速率-失真值。
在任何情況下,在選擇用於區塊之框內預測模式後,框內預測處理單元46可將指示用於區塊之所選框內預測模式的資訊提供至熵編碼單元56。熵編碼單元56可編碼指示所選框內預測模式之資訊。編碼器件104可將各種區塊之編碼上下文之定義以及待用於上下文中之每一者的最可能的框內預測模式、框內預測模式索引表及經修改框內預測模式索引表之指示包括於經傳輸位元串流組態資料中。位元串流組態資料可包括複數個框內預測模式索引表及複數個經修改框內預測模式索引表(亦被稱作碼字映射表)。
在預測處理單元41經由框間預測或框內預測產生當前視訊區塊之預測性區塊之後,編碼器件104藉由自當前視訊區塊減去預測性區塊而形成殘餘視訊區塊。殘餘區塊中之殘餘視訊資料可包括於一或多個TU中且被應用於變換處理單元52。變換處理單元52使用諸如離散餘弦變換(DCT)或概念上相似變換之變換將殘餘視訊資料變換成殘餘變換係數。變換處理單元52可將殘餘視訊資料自像素域轉換至變換域(諸如,頻域)。
變換處理單元52可將所得變換係數發送至量化單元54。量化單元54量化變換係數以進一步減少位元率。量化處理程序可減小與係數中之一些或所有相關聯的位元深度。可藉由調整量化參數來修改量化程度。在一些實例中,量化單元54可接著執行對包括經量化變換係數之矩陣的掃描。替代性地,熵編碼單元56可執行掃描。
在量化之後,熵編碼單元56對經量化變換係數進行熵編碼。舉例而言,熵編碼單元56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼技術。在由熵編碼單元56進行熵編碼之後,經編碼位元串流可傳輸至解碼器件112,或經存檔以供稍後由解碼器件112傳輸或由解碼器件112擷取。熵編碼單元56亦可熵編碼正經寫碼之當前視訊截塊的運動向量及其他語法元素。
反量化單元58及反變換處理單元60分別應用反量化及反變換以重建構像素域中之殘餘區塊以供稍後用作參考圖像之參考區塊。運動補償單元44可藉由將殘餘區塊加至參考圖像清單內之參考圖像中之一者的預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於經重建構殘餘區塊以計算用於子整數像素值以用於運動估計。求和器62將經重建構殘餘區塊加至由運動補償單元44產生之運動補償預測區塊以產生用於儲存於圖像記憶體64中之參考區塊。參考區塊可由運動估計單元42及運動補償單元44用作參考區塊以框間預測後續視訊圖框或圖像中之區塊。
以此方式,圖12之編碼器件104表示經組態以產生經編碼視訊位元串流之語法的視訊編碼器之實例。編碼器件104可(例如)產生如上文所描述之VPS、SPS及PPS參數集。編碼器件104可執行本文中所描述之技術中之任一者,包括上文所描述的處理程序。本發明之技術已大體上關於編碼器件104加以描述,但如上文所提及,本發明之技術中的一些亦可由後處理器件57實施。
圖13為說明實例解碼器件112之方塊圖。解碼器件112包括熵解碼單元80、預測處理單元81、反量化單元86、反變換處理單元88、求和器90、濾波器單元91及圖像記憶體92。預測處理單元81包括運動補償單元82及框內預測處理單元84。在一些實例中,解碼器件112可執行大體上與關於來自圖13之編碼器件104描述的編碼遍次互逆的解碼遍次。
在解碼處理程序期間,解碼器件112接收表示由編碼器件104發送之經編碼視訊截塊之視訊區塊及由編碼器件104發送之相關聯語法元素的經編碼視訊位元串流。在一些實施例中,解碼器件112可自編碼器件104接收經編碼視訊位元串流。在一些實施例中,解碼器件112可自網路實體79 (諸如,伺服器、媒體感知網路元件(MANE)、視訊編輯器/編接器(splicer)或經組態以實施上文所描述之技術中之一或多者的其他此類器件)接收經編碼視訊位元串流。網路實體79可或可不包編碼器件104。在網路實體79將經編碼視訊位元串流傳輸至解碼器件112之前,本發明中所描述之技術中的一些可由網路實體79實施。在一些視訊解碼系統中,網路實體79及解碼器件112可為獨立器件之部分,而在其他情況下,關於網路實體79描述之功能性可由包含解碼器件112之同一器件執行。
解碼器件112之熵解碼單元80對位元串流進行熵解碼以產生經量化係數、運動向量及其他語法元素。熵解碼單元80將運動向量及其他語法元素轉遞至預測處理單元81。解碼器件112可接收視訊截塊層級及/或視訊區塊層級之語法元素。熵解碼單元80可處理並剖析諸如VPS、SPS及PPS之一或多個參數集中之固定長度語法元素及可變長度語法元素兩者。
當視訊截塊被寫碼為經框內寫碼(I)截塊時,預測處理單元81之框內預測處理單元84可基於經發信框內預測模式及來自當前圖框或圖像之先前經解碼區塊的資料而產生當前視訊截塊之視訊區塊的預測資料。當視訊圖框經寫碼文經框間寫碼(亦即,B、P或GPB)截塊時,預測處理單元81之運動補償單元82基於運動向量及自熵解碼單元80接收到之其他語法元素產生當前視訊截塊之視訊區塊的預測性區塊。預測性區塊可自參考圖像清單內之參考圖像中的一者產生。解碼器件112可基於儲存於圖像記憶體92中之參考圖像使用預設建構技術來建構參考圖框清單,清單0及清單1。
運動補償單元82藉由剖析運動向量及其他語法元素來判定用於當前視訊截塊之視訊區塊的預測資訊,並使用該預測資訊以產生經解碼當前視訊區塊之預測性區塊。舉例而言,運動補償單元82可使用參數集中之一或多個語法元素以判定用以寫碼視訊截塊之視訊區塊之預測模式(例如,框內預測或框間預測)、框間預測截塊類型(例如,B截塊、P截塊或GPB截塊)、截塊之一或多個參考圖像清單之建構資訊、截塊之每一框間編碼視訊區塊之運動向量、截塊之每一框間寫碼視訊區塊之框間預測狀態,及用以解碼當前視訊截塊中之視訊區塊的其他資訊。
運動補償單元82亦可執行基於內插濾波器之內插。運動補償單元82可使用如在編碼視訊區塊期間由編碼器件104使用的內插濾波器來計算參考區塊之子整數像素的內插值。在此情況下,運動補償單元82可自所接收語法元素判定由編碼器件104使用之內插濾波器,且可使用內插濾波器來產生預測性區塊。
反量化單元86反量化或解量化位元串流中所提供且由熵解碼單元80解碼之經量化變換係數。反量化處理程序可包括使用由編碼器件104針對視訊截塊中之每一視訊區塊計算的量化參數來判定量化程度及同樣應應用之反量化程度。反變換處理單元88將反變換(例如,反DCT或其他合適之反變換)、反整數變換或概念上相似反變換處理程序應用於變換係數以便在像素域中產生殘餘區塊。
在運動補償單元82基於運動向量及其他語法元素而產生當前視訊區塊之預測性區塊之後,解碼器件112藉由將來自反變換處理單元88之殘餘區塊與由運動補償單元82產生之對應預測性區塊求和而形成經解碼視訊區塊。求和器90表示執行此求和運算之一或多個組件。若需要,亦可使用迴路濾波器(在寫碼迴路中或在寫碼迴路後)以使像素轉變平滑,或以其他方式改良視訊品質。濾波器單元91意欲表示一或多個迴路濾波器,諸如,解區塊濾波器、自適應迴路濾波器(ALF)及樣本自適應偏移(SAO)濾波器。儘管濾波器單元91在圖13中展示為迴路濾波器,但在其他組態中,濾波器單元91可實施為後迴路濾波器。給定圖框或圖像中之經解碼視訊區塊接著儲存於圖像記憶體92中,圖像記憶體92儲存用於後續運動補償之參考圖像。圖像記憶體92亦儲存經解碼視訊以供稍後呈現於顯示器件(諸如,圖1中所展示之視訊目的地器件122)上。
在前述描述中,申請案之態樣係參考特定實施例而描述,但熟習此項技術者將認識到申請案不限於此。因此,儘管本文中已詳細描述申請案之說明性實施例,但應理解,本發明概念可以其他方式不同地體現並使用,且所附申請專利範圍意欲解釋為包括除先前技術所限制外的此等變化。上文所描述之標的物之各種特徵及態樣可個別地或聯合地使用。另外,實施例可用於超出本文所描述之彼等環境及應用之任何數目個環境及應用,而不脫離本說明書之更廣精神及範疇。因此,本說明書及圖式被視為說明性而非限定性。為說明之目的,以特定次序描述方法。應瞭解,在替代實施例中,可以與所描述之次序不同之次序來執行該等方法。
在組件被描述為「經組態以」執行某些操作之情況下,可(例如)藉由設計電子電路或其他硬體以執行操作、藉由程式化可程式化電子電路(例如,微處理器或其他合適之電子電路)以執行操作或其任何組合來實現此組態。
結合本文所揭示之實施例而描述之各種說明性邏輯區塊、模組、電路及演算法步驟可被實施為電子硬體、電腦軟體、韌體或其組合。為了清楚地說明硬體與軟體之此可互換性,各種說明性組件、區塊、模組、電路及步驟已在上文大體按其功能性加以了描述。此功能性實施為硬體抑或軟體取決於特定應用及強加於整個系統之設計約束而定。熟習此項技術者可針對每一特定應用而以變化之方式實施所描述之功能性,但不應將此等實施決策解譯為致使脫離本發明之範疇。
本文中所描述之技術亦可實施於電子硬體、電腦軟體、韌體或其任何組合中。此等技術可實施於多種器件中之任何者中,諸如,通用電腦、無線通信器件手機或具有多種用途(包括在無線通信器件手機及其他器件中之應用)之積體電路器件。可將描述為模組或組件之任何特徵共同實施於整合式邏輯器件中或分開實施為離散但可互操作之邏輯器件。若以軟體實施,則該等技術可至少部分由包含包括當經執行時執行上文所描述方法中之一或多者之指令之程式碼的電腦可讀資料儲存媒體實現。電腦可讀資料儲存媒體可形成電腦程式產品之部分,電腦程式產品可包括封裝材料。電腦可讀媒體可包含記憶體或資料儲存媒體,諸如,隨機存取記憶體(RAM),諸如,同步動態隨機存取記憶體(SDRAM)、唯讀記憶體(ROM)、非揮發性隨機存取記憶體(NVRAM)、電可抹除可程式化唯讀記憶體(EEPROM)、快閃記憶體、磁性或光學資料儲存媒體及其類似者。另外或替代地,該等技術可至少部分地由電腦可讀通信媒體實現,該電腦可讀通信媒體載送或傳達呈指令或資料結構之形式且可由電腦存取、讀取及/或執行的程式碼,諸如,傳播之信號或波。
程式碼可由可包括一或多個處理器之處理器執行,諸如,一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路。此處理器可經組態以執行本發明中所描述之技術中之任一者。通用處理器可為微處理器;但在替代例中,處理器可為任何習知處理器、控制器、微控制器或狀態機。處理器亦可實施為計算器件之組合,例如DSP與微處理器之組合、複數個微處理器、結合DSP核心之一或多個微處理器,或任何其他此類組態。因此,如本文中所使用之術語「處理器」可指前述結構中之任一者、前述結構之任何組合或適合於實施本文中所描述之技術的任何其他結構或裝置。此外,在一些態樣中,本文中描述之功能性可提供於經組態用於編碼及解碼之專用軟體模組或硬體模組,或併入於組合之視訊編碼器-解碼器(編解碼器)中。
35‧‧‧分割單元 41‧‧‧預測處理單元 42‧‧‧運動估計單元 44‧‧‧運動補償單元 46‧‧‧框內預測處理單元 50‧‧‧求和器 52‧‧‧變換處理單元 54‧‧‧量化單元 56‧‧‧熵編碼單元 57‧‧‧後處理器件 58‧‧‧反量化單元 60‧‧‧反變換處理單元 62‧‧‧求和器 63‧‧‧濾波器單元 64‧‧‧圖像記憶體 79‧‧‧網路實體 80‧‧‧熵解碼單元 81‧‧‧預測處理單元 82‧‧‧運動補償單元 84‧‧‧框內預測處理單元 86‧‧‧反量化單元 88‧‧‧反變換處理單元 90‧‧‧求和器 91‧‧‧濾波器單元 92‧‧‧圖像記憶體 100‧‧‧系統 102‧‧‧視訊源 104‧‧‧編碼器件 106‧‧‧編碼器引擎 108‧‧‧儲存器 110‧‧‧輸出 112‧‧‧解碼器件 114‧‧‧輸入 116‧‧‧解碼器引擎 118‧‧‧儲存器 120‧‧‧通信鏈路 122‧‧‧視訊目的地器件 200‧‧‧區塊之群組 202‧‧‧P區塊 204‧‧‧Q區塊 206‧‧‧邊界 210‧‧‧片段 302‧‧‧P區塊 304‧‧‧Q區塊 310‧‧‧片段 312‧‧‧p樣本 314‧‧‧q樣本 402‧‧‧P區塊 404‧‧‧Q區塊 410‧‧‧片段 422‧‧‧p樣本 424‧‧‧q樣本 1100‧‧‧處理程序 1102‧‧‧步驟 1104‧‧‧步驟 1106‧‧‧步驟 1108‧‧‧步驟 1110‧‧‧步驟 1112‧‧‧步驟 1114‧‧‧步驟 1116‧‧‧步驟 1118‧‧‧步驟
在下文參考以下諸圖詳細描述說明性實例:
圖1為說明包括編碼器件及解碼器件之系統之實例的方塊圖;
圖2包括可為經編碼視訊圖框之部分的區塊之群組的圖;
圖3包括說明沿左邊區塊與右邊區塊之間的邊界之片段的像素或樣本之實例的圖;
圖4包括說明沿片段的樣本之(在此實例中)四個線當中的像素或樣本之一個線的圖;
圖5包括說明可用以計算沿片段之本端活動性的樣本之圖;
圖6包括說明平均活動性及活動性差異的可能組合之圖表;
圖7包括說明經量化平均活動性及經量化活動性差異之可能組合的圖表;
圖8包括說明可用於濾波處理程序之額外樣本的圖;
圖9包括說明可能合併之類別的圖表;
圖10包括說明可能合併之類別的圖表;
圖11包括說明用於寫碼視訊資料之實例處理程序之流程圖;
圖12為說明實例編碼器件之方塊圖;
圖13為說明實例解碼器件之方塊圖;
圖14展示具有大小16之FilterSetBS2的實例;
圖15展示具有大小8之FilterSetBS2的實例;
圖16展示具有大小4之FilterSetBS2的實例;
圖17展示具有大小16之FilterSetBS1的實例;且
圖18展示FilterSetBS1之整數表示的實例。
1100‧‧‧處理程序
1102‧‧‧步驟
1104‧‧‧步驟
1106‧‧‧步驟
1108‧‧‧步驟
1110‧‧‧步驟
1112‧‧‧步驟
1114‧‧‧步驟
1116‧‧‧步驟
1118‧‧‧步驟

Claims (30)

  1. 一種寫碼視訊資料之電腦實施方法,其包含: 在一視訊寫碼器件處獲得包括複數個經編碼視訊圖框之視訊資料; 對於來自該複數個經編碼視訊圖框之一經編碼視訊圖框的一第一區塊判定該第一區塊中之像素當中的一第一活動性; 對於來自該經編碼視訊圖框之一第二區塊判定該第二區塊中之像素當中的一第二活動性,其中該第二區塊在該視訊圖框內緊接於該第一區塊右邊; 使用該第一活動性及該第二活動性判定該第一區塊及該第二區塊之一平均活動性; 使用該第一活動性及該第二活動性判定該第一區塊與該第二區塊之間的一活動性差異; 使用該平均活動性及該活動性差異選擇該第一區塊與該第二區塊之間的一邊界之一分類; 使用該分類選擇一濾波器; 將該濾波器應用於該第一區塊中之該等像素或該第二區塊中之該等像素以使該等像素之間的轉變平滑;及 在應用該濾波器之後輸出該第一區塊及該第二區塊以將其加至一經重建構視訊圖框。
  2. 如請求項1之電腦實施方法,其進一步包含: 將非均勻量化應用於該平均活動性及該活動性差異,其中該非均勻量化產生一層級化平均活動性及該等活動性之一層級化差異,且其中選擇該分類進一步包括使用該層級化平均活動性及該等活動性之該層級化差異。
  3. 如請求項1之電腦實施方法,其進一步包含: 判定該第一區塊之一類型,該類型指示該第一區塊中之該等像素相似抑或相異,其中選擇該濾波器進一步包括使用該類型。
  4. 如請求項3之電腦實施方法,其進一步包含: 基於該第二區塊為不同於該第一區塊之一類型而選擇一不同濾波器以用於該第二區塊。
  5. 如請求項1之電腦實施方法,其進一步包含: 對於來自該第一區塊中之該等像素的一特定像素判定該特定像素距該邊界之一距離,其中該濾波器係進一步基於該距離而選擇。
  6. 如請求項5之電腦實施方法,其進一步包含: 基於來自該第一區塊之該等像素的一第二像素相較於該特定像素具有距該邊界之一不同距離而選擇一不同濾波器以用於該第二像素。
  7. 如請求項1之電腦實施方法,其中該濾波器之一索引包括於該經編碼視訊資料中。
  8. 如請求項1之電腦實施方法,其中該第一區塊中之該等像素及該第二區塊中之該等像素沿該邊界之一片段,該片段小於該邊界之全長,且其中該第一區塊中之該等像素及該第二區塊中之該等像素遠離該邊界多達八個像素。
  9. 如請求項1之電腦實施方法,其中該方法包括在應用該濾波器之後及在輸出該第一區塊及該第二區塊之前將至少一個削減值應用於由該濾波器產生的一像素值。
  10. 如請求項1之電腦實施方法,其中當包括該第一區塊及該第二區塊之一截塊為一經框內寫碼截塊時,一邊界強度值等於二,且其中當該截塊為一經框間寫碼截塊時,該邊界強度值等於零或一。
  11. 如請求項1之電腦實施方法,其中該濾波器係藉由使用來自複數個濾波器索引當中之一濾波器索引而選擇,且其中該選擇包括強迫該第一區塊之一第一像素具有與該第一區塊之一第二像素相同的濾波器索引。
  12. 一種視訊寫碼器件,其包含: 一記憶體,其經組態以儲存視訊資料,該視訊資料包括複數個經編碼視訊圖框;及 一處理器,其經組態以: 對於來自該複數個經編碼視訊圖框之一經編碼視訊圖框的一第一區塊判定該第一區塊中之像素當中的一第一活動性; 對於來自該經編碼視訊圖框之一第二區塊判定該第二區塊中之像素當中的一第二活動性,其中該第二區塊在該視訊圖框內緊接於該第一區塊右邊; 使用該第一活動性及該第二活動性判定該第一區塊及該第二區塊之一平均活動性; 使用該第一活動性及該第二活動性判定該第一區塊與該第二區塊之間的一活動性差異; 使用該平均活動性及該活動性差異選擇該第一區塊與該第二區塊之間的一邊界之一分類; 使用該分類選擇一濾波器; 將該濾波器應用於該第一區塊中之該等像素或該第二區塊中之該等像素以使該等像素之間的轉變平滑;及 在應用該濾波器之後輸出該第一區塊及該第二區塊以將其加至一經重建構視訊圖框。
  13. 如請求項12之視訊寫碼器件,其中該處理器經進一步組態以: 將非均勻量化應用於該平均活動性及該活動性差異,其中該非均勻量化產生一層級化平均活動性及該等活動性之一層級化差異,且其中選擇該分類進一步包括使用該層級化平均活動性及該等活動性之該層級化差異。
  14. 如請求項12之視訊寫碼器件,其中該處理器經進一步組態以: 判定該第一區塊之一類型,該類型指示該第一區塊中之該等像素相似抑或相異,其中選擇該濾波器進一步包括使用該類型。
  15. 如請求項14之視訊寫碼器件,其中該處理器經進一步組態以: 基於該第二區塊為不同於該第一區塊之一類型而選擇一不同濾波器以用於該第二區塊。
  16. 如請求項12之視訊寫碼器件,其中該處理器經進一步組態以: 對於來自該第一區塊中之該等像素的一特定像素判定該特定像素距該邊界之一距離,其中該濾波器係進一步基於該距離而選擇。
  17. 如請求項16之視訊寫碼器件,其中該處理器經進一步組態以: 基於來自該第一區塊之該等像素的一第二像素相較於該特定像素具有距該邊界之一不同距離而選擇一不同濾波器以用於該第二像素。
  18. 如請求項12之視訊寫碼器件,其中該濾波器之一索引包括於該經編碼視訊資料中。
  19. 如請求項12之視訊寫碼器件,其中該第一區塊中之該等像素及該第二區塊中之該等像素沿該邊界之一片段,該片段小於該邊界之全長,且其中該第一區塊中之該等像素及該第二區塊中之該等像素遠離該邊界多達八個像素。
  20. 如請求項12之視訊寫碼器件,其中該處理器經進一步組態以在應用該濾波器之後及在輸出該第一區塊及該第二區塊之前將至少一個削減值應用於由該濾波器產生的一像素值。
  21. 如請求項12之視訊寫碼器件,其中當包括該第一區塊及該第二區塊之一截塊為一經框內寫碼截塊時,一邊界強度值等於二,且其中當該截塊為一經框間寫碼截塊時,該邊界強度值等於零或一。
  22. 如請求項12之視訊寫碼器件,其中該濾波器係使用來自複數個濾波器索引當中之一濾波器索引而選擇,且其中該選擇包括強迫該第一區塊之一第一像素具有與該第一區塊之一第二像素相同的濾波器索引。
  23. 如請求項12之視訊寫碼器件,其進一步包含: 一攝影機,其用於捕捉視訊資料。
  24. 如請求項12之視訊寫碼器件,其進一步包含: 一顯示器,其用於顯示經解碼視訊資料。
  25. 一種非暫時性電腦可讀媒體,其上儲存有指令,該等指令在由一視訊寫碼器件之一或多個處理器執行時致使該一或多個處理器執行包括以下各者之操作: 獲得包括複數個經編碼視訊圖框之視訊資料; 對於來自該複數個經編碼視訊圖框之一經編碼視訊圖框的一第一區塊判定該第一區塊中之像素當中的一第一活動性; 對於來自該經編碼視訊圖框之一第二區塊判定該第二區塊中之像素當中的一第二活動性,其中該第二區塊在該視訊圖框內緊接於該第一區塊右邊; 使用該第一活動性及該第二活動性判定該第一區塊及該第二區塊之一平均活動性; 使用該第一活動性及該第二活動性判定該第一區塊與該第二區塊之間的一活動性差異; 使用該平均活動性及該活動性差異選擇該第一區塊與該第二區塊之間的一邊界之一分類; 使用該分類選擇一濾波器; 將該濾波器應用於該第一區塊中之該等像素或該第二區塊中之該等像素以使該等像素之間的轉變平滑;及 在應用該濾波器之後輸出該第一區塊及該第二區塊以將其加至一經重建構視訊圖框。
  26. 如請求項25之非暫時性電腦可讀媒體,其中該等操作進一步包括: 將非均勻量化應用於該平均活動性及該活動性差異,其中該非均勻量化產生一層級化平均活動性及該等活動性之一層級化差異,且其中選擇該分類進一步包括使用該層級化平均活動性及該等活動性之該層級化差異。
  27. 如請求項25之非暫時性電腦可讀媒體,其中該等操作進一步包括: 判定該第一區塊之一類型,該類型指示該第一區塊中之該等像素相似抑或相異,其中選擇該濾波器進一步包括使用該類型。
  28. 如請求項25之非暫時性電腦可讀媒體,其中該等操作進一步包括: 對於來自該第一區塊中之該等像素的一特定像素判定該特定像素距該邊界之一距離,其中該濾波器係進一步基於該距離而選擇。
  29. 一種裝置,其包含: 用於獲得包括複數個經編碼視訊圖框之視訊資料的構件; 用於對於來自該複數個經編碼視訊圖框之一經編碼視訊圖框的一第一區塊判定該第一區塊中之像素當中的一第一活動性的構件; 用於對於來自該經編碼視訊圖框之一第二區塊判定該第二區塊中之像素當中的一第二活動性的構件,其中該第二區塊在該視訊圖框內緊接於該第一區塊右邊; 用於使用該第一活動性及該第二活動性判定該第一區塊及該第二區塊之一平均活動性的構件; 用於使用該第一活動性及該第二活動性判定該第一區塊與該第二區塊之間的一活動性差異的構件; 用於使用該平均活動性及該活動性差異選擇該第一區塊與該第二區塊之間的一邊界之一分類的構件; 用於使用該分類選擇一濾波器的構件; 用於將該濾波器應用於該第一區塊中之該等像素或該第二區塊中之該等像素以使該等像素之間的轉變平滑的構件;及 在應用該濾波器之後,用於輸出該第一區塊及該第二區塊以將其加至一經重建構視訊圖框的構件。
  30. 如請求項29之裝置,其中該用於選擇一濾波器的構件包含用於若該分類具有一第一值則選擇濾波器之一第一集合的構件,及用於若該分類具有不同於該第一值之一第二值則選擇濾波器之一第二集合的構件, 其中濾波器之該第二集合為比該第一集合少的濾波器之一集合且為該第一集合之一子集。
TW108111776A 2018-04-02 2019-04-02 用於視訊寫碼及處理的解區塊濾波器 TW202002631A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862651703P 2018-04-02 2018-04-02
US62/651,703 2018-04-02
US16/372,180 2019-04-01
US16/372,180 US10708592B2 (en) 2018-04-02 2019-04-01 Deblocking filter for video coding and processing

Publications (1)

Publication Number Publication Date
TW202002631A true TW202002631A (zh) 2020-01-01

Family

ID=68054042

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108111776A TW202002631A (zh) 2018-04-02 2019-04-02 用於視訊寫碼及處理的解區塊濾波器

Country Status (5)

Country Link
US (1) US10708592B2 (zh)
EP (1) EP3772261B1 (zh)
CN (1) CN112313953B (zh)
TW (1) TW202002631A (zh)
WO (1) WO2019195215A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI878429B (zh) * 2020-01-08 2025-04-01 美商高通公司 用於視訊編解碼的多重變換集訊號傳遞

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117956193A (zh) * 2018-01-08 2024-04-30 三星电子株式会社 编码方法及其设备以及解码方法及其设备
US11956452B2 (en) * 2018-04-11 2024-04-09 Rockchip Electronics Co., Ltd. System and method for H.265 encoding
EP3788787A1 (en) 2018-06-05 2021-03-10 Beijing Bytedance Network Technology Co. Ltd. Interaction between ibc and atmvp
CN110636298B (zh) 2018-06-21 2022-09-13 北京字节跳动网络技术有限公司 对于Merge仿射模式和非Merge仿射模式的统一约束
CN110636300B (zh) 2018-06-21 2022-07-29 北京字节跳动网络技术有限公司 颜色分量之间的子块运动矢量继承
WO2020009617A1 (en) * 2018-07-02 2020-01-09 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding
CN117768651A (zh) 2018-09-24 2024-03-26 北京字节跳动网络技术有限公司 处理视频数据的方法、装置、介质、以及比特流存储方法
JP7324841B2 (ja) 2018-11-10 2023-08-10 北京字節跳動網絡技術有限公司 ビデオ・データ処理方法、装置、記憶媒体及び記憶方法
WO2020224581A1 (en) 2019-05-05 2020-11-12 Beijing Bytedance Network Technology Co., Ltd. Chroma deblocking harmonization for video coding
WO2020228662A1 (en) 2019-05-11 2020-11-19 Beijing Bytedance Network Technology Co., Ltd. Boundary strength determination for deblocking filters in video processing
WO2020228661A1 (en) 2019-05-11 2020-11-19 Beijing Bytedance Network Technology Co., Ltd. Deblocking filter for video coding
EP3970366B1 (en) 2019-06-14 2025-12-10 Beijing Bytedance Network Technology Co., Ltd. Handling video unit boundaries and virtual boundaries
CN113994671B (zh) 2019-06-14 2024-05-10 北京字节跳动网络技术有限公司 基于颜色格式处理视频单元边界和虚拟边界
KR102707854B1 (ko) 2019-07-15 2024-09-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 적응적 루프 필터링에서의 분류
CN114270848B (zh) 2019-08-23 2025-04-29 北京字节跳动网络技术有限公司 在去方块滤波中使用边界强度
CN114342369B (zh) 2019-09-02 2025-07-18 北京字节跳动网络技术有限公司 用于视频编解码的色度去方块调谐
ES3048492T3 (en) 2019-09-14 2025-12-10 Bytedance Inc Quantization parameter offset for chroma deblocking filtering
ES3030107T3 (en) 2019-09-18 2025-06-26 Beijing Bytedance Network Tech Co Ltd Two-part signaling of adaptive loop filters in video coding
CN114430902B (zh) 2019-09-22 2023-11-10 北京字节跳动网络技术有限公司 自适应环路滤波中的填充过程
EP4022910A4 (en) 2019-09-27 2022-11-16 Beijing Bytedance Network Technology Co., Ltd. ADAPTIVE LOOP FILTERING BETWEEN DIFFERENT VIDEO UNITS
CN114651442B (zh) 2019-10-09 2025-06-13 字节跳动有限公司 视频编解码中的跨分量适应性回路滤波
CN117956146A (zh) 2019-10-10 2024-04-30 北京字节跳动网络技术有限公司 自适应环路滤波中不可用样点位置处的填充处理
EP4029264A4 (en) 2019-10-14 2022-11-23 ByteDance Inc. Joint coding of chroma residual and filtering in video processing
WO2021083257A1 (en) 2019-10-29 2021-05-06 Beijing Bytedance Network Technology Co., Ltd. Cross-component adaptive loop filter
WO2021104409A1 (en) 2019-11-30 2021-06-03 Beijing Bytedance Network Technology Co., Ltd. Cross-component adaptive filtering and subblock coding
KR20220106116A (ko) 2019-12-09 2022-07-28 바이트댄스 아이엔씨 비디오 코딩에서 양자화 그룹 사용
CN115104302B (zh) 2019-12-11 2025-12-02 抖音视界有限公司 跨分量适应性回路滤波的样点填充
MX2022008040A (es) * 2019-12-28 2022-08-22 Beijing Dajia Internet Information Tech Co Ltd Filtros en bucle para la codificacion de video.
KR20240095482A (ko) 2019-12-30 2024-06-25 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 비디오 데이터의 크로마 및 루마 성분의 교차 성분 결정
EP4078949A4 (en) * 2019-12-31 2023-03-29 Huawei Technologies Co., Ltd. METHOD AND APPARATUS FOR UNLOCKING BETWEEN BOUNDARIES FILTERING OF BLOCKS PREDICTED USING WEIGHTED PREDICTION AND NON-RIGHTANGLE MERGE MODES
CN114902657B (zh) 2019-12-31 2025-06-13 字节跳动有限公司 视频编解码中的自适应颜色变换
WO2021136553A1 (en) 2020-01-05 2021-07-08 Beijing Bytedance Network Technology Co., Ltd. Using adaptive color transform in video coding
WO2021143896A1 (en) 2020-01-18 2021-07-22 Beijing Bytedance Network Technology Co., Ltd. Adaptive colour transform in image/video coding
JP2023512694A (ja) 2020-02-04 2023-03-28 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 高レベルシンタックスのシグナリングについてのエンコーダ、デコーダ、および対応する方法
US12439036B2 (en) 2020-02-26 2025-10-07 Hfi Innovation Inc. Methods and apparatuses of loop filter parameter signaling in image or video processing system
JP7522237B2 (ja) 2020-06-30 2024-07-24 北京字節跳動網絡技術有限公司 適応ループフィルタリングのための境界位置
CN117121481A (zh) 2021-03-17 2023-11-24 抖音视界有限公司 单独树编解码限制
US12382032B2 (en) 2021-03-31 2025-08-05 Telefonaktiebolaget Lm Ericsson (Publ) Extra-long tap deblocking
US20250365407A1 (en) * 2022-06-30 2025-11-27 Telefonaktiebolaget Lm Ericsson (Publ) Decision process for extra-long deblocking filters
WO2025166744A1 (zh) * 2024-02-08 2025-08-14 Oppo广东移动通信有限公司 编解码方法、编解码器、码流以及存储介质
CN120259950B (zh) * 2025-06-04 2025-08-19 浙江美通筑路机械股份有限公司 一种基于机器视觉的高速清扫车目标识别方法和系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI103003B1 (fi) * 1997-06-13 1999-03-31 Nokia Mobile Phones Ltd Suodatusmenetelmä, suodatin ja matkaviestinpääte
US8285068B2 (en) * 2008-06-25 2012-10-09 Cisco Technology, Inc. Combined deblocking and denoising filter
US8761538B2 (en) * 2008-12-10 2014-06-24 Nvidia Corporation Measurement-based and scalable deblock filtering of image data
JP6083614B2 (ja) * 2011-11-04 2017-02-22 サン パテント トラスト 復号方法および復号装置
US9906790B2 (en) * 2014-03-14 2018-02-27 Qualcomm Incorporated Deblock filtering using pixel distance
AU2014202921B2 (en) * 2014-05-29 2017-02-02 Canon Kabushiki Kaisha Method, apparatus and system for de-blocking a block of video samples
US20180091812A1 (en) * 2016-09-23 2018-03-29 Apple Inc. Video compression system providing selection of deblocking filters parameters based on bit-depth of video data
US10212456B2 (en) * 2017-06-02 2019-02-19 Apple Inc. Deblocking filter for high dynamic range (HDR) video

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI878429B (zh) * 2020-01-08 2025-04-01 美商高通公司 用於視訊編解碼的多重變換集訊號傳遞

Also Published As

Publication number Publication date
CN112313953A (zh) 2021-02-02
WO2019195215A1 (en) 2019-10-10
US20190306503A1 (en) 2019-10-03
EP3772261C0 (en) 2024-04-24
CN112313953B (zh) 2024-01-16
US10708592B2 (en) 2020-07-07
EP3772261A1 (en) 2021-02-10
EP3772261B1 (en) 2024-04-24

Similar Documents

Publication Publication Date Title
CN112313953B (zh) 用于视频编解码和处理的去方块滤波器
TWI827609B (zh) 基於區塊之自適應迴路濾波器(alf)之設計及發信令
US10638133B2 (en) Delta quantization parameter (QP) coding options for video
TWI705694B (zh) 片級內部區塊複製及其他視訊寫碼改善
TWI479869B (zh) 色調片段位準量化系數偏移及解塊
TWI882999B (zh) 用於框內預測模式推導之基於區塊之量化剩餘域脈碼調變指派
JP7369124B2 (ja) 結合されたピクセル/変換ベースの量子化を用いたビデオコーディングのための量子化パラメータ制御
CN106105201B (zh) 使用像素距离的解块滤波
KR102287779B1 (ko) 해시 기반의 블록 매칭의 결과에 기초한 인코더 결정
TW201926991A (zh) 色度量化參數偏移
CN110463202A (zh) 色彩分量当中的滤波器信息共享
CN107690808A (zh) 可缩放视频译码中色域缩放性参数及表的推导
CN114982246A (zh) 环路滤波器的自适应舍入
US20170347126A1 (en) Video debanding using adaptive filter sizes and gradient based banding detection
TWI873150B (zh) 增強內部寫碼區塊之解碼產出量
JP2024501331A (ja) ビデオコーディング中にフィルタ処理するための複数のニューラルネットワークモデル
TW202029774A (zh) 藉由轉換域濾波之量化假影抑制及信號恢復
TW201921938A (zh) 具有在用於視訊寫碼之隨機存取組態中之未來參考訊框之可調適圖像群組結構
TWI848969B (zh) 用於視訊寫碼及處理之解塊濾波器
WO2024039803A1 (en) Methods and devices for adaptive loop filter
TWI770546B (zh) 用於視訊寫碼之解塊濾波
WO2023056159A1 (en) Edge offset for cross component sample adaptive offset (ccsao) filter
EP4260559A1 (en) Low complexity history usage for rice parameter derivation for high bit-depth video coding