本申請案主張2016年8月15日申請之美國臨時申請案第62/375,383號及2016年10月5日申請之美國臨時申請案第62/404,572之權益,該等美國臨時申請案中之每一者特此以全文引用之方式併入本文中。 圖1為說明可經組態以執行關於運動向量預測的本發明之技術的實例視訊編碼及解碼系統10的方塊圖。如圖1中所示,系統10包括源器件12,其提供稍後將由目的地器件14解碼的經編碼視訊資料。特定言之,源器件12經由電腦可讀媒體16將視訊資料提供至目的地器件14。源器件12及目的地器件14可包含廣泛範圍之器件中的任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、電話手機(諸如所謂的「智慧型」電話)、所謂的「智慧型」墊片、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件或其類似者。在一些情況下,源器件12及目的地器件14可經裝備以用於無線通信。 目的地器件14可經由電腦可讀媒體16接收待解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14的任何類型之媒體或器件。在一個實例中,電腦可讀媒體16可包含通信媒體以使源器件12能夠即時地將經編碼視訊資料直接傳輸至目的地器件14。可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且將其傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如區域網路、廣域網路或全球網路,諸如網際網路)的一部分。通信媒體可包括路由器、交換器、基地台或可適用於有助於自源器件12至目的地器件14之通信的任何其他設備。 在一些實例中,經編碼資料可自輸出介面22輸出至儲存器件。類似地,經編碼資料可由輸入介面自儲存器件存取。儲存器件可包括多種分佈式或本端存取之資料儲存媒體中之任一者,諸如硬碟機、Blu-ray光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體或用於儲存經編碼視訊資料之任何其他合適的數位儲存媒體。在再一實例中,儲存器件可對應於可儲存由源器件12產生之經編碼視訊的檔案伺服器或另一中間儲存器件。目的地器件14可經由串流或下載自儲存器件存取儲存之視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將彼經編碼視訊資料傳輸至目的地器件14的任何類型之伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、FTP伺服器、網路附加儲存(NAS)器件或本端磁碟機。目的地器件14可經由任何標準資料連接(包括網際網路連接)而存取經編碼視訊資料。此連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或兩者之組合。來自儲存器件之經編碼視訊資料之傳輸可為串流傳輸、下載傳輸或其組合。 本發明之技術不必限於無線應用或設定。該等技術可應用於視訊寫碼以支援多種多媒體應用中之任一者,諸如空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(諸如,經由HTTP之動態自適應串流(DASH))、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上之數位視訊的解碼或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。 在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。根據本發明,源器件12之視訊編碼器20可經組態以應用關於運動向量預測的本發明之技術。在其他實例中,源器件及目的地器件可包括其他組件或配置。舉例而言,源器件12可自外部視訊源18 (諸如外部攝影機)接收視訊資料。同樣地,目的地器件14可與外部顯示器件介接,而非包括整合式顯示器件。 圖1之所說明系統10僅為一個實例。關於運動向量預測的本發明之技術可由任何數位視訊編碼及/或解碼器件執行。儘管本發明之技術通常由視訊編碼器件執行,但該等技術亦可由視訊編碼器/解碼器(通常被稱作「CODEC」)執行。此外,本發明之技術亦可由視訊預處理器執行。源器件12及目的地器件14僅為源器件12產生經寫碼視訊資料用於傳輸至目的地器件14的此等寫碼器件之實例。在一些實例中,器件12、14可以實質上對稱之方式操作,使得器件12、14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援例如視訊器件12、14之間的單向或雙向視訊傳播,以用於視訊串流、視訊播放、視訊廣播或視訊電話。 源器件12之視訊源18可包括視訊擷取器件,諸如視訊攝影機、含有先前擷取之視訊的視訊存檔及/或用於自視訊內容提供者接收視訊的視訊饋入介面。作為另一替代,視訊源18可產生基於電腦圖形之資料作為源視訊,或實況視訊、經存檔視訊及電腦產生之視訊的組合。在一些情況下,若視訊源18為視訊攝影機,則源器件12及目的地器件14可形成所謂的攝影機電話或視訊電話。然而,如上文所提及,本發明中所描述之技術一般可適用於視訊寫碼,且可適用於無線及/或有線應用。在每一情況下,擷取、預先擷取或電腦產生之視訊可由視訊編碼器20編碼。經編碼視訊資訊可接著由輸出介面22輸出至電腦可讀媒體16上。 電腦可讀媒體16可包括暫時性媒體,諸如無線廣播或有線網路傳輸,或儲存媒體(亦即,非暫時性儲存媒體),諸如硬碟、快閃磁碟機、緊密光碟、數位視訊光碟、Blu-ray光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(未展示)可自源器件12接收經編碼視訊資料,且例如經由網路傳輸將經編碼視訊資料提供至目的地器件14。類似地,媒體產生設施(諸如光碟衝壓設施)之計算器件可自源器件12接收經編碼視訊資料且生產含有經編碼視訊資料之光碟。因此,在各種實例中,可理解電腦可讀媒體16包括各種形式之一或多個電腦可讀媒體。 目的地器件14之輸入介面28自電腦可讀媒體16接收資訊。電腦可讀媒體16之資訊可包括由視訊編碼器20定義之語法資訊,該語法資訊亦供視訊解碼器30使用,包括描述區塊及其他經寫碼單元(例如,GOP)之特性及/或處理的語法元素。顯示器件32將經解碼視訊資料顯示給使用者,且可包含多種顯示器件中之任一者,諸如陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。 視訊編碼器20及視訊解碼器30可根據視訊寫碼標準(諸如高效率視訊寫碼(HEVC)標準、HEVC標準的擴展或後續標準,諸如ITU-TH.266)而操作。替代地,視訊編碼器20及視訊解碼器30可根據其他專屬或行業標準(諸如ITU-T H.264標準,替代地被稱作MPEG-4,第10部分,進階視訊寫碼(AVC))或此等標準之擴展而操作。然而,本發明之技術不限於任何特定寫碼標準。視訊寫碼標準之其他實例包括MPEG-2及ITU-T H.263。儘管圖1中未展示,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體,以處置共同資料串流或單獨資料串流中之音訊及視訊兩者的編碼。若適用,則MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。 視訊編碼器20及視訊解碼器30各自可實施為多種合適編碼器電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地以軟體實施時,器件可將用於軟體之指令儲存於合適的非暫時性電腦可讀媒體中,且在硬體中使用一或多個處理器執行指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可整合為各別器件中的組合式編碼器/解碼器(CODEC)之部分。 視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264 (亦稱為ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展。MVC的一個聯合草案係描述於2010年3月的「用於通用視聽服務之進階視訊寫碼」(ITU-T標準H.264)中。 另外,存在新開發的視訊寫碼標準,即ITU-T視訊寫碼專家群(VCEG)及ISO/IEC運動圖像專家群(MPEG)之視訊寫碼聯合合作小組(JCT-VC)所開發的高效率視訊寫碼(HEVC)。HEVC的最近草案可自http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip獲得。HEVC標準亦在標準ITU-T H.265及國際標準ISO/IEC 23008-2中聯合提出,兩者皆名為「高效率視訊寫碼」且兩者皆於2014年10月公開。 JCT-VC開發了HEVC標準。HEVC標準化努力係基於視訊寫碼器件之演進模型,被稱作HEVC測試模型(HM)。HM根據(例如)ITU-T H.264/AVC假定視訊寫碼器件相對於現存器件之若干額外能力。舉例而言,儘管H.264提供九個框內預測編碼模式,但HEVC HM可提供多達三十三個框內預測編碼模式。 一般而言,HM之工作模型描述視訊圖框或圖像可劃分成包括明度樣本及色度樣本兩者之樹型區塊或最大寫碼單元(LCU)之序列。位元串流內之語法資料可定義LCU之大小,LCU就像素之數目而言為最大寫碼單元。圖塊包括按寫碼次序之數個連續樹型區塊。視訊圖框或圖像可分割成一或多個圖塊。每一樹型區塊可根據四分樹而分裂成若干寫碼單元(CU)。一般而言,四分樹資料結構每個CU包括一個節點,其中根節點對應於樹型區塊。若CU分裂成四個子CU,則對應於該CU之節點包括四個葉節點,該四個葉節點中之每一者對應於該等子CU中之一者。 四分樹資料結構之每一節點可提供對應CU之語法資料。舉例而言,四分樹中之節點可包括分裂旗標,其指示對應於該節點之CU是否分裂成子CU。針對CU之語法元素可經遞迴地定義,且可取決於CU是否分裂成子CU。若CU不進一步分裂,則該CU被稱作葉CU。在本發明中,即使不存在原始葉CU之明顯分裂,葉CU之四個子CU亦將被稱作葉CU。舉例而言,若16×16大小之CU未進一步分裂,則四個8×8子CU亦將被稱作葉CU,儘管16×16 CU從未分裂。 除CU不具有大小區別外,CU具有與H.264標準之巨集區塊類似的用途。舉例而言,樹型區塊可分裂成四個子節點(亦被稱作子CU),且每一子節點又可為上代節點且可被分裂成另外四個子節點。被稱作四分樹之葉節點的最終未分裂子節點包含寫碼節點,該寫碼節點亦被稱作葉CU。與一經寫碼位元串流相關聯之語法資料可定義樹型區塊可分裂之最大次數(其被稱作最大CU深度),且亦可定義該等寫碼節點之最小大小。因此,位元串流亦可定義最小寫碼單元(SCU)。本發明使用術語「區塊」來指HEVC之上下文中的CU、PU或TU中之任一者,或其他標準之上下文中的類似資料結構(例如,H.264/AVC中之巨集區塊及其子區塊)。 CU包括寫碼節點以及與該寫碼節點相關聯之預測單元(PU)及變換單元(TU)。CU之大小對應於寫碼節點之大小且形狀必須為正方形。CU之大小可在8×8像素達至具有最大64×64像素或更多像素的樹型區塊之大小的範圍內。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述例如將CU分割成一或多個PU。分割模式可在CU經跳過或直接模式編碼、框內預測模式編碼或框間預測模式編碼之間不同。PU可分割成非正方形形狀。與CU相關聯之語法資料亦可描述例如根據四分樹將CU分割成一或多個TU。TU可為正方形或非正方形(例如,矩形)形狀。 HEVC標準允許根據TU之變換,該等變換對於不同CU可不同。通常基於針對經分割LCU所定義之給定CU內的PU之大小來對TU設定大小,但可並非總是此情況。TU的大小通常與PU相同或比PU小。在一些實例中,可使用被稱為「殘餘四分樹」(RQT)之四分樹結構將對應於CU之殘餘樣本再分為較小單元。RQT之葉節點可被稱作變換單元(TU)。與TU相關聯之像素差值可經變換以產生可加以量化之變換係數。 葉CU可包括一或多個預測單元(PU)。一般而言,PU表示對應於對應CU之所有或一部分的空間區域,且可包括用於擷取PU之參考樣本的資料。此外,PU包括與預測有關之資料。舉例而言,當PU經框內模式編碼時,PU之資料可包括於殘餘四分樹(RQT)中,該RQT可包括描述用於對應於PU之TU的框內預測模式的資料。作為另一實例,當PU經框間模式編碼時,PU可包括定義PU之一或多個運動向量的資料。定義PU之運動向量之資料可描述例如運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖像,及/或運動向量之參考圖像清單(例如,清單0、清單1或清單C)。 具有一或多個PU之葉CU亦可包括一或多個變換單元(TU)。如上文所論述,可使用RQT (亦稱作TU四分樹結構)來指定該等變換單元。舉例而言,分裂旗標可指示葉CU是否分裂成四個變換單元。接著,可將每一變換單元進一步分裂為其他若干子TU。當TU未進一步分裂時,可將其稱作葉TU。大體而言,對於框內寫碼,屬於葉CU之所有葉TU共用相同之框內預測模式。亦即,一般應用同一框內預測模式來計算葉CU之所有TU之預測值。對於框內寫碼,視訊編碼器可使用框內預測模式將每一葉TU之殘餘值計算為CU之對應於TU的部分與原始區塊之間的差。TU不必限於PU的大小。因此,TU可大於或小於PU。對於框內寫碼,PU可與同一CU之對應葉TU共置。在一些實例中,葉TU之最大大小可對應於對應葉CU之大小。 此外,葉CU之TU亦可與各別四分樹資料結構(被稱作殘餘四分樹(RQT))相關聯。亦即,葉CU可包括指示葉CU如何分割成TU之四分樹。TU四分樹之根節點通常對應於葉CU,而CU四分樹之根節點通常對應於樹型區塊(或LCU)。將RQT之未被分裂的TU稱作葉TU。一般而言,除非另有指示,否則本發明分別使用術語CU及TU來指葉CU及葉TU。 視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)大體上包含一系列視訊圖像中之一或多者。GOP可包括GOP之標頭、圖像中之一或多者之標頭或別處中之語法資料,該語法資料描述包括於GOP中之圖像之數目。圖像之每一圖塊可包括描述各別圖塊之編碼模式的圖塊語法資料。視訊編碼器20通常對個別視訊圖塊內之視訊區塊進行操作,以便編碼視訊資料。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小,且可根據指定寫碼標準而大小不同。 作為一實例,HM支援各種PU大小之預測。假定特定CU之大小為2N×2N,HM支援2N×2N或N×N (在8×8 CU之情況下)之PU大小的框內預測,及2N×2N、2N×N、N×2N或N×N之對稱PU大小的框間預測。HM亦支援2N×nU、2N×nD、nL×2N及nR×2N之PU大小的框間預測之不對稱分割。在不對稱分割中,CU之一個方向未分割,而另一方向被分割成25%及75%。CU之對應於25%分割之部分由「n」隨後「上(Up)」、「下(Down)」、「左(Left)」或「右(Right)」之指示來指示。因此,例如,「2N×nU」係指水平地以頂部之2N×0.5N PU及底部之2N×1.5N PU分割之2N×2N CU。 在本發明中,「N×N」與「N乘N」可互換地使用以指視訊區塊在垂直尺寸及水平尺寸方面之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16區塊在垂直方向上將具有16個像素(y = 16)且在水平方向上將具有16個像素(x = 16)。同樣地,N×N區塊通常在垂直方向上具有N個像素且在水平方向上具有N個像素,其中N表示非負整數值。區塊中之像素可按列及行來排列。此外,區塊未必需要在水平方向上與垂直方向上具有相同數目個像素。舉例而言,區塊可包含N×M個像素,其中M未必等於N。 在使用CU之PU的框內預測性或框間預測性寫碼之後,視訊編碼器20可計算CU之TU的殘餘資料。PU可包含描述在空間域(亦被稱作像素域)中產生預測性像素資料之方法或模式的語法資料,且TU可包含在對殘餘視訊資料應用變換(例如,離散餘弦變換(DCT)、整數變換、小波變換或在概念上類似的變換)之後變換域中的係數。殘餘資料可對應於未經編碼之圖像之像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括CU之殘餘資料的TU,且接著變換該等TU以產生CU之變換係數。 在用以產生變換係數之任何變換之後,視訊編碼器20可對變換係數執行量化。量化通常指將變換係數量化以可能減少用以表示變換係數的資料之量從而提供進一步壓縮之程序。量化程序可減小與係數中之一些或所有相關聯之位元深度。舉例而言,可在量化期間將
n
位元值降值捨位至
m
位元值,其中
n
大於
m
。 在量化之後,視訊編碼器可掃描變換係數,從而自包括經量化變換係數之二維矩陣產生一維向量。該掃描可經設計以將較高能量(且因此較低頻率)係數置於陣列前部,及將較低能量(且因此較高頻率)係數置於陣列後部。在一些實例中,視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數以產生可經熵編碼的串列化向量。在其他實例中,視訊編碼器20可執行自適應掃描。在掃描經量化變換係數以形成一維向量之後,視訊編碼器20可例如根據上下文自適應可變長度寫碼(CAVLC)、上下文自適應二進位算術寫碼(CABAC)、基於語法之上下文自適應二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法來對一維向量進行熵編碼。視訊編碼器20亦可熵編碼與經編碼視訊資料相關聯之語法元素以供視訊解碼器30在解碼視訊資料時使用。 為執行CABAC,視訊編碼器20可將上下文模型內之上下文指派至待傳輸之符號。該上下文可能係關於(例如)符號之相鄰值是否為非零。為執行CAVLC,視訊編碼器20可選擇可變長度碼用於待傳輸之符號。 可將VLC中之碼字建構成使得相對較短碼對應於更有可能的符號,而較長碼對應於較不可能的符號。以此方式,相對於(例如)針對待傳輸之每一符號使用相等長度碼字,使用VLC可達成位元節省。機率判定可基於經指派至符號之上下文。 根據本發明之一或多種技術,視訊編碼器20及/或視訊解碼器30可實施本發明之技術中之一或多者。舉例而言,視訊編碼器20及/或視訊解碼器30可在運動估計及補償中使用仿射模型。 圖2為說明可經組態以執行關於運動向量預測的本發明之技術之視訊編碼器20的實例的方塊圖。視訊編碼器20可執行視訊圖塊內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減小或移除給定視訊圖框或圖像內之視訊的空間冗餘。框間寫碼依賴於時間預測以減小或移除視訊序列之鄰近圖框或圖像內之視訊的時間冗餘。框內模式(I模式)可指若干基於空間之寫碼模式中之任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可指若干基於時間之寫碼模式中之任一者。 如圖2所示,視訊編碼器20接收待編碼之視訊圖塊內之當前視訊區塊。在圖2之實例中,視訊編碼器20包括模式選擇單元40、參考圖像記憶體64、求和器50、變換處理單元52、量化單元54及熵編碼單元56。模式選擇單元40又包括運動補償單元44、運動估計單元42、框內預測單元46及分割單元48。為了視訊區塊重建構,視訊編碼器20亦包括反量化單元58、反變換單元60及求和器62。亦可包括解區塊濾波器(圖2中未展示)以便對區塊邊界進行濾波,以自重建構之視訊移除方塊效應假影。若需要,解區塊濾波器將通常對求和器62之輸出進行濾波。除瞭解區塊濾波器外,亦可使用額外濾波器(迴路內或迴路後)。為簡潔起見未展示此類濾波器,但若需要,此類濾波器可對求和器50之輸出進行濾波(作為迴路內濾波器)。 在編碼處理期間,視訊編碼器20接收待寫碼之視訊圖框或圖塊。可將圖框或圖塊劃分成多個視訊區塊。運動估計單元42及運動補償單元44執行所接收之視訊區塊相對於一或多個參考圖框中之一或多個區塊的框間預測性寫碼以提供時間預測。框內預測單元46可替代地執行所接收之視訊區塊相對於與待寫碼區塊同圖框或圖塊中之一或多個相鄰區塊的框內預測性寫碼以提供空間預測。視訊編碼器20可執行多個寫碼遍次,例如,以選擇用於每一視訊資料區塊之適當寫碼模式。 此外,分割單元48可基於對先前寫碼遍次中之先前分割方案的評估計而將視訊資料之區塊分割成子區塊。舉例而言,分割單元48可首先將圖框或圖塊分割成LCU,且基於位元率-失真分析(例如,位元率-失真最佳化)來將該等LCU中之每一者分割成子CU。模式選擇單元40可進一步產生指示將LCU分割為子CU之四分樹資料結構。四分樹之葉節點CU可包括一或多個PU及一或多個TU。 模式選擇單元40可(例如)基於誤差結果而選擇寫碼模式(框內或框間)中之一者,且將所得經框內寫碼區塊或經框間寫碼區塊提供至求和器50以產生殘餘區塊資料,及提供至求和器62以重建構經編碼區塊以用作參考圖框。模式選擇單元40亦將語法元素(諸如,運動向量、框內模式指示符、分區資訊及其他此類語法資訊)提供至熵編碼單元56。 運動估計單元42及運動補償單元44可高度整合,但出於概念目的而單獨說明。由運動估計單元42執行之運動估計為產生運動向量之程序,該等運動向量估計視訊區塊之運動。舉例而言,運動向量可指示當前視訊圖框或圖像內之視訊區塊的PU相對於參考圖像(或其他經寫碼單元)內之預測性區塊相對於在當前圖像(或其他經寫碼單元)內正經寫碼的當前區塊之位移。預測性區塊為就像素差而言被發現緊密地匹配於待寫碼區塊之區塊,像素差可藉由絕對差和(SAD)、平方差和(SSD)或其他差度量予以判定。在一些實例中,視訊編碼器20可計算儲存於參考圖像記憶體64中的參考圖像之次整數像素位置的值。舉例而言,視訊編碼器20可內插參考圖像的四分之一像素位置、八分之一像素位置或其他分率像素位置的值。因此,運動估計單元42可執行關於全像素位置及分率像素位置之運動搜尋且輸出具有分率像素精確度之運動向量。 運動估計單元42藉由將PU之位置與參考圖像之預測性區塊的位置比較而計算經框間寫碼圖塊中之視訊區塊之PU的運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),該等清單中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動估計單元42將經計算運動向量發送至熵編碼單元56及運動補償單元44。 由運動補償單元44執行之運動補償可涉及基於由運動估計單元42判定之運動向量提取或產生預測性區塊。再次,在一些實例中,運動估計單元42與運動補償單元44可在功能上整合。在接收到當前視訊區塊之PU的運動向量之後,運動補償單元44可在參考圖像清單中之一者中定位運動向量指向之預測性區塊。求和器50藉由自正經寫碼之當前視訊區塊的像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值,如下文所論述。一般而言,運動估計單元44相對於明度分量執行運動估計,且運動補償單元46將基於該等明度分量所計算之運動向量用於色度分量及明度分量兩者。模式選擇單元40亦可產生與視訊區塊及視訊圖塊相關聯之語法元素以供視訊解碼器30在解碼視訊圖塊之視訊區塊時使用。 視訊編碼器20可經組態以執行上文關於圖1所論述的本發明之各種技術中之任一者,且如在下文將更詳細地描述。舉例而言,運動補償單元44可經組態以根據本發明之技術使用AMVP或合併模式來寫碼用於視訊資料之區塊的運動資訊。 假定運動補償單元44選擇執行合併模式,運動補償單元44可形成包括合併候選項集合之候選清單。運動補償單元44可基於特定的預定次序將候選項添加至候選清單。如上文所論述,運動補償單元44亦可添加額外候選項且執行對候選清單之修剪。最終,模式選擇單元40可判定哪些候選項將用於編碼當前區塊之運動資訊,且編碼表示所選擇候選項之合併索引。 如上文所描述,作為由運動估計單元42及運動補償單元44執行之框間預測的替代例,框內預測單元46可對當前區塊進行框內預測。詳言之,框內預測單元46可判定待用以編碼當前區塊之框內預測模式。在一些實例中,框內預測單元46可例如在單獨編碼遍次期間使用各種框內預測模式來編碼當前區塊,且框內預測單元46(或在一些實例中,模式選擇單元40)可自所測試模式中選擇適當框內預測模式來使用。 舉例而言,框內預測單元46可使用對於各種所測試框內預測模式的位元率-失真分析來計算位元率-失真值,且在所測試模式中選擇具有最佳位元率-失真特性之框內預測模式。位元率-失真分析大體上判定經編碼區塊與原始、未編碼區塊(其經編碼以產生經編碼區塊)之間的失真(或誤差)量,以及用以產生經編碼區塊之位元率(亦即,位元之數目)。框內預測單元46可根據各種經編碼區塊之失真及位元率來計算比率,以判定哪一框內預測模式展現該區塊之最佳位元率-失真值。 在針對區塊選擇框內預測模式之後,框內預測單元46可將指示用於區塊之所選框內預測模式的資訊提供至熵編碼單元56。熵編碼單元56可編碼指示所選框內預測模式之資訊。視訊編碼器20可在經傳輸位元串流中包括以下各者:組態資料,其可包括複數個框內預測模式索引表及複數個經修改框內預測模式索引表(亦被稱作碼字映射表);各種區塊之編碼上下文的定義;及待用於該等上下文中之每一者的最可能框內預測模式、框內預測模式索引表及經修改框內預測模式索引表的指示。 視訊編碼器20藉由自正被寫碼之原始視訊區塊減去來自模式選擇單元40之預測資料而形成殘餘視訊區塊。求和器50表示執行此減法運算之一或多個組件。變換處理單元52將變換(諸如離散餘弦變換(DCT)或概念上類似之變換)應用於殘餘區塊,從而產生包含殘餘變換係數值之視訊區塊。變換處理單元52可執行概念上類似於DCT之其他變換。亦可使用小波變換、整數變換、子頻帶變換或其他類型之變換。 在任何情況下,變換處理單元52將變換應用於殘餘區塊,從而產生殘餘變換係數區塊。變換可將殘餘資訊自像素值域轉換至變換域,諸如頻域。變換處理單元52可將所得變換係數發送至量化單元54。量化單元54量化變換係數以進一步減小位元率。量化程序可減小與係數中之一些或所有相關聯之位元深度。量化程度可藉由調整量化參數來修改。在一些實例中,量化單元54可接著執行對包括經量化變換係數之矩陣的掃描。替代地,熵編碼單元56可執行掃描。 在量化之後,熵編碼單元56對經量化變換係數進行熵寫碼。舉例而言,熵編碼單元56可執行上下文自適應可變長度寫碼(CAVLC)、上下文自適應二進位算術寫碼(CABAC)、基於語法之上下文自適應二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵寫碼技術。在基於上下文之熵寫碼的情況下,上下文可基於相鄰區塊。在由熵寫碼單元56進行熵寫碼之後,可將經編碼位元串流傳輸至另一器件(例如,視訊解碼器30)或加以存檔以供稍後傳輸或擷取。 反量化單元58及反變換單元60分別應用反量化及反變換以在像素域中重建構殘餘區塊,例如,以供稍後用作參考區塊。運動補償單元44可藉由將殘餘區塊添加至參考圖像記憶體64之圖框中之一者的預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於重建構之殘餘區塊以計算用於在運動估計中使用之次整數像素值。求和器62將重建構之殘餘區塊添加至由運動補償單元44產生之運動經補償的預測區塊,以產生重建構之視訊區塊以儲存於參考圖像記憶體64中。重建構之視訊區塊可由運動估計單元42及運動補償單元44用作參考區塊以對後續視訊圖框中之區塊進行框間寫碼。 圖3為說明可經組態以執行本發明之運動向量預測技術之視訊解碼器30的實例的方塊圖。在圖3之實例中,視訊解碼器30包含熵解碼單元70、運動補償單元72、框內預測單元74、反量化單元76、反變換單元78、參考圖像記憶體82及求和器80。在一些實例中,視訊解碼器30可執行大體上互逆於關於視訊編碼器20 (圖2)所描述之編碼遍次的解碼遍次。運動補償單元72可基於自熵解碼單元70接收之運動向量來產生預測資料,而框內預測單元74可基於自熵解碼單元70接收之框內預測模式指示符來產生預測資料。 在解碼程序期間,視訊解碼器30自視訊編碼器20接收表示經編碼視訊圖塊之視訊區塊及相關聯語法元素的經編碼視訊位元串流。視訊解碼器30之熵解碼單元70熵解碼位元串流以產生經量化係數、運動向量或框內預測模式指示符及其他語法元素。熵解碼單元70將運動向量及其他語法元素轉遞至運動補償單元72。視訊解碼器30可在視訊圖塊層級及/或視訊區塊層級接收語法元素。 當視訊圖塊經寫碼為經框內寫碼(I)圖塊時,框內預測處理單元74可基於發信框內預測模式及來自當前圖框或圖像之先前經解碼區塊的資料來產生用於當前視訊圖塊之視訊區塊的預測資料。當視訊圖框經寫碼為框間寫碼(亦即,B、P或GPB)圖塊時,運動補償單元72基於運動向量及自熵解碼單元70接收之其他語法元素而產生用於當前視訊圖塊之視訊區塊的預測性區塊。預測性區塊可由參考圖像清單中之一者內的參考圖像中之一者產生。視訊解碼器30可基於儲存於參考圖像記憶體82中之參考圖像,使用預設建構技術來建構參考圖框清單:清單0及清單1。 運動補償單元72藉由剖析運動向量及其他語法元素來判定當前視訊截塊圖塊之視訊區塊的預測資訊,且使用該預測資訊產生用於正經解碼之當前視訊區塊的預測性區塊。舉例而言,運動補償單元72使用所接收語法元素中之一些來判定用於寫碼視訊圖塊之視訊區塊的預測模式(例如,框內或框間預測)、框間預測圖塊類型(例如,B圖塊或P圖塊)、該圖塊之參考圖像清單中之一或多者的建構資訊、該圖塊之每一經框間編碼視訊區塊的運動向量、該圖塊之每一經框間寫碼視訊區塊的框間預測狀態及用以解碼當前視訊圖塊中之視訊區塊的其他資訊。 運動補償單元72亦可執行基於內插濾波器之內插。運動補償單元72可使用如由視訊編碼器20在編碼視訊區塊期間使用之內插濾波器來計算參考區塊之次整數像素的內插值。在此情況下,運動補償單元72可自接收之語法元素判定由視訊編碼器20使用之內插濾波器且使用該等內插濾波器產生預測性區塊。 視訊解碼器30可經組態以執行上文關於圖1所論述的本發明之各種技術中之任一者,如下文將更詳細地論述。舉例而言,運動補償單元72可經組態以判定根據本發明之技術使用AMVP或併入模式來執行運動向量預測。熵解碼單元70可解碼表示運動資訊如何用於當前區塊之寫碼的一或多個語法元素。 假定語法元素指示合併模式被執行,運動補償單元72可形成包括合併候選項集合之候選清單。運動補償單元72可基於特定的預定次序將候選項添加至候選清單。如上文所論述,運動補償單元72亦可添加額外候選項及執行候選清單之修剪。最後,運動補償單元72可解碼表示哪一個候選項被用於寫碼當前區塊之運動資訊的合併索引。 反量化單元76反量化(亦即,解量化)提供於位元串流中且由熵解碼單元70熵解碼之經量化變換係數。反量化程序可包括使用由視訊解碼器30針對視訊圖塊中之每一視訊區塊計算之量化參數QP
Y
以判定應當應用的量化程度及類似地反量化程度。 反變換單元78將反變換(例如,反DCT、反整數變換或在概念上類似之反變換程序)應用於變換係數,以便在像素域中產生殘餘區塊。 在運動補償單元72基於運動向量及其他語法元素產生當前視訊區塊之預測性區塊之後,視訊解碼器30藉由對來自反變換單元78之殘餘區塊與由運動補償單元72產生之對應預測性區塊求和而形成經解碼視訊區塊。求和器80表示執行此求和運算之該或該等組件。必要時,亦可應用解區塊濾波器對經解碼區塊進行濾波以便移除區塊效應假影。亦可使用其他迴路濾波器(在寫碼迴路內或在寫碼迴路後)以使像素轉變平滑,或以其他方式改良視訊品質。接著將給定圖框或圖像中之經解碼視訊區塊儲存於參考圖像記憶體82中,該參考圖像記憶體儲存用於後續運動補償之參考圖像。參考圖像記憶體82亦儲存經解碼視訊以用於稍後在顯示器件(諸如,圖1之顯示器件32)上呈現。 圖4為說明框內預測之態樣的概念圖。視訊編碼器20及/或視訊解碼器30可實施框內預測以藉由使用區塊之空間相鄰的重建構之影像樣本來執行影像區塊預測。用於16×16影像區塊之框內預測之典型實例係展示於圖4中。如圖4中所說明,藉由框內預測,16×16影像區塊 (呈實線正方形)係根據沿著選定預測方向(如箭頭所指示)位於最近上方列及左邊行中的上方及左邊相鄰重建構之樣本(參考樣本)來預測。在HEVC,對於明度區塊之框內預測,包括35個模式。 圖5為說明用於明度區塊之框內預測模式的概念圖。該等模式包括平面模式、DC模式及33個角度模式,如圖5中所指示。定義於HEVC中之框內預測之35個模式經索引化展示於下表1中:
表 1- 框內預測模式及相關聯名稱之說明
圖6為說明平面模式之態樣的概念圖。對於通常為最常使用的框內預測模式之平面模式,預測樣本係如圖6中所示地產生。為了對N×N區塊執行平面預測,對於定位在(x,y)之每一樣本,視訊編碼器20及/或視訊解碼器30可利用雙線性濾波器使用四個特定相鄰重建構之樣本(亦即,參考樣本)來計算預測值。四個參考樣本包括右上方重建構樣本TR、左下方重建構樣本BL、位於當前樣本之同一行(rx,-1)處(表示為T)及當前樣本之同一列(r-1,y)處(表示為L)的兩個重建構樣本。平面模式如以下方程式中所示地公式化:p
xy
= (N-x-1)·L + (N-y-1) ·T + x·TR + y·BL。 對於DC模式,簡單地用相鄰重建構樣本之平均值填充預測區塊。一般而言,針對模型化平滑地變化及恆定圖像區域應用平面模式及DC模式兩者。 圖7為說明根據HEVC之角度模式之態樣的概念圖。對於總共包括33個不同預測方向的HEVC中之角度框內預測模式,框內預測程序描述如下。對於每一給定角度框內預測,可相應地識別框內預測方向。舉例而言,根據圖5,框內模式18對應於純水平預測方向,且框內模式26對應於純垂直預測方向。給定特定框內預測方向,針對預測區塊之每一樣本,首先將樣品之座標(x,y)沿著預測方向投影至相鄰的重建構樣本之列/行,如圖7中之實例中所示。假設(x,y)對經投影至兩個相鄰重建構樣本L與R之間的分數位置α,則使用雙抽頭雙線性內插濾波器來計算用於(x, y)之預測值,如以下方程式中所示地公式化:p
xy
= (1- α)·L + α·R。為避免浮點運算,在HEVC中,實際上使用如p
xy
= ((32- a)·L + a·R + 16)>>5的整數算術來近似上述計算,其中a為等於32*α之整數。 在下文大體上描述了色度編碼及解碼之態樣。色度信號中之結構常常遵循對應明度信號之結構。如所描述,根據HEVC,每一明度區塊對應於一個色度區塊,而每一色度預測區塊可基於等於2N×2N或N×N的明度預測區塊之分區大小而對應於一個或四個明度預測區塊。利用色度信號結構之此等特性及一般趨勢,HEVC提供視訊編碼器20可藉以向視訊解碼器30指示色度PU係與對應選定明度PU使用同一預測模式預測的情況或例子的機制。下表2規定視訊編碼器20可使用以發信用於色度PU之色度模式的模式配置。舉例而言,一個經框內編碼之色度PU可使用選自五個(5)模式中之一者的模式來預測,該等模式包括平面模式(INTRA_PLANAR)、垂直模式(INTRA_ANGULAR26)、水平模式(INTRA_ANGULAR10)、DC模式(INTRA_DC)及推演模式(DM)。DM經設定為用於預測對應選定明度PU之框內預測模式。舉例而言,若對應選定明度PU係用具有等於11之索引的框內模式寫碼,則DM經設定為具有等於11之索引的框內模式。
表 2- 色度框內預測模式及相關聯名稱之說明
若在經編碼視訊位元串流中指示推演模式將用於PU,則視訊解碼器30可使用用於對應明度PU之預測模式來執行針對色度PU之預測。為了緩解可能在推演模式指預測模式中之始終存在之一者時出現的冗餘問題,視訊編碼器20及視訊解碼器30可使用指定替代模式作為重複模式之替代物。如上文之表2中所示,視訊編碼器20及視訊解碼器30可使用亦被稱作「角度(34)模式」之「INTRA_ANGULAR34」色度替代模式作為替代物以移除冗餘。舉例而言,色度PU與明度PU之間的關係為一對一或多對一,視訊編碼器20及視訊解碼器30可藉由選擇可適用於單個對應明度PU之預測模式來判定用於色度PU之預測模式。 然而,在一些情況下,一個色度PU可對應於多個明度PU。認為單個色度PU對應於多個明度PU之情境係關於色度編碼及解碼之例外或「特殊情況」。舉例而言,在此等特殊情況中之一些中,一個色度PU可對應於四個明度PU。在色度-明度關係係一對多的特殊情況下,視訊編碼器20及視訊解碼器30可藉由選擇用於對應左上方明度PU之預測模式來判定用於色度PU之預測模式。 視訊編碼器20及視訊解碼器30可熵寫碼(分別地熵編碼及熵解碼)指示用於視訊資料區塊之色度預測模式的資料。根據色度模式寫碼,視訊編碼器20可指派1-b語法元素(0)至單個最常出現的推演模式,同時指派3-b語法元素(分別為100、101、110及111)至剩餘四個模式中之每一者。視訊編碼器20及視訊解碼器3可藉由一個上下文模型僅寫碼第一位元子(bin),且可對剩餘兩個位元子(若需要)進行旁路寫碼。 視訊編碼器20及視訊解碼器30可根據上下文自適應二進位算術寫碼(CABAC)來熵寫碼(分別熵編碼及熵解碼)視訊資料。CABAC係如下熵寫碼方法:首先在H.264/AVC中介紹,且描述於D. Marpe、H. Schwarz及T. Wiegand的「Context-based adaptive binary arithmetic coding in the H.264/AVC video compression standard」(美國電力工程學會公刊電路系統視訊技術,2003年7月,第7期第13卷,第620至636頁)中。CABAC現在用於高效率視訊寫碼(HEVC)視訊寫碼標準中。視訊編碼器20可視訊解碼器30可以與針對HEVC所執行之CABAC類似的方式將CABAC用於熵寫碼。 CABAC涉及三個主要功能:二進位化、上下文模型化及算術寫碼。二進位化功能將語法元素映射至被稱作位元子串之二進位符號(位元子)。上下文模型化功能估計位元子之機率。算術寫碼功能(亦被稱作二進位算術寫碼)基於估計之機率而將位元子壓縮至位元。 視訊編碼器20及視訊解碼器30可使用HEVC中所提供的若干不同二進位化程序中之一或多者執行用於CABAC之二進位化。HEVC中所提供的二進位化程序包括一元(U)、截短一元(TU)、k階指數哥倫布(EGk)及固定長度(FL)技術。此等二進位化程序之細節係描述於V. Sze及M. Budagavi的「High throughput CABAC entropy coding in HEVC」(IEEE Transactions on Circuits and Systems for Video Technology (TCSVT),2012年12月,第12期,第22卷,第1778至1791頁)中。 根據基於一元之編碼,視訊編碼器20可信號長度N+1之位元子串,其中「N」表示整數值,其中前N個位元子(值)為1,且其中最後位元子(值)為0。根據基於一元之解碼,視訊解碼器30可搜尋位元子之0值。在到0值位元子後,視訊解碼器30可判定語法元素係完整的。 根據截短一元寫碼,視訊編碼器20可比一元寫碼之情況少編碼一個位元子。舉例而言,視訊編碼器20可設定語法元素之最大可能值的最大值。最大值在本文中由「cMax」指示。當(N+1)<cMax時,如同一元寫碼,視訊編碼器20可實施相同發信。然而,當(N+1)=cMax時,視訊編碼器20可將所有位元子設定為各別值1。視訊解碼器30可搜尋0值位元子,直至已檢測了cMax數目個位元子,以判定何時語法元素係完整的。一元及截短一元寫碼中所使用的位元子串之態樣及其間的對比係說明於下面的表3中。對比位元子值係說明於表3中,使用粗斜體調出。
表 3- 一元及截短一元之位元子串實例
視訊編碼器20及視訊解碼器30亦可執行CABAC之上下文模型化態樣。上下文模型化提供相對準確之機率估計,其係達成高效率寫碼之一態樣。因此,上下文模型化係一自適應程序,且有時被描述為「高度自適應」。不同上下文模型可用於不同位元子,其中上下文模型之機率可基於先前已寫碼位元子之值來更新。具有類似分佈之位元子常常共用同一上下文模型。視訊編碼器20及/或視訊解碼器30可基於包括以下各者之一或多個因素來選擇用於每一位元子之上下文模型化:語法元素之類型、語法元素中之位元子位置(binIdx)、明度/色度、相鄰資訊等。 視訊編碼器20及視訊解碼器30可在位元子寫碼(位元子編碼或位元子解碼,視具體情況而定)之每一例項之後執行上下文切換。視訊編碼器20及視訊解碼器30可將機率模型作為7位元輸入項(6個位元用於機率狀態且1個位元用於最可能符號(MPS))儲存於上下文記憶體中,且可使用由上下文選擇邏輯計算之上下文索引來定址機率模型。HEVC提供與H.264/AVC相同的機率更新方法。然而,基於HEVC之上下文選擇邏輯係關於H.264/AVC上下文選擇邏輯經修改,以改良輸送量。視訊編碼器20及視訊解碼器30亦可將機率表示分別用於CABAC熵編碼及解碼。對於CABAC,64個代表性機率值
係藉由以下遞歸方程式針對最不可能符號(LPS)導出:
,對於所有
, 其中

。 在上述方程式中,該組機率中之所選縮放因數α ≈0.9492與基數N =64兩者表示機率表示之準確度與適應速度之間的折中方案。上述方程式中所使用之參數已展示出機率表示準確度與較快調適需要之間的相對良好折中方案。MPS之機率等於1減去LPS之機率(亦即(1-LPS))。因此,可由CABAC表示之機率範圍係[0.01875, 0.98125]。範圍之上限(MPS機率)等於一減去下限(亦即,一減去LPS機率)。亦即,1-0.01875 = 0.98125。 在編碼或解碼特定圖塊之前,視訊編碼器20及視訊解碼器30可基於一些預定義值來初始化機率模型。舉例而言,給定由「qp」指示之輸入量化參數及由「initVal」指示之預定義值,視訊編碼器20及/或視訊解碼器30可導出機率模型(由「state」及「MPS」指示)之7位元輸入項()如下: Qp = Clip3(0, 51, qp); slope = ( initVal >>4)*5 - 45; offset = ((initVal &15)<<3)-16; initState = min( max( 1, ( ( ( slope * qp ) >> 4 ) + offset ) ), 126 ); MPS = (initState >= 64 ); state index = ( (mpState? (initState - 64) : (63 - initState)) <<1) + MPS; 導出之狀態索引隱含地包括MPS資訊。亦即,當狀態索引為偶數值時,MPS值等於0。相反地,當狀態索引為奇數值時,MPS值等於1。「initVal」之值在具有8位元精度之範圍[0,255]內。 預定義initVal係圖塊相依性的。亦即,視訊編碼器20可將三組上下文初始化參數分別用於特別用於I圖塊、P圖塊及B圖塊之寫碼的機率模型。以此方式,視訊編碼器20經啟用以針對此等三個圖塊類型在三個初始化表之間選擇,以使得可潛在地達成對不同寫碼情境及/或不同類型視訊內容的更好配合。 JEM3.0之新近進展包括關於框內模式寫碼之發展。根據JEM3.0之此等新近發展,視訊編碼器20及視訊解碼器30可執行具有6個最可能模式(MPM)之框內模式寫碼。如V. Seregin、X. Zhao、A. Said、M. Karczewicz的「Neighbor based intra most probable modes list derivation」(JVET-C0055,日內瓦,2016年5月)中所描述,HEVC中之33個角度模式已擴展至65個角度模式,加上具有6個最可能模式(MPM)之DC及平面模式。視訊編碼器20可編碼用以指示框內明度模式是否包括於MPM候選清單中的一位元旗標(例如,「MPM旗標」),該MPM候選清單包括6個模式(如上文所引用之JVET-C0055中所描述)。若框內明度模式包括於MPM候選清單中(由此導致視訊編碼器20將MPM旗標設定為正值),則視訊編碼器20可進一步編碼且發信MPM候選者之索引,以指示清單中之哪個MPM候選者係框內明度模式。否則(亦即,若視訊編碼器20將MPM旗標設定為負值),視訊編碼器20可進一步發信剩餘框內明度模式之索引。 根據JEM3.0進步之此等態樣,視訊解碼器30可在接收到發信之經編碼視訊位元串流後解碼MPM旗標,以判定框內明度模式是否包括於MPM候選清單中。若視訊解碼器30判定MPM旗標經設定為正值,則視訊解碼器30可解碼接收之索引以自MPM候選清單識別框內明度模式。相反地,若視訊解碼器30判定MPM旗標經設定為負值,則視訊解碼器30可接收且解碼剩餘框內明度模式之索引。 關於自適應多核心變換亦已達成新近JEM3.0進展。除了用於HEVC中的DCT-II及4×4 DST-VII之外,自適應多變換(AMT)方案亦被用於經框間寫碼區塊及經框內寫碼區塊兩者之殘餘寫碼。AMT利用除HEVC目前所定義之變換外的來自DCT/DST家族之多個選定變換。JEM3.0之新引入變換矩陣為DST-VII、DCT-VIII、DST-I及DCT-V。 對於框內殘餘寫碼,歸因於不同框內預測模式之不同殘餘統計資料,視訊編碼器20及視訊解碼器30可使用模式相依性變換候選項選擇程序。三個變換子集已如下表4中所示地定義,且視訊編碼器20及/或視訊解碼器30可基於框內預測模式來選擇變換子集,如下表5中所指定。
表 4 :三個預定義的變換候選項集合 表 5 :用於每一框內預測模式之選定水平 (H) 及垂直 ( V ) 變換集合
根據子集合概念,視訊解碼器30可首先基於下表6識別變換子集。舉例而言,為了識別變換子集,視訊解碼器30可使用CU之框內預測模式,其在CU層級AMT旗標設定為值1之情況下發信。隨後,針對水平及垂直變換中之每一者,視訊解碼器30可根據下表7選擇經識別變換子集中之兩個變換候選項中之一者。用於水平及垂直變換中之每一者的選定變換候選項係基於明確地發信具有旗標之資料而選擇。然而,對於框間預測殘餘,視訊解碼器30可針對所有框間模式且針對水平及垂直變兩者使用僅一個變換集合,其由DST-VII及DCT-VIII組成。
表 6- 色度框內預測模式及相關聯名稱之說明 表 7- 用於每一色度模式之位元子串
關於用於視訊寫碼之LM (線性模型)預測模式已達成新近JEM3.0進展。本發明之視訊寫碼器件(諸如視訊編碼器20及視訊解碼器30)在視訊編碼及視訊解碼時可處理色彩空間及色彩格式之態樣。色彩視訊在多媒體系統中發揮主要作用,其中各種色彩空間用以有效表示色彩。色彩空間使用多個分量利用數字值指定色彩。常用色彩空間為「RGB」色彩空間,其中將色彩表示為三原色分量值(亦即,紅色、綠色及藍色)之組合。對於色彩視訊壓縮,已廣泛地使用YCbCr色彩空間,如A.Ford及A.Roberts的「Colour space conversions」(Tech. Rep,倫敦,威斯敏斯特大學,1998年8月)中所描述。YCbCr可經由線性變換自RGB色彩空間相對容易地轉換。在RGB至YCbCr轉換中,不同分量之間的冗餘(即,交叉分量冗餘)在所得YCbCr色彩空間中顯著減小。 YCbCr之一個優點為與黑白TV之回溯相容性,此係因為Y信號傳達亮度資訊。另外,色度頻寬可藉由以4:2:0色度取樣格式次取樣Cb及Cr分量而減少,與RGB中之次取樣相比,主觀影響顯著較小。由於此等優點,YCbCr已為視訊壓縮中之主要色彩空間。亦存在可用於視訊壓縮之其他色彩空間,諸如YCoCg。出於說明目的,不管所使用的實際色彩空間如何,在整個本發明中使用Y、Cb、Cr信號來表示視訊壓縮方案中之三個色彩分量。在4:2:0取樣中,兩個色度陣列(Cb及Cr)中之每一者的高度及寬度均為明度陣列(Y)之一半。 圖8為說明圖像中之標稱垂直及水平位置明度樣本及色度樣本之實例的概念圖。圖像中之明度樣本及色度樣本的標稱垂直及水平相對位置係大體上對應於如4:2:0取樣格式所提供之位置而展示於圖8中。 用於視訊寫碼之LM預測模式之態樣將在以下段落中論述。儘管交叉分量冗餘在YCbCr色彩空間中顯著減小,但三個色彩分量之間的相關性在YCbCr色彩空間中仍然存在。已研究各種技術以藉由進一步減小色彩分量之間的相關性來改良視訊寫碼效能。關於4:2:0色度視訊寫碼,在HEVC標準開發期間研究了線性模型(LM)預測模式。LM預測模式之態樣係描述於J. Chen、V. Seregin、W.-J. Han、J.-S. Kim及B.-M. Joen的「CE6.a.4: Chroma intra prediction by reconstructed luma samples」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合合作小組(Joint Collaborative Team on Video Coding,JCT-VC),JCTVC-E266, 第5次會議,日內瓦,2011年3月16日至23日)中。 在根據LM預測模式執行預測時,視訊編碼器20及視訊解碼器30可藉由使用以下方程式(1)中所示之線性模型,基於同一區塊之減少取樣的重建構明度樣本來預測色度樣本。

(1) 其中
表示區塊中之色度樣本之預測且
表示同一區塊之減少取樣的重建構明度樣本。參數α及β係自當前區塊周圍之因果性重建構樣本導出。 圖9為說明用於導出在根據線性模型(LM)模式之預測中所使用之參數的樣本之位置的概念圖。圖9中所描繪的選定參考樣本之實例係關於如上文之方程式(1)中所使用的α及β之導出。若色度區塊大小由N×N (其中N為整數)表示,則i及j均在範圍[0,N]內。 視訊編碼器20及視訊解碼器30可藉由根據以下方程式(2)減小或潛在地最小化當前區塊周圍的相鄰重建構明度樣本及色度樣本之間的回歸誤差來導出方程式(1)中之參數α及β。
(2) 參數α及β如下所述地解出。
(3)
(4) 其中
xi
表示減少取樣的重建構明度參考樣本,
yi
表示重建構色度參考樣本,且
I
表示參考樣本之量(例如,計數)。對於目標
N×N
色度區塊,當左方及上方因果樣本兩者可用時,所涉及樣本之總數(
I
)等於
2N
。當僅左方或上方因果樣本可用時,所涉及樣本之總數(
I
)等於
N
。 總體而言,當應用LM預測模式時,視訊編碼器20及/或視訊解碼器30可按列於如下之次序調用以下步驟: a)減少取樣相鄰明度樣本; b)導出線性參數(亦即,α及β);及 c)減少取樣當前明度區塊且自減少取樣之明度區塊及線性參數導出預測。 為了進一步改良寫碼效率,視訊編碼器20及/或視訊解碼器30可利用減少取樣濾波器(1, 2, 1)及(1, 1)來導出對應明度區塊內之相鄰樣本
xi
及減少取樣的明度樣本
。 關於色度分量之間的預測亦已達成新近JEM3.0進展。在JEM中,LM預測模式經擴展至兩個色度分量之間的預測。舉例而言,可自Cb分量預測Cr分量。替代使用重建構之樣本信號,視訊編碼器20及/或視訊解碼器30在剩餘域中可應用交叉分量預測。舉例而言視訊編碼器20及/或視訊解碼器30可藉由將加權的重建構Cb殘餘添加至原始Cr框內預測從而形成最終Cr預測來實施交叉分量預測之剩餘域應用。此操作之實例展示於以下方程式(3)中。

(3) 視訊編碼器20及/或視訊解碼器30可導出縮放因數α,如在LM模式中之導出。然而,一個不同之處在於相對於誤差函數中之預設α值增加了回歸成本,使得導出的縮放因數偏向預設值(-0.5)。LM預測模式係作為一個額外色度框內預測模式而添加。就此而言,視訊編碼器20可針對色度分量增加多一次RD成本檢查,以用於選擇色度框內預測模式。 四分樹二進位樹(QTBT)結構之態樣係描述於以下段落中。在VCEG提議COM16-C966 (J. An、Y.-W. Chen、K. Zhang、H. Huang、Y.-W. Huang及S. Lei的「Block partitioning structure for next generation video coding」(International Telecommunication Union,COM16-C966,2015年9月))中,針對超過HEVC之未來視訊寫碼標準建議QTBT分割方案。展示COM16-C966中所建議之QTBT結構之模擬比HEVC中所使用之四分樹結構更有效率。在COM16-C966之建議QTBT結構中,首先根據四分樹結構來分割寫碼樹型區塊(CTB),其中一個節點之四分樹拆分可反覆,直至該節點達到最小允許之四分樹葉節點大小(MinQTSize)。 根據QTBT結構,若四分樹葉節點大小不大於最大允許之二進位樹型根節點大小(MaxBTSize),則可根據二進位樹結構進一步分割四分樹葉節點。給定節點之二進位樹拆分可反覆,直至該節點達到最小允許之二進位樹葉節點大小(MinBTSize),或直至反覆拆分達到最大允許之二進位樹深度(MaxBTDepth)。二進位樹葉節點即為CU,其在無任何進一步分割之情況下可用於預測(例如圖像內或圖像間預測)及變換。 根據二進位樹拆分,視訊編碼器20及/或視訊解碼器30可實施兩個拆分類型,即對稱水平拆分及對稱垂直拆分。在QTBT分割結構之一個實例中,CTU大小經設定為128×128 (即,128×128明度樣本及兩個對應的64×64色度樣本),MinQTSize經設定為16×16,MaxBTSize經設定為64×64,MinBTSize (對於寬度及高度兩者)經設定為4,且MaxBTDepth經設定為4。視訊編碼器20及/或視訊解碼器30可首先將QTBT方案之四分樹分割部分應用於CTU,以產生四分樹葉節點。四分樹葉節點可具有自16×16(亦即,MinQTSize)至128×128(亦即,CTU大小)之大小。 若葉四分樹節點為128×128,則視訊編碼器20及/或視訊解碼器30不能使用QTBT方案之二進位樹部分將葉四分樹節點進一步拆分,此係因為節點大小超過MaxBTSize (在此情況下,64×64)。在其他方面(亦即,若節點大小不超過64×64之MaxBTSize),視訊編碼器20及/或視訊解碼器30可使用QTBT結構之二進位樹分割部分將葉四分樹節點進一步分割。因此,四分樹葉節點亦為QTBT方案之二進位樹部分的根節點,且因此具有二進位樹深度0。當反覆二進位樹分割達到使二進位樹深度達到MaxBTDepth (亦即,4)時,視訊編碼器20及/或視訊解碼器30關於葉節點不執行任何種類之進一步拆分。當QTBT方案之二進位樹部分產生具有等於MinBTSize (亦即,4)之寬度的二進位樹節點時,視訊編碼器20及/或視訊解碼器30可不執行節點之進一步水平拆分。類似地,當QTBT方案之二進位樹部分產生具有等於MinBTSize (亦即,4)之高度的二進位樹節點時,視訊編碼器20及/或視訊解碼器30可不執行節點之進一步垂直拆分。QTBT方案之二進位樹部分之葉節點(在分割完全達到二進位樹分割的情況下)即無任何其他分割之情況下藉由預測及變換進一步處理之CU。 圖10為說明QTBT分割方案之態樣的概念圖。圖10左側的方塊圖說明根據QTBT分割結構分割區塊162之實例。QTBT分割方案之四分樹分割態樣係使用區塊162中之實線說明,而QTBT分割方案之二進位樹分割態樣係使用區塊162中之虛線說明。區塊162在僅調用QTBT方案之四分樹部分的情況下分割成正方形葉節點,在調用QTBT方案之二進位樹部分(無論其是否與四分樹分割部分組合地調用)的任何情況下分割成非正方形的矩形葉節點。與HEVC之分割技術(其中多個變換係可能的)相比,QTBT分割方案提供一系統,由此,PU大小始終等於CU大小。 圖10之右側的示意圖說明樹結構164。樹結構164係用於關於圖10中之區塊162所說明之分割的對應樹結構。同樣在樹結構164之情況下,在圖10之QTBT分割方案的支援下,實線指示四分樹拆分,且虛線指示二進位樹拆分。對於使用樹結構164中之虛線所說明的二進位樹型部之每一拆分(亦即,非葉)節點,視訊編碼器20可發信各別一位元旗標以指示哪個拆分類型(亦即,水平或垂直)被使用。根據QTBT分割之一些實施,視訊編碼器20可將旗標設定為值零(0)以指示水平拆分,且設定為值一(1)以指示垂直拆分。應瞭解,對於QTBT分割結構之四分樹拆分部分,不需要指示拆分類型,此係因為四分樹拆分始終將區塊水平地且垂直地拆分成大小相等之4個子區塊。 圖11A及圖11B說明用於根據QTBT分割方案之對應明度區塊及色度區塊的獨立分割結構的實例。QTBT區塊分割技術准許且支援具有獨立的基於QTBT之分割結構的對應明度區塊及色度區塊之特徵。根據QTBT分割方案,對於P圖塊及B圖塊,一個CTU中之對應明度CTU及色度CTU共用同一基於QTBT之分割結構。然而,對於I圖塊,明度CTU可根據第一基於QTBT之分割結構分割成CU,且色度CTU係根據第二基於QTBT之分割結構分割成色度CU,第二基於QTBT之分割結構與第一基於QTBT之分割結構可不相同或可並非不相同。因此,I圖塊中之CU可由明度分量之寫碼區塊或兩個色度分量之寫碼區塊組成,而對於P圖塊及B圖塊中之CU,CU可由所有三個色彩分量之寫碼區塊組成。 用於I圖塊的由QTBT支援之獨立樹結構包括與色度寫碼有關之態樣。舉例而言,JEM允許每個PU六個(6)色度模式。DM模式之使用指示:視訊編碼器20及/或視訊解碼器30將與用於對應明度PU相同的預測模式用於色度PU。如上所述,對於I圖塊,用於明度區塊及對應色度的基於QTBT之分割結構可不同。因而,當DM模式用於I圖塊中時,視訊編碼器20及/或視訊解碼器30可繼承覆蓋左上方位置之PU之明度預測模式以針對色度PU執行預測。與HEVC之分割技術(其中明度區塊及其對應色度區塊始終共用同一樹結構)相比,JEM3.0的基於之QTBT分割准許如圖11A及圖11B中所示的明度樹結構與色度樹結構之間的可能差異。 圖11A及圖11B說明I圖塊中之一個CTU之QTBT分割結構的實例。圖11A說明明度區塊172,其中左分割區174使用上部及下部書名號調出。圖11B說明對應色度區塊176,其中左分割區178使用上部及下部書名號調出。各別左分割區174及178包括更細分割區,如圖11A及圖11B中所示。L(i) (其中「i」表示各別分割區內所說明之各別整數值)指示:用於各別分割區之明度框內預測模式具有等於i之索引。在圖11A及11B中所說明之實例中,視訊編碼器20及/或視訊解碼器30可根據DM模式來編碼/解碼色度區塊176之左分割區。因此,視訊編碼器20及/或視訊解碼器30可選擇LM模式根據左上方對應明度區塊分割區來預測色度區塊176之左分割區178。在圖11A及圖11B中所說明之使用情況情境下,視訊編碼器20及/或視訊解碼器30可選擇具有等於1之索引的框內預測模式來編碼/解碼色度區塊176之左分割區178,此係因為「i」在明度區塊172之左上方分割區中具有值1。 上文之表7規定視訊編碼器20可用於發信色度模式之模式配置。為了移除在推演模式(DM)指始終存在之模式中之一者時可能出現的色度模式發信中之可能冗餘,視訊編碼器20可使用角度(在總共存在67個框內模式時為66)模式來替代如下表7.1中所示的重複模式。在下表7.1中所說明之使用情況情境下,角度模式(表示為INTRA_ANGULAR66)被稱為「替代模式」。
表 7.1- 色度框內預測模式及相關聯名稱之說明
如上文所論述,視訊編碼器20及視訊解碼器30可執行色度預測模式之熵寫碼。在色度模式寫碼中,1-b語法元素(0)經指派至最常出現的推演模式,兩個位元子(10)經指派至LM模式,而4-b語法元素(1100、1101、1110、1111)經指派至剩餘四個模式。前兩個位元子係用一個上下文模型寫碼且剩餘兩個位元子(若需要)可經旁路寫碼。
表 7.2- 用於每一色度模式之位元子串
本發明之技術係針對改良上文所論述之各種技術之效能。如上所述,JEM3.0支援用於針對同一CTU之色度區塊分割及明度區塊分割的獨立樹結構。然而,一個色度PU可對應於多個明度PU。根據JEM3.0之QTBT分割態樣而自用於色度寫碼之多個明度PU僅繼承明度框內預測模式中之一者可提供次佳結果,該等結果可藉由本發明之各種技術來改良或可能最佳化。另外,對於JEM中之給定PU,可能色度模式之總數為六(6)。然而,針對明度寫碼,可能模式之總數為六十七(67)。本發明之各種技術可藉由增大色度模式之總數來改良寫碼效率。 本發明之各種技術在下文以詳細列舉方式列出。應瞭解,視訊編碼器20及/或視訊解碼器30可應用下文所論述之各種技術,個別地或以所描述技術中之兩者或多者之各種組合。儘管描述為由視訊編碼器20及/或視訊解碼器30執行,但應瞭解,圖2中所說明之視訊編碼器20之一或多個組件及/或圖3中所說明之視訊解碼器30之一或多個組件可執行本發明之各種技術。 下文之描述將一個色度區塊之尺寸表示為W*H (其中「W」為色度區塊之寬度且「H」為色度區塊之高度)。色度區塊中之左上方像素相對於整個圖塊之位置係由元組(x, y)表示,其中「x」及「y」分別為水平偏移及垂直偏移。對應於給定色度區塊之明度區塊具有等於2W*2H之大小(對於4:2:0色彩格式)或W*H (對於4:4:4色彩格式)。對應明度區塊中之左上方像素相對於整個圖塊之位置係由元組(2x, 2y) (對於4:2:0)或(x, y) (對於4:4:4)表示。下文給出之實例係關於4:2:0色彩格式來描述。應瞭解,本文中所描述之技術亦可擴展至其他色彩格式。 根據本發明之某些態樣,關於色度寫碼可添加多個DM模式,由此增大可供視訊編碼器20及視訊解碼器30使用(來自明度區塊)的可用色度編碼及解碼模式之數目。亦即,根據本發明之此等態樣,視訊編碼器20及視訊解碼器30可具有比單個選項更多的DM選項用以繼承用於對應明度區塊之寫碼模式。舉例而言,根據本發明之技術,視訊編碼器20及/或視訊解碼器30可基於對應明度區塊中所使用之框內預測模式而產生含有用於色度區塊之DM框內預測模式的候選清單。儘管藉由在DM候選清單中維持相同總數之可能色度模式保持了寫碼及頻寬效率,針對應用多個DM的本發明之技術提供潛在的精度增強,此係因為該等DM與現有技術中所使用之預設模式相比提供較佳準確度。 在此實例中,視訊編碼器20可發信如目前在JEM3.0中所闡述之色度模式。然而,若視訊編碼器20選擇DM模式用於色度區塊之色度寫碼,則視訊編碼器20可實施額外發信。更具體言之,根據此實例,視訊編碼器20可編碼且發信指示DM模式經選擇用於色度區塊之編碼的旗標。基於色度區塊已在DM模式下編碼,則視訊編碼器20可編碼且發信一索引值,以指示候選清單之哪個模式被用作DM模式。基於候選清單之大小,視訊編碼器20可編碼且發信零(0)與五(5)之間的索引值。亦即,視訊編碼器20可產生色度預測模式之候選清單,其包括總共六個(6)候選項,亦即,導致候選清單大小為六(6)。 基於接收到設定為指示經編碼色度區塊係使用DM模式來編碼之值的旗標,視訊解碼器30可判定用於色度區塊之解碼模式包括於候選清單中。隨後,視訊解碼器30可接收及解碼識別色度模式候選清單中之輸入項的索引。基於指示經編碼色度區塊係使用DM模式來編碼的旗標,且使用針對經編碼色度區塊的所接收之索引值,視訊解碼器30可自色度模式候選清單選擇特定模式用於解碼色度區塊。以此方式,在DM模式經選擇用於寫碼色度區塊之例子中,視訊編碼器20及視訊解碼器30可增大可用於編碼及解碼色度區塊的候選項模式之數目。基於候選清單之大小,視訊解碼器30可解碼零(0)與五(5)之間的索引值。亦即,視訊解碼器30可產生色度預測模式之候選清單,其包括總共六個(6)候選項,亦即,導致候選清單大小為六(6)。 在一些實例中,視訊編碼器20可首先編碼且發信指示色度區塊是否以線性模型(LM)模式來編碼的旗標。在此等實例中,視訊編碼器20可在發信旗標(用以指示色度區塊是否經LM編碼)後跟隨指示候選清單中之所有DM候選項之資料。根據此實施,視訊解碼器30可在經編碼視訊位元串流中接收指示色度區塊是否以LM模式來編碼的經編碼旗標。視訊解碼器30可自在經編碼視訊位元串流中之LM旗標之後開始的位置剖析指示候選清單中之所有DM候選項的資料。因此將瞭解,根據本發明之各種實例,視訊解碼器30可建構DM候選清單,或替代地,可在經編碼視訊位元串流中接收整個DM候選清單。在任一情境下,視訊解碼器30可使用發信索引自候選清單選擇適當DM模式。 視訊編碼器20亦可實施關於DM候選清單之DM的精簡。亦即,視訊編碼器20可判定包括於該清單中之DM中的兩個是否相同。若視訊編碼器20判定單個DM之多個例項(亦即,多個相同DM)包括於候選清單中,則視訊編碼器20可藉由移除同一DM之所有其他例項來移除冗餘。亦即,視訊編碼器20可精簡該清單,以使得此相同DM之僅一個例項保持在候選清單中。 在本發明之基於DM候選清單之技術的一些實例中,視訊編碼器20可針對預設模式中之一或多者來精簡候選清單中之DM候選項。根據本發明之精簡技術,若視訊編碼器20判定預設模式中之一者(例如,預設模式清單中之第K模式)與DM候選清單中之DM模式中之一者相同,則視訊編碼器20可用替代模式替換候選清單中之此DM模式。除了替換候選清單中之經精簡DM模式以外,視訊編碼器20亦可將替代模式設定為具有等於((最大框內模式索引)-1-K)之值之索引的模式。在視訊編碼器20發信指示包括於候選清單中之所有DM模式之資料的一些實施中,視訊編碼器20可發信反映經精簡DM候選清單之資料。 在視訊解碼器30亦執行DM候選清單建構之一些實例中,視訊解碼器30亦可執行精簡以完成DM候選清單。舉例而言,若視訊解碼器30判定預設模式中之一者(例如,預設模式清單中之第K模式)與DM候選清單中之DM模式中之一者相同,則視訊解碼器30可用替代模式替換候選清單中之此DM模式。除了替換候選清單中之經精簡DM模式以外,視訊解碼器30亦可將替代模式設定為具有等於((最大框內模式索引)-1-K)之值之索引的模式。 藉由實施上文所描述的基於DM候選清單之技術中之一或多者,視訊編碼器20及視訊解碼器30可增大可能色度預測模式之數目。經由上文所描述的基於DM候選清單之技術可獲得的增大數目之色度模式可在維持精度同時改良寫碼效率。如上所述,在各種實例中,視訊解碼器30可經由經編碼視訊位元串流接收整個DM候選清單。或替代地,可建構DM候選清單且使用所發信索引而自關於色度區塊之DM候選清單選擇預測模式。因為視訊解碼器30可接收顯式發信之DM候選清單,或替代地建構DM候選清單,所以各種基於DM候選清單之技術在本文中被描述為由視訊編碼器20且視情況由視訊解碼器30執行。 在一些實例中,視訊編碼器20可將DM候選清單之大小(亦即,包括於DM候選清單中之候選項之總數)固定在特定範圍內,諸如在圖案塊內、在圖塊內、在圖像內或在序列內。在一些此等實例中,若視訊解碼器30經組態以建構DM候選清單且使用所發信索引來選擇候選項,則視訊解碼器30亦可將DM候選清單之大小(亦即,包括於DM候選清單中之候選項之總數)固定在特定範圍內,諸如在圖案塊內、在圖塊內、在圖像內或在序列內。 在一些實例中,視訊編碼器20可按含後設資料之資料結構來發信候選清單之大小,該資料結構可關於對應經編碼視訊資料在頻帶外發信。作為一些非限制性實例,視訊編碼器20可在圖塊標頭、圖像參數集合(PPS)或序列參數集(SPS)中之任一者中發信候選清單之大小。根據一些實例,視訊編碼器20 (且視情況,視訊解碼器30)可經組態以預定義候選清單之大小,以使得候選清單之大小對於所有區塊大小相同。替代地,視訊編碼器20 (且視情況,視訊解碼器30)可經組態以預定義候選清單之大小,以使得候選清單之大小視區塊之大小而變化。 根據一些實例,視訊編碼器20 (且視情況,視訊解碼器30)可建構DM候選清單以包括(例如,含有)至多三個部分。在此等實例中,DM候選清單之三個部分包括以下各項:(i)第一部分,其包括與相對於對應明度區塊之特定位置相關聯的明度框內預測模式之候選項;(ii)第二部分,其包括自對應明度區塊內之所有明度區塊之一函數導出的候選項,例如,如上文之一個實例中所描述的最常使用之明度框內預測模式;及(iii)第三部分,其包括自具有模式索引之特定偏移的選定明度框內預測模式導出的候選項。 在一個實例中,視訊編碼器20 (且視情況,視訊解碼器30)可按次序將來自前兩個部分之候選項插入至DM候選清單中,直至候選項之總數等於預定義清單大小(亦即,DM模式之預定義總數)。在關於包括於DM候選清單中之模式執行精簡程序之後,若候選清單之大小仍然小於DM模式之預定義總數,則視訊編碼器20 (且視情況,視訊解碼器30)可插入來自該清單之第三部分的候選項。在一個此實例中,視訊編碼器20 (且視情況,視訊解碼器30)可按第一部分、繼之以第二部分、繼之以第三部分的次序將來自三個部分(或兩個部分,視精簡之結果而定)之候選項插入至候選清單中。在另一替代實例中,視訊編碼器20 (且視情況,視訊解碼器30)可在來自第一部分之候選項之前插入來自第二部分之候選項。在又一替代實例中,視訊編碼器20 (且視情況,視訊解碼器30)可在來自第一部分之候選項當中插入來自第二部分之候選項(例如,藉由交錯或交織第一部分及第二部分之候選項)。 根據一些實例,DM候選清單之第一部分之候選項係繼承自特定位置的用於寫碼對應明度區塊之模式。舉例而言,候選清單之第一部分可包括繼承自對應明度區塊中之以下位置的模式:中心位置、左上方位置、右上方位置、左下方位置及右下方位置。亦即,在此實例中,候選清單之第一部分可包括繼承自對應明度區塊之四個邊角的模式。在一個此類實例中,視訊編碼器20 (且視情況,視訊解碼器30)可按以下次序將繼承自對應明度區塊之四個邊角位置的模式插入至DM候選清單:中心、左上方、右上方、左下方及右下方。在另一此類實例中,視訊編碼器20 (且視情況,視訊解碼器30)可按以下次序將繼承自對應明度區塊之四個邊角位置的模式插入至DM候選清單:中心、左上方、右下方、左下方及右上方。在其他實例中,次序可變化,且應瞭解,上文所描述之次序係非限制性實例。 在一個實例中,視訊編碼器20 (且視情況,視訊解碼器30)可形成DM候選清單之第一部分以包括對應明度區塊之所有位置的框內預測模式。在此實例中,第二部分可變為非必要的,此係因為第一部分包括對應明度區塊之所有框內預測模式。另外,視訊編碼器20 (且視情況,視訊解碼器30)可按某一次序遍歷對應明度區塊內之所有單元。替代地或另外,視訊編碼器20 (且視情況,視訊解碼器30)可按基於對應明度區塊內之出現的減小數目的次序將附加模式添加至DM候選清單。 在一個實例中,視訊編碼器20 (且視情況,視訊解碼器30)可為了形成第三部分而將偏移應用於已插入至該清單的前一或多個候選項。另外,在形成第三部分時,視訊編碼器20 (且視情況,視訊解碼器30)可進一步應用或執行對已插入候選項之精簡。在一個替代實例中,視訊編碼器20 (且視情況,視訊解碼器30)可形成第三部分以包括來自相鄰區塊之一或多個框內色度模式。 根據本文中所描述之技術之一些實施,視訊編碼器20 (且視情況,視訊解碼器30)可自CU至CU或自PU至PU或自TU至TU而適應性地改變候選清單之大小。在一個實例中,視訊編碼器20 (且視情況,視訊解碼器30)可僅添加來自第一部分之候選項,如關於三部分DM候選清單形成實施所描述。替代地,視訊編碼器20 (且視情況,視訊解碼器30)可僅將來自第一部分及第二部分之候選項添加至DM候選清單。在一些實例中,視訊編碼器20 (且視情況,視訊解碼器30)可執行精簡以移除相同的框內預測模式。III。 在視訊編碼器20精簡DM候選清單之實例中,若最終精簡後DM候選清單中之候選項的數目等於1,則視訊編碼器20可不發信DM索引。在一些實例中,視訊編碼器20 (且視情況,視訊解碼器30)可使用截短一元二進位化將DM候選清單內之DM索引值二進位化。替代地,視訊編碼器20 (且視情況,視訊解碼器30)可使用一元二進位化將DM候選清單內之DM索引值二進位化。 在一些實例中,視訊編碼器20 (且視情況,視訊解碼器30)可設定上下文模型索引等於位元子索引。替代地,用於寫碼DM索引值之上下文模型之總數可小於最大候選項數目。在此情況下,視訊編碼器20可設定上下文模型索引設定等於min (K,位元子索引),其中K表示正整數。替代地,視訊編碼器20可用上下文模型僅編碼前幾個位元子,且可用於旁路模式編碼剩餘位元子。在此實例中,視訊解碼器30可用上下文模型解碼僅前幾個位元子,且可用旁路模式解碼剩餘位元子。 替代地,視訊編碼器20 (且視情況,視訊解碼器30)可視DM候選項之總數或CU、PU或TU大小中之一或多者來確定經上下文寫碼之位元子的數目。替代地,對於前M個位元子(例如,M等於1),上下文模型化可進一步取決於最終(例如精簡後)DM候選清單中之DM候選項之總數或CU/PU/TU大小或對應明度區塊之拆分資訊。 在一些實例中,視訊編碼器20 (且視情況,視訊解碼器30)可在二進位化之前進一步重排序候選清單中之候選項。在一個實例中,當CU/PU/TU之寬度大於CU/PU/TU之高度時,重排序可基於用於候選項之實際框內模式與水平框內預測模式之間的框內預測模式索引差。該差愈小,將指派的將指派至DM候選清單中之候選項的索引將愈小。在另一實例中,當CU/PU/TU之高度大於CU/PU/TU之寬度時,重排序可基於用於候選項之實際框內模式與垂直框內預測模式之間的框內預測模式索引差。亦在此實例中,該差愈小,針對DM候選清單中之候選項將指派的索引愈小。 替代地,此外,視訊編碼器20 (且視情況,視訊解碼器30)可相對於預設模式執行該清單中之所有DM候選項之精簡。若預設模式中之一者(例如,預設模式清單中之第K模式)與DM候選清單中之DM模式中之一者相同,則視訊編碼器20 (且視情況,視訊解碼器30)可用用替代模式替換DM候選清單中之此DM模式。除了替換候選清單中之經精簡DM模式以外,視訊編碼器20 (且視情況,視訊解碼器30)可將替代模式設定成具有等於((最大框內模式索引)-1-K)之值之索引的模式。 根據本發明之一些技術,視訊編碼器20及視訊解碼器30可統一明度及色度框內預測模式。亦即,對於每一色度區塊,除了線性模型(LM)模式及寫碼色度分量所特有之其他模式以外,視訊編碼器20及/或視訊解碼器30亦可自可用明度預測模式之集區選擇一預測模式。可用明度預測模式之集區在本文中經描述為包括總共「N」個預測模式,其中「N」表示正整數值。在一些實例中,「N」之值等於六十七(67),對應於67個不同的可用明度預測模式。 另外,關於色度框內預測模式之編碼及發信,視訊編碼器20亦可發信最可能模式(MPM)旗標,且視MPM旗標之值而發信MPM索引(對應於MPM候選清單中之MPM候選項之索引)。舉例而言,視訊編碼器20可藉由首先將用於色度區塊之一或多個DM模式添加至MPM候選清單來建構MPM候選清單。如上所述,視訊編碼器20可識別用於色度區塊之多個DM模式。然而,應瞭解,在一些情境下,視訊編碼器20可識別用於色度區塊之單個DM模式。在將DM模式添加至MPM候選清單之後,視訊編碼器20可將來自相鄰區塊之其他色度模式添加至MPM候選清單。替代地或另外,視訊編碼器20可添加預設模式,諸如藉由使用描述於V. Seregin、X. Zhao、A. Said、M. Karczewicz的「Neighbor based intra most probable modes list derivation」(JVET-C0055,日內瓦,2016年5月May 2016) (在下文中,「Seregin」)中的明度MPM候選清單建構程序。 替代地,視訊編碼器20可建構色度MPM候選清單,其方式與用於明度模式MPM候選清單之方式相同。舉例而言,視訊編碼器20可按描述於Seregin中之次序來檢查若干相鄰區塊。在此等實施中,視訊編碼器20可處理LM模式及/或其他色度特定框內預測模式,其方式與視訊編碼器20處理其他框內預測模式相同。此外,視訊編碼器20可精簡MPM候選清單以移除由相同框內預測模式自多個源添加所產生之冗餘。 在一個實例中,視訊編碼器20可首先發信一旗標以指示僅適用於色度分量之一或多個色度特定模式(諸如僅用於寫碼色度分量之LM模式及/或其他預測模式)之使用。若選定預測模式並非色度特定模式(亦即,視訊編碼器20將上述旗標設定至停用狀態),則視訊編碼器20可進一步發信MPM旗標。在此實例實施中,當將繼承自相鄰區塊之色度預測模式添加至MPM清單時,視訊編碼器20可不考慮色度特定模式(例如,LM模式),在此色度特定模式係取自相鄰區塊的情況下。 此實施之實例使用情況係於下文描述。視訊編碼器20可使用LM模式來框內預測色度區塊,且因此可發信經設定至啟用狀態之LM旗標。基於色度區塊已使用LM預測模式經編碼,視訊編碼器20可發信指示用於色度區塊之MPM候選清單內之位置的MPM索引。此實例使用情況說明,視訊編碼器20可使用一位元旗標首先為視訊解碼器30提供用於色度區塊之預測模式根本是否為MPM候選清單中之候選項的指示。當且僅當用於色度區塊之預測模式係來自MPM候選清單之候選項時,視訊編碼器20才可發信索引以向視訊解碼器30指示MPM候選清單之哪個模式係用以預測色度區塊。以此方式,視訊編碼器20可藉由首先使用一位元旗標、接著基於旗標之值判定根本是否發信索引值來節省頻寬。 上述技術之解碼器側態樣係在下文論述。視訊解碼器30可在經編碼視訊位元串流中接收MPM旗標。若MPM旗標之值經設定至啟用狀態,則視訊解碼器30亦可接收關於相關色度區塊之MPM索引,其對應於MPM候選清單中之特定MPM候選項之索引。舉例而言,視訊解碼器30可藉由首先將用於色度區塊之一或多個DM模式添加至MPM候選清單來建構MPM候選清單。如上所述,視訊解碼器30可識別用於色度區塊之重建構的多個DM模式。然而,應瞭解,在一些情境下,視訊解碼器30可識別用於色度區塊之單個DM模式。在將DM模式添加至MPM候選清單之後,視訊解碼器30可將來自相鄰區塊之其他色度模式添加至MPM候選清單。替代地或另外,視訊解碼器30可添加預設模式,諸如藉由使用描述於Seregin中之明度MPM候選清單建構程序。 替代地,視訊解碼器30可建構色度MPM候選清單,其方式與用於明度模式MPM候選清單之方式相同。舉例而言,視訊解碼器30可按描述於Seregin中之次序來檢查若干相鄰區塊。在此等實施中,視訊解碼器30可處理LM模式及/或其他色度特定框內預測模式,其方式與視訊解碼器30處理其他框內預測模式相同。此外,視訊解碼器30可精簡MPM候選清單以移除由相同框內預測模式自多個源添加所產生之冗餘。 在一個實例中,視訊解碼器30可首先發信一旗標以指示僅適用於色度分量之一或多個色度特定模式(諸如僅用於寫碼色度分量之LM模式及/或其他預測模式)之使用。若選定預測模式並非色度特定模式(亦即,視訊解碼器30判定上述旗標經設定至停用狀態),則視訊解碼器30可進一步接收MPM旗標。在此實例實施中,當將繼承自相鄰區塊之色度預測模式添加至MPM清單時,視訊解碼器30可不考慮色度特定模式(例如,LM模式),在此色度特定模式係取自相鄰區塊的情況下。 此實施之實例使用情況係於下文描述。視訊解碼器30可接收經設定至啟用狀態之LM旗標,且可因此使用LM模式框內預測來重建構色度區塊。基於色度區塊已使用LM預測模式經編碼,視訊解碼器30可接收指示用於色度區塊之MPM候選清單內之位置的MPM索引。此實例使用情況說明,視訊解碼器30可使用一位元旗標來首先判定用於色度區塊之預測模式根本是否為MPM候選清單中之候選項。若預測模式並非來自MPM候選清單之候選項,則視訊解碼器30避免需要視訊編碼器20發信指示MPM候選清單之哪個模式係用以預測色度區塊的索引。以此方式,視訊解碼器30可藉由減小需要視訊編碼器20發信索引值的例項之數目來節省頻寬,此與發信一位元旗標相比可更加頻寬密集。 在一些實例中,除了LM模式以外,視訊編碼器20及/或視訊解碼器30可將其他色度特有或色度特定框內預測模式添加至MPM清單,且添加剩餘框內預測模式作為該清單之預設模式。替代地,視訊編碼器20可首先發信一MPM旗標,且在建構MPM清單時,視訊編碼器20及/或視訊解碼器30可始終考慮相鄰區塊之色度預測模式,不管相鄰區塊是否係使用LM模式所預測。在另一實例中,若LM模式未添加至MPM清單,則視訊編碼器20及/或視訊解碼器30可添加LM模式作為第一預設模式。在另一實例中,視訊編碼器20及/或視訊解碼器30可僅使用來自MPM候選清單之LM及模式,且可將預設模式一起移除。在一些實例中,僅當添加之預設模式之總數小於由「K」表示之預定整數值時,視訊編碼器20 (且視情況,視訊解碼器30)才可添加現有預設模式。在一個此實例中,K經設定至值四(4)。 在一些實例中,當僅允許一個DM時,替代自具有對應明度區塊之左上方邊角取得明度框內預測模式,視訊編碼器20及/或視訊解碼器30可使用以下規則中之一或多者來選擇明度框內預測模式作為DM模式。在此規則之一個實例中,明度框內預測模式係對應明度區塊內最常使用的模式。在一個實例中,基於某一掃描次序,視訊編碼器20及/或視訊解碼器30可遍歷對應明度區塊內之每一單元之框內預測模式,且記錄現有明度預測模式之出現次數。視訊編碼器20及/或視訊解碼器30可選擇具有最大出現次數之模式。亦即,視訊編碼器20及/或視訊解碼器30可選擇覆蓋對應明度區塊之大小(亦即,面積)最多的明度框內預測模式。當兩個預測模式在對應明度區塊中具有相同使用量時,視訊編碼器20及/或視訊解碼器30可選擇基於掃描次序首先偵測到之預測模式。此處,將單元定義為用於明度/色度框內預測之最小PU/TU大小。在一些實例中,掃描次序可為光柵/Z形/對角線/Z形掃描次序或寫碼次序。 替代地,視訊編碼器20及/或視訊解碼器30可自明度區塊之中心位置開始掃描,且按某一次序遍歷至邊界。替代地或另外,掃描/單元可取決於PU/TU大小。替代地,基於某一掃描次序,視訊編碼器20及/或視訊解碼器30可遍歷對應明度區塊內之每一PU/TU/CU之框內預測模式,且記錄所記錄的現有明度預測模式之出現次數。視訊編碼器20及/或視訊解碼器30可選擇具有最大出現次數之模式。當兩個模式在明度區塊中具有相同使用量時,視訊編碼器20及/或視訊解碼器30可選擇基於掃描次序首先出現(亦即,首先偵測到)之預測模式。在一些實例中,掃描次序可為光柵/Z形/對角線/Z形掃描次序或寫碼次序。替代地,掃描可取決於PU/TU大小。 在另一替代例中,對於上文關於單個經允許DM模式所描述之實例,若視訊編碼器20及/或視訊解碼器30判定兩個或多個模式在對應明度區塊中具有相等出現次數,則視訊編碼器20及/或視訊解碼器30可選擇在明度區塊中具有相等出現次數的該等模式中之一者。該選擇可取決於此等多個明度模式之模式索引及/或PU/TU大小。替代地,針對特定區塊大小,諸如大於32×32之區塊大小,視訊編碼器20及/或視訊解碼器30可根據此基於單個DM之規則僅評估對應明度區塊之明度框內預測模式之一部分(例如,部分子集)。 作為關於單個DM模式情境之此規則的另一實例,視訊編碼器20及/或視訊解碼器30可選擇與對應明度區塊之中心位置相關聯的明度框內預測模式。在一個實例中,視訊編碼器20及/或視訊解碼器30可根據用於4:2:0色彩格式之座標元組(2x + W - 1, 2y + H - 1)來界定中心位置。替代地,視訊編碼器20及/或視訊解碼器30可如下所述地界定中心位置: - 若W及H均等於2,則視訊編碼器20及/或視訊解碼器30可使用位置(2x, 2y)作為中心位置。 - 否則,若H等於2,則視訊編碼器20及/或視訊解碼器30可使用位置(2x + (2*W/4/2 - 1)*4, 2y)作為中心位置。 - 否則,若W等於2,則視訊編碼器20及/或視訊解碼器30可使用位置(2x, 2y + (2*H/4/2 - 1)*4)作為中心位置。 - 否則(例如,H及W均不等於4),則使用(2x + (2*W/4/2 - 1)*4, 2y + (2*H/4/2 - 1)*4)作為中心位置。 根據本發明之技術之一些實例,替代將同一預設模式用於所有區塊,視訊編碼器20及/或視訊解碼器30可將自對應明度區塊導出之該等模式看作預設模式。在一個實例中,預設模式之總數經增大以包括自對應明度區塊導出之更多模式。在另一實例中,當添加之預設模式之總數小於K (在一個非限制性實例中,K經設定至4)時,僅添加現有預設模式。 圖12A及圖12B根據本發明之一或多個態樣說明用於色度預測模式之自適應排序的相鄰區塊選擇。根據本發明之技術之一些實例,視訊編碼器20及/或視訊解碼器30可應用色度模式之自適應排序,以使得次序可取決於相鄰區塊之色度模式。在一個實例中,視訊編碼器20及/或視訊解碼器30將自適應排序僅應用於特定模式,諸如DM模式及/或LM模式。在另一實例中,相鄰區塊為五個相鄰區塊,如圖12A中所描繪。替代地,視訊編碼器20及/或視訊解碼器30可使用僅兩個相鄰區塊,例如,如圖12A中所示之A1及B1,或圖12B中所示之上方區塊(A)及左邊區塊(L)。在一個實例中,當所有可用相鄰經框內寫碼區塊係用LM模式寫碼時,視訊編碼器20及/或視訊解碼器30可使LM模式處於DM模式之前。替代地,當可用相鄰經框內寫碼區塊中之至少一者係用LM模式寫碼時,視訊編碼器20及/或視訊解碼器30可使LM模式處於DM模式之前。 根據本發明之一些實例,視訊編碼器20及/或視訊解碼器30可使用明度資訊在熵寫碼之前對色度語法值重新排序。在一個實例中,明度區塊之NSST索引可用以更新色度NSST索引之寫碼次序。在此情況下,視訊編碼器20及/或視訊解碼器30可首先編碼/解碼指示色度區塊之索引與對應明度區塊之NSST索引是否相同的位元子。在另一實例中,視訊編碼器20及/或視訊解碼器30可使用明度區塊之自適應多重變換(AMT)索引來更新色度AMT索引之寫碼次序。在此情況下,視訊編碼器20及/或視訊解碼器30可首先編碼/解碼一位元子以指示色度區塊之索引與對應明度區塊之AMT索引是否相同。視訊編碼器20及/或視訊解碼器30可將另一(例如,類似)方式用於任何其他語法,關於該方式,方法可適用於明度分量及色度分量兩者,而索引/模式對於明度分量及色度分量可不同。 根據本發明之一些實例,視訊編碼器20及/或視訊解碼器30可針對一個色度區塊導出LM參數之多個集合,以使得導出係基於對應明度區塊之明度框內預測模式。在一個實例中,視訊編碼器20及/或視訊解碼器30可導出至多參數之K個集合,例如,其中「K」表示整數值。在一個實例中,「K」經設定至值二(2)。在另一實例中,視訊編碼器20及/或視訊解碼器30可基於位於對應明度區塊中之樣本的框內預測模式而將相鄰明度/色度樣本分類成K個集合。視訊編碼器20及/或視訊解碼器30可基於位於對應明度區塊中之樣本的框內預測模式而將對應明度區塊內之明度樣本樣本分類成K個集合。在另一實例中,當認為兩個框內預測模式「遠離」時,例如,在模式索引之絕對值大於臨限值的情況下,視訊編碼器20及/或視訊解碼器30可將對應子區塊及相鄰樣本看作使用了不同參數。 根據本發明之一些實例,視訊編碼器20及/或視訊解碼器30可將複合式DM模式用於編碼/解碼當前色度區塊。根據本發明之複合式DM模式,視訊編碼器20可使用自兩個或多個經識別框內預測模式產生之預測區塊的加權和而產生預測區塊。視訊編碼器20可識別用於編碼共置明度區塊或用於編碼相鄰色度區塊或用於編碼對應明度區塊之相鄰區塊的兩個或多個框內預測模式。接著,視頻編碼器可產生經識別框內預測模式中之每一者的預測區塊,且可導出兩個或多個所產生預測區塊之加權和以作為此複合式DM模式之預測區塊。 在一個實例中,用於產生此複合式DM模式之預測區塊的權重取決於應用於對應明度區塊的每一經識別框內預測模式的面積大小。替代地,每一經識別框內預測模式之預測區塊之權重可取決於當前像素之位置及當前經識別框內預測模式是否覆蓋當前像素。在另一替代例中,該等權重對於每一經識別框內預測模式係相同的。在另一替代例中,視訊編碼器20及/或視訊解碼器30仍然可利用預定義權重之集合。在又一替代例中,或另外,視訊編碼器20可發信用於每一CTU/CU/PU/TU之權重之索引。當發信預設模式(如表7.1中所示之非DM模式及非LM模式)時,若預設模式已經識別用於產生複合式DM模式,則視訊編碼器20可用未識別用於產生複合式DM模式的其他框內預測模式來替換該等預設模式。 圖13A及圖13B為說明視訊編碼器20及視訊解碼器30可用於根據上文所述的基於多個DM模式選擇之技術來選擇色度框內預測模式的區塊位置之實例的概念圖。關於針對色度寫碼的基於多個DM模式之選擇的一個實例實施係在下文描述。如上所述,根據本發明之態樣,視訊編碼器20 (且視情況,視訊解碼器30)可執行DM模式之選擇。亦即,在一些實例中,視訊編碼器20可顯式地發信DM候選清單,由此消除對視訊解碼器30亦形成DM候選清單之需要。在其他實例中,視訊編碼器20可僅發信來自DM候選清單之選定候選項的索引,從而使得視訊解碼器30能夠自視訊解碼器30亦形成之DM候選清單選擇一候選項。 圖13A說明明度分量(明度區塊202)之子區塊中所使用的預測模式。圖13B說明根據HEVC技術的關於色度區塊204之明度模式繼承。如所示,根據HEVC技術,來自明度區塊202之左上方子區塊之預測模式(即,模式L (1))係相對於色度區塊204之左邊區域繼承。如圖13A中所示,(例如,藉由視訊編碼器20,且視情況,視訊解碼器30)獲得用於位於中心(C0)、左上方(TL)、右上方(TR)、左下方(BL)及右下方(BR)處的子區塊的明度模式。該等模式由首字母縮寫詞DMC、DMTL、DMTR、DMBL、DMBR表示。在一些替代例中,視訊編碼器20 (且視情況,視訊解碼器30)可用對位置C1及/或C2及/或C3處所使用之模式的選擇來替換C0選擇。另外,視訊編碼器20 (且視情況,視訊解碼器30)可將覆蓋明度區塊202之大部分面積的明度模式作為額外DM模式添加至DM候選清單。覆蓋明度區塊202之最大面積的明度模式由首字母縮寫詞「DMM」表示。 視訊編碼器20 (且視情況,視訊解碼器30)可使用下文所論述之一或多種技術來建構DM候選清單。包括DMC、DMTL、DMTR、DMBL及DMBL的來自候選項群組之數個候選項(由「N」表示)可根據預定次序添加至DM候選清單。在一個實例中,「N」經設定至六(6)且次序可如下:DMC、DMM、DMTL、DMTR、DMBL、DMBR。在一個替代例中,「N」經設定至五(5)且次序可如下:DMC、DMTL、DMTR、DMBL、DMBR。在形成候選清單時,在將每一此候選項添加至DM候選清單之前,視訊編碼器20 (且視情況,視訊解碼器30)可相對於所有候選項或先前添加之候選項的部分子集(例如,真子集)精簡每一候選項。雖然上文論述了兩個實例次序,但應瞭解,根據本發明之態樣,視訊編碼器20 (且視情況,視訊解碼器30)亦可使用各種其他次序。假設候選清單中之DM模式之總數為「M」(其中「M」為正整數),預設模式之總數由「F」來表示,則DM候選清單之特定候選項由DM
i
來表示。在此記法中,下標「i」表示範圍介於0至M-1)之整數值。 視訊編碼器20 (且視情況,視訊解碼器30)可在DM候選項及預設模式中使用應用精簡。亦即,在形成DM候選清單時,視訊編碼器20 (且視情況,視訊解碼器30)可相對於預設模式精簡DM候選項。在一個替代例中,對於每一DM
i
,視訊編碼器20 (且視情況,視訊解碼器30)可比較DM
i
與預設模式中之每一者。若發現任何預設模式與DM
i
相同,則視訊編碼器20 (且視情況,視訊解碼器30)可用替代模式替換第一個此預設模式(其被發現與DM
i
相同)。舉例而言,視訊編碼器20 (且視情況,視訊解碼器30)可用具有等於(K-1-i)之索引值的模式替換經精簡之預設模式,其中「K」係用於對應明度區塊之明度預測模式的總數。用於此等操作之實例偽碼在下文給出。 for ( i = 0; i < M; i++) { DMIdx = DM
i
; for ( j = 0; j < F; j ++) //假設4種預設模式 { if( DMIdx == j-th default mode ) { j-th default mode = Mode (K-1-i) } } } 舉例而言,預設模式可為:模式0(平面)、模式50 (垂直方向)、模式18 (水平方向)及模式1 (DC),且DM候選清單係{模式0,模式63,模式50,模式1}。在精簡程序之後,該等預設模式由以下集合替換:{模式66,模式64,模式18,模式63}。在另一替代例中,視訊編碼器20 (且視情況,視訊解碼器30)可應用完全精簡,其中每一預設模式相對於所有DM模式進行精簡。亦即,對於每一預設模式,該等預設模式將與所有DM模式進行比較。若逐步驟比較指示DM模式中之一者與目前在檢測中之預設模式相同,則該預設模式將由最後非DM模式替換。用於此實例之實例偽碼在下文給出。 Bool ModeAdded [K]; memset ( ModeAdded, false, K*sizeof(Bool)); //初始化為假(false) for ( i = 0; i < M; i++) { ModeAdded [DMi] = true; //當添加對應框內模式作為DM時,將旗標設定為真(ture) } Set variable LastAvailModeIdx = K-1; for ( i = 0; i < F; i ++) //使每一預設模式循環 { if( ModeAdded [i-th default mode] == true) //已添加至色度模式清單 //list { for( j= LastAvailModeIdx; j >=0; j--) { if( ModeAdded [j] == true) //尚未添加至色度模式清單 { i-th default mode = mode j; //預設模式將由最後可用模式替換 //可用模式替換 LastAvailModeIdx = j - 1; //更新變數以記錄 //不可添加之最後索引 break; } } } } 視訊編碼器20可實施本發明的基於多個DM模式之技術之各種態樣,以實施色度模式之發信。視訊編碼器20可根據包括以下部分之程序來編碼色度模式。作為一個部分,視訊編碼器20可編碼且發信一位元旗標以指示僅可適用於色度分量之預測模式中之任一者(例如,LM,其係色度編碼特有的)之使用。若色度區塊係根據此色度特定模式經編碼(由此致使視訊編碼器20將該旗標設定至啟用狀態),則視訊編碼器20可另外編碼且發信特定模式之索引。 另外,視訊編碼器20可編碼且發信一旗標以指示自對應明度區塊導出之模式之使用。亦即,若視訊編碼器20基於用於對應明度區塊之預測模式來選擇用於編碼色度區塊之預測模式,則視訊編碼器20可將該旗標設定至啟用狀態。隨後,若色度區塊係使用繼承自對應明度區塊之預測模式經編碼,則視訊編碼器20可另外編碼且發信選自對應明度區塊之模式的索引。 若視訊編碼器20判定色度區塊既不根據色度特定預測模式亦不根據明度區塊導出之預測模式經編碼,則視訊編碼器20可編碼且發信識別剩餘模式之資訊。視訊編碼器20可根據不同次序實施色度編碼之上文所列出之部分/選項。不同次序之實例係在以下表7.3及表7.4或表8中給出。
表 7.3- 色度框內預測模式及相關聯名稱之說明 表 7.4- 用於每一色度模式之位元子串 表 8- 用於每一色度模式之位元子串
如上所述,本發明之態樣係針對明度模式及色度模式之統一。明度模式及色度模式之統一的實例實施係在下文描述。最可能模式(MPM)候選項之總允許數目在下文由N
mpm
表示。視訊編碼器20及/或視訊解碼器30可建構色度框內模式之模式清單以包括以下部分: - LM模式;及 - MPM模式。 MPM模式部分可包括DM候選清單及色度模式部分。視訊編碼器20 (且視情況,視訊解碼器30)可使用與上文關於DM多個DM模式所描述的相同技術來形成統一候選清單之DM候選清單部分。關於MPM模式之色度模式部分,視訊編碼器20 (且視情況,視訊解碼器30)可自目前經寫碼色度區塊之相鄰區塊導出色度模式。舉例而言,為了自相鄰區塊導出色度模式,視訊編碼器20 (且視情況,視訊解碼器30)可再使用用於明度模式之MPM建構程序。若MPM候選項之總數在執行上文所述之清單建構程序之後仍小於N
mpm
,則視訊編碼器20 (且視情況,視訊解碼器30)可根據上文所引用之JVET-C0055實施各種步驟。 舉例而言,若MPM候選項之總數在執行上文所闡述之清單建構程序之後小於N
mpm
之值,則視訊編碼器20 (且視情況,視訊解碼器30)可添加以下模式:左邊(L)、上方(A)、平面、DC、左下(BL)、右上(AR)及左上(AL)模式。若MPM候選清單仍不完整(亦即,若MPM候選項之總數小於N
mpm
之值),則視訊編碼器20 (且視情況,視訊解碼器30)可添加-1及+1至已包括之角度模式。若MPM清單仍不完整,MPM候選清單仍不完整(亦即,MPM候選項之總數小於N
mpm
之值),則視訊編碼器20 (且視情況,視訊解碼器30)可添加預設模式,即,垂直、水平、2及對角線模式。 視訊編碼器20及/或視訊解碼器30可識別之非MPM模式包括未包括於上文所述之MPM候選清單建構程序中的任何剩餘框內預測模式。與上文(例如,在引用JVET-C0055之部分)所描述的基於明度之MPM清單建構程序之差別在於,當添加一個候選項時,所添加之候選項並非LM模式。替代地或另外,平面及DC模式可在所有空間相鄰者之後添加。替代地,視訊編碼器20及/或視訊解碼器30可實施一或多個其他MPM清單建構技術來替換JVET-C0055之技術。 關於明度模式及色度模式之統一,視訊編碼器20可實施本發明之各種色度模式發信技術。視訊編碼器20可根據包括以下部分之程序來編碼色度模式。作為一個部分,視訊編碼器20可編碼且發信一位元旗標以指示僅可適用於色度分量之預測模式中之任一者(例如,LM,其係色度編碼特有的)之使用。若色度區塊係根據此色度特定模式經編碼(由此致使視訊編碼器20將該旗標設定至啟用狀態),則視訊編碼器20可另外編碼且發信特定模式之索引。 另外,視訊編碼器20可編碼且發信一旗標以指示包括於MPM候選清單中之模式的使用。亦即,若視訊編碼器20選擇一預測模式用於編碼色度區塊,且選定預測模式包括於MPM候選清單中,則視訊編碼器20可將該旗標設定至啟用狀態。隨後,若色度區塊係使用包括於MPM候選清單中之預測模式經編碼,則視訊編碼器20可另外編碼且發信該模式之索引,其指示模式在MPM候選清單中之位置。 若視訊編碼器20判定色度區塊既不根據色度特定預測模式亦不根據包括於MPM候選清單中之預測模式經編碼,則視訊編碼器20可編碼且發信識別剩餘模式之資訊。視訊編碼器20可根據不同次序實施色度編碼之上文所列出之部分/選項。不同次序之實例在以下表8.1或表9中給出。
表 8.1- 用於每一色度模式之位元子串
若色度框內模式之模式清單僅包括LM部分及MPM部分(如同明度MPM,包括多個DM模式及來自空間相鄰者之模式),則視訊編碼器20可以另一經修改方式來實施色度模式之發信,如下表9中所示。
表 9
在另一替代例中,視訊編碼器20 (且視情況,視訊解碼器30)可總是添加預設模式(諸如平面、DC、水平、垂直模式)至MPM候選清單。在一個實例中,可首先用上述技術中之一或多者建構MPM候選清單之N
mpm
個候選項。接著,預設模式之缺失模式可替換最後一或多個MPM候選項。 圖14為說明根據本發明之態樣的視訊解碼器30之處理電路可執行之實例程序220的流程圖。程序220可在視訊解碼器30之處理電路判定可供用於預測視訊資料之明度區塊的多個推演模式(DM)亦可供用於預測視訊資料之色度區塊時開始,該色度區塊對應於該明度區塊(222)。視訊解碼器30可形成關於該色度區塊之預測模式之一候選清單,該候選清單包括可供用於預測該色度區塊之該多個DM中之一或多個DM (224)。在一些非限制性實例中,視訊解碼器30之處理電路可在經編碼視訊位元串流中接收指示該候選清單之該一或多個DM中之每一各別DM的資料,且重建構指示一或多個DM中之每一各別DM的所接收資料,從而形成候選清單。在其他實例中,視訊解碼器30之處理電路可建構候選清單。 視訊解碼器30之處理電路可判定使用候選清單之一或多個DM中之任何DM來解碼色度區塊(226)。在一些非限制性實例中,視訊解碼器30之處理電路可在經編碼視訊位元串流中接收指示色度區塊係使用DM中之一者進行編碼的一位元旗標。基於使用候選清單之一或多個DM中之任何DM來解碼色度區塊的判定,視訊解碼器30之處理電路可解碼識別候選清單之將用於解碼色度區塊的選定DM的一指示(228)。舉例而言,視訊解碼器30之處理電路可重建構指示識別候選清單中之選定DM之位置的索引值的資料(在經編碼視訊位元串流中接收)。隨後,視訊解碼器30之處理電路可根據選定DM來解碼色度區塊(230)。在各種實例中,包括明度區塊及色度區塊之視訊資料可儲存至視訊解碼器30之記憶體。 在一些實例中,包括於候選清單中之一或多個DM可包括以下各項中之一或多者:一第一預測模式,其與對應明度區塊之中心位置相關聯;一第二預測模式,其與對應明度區塊之左上方位置相關聯;一第三預測模式,其與對應明度區塊之右上方位置相關聯;一第四預測模式,其與對應明度區塊之左下方位置相關聯;或一第五預測模式,其與對應明度區塊之右下方位置相關聯。在一些實例中,該候選清單可進一步包括不同於該一或多個DM中之每一者的一或多個色度框內預測模式。在一些此等實例中,該等色度框內預測模式中之每一者對應於用以預測該色度區塊之一相鄰色度區塊的一模式。在一些實例中,該候選清單之至少一個各別色度框內預測模式係僅用於預測色訊資料的一色度特定預測模式。 圖15為說明根據本發明之態樣的視訊編碼器20之處理電路可執行之實例程序240的流程圖。程序240可在視訊編碼器20之處理電路判定可供用於預測視訊資料之明度區塊的多個推演模式(DM)亦可供用於預測視訊資料之色度區塊時開始,該色度區塊對應於該明度區塊(242)。在各種實例中,包括明度區塊及色度區塊之視訊資料可儲存至視訊編碼器20之記憶體。視訊編碼器20可形成關於該色度區塊之預測模式之一候選清單,該候選清單包括可供用於預測該色度區塊之該多個DM中之一或多個DM (244)。 視訊編碼器20之處理電路可判定使用候選清單之一或多個DM中之任何DM來編碼色度區塊(246)。基於使用候選清單之一或多個DM中之任何DM來編碼色度區塊的判定,視訊編碼器20之處理電路可編碼識別候選清單之將用於解碼色度區塊的選定DM的一指示(248)。舉例而言,視訊編碼器20之處理電路可編碼指示識別候選清單中之選定DM之位置的索引值的資料,且在經編碼視訊位元串流中發信經編碼資料。隨後,視訊編碼器20之處理電路可根據選定DM來編碼色度區塊(250)。在一些實例中,視訊編碼器20之處理電路可在經編碼視訊位元串流中發信指示該色度區塊是否使用一線性模型(LM)模式進行編碼的一一位元旗標。在此等實例中,視訊編碼器20之處理電路可在經編碼視訊位元串流中發信指示該候選清單之該一或多個DM中之每一各別DM的資料。 在一些實例中,包括於候選清單中之一或多個DM可包括以下各項中之一或多者:一第一預測模式,其與對應明度區塊之中心位置相關聯;一第二預測模式,其與對應明度區塊之左上方位置相關聯;一第三預測模式,其與對應明度區塊之右上方位置相關聯;一第四預測模式,其與對應明度區塊之左下方位置相關聯;或一第五預測模式,其與對應明度區塊之右下方位置相關聯。在一些實例中,該候選清單可進一步包括不同於該一或多個DM中之每一者的一或多個色度框內預測模式。在一些此等實例中,該等色度框內預測模式中之每一者對應於用以預測該色度區塊之一相鄰色度區塊的一模式。在一些實例中,該候選清單之至少一個各別色度框內預測模式係僅用於預測色訊資料的一色度特定預測模式。在一些實例中,視訊編碼器20之處理電路可判定該一或多個DM中之至少兩個DM係相同的,且可將該至少兩個相同DM中之僅一個DM包括於該候選清單中。 圖16為說明根據本發明之態樣的視訊解碼器30之處理電路可執行之實例程序260的流程圖。程序260可在視訊解碼器30之處理電路針對儲存至視訊解碼器30之記憶體的視訊資料之色度區塊形成最可能模式(MPM)候選清單,以使得MPM候選清單包括與視訊資料的相關聯於色度區塊之明度區塊相關聯的一或多個推演模式(DM),及可用於解碼視訊資料之亮度分量的多個明度預測模式(262)時開始。在一些實例中,視訊解碼器30之處理電路可將一或多個DM添加至MPM候選清單,且可在MPM候選清單之出現在MPM候選清單中的所有一個或DM之位置之後的位置添加繼承自色度區塊之相鄰色度區塊的一或多個色度模式。 在一些實例中,視訊解碼器30之處理電路可回應於LM模式係用以預測色度區塊之一或多個相鄰色度區塊的判定而自MPM候選清單省略LM模式之任何額外例項。在一些實例中,視訊解碼器30之處理電路可在經編碼視訊位元串流中接收指示色度區塊是否使用LM模式進行編碼的一位元旗標。在一個情境下,視訊解碼器30之處理電路可判定所接收之一位元旗標經設定至停用狀態,可接收對應於MPM候選清單之一特定模式的MPM索引,且基於所接收之一位元旗標經設定至停用狀態可選擇對應於所接收之MPM索引的特定模式。在另一情境下,視訊解碼器30之處理電路可判定所接收之一位元旗標經設定至啟用狀態,且基於所接收之一位元旗標經設定至啟用狀態,可自MPM候選清單選擇LM模式。 在一些實例中,視訊解碼器30之處理電路可判定與色度區塊相關聯之預設模式之數目是否符合預定臨限值。基於預設模式之數目符合預定臨限值的判定,視訊解碼器30之處理電路可將預設模式中之每一預設模式添加至MPM候選清單,且可自MPM候選清單省略所有預設模式。視訊解碼器30之處理電路可自MPM候選清單選擇一模式(264)。隨後,視訊解碼器30之處理電路可根據選自MPM候選清單之模式來解碼色度區塊(266)。 在一些實例中,為了形成MPM候選清單,視訊解碼器30之處理電路可將一或多個DM添加至MPM候選清單,且可在MPM候選清單之出現在MPM候選清單中的所有一個或DM之位置之後的位置添加繼承自色度區塊之相鄰色度區塊的一或多個色度模式。在一些實例中,為了形成MPM候選清單,視訊解碼器30之處理電路可將一或多個線性模型(LM)模式添加至MPM候選清單。在一個此實例中,視訊解碼器30之處理電路可判定一或多個LM模式包含第一模式之第一例項及第一LM模式之一或多個額外例項,且可回應於第一LM模式係用以預測色度區塊之一或多個相鄰色度區塊的判定而自MPM候選清單省略LM模式之一或多個額外例項。 在一些實例中,視訊解碼器30之處理電路可在經編碼視訊位元串流中接收指示色度區塊是否使用LM模式進行編碼的一位元旗標,其中自MPM候選清單選擇模式係基於該一位元旗標之值。在一些此等實例中,視訊解碼器30之處理電路可判定一或多個LM模式包括多個LM模式,且可判定所接收之一位元旗標經設定至啟用狀態。在一些此等實例中,視訊解碼器30裝置處理電路可接收對應於MPM候選清單中之多個LM模式之一特定LM模式的位置的LM索引,且可基於所接收之一位元旗標經設定至啟用狀態而選擇對應於所接收之LM索引的特定LM模式用於寫碼色度區塊。在一些實例中,為了自MPM候選清單選擇模式,視訊解碼器30之處理電路可判定所接收之一位元旗標經設定至停用狀態,可接收對應於MPM候選清單之一特定模式的MPM索引,且可基於所接收之一位元旗標經設定至停用狀態,選擇對應於所接收之MPM索引的特定模式。 在一些實例中,視訊解碼器30之處理電路可判定與色度區塊相關聯之預設模式之數目是否符合預定臨限值。在此等實例中,視訊解碼器30之處理電路可執行以下各項中之一者:(i)添加,基於預設模式之數目不符合預定臨限值的判定,將預設模式中之每一預設模式添加至MPM候選清單;或(ii)基於預設模式之數目符合預定臨限值的判定,自MPM候選清單省略所有預設模式。 圖17為說明根據本發明之態樣的視訊編碼器20之處理電路可執行之實例程序280的流程圖。程序280可在視訊編碼器20之處理電路針對儲存至視訊編碼器20之記憶體的視訊資料之色度區塊形成最可能模式(MPM)候選清單,以使得MPM候選清單包括一線性模型(LM)模式、與視訊資料的相關聯於色度區塊之明度區塊相關聯的一或多個推演模式(DM),及可用於解碼明度區塊的多個明度預測模式(282)時開始。在一些實例中,視訊編碼器20之處理電路可將一或多個DM添加至MPM候選清單,且可在出現在MPM候選清單中的所有一個或DM之位置之後的MPM候選清單之位置添加繼承自色度區塊之相鄰色度區塊的一或多個色度模式。 在一些實例中,視訊編碼器20之處理電路可回應於LM模式係用以預測色度區塊之一或多個相鄰色度區塊的判定而自MPM候選清單省略LM模式之任何額外例項。在一些實例中,視訊編碼器20之處理電路可在經編碼視訊位元串流中發信指示色度區塊是否使用LM模式進行編碼的一位元旗標。在一個情境下,視訊編碼器20之處理電路可基於色度區塊未使用LM模式進行編碼的判定而將該一位元旗標設定至停用狀態。在此情境下,基於色度區塊未使用LM模式進行編碼的判定及色度區塊係使用MPM候選清單之特定模式進行編碼的判定,視訊編碼器20之處理電路可在經編碼視訊位元串流中發信對應於MPM候選清單之特定模式的MPM索引。在另一情境下,視訊編碼器20之處理電路可基於色度區塊係使用LM模式進行編碼的判定而將該一位元旗標設定至啟用狀態。 在一些實例中,視訊編碼器20之處理電路可判定與色度區塊相關聯之預設模式之數目是否符合預定臨限值。基於預設模式之數目符合預定臨限值的判定,視訊編碼器20之處理電路可將預設模式之每一預設模式添加至MPM候選清單,且可自MPM候選清單省略所有預設模式。視訊編碼器20之處理電路可自MPM候選清單選擇一模式(284)。隨後,視訊編碼器20之處理電路可根據選自MPM候選清單之模式來編碼色度區塊。 在一些實例中,為了形成MPM候選清單,視訊編碼器20之處理電路可將一或多個線性模型(LM)模式添加至MPM候選清單。在一些實例中,視訊編碼器20之處理電路可在經編碼視訊位元串流中發信指示色度區塊是否使用MPM候選清單之一或多個LM模式中之任一者進行編碼的一位元旗標。在一些實例中,視訊編碼器20之處理電路可設定基於色度區塊未使用候選清單之任何LM模式進行編碼的判定而將該一位元旗標設定至停用狀態,且可基於色度區塊未使用MPM候選清單之任何LM模式進行編碼的判定且基於色度區塊係使用MPM候選清單之特定模式進行編碼的判定,在經編碼視訊位元串流中發信對應於MPM候選清單之特定模式的MPM索引。在一些實例中,視訊編碼器20之處理電路可基於色度區塊係使用MPM候選清單之一或多個LM模式中之一特定LM模式進行編碼的判定而將該一位元旗標設定至啟用狀態。 在一些實例中,視訊編碼器20之處理電路可判定與色度區塊相關聯之預設模式之數目是否符合預定臨限值。隨後,視訊編碼器20之處理電路可執行以下各項中之一者:(i)基於預設模式之數目不符合預定臨限值的判定,將預設模式中之每一預設模式添加至MPM候選清單;或(ii)基於預設模式之數目符合預定臨限值的判定,自MPM候選清單省略所有預設模式。 應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可以不同序列執行、可被添加、合併或完全省去(例如,並非所有所描述動作或事件係實踐該等技術所必要的)。此外,在某些實例中,可例如經由多執行緒處理、中斷處理或多個處理器同時而非依序執行動作或事件。 在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體通常可對應於(1)非暫時性之有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術的指令、碼及/或資料結構的任何可用媒體。電腦程式產品可包括電腦可讀媒體。 舉例說明而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器件、磁碟儲存器件或其他磁性儲存器件、快閃記憶體或可用於儲存呈指令或資料結構形式之所要程式碼且可由電腦存取的任何其他媒體。並且,任何連接被恰當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如紅外線、無線電及微波)自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纜、雙絞線、DSL或無線技術(諸如紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為關於非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再現資料,而光碟使用雷射以光學方式再現資料。以上各者之組合亦應包括於電腦可讀媒體之範圍內。 指令可由一或多個處理器執行,該一或多個處理器諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)或其他等效的整合或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指上述結構或適合於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,本文中所描述之功能性可提供於經組態用於編碼及解碼之專用硬體及/或軟體模組內,或併入組合式編解碼器中。此外,該等技術可完全實施於一或多個電路或邏輯元件中。 可以多種器件或裝置來實施本發明之技術,該等器件或裝置包括無線手機、積體電路(IC)或IC之集合(例如,晶片組)。在本發明中描述了各種組件、模組或單元以強調經組態以執行所揭示技術之器件的功能態樣,但未必要求由不同硬體單元來實現。確切而言,如上所述,可將各種單元組合於編解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合結合合適之軟體及/或韌體來提供該等單元。 已描述了各種實例。此等及其他實例在以下申請專利範圍之範疇內。