TWI751771B - 視訊和影像編解碼中之高階信息發信 - Google Patents
視訊和影像編解碼中之高階信息發信 Download PDFInfo
- Publication number
- TWI751771B TWI751771B TW109138224A TW109138224A TWI751771B TW I751771 B TWI751771 B TW I751771B TW 109138224 A TW109138224 A TW 109138224A TW 109138224 A TW109138224 A TW 109138224A TW I751771 B TWI751771 B TW I751771B
- Authority
- TW
- Taiwan
- Prior art keywords
- slice
- picture
- type
- current picture
- types
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供一種在影像與視訊編解碼中對高階信息加以發信的方法。一視訊解碼器接收來自一位元流的資料以解碼作為一視訊的一當前畫面。視訊解碼器剖析該當前畫面的一畫面標頭,該畫面標頭包括一組一或多個切片信息語法元素在該畫面標頭,以指示出存在於該當前畫面中的一或多個切片類型的存在。視訊解碼器藉由使用該組切片信息語法元素來重構該當前畫面的該等切片。
Description
本揭示通常涉及視訊編解碼的傳送。尤其,本揭示關於對用於編解碼影像與視訊資料的高階信息的發信加以改善壓縮效率。
除非此處另有說明外,本小節所描述的方法相對於下面列出的請求項而言不是先前技術,並且不因納入於本小節而被認為承認是先前技術。
高效率視訊編解碼(High Efficiency Video Coding,HEVC)的標準,是由視訊編碼聯合協作小組(Joint Collaborative Team on Video Coding,JCT-VC)所開發的最新國際視訊編解碼標準。輸入的視訊信號是從重構後信號加以預測,而此重構後信號是從編解碼畫面區域所加以推導。預測殘差信號是藉由一線性轉換加以處理。轉換係數以及其他邊信息一起被量化與熵編碼於位元流中。在對去量化轉換係數進行逆轉換之後,重構後信號是由預測信號與重構後殘差信號所產生。重構後信號進一步藉由環路濾波器加以處理來去除編解碼偽影。解碼後畫面被儲存於幀緩衝器中以用於預測輸入視訊信號中的後續畫面。
在HEVC中,一編碼的畫面被分割成以相關聯的編碼樹單元
(coding tree unit,CTU)來表示的非重疊的方形塊區域。一個經過編碼的畫面可以藉由一些切片的集合來表示,每一畫面包括多個整數的CTU。在一切片中的多個個別CTU是以逐行掃描的順序(raster scanning order)來處理。一雙向預測(bi-predictive,B)切片可以用幀內預測或幀間預測來解碼,其使用最多兩個運動向量與參考索引來預測每一塊的樣本值。一預測(predictive,P)切片可以用幀內預測或幀間預測來解碼,其使用最多一個運動向量與參考索引來預測每一塊的樣本值。一幀內(intra,I)切片則僅用幀內預測來解碼。
使用遞迴的四叉樹(QT)結構,一CTU可被分割成多個非重疊的編解碼單元(CUs),以適應於各種當地局部的運動與組織結構的特徵。對於每一CU則會具體指定一或複數個預測單元PU。PU(與相關聯的CU語法)是作為發信預測子信息的一基本單元。然後使用所指定的預測程序,來預測PU內相關聯像素樣本的值。使用殘差的四叉樹(RQT)結構,一CU可進一步被分割來代表相關聯的預測殘差信號。RQT結構的樹葉節點(leaf nodes)對應於轉換單元(TUs)。一轉換單元包含有數個亮度樣本(luma samples,大小為8x8、16x16或32x32)的一轉換塊(TB)或是數個亮度樣本(大小為4x4)的四個轉換塊,以及數個彩度樣本(chroma樣本,4:2:0顏色形式的一畫面)的二個相對應轉換塊。一整數轉換會應用在一轉換塊,而量化係數水平的數值會與其他邊信息一起熵編解碼於位元流中。第2圖示出一塊分割(左方)與其相對應的四叉樹QT表示(右方)的例子。實線表示CU的邊界而虛線表示TU的邊界。
編碼樹單元(CTU)、編碼塊(CB)、預測塊(PB)與轉換塊(TB)名詞定義是用來表明各自相關聯於CTU、CU、PU與TU的一個顏色成分的二維樣本陣列。因此一CTU是由一亮度CTB、二彩度CTB與相關聯的語
法元素所組成。相似的關係也適用於CU、PU與TU。樹分割通常同時應用於亮度與彩度二者,雖然當彩度達到了某些最小大小限制時會有些例外情況。
在通用視訊編解碼(Versatile Video Coding,簡稱VVC)中,一編碼畫面也可以被分割成藉由CTU來代表的非重疊的方形塊區域。藉由具有巢狀式多重-類型樹的一四叉樹使用二叉與三叉樹分割,每一CTU可以被分割為一或多個尺寸較小的編解碼單元(CU)。所生成的CU分割可以是方形或長方形的形狀。
以下發明內容僅是說明性的,不打算以任何方式加以限制。也就是說,以下發明內容被提供以介紹此處所描述的新且非顯而易知的技術的概念、重點、好處和優勢。選擇性而不是將所有的實施方式在下面的詳細說明中進行進一步描述。因此,以下發明內容不用於決定所要求主題的本質特徵,也不用於決定所要求主題的範圍。
視訊解碼器接收來自一位元流的資料以解碼作為一視訊的一當前畫面。視訊解碼器剖析該當前畫面的一畫面標頭,該畫面標頭包括一組一或多個切片信息語法元素在該畫面標頭,以指示出存在於該當前畫面中的一或多個切片類型的存在。該組切片信息語法元素可以指示出一特定類型的切片是否存在於該當前畫面中。該組切片信息語法元素可以包括一或多個語法元素:用以指示出(i)一第一切片類型是否存在於該當前畫面中,以及(ii)一第二且不相同的切片類型是否存在於該當前畫面中;其中該第一切片類型的一切片並未參考除了該當前畫面之外的畫面的信息,以及該第二切片類型的一切片有參考除了該當前畫面之外的畫面的信息。
當剖析畫面標頭時,視訊解碼器可以旁路與編解碼工具相關的畫面標頭語法元素而不加以剖析,當該編解碼工具與存在於藉由該組切片信息語
法元素所識別出的當前畫面中的一或多個切片類型不相關聯。
視訊解碼器藉由使用該組切片信息語法元素來重構該當前畫面的切片。在一些實施例中,該組切片信息語法元素包括一多-切片-類型語法元素來指示出該當前畫面是否包括多於一種切片類型的切片。在一些實施例中,當該多-切片-類型語法元素指示出該當前畫面包括多於一種切片類型的切片時,該當前畫面的一切片的一切片標頭指示出一切片類型。在一些實施例中,該當前畫面參考一畫面參數組(picture parameter set,PPS),該PPS包括一PPS語法元素來指示出不同切片類型的切片是否被允許於該當前畫面中。當該PPS語法元素指示出多於一種切片類型的切片是被允許時,該當前畫面的畫面標頭包括該多-切片-類型語法元素。
200:視訊編碼器
205:視訊源
208:減法器
209:殘差信號
210:轉換模組
211:量化模組
212:已量化係數
213:已預測像素資料
214:逆量化模組
215:逆轉換模組
216:轉換係數
217:已重構像素資料
219:已重構殘差
220:幀內-畫面估計模組
225:幀內-預測模組
230:運動補償模組
235:運動估計模組
240:幀間-預測模組
245:迴路濾波器
250:已重構畫面緩衝器
265:MV緩衝器
275:MV預測模組
290:熵編碼器
295:位元流
300:程序
310~330:區塊
400:視訊解碼器
410:逆轉換模組
411:逆量化模組/去量化模組
412:已量化係數
413:已預測像素資料
416:轉換係數
417:已解碼像素資料
419:已重構殘差信號
425:幀內-預測模組
430:運動補償模組
445:迴路濾波器
450:已解碼畫面緩衝器
455:顯示裝置
465:MV緩衝器
475:MV預測模組
490:剖析器(熵解碼器)
495:位元流
500:程序
510~530:區塊
600:電子系統
605:匯流排
610:處理單元
615:影像處理單元
620:系統記憶體
625:網路
630:唯讀記憶體
635:永久存儲裝置
640:輸入設備
645:輸出設備
下列圖式用以提供本發明的進一步理解,並被納入且構成本發明的一部分。這些圖式說明瞭本發明的實施方式,並與說明書一起用以解釋本發明的原理。為了清楚地說明本發明的概念,與實際實施方式中的尺寸相比,一些元件可以不按照比例被示出,這些圖式無需按照比例繪製。
第1圖概念性繪示出一編碼視訊的一部分,其中在畫面標頭的語法元素被用來指示出某個或某些切片類型是否存在於相對應的畫面中。
第2圖繪示出一示例的視訊編碼器。
第3圖概念性繪示出一程序來發信在一畫面標頭的一或多個語法元素以指示出可能存在於當前畫面中的切片類型。
第4圖繪示出一示例的視訊解碼器。
第5圖概念性繪示出一程序來使用在一畫面標頭的一或多個語法元素以指示出可能存在於當前畫面中的切片類型。
第6圖概念性地繪示出本揭示的一些實施例可以於其中加以施行實作的一電子系統。
在下面詳細的說明書中,為了透徹理解相關教示內容,透過舉例的方式進行說明大量具體的細節。基於本文所描述的教示內容的任何改變、推導和/或拓展均在本發明的保護範圍內。為了避免不必要地混淆本發明的教示內容的方面,關於此處所公開的一個或者複數個示例性實施方式中已知的方法、程式、元件和/或電路,在有些時候會用相對較高的層次加以描述而不細說。
本揭示的一些實施例對用於編解碼影像與視訊資料的高階信息發信(signaling high-level information)提供方法來改善壓縮效率。在一些實施例中,一或多個高階語法(high-level syntax,HLS)組,例如視訊參數組(video parameter set,VPS)、序列參數組(sequence parameter set、SPS)、畫面參數組(picture parameter set、PPS)以及畫面標頭組,可以進一步包括多個語法元素以指示出可能存在於相關聯資料結構的切片類型。如此一來,一視訊編解碼器可以對在一當前HLS組中的語法元素跳過而不加以編碼或解碼,當所述當前HLS組中的語法元素是關於與相關聯資料結構中所存在的任何切片類型不相關聯的編解碼器工具。例如,在一些實施例中,一視訊編解碼器可以進一步包括在一當前SPS中的一或多個語法元素,來指示出藉由該當前SPS所參考的相關聯編解碼視訊序列中可能存在的切片類型。當該SPS中的一或多個語法元素指示出I切片是在相關聯編解碼視訊序列中唯一存在的切片類型時,一視訊編解碼器可以對與I切片不相關的所有SPS語法元素跳過而不編解碼(例如,幀間預測工具以及於一I切片中不適用的其他工具)。
a)對切片類型(一或多個)的存在加以發信
在一些實施例中,一畫面標頭被發信用於每一編解碼畫面。該畫面標頭可以包括一或多個語法元素,以指示出可能存在於該當前畫面中的切片類型。如此一來,一視訊編解碼器可以跳過以下的畫面標頭語法元素而不加以編碼或解碼:與當前畫面中所存在的任何切片類型不相關聯的編解碼工具的相關畫面標頭語法元素。例如,當該畫面標頭指示出I切片是在當前編解碼畫面中唯一存在的切片類型時,一視訊編解碼器可以對與I切片不相關的所有畫面標頭語法元素跳過而不編解碼(例如,幀間預測工具以及於一I切片中不適用的其他工具)。
在一些實施例中,畫面標頭可以進一步包括一或多個語法元素,以指示出可能存在於一當前畫面中的切片類型的集合(collection)。在一些實施例中,一視訊編解碼器於該畫面標頭中發信一語法元素ph_slice_types。表格1與2提供二個示例性表格來解釋ph_slice_types的語法數值。尤其,這些表格顯示可能存在於相關聯資料結構中的ph_slice_types的語法數值的映射。
在一些實施例中,畫面標頭可以包括多個語法元素以指示出可能存在於當前畫面中的某一些切片類型。在一些實施例中,SPS可以包括三個語法旗標sps_slice_B_present、sps_slice_P_present、與sps_slice_I_present以指示出B切片、P切片、與I切片是否分別存在於來自當前SPS所參考的一編解碼器視訊序列的編解碼畫面中。相似地,PPS可以包括三個語法旗標pps_slice_B_present、pps_slice_P_present、與pps_slice_I_present以指示出B切片、P切片、與I切片是否分別存在於來自參考當前SPS的編解碼畫面中。在一些實施例中,畫面標頭可以包括三個語法旗標在畫面標頭中:ph_slice_B_present、ph_slice_P_present、與ph_slice_I_present,以分別指示出B切片、P切片、與I切片是否存在於當前畫面中。
在一些實施例中,一視訊編解碼器於該畫面標頭中發信信息,以推導出變數phPicType來指示出可能存在於當前畫面中的切片類型。表格3與4提供二個示例性表格來映射或解釋phPicType的語法數值。
表格4是從表格3加以延伸用以解釋在一訪問單元分隔符(access unit delimiter,AUD)中的語法元素pic_type。因此,對信息加以發信用以推導出變數phPicType可以用發信於相關聯AUD中phPicType的數值(當存在時)為前提條件。在一些實施例中,AUD被約束為對每一訪問單元(access unit)總是發信。對信息加以發信用以推導出變數phPicType可以用發信於相關聯AUD中phPicType的數值為前提條件。例如,當發信於相關聯AUD中的phPicType等於0時,一視訊編解碼器可以跳過而不編碼或解碼用來推導在當前畫面標頭中變數phPicType的信息,而且phPicType被推論等於0。
在一些實施例中,一視訊編解碼器可以有多於一個高階語法組(包括多個語法元素)用來對切片類型加以發信,而前述切片類型是可能存在於具有相同語法元素數值解釋的分別相關聯的資料結構中。例如,一視訊編解碼器可以包含SPS與AUD二者,在SPS與AUD都具有一語法元素用來對切片類型加以指示,而前述切片類型是可能存在於具有相同語法元素解釋(如表格1-4)的分別相關聯的資料結構中。
在一些實施例中,一語法元素intra_only_constraint_flag被發信來對被允許切片類型的約束加以指明。在一些實施例中,將信息發信以推導出語法元素來對在分別相關聯的資料結構中可能存在的切片類型加以發信,可以進一步用語法元素intra_only_constraint_flag的數值為條件。在一些實施例中,當intra_only_constraint_flag等於1時,一視訊編解碼器可以跳過以下的語法元素
而不加以編碼或解碼:關於與I切片類型不相關聯的編解碼工具的語法元素。
在一些實施例中,一或多個高階語法(high-level syntax,HLS)組,例如視訊參數組(video parameter set,VPS)、序列參數組(sequence parameter set、SPS)、畫面參數組(picture parameter set、PPS)與/或畫面標頭(picture header,PH),可以包括一或多個語法元素以指示出可能存在於當前畫面中的網路抽象層(network abstraction layer,NAL)單元類型。如此一來,一視訊編解碼器可以跳過以下的畫面標頭語法元素而不加以編碼或解碼:關於與相關聯資料結構中所存在的NAL單元類型不相關聯的編解碼器工具的畫面標頭語法元素。例如,當該畫面標頭指示出即時解碼刷新(instantaneous decoding refresh,IDR)單元類型存在時,一視訊編解碼器可以跳過當前畫面中的參考畫面列表語法元素而不加以編碼或解碼。
在一些實施例中,一視訊編解碼器可以在一或多個高階語法(HLS)組(例如VPS、SPS、PPS、與/或畫面標頭)中,發信一或多個關於使用逐漸解碼刷新(gradual decoding refresh,GDR)的信令語法元素(signal syntax element)。在一些實施例中,在藉由當前畫面所參考的高階語法組中GDR-相關的語法元素的數值的條件下,關於GDR的語法元素被發信於一畫面標頭。在一些實施例中,在畫面標頭中,指明所選擇PPS索引的語法元素ph_pic_parameter_set_id在指明當前畫面是否為一GDR畫面的語法元素gdr_pic_flag之前被發信。在被一當前畫面標頭中所選擇PPS所參考的SPS中,當語法元素gdr_enabled_flag等於0時,在該當前畫面標頭中會跳過對gdr_pic_flag的編解碼。當語法元素gdr_pic_flag不存在時會被推論等於0。下面表格5顯示一畫面標頭的一示例性語法表格來顯示關於GDR的語法元素:表格5:
在一些實施例中,一HLS組(例如VPS、SPS、與PPS)可以進一步包括一或多個語法元素以指示出可能存在於相關聯資料結構中的切片類型。如此一來,可以跳過對下列HLS元素的編解碼:與相關聯資料結構中所存在的任何切片類型不相關聯的編解碼工具的相關HLS元素。例如,一視訊編解碼器可以編碼或解碼於一當前PPS中的一或多個語法元素,以指示出可能存在於相關聯編解碼畫面(稱為當前PPS)中的切片類型。當於PPS中一或多個所增加的語法元素指示出I切片是在相關聯編解碼畫面中唯一存在的切片類型時,一視訊編解碼器可以對與I切片不相關的所有PPS語法元素跳過而不編解碼(例如,幀間預測工具以及於一I切片中不適用的其他工具)。在一些實施例中,PPS可以進一步包括藉由pps_pic_type所表示的一語法元素。pps_pic_type的數值的解釋可以依據上面表格1-4藉由其中示例性映射之一來加以指明。
在一些實施例中,在藉由當前畫面標頭所參考的高階語法組中的相關信息(當存在時)的條件下,一視訊編解碼器可以編碼或解碼畫面標頭語法元素以指示出可能存在於一當前畫面的切片類型。在一例子中,一視訊編解碼器可以編碼或解碼在畫面標頭中的三個語法旗標(表示為ph_slice_B_present_flag、ph_slice_P_present_flag、與ph_slice_I_present_flag),
以分別指示出B切片、P切片、與I切片是否存在於當前畫面中。當被一當前畫面標頭所參考的PPS指示出只有I切片類型存在於當前畫面中時,視訊編解碼器可以推論ph_slice_I_present_flag等於1、ph_slice_B_present_flag與ph_slice_P_present_flag二者皆等於0,並且跳過此三個語法旗標而不加以編碼或解碼。視訊編解碼器可以進一步跳過當前畫面標頭中關於幀間預測的語法元素而不加以編碼或解碼。備選地,PPS可以包括三個語法旗標(表示為pps_slice_B_present、pps_slice_P_present、與pps_slice_I_present),以指示出B切片、P切片、與I切片是否分別存在於參考當前PPS的編解碼畫面中。
在一些實施例中,一視訊編解碼器可以於一畫面標頭發信或推導信息,以指示出在一當前畫面中是否存在多於一種切片類型。當指示出只有一種切片類型存在於該當前畫面中時,視訊編解碼器可以進一步對存在於當前畫面中的切片類型(B、P、或I)加以編碼或解碼。視訊編解碼器可以進一步跳過關於當前畫面相關聯切片中的切片類型的信息而不加以編碼或解碼,其中當前畫面相關聯切片中的切片類型被推論為與畫面標頭中的編解碼切片類型相同。當指示出有多於一種切片類型存在於該當前畫面中時,視訊編解碼器可以進一步對用於推導可能存在於當前畫面中的可能切片類型的信息加以編碼或解碼。視訊編解碼器可以進一步跳過僅適用於無使用的(unused)切片類型的編解碼工具的語法元素,而不對其數值加以編碼或解碼。
在一些實施例中,視訊編解碼器可以於一或多個HLS組(例如SPS與PPS)發信一或多個語法元素,以指示出以下是否被允許:在一畫面中存在有多於一種切片類型以用於參考上述一或多個HLS組的所有相關聯畫面。當被發信的HLS信息指示出在每一相關聯畫面中存在有多於一種切片類型是不被允許時,視訊編解碼器可以推論在一當前畫面中存在只有一種切片類型以用於參考上述一或多個HLS組的所有相關聯畫面;以及進一步跳過在畫面標頭中關
於用來指示出在一當前畫面中是否存在有多於一種切片類型的語法元素,而不加以編碼或解碼。視訊編解碼器可以進一步於上述一或多個HLS組發信另一個或多個語法元素,以指示出參考上述一或多個HLS組的每一畫面被進一步分割為多於一個切片。此一或多個語法元素是在用來指示出每一相關聯畫面是否可存在有多於一種切片類型的前述一或多個語法元素之前(於解碼順序中)被發信。當另一或多個編解碼語法元素指示出參考該一或多個HLS組的每一相關聯畫面包含只有一個切片時,視訊編解碼器可以推論在相關聯畫面中只存在有一種切片類型,而且跳過用來指示出每一相關聯畫面是否可存在有多於一種切片類型的前述一或多個語法元素,而不加以編碼或解碼。
在一些實施例中,一視訊編解碼器可以於一畫面標頭或其他HLS組中發信或推導信息,以指示出在一當前畫面中是否存在多於一種VCL NAL類型。當該當前畫面包含只有一個切片首先被發信時,視訊編解碼器可以推論在當前畫面中存在只有一種VCL NAL類型。例如,一視訊編解碼器可以發信語法元素mixed_nalu_types_in_pic_flag,來指明參考PPS的每一畫面是否有相同的nal_unit_type數值。在一些實施例中,語法元素mixed_nalu_types_in_pic_flag被移動至(被放置於)語法元素no_pic_partition_flag之後,而且只有在語法元素no_pic_partition_flag等於0時才加以編解碼,如下面表格6所示。由於mixed_nalu_types_in_pic_flag是關於以長方形切片分割模式來使用次畫面分割,對語法元素mixed_nalu_types_in_pic_flag進行編解碼可以進一步以下列為條件:長方形切片分割是否在使用以及當前畫面中切片的數目。
對一些實施例,下面表格6-8分別提供用於PPS、畫面標頭、與切片標頭的示例性的HLS語法表格。
在一PPS中的語法元素pps_mixed_slice_types_in_pic_flag指示出在一畫面中存在有多於一種切片類型以用於參考該PPS的所有畫面是否被允許。在一當前畫面標頭中的語法元素ph_mixed_slice_types_in_pic_flag指示出在一當前畫面中是否存在有多於一種切片類型。當pps_mixed_slice_types_in_pic_flag的數值等於0時,在參考該PPS的一當前畫面中存在有多於一種切片類型是不被允許的。ph_mixed_slice_types_in_pic_flag的數值不被編解碼而且被推論等於0。當ph_mixed_slice_types_in_pic_flag的數值等於0時,在切片標頭中的語法元素slice_type的數值不被編解碼而且被推論等於ph_slice_type的數值。在切片標頭中關於僅適用於無使用的(unused)切片類型的編解碼工具的語法元素的數值可以被進一步跳過。當ph_mixed_slice_types_in_pic_flag等於1時,在當前畫面中可能的切片類型是藉由表示為ph_slice_B_present_flag、ph_slice_P_present_flag、與ph_slice_I_present_flag的語法元素加以發信,來分別指示出在該當前畫面中B切片、P切片、與I切片是否可存在。
(b)發信多種切片類型
在一些實施例中,在一PPS中的語法元素mixed_slice_types_in_pic_flag指示出在一畫面中存在有多於一種切片類型以用於參考該PPS的所有畫面是否被允許。當pps_mixed_slice_types_in_pic_flag等於0時,語法元素ph_slice_type指明在當前標頭中只有一種切片類型存在。在切片標頭中關於僅適用於無使用的(unused)切片類型的編解碼工具的語法元素的數值被進一步跳過。在切片標頭中語法元素slice_type的數值可以從ph_slice_type的編解碼數值加以推論。表格9-11分別顯示使用pps_mixed_slice_types_in_pic_flag的PPS、畫面標頭、與切片標頭的語法表格。
在PPS RBSP(如表格9所示)中,語法元素mixed_nalu_types_in_pic_flag等於1指明參考該PPS的每一畫面具有多於一個VCL NAL單元,以及VCL NAL單元沒有與nal_unit_type相同的數值,以及該畫面不是一IRAP畫面。mixed_nalu_types_in_pic_flag的數值等於0指明參考該
PPS的每一畫面具有一或多個VCL NAL單元,以及參考該PPS的每一畫面的VCL NAL單元具有與nal_unit_type相同的數值。當不存在時,mixed_nalu_types_in_pic_flag的數值被推論等於0。當no_mixed_nalu_types_in_pic_constraint_flag等於1時,mixed_nalu_types_in_pic_flag的數值必須等於0。
對具有一nal_unit_type數值nalUnitTypeA在IDR_W_RADL到CRA_NUT的範圍(包含)的每一切片,在也包含具有另一nal_unit_type數值的一或多個切片的一畫面picA中(即,對畫面picA,mixed_nalu_types_in_pic_flag的數值的等於1),應用以下:
- 切片必須屬於一次畫面subpicA,其中相對應subpic_treated_as_pic_flag[i]的數值等於1。
- 切片不可以屬於picA的一次畫面,其中該次畫面包含具有不等於nalUnitTypeA的nal_unit_type的VCL NAL單元。
- 對在CLVS中按解碼順序的後續所有PU,在subpicA中任一切片的參考畫面清單RefPicList[0]或RefPicList[1]都不可以包括在當前條目(active entry)中解碼順序早於picA的任何畫面。
mixed_slice_types_in_pic_flag的數值等於1指明參考該PPS的每一畫面可存在有多於一種切片類型在當前畫面中。mixed_slice_types_in_pic_flag的數值等於0指明參考該PPS的每一畫面存在有一種類型在當前畫面中。當不存在時,mixed_slice_types_in_pic_flag的數值被推論等於0。
在畫面標頭RBSP(如表格10所示)中,當mixed_slice_types_in_pic_flag等於0時,語法元素ph_slice_type指明在當前畫面的所有切片標頭中slice_type的數值。
在切片標頭(如表格11所示)中,語法元素slice_type指明切片的編解碼類型。當不存在時,slice_types的數值被推論等於ph_slice_type的數值。(與不同切片類型相關聯的slice_type的數值如下面表格23所示)。
(c)對不同切片類型的一混和加以發信畫面標頭
在一些實施例中,視訊編解碼器指示出幀間切片類型(B或P)與幀內切片類型(I)是否可存在於一當前畫面中。語法元素ph_mixed_slice_types_in_pic_flag被進一步加入於畫面標頭中,以指示出在一當前畫面中是否可存在有多於一種切片類型。當ph_mixed_slice_types_in_pic_flag等於1時,一語法元素ph_intra_slice_present_flag被進一步發信,以指示出切片類型I是否可存在於該當前畫面中。變數InterSlicePresent與IntraSlicePresent分別指示出在一當前畫面中是否存在有任何幀間切片(切片類型B或P)與任何幀內切片(切片類型I)。變數InterSlicePresent與IntraSlicePresent可以從ph_mixed_slice_types_in_pic_flag、ph_intra_slice_present_flag、與ph_slice_type的數值加以推導。在切片標頭中,slice_type上信息的發信取決於ph_mixed_slice_types_in_pic_flag與IntraSlicePresent的數值。下面表格12與13分別顯示一畫面標頭與一切片標頭,其中語法元素指示出幀間切片與幀內切片是否存在:
ph_mixed_slice_types_in_pic_flag的數值為1指明在當前畫面中可存在有多於一種的切片類型。ph_mixed_slice_types_in_pic_flag的數值為0指明在一當前畫面中的所有切片必須有相同slice_type的數值。當ph_mixed_slice_types_in_pic_flag不存在時,ph_mixed_slice_types_in_pic_flag的數值被推論等於0。
ph_intra_slice_present_flag的數值為1指示出切片類型I可存在於一當前畫面中。ph_intra_slice_present_flag的數值為0指示出切片類型I不存在於一當前畫面中。當ph_mixed_slice_types_in_pic_flag等於0時,語法元素ph_slice_type指明在當前畫面的所有切片標頭中slice_type的數值。
變數InterSlicePresent與IntraSlicePresent如以下加以推導:
- 如果ph_mixed_slice_types_in_pic_flag等於1時,InterSlicePresent被設定等於1而且IntraSlicePresent被設定等於ph_intra_slice_present_flag
- 否則,InterSlicePresent被設定等於(ph_slice_type=I)而且IntraSlicePresent被設定等於(ph_slice_type==I)。
依據下面表格23,語法元素slice_type指明切片的編解碼類型。當slice_type不存在時,slice_types的數值如以下加以推導:
- 如果ph_mixed_slice_types_in_pic_flag等於1時,slice_type的數值被設定等於P_slice_flag。
-否則,slice_type的數值被設定等於ph_slice_type。
當ph_mixed_slice_types_in_pic_flag等於1而且IntraSlicePresent等於0時,語法元素P_slice_flag為1指明slice_type的數值等於P。當ph_mixed_slice_types_in_pic_flag等於1而且IntraSlicePresent等於0時,P_slice_flag等於0指明slice_type的數值等於B。
(d)對個別切片類型的存在加以發信
在一些實施例中,視訊編解碼器指示出每一切片類型(B、P、與I)是否可存在於一當前畫面中。在一當前畫面標頭中的語法元素ph_mixed_slice_types_in_pic_flag指示出在一當前畫面中是否可存在有多於一種切片類型。當ph_mixed_slice_types_in_pic_flag等於1時,一語法元素ph_present_slice_types被進一步發信,以指示出可存在於一當前畫面中的切片類型。尤其,變數BSlicePresent、PSlicePresent、與ISlicePresent分別指示出切片類型B、P、與I是否可存在於該當前畫面中。變數BSlicePresent、PSlicePresent、與ISlicePresent可以從ph_mixed_slice_types_in_pic_flag、ph_slice_type、與ph_present_slice_types的數值中加以推導。在切片標頭中,slice_type上信息的發信取決於ph_mixed_slice_types_in_pic_flag與ph_present_slice_types的數值。下面表格14與15顯示一畫面標頭與一切片標頭,其中語法包括對於指示出每一切片類型是否可存在加以發信。
ph_mixed_slice_types_ie_pic_flag的數值為等於1指明在當前畫面中可存在有多於一種的切片類型。ph_mixed_slice_types_in_pic_flag的數值為等於0指明在一當前畫面中的所有切片必須有相同slice_type的數值。當ph_mixed_slice_types_in_pic_flag不存在時,ph_mixed_slice_types_in_pic_flag的數值被推論等於0。
當ph_mixed_slice_types_in_pic_flag等於1時,語法元素ph_present_slice_types指示出可存在於一當前畫面的切片類型。當ph_mixed_slice_types_in_pic_flag等於0時,語法元素ph_slice_type指明在當前畫面的所有切片標頭中slice_type的數值。
變數BSlicePresent、PSlicePresent、與ISlicePresent如以下加以推導:
- 如果ph_mixed_slice_types_in_pic_flag等於1,BSlicePresent被設定等於(ph_slice_type==B)、PSlicePresent被設定等於(ph_slice_type==P)、而且ISlicePresent被設定等於(ph_slice_type==I)
- 否則,BSlicePresent被設定等於(ph_present_slice_types=0)、PSlicePresent被設定等於(ph_present_slice_types=1)、而且ISlicePresent被設定等於(ph_present_slice_types=2)。
依據下面表格23,語法元素slice_type指明切片的編解碼類型。當語法元素slice_type不存在時,其數值如以下加以推導:
- 如果ph_mixed_slice_types_in_pic_flag等於1時,slice_type的數值被設定等於(slice_type_flag>=ph_present_slice_types?slice_type_flag+1:slice_type_flag)。
否則,slice_type的數值被設定等於ph_slice_type。
當ph_mixed_slice_types_in_pic_flag等於1而且ph_present_slice_types的數值不等於3時,語法元素slice_type_flag指明slice_type的數值。。
在一些實施例中,語法元素ph_inter_slice_allowed_flag與ph_intra_slice_allowed_flag被發信來分別指示出幀間切片與幀內切片是否可被允許存在於該畫面中。當ph_inter_slice_allowed_flag等於0,僅關於幀內編解碼工具的語法元素不被發信。當ph_intra_slice_allowed_flag等於0,僅關於幀間編解碼工具的語法元素不被發信。當ph_inter_slice_allowed_flag等於0,在切片標頭的語法元素slice_type的數值被推論等於2而且不被編碼進位元流中。
(e)對幀間切片與幀內切片是否可能存在加以發信
在一些實施例中,視訊編解碼器對信息加以發信用以推導出幀間切片類型(B或P)與幀內切片類型(I)是否可分別存在於一編解碼畫面中。在一些實施例中,一語法元素ph_multiple_slice_types_in_pic_flag被進一步加入於畫面標頭中,以指示出該畫面的編解碼切片中是否可存在有多於一種的切片類型。ph_multiple_slice_types_in_pic_flag的數值等於1指明在畫面中的編解碼切片可以有不同的slice_type數值。ph_multiple_slice_types_in_pic_flag的數值等於0指明畫面中所有編解碼切片都有相同的slice_type數值。當ph_multiple_slice_types_in_pic_flag等於1,一語法元素ph_intra_slice_allowed_flag被進一步發信以指示出切片類型I是否可被允許於該
當前畫面中。當ph_multiple_slice_types_in_pic_flag等於0,一語法元素ph_slice_type被進一步發信以指明用於畫面中所有切片的slice_type數值。變數InterSliceAllowed與IntraSliceAllowed分別指示出幀間切片類型(切片類型B或P)與幀內切片類型(切片類型I)是否被允許於該畫面中。變數InterSliceAllowed與IntraSliceAllowed的數值可以從ph_multiple_slice_types_in_pic_flag、ph_intra_slice_allowed_flag、與ph_slice_type的數值加以推導。關於僅適用於無使用的(unused)切片類型的編解碼工具的PH語法元素的數值不被編解碼。當no_pic_partition_flag等於1或rect_slice_flag等於1而且num_slices_in_pic_minus1等於1時,ph_multiple_slice_types_in_pic_flag被推論等於0而且不被顯性地編解碼於位元流中。備選地,一新的語法元素pps_multiple_slice_types_in_pic_flag可以進一步被發信於PPS中,來指示出在參考該PPS的每一畫面中是否可存在有多於一種切片類型。當pps_multiple_slice_types_in_pic_flag等於0時,ph_multiple_slice_types_in_pic_flag被推論為等於0而且不被編碼進位元流中。下面表格16與17顯示一畫面標頭與一切片標頭,其中語法包括對於指示出幀間切片與幀內切片是否存在加以發信。
ph_multiple_slice_types_in_pic_flag的數值為1指明在畫面中編解碼切片可以有不同的slice_type數值。ph_multiple_slice_types_in_pic_flag的數值為0指明在畫面中所有編解碼切片都有相同的slice_type數值。當ph_multiple_slice_types_in_pic_flag不存在時,其數值被推論為0。
ph_intra_slice_allowed_flag的數值等於0指明在畫面中所有編解碼切片都具有slice_type等於0或1。ph_intra_slice_allowed_flag的數值等於1指明在畫面中可能有或可能沒有一或多個slice_type等於2的編解碼切片。當ph_multiple_slice_types_in_pic_flag等於0時,語法元素ph_slice_type指明在畫面中所有切片的slice_type數值。
變數InterSliceAllowed與IntraSliceAllowed如以下加以推導:
- 如果ph_multiple_slice_types_in_pic_flag等於1時,InterSliceAllowed被設定等於1而且IntraSliceAllowed被設定等於ph_intra_slice_present_flag
- 否則,InterSliceAllowed被設定等於(ph_slice_type=I)而且IntraSliceAllowed被設定等於(ph_slice_type==I)。
在一些實施例中,對於支援基於次畫面位元流合併(subpicture-based bitstream merging)而不需要改變PH NAL單元的位元流,編碼器設定InterSliceAllowed與IntraSliceAllowed二者的數值為1。
(f)對每一切片類型是否可能存在加以發信
在一些實施例中,視訊編解碼器對信息加以發信用以推導出每一切片類型(B、P、與I)是否可存在於該編解碼畫面中。在一些實施例中,一語法元素ph_multiple_slice_types_in_pic_flag被進一步加入於畫面標頭中,以指示
出該畫面的編解碼切片中是否可存在有多於一種的切片類型。語法元素ph_multiple_slice_types_in_pic_flag等於1指示出在畫面中的編解碼切片可以有不同的slice_type數值。語法元素ph_multiple_slice_types_in_pic_flag等於0指示出畫面中所有編解碼切片都有相同的slice_type數值。
當ph_multiple_slice_types_in_pic_flag等於1時,一語法元素ph_allowed_slice_types_idc被進一步發信用以推導出用於畫面切片中所允許的切片類型。當ph_multiple_slice_types_in_pic_flag等於0時,一語法元素ph_slice_type被進一步發信以指明用於畫面中所有切片的slice_type數值。變數BSliceAllowed、PSliceAllowed、與ISliceAllowed的數值分別指示出切片類型B、P、與I是否可被允許於該畫面中。變數BSliceAllowed、PSliceAllowed、與ISliceAllowed可以從ph_multiple_slice_types_in_pic_flag、ph_allowed_slice_types_idc、與ph_slice_type的數值推導。關於僅適用於無使用的(unused)切片類型的編解碼工具的PH語法元素的數值不被編解碼。當no_pic_partition_flag等於1或rect_slice_flag等於1而且num_slices_in_pic_minus1等於1時,ph_multiple_slice_types_in_pic_flag被推論等於0而且不被顯性地編解碼於位元流中。
備選地,一語法元素pps_multiple_slice_types_in_pic_flag可以進一步被發信於PPS中,來指示出在參考該PPS的每一畫面中是否存在有多於一種切片類型。當pps_multiple_slice_types_in_pic_flag的數值等於0時,語法元素ph_multiple_slice_types_in_pic_flag被推論為等於0而且不被編碼進位元流中。下面表格18與19顯示一畫面標頭與一切片標頭,其中語法包括對於指示出每一切片類型是否可能存在加以發信。
語法元素pred_weight_Table是藉由以下表格20所示的語法表格來加以提供。
當pps_weighted_bipred_flag與wp_info_in_ph_flag二者皆等於1時,語法元素num_l1_weights指明the number of weights發信用於參考畫面列表1中欄位(entries)的權重的數目。num_l1_weights的數值被約束為在0到Min(15,num_ref_entries[1][RplsIdx[1]])的範圍(包含)。變數NumWeightsL1如以下加以推導:如果(pps_weighted_bipred_flag)NumWeightsL1=0
否則如果(wp_info_in_ph_flag)NumWeightsL1=BSliceAllowed?num_l1_weights:0
否則NumWeightsL1=NumRefIdxActive[1]
在上面表格18所示的畫面標頭中,語法元素ph_multiple_slice_types_in_pic_flag等於1指示出畫面中的編解碼切片可以有不同的slice_type數值。ph_multiple_slice_types_in_pic_flag的數值等於0指明在畫面中所有編解碼切片都有相同的slice_type數值。當語法元素ph_multiple_slice_types_in_pic_flag不存在時,其數值被推論為等於0。當ph_multiple_slice_types_in_pic_flag等於1時,語法元素ph_allowed_slice_types_idc指明用於畫面中編解碼切片所被允許的slice_type數值。下面表格21顯示藉由ph_allowed_slice_types_idc所指明被允許的slice_type。(切片的編解碼類型依據下面表格23藉由slice_type加以指明)。
當ph_muliple_slice_types_in_pic_flag等於0時,語法元素ph_slice_type指明用於畫面中所有切片標頭的slice_type數值。變數BSliceAllowed、PSliceAllowed、與ISliceAllowed如以下加以推導:
- 如果ph_multiple_slice_types_in_pic_flag等於0時,BSliceAllowed被設定等於(ph_slice_type==B),PSliceAllowed被設定等於(ph_slice_type==P)而且ISliceAllowed被設定等於(ph_slice_type==I)
- 否則,BSliceAllowed被設定等於(ph_allowed_slice_types_idc=0)、PSliceAllowed被設定等於(ph_allowed_slice_types_idc=1)而且ISliceAllowed被設定等於(ph_allowed_slice_types_idc=2)。
在一些實施例中,對於支援基於次畫面位元流合併(subpicture-based bitstream merging)而不需要改變PH NAL單元的位元流,編碼器設定ph_inter_slice_allowed_flag與ph_intra_slice_allowed_flag二者的數值等於1。
(g)基於PH信息的條件來對切片類型加以發信
在一些實施例中,當ph_inter_slice_allowed_flag等於1而且ph_intra_slice_allowed等於0,slice_type的數值只被允許等於0或1,而且可以藉由一位元(one bin)所發信的語法旗標加以發信。在一些實施例中,基於ph_inter_slice_allowed_flag的數值等於1以及在PH中的ph_intra_slice_allowed的條件,視訊編解碼器對信息加以發信用以推導出在切片標頭中slice_type的數值。在一些實施例中,當ph_inter_slice_allowed_flag等於1而且ph_intra_slice_allowed等於0,語法元素P_slice_flag指明slice_type的數值是否等於0或1。如此一來,具有ph_intra_slice_allowed等於0而且slice_type等於2的一位元流可以被避免(avoided)。下面表格22顯示基於PH信息的條件對切片類型加以發信的一切片標頭:
(h)切片標頭的語意(Slice Header Semantics)
在一些實施例中,當ph_multiple_slice_types_in_pic_flag等於0,slice_type的數值(當不存在時)被推論等於ph_slice_type,否則被推論等於P_slice_flag的數值。當ph_multiple_slice_types_in_pic_flag等於1而且IntraSliceAllowed等於0時,P_slice_flag等於1指明slice_type的數值等於P。當ph_multiple_slice_types_in_pic_flag等於1而且IntraSliceAllowed等於0時,P_slice_flag等於0指明slice_type的數值等於B。
在一些實施例中,當ph_inter_slice_allowed_flag等於0,slice_type的數值(當不存在時)被推論等於2,否則被推論等於P_slice_flag。P_slice_flag等於1指明當ph_inter_slice_allowed_flag等於1而且ph_intra_slice_allowed等於0時,slice_type的數值等於P。P_slice_flag等於0指明當ph_inter_slice_allowed_flag等於1而且ph_intra_slice_allowed等於0時,slice_type的數值等於B。
在一些實施例中,slice_type的數值(當不存在時)依據下列來加以決定:
- 如果ph_multiple_slice_types_in_pic_flag等於1,slice_type的數值被設定等於(slice_type_flag>=ph_allowed_slice_types_idc?slice_type_flag+1:slice_type_flag)。
- 否則,slice_type的數值被設定等於ph_slice_type。
當ph_multiple_slice_types_in_pic_flag等於1而且ph_allowed_slice_types_idc的數值不等於3時,語法元素slice_type_flag指明slice_type的數值。
在一些實施例中,當nal_unit_type是在IDR_W_RADL到CRA_NUT的範圍(包含),而且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等於1,slice_type被約束為等於2。
第1圖概念性繪示出一編碼視訊的一部分,其中在畫面標頭與PPS的語法元素被用來指示出某個或某些切片類型是否存在於相對應的畫面中。如所繪示,編碼視訊100包括畫面111-114。這些畫面參考一畫面參數組(picture parameter set,PPS)105。編碼視訊100包括分別與視訊畫面111-114相關聯的畫面標頭121-124。每一視訊畫面111-114包括一或多個切片,而且每一切片有一相對應切片標頭。例如,視訊畫面114的切片是相關聯於切片標頭151-154。
如所繪示,用於畫面114的畫面標頭124發信一或多個切片信息語法元素,來指示出存在於該當前畫面中的一或多種切片類型的存在。在一些實施例中,這些切片信息語法元素可以包括ph_mixed_slice_types_in_pic_flag、與ph_intra_slice_present_flag(如第1圖與上面表格12所示)。在一些實施例中,這些切片信息語法元素可以包括ph_slice_B_present_flag、ph_slice_P_present_flag、ph_slice_I_present_flag(如第上面表格7所示)。此一切片信息語法元素可以指示出一種特定的切片類型(幀間、幀內、B、P、或I)是否存在於當前畫面中。
此外,切片信息語法元素包括數個語法元素以指示出(i)一第一切片類型是否存在於該當前畫面中,以及(ii)一第二且不相同的切片類型是否存在於該當前畫面中。該第一切片類型的一切片(例如,幀內切片,I切片類型)並未參考除了該當前畫面之外的其他畫面的信息。該第二切片類型的一切片(例如,幀間切片,B或P切片類型)有參考除了該當前畫面之外的其他畫面的信息。例如,切片信息語法元素ph_mixed_slice_type_in_pic_flag與ph_intra_slice_present_flag可以被用來決定幀內切片與/或幀間切片是否被允許於視訊畫面114中(藉由決定變數IntraSliceAllowed與InterSliceAllowed)。
一視訊編解碼器可以對畫面標頭語法元素進行旁路而不加以編碼或解碼,該畫面標頭語法元素與存在於藉由一或多個切片信息語法元素所識別出的當前畫面中的一或多種切片類型不相關聯。例如,如果IntraSliceAllowed為假,畫面標頭124中的語法元素160被跳過或旁路;而且如果InterSliceAllowed為假,畫面標頭140中的語法元素162被跳過或旁路。
在一些實施例中,一畫面標頭的切片信息語法元素包括一多-切片-類型語法元素,來指示出該當前畫面是否包括多於一種切片類型的切片。當該多-切片-類型語法元素指示出該當前畫面包括多於一種切片類型的切片時,該當前畫面的一切片的一切片標頭發信或指示出一切片類型。在畫面標頭124中,語法元素ph_mixed_slice_types_in_pic_flag是一多-切片-類型語法元素,來指示出在畫面中可以有不同切片類型的不同切片的一混和(例如,畫面114中的一切片可以是I切片,而另一切片可以是B切片等)。在切片標頭153中,多-切片-類型語法元素ph_mixed_slice_types_in_pic_flag被使用來決定語法元素“slice_type”是否被發信。
PPS 105包括一PPS語法元素來指示出不同切片類型的切片是否被允許(例如,pps_mixed_slice_types_in_pic_flag)。當該PPS語法元素指示出
多於一種切片類型的切片是被允許時,畫面標頭140對該多-切片-類型語法元素ph_mixed_slice_types_in_pic_flag加以發信。
任何前述所提議方法可以於編碼器與/或解碼器中加以施行實作。例如,任何所提議方法可以於一編碼器的一高階語法編碼模組與/或解碼器的一高階語法解碼模組中加以施行實作。備選地,任何所提議方法可以以一電路整合於編碼器的高階語法編碼模組與/或解碼器的高階語法解碼模組中加以施行實作。任何前述所提議方法也可以於影像編碼器與/或解碼器中加以施行實作,其中所產生的位元流相對應於僅使用幀內畫面預測的一個編解碼幀。
第2圖繪示出一示例性的視訊編碼器200。如圖所示,視訊編碼器200從一視訊源205接收輸入視訊信號並將該信號編碼進位元流295。視訊編碼器200具有若干組件或模組以將來自視訊源205的信號加以編碼,至少包括有些組件是選擇自轉換模組210、量化模組211、逆量化模組214、逆轉換模組215、幀內-畫面估計模組320、幀內-預測模組225、運動補償模組230、運動估計模組235、迴路濾波器245、已重構畫面緩衝器250、MV緩衝器265、MV預測模組275以及熵編碼器290。運動補償模組230與運動估計模組235是幀間-預測模組240的一部份。
在一些實施例中,模組210-290是由計算設備或電子裝置的一個或複數個處理單元(例如,處理器)所執行的軟體指令的模組。在一些實施例中,模組210-290是由電子裝置的一個或複數個積體電路(integrated circuit,IC)所實現的硬體電路的模組。雖然模組210-290被示出為分開的模組,但是一些模組可以被組合成單一個模組。
視訊源205提供原始視訊信號,其呈現沒有壓縮的每個視訊幀的像素資料。減法器208計算視訊源205的原始視訊像素資料與來自於運動補償模
組230或者幀內-預測模組225的已預測像素資料213之間的差。轉換模組210將此差(或殘差像素資料或殘差信號209)轉換為轉換係數(例如,透過執行離散餘弦轉換,或DCT)。量化模組211將轉換係數量化為已量化資料(或已量化係數)212,其由熵編碼器290編碼進位元流295中。
逆量化模組214逆量化已量化資料(或已量化係數)212,以獲得轉換係數,而逆轉換模組215對轉換係數執行逆轉換以產生已重構殘差219。已重構殘差219與已預測像素資料213相加以生成已重構像素資料217。在一些實施例中,已重構像素資料217被暫時存儲在一線緩衝器(未示出)中以用於幀內-畫面預測和空間MV預測。已重構像素由迴路濾波器245進行濾波並被存儲在已重構畫面緩衝器250中。在一些實施例中,已重構畫面緩衝器250是在視訊編碼器200之外的一記憶體。在一些實施例中,已重構畫面緩衝器250是在視訊編碼器200之內的一記憶體。
幀內-畫面估計模組220基於已重構像素資料217執行幀內-預測,以產生幀內預測資料。幀內-預測資料被提供給熵編碼器290以被編碼進位元流295中。幀內-預測資料也被幀內-預測模組225使用,以產生已預測像素資料213。
運動估計模組235藉由提供MV給存儲在已重構畫面緩衝器250中的先前已解碼視訊幀的參考像素資料,來執行幀間-預測。這些MV被提供給運動補償模組230以產生已預測像素資料。
不用將完整實際MV編碼進位元流中,視訊編碼器200使用MV預測來產生已預測MV,並且將用於運動補償的MV與已預測MV之間的差被編碼為殘差運動資料並被存儲在位元流295中。
MV預測模組275基於參考MV來產生已預測MV,所述參考MV是在編碼先前視訊幀所產生的,也就是用於執行運動補償的運動補償MV。
MV預測模組275從MV緩衝器265中取回來自先前視訊幀的參考MV。視訊編碼器200將所產生以用於當前視訊幀的MV存儲在MV緩衝器265中,以作為用於產生已預測MV的參考MV。
MV預測模組275使用參考MV來創建已預測MV。已預測MV可以由空間MV預測或時間MV預測來加以計算。當前視訊幀(殘差運動資料)的已預測MV與運動補償MV(MC MV)之間的差值由熵編碼器290編碼進位元流295中。
熵編碼器290透過使用諸如上下文適應性二進制算術編碼(Context-based Adaptive Binary Arithmetic Coding,CABAC)或霍夫曼編碼(Huffman encoding)的熵編解碼技術,將各種參數和資料編碼進位元流295中。熵編碼器290將各種標頭元素、旗標、以及已量化轉換係數212與殘差運動資料,一起編碼為語法元素進入位元流295中。然後位元流295被存儲於存儲裝置中或透過諸如網路的通信介質被傳輸至一解碼器。
迴路濾波器245對已重構像素資料217進行濾波運算或平滑操作運算以減少編解碼偽影,特別是在像素塊的邊界處。在一些實施例中,所執行的濾波操作包括取樣自適應偏移(Sample Adaptive Offset,SAO)。在一些實施例中,濾波操作包括自適應迴路濾波器(Adaptive Loop Filter,ALF)。
在一些實施例中,熵編碼器290將切片信息語法元素發信或編碼進入位元流295中。切片信息語法元素,例如ph_slice_B_present_flag、ph_slice_P_present_flag、ph_slice_I_present_flag、與ph_mixed_slice_types_in_pic_flag,被編碼進與視訊畫面相關聯的畫面標頭中。依據所發信的切片信息語法元素,熵編碼器290可以基於存在或不存在其中的切片類型,來對編碼某些語法元素加以旁路或省略(bypass or omit)。
第3圖概念性繪示出一程序300來發信在一畫面標頭的一或多個
語法元素以指示出可能存在於當前畫面中的切片類型。在一些實施例中,藉由執行儲存於一電腦可讀取媒介上的指令,實施編碼器200的一計算裝置上的一個或複數個處理單元(例如,處理器)會執行程序300。在一些實施例中,實施編碼器200的一電子裝置會執行程序300。
編碼器接收(於區塊310)原始像素資料以被編碼作為一視訊的一當前畫面進入一位元流中。編碼器發信(於區塊320)該當前畫面的一畫面標頭,該畫面標頭包括一組一或多個切片信息語法元素在該畫面標頭,以指示出存在於該當前畫面中的一或多個切片類型的存在。
該組切片信息語法元素可以指示出一特定類型的切片是否存在於該當前畫面中(例如ph_slice_B_present_flag指示出B-類型的切片存在於該當前畫面中,等)。該組切片信息語法元素可以包括一或多個語法元素,用以指示出(i)一第一切片類型是否存在於該當前畫面中,以及(ii)一第二且不相同的切片類型是否存在於該當前畫面中。該第一切片類型的一切片並未參考除了該當前畫面之外的畫面的信息(例如,幀內切片或I切片),以及該第二切片類型的一切片有參考除了該當前畫面之外的畫面的信息(例如,幀間切片,B或P切片)。
當發信畫面標頭時,視訊解碼器可以對相關於編解碼工具的畫面標頭語法元素進行旁路而不加以剖析,當該編解碼工具與存在於藉由該組切片信息語法元素所識別出的當前畫面中的一或多個切片類型不相關聯。
編碼器藉由使用該組切片信息語法元素來編碼(於區塊330)該當前畫面的切片。在一些實施例中,該組切片信息語法元素包括一多-切片-類型語法元素來指示出該當前畫面是否包括多於一種切片類型的切片(例如,ph_mixed_slice_types_in_pic_flag指示出多種切片類型的一混合可能存在於該當前畫面中)。在一些實施例中,當該多-切片-類型語法元素指示出該當前畫面包
括多於一種切片類型的切片時,該當前畫面的一切片的一切片標頭指示出一切片類型。在一些實施例中,該當前畫面參考一畫面參數組(PPS),該PPS包括一PPS語法元素來指示出不同切片類型的切片是否被允許於該當前畫面中(例如,pps_mixed_slice_types_in_pic_flag)。當該PPS語法元素指示出多於一種切片類型的切片是被允許時,該當前畫面的畫面標頭包括該多-切片-類型語法元素。
第4圖繪示出一示例性的視訊解碼器400。如圖所示,視訊解碼器400是一影像-解碼或視訊-解碼電路,其接收一位元流495並將位元流的內容解碼為視訊幀的像素資料以用於顯示。視訊解碼器400具有用於解碼位元流495的若干組件或模組,包括有些組件是選擇自一逆量化模組411、一逆轉換模組410、一幀內-預測模組425、一運動補償模組430、一迴路濾波器445、一已解碼畫面緩衝器450、一MV緩衝器465、一MV預測模組475與一剖析器490。運動補償模組430是幀間-預測模組440的一部份。
在一些實施例中,模組410-490是由計算設備的一個或複數個處理單元(例如,處理器)所執行的軟體指令的模組。在一些實施例中,模組410-490是由電子設備的一個或複數個積體電路所實現的硬體電路的模組。雖然模組410-490被表示為分開的模組,但是一些模組可以被組合成單一個模組。
剖析器490(或熵解碼器)接收位元流495,並且根據由視訊-編解碼或影像-編解碼標準所定義的語法來進行初步剖析。所剖析的語法元素包括各種標頭元素、旗標、以及已量化資料(或已量化係數)412。剖析器490藉由使用諸如上下文適應性二進制算術編碼(context-adaptive binary arithmetic coding,CABAC)或霍夫曼編碼的熵編解碼技術來剖析出各種語法元素。
逆量化模組411對已量化資料(或已量化係數)412進行去量化
(de-quantize)以獲得轉換係數,並且逆轉換模組410對轉換係數416執行逆轉換運算以產生已重構殘差信號419。已重構殘差信號419與來自於幀內-預測模組425或運動補償模組430的已預測像素資料413相加,以產生已解碼像素資料417。已解碼像素資料由迴路濾波器445濾波並被存儲在已解碼畫面緩衝器450中。在一些實施例中,已解碼畫面緩衝器450是在視訊解碼器400之外的一記憶體。在一些實施例中,已解碼畫面緩衝器450是在視訊解碼器400之內的一記憶體。
幀內-預測模組425從位元流495接收幀內-預測資料,並且據此從存儲在已解碼畫面緩衝器450中的已解碼像素資料417來產生已預測像素資料413。在一些實施例中,已解碼像素資料417也被存儲在用於幀內-畫面預測和空間MV預測的一線緩衝器(未示出)中。
在一些實施例中,已解碼畫面緩衝器450的內容被用於顯示。顯示裝置455直接取出已解碼畫面緩衝器450的內容以進行顯示,或將已解碼畫面緩衝器的內容取回到一顯示緩衝器。在一些實施例中,顯示裝置透過一像素傳輸從已解碼畫面緩衝器450來接收像素值。
運動補償模組430根據運動補償MV(MC MV),從存儲在已解碼畫面緩衝器450中的已解碼像素資料417來產生已預測像素資料413。這些運動補償MV透過將自位元流495接收的殘差運動資料與自MV預測模組475接收的預測MV相加而被解碼。
MV預測模組475基於參考MV來產生已預測MV,所述參考MV是在解碼先前視訊幀所產生的,也就是用於執行運動補償的運動補償MV。MV預測模組475從MV緩衝器465中取回先前視訊幀的參考MV。視訊解碼器400將產生用來解碼當前視訊幀的運動補償MV存儲在MV緩衝器465中,以作為用於產生已預測MV的參考MV。
迴路濾波器445對已解碼像素資料417執行濾波操作或平滑操作,以減少編解碼偽影,特別是在像素塊的邊界處。在一些實施例中,所執行的濾波操作包括取樣自適應偏移(Sample Adaptive Offset,SAO)。在一些實施例中,濾波操作包括自適應迴路濾波器(Adaptive Loop Filter,ALF)。
在一些實施例中,熵解碼器490將切片信息語法元素剖析或解碼進入位元流495中。切片信息語法元素,例如ph_slice_B_present_flag、ph_slice_P_present_flag、ph_slice_I_present_flag、與ph_mixed_slice_types_in_pic_flag,從與視訊畫面相關聯的畫面標頭中加以剖析。依據所發信於畫面標頭的切片信息語法元素,熵解碼器490可以基於存在或不存在其中的切片類型,來對解碼或剖析某些語法元素加以旁路或省略(bypass or omit)。
第5圖概念性繪示出一程序500來使用在一畫面標頭的一或多個語法元素以指示出可能存在於當前畫面中的切片類型。在一些實施例中,藉由執行儲存於一電腦可讀取媒介上的指令,實施解碼器400的一計算裝置上的一個或複數個處理單元(例如,處理器)會執行程序500。在一些實施例中,實施解碼器400的一電子裝置會執行程序500。
解碼器接收(於區塊510)來自一位元流的資料以被解碼作為一視訊的一當前畫面。解碼器剖析(於區塊520)該當前畫面的一畫面標頭,該畫面標頭包括一組一或多個切片信息語法元素在該畫面標頭,以指示出存在於該當前畫面中的一或多個切片類型的存在。該組切片信息語法元素可以指示出一特定類型的切片是否存在於該當前畫面中(例如ph_slice_B_present_flag指示出B-類型的切片存在於該當前畫面中,等)。該組切片信息語法元素可以包括一或多個語法元素,用以指示出(i)一第一切片類型是否存在於該當前畫面中,以及(ii)一第二且不相同的切片類型是否存在於該當前畫面中;其中該第一切片類
型的一切片並未參考除了該當前畫面之外的畫面的信息(例如,切片類型I),以及該第二切片類型的一切片有參考除了該當前畫面之外的畫面的信息(例如,切片類型B與P)。
當剖析畫面標頭時,視訊解碼器可以對相關於編解碼工具的畫面標頭語法元素進行旁路而不加以剖析,該編解碼工具與存在於藉由該組切片信息語法元素所識別出的當前畫面中的一或多個切片類型不相關聯。
視訊解碼器藉由使用該組切片信息語法元素來重構(於區塊530)該當前畫面的切片。在一些實施例中,該組切片信息語法元素包括一多-切片-類型語法元素來指示出該當前畫面是否包括多於一種切片類型的切片(例如,ph_mixed_slice_types_in_pic_flag指示出多種切片類型的一混合可能存在於該當前畫面中)。在一些實施例中,當該多-切片-類型語法元素指示出該當前畫面包括多於一種切片類型的切片時,該當前畫面的一切片的一切片標頭指示出一切片類型。在一些實施例中,該當前畫面參考一畫面參數組(PPS),該PPS包括一PPS語法元素來指示出不同切片類型的切片是否被允許於該當前畫面中(例如,pps_mixed_slice_types_in_pic_flag)。當該PPS語法元素指示出多於一種切片類型的切片是被允許時,該當前畫面的畫面標頭包括該多-切片-類型語法元素。
很多上述的特徵和應用可以被實現為軟體處理,其被指定為記錄在電腦可讀存儲介質(computer readable storage medium)(也被稱為電腦可讀介質)上的指令集。當這些指令由一個或者複數個計算單元或者處理單元(例如,一個或者複數個處理器、處理器核或者其他處理單元)來執行時,則這些指令使得該處理單元執行這些指令所表示的動作。電腦可讀介質的示例包括但不限於CD-ROM、快閃記憶體驅動器(flash drive)、隨機存取記憶體(random
access memory,RAM)晶片、硬碟、可讀寫可程式設計唯讀記憶體(erasable programmable read only memory,EPROM),電可擦除可程式設計唯讀記憶體(electrically erasable programmable read-only memory,EEPROM)等。該電腦可讀介質不包括透過無線或有線連接的載波和電信號。
在本說明書中,術語“軟體”意味著包括唯讀記憶體中的韌體或者存儲在磁存儲裝置中的應用程式,該應用程式可以被讀入到記憶體中以用於處理器進行處理。同時,在一些實施例中,複數個軟體發明可以作為更大程式的子部分來實現,而保留不同的軟體發明。在一些實施例中,複數個軟體發明可以作為分開的程式來實現。最後,一起實現此處所描述的軟體發明的分開的程式的任何結合是在本發明的範圍內。在一些實施例中,當被安裝以在一個或者複數個電子系統上進行操作時,軟體程式定義了一個或者複數個特定的機器實現方式,該機器實現方式執行和實施該軟體程式的操作。
第6圖概念性地繪示一電子系統600,本揭示的一些實施例可以於其中加以實施。電子系統600可以是電腦(例如,臺式電腦、個人電腦、平板電腦等)、電話、PDA或者其他種類的電子設備。這個電子系統包括各種類型的電腦可讀媒質和用於各種其他類型的電腦可讀媒質的介面。電子系統600包括匯流排605、處理單元610、影像處理單元(graphics-processing unit,GPU)615、系統記憶體620、網路625、唯讀記憶體(read-only memory,ROM)630、永久存儲裝置635、輸入設備640和輸出設備645。
匯流排605集體表示與大量的電子系統600通信連接的內部設備的所有系統匯流排、外設匯流排和晶片組匯流排。例如,匯流排605透過影像處理單元615、唯讀記憶體630、系統記憶體620和永久存儲裝置635,與處理單元610通信連接。
對於這些各種記憶體單元,處理單元610取回執行的指令和處理
的資料,以為了執行本發明的處理。在不同實施例中,該處理單元可以是單個處理器或者多核處理器。某些指令被傳輸影像處理單元615和並被其執行。該影像處理單元615可以卸載各種計算或補充由處理單元610提供的影像處理。
唯讀記憶體630存儲處理單元610或者電子系統的其他模組所需要的靜態資料和指令。另一方面,永久存儲裝置635是一種讀寫記憶體設備(read-and-write memory)。這個設備是一種非易失性(non-volatile)記憶體單元,其即使在電子系統600關閉時也存儲指令和資料。本發明的一些實施例使用大容量存儲設備(例如磁片或光碟及其相應的磁碟機)作為永久存儲裝置635。
其他實施例使用卸載式存儲裝置設備(如軟碟、快閃記憶體設備等,以及其相應的磁碟機)作為該永久存儲裝置。與永久存儲裝置635一樣,系統記憶體620是一種讀寫記憶體設備。但是,與存儲裝置635不一樣的是,該系統記憶體620是一種易失性(volatile)讀寫記憶體,例如隨機讀取記憶體。系統記憶體620存儲一些處理器在運行時需要的指令和資料。在一些實施例中,根據本發明的處理被存儲在該系統記憶體620、永久存儲裝置635和/或唯讀記憶體630中。例如,各種記憶體單元包括用於根據一些實施例的處理多媒體剪輯的指令。對於這些各種記憶體單元,處理單元610取回執行的指令和處理的資料,以為了執行某些實施例的處理。
匯流排605也連接到輸入設備640和輸出設備645。該輸入設備640使得使用者溝通資訊並選擇指令到該電子系統上。該輸入設備640包括字母數位元鍵盤和指點設備(也被稱為“遊標控制設備”),攝像機(如網路攝像機(webcam)),用於接收語音命令的麥克風或類似的設備等。輸出設備645顯示由電子系統生成的圖像或以其他方式輸出的資料。輸出設備645包括印表機和顯示裝置,例如陰極射線管(cathode ray tube,CRT)或液晶顯示器(liquid crystal
display,LCD),以及揚聲器或類似的音訊輸出設備。一些實施例包括諸如同時用作輸入設備和輸出設備的觸控式螢幕等設備。
最後,如第6圖所示,匯流排605也透過網路介面卡(未示出)將電子系統600耦接到網路625。在這個方式中,電腦可以是電腦網路(例如,局域網(local area network,LAN)、廣域網路(wide area network,WAN)或者內聯網)或者網路的網路(例如互聯網)的一部分。電子系統600的任一或者所有元件可以與本發明結合使用。
一些實施例包括電子元件,例如,微處理器、存儲裝置和記憶體,其將電腦程式指令存儲到機器可讀介質或者電腦可讀介質(可選地被稱為電腦可讀存儲介質、機器可讀介質或者機器可讀存儲介質)。電腦可讀介質的一些實例包括RAM、ROM、唯讀光碟(read-only compact disc,CD-ROM),可燒錄光碟(recordable compact disc,CD-R)、可讀寫光碟(rewritable compact disc,CD-RW)、唯讀數位通用光碟(read-only digital versatile disc)(例如,DVD-ROM,雙層DVD-ROM)、各種可記錄/可讀寫DVD(例如DVD RAM、DVD-RW、DVD+RW等)、快閃記憶體(如SD卡、迷你SD卡,微SD卡等)、磁性和/或固態硬碟、唯讀和可燒錄藍光®(Blu-Ray®)盤、超高密度光碟和其他任何光學介質或磁介質,以及軟碟。電腦可讀介質可以存儲由至少一個處理單元執行的電腦程式,並且包括用於執行各種操作的指令集。電腦程式或電腦代碼的示例包括機器代碼,例如編譯器產生的機器代碼,以及包含由電腦、電子元件或微處理器使用注釋器(interpreter)而執行的高級代碼的文檔。
當以上討論主要是指執行軟體的微處理器或多核處理器時,很多上述的功能和應用程式由一個或複數個積體電路執行,如特定應用的積體電路(application specific integrated circuit,ASIC)或現場可程式設計閘陣列(field programmable gate array,FPGA)。在一些實施例中,這種積體電路執行存儲在
該電路本身上的指令。此外,一些實施例執行存儲在可程式設計邏輯器件(programmable logic device,PLD),ROM或RAM設備中的軟體。
如本發明的說明書和任一請求項中所使用,術語“電腦”、“伺服器”、“處理器”和“記憶體”均指電子設備或其他技術設備。這些術語不包括人或群體。為了本說明書的目的,術語顯示或顯示裝置指在電子設備上進行顯示。如本發明的說明書和任一請求項中所使用,術語“電腦可讀介質”、“電腦可讀媒質”和“機器可讀介質”完全局限於有形的、實體的物體,其以電腦可讀的形式存儲資訊。這些術語不包括任何無線信號、有線下載信號和其他任何短暫信號。
在結合許多具體細節的情況下描述了本發明時,本領域通常知識者將認識到,本發明可以以其他具體形式而被實施,而不脫離本發明的精神。此外,大量的圖(包括第3圖和第5圖)概念性示出了處理。這些處理的具體操作可以不以所示以及所描述的確切順序來被執行。這些具體操作可用不在一個連續的操作系列中被執行,並且不同的具體操作可以在不同的實施例中被執行。另外,該處理透過使用幾個子處理而被實現,或者作為更大巨集處理的部分。因此,本領域通常知識者將能理解的是,本發明不受前述說明性細節的限制,而是由請求項加以界定。
本文所描述的主題有時表示不同的元件,其包含在或者連接到其他不同的元件。可以理解的是,所描述的結構僅是示例,實際上可以由許多其他結構來實施,以實現相同的功能。從概念上講,任何實現相同功能的組件的排列實際上是“相關聯的”,以便實現所需的功能。因此,不論結構或中間部件,為實現特定的功能而組合的任何兩個元件被視為“相互關聯”,以實現所需的功能。同樣,任何兩個相關聯的元件被看作是相互“可操作連接”或“可操作耦接”,以實現特定功能。能相互關聯的任何兩個組件也被視為相互“可操作地耦合”以實現特
定功能。可操作連接的具體例子包括但不限於物理可配對和/或物理上相互作用的元件,和/或無線可交互和/或無線上相互作用的元件,和/或邏輯上相互作用和/或邏輯上可交互的元件。
此外,關於基本上任何複數和/或單數術語的使用,本領域的技術人員可以根據上下文和/或應用從複數轉換為單數和/或從單數到複數。為清楚起見,本文明確規定了不同的單數/複數排列。
此外,本領域的通常知識者可以理解,通常,本發明所使用的術語特別是請求項中的,如請求項的主題,通常用作“開放”術語,例如,“包括”應解釋為“包括但不限於,“有”應理解為“至少有”“包括”應解釋為“包括但不限於”等。本領域的通常知識者可以進一步理解,若計畫介紹特定數量的請求項內容,將在請求項內明確表示,並且,在沒有這類內容時將不顯示。例如,為幫助理解,下面請求項可能包含短語“至少一個”和“一個或複數個”,以介紹請求項內容。然而,這些短語的使用不應理解為暗示使用不定冠詞“a”或“an”介紹請求項內容,而限制了任何特定的請求項。甚至當相同的請求項包括介紹性短語“一個或複數個”或“至少有一個”,不定冠詞,例如“a”或“an”,則應被解釋為表示至少一個或者更多,對於用於介紹請求項的明確描述的使用而言,同樣成立。此外,即使明確引用特定數量的介紹性內容,本領域通常知識者可以認識到,這樣的內容應被解釋為表示所引用的數量,例如,沒有其他修改的“兩個引用”,意味著至少兩個引用,或兩個或兩個以上的引用。此外,在使用類似於“A、B和C中的至少一個”的表述的情況下,通常如此表述是為了本領域通常知識者可以理解該表述,例如,“系統包括A、B和C中的至少一個”將包括但不限於單獨具有A的系統,單獨具有B的系統,單獨具有C的系統,具有A和B的系統,具有A和C的系統,具有B和C的系統,和/或具有A、B和C的系統,等。本領域通常知識者進一步可理解,無論在說明書中、請求項中或者附圖中,由兩個或兩個
以上的替代術語所表現的任何分隔的單詞和/或短語應理解為,包括這些術語中的一個,其中一個,或者這兩個術語的可能性。例如,“A或B”應理解為,“A”,或者“B”,或者“A和B”的可能性。
從前述可知,為了說明目的,此處已描述了各種實施方案,並且在不偏離本發明的範圍和精神的情況下,可以進行各種變形。因此,此處所公開的各種實施方式不用於限制,專利申請範圍表示真實的範圍和精神。
500:程序
510~530:區塊
Claims (10)
- 一種視訊解碼方法,包括:接收來自一位元流的資料以解碼作為一視訊的一當前畫面;剖析該當前畫面的一畫面標頭,該畫面標頭包括一組一或多個切片信息語法元素在該畫面標頭,以指示出存在於該當前畫面中的一或多種切片類型的存在;以及藉由使用該組切片信息語法元素來重構該當前畫面的該等切片。
- 如請求項1所述的視訊解碼方法,進一步包括:對畫面標頭語法元素進行旁路而不加以剖析,該畫面標頭語法元素與存在於藉由該組切片信息語法元素所識別出的當前畫面中的一或多種切片類型不相關聯。
- 如請求項1所述的視訊解碼方法,其中該組切片信息語法元素指示出一特定類型的切片是否存在於該當前畫面中。
- 如請求項1所述的視訊解碼方法,其中該組切片信息語法元素包括一或多個語法元素:用以指示出(i)一第一切片類型是否存在於該當前畫面中,以及(ii)一第二且不相同的切片類型是否存在於該當前畫面中。
- 如請求項4所述的視訊解碼方法,其中該第一切片類型的一切片並未參考除了該當前畫面之外其他畫面的信息,其中該第一切片類型為I切片類型,以及該第一切片類型的該切片為幀內切片;以及該第二切片類型的一切片有參考除了該當前畫面之外其他畫面的信息,其中該第二切片類型為B或P切片類型,以及該第二切片類型的該切片為幀間切片。。
- 如請求項1所述的視訊解碼方法,其中該組切片信息語法元素包括:一多-切片-類型語法元素來指示出該當前畫面是否包括多於一種切片類 型的切片。
- 如請求項6所述的視訊解碼方法,其中當該多-切片-類型語法元素指示出該當前畫面包括多於一種切片類型的切片時,該當前畫面的一切片的一切片標頭指示出一切片類型。
- 如請求項6所述的視訊解碼方法,其中該當前畫面參考一畫面參數組,該畫面參數組包括:一畫面參數組語法元素來指示出不同切片類型的切片是否被允許於該當前畫面中,其中當該畫面參數組語法元素指示出多於一種切片類型的切片是被允許時,該當前畫面的該畫面標頭包括該多-切片-類型語法元素。
- 一種視訊編碼方法,包括:接收原始像素資料以編碼作為一視訊的一當前畫面進入一位元流中;發信該當前畫面的一畫面標頭,該畫面標頭包括在該畫面標頭中的一組一或多個切片信息語法元素,以指示出存在於該當前畫面中的一或多個切片類型的存在;以及藉由使用該組切片信息語法元素來編碼該當前畫面的該等切片。
- 一種電子裝置,包括:一視訊解碼器電路,被配置來進行操作,包括:接收來自一位元流的資料以解碼作為一視訊的一當前畫面;剖析該當前畫面的一畫面標頭,該畫面標頭包括一組一或多個切片信息語法元素在該畫面標頭,以指示出存在於該當前畫面中的一或多個切片類型的存在;以及藉由使用該組切片信息語法元素來重構該當前畫面的該等切片。
Applications Claiming Priority (16)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201962930088P | 2019-11-04 | 2019-11-04 | |
| US201962930086P | 2019-11-04 | 2019-11-04 | |
| US62/930,086 | 2019-11-04 | ||
| US62/930,088 | 2019-11-04 | ||
| US201962945282P | 2019-12-09 | 2019-12-09 | |
| US62/945,282 | 2019-12-09 | ||
| US201962954023P | 2019-12-27 | 2019-12-27 | |
| US62/954,023 | 2019-12-27 | ||
| US202062957759P | 2020-01-06 | 2020-01-06 | |
| US62/957,759 | 2020-01-06 | ||
| US202062958624P | 2020-01-08 | 2020-01-08 | |
| US62/958,624 | 2020-01-08 | ||
| US202063000537P | 2020-03-27 | 2020-03-27 | |
| US63/000,537 | 2020-03-27 | ||
| US17/086,650 US11758193B2 (en) | 2019-11-04 | 2020-11-02 | Signaling high-level information in video and image coding |
| US17/086,650 | 2020-11-02 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW202123704A TW202123704A (zh) | 2021-06-16 |
| TWI751771B true TWI751771B (zh) | 2022-01-01 |
Family
ID=75688355
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW109138224A TWI751771B (zh) | 2019-11-04 | 2020-11-03 | 視訊和影像編解碼中之高階信息發信 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US11758193B2 (zh) |
| KR (1) | KR102837937B1 (zh) |
| CN (1) | CN114616829B (zh) |
| MX (1) | MX2022005156A (zh) |
| TW (1) | TWI751771B (zh) |
| WO (1) | WO2021088855A1 (zh) |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12375723B2 (en) * | 2019-08-22 | 2025-07-29 | Sharp Kabushiki Kaisha | Systems and methods for signaling picture information in video coding |
| EP4018671A4 (en) | 2019-09-19 | 2022-12-07 | Beijing Bytedance Network Technology Co., Ltd. | Deriving reference sample positions in video coding |
| KR102825527B1 (ko) * | 2019-09-23 | 2025-06-25 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 세그먼트 존재 정보 제공 |
| CN114503588B (zh) | 2019-10-05 | 2024-10-08 | 北京字节跳动网络技术有限公司 | 基于级别的视频编解码工具的信令通知 |
| US11310511B2 (en) * | 2019-10-09 | 2022-04-19 | Tencent America LLC | Method and apparatus for video coding |
| CN114556934B (zh) | 2019-10-12 | 2025-09-16 | 北京字节跳动网络技术有限公司 | 视频编解码中的预测类型信令 |
| EP4029274A4 (en) | 2019-10-13 | 2022-11-30 | Beijing Bytedance Network Technology Co., Ltd. | INTERPLAY BETWEEN REFERENCE IMAGE CAPTURE AND VIDEO ENCODING TOOLS |
| WO2021091254A1 (ko) * | 2019-11-05 | 2021-05-14 | 엘지전자 주식회사 | 영상/비디오 코딩 시스템에서 픽처 헤더에서 슬라이스 타입에 관한 정보를 시그널링하는 방법 및 장치 |
| CN120956928A (zh) * | 2019-11-05 | 2025-11-14 | Lg 电子株式会社 | 基于切片类型的图像/视频编码方法和设备 |
| JP7383816B2 (ja) * | 2019-11-18 | 2023-11-20 | エルジー エレクトロニクス インコーポレイティド | ループフィルタリングを制御する画像コーディング装置及び方法 |
| CN114930855B (zh) * | 2019-11-28 | 2025-05-09 | Lg电子株式会社 | 用于图像/视频编译的切片和拼块配置 |
| GB2590634B (en) * | 2019-12-20 | 2024-10-02 | Canon Kk | High Level syntax for video coding and decoding |
| EP4066502A4 (en) | 2019-12-27 | 2023-01-18 | Beijing Bytedance Network Technology Co., Ltd. | Signaling of slice types in video pictures headers |
| JP7701924B2 (ja) * | 2019-12-27 | 2025-07-02 | アリババ グループ ホウルディング リミテッド | ピクチャに対して漸進的復号化リフレッシュ処理を行うための方法及びシステム |
| JP7410316B2 (ja) | 2020-02-19 | 2024-01-09 | バイトダンス インコーポレイテッド | ビットストリームにおけるビデオ成分のための重み値の推論 |
| US11330305B2 (en) * | 2020-02-24 | 2022-05-10 | Qualcomm Incorporated | Signaling constraints and sequence parameter set sharing in video coding |
| US11303897B2 (en) * | 2020-02-25 | 2022-04-12 | Tencent America LLC | Method and apparatus for signaling of chroma quantization parameters |
| GB2592957A (en) * | 2020-03-11 | 2021-09-15 | Canon Kk | High level syntax for video coding and decoding |
| US11563963B2 (en) | 2020-05-19 | 2023-01-24 | Qualcomm Incorporated | Determining whether to code picture header data of pictures of video data in slice headers |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20140056356A1 (en) * | 2012-08-21 | 2014-02-27 | Motorola Mobility Llc | Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes |
| CN104737541A (zh) * | 2012-09-26 | 2015-06-24 | 松下电器(美国)知识产权公司 | 图像编码方法、图像解码方法、图像编码装置、图像解码装置及图像编码解码装置 |
| CN104969557A (zh) * | 2012-02-04 | 2015-10-07 | 摩托罗拉移动有限责任公司 | 对用于视频编码的并置参考图片以显式方式进行信号传输 |
| US9736476B2 (en) * | 2012-04-27 | 2017-08-15 | Qualcomm Incorporated | Full random access from clean random access pictures in video coding |
| TW201916686A (zh) * | 2016-10-18 | 2019-04-16 | 聯發科技股份有限公司 | 約束的序列資料頭的方法及裝置 |
| US10397610B2 (en) * | 2012-02-01 | 2019-08-27 | Nokia Technologies Oy | Method and apparatus for video coding |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9313514B2 (en) * | 2010-10-01 | 2016-04-12 | Sharp Kabushiki Kaisha | Methods and systems for entropy coder initialization |
| KR20130118798A (ko) | 2012-04-20 | 2013-10-30 | 한국전자통신연구원 | 영상 복호화 방법 및 장치 |
| US9800869B2 (en) | 2012-06-15 | 2017-10-24 | Google Technology Holdings LLC | Method and apparatus for efficient slice header processing |
| EP2713616A1 (en) * | 2012-09-27 | 2014-04-02 | British Telecommunications public limited company | Perceptually driven error correction for video transmission |
| EP2804375A1 (en) * | 2013-02-22 | 2014-11-19 | Thomson Licensing | Coding and decoding methods of a picture block, corresponding devices and data stream |
| EP3057325A4 (en) * | 2013-10-08 | 2017-05-10 | Sharp Kabushiki Kaisha | Image decoding device, image coding device, and coded data |
| WO2015074047A1 (en) * | 2013-11-18 | 2015-05-21 | Arris Enterprises, Inc. | Intra block copy for intra slices in high efficiency video coding (hevc) |
| WO2016138513A1 (en) * | 2015-02-27 | 2016-09-01 | Arris Enterprises, Inc. | Modification of unification of intra block copy and inter signaling related syntax and semantics |
| WO2018181252A1 (en) * | 2017-03-28 | 2018-10-04 | Panasonic Intellectual Property Corporation Of America | Encoding apparatus, decoding apparatus, encoding method, and decoding method |
| US10375416B1 (en) * | 2018-09-05 | 2019-08-06 | Tencent America LLC | Segment types in video coding |
-
2020
- 2020-11-02 US US17/086,650 patent/US11758193B2/en active Active
- 2020-11-03 TW TW109138224A patent/TWI751771B/zh active
- 2020-11-04 WO PCT/CN2020/126429 patent/WO2021088855A1/en not_active Ceased
- 2020-11-04 KR KR1020227017706A patent/KR102837937B1/ko active Active
- 2020-11-04 MX MX2022005156A patent/MX2022005156A/es unknown
- 2020-11-04 CN CN202080076268.7A patent/CN114616829B/zh active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10397610B2 (en) * | 2012-02-01 | 2019-08-27 | Nokia Technologies Oy | Method and apparatus for video coding |
| CN104969557A (zh) * | 2012-02-04 | 2015-10-07 | 摩托罗拉移动有限责任公司 | 对用于视频编码的并置参考图片以显式方式进行信号传输 |
| US9736476B2 (en) * | 2012-04-27 | 2017-08-15 | Qualcomm Incorporated | Full random access from clean random access pictures in video coding |
| US20140056356A1 (en) * | 2012-08-21 | 2014-02-27 | Motorola Mobility Llc | Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes |
| CN104737541A (zh) * | 2012-09-26 | 2015-06-24 | 松下电器(美国)知识产权公司 | 图像编码方法、图像解码方法、图像编码装置、图像解码装置及图像编码解码装置 |
| TW201916686A (zh) * | 2016-10-18 | 2019-04-16 | 聯發科技股份有限公司 | 約束的序列資料頭的方法及裝置 |
Also Published As
| Publication number | Publication date |
|---|---|
| US11758193B2 (en) | 2023-09-12 |
| US20210136419A1 (en) | 2021-05-06 |
| WO2021088855A1 (en) | 2021-05-14 |
| CN114616829A (zh) | 2022-06-10 |
| KR20220083834A (ko) | 2022-06-20 |
| KR102837937B1 (ko) | 2025-07-23 |
| CN114616829B (zh) | 2025-05-09 |
| MX2022005156A (es) | 2022-06-02 |
| TW202123704A (zh) | 2021-06-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI751771B (zh) | 視訊和影像編解碼中之高階信息發信 | |
| US11284077B2 (en) | Signaling of subpicture structures | |
| US20200322607A1 (en) | Coding Transform Coefficients With Throughput Constraints | |
| TWI785502B (zh) | 在分塊中指明切片之切片組塊的視訊編解碼方法及電子裝置 | |
| US12143601B2 (en) | Specifying layout in video pictures | |
| TWI797560B (zh) | 跨層參考限制條件 | |
| JP2024010169A (ja) | ビデオ・コーディングにおける低周波ノン・セパラブル変換シグナリング | |
| TWI784348B (zh) | 視訊圖片資訊之指定技術 | |
| JP7623077B2 (ja) | サブピクチャレベルに基づいたパーティション計算 | |
| CN120917738A (zh) | 后处理滤波器的处理顺序的指示 | |
| JP2023519937A (ja) | 映像コーディングにおける同一位置に配置されたピクチャに対する制約 | |
| JP2023179750A (ja) | 映像ピクチャヘッダにおけるフィルタリングパラメータ信号通知 | |
| KR102795383B1 (ko) | 서브화상 구조의 시그널링 |