JP6854795B2 - 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ - Google Patents
補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ Download PDFInfo
- Publication number
- JP6854795B2 JP6854795B2 JP2018192243A JP2018192243A JP6854795B2 JP 6854795 B2 JP6854795 B2 JP 6854795B2 JP 2018192243 A JP2018192243 A JP 2018192243A JP 2018192243 A JP2018192243 A JP 2018192243A JP 6854795 B2 JP6854795 B2 JP 6854795B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- resolution
- frame
- auxiliary frame
- scaled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/01—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
- H04N7/0117—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving conversion of the spatial resolution of the incoming video signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/144—Movement detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/01—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
- H04N7/0135—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes
- H04N7/014—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes involving the use of motion vectors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
ビデオ捕捉デバイスによって捕捉された第1の画像データを受信するステップと、
復号されるとき、ビデオストリームに対して意図される解像度を判定するステップと、
第1のスケールダウンされた画像データを取得するために第1の画像データをスケールダウンするステップであって、第1のスケールダウンされた画像データが意図される解像度よりも低い第1の解像度を有する、スケールダウンするステップと、
空の第1の補助フレームを準備するステップであって、第1の補助フレームの画像データが、意図される解像度に等しい解像度を有し、すべてが同じ事前定義された値を有するビットを備える、準備するステップと、
第1のスケールダウンされた画像データを第1の補助フレームの画像データ内に貼り付けるステップと、
第1の補助フレームをイントラフレームとして符号化するステップと、
第1の補助フレームの画像データ内の第1のスケールダウンされた画像データを意図される解像度を有する第1のアップスケールされた画像データにアップスケールするための第1の画像変換を判定するステップと、
少なくとも1つの所定のマクロブロックサイズに従って、第1の画像変換の結果生じる画素の移動をサンプリングすることによって、第1の動きベクトルを判定するステップと、
第1の画像データを第1の補助フレームを参照するインターフレームとして第1のフレームに符号化するステップであって、第1のフレームの動きベクトルが第1の動きベクトルに対応する、符号化するステップとを備える。
ビデオ捕捉デバイスによって捕捉された第2の画像データを受信するステップと、
第2のスケールダウンされた画像データを取得するために第2の画像データをスケールダウンするステップであって、第2のスケールダウンされた画像データの解像度が第1の解像度である、スケールダウンするステップと、
空の第2の補助フレームを準備するステップであって、第2の補助フレームの画像データが意図される解像度に等しい解像度を有する、準備するステップと、
第2のスケールダウンされた画像データを第2の補助フレームの画像データ内に貼り付けるステップと、
第2の補助フレームを第1の補助フレームを参照するインターフレームとして符号化するステップと、
第2の補助フレームの画像データ内の第2のスケールダウンされた画像データを意図される解像度を有するアップスケールされた画像データにアップスケールするための第2の画像変換を判定するステップと、
第2の画像変換をサンプリングすることによって、第2の動きベクトルを判定するステップと、
第2のフレームを、第2の補助フレームを参照するインターフレームとして第2のフレームに符号化するステップであって、第2のフレームの動きベクトルが第2の動きベクトルに対応する、符号化するステップと
をさらに備える。
ビデオ記録デバイスによって第3の画像データを捕捉するステップと、
第3のスケールダウンされた画像データを取得するために第3の画像データをスケールダウンするステップであって、第3のスケールダウンされた画像データが第2の解像度を有し、第2の解像度が、第1の解像度とは異なり、意図される解像度よりも低い、スケールダウンするステップと、
空の第3の補助フレームを準備するステップであって、第3の補助フレームの画像データが意図される解像度に等しい解像度を有する、準備するステップと、
第3のスケールダウンされた画像データを第3の補助フレームの画像データ内に貼り付けるステップと、
第3の補助フレームをイントラフレームとして符号化するステップと、
第3の補助フレームの画像データ内の第3のスケールダウンされた画像データを意図される解像度を有する第3のアップスケールされた画像データにアップスケールするための第3の画像変換を判定するステップと、
第3の画像変換をサンプリングすることによって、第3の動きベクトルを判定するステップと、
第3の画像データを第3の補助フレームを参照するインターフレームとして第3のフレームに符号化するステップであって、第3のフレームの動きベクトルが第3の動きベクトルに対応する、符号化するステップと
をさらに備える。
第1の画像データROI1のセクションが符号化されたビデオストリーム内に第3の解像度で含まれるべきと判定するステップであって、第3の解像度が第1の解像度よりも高い、判定するステップと、
ROI1が第1のスケールダウンされた画像データに重複しないために、ROI1が、第1のスケールダウンされた画像データを上書きしないように、または第1のスケールダウンされた画像データによって上書きされるように、第3の解像度を有するROI1を第1の補助フレームの画像データ内に貼り付けるステップと、
意図される解像度を有するROI1を第1のアップスケールされた画像データ内に挿入するための第4の画像変換を判定するステップと、
第4の画像変換をサンプリングすることによって、第4の動きベクトルを判定するステップと
をさらに含み、
第1の画像データをインターフレームとして第1のフレームに符号化するステップは、第1のフレームの動きベクトルが第1の動きベクトルおよび第4の動きベクトルに対応すると判定するステップを備える。
第2の画像データROI2のセクションが符号化されたビデオストリーム内に第3の解像度で含まれるべきと判定するステップと、
ROI2が、第2のスケールダウンされた画像データを上書きしないように、または第2のスケールダウンされた画像データによって上書きされるように、第3の解像度を有するROI2を第2の補助フレームの画像データ内に貼り付けるステップと、
意図される解像度を有するROI2を第2のアップスケールされた画像データ内に挿入するための第5の画像変換を判定するステップと、
第4の画像変換をサンプリングすることによって、第5の動きベクトルを判定するステップと
をさらに備え、
第2の画像データをインターフレームとして第2のフレームに符号化するステップは、第2のフレームの動きベクトルが第2の動きベクトルおよび第5の動きベクトルに対応すると判定するステップを備える。
ビデオ捕捉デバイスによって捕捉された第1の画像データを受信することと、
復号されるとき、ビデオストリームに対して意図される解像度を判定することと、
第1のスケールダウンされた画像データを取得するために第1の画像データをスケールダウンすることであって、第1のスケールダウンされた画像データが意図される解像度よりも低い第1の解像度を有する、スケールダウンすることと、
空の第1の補助フレームを準備することであって、第1の補助フレームの画像データが、意図される解像度に等しい解像度を有し、すべてが同じ事前定義された値を有するビットを備える、準備することと、
第1のスケールダウンされた画像データを第1の補助フレームの画像データ内に貼り付けることと、
第1の補助フレームをイントラフレームとして符号化することと、
第1の補助フレームの画像データ内の第1のスケールダウンされた画像データを意図される解像度を有する第1のアップスケールされた画像データにアップスケールするための第1の画像変換を判定することと、
少なくとも1つの所定のマクロブロックサイズに従って、第1の画像変換の結果生じた画素の移動をサンプリングすることによって、第1の動きベクトルを判定することと、
第1の画像データを第1の補助フレームを参照するインターフレームとして第1のフレームに符号化することであって、第1のフレームの動きベクトルが第1の動きベクトルに対応する、符号化することと
を行うようにさらに適合されたエンコーダによって達成される。
デジタルネットワークを介して意図される解像度を受信し、
第1の解像度を受信し、
受信された意図される解像度および受信された第1の解像度に従って、ビデオストリームを符号化し、
デジタルネットワークを介して、符号化されたビデオストリームを送信する
ように適合されており、
デコーダが、
デジタルネットワークを介して、符号化されたビデオストリームを受信し、
復号されたビデオストリームを達成するために、符号化されたビデオストリームを復号する
ように適合されている、エンコーダによって達成される。
第1の画像データのセクションROI1が符号化されたビデオストリーム内に第3の像度で含まれるべきと判定することであって、第3の解像度が第1の解像度よりも高い、判定することと、
ROI1が第1のスケールダウンされた画像データに重複しないために、ROI1が、第1のスケールダウンされた画像データを上書きしないように、または第1のスケールダウンされた画像データによって上書きされるように、第3の解像度を有するROI1を第1の補助フレームの画像データ内に貼り付けることと、
意図される解像度を有するROI1を第1のアップスケールされた画像データ内に挿入するための第4の画像変換を判定することと、
第4の画像変換をサンプリングすることによって、第4の動きベクトルを判定することと
を行うようにさらに適合されており、
第1の画像データをインターフレームとして第1のフレームに符号化するステップが、第1のフレームの動きベクトルが第1の動きベクトルおよび第4の動きベクトルに対応すると判定することをさらに備え、
デコーダが、
復号されたビデオストリームを達成するために、符号化されたビデオストリームを復号することであって、第1の補助フレームの画像データからROI1を抽出することを備える、復号することと、
ROI1を復号されたビデオストリームとは個別にディスプレイ上に表示することと
を行うように適合されている、エンコーダによって達成される。
104 ビデオ捕捉デバイス、ビデオ記録デバイス、画像補足デバイス
106 ビデオストリーム
106a 第1の画像データ
106a〜c 画像フレーム、画像データ
106b 第2の画像データ、さらなる画像データ
106c 第3の画像データ
108 エンコーダ
110 補助フレーム(AF)
110a 第1の補助フレーム、補助フレーム、補助画像、AF1
110b 第2の補助フレーム、さらなる補助フレーム、AF2
110c 第3の補助フレーム、AF3
112 正規のフレーム(RF)
112a 第1のフレーム、RF1
112b 第2のフレーム、さらなるフレーム、RF2、
112c 第3のフレーム、RF3
114 第1のスケールダウンされた画像データ
116 第3のスケールダウンされた画像データ
120 動きベクトル、第1の動きベクトル
302 ROI1
304 部分、セクション
402 デジタルネットワーク
404 デコーダ
410 画像データ
416 ビデオストリーム
418 クライアントアプリケーション、ディスプレイ
Claims (15)
- ビデオストリームをビデオコーディングフォーマットで符号化するための方法であって、前記ビデオコーディングフォーマットが、補助フレーム(110)を前記符号化されたビデオストリーム(416)内に含めることをサポートし、前記補助フレーム(110)が、前記符号化されたビデオストリーム(416)内の別のフレーム(112)によって参照され、前記符号化されたビデオストリーム(416)内の別のフレームを補完する画像データを備え、前記補助フレーム(110)が、前記補助フレーム(110)の前記画像データが、前記符号化されたビデオストリーム(416)を復号するときに示されることは意図されず、代わりに、示される画像データを達成するために前記別のフレームのデータとともに使用されることを指示するフラグ値を備え、前記方法が、
ビデオ捕捉デバイス(104)によって捕捉された第1の画像データ(106a)を受信するステップと、
復号されるときの前記ビデオストリーム(106)のための意図される解像度を判定するステップ(S502)と、
第1のスケールダウンされた画像データ(114)を取得するために前記第1の画像データ(106a)をスケールダウンするステップ(S504)であって、前記第1のスケールダウンされた画像データ(114)が、前記意図される解像度よりも低い第1の解像度を有する、スケールダウンするステップ(S504)と、
空の第1の補助フレーム(110a)を準備するステップであって、前記第1の補助フレーム(110a)の前記画像データが、前記意図される解像度に等しい解像度を有し、かつ、すべてが同じ事前定義された値を有するビットを備える、準備するステップと、
前記第1のスケールダウンされた画像データ(114)を前記第1の補助フレーム(110a)の前記画像データ内に貼り付けるステップ(S506)と、
前記第1の補助フレーム(110a)をイントラフレームとして符号化するステップと、
前記第1の補助フレーム(110a)の前記画像データ(106)内の前記第1のスケールダウンされた画像データ(114)を前記意図される解像度を有する第1のアップスケールされた画像データにアップスケールするための第1の画像変換を判定するステップと、
少なくとも1つの所定のマクロブロックサイズに従って、前記第1の画像変換の結果生じる画素の移動をサンプリングすることによって、第1の動きベクトル(120)を判定するステップ(S508)と、
前記第1の画像データ(106a)を前記第1の補助フレーム(110a)を参照するインターフレームとして第1のフレーム(112a)に符号化するステップであって、前記第1のフレーム(112a)の動きベクトル(120)が前記第1の動きベクトル(120)に対応する、符号化するステップと
を備える、方法。 - 前記ビデオ捕捉デバイス(104)によって捕捉された第2の画像データ(106b)を受信するステップと、
第2のスケールダウンされた画像データを取得するために前記第2の画像データ(106b)をスケールダウンするステップであって、前記第2のスケールダウンされた画像データの解像度が前記第1の解像度である、スケールダウンするステップと、
空の第2の補助フレーム(110b)を準備するステップであって、前記第2の補助フレーム(110b)の前記画像データが前記意図される解像度に等しい解像度を有する、準備するステップと、
前記第2のスケールダウンされた画像データを前記第2の補助フレーム(110b)の前記画像データ内に貼り付けるステップと、
前記第2の補助フレーム(110b)を前記第1の補助フレーム(110a)を参照するインターフレームとして符号化するステップと、
前記第2の補助フレーム(110b)の前記画像データ内の前記第2のスケールダウンされた画像データを前記意図される解像度を有する第2のアップスケールされた画像データにアップスケールするための第2の画像変換を判定するステップと、
前記第2の画像変換をサンプリングすることによって、第2の動きベクトルを判定するステップと、
前記第2の画像データ(106b)を、前記第2の補助フレーム(110b)を参照するインターフレームとして第2のフレーム(112b)に符号化するステップであって、前記第2のフレーム(112b)の動きベクトルが前記第2の動きベクトルに対応する、符号化するステップと
をさらに備える、請求項1に記載の方法。 - ビデオ捕捉デバイス(104)によって第3の画像データ(106c)を捕捉するステップと、
第3のスケールダウンされた画像データ(116)を取得するために前記第3の画像データ(106c)をスケールダウンするステップであって、前記第3のスケールダウンされた画像データ(116)が第2の解像度を有し、前記第2の解像度が、前記第1の解像度とは異なり、前記意図される解像度よりも低い、スケールダウンするステップと、
空の第3の補助フレーム(110c)を準備するステップであって、前記第3の補助フレーム(110c)の前記画像データが、前記意図される解像度に等しい解像度を有する、準備するステップと、
前記第3のスケールダウンされた画像データ(116)を前記第3の補助フレーム(110c)の前記画像データ内に貼り付けるステップと、
前記第3の補助フレーム(110c)をイントラフレームとして符号化するステップと、
前記第3の補助フレーム(110c)の前記画像データ内の前記第3のスケールダウンされた画像データを前記意図される解像度を有する第3のアップスケールされた画像データにアップスケールするための第3の画像変換を判定するステップと、
前記第3の画像変換をサンプリングすることによって、第3の動きベクトルを判定するステップと、
前記第3の画像データを、前記第3の補助フレーム(110c)を参照するインターフレームとして第3のフレーム(112c)に符号化するステップであって、前記第3のフレーム(112c)の動きベクトルが前記第3の動きベクトルに対応する、符号化するステップと
をさらに備える、請求項1または2に記載の方法。 - 前記第1の画像データ(106a)のセクションROI1(302)が前記符号化されたビデオストリーム(416)に第3の解像度で含まれるべきと判定するステップであって、前記第3の解像度が前記第1の解像度よりも高い、判定するステップと、
前記ROI1(302)が前記第1のスケールダウンされた画像データ(114)に重複しないために、前記ROI1(302)が、前記第1のスケールダウンされた画像データ(114)を上書きしないように、または前記第1のスケールダウンされた画像データ(114)によって上書きされるように、前記第3の解像度を有する前記ROI1(302)を前記第1の補助フレーム(110a)の前記画像データ内に貼り付けるステップ(S506)と、
前記意図される解像度を有する前記ROI1(302)を前記第1のアップスケールされた画像データ内に挿入するための第4の画像変換を判定するステップと、
前記第4の画像変換をサンプリングすることによって、第4の動きベクトル(120)を判定するステップと
をさらに備え、
前記第1の画像データ(106a)をインターフレームとして前記第1のフレーム(112a)に前記符号化するステップ(S510)が、前記第1のフレーム(112a)の動きベクトルが前記第1の動きベクトルおよび前記第4の動きベクトルに対応すると判定するステップを備える、請求項1から3のいずれか一項に記載の方法。 - 前記ビデオ捕捉デバイスによって捕捉された第2の画像データを受信するステップと、
第2のスケールダウンされた画像データを取得するために前記第2の画像データをスケールダウンするステップであって、前記第2のスケールダウンされた画像データの解像度が前記第1の解像度である、スケールダウンするステップと、
空の第2の補助フレームを準備するステップであって、前記第2の補助フレームの前記画像データが、前記意図される解像度と等しい解像度を有する、準備するステップと、
前記第2のスケールダウンされた画像データを、前記第2の補助フレームの前記画像データに貼り付けるステップと、
前記第1の補助フレームを参照するインターフレームとして前記第2の補助フレームを符号化するステップと、
前記第2の補助フレームの前記画像データ内の前記第2のスケールダウンされた画像データを、前記意図された解像度を有する第2のスケールアップされた画像データにスケールアップするための第2の画像変換を判定するステップと、
前記第2の画像変換をサンプリングすることによって、第2の動きベクトルを判定するステップと、
前記第2の画像データを前記第2の補助フレームを参照するインターフレームとして第2のフレームに符号化するステップであって、前記第2のフレームの動きベクトルが、前記第2の動きベクトルに対応する、符号化するステップと、
前記第2の画像データ(106b)のセクションROI2が前記符号化されたビデオストリーム(416)内に前記第3の解像度で含まれるべきと判定するステップと、
前記ROI2が、前記第2のスケールダウンされた画像データを上書きしないように、または前記第2のスケールダウンされた画像データによって上書きされるように、前記第3の解像度を有する前記ROI2を前記第2の補助フレーム(110b)の前記画像データ内に貼り付けるステップと、
前記意図される解像度を有する前記ROI2を前記第2のアップスケールされた画像データ内に挿入するための第5の画像変換を判定するステップと、
前記第5の画像変換をサンプリングすることによって、第5の動きベクトルを判定するステップと
をさらに備え、
前記第2の画像データ(106b)をインターフレームとして前記第2のフレーム(112b)に前記符号化するステップが、前記第2のフレーム(112b)の動きベクトルが前記第2の動きベクトルおよび前記第5の動きベクトルに対応すると判定するステップを備える、請求項4に記載の方法。 - 前記ROI1(302)および前記ROI2が、それぞれ、前記第1のおよび前記第2の補助フレーム(110a〜b)の前記画像データ内の対応する位置に貼り付けられる、請求項5に記載の方法。
- 前記第3の解像度が、前記意図される解像度に等しい、および前記意図される解像度よりも大きい、のうちの1つである、請求項4から6のいずれか一項に記載の方法。
- 前記意図される解像度が、前記ビデオ捕捉デバイス(104)によって捕捉された前記画像データ(106)の解像度に等しい、請求項1から7のいずれか一項に記載の方法。
- 前記ビデオコーディングフォーマットが、High Efficiency Video Coding、H.265、H.264、VP10、VP9、AV1、Advanced Video Coding、およびH.266のうちの1つである、請求項1から8のいずれか一項に記載の方法。
- ビデオストリームエンコーダ(108)が接続されたデジタルネットワーク(402)のビットレートに基づいて前記第1の解像度を判定するステップ(S502)
をさらに備える、請求項1から9のいずれか一項に記載の方法。 - 処理能力を有するデバイスによって実行されると、請求項1から10のいずれか一項に記載の方法を前記デバイスに実行させる命令を含む非一時的コンピュータ読み取り可能記憶媒体。
- ビデオ捕捉デバイス(104)によって捕捉されたビデオストリーム(106)をビデオコーディングフォーマットで符号化するように構成されたビデオストリームエンコーダ(108)であって、前記ビデオコーディングフォーマットが、補助フレーム(110)を前記符号化されたビデオストリーム(416)内に含めることをサポートし、前記補助フレーム(110)が、前記符号化されたビデオストリーム(416)内の別のフレームによって参照され、かつ、前記符号化されたビデオストリーム(416)内の別のフレームを補完する画像データを備え、前記補助フレームが、前記補助フレーム(110)の前記画像データが、前記符号化されたビデオストリーム(416)を復号するときに示されることは意図されず、代わりに、示される画像データを達成するために前記別のフレームのデータとともに使用されることを指示するフラグ値を備え、前記ビデオストリームエンコーダ(108)が、
前記ビデオ捕捉デバイス(104)によって捕捉された第1の画像データ(106a)を受信することと、
復号されるときの前記ビデオストリームのための意図される解像度を判定すること(S502)と、
第1のスケールダウンされた画像データ(114)を取得するために前記第1の画像データ(106a)をスケールダウンすること(S504)であって、前記第1のスケールダウンされた画像データ(114)が、前記意図される解像度よりも低い第1の解像度を有する、スケールダウンすること(S504)と、
空の第1の補助フレーム(110a)を準備することであって、前記第1の補助フレーム(110a)の前記画像データが、前記意図される解像度に等しい解像度を有し、すべてが同じ事前定義された値を有するビットを備える、準備することと、
前記第1のスケールダウンされた画像データ(114)を前記第1の補助フレーム(110a)の前記画像データ内に貼り付けること(S506)と、
前記第1の補助フレーム(110a)をイントラフレームとして符号化することと、
前記第1の補助フレーム(110a)の前記画像データ(106a)内の前記第1のスケールダウンされた画像データ(114)を前記意図される解像度を有する第1のアップスケールされた画像データにアップスケールするための第1の画像変換を判定することと、
少なくとも1つの所定のマクロブロックサイズに従って、前記第1の画像変換の結果生じた画素の移動をサンプリングすることによって、第1の動きベクトル(120)を判定すること(S508)と、
前記第1の画像データ(106a)を前記第1の補助フレーム(110a)を参照するインターフレームとして第1のフレーム(112a)に符号化することであって、前記第1のフレーム(112a)の動きベクトル(120)が前記第1の動きベクトル(120)に対応する、符号化することと
を行うようにさらに構成されている、ビデオストリームエンコーダ(108)。 - 請求項12に記載のビデオストリームエンコーダ(108)と、
デコーダであって、前記ビデオストリームエンコーダ(108)が、デジタルネットワーク(402)を介して前記デコーダ(404)に接続されている、デコーダと、
を含む、システムであって、
前記ビデオストリームエンコーダ(108)が、
前記ビデオ捕捉デバイスによって捕捉された第1の画像データを受信することと、
復号されるときの前記ビデオストリームのための意図される解像度を判定することと、
第1のスケールダウンされた画像データを取得するために前記第1の画像データをスケールダウンすることであって、前記第1のスケールダウンされた画像データが、前記意図される解像度よりも低い第1の解像度を有する、スケールダウンすることと、
空の第1の補助フレームを準備することであって、前記第1の補助フレームの前記画像データが、前記意図される解像度に等しい解像度を有し、すべてが同じ事前定義された値を有するビットを備える、準備することと、
前記第1のスケールダウンされた画像データを前記第1の補助フレームの前記画像データ内に貼り付けることと、
前記第1の補助フレームをイントラフレームとして符号化することと、
前記第1の補助フレームの前記画像データ内の前記第1のスケールダウンされた画像データを前記意図される解像度を有する第1のアップスケールされた画像データにアップスケールするための第1の画像変換を判定することと、
少なくとも1つの所定のマクロブロックサイズに従って、前記第1の画像変換の結果生じた画素の移動をサンプリングすることによって、第1の動きベクトルを判定することと、
前記第1の画像データを前記第1の補助フレームを参照するインターフレームとして第1のフレームに符号化することであって、前記第1のフレームの動きベクトルが前記第1の動きベクトルに対応する、符号化することと
を行うようにさらに構成され、
前記デコーダ(404)が、
前記ビデオストリームエンコーダ(108)の前記ビデオコーディングフォーマットで符号化されたビデオストリームを復号するように構成され、前記ビデオストリームエンコーダ(108)が、
前記デジタルネットワーク(402)を介して前記意図される解像度を受信することと、
第1の解像度を受信することと、
前記受信された意図される解像度および前記受信された第1の解像度に従って、前記ビデオストリーム(106)を符号化することと、
前記デジタルネットワーク(402)を介して前記符号化されたビデオストリーム(416)を送信することと、
前記デジタルネットワーク(402)を介して、前記符号化されたビデオストリーム(416)を受信することと、
復号されたビデオストリームを達成するために、前記符号化されたビデオストリーム(416)を復号することと、
を行うように適合されている、システム。 - ディスプレイ(418)をさらに備え、前記ビデオストリームエンコーダ(108)が、
前記第1の画像データのセクションROI1(302)が前記符号化されたビデオストリーム(416)内に前記第1の解像度よりも高い第3の解像度で含まれるべきと判定することと、
前記ROI1が前記第1のスケールダウンされた画像データ(114)に重複しないために、前記ROI1(302)が、前記第1のスケールダウンされた画像データ(114)を上書きしないよう、または前記第1のスケールダウンされた画像データ(114)によって上書きされるよう、前記第3の解像度を有する前記ROI1(302)を前記第1の補助フレーム(110a)の前記画像データ内に貼り付けることと、
前記意図される解像度を有する前記ROI1(302)を前記第1のアップスケールされた画像データ内に挿入するための第4の画像変換を判定することと、
前記第4の画像変換をサンプリングすることによって、第4の動きベクトルを判定することと
を行うようにさらに構成されており、
前記第1の画像データ(106a)をインターフレームとして前記第1のフレーム(112a)に前記符号化するステップが、前記第1のフレーム(112a)の動きベクトルが前記第1の動きベクトル(120)および前記第4の動きベクトルに対応すると判定することを備え、
前記デコーダ(404)が、
復号されたビデオストリームを達成するために、前記符号化されたビデオストリーム(416)を復号することであって、前記第1の補助フレーム(110a)の前記画像データ(106)から前記ROI1(302)を抽出することを備える、復号することと、
前記ROI1(302)を前記復号されたビデオストリームとは個別に前記ディスプレイ(418)上に表示すること(412)
を行うようにさらに構成されている、請求項13に記載のシステム。 - 前記第3の解像度が前記意図される解像度よりも大きく、前記ROI1(302)を前記復号されたビデオストリームとは個別に前記ディスプレイ(418)上に前記表示する(412)ステップが、前記ROI1(302)を前記ディスプレイ(418)上に前記第3の解像度で表示することを備える、請求項14に記載のシステム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP17197037.9A EP3474225B1 (en) | 2017-10-18 | 2017-10-18 | Method and encoder for encoding a video stream in a video coding format supporting auxiliary frames |
| EP17197037.9 | 2017-10-18 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2019075783A JP2019075783A (ja) | 2019-05-16 |
| JP2019075783A5 JP2019075783A5 (ja) | 2020-07-27 |
| JP6854795B2 true JP6854795B2 (ja) | 2021-04-07 |
Family
ID=60138279
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018192243A Active JP6854795B2 (ja) | 2017-10-18 | 2018-10-11 | 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US10616592B2 (ja) |
| EP (1) | EP3474225B1 (ja) |
| JP (1) | JP6854795B2 (ja) |
| KR (1) | KR102118265B1 (ja) |
| CN (1) | CN109688410B (ja) |
| TW (1) | TWI763937B (ja) |
Families Citing this family (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3713235B1 (en) * | 2019-03-19 | 2023-08-02 | Axis AB | Methods and devices for encoding a video stream using a first and a second encoder |
| CN111836080B (zh) * | 2019-04-19 | 2022-07-19 | 浙江宇视科技有限公司 | 视频参数优化方法及装置 |
| CN110248192B (zh) * | 2019-06-12 | 2021-10-15 | 腾讯科技(深圳)有限公司 | 编码器切换、解码器切换、屏幕分享方法和屏幕分享系统 |
| US10951902B2 (en) * | 2019-06-12 | 2021-03-16 | Rovi Guides, Inc. | Systems and methods for multiple bit rate content encoding |
| JP7151654B2 (ja) | 2019-07-26 | 2022-10-12 | トヨタ自動車株式会社 | 検索装置、学習装置、検索システム、検索プログラム、及び学習プログラム |
| GB2590152A (en) * | 2019-10-04 | 2021-06-23 | Vaion Ltd | Encoding and decoding a video |
| GB201914348D0 (en) * | 2019-10-04 | 2019-11-20 | Vaion Ltd | Encoding and decoding a video |
| EP3902244B1 (en) * | 2020-04-23 | 2022-03-23 | Axis AB | Controlling a pan-tilt-zoom camera |
| KR102313651B1 (ko) * | 2020-05-12 | 2021-10-15 | 수니코리아 엘엘씨(한국뉴욕주립대학교) | 서버와 클라이언트 장치 간 비디오 스트리밍 방법 |
| JP2022038979A (ja) * | 2020-08-27 | 2022-03-10 | ソニーセミコンダクタソリューションズ株式会社 | 画像処理装置および方法 |
| EP3989530A1 (en) * | 2020-10-23 | 2022-04-27 | Axis AB | Generating substitute image frames based on camera motion |
| US20220394073A1 (en) * | 2021-06-08 | 2022-12-08 | Comcast Cable Communications, Llc | Method and apparatus for determining bitrate switch points |
| EP4387228A1 (en) | 2022-12-15 | 2024-06-19 | Axis AB | Method and device for combining image data from two or more encoded image frames |
| EP4443874A1 (en) | 2023-04-03 | 2024-10-09 | Axis AB | Encoding of video stream during changing camera field-of-view |
| EP4535784B1 (en) | 2023-10-02 | 2025-09-17 | Axis AB | Method and device for handling bandwidth shortage in relation to transmission of video frames |
| EP4542993A1 (en) * | 2023-10-18 | 2025-04-23 | Axis AB | Video stream encoding both overview and region-of-interest(s) of a scene |
Family Cites Families (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6226327B1 (en) * | 1992-06-29 | 2001-05-01 | Sony Corporation | Video coding method and apparatus which select between frame-based and field-based predictive modes |
| US6057884A (en) * | 1997-06-05 | 2000-05-02 | General Instrument Corporation | Temporal and spatial scaleable coding for video object planes |
| US6310919B1 (en) * | 1998-05-07 | 2001-10-30 | Sarnoff Corporation | Method and apparatus for adaptively scaling motion vector information in an information stream decoder |
| US7085323B2 (en) * | 2002-04-03 | 2006-08-01 | Stmicroelectronics, Inc. | Enhanced resolution video construction method and apparatus |
| US20040120398A1 (en) * | 2002-12-19 | 2004-06-24 | Ximin Zhang | System and method for adaptive field and frame video encoding using rate-distortion characteristics |
| KR100885443B1 (ko) | 2005-04-06 | 2009-02-24 | 엘지전자 주식회사 | 레이어간 예측방식를 사용해 엔코딩된 영상신호를디코딩하는 방법 |
| KR100896279B1 (ko) * | 2005-04-15 | 2009-05-07 | 엘지전자 주식회사 | 영상 신호의 스케일러블 인코딩 및 디코딩 방법 |
| US7801223B2 (en) * | 2006-07-27 | 2010-09-21 | Lsi Corporation | Method for video decoder memory reduction |
| JP2008177907A (ja) * | 2007-01-19 | 2008-07-31 | Fujitsu Ltd | 動画データ復号装置、情報機器、動画データ復号方法および動画データ復号プログラム |
| US8508659B2 (en) * | 2009-08-26 | 2013-08-13 | Nxp B.V. | System and method for frame rate conversion using multi-resolution temporal interpolation |
| JP5308322B2 (ja) * | 2009-12-16 | 2013-10-09 | 日本放送協会 | 画像符号化装置、画像復号装置及びプログラム |
| JP5588833B2 (ja) * | 2010-11-10 | 2014-09-10 | 富士フイルム株式会社 | 画像圧縮装置、画像伸長装置、方法、及びプログラム |
| GB2501835B (en) * | 2011-03-09 | 2014-09-03 | Canon Kk | Video encoding and decoding |
| US8934544B1 (en) * | 2011-10-17 | 2015-01-13 | Google Inc. | Efficient motion estimation in hierarchical structure |
| US9661340B2 (en) * | 2012-10-22 | 2017-05-23 | Microsoft Technology Licensing, Llc | Band separation filtering / inverse filtering for frame packing / unpacking higher resolution chroma sampling formats |
| US10250902B2 (en) * | 2013-05-24 | 2019-04-02 | Kt Corporation | Method for inducing motion information in multilayer structure and apparatus using same |
| US9756331B1 (en) * | 2013-06-17 | 2017-09-05 | Google Inc. | Advance coded reference prediction |
| EP3038370A1 (en) | 2014-12-22 | 2016-06-29 | Alcatel Lucent | Devices and method for video compression and reconstruction |
| US20160286226A1 (en) | 2015-03-24 | 2016-09-29 | Nokia Technologies Oy | Apparatus, a method and a computer program for video coding and decoding |
| CN104811722B (zh) * | 2015-04-16 | 2019-05-07 | 华为技术有限公司 | 一种视频数据的编解码方法及装置 |
| AU2015207825A1 (en) | 2015-07-28 | 2017-02-16 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding video data for selected viewing conditions |
| CN106162180A (zh) * | 2016-06-30 | 2016-11-23 | 北京奇艺世纪科技有限公司 | 一种图像编解码方法及装置 |
-
2017
- 2017-10-18 EP EP17197037.9A patent/EP3474225B1/en active Active
-
2018
- 2018-10-11 KR KR1020180121100A patent/KR102118265B1/ko active Active
- 2018-10-11 JP JP2018192243A patent/JP6854795B2/ja active Active
- 2018-10-12 TW TW107135901A patent/TWI763937B/zh active
- 2018-10-15 CN CN201811197067.3A patent/CN109688410B/zh active Active
- 2018-10-17 US US16/163,387 patent/US10616592B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| KR20190043469A (ko) | 2019-04-26 |
| EP3474225A1 (en) | 2019-04-24 |
| EP3474225B1 (en) | 2019-09-25 |
| CN109688410A (zh) | 2019-04-26 |
| TWI763937B (zh) | 2022-05-11 |
| KR102118265B1 (ko) | 2020-06-02 |
| JP2019075783A (ja) | 2019-05-16 |
| US20190116371A1 (en) | 2019-04-18 |
| CN109688410B (zh) | 2021-01-29 |
| US10616592B2 (en) | 2020-04-07 |
| TW201929547A (zh) | 2019-07-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6854795B2 (ja) | 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ | |
| KR102525578B1 (ko) | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 | |
| CN104365095B (zh) | 用于对视频流的选定空间部分进行编码的方法和装置 | |
| US5815601A (en) | Image encoder and image decoder | |
| TWI387317B (zh) | 產生重新取樣參考畫面之裝置及其方法與影像解碼系統 | |
| CN101690163B (zh) | 快门时间补偿 | |
| US9600853B2 (en) | Method, terminal and system for image processing | |
| TWI505694B (zh) | 編碼器及編碼方法 | |
| JP2011505781A (ja) | 高解像度デジタル静止画像をビデオと並行して符号化するためのavc規格の拡張 | |
| JP2011505780A (ja) | 高解像度デジタル静止画像をビデオと連続して符号化するためのavc規格の拡張 | |
| WO2010095471A1 (ja) | 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム | |
| JP6975121B2 (ja) | 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ | |
| CN110121065B (zh) | 空间排序视频编码应用中的多向图像处理 | |
| JP5529161B2 (ja) | ビデオストリームをブラウジングする方法及び装置 | |
| CN101584220B (zh) | 对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统 | |
| CN114125448B (zh) | 视频编码方法、解码方法及相关装置 | |
| WO2013191193A1 (ja) | 映像圧縮伝送システム | |
| CN112567739B (zh) | 用于视觉媒体编码和解码的平面预测模式 | |
| JP2011015262A (ja) | 画像復号化装置 | |
| JP4580880B2 (ja) | 画像符号化装置、画像復号装置及び画像処理システム | |
| JPH10145788A (ja) | 映像再生装置 | |
| KR102459813B1 (ko) | 영상스위칭 기반의 주기적 화질보정 영상처리 방법 | |
| US20260039828A1 (en) | Method and apparatus for image processing using artificial intelligence technology | |
| JP2024147510A (ja) | カメラ視野を変更している間のビデオストリームの符号化 | |
| JP2006352636A (ja) | 動画像符号化装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200612 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200612 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200612 |
|
| A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20201021 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201022 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201027 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210107 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210309 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210316 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6854795 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |