[go: up one dir, main page]

JP2011528130A - 高度に圧縮されたエンハンスメントレイヤのデータを同期させる方法及び装置 - Google Patents

高度に圧縮されたエンハンスメントレイヤのデータを同期させる方法及び装置 Download PDF

Info

Publication number
JP2011528130A
JP2011528130A JP2011517894A JP2011517894A JP2011528130A JP 2011528130 A JP2011528130 A JP 2011528130A JP 2011517894 A JP2011517894 A JP 2011517894A JP 2011517894 A JP2011517894 A JP 2011517894A JP 2011528130 A JP2011528130 A JP 2011528130A
Authority
JP
Japan
Prior art keywords
enhancement layer
base layer
packet
bitstream
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011517894A
Other languages
English (en)
Other versions
JP5314757B2 (ja
Inventor
ヤクス,ペーター
コルドン,スヴェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2011528130A publication Critical patent/JP2011528130A/ja
Application granted granted Critical
Publication of JP5314757B2 publication Critical patent/JP5314757B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

マルチメディアアプリケーションのデータフォーマットは、データパケットを使用し、ベースレイヤ(BL)及び1以上のエンハンスメントレイヤ(EL)をもつパケット化された階層的なレイヤを含む。可変長符号化データを含むパケットは、チェックサム情報を付加するために使用されるパディングビットを典型的に提供する。チェックサム情報は、復号化されたベースレイヤ及び復号化されたエンハンスメントレイヤのパケットデータの両者を示し、レイヤ間の同期の損失を検出するために使用される。パケットは異なる個々の量のパディングビットを提供するが、このパケット当たりの可変のビット量は、同期に関連した目的のためにチェックサム情報を付加するために十分である。これにより、エンハンスメントレイヤの符号化が、特にパケットヘッダなし及びパケット同期ワードなしといった同期のためのオーバヘッド情報を提供しない場合でさえ、たとえば同期はずれの検出が可能となる。

Description

本発明は、ベースレイヤのデータに関連するエンハンスメントレイヤのデータの高圧縮符号化の方法及び装置、並びに、高圧縮されたエンハンスメントレイヤのデータの対応する復号化の方法及び装置に関するものであり、ここでは、エンハンスメントレイヤのデータと対応するベースレイヤのデータとの間の同期が決定される。
幾つかのマルチメディアアプリケーションのデータフォーマットは、ベースレイヤ(BL)と1以上のエンハンスメントレイヤ(EL)とをもつ階層的なレイヤを使用する。あるレイヤにおけるデータは、パケット化されることがあり、すなわちパケット又はフレームに編成されることがある。BL信号は、再生可能なマルチメディアデータを取得するために単独でデコードすることができ、且つ基本的なデコードのための全ての情報を含む一方で、EL信号は、有効なマルチメディアデータを取得するために単独でデコードすることができない付加的な情報を有する。代わりに、ELデータは、BLデータにしっかりと結合され、BLデータと一緒でのみ有益である。通常、BL及びELデータは、一般的な復号化の間又はそれらの個々の復号化の後の何れかで、互いに付加されるか又は重ね合わされる。何れかのケースにおいて、ELデータをBLデータに同期させることが必要であり、さもなければ、ELデータは有益な情報を含まないためである。
たとえば個々のCRCチェックサム又は前方誤り訂正(FEC)メカニズムにより、それぞれのサブビットストリームのインテグリティを個々にチェックすることが一般的である。一般に、係るCRC又はFECスキームは、サブビットストリームの個々の分離したブロック又はシグナルフレームに適用される。デコードがサブビットストリームにおける同期した位置で開始し、更にサブビットストリームの何れについても伝送エラーが検出されない場合、デコーダは、階層的なビットストリームが同期していると想定する。しかし、この技術はビットストリームの個々のプロテクトされたブロックの受信に関して確実性を与えるだけであるため、たとえば1つのサブビットストリームのプロテクトされたブロックのうちの1つが完全に失われた場合に、検出されない誤りが存在する。
さらに、データレートをできるだけ低く保持することが望ましく、これは、洗練されたデータ圧縮方法につながる。CRC又はFECのアプローチの問題点は、典型的に、かなりの量の付加データがビットストリームのそれぞれのブロックについて送信される必要があることである。したがって、一様に分散されないデータワードについて可変長符号化が使用されることがある。可変長符号化(VLC)では、より頻繁に、すなわち高い確率で出現するデータワードは、より短いコードワードで符号化される一方で、より低い確率で出現するデータワードは、より長いコードワードに符号化される。したがって、符号化されたメッセージにおける平均のビット数は、一定のコードワード長を使用するよりも短い。しかし、VLCのような高圧縮方法は、ビットエラーに対して感度が高く、完全なデータの損失につながる場合がある。たとえばVLCについて、同期が失われているときに、どのビットがコードワードに属するかを判定することが不可能な場合がある。したがって、可能性のあるデータの損失を制限する一般的な解決策は、非常に高い確率で認識される固有の同期ワードを挿入することである。しかし、同期ワードはデータレートを増加し、より多くの同期ワードが使用されると、データレートが高くなる。さらに、サブビットストリームのブロックにCRC又はFEC方法を適用する更なる問題点は、VBR符号化におけるような、可変長であってブロックヘッダを有さないブロックに対処することが非常に困難である点である。
データ送信又は記憶におけるビットエラーの検出を可能にするため、符号化されたデータに対してチェックサムを計算し、チェックサムを送信又は記憶することが一般的な方法である。所定のビット誤りを検出又は訂正するために異なるタイプのチェックサムが知られている。しかし、チェックサムにおける情報量が高くなると、より多くのビット数が必要となる。したがって、よりチェックサムが有益であると、よりデータレートが高められることになる。
上記に鑑みて、本発明が解決すべき課題は、パケット化されたベースレイヤのデータストリームに関する高圧縮されたエンハンスメントレイヤのデータストリームについて符号化方法及びフォーマットを提供し、これにより、エンハンスメントレイヤのデータストリームにおける同期情報(sync)とチェックサム情報の量を低く維持しつつ、デコードの間に、エンハンスメントレイヤのデータとベースレイヤのデータとの間の同期の損失を少なくとも検出することを可能にすることである。
さらに、本発明が解決すべき別の課題は、対応するデコード方法及び装置を提供することである。特に、デコード方法及び装置は、デコードの間、エンハンスメントレイヤのデータとベースレイヤのデータとの間の同期の損失を少なくとも検出することができる。係る検出に応じて、乱れを低減することを少なくとも支援することができる。
本発明は、上述した問題について以下の解決策を提供するものである。
原則として、本発明は、可変長符号化データを含むパケットが、チェックサム情報を付加するために使用される、それらのパディングビットにおいてフリーなスペースを典型的に提供する事実、及びチェックサム情報が同期の損失を検出するため又は他の同期の目的で使用することができる事実の認識に基づいている。この理由のため、チェックサム情報は、デコードされたベースレイヤ及びデコードされたエンハンスメントレイヤのパケットデータとまとめて呼ばれる。全てのパケットがフリーのパディングビットを提供するものではないが、少なくとも大部分のパケットが提供するものであり、nビットがバイトを形成すると仮定して、それぞれのパケットは、平均で(n-1)/2のパディングビットを提供する。このパケット当たりの可変のビット数は、高く洗練された誤り訂正について十分ではない場合があるが、上述された同期に関連する目的について十分であることがわかる。有利なことに、これにより、たとえば、エンハンスメントレイヤの符号化が、パケットヘッダ及びパケット同期ワードなしといった、非常に制限されたオーバヘッド情報を提供するとしても、数パケット後に同期はずれ“out-of-sync”の検出が可能となる。
1態様では、本発明は、ベースレイヤのデータストリーム及び関連されるエンハンスメントレイヤのデータストリームを符号化する方法を提供するものであり、本方法は、以下のステップを含む。ベースレイヤのデータストリーム及びエンハンスメントレイヤのデータストリームに対して共通のチェックサムを計算するステップ。個々の長さのベースレイヤのパケットにおけるベースレイヤのデータを符号化するステップ。あるパケットにおけるデータワードは、(たとえばバイト指向の構造といった)固定長を有し、それぞれのパケットは、同期ワード及び個々のパケット長の示唆を少なくとも含むヘッダ部分を有する。個々の長さのエンハンスメントレイヤのパケットにおけるエンハンスメントレイヤのデータを符号化するステップ。それぞれのエンハンスメントレイヤのパケットは、特定のベースレイヤのパケットに対応し、エンハンスメントレイヤのパケットにおけるデータワードは、可変長を有し(すなわちバイト指向の構造ではない)、パケットは、ヘッダ、リーディングパケット同期ワード及びパケット長の示唆を含まない。あるパケットに符号化されるエンハンスメントレイヤのデータワードの数は、対応するベースレイヤのパケットに符号化されるベースレイヤのデータワードの数に依存する。符号化されたエンハンスメントレイヤのパケットをバイト指向の構造にマッピングするステップ。バイトは、nビットを有し、そのパケットの最後のバイトにおける多数のパディングビットは、使用されないままである。この数は、0とn−1との間である。エンハンスメントレイヤのパケットについてパディングビットの数を決定するステップ。前記エンハンスメントレイヤのパケットとその対応するベースレイヤのパケットとに関連するチェックサムから最下位ビット(LSB)の量を抽出するステップ。この量は、前記決定されたパディングビット数に等しい。抽出されたチェックサムLSBを前記パディングビットに挿入するステップ。
個々のベースレイヤのパケットの長さは、採用されるマルチメディアアプリケーションのフォーマットに従って、それらの内容により定義される場合がある。たとえばオーディオ符号化フォーマットMP3(MPEG-1 Layer III)又はビデオ符号化フォーマットAVCは、可変長のコンテンツに依存するパケット長を提供する。
さらに、パケットにおける値(情報)の数は、エントロピー符号化の前後で同じである一方、ビット数又はバイト数は、通常は異なることに留意されたい。
1実施の形態では、BLデータストリームのそれぞれのベースレイヤ(BL)のパケットは、ELビットストリームの1つの対応するエンハンスメントレイヤ(EL)パケットを有し、BLパケットにおけるそれぞれのデータ値は、ELパケットにおける対応するデータエンハンスメント値を有する。たとえば、BLパケットが特定の数XBの値を有する場合、対応するELパケットは、同じ数のエンハンスメント値を有し、1つのエンハンスメント値がそれぞれのBL値に対応する。
別の実施の形態では、BLデータストリームのそれぞれのBLパケットは、ELビットストリームの1つの対応するELパケットを有し、BLパケットにおける特定のタイプのそれぞれのデータ値のみがELパケットにおける対応するデータエンハンスメント値を有する。たとえばBLパケットが第一のタイプのXB1値を有し、第二のタイプのXB2値を有する場合、対応するELパケットは、第一のタイプのBL値にのみ関連する同じ数XB1のエンハンスメント値を有する場合がある。
1実施の形態では、BL及びELデータは、たとえば1つのファイルに記憶されるように、順次に配置され、ELデータは、多くて1つの同期ワードを有する。
本発明の別の態様によれば、符号化されたマルチメディア信号は、第一の部分と第二の部分とを有し、第一の部分は、ベースレイヤのオーディオビットストリームのバイトで位置合わせされた(bite-aligned)エントロピー符号化パケットを有し、第二の部分は、可変長符号化されたエンハンスメントレイヤのデータを有する。ベースレイヤパケットは、同期情報を含み、エンハンスメントレイヤパケットは、同期情報を含まない(少なくともパケットヘッダをもたない)。エンハンスメントレイヤパケットは、それらの対応するベースレイヤパケットのエンハンスされた復号化に適した符号化パラメータを有する。エンハンスメントレイヤパケットの最後のバイトは、パディングビットの個々の可変の数Nを有する(すなわち異なるエンハンスメントレイヤのパケットは、異なる個々の数のパディングビットを有する場合がある)。パディングビットは、2つのパケット、すなわちオーディオ信号の第二の部分からのエンハンスメントレイヤのパケット及びオーディオ信号の第一の部分からの対応するベースレイヤパケットを通してチェックサムのN個のLSBを有する。チェックサムは、エントロピー符号化の前に計算され、すなわち、受信されたときのデータではなく、エントロピー復号化されたデータを示す。
本発明の更に別の態様によれば、ベースレイヤのビットストリーム及び対応するエンハンスメントレイヤのビットストリームを復号化する方法が提供される。エンハンスメントレイヤのビットストリームは、ベースレイヤのビットストリームのエンハンスされた復号化のための可変長符号化されたエンハンスメントデータを含む。当該方法は、以下のステップを含む。ベースレイヤのビットストリームの一部をエントロピー復号化するステップを含む。第一のエントロピー復号化されたベースレイヤのパケットが取得される。エンハンスメントレイヤのビットストリームの一部をエントロピー復号化するステップ。ベースレイヤのビットストリームの一部のエンハンスされた復号化のためのエンハンスメントデータが取得される。エンハンスメントレイヤビットストリームの最後のバイトにおけるパディングビットの数Nを決定するステップ。パディングビットを抽出及び/又は記憶するステップ。第一の復号化されたベースレイヤパケット及びエンハンスメントレイヤのビットストリームのエントロピー復号化された部分からの前記エンハンスメントデータを通してチェックサムを計算するステップ。計算されたチェックサムのN個の最下位ビット(LSB)を抽出するステップ。Nは、パディングビットの決定された数に等しい。計算されたチェックサムの抽出されたN個の最下位ビットをN個の抽出されたパディングビットと比較するステップ。両者が等しい場合、前記エンハンスメントデータ及びベースレイヤのビットストリームデータを復号化するステップ。両者が等しくない場合、簡略化された復号化を使用してベースレイヤのビットストリームを復号化するステップ。エンハンスメントレイヤのビットストリームからのデータは、使用されないか又は無視される。
(復号化の前後の)ベースレイヤパケットの長さは、そのヘッダにおいて予め定義されるか又は指示される一方で、エンハンスメントレイヤパケットの(ビットに関する)長さは、指示されず、たとえば対応するベースレイヤのパケットからの情報を使用して復号化プロセスの間に導出される必要がある。1実施の形態では、エンハンスメントレイヤのパケットにおける符号化された値の数は、対応するベースレイヤのパケットにおける値の予め定義されたタイプの数に等しく、復号化は、ベースレイヤのパケットからエンハンスメントレイヤのパケットから復号化されるべき値の数を決定するステップ、及び決定された値の数をエンハンスメントレイヤのデータから復号化するステップを含む。別の実施の形態では、エンハンスメントレイヤのパケット当たりの値の数は、予め定義される。
本発明の有利な実施の形態は、従属の請求項、以下の説明及び図面に開示される。
本発明の例示的な実施の形態は、添付図面を参照して記載される。
ベースレイヤ及びエンハンスメントレイヤをもつストリームフォーマットの構造を示す図である。 パケット化されたベースレイヤの構造を示す図である。 パディングビットを含むパケット化されたエンハンスメントレイヤの構造を示す図である。 同期はずれの検出のため、例示的な受信された同期ワードと計算された同期ワードの比較を示す図である。 MP3ベースレイヤのデータとオーディオエンハンスメントレイヤのデータを生成するオーディオエンコーダのブロック図である。 MP3ベースレイヤのデータとオーディオエンハンスメントレイヤのデータのためのオーディオデコーダのブロック図である。 オーディオエンコーダにおけるパディングビットの置き換えに関する詳細のブロック図である。
図1は、ベースレイヤ10及びエンハンスメントレイヤ11を含むデータストリームを示す。エンハンスメントレイヤは、本明細書において拡張レイヤとも呼ばれる。データストリームは制限されているので、データチャンクとも呼ばれる。拡張レイヤは、記載及び図示される実施の形態では、ベースレイヤに後続し、これにより、両者は、伝送又は記憶のために同じチャネルを順次に使用することができる。別の実施の形態では、両レイヤは、個別のチャネルを使用することができ、これにより、両レイヤは、伝送、受信、記憶又はストレージからの読み取りを同時にすることができる。
この例では、ベースレイヤ10は、図2に示されるMP3オーディオデータを含み、エンハンスメントレイヤ11は、オーディオデータの拡張された復号化のためのデータを含む。ベースレイヤのデータチャンクは、フレーム12,21,22に分離される。たとえばMP3フレームであるベースレイヤのフレームの開始は、固有の同期ワード23により示される。たとえばMP3デコーダである対応するデコーダは、MP3のフレームの開始を発見するまでこの同期ワード23についてデータストリームを分析し、発見されたMP3のフレームのスペクトル値をデコードする。ビットエラーがフレームデータに存在する場合、復号化されたデータは誤りであり、フレーム21はドロップされる。しかし、次のフレーム22は、次の同期ワードにより発見され、更なるフレームが失われないように、復号化を継続することができる。
本発明は、拡張されたMP3オーディオデータについて使用されるフォーマット及び復号化プロセスに基づいて説明される。デコーダは、“hd3”デコーダと呼ばれ、対応するエンコーダは、“hd3”エンコーダと呼ばれる。代替的に、“MP3HD”と呼ばれる場合がある。いわゆる“hd3”ビットストリームのフォーマットは、ベースレイヤ10としてMP3フォーマットレイヤと、少なくとも1つの更なるエンハンスメントレイヤ又は拡張レイヤ11を含む。MP3フレーム12は、hd3−ファイルの1つのコヒーレントなデータチャンク(データの塊“data chunk”)10を形成し、拡張レイヤ11は、後続するコヒーレントなエンハンスメントデータチャンクを形成する。1実施の形態では、ベースレイヤ10及び拡張レイヤ11は、完全なオーディオトラック(又は同様のもの)を形成する。別の実施の形態では、例外的に長いトラックについて、コヒーレントなベースレイヤのデータチャンクと後続するコヒーレントなエンハンスメントレイヤのデータチャンクがあるトラックの一部のみを形成し、完全なオーディオトラックがデータチャンクの2以上のペアから構成されることが可能である。
また、拡張レイヤのデータチャンク11は、図3に示されるように、フレームで構築される。しかし、帯域幅を低減するため、高圧縮される。したがって、エンハンスメントレイヤの値は、可変長符号化を使用して符号化され、拡張レイヤのフレームは、syncワード(同期ワード)で開始しない。代わりに、フレームは、あるシーケンスにおいて付加される。さらに、エンハンスメントレイヤのフレームにおけるコードワードは、バイト構造に関わらず、あるシーケンスにおいて付加される。したがって、拡張レイヤのフレームの境界は、直接的に検出可能ではないが、フレーム当たり定義された値の数を復号化することを含む、定義された復号化アルゴリズムに従って発見される必要がある。
可変長符号化のため、ビットエラーは、現在の値を乱すだけでなく、フレームにおける全ての後続する値の開始が不確かであるように、未知の現在の値の長さをレンダリングする。さらに、欠けているフレーム同期ワードのため、エンハンスメントレイヤのデータチャンクにおける更なるフレームを識別することは、従来可能ではない。
例示的に、Golombコードは、可変長符号として使用することができる。Golombコードは、たとえばMP3データ及びMP3エンハンスメントデータについて十分である、非負の整数値の制限された範囲を表すために使用される。原則として、コードは、他のマルチメディアデータについても使用される。コードワードは、商及び余りにより構築され、商は、単項の表現であり、余りは、2進表現であり、両者は、同じ約数を示す。たとえば、8の約数により、21の値は、“110101”として表現され、先頭の“11”は、単項の表現で商(2)を表し、後続のゼロは、セパレータであり、最後のビット“101”は、余り5を表す。余りのビット数は予め定義された約数に依存するので、固定される。しかし、先頭の単項のコード又はセパレータがビットエラーのために歪んだ場合、コードワード長を決定することが不可能である。したがって、後続するコードワードは発見されない。この種類の問題は、本発明が他の可変長符号と共に有益であるように、全ての可変長符号にも同様に当てはまる。
上述したように、符号化から生じる1つの問題は、ビット誤りの後に、エンハンスメントレイヤのデータストリームの後続する部分が従来技術の方法と使用することができないことである。別の、更に悪い問題は、復号化が間違ったエンハンスメントレイヤのデータを使用するように、この誤りが従来技術の方法により検出不可能である点である。これは、たとえばオーディオデータの場合において、ベースレイヤ及び非同期のエンハンスメントレイヤのデータから得られる復号化されたオーディオ信号が、正しく復号化された純粋なベースレイヤのデータよりも更に悪くなるように、オーディオ再生に乱れを生じさせる。一般的な場合、間違って同期されたエンハンスメントレイヤのデータの使用は、「さもなければ正しい」ベースレイヤのデータの使用に乱れを生じさせる。
本発明によれば、この問題に対する1つの解決策は、以下のように提供される。あるフレームにおけるエンハンスメントレイヤのデータの可変長符号化のため、及び可変長符号化されたデータが後続する処理のためにバイト構造にマッピングされる事実のため、エンハンスメントレイヤのフレームの最終バイトは、パディングビットを含む場合がある。これらは、通常はゼロに設定され、無視される。
さらに、パディングビットの量は、フレームは、可変長符号のために異なるビット長を有する場合があるので、あるフレームから次のフレームに変化する。
本発明は、エントロピー符号化の前に、ベースレイヤのフレームとその対応するエンハンスメントレイヤのフレームを通して共通のチェックサムを計算し、エントロピー符号化の後に残されているパディングビットに、チェックサムの好ましくはLSBをできるだけ多数のビットで書き込むことを含む。従来のデコーダは、この情報を使用することができず、従ってそれを無視している一方、本発明の復号化の態様に係るデコーダは、ベースレイヤのフレーム及びエンハンスメントレイヤのフレームが同期されるかを少なくとも検出するため、この情報を使用する。
本発明の1態様によれば、デコーダは、定義された開始位置から開始して、それぞれのパケットについてエンハンスメントレイヤデータからの定義された値の数をデコードする。次いで、デコーダは、ゼロに通常設定される、現在のエンハンスメントレイヤのフレームの最後のバイトから残りのスペアビットを読み取る。しかし、本発明に係るエンハンスメントレイヤのフレームでは、これらのビットは、チェックサムのLSBを含む。したがって、デコーダは、これらのビットを抽出/記憶し、復号化されたベースレイヤのフレーム及び現在の復号化されたエンハンスメントレイヤのフレームを通してチェックサムを計算し、抽出/記憶されたチェックサムを計算されたチェックサムのLSBの適切な量と比較する。両方のチェックサムの値が等しい場合、ベースレイヤのフレームとエンハンスメントレイヤのフレームが正しく復号化されており、互いに離れられない関係にあり、すなわちストリームが同期していると考えられる。
高度な実施の形態では、同期エラーが検出された後に同期を再び取り戻すことも可能な場合がある。これは、たとえば、同期の損失後に、後続するBLフレームを復号化し、ELフレームからの定義された値の量を復号化し、ELフレームの最終バイトから残りのビットを抽出し、復号化されたBL及びELフレームを通してチェックサムを計算し、チェックサムを抽出されたパディングビットと比較することで可能となる。不一致の場合、ELにおける開始位置は、ビット毎にシフトされ、ELに関連する手順が繰り返される。対応するBL及びELフレームにおいてビットエラーが存在しない場合、ストリームにおけるこれらのフレームを発見すること、すなわち再同期することがこの方法により可能である。1実施の形態では、記載されるプロセスは、後処理ステップにおいて壊れたエンハンスメントレイヤのストリームを修復するために使用される。この目的のため、上述されたようにELパケットにおけるビット誤りが検出され、上述されたように次の正しいELパケットが決定され、誤ったELパケットは、フォーマットの要件を満たすように修正される。エンハンスメントレイヤのフレームがベースレイヤのフレームよりも信頼できる(たとえば高品質の受信条件のために誤りがないといった)別の実施の形態では、所与のELパケットについて対応するBLパケットが決定されるか又は修復される。
上述されたように、エンハンスメントフレームデータの正しい復号化は、ベースレイヤ及びエンハンスメントレイヤが同期されることを保証する。以下に記載されるMP-3に関連する実施の形態では、デコーダは、部分的な拡張レイヤのデコーダである。エンハンスメントレイヤの復号化は、データチャンク又はファイルにおける定義された位置、すなわちベースレイヤデータの最後のフレームの後で開始する。エンハンスメントレイヤのデータの開始は、たとえば個別のファイル又はストリームにある場合にはささいなことである。ベースレイヤ及びエンハンスメントレイヤの1つのファイル又はチャネルの場合、この位置を示すポインタは、ファイルヘッダに設けられる。更なる可能性は、エンハンスメントレイヤのチャンク11は特別の指示(たとえば特定の同期ワード)により開始することである。しかし、エンハンスメントレイヤは、同期の目的のために更なるバイトを有さない。
たとえばhd3コーデックを表す実施の形態では、ビット精度のエントロピー符号化アルゴリズムが使用される。このアルゴリズムは、可変のコードワードの長さを使用して、あるコードワードの長さをシンボルの統計的な発生頻度に適合させる。したがって、それぞれのフレーム長は、ビットの観点で変化し、バイトの境界で直接に終了しない。拡張レイヤのバイト毎の切断又は(たとえばファイルヘッダに記憶されるテーブルから分かる場合がある)特定の拡張フレームの開始へのジャンプを可能にするため、フレーム長は、パディングビットを使用することで次のバイトの境界にまで常に丸められる。したがって、(それぞれのバイトが8ビットを有するとして)フレーム当たり3.5パディングビットの平均の量が生じ、本発明に従って使用される。一般に、バイトがkビットを有する場合に(k-1)/2ビットとなる。
上述したように、この種のビットストリームの問題は、ビットストリームにおけるエラーが現在のフレームにおける誤りにつながるだけでなく、同期に乱れを生じさせることである。さらに、上述した階層的なMP3ビットストリームのフォーマットでは、符号化された信号を再構成するためにその特定のMP3フレームの部分的に復号化された値を拡張レイヤのフレームが必要とするので、拡張レイヤは、ベースレイヤと同期される必要がある。したがって、拡張レイヤが同期された状態を保持するため、MP3フレーム及び拡張レイヤフレームが同期し、拡張レイヤの部分的な復号化が正しいことが保証されるべきである。
本発明の1つの利点は、余分のビット又はバイトを使用することなしに、すなわちデータ量を増加することなしに、両者の同期の問題を克服することである。
例示的に、hd3デコーダにおける同期はずれの検出の実現は、以下に記載される。第一に、復号化されたMP3データ(スペクトルMP3値)が有効であることを保証するため、部分的に復号化されたMP3値の整数の合計が計算される。第二に、拡張レイヤのデータの正しい復号化を検証するため、部分的に復号化された拡張レイヤのデータの整数の合計が計算され、部分的に復号化されたMP3値の整数の合計に加えられる。結果は、原則として、2つの対応するhd3フレームのハッシュ値である。ハッシュ値は、実際の装置とは独立に、実際のエントロピー符号化方法とは独立に、各符号化及び復号化装置に関して同じようにビットレベルで正確である。これは、ハッシュ値がエントロピー符号化前に計算されるためである。ビットストリーム内のハッシュ値を受信することで、デコーダは、同期エラーを検出して、それに対応することができる。異なるエントリピー符号化方法により異なるエンハンスメントレイヤのフレーム長、従って異なる量のパディングビットとなる場合があるが、チェックサムは同じである。さらに、デコーダは、なお同期損失を検出することができる。これは、比較されるべきビット量は、デコーダ内で決定されるからである。
本発明の1態様は、ハッシュ値のLSBのみを使用して、これらのビットをそれぞれの拡張レイヤフレームのパディングビットに記憶することである。次いで、デコーダは、両方のレイヤを部分的に(すなわちエントロピー)復号化した後、パディングビットを抽出し、部分的に復号化された値からハッシュ値を計算することができる。ハッシュ値のLSBがパディングビットに等しくない場合、部分的な復号化プロセスにおいてエラーが存在せず、拡張レイヤは、更なる復号化により同期から抜け出る場合がある。結果として、デコーダは、1実施の形態では、全体の復号化プロセスを停止することができる。しかし、別の実施の形態では、ベースレイヤのチャンクの復号化がなお実現可能であるため、ベースレイヤフレームの独立した復号化に切り替える。次いで、デコーダは、上述されたように、純粋なベースレイヤの復号化を継続し、エンハンスメントレイヤの復号化を抑えるか又はエンハンスメントレイヤの同期を取り戻す。この手順の特定の利点は、誤って同期されたエンハンスメントレイヤのデータを検出及びスイッチを切ることができ、従ってベースレイヤのデータの再生を乱さない。
以下では、図4に示されるように、例示的に受信及び計算された同期ワードの比較が記載される。以下の項が使用される。
Figure 2011528130
例では、16ビットのチェックサムHframeは、部分的に復号化されたベースレイヤのフレームの値Xmp3(k)及びその対応するエンハンスメントレイヤのフレームの値Xext(k)を通してデコーダにおいて計算される。受信されたエンハンスメントレイヤのフレームの最後のバイトにおいて、4ビットがパディングビットとして検出され、これらパディングビットから、送信される4ビットのチェックサムHpaddingが抽出される。正しい同期を検出するため、抽出されたパディングビットHpaddingは、計算されたチェックサムHframeのLSBに等しい必要がある。それらが異なる場合、フレームが同期はずれであることを意味する(又はビットエラーが生じたことを意味し、これもチェックすることができる)。
本発明の1態様は、更なるデータバイトがエンハンスメントレイヤのストリームに挿入される必要がないことである。結果的に、公知の誤り検出方法以外に、誤り検出の確率が異なるように、パディングビットの数は、ゼロと7ビットとの間で異なる。したがって、同期の損失は、最初の無効なフレームで即座に検出されない場合がある。しかし、それぞれ後続するフレームは、検出されている誤りの確率を増加させる。これは、後続するハッシュ値が無効であるためである。したがって、提案される方法は、少なくとも数フレーム内で同期はずれの状況を検出するのに十分に良好である。音声に関連した実施の形態では、係る状況は、MP3が数ミリ秒の音を典型的に表すことを考慮して、聴取者の主要な乱れを防止するのに十分に高速に検出される。従って、提案される同期はずれの検出は、音声符号化にとって特に有利である。
本発明の更なる実施の形態では、記載される同期はずれの検出メカニズムは、図5及び図6に示されるように、MP3に基づいた階層的な無損失オーディオコーデックとして実現される。
図5は、MP3ベースレイヤのデータとオーディオエンハンスメントレイヤのデータを生成する例示的なオーディオエンコーダを示す。入力信号200は、従来のMP3フィルタバンク及び量子化ユニット203に供給され、整数MDCT計算ユニット240に供給される。MP3フィルタバンクは、MP3ビン215を提供し、このMP3ビンは、エントロピー符号化されて(220)、次いで、従来のMP3フォーマット化されたオーディオ信号225、すなわちMP3ビットストリームを表し、このMP3ビットストリームが出力される。エンハンスメントレイヤ信号は、MP3ビンの整数MCDT値へのマッピング230により取得される。これらは、実際の整数MDCT240の出力と比較され(250)、残りの残差255が計算される。残差255は、エントロピー符号化され(270)、上述され且つ図3に示された可変長符号化が使用される。図7は、可変長の符号化パケット273がバイトにマッピングされる(271)ことを詳細に示す。係る符号化されたパケット275の大部分は、上述されたようにトレイリング(trailing)パディングビットを有し、このパディングビットは、一時的にゼロに設定される。パディングビットの数Nを決定する(272)ことが望ましい。
計算ブロック260では、ベースレイヤのフレームのMP3ビン215及び対応するエンハンスメントレイヤのフレームの残差255とからハッシュ値265が計算される。これら2つの対応するフレームは、入力信号の同じ部分から共に生成され、従って両者は、高度なデコーダにおいて出力信号の同じ部分に結合される必要がある。しかし、従来のデコーダは、エンハンスメントレイヤ信号を無視し、ベースレイヤ信号をMP3の品質をもつ従来のオーディオ信号にデコードすることができる。また、エンハンスメントレイヤの信号を復号化可能なデコーダは、同期はずれの検出を必ずしも実行する必要はないが、ハッシュ値を無視することができる。しかし、これらのデコーダは、同期はずれの状況を検出することができないリスクがあり、従って本発明に係るデコーダよりも誤った出力信号品質を提供する場合がある。
ハッシュ値265は、デコーダにおいて後に、復号化された整数のスペクトルから計算されるように、MP3ビン215内の整数のスペクトル(integer spectra)及び整数の残差(255)から計算される(260)。ハッシュ値265は、これらの整数値からのシンプルなチェックサムである場合があり、その計算の間に、Mビット(M≧N)の固定された幅を通常有する。原則として、エンハンスメントレイヤのフレームの終了での決定された利用可能なパディングビットの量N 274は、トランケーションユニット261に供給され、このトランケーションユニット261は、Mビットのハッシュ値265からNの最下位ビットを抽出又は切り捨てる。結果として得られる切り捨てられたNビットのハッシュ値263は、次いで、エンハンスメントレイヤのフレーム275のパディングビットに挿入され(280)、これにより、本発明の1態様に係るエントロピー符号化されたエンハンスメントレイヤ信号285が得られる。エンハンスメントレイヤのビットストリームは、「CDレイヤ」ビットストリームとも呼ばれる。これは、エンハンスメントレイヤのビットストリームは、品質が低減されたMP3信号から(CDからのような)本来の品質の損失のない再構成を可能にするためである。
1実施の形態では、1つの最初の同期ワードは、エンハンスメントレイヤのビットストリーム295に付加される(290)。これは、このストリームの開始を発見することが困難である場合に有利な場合があり、たとえば、両方のレイヤが図1のように1つのファイルに記憶され、ファイルヘッダにおけるポインタが最初のエンハンスメントレイヤのパケットを示す場合、このポインタにおけるビット誤りは、発見されていないエンハンスメントレイヤにおいて生じる。係る1つの最初の同期ワードにより、エンハンスメントレイヤの開始についてストリームを分析することができる。しかし、これは、最初の同期を提供するのみであり、レイヤ間の後の同期の損失を検出するために適切ではない。
実現において、中間的な結果が物理的に利用可能ではないように、記載された論理ステップの幾つかを同時に実行することができることは明らかである。
図6は、同期はずれの検出を実行する間、ベースレイヤのフレームとエンハンスメントレイヤのフレームを復号化する対応するデコーダを示す。デコーダは、2つの個別のビットストリーム、たとえばMP3ビットストリーム101及びエンハンスメントレイヤのビットストリーム102を受信する。次いで、両方のビットストリームは、部分的に復号化(110,120)、すなわちエントロピー復号化される。用語「部分的な」復号化は、この復号化の結果が意図された最終的なオーディオ信号ではない事実を示す。代わりに、部分的な復号化の結果は、それぞれ、MP3ビットストリームについて復号化されたMP3ビン115及びエンハンスメントレイヤについて復号化された整数のMDCT残差ビン125である。整数のMDCT残差ビン125は、(損失の多い)MP3符号化前の本来のオーディオ値が取得されるように、MP3ビンをエンハンスするために使用することができる。したがって、エンハンスメントレイヤのデータにより、損失の多いMP3データに基づいて、損失の多いオーディオデータの符号化を取得することができる。
部分的に復号化されたビットストリーム115,125の両者は、整数値として表現される。同期エラーの検出160のため、1つのハッシュ値145が2つのパーシャルデコーダ110,120の結果115,125から計算される。この例では、MP3スペクトルからの全ての周波数ビンに整数のMDCT残差のスペクトルからの全ての周波数ビンを加えた整数の合計をシンプルに加えることで、ハッシュ値145が計算される。信号スペクトルが非ゼロである場合、通常の場合のように、この合計の幾つかの最下位ビット(LSB)における切り捨てられたハッシュ値は、フレームからフレームへと相関関係のない擬似ランダム値を表す。他の実施の形態では、所定の値のみを加算するか、又はリニアフィードバックシフトレジスタに基づいたCRCのような方法を使用して、ハッシュを計算するための他の方法を使用することができる。
並行して、エンハンスメントレイヤの表現の符号化されたサブビットストリームを完了するパディングビットが抽出される(150)。抽出されたパディングビット152に加えて、検出されたパディングビット151の数は、次の処理ステップに送出される。
実際のエラーチェックは、エンハンスメントレイヤのサブビットストリーム102から採取されたハッシュ値152のLSBを、局所的に復号化されたスペクトル115,125から計算されたハッシュ値の対応するLSBと比較して(160)行われる。比較が違いを示す場合、最終的な復号化ブロック130に同期はずれを指示するため、エラー指示フラグ165が立てられる。
残りの最終的な復号化130は、2つの部分的に復号化された信号スペクトル、すなわちMP3ビン115及びMDCT残差125を結合し、デコーダのオーディオ出力信号135を生成する。上述されたようにエラー指示フラグ165が立てられた場合、デコーダは、同期はずれの状況に対処するために適切な措置を取る。たとえば、復号化プロセスが完全に停止されるか、又はデコーダがベースレイヤのみの復号化のモードに入り、それによりエンハンスメントレイヤからの非同期の情報を無視する場合がある。
好ましくは、本発明は、階層的又はスケーラブルなオーディオ圧縮に関する。特に、本発明は、階層的なビットストリームの異なるレイヤが異なるトランスポートチャネルを介して伝送されるか又は個別の物理的な位置に記憶されるビットストリームフォーマットについて有効である。たとえば、階層的な符号化されたオーディオ信号のサブビットストリームの少なくとも大部分があるファイルにおける異なる位置に記憶された場合、又はストレージからの伝送又は検索の間に、異なるサブビットストリームが伝送又はストレージのエラーのために同期から抜け出る場合に役に立つ。本発明は、短時間における係る状況の保証された検出を可能にし、適切な措置を取ることを可能にする。
本発明は、同期の問題に対する他の既知の解決策よりも有利な点を有する。たとえば、更なるデータは送信される必要がないように、同期パターン又はタイムスタンプをエンハンスメントレイヤのサブビットストリームのブロックと連続的に送出する必要がない。
しかし、ベースレイヤについて、たとえばMPEG-1レイヤIII(MP3)におけるように、ビットストリームのそれぞれのブロック又は信号フレームと共に同期パターンを送出することが必要とされる場合がある。MP3では、それぞれのフレームヘッダは、12個の数字の1からなる固定されたパターンで開始する。このパターンは、後続するヘッダ情報の妥当性チェックと共に、デコーダが1つのビットストリームに同期された状態を保持することを可能にする。しかし、異なるサブビットストリームの同期は、固定された同期パターンを使用することで達成することができない。本発明は、上位レイヤ及び下位レイヤの時間的に対応するフレームからCRC又はハッシュ値を計算することで、この問題を一般的に解決する。これにより、前記上位レイヤと、共通の復号化に寄与する全ての下位レイヤとの間で強いリンクが構築される。
本発明の別の利点は、符号化されたビットストリームを通してCRC値を計算/チェックする従来の方法とは対照的に、CRC又はハッシュ値がサブビットストリームから到来する個々に部分的に復号化された情報から計算されることである。これは、異なる考え方を反映している。典型的に、CRCは、ビットの伝送/記憶をプロテクトするために適用される一方で、本発明では、整数のパラメータのビットレベルの精度の伝送/記憶/復号化をプロテクトするため、CRC/ハッシュ値が適用される。本発明の別の利点は、前記CRC/ハッシュ値を送信するために必要とされる余分の情報が、バイトの境界で後続するフレームを開始するため、それぞれのフレームの境界に付加されるパディングビットに記憶されることである。利用可能なパディングビットの量は可変であって且つ予測可能ではないが、同期はずれの検出のために、平均して短い反応時間を設けることで十分である。
更なる利点は、エラーチェックが復号化プロセスの一部を包含することである。すなわち、ビットストリームが揃えられるチェックに加えて、部分的な復号化のプロセスがビットレベルで正確であること、すなわちビットレベルで同期していることをチェックする。
また、本発明は、以下の利点を有する。
本発明は、同期パターンの必要なしに、可変のビットレートの符号化スキームと適用される。従って、本発明は、非常に高い圧縮効率を得ることができる。
それぞれのフレームについてパディングビットにCRC/ハッシュ情報を記憶することのため、余分のビットレートが必要とされない。
本発明によれば、全てのサブビットストリームの同期又は正しい受信を連続して追跡することが必要とされない。エラーチェックは、それぞれの信号フレームについて独立に計算することができる。
先の例はオーディオ信号に関するものであるが、本発明の一般的な考えは、たとえばビデオといった各種の信号を表す階層的なビットストリームに一般的に適用可能である。同様に、ベースレイヤストリーム又は他のエンハンスメントレイヤストリームの何れかと同期される必要がある更なるエンハンスメントレイヤストリームについて本発明を適用することができる(たとえば、2番目のELストリームは、1番目のELストリームに同期されるか、又はそれらのそれぞれは、BLストリームに同期される場合がある)。さらに、3以上のストリーム間で同時に同期を検出するために本発明を適用することができる。
本発明の1態様では、BLビットストリームとBLビットストリームに関連するエンハンスメントレイヤのビットストリームとを有するオーディオ又はビデオ信号を符号化する装置が開示される、BLデータ及びエンハンスメントレイヤのデータは、パケットで構成される。BLビットストリームのパケットは、ELビットストリームの対応するパケットを有する。
当該装置は、以下の構成要素を有する。BLビットストリームのパケットと、ELビットストリームのパケットとからチェックサムを計算する計算手段。BLビットストリームのパケットをエントロピー符号化するBLエントロピーエンコーダ。エントロピー符号化された、同期ワードで開始するバイト単位で揃えられた(byte-aligned)BLパケットが生成される。可変長符号化方法を使用してELビットストリームのパケットをエントロピー符号化するELエントロピーコーダ。ヘッダを持たず、且つ同期ワードで開始しないエントロピー符号化されたELパケットが生成される。符号化されたELパケットをバイトにマッピングするマッピング手段。符号化されたELパケットの最後のバイトにおいて、ビット数Nはパディングビットである。符号化されたELパケットの最後のバイトにおけるパディングビットの量Nを決定する決定手段。前記計算されたチェックサムのNの最下位ビットを抽出する抽出手段。Nは、決定されたパディングビットの量に等しい。符号化されたパケットの終了でパディングビットに計算されたチェックサムの抽出されたNの最下位ビットを挿入する挿入手段。挿入されたチェックサムのビットを含む符号化されたELパケット、及び符号化されたBLパケットを供給又は出力する手段。
本発明の1態様では、符号化装置は、符号化されたBLビットストリーム及び符号化されたELビットストリームをファイルに記憶する手段を更に有する。BLパケットは、ファイルの第一の部分において互いに隣接して記憶され、ELパケットは、ファイルの後続する第二の部分において互いに隣接して記憶される。
本発明の別の態様では、BLビットストリーム及び対応するELビットストリームを有するオーディオ又はビデオ信号を復号化する装置が開示される。ELビットストリームは、BLビットストリームの向上された復号化のための可変長符号化パラメータを有する。
当該装置は、以下の構成要素を有する。BLビットストリームの一部を部分的に復号化するBLパーシャルデコーダ。第一の復号化されたBLパケットが生成される。ELビットストリームの一部を部分的に復号化するELパーシャルデコーダ。BLビットストリームの向上された復号化のための復号化パラメータが生成される。ELビットストリームの前記部分においてパディングビットの数Nを決定する手段。パディングビットを抽出及び/又は記憶する手段。ELビットストリームの部分的に復号化された部分からの第一の復号化されたBLパケット及び前記復号化パラメータからチェックサムを計算する計算手段。Nを決定されたパディングビットの量に等しい数として、計算されたチェックサムの抽出されたNの最下位ビットをNの抽出されたパディングビットと比較し、両者が等しくない場合にエラーの指示を供給する比較手段。計算されたチェックサムの抽出されたNの最下位ビット及びNの抽出されたパディングビットが前記エラーの指示に従って等しい場合、部分的に復号化されたBLビットストリームを復号化し、このときBLビットストリームの向上された復号化のための前記復号化パラメータが使用され、さもなければ簡略化された復号化を使用して部分的に復号化されたBLビットストリームを復号化する復号化手段であって、このときELビットストリームからのデータが使用されない。
なお、本発明は例示により記載されたが、本発明の範囲から逸脱することなしに、詳細の変更が行われることを理解されたい。
発明の詳細な説明及び(必要に応じて)特許請求の範囲及び図面に開示されるそれぞれの特徴は、独立して提供されるか又は任意の組み合わせで提供される場合がある。必要に応じて、特徴は、ハードウェア、ソフトウェア又は両者の組み合わせで実現される場合がある。必要に応じて、接続は、必ずしも直接又は専用の接続である必要はないが、無線接続又は有線接続として実現される場合がある。特許請求の範囲で現れる参照符号は、例示のみであり、特許請求の範囲に限定的な影響を有さない。

Claims (15)

  1. ベースレイヤのビットストリーム及び該ベースレイヤのビットストリームに関連するエンハンスメントレイヤのビットストリームを有するオーディオ又はビデオ信号を符号化する方法であって、
    前記ベースレイヤのデータ及びエンハンスメントレイヤのデータはパケットで構成され、前記ベースレイヤのビットストリームのパケットは、前記エンハンスメントレイヤのビットストリームの対応するパケットを有し、
    当該方法は、
    前記ベースレイヤのビットストリームのパケットと前記エンハンスメントレイヤのビットストリームの対応するパケットとからチェックサムを計算するステップと、
    前記ベースレイヤのビットストリームのパケットをエントロピー符号化するステップと、同期ワードで開始する、エントロピー符号化された、バイト単位で揃えられたベースレイヤのパケットが得られ、
    可変長符号化を使用して前記エンハンスメントレイヤのビットストリームのパケットをエントロピー符号化するステップと、ヘッダをもたず且つ同期ワードで開始しないエントロピー符号化されたエンハンスメントレイヤのパケットが得られ、
    前記符号化されたエンハンスメントレイヤのパケットをバイトにマッピングするステップと、それぞれのバイトは固定されたビット数を有し、前記符号化されたエンハンスメントレイヤのパケットの最終バイトにおいて、ビットの数Nがパディングビットであり、
    前記符号化されたエンハンスメントレイヤのパケットの最終バイトにおける前記パディングビットの量Nを決定するステップと、
    前記計算されたチェックサムのNの最下位ビットを抽出するステップと、Nは、決定されたパディングビットの量に等しく、
    計算されたチェックサムの抽出されたNの最下位ビットを、前記符号化されたエンハンスメントレイヤのパケットの終わりにある前記パディングビットに挿入するステップと、
    挿入されたチェックサムビットを含む前記符号化されたエンハンスメントレイヤのパケット及び前記符号化されたベースレイヤのパケットとを出力するステップと、
    を含むことを特徴とする方法。
  2. 1つの先頭の同期ワードと複数の前記符号化されたエンハンスメントレイヤのパケットとにより、パケット又はフレームヘッダのような更なる構造的なデータをもたない符号化されたエンハンスメントレイヤのビットストリームが形成される、
    請求項1記載の方法。
  3. 前記エントロピー符号化の前に、前記ベースレイヤのビットストリーム及び前記エンハンスメントレイヤのビットストリームは整数の値を有し、
    前記チェックサムを計算するステップは、エントロピー符号化の前に前記整数の値を合計する、
    請求項1又は2記載の方法。
  4. 前記エンハンスメントレイヤのビットストリームのパケットは、Golombコードを使用して符号化される、
    請求項1乃至3の何れか記載の方法。
  5. 符号化されたエンハンスメントレイヤのパケット当たりのパディングビットの数Nは、バイトのビット数未満である変数であり、切り上げ又は四捨五入したとき、平均してバイトのビット数の2分の1である、
    請求項1乃至4の何れか記載の方法。
  6. 前記ベースレイヤのビットストリームは、MP3フォーマットのオーディオデータを含み、前記エンハンスメントレイヤのビットストリームは、前記ベースレイヤのビットストリームの前記MP3フォーマットのオーディオデータの改善された復号化に適したMDCT残差を含む、
    請求項1乃至5の何れか記載の方法。
  7. 前記符号化されたベースレイヤのビットストリーム及び前記符号化されたエンハンスメントレイヤのビットストリームをファイルに記憶するステップを更に含み、
    前記ベースレイヤのパケットは、前記ファイルの第一の部分において互いに隣接して記憶され、前記エンハンスメントレイヤのパケットは、前記ファイルの後続する第二の部分に互いに隣接して記憶される、
    請求項1乃至6の何れか記載の方法。
  8. ベースレイヤのビットストリーム及び対応するエンハンスメントレイヤを有するオーディオ又はビデオ信号を復号化する方法であって、
    前記エンハンスメントレイヤのビットストリームは、前記ベースレイヤのビットストリームの向上された復号化のための可変長符号化パラメータを含み、
    当該方法は、
    前記ベースレイヤのビットストリームの一部を部分的に復号化するステップと、第一の復号化されたベースレイヤのパケットが得られ、
    前記エンハンスメントレイヤのビットストリームの一部を部分的に復号化するステップと、前記ベースレイヤのビットストリームの改善された復号化のための復号化パラメータが得られ、
    前記エンハンスメントレイヤのビットストリームの前記一部におけるパディングビットの数Nを決定し、前記パディングビットを抽出及び/又は記憶するステップと、
    前記第一の復号化されたベースレイヤのパケットと、前記エンハンスメントレイヤのビットストリームの部分的に復号化された部分からの前記復号化パラメータとに基づいてチェックサムを計算するステップと、
    Nを決定されたパディングビットの量に等しい数であるとして、計算されたチェックサムの抽出されたNの最下位ビットをNの抽出されたパディングビットと比較するステップと、
    両者が等しい場合、前記ベースレイヤのビットストリームの改善された復号化のための前記復号化パラメータを使用して前記部分的に復号化されたベースレイヤのビットストリームを復号化し、両者が等しくない場合、簡易化した復号化を使用して前記部分的に復号化されたベースレイヤのビットストリームを復号化するステップとを含み、前記エンハンスメントレイヤのビットストリームからのデータは使用されない、
    ことを特徴とする方法。
  9. 前記パディングビットの数Nを決定するステップは、
    前記ベースレイヤのビットストリームの前記部分的に復号化された部分におけるコードワードの数を決定するステップと、
    前記可変長符号化されたエンハンスメントレイヤのビットストリームの一部からの対応する数のコードワードを復号化するステップと、
    前記エンハンスメントレイヤのビットストリームの一部の最終バイトのうちの残りのビットを前記Nのパディングビットとなるように決定するステップと、
    を含む請求項8記載の方法。
  10. 前記エンハンスメントレイヤのビットストリームは、それぞれのベースレイヤのパケットについて、予め決定された数の復号化パラメータを含む、
    請求項8又は9記載の方法。
  11. 第一の部分と第二の部分とを有する符号化されたオーディオ/ビデオ信号であって、
    前記第一の部分は、ベースレイヤのオーディオ/ビデオビットストリームのバイト単位で揃えられたエントロピー符号化されたパケットを含み、
    前記第二の部分は、可変長符号化されたエンハンスメントレイヤのデータを含むバイト単位で揃えられたエントロピー符号化されたエンハンスメントレイヤのパケットを含み、
    前記ベースレイヤのパケットは、同期情報をもつヘッダを含み、
    前記エンハンスメントレイヤのパケットは、同期情報をもつヘッダを含まず、
    それぞれのエンハンスメントレイヤのパケットは、対応するベースレイヤパケットの改善された復号化に適した符号化パラメータを含み、
    エンハンスメントレイヤのパケットの最終バイトは、パディングビットの数Nを含み、
    前記パディングビットは、エントロピー符号化前に、前記エンハンスメントレイヤのパケットと対応するベースレイヤのパケットとによるチェックサムのうちのN個のLSBを含む、
    ことを特徴とする信号。
  12. 前記ベースレイヤのオーディオ/ビデオビットストリーム及びエンハンスメントレイヤのビットストリームは整数値を有し、前記チェックサムは、前記整数値の合計である、
    請求項11記載の信号。
  13. ベースレイヤのビットストリームと該ベースレイヤのビットストリームに関連するエンハンスメントレイヤのビットストリームとを有するオーディオ又はビデオ信号を符号化する装置であって、
    前記ベースレイヤデータ及び前記エンハンスメントデータは、パケットで構成され、前記ベースレイヤのビットストリームのパケットは、前記エンハンスメントレイヤのビットストリームの対応するパケットを有し、
    当該装置は、
    前記ベースレイヤのビットストリームのパケットと前記エンハンスメントレイヤのビットストリームの対応するパケットとからチェックサムを計算する計算手段と、
    前記ベースレイヤのビットストリームのパケットをエントロピー符号化するベースレイヤエントロピーエンコーダと、同期ワードで開始する、エントロピー符号化された、バイト単位で揃えられたベースレイヤのパケットが生成され、
    可変長符号化を使用して前記エンハンスメントレイヤのビットストリームのパケットをエントロピー符号化するエンハンスメントレイヤのエントロピーエンコーダと、ヘッダをもたず且つ同期ワードで開始しないエントロピー符号化されたエンハンスメントレイヤのパケットが生成され、
    前記符号化されたエンハンスメントレイヤのパケットをバイトにマッピングするマッピング手段と、それぞれのバイトは固定されたビット数を有し、前記符号化されたエンハンスメントレイヤのパケットの最終バイトにおいて、ビットの数Nがパディングビットであり、
    前記符号化されたエンハンスメントレイヤのパケットの最終バイトにおける前記パディングビットの量Nを決定する決定手段と、
    前記計算されたチェックサムのNの最下位ビットを抽出する抽出手段と、Nは、決定されたパディングビットの量に等しく、
    計算されたチェックサムの抽出されたNの最下位ビットを、前記符号化されたエンハンスメントレイヤのパケットの終わりにある前記パディングビットに挿入する挿入手段と、
    挿入されたチェックサムビットを含む前記符号化されたエンハンスメントレイヤのパケット及び前記符号化されたベースレイヤのパケットとを出力する出力手段と、
    を有することを特徴とする装置。
  14. 前記符号化されたベースレイヤのビットストリーム及び前記符号化されたエンハンスメントレイヤのビットストリームをファイルに記憶する記憶手段を更に有し、
    前記ベースレイヤのパケットは、前記ファイルの第一の部分において互いに隣接して記憶され、前記エンハンスメントレイヤのパケットは、前記ファイルの後続する第二の部分に互いに隣接して記憶される、
    請求項13記載の装置。
  15. ベースレイヤのビットストリーム及び対応するエンハンスメントレイヤを有するオーディオ又はビデオ信号を復号化する装置であって、
    前記エンハンスメントレイヤのビットストリームは、前記ベースレイヤのビットストリームの向上された復号化のための可変長符号化パラメータを含み、
    当該装置は、
    前記ベースレイヤのビットストリームの一部を部分的に復号化するベースレイヤのパーシャルデコーダと、第一の復号化されたベースレイヤのパケットが生成され、
    前記エンハンスメントレイヤのビットストリームの一部を部分的に復号化するエンハンスメントレイヤのパーシャルデコーダと、前記ベースレイヤのビットストリームの改善された復号化のための復号化パラメータが生成され、
    前記エンハンスメントレイヤのビットストリームの前記一部におけるパディングビットの数Nを決定する手段、前記パディングビットを抽出及び/又は記憶する手段と、
    前記第一の復号化されたベースレイヤのパケットと、前記エンハンスメントレイヤのビットストリームの部分的に復号化された部分からの前記復号化パラメータとに基づいてチェックサムを計算する計算手段と、
    Nを決定されたパディングビットの量に等しい数であるとして、計算されたチェックサムの抽出されたNの最下位ビットをNの抽出されたパディングビットと比較し、両者が等しくない場合に、エラーの指示を供給する比較手段と、
    前記計算されたチェックサムの抽出されたNの最下位ビットと前記Nの抽出されたパディングビットとが等しい場合、前記部分的に復号化されたベースレイヤのビットストリームを復号化する復号化手段と、前記ベースレイヤのビットストリームの改善された復号化のための前記復号化パラメータが使用され、
    前記復号化手段は、前記計算されたチェックサムの抽出されたNの最下位ビットと前記Nの抽出されたパディングビットとが等しくない場合、簡易化した復号化を使用して前記部分的に復号化されたベースレイヤのビットストリームを復号化し、前記エンハンスメントレイヤのビットストリームからのデータは使用されない、
    ことを特徴とする方法。
JP2011517894A 2008-07-16 2009-07-14 高度に圧縮されたエンハンスメントレイヤのデータを同期させる方法及び装置 Expired - Fee Related JP5314757B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08160549A EP2146343A1 (en) 2008-07-16 2008-07-16 Method and apparatus for synchronizing highly compressed enhancement layer data
EP08160549.5 2008-07-16
PCT/EP2009/058944 WO2010007037A1 (en) 2008-07-16 2009-07-14 Method and apparatus for synchronizing highly compressed enhancement layer data

Publications (2)

Publication Number Publication Date
JP2011528130A true JP2011528130A (ja) 2011-11-10
JP5314757B2 JP5314757B2 (ja) 2013-10-16

Family

ID=39816809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011517894A Expired - Fee Related JP5314757B2 (ja) 2008-07-16 2009-07-14 高度に圧縮されたエンハンスメントレイヤのデータを同期させる方法及び装置

Country Status (14)

Country Link
US (2) US8462702B2 (ja)
EP (3) EP2146343A1 (ja)
JP (1) JP5314757B2 (ja)
KR (1) KR20110052632A (ja)
CN (1) CN102160378B (ja)
BR (1) BRPI0916619A2 (ja)
CA (1) CA2730468A1 (ja)
ES (1) ES2430241T3 (ja)
MX (1) MX2011000527A (ja)
PL (1) PL2301025T3 (ja)
RU (1) RU2510918C2 (ja)
TW (1) TWI449032B (ja)
WO (1) WO2010007037A1 (ja)
ZA (1) ZA201100381B (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8077990B2 (en) 2006-04-28 2011-12-13 Pixsense Inc. Efficient content compression and decompression system and method
EP1881485A1 (en) * 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
KR101313952B1 (ko) * 2008-06-23 2013-10-01 픽스센스 인코포레이티드 부호화된 데이터의 압축 이득을 위한 피압축 도메인 시스템 및 방법
US8589999B1 (en) * 2009-08-11 2013-11-19 Arris Solutions, Inc. Methods and systems for splicing between media streams
US8873582B2 (en) 2010-04-08 2014-10-28 Lg Electronics Inc. Method for transmitting PPDU in wireless local area network and apparatus for the same
EP2395505A1 (en) * 2010-06-11 2011-12-14 Thomson Licensing Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer
MY198882A (en) 2011-07-15 2023-10-02 Ge Video Compression Llc Sample array coding for low-delay
EP2805504A1 (en) * 2012-01-18 2014-11-26 Luca Rossato Distinct encoding and decoding of stable information and transient/stochastic information
US8639057B1 (en) 2012-03-19 2014-01-28 The Modern Video Company Artifact removal method and system for contoured images and video
CN103748628B (zh) * 2012-07-02 2017-12-22 索尼公司 解码装置和方法以及编码装置和方法
CA2843226A1 (en) 2012-07-02 2014-01-09 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
CA2979245C (en) * 2013-01-29 2019-10-15 Martin Dietz Concept for coding mode switching compensation
US10057250B2 (en) * 2013-05-14 2018-08-21 Kara Partners Llc Technologies for enhancing computer security
US10594687B2 (en) 2013-05-14 2020-03-17 Kara Partners Llc Technologies for enhancing computer security
US12028333B2 (en) 2013-05-14 2024-07-02 Kara Partners Llc Systems and methods for variable-length encoding and decoding for enhancing computer systems
US12375477B2 (en) 2013-05-14 2025-07-29 Kara Partners Llc Systems and methods for variable-length encoding and decoding for enhancing computer systems
US10015506B2 (en) 2013-05-20 2018-07-03 Cinova Media Frequency reduction and restoration system and method in video and image compression
US8959414B2 (en) * 2013-06-13 2015-02-17 Lsi Corporation Systems and methods for hybrid layer data decoding
ITMI20131824A1 (it) * 2013-11-04 2015-05-05 St Microelectronics Srl Metodo di identificare un messaggio conforme allo standard ota (over the air) ed affetto da errore
US20150256842A1 (en) * 2014-03-07 2015-09-10 Silicon Image, Inc. Compressed Video Transfer over a Multimedia Link
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
US10462477B2 (en) 2015-02-25 2019-10-29 Cinova Media Partial evaluator system and method
KR20240058992A (ko) * 2015-10-08 2024-05-03 돌비 인터네셔널 에이비 압축된 사운드 또는 음장 표현들에 대한 계층화된 코딩
US10460700B1 (en) 2015-10-12 2019-10-29 Cinova Media Method and apparatus for improving quality of experience and bandwidth in virtual reality streaming systems
CN106791863B (zh) * 2015-11-19 2019-07-16 浙江大华技术股份有限公司 一种svc视频数据的存储方法及装置
US12212751B1 (en) 2017-05-09 2025-01-28 Cinova Media Video quality improvements system and method for virtual reality
US10944971B1 (en) 2017-05-22 2021-03-09 Cinova Media Method and apparatus for frame accurate field of view switching for virtual reality
KR102777347B1 (ko) * 2018-11-30 2025-03-05 삼성전자주식회사 이미지 처리 장치 및 프레임 버퍼 컴프레서
WO2020164752A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs
CN114902685B (zh) * 2019-10-15 2024-03-22 交互数字Ce专利控股有限公司 用于发送和接收视频的方法和装置
US11095311B2 (en) * 2019-11-27 2021-08-17 Qualcomm Incorporated Quantization codeword selection for low cost parity checking
CN113596915A (zh) * 2020-04-30 2021-11-02 华为技术有限公司 一种通信方法及装置
US11348594B2 (en) * 2020-06-11 2022-05-31 Qualcomm Incorporated Stream conformant bit error resilience
CN111510509B (zh) * 2020-06-15 2020-12-08 佛山市睿宝智能科技有限公司 针织机选针器的数据通讯方法、存储介质和针织机

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10126389A (ja) * 1995-09-29 1998-05-15 Toshiba Corp 符号化装置および復号化装置
JPH10200921A (ja) * 1997-01-10 1998-07-31 Sony Corp デジタルデータ伝送方法、データ記録再生装置、データ編集装置
JP2001320422A (ja) * 2000-03-03 2001-11-16 Ntt Docomo Inc ヘッダ圧縮を伴うパケット伝送のための方法および装置
JP2007520918A (ja) * 2003-11-28 2007-07-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビットストリームを符号化又は復号化するための方法及び装置
JP2009544054A (ja) * 2006-07-18 2009-12-10 トムソン ライセンシング 非可逆符号化信号のビットストリーム・データ及び上記信号の可逆拡張符号化データのオーディオ・ビットストリーム・データ構造配置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3132456B2 (ja) * 1998-03-05 2001-02-05 日本電気株式会社 階層的画像符号化方式、及び階層的画像復号方式
US6816194B2 (en) 2000-07-11 2004-11-09 Microsoft Corporation Systems and methods with error resilience in enhancement layer bitstream of scalable video coding
EP1308931A1 (de) 2001-10-23 2003-05-07 Deutsche Thomson-Brandt Gmbh Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist
GB2391413B (en) 2002-07-31 2004-08-25 Motorola Inc Object-based scalable video transmissions
US7188250B1 (en) 2002-12-13 2007-03-06 Nvidia Corporation Method and apparatus for performing network processing functions
KR100605906B1 (ko) * 2004-08-02 2006-08-01 삼성전자주식회사 위치 정보를 포함한 디지털 방송 신호를 이용하는 디지털방송 시스템 및 그 방법
KR100662350B1 (ko) 2004-08-23 2007-01-02 엘지전자 주식회사 영상 전송 장치 및 방법
KR100664929B1 (ko) * 2004-10-21 2007-01-04 삼성전자주식회사 다 계층 기반의 비디오 코더에서 모션 벡터를 효율적으로압축하는 방법 및 장치
KR100763178B1 (ko) 2005-03-04 2007-10-04 삼성전자주식회사 색 공간 스케일러블 비디오 코딩 및 디코딩 방법, 이를위한 장치
EP2555187B1 (en) * 2005-10-12 2016-12-07 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding audio data and extension data
KR100763196B1 (ko) 2005-10-19 2007-10-04 삼성전자주식회사 어떤 계층의 플래그를 계층간의 연관성을 이용하여부호화하는 방법, 상기 부호화된 플래그를 복호화하는방법, 및 장치
TWI276047B (en) * 2005-12-15 2007-03-11 Ind Tech Res Inst An apparatus and method for lossless entropy coding of audio signal
CN101043619A (zh) * 2006-03-24 2007-09-26 华为技术有限公司 视频编码的误差控制系统和方法
US7941727B2 (en) 2006-10-31 2011-05-10 Hewlett-Packard Development Company, L.P. Checksum generator for variable-length data
US20080101476A1 (en) 2006-11-01 2008-05-01 Qualcomm Incorporated Video coding rate adaptation to reduce packetization overhead
US8630355B2 (en) * 2006-12-22 2014-01-14 Qualcomm Incorporated Multimedia data reorganization between base layer and enhancement layer
US20080152006A1 (en) * 2006-12-22 2008-06-26 Qualcomm Incorporated Reference frame placement in the enhancement layer

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10126389A (ja) * 1995-09-29 1998-05-15 Toshiba Corp 符号化装置および復号化装置
JPH10200921A (ja) * 1997-01-10 1998-07-31 Sony Corp デジタルデータ伝送方法、データ記録再生装置、データ編集装置
JP2001320422A (ja) * 2000-03-03 2001-11-16 Ntt Docomo Inc ヘッダ圧縮を伴うパケット伝送のための方法および装置
JP2007520918A (ja) * 2003-11-28 2007-07-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビットストリームを符号化又は復号化するための方法及び装置
JP2009544054A (ja) * 2006-07-18 2009-12-10 トムソン ライセンシング 非可逆符号化信号のビットストリーム・データ及び上記信号の可逆拡張符号化データのオーディオ・ビットストリーム・データ構造配置

Also Published As

Publication number Publication date
KR20110052632A (ko) 2011-05-18
EP2146343A1 (en) 2010-01-20
CN102160378A (zh) 2011-08-17
US8995348B2 (en) 2015-03-31
MX2011000527A (es) 2011-03-29
JP5314757B2 (ja) 2013-10-16
US20110103445A1 (en) 2011-05-05
EP2301025A1 (en) 2011-03-30
ZA201100381B (en) 2012-03-28
RU2510918C2 (ru) 2014-04-10
RU2011105660A (ru) 2012-08-27
BRPI0916619A2 (pt) 2018-07-31
CN102160378B (zh) 2013-06-26
CA2730468A1 (en) 2010-01-21
EP2301025B1 (en) 2013-09-04
US8462702B2 (en) 2013-06-11
PL2301025T3 (pl) 2013-12-31
TWI449032B (zh) 2014-08-11
EP2355095A3 (en) 2012-11-14
TW201005731A (en) 2010-02-01
US20130215972A1 (en) 2013-08-22
WO2010007037A1 (en) 2010-01-21
EP2355095A2 (en) 2011-08-10
ES2430241T3 (es) 2013-11-19

Similar Documents

Publication Publication Date Title
JP5314757B2 (ja) 高度に圧縮されたエンハンスメントレイヤのデータを同期させる方法及び装置
JP3597647B2 (ja) 符号化方法及び装置
CN100593294C (zh) 译码装置和译码方法
CN1913425B (zh) 译码装置和译码方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130625

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130705

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees