[go: up one dir, main page]

JP2008170488A - 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法 - Google Patents

波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法 Download PDF

Info

Publication number
JP2008170488A
JP2008170488A JP2007000874A JP2007000874A JP2008170488A JP 2008170488 A JP2008170488 A JP 2008170488A JP 2007000874 A JP2007000874 A JP 2007000874A JP 2007000874 A JP2007000874 A JP 2007000874A JP 2008170488 A JP2008170488 A JP 2008170488A
Authority
JP
Japan
Prior art keywords
mode
residual code
waveform data
waveform
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007000874A
Other languages
English (en)
Inventor
Masatsugu Okazaki
雅嗣 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007000874A priority Critical patent/JP2008170488A/ja
Priority to US11/965,539 priority patent/US8706506B2/en
Priority to EP08100017A priority patent/EP1942490A1/en
Publication of JP2008170488A publication Critical patent/JP2008170488A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • G10H7/08Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform
    • G10H7/12Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform by means of a recursive algorithm using one or more sets of parameters stored in a memory and the calculated amplitudes of one or more preceding sample points
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/541Details of musical waveform synthesis, i.e. audio waveshape processing from individual wavetable samples, independently of their origin or of the sound they represent
    • G10H2250/571Waveform compression, adapted for music synthesisers, sound banks or wavetables
    • G10H2250/581Codebook-based waveform compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

【課題】 波形データの各部において最適な量子化方式、その他の条件を選択しつつ波形データを圧縮する。
【解決手段】 量子化&正規化部62は、複数の候補モードの中から圧縮率の高いものから順番に試行モードを選択し、元波形サンプルSnを残差符号に変換する。逆量子化&逆正規化部66、加算器65は、この残差符号から復元波形サンプル◇Xnを生成する。モード解析部68は、Snに対する◇XnのS/N比が許容値以下であるか否かを判定し、S/N比が許容値を超えると判定すると、量子化&正規化部62に対して次の試行モードを選択させる。そして、◇XnのS/N比が許容値以下になると、残差符号等をフレーム詰込部90に送り、フレームを構成させる。
【選択図】 図4

Description

本発明は、波形データを圧縮する波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法に関するものである。
電子楽器等に用いられる波形メモリに波形データを記録する際、波形データを圧縮することにより波形メモリの容量を削減する技術が知られている。波形データを圧縮する方式としては、スカラー量子化方式と、ベクトル量子化方式とが知られている。スカラー量子化方式は、波形データの瞬時値の「1」サンプルを圧縮データの「1符号」に対応させるものであり、ベクトル量子化方式は、波形データの瞬時値の複数サンプルを圧縮データの「1符号」に対応させるものである。
従来の波形メモリ音源においては、採用される量子化方式はスカラー量子化方式であって、ベクトル量子化方式を採用したものは無かった。これは、楽器音の波形データは、波形の特徴が刻々と変化するため、波形データ全体に渡って共通する特徴(瞬時値相互間の相関性)を見い出すことが困難であり、ベクトル量子化方式を採用しても圧縮率を向上できる利点を得にくいためであった。例えば、特許文献1においては、波形圧縮装置により波形データをフレーム単位で線形予測圧縮して、スカラー量子化方式の圧縮波形データを得て、この圧縮波形データを波形メモリに記憶してなる波形メモリ音源が開示されている。
特開2004−294491号公報
ところで、波形メモリ音源に用いられる波形データを圧縮することは、圧縮率を高めることによって得られる経済効果は非常に大きい。すなわち、波形メモリ音源において波形データを記録するROMは、同じ物が大量に生産されるため、各波形データのデータ量を僅かでも削減させることができれば、全体としては大きな経済的効果が得られる。
その一方、音源用の波形データを圧縮するにあたっては、リアルタイム性が求められないという特徴がある。すなわち、音源用の波形データを圧縮する際には、元波形データの時間長を超える時間を費やして圧縮処理を行ったとしても、特に支障は生じない。
かかる事情に鑑みれば、音源用の波形データを圧縮する場合には、たとえ時間を費やしたとしても、最もデータ量を削減できるモードを探索できるようにすることが望ましい。
また、音源用の波形データとして記録される楽器音を観察すると、波形が乱れるアタック部においては、サンプル値相互間の相関性が低くなる一方、波形が安定する定常部においては、サンプル値相互間の相関性が高くなる傾向がある。しかも、これらの傾向は楽器の種類によっても大きく異なる。従って、楽器音をフレーム単位で圧縮して記録するにあたっては、ある量子化方式またはモードを固定的に適用するのではなく、最適な量子化方式をフレーム毎に採用することが望ましいと考えられる。また、ベクトル量子化方式を採用する場合には、コードブック等もフレーム毎に最適なものを適用することがより望ましいと考えられる。
この発明は上述した事情に鑑みてなされたものであり、波形データの各部において最適な量子化方式、その他の条件を選択しつつ波形データを圧縮できる波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法を提供することを目的としている。
上記課題を解決するため本発明にあっては、下記構成を具備することを特徴とする。なお、括弧内は例示である。
請求項1記載の波形圧縮装置にあっては、元波形データ(Sn)を、残差符号(Lm)と該残差符号(Lm)の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データに変換する波形圧縮装置において、前記残差符号(Lm)を得るための複数の候補モードのうち、 未だ試行モードとして選択されていない候補モードの中から最も圧縮率の高い候補モードを試行モードとして選択する 試行モード決定手段(81)と、決定された前記試行モードに従って、前記元波形データのうち該試行モードに 対応する量のデータを圧縮し、該試行モードに対応する 残差符号(Lm)を生成する 波形データ圧縮手段(84)と、前記残差符号(Lm)を復元することにより、 復元波形データ(◇Xn)を生成する 波形データ復元手段(66)と、前記復元波形データ(◇Xn)が前記元波形データ(Sn)に対して 有する量子化誤差の評価値(S/N比)を測定し、該評価値が所定の許容値以下であるか否か を判定する判定手段(68,SP8)と、前記判定手段(68,SP8)における判定結果が否定的であったことを条件として、 前記試行モード決定手段(81)に対して新たな試行モードを選択させる モード調整指令を出力する モード調整指令手段(68,SP16)と、前記判定手段(68,SP8)における判定結果が肯定的であったことを条件として、 前記残差符号と、前記試行モードを特定する副情報とを 前記フレームに格納する フレーム格納手段(90)とを有することを特徴とする。
さらに、請求項2記載の構成にあっては、請求項1記載の波形圧縮装置において、前記複数の候補モードのうち少なくとも一部は、ベクトル量子化方式のモードである ことを特徴とする。
さらに、請求項3記載の構成にあっては、請求項2記載の波形圧縮装置において、前記複数の候補モードは、 スカラー量子化方式を採用する複数のモードと ベクトル量子化方式を採用する複数のモードと を含み、かつ、 前記スカラー量子化方式を採用する複数のモードおよび 前記ベクトル量子化方式を採用する複数のモードは、 各々一の残差符号(Lm)を構成するビット数が異なる 複数のモードから成るものであることを特徴とする。
また、請求項4記載の波形圧縮装置にあっては、元波形データ(Sn)を、残差符号(Lm)と該残差符号(Lm)の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データに変換する波形圧縮装置において、ベクトル量子化方式による複数の候補モードの中から、前記残差符号(Lm)の生成に適用する一のモードを選択するモード決定手段(81)と、選択された前記一のモードに従って、 前記元波形データのうち該一のモードに 対応する量のデータを圧縮し、該一のモードに対応する 残差符号(Lm)を生成する 波形データ圧縮手段(84)と、前記残差符号と、前記一のモードを特定する副情報とを 前記フレームに格納する フレーム格納手段(90)とを有することを特徴とする。
さらに、請求項5記載の構成にあっては、請求項4記載の波形圧縮装置において、前記一のモードに対応する複数のコードブックの中から一のコードブックを 選択するコードブック決定手段(82)をさらに具備し、前記波形データ圧縮手段(84)は、 選択された前記一のモードと前記一のコードブックとに従って、 前記元波形データのうち該一のモードに 対応する量のデータを圧縮し、該一のモードに対応する 残差符号(Lm)を生成するものであり、前記副情報は、前記一のコードブックを特定する情報をさらに含むものであることを特徴とする。
また、請求項6記載の波形伸長装置にあっては、残差符号(Lm)と該残差符号(Lm)の生成に適用された モードを特定する副情報部とから成る、 所定形式の複数のフレームを有する圧縮データを復元して 復元波形データ(◇Xn)を得る 波形伸長装置において、前記副情報部において前記モードとしてベクトル量子化方式が 採用されているか否かを判定するモード判定手段(77)と、前記モード判定手段(77)における判定結果が肯定的であったことを条件として、 一の前記残差符号(Lm)から複数の波形サンプルを復元する一方、 前記モード判定手段(77)における判定結果が否定的であったことを 条件として、 一の前記残差符号(Lm)から一の波形サンプルを復元する 逆量子化手段(75)とを有することを特徴とする。
また、請求項7記載の波形伸長装置にあっては、残差符号(Lm)と該残差符号(Lm)の生成に適用された モードを特定する副情報部とから成る、 所定形式の複数のフレームを有する圧縮データを復元して 復元波形データ(◇Xn)を得る 波形伸長装置において、前記モードはベクトル量子化方式のモードであり、前記各フレーム毎に前記副情報部を読み出し、 前記モードを特定するモード特定手段(35)と、特定された前記モードに基づいて、前記各フレームに含まれる各残差符号(Lm)から、各々複数の波形サンプルを復元する逆量子化手段(75)とを有することを特徴とする。
また、請求項8記載のプログラムにあっては、元波形データ(Sn)を、残差符号(Lm)と該残差符号(Lm)の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データに変換するプログラムにおいて、前記残差符号(Lm)を得るための複数の候補モードのうち、 未だ試行モードとして選択されていない一の候補モードを試行モードとして選択する 試行モード決定過程(81)と、決定された前記試行モードに従って、前記元波形データのうち該試行モードに 対応する量のデータを圧縮し、該試行モードに対応する 残差符号(Lm)を生成する 波形データ圧縮過程(84)と、前記残差符号(Lm)を復元することにより、 復元波形データ(◇Xn)を生成する 波形データ復元過程(66)と、前記復元波形データ(◇Xn)が前記元波形データ(Sn)に対して 有する量子化誤差の評価値(S/N比)を測定し、該評価値が所定の許容値以下であるか否か を判定する判定過程(68,SP8)と、該判定過程(68,SP8)における判定結果が否定的であったことを条件として、 前記試行モード決定過程(81)に対して新たな試行モードを選択させる モード調整指令を出力する モード調整指令過程(68,SP16)と、該判定過程(68,SP8)における判定結果が肯定的であったことを条件として、 前記残差符号と、前記試行モードを特定する副情報とを 前記フレームに格納する フレーム格納過程(90)とを処理装置(10)に実行させることを特徴とする。
また、請求項9記載の圧縮データの生産方法にあっては、元波形データ(Sn)に基づいて、残差符号(Lm)と該残差符号(Lm)の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データを生産する圧縮データの生産方法において、前記残差符号(Lm)を得るための複数の候補モードのうち、 未だ試行モードとして選択されていない一の候補モードを試行モードとして選択する 試行モード決定過程(81)と、決定された前記試行モードに従って、前記元波形データのうち該試行モードに 対応する量のデータを圧縮し、該試行モードに対応する 残差符号(Lm)を生成する 波形データ圧縮過程(84)と、前記残差符号(Lm)を復元することにより、 復元波形データ(◇Xn)を生成する 波形データ復元過程(66)と、前記復元波形データ(◇Xn)が前記元波形データ(Sn)に対して 有する量子化誤差の評価値(S/N比)を測定し、該評価値が所定の許容値以下であるか否か を判定する判定過程(68,SP8)と、該判定過程(68,SP8)における判定結果が否定的であったことを条件として、 前記試行モード決定過程(81)に対して新たな試行モードを選択させる モード調整指令を出力する モード調整指令過程(68,SP16)と、該判定過程(68,SP8)における判定結果が肯定的であったことを条件として、 前記残差符号と、前記試行モードを特定する副情報とを 前記フレームに格納する フレーム格納過程(90)とを有することを特徴とする。
また、請求項10記載のプログラムにあっては、元波形データ(Sn)を、残差符号(Lm)と該残差符号(Lm)の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データに変換するプログラムにおいて、ベクトル量子化方式による複数の候補モードの中から、前記残差符号(Lm)の生成に適用する一のモードを選択するモード決定過程(81)と、選択された前記一のモードに従って、 前記元波形データのうち該一のモードに 対応する量のデータを圧縮し、該一のモードに対応する 残差符号(Lm)を生成する 波形データ圧縮過程(84)と、前記残差符号と、前記一のモードを特定する副情報とを 前記フレームに格納する フレーム格納過程(90)とを処理装置(10)に実行させることを特徴とする。
また、請求項11記載の圧縮データの生産方法にあっては、元波形データ(Sn)に基づいて、残差符号(Lm)と該残差符号(Lm)の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データを生産する圧縮データの生産方法において、ベクトル量子化方式による複数の候補モードの中から、前記残差符号(Lm)の生成に適用する一のモードを選択するモード決定過程(81)と、選択された前記一のモードに従って、 前記元波形データのうち該一のモードに 対応する量のデータを圧縮し、該一のモードに対応する 残差符号(Lm)を生成する 波形データ圧縮過程(84)と、前記残差符号と、前記一のモードを特定する副情報とを 前記フレームに格納する フレーム格納過程(90)とを有することを特徴とする。
以上のように、複数の候補モードの中から圧縮率の高い順に試行モードを選択し、選択された試行モードにおいて残差符号と復元波形データとを生成し、量子化誤差の評価値が許容値以下になったときにフレームを作成する構成によれば、各フレームにおいて最適な量子化方式を選択しつつ波形データを圧縮することができる。
また、候補モードとして、スカラー量子化方式とベクトル量子化方式とを有する構成によれば、波形データの各部においてスカラー量子化方式またはベクトル量子化方式のうち最適な方式を選択することができる。
また、ベクトル量子化方式による複数の候補モードの中から、一のモードをフレーム毎に選択する構成によれば、各フレームの特徴に適したモードをフレーム毎に選択できるから、ベクトル量子化方式の利点を活かして高い圧縮率を実現することができる。
1.楽音生成装置
1.1.全体構成
次に、本発明の一実施例の楽音生成装置のブロック図を図1に示す。図1に示す楽音生成装置1おいて、CPU10は楽音生成に関連する各種プログラムを実行することにより楽音生成装置1における楽音生成の動作を制御する中央処理装置(Central Processing Unit)である。すなわち、演奏操作子の操作、自動演奏、通信I/Oからの入力などにより発音開始指示(ノートオン)が発生したときには、音源部30に対してその発音開始指示に応じた楽音の生成開始を指示している。ROM(Read Only Memory)11は、例えばフラッシュROMとされており、CPU10が実行する楽音生成処理のプログラムや、各種データが格納されている。RAM(Random Access Memory)12は楽音生成装置1におけるメインメモリであり、本発明にかかる波形圧縮装置により圧縮データ(圧縮された波形データ)がフレームを単位として記憶されている波形記憶領域12aを備えていると共に、CPU10のワークエリア等の領域が設定されている書き換え可能な記憶手段である。なお、波形記憶領域12aには複数音色の圧縮データを記憶することができる。
また、操作子13は、鍵盤等の演奏操作子や各種設定を行うパネルスイッチであり、表示器14は楽音生成時に各種情報を表示させる液晶等からなる表示器である。通信I/O15は、LAN(Local Area Network )やインターネット、電話回線等の通信ネットワークを介してサーバコンピュータに接続するためのネットワークインタフェースである。この通信I/O15を介して、楽音生成装置1内部で作成したMIDIメッセージを外部へ送出したり、外部からのMIDIメッセージを受信することができる。制御レジスタ20は、CPU10から各発音チャンネルの発音パラメータが書き込まれるレジスタである。音源部30は、フレームを単位として圧縮データの伸長処理を行うデコーダを備えており、CPU10の制御に基づいて、RAM12の波形記憶領域12aから楽音生成に必要とする圧縮データを後述する小フレーム毎に読み出し、読み出した圧縮データの伸長処理を行っている。そして、デコードされた波形データの補間、エンベロープ付与、チャンネル累算(ミキシング)、および効果(エフェクト)付与などの処理を行って、楽音波形データとして出力している。音源部30から出力された楽音波形データはアナログ信号に変換されてサウンドシステム40から放音されるようになる。なお、各部はバスライン16を介して接続されている。
1.2.データ構造
次に、音源部30について説明する前にRAM12の波形記憶領域12aに記憶されている圧縮データのデータ構造を図2を参照して説明する。波形記憶領域12aに記憶されている圧縮データの「1」音色分の圧縮データが図2に示されている。図2に示す圧縮データは、圧縮データの全体に関する情報が書き込まれているヘッダ情報と、残差符号等が収容されているフレーム1ないしフレームnから構成されている。ヘッダ情報は、残差符号のサンプルのビット数、読出開始アドレス、読出終了アドレス、ループアドレス、最初のフレームの予測係数、スケールファクタおよびモード、その他データからなる。次に、残差符号のサンプル等が書き込まれている各フレームのデータ構造について説明する。まず、図2には例として「フレーム2」のデータ構造が示されている。図示するように、「1」フレームは、アドレスが「00」から「09」の「10」アドレスに対応する「10」の小フレームから構成されている。この小フレームは副情報部と残差符号部とからなる。
一の小フレームのデータ幅は図2に示すように「16」ビットである。このうち、副情報部のビット数は「4」ビットであり、残差符号部のビット数は「12」ビットである。残差符号部は一または複数の残差符号から成るが、一の残差符号のビット数は、圧縮する前の元波形データの性質に適するよう、フレーム毎に定められた固定のビット数に設定されている。但し、残差符号のビット数は、フレーム毎に異なる。まず、図示した「フレーム2」の例にあっては、図示のように一の残差符号のビット数は「3」ビットであり、一の小フレームあたりの残差符号数は「4」である。また、一の残差符号のビット数を「4」ビットに固定すると、図2における残差符号部の下段に示されるように「1」小フレーム内のサンプル数は「3」となる。同様に、一の残差符号のビット数を「2」ビットとすると、図2における残差符号部のさらに下段に示されるように一の小フレームの残差符号数は「6」になる。一のフレーム全体においては、小フレームのデータ幅が「16」ビットであるから、一のフレームを構成するビット数は「160」ビットになり、その内の「40」ビットのデータ領域が副情報部の領域となり、残る「120」ビットのデータ領域が残差符号部の領域となる。
ところで、一のフレームに含まれる副情報部は、当該一のフレームの次のフレームの残差符号を復号するためのパラメータから成るものである。例えば、「フレーム2」の副情報部は、「フレーム3」の残差符号を復号するためのパラメータから成るものである。これは、波形データが再生されるときは、小フレームを単位として圧縮データが読み出されることに起因するものである。すなわち、「フレーム2」の再生が終了して、「フレーム3」の先頭の小フレームが読み出されたとき、この小フレーム内の残差符号を復号するためのパラメータは既に判明しているから、残差符号を直ちに復号することが可能になる。
次に、副情報部の詳細を説明する。
(1)予測係数部:本実施例では、あるサンプル(注目サンプルという)の値を特定するために、過去の複数のサンプル値(例えば「4」サンプル)から近似多項式によって注目サンプルの予測値を求め、この予測値に対する実測値の残差を残差符号として記録する。予測係数とは、この近似多項式に用いられる係数である。
(2)モード部:これは、残差符号部における各残差符号に採用されている量子化方式(スカラーまたはベクトル)と、各残差符号のビット数とを特定する情報である。例えば、「スカラー量子化:2ビット」、「スカラー量子化:3ビット」、「ベクトル量子化(2次元):4ビット」、「スカラー量子化:4ビット」、「ベクトル量子化(2次元):6ビット」「ベクトル量子化(3次元):6ビット」「スカラー量子化:6ビット」などのモードがある。
(3)スケールファクタ部:これは、残差符号部における残差符号の最大スケールを特定する情報である。例えば、モードが「スカラー量子化:2ビット」であれば、残差符号の値は「11b」、「10b」、「01b」、「00b」(bは2進数であることを示す)のうち何れかになり、このうち「11b」が最大値である。スケールファクタは、この最大値「11b」に対応する実際の残差値を示すものになる。この場合、スケールファクタを絶対値ではなく、フレーム間の比や対数スケールにおける差で記憶するとビット数に対する情報量の効率を向上することができる。スケールファクタをフレーム間の比や対数スケールにおける差とした場合においては、逆量子化時に絶対値に変換されて残差符号に乗算されるようになる。
(4)その他情報部:その他情報部には、コードブックの番号等が記録される。コードブックとは、周知のように、ベクトル量子化方式において一の残差符号と、複数サンプルの残差とを対応付けるものであり、コードブックの番号は、量子化方式のモード毎に独立して付与される。例えば、その他情報部の全ビット(4ビット)を全てコードブックの番号の指定に割り当てると、最大「16」種類のコードブックを指定できることになるが、これにより各量子化方式毎に最大「16」種類のコードブックを指定できることになる。
コードブックは、一般的にはベクトル量子化方式に対して用いられるが、本実施例においてはスカラー量子化方式に対してもコードブックが適用される。スカラー量子化方式におけるコードブックとは、一の残差符号から一の残差の値を決定するためのテーブルや関数であって、残差符号と残差との対応関係を表すテーブル、または、残差符号と残差との対応関係を表す関数に適用される係数のテーブルである。上述した「スカラー量子化:2ビット」の量子化方式においては、残差符号が最大値「11b」であるときの残差はスケールファクタに等しい。そして、残差符号と残差との対応関係がリニアなものであれば、残差符号「10b」はスケールファクタの「2/3」、残差符号「01b」はスケールファクタの「1/3」になる。しかし、このリニアな対応関係が必ずしも望ましいわけではなく、例えばログスケールなど、非リニアな対応関係が望ましい場合もあるため、コードブックを指定することにより、最適な対応関係を選択できるようにしている。なお、その他情報部は、コードブックの番号のほか、音量情報や波形データのループアドレス等の情報として用いても良い。
1.3.音源部30の詳細構成
図1に戻り、音源部30の詳細構成について説明する。まず、アドレス発生部32は、周波数情報(Fナンバ)を累算するサンプルカウンタと、RAM12における波形記憶領域12aから圧縮データデータを小フレーム毎に読み出す読出アドレスを生成するメモリカウンタとを備えている。サンプルカウンタは、指定された音高に対応する圧縮データのピッチシフト量であるFナンバを累算して整数部と小数部からなるサンプルアドレスを生成し、その内の整数部を残差符号キャッシュ部33に、残る小数部を補間部36にそれぞれ供給する。また、該サンプルカウンタは、サンプルアドレスの整数部が、小フレームのサンプル数に達するごとに「要求パルス」なる信号を出力する。なお、「小フレームのサンプル数」とは、小フレームあたりの残差符号数と、一残差符号に対するサンプル数とを乗算したものである。例えば、モードが「スカラー量子化:3ビット」であれば「4×1=4」、モードが「ベクトル量子化(3次元):6ビット」であれば、「2×3=6」になる。アドレス発生部32のメモリカウンタでは、サンプルカウンタから上記要求パルスが入力されるごとに、メモリアドレスを「1」ずつカウントアップすることにより、小フレームを読み出す小フレームアドレスFADを生成している。
フレーム読出部31には、アドレス発生部32から、上記要求パルスと小フレームアドレスFADとが供給される。そして、フレーム読出部31は、要求パルスが入力されるごとに、小フレームアドレスFADによって示される小フレームのデータを読み出す。読み出された小フレームのデータにおける副情報部は副情報デコード部34に供給され、読み出された小フレームの残差符号部は残差符号キャッシュ部33に供給される。副情報デコード部34には、「1」フレームの期間において、フレーム読出部31から供給される各小フレームの副情報が順次収集され、副情報の各データがデコードされる。そして、そのフレームの次のフレームの期間に、デコードされた予測係数部およびスケールファクタがデコーダ35に供給されると共に、モード部およびその他情報部のデータが音源部30の各ブロックに供給される。
残差符号キャッシュ部33にあっては、読み出された小フレームのうちの最新の「3」つの小フレームがキャッシュに保持される。そして、アドレス発生部32からのサンプルアドレスの整数部に応じて、その整数部の進行量に相当する数の残差符号のサンプルがキャッシュされた「3」つの小フレームから取り出され、取り出された残差符号のサンプルがデコーダ35に送られる。デコーダ(キャッシュ)35では、残差符号キャッシュ部33から残差符号のサンプルが送られてくる毎に、「4次」の線形予測伸長により残差符号のサンプルがデコードされて復元波形サンプルを得ている。この復元波形サンプルは、デコーダ35内の波形データキャッシュに、例えば「4」サンプル保存される。
デコーダ35から出力される伸長された復元波形データは、補間部36に供給される。この場合、デコーダ35における波形データキャッシュ部74にキャッシュされている「4」サンプルの復元波形サンプルD1〜D4が補間部36に供給される。そして、補間部36ではアドレス発生部32からのサンプルアドレスの小数部に基づいて、供給された4つの復元波形サンプルD1〜D4を、例えば4点補間して、補間サンプルを生成する。ところで、制御レジスタ20には、補間サンプルに対して付与されるべきエンベロープを規定する音量EGパラメータがノートオン時に記憶されている(詳細は後述する)。補間部36から出力される補間サンプルは、音量EG部37において、音量EGパラメータに基づいて音量制御され、その結果がミキサ38に供給される。ミキサ38では全ての発音チャンネルにおける波形サンプルがチャンネル累算されると共に、必要に応じて効果が付与され、その結果が再生タイミング毎に出力される。ミキサ38からの出力は、ディジタル−アナログ変換器(DAC)39に供給されてアナログ信号に変換され、サウンドシステム40から放音されるようになる。
1.4.デコーダ35(波形伸長装置)の詳細構成
次に、音源部30におけるデコーダ35の詳細構成を図3(a)を参照し説明する。デコーダ35には、残差符号キャッシュ部33から残差符号Lmが供給されるとともに、副情報デコード部34から各副情報、すなわち予測係数、スケールファクタSF、モード、コードブック番号、およびその他の情報が供給される。デコーダ35内において逆量子化&逆正規化部71には、モードと、スケールファクタSFと、残差符号と、コードブック番号とが供給され、これらに基づいて各サンプル(注目サンプル)における残差サンプルqnが出力される。なお、逆量子化&逆正規化部71の詳細については後述する。ところで、一の残差符号Lmに基づいて生成される残差サンプルqnの数は、スカラー量子化方式が採用されている場合は「1」であり、ベクトル量子化方式が採用されている場合は複数(通常は「2」または「3」)になる。
残差サンプルqnは加算器72に供給される。さらに、加算器72には、線形予測演算部73から、注目サンプルの予測値である線形予測サンプル◇Sn-1が供給される。加算器72においては、両者が加算されることにより、注目サンプルに係る復元波形サンプル◇Xnが出力される。復元波形サンプル◇Xnは波形データキャッシュ部74にキャッシュされると共に、伸長された波形データとして出力される。
波形データキャッシュ部74には、現在から過去に向かって「4」サンプルの復元波形サンプル◇Xn〜◇Xn-3(D1〜D4)がキャッシュされており、このキャッシュされた「4」サンプルの復元波形サンプルD1〜D4が線形予測演算部73に供給される。線形予測演算部73では、これら復元波形サンプルD1〜D4にそれぞれの次数の線形予測係数Pを乗算して加算することにより4次の線形予測を行い、次の復元波形サンプル◇Xn+1を得るための線形予測サンプル◇Snを生成している。
次に、逆量子化&逆正規化部71の詳細構成を図3(b)を参照し説明する。モード判定部77においては、供給されたモードに基づいて、現在のフレームにおける量子化方式(スカラーまたはベクトル)と、各残差符号のビット数とが特定される。次に、コードブック決定部78においては、量子化方式と、残差符号のビット数と、その他情報部に含まれるコードブック番号とに基づいて、採用されるコードブックが決定され、該コードブックは逆量子化部75に供給される。逆量子化部75においては、該コードブックに基づいて、一の残差符号Lmから一または複数の残差が生成される。次に、逆正規化部76においては、これらの残差にスケールファクタSFが乗算され、これによって逆正規化された残差サンプルqnが出力される。
このように、本実施例にかかる楽音生成装置1では、モード判定部77において、各フレームにスカラー量子化方式またはベクトル量子化方式の何れが適用されているかをフレーム毎に判定するから、スカラー量子化方式が適用されているフレームと、ベクトル量子化方式が適用されているフレームとが混在している圧縮データを適切に復元することが可能である。
また、従来技術によって音源用の波形データとして作成された圧縮データは、スカラー量子化方式のみを採用しているが、かかる圧縮データも本実施例の楽音生成装置1によって再生することが可能になる。すなわち、本実施例の楽音生成装置1は、過去の楽音生成装置に対して上位コンパチブルになるように構成されているから、過去に作成された(スカラー量子化方式のみを採用した)圧縮データの資産を有効に活用することが可能になる。
さらに、圧縮データの各フレームには、各フレームの再生に必要な残差符号が記憶されると同時に次のフレームの残差符号を伸長するための副情報が格納されるから、音源部30において、副情報をタイミングよく取り出すための専用の回路が不要になり、回路構成を簡単にすることができる。
1.5.楽音生成装置の動作
次に、楽音生成装置1の動作について説明する。
演奏操作子の操作、自動演奏、通信I/O15からの入力などにより発音開始指示(ノートオン)が発生すると、CPU10が音源部30に対してその発音開始指示に応じた楽音の生成開始を指示する。ここで、ノートオンには、パート(音色)PT、音高N、強度Vなどの指定が含まれる。この場合の手順は次のようになる。
(1)まず、音源部30の複数発音チャンネルのうちの1つを当該楽音の発生に割当てる。
(2)パートPTで現在選択されている音色データ(RAM12上)に基づいて、波形記憶領域12aに記憶されている波形データの1つを選択し、ピッチシフト量、音量EGパラメータ、LFOパラメータ、出力レベル等を制御レジスタ20の割り当てた発音チャンネル領域に設定する。
(3)選択された波形データのヘッダを読み出し、残差符号のビット数、読出開始アドレス、読出終了アドレス、ループアドレス、最初のフレームの予測係数、スケールファクタ、モード、その他データを、上記発音チャンネル領域に設定する。この場合の各アドレスは、フレームを単位としたアドレスでも良い。
(4)上記発音チャンネル領域にノートオンの指令を書き込む。
これにより、音源部30において楽音の生成(波形の伸長)が開始されるようになる。
2.波形圧縮装置
2.1.波形圧縮装置の構成
次に、線形予測を利用して、圧縮した波形データ(図2)を生成する波形圧縮装置の実施例について説明する。この波形圧縮装置のハードウエア構成は、楽音生成装置1(図1)と同様である。波形圧縮処理は、CPU10上で動作するプログラムによって実行される。このプログラムのアルゴリズム構成を図4(a),(b)に示す。但し、このアルゴリズム構成の全部または一部をハードウエアによって実現してもよいことは言うまでもない。本実施例においては、RAM12内の波形記憶領域12aには、圧縮されていない元波形データが記憶されており、これが圧縮された結果である圧縮データも波形記憶領域12aに記憶される。
本実施例において、圧縮処理に適用される可能性のある複数のモードを「候補モード」といい、候補モードの中から圧縮処理の試行ために選択された一のモードを「試行モード」という。各候補モードには、試行モードとして適用される優先順が定められており、この優先順に候補モードを配列したリストを「モードリスト」という。ここで、モードリストにおける優先順は、次のように定められる。まず、圧縮率の高い候補モードは、圧縮率の低い候補モードよりも優先順が高くなるように設定される。また、圧縮率が等しい複数の候補モードについては、スカラー量子化方式よりもベクトル量子化方式のほうが優先順が高くなるように設定される。さらに、ベクトル量子化方式相互間においては、次元数の高いモードの優先順が高くなるように設定される。
これは、圧縮率の等しい候補モード相互間では、ベクトル量子化方式によって得られた圧縮データのほうがS/N比を低く抑えられる可能性が高いことによる。例えば、「スカラー量子化:2ビット」、「ベクトル量子化(2次元):4ビット」、および「ベクトル量子化(3次元):6ビット」は、何れも元波形データの「1」サンプルあたりの残差符号のビット数は「2」であるから、圧縮率は等しい。従って、これらの優先順は、「ベクトル量子化(3次元):6ビット」、「ベクトル量子化(2次元):4ビット」、「スカラー量子化:2ビット」の順になる。
図4(a)において、量子化&正規化部62には、このモードリストが記憶されており、モードリストの順に従って、一の候補モードが圧縮処理を行うための「試行モード」として選択される。さらに、量子化&正規化部62には、ベクトル量子化方式およびスカラー量子化方式に適用されるコードブックも記憶されている。量子化&正規化部62においては、最初はモードリストの先頭の候補モードが試行モードとして選択される。試行モードが決定されると、残差符号数が特定されるから、「1」フレームに対応する元波形データのサンプル(以下、「元波形サンプル」という)Snのサンプル数Kが特定される。サンプル数Kが特定されると、元波形データのうち未圧縮の区間の先頭から、当該サンプル数Kだけ元波形サンプルが読み出され、予測係数&スケールファクタ生成部63に供給される。
予測係数&スケールファクタ生成部63においては、サンプル数Kの元波形サンプルSnが解析され、予測係数Pと、スケールファクタSFとが決定される。一方、減算器61には、サンプル数Kの元波形サンプルSnが一サンプルづつ供給される。さらに、減算器61には、後述する線形予測サンプル◇Sn-1が一サンプルづつ供給される。これにより、減算器61からは残差サンプルdn(=Sn−◇Sn-1)が出力される。なお、本明細書においては、残差サンプルに対して、「dn」および「qn」という記号を使っているが、「dn」は上述したように元波形サンプルSnから線形予測サンプル◇Sn-1を減算することにより得られるものであり、「qn」は、残差符号を逆量子化および逆正規化して得られたものである。
量子化&正規化部62においては、試行モードと、スケールファクタSFと、コードブックとに基づいて、残差サンプルdnが残差符号に変換される。すなわち、まず、残差サンプルdnがスケールファクタSFで除算されることにより正規化される。なお、量子化&正規化部62の詳細構成については後述する。逆量子化&逆正規化部66には、スケールファクタSFと、試行モードと、コードブック番号と、残差符号とが供給される。逆量子化&逆正規化部66は、上述した逆量子化&逆正規化部71(図3(b))と同様に構成されており、逆正規化された残差サンプルqnが出力される。
加算器65においては、残差サンプルqnと、線形予測サンプル◇Sn-1とが加算され、加算結果が復元波形サンプル◇Xnとして出力される。線形予測部64は、線形予測演算部73および波形データキャッシュ部74(図3(a))と同様に構成されている。すなわち、線形予測部64は予測係数&スケールファクタ生成部63から線形予測係数Pを受信し、過去「4」サンプルの復元波形サンプル◇Xn〜◇Xn-3をキャッシュするとともに、これら復元波形サンプルD1〜D4にそれぞれの次数の線形予測係数Pを乗算して加算することにより次の復元波形サンプル◇Xn+1を得るための線形予測サンプル◇Snを出力する。
モード解析部68には、元波形サンプルSnと、復元波形サンプル◇Xnとが供給され、「1」フレームに係る復元波形サンプル◇Xnに含まれる量子化誤差の評価値(S/N比)が測定される。そして、この評価値が所定の許容値を超えている場合には、モード解析部68から量子化&正規化部62に対して、モード調整指令が出力される。量子化&正規化部62においては、このモード調整指令が供給されると、モードリスト内の次の候補モードが試行モードとして選択される。この新たな試行モードが選択されると、予測係数&スケールファクタ生成部63においては、新たなサンプル数Kが決定され、上述した動作と同様に新たな試行モードにおける残差符号が生成されるとともに、復元波形サンプル◇Xnが生成され、該復元波形サンプル◇Xnに含まれる量子化誤差の評価値(S/N比)が再び測定される。そして、該評価値が上記許容値以下になるまで同様の動作が繰り返される。
そして、モード解析部68に供給された復元波形サンプル◇Xnの量子化誤差の評価値が上記許容値を超えていない場合には、モード解析部68からフレーム詰込部90に対して、フレーム構成指令が出力される。フレーム詰込部90は、予測係数&スケールファクタ生成部63から予測係数と、スケールファクタSFとを受信するとともに、量子化&正規化部62から試行モードと、コードブック番号と、残差符号とを受信し、これら受信した情報を「160」ビットの中に詰め込むことにより、「10」の小フレームからなるフレーム(図2)を生成する。これにより、当該フレームに対して最後に選択された試行モードが最終的に適用されるモードとして採用されたことになる。
次に、量子化&正規化部62の詳細構成を図4(b)を参照し説明する。まず、正規化部83においては、残差サンプルqnがスケールファクタSFによって除算され、これによって正規化された残差サンプルが出力される。モード決定部81においては、最初にモードリスト内の先頭の候補モードが試行モードとして採用されるとともに、その後はモード解析部68よりモード調整指令が供給される毎に、モードリスト内の次の候補モードが試行モードとして選択される。コードブック決定部82においては、残差サンプルqnの分布状態等に基づいて、最大「16」種類の既定のコードブックのうち何れか最適なものが選択される。
量子化部84においては、試行モードがスカラー量子化方式である場合は、正規化された残差サンプルは、コードブックに基づく特性(リニアまたは非リニアな特性)に応じた残差符号に一対一に対応して作成される。すなわち、試行モードに係るビット数にスケーリングされ、残差符号Lmが生成される。一方、試行モードがベクトル量子化方式である場合は、正規化された残差サンプルは、所定数(「2」または「3」)毎に、コードブックに基づいた残差符号Lmに変換される。
2.2.波形圧縮装置の要部の動作
次に、上述した波形圧縮装置において、モード解析部68において新たなフレームの読み出しが指令され、またはモード調整指令が出力されることにより、試行モードが指定されたときに実行される処理の内容を図5を参照し説明する。図5において処理がステップSP2に進むと、波形記憶領域12aから選択された波形データのサンプル(元波形サンプル)が「1」フレームに対応するサンプル数Kだけ取り出され、コーダ60に供給される。コーダ60においては、試行モードに応じた残差符号Lmが量子化&正規化部62から出力され、これら残差符号Lmに基づいて、逆量子化&逆正規化部66および加算器65を介して復元波形サンプル◇Xnが出力される。この「1」フレーム分の復元波形サンプル◇Xnは、RAM12内の所定領域に格納される。
「1」フレーム分の復元波形サンプル◇Xnの格納が終了すると、処理はステップSP4に進み、該復元波形サンプル◇XnがRAM12から読み出される。次に、処理がステップSP6に進むと、RAM12内に格納され各々が「1」フレームに対応する元波形サンプルSnと復元波形サンプル◇Xnとが比較解析され、復元波形サンプル◇Xnに含まれる量子化誤差の評価値(S/N比)が測定される。
次に、処理がステップSP8に進むと、この評価値が所定の許容値以下であるか否かが判定される。ここで「NO」と判定されると、処理はステップSP14に進み、モード解析部68内に蓄積している残差符号Lmが消去される。次に、処理がステップSP16に進むと、モード解析部68から量子化&正規化部62に対して、モード調整指令が出力される。以上にて本ルーチンの処理は終了するが、その後に量子化&正規化部62においては、モードリストの次の候補モードが新たな試行モードとして選択されると、上記ステップSP2〜SP8の処理が再び繰り返される。
そして、量子化誤差の評価値が許容値以下になると、ステップSP8において「YES」と判定され、処理はステップSP10に進む。ステップSP10においては、モード解析部68内に蓄積している残差符号Lmがフレーム詰込部90に送信され、これによってフレーム詰込部90内にてフレームが作成される。次に、処理がステップSP12に進むと、量子化&正規化部62に対して、次のフレームの処理の開始が指令される。これにより、次のフレームに対して、上述した処理と同様の処理が繰り返される。
以下、新たなフレームの読み出しが指令された場合、または新たな試行モードが指定される毎に上記モード解析ルーチン(図5)が実行され、やがて、元波形サンプルSnの全体に対してフレームが構成される。全てのフレームが構成されると、これらフレームにヘッダが付与され、圧縮データが完成する。完成した圧縮データはROM等に書き込まれ、このROMは、上述した楽音生成装置1のROM11等として使用される。
以上説明したように本実施例によれば、スカラー量子化方式またはベクトル量子化方式が混在したモードリストの中から順次試行モードが選択され、試行モードによって得られた残差符号に係る量子化誤差の評価値が許容値以下になると、その試行モードが最終的に適用されるモードになる。従って、スカラー量子化方式またはベクトル量子化方式のうち、最適な量子化方式をフレーム毎に選択することができ、圧縮データのデータ量を効果的に削減することができる。
3.変形例
本発明は上述した実施例に限定されるものではなく、例えば以下のように種々の変形が可能である。
(1)上記波形圧縮装置の実施例においては、楽音生成装置1上で動作するプログラムによって波形圧縮処理を行ったが、このプログラムのみをCD−ROM、メモリカード等の記録媒体に格納して頒布し、あるいは伝送路を通じて頒布してもよい。
(2)上記波形圧縮装置の実施例においては、モードリスト中で圧縮率が等しい複数の候補モードに対して、スカラー量子化方式よりもベクトル量子化方式のほうが優先順が高くなるように設定された。しかし、音色によっては、スカラー量子化方式のほうがS/N比を低く抑えられる可能性が高い場合も考えられる。かかる場合には、圧縮率が等しい複数の候補モードに対して、ベクトル量子化方式よりもスカラー量子化方式のほうが優先順が高くなるように設定してもよい。
本発明の一実施例による楽音生成装置1のブロック図である。 本実施例に採用される波形データファイルのデータ構造を示す図である。 図1に示すデコーダの詳細構成を示す図である。 本発明の波形圧縮装置の実施例のアルゴリズムのブロック図である。 該波形圧縮装置におけるモード解析ルーチンのフローチャートである。
符号の説明
10:CPU、11:ROM、12:RAM、12a:波形記憶領域、13:操作子、14:表示器、16:バスライン、20:制御レジスタ、30:音源部、31:フレーム読出部、32:アドレス発生部、33:残差符号キャッシュ部、34:副情報デコード部、35:デコーダ、36:補間部、37:音量EG部、38:ミキサ、39:DAC、40:サウンドシステム、60:コーダ、61:減算器、62:量子化&正規化部、63:予測係数&スケールファクタ生成部、64:線形予測部、65:加算器、66:逆量子化&逆正規化部(波形データ復元手段)、68:モード解析部(判定手段,モード調整指令手段)、71:逆量子化&逆正規化部、72:加算器、73:線形予測演算部、74:波形データキャッシュ部、75:逆量子化部、76:逆正規化部、77:モード判定部(モード判定手段)、78,82:コードブック決定部、81:モード決定部(試行モード決定手段)、83:正規化部、84:量子化部(波形データ圧縮手段)、90:フレーム詰込部。

Claims (11)

  1. 元波形データを、残差符号と該残差符号の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データに変換する波形圧縮装置において、
    前記残差符号を得るための複数の候補モードのうち、未だ試行モードとして選択されていない候補モードの中から最も圧縮率の高い候補モードを試行モードとして選択する試行モード決定手段と、
    決定された前記試行モードに従って、前記元波形データのうち該試行モードに対応する量のデータを圧縮し、該試行モードに対応する残差符号を生成する波形データ圧縮手段と、
    前記残差符号を復元することにより、復元波形データを生成する波形データ復元手段と、
    前記復元波形データが前記元波形データに対して有する量子化誤差の評価値を測定し、該評価値が所定の許容値以下であるか否かを判定する判定手段と、
    前記判定手段における判定結果が否定的であったことを条件として、前記試行モード決定手段に対して新たな試行モードを選択させるモード調整指令を出力するモード調整指令手段と、
    前記判定手段における判定結果が肯定的であったことを条件として、前記残差符号と、前記試行モードを特定する副情報とを前記フレームに格納するフレーム格納手段と
    を有することを特徴とする波形圧縮装置。
  2. 前記複数の候補モードのうち少なくとも一部は、ベクトル量子化方式のモードであることを特徴とする請求項1記載の波形圧縮装置。
  3. 前記複数の候補モードは、スカラー量子化方式を採用する複数のモードとベクトル量子化方式を採用する複数のモードとを含み、かつ、前記スカラー量子化方式を採用する複数のモードおよび前記ベクトル量子化方式を採用する複数のモードは、各々一の残差符号を構成するビット数が異なる複数のモードから成るものである
    ことを特徴とする請求項2記載の波形圧縮装置。
  4. 元波形データを、残差符号と該残差符号の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データに変換する波形圧縮装置において、
    ベクトル量子化方式による複数の候補モードの中から、前記残差符号の生成に適用する一のモードを選択するモード決定手段と、
    選択された前記一のモードに従って、前記元波形データのうち該一のモードに対応する量のデータを圧縮し、該一のモードに対応する残差符号を生成する波形データ圧縮手段と、
    前記残差符号と、前記一のモードを特定する副情報とを前記フレームに格納するフレーム格納手段と
    を有することを特徴とする波形圧縮装置。
  5. 前記一のモードに対応する複数のコードブックの中から一のコードブックを選択するコードブック決定手段をさらに具備し、
    前記波形データ圧縮手段は、選択された前記一のモードと前記一のコードブックとに従って、前記元波形データのうち該一のモードに対応する量のデータを圧縮し、該一のモードに対応する残差符号を生成するものであり、
    前記副情報は、前記一のコードブックを特定する情報をさらに含むものである
    ことを特徴とする請求項4記載の波形圧縮装置。
  6. 残差符号と該残差符号の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データを復元して復元波形データを得る波形伸長装置において、
    前記副情報部において前記モードとしてベクトル量子化方式が採用されているか否かを判定するモード判定手段と、
    前記モード判定手段における判定結果が肯定的であったことを条件として、一の前記残差符号から複数の波形サンプルを復元する一方、前記モード判定手段における判定結果が否定的であったことを条件として、一の前記残差符号から一の波形サンプルを復元する逆量子化手段と
    を有することを特徴とする波形伸長装置。
  7. 残差符号と該残差符号の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データを復元して復元波形データを得る波形伸長装置において、
    前記モードはベクトル量子化方式のモードであり、
    前記各フレーム毎に前記副情報部を読み出し、前記モードを特定するモード特定手段と、
    特定された前記モードに基づいて、前記各フレームに含まれる各残差符号から、各々複数の波形サンプルを復元する逆量子化手段と
    を有することを特徴とする波形伸長装置。
  8. 元波形データを、残差符号と該残差符号の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データに変換するプログラムにおいて、
    前記残差符号を得るための複数の候補モードのうち、未だ試行モードとして選択されていない一の候補モードを試行モードとして選択する試行モード決定過程と、
    決定された前記試行モードに従って、前記元波形データのうち該試行モードに対応する量のデータを圧縮し、該試行モードに対応する残差符号を生成する波形データ圧縮過程と、
    前記残差符号を復元することにより、復元波形データを生成する波形データ復元過程と、
    前記復元波形データが前記元波形データに対して有する量子化誤差の評価値を測定し、該評価値が所定の許容値以下であるか否かを判定する判定過程と、
    該判定過程における判定結果が否定的であったことを条件として、前記試行モード決定過程に対して新たな試行モードを選択させるモード調整指令を出力するモード調整指令過程と、
    該判定過程における判定結果が肯定的であったことを条件として、前記残差符号と、前記試行モードを特定する副情報とを前記フレームに格納するフレーム格納過程と
    を処理装置に実行させることを特徴とするプログラム。
  9. 元波形データに基づいて、残差符号と該残差符号の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データを生産する圧縮データの生産方法において、
    前記残差符号を得るための複数の候補モードのうち、未だ試行モードとして選択されていない一の候補モードを試行モードとして選択する試行モード決定過程と、
    決定された前記試行モードに従って、前記元波形データのうち該試行モードに対応する量のデータを圧縮し、該試行モードに対応する残差符号を生成する波形データ圧縮過程と、
    前記残差符号を復元することにより、復元波形データを生成する波形データ復元過程と、
    前記復元波形データが前記元波形データに対して有する量子化誤差の評価値を測定し、該評価値が所定の許容値以下であるか否かを判定する判定過程と、
    該判定過程における判定結果が否定的であったことを条件として、前記試行モード決定過程に対して新たな試行モードを選択させるモード調整指令を出力するモード調整指令過程と、
    該判定過程における判定結果が肯定的であったことを条件として、前記残差符号と、前記試行モードを特定する副情報とを前記フレームに格納するフレーム格納過程と
    を有することを特徴とする圧縮データの生産方法。
  10. 元波形データを、残差符号と該残差符号の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データに変換するプログラムにおいて、
    ベクトル量子化方式による複数の候補モードの中から、前記残差符号の生成に適用する一のモードを選択するモード決定過程と、
    選択された前記一のモードに従って、前記元波形データのうち該一のモードに対応する量のデータを圧縮し、該一のモードに対応する残差符号を生成する波形データ圧縮過程と、
    前記残差符号と、前記一のモードを特定する副情報とを前記フレームに格納するフレーム格納過程と
    を処理装置に実行させることを特徴とするプログラム。
  11. 元波形データに基づいて、残差符号と該残差符号の生成に適用されたモードを特定する副情報部とから成る、所定形式の複数のフレームを有する圧縮データを生産する圧縮データの生産方法において、
    ベクトル量子化方式による複数の候補モードの中から、前記残差符号の生成に適用する一のモードを選択するモード決定過程と、
    選択された前記一のモードに従って、前記元波形データのうち該一のモードに対応する量のデータを圧縮し、該一のモードに対応する残差符号を生成する波形データ圧縮過程と、
    前記残差符号と、前記一のモードを特定する副情報とを前記フレームに格納するフレーム格納過程と
    を有することを特徴とする圧縮データの生産方法。
JP2007000874A 2007-01-06 2007-01-06 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法 Pending JP2008170488A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007000874A JP2008170488A (ja) 2007-01-06 2007-01-06 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法
US11/965,539 US8706506B2 (en) 2007-01-06 2007-12-27 Waveform compressing apparatus, waveform decompressing apparatus, and method of producing compressed data
EP08100017A EP1942490A1 (en) 2007-01-06 2008-01-02 Waveform compressing apparatus, waveform decompressing apparatus, and method of producing compressed data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007000874A JP2008170488A (ja) 2007-01-06 2007-01-06 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法

Publications (1)

Publication Number Publication Date
JP2008170488A true JP2008170488A (ja) 2008-07-24

Family

ID=39166281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007000874A Pending JP2008170488A (ja) 2007-01-06 2007-01-06 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法

Country Status (3)

Country Link
US (1) US8706506B2 (ja)
EP (1) EP1942490A1 (ja)
JP (1) JP2008170488A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US9245529B2 (en) * 2009-06-18 2016-01-26 Texas Instruments Incorporated Adaptive encoding of a digital signal with one or more missing values
CN102714776B (zh) * 2009-10-15 2015-02-11 唯听助听器公司 具有音频编解码器的助听器和方法
US8902978B2 (en) 2010-05-30 2014-12-02 Lg Electronics Inc. Enhanced intra prediction mode signaling
JP2014092722A (ja) * 2012-11-05 2014-05-19 Yamaha Corp 音発生装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01187598A (ja) * 1988-01-22 1989-07-26 Hitachi Ltd 音声符号化装置
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
JP2001142499A (ja) * 1999-11-10 2001-05-25 Nec Corp 音声符号化装置ならびに音声復号化装置
JP2002258896A (ja) * 2001-02-27 2002-09-11 Mitsubishi Electric Corp 音声符号化方法および音声符号化装置
JP2005189886A (ja) * 1999-07-05 2005-07-14 Nokia Corp オーディオ信号の符号化効率を向上させる方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5693901A (en) * 1995-04-17 1997-12-02 Kabushiki Kaisha Kawai Gakki Seisakusho Electronic musical instrument
JP3482685B2 (ja) * 1993-05-25 2003-12-22 ヤマハ株式会社 電子楽器の音源装置
JPH09152896A (ja) * 1995-11-30 1997-06-10 Oki Electric Ind Co Ltd 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
US5797121A (en) * 1995-12-26 1998-08-18 Motorola, Inc. Method and apparatus for implementing vector quantization of speech parameters
US5920853A (en) * 1996-08-23 1999-07-06 Rockwell International Corporation Signal compression using index mapping technique for the sharing of quantization tables
JP3684751B2 (ja) * 1997-03-28 2005-08-17 ソニー株式会社 信号符号化方法及び装置
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
EP1343139B1 (en) * 1997-10-31 2005-03-16 Yamaha Corporation audio signal processor with pitch and effect control
AU1524300A (en) 1998-11-13 2000-06-05 Qualcomm Incorporated Closed-loop variable-rate multimode predictive speech coder
US6510407B1 (en) * 1999-10-19 2003-01-21 Atmel Corporation Method and apparatus for variable rate coding of speech
JP3933072B2 (ja) 2003-03-25 2007-06-20 ヤマハ株式会社 波形圧縮装置
US8090573B2 (en) * 2006-01-20 2012-01-03 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01187598A (ja) * 1988-01-22 1989-07-26 Hitachi Ltd 音声符号化装置
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
JP2005189886A (ja) * 1999-07-05 2005-07-14 Nokia Corp オーディオ信号の符号化効率を向上させる方法
JP2001142499A (ja) * 1999-11-10 2001-05-25 Nec Corp 音声符号化装置ならびに音声復号化装置
JP2002258896A (ja) * 2001-02-27 2002-09-11 Mitsubishi Electric Corp 音声符号化方法および音声符号化装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6012009852; 管村昇: 'ベクトル量子化による音声符号化' 情報処理 第22巻、第7号, 19810715, 702-703, 社団法人情報処理学会 *
JPN6012053556; 管村昇: 'ベクトル量子化による音声符号化' 情報処理 第22巻、第7号, 19810715, p. 702-703, 社団法人情報処理学会 *

Also Published As

Publication number Publication date
US20080167882A1 (en) 2008-07-10
EP1942490A1 (en) 2008-07-09
US8706506B2 (en) 2014-04-22

Similar Documents

Publication Publication Date Title
RU2554554C2 (ru) Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи
JP2002335161A (ja) 信号処理装置及び方法、信号符号化装置及び方法、並びに信号復号装置及び方法
CN110265043B (zh) 自适应有损或无损的音频压缩和解压缩演算方法
JP2008170488A (ja) 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法
US9165563B2 (en) Coding device, coding method, decoding device, decoding method, and storage medium
US10515618B2 (en) Waveform data structure, waveform data storage device, waveform data storing method, waveform data extracting device, waveform data extracting method and electronic musical instrument
US20030108108A1 (en) Decoder, decoding method, and program distribution medium therefor
JPH07199996A (ja) 波形データ符号化装置、波形データ符号化方法、波形データ復号装置、及び波形データ符号化/復号装置
JP3826870B2 (ja) 圧縮データ構造、波形生成装置および波形記憶装置
JP3933072B2 (ja) 波形圧縮装置
JP2796408B2 (ja) 音声情報圧縮装置
JP3933073B2 (ja) 波形伸長装置
JP2002091497A (ja) オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体
JP4107085B2 (ja) 波形データ圧縮方法
JP3912304B2 (ja) 圧縮データ構造、波形生成装置および波形記憶装置
US6907413B2 (en) Digital signal processing method, learning method, apparatuses for them, and program storage medium
JP4007194B2 (ja) 音源装置
JP2014021162A (ja) 復号装置、復号方法、及びプログラム
JP3603343B2 (ja) 波形読出装置
JP3747357B2 (ja) 楽音信号の符号化装置及び復号化装置
JP2790160B2 (ja) 波形生成装置および波形記憶装置
JP3479495B2 (ja) 音響信号符号化方法、その装置、音響信号復号化方法、その装置及びそれらのプログラム記録媒体
JP3945435B2 (ja) 波形データ圧縮方法、楽音信号発生方法、楽音信号処理装置およびプログラム
JP6146686B2 (ja) データ構造、データ格納装置、データ取り出し装置および電子楽器
JP2006211243A (ja) ディジタル信号符号化装置,ディジタル信号符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091117

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20110809

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121016