JP4444295B2 - 情報信号を量子化するための方法および装置 - Google Patents
情報信号を量子化するための方法および装置 Download PDFInfo
- Publication number
- JP4444295B2 JP4444295B2 JP2006552545A JP2006552545A JP4444295B2 JP 4444295 B2 JP4444295 B2 JP 4444295B2 JP 2006552545 A JP2006552545 A JP 2006552545A JP 2006552545 A JP2006552545 A JP 2006552545A JP 4444295 B2 JP4444295 B2 JP 4444295B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- values
- speech
- filter
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Radar Systems Or Details Thereof (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
Description
Claims (8)
- 音声値列の音声信号をコード化する装置であって、前記装置は、
心理音響モデルを用いて、音声値列の中の音声値ブロックに対する第1マスキングしきい値を求める手段と、
フィルタ通過音声値列を得るためのパラメータ化可能フィルタを示し、それを用いて音声値列を周波数選択性フィルタリングする手段と、
パラメータ化可能フィルタ(30)の伝達関数が第1マスキングしきい値の大きさの逆数にほぼ対応するよう、前記パラメータ化可能フィルタの計算されたパラメータ化値を計算する手段と、
前記フィルタ通過音声値を量子化音声値にマッピングし、しきい値情報値を超えるときよりも前記しきい値情報値未満の方が急勾配になるコースをとる量子化階段関数により前記量子化音声値の列を得るために、前記フィルタ通過音声値を量子化する手段とを備え、
周波数選択性フィルタリングする手段が、
前記フィルタ通過音声値の所定ブロックを得るために計算されたパラメータ化値に所定方式で応じる所定パラメータ化値を用いて、前記パラメータ化可能フィルタを用いることにより前記音声値列の中の音声値の所定ブロックを周波数選択性フィルタリングするように構成される、装置。 - マスキングしきい値を求める手段が音声値の他の第2ブロックに対する他の第2マスキングしきい値をさらに求めるように形成され、計算する手段が、前記伝達関数が前記第2マスキングしきい値の大きさの逆数にほぼ対応するよう、パラメータ化可能フィルタの他の第2パラメータ化値を計算するよう形成され、前記所定ブロックは第1および第2ブロックの間にあるかまたは第2ブロックであり、周波数選択性フィルタリングする手段が、
音声値の前記所定ブロックの所定音声値に対する補間パラメータ化値を得るために第1パラメータ化値と第2パラメータ化値との間で補間する手段を含み、
所定音声値に対応するフィルタ通過音声値の所定ブロックのフィルタ通過音声値を得るために、補間パラメータ化値を用いるように構成された、請求項1に記載の装置。 - 前記装置がさらに、第1マスキングしきい値に応じて第1量子化ノイズパワーリミットと、第2マスキングしきい値に応じて第2量子化ノイズパワーリミットを求める手段(22)を備え、周波数選択性フィルタリングする手段が、音声値の前記所定ブロックの所定音声値に対する補間量子化ノイズパワーリミットを得るために前記第1量子化ノイズパワーリミットと前記第2量子化ノイズパワーリミットとの間で補間する手段(90)と、量子化手段による量子化および補間量子化ノイズパワーリミットにより生じる量子化ノイズパワーに応じて中間段階値を求める手段(92)とを含み、段階をつけられたフィルタ通過音声値を得るために所定音声値に対応するフィルタ通過音声値に段階をつけるするように構成される、請求項2に記載の装置。
- 前記第1量子化ノイズパワーリミットと前記第2量子化ノイズパワーリミットとの間で補間する手段が直線補間を用いるように構成される、請求項3に記載の装置。
- 前記中間段階値を求める手段が、前記補間量子化ノイズパワーリミットにより除される前記量子化ノイズパワーの商の根を計算するように構成される、請求項3または請求項4に記載の装置。
- 前記しきい値情報値より大きな全てのフィルタ通過音声値が最大量子化階段値に量子化されるよう、前記量子化階段関数が前記しきい値情報値を超えてから平坦になっている、請求項1ないし請求項5のいずれかに記載の装置。
- 音声値列の音声信号をコード化する方法であって、前記方法が、
フィルタ通過音声値列を得るためにパラメータ化可能フィルタを用いて音声値列を周波数選択性フィルタリングするステップと、
前記フィルタ通過音声値を量子化音声値にマッピングし、しきい値情報値を超えているときよりも、前記しきい値情報値未満の方が急勾配になるコースをとる量子化階段関数により前記量子化音声値の列を得るために、前記フィルタ通過音声値を量子化するステップと、
心理音響モデルを用いて、前記音声値列の中の音声値ブロックに対する第1マスキングしきい値を求めるステップと、
パラメータ化可能フィルタの伝達関数が第1マスキングしきい値の大きさの逆数にほぼ対応するよう、前記パラメータ化可能フィルタの計算されたパラメータ化値を計算するステップとを含み、
周波数選択性フィルタリングのステップは、前記音声値列の中の音声値の所定ブロックが、前記フィルタ通過音声値の所定ブロックを得るために計算されたパラメータ化値に所定方式で応じる所定パラメータ化値を用いて、パラメータ化可能フィルタを用いて周波数選択性フィルタリングされるように機能する、方法。 - コンピュータに、請求項7に記載の方法を実行させるコンピュータプログラム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102004007184A DE102004007184B3 (de) | 2004-02-13 | 2004-02-13 | Verfahren und Vorrichtung zum Quantisieren eines Informationssignals |
| PCT/EP2005/001343 WO2005078703A1 (de) | 2004-02-13 | 2005-02-10 | Verfahren und vorrichtung zum quantisieren eines informationssignals |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2007522509A JP2007522509A (ja) | 2007-08-09 |
| JP4444295B2 true JP4444295B2 (ja) | 2010-03-31 |
Family
ID=34853461
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006552545A Expired - Lifetime JP4444295B2 (ja) | 2004-02-13 | 2005-02-10 | 情報信号を量子化するための方法および装置 |
Country Status (15)
| Country | Link |
|---|---|
| US (1) | US7464027B2 (ja) |
| EP (1) | EP1697929B1 (ja) |
| JP (1) | JP4444295B2 (ja) |
| KR (1) | KR100813193B1 (ja) |
| CN (1) | CN1918630B (ja) |
| AT (1) | ATE377243T1 (ja) |
| AU (1) | AU2005213767B2 (ja) |
| BR (1) | BRPI0506627B1 (ja) |
| CA (1) | CA2555639C (ja) |
| DE (2) | DE102004007184B3 (ja) |
| ES (1) | ES2294685T3 (ja) |
| IL (1) | IL177164A (ja) |
| NO (1) | NO337836B1 (ja) |
| RU (1) | RU2337413C2 (ja) |
| WO (1) | WO2005078703A1 (ja) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102004009955B3 (de) | 2004-03-01 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite |
| US7627481B1 (en) * | 2005-04-19 | 2009-12-01 | Apple Inc. | Adapting masking thresholds for encoding a low frequency transient signal in audio data |
| JP4640020B2 (ja) * | 2005-07-29 | 2011-03-02 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
| EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
| DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
| ATE509347T1 (de) * | 2006-10-20 | 2011-05-15 | Dolby Sweden Ab | Vorrichtung und verfahren zum codieren eines informationssignals |
| US7823092B1 (en) * | 2007-11-23 | 2010-10-26 | Altera Corporation | Method and apparatus for implementing a parameterizable filter block with an electronic design automation tool |
| EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
| CA2958429C (en) | 2014-07-25 | 2020-03-10 | Panasonic Intellectual Property Corporation Of America | Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method |
| DE102014220687A1 (de) * | 2014-10-13 | 2016-04-14 | Continental Automotive Gmbh | Kommunikationsvorrichtung für ein Fahrzeug und Verfahren zum Kommunizieren |
| RU2754497C1 (ru) * | 2020-11-17 | 2021-09-02 | федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) | Способ передачи речевых файлов по зашумленному каналу и устройство для его реализации |
Family Cites Families (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE3506912A1 (de) | 1985-02-27 | 1986-08-28 | Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover | Verfahren zur uebertragung eines audiosignals |
| DE3820037A1 (de) | 1988-06-13 | 1989-12-14 | Ant Nachrichtentech | Bildcodierverfahren und einrichtung |
| DE3820038A1 (de) * | 1988-06-13 | 1989-12-14 | Ant Nachrichtentech | Verfahren zur aufbereitung und uebertragung einer bildsequenz |
| JP3186290B2 (ja) * | 1993-01-20 | 2001-07-11 | ソニー株式会社 | 符号化方法、符号化装置、復号化装置及び記録媒体 |
| US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
| DE19549621B4 (de) | 1995-10-06 | 2004-07-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Codieren von Audiosignalen |
| GB2307833B (en) * | 1995-12-01 | 2000-06-07 | Geco As | A data compression method and apparatus for seismic data |
| AU3452397A (en) * | 1996-07-05 | 1998-02-02 | Victoria University Of Manchester, The | Speech synthesis system |
| US6370477B1 (en) | 1996-11-22 | 2002-04-09 | Schlumberger Technology Corporation | Compression method and apparatus for seismic data |
| US6131084A (en) | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
| KR100335609B1 (ko) | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
| US6195633B1 (en) * | 1998-09-09 | 2001-02-27 | Sony Corporation | System and method for efficiently implementing a masking function in a psycho-acoustic modeler |
| KR100440896B1 (ko) * | 1998-12-30 | 2004-09-18 | 주식회사 대우일렉트로닉스 | 양자화복호화장치 |
| RU2144222C1 (ru) * | 1998-12-30 | 2000-01-10 | Гусихин Артур Владимирович | Способ сжатия звуковой информации и система для его реализации |
| WO2000063886A1 (en) * | 1999-04-16 | 2000-10-26 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for audio coding |
| US6370502B1 (en) * | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
| EP1228569A1 (en) | 1999-10-30 | 2002-08-07 | STMicroelectronics Asia Pacific Pte Ltd. | A method of encoding frequency coefficients in an ac-3 encoder |
| US7110953B1 (en) * | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
| WO2002080573A1 (fr) * | 2001-03-28 | 2002-10-10 | Sony Corporation | Appareil, procede, programme de quantification et support d'enregistrement |
| DE10217297A1 (de) * | 2002-04-18 | 2003-11-06 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten |
| CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
-
2004
- 2004-02-13 DE DE102004007184A patent/DE102004007184B3/de not_active Expired - Lifetime
-
2005
- 2005-02-10 RU RU2006132742/09A patent/RU2337413C2/ru active
- 2005-02-10 AU AU2005213767A patent/AU2005213767B2/en not_active Expired
- 2005-02-10 EP EP05715289A patent/EP1697929B1/de not_active Expired - Lifetime
- 2005-02-10 KR KR1020067015896A patent/KR100813193B1/ko not_active Expired - Lifetime
- 2005-02-10 BR BRPI0506627A patent/BRPI0506627B1/pt active IP Right Grant
- 2005-02-10 AT AT05715289T patent/ATE377243T1/de active
- 2005-02-10 WO PCT/EP2005/001343 patent/WO2005078703A1/de not_active Ceased
- 2005-02-10 CA CA2555639A patent/CA2555639C/en not_active Expired - Lifetime
- 2005-02-10 CN CN200580004688XA patent/CN1918630B/zh not_active Expired - Lifetime
- 2005-02-10 DE DE502005001821T patent/DE502005001821D1/de not_active Expired - Lifetime
- 2005-02-10 ES ES05715289T patent/ES2294685T3/es not_active Expired - Lifetime
- 2005-02-10 JP JP2006552545A patent/JP4444295B2/ja not_active Expired - Lifetime
-
2006
- 2006-07-27 US US11/460,433 patent/US7464027B2/en not_active Expired - Lifetime
- 2006-07-31 IL IL177164A patent/IL177164A/en active IP Right Grant
- 2006-09-12 NO NO20064091A patent/NO337836B1/no unknown
Also Published As
| Publication number | Publication date |
|---|---|
| US20070043557A1 (en) | 2007-02-22 |
| IL177164A (en) | 2010-11-30 |
| JP2007522509A (ja) | 2007-08-09 |
| US7464027B2 (en) | 2008-12-09 |
| ES2294685T3 (es) | 2008-04-01 |
| IL177164A0 (en) | 2006-12-10 |
| EP1697929B1 (de) | 2007-10-31 |
| BRPI0506627A (pt) | 2007-05-02 |
| CN1918630B (zh) | 2010-04-14 |
| BRPI0506627B1 (pt) | 2018-10-09 |
| CN1918630A (zh) | 2007-02-21 |
| WO2005078703A1 (de) | 2005-08-25 |
| NO20064091L (no) | 2006-11-10 |
| HK1093814A1 (en) | 2007-03-09 |
| NO337836B1 (no) | 2016-06-27 |
| CA2555639A1 (en) | 2005-08-25 |
| RU2006132742A (ru) | 2008-03-20 |
| DE102004007184B3 (de) | 2005-09-22 |
| AU2005213767B2 (en) | 2008-04-10 |
| AU2005213767A1 (en) | 2005-08-25 |
| EP1697929A1 (de) | 2006-09-06 |
| CA2555639C (en) | 2012-07-10 |
| KR100813193B1 (ko) | 2008-03-13 |
| DE502005001821D1 (de) | 2007-12-13 |
| RU2337413C2 (ru) | 2008-10-27 |
| KR20060113999A (ko) | 2006-11-03 |
| ATE377243T1 (de) | 2007-11-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4444296B2 (ja) | オーディオ符号化 | |
| KR100859881B1 (ko) | 음성 신호 코딩 | |
| JP4212591B2 (ja) | オーディオ符号化装置 | |
| JP2012177939A (ja) | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 | |
| JP4444295B2 (ja) | 情報信号を量子化するための方法および装置 | |
| CN114550732A (zh) | 一种高频音频信号的编解码方法和相关装置 | |
| JP4444297B2 (ja) | オーディオ符号化 | |
| JP5491193B2 (ja) | 音声コード化の方法および装置 | |
| JP4721355B2 (ja) | 符号化データの符号化則変換方法および装置 | |
| MXPA06009144A (en) | Audio encoding | |
| MXPA06009110A (en) | Method and device for quantizing a data signal |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090804 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091102 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091110 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091201 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100105 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100113 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4444295 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130122 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130122 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| EXPY | Cancellation because of completion of term |