JP2012141630A - 瞬間的事象を有する音声信号の操作装置および操作方法 - Google Patents
瞬間的事象を有する音声信号の操作装置および操作方法 Download PDFInfo
- Publication number
- JP2012141630A JP2012141630A JP2012055129A JP2012055129A JP2012141630A JP 2012141630 A JP2012141630 A JP 2012141630A JP 2012055129 A JP2012055129 A JP 2012055129A JP 2012055129 A JP2012055129 A JP 2012055129A JP 2012141630 A JP2012141630 A JP 2012141630A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio signal
- time
- instantaneous event
- instantaneous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Electrophonic Musical Instruments (AREA)
- Amplifiers (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
【解決手段】瞬間的事象を有する音声信号を操作するための信号操作器は、瞬間的事象信号除去器、信号処理器、および信号挿入器を含む。信号操作器は、瞬間的事象信号除去器によって瞬間的事象が取り除かれた信号位置にて、処理音声信号に時間部分を挿入する。その結果、操作された音声信号は、処理によって影響を受けなかった瞬間的事象を含む。ここで、瞬間的事象の垂直コヒーレンスは、信号処理器の中で実行される処理が、垂直コヒーレンスを破壊しないで維持される。
【選択図】図1
Description
行される。挿入が、帯域幅拡張のシナリオの中で拡張係数によって制御される。位相の変化の挿入、すなわち、加算器552による一定の周波数値fiの加算の前の値によって、図5aの個々の発振器502の周波数は変更されない。しかしながら、音声信号全体の一時的な変化は、すなわち、拡張係数2によって減速される。その結果は、元のピッチを有する一時的に拡張された音調、すなわち、階調波を伴う元の基本波である。
(1)「位相音声分析合成装置:チュートリアル」マークダルソン著、コンピュータ音楽ジャーナル、10巻、No.4、ページ14〜27、1986年(“The phase Vocoder: A tutorial”, Mark Dolson, Com
puter Music Journal, vol. 10, no. 4, pp. 14 − 27, 1986)
(2)「ピッチシフトのための新しい位相音声分析合成装置の技術、調和および他のエキゾチックな効果」、L.ラロッシュォおよびM.ダルソン著、音声と音響のための信号処理の応用に関する1999年IEEE研究集会の会報、ニューパルツ、ニューヨーク、1999年10月17日〜20日、ページ91〜94(“New phase Voco
der techniques for pitch−shifting, harmonizing and other exotic effects”, L. Lar
oche und M. Dolson, Proceedings 1999 IEEE Workshop on applications of signal processing to audio and acoustics, New Paltz, New York, October 17 − 20, 1999, pages 91 to 94;”)
(3)「瞬間的事象を処理する中間位相音声分析合成装置の新しいアプローチ」、A.ローベル著、デジタル音声効果(DAFx−03)に関する第6回国際会議の議事録、ロンドン、イギリス(2003年9月8日〜11日)、ページDAFx−1〜DAFx−6(New approached to transient processing interphase vocoder”, A. Robel, Proceedin
g of the 6th international conference on digital audio effects (DAFx−03), London, UK, September 8−11, 2003, pages DAFx−1 to DAFx−6)
(4)「位相固定された音声分析合成装置」、メラープケット著、音声と音響のための信号処理の応用に関する1999年IEEE ASSP研究集会の会報、(“Phase
−locked Vocoder”, Meller Puckette, Proce
edings 1995, IEEE ASSP, Conference on applications of signal processing to audio and acoustics,)
(5)米国特許出願No.6,549,884。
103 瞬間的事象検出器
104’ メタデータ計算機
106 サイド情報抽出器
110 信号処理器
112 周波数選択分析器
113 周波数選択処理装置
120 信号挿入器
128 相互フェード
130 信号調整器
801 瞬間的事象
803 時間位置
804 第1の時間部分
809 第2の時間部分
813a 始めの部分
813b 終わりの部分
900 信号出力インタフェース
Claims (9)
- 瞬間的事象(801)を有する音声信号の操作装置であって、
処理音声信号を得るために、前記瞬間的事象(801)を含む第1の時間部分(804)が除去された瞬間的事象減少の音声信号を処理するための、もしくは、前記瞬間的事象(801)を含む音声信号を処理するための、信号処理器(110)と、
第2の時間部分(809)を、前記第1の時間部分(804)が除去された、もしくは、前記瞬間的事象(801)が前記処理音声信号の中に置かれた信号位置で、前記処理音声信号に挿入するための信号挿入器(120)と、を備え、
前記瞬間的事象(801)を含む第2の時間部分(809)は、前記信号処理器(110)によって実行される処理によって影響をされず、その結果、操作音声信号が得られること、
前記信号挿入器(120)は、
前記瞬間的事象(801)を有する音声信号から複製されるべき前記第2の時間部分(809)の時間長を決定(122)し、
前記第2の時間部分(809)の開始時間もしくは終了時間を、相互相関計算の最大値を見つけることによって決定(123)し、その結果、前記第2の時間部分(809)の境界を、前記処理音声信号の対応する境界にできる限り合致させ、
前記操作音声信号における前記瞬間的事象(801)の時間位置(803´)が、前記音声信号における前記瞬間的事象(801)の時間位置(803)と一致している、もしくは、前記瞬間的事象(801)の前マスキングもしくは後マスキングによって決定された精神音響的に許容できる程度より小さい時差で、前記音声信号における前記瞬間的事象(801)の時間位置(803)から外れていること、
を特徴とする、音声信号の操作装置。 - 前記瞬間的事象減少の音声信号を得るために、前記音声信号から前記第1の時間部分(804)を除去するための瞬間的事象信号除去器(100)を更に備え、前記第1の時間部分(804)は前記瞬間的事象(801)を有していること、を特徴とする、請求項1に記載の音声信号の操作装置。
- 前記信号処理器(110)は、前記瞬間的事象減少の音声信号を、周波数依存方法(112、113)で処理するように構成され、その結果、前記処理は、前記瞬間的事象減少の音声信号に位相シフトを導入し、前記位相シフトは異なるスペクトル成分ごとに異なること、を特徴とする、請求項1または請求項2に記載の音声信号の操作装置。
- 前記信号挿入器(120)は、少なくとも前記第1の時間部分(804)を複製することによって、前記第2の時間部分(809)を発生させるように構成され、その結果、前記第2の時間部分(809)は、前記瞬間的事象(801)を有する音声信号から複製した少なくとも第1の時間部分(804)の複製を含むこと、を特徴とする、請求項1〜請求項3のいずれかに記載の音声信号の操作装置。
- 前記信号処理器(110)は、音声分析合成装置、位相音声分析合成装置、もしくは、(P)SOLA処理器を含むこと、を特徴とする、請求項1〜請求項4のいずれかに記載の音声信号の操作装置。
- 時間が離散した前記操作音声信号の減衰もしくは挿入によって前記操作音声信号を調整するための信号調整器(130)を更に備えたこと、を特徴とする、請求項1〜請求項5のいずれかに記載の音声信号の操作装置。
- 音声信号における瞬間的事象を検出するための瞬間的事象検出器(103)、もしくは、音声信号に関連したサイド情報を抽出して解読するためのサイド情報抽出器(106)を更に備え、
前記サイド情報は、前記瞬間的事象(801)の時間位置(803)を示す、または、前記第1の時間部分(804)もしくは前記第2の時間部分(809)の開始時間もしくは終了時間を示すこと、
を特徴とする、請求項1〜請求項6のいずれかに記載の音声信号の操作装置。 - 瞬間的事象(801)を有する音声信号の操作方法であって、
処理音声信号を得るために、前記瞬間的事象(801)を含む第1の時間部分(804)が除去された瞬間的事象減少の音声信号を処理するための、もしくは、前記瞬間的事象(801)を含む音声信号を処理するための、信号処理工程(110)と、
第2の時間部分(809)を、前記第1の時間部分(804)が除去された、もしくは、前記瞬間的事象(801)が前記処理音声信号の中に置かれた信号位置で、前記処理音声信号に挿入するための信号挿入工程(120)と、を備え、
前記瞬間的事象(801)を含む第2の時間部分(809)は前記信号処理工程(110)によって影響されず、その結果、操作音声信号が得られること、
前記信号挿入工程(120)は、
前記瞬間的事象(801)を有する音声信号から複製されるべき前記第2の時間部分(809)の時間長を決定(122)し、
前記第2の時間部分(809)の開始時間もしくは終了時間を、相互相関計算の最大値を見つけることによって決定(123)し、その結果、前記第2の時間部分(809)の境界を、前記処理音声信号の対応する境界にできる限り合致させる工程、を備え、
前記操作音声信号における前記瞬間的事象(801)の時間位置(803´)が、前記音声信号における前記瞬間的事象(801)の時間位置(803)と一致している、もしくは、前記瞬間的事象(801)の前マスキングもしくは後マスキングによって決定された精神音響的に許容できる程度より小さい時差で、前記音声信号における前記瞬間的事象(801)の時間位置(803)から外れていること、
を特徴とする、音声信号の操作方法。 - コンピュータが稼動したとき、請求項8の方法を実行するためのプログラムコードを有すること、を特徴とする、コンピュータプログラム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US3531708P | 2008-03-10 | 2008-03-10 | |
| US61/035,317 | 2008-03-10 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010550054A Division JP5336522B2 (ja) | 2008-03-10 | 2009-02-17 | 瞬間的事象を有する音声信号の操作装置および操作方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012141630A true JP2012141630A (ja) | 2012-07-26 |
| JP5425250B2 JP5425250B2 (ja) | 2014-02-26 |
Family
ID=40613146
Family Applications (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010550054A Active JP5336522B2 (ja) | 2008-03-10 | 2009-02-17 | 瞬間的事象を有する音声信号の操作装置および操作方法 |
| JP2012055129A Active JP5425250B2 (ja) | 2008-03-10 | 2012-03-12 | 瞬間的事象を有する音声信号の操作装置および操作方法 |
| JP2012055130A Active JP5425952B2 (ja) | 2008-03-10 | 2012-03-12 | 瞬間的事象を有する音声信号の操作装置および操作方法 |
| JP2012055128A Active JP5425249B2 (ja) | 2008-03-10 | 2012-03-12 | 瞬間的事象を有する音声信号の操作装置および操作方法 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010550054A Active JP5336522B2 (ja) | 2008-03-10 | 2009-02-17 | 瞬間的事象を有する音声信号の操作装置および操作方法 |
Family Applications After (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012055130A Active JP5425952B2 (ja) | 2008-03-10 | 2012-03-12 | 瞬間的事象を有する音声信号の操作装置および操作方法 |
| JP2012055128A Active JP5425249B2 (ja) | 2008-03-10 | 2012-03-12 | 瞬間的事象を有する音声信号の操作装置および操作方法 |
Country Status (14)
| Country | Link |
|---|---|
| US (4) | US9275652B2 (ja) |
| EP (4) | EP2250643B1 (ja) |
| JP (4) | JP5336522B2 (ja) |
| KR (4) | KR101230481B1 (ja) |
| CN (4) | CN101971252B (ja) |
| AU (1) | AU2009225027B2 (ja) |
| BR (4) | BRPI0906142B1 (ja) |
| CA (4) | CA2897276C (ja) |
| ES (3) | ES2747903T3 (ja) |
| MX (1) | MX2010009932A (ja) |
| RU (4) | RU2565009C2 (ja) |
| TR (1) | TR201910850T4 (ja) |
| TW (4) | TWI505266B (ja) |
| WO (1) | WO2009112141A1 (ja) |
Families Citing this family (54)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AU2009225027B2 (en) * | 2008-03-10 | 2012-09-20 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Device and method for manipulating an audio signal having a transient event |
| USRE47180E1 (en) | 2008-07-11 | 2018-12-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
| BRPI0917762B1 (pt) * | 2008-12-15 | 2020-09-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Codificador de áudio e decodificador de extensão de largura de banda |
| EP4120254B1 (en) | 2009-01-28 | 2025-01-15 | Dolby International AB | Improved harmonic transposition |
| EP2392005B1 (en) | 2009-01-28 | 2013-10-16 | Dolby International AB | Improved harmonic transposition |
| EP2214165A3 (en) * | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
| KR101697497B1 (ko) | 2009-09-18 | 2017-01-18 | 돌비 인터네셔널 에이비 | 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체 |
| BR112012009446B1 (pt) | 2009-10-20 | 2023-03-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Método e aparelho de armazenamento de dados |
| MY160067A (en) | 2010-01-12 | 2017-02-15 | Fraunhofer Ges Forschung | Audio encoder, audio decoder, method for encoding and audio information, method for decording an audio information and computer program using a modification of a number representation of a numeric previous context value |
| DE102010001147B4 (de) | 2010-01-22 | 2016-11-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Mehrfrequenzbandempfänger auf Basis von Pfadüberlagerung mit Regelungsmöglichkeiten |
| EP2362376A3 (en) * | 2010-02-26 | 2011-11-02 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using envelope shaping |
| BR122021019082B1 (pt) | 2010-03-09 | 2022-07-26 | Dolby International Ab | Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata |
| CA2792368C (en) * | 2010-03-09 | 2016-04-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch |
| BR112012022745B1 (pt) | 2010-03-09 | 2020-11-10 | Fraunhofer - Gesellschaft Zur Föerderung Der Angewandten Forschung E.V. | dispositivo e método para resposta de magnitude aperfeiçoada e alinhamento temporal em um vocoder de fase com base no método de extenção da largura de banda para sinais de áudio |
| CN102436820B (zh) | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
| JP5807453B2 (ja) * | 2011-08-30 | 2015-11-10 | 富士通株式会社 | 符号化方法、符号化装置および符号化プログラム |
| KR101833463B1 (ko) * | 2011-10-12 | 2018-04-16 | 에스케이텔레콤 주식회사 | 음향 신호 품질 개선 시스템 및 그 방법 |
| US9286942B1 (en) * | 2011-11-28 | 2016-03-15 | Codentity, Llc | Automatic calculation of digital media content durations optimized for overlapping or adjoined transitions |
| EP2631906A1 (en) * | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
| WO2013189528A1 (en) * | 2012-06-20 | 2013-12-27 | Widex A/S | Method of sound processing in a hearing aid and a hearing aid |
| US9064318B2 (en) | 2012-10-25 | 2015-06-23 | Adobe Systems Incorporated | Image matting and alpha value techniques |
| US10638221B2 (en) | 2012-11-13 | 2020-04-28 | Adobe Inc. | Time interval sound alignment |
| US9201580B2 (en) | 2012-11-13 | 2015-12-01 | Adobe Systems Incorporated | Sound alignment user interface |
| US9355649B2 (en) * | 2012-11-13 | 2016-05-31 | Adobe Systems Incorporated | Sound alignment using timing information |
| US9076205B2 (en) | 2012-11-19 | 2015-07-07 | Adobe Systems Incorporated | Edge direction and curve based image de-blurring |
| US10249321B2 (en) | 2012-11-20 | 2019-04-02 | Adobe Inc. | Sound rate modification |
| US9451304B2 (en) | 2012-11-29 | 2016-09-20 | Adobe Systems Incorporated | Sound feature priority alignment |
| US10455219B2 (en) | 2012-11-30 | 2019-10-22 | Adobe Inc. | Stereo correspondence and depth sensors |
| US9135710B2 (en) | 2012-11-30 | 2015-09-15 | Adobe Systems Incorporated | Depth map stereo correspondence techniques |
| US10249052B2 (en) | 2012-12-19 | 2019-04-02 | Adobe Systems Incorporated | Stereo correspondence model fitting |
| US9208547B2 (en) | 2012-12-19 | 2015-12-08 | Adobe Systems Incorporated | Stereo correspondence smoothness tool |
| US9214026B2 (en) | 2012-12-20 | 2015-12-15 | Adobe Systems Incorporated | Belief propagation and affinity measures |
| JPWO2014136628A1 (ja) * | 2013-03-05 | 2017-02-09 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
| WO2014136629A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
| US20140358565A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
| EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
| EP3028274B1 (en) * | 2013-07-29 | 2019-03-20 | Dolby Laboratories Licensing Corporation | Apparatus and method for reducing temporal artifacts for transient signals in a decorrelator circuit |
| US9812150B2 (en) | 2013-08-28 | 2017-11-07 | Accusonus, Inc. | Methods and systems for improved signal decomposition |
| KR101852749B1 (ko) * | 2013-10-31 | 2018-06-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 주파수 도메인에서의 시간적인 사전-형상화된 잡음의 삽입에 의한 오디오 대역폭 확장 |
| BR112016014104B1 (pt) | 2013-12-19 | 2020-12-29 | Telefonaktiebolaget Lm Ericsson (Publ) | método de estimativa de ruído de fundo, estimador de ruído de fundo, detector de atividade de som, codec, dispositivo sem fio, nó de rede, meio de armazenamento legível por computador |
| US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
| US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
| US10468036B2 (en) * | 2014-04-30 | 2019-11-05 | Accusonus, Inc. | Methods and systems for processing and mixing signals using signal decomposition |
| US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
| US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
| EP2963646A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
| US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
| US9711121B1 (en) * | 2015-12-28 | 2017-07-18 | Berggram Development Oy | Latency enhanced note recognition method in gaming |
| US9640157B1 (en) * | 2015-12-28 | 2017-05-02 | Berggram Development Oy | Latency enhanced note recognition method |
| WO2019145955A1 (en) | 2018-01-26 | 2019-08-01 | Hadasit Medical Research Services & Development Limited | Non-metallic magnetic resonance contrast agent |
| IL319703A (en) | 2018-04-25 | 2025-05-01 | Dolby Int Ab | Combining high-frequency reconstruction techniques with reduced post-processing delay |
| CA3098064A1 (en) | 2018-04-25 | 2019-10-31 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
| US11158297B2 (en) * | 2020-01-13 | 2021-10-26 | International Business Machines Corporation | Timbre creation system |
| CN112562703B (zh) * | 2020-11-17 | 2024-07-26 | 普联国际有限公司 | 一种音频的高频优化方法、装置和介质 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11194796A (ja) * | 1997-10-31 | 1999-07-21 | Matsushita Electric Ind Co Ltd | 音声再生装置 |
| JP2001075571A (ja) * | 1999-09-07 | 2001-03-23 | Roland Corp | 波形生成装置 |
| US6766300B1 (en) * | 1996-11-07 | 2004-07-20 | Creative Technology Ltd. | Method and apparatus for transient detection and non-distortion time scaling |
| JP2004527000A (ja) * | 2001-04-13 | 2004-09-02 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ信号の高品質タイムスケーリング及びピッチスケーリング |
Family Cites Families (62)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10509256A (ja) * | 1994-11-25 | 1998-09-08 | ケイ. フインク,フレミング | ピッチ操作器を使用する音声信号の変換方法 |
| JPH08223049A (ja) * | 1995-02-14 | 1996-08-30 | Sony Corp | 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法 |
| JP3580444B2 (ja) * | 1995-06-14 | 2004-10-20 | ソニー株式会社 | 信号伝送方法および装置、並びに信号再生方法 |
| US6049766A (en) * | 1996-11-07 | 2000-04-11 | Creative Technology Ltd. | Time-domain time/pitch scaling of speech or audio signals with transient handling |
| SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
| US6266003B1 (en) * | 1998-08-28 | 2001-07-24 | Sigma Audio Research Limited | Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals |
| US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
| US6316712B1 (en) * | 1999-01-25 | 2001-11-13 | Creative Technology Ltd. | Method and apparatus for tempo and downbeat detection and alteration of rhythm in a musical segment |
| SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
| US6549884B1 (en) | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
| US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
| GB2357683A (en) * | 1999-12-24 | 2001-06-27 | Nokia Mobile Phones Ltd | Voiced/unvoiced determination for speech coding |
| US7096481B1 (en) * | 2000-01-04 | 2006-08-22 | Emc Corporation | Preparation of metadata for splicing of encoded MPEG video and audio |
| US7447639B2 (en) * | 2001-01-24 | 2008-11-04 | Nokia Corporation | System and method for error concealment in digital audio transmission |
| US6876968B2 (en) * | 2001-03-08 | 2005-04-05 | Matsushita Electric Industrial Co., Ltd. | Run time synthesizer adaptation to improve intelligibility of synthesized speech |
| US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
| US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
| MXPA03010237A (es) * | 2001-05-10 | 2004-03-16 | Dolby Lab Licensing Corp | Mejoramiento del funcionamiento de transitorios en sistemas de codificacion de audio de baja tasa de transferencia de bitios mediante la reduccion del pre-ruido. |
| WO2003091990A1 (en) * | 2002-04-25 | 2003-11-06 | Shazam Entertainment, Ltd. | Robust and invariant audio pattern matching |
| US8676361B2 (en) * | 2002-06-05 | 2014-03-18 | Synopsys, Inc. | Acoustical virtual reality engine and advanced techniques for enhancing delivered sound |
| TW594674B (en) * | 2003-03-14 | 2004-06-21 | Mediatek Inc | Encoder and a encoding method capable of detecting audio signal transient |
| JP4076887B2 (ja) * | 2003-03-24 | 2008-04-16 | ローランド株式会社 | ボコーダ装置 |
| US7233832B2 (en) * | 2003-04-04 | 2007-06-19 | Apple Inc. | Method and apparatus for expanding audio data |
| SE0301273D0 (sv) | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
| US6982377B2 (en) * | 2003-12-18 | 2006-01-03 | Texas Instruments Incorporated | Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing |
| CA2556575C (en) * | 2004-03-01 | 2013-07-02 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
| JP4744438B2 (ja) * | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
| EP1728243A1 (en) | 2004-03-17 | 2006-12-06 | Koninklijke Philips Electronics N.V. | Audio coding |
| WO2005099385A2 (en) * | 2004-04-07 | 2005-10-27 | Nielsen Media Research, Inc. | Data insertion apparatus and methods for use with compressed audio/video data |
| US8843378B2 (en) | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
| US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
| KR100750115B1 (ko) * | 2004-10-26 | 2007-08-21 | 삼성전자주식회사 | 오디오 신호 부호화 및 복호화 방법 및 그 장치 |
| US7752548B2 (en) * | 2004-10-29 | 2010-07-06 | Microsoft Corporation | Features such as titles, transitions, and/or effects which vary according to positions |
| WO2006079350A1 (en) * | 2005-01-31 | 2006-08-03 | Sonorit Aps | Method for concatenating frames in communication system |
| US7742914B2 (en) * | 2005-03-07 | 2010-06-22 | Daniel A. Kosek | Audio spectral noise reduction method and apparatus |
| US7983922B2 (en) | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
| MX2007015118A (es) * | 2005-06-03 | 2008-02-14 | Dolby Lab Licensing Corp | Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion. |
| US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
| US8050915B2 (en) * | 2005-07-11 | 2011-11-01 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signals using hierarchical block switching and linear prediction coding |
| US7565289B2 (en) * | 2005-09-30 | 2009-07-21 | Apple Inc. | Echo avoidance in audio time stretching |
| US7917358B2 (en) * | 2005-09-30 | 2011-03-29 | Apple Inc. | Transient detection by power weighted average |
| US8473298B2 (en) * | 2005-11-01 | 2013-06-25 | Apple Inc. | Pre-resampling to achieve continuously variable analysis time/frequency resolution |
| EP1959428A4 (en) * | 2005-12-09 | 2011-08-31 | Sony Corp | MUSIC EDITING DEVICE AND MUSIC EDITING PROCEDURE |
| WO2007069150A1 (en) * | 2005-12-13 | 2007-06-21 | Nxp B.V. | Device for and method of processing an audio data stream |
| JP4949687B2 (ja) * | 2006-01-25 | 2012-06-13 | ソニー株式会社 | ビート抽出装置及びビート抽出方法 |
| EP2016769A4 (en) * | 2006-01-30 | 2010-01-06 | Clearplay Inc | SYNCHRONIZATION OF FILTER METADATA WITH MULTIMEDIA PRESENTATION |
| JP4487958B2 (ja) * | 2006-03-16 | 2010-06-23 | ソニー株式会社 | メタデータ付与方法及び装置 |
| DE102006017280A1 (de) * | 2006-04-12 | 2007-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals |
| ATE493794T1 (de) * | 2006-04-27 | 2011-01-15 | Dolby Lab Licensing Corp | Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke |
| US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
| US8046749B1 (en) * | 2006-06-27 | 2011-10-25 | The Mathworks, Inc. | Analysis of a sequence of data in object-oriented environments |
| US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
| US7514620B2 (en) * | 2006-08-25 | 2009-04-07 | Apple Inc. | Method for shifting pitches of audio signals to a desired pitch relationship |
| US8259806B2 (en) * | 2006-11-30 | 2012-09-04 | Dolby Laboratories Licensing Corporation | Extracting features of video and audio signal content to provide reliable identification of the signals |
| KR101373890B1 (ko) * | 2006-12-28 | 2014-03-12 | 톰슨 라이센싱 | 자동적인 시각적 아티팩트 분석 및 아티팩트 감소를 위한 방법 및 장치 |
| US20080181298A1 (en) * | 2007-01-26 | 2008-07-31 | Apple Computer, Inc. | Hybrid scalable coding |
| US20080221876A1 (en) * | 2007-03-08 | 2008-09-11 | Universitat Fur Musik Und Darstellende Kunst | Method for processing audio data into a condensed version |
| US20090024234A1 (en) * | 2007-07-19 | 2009-01-22 | Archibald Fitzgerald J | Apparatus and method for coupling two independent audio streams |
| AU2009225027B2 (en) * | 2008-03-10 | 2012-09-20 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Device and method for manipulating an audio signal having a transient event |
| US8380331B1 (en) * | 2008-10-30 | 2013-02-19 | Adobe Systems Incorporated | Method and apparatus for relative pitch tracking of multiple arbitrary sounds |
| EP2392005B1 (en) * | 2009-01-28 | 2013-10-16 | Dolby International AB | Improved harmonic transposition |
| TWI484473B (zh) | 2009-10-30 | 2015-05-11 | Dolby Int Ab | 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統 |
-
2009
- 2009-02-17 AU AU2009225027A patent/AU2009225027B2/en active Active
- 2009-02-17 TR TR2019/10850T patent/TR201910850T4/tr unknown
- 2009-02-17 KR KR1020127005834A patent/KR101230481B1/ko active Active
- 2009-02-17 CA CA2897276A patent/CA2897276C/en active Active
- 2009-02-17 KR KR1020127005833A patent/KR101230480B1/ko active Active
- 2009-02-17 ES ES10194088T patent/ES2747903T3/es active Active
- 2009-02-17 CA CA2897271A patent/CA2897271C/en active Active
- 2009-02-17 MX MX2010009932A patent/MX2010009932A/es active IP Right Grant
- 2009-02-17 US US12/921,550 patent/US9275652B2/en active Active
- 2009-02-17 EP EP09719651.3A patent/EP2250643B1/en active Active
- 2009-02-17 RU RU2012113092/08A patent/RU2565009C2/ru active IP Right Revival
- 2009-02-17 CA CA2717694A patent/CA2717694C/en active Active
- 2009-02-17 CA CA2897278A patent/CA2897278A1/en active Pending
- 2009-02-17 JP JP2010550054A patent/JP5336522B2/ja active Active
- 2009-02-17 CN CN2009801081751A patent/CN101971252B/zh active Active
- 2009-02-17 KR KR1020107020270A patent/KR101291293B1/ko active Active
- 2009-02-17 BR BRPI0906142-8A patent/BRPI0906142B1/pt active IP Right Grant
- 2009-02-17 EP EP10194095A patent/EP2293295A3/en not_active Withdrawn
- 2009-02-17 CN CN201210261998.1A patent/CN102881294B/zh active Active
- 2009-02-17 KR KR1020127005832A patent/KR101230479B1/ko active Active
- 2009-02-17 BR BR122012006270-7A patent/BR122012006270B1/pt active IP Right Grant
- 2009-02-17 EP EP10194088.0A patent/EP2293294B1/en active Active
- 2009-02-17 BR BR122012006269-3A patent/BR122012006269A2/pt not_active Application Discontinuation
- 2009-02-17 CN CN201210262522.XA patent/CN102789784B/zh active Active
- 2009-02-17 ES ES09719651T patent/ES2738534T3/es active Active
- 2009-02-17 RU RU2012113087/08A patent/RU2565008C2/ru active
- 2009-02-17 RU RU2010137429/08A patent/RU2487429C2/ru active
- 2009-02-17 BR BR122012006265-0A patent/BR122012006265B1/pt active IP Right Grant
- 2009-02-17 EP EP10194086.4A patent/EP2296145B1/en active Active
- 2009-02-17 ES ES10194086T patent/ES2739667T3/es active Active
- 2009-02-17 CN CN201210262760.0A patent/CN102789785B/zh active Active
- 2009-02-17 WO PCT/EP2009/001108 patent/WO2009112141A1/en not_active Ceased
- 2009-02-23 TW TW101114956A patent/TWI505266B/zh active
- 2009-02-23 TW TW101114948A patent/TWI505264B/zh active
- 2009-02-23 TW TW098105710A patent/TWI380288B/zh active
- 2009-02-23 TW TW101114952A patent/TWI505265B/zh active
-
2012
- 2012-03-12 JP JP2012055129A patent/JP5425250B2/ja active Active
- 2012-03-12 JP JP2012055130A patent/JP5425952B2/ja active Active
- 2012-03-12 JP JP2012055128A patent/JP5425249B2/ja active Active
- 2012-04-03 RU RU2012113063/08A patent/RU2598326C2/ru active IP Right Revival
- 2012-05-07 US US13/465,946 patent/US9236062B2/en active Active
- 2012-05-07 US US13/465,936 patent/US9230558B2/en active Active
- 2012-05-07 US US13/465,958 patent/US20130010983A1/en not_active Abandoned
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6766300B1 (en) * | 1996-11-07 | 2004-07-20 | Creative Technology Ltd. | Method and apparatus for transient detection and non-distortion time scaling |
| JPH11194796A (ja) * | 1997-10-31 | 1999-07-21 | Matsushita Electric Ind Co Ltd | 音声再生装置 |
| JP2001075571A (ja) * | 1999-09-07 | 2001-03-23 | Roland Corp | 波形生成装置 |
| JP2004527000A (ja) * | 2001-04-13 | 2004-09-02 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ信号の高品質タイムスケーリング及びピッチスケーリング |
Non-Patent Citations (1)
| Title |
|---|
| NSABIMANA, F.X. ET AL.: ""Audio Signal Decomposition for Pitch and Time Scaling"", PROCEEDINGS OF THE 3RD INTERNATIONAL SYMPOSIUM ON COMMUNICATIONS, CONTROL AND SIGNAL PROCESSING(ISCC, JPN6012036221, March 2008 (2008-03-01), pages 1285 - 1290, XP031269268, ISSN: 0002667213 * |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5425250B2 (ja) | 瞬間的事象を有する音声信号の操作装置および操作方法 | |
| CA2821035A1 (en) | Device and method for manipulating an audio signal having a transient event | |
| AU2012216539B2 (en) | Device and method for manipulating an audio signal having a transient event | |
| HK1154110A (en) | Device and method for manipulating an audio signal having a transient event | |
| HK1154303A (en) | Device and method for manipulating an audio signal having a transient event | |
| HK1154303B (en) | Device and method for manipulating an audio signal having a transient event | |
| HK1154111A (en) | Device and method for manipulating an audio signal having a transient event | |
| HK1151121B (en) | Device and method for manipulating an audio signal having a transient event | |
| HK1151121A (en) | Device and method for manipulating an audio signal having a transient event |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130709 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131008 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131126 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5425250 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |