JP2014041240A - タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム - Google Patents
タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム Download PDFInfo
- Publication number
- JP2014041240A JP2014041240A JP2012183083A JP2012183083A JP2014041240A JP 2014041240 A JP2014041240 A JP 2014041240A JP 2012183083 A JP2012183083 A JP 2012183083A JP 2012183083 A JP2012183083 A JP 2012183083A JP 2014041240 A JP2014041240 A JP 2014041240A
- Authority
- JP
- Japan
- Prior art keywords
- phase
- frequency
- audio data
- time
- calculation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 188
- 230000008859 change Effects 0.000 claims abstract description 39
- 230000008569 process Effects 0.000 claims description 122
- 238000006243 chemical reaction Methods 0.000 claims description 64
- 230000008602 contraction Effects 0.000 claims description 64
- 238000005070 sampling Methods 0.000 claims description 21
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 36
- 238000001228 spectrum Methods 0.000 description 20
- 239000000872 buffer Substances 0.000 description 19
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 238000010924 continuous production Methods 0.000 description 10
- 230000006866 deterioration Effects 0.000 description 8
- 238000009527 percussion Methods 0.000 description 7
- 238000012423 maintenance Methods 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 101100173586 Schizosaccharomyces pombe (strain 972 / ATCC 24843) fft2 gene Proteins 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000003325 tomography Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
【解決手段】デジタルオーディオデータを、周波数成分ごとの振幅と位相に変換するFFT部21と、デジタルオーディオデータを、FFT部21の実行タイミングから時間伸縮長だけ異なる実行タイミングで再度FFT変換して得られた位相と、FFT部21で得られた位相の差分値を位相変化量として時間伸縮後の位相を推定し、位相連続処理を行う位相連続処理部33と、を備えた。
【選択図】図2
Description
図1(a)は、再生装置1の簡易ブロック図である。同図に示すように、再生装置1は、再生部2と、オーディオデータ処理部3(オーディオデータ処理装置)と、バッファメモリ4と、オーディオデータ出力部5と、を備えている。再生部2は、CDなどのデバイスから楽曲・楽音を読み出して再生する。オーディオデータ処理部3は、CPU(Central Processing Unit)またはDSP(Digital Signal Processor)によって主要部が構成され、再生部2によって再生されたデジタルオーディオデータ(以下、単に「オーディオデータ」と称する)をバッファメモリ4に格納すると共に、バッファメモリ4から読み出したオーディオデータに対し、デジタル信号処理を施す。なお、バッファメモリ4は、入力用のバッファメモリ4(以下、「入力バッファ4a」と称する)と、出力用のバッファメモリ4(以下、「出力バッファ4b」と称する)と、から成る。オーディオデータ出力部5は、オーディオデータ処理部3による処理後のオーディオデータ(出力バッファ4bから読み出したオーディオデータ)を、外部(アンプおよびスピーカーを有する出力装置など)に出力する。
次に、図6を参照し、本発明の第2実施形態について説明する。上記の第1実施形態では、振幅の時間変化率から得られる正規化振幅差分値に基づいてアタック部を検出したが、本実施形態は、位相の時間変化率から得られる位相断層度に基づいてアタック部を検出する点で異なる。以下、第1実施形態と異なる点のみ説明する。なお、本実施形態において、第1実施形態と同様の構成部分については同様の符号を付し、詳細な説明を省略する。また、第1実施形態と同様の構成部分について適用される変形例は、本実施形態についても同様に適用される。
次に、図7〜図11を参照し、本発明の第3実施形態について説明する。本実施形態では、位相演算処理として、位相リセット処理と位相連続処理以外に、ピーク位相維持処理を行う。当該「ピーク位相維持処理」とは、周波数スペクトルのスペクトルピークと、当該スペクトルピークに近接する近接周波数帯域の位相関係を維持する処理を指す。以下、「ピーク位相維持処理」の対象となるスペクトルピークの決定方法、および位相関係を維持するか否かの判定方法等について、主に説明する。なお、本実施形態においても、上記の各実施形態と同様の構成部分については同様の符号を付し、詳細な説明を省略する。また、上記の各実施形態と同様の構成部分について適用される変形例は、本実施形態についても同様に適用される。
Claims (9)
- デジタルオーディオデータを、周波数成分ごとの振幅と位相に変換する第1の周波数変換ステップと、
前記デジタルオーディオデータを、前記第1の周波数変換ステップの実行タイミングから時間伸縮長だけ異なる実行タイミングで、周波数成分ごとの振幅と位相に変換する第2の周波数変換ステップと、
前記第1の周波数変換ステップで得られた位相と、前記第2の周波数変換ステップで得られた位相の差分値を、位相変化量とし、時間伸縮後の位相を推定する位相推定ステップと、を実行することを特徴とするタイムスケーリング方法。 - 前記時間伸縮長は、時間伸縮率と、出力オーバーラップ数の乗算値に基づいて演算される長さであることを特徴とする請求項1に記載のタイムスケーリング方法。
- 振幅および/または位相の時間変化率の演算結果を用いて異なる位相切替判別を行う複数の位相切替判別処理の処理結果に応じ、前記周波数成分ごとの位相が、前記第1の周波数変換ステップの演算結果そのものとして位相のリセット処理を行う位相リセット処理と、前記周波数成分ごとの位相が、前記第1の周波数変換ステップの前回の演算結果から時間伸縮を考慮して連続変化したものとして位相の連続化処理を行う位相連続処理と、のいずれの位相演算処理を行うかを判別する位相演算処理判別ステップと、
前記位相演算処理判別ステップの判別結果に応じて、前記位相リセット処理または前記位相連続処理を行う位相演算処理ステップと、を実行し、
前記第1の周波数変換ステップ、前記第2の周波数変換ステップおよび前記位相推定ステップは、前記位相連続処理を行う場合に実行されることを特徴とする請求項1または2に記載のタイムスケーリング方法。 - 前記複数の位相切替判別処理は、異なる周波数帯域ごとにアタック部の有無を判別するものであり、
前記位相演算処理ステップでは、前記複数の位相切替判別処理の判別により前記アタック部「有」と判別された場合、前記位相リセット処理を行い、前記アタック部「無」と判別された場合、前記位相連続処理を行うことを特徴とする請求項3に記載のタイムスケーリング方法。 - 前記位相演算処理ステップによる位相演算処理後の各周波数成分を、デジタルオーディオデータに変換する周波数逆変換ステップと、
前記周波数逆変換ステップによる周波数逆変換処理時に、時間伸縮率に比例して周波数逆変換後のデジタルオーディオデータのデータ数を増減させる時間伸縮演算ステップと、をさらに実行することを特徴とする請求項3または4に記載のタイムスケーリング方法。 - 請求項1ないし5のいずれか1項に記載のタイムスケーリング方法における各ステップと、
前記デジタルオーディオデータのサンプリング周波数を変更することで、時間伸縮および音高変更を行うサンプリングレート変換演算ステップと、を実行し、
前記タイムスケーリング方法の各ステップによる時間伸縮長と、前記サンプリングレート変換演算ステップによる時間伸縮長とが相殺され、音高のみが変更されることを特徴とするピッチシフト方法。 - デジタルオーディオデータを、周波数成分ごとの振幅と位相に変換する第1の周波数変換手段と、
前記デジタルオーディオデータを、前記第1の周波数変換手段の実行タイミングから時間伸縮長だけ異なる実行タイミングで、周波数成分ごとの振幅と位相に変換する第2の周波数変換手段と、
前記第1の周波数変換手段で得られた位相と、前記第2の周波数変換手段で得られた位相の差分値を、位相変化量とし、時間伸縮後の位相を推定する位相推定手段と、を備えたことを特徴とするオーディオデータ処理装置。 - コンピューターに、請求項1ないし5のいずれか1項に記載のタイムスケーリング方法における各ステップを実行させるためのプログラム。
- コンピューターに、請求項6に記載のピッチシフト方法における各ステップを実行させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012183083A JP2014041240A (ja) | 2012-08-22 | 2012-08-22 | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012183083A JP2014041240A (ja) | 2012-08-22 | 2012-08-22 | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2014041240A true JP2014041240A (ja) | 2014-03-06 |
Family
ID=50393542
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012183083A Pending JP2014041240A (ja) | 2012-08-22 | 2012-08-22 | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2014041240A (ja) |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0950293A (ja) * | 1995-08-07 | 1997-02-18 | Fujitsu Ltd | 音声信号変換装置および超音波診断装置 |
| WO2006070768A1 (ja) * | 2004-12-27 | 2006-07-06 | P Softhouse Co., Ltd. | オーディオ波形処理装置、方式およびプログラム |
| JP2009237589A (ja) * | 2003-12-25 | 2009-10-15 | Casio Comput Co Ltd | 音声分析合成装置、及びプログラム |
| WO2011048792A1 (ja) * | 2009-10-21 | 2011-04-28 | パナソニック株式会社 | 音響信号処理装置、音響符号化装置および音響復号装置 |
| WO2011089029A1 (en) * | 2010-01-19 | 2011-07-28 | Dolby International Ab | Improved subband block based harmonic transposition |
| JP2012002858A (ja) * | 2010-06-14 | 2012-01-05 | Pioneer Electronic Corp | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム |
-
2012
- 2012-08-22 JP JP2012183083A patent/JP2014041240A/ja active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0950293A (ja) * | 1995-08-07 | 1997-02-18 | Fujitsu Ltd | 音声信号変換装置および超音波診断装置 |
| JP2009237589A (ja) * | 2003-12-25 | 2009-10-15 | Casio Comput Co Ltd | 音声分析合成装置、及びプログラム |
| WO2006070768A1 (ja) * | 2004-12-27 | 2006-07-06 | P Softhouse Co., Ltd. | オーディオ波形処理装置、方式およびプログラム |
| WO2011048792A1 (ja) * | 2009-10-21 | 2011-04-28 | パナソニック株式会社 | 音響信号処理装置、音響符号化装置および音響復号装置 |
| WO2011089029A1 (en) * | 2010-01-19 | 2011-07-28 | Dolby International Ab | Improved subband block based harmonic transposition |
| JP2012002858A (ja) * | 2010-06-14 | 2012-01-05 | Pioneer Electronic Corp | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム |
Non-Patent Citations (1)
| Title |
|---|
| JPN6016034533; Robert Bristow-JOHNSON, et al.: 'Intraframe Time-Scaling of Nonstationary Sinusoids within the Phase Vocoder' Proc. 2001 IEEE Workshop on the Applications of Signal Processing to Audio and Acoustics , 20011024, pp.215-218, IEEE * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4823804B2 (ja) | コード名検出装置及びコード名検出用プログラム | |
| JP4767691B2 (ja) | テンポ検出装置、コード名検出装置及びプログラム | |
| JP4672613B2 (ja) | テンポ検出装置及びテンポ検出用コンピュータプログラム | |
| US8392006B2 (en) | Detecting if an audio stream is monophonic or polyphonic | |
| US8153882B2 (en) | Time compression/expansion of selected audio segments in an audio file | |
| US8198525B2 (en) | Collectively adjusting tracks using a digital audio workstation | |
| US20110011244A1 (en) | Adjusting a variable tempo of an audio file independent of a global tempo using a digital audio workstation | |
| WO2007010637A1 (ja) | テンポ検出装置、コード名検出装置及びプログラム | |
| US20110015767A1 (en) | Doubling or replacing a recorded sound using a digital audio workstation | |
| Ryynanen et al. | Accompaniment separation and karaoke application based on automatic melody transcription | |
| JP2017090671A (ja) | 調律推定装置、評価装置およびデータ処理装置 | |
| JP6118522B2 (ja) | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム | |
| JP2012002858A (ja) | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム | |
| JP5229998B2 (ja) | コード名検出装置及びコード名検出用プログラム | |
| JP4645241B2 (ja) | 音声処理装置およびプログラム | |
| JP2005292207A (ja) | 音楽分析の方法 | |
| JP6263383B2 (ja) | 音声信号処理装置、音声信号処理装置の制御方法、プログラム | |
| WO2019043797A1 (ja) | 楽曲解析装置および楽曲解析プログラム | |
| JP6281211B2 (ja) | 音響信号のアライメント装置、アライメント方法及びコンピュータプログラム | |
| JP6235198B2 (ja) | 音声信号処理方法、音声信号処理装置およびプログラム | |
| JP5005445B2 (ja) | コード名検出装置及びコード名検出用プログラム | |
| JP4932614B2 (ja) | コード名検出装置及びコード名検出用プログラム | |
| JP6263382B2 (ja) | 音声信号処理装置、音声信号処理装置の制御方法、プログラム | |
| JP2014041240A (ja) | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム | |
| WO2010146624A1 (ja) | 音声信号処理装置のタイムスケーリング方法、音声信号処理装置のピッチシフト方法、音声信号処理装置およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150219 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20150320 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150722 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20151127 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160817 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160906 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170307 |