[go: up one dir, main page]

JP2003263170A - Method for analyzing waveform of musical sound and method for analyzing and synthesizing waveform of musical sound - Google Patents

Method for analyzing waveform of musical sound and method for analyzing and synthesizing waveform of musical sound

Info

Publication number
JP2003263170A
JP2003263170A JP2003043802A JP2003043802A JP2003263170A JP 2003263170 A JP2003263170 A JP 2003263170A JP 2003043802 A JP2003043802 A JP 2003043802A JP 2003043802 A JP2003043802 A JP 2003043802A JP 2003263170 A JP2003263170 A JP 2003263170A
Authority
JP
Japan
Prior art keywords
waveform
analysis
musical tone
peak
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003043802A
Other languages
Japanese (ja)
Other versions
JP3741106B2 (en
Inventor
Masahiro Kakishita
下 正 尋 柿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2003043802A priority Critical patent/JP3741106B2/en
Publication of JP2003263170A publication Critical patent/JP2003263170A/en
Application granted granted Critical
Publication of JP3741106B2 publication Critical patent/JP3741106B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To highly accurately analyze the waveform of a musical sound. <P>SOLUTION: In analyzing the waveform of a musical sound as shown in the figure, a point of which the amplitude is a maximum value is set as a specific point and spectral analysis is performed by short Fourier transformation while successively shifting a time window in the positive direction of a time base from the specific point. Then the spectral analysis is performed while successively shifting the time window in the negative direction of the time base from the specific point. The locus of peaks detected in each frame is judged in both the directions to follow the locus. The spectral analysis is performed under a different analytical condition in each harmonic. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、楽音波形分析方法
及び楽音波形分析合成方法に関する。
TECHNICAL FIELD The present invention relates to a musical tone waveform analysis method and a musical tone waveform analysis / synthesis method.

【0002】[0002]

【従来の技術】楽音合成の一つの方法として、楽音波形
を分析し、該分析することにより得られたもとの楽音波
形に含まれている周波数成分の信号を発生させてこれら
を加算することにより、楽音波形を合成する分析・
(再)合成(Analysis & (Re)Synthesis)方式が知られ
ている。この楽音波形分析合成方式においては、まず、
楽音波形をスペクトル解析してその楽音に含まれている
基音周波数およびその倍音周波数に対応する線スペクト
ル成分を抽出する。通常、このスペクトル解析は、時間
窓(ウインドウ)を用いたフーリエ変換による短時間ス
ペクトル解析を用いて行われている。すなわち、分析対
象となる楽音をサンプリングし、該楽音波形サンプルに
窓関数を掛けてFFT(高速フーリエ変換:Fast Fouri
er Transform)を行い、該フーリエ変換出力の振幅デー
タからピークを成す全ての周波数位置を検出する。以上
の処理を、前記時間窓を移動しながら行い(短時間フー
リエ変換(SFFT:Short-time Fast Fourier Transf
orm))、各フレームにおけるピークを検出し、得られ
たピークのうち、軌跡を成すものを追跡する。そして、
得られた軌跡の中から所望のデータを選択し、その一つ
ひとつを正弦波合成し、加算することによりもとの楽音
波形のうち決定論的に得られる波形を合成する。そし
て、前記もとの楽音波形から前記決定論的に得られる波
形(Deterministic Wave)を減算することにより残差波
形(Residual Wave)を得る。
2. Description of the Related Art As one method of synthesizing a musical tone, a musical tone waveform is analyzed, a signal of a frequency component contained in the original musical tone waveform obtained by the analysis is generated, and these are added, Analysis that synthesizes musical sound waveforms
An (Analysis & (Re) Synthesis) method is known. In this tone waveform analysis and synthesis method, first,
The musical tone waveform is spectrally analyzed to extract line spectrum components corresponding to the fundamental frequency and its overtone frequency contained in the musical tone. Usually, this spectrum analysis is performed using short-time spectrum analysis by Fourier transform using a time window. That is, a musical tone to be analyzed is sampled, and the musical tone waveform sample is multiplied by a window function to obtain an FFT (Fast Fourier Transform).
er Transform) to detect all frequency positions forming a peak from the amplitude data of the Fourier transform output. The above processing is performed while moving the time window (short-time fast Fourier transform (SFFT)).
orm)), the peaks in each frame are detected, and the obtained peaks are traced. And
Desired data is selected from the obtained loci, and each of them is sinusoidally synthesized and added to synthesize a deterministically obtained waveform of the original musical tone waveform. Then, a residual waveform is obtained by subtracting the deterministically obtained waveform (Deterministic Wave) from the original musical tone waveform.

【0003】前記決定論的に得られた波形は、前記軌跡
のデータをモディファイすることによりモディファイす
ることができ、前記残差波形はEQ(イコライザ)やF
FT他の信号処理によりモディファイすることができ
る。このようにしてモディファイされた決定論的に得ら
れる波形と前記残差波形とを加算することにより、所望
の楽音波形を得ることができる。なお、上記楽音波形の
分析は、上述したような楽音波形の合成のためだけでは
なく、楽器音の特徴と楽器の物理的性質との関連を明ら
かにするため、あるいは、楽器音の機械認識などのため
にも用いられている。
The deterministically obtained waveform can be modified by modifying the data of the locus, and the residual waveform is EQ (equalizer) or F.
It can be modified by signal processing such as FT. A desired musical tone waveform can be obtained by adding the thus-determined deterministically obtained waveform and the residual waveform. The analysis of the musical tone waveform is not only for synthesizing the musical tone waveform as described above, but also for clarifying the relationship between the characteristic of the musical instrument sound and the physical property of the musical instrument, or the machine recognition of the musical instrument sound, etc. It is also used for.

【0004】図20は、このような波形分析の結果得ら
れた前記ピークデータの一例を示す図である。この図に
示す例は、ピアノの中央ハ(C4,基音周波数は約26
1.63Hz)を分析したものであり、横軸は時間(単
位はms)、縦軸は周波数(単位はHz)であり、前記
時間窓に対応する各フレーム毎に検出されたピークデー
タが点で表されている。また、横方向の細線は、前記基
音周波数およびその倍音の周波数を表している。この図
において、全ての点は独立に存在しており、図において
軌跡を描いている線を見てとることができるが、これが
つながっているとの情報はまだ得られていない。また、
線として見える部分以外はノイズであったり、非調和な
成分であったり、あるいは、FFTの窓関数のサイドロ
ーブが表示されているものとみなされる。このようなピ
ークデータから軌跡を成すデータを抽出するためには、
各フレームタイムにおける各ピーク点がどのように接続
しているかを判定することが必要である。このために、
一般に、各フレームで倍音関係にある成分をピッキング
することが行われている。すなわち、既知の基音周波数
FBに対して、その整数倍、2×FB,3×FB,…の
周波数近辺で最大の振幅を持つ点を倍音であると判断
し、各フレーム毎に倍音データをピックアップしていく
方法がとられている。
FIG. 20 is a diagram showing an example of the peak data obtained as a result of such waveform analysis. In the example shown in this figure, the center C of a piano (C4, the fundamental frequency is about 26
1.63 Hz), the horizontal axis is time (unit is ms), the vertical axis is frequency (unit is Hz), and peak data detected for each frame corresponding to the time window is a point. It is represented by. Further, the horizontal thin line represents the fundamental frequency and the frequency of the overtone thereof. In this figure, all points exist independently, and you can see the line that draws the locus in the figure, but information that they are connected has not yet been obtained. Also,
It is considered that noise is present in the area other than the portion visible as a line, that it is an anharmonic component, or that the side lobe of the window function of the FFT is displayed. In order to extract the data that forms the locus from such peak data,
It is necessary to determine how the peak points at each frame time are connected. For this,
Generally, picking of a component having a harmonic relationship in each frame is performed. That is, it is determined that the point having the maximum amplitude in the vicinity of the frequency of 2 × FB, 3 × FB, ..., which is an integral multiple of the known fundamental frequency FB, is the overtone, and the overtone data is picked up for each frame. The method of doing is taken.

【0005】[0005]

【発明が解決しようとする課題】図21は、前記図20
における基音の20msecあたりを拡大した図であ
る。この図において、時間軸を右から左へ見ると、時刻
Aにおいてピークは矢印の方向へつながるとするのが正
解であろう。しかしながら、上述した従来の方法では、
各フレーム各々で倍音周波数に最も近いものを選択する
という条件で追従が行われているため、時間Aでaのピ
ークにつながるのか、それともbのピークへつながるの
かが確定しないという問題点がある。
FIG. 21 corresponds to FIG.
It is the figure which expanded about 20 msec of the fundamental tone in. In this figure, when the time axis is viewed from right to left, it is correct that the peaks are connected in the direction of the arrow at time A. However, in the conventional method described above,
Since the tracking is performed under the condition that the one closest to the harmonic overtone frequency is selected in each frame, there is a problem that it is not certain whether the peak at time a is connected to the peak at a or the peak at b.

【0006】また、図22は、ピアノのC1(32.7
03Hz)の楽音ピークを上述した従来の方法で検出し
た結果を示す図である。このデータは、時間窓の幅(ウ
インドウサイズ)をC1の基本周期30.5msの8
倍、244.6msとし、ウインドウの移動時間(ウイ
ンドウホップサイズ)を基本周期の1/8(3.82m
s)として得たものである。また、図23は、前記図1
2の高調波部分におけるのピークを拡大した図である。
なお、これらの図において、横軸は時間、縦軸は周波
数、横方向の細線は基音周波数およびその倍音を示して
いる。図23をみると、高次の倍音の軌跡が倍音周波数
からかなり外れていることが判る。これは、例えば、8
倍音(261.62Hz)の成分では、前述のウインド
ウ内に64周期入ってしまうためであると考えられる。
短時間高速フーリエ変換(SFFT)の不確定性とし
て、周波数を正確に得ようとするにはある程度以上のウ
インドウサイズが必要である。32.703Hz付近を
正確に検出するためには上述程度以上のウインドウサイ
ズが必要である。しかしウインドウが広いと時間分解能
が悪くなってしまうという問題点がある。一般に、SF
FTの性質として一つのウインドウ内では周波数、振幅
が変化してもその情報を得ることができない。高調波成
分の方が変化が速いとするならば、8倍音は64周期内
に周波数、振幅の揺らぎが生じていると考えられる。こ
の状況はさらに高調波であればあるほど顕著となる。
FIG. 22 shows a piano C1 (32.7).
It is a figure which shows the result of having detected the musical tone peak of (03 Hz) by the conventional method mentioned above. This data shows that the width of the time window (window size) is 8 when the basic period of C1 is 30.5 ms.
Double, 244.6 ms, and the window moving time (window hop size) is 1/8 of the basic period (3.82 m).
It was obtained as s). In addition, FIG. 23 corresponds to FIG.
It is the figure which expanded the peak in the higher harmonic part of 2.
In these figures, the horizontal axis represents time, the vertical axis represents frequency, and the horizontal thin line represents the fundamental frequency and its overtone. It can be seen from FIG. 23 that the locus of higher harmonics is considerably deviated from the harmonic frequency. This is, for example, 8
It is considered that this is because the overtone (261.62 Hz) component includes 64 cycles in the above window.
As an uncertainty of the short-time fast Fourier transform (SFFT), a certain window size or more is required to accurately obtain the frequency. In order to accurately detect around 32.703 Hz, a window size equal to or larger than the above is required. However, when the window is wide, there is a problem that the time resolution becomes poor. Generally, SF
As a property of FT, even if the frequency and the amplitude change within one window, the information cannot be obtained. If it is assumed that the harmonic component changes faster, it is considered that the 8th overtone has frequency and amplitude fluctuations within 64 cycles. This situation becomes more remarkable as the number of harmonics increases.

【0007】そこで、このような問題点を防止するため
に、被解析信号をBPFをかけることにより帯域分割
し、分割された帯域毎にウインドウサイズ、ウインドウ
のホップサイズを決めてSFFTする方法が行なわれて
いる。この方法は、図24に示す楽音分析合成装置のよ
うに、ローパスフィルタ(LPF)101、複数のバン
ドパスフィルタ(BPF)102およびハイパスフィル
タ(HPF)103を用いて被解析信号を複数の周波数
帯域に分割し、乗算器104を用いて帯域分割された各
周波数帯の信号にそれぞれ対応する時間窓を掛け、それ
ぞれ対応して設けられたSFFT部105により各々の
帯域のスペクトル解析を実行し、各解析結果についてそ
れぞれ別個に設けられたピーク検出及びピーク追従処理
部106で前記ピークの軌跡の追従を行い、正弦波合成
部107において、前記それぞれの帯域において検出さ
れた軌跡に対応する正弦波を生成し、それらを合成して
前述した決定論的波形(Deterministic Wave)を出力す
るものである。
Therefore, in order to prevent such a problem, a method is used in which the signal to be analyzed is band-divided by applying BPF, and the window size and the hop size of the window are determined for each divided band to carry out the SFFT. Has been. This method uses a low-pass filter (LPF) 101, a plurality of band-pass filters (BPF) 102, and a high-pass filter (HPF) 103 as in the tone analysis / synthesis apparatus shown in FIG. , And the signals of the respective frequency bands, which are band-divided by the multiplier 104, are multiplied by the corresponding time windows, and the spectrum analysis of each band is executed by the corresponding SFFT units 105. The peak detection and peak tracking processing unit 106 separately provided for the analysis result tracks the locus of the peak, and the sine wave synthesizing unit 107 generates sine waves corresponding to the loci detected in the respective bands. Then, they are combined and the above-mentioned deterministic waveform (Deterministic Wave) is output.

【0008】しかし、この方法では、LPF104、複
数のBPF102およびHPF103の位相特性を均一
に設計することが困難であり、このようにして解析した
結果得られた各倍音の軌跡から正弦波合成によりDeterm
inistic Waveを合成したとしても、被解析信号との間に
位相のずれが生じてしまい、被解析信号からDeterminis
tic Waveを減算するという方法ではResidual Waveは得
られないという問題点があった。
However, with this method, it is difficult to uniformly design the phase characteristics of the LPF 104, the plurality of BPFs 102, and the HPF 103, and from the trajectories of the overtones obtained as a result of the analysis in this way, Determining by sine wave synthesis
Even if the inistic wave is combined, a phase shift occurs between the signal under analysis and the signal under analysis
There was a problem that Residual Wave could not be obtained by the method of subtracting tic Wave.

【0009】すなわち、従来技術においては、基音周波
数が低く、高次倍音が豊富に含まれているような波形に
おいて、これを分離しようとする際、SFFTの不確定
性により、基本周波数の周波数精度を上げようとしてウ
インドウサイズを大きくすると、高調波の変化に追従す
ることができなくなる。また、高調波の変化に追従しよ
うとしてウインドウサイズを小さくすると、基本周波数
の周波数精度が低くなってしまい、DeterministicとRes
idualの分離精度が悪くなるという問題点がある。
That is, in the prior art, when trying to separate a waveform having a low fundamental frequency and abundant high-order overtones, the frequency accuracy of the fundamental frequency is increased due to the uncertainty of the SFFT. If the window size is increased in an attempt to raise the value, it becomes impossible to follow the change in the harmonic. Also, if the window size is reduced in order to follow changes in harmonics, the frequency accuracy of the fundamental frequency will decrease, and Deterministic and Res
There is a problem that the separation accuracy of idual becomes worse.

【0010】そこで本発明は、各フレームにおけるピー
クの追従を正確に行うことのできる高精度の楽音分析方
法および装置を提供することを目的としている。また、
基本周波数が低く、高次倍音が豊富に含まれているよう
な波形であっても、高精度に分離することのできる楽音
波形分離方法および装置を提供することを目的としてい
る。
Therefore, it is an object of the present invention to provide a high-accuracy tone analysis method and apparatus capable of accurately following a peak in each frame. Also,
It is an object of the present invention to provide a musical tone waveform separation method and device that can separate with high accuracy even if the waveform has a low fundamental frequency and is rich in high-order overtones.

【0011】[0011]

【課題を解決するための手段】上記目的を達成するため
に、本発明の楽音波形分析方法は、分析対象楽音波形サ
ンプルに対し順次シフトする時間窓を用いてフーリエ変
換を行うことにより前記時間窓の位置に対応する各フレ
ームにおけるピーク点を検出してスペクトル解析を行う
楽音波形分析方法において、当該分析対象楽音の複数の
倍音のグループ毎にそれぞれ対応して設定された分析条
件を用いて前記スペクトル解析を行うようにしたもので
ある。
In order to achieve the above object, the musical tone waveform analysis method of the present invention is characterized in that the time window is obtained by performing a Fourier transform using time windows sequentially shifted with respect to the musical tone waveform sample to be analyzed. In a musical tone waveform analysis method for detecting a peak point in each frame corresponding to the position of the spectrum and performing spectrum analysis, the spectrum is analyzed using analysis conditions set corresponding to each of a plurality of overtone groups of the musical tone to be analyzed. It is designed to be analyzed.

【0012】また、本発明の楽音波形分析合成方法は、
楽音波形から線スペクトル成分を抽出し、該抽出した線
スペクトル成分に対応する正弦波信号波形を生成して合
成し、前記楽音波形から前記合成した信号波形を減算し
た残差成分と前記合成した信号波形とを加算することに
より楽音を合成する楽音波形分析合成方法であって、前
記楽音波形を分析するとき、当該楽音波形の複数の倍音
のグループ毎にそれぞれ対応して設定された分析条件を
用いて前記楽音波形の分析を行い、該分析結果に基づい
て前記線スペクトル成分を抽出するようにしたものであ
る。さらに、前記倍音のグループに対応する前記残差成
分を抽出し、該残差成分を順次さらに異なるグループ対
応に分析するようにしたものである。
The musical tone waveform analysis and synthesis method of the present invention is
A line spectrum component is extracted from the musical tone waveform, a sine wave signal waveform corresponding to the extracted line spectrum component is generated and synthesized, and a residual component obtained by subtracting the synthesized signal waveform from the musical tone waveform and the synthesized signal. A method of analyzing and synthesizing a musical tone waveform by adding a waveform and a musical tone, wherein when the musical tone waveform is analyzed, analysis conditions set respectively corresponding to a plurality of overtone groups of the musical tone waveform are used. Then, the musical tone waveform is analyzed, and the line spectrum component is extracted based on the analysis result. Further, the residual components corresponding to the overtone groups are extracted, and the residual components are sequentially analyzed for different groups.

【0013】[0013]

【発明の実施の形態】図1は、本発明の楽音分析方法が
実行される楽音分析合成装置のハードウエア構成の一例
を示すブロック図である。この図において、1はこの楽
音分析合成装置全体の制御を行うCPU、2はCPU1
が実行する各種制御プログラム、楽音分析プログラムお
よび楽音合成プログラムなどの各種プログラムを記憶す
るプログラムメモリ、3は各種制御情報、後述する各種
のデータの記憶および一時記憶領域(バッファ)やワー
クエリアとして使用されるデータメモリ、4は表示装
置、5はキーボードおよびポインティングデバイスなど
の入力装置、6は鍵盤などの演奏操作子、7は楽音を合
成する楽音合成部(シンセサイズユニット)、8は楽音
波形サンプルをアナログ信号に変換し、図示しないサウ
ンドシステムに出力するデジタルアナログ変換器(DA
C)である。また、9は電話回線、インターネット、L
ANなどの通信ネットワーク11と接続するためのネッ
トワークインターフェース回路、10はシステムバスで
ある。なお、この図1に示したハードウエア構成におい
ては、楽音合成部7および演奏操作子6が設けられてい
るが、これらは必ずしも設けることが必要ではない。ま
た、図示していないが、CD−ROM、DVD、MO、
FDなどの外部記憶媒体の駆動装置を接続してもよいこ
とは当然である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a block diagram showing an example of the hardware configuration of a musical tone analysis / synthesis apparatus for executing the musical tone analysis method of the present invention. In this figure, 1 is a CPU that controls the entire tone analysis / synthesis apparatus, and 2 is a CPU 1.
The program memory 3 for storing various programs such as various control programs, musical tone analysis programs and musical tone synthesizing programs executed by is used for storing various control information, various data described later, and a temporary storage area (buffer) or work area. Data memory, 4 is a display device, 5 is an input device such as a keyboard and pointing device, 6 is a performance operator such as a keyboard, 7 is a musical sound synthesizing unit (synthesizing unit) for synthesizing musical sounds, and 8 is a musical sound waveform sample. Digital-to-analog converter (DA that converts analog signals and outputs to a sound system not shown)
C). Also, 9 is a telephone line, the Internet, L
A network interface circuit 10 for connecting to a communication network 11 such as an AN is a system bus. In the hardware configuration shown in FIG. 1, the musical tone synthesizer 7 and the performance operator 6 are provided, but they need not be provided. Although not shown, a CD-ROM, DVD, MO,
It goes without saying that a drive device for an external storage medium such as an FD may be connected.

【0014】図2は、前記楽音合成部7の内部構成の例
を示す図であり、図2の(a)は、前述した各軌跡に対
応する周波数成分の波形を発生する複数個の正弦波波形
発生部を有する場合の一構成例を示す図である。図2の
(a)において、71および73は前記システムバス1
0を介して前記CPU1に接続するためのインターフェ
ース回路、72は正弦波波形演算部であり、図示するよ
うに複数の正弦波波形発生器SWG1〜SWGnが設け
られている。この複数の正弦波波形発生器SWG1〜S
WGnは、前記楽音波形を分析して検出された各ピーク
点の軌跡の各々に対応した正弦波波形を生成するもので
ある。また、74は残差波形演算部であり、前述した残
差波形(Residual Wave)を生成する。さらに、75は
ミキサであり、前記正弦波波形演算部72の出力と前記
残差波形演算部74の出力とを合成して、合成楽音を前
記DAC8に出力する。
FIG. 2 is a diagram showing an example of the internal configuration of the musical sound synthesizing section 7. FIG. 2 (a) shows a plurality of sine waves that generate the waveforms of the frequency components corresponding to the respective loci described above. It is a figure which shows one structural example in the case of having a waveform generation part. In FIG. 2A, 71 and 73 are the system bus 1
An interface circuit for connecting to the CPU 1 via 0, 72 is a sine wave waveform calculator, and is provided with a plurality of sine wave waveform generators SWG1 to SWGn as shown in the figure. The plurality of sine wave waveform generators SWG1 to SWG
The WGn generates a sine wave waveform corresponding to each locus of each peak point detected by analyzing the musical tone waveform. Reference numeral 74 denotes a residual waveform calculation unit, which generates the residual waveform (Residual Wave) described above. Further, 75 is a mixer, which synthesizes the output of the sine wave waveform computing unit 72 and the output of the residual waveform computing unit 74 and outputs a synthesized musical tone to the DAC 8.

【0015】図2の(b)は前記楽音合成部7の他の構
成例を示す図である。この図において、76は前記CP
U1とのインターフェース回路、77は波形メモリ、7
8は前記波形メモリ77から波形データの読出を制御す
る位相発生部、79は前記読み出された波形サンプルに
対して所望の加工を行う波形加工部である。この例にお
いては、前記楽音波形サンプルを分析して得られたピー
ク点の各軌跡に対応する正弦波波形の合成波形および前
記残差波形の合成波形が前記CPU1によりソフトウエ
アにより演算生成され、前記波形メモリ77に格納され
るようになされている。そして、当該楽音発生制御信号
に応じて、前記位相発生部78により前記波形メモリ7
7から当該合成楽音信号波形が読み出され、波形加工部
79を介して、前記DAC8に出力されることなる。
FIG. 2B is a diagram showing another example of the configuration of the musical tone synthesizer 7. In this figure, 76 is the CP
Interface circuit with U1, 77 is waveform memory, 7
Reference numeral 8 is a phase generator that controls the reading of waveform data from the waveform memory 77, and 79 is a waveform processing unit that performs desired processing on the read waveform sample. In this example, a synthesized waveform of a sine wave waveform and a synthesized waveform of the residual waveform corresponding to respective loci of peak points obtained by analyzing the musical tone waveform sample are arithmetically generated by the CPU 1 by software, It is adapted to be stored in the waveform memory 77. Then, in response to the tone generation control signal, the phase generator 78 causes the waveform memory 7 to operate.
The synthesized musical tone signal waveform is read from 7 and output to the DAC 8 via the waveform processing section 79.

【0016】以下、本発明の楽音分析方法における波形
分析処理について説明する。図3は、前記図20と同じ
ピアノのC4打鍵音の時間波形の一例を示す図である。
この波形を使ってピーク追従する場合を例にとって説明
する。図4は、波形分析処理を説明するためのフローチ
ャートである。なお、波形分析処理を実行するときに
は、分析対象波形の先頭からフレームを少しずつずらし
て、ピークを見つけ、すべてのピークを見つけてからピ
ークを追従することも当然可能であるが、すべてのフレ
ームの全てのピークデータを貯えておくためには、膨大
な記憶容量を必要とする場合がある。そこで、本発明に
おいては、分析フレーム毎に追従をチェックし、追従可
能なピークのみを記憶するようにしている。
The waveform analysis processing in the tone analysis method of the present invention will be described below. FIG. 3 is a diagram showing an example of a time waveform of a C4 keystroke sound of the same piano as in FIG.
A case will be described below as an example where peaks are tracked using this waveform. FIG. 4 is a flowchart for explaining the waveform analysis process. When performing the waveform analysis process, it is naturally possible to shift the frame little by little from the beginning of the waveform to be analyzed, find the peaks, find all the peaks, and then follow the peaks. A huge storage capacity may be required to store all the peak data. Therefore, in the present invention, tracking is checked for each analysis frame, and only peaks that can be tracked are stored.

【0017】さて、波形分析処理が開始されると、ま
ず、ステップS1において、分析対象波形のサンプリン
グ処理が実行され、分析の対象となる楽器音のサンプリ
ングデータが前記データメモリ3に格納される。すなわ
ち、例えば、44.1kHzのサンプリング周波数で分
析対象楽音波形がサンプリングされ、前記図3に示した
ような分析対象波形がデータメモリ3に格納される。次
に、ステップS2に進み、分析条件が入力されるととも
に分析の前処理が行われる。すなわち、前記ステップS
1において格納された分析対象データの振幅調整、イコ
ライズ処理、フィルタリング処理などが行われ、同時に
分析範囲の設定も行われる。
When the waveform analysis processing is started, first, in step S1, sampling processing of the analysis target waveform is executed, and the sampling data of the musical instrument sound to be analyzed is stored in the data memory 3. That is, for example, the musical tone waveform to be analyzed is sampled at a sampling frequency of 44.1 kHz, and the waveform to be analyzed as shown in FIG. 3 is stored in the data memory 3. Next, in step S2, analysis conditions are input and analysis preprocessing is performed. That is, the step S
Amplitude adjustment, equalization processing, filtering processing, and the like of the analysis target data stored in 1 are performed, and at the same time, the analysis range is set.

【0018】続いて、ステップS3に進み、前記分析対
象データのエンベロープが最大となる時点(以下、アタ
ックマックスポイント(Attack Max Point)という)の
検出が行われる。これは、振幅レベルが最大となるアタ
ックマックスポイントでは、すべての追従が必要なピー
クが出揃っている可能性が大きいので、この時間波形の
振幅レベルが最大振幅を示す時間が窓サイズの中央位置
にくるようにして分析を開始するようにしているためで
ある。図3の例では、アタックマックスポイントはサン
プリング開始時点から42.9ms後に見つけられる。
この実施の形態では、サンプリング周波数が44.1k
Hzであるので、42.9msは1892点目と求めら
れる。これにより、追従が必要なピークをもらすことな
く検出することが可能となる。
Subsequently, in step S3, a time point at which the envelope of the data to be analyzed is maximized (hereinafter referred to as Attack Max Point) is detected. This is because there is a high possibility that all the peaks that need tracking follow at the attack max point where the amplitude level is the maximum, so the time when the amplitude level of this time waveform shows the maximum amplitude is at the center position of the window size. This is because the analysis is started in such a manner as to come out. In the example of FIG. 3, the attack max point is found 42.9 ms after the start of sampling.
In this embodiment, the sampling frequency is 44.1k.
Since it is Hz, 42.9 ms is obtained as the 1892th point. As a result, it becomes possible to detect a peak that needs to be tracked without leaking.

【0019】次に、ステップS4に進み、分析窓の初期
設定などが行われる。一般に、FFTの窓サイズは波形
の基本周期の整数倍とするのが適切であり、例えば、8
倍とされる。前記図3に示したC4打鍵音は基音周波数
が261.63Hzであり、その1周期に含まれるサン
プルポイント数は、サンプリング周波数fsを44.1
kHzとしたとき、168.6点となる。したがって、
窓サイズは、この8倍、1348点(小数以下四捨五
入)となる。また、FFTサイズは、2のベキ数でなけ
ればならず、前述のように、このFFTサイズが大きけ
れば大きいほど周波数分解能は向上する。しかし、あま
り大きすぎても計算時間がかかってしまうので、ここで
は、窓サイズを超える最少の2のベキ数を選ぶこととす
る。したがって、この例では、2048点と決定され
る。
Next, in step S4, the initialization of the analysis window and the like are performed. Generally, it is appropriate that the FFT window size is an integral multiple of the fundamental period of the waveform, for example, 8
To be doubled. The C4 keystroke sound shown in FIG. 3 has a fundamental frequency of 261.63 Hz, and the number of sampling points included in one cycle is 44.1 at the sampling frequency fs.
When it is set to kHz, it becomes 168.6 points. Therefore,
The window size is 8 times this, 1348 points (rounded up to the nearest whole number). Further, the FFT size must be a power of 2, and as described above, the larger the FFT size, the higher the frequency resolution. However, if it is too large, it takes a long time to calculate, so here, the minimum power number of 2 that exceeds the window size is selected. Therefore, in this example, 2048 points are determined.

【0020】続いて、ステップS5に進み、フレーム位
置を計数するフラグnを0に初期化する。そして、ステ
ップS6に進み、分析窓位置の設定を行う。前述のよう
に、アタックマックスポイントは1892点目であり、
窓サイズが1348点であるため、最初のフレームは1
218点目から2566点目となる。これを第0フレー
ムとする。続いて、ステップS7に進み、分析対象波形
の分析範囲が分析対象波形の分析範囲の最大値framemax
を超過したか否かを判定する。この判定結果がNOのと
きは、次のステップS8に進みFFT処理が実行され
る。また、この判定結果がYESのときは、ステップS
15に進む。
Succeedingly, in a step S5, a flag n for counting the frame position is initialized to 0. Then, in step S6, the analysis window position is set. As mentioned above, the attack max point is 1892 points,
The first frame is 1 because the window size is 1348 points
From the 218th point to the 2566th point. This is the 0th frame. Succeedingly, in step S7, the analysis range of the analysis target waveform is the maximum value framemax of the analysis range of the analysis target waveform.
It is determined whether or not is exceeded. If the determination result is NO, the process proceeds to the next step S8 and the FFT process is executed. If the determination result is YES, step S
Proceed to 15.

【0021】ステップS8においてFFT処理が実行さ
れ、ステップS9において、このFFT処理の結果から
ピークが求められる。このピークを求めた結果の例を図
5に示す。この第0フレームのそれぞれのピークをPK0-
1,PK0-2,…,PK0-M0と表すこととする。ここで、それ
ぞれのピークは、周波数(Frequency)、振幅(Magnitud
e)、位相(Phase)の3つの情報を有している。これをPK0
-1.Frequency,PK0-1.Magnitude,PK0-1.Phase,…と表
すこととする。なお、M0はフレーム0で検出されたピ
ークの総数である。これらのピークはリファレンス(Fr
ame n)として、前記データメモリ3中のバッファに格
納される。
The FFT processing is executed in step S8, and the peak is obtained from the result of the FFT processing in step S9. An example of the result of obtaining this peak is shown in FIG. Each peak of this 0th frame is PK0-
1, PK0-2, ..., PK0-M0. Here, each peak has a frequency (Frequency) and an amplitude (Magnitud
It has three pieces of information, e) and phase. This is PK0
-1.Frequency, PK0-1.Magnitude, PK0-1.Phase, ... Note that M0 is the total number of peaks detected in frame 0. These peaks are the reference (Fr
It is stored in a buffer in the data memory 3.

【0022】続いて、ステップS10に進み、フレーム
番号nが0であるか否かが判定される。処理開始直後に
おいてはn=0であるため、ステップS10の判定結果
がYESとなり、前記ステップS11が実行される。こ
のステップS11において、前記バッファに格納された
Frame 0のデータは、前記データメモリ3に確保された
分析結果を格納するテーブル領域中の対応する個所TFra
me 0に格納される。また、nが0でないときは、ステッ
プS12においてピーク追従処理が実行され、続いてス
テップS13において、前記分析結果を格納するテーブ
ルに追従結果が格納される。この追従処理の詳細につい
ては後述する。
Succeedingly, in a step S10, it is determined whether or not the frame number n is 0. Immediately after the start of processing, n = 0, so the determination result of step S10 is YES, and step S11 is executed. In this step S11, the data stored in the buffer
The data of Frame 0 corresponds to the corresponding location TFra in the table area for storing the analysis result secured in the data memory 3.
Stored in me 0. When n is not 0, the peak follow-up processing is executed in step S12, and subsequently, in step S13, the follow-up result is stored in the table for storing the analysis result. Details of this tracking process will be described later.

【0023】図6は、分析の結果得られたピークに関す
る情報を格納するテーブルのイメージを示す図である。
この図に示すテーブルにおいて、行は線スペクトル成
分、列は解析された全フレームであり、各セルには各フ
レームにおいて検出されたピークの番号を示している。
なお、ここでは、周波数の低い方から順に各ピーク点に
番号を付している。前記ステップS11により、このテ
ーブルのFrame 0の列に、前記ステップS9で得られた
各ピーク点の情報が書き込まれる。
FIG. 6 is a diagram showing an image of a table that stores information on peaks obtained as a result of analysis.
In the table shown in this figure, the rows are the line spectrum components, the columns are all the analyzed frames, and the number of the peak detected in each frame is shown in each cell.
In addition, here, each peak point is numbered in order from the lowest frequency. By the step S11, the information of each peak point obtained in the step S9 is written in the column of Frame 0 of this table.

【0024】前述したように、各ピーク点にそれぞれ周
波数、振幅および位相の3つの要素が含まれており、実
際には、この図6に示した線スペクトル成分数×総フレ
ーム数のデータが3枚分作成されることとなる。前述し
た楽音合成時には、このテーブルを読み出して、各行に
対応して正弦波波形発生器を割り当て、フレーム進行に
伴い、各データ(周波数、振幅および位相)に基づいて
正弦波波形を発生させることとなる。なお、前後のスペ
クトルの発生消滅具合をみて、正弦波波形発生器のチャ
ンネルの割り当てを柔軟に行うようにすれば、楽音合成
時における処理効率を向上させることができ、また、複
音発生の差異の正弦波波形発生器の有効利用を図ること
ができる。例えば、図6に示した例においては、第xフ
レームで第12番目のピークが消滅し、第yおよびy+
1フレームで復活して現れているが、図6に示したよう
に、フレーム前後の割り当て状態を参照して、ピーク成
分の連続性を崩さない限り、空いているチャンネルを使
用するようにしてもよい。
As described above, each peak point includes three elements of frequency, amplitude and phase. Actually, the data of the number of line spectrum components × total number of frames shown in FIG. 6 is three. One sheet will be created. At the time of the above-described musical tone synthesis, this table is read out, a sine wave waveform generator is assigned to each row, and a sine wave waveform is generated based on each data (frequency, amplitude and phase) as the frame progresses. Become. If the channels of the sine wave waveform generator are flexibly assigned depending on the occurrence and disappearance of the spectrum before and after, it is possible to improve the processing efficiency at the time of synthesizing a musical sound, and to reduce the difference in the occurrence of compound sounds. It is possible to effectively use the sine wave waveform generator. For example, in the example shown in FIG. 6, the 12th peak disappears in the xth frame, and the yth and y + th peaks are eliminated.
Although it reappears in one frame, as shown in FIG. 6, it is possible to use an empty channel by referring to the allocation states before and after the frame as long as the continuity of the peak component is not broken. Good.

【0025】さて、前記ステップS11あるいはS13
の終了後に、前記フレーム番号nが1だけ増加され(ス
テップS14)、再び、前記ステップS6に処理が戻
る。このステップS6の分析窓位置設定処理において
は、第n+1フレームに対応する分析窓位置が設定され
る。このとき、前記フレームが時間軸に沿って時間軸の
正方向に移動される。この実施の形態においては、移動
するサンプルデータ数を基本周期の1/8、すなわち、
21点としている。したがって、例えば、第1フレーム
については、前述した第0フレームの分析窓位置(12
18点目〜2566点目)を21点だけ時間軸の正方向
にずらした第1239点目〜2587点目が第1フレー
ムの分析窓位置として設定されることとなる。そして、
前記ステップS7、S8、S9が実行され、第1フレー
ムにおけるピークPK1-1,PK1-2,…,PK1-M1(M1は見
つかったピークの総数)が検出される。
Now, the above-mentioned step S11 or S13
After the above, the frame number n is incremented by 1 (step S14), and the process returns to the step S6. In the analysis window position setting process of step S6, the analysis window position corresponding to the (n + 1) th frame is set. At this time, the frame is moved along the time axis in the positive direction of the time axis. In this embodiment, the number of moving sample data is 1/8 of the basic period, that is,
21 points. Therefore, for example, for the first frame, the analysis window position (12
The 1239th to 2587th points, which are obtained by shifting the 18th to 2566th points) by 21 points in the positive direction of the time axis, are set as the analysis window positions of the first frame. And
The steps S7, S8, and S9 are executed, and the peaks PK1-1, PK1-2, ..., PK1-M1 (M1 is the total number of found peaks) in the first frame are detected.

【0026】そして、この場合は、前記ステップS10
の判定結果がNOとなり、ステップS12のピーク追従
処理が実行される。ここでは、前記第0フレームにおい
て検出されたピーク(ピークのリファレンス0とこの第
1フレームにおいて検出されたピークとを後述する方法
によって双方向に比較し、追従結果を得る。この追従結
果として得られたつながっているピークのみをメモリの
前述したテーブルに格納していくと同時に、次のフレー
ムに対するリファレンスとする。図6に示した例におい
ては、第0フレームの11という番号が付されたピーク
に接続されるピークが、第1フレームになかったことが
示されている。以下、このステップS6〜S14の処理
を繰り返し、分析波形の分析範囲の最後までピーク追従
処理を実行する。このように、まず、第0フレームから
フレームを時間軸の正方向に順次ずらしながら、分析範
囲の最後の位置まで、ピーク追従処理が実行される。
In this case, step S10 described above is performed.
The determination result of No is NO, and the peak tracking process of step S12 is executed. Here, the peak detected in the 0th frame (the peak reference 0 and the peak detected in the first frame are bidirectionally compared by a method described later to obtain a tracking result. The tracking result is obtained. Only the connected peaks are stored in the above-mentioned table of the memory, and at the same time, they are used as a reference for the next frame.In the example shown in Fig. 6, the peak numbered 11 in the 0th frame is added. It is shown that there is no connected peak in the first frame.Hereafter, the processes of steps S6 to S14 are repeated, and the peak tracking process is executed until the end of the analysis range of the analysis waveform. First, while sequentially shifting the frame from the 0th frame in the positive direction of the time axis, peak tracking processing is performed up to the last position in the analysis range. It is executed.

【0027】そして、分析範囲の最後まで到達すると、
前記ステップS7の判定結果がYESとなり、ステップ
S15に進む。このステップS15においては、前記フ
レーム番号nを−1に設定する。以下、前記第0フレー
ムから時間軸の負の方向に沿ってのピーク追従処理が開
始される。すなわち、ステップS16において、分析窓
位置が設定される。このステップS16における分析窓
位置の設定処理は、前記ステップS6における処理とは
異なり、時間を逆順に進めて行われる。すなわち、前述
のように、第0フレーム分析窓位置が21点だけ時間軸
の負の方向にずらされ、第1197点目〜第2545点
目が第−1フレームの分析窓位置と設定される。そし
て、ステップS17において分析範囲を超過したか否か
が判定され、この判定結果がNOのときはステップS1
8において、FFT処理が実行される。そして、前述の
場合と同様にピーク検出処理が実行され(S19)、ピ
ーク追従処理が実行される(S20)。そして、追従結
果が前記テーブルに格納される(S21)。そして、ス
テップS22において、n−1をあらたなnとして、前
記ステップS16以降の処理が繰り返し実行される。そ
して、前記分析範囲を超過した場合に、前記ステップS
17の判定結果がYESとなり、この波形分析処理を終
了する。このとき、前記図6に示したテーブル中に分析
結果が得られていることとなる。
When the end of the analysis range is reached,
The determination result of step S7 is YES, and the process proceeds to step S15. In step S15, the frame number n is set to -1. Thereafter, the peak tracking process is started from the 0th frame along the negative direction of the time axis. That is, in step S16, the analysis window position is set. Unlike the processing in step S6, the processing for setting the analysis window position in step S16 is performed by advancing the time in the reverse order. That is, as described above, the 0th frame analysis window position is shifted by 21 points in the negative direction of the time axis, and the 1197th to 2545th points are set as the -1st frame analysis window position. Then, in step S17, it is determined whether or not the analysis range is exceeded, and if the determination result is NO, step S1
At 8, the FFT process is executed. Then, the peak detection processing is executed (S19) and the peak tracking processing is executed (S20), as in the case described above. Then, the follow-up result is stored in the table (S21). Then, in step S22, n-1 is newly set as n, and the processes in and after step S16 are repeatedly executed. When the analysis range is exceeded, the step S
The determination result of 17 is YES, and this waveform analysis processing ends. At this time, the analysis result is obtained in the table shown in FIG.

【0028】次に、前記ステップS12およびS20に
おけるピーク追従処理について説明する。互いに隣り合
った第pフレームと第rフレームについてピーク追従処
理を行うものとする。まず、第pフレームにおいて検出
されたピークPKp-q(PKp-1,PKp-2,…,PKp-Mp)につ
いて、第rフレームのすべてのピークPKr-s(PKr-1,PK
r-2,…,PKr-Mr)とつながる可能性を計算する。この
可能性を示す値をCP(Connection Possibility)と名付
けることとする。CP(p-q,r-s)は、フレームp側から見
た、PKp-qとPKr-sとのつながる可能性を示す数値であ
る。このCPは次の式(1)により、計算することができ
る。 CP(p-q,r-s)=FuncA(|PKp-q.Frequency-PKr-s.Frequency|)*FunkB(|PKp-q.Mag nitude-PKr-s.Magnitude|)*FuncC(PredictionPhase(sign(r-p),PKp-q,PKr-s)-PK r-s.Phase) …(1)。 ここで、FunkAは周波数について近いものを捜す関数
(周波数比較関数)である。図7にこの周波数比較関数
FuncAの一例を示す。この図において、横軸xは当該ピ
ークの周波数、縦軸は確率であり、Fは比較対象となる
ピークの周波数、FBは当該楽音の基音周波数である。
この例に示すように、両者が全く同一の周波数のときに
1となり、全領域についての積分値が1となる関数を用
いればよい。また、FuncBは振幅について近いものを捜
す振幅比較関数である。図8は、この振幅比較関数の一
例を示す図であり、前記周波数比較関数と同様に、全く
振幅の差がないときに1となり、全領域についての積分
値が1となる関数である。楽音の場合、フレームの移動
距離が短いため、この間ではそれ程急峻な変化はないと
仮定している。
Next, the peak tracking processing in steps S12 and S20 will be described. It is assumed that the peak tracking process is performed on the p-th frame and the r-th frame that are adjacent to each other. First, for the peaks PKp-q (PKp-1, PKp-2, ..., PKp-Mp) detected in the p-th frame, all peaks PKr-s (PKr-1, PKK in the r-th frame).
r-2,…, PKr-Mr) is calculated. The value indicating this possibility is named CP (Connection Possibility). CP (pq, rs) is a numerical value indicating the possibility of connection between PKp-q and PKr-s as seen from the frame p side. This CP can be calculated by the following equation (1). CP (pq, rs) = FuncA (| PKp-q.Frequency-PKr-s.Frequency |) * FunkB (| PKp-q.Mag nitude-PKr-s.Magnitude |) * FuncC (PredictionPhase (sign (rp) , PKp-q, PKr-s) -PK rs.Phase) (1). Here, FunkA is a function (frequency comparison function) that searches for similar frequencies. This frequency comparison function is shown in Fig. 7.
An example of FuncA is shown. In this figure, the horizontal axis x is the frequency of the peak, the vertical axis is the probability, F is the frequency of the peak to be compared, and FB is the fundamental frequency of the musical tone.
As shown in this example, it is only necessary to use a function that becomes 1 when the frequencies are exactly the same and the integrated value becomes 1 in all regions. FuncB is an amplitude comparison function that searches for similar amplitudes. FIG. 8 is a diagram showing an example of the amplitude comparison function, which is 1 when there is no difference in amplitude and the integrated value for all regions is 1 as in the frequency comparison function. In the case of a musical sound, it is assumed that the moving distance of the frame is short, so that there is no such a sharp change during this period.

【0029】さらに、FuncCは位相についての関数であ
る。また、次の式(2)に示すように、PredictionPhas
eは位相予測関数でフレームの移動方向の関数となり、
フレームpの情報から予測されるフレームrでの位相を
計算するものである。 PredictionPhase(sign(r-p),PKp-q,PKr-s)=PKp-q.Phase+sign(r-p)2π*PKp-q .Frequency/SamplingFrequency*HopSize …(2)。 ここで、HopSizeはフレームの移動サンプル点数であ
り、この例では21点となる。HopSize/SamplingFrequ
encyはフレームの移動サンプル時間を示しており、この
例では4.76msである。この式(2)は、pフレー
ムで周波数がPKp-q.Frequencyであったとして、隣のフ
レームまでこれが変わらなかったとした場合、rフレー
ムの位相が何度であるのかを計算するものである。ま
た、sign(r-p)はフレームの移動方向で、正の場合には
位相は進み、負の場合には位相が戻ることを示してい
る。FuncCは位相間の距離が近いとき1となるような関
数であり、例えば、次の式(3)のような形式の比較関
数が用いられる。 FuncC(phase1-phase2)=(1+cos(phase1-phase2))/2 …(3)。
Further, FuncC is a function of phase. In addition, as shown in the following equation (2), PredictionPhas
e is a phase prediction function, which is a function in the moving direction of the frame,
The phase at frame r predicted from the information at frame p is calculated. PredictionPhase (sign (rp), PKp-q, PKr-s) = PKp-q.Phase + sign (rp) 2π * PKp-q .Frequency / SamplingFrequency * HopSize (2). Here, HopSize is the number of moving sample points of the frame, which is 21 points in this example. HopSize / SamplingFrequ
ency indicates the moving sample time of the frame, which is 4.76 ms in this example. This formula (2) calculates how many times the phase of the r frame is, assuming that the frequency is PKp-q.Frequency in the p frame and it does not change until the next frame. Further, sign (rp) is the moving direction of the frame, and indicates that the phase advances when it is positive and returns when it is negative. FuncC is a function that becomes 1 when the distance between the phases is short, and for example, a comparison function in the form of the following expression (3) is used. FuncC (phase1-phase2) = (1 + cos (phase1-phase2)) / 2 (3).

【0030】フレームpでのq番目のピークについて、
r側のすべてのピークに対するCP(p-q,r-1),CP(p-q,r-
2),…,CP(p-q,r-Mr)を計算し、CP値が最大となるピー
クがp側からr側を見たときに一番つながる可能性のあ
るピークであるということができる。図9は、PKp-1に
ついて計算した例を示す図である。この図9に示した例
においては、CP(p-1,r-1)が最大値となっているので、P
Kp-1はPKr-1と最もつながる可能性があると考えられ
る。なお、このときに前記CPの最小値を予め決定してお
き、例えば、すべてのCP値が0.001以下の場合はつ
ながる可能性のあるピークがないとする方が現実的であ
る。この場合のピークはフレームpで消滅したものと考
えられる。
For the qth peak in frame p,
CP (pq, r-1), CP (pq, r- for all peaks on the r side
2), ..., CP (pq, r-Mr) is calculated, and it can be said that the peak with the maximum CP value is the peak that may be most connected when the r side is viewed from the p side. FIG. 9 is a diagram showing an example of calculation for PKp-1. In the example shown in FIG. 9, CP (p-1, r-1) has the maximum value, so P
Kp-1 is thought to be most likely to connect with PKr-1. At this time, it is realistic to determine the minimum value of the CP in advance and, for example, if all CP values are 0.001 or less, there is no peak that may be connected. The peak in this case is considered to have disappeared at frame p.

【0031】このようにして、フレームpのすべてのピ
ークについて最もつながる可能性のあるフレームrでの
ピークが見つかったとする。しかし、図10に示すよう
な場合には、p上での2つのピークがr上での1つのピ
ークにつながってしまう可能性がある。この図10に示
した例では、PKp-3とPKp-4の2つがPKr-3に接続されて
しまう。そこで、本発明においては、今度はr側からp
側を見てもっともつながる可能性のあるピークを捜すよ
うにしている。この場合においても、前記式(1)に示
したCPを用いる。ただし、この場合には、前記Predicti
onPhaseの計算式が異なっている。すなわち、位相予測
関数PredictionPhaseは、時間的に逆方向を予測するも
のとなるため、sign(p-r)が負となり、次の式(4)の
ようになる。 PredictionPhase(sign(p-r),PKr-s,PKp-q)=PKr-s.Phase-2π*PKr-s.Frequenc y/SamplingFrequency*Hopsize …(4)。
In this way, it is assumed that the peaks in frame r, which are most likely to be connected, are found for all the peaks in frame p. However, in the case as shown in FIG. 10, two peaks on p may be connected to one peak on r. In the example shown in FIG. 10, PKp-3 and PKp-4 are connected to PKr-3. Therefore, in the present invention, this time from the r side to p
I try to look for the peak that is most likely to be connected. Also in this case, the CP shown in the formula (1) is used. However, in this case, the Predicti
The onPhase calculation formula is different. That is, since the phase prediction function PredictionPhase predicts the opposite direction in time, the sign (pr) becomes negative, and the expression (4) is obtained. PredictionPhase (sign (pr), PKr-s, PKp-q) = PKr-s.Phase-2π * PKr-s.Frequency / SamplingFrequency * Hopsize (4).

【0032】このようにして得られるCP(r-s,p-1),CP
(r-s,p-2),…,CP(r-s,p-Mp)の値から最大のものを見
つけて、r側からp側を見たときに一番つながる可能性
のあるピークを捜す。図11はこの結果の一例を示す図
である。図示した例においては、PKr-3はPKp-4とつなが
る可能性が高いという結果が得られる。これにより、PK
p-4とPKr-3がつながっていると判断する。また、PKp-3
についてはフレームpで消滅したと考えることができ
る。このように双方向からのマッチングをとるようにす
ることにより、最適なピークの接続を見い出すことが可
能となる。
CP (rs, p-1), CP thus obtained
(rs, p-2), ..., CP (rs, p-Mp) is found to be the maximum value, and the peak most likely to be connected when looking from the r side to the p side is searched. FIG. 11 is a diagram showing an example of this result. In the example shown, PKr-3 is likely to connect with PKp-4. This allows PK
Judge that p-4 and PKr-3 are connected. Also, PKp-3
Can be considered to have disappeared at frame p. By thus performing bidirectional matching, it is possible to find the optimum peak connection.

【0033】なお、前記図10において、p側からr側
を見たときに、PKp-3についてはCP(p-3,r-3)が最大値を
とり、PKp-4についてもCP(p-4,r-3)が最大値をとったと
する。すなわち、PKp-3とPKp-4がともにPKr-3につなが
る可能性があるということである。この場合、r側から
p側を見て再度CP(r-3,p-3)とCP(r-3,p-4)の値を計算す
るようにしてもよいが、これをCP(p-3,r-3)とCP(p-4,r-
3)で代用し、このうち大きい方を選ぶようにしてもよ
い。
In FIG. 10, when looking from the p side to the r side, CP (p-3, r-3) takes the maximum value for PKp-3, and CP (p-3 -4, r-3) takes the maximum value. That is, both PKp-3 and PKp-4 may lead to PKr-3. In this case, the values of CP (r-3, p-3) and CP (r-3, p-4) may be calculated again by looking at the p side from the r side. -3, r-3) and CP (p-4, r-
You may substitute in 3) and select the larger one.

【0034】なお、前記ステップS20において、第0
フレーム側から第−1フレームとのCP値を計算するとき
には、前記PredictionPhaseは時間的に逆方向を予想す
ることとなるため、前記式(4)で示した位相予測関数
を用いる。また、第−1フレームから第0フレームをみ
るときには、当然、式(2)の位相予測関数を用いるこ
ととなる。
In step S20, the 0th
When the CP value for the -1st frame is calculated from the frame side, since the PredictionPhase predicts the opposite direction in time, the phase prediction function shown in the equation (4) is used. In addition, when viewing the -1st frame to the 0th frame, the phase prediction function of Expression (2) is naturally used.

【0035】このようにして、分析対象波形の最初から
最後まで各フレームでの各ピークの接続が分かったもの
とする。図12は、このようにして判定された結果の一
例を示す図である。この図において、一番最初にリファ
レンスとしたのは、前述のように、第0フレームのピー
クであり、このフレームのピークをすべて追従したこと
になる。もちろん、途中で消滅条件により消えてつなが
らなくなってしまったピークも含まれている。また、図
12に示したピーク軌跡には、必要でないピークまで追
従対象に含まれてしまっている可能性もある。例えば、
aで示したピークの軌跡は、不必要なものであると考え
られる。そこで、得られた結果を必要に応じてクリーニ
ングする。このクリーニングの条件は、1.ハーモニッ
クであること、2.全フレーム数に対してある程度以上
の長さを持つこと、である。この条件のうち、いずれか
一方でもよいし、あるいは、前記1と2のアンド条件で
あってもよい。図13に、このようにしてクリーニング
した結果の一例を示す。
In this way, it is assumed that the connection of each peak in each frame is known from the beginning to the end of the waveform to be analyzed. FIG. 12 is a diagram showing an example of the result of the determination thus made. In this figure, the first reference was the peak of the 0th frame, as described above, and all the peaks of this frame were followed. Of course, it also includes peaks that disappeared due to extinction conditions on the way. Further, in the peak locus shown in FIG. 12, there is a possibility that unnecessary peaks may be included in the tracking target. For example,
The locus of the peak indicated by a is considered to be unnecessary. Therefore, the obtained results are cleaned as needed. The conditions for this cleaning are 1. Being harmonic 2. It has a certain length or more with respect to the total number of frames. One of these conditions may be used, or the AND conditions of 1 and 2 above may be used. FIG. 13 shows an example of the result of cleaning in this way.

【0036】また、あるピークの軌跡が途中で一部切れ
てしまっている場合もある。図14はこのような場合の
例を示す図である。この図において、M番目のピーク軌
跡はN−1フレームで消滅し、N+1フレームで生成さ
れているように見える。しかし、1つの軌跡は1つの正
弦波発振器に対応しており、軌跡が消滅した時点で対応
の正弦波発振器は未使用状態あるいは出力途絶、すなわ
ちN−1フレームとN+1フレーム間で正弦波出力がぷ
っつりと切れてしまうということになってしまい、クリ
ックノイズの発生などの不都合が生じる恐れがある。こ
のような場合は、図15に示すようにNフレームに振幅
0のピークがあるように補って考え、一続きの軌跡と考
えるようにすればよい。あるいは、フレームN−1のピ
ークの情報とフレームN+1のピークの情報を補間し、
フレームのピーク情報を作り出すようにすることもでき
る。前述した図12において、aで示した軌跡は、この
ようにして補間された例である。このような補間はリフ
ァレンスピークを次のように作ることにより実現するこ
とができる。すなわち、PKN-Mは実際には見つけられな
かったのであるから、振幅は0である。しかし、N-1の
ピークのデータから周波数と位相を予想することができ
る。そこで、一旦途切れてしまったピークのリファレン
スとして、周波数と位相の情報のみを持つピークとし
て、その情報を保持しておくようにする。これにより、
フレームNへ接続できなかったピークについて、さもフ
レームNにピークがあったかのようにリファレンスを作
成しN+1の接続を行うようにすることが可能となる。
Further, the locus of a certain peak may be partly cut off in the middle. FIG. 14 is a diagram showing an example of such a case. In this figure, the Mth peak locus disappears in N-1 frames and appears to be generated in N + 1 frames. However, one locus corresponds to one sine wave oscillator, and when the locus disappears, the corresponding sine wave oscillator is in the unused state or the output is cut off, that is, the sine wave output is generated between the N-1 frame and the N + 1 frame. There is a risk of inconvenience such as generation of click noise because it will be cut off completely. In such a case, it may be considered as a continuous trajectory by supplementing the N frame as shown in FIG. 15 so that the peak has an amplitude of 0. Alternatively, the peak information of frame N-1 and the peak information of frame N + 1 are interpolated,
It is also possible to generate peak information of the frame. In FIG. 12 described above, the locus indicated by a is an example of the interpolation thus performed. Such interpolation can be realized by creating a reference peak as follows. That is, since the PKN-M was not actually found, the amplitude is 0. However, the frequency and phase can be predicted from the N-1 peak data. Therefore, as a reference of a peak that has once been interrupted, the peak is stored as information having only frequency and phase information. This allows
For peaks that could not be connected to frame N, it is possible to create a reference as if there were peaks in frame N and connect N + 1.

【0037】さて、前述のように、従来のSFFT処理
においては、ウインドウサイズを大きくすると基本周波
数の周波数精度は向上するものの高調波の変化に追従す
ることができなくなり、ウインドウサイズを小さくする
と基本周波数の周波数精度が悪くなってしまうという問
題点があった。このような問題点を解決する本発明の楽
音分析および合成処理について、図16の処理の流れ図
および図17の波形図を参照して説明する。
As described above, in the conventional SFFT processing, when the window size is increased, the frequency accuracy of the fundamental frequency is improved, but it becomes impossible to follow the change of harmonics, and when the window size is reduced, the fundamental frequency is decreased. However, there was a problem that the frequency accuracy of was deteriorated. The tone analysis and synthesis processing of the present invention which solves such a problem will be described with reference to the flow chart of the processing of FIG. 16 and the waveform chart of FIG.

【0038】図16において、入力される被解析信号
は、第1の窓関数(Window Function1)と第1のホップ
サイズ(Window Hopsize 1)に基づいて設定される分析
窓(Window 1)と乗算され(ステップS32)、第1の
短時間フーリエ変換(SFFT)が行われる(ステップ
S33)。この第1の短時間フーリエ変換においては、
前述したと同様に、基本周波数から決定されるウインド
ウサイズ及びウインドウポップサイズによる分析が行わ
れる。
In FIG. 16, the input analyzed signal is multiplied by the analysis window (Window 1) set based on the first window function (Window Function 1) and the first hop size (Window Hopsize 1). (Step S32), the first short-time Fourier transform (SFFT) is performed (step S33). In this first short-time Fourier transform,
Similar to the above, the analysis by the window size and the window pop size determined from the fundamental frequency is performed.

【0039】そして、ステップS34において、この第
1のSFFTの結果から第1のピーク検出及びピーク追
従処理が行われる。この第1のピーク検出及びピーク追
従処理においては、前述したと同様のピーク検出及びピ
ーク追従であるが、ここでは、基本周波数の8倍音以下
の周波数のピークを対象として、処理を行う。このステ
ップS34の出力を第1の軌道情報と呼ぶ。続いて、ス
テップS35に進み、該第1の軌道情報の正弦波合成を
実行し、第1の決定論的波形(DeterministicWave)を
出力する。図17におけるは前記被解析信号の一例
(この例では、ピアノのC1の波形)であり、は前記
第1の決定論的波形を示している。なお、前記正弦波合
成は、前述のように、離散的な正弦波波形サンプルを生
成し、これらを加算することにより行ってもよいし、あ
るいは、複数個の正弦波波形発生器を用いて対応する正
弦波波形を発生させ、それらの出力を合成するようにし
てもよい。
Then, in step S34, the first peak detection and peak tracking processing is performed from the result of the first SFFT. In the first peak detection and peak tracking processing, the same peak detection and peak tracking as described above are performed, but here, the processing is performed for the peak of the frequency equal to or lower than the eighth harmonic of the fundamental frequency. The output of this step S34 is called the first trajectory information. Succeedingly, in a step S35, the sine wave synthesis of the first trajectory information is executed, and a first deterministic waveform (Deterministic Wave) is outputted. FIG. 17 shows an example of the analyzed signal (in this example, the waveform of the piano C1), and shows the first deterministic waveform. As described above, the sine wave synthesis may be performed by generating discrete sine wave waveform samples and adding them together, or by using a plurality of sine wave waveform generators. It is also possible to generate sinusoidal waveforms that are generated and combine their outputs.

【0040】次に、このようにして得た第1のDetermin
istic Waveの極性を反転して(ステップS36)、前記
被解析信号と加算する(ステップS37)。これによ
り、第1の残余波形(Residual Wave)を得る。図17
のは、この第1の残余波形の一例を示すものであり、
この第1の残余波形は、前記被解析信号と前記8倍音以
下の周波数を有するピークの軌跡から合成された第1の
Deterministic Waveとの差の信号である。次に、この第
1のResidual Waveについて、第2の窓関数(Window Fu
nction 2)と第2のウインドウホップサイズ(Window H
opsize 2)とにより設定される第2の窓関数(Window
2)を乗算し(ステップS39)、第2の短時間フーリ
エ変換処理を実行する(S40)。この第2のSFFT
は、ウインドウサイズとして8倍音の周期の8倍、すな
わち、基本周期と同じサイズを用い、また、ウインドウ
のホップサイズは、8倍音の1/8、すなわち基本周波
数の1/64として、分析を行う。このようなウインド
ウサイズ及びウインドウホップサイズを用いることによ
り、高い周波数成分についても精度のよいピーク検出及
び軌跡の追従が可能となる。そして、この第2のSFF
Tの出力から、8倍音以上の周波数成分について、ピー
ク検出及びピーク追従処理を実行し(S41)、第2の
軌道情報を得る。次に、この第2の軌道情報から前述と
同様に正弦波合成を行い(S42)、第2のDeterminis
tic Waveを得る。この第2のDeterministic Waveは、8
倍音以上の高調波成分についての合成信号である。
Next, the first Determin obtained in this way
The polarity of the istic wave is inverted (step S36) and added with the signal to be analyzed (step S37). As a result, the first residual waveform is obtained. FIG. 17
Shows an example of this first residual waveform,
This first residual waveform is a first synthesized from the analyzed signal and a locus of peaks having frequencies below the eighth harmonic.
This is the signal of the difference from the Deterministic Wave. Next, for this first Residual Wave, the second window function (Window Fu
nction 2) and the second window hop size (Window H
opsize 2) and the second window function (Window
2) is multiplied (step S39), and the second short time Fourier transform process is executed (S40). This second SFFT
Uses 8 times the period of the 8th harmonic as the window size, that is, the same size as the fundamental period, and the hop size of the window is 1/8 of the 8th harmonic, that is, 1/64 of the fundamental frequency. . By using such a window size and window hop size, it is possible to detect peaks and follow a locus with high accuracy even for high frequency components. And this second SFF
From the output of T, peak detection and peak tracking processing is executed for frequency components of 8th harmonic or higher (S41), and second orbit information is obtained. Next, the sine wave synthesis is performed from the second trajectory information in the same manner as described above (S42), and the second Determinis
Get a tic Wave. This second Deterministic Wave has 8
It is a composite signal of harmonic components above harmonics.

【0041】このようにして得られた第2のDeterminis
tic Waveと前記ステップS35で得られた第1のDeterm
inistic Waveとを合成して(ステップS43)、最終的
な決定論的波形(Deterministic Wave)を得る。図17
のは、この決定論的波形の一例を示している。このス
テップS43における合成においては、前記第1の決定
論的波形Deterministic Waveと前記第2の決定論的波形
との加算が行われるが、前述のように、前記第1の決定
論的波形は基本周期の1/8のウインドウホップサイズ
間隔で得られた第1の軌道情報に基づいており、前記第
2の決定論的波形は基本周期の1/64のウインドウホ
ップサイズ間隔で得られた第2の軌道情報に基づいてい
る。したがって、この2つのデータを加算するために
は、精度の細かい間隔にデータを合わせ込むことが必要
となる。すなわち、前記第1の決定論的波形のデータを
8倍に補間して1/64の精度にあわせることが必要と
なる。
The second Determinis thus obtained
tic Wave and the first Determ obtained in step S35
A final deterministic waveform (Deterministic Wave) is obtained by synthesizing with the inistic Wave (step S43). FIG. 17
Shows an example of this deterministic waveform. In the synthesis in step S43, the first deterministic waveform Deterministic Wave and the second deterministic waveform are added, but as described above, the first deterministic waveform is basically Based on the first trajectory information obtained at a window hop size interval of 1/8 of the period, the second deterministic waveform is obtained at a second hop size interval of 1/64 of the fundamental period. It is based on the orbit information of. Therefore, in order to add these two pieces of data, it is necessary to match the data with a fine interval. That is, it is necessary to interpolate the data of the first deterministic waveform by 8 times to match the precision of 1/64.

【0042】前述のように、各ピークのデータは、それ
ぞれ振幅、周波数および位相の3つの情報を有してい
る。図18は振幅情報および周波数情報の補間を説明す
るための図であり、この図に示すように、基本周期の1
/8の間隔で得られた第1の決定論的波形データのピー
クP1-1とP1-2との間を例えば直線補間して、P1-1-1,P1
-1-2,…,P1-1-7を得ることにより1/64の精度の振
幅情報あるいは周波数情報とする。なお、補間方法とし
ては直線補間に限らず、合い前後する数点のデータをと
って多項式補間をしてもよい。また、位相情報について
は、基本周期の1/8の間隔で得られた第1の決定論的
波形データのピークP1-1の位相及び周波数のデータと、
ピークP1-2の位相及び周波数のデータを用いて、図19
に示すような位相の回転を記述し、各点P1-1-1,P1-1-
2,…,P1-1-7の位相を読み取るようにすればよい。こ
のようにして、第1のDeterministic Waveと第2のDete
rministic Waveとの時間分解能を揃えてから、データの
加算を行うことができる。
As described above, the data of each peak has three pieces of information of amplitude, frequency and phase. FIG. 18 is a diagram for explaining interpolation of amplitude information and frequency information. As shown in FIG.
For example, linear interpolation is performed between peaks P1-1 and P1-2 of the first deterministic waveform data obtained at intervals of / 8, and P1-1-1 and P1
By obtaining -1-2, ..., P1-1-7, it becomes amplitude information or frequency information with an accuracy of 1/64. The interpolation method is not limited to linear interpolation, and polynomial interpolation may be performed by taking data at several points before and after the matching. Regarding the phase information, the phase and frequency data of the peak P1-1 of the first deterministic waveform data obtained at intervals of 1/8 of the fundamental period,
Using the phase and frequency data of peak P1-2, FIG.
Describe the rotation of the phase as shown in, and each point P1-1-1, P1-1-
2,…, Read the phase of P1-1-7. In this way, the first Deterministic Wave and the second Dete
Data can be added after matching the time resolution with rministic Wave.

【0043】また、前記第2のDeterministic Waveの極
性を反転して(S44)、前記第1のResidual Waveと
加算する(S45)ことにより、図17のに示すよう
な、最終的なResidual Waveを得ることもできる。この
図17のから明らかなように、残余波形は立ち上がり
直後以外においては非常に低レベルなものとなってい
る。なお、上記においては、被解析信号の周波数帯域を
2分割した例を示したが、これに限られることはなく、
3分割、4分割等、それぞれの場合に応じた数に分割
し、上述の例と同様の方法で、実現することが可能であ
る。
Further, by inverting the polarity of the second Deterministic Wave (S44) and adding it to the first Residual Wave (S45), the final Residual Wave as shown in FIG. 17 is obtained. You can also get it. As is apparent from FIG. 17, the residual waveform has a very low level except immediately after the rising. In the above, an example in which the frequency band of the analyzed signal is divided into two has been shown, but the invention is not limited to this.
It is possible to realize by the same method as in the above example by dividing into a number according to each case such as 3 divisions and 4 divisions.

【0044】また、上記においては、分析対象楽音波形
について、まず、低次倍音グループについてSFFTを
実行し、当該正弦波合成波形との残差波形について、高
次倍音グループについてのSFFTを実行しているが、
これに限ることはない。例えば、分析対象楽音波形につ
いて、低次倍音グループについてのSFFT処理と高次
倍音グループについてのSFFT処理をそれぞれ実行
し、前記低次倍音グループに関する正弦波合成波形と前
記高次倍音グループに関する正弦波合成波形とを前記分
析対象楽音波形から減算することにより、残差波形を求
めるようにしてもよい。
Further, in the above, for the musical tone waveform to be analyzed, first, the SFFT is executed for the low-order overtone group, and the SFFT for the high-order overtone group is executed for the residual waveform with the sine wave composite waveform. But
It is not limited to this. For example, for the musical tone waveform to be analyzed, the SFFT process for the low-order overtone group and the SFFT process for the high-order overtone group are executed respectively, and a sine wave synthesis waveform for the low-order overtone group and a sine wave synthesis for the high-order overtone group are performed. The residual waveform may be obtained by subtracting the waveform and the musical tone waveform to be analyzed.

【0045】さらに、上記においては、分析時の波形演
算はソフトウエア処理で実行するものとして説明した
が、前記楽音合成部7における正弦波合成機能を用いて
波形演算を実行させるようにしてもよい。この場合は、
分析結果を正弦波合成部に与え、合成結果をその出力か
ら受け取るようにすればよい。さらにまた、前述した各
処理の実行部および楽音合成部などは、ハードウエアあ
るいはソフトウエアのいずれによっても実現することが
可能である。さらにまた、上記においては前記図1に示
したような構成を有する楽音分析合成装置において本発
明の楽音分析方法および楽音分析合成方法が実行される
ものとして説明したが、本発明の楽音分析方法及び楽音
分析合成方法は、これに限られることなく、パーソナル
コンピュータ等の汎用コンピュータ、電子楽器、ゲーム
マシン、カラオケ装置、スペクトルアナライザ等の計測
器など各種の装置において実行させることができるもの
である。
Further, in the above description, the waveform calculation at the time of analysis is executed by software processing. However, the waveform calculation may be executed by using the sine wave synthesizing function of the musical tone synthesizer 7. . in this case,
The analysis result may be given to the sine wave synthesis unit, and the synthesis result may be received from the output. Furthermore, the execution unit of each processing and the tone synthesis unit described above can be realized by either hardware or software. Furthermore, in the above description, the tone analysis method and the tone analysis / synthesis method of the present invention are executed in the tone analysis / synthesis apparatus having the configuration shown in FIG. The musical tone analysis / synthesis method is not limited to this, and can be executed in various devices such as a general-purpose computer such as a personal computer, an electronic musical instrument, a game machine, a karaoke device, and a measuring instrument such as a spectrum analyzer.

【0046】[0046]

【発明の効果】以上説明したように、本発明の楽音分析
方法によれば、各フレームにおけるピークの追従を正確
に行うことができる。また、基本周波数が低く、高次倍
音が豊富に含まれているような波形であっても、精度よ
くスペクトル分析ができるという効果がある。
As described above, according to the tone analysis method of the present invention, it is possible to accurately follow the peak in each frame. In addition, even if the waveform has a low fundamental frequency and abundant high-order overtones, the spectrum can be accurately analyzed.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の楽音分析方法あるいは楽音分析合成
方法が実行される楽音分析合成装置の一構成例を示すブ
ロック図である。
FIG. 1 is a block diagram showing an example of the configuration of a musical sound analysis / synthesis apparatus in which a musical sound analysis method or a musical sound analysis / synthesis method of the present invention is executed.

【図2】 楽音合成部の構成例を示すブロック図であ
る。
FIG. 2 is a block diagram showing a configuration example of a musical sound synthesizing unit.

【図3】 ピアノのC4打鍵音の時間波形の一例を示す
図である。
FIG. 3 is a diagram showing an example of a time waveform of a C4 keystroke sound of a piano.

【図4】 波形分析処理を説明するためのフローチャー
トである。
FIG. 4 is a flowchart for explaining a waveform analysis process.

【図5】 図3に示す時間波形についての分析結果の一
例である。
5 is an example of an analysis result of the time waveform shown in FIG.

【図6】 分析結果を格納するテーブルの一例を示す図
である。
FIG. 6 is a diagram showing an example of a table storing analysis results.

【図7】 周波数比較関数の一例を示す図である。FIG. 7 is a diagram showing an example of a frequency comparison function.

【図8】 振幅比較関数の一例を示す図である。FIG. 8 is a diagram showing an example of an amplitude comparison function.

【図9】 隣接するフレーム間のピークがつながる可能
性の計算結果の一例を示す図である。
FIG. 9 is a diagram showing an example of a calculation result of a possibility that peaks between adjacent frames are connected.

【図10】 ピークのつながる可能性の計算結果の一例
を示す図である。
FIG. 10 is a diagram showing an example of a calculation result of a possibility that peaks are connected.

【図11】 ピークのつながる可能性の計算結果の一例
を示す図である。
FIG. 11 is a diagram showing an example of a calculation result of a possibility that peaks are connected.

【図12】 ピークのつながりを判定した結果の一例を
示す図である。
FIG. 12 is a diagram showing an example of a result of determining a peak connection.

【図13】 図12の判定結果をクリーニングした結果
の一例を示す図である。
13 is a diagram showing an example of a result of cleaning the determination result of FIG.

【図14】 ピークの軌跡が途切れている場合を説明す
るための図である。
FIG. 14 is a diagram for explaining a case where a locus of peaks is interrupted.

【図15】 図14の場合の補間処理について説明する
ための図である。
FIG. 15 is a diagram for explaining an interpolation process in the case of FIG.

【図16】 本発明における楽音分析および合成処理に
ついて説明するための流れ図である。
FIG. 16 is a flowchart for explaining the musical sound analysis and synthesis processing in the present invention.

【図17】 図16に示した処理の各段階における波形
の一例を示す図である。
17 is a diagram showing an example of waveforms at each stage of the processing shown in FIG.

【図18】 図16に示した処理における楽音合成を説
明するための図である。
FIG. 18 is a diagram for explaining tone synthesis in the processing shown in FIG.

【図19】 図16に示した処理における楽音合成を説
明するための図である。
FIG. 19 is a diagram for explaining musical tone synthesis in the processing shown in FIG.

【図20】 楽音波形の分析結果の一例を示す図であ
る。
FIG. 20 is a diagram showing an example of analysis results of musical tone waveforms.

【図21】 図20の一部を拡大した図である。FIG. 21 is an enlarged view of part of FIG. 20.

【図22】 基音周波数が低く、高次倍音が豊富に含ま
れる楽音波形の分析結果の一例を示す図である。
FIG. 22 is a diagram showing an example of an analysis result of a musical tone waveform having a low fundamental frequency and abundantly containing high-order overtones.

【図23】 基音周波数が低く、高次倍音が豊富に含ま
れる楽音波形の分析結果の一例を示す図である。
FIG. 23 is a diagram showing an example of an analysis result of a musical tone waveform having a low fundamental frequency and abundant high-order overtones.

【図24】 従来の楽音波形分析及び合成装置の一例を
示す図である。
FIG. 24 is a diagram showing an example of a conventional musical tone waveform analysis and synthesis apparatus.

【符号の説明】[Explanation of symbols]

1 CPU、2 プログラムメモリ、3 データメモ
リ、4 表示装置、5入力装置、6 演奏操作子、7
楽音合成部、8 デジタルアナログ変換器、9ネットワ
ークインターフェース、10 システムバス、11 通
信ネットワーク、71、73、76 CPUインターフ
ェース回路、72 正弦波波形演算部、74 残差波形
演算部、75 ミキサ、77 波形メモリ、78 位相
発生部、79 波形加工部、101 ローパスフィル
タ、102 バンドパスフィルタ、103 ハイパスフ
ィルタ、104 乗算部、105 短時間FFT部、1
06 ピーク検出およびピーク追従処理部、107 正
弦波合成部
1 CPU, 2 program memory, 3 data memory, 4 display device, 5 input device, 6 performance operator, 7
Tone synthesizer, 8 digital-to-analog converter, 9 network interface, 10 system bus, 11 communication network, 71, 73, 76 CPU interface circuit, 72 sine wave waveform calculator, 74 residual waveform calculator, 75 mixer, 77 waveform Memory, 78 Phase generator, 79 Waveform processor, 101 Low-pass filter, 102 Band-pass filter, 103 High-pass filter, 104 Multiplier, 105 Short-time FFT section, 1
06 peak detection and peak tracking processing unit, 107 sine wave synthesis unit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 分析対象楽音波形サンプルに対し順次シ
フトする時間窓を用いてフーリエ変換を行うことにより
前記時間窓の位置に対応する各フレームにおけるピーク
点を検出してスペクトル解析を行う楽音波形分析方法に
おいて、 当該分析対象楽音の複数の倍音のグループ毎にそれぞれ
対応して設定された分析条件を用いて前記スペクトル解
析を行うようにしたことを特徴とする楽音波形分析方
法。
1. A musical tone waveform analysis for performing spectrum analysis by performing a Fourier transform on a musical tone waveform sample to be analyzed using a time window that is sequentially shifted to detect a peak point in each frame corresponding to the position of the time window. In the method, the spectrum analysis is performed by using analysis conditions set corresponding to each of a plurality of overtone groups of the analysis target musical sound.
【請求項2】 楽音波形から線スペクトル成分を抽出
し、該抽出した線スペクトル成分に対応する正弦波信号
波形を生成して合成し、前記楽音波形から前記合成した
信号波形を減算した残差成分と前記合成した信号波形と
を加算することにより楽音を合成する楽音波形分析合成
方法であって、 前記楽音波形を分析するとき、当該楽音波形の複数の倍
音のグループ毎にそれぞれ対応して設定された分析条件
を用いて前記楽音波形の分析を行い、該分析結果に基づ
いて前記線スペクトル成分を抽出するようにしたことを
特徴とする楽音波形分析合成方法。
2. A residual component obtained by extracting a line spectrum component from a musical tone waveform, generating and synthesizing a sine wave signal waveform corresponding to the extracted line spectrum component, and subtracting the synthesized signal waveform from the musical tone waveform. And a synthesized signal waveform, which is a musical tone waveform analysis / synthesis method for synthesizing a musical tone, wherein when the musical tone waveform is analyzed, it is set correspondingly to each of a plurality of overtone groups of the musical tone waveform. A method for analyzing and synthesizing a musical tone waveform, characterized in that the musical tone waveform is analyzed under the analysis conditions described above, and the line spectrum component is extracted based on the analysis result.
【請求項3】 前記倍音のグループに対応する前記残差
成分を抽出し、該残差成分を順次さらに異なるグループ
対応に分析することを特徴とする請求項2記載の楽音波
形分析合成方法。
3. The musical tone waveform analysis / synthesis method according to claim 2, wherein the residual components corresponding to the overtone groups are extracted, and the residual components are sequentially analyzed for different groups.
JP2003043802A 2003-02-21 2003-02-21 Musical sound waveform analysis method and musical sound waveform analysis synthesis method Expired - Lifetime JP3741106B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003043802A JP3741106B2 (en) 2003-02-21 2003-02-21 Musical sound waveform analysis method and musical sound waveform analysis synthesis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003043802A JP3741106B2 (en) 2003-02-21 2003-02-21 Musical sound waveform analysis method and musical sound waveform analysis synthesis method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP17437298A Division JP3433673B2 (en) 1998-06-22 1998-06-22 Music waveform analysis method and music waveform analyzer

Publications (2)

Publication Number Publication Date
JP2003263170A true JP2003263170A (en) 2003-09-19
JP3741106B2 JP3741106B2 (en) 2006-02-01

Family

ID=29208466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003043802A Expired - Lifetime JP3741106B2 (en) 2003-02-21 2003-02-21 Musical sound waveform analysis method and musical sound waveform analysis synthesis method

Country Status (1)

Country Link
JP (1) JP3741106B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009011438A1 (en) * 2007-07-18 2009-01-22 Wakayama University Cyclic signal processing method, cyclic signal conversion method, cyclic signal processing device, and cyclic signal analysis method
JP2010217476A (en) * 2009-03-17 2010-09-30 Yamaha Corp Waveform data generating method
JP2010217477A (en) * 2009-03-17 2010-09-30 Yamaha Corp Waveform data generating method
EP3346468A4 (en) * 2015-09-03 2019-04-24 Pioneer DJ Corporation MUSICAL SONG ANALYSIS DEVICE, METHOD, AND PROGRAM
CN112948331A (en) * 2021-03-01 2021-06-11 湖南快乐阳光互动娱乐传媒有限公司 Audio file generation method, audio file analysis method, audio file generator and audio file analyzer

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009011438A1 (en) * 2007-07-18 2009-01-22 Wakayama University Cyclic signal processing method, cyclic signal conversion method, cyclic signal processing device, and cyclic signal analysis method
US8781819B2 (en) 2007-07-18 2014-07-15 Wakayama University Periodic signal processing method, periodic signal conversion method, periodic signal processing device, and periodic signal analysis method
JP2010217476A (en) * 2009-03-17 2010-09-30 Yamaha Corp Waveform data generating method
JP2010217477A (en) * 2009-03-17 2010-09-30 Yamaha Corp Waveform data generating method
EP3346468A4 (en) * 2015-09-03 2019-04-24 Pioneer DJ Corporation MUSICAL SONG ANALYSIS DEVICE, METHOD, AND PROGRAM
CN112948331A (en) * 2021-03-01 2021-06-11 湖南快乐阳光互动娱乐传媒有限公司 Audio file generation method, audio file analysis method, audio file generator and audio file analyzer
CN112948331B (en) * 2021-03-01 2023-02-03 湖南快乐阳光互动娱乐传媒有限公司 Audio file generation method, audio file analysis method, audio file generator and audio file analyzer

Also Published As

Publication number Publication date
JP3741106B2 (en) 2006-02-01

Similar Documents

Publication Publication Date Title
JP4527287B2 (en) A signal processing technique for changing the time scale and / or fundamental frequency of an audio signal
US7672835B2 (en) Voice analysis/synthesis apparatus and program
US7342168B2 (en) Sound effecter, fundamental tone extraction method, and computer program
JPH0315758B2 (en)
JP2003263170A (en) Method for analyzing waveform of musical sound and method for analyzing and synthesizing waveform of musical sound
JP3433673B2 (en) Music waveform analysis method and music waveform analyzer
KR101286168B1 (en) Audio signal processing device, method and recording medium storing the method
JPS6233599B2 (en)
JP3534012B2 (en) Waveform analysis method
US5691496A (en) Musical tone control apparatus for filter processing a musical tone waveform ONLY in a transient band between a pass-band and a stop-band
JP2765306B2 (en) Sound source device
JP3767236B2 (en) Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable recording medium recording a musical sound waveform analysis program
JP3644296B2 (en) Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable recording medium recording a musical sound waveform analysis program
JP5163606B2 (en) Speech analysis / synthesis apparatus and program
JP3633963B2 (en) Musical sound generating apparatus and musical sound generating method
JP2004013179A (en) Sound source waveform synthesizer using analysis result
JPS6091227A (en) Acoustic analysis device synthesis device
JP3743356B2 (en) Musical sound waveform spectral peak trajectory tracking method and apparatus
JP2005208627A (en) Speech analysis / synthesis apparatus and program
JP3304709B2 (en) Music signal analysis method
JP4246160B2 (en) Music search apparatus and music search method
JP3454147B2 (en) Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable medium recording musical sound waveform analysis program
JP5609280B2 (en) Method and apparatus for encoding acoustic signal
JP5246208B2 (en) Fundamental tone extraction apparatus and program
JPH0740194B2 (en) Electronic musical instrument

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040421

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051031

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081118

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091118

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101118

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101118

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111118

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111118

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121118

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121118

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131118

Year of fee payment: 8

EXPY Cancellation because of completion of term