WO2019003348A1

WO2019003348A1 - 歌唱音効果生成装置及び方法、プログラム

Info

Publication number: WO2019003348A1
Application number: PCT/JP2017/023779
Authority: WO
Inventors: 一輝柏瀬; 桂三濱野
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2017-06-28
Filing date: 2017-06-28
Publication date: 2019-01-03
Anticipated expiration: 2019-12-28

Abstract

演奏により発音する音に対して与える効果を演奏態様に基づき生成することができる歌唱音効果生成装置を提供する。ＣＰＵ１０は、ノートオンを検出すると、出力中の歌唱音があるかどうか、また、出力中の歌唱音があれば、検出したノートオンと出力中の歌唱音のノートオフのタイミングの関係から、レガート奏法に該当するかどうか、等を判定し、演奏態様を特定する。そして、ＣＰＵ１０は、特定した演奏態様に基づいて、歌唱音に与える効果を生成する。

Description

歌唱音効果生成装置及び方法、プログラム

　本発明は、演奏操作に基づき発音する歌唱音に対して、付与する効果を生成する歌唱音効果生成装置及び方法、プログラムに関する。

　音声合成技術を用い、歌唱用データに基づき歌唱音を発音する装置が知られている。また、発音制御パラメータを用いて、リアルタイム演奏時に、簡単に、表情豊かな音の演奏を行えるようにした装置も知られている（下記特許文献１）。この装置は、ノートオン・オフに合わせて演奏曲中の対応する歌詞を歌唱する。歌詞の各音節には音節情報及び音制御パラメータが対応付けられて記憶されている。この装置は、発音開始指示に応じて、音節情報に対応付けされた発音制御パラメータを読み出し、読み出した発音制御パラメータに従った発音態様で発音することで、効果（表情）を付与する。

特開２０１６－１７７２７６号公報

　しかしながら、上記従来の装置では、発音指示により順番に読み出される音節に対し、予め対応付けられた表情付けが付与されるのであり、歌唱音に付与する効果をユーザの意図で変えることはできない。そのため、奏法に拘わらず、歌唱音に対して決まった効果しか付与されず、歌唱音を発音させる際の演奏表現を向上させる上で改善の余地があった。

　本発明の目的は、演奏により発音する音に対して与える効果を演奏態様に基づき生成することができる歌唱音効果生成装置及び方法を提供することである。

　上記目的を達成するために本発明によれば、演奏操作子に対する演奏操作を検出する検出部と、前記検出部により検出された、発音指示を示す演奏操作に基づいて、音節の歌唱開始を指示する指示部と、前記検出部により検出された演奏操作に基づいて演奏態様を特定し、特定した演奏態様に基づいて前記指示部の指示に基づく歌唱音に与える効果を生成する生成部と、を有する歌唱音効果生成装置が提供される。

　なお、上記括弧内の符号は例示である。

　本発明によれば、演奏により発音する音に対して与える効果を演奏態様に基づき生成することができる。

歌唱音効果生成装置の模式図である。電子楽器のブロック図である。演奏が行われる場合の処理の流れの一例を示すフローチャートである。単音処理のフローチャートである。歌詞テキストデータの一例を示す図である。音声素片データの種類の一例を示す図である。重音処理のフローチャートである。

　以下、図面を参照して本発明の実施の形態を説明する。

　図１は、本発明の一実施の形態に係る歌唱音効果生成装置の模式図である。この歌唱音効果生成装置は、一例として鍵盤楽器である電子楽器１００として構成され、本体部３０及びネック部３１を有する。本体部３０は、第１面３０ａ、第２面３０ｂ、第３面３０ｃ、第４面３０ｄを有する。第１面３０ａは、複数の鍵から成る鍵盤部ＫＢが配設される鍵盤配設面である。第２面３０ｂは裏面である。第２面３０ｂにはフック３６、３７が設けられる。フック３６、３７間には不図示のストラップを架けることができ、演奏者は通常、ストラップを肩に掛けて鍵盤部ＫＢの操作等の演奏を行う。従って、肩掛けした使用時で、特に鍵盤部ＫＢの音階方向（鍵の配列方向）が左右方向となるとき、第１面３０ａ及び鍵盤部ＫＢが聴取者側を向き、第３面３０ｃ、第４面３０ｄはそれぞれ概ね下方、上方を向く。ネック部３１は本体部３０の側部から延設される。ネック部３１には、進み操作子３４、戻し操作子３５をはじめとする各種の操作子が配設される。本体部３０の第４面３０ｄには、液晶等で構成される表示ユニット３３が配設される。

　電子楽器１００は、演奏操作子への操作に応じて歌唱模擬を行う楽器である。ここで、歌唱模擬とは、歌唱合成により人間の声を模擬した音声を出力することである。鍵盤部ＫＢの各鍵は白鍵、黒鍵が音高順に並べられ、各鍵は、それぞれ異なる音高に対応付けられている。電子楽器１００を演奏する場合、ユーザは、鍵盤部ＫＢの所望の鍵を押下する。電子楽器１００はユーザにより操作された鍵を検出し、操作された鍵に応じた音高の歌唱音を発音する。なお、発音される歌唱音の音節の順番は予め定められている。

　図２は、電子楽器１００のブロック図である。電子楽器１００は、ＣＰＵ（Central Processing Unit）１０と、タイマ１１と、ＲＯＭ（Read Only Memory）１２と、ＲＡＭ（Random Access Memory）１３と、データ記憶部１４と、演奏操作子１５と、他操作子１６と、パラメータ値設定操作子１７と、表示ユニット３３と、音源１９と、効果回路２０と、サウンドシステム２１と、通信Ｉ／Ｆ（Interface）と、バス２３と、を備える。ＣＰＵ１０は、電子楽器１００全体の制御を行う中央処理装置である。タイマ１１は、時間を計測するモジュールである。ＲＯＭ１２は制御プログラムや各種のデータなどを格納する不揮発性のメモリである。ＲＡＭ１３はＣＰＵ１０のワーク領域及び各種のバッファなどとして使用される揮発性のメモリである。表示ユニット３３は、液晶ディスプレイパネル、有機ＥＬ（Electro-Luminescence）パネルなどの表示モジュールである。表示ユニット３３は、電子楽器１００の動作状態、各種設定画面、ユーザに対するメッセージなどを表示する。

　演奏操作子１５は、主として音高を指定する演奏操作を受け付けるモジュールである。本実施の形態では、鍵盤部ＫＢ、進み操作子３４、戻し操作子３５は演奏操作子１５に含まれる。一例として、演奏操作子１５が鍵盤である場合、演奏操作子１５は、各鍵に対応するセンサのオン／オフに基づくノートオン／ノートオフ、押鍵の強さ（速さ、ベロシティ）などの演奏情報を出力する。この演奏情報は、ＭＩＤＩ（musical instrument digital interface）メッセージ形式であってもよい。他操作子１６は、例えば、電子楽器１００に関する設定など、演奏以外の設定を行うための操作ボタンや操作つまみなどの操作モジュールである。パラメータ値設定操作子１７は、主として歌唱音の属性についてのパラメータを設定するために使用される、操作ボタンや操作つまみなどの操作モジュールである。このパラメータとしては、例えば、和声（Harmonics）、明るさ（Brightness）、共鳴（Resonance）、性別要素（Gender Factor）等がある。和声とは、声に含まれる倍音成分のバランスを設定するパラメータである。明るさとは、声の明暗を設定するパラメータであり、トーン変化を与える。共鳴とは、歌唱音声や楽器音の、音色や強弱を設定するパラメータである。性別要素とは、フォルマントを設定するパラメータであり、声の太さ、質感を女性的、或いは、男性的に変化させる。外部記憶装置３は、例えば、電子楽器１００に接続される外部機器であり、例えば、音声データを記憶する装置である。通信Ｉ／Ｆ２２は、外部機器と通信する通信モジュールである。バス２３は電子楽器１００における各部の間のデータ転送を行う。

　データ記憶部１４は、歌唱用データ１４ａを格納する。歌唱用データ１４ａには歌詞テキストデータ、音韻情報データベースなどが含まれる。歌詞テキストデータは、歌詞を記述するデータであり、歌唱部（音源１９、効果回路２０及びサウンドシステム２１）により歌唱されるためのデータである。歌詞テキストデータには、曲ごとの歌詞が音節単位で区切られて記述されている。すなわち、歌詞テキストデータは歌詞を音節に区切った文字情報を有し、この文字情報は音節に対応する表示用の情報でもある。ここで音節とは、１回の演奏操作に応じて出力する音のまとまりである。音韻情報データベースは、音声素片データ（音節情報）を格納するデータベースである。音声素片データは音声の波形を示すデータであり、例えば、音声素片のサンプル列のスペクトルデータを波形データとして含む。また、音声素片データには、音声素片の波形のピッチを示す素片ピッチデータが含まれる。歌詞テキストデータ、音声素片データは、それぞれ、データベースにより管理されてもよい。

　音源１９は、複数の発音チャンネルを有するモジュールである。音源１９には、ＣＰＵ１０の制御の基で、ユーザの演奏に応じて１つの発音チャンネルが割り当てられる。歌唱音を発音する場合、音源１９は、割り当てられた発音チャンネルにおいて、データ記憶部１４から演奏に対応する音声素片データを読み出して歌唱音データを生成する。効果回路２０は、音源１９が生成した歌唱音データに対して、パラメータ値設定操作子１７により指定された音響効果を適用する。サウンドシステム２１は、効果回路２０による処理後の歌唱音データを、デジタル／アナログ変換器によりアナログ信号に変換する。そして、サウンドシステム２１は、アナログ信号に変換された歌唱音を増幅してスピーカなどから出力する。

　図３は、電子楽器１００による演奏が行われる場合の処理の流れの一例を示すフローチャートである。ここでは、ユーザにより、演奏曲の選択と選択した曲の演奏とが行われる場合の処理について説明する。また、説明を簡単にするため、複数の鍵が同時に操作された場合であっても、単音のみを出力する場合について説明する。この場合、同時に操作された鍵の音高のうち、最も高い音高のみについて処理してもよいし、最も低い音高のみについて処理してもよい。なお、以下に説明する処理は、例えば、ＣＰＵ１０がＲＯＭ１２やＲＡＭ１３に記憶されたプログラムを実行し、電子楽器１００が備える各種構成を制御する制御部として機能することにより実現される。

　電源がオンにされると、ＣＰＵ１０は、演奏する曲を選択する操作がユーザから受け付けられるまで待つ（ステップＳ１０１）。なお、一定時間経過しても曲選択の操作がない場合は、ＣＰＵ１０は、デフォルトで設定されている曲が選択されたと判断してもよい。ＣＰＵ１０は、曲の選択を受け付けると、選択された曲の歌唱用データ１４ａの歌詞テキストデータを読み出す。そして、ＣＰＵ１０は、歌詞テキストデータに記述された先頭の音節にカーソル位置を設定する（ステップＳ１０２）。ここで、カーソルとは、次に発音する音節の位置を示す仮想的な指標である。次に、ＣＰＵ１０は、鍵盤部ＫＢの操作に基づくノートオンを検出したか否かを判定する（ステップＳ１０３）。ＣＰＵ１０は、ノートオンが検出されない場合、ノートオフを検出したか否かを判別する（ステップＳ１０９）。

　一方、ノートオンを検出した場合、すなわち新たな押鍵を検出した場合は、ＣＰＵ１０は、出力中の歌唱音があるか否かを判別する（ステップＳ１０４）。ここで、出力中の歌唱音とは、新たな押鍵がされる直前の押鍵に基づき発音されている歌唱音である。従って、出力中の歌唱音があることは、発音指示を示す演奏操作が継続していることを意味する。詳細は後述するが、ステップＳ１０４、Ｓ１０５、Ｓ１０６、Ｓ１０８では、ＣＰＵ１０は、演奏態様を特定し、特定した演奏態様に基づいて、歌唱音に与える効果を生成する。本実施の形態で特定される演奏態様として、新たな発音を指示する演奏操作（単音）のほか、一時的な重複押鍵（レガート奏法等）を想定している。

　ステップＳ１０４での判別の結果、出力中の歌唱音がない場合は、ＣＰＵ１０は、発音指示を示す演奏操作が継続していない場合に新たな発音指示を示す演奏操作がなされるという演奏態様を特定する。そこでＣＰＵ１０は、ステップＳ１０５に進み、例外的に押下状態の鍵（発音指示を示すものではないが押下状態が継続している鍵）が存在すればその鍵に対応する音のノートオフ処理を実行し、その後、単音処理を実行する（ステップＳ１０６）。この単音処理については図４で後述する。その後ＣＰＵ１０は、カーソル位置（読出位置）を更新し（ステップＳ１０７）、処理をステップＳ１０９に進める。ステップＳ１０４での判別の結果、出力中の歌唱音がある場合は、継続している演奏操作に対応する音高とは別の音高の発音指示を示す演奏操作がなされた（所定の演奏態様が特定された）ことを意味する。そこでＣＰＵ１０は、後述する図７に示す重音処理を実行して（ステップＳ１０８）、処理をステップＳ１０９に進める。

　図４は、図３のステップＳ１０６で実行される単音処理のフローチャートである。まずＣＰＵ１０は、ステップＳ１０３で検出したノートオンのベロシティ値を取得する（ステップＳ２０１）。そしてＣＰＵ１０は、取得したベロシティ値が第１の所定値（例えば、１００）以上であるか否かを判別する（ステップＳ２０２）。取得したベロシティ値が第１の所定値未満である場合は、ＣＰＵ１０は、取得したベロシティ値が第１の所定値より小さい第２の所定値（例えば、６０）以下であるか否かを判別する（ステップＳ２０４）。そしてＣＰＵ１０は、取得したベロシティ値が第２の所定値以下でない場合は、処理をステップＳ２０７に進める。すなわち、ベロシティ値が第１の所定値未満で第２の所定値より大きい場合は、ＣＰＵ１０は、ステップＳ２０７で、効果付与をしない通常の出力音生成処理を実行する。具体的には、ＣＰＵ１０は、読み出し位置の音節情報を読み出し、上記検出したノートオンの音高で歌唱音を生成し、出力する。すなわち、ＣＰＵ１０は、発音指示を示す演奏操作に基づいて、音節の歌唱開始を指示する。その後、図４に示す処理は終了する。

　ここで、ステップＳ２０７、Ｓ２０３、Ｓ２０６に共通する出力音生成処理について説明する。ＣＰＵ１０はまず、カーソル位置に対応する音節の音声素片データ（波形データ）を読み出し、ノートオンに対応する音高で、読み出した音声素片データが示す波形の音を出力する。具体的には、ＣＰＵ１０は、音声素片データに含まれる素片ピッチデータが示す音高と、操作された鍵に対応する音高との差分を求め、この差分に相当する周波数だけ波形データが示すスペクトル分布を周波数軸方向に移動させる。これにより、電子楽器１００は、操作された鍵に対応する音高で歌唱音を出力することができる。

　ここで、カーソル位置の決定と歌唱音の発音について、具体例を用いて説明する。まず、カーソル位置の更新について説明する。図５は、歌詞テキストデータの一例を示す図である。図の例では、歌詞テキストデータには、５つの音節ｃ１～ｃ５の歌詞が記述されている。各字「は」、「る」、「よ」、「こ」、「い」は、日本語のひらがなの１字を示し、各字が１音節に対応する。ＣＰＵ１０は、音節単位でカーソル位置を更新する。例えば、カーソルが音節ｃ３に位置している場合、「よ」に対応する音声素片データをデータ記憶部１４から読み出し、「よ」の歌唱音を発音する。ＣＰＵ１０は、「よ」の発音が終了すると、次の音節ｃ４にカーソル位置を移動させる。このように、ＣＰＵ１０は、ノートオンに応じて次の音節にカーソル位置を順次移動させる。

　次に、歌唱音の発音について説明する。図６は、音声素片データの種類の一例を示す図である。ＣＰＵ１０は、カーソル位置に対応する音節を発音させるために、音韻情報データベースから、音節に対応する音声素片データを抽出する。音声素片データには、音素連鎖データと、定常部分データの２種類が存在する。音素連鎖データとは、「無音（＃）から子音」、「子音から母音」、「母音から（次の音節の）子音又は母音」など、発音が変化する際の音声素片を示すデータである。定常部分データは、母音の発音が継続する際の音声素片を示すデータである。例えば、カーソル位置が音節ｃ１の「は（ｈａ）」に設定されている場合、音源１９は、「無音→子音ｈ」に対応する音声連鎖データ「＃－ｈ」と、「子音ｈ→母音ａ」に対応する音声連鎖データ「ｈ－ａ」と、「母音ａ」に対応する定常部分データ「ａ」と、を選択する。そして、ＣＰＵ１０は、演奏が開始されて押鍵を検出すると、音声連鎖データ「＃－ｈ」、音声連鎖データ「ｈ－ａ」、定常部分データ「ａ」に基づく歌唱音を、操作された鍵に応じた音高、操作に応じたベロシティで出力する。このようにして、カーソル位置の決定と歌唱音の発音が実行される。

　ステップＳ２０２での判別の結果、取得したベロシティ値が第１の所定値以上である場合は、ＣＰＵ１０は、第１種類の効果（例えば、しゃくり）を付与する出力音生成処理を実行する。すなわち、ステップＳ２０３で、ＣＰＵ１０は、読み出し位置の音節情報を読み出し、上記検出したノートオンの音高の発音を「しゃくり」で開始するように、歌唱音を生成し、出力する。これにより、出力中の歌唱音が無い状態での新たな押鍵により発音する歌唱音に対して、しゃくりの効果を付与することができる。その後、処理はステップＳ２０４に進む。

　ステップＳ２０４での判別の結果、取得したベロシティ値が第２の所定値以下である場合は、ＣＰＵ１０は、第２の種類（例えば、こぶし）を付与する出力音生成処理を実行する。すなわち、まずＣＰＵ１０は、ステップＳ２０５で、読み出し位置の音節情報を読み出し、その音節情報が示す波形データから母音開始位置を検出する（ステップＳ２０５）。さらにＣＰＵ１０は、上記検出したノートオンの音高で歌唱音の生成を開始し、歌唱音生成の過程で母音開始位置にて「こぶし」を追加するようにして、歌唱音を出力する（ステップＳ２０６）。これにより、出力中の歌唱音が無い状態での新たな押鍵により発音する歌唱音に対して、こぶしの効果を付与することができる。その後、図４に示す処理は終了する。

　図７は、図３のステップＳ１０８で実行される重音処理のフローチャートである。まず、ＣＰＵ１０は、レガート判定期間（所定時間）が経過するまで待機する（ステップＳ３０１）。レガート判定期間の計時は、図３のステップＳ１０３で新たなノートオンが検出されたとき開始される。ここで、レガート判定期間は予めＲＯＭ１２等に格納されているとする。なお、レガート判定期間は絶対時間に限定されず、テンポに応じた長さ（例えば、６４分音符長）としてもよい。レガート判定期間中に、ＣＰＵ１０は、ノートオン・ノートオフを検出し、検出結果を記憶しておく。

　レガート判定期間が経過すると、ＣＰＵ１０は、ステップＳ１０３で検出したノートオンの音高を取得する（ステップＳ３０２）。そしてＣＰＵ１０は、レガート判定期間中に、出力中の歌唱音に対するノートオフがあったか否かを判別する（ステップＳ３０３）。レガート判定期間中に、出力中の歌唱音に対するノートオフがあった場合は、いわゆるレガート奏法がなされたと判断できる。そこでＣＰＵ１０は、出力中の歌唱音を停止し（ステップＳ３０４）、レガート奏法に対応する効果付与処理へ移行する（ステップＳ３０５、Ｓ３０６、Ｓ３０８）。まず、ＣＰＵ１０は、出力中の歌唱音の音高よりも上記検出したノートオンの音高の方が高いか否かを判別する（ステップＳ３０５）。そして、出力中の歌唱音の音高よりも上記検出したノートオンの音高の方が高い場合は、高音方向へのレガート奏法がなされたと判断できる。そこでＣＰＵ１０は、出力中の音高から上記検出したノートオンの音高までを「しゃくり」でつないで安定するように、歌唱音を生成し、出力する。これにより、しゃくりの態様で高音側へ音高が変化する。その後、処理はステップＳ３０７に進む。

　一方、出力中の歌唱音の音高よりも上記検出したノートオンの音高の方が高くない場合は、低音方向へのレガート奏法がなされたと判断できる。そこでＣＰＵ１０は、出力中の音高から上記検出したノートオンの音高までを「フォール」でつないで安定するように、歌唱音を生成し、出力する。これにより、フォールの態様で低音側へ音高が変化する。その後、処理はステップＳ３０７に進む。ＣＰＵ１０は、ステップＳ３０７で、カーソル位置（読出位置）を更新し、図７に示す処理を終了させる。なお、レガート判定期間中に、出力中の歌唱音に対するノートオフと、上記検出したノートオンに対するノートオフとが共にあった場合は、ＣＰＵ１０は、ステップＳ３０６、Ｓ３０８では効果の生成をしない。従って、しゃくりやフォールを付与するのは、上記検出したノートオンが継続していることが前提となる。

　ステップＳ３０３での判別の結果、レガート判定期間中に、出力中の歌唱音に対するノートオフがなかった場合は、レガート奏法に該当しないと判断できる。例えば、出力中の歌唱音に対するノートオンが継続したまま、それと異なる音高のノートオンの操作があり、重複して押鍵状態となっていると判断できる。この場合、ＣＰＵ１０は、非レガート重複押鍵に対応する効果付与処理へ移行する（ステップＳ３０９～Ｓ３１６）。この効果付与処理では、出力中の歌唱音に対して、一例として、後から押下された鍵の音高に応じた速さのビブラート効果を付与する。

　まず、ＣＰＵ１０は、上記検出したノートオンに対するノートオフを検出したか否かを判別する（ステップＳ３０９）。そして、上記検出したノートオンに対するノートオフを検出しない場合は、出力中の歌唱音にビブラートを付与中であるか否かを判別する（ステップＳ３１０）。そして出力中の歌唱音にビブラートを付与中でない場合は、ＣＰＵ１０は、出力中の歌唱音の音高よりも上記検出したノートオンの音高の方が高いか否かを判別する（ステップＳ３１１）。そしてＣＰＵ１０は、出力中の歌唱音の音高よりも上記検出したノートオンの音高の方が高くない場合は、出力中の歌唱音に対して、第１の速度（遅め）のビブラートの付与を開始し（ステップＳ３１２）、処理をステップＳ３１４に進める。一方、出力中の歌唱音の音高よりも上記検出したノートオンの音高の方が高い場合は、ＣＰＵ１０は、出力中の歌唱音に対して、第１の速度より速い第２の速度（速め）のビブラートの付与を開始し（ステップＳ３１３）、処理をステップＳ３１４に進める。

　ステップＳ３１４では、ＣＰＵ１０は、出力中の歌唱音に対するノートオフを検出したか否かを判別し、出力中の歌唱音に対するノートオフを検出していない場合は処理をステップＳ３０９に戻す。ステップＳ３０９での判別の結果、上記検出したノートオンに対するノートオフを検出した場合は、出力中の歌唱音に対するビブラートの付与を停止し（ステップＳ３１６）、処理をステップＳ３０７に進める。従って、出力中の歌唱音に対して、後から押下した鍵の押下状態が継続している間、ビブラートの付与が継続する。ステップＳ３１４での判別の結果、出力中の歌唱音に対するノートオフを検出した場合は、出力中の歌唱音を停止し（ステップＳ３１５）、処理をステップＳ３０７に進める。

　図３のステップＳ１０９でノートオフを検出した場合は、ＣＰＵ１０は、音を出力中であればその音の出力を停止して（ステップＳ１１０）、演奏が終了したか否かを判別する（ステップＳ１１１）。一方、ノートオフを検出しない場合は、ＣＰＵ１０は処理をステップＳ１１１に進める。なお、レガート奏法における最初のノートオンに対するノートオフ処理には、ステップＳ１１１でなく図７のステップＳ３１５が該当する。ＣＰＵ１０は、ステップＳ１１１で、演奏を終了していない場合は処理をステップＳ１０３に戻す。一方、演奏を終了した場合は、ＣＰＵ１０は、音を出力中であればその音の出力を停止して（ステップＳ１１２）、図３に示す処理を終了する。なお、ＣＰＵ１０は、演奏を終了したか否かを、例えば、選択曲の最後尾の音節が発音されたか否か、あるいは他操作子１６により演奏を終了する操作が行われた否か、などに基づき判別できる。

　本実施の形態によれば、ＣＰＵ１０は、発音指示を示す演奏操作に基づいて開始した音節の歌唱音（出力中の歌唱音）に与える効果を、発音指示を示す演奏操作またはその後の演奏操作から特定される演奏態様に基づいて生成する。これにより、演奏により発音する音に対して与える効果を演奏態様に基づき生成することができ、歌唱音を発音させる際の演奏表現を向上させることができる。

　すなわち、ＣＰＵ１０は、発音指示を示す演奏操作が継続していない場合に新たな発音指示を示す演奏操作があった場合は、その新たな発音指示に対応する歌唱音に与える効果（ビブラートまたはしゃくり）を生成する（単音処理）。特にＣＰＵ１０は、新たな発音指示を示す演奏操作の速さ（ベロシティ）に応じた効果（しゃくり／こぶし）を生成する。これにより、発音指示を示す演奏操作の態様に応じた効果を、発音指示に基づく音に付与することができる。

　また、重音処理（図７）においては、発音指示とは別の演奏操作、すなわち、継続している演奏操作に対応する音高とは別の音高の発音指示を示す演奏操作により、発音中の音に効果を付与することができる。特に、レガート判定期間内に、別の音高の発音指示を示す演奏操作が解除されることなく発音指示を示す演奏操作が解除された場合は、レガート奏法に該当する。この場合、開始した歌唱から別の音高の発音指示を示す演奏操作に基づく歌唱への移行態様に関する効果（フォールまたはしゃくり）が生成される（Ｓ３０６、Ｓ３０８）ので、レガート演奏に適する効果を付与することができる。また、レガート判定期間が経過した時点で、発音指示を示す演奏操作及び別の音高の発音指示を示す演奏操作のいずれも解除されていない場合（重複状態）は、上記別の音高に応じた効果（音高に応じた速さのビブラート）が生成される（Ｓ３１２、Ｓ３１３）。これにより、ユーザは、発音指示のための押鍵中に別の鍵を押下することでビブラートをかけることができる。また、発音指示のための押鍵中に別の鍵の押下を解除すればビブラートが止まるので（Ｓ３１６）、ユーザは所望の期間だけビブラートをかけることができる。

　なお、図３のステップＳ１０６での単音処理（図４）、ステップＳ１０８での重音処理（図７）で歌唱音に付与するために生成される効果の態様は例示であり、他の効果を生成してもよい。例えば、単音処理において、効果はしゃくりやこぶしに限らない。なお、単音処理において、検出したノートオンのベロシティ値を２段階に分け、生成し得る効果の態様を２つとしたが、３段階以上に分けて３以上の態様を生成可能にしてもよい。

　また、重音処理の非レガート重複押鍵に対応する効果付与処理（ステップＳ３０９～Ｓ３１６）において、検出したノートオンの音高を出力中の音高と比べて高いか低いかによってビブラートの速さを決定した。しかしこれに限らず、検出したノートオンの音高を２以上の段階に分け、その音高に応じて効果の種類や程度を変えてもよい。また、重音処理においても、検出したノートオンのベロシティを、生成する効果に反映させてもよい。また、出力中の音高とは別の音高の鍵が２つ以上押下された場合に、それら２つ以上の押鍵の組み合わせに応じて効果を生成してもよい。なお、一度に付与する効果の種類は複数であってもよい。

　なお、本発明は、効果専用操作子でない演奏操作子が発音指示と効果生成の双方に用いられる構成の装置に適用可能である。従って、効果専用操作子でない演奏操作子の操作により発音指示がなされ、所定の演奏態様で演奏操作子が操作されたことに応じて、発音指示により発音される歌唱音に対して付与する効果が生成される各種の装置に本発明を適用可能である。

　なお、本実施の形態では、演奏操作子１５が鍵盤である場合について説明したが、演奏操作子１５は、ギターのように弦が並べて配置された形状であってもよい。また、音高を指定した発音または発音解除の指示は、鍵のような操作子で入力される構成に限定されない。また、演奏操作子１５は、鍵盤や弦、或いは、音高指定用の複数のボタンをタッチパネルに表示したものであってもよい。演奏操作子に対する演奏操作から、ＣＰＵ１０が、発音のタイミング、音高、操作の強弱を抽出することで、発音または発音解除の指示を取得してもよい。また、演奏操作子１５は、複数の異なる音高を入力するための操作受付部が空間的に並べて配置されたものであってもよい。従って、本発明の歌唱音効果生成装置が適用される装置は鍵盤楽器に限らない。

　また、本実施の形態では、歌唱される歌詞として日本語の歌詞を例示したがこれには限らず、他言語であってもよい。１文字と１音節とは必ずしも対応しない。例えば、濁点を有する「だ」（ｄａ）は、「た」（ｔａ）と「"」の２文字が１音節に対応する。また、例えば英語の歌詞が「september」の場合、「sep」「tem」「ber」の３音節となる。「sep」は１音節であるが、「s」「e」「p」の３文字が１音節に対応する。ＣＰＵ１０は、演奏操作子１５をユーザが操作する度に、各音節を、操作された鍵の音高で順次発音する。

　以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。

　なお、本発明を達成するためのソフトウェアによって表される制御プログラムを記憶した記憶媒体を、本楽器に読み出すことによって同様の効果を奏するようにしてもよく、その場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した、非一過性のコンピュータ読み取り可能な記録媒体は本発明を構成することになる。また、プログラムコードを伝送媒体等を介して供給してもよく、その場合は、プログラムコード自体が本発明を構成することになる。なお、これらの場合の記憶媒体としては、ＲＯＭのほか、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード等を用いることができる。「非一過性のコンピュータ読み取り可能な記録媒体」は、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（例えばＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ））のように、一定時間プログラムを保持しているものも含む。

１０　ＣＰＵ（検出部、指示部、生成部、取得部）
１４ａ　歌唱用データ
１５　演奏操作子
１９　音源
２０　効果回路
２１　サウンドシステム

Claims

　演奏操作子に対する演奏操作を検出する検出部と、
　前記検出部により検出された、発音指示を示す演奏操作に基づいて、音節の歌唱開始を指示する指示部と、
　前記検出部により検出された演奏操作に基づいて演奏態様を特定し、特定した演奏態様に基づいて前記指示部の指示に基づく歌唱音に与える効果を生成する生成部と、を有する歌唱音効果生成装置。
　前記生成部は、発音指示を示す演奏操作が継続している場合における所定の演奏態様に基づいて前記効果を生成する請求項１に記載の歌唱音効果生成装置。
　前記所定の演奏態様は、前記継続している演奏操作に対応する音高とは別の音高の発音指示を示す演奏操作である請求項２に記載の歌唱音効果生成装置。
　前記生成部は、前記音節の歌唱開始から所定時間が経過する前に、前記別の音高の発音指示を示す演奏操作が解除されることなく前記発音指示を示す演奏操作が解除された場合は、前記開始した歌唱から前記別の音高の発音指示を示す演奏操作に基づく歌唱への移行態様に関する前記効果を生成する請求項３に記載の歌唱音効果生成装置。
　前記生成部は、前記音節の歌唱開始から所定時間が経過した時点で前記発音指示を示す演奏操作及び前記別の音高の発音指示を示す演奏操作のいずれも解除されていない場合は、前記別の音高に応じて前記効果を生成する請求項３に記載の歌唱音効果生成装置。
　前記生成部は、前記音節の歌唱開始から前記所定時間が経過した後、前記発音指示を示す演奏操作が解除されることなく前記別の音高の発音指示を示す演奏操作が解除されると、前記別の音高に応じた前記効果の生成を停止する請求項５に記載の歌唱音効果生成装置。
　前記生成部は、発音指示を示す演奏操作が継続していない場合に新たな発音指示を示す演奏操作がなされるという演奏態様を特定した場合、前記新たな発音指示を示す演奏操作に基づいて、前記新たな発音指示に対応する歌唱音に与える効果を生成する請求項１～６のいずれか１項に記載の歌唱音効果生成装置。
　前記生成部は、前記新たな発音指示を示す演奏操作の速さに応じて、前記新たな発音指示に対応する歌唱音に与える効果を生成する請求項７に記載の歌唱音効果生成装置。
　複数の音節情報の中から、予め定められた順番で、前記音節に対応付けられた音節情報を取得する取得部と、
　前記取得部により取得された音節情報と前記指示部の指示とに基づいて歌唱合成して発音する歌唱部と、を有する請求項１～８のいずれか１項に記載の歌唱音効果生成装置。
　前記指示部は、前記検出された、音高を指定した発音指示を示す演奏操作に基づいて、前記指定された音高で前記音節の歌唱開始を指示する請求項９に記載の歌唱音効果生成装置。
　演奏操作子に対する演奏操作を検出する検出ステップと、
　前記検出ステップにより検出された、発音指示を示す演奏操作に基づいて、音節の歌唱開始を指示する指示ステップと、
　前記検出ステップにより検出された演奏操作に基づいて演奏態様を特定し、特定した演奏態様に基づいて前記指示ステップによる指示に基づく歌唱音に与える効果を生成する生成ステップと、を有する歌唱音効果生成方法。
　演奏操作子に対する演奏操作を検出する検出ステップと、
　前記検出ステップにより検出された、発音指示を示す演奏操作に基づいて、音節の歌唱開始を指示する指示ステップと、
　前記検出ステップにより検出された演奏操作に基づいて演奏態様を特定し、特定した演奏態様に基づいて前記指示ステップによる指示に基づく歌唱音に与える効果を生成する生成ステップと、をコンピュータに実行させるプログラム。