[go: up one dir, main page]

JP6228100B2 - ラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラム - Google Patents

ラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラム Download PDF

Info

Publication number
JP6228100B2
JP6228100B2 JP2014233017A JP2014233017A JP6228100B2 JP 6228100 B2 JP6228100 B2 JP 6228100B2 JP 2014233017 A JP2014233017 A JP 2014233017A JP 2014233017 A JP2014233017 A JP 2014233017A JP 6228100 B2 JP6228100 B2 JP 6228100B2
Authority
JP
Japan
Prior art keywords
loudness
boost
gain
adjustment
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014233017A
Other languages
English (en)
Other versions
JP2016096517A (ja
Inventor
力 濱島
力 濱島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2014233017A priority Critical patent/JP6228100B2/ja
Publication of JP2016096517A publication Critical patent/JP2016096517A/ja
Application granted granted Critical
Publication of JP6228100B2 publication Critical patent/JP6228100B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

本発明は、音声信号のラウドネスを調整するためのラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラムに関し、特に、可変ゲイン増幅器の他に、ブースタを有するラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラムに関する。
地上デジタル放送が本格運用となってから番組内、番組間、番組とCMの音量差が非常に顕著となってきた。デジタル放送は、作り手の音をそのまま視聴者へ届けることができる反面、製作者が意図的にダイナミックレンジの広い番組を作成した場合、音量差が大きくなり、生活雑音の中でTV等を視聴すると小さな音が聴きづらく、TVの音量を大きくすると、いきなり大きな音量となり、TVの音量を絞ると言った動作をする状況となっている。
そのため、世界的に音声信号の音量に対する基準作りが行われ、ARIB TR−B32による運用規定とEBU R128による推奨が進んでいる状況である。これらでは、ITU-R BS.1771の規定が引用されている。これらの運用規定又は推奨及び規定では、番組・素材単位でショートタームラウドネスを計算し、これが、ターゲットラウドネスとなるように素材を制作・運用することを目的としている。
しかし、TV放送では、スポーツ中継、記者中継および生放送番組等が存在しており、予め編集を行うことができない。そのため、リアルタイムに音量感の調整を前述の運用規定又は推奨及び規定の算出方法に従って処理を行う装置が必要である。
特開2013−223130号公報
ARIB TR−B32 デジタルテレビ放送番組におけるラウドネス運用規定 (OPERATIONAL GUIDELINES FOR LOUDNESS OF DIGITAL TELEVISION PROGRAMS) 技術資料 (ARIB TECHNICAL REPORT) 平成23年3月28日策定、平成25年3月19日1.1改定、平成25年12月10日1.2改定、一般社団法人電波産業会 (ASSOCIATION OF RADIO INDUSTRIES AND BUSINESSES) EBU R129 LOUDNESS NORMALIZATION AND PERMITTED MAXIMUM LEVEL OF AUDIO SIGNALS, JUNE 2014 ITU-R BS.1771 REQUMREMENT FOR LOUDNESS AND TRUE-PEAK INDICATING METERS, APPROVED IN 2012-01
特許文献1において、リアルタイムで制御を行うラウドネスコントローラにおいて、ターゲットラウドネスよりも大きな入力信号に対して入力信号を可変ゲイン増幅器において減衰させる構成となっている。この機能の構成は、初段にある可変ゲイン増幅器おいてゲイン制御を行うことにより、音質に大きな影響のあるダイナミックレンジコントロールを最小限にすることを目的としている。しかし、可変ゲイン増幅器において入力信号が抑圧され、抑圧後の入力信号のレベルがブースト処理の閾値以下となると、ブースタが動作し、これにより、入力信号が増幅されることとなる。そのため、入力信号を抑えてもラウドネス抑圧の効果が小さくなることとなり、これにより、さらに入力信号の抑圧を行うといった動作となってしまう。
また、入力信号が間欠的な音声信号である場合において、間欠期間における音声信号がブースト閾値未満であり、且つゲート閾値を超える場合に、ブースタが動作してゲインを上げてしまう。間欠期間が終了して、音声期間に入った直後では、通常レベルの音声信号もブースタにより増幅されてしまい、これにより、その音声信号は必要以上に大きくなってしまう。
具体例を図1を参照して説明する。図1(a)に示すような音声信号を入力した場合、平均ラウドネスがターゲットラウドネスよりも大きいため、制御部によりゲイン量が制御される可変ゲイン増幅器により、図1(b)に示すように、音声信号全体のレベルをゲインGa抑圧することにより、平均ラウドネスをターゲットラウドネスに近づけるための処理が行われる。この音声信号の低レベル側のレベルは、ブースト閾値を下回るため、ブースタによりブーストされる。音声信号が低レベルから高レベルに変化しても、ブーストゲインは即座に解放されずに、所定の時間をかけて解放される。従って、ブーストが解放されるまで、出力音声信号のレベルが必要以上に高くなってしまう。これに伴い、制御部は、不要に高くなったレベルをターゲットラウドネスに近づけるために可変ゲイン増幅器のゲインをGb増やしてGa+Gbにする(図1(c))。この様に可変ゲイン増幅器によりラウドネス調整のための抑圧を行う処理とブースタによりブーストを行う処理が繰り返される状態が発生する。この状態は、可変ゲインが音声信号を過剰に抑圧することを意味している。入力音声信号は、仮にブースト処理がなければラウドネス調整により可変ゲインGaの抑圧がされることにより、その平均ラウドネスがターゲットラウドネスとなるはずであったが、ブースト処理が追加されるので、ラウドネス調整のための抑圧ゲインは過剰となり、Ga→Ga+Gb→Ga+Gb+Gc→…と増加していく。
別の具体例を図2を参照して説明する。入力音声信号がターゲットラウドネス付近で安定している状態でも、ブースタによるブースト処理により全体のゲインが上がってしまい、これを補償するためにラウドネス制御を行う必要が生じてしまう。
さらに、特許文献1の装置では、リアルタイムでモーメンタリラウドネスとターゲットラウドネスとの比較結果をアタック処理をオンにするかオフにするか判断するために用いているため、平均ラウドネスがターゲットラウドネスとなるように作成されたコンテンツの平均ラウドネスが、ターゲットラウドネスよりも低くなってしまう場合が生じてしまう。
そこで、本発明は、極力音声の遅延時間を発生させずに、ラウドネス運用規定に従ってリアルタイムでラウドネス調整を行い、違和感無く音質を保ちながら自然に処理を行い平均ラウドネスがターゲットラウドネスとなる様な信号処理を行うラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラムを提供することを目的とする。
本発明によれば、入力音声信号に対してラウドネス調整を行う可変ゲイン増幅手段と、前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブースト手段と、前記ブースト処理後の前記中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記可変ゲイン増幅手段によるラウドネス調整を制御し、更に、所定の条件が満たされた場合には、前記ラウドネス調整における前記調整ゲイン及び前記ブースト処理におけるブーストゲインのうちの少なくとも一方を修正する制御手段と、を備えることを特徴とするラウドネス調整装置が提供される。
また、本発明によれば、入力音声信号に対してラウドネス調整を行う可変ゲイン増幅ステップと、前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブーストステップと、前記ブースト処理後の前記中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記可変ゲイン増幅手段によるラウドネス調整を制御し、更に、所定の条件が満たされた場合には、前記ラウドネス調整における前記調整ゲイン及び前記ブースト処理におけるブーストゲインのうちの少なくとも一方を修正する制御ステップと、を有することを特徴とするラウドネス調整方法が提供される。
更に、本発明によれば、コンピュータをラウドネス調整装置として機能させるためのラウドネス調整用プログラムであって、前記コンピュータを、入力音声信号に対してラウドネス調整を行う可変ゲイン増幅手段と、前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブースト手段と、前記ブースト処理後の前記中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記可変ゲイン増幅手段によるラウドネス調整を制御し、更に、所定の条件が満たされた場合には、前記ラウドネス調整における前記調整ゲイン及び前記ブースト処理におけるブーストゲインのうちの少なくとも一方を修正する制御手段と、として機能させることを特徴とするラウドネス調整用プログラムが提供される。
本発明によれば、極力音声の遅延時間を発生させずに、ラウドネス運用規定に従ってリアルタイムでラウドネス調整を行い、違和感無く音質を保ちながら自然に処理を行い平均ラウドネスがターゲットラウドネスとなる様な信号処理を行うことが可能となる。
通常のラウドネス調整装置における問題点を説明するための音声信号の波形図である。 通常のラウドネス調整装置における他の問題点を説明するための音声信号の波形図である。 本発明の実施形態によるラウドネス調整装置の構成を示す機能ブロック図である。 (a)図3に示すブースタの振幅特性を示すグラフである。
(b)図3に示すリミッタ/コンプレッサの振幅特性を示すグラフである。
本発明の実施形態におけるラウドネス調整の1つであるアタック処理のオン/オフ制御の方法を説明するためのフローチャートである。 本発明の実施形態におけるアタック処理のオン/オフ制御の方法を説明するための波形図及びタイミング図である。 本発明の実施形態におけるアタック処理のオン/オフ制御の方法を説明するための他の波形図である。 本発明の実施形態におけるラウドネス調整の1つであるアタック処理のオン/オフ制御の方法の他の部分を説明するためのフローチャートである。 本発明の実施形態におけるラウドネス調整の1つであるアタック処理を説明するための波形図である。 本発明の実施形態におけるラウドネス調整の1つであるリリース処理のオン/オフ制御の方法を説明するためのフローチャートである。 本発明の実施形態におけるラウドネス調整ゲインとブーストゲインとを合わせて更新する方法を説明するための概念図である。 本発明の実施形態におけるラウドネス調整ゲインとブーストゲインとを合わせて更新する方法を説明するためのフローチャートである。 本発明の実施形態におけるラウドネス調整の1つであるブースト解放方法を説明するための他の波形図である。
以下、図面を参照して本発明を実施するための形態について詳細に説明する。
図3は、本発明の実施形態によるラウドネス調整装置の機能的な構成を示すブロック図である。
図3を参照すると、このラウドネス調整装置は、デコーダ101、入力側モーメンタリラウドネス計算部103、可変ゲイン増幅器105、第1のK特性フィルタ107、ブースタ109、第2のK特性フィルタ111、リミッタ/コンプレッサ113、エンコーダ115、第3のK特性フィルタ117、内部モーメンタリラウドネス計算部119、内部ショートタームラウドネス計算部121、選択スイッチ123及び制御部125を含む。
デコーダ101は、入力データ1をデコードして、音声データ2と付加情報(音声モード情報、切替情報、ラウドネス運用情報等)12を抽出する。音声データ2は、音声信号を表すものである。
入力側モーメンタリラウドネス計算部103は、音声データ2により表される音声信号の入力側モーメンタリラウドネスを計算する。ここで、モーメンタリラウドネスは、ITU-R B.1771で定義されているものである。
可変ゲイン増幅器105は、音声データ2に対してラウドネス調整を行う。ラウドネス調整における調整ゲインは、ゲイン制御データ11により指定される。また、調整ゲイン(dB)は、マイナスからプラスの範囲に亘る。つまり、可変ゲイン増幅器105は、調整ゲインに応じて、入力音声信号を増幅し、又は、減衰させる。また、調整ゲイン(dB)が時間的に減少傾向にあるときには、アタック処理がされているといい、調整ゲイン(dB)が時間的に増加傾向にあるときには、リリース処理がされているという。
第1のK特性フィルタ107は、可変ゲイン増幅器105によるラウドネス調整をされた後の音声信号である第1の中間音声信号3に対してフィルタ処理を行う。第1のK特性フィルタ107は、ARIB TR−B32の「3.2 K特性フィルタ」で定義されているフィルタであり、それぞれ所定の周波数特性を有する2次のIIRフィルタを2段接続することにより構成されている。第1段目のIIRフィルタは、頭部形状の音響効果に相当する周波数応答特性を有し、第2段目のIIRフィルタは、RLB特性を有する。
ブースタ109は、基本的には、第1のK特性フィルタ107によりフィルタ処理された後の音声信号4のレベルに応じて、図4(a)に示すゲイン特性に従って、第1の中間音声信号3に対してブースト処理を行う。図4(a)に示すように、ブースタ109は、音声信号4のレベルがゲート閾値以上でありブースト閾値以下の範囲にある場合には、第1の中間音声信号3をブーストし、音声信号4のレベルがその範囲にない場合には、第1の中間音声信号3をブーストしない。なお、図4(a)に示すように、ブーストする場合のブーストゲインは、基本的には一定であるが、ブースト後のレベルがブースト閾値以上にならないように調整される。また、ブーストゲインは、本発明に従って、更に、調整されるが、これに関しては後述する。ブースタ109は、図4(a)に示すゲイン特性以外の特性を有していてもよい。
第2のK特性フィルタ111は、ブースタ109によるブースト処理をされた後の音声信号である第2の中間音声信号5に対してフィルタ処理を行う。第2のK特性フィルタ111の特性は、第1のK特性フィルタ107の特性と同一である。
リミッタ/コンプレッサ113は、第2のK特性フィルタ111によりフィルタ処理された後の音声信号6のレベルに応じて、図4(b)に示すゲイン特性に従って、第2の中間音声信号5に対して超過振幅抑圧処理を行い、この処理の結果を出力音声信号7として出力する。図4(b)に示すように、リミッタ/コンプレッサ113は、音声信号5のレベルが上限閾値以上である場合には、第2の中間音声信号5を抑圧する。リミッタ/コンプレッサ113は、図4(b)に示すゲイン特性以外の特性を有していてもよい。また、入力音声信号によっては、リミッタ/コンプレッサ113に入力される第2の中間音声信号5のレベルは上限閾値を全く超えないことがあり、このような場合には、実質的には、リミッタ/コンプレッサ113が削除され、ブースタ109が出力する第2の中間音声信号5が、エンコーダ115及び第3のK特性フィルタ117に直接供給される構成と同様となる。
エンコーダ115は、出力音声信号7に対して所定のエンコーダ処理を行い、この処理の結果を出力音声データ16として出力する。
第3のK特性フィルタ117は、出力音声信号7に対してフィルタ処理を行う。第3のK特性フィルタ111の特性は、第1のK特性フィルタ107の特性と同一である。
内部モーメンタリラウドネス計算部119は、第3のK特性フィルタ117により処理された出力音声信号7である音声信号8に基づいて、内部モーメンタリラウドネス9を生成するための処理を行う。ここで、モーメンタリラウドネスは、ITU-R B.1771で定義されているものである。
内部ショートラウドネス計算部121は、第3のK特性フィルタ117により処理された出力音声信号7である音声信号8に基づいて、内部ショートタームラウドネス10を生成するための処理を行う。ここで、ショートタームラウドネスは、ITU-R B.1771で定義されているものである。
モーメンタリラウドネスは、400ミリ秒の時定数を有し、ショートタームラウドネスは、3秒の時定数を有するので、モーメンタリラウドネスよりもショートタームラウドネスは、より平滑化されたものとなる。
選択スイッチ123は、デコーダ101から入力した付加情報12及び外部から入力した制御情報13のうちの何れかを選択して、セレクタ出力信号15として出力する。
制御部125は、内部モーメンタリラウドネス9、内部ショートタームラウドネス10、ターゲットラウドネス14、許容ラウドネス初期値20及びセレクタ出力信号15に基づいて、ゲイン制御データ11を生成する。ここで、ターゲットラウドネス14は、ARIB TR−B32などの所定の規定で定められたものである。許容ラウドネス初期値20は、ターゲットラウドネス14よりもレベルが上回る。
ゲイン制御データ11に関連する制御は、アタック処理に関連する制御と、リリース処理に関連する制御を含む。
図5を参照して、制御部125により行われるアタック処理に関連する制御を説明する。
内部モーメンタリラウドネス9が許容ラウドネスよりも大きく(ステップS201でYES)、且つ、アタック処理が実行中でなく(ステップS203でNO)、且つ、内部ショートタームラウドネス10が増加傾向である(ステップS205でYES)時には、前記アタック処理を開始するべきであるとする判断する(ステップS207)。ゲイン制御データは、その判断に応じて変更される。なお、後述するように、許容ラウドネスとは、許容ラウドネス初期値20により初期化されるが、条件に応じて変動する変数である。
内部モーメンタリラウドネス9が許容ラウドネスよりも大きく(ステップS201でYES)、且つ、アタック処理が実行中であり(ステップS203でYES)、且つ、内部ショートタームラウドネス10が増加傾向である(ステップS209でYES)時には、アタック処理を継続するべきであるとする(ステップS207)。
内部モーメンタリラウドネス9が許容ラウドネスよりも大きく(ステップS201でYES)、且つ、前記アタック処理が実行中であり(ステップS203でYES)、且つ、内部ショートタームラウドネスが増加傾向でない(ステップS209でNO)時には、アタック処理を中断するべきであるとする(ステップS211)。ゲイン制御データは、その判断に応じて変更される。
アタック処理に関連する制御における動作例を図6を参照して説明する。なお、許容ラウドネスは、この例においては、変化しないこととしているが、本実施形態では、後述するように変化する。
図6を参照すると、時刻T1から時刻T2までの期間、時刻T3から時刻T4までの期間、時刻T5から時刻T6までの期間、時刻T7から時刻T8までの期間、及び、時刻T9から時刻T10までの期間においては、内部モーメンタリラウドネスは、許容ラウドネスより大きく、それ以外の期間では、内部モーメンタリラウドネスは、許容ラウドネス以下である。
また、時刻L1から時刻L2の期間、時刻L3から時刻L4の期間、及び、時刻L5から時刻L6の期間においては、内部ショートタームラウドネスは、増加傾向であり、それ以外の期間では、内部ショートタームラウドネスは、減少傾向である。
時刻T1から時刻T2の期間においては、内部モーメンタリラウドネスが許容ラウドネスより大きく、内部ショートタームラウドネスが増加傾向であるので、ステップS201、S203、S205、S207又はステップS201、S203、S209、S207により、アタック処理が行われる。
時刻T2から時刻T3の期間においては、内部モーメンタリラウドネスは許容ラウドネス以下であるので、ステップS201のみ実行されアタック処理中断が行われず、そのままアタック処理が継続される(アタック処理が継続するとは、アタック処理による減衰量が増加することを意味する)。
時刻L2からは、アタック処理が継続中であり、内部モーメンタリラウドネスが許容ラウドネス以上であり、また、それまで増加傾向であった内部ショートタームラウドネスが減少傾向に変化するので、ステップS201、S203、S209、S211により、アタック中断処理が行われ、それからアタック処理は中断される。しかし、モーメンタリラウドネスがリリース閾値以上であるため、リリース処理は行われない。従って、アタック処理は中断され処理継続中のゲイン量が継続的に維持される。
時刻T5においては、それまで許容ラウドネス未満であった内部モーメンタリが許容ラウドネス以上となるが、アタック処理はOFFであり、内部ショートタームラウドネスが減少傾向であるので、ステップS201、S203、S205のみ実行され、アタック処理はOFFのままである。
時刻L3においては、内部モーメンタリラウドネスが許容ラウドネス以上であり、アタック処理はOFFであり、それまで減少傾向であった内部ショートタームラウドネスが増加傾向に変化するので、ステップS201、S203、S205、S207が実行され、アタック処理が再開される。時刻L3からは同様な判断がされて、アタック処理による減衰量が増加していく。
時刻L4においては、内部モーメンタリラウドネスが許容ラウドネス以上であり、アタック処理が継続中であり、それまで増加傾向であった内部ショートタームラウドネスが減少傾向になるので、ステップS201、S203、S209、S211が実行され、アタック処理が中断される。
時刻T7においては、それまで許容ラウドネス未満であった内部モーメンタリラウドネスが許容ラウドネス以上となるが、現在アタック処理が中断されていて、内部ショートタームラウドネスが減少傾向であるので、ステップS201、S203、S205が実行され、アタック処理は中断されたままとなる。
時刻L5においては、それまで減少傾向であった内部ショートタームラウドネスが増加傾向となるが、内部モーメンタリラウドネスが許容ラウドネス未満であるので、ステップS201のみが実行され、アタック処理は中断されたままとなる。
時刻T9においては、それまで許容ラウドネス未満であった内部モーメンタリラウドネスが許容ラウドネス以上となり、それまではアタック処理は中断されたままであり、内部ショートタームラウドネスは増加傾向であるので、ステップS201、S203、S205、S207が実行され、アタック処理が再開される。
このようにアタック処理のON/OFFが制御されるため、図7に示すような出力音声信号を得ることができる。
リリース処理に関しては、時刻M1と時刻M2との間の期間において、内部モーメンタリラウドネスがリリース閾値を下回るので、この期間においては、リリース処理がONになる。
従って、可変ゲイン増幅105のゲインは、時刻T1から時刻L2までの期間では、徐々に減少し、時刻L2から時刻L3の期間では、時刻L2における値のまま不変で、時刻L3から時刻L4までの期間では、再度、徐々に減少し、時刻L4から時刻M1までの期間では、時刻L4における値のまま不変である。更に、可変ゲイン増幅器105のゲインは、時刻M1から時刻M2までの期間では、徐々に増加し、時刻M2から時刻T9までの期間では、時刻M2の値のまま不変で、時刻T9以降に再度徐々に減少する。
特許文献1に記載されている装置においては、ステップS203で内部モーメンタリラウドネス119と比較される相手は、ターゲットラウドネスであるが、本実施形態においては、ステップS203で内部モーメンタリラウドネス119と比較される相手は、ターゲットラウドネスよりも数dB(例えば、2〜4dB)レベルが高い許容ラウドネスである。従って、本実施形態は、特許文献1に記載されている装置と比較すると、アタック処理が開始されたり、アタック処理が継続されるための内部モーメンタリラウドネス119のレベルが高くなり、従って、可変ゲイン増幅器105により必要以上に入力音声信号2が抑圧されてしまうことを防止することができる。従って、音質劣化の原因となる抑圧処理を適用しなくて済むコンテンツを増やすことができる。特に、コンテンツ製作者により意図的に音声レベルにある程度の抑揚を付けることにより効果を出しているコンテンツを扱う場合であっても、抑圧処理を適用しなくて済み、コンテンツ製作者の意図をそのまま活かすことできる可能性が大きくなる。
ここで、図5を参照して説明したアタック処理に関連する制御を行うと、コンテンツ全体に亘る平均ラウドネスがターゲットラウドネスを上回ってしまう場合が生じる。そこで、図8の一部を参照して説明するように許容ラウドネスを減少させる。内部ショートタームラウドネス10が許容ラウドネス14よりも高い(ステップS221でYES)時には、許容ラウドネスを減少させる(ステップS223)。こうすることにより、内部ショートタームラウドネス10がターゲットラウドネス14よりも高い状態が継続する場合には、徐々に許容ラウドネスを下げることができるので、これにより上述したアタック処理を開始したり、アタック処理を継続するための内部モーメンタリラウドネス9を下げることができるようになり、第1中間音声信号3のレベルを徐々に下げていくことができ、従って、出力音声信号7のレベルも徐々に下げていくことができる。また、出力音声信号7のレベルが徐々に下がるようにすることにより、聴覚上の違和感をなくすことができる。
許容ラウドネスは、ステップS223の処理を継続すると、ターゲットラウドネス14よりも低くなる。しかし、基本的には、許容ラウドネスをターゲットラウドネス14よりも高くしておく必要がある。そこで、図8の他の部分を参照して説明するように許容ラウドネスを増加させる。内部ショートタームラウドネス10が許容ラウドネス14以下であり(ステップS221でNO)、且つ、許容ラウドネスが許容ラウドネス初期値20よりも小さい(ステップS225でYES)時には、許容ラウドネスを増加させる(ステップS227)。増加率は適宜調整する。また、増加後に許容ラウドネス初期値20を上回らないようにする。こうすることにより、内部ショートタームラウドネス10がターゲットラウドネス14よりも低くなってから、徐々に許容ラウドネスを許容ラウドネス初期値20に戻すことができる。
また、図9(a)に示すように、通常技術を用いた場合、元々、平均ラウドネスが、最終的にはターゲットラウドネスと同一レベルになるようにコンテンツ制作時に調整されていても、入力側ショートタームラウドネスがターゲットラウドネスを上回る期間がある程度続くと、ラウドネスコントロールされた平均ラウドネスが、最終的にはターゲットラウドネスを下回るレベルになってしまう。
これに対して、図9(b)に示すように、本実施形態では、入力側ショートタームラウドネスがターゲットラウドネスを上回る期間がある程度続いても、その期間において入力側ショートタームラウドネスが許容ラウドネスを下回っていれば、ラウドネスコントロールされた平均ラウドネスは、最終的にはターゲットラウドネスと同一レベルになる。
また、図9(c)に示すように、入力側ショートタームラウドネスがターゲットラウドネスのみならず許容ラウドネスも上回ってしまう期間がある程度続くと、平均ラウドネスがターゲットラウドネスを上回ってしまうことがあることを防止するために、図9を参照して説明した方法により許容ラウドネスのレベルを制御しているので、平均ラウドネスは、最終的にはターゲットラウドネスと同一レベルになる。図9(c)の例では、入力側ショートタームラウドネスのレベルが一定であっても、制御により許容ラウドネスが徐々に減少して、それに伴い、ラウドネスコントロールされた内部ショートタームラウドネスも減少していくこととも示している。
図10を参照して、制御部125により行われるリリース処理に関連する制御を説明する。
音声モードに変化がなく(ステップS241でNO)、且つ、内部モーメンタリラウドネス9がリリーススタート閾値以下である(ステップS243でYES)時には、通常リリース処理をするべきであると判断する(ステップS245)。ゲイン制御データは、その判断に応じて変更される。
また、音声モードに変化がある(ステップS241でYES)時には、高速リリース処理をするべきであると判断する(ステップS247)。ゲイン制御データは、その判断に応じて変更される。
次に、可変ゲイン増幅器105で行われるラウドネス調整における調整ゲインと、ブースタ109で行われるブースト処理におけるブーストゲインとの双方を、制御部125により制御する方法について図11及び図12を参照して説明する。この方法においては、現在の調整ゲインと現在のブーストゲインに基づいて、これらを修正する。現在の調整ゲインは、制御部125で保持されており、現在のブーストゲインは、ブースタ109から制御部18に入力される信号18により示され、修正後の調整ゲインは、ゲイン制御データ11により示され、修正後のブーストゲイン17は制御部125からブースタ109に出力される信号17により示される。
図11(a)に示すように、現在のブーストゲインがゼロ(dB)を超える値を示しており(ステップS261でYES)、現在のラウドネス調整ゲインがゼロ(dB)未満の値を示しており(ステップS262でYES)、現在のブーストゲインと現在のラウドネス調整ゲインとの和がゼロ(dB)を超えている(ステップS263でYES)ことは、可変ゲイン増幅器105により入力音声信号2が減衰されていて、その減衰量以上にブーストされている状態を示している。このような状態である時には、現在のブーストゲイン(dB)にラウドネス調整ゲインを加算することにより得た値を修正後のブーストゲイン(dB)とし(ステップS265)、更に、ゼロ(dB)を修正後のラウドネス調整ゲインとする(ステップS267)。こうすることにより、可変ゲイン増幅器105により入力音声信号2が減衰されることがなくなり、また、ブースタ109によるブーストゲインを最小限にすることができる。但し、ラウドネス調整ゲインの修正量とブーストゲインの修正量を上記より減らしても(すなわち、修正後のラウドネス調整ゲインがゼロ(dB)を超え、現在のラウドネス調整ゲイン未満として、修正前後のラウドネス調整ゲインの差分を現在のブーストゲインから差し引くことにより修正後のブーストゲインを得るようにしても)、一定の効果を得ることができる。
図11(b)に示すように、現在のブーストゲインがゼロ(dB)を超える値を示しており(ステップS261でYES)、現在のラウドネス調整ゲインがゼロ(dB)未満の値を示しており(ステップS262でYES)、現在のブーストゲインと現在のラウドネス調整ゲインとの和がゼロ(dB)未満である(ステップS263でNO、ステップS269でYES)ことは、可変ゲイン増幅器105により入力音声信号2が減衰されても、その減衰量のうちの一部を相殺するようにブーストされている状態を示している。このような状態である時には、ゼロ(dB)を修正後のブーストゲインとし(ステップS271)、更に、現在のブーストゲイン(dB)にラウドネス調整ゲインを加算することにより得た値を修正後のラウドネス調整ゲイン(dB)とする(ステップS273)。こうすることにより、可変ゲイン増幅器105による減衰量を減らすことができ、また、ブースタ109により第1中間音声信号3がブーストされることがなくなる。但し、ラウドネス調整ゲインの修正量とブーストゲインの修正量を上記より減らしても(すなわち、修正後のブーストゲインがゼロ(dB)を超え、現在のブーストゲイン未満として、修正前後のブーストゲインの差分を現在のラウドネス調整ゲインから差し引くことにより修正後のラウドネスゲインを得るようにしても)、一定の効果を得ることができる。
図11(c)に示すように、現在のブーストゲインがゼロ(dB)を超える値を示しており(ステップS261でYES)、現在のラウドネス調整ゲインがゼロ(dB)未満の値を示しており(ステップS262でYES)、現在のブーストゲインと現在のラウドネス調整ゲインとの和がゼロ(dB)である(ステップS263でNO、ステップS269でNO)ことは、可変ゲイン増幅器105により入力音声信号2が減衰されても、その減衰量の全部をキャンセルするようにブーストされている状態を示している。このような状態である時には、ゼロ(dB)を修正後のブーストゲインとし(ステップS275)、更に、ゼロ(dB)を修正後のラウドネス調整ゲイン(dB)とする(ステップS277)。こうすることにより、可変ゲイン増幅器105により入力音声信号2が減衰されることがなくなり、また、ブースタ109により第1中間音声信号3がブーストされることがなくなる。但し、ラウドネス調整ゲインの修正量とブーストゲインの修正量を上記より減らしても(すなわち、修正後のラウドネス調整ゲインと修正後のブーストゲインとが残るようにしても)、一定の効果を得ることができる。
従って、図11(a)、(b)、(c)の処理がされることにより、ブーストゲイン(dB)がゼロ(dB)を超え、且つ、調整ゲイン(dB)がゼロ(dB)未満である場合には、ブーストゲイン(dB)を減少させ、又は、ブースタ109によるブーストを中断し、ブーストゲイン(dB)と調整ゲイン(dB)の和を維持するように調整ゲインが修正されることとなる。
図11(a)、(b)、(c)及び図12を参照して説明した処理を行うことにより、図1を参照して説明した通常技術の問題を解決することができる。従って、出力音声信号は最初から図5(c)に示すように、音声信号が低レベルから高レベルに立ち上がった直後のオーバーシュートと音声信号が高レベルから低レベルに立ち下がった直後のアンダーシュートが発生していないものとなる。また、この状態において、可変ゲイン増幅器105は音声信号を必要以上に減衰させず、ブースタ109は低レベル側の音声信号を必要以上にブーストしない。
次に、ブースタ109において、更に、ブーストゲインを制御する方法について図13を参照して説明する。
入力側モーメンタリラウドネス計算部103で計算された入力側モーメンタリラウドネスがブーストゲート閾値を超える(ステップS291でYES)時には、ブースタ109におけるブーストゲインを0(dB)にする。すなわち、ブースタ109によるブーストを解放する。ブーストゲート閾値は、例えば、図4に示すブースト閾値を僅かに上回る値に設定するが、この限りではない。こうすることにより図2を参照して説明した通常技術の問題を解決することができる。すなわち、図2に示すような音声信号を入力した場合、ブーストゲート閾値以上の音声信号のブーストをしないことにより、不要なラウドネス制御をなくすことができる。
図11及び図12を参照して説明した機能と図13を参照して説明した機能により、可変ゲイン増幅器105における乗算とブースタ109における乗算の双方を行うことによる演算誤差の多重発生を極力避けることができ、これにより出力音声信号の品質を向上させることができる。また、街頭での演説などの放送の場合のように、レベルが比較的高いベースノイズ(背景ノイズ)と間欠音声信号が重畳された音声信号を入力した場合には、ベースノイズによる必要以上のブーストゲインを抑制することができ、従って、自然な音質を維持することができる。
なお、上記のラウドネス調整装置は、ハードウェア、ソフトウェア又はこれらの組合わせにより実現することができる。また、上記のラウドネス調整装置により行なわれるラウドネス調整方法も、ハードウェア、ソフトウェア又はこれらに組合わせにより実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
入力音声信号に対してラウドネス調整を行う可変ゲイン増幅手段と、
前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブースト手段と、
前記ブースト処理後の前記中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記可変ゲイン増幅手段によるラウドネス調整を制御し、更に、所定の条件が満たされた場合には、前記ラウドネス調整における調整ゲイン及び前記ブースト処理におけるブーストゲインのうちの少なくとも一方を修正する制御手段と、
を備えることを特徴とするラウドネス調整装置。
(付記2)
付記1に記載のラウドネス調整装置であって、
前記制御手段は、前記ブーストゲイン(dB)がゼロ(dB)を超え、且つ、前記調整ゲイン(dB)がゼロ(dB)未満である場合には、前記ブーストゲイン(dB)を減少させ、又は、前記ブースト手段によるブーストを中断し、前記ブーストゲイン(dB)と前記調整ゲイン(dB)の和を維持するように前記調整ゲインを修正する処理を行うことを特徴とするラウドネス調整装置。
(付記3)
付記2に記載のラウドネス調整装置であって、
前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)を超える場合に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後のブーストゲイン(dB)とし、更に、ゼロ(dB)を修正後の前記調整ゲインとする処理を行うことを特徴とするラウドネス調整装置。
(付記4)
付記2又は3に記載のラウドネス調整装置であって、
前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)未満である場合に、前記ブースト手段によるブースト処理を解放し、更に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後の調整ゲイン(dB)とする処理を行うことを特徴とするラウドネス調整装置。
(付記5)
付記1乃至4の何れか1に記載のラウドネス調整装置であって、
前記制御手段は、前記入力音声信号に基づいて生成された入力側モーメンタリラウドネスがブーストゲート閾値を上回ったならば、前記ブースト手段によるブースト処理を解放することを特徴とするラウドネス調整装置。
(付記6)
付記1乃至5の何れか1に記載のラウドネス調整装置であって、
前記制御手段は、
前記可変ゲイン増幅手段によりアタック処理をするか否かの判断をする際に、前記内部モーメンタリラウドネスと比較される閾値として、前記ターゲットラウドネスを上回る許容ラウドネスを設定し、
前記内部ショートタームラウドネスが、前記許容ラウドネスを超えている時には、前記許容ラウドネスを減少させるための処理を行うことを特徴とするラウドネス調整装置。
(付記7)
付記6に記載のラウドネス調整装置であって、
前記制御手段は、更に、
前記内部ショートタームラウドネスが、前記許容ラウドネス以下であり、且つ、前記許容ラウドネスが該許容ラウドネスに対して設定されている初期許容ラウドネス未満であるならば、前記許容ラウドネスを増加させるための処理を行うことを特徴とするラウドネス調整装置。
(付記8)
付記6又は7に記載のラウドネス調整装置であって、
前記アタック処理をするか否かの判断は、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中でなく、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を開始するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を継続するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向でない時には、前記アタック処理を中断するべきであるとする判断と、
を含むことを特徴とするラウドネス調整装置。
(付記9)
付記5乃至7の何れか1に記載のラウドネス調整装置であって、
前記制御手段は、更に、前記内部モーメンタリラウドネスに基づいて、前記可変ゲイン増幅手段によるリリース処理を制御することを特徴とするラウドネス調整装置。
(付記10)
入力音声信号に対してラウドネス調整を行う可変ゲイン増幅ステップと、
前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブーストステップと、
前記ブースト処理後の前記第1中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記ラウドネス調整を制御し、更に、所定の条件が満たされた場合には、前記ラウドネス調整における調整ゲイン及び前記ブースト処理におけるブーストゲインのうちの少なくとも一方を修正する制御ステップと、
を有することを特徴とするラウドネス調整方法。
(付記11)
付記10に記載のラウドネス調整方法であって、
前記制御ステップは、前記ブーストゲイン(dB)がゼロ(dB)を超え、且つ、前記調整ゲイン(dB)がゼロ(dB)未満である場合には、前記ブーストゲイン(dB)を減少させ、又は、前記ブースト手段によるブーストを中断し、前記ブーストゲイン(dB)と前記調整ゲイン(dB)の和を維持するように前記調整ゲインを修正する処理を行うことを特徴とするラウドネス調整方法。
(付記12)
付記11に記載のラウドネス調整方法であって、
前記制御ステップは、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)を超える場合に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後のブーストゲイン(dB)とし、更に、ゼロ(dB)を修正後の前記調整ゲインとする処理を行うことを特徴とするラウドネス調整方法。
(付記13)
付記11又は12に記載のラウドネス調整方法であって、
前記制御ステップは、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)未満である場合に、前記ブーストステップによるブースト処理を解放し、更に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後の調整ゲイン(dB)とする処理を行うことを特徴とするラウドネス調整方法。
(付記14)
付記10乃至13の何れか1に記載のラウドネス調整方法であって、
前記制御ステップは、前記入力音声信号に基づいて生成された入力側モーメンタリラウドネスがブーストゲート閾値を上回ったならば、前記ブーストステップによるブースト処理を解放することを特徴とするラウドネス調整方法。
(付記15)
付記10乃至14の何れか1に記載のラウドネス調整方法であって、
前記制御ステップは、
前記可変ゲイン増幅ステップによりアタック処理をするか否かの判断をする際に、前記内部モーメンタリラウドネスと比較される閾値として、前記ターゲットラウドネスを上回る許容ラウドネスを設定し、
前記内部ショートタームラウドネスが、前記許容ラウドネスを超えている時には、前記許容ラウドネスを減少させるための処理を行うことを特徴とするラウドネス調整方法。
(付記16)
付記15に記載のラウドネス調整方法であって、
前記制御ステップは、更に、
前記内部ショートタームラウドネスが、前記許容ラウドネス以下であり、且つ、前記許容ラウドネスが該許容ラウドネスに対して設定されている初期許容ラウドネス未満であるならば、前記許容ラウドネスを増加させるための処理を行うことを特徴とするラウドネス調整方法。
(付記17)
付記15又は16に記載のラウドネス調整方法であって、
前記アタック処理をするか否かの判断は、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中でなく、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を開始するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を継続するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向でない時には、前記アタック処理を中断するべきであるとする判断と、
を含むことを特徴とするラウドネス調整方法。
(付記18)
付記14乃至16の何れか1に記載のラウドネス調整方法であって、
前記制御ステップは、更に、前記内部モーメンタリラウドネスに基づいて、前記可変ゲイン増幅ステップによるリリース処理を制御することを特徴とするラウドネス調整方法。
(付記19)
コンピュータをラウドネス調整装置として機能させるためのラウドネス調整用プログラムであって、
前記コンピュータを、
入力音声信号に対してラウドネス調整を行う可変ゲイン増幅手段と、
前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブースト手段と、
前記ブースト処理後の前記第1中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記可変ゲイン増幅手段によるラウドネス調整を制御し、更に、所定の条件が満たされた場合には、前記ラウドネス調整における調整ゲイン及び前記ブースト処理におけるブーストゲインのうちの少なくとも一方を修正する制御手段と、
として機能させることを特徴とするラウドネス調整用プログラム。
(付記20)
付記19に記載のラウドネス調整用プログラムであって、
前記制御手段は、前記ブーストゲイン(dB)がゼロ(dB)を超え、且つ、前記調整ゲイン(dB)がゼロ(dB)未満である場合には、前記ブーストゲイン(dB)を減少させ、又は、前記ブースト手段によるブーストを中断し、前記ブーストゲイン(dB)と前記調整ゲイン(dB)の和を維持するように前記調整ゲインを修正する処理を行うことを特徴とするラウドネス調整用プログラム。
(付記21)
付記20に記載のラウドネス調整用プログラムであって、
前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)を超える場合に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後のブーストゲイン(dB)とし、更に、ゼロ(dB)を修正後の前記調整ゲインとする処理を行うことを特徴とするラウドネス調整用プログラム。
(付記22)
付記20又は21に記載のラウドネス調整用プログラムであって、
前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)未満である場合に、前記ブースト手段によるブースト処理を解放し、更に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後の調整ゲイン(dB)とする処理を行うことを特徴とするラウドネス調整用プログラム。
(付記23)
付記19乃至22の何れか1に記載のラウドネス調整用プログラムであって、
前記制御手段は、前記入力音声信号に基づいて生成された入力側モーメンタリラウドネスがブーストゲート閾値を上回ったならば、前記ブースト手段によるブースト処理を解放することを特徴とするラウドネス調整用プログラム。
(付記24)
付記19乃至23の何れか1に記載のラウドネス調整用プログラムであって、
前記制御手段は、
前記可変ゲイン増幅手段によりアタック処理をするか否かの判断をする際に、前記内部モーメンタリラウドネスと比較される閾値として、前記ターゲットラウドネスを上回る許容ラウドネスを設定し、
前記内部ショートタームラウドネスが、前記許容ラウドネスを超えている時には、前記許容ラウドネスを減少させるための処理を行うことを特徴とするラウドネス調整用プログラム。
(付記25)
付記24に記載のラウドネス調整用プログラムであって、
前記制御手段は、更に、
前記内部ショートタームラウドネスが、前記許容ラウドネス以下であり、且つ、前記許容ラウドネスが該許容ラウドネスに対して設定されている初期許容ラウドネス未満であるならば、前記許容ラウドネスを増加させるための処理を行うことを特徴とするラウドネス調整用プログラム。
(付記26)
付記24又は25に記載のラウドネス調整用プログラムであって、
前記アタック処理をするか否かの判断は、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中でなく、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を開始するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を継続するべきであるとする判断と、
前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向でない時には、前記アタック処理を中断するべきであるとする判断と、
を含むことを特徴とするラウドネス調整用プログラム。
(付記27)
付記23乃至25の何れか1に記載のラウドネス調整用プログラムであって、
前記制御手段は、更に、前記内部モーメンタリラウドネスに基づいて、前記可変ゲイン増幅手段によるリリース処理を制御することを特徴とするラウドネス調整用プログラム。
(付記28)
付記1乃至9の何れか1に記載のラウドネス調整装置であって、前記出力信号に対して所定の超過振幅抑圧処理を行う超過振幅抑圧手段を更に備え、
前記制御手段は、前記超過振幅抑圧処理後の前記出力信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて動作することを特徴とするラウドネス調整装置。
(付記29)
付記10乃至18の何れか1に記載のラウドネス調整方法であって、前記出力信号に対して所定の超過振幅抑圧処理を行う超過振幅抑圧ステップを更に有し、
前記制御ステップは、前記超過振幅抑圧処理後の前記出力信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて行われることを特徴とするラウドネス調整装置。
(付記30)
付記19乃至27の何れか1に記載のラウドネス調整用プログラムであって、
前記コンピュータを、更に、前記出力信号に対して所定の超過振幅抑圧処理を行う超過振幅抑圧手段として機能させ、
前記制御手段は、前記超過振幅抑圧処理後の前記出力信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて動作することを特徴とするラウドネス調整用プログラム。
本発明は、音声信号のラウドネスを調整するために利用することができる。特に、本発明は、テレビ放送、インターネット放送、ラジオ放送および音声信号をリアルタイムに出力する機能を有する装置などに利用することができる。
101 デコーダ
103 入力側モーメンタリラウドネス計算部
105 可変ゲイン増幅器
107 第1のK特性フィルタ
109 ブースタ
111 第2のK特性フィルタ
113 リミッタ/コンプレッサ
115 エンコーダ
117 第3のK特性フィルタ
119 内部モーメンタリラウドネス計算部
121 内部ショートタームラウドネス計算部
123 選択スイッチ
125 制御部

Claims (10)

  1. 入力音声信号に対してラウドネス調整を行う可変ゲイン増幅手段と、
    前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブースト手段と、
    前記ブースト処理後の前記中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記可変ゲイン増幅手段によるラウドネス調整を制御し、更に、前記ラウドネス調整における現在の調整ゲイン及び前記ブースト処理における現在のブーストゲインに基づいて、前記調整ゲインおよび前記ブーストゲインのうちの少なくとも一方を修正する制御手段と、
    を備えることを特徴とするラウドネス調整装置。
  2. 請求項1に記載のラウドネス調整装置であって、
    前記制御手段は、前記ブーストゲイン(dB)がゼロ(dB)を超え、且つ、前記調整ゲイン(dB)がゼロ(dB)未満である場合には、前記ブーストゲイン(dB)を減少させ、又は、前記ブースト手段によるブーストを中断し、前記ブーストゲイン(dB)と前記調整ゲイン(dB)の和を維持するように前記調整ゲインを修正する処理を行うことを特徴とするラウドネス調整装置。
  3. 請求項2に記載のラウドネス調整装置であって、
    前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)を超える場合に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後のブーストゲイン(dB)とし、更に、ゼロ(dB)を修正後の前記調整ゲインとする処理を行うことを特徴とするラウドネス調整装置。
  4. 請求項2又は3に記載のラウドネス調整装置であって、
    前記制御手段は、ゼロ(dB)を超える前記ブーストゲイン(dB)とゼロ(dB)未満の前記調整ゲイン(dB)との和がゼロ(dB)未満である場合に、前記ブースト手段によるブースト処理を解放し、更に、前記ブーストゲイン(dB)に前記調整ゲイン(dB)を加算することにより得た値を修正後の調整ゲイン(dB)とする処理を行うことを特徴とするラウドネス調整装置。
  5. 請求項1乃至4の何れか1項に記載のラウドネス調整装置であって、
    前記制御手段は、前記入力音声信号に基づいて生成された入力側モーメンタリラウドネスがブーストゲート閾値を上回ったならば、前記ブースト手段によるブースト処理を解放することを特徴とするラウドネス調整装置。
  6. 請求項1乃至5の何れか1項に記載のラウドネス調整装置であって、
    前記制御手段は、
    前記可変ゲイン増幅手段によりアタック処理をするか否かの判断をする際に、前記内部モーメンタリラウドネスと比較される閾値として、前記ターゲットラウドネスを上回る許容ラウドネスを設定し、
    前記内部ショートタームラウドネスが、前記許容ラウドネスを超えている時には、前記許容ラウドネスを減少させるための処理を行うことを特徴とするラウドネス調整装置。
  7. 請求項6に記載のラウドネス調整装置であって、
    前記制御手段は、更に、
    前記内部ショートタームラウドネスが、前記許容ラウドネス以下であり、且つ、前記許容ラウドネスが該許容ラウドネスに対して設定されている初期許容ラウドネス未満であるならば、前記許容ラウドネスを増加させるための処理を行うことを特徴とするラウドネス調整装置。
  8. 請求項6又は7に記載のラウドネス調整装置であって、
    前記アタック処理をするか否かの判断は、
    前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中でなく、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を開始するべきであるとする判断と、
    前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向である時には、前記アタック処理を継続するべきであるとする判断と、
    前記内部モーメンタリラウドネスが前記許容ラウドネスよりも大きく、且つ、前記アタック処理が実行中であり、且つ、前記内部ショートタームラウドネスが増加傾向でない時には、前記アタック処理を中断するべきであるとする判断と、
    を含むことを特徴とするラウドネス調整装置。
  9. 入力音声信号に対してラウドネス調整を行う可変ゲイン増幅ステップと、
    前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブーストステップと、
    前記ブースト処理後の前記中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記ラウドネス調整を制御し、更に、前記ラウドネス調整における現在の調整ゲイン及び前記ブースト処理における現在のブーストゲインに基づいて、前記調整ゲインおよび前記ブーストゲインのうちの少なくとも一方を修正する制御ステップと、
    を有することを特徴とするラウドネス調整方法。
  10. コンピュータをラウドネス調整装置として機能させるためのラウドネス調整用プログラムであって、
    前記コンピュータを、
    入力音声信号に対してラウドネス調整を行う可変ゲイン増幅手段と、
    前記ラウドネス調整後の前記入力音声信号である中間音声信号に対して所定のブースト処理を行うブースト手段と、
    前記ブースト処理後の前記第1中間音声信号である出力音声信号に基づいて生成された内部モーメンタリラウドネス及び内部ショートタームラウドネス並びに所定のターゲットラウドネスに少なくとも基づいて、前記可変ゲイン増幅手段によるラウドネス調整を制御し、更に、前記ラウドネス調整における現在の調整ゲイン及び前記ブースト処理における現在のブーストゲインに基づいて、前記調整ゲインおよび前記ブーストゲインのうちの少なくとも一方を修正する制御手段と、
    として機能させることを特徴とするラウドネス調整用プログラム。
JP2014233017A 2014-11-17 2014-11-17 ラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラム Active JP6228100B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014233017A JP6228100B2 (ja) 2014-11-17 2014-11-17 ラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014233017A JP6228100B2 (ja) 2014-11-17 2014-11-17 ラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラム

Publications (2)

Publication Number Publication Date
JP2016096517A JP2016096517A (ja) 2016-05-26
JP6228100B2 true JP6228100B2 (ja) 2017-11-08

Family

ID=56071520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014233017A Active JP6228100B2 (ja) 2014-11-17 2014-11-17 ラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラム

Country Status (1)

Country Link
JP (1) JP6228100B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6506230B2 (ja) * 2016-09-28 2019-04-24 Necプラットフォームズ株式会社 音声無音検知装置、音声無音検知方法、音声無音検知プログラム、及び音声無音検知システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5535592A (en) * 1978-09-06 1980-03-12 Nec Corp Signal amplitude expander with limiter
RU2417514C2 (ru) * 2006-04-27 2011-04-27 Долби Лэборетериз Лайсенсинг Корпорейшн Регулировка усиления звука с использованием основанного на конкретной громкости обнаружения акустических событий
JP5827442B2 (ja) * 2012-04-12 2015-12-02 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号におけるラウドネス変化をレベリングするシステム及び方法
JP5527827B2 (ja) * 2012-04-17 2014-06-25 Necエンジニアリング株式会社 ラウドネス調整装置、ラウドネス調整方法、及びプログラム

Also Published As

Publication number Publication date
JP2016096517A (ja) 2016-05-26

Similar Documents

Publication Publication Date Title
JP5236006B2 (ja) 音声信号調整装置及び音声信号調整方法
KR102505773B1 (ko) 다중 대역 제한기 모드 및 잡음 보상 방법
AU2014340178B2 (en) System and method for digital signal processing
EP3369175B1 (en) Object-based audio signal balancing
US10109288B2 (en) Dynamic range and peak control in audio using nonlinear filters
JP6388457B2 (ja) オーディオ信号を圧縮するためのデジタルコンプレッサ
JP2010537233A (ja) 圧縮デジタルテレビの音声処理
CN104798301A (zh) 音频响度控制系统
AU2014340178A1 (en) System and method for digital signal processing
US20080152168A1 (en) Audio signal frequency range boost circuits
EP2837094A1 (en) System and method for leveling loudness variation in an audio signal
JP6228100B2 (ja) ラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラム
EP1580884A1 (en) Dynamic equalizing
JP4661422B2 (ja) ミューティング装置、デジタルオーディオ装置
JP2004104692A (ja) 自動利得制御装置、自動利得制御方法および自動利得制御プログラム
JPWO2018131513A1 (ja) 情報処理装置および方法、並びにプログラム
JP4803193B2 (ja) オーディオ信号の利得制御装置および利得制御方法
US9461604B2 (en) Sound output device and method of adjusting sound volume
CN102117619A (zh) 白噪声阶段增益调整方法及装置
JP5240039B2 (ja) 周波数特性調整装置、プログラム、及び周波数特性調整方法
EP4029144B1 (en) Dynamic range compression with reduced artifacts
HK40077304A (en) Multiband limiter modes and noise compensation methods
EP2128978A1 (en) Reproducing apparatus and reproducing method
JP2015173343A (ja) オーディオ信号処理装置
JP2014187474A (ja) 音声信号処理装置、音響装置、音声信号処理装置の制御方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160304

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20160923

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170307

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170421

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20170710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171012

R150 Certificate of patent or registration of utility model

Ref document number: 6228100

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150