[go: up one dir, main page]

JP5051235B2 - エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置及び音出力装置 - Google Patents

エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置及び音出力装置 Download PDF

Info

Publication number
JP5051235B2
JP5051235B2 JP2009536910A JP2009536910A JP5051235B2 JP 5051235 B2 JP5051235 B2 JP 5051235B2 JP 2009536910 A JP2009536910 A JP 2009536910A JP 2009536910 A JP2009536910 A JP 2009536910A JP 5051235 B2 JP5051235 B2 JP 5051235B2
Authority
JP
Japan
Prior art keywords
sound
sound signal
signal
echo
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009536910A
Other languages
English (en)
Other versions
JPWO2009047871A1 (ja
Inventor
直司 松尾
太介 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/JP2007/069930 external-priority patent/WO2009047858A1/ja
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009536910A priority Critical patent/JP5051235B2/ja
Publication of JPWO2009047871A1 publication Critical patent/JPWO2009047871A1/ja
Application granted granted Critical
Publication of JP5051235B2 publication Critical patent/JP5051235B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音信号に基づいて音を出力する音出力装置と、音が入力される音入力装置と、該音入力装置が入力した音から、前記音出力装置が出力した音に基づくエコーを抑圧するエコー抑圧装置とを備えるエコー抑圧システム、該エコー抑圧システムに適用されるエコー抑圧方法、前記エコー抑圧システムにて用いられるエコー抑圧装置を実現するためのエコー抑圧プログラム、前記エコー抑圧システムにて用いられるエコー抑圧装置及び音出力装置に関する。
例えば、従来のカーナビゲーションシステムにおける音声認識では、話者が発声する前に発話スイッチを押下することにより、カーナビゲーションシステムを消音し、カーナビゲーションシステムのスピーカから出力された音が、エコーとしてマイクロホンに回り込み、音声の誤認識の要因となることを防止している。これに対し、出力音を消音することなく音声認識による操作を行いたいという使用者からの要望がある。この様な要望に応えるためにはスピーカからマイクロホンに回り込む音を抑圧するエコー抑圧方法が必要となる。また車両内の音響、即ちカーオーディオシステムでは、マルチチャネルに対応すべく複数のスピーカが用いられているため、マルチチャネルのカーオーディオシステムから音声認識等の用途に用いられるマイクロホンに回り込むエコーに対応するエコー抑圧方法が要求される。
そこでモノラルチャネルのオーディオシステムに対応するエコー抑圧方法をマルチチャネルのオーディオシステムに適用したエコー抑圧装置が提案されている。図1は、従来の第1のエコー抑圧装置の構成を示す模式図である。図1中1000は、エコー抑圧装置であり、エコー抑圧装置1000は、マルチチャネルオーディオ2000から出力された複数チャネルの音信号を、複数のスピーカ2001,2001,…へ出力し、各スピーカ2001,2001,…は、夫々の音信号に基づく出力を行う。そしてエコー抑圧装置1000は、マイクロホン2002にて受音した音から、出力された複数チャネルの音に基づくエコーを除去する。エコーの除去は、受音した音に基づく観測音信号y(t)から、出力する複数チャネル(n)の音に基づく参照音信号x1(t),…,xn(t)を、夫々のチャネルの参照音信号x1(t),…,xn(t)に対応した複数の抑圧機構(エコーキャンセラ)1001−1,…,1001−nにて夫々に対応するエコーを抑圧することにより行う。
またモノラルチャネルのオーディオシステムに対応するエコー抑圧方法をマルチチャネルのオーディオシステムに適用したエコー抑圧装置は、図1以外の形態についても提案されている。図2は、従来の第2のエコー抑圧装置の構成を示す模式図である。第2のエコー抑圧装置1000は、複数チャネルの音に基づく参照音信号x1(t),…,xn(t)を加算する加算機構1002にて加算参照音信号x(t)を生成し、一の抑圧機構1001にて、観測音信号y(t)から、加算参照音信号x(t)に基づいてエコーを抑圧する。
図3は、従来のエコー抑圧装置が備える抑圧機構1001の機能構成を示す機能ブロック図である。抑圧機構1001は、話者が発声しているダブルトークの状態及び発声していないシングルトークの状態を検出する検出部10010と、学習同定法を用いた適応処理により、エコーの推定に要するフィルタ係数を更新するフィルタ係数更新部10011と、フィルタ係数を用いた数百次の積和演算により、参照音信号x(t)から、エコー信号x'(t)を推定する線形FIRフィルタ部10012と、観測音信号y(t)からエコー信号x'(t)を減算することによりエコーの抑圧を行った抑圧結果r(t)を出力する減算部10013とを備えている。検出部10010は、抑圧結果r(t)の強度変化に基づいてシングルトークの状態とダブルトークの状態とを検出し、ダブルトークの状態時には、フィルタ係数更新部10011のフィルタ係数の更新を停止させる。フィルタ係数更新部10011は、抑圧結果r(t)に基づいてフィルタ係数を算出する。
なお図1に示したエコー抑圧装置1000では、図3に示す抑圧機構1001を参照音信号x1(t),…,xn(t)毎に備えている。この様なエコー抑圧方法は、例えば特許文献1に開示されている。
特開2002−237769号公報
しかしながら図1に示した様に各チャネルに対応する抑圧機構を要する方法では、コストの増加、装置の大型化等の問題がある。特に設置スペースの制約が大きいカーナビゲーションシステムに適用する場合、大型化の問題は深刻である。
さらに図2に示した様に参照音信号を加算してモノラルチャネルの加算参照音信号とした場合には、抑圧できていない残留エコーが大きくなるという問題が生じる。これはマルチチャネルオーディオ2000による音楽等の音の出力では、各スピーカの再生音及び強度が独立して変化するため、複数経路のエコーを一の適応処理にて学習すると、推定精度が低下するためである。
本発明は斯かる事情に鑑みてなされたものであり、複数チャネルの音信号に対して異なる周波数帯域の成分を通過させ、また夫々異なる周波数帯域の成分の複数の音信号を加算した参照音信号及び入力された音を変換した観測音信号に基づいて、観測音信号に含まれるエコーを抑圧することにより、一つの抑圧機構で複数チャネルに対応するエコーの抑圧を行うことができるので、コストの増加及び装置の大型化を抑制することが可能であり、また観測音信号の任意の周波数には、一のチャネルの音信号に基づく一の経路のエコーのみが含まれているため、エコーの推定精度を上げることができ、残留エコーを抑制することが可能なエコー抑圧システム、該エコー抑圧システムに適用されるエコー抑圧方法、前記エコー抑圧システムにて用いられるエコー抑圧装置を実現するためのエコー抑圧プログラム、前記エコー抑圧システムにて用いられるエコー抑圧装置及び音出力装置の提供を目的とする。
第1のエコー抑圧システムは、音信号に基づいて音を出力する音出力装置と、入力された音を音信号に変換する音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置とを備えるエコー抑圧システムにおいて、前記音出力装置は、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部とを有し、前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、前記エコー抑圧装置は、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部とを有することを要件とする。
第2のエコー抑圧システムは、第1のエコー抑圧システムにおいて、前記通過部は、複数の音信号を夫々周波数軸上の成分に変換する第1変換部と、周波数軸上の成分に変換した複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる帯域通過フィルタ部と、夫々の周波数帯域の成分を通過させた周波数軸上の成分に変換されている複数の音信号を、夫々時間軸上の音信号に変換する第2変換部とを有することを要件とする。
第3のエコー抑圧システムは、第2のエコー抑圧システムにおいて、前記通過部が夫々異なる周波数帯域の成分を通過させる複数の音信号は、第1音信号、第2音信号、第1音信号及び/又は第2音信号を所定の加工方法で加工した加工音信号であり、前記帯域通過フィルタ部は、音信号毎にフィルタ係数が設定されてあり、第1音信号に対して第1フィルタ係数、第2音信号に対して第2フィルタ係数、並びに加工音信号に対して加工方法に応じた第1フィルタ係数及び/又は第2フィルタ係数に基づく加工フィルタ係数が夫々設定されていることを要件とする。
第4のエコー抑圧システムは、第3のエコー抑圧システムにおいて、前記加工音信号は、前記第1音信号及び前記第2音信号の和である和音信号、前記第1音信号を所定時間遅延させた遅延第1音信号、並びに前記第2音信号を所定時間遅延させた遅延第2音信号であり、前記加工フィルタ係数は、和音信号に対して第1音信号及び第2音信号の和に基づくフィルタ係数、遅延第1音信号に対して第1フィルタ係数に基づくフィルタ係数、並びに遅延第2音信号に対して第2フィルタ係数に基づくフィルタ係数が夫々設定されていることを要件とする。
第5のエコー抑圧システムは、第1乃至第4のいずれかのエコー抑圧システムにおいて、前記通過部は、等間隔に分割した周波数帯域の成分を通過させる様にしてあることを要件とする。
第6のエコー抑圧システムは、第1乃至第4のいずれかのエコー抑圧システムにおいて、前記通過部は、対数値が等間隔となるように分割した周波数帯域の成分を通過させる様にしてあることを要件とする。
第7のエコー抑圧システムは、第1乃至第6のいずれかのエコー抑圧システムにおいて、前記音出力装置は、予め設定されている除去帯域に該当する周波数帯域の成分を、何れの音信号に対しても通過させない様にしてあり、前記補正部は、前記参照音信号を、周波数毎に設定されたフィルタ係数にてフィルタリングすることにより、前記観測音信号の補正に要する補正量を導出する補正用フィルタ部と、前記補正後の観測音信号に基づいて、前記補正用フィルタのフィルタ係数の算出及び更新を行う係数更新部と、前記観測音信号の除去帯域の成分に基づいて、前記係数更新部による更新の可否を判定する更新可否判定部とを有することを要件とする。
第8のエコー抑圧システムは、第1乃至第7のいずれかのエコー抑圧システムにおいて、前記音出力装置は、更に、周波数帯域毎に、複数の音信号の振幅の大きさを所定の方法で比較し、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上か否かを判定する比較部を更に備え、前記通過部は、前記比較部が所定値以上と判定した周波数帯域に対しては、前記一の音信号のみを通過させる様にしてあることを要件とする。
第9のエコー抑圧システムは、第1乃至第7のいずれかのエコー抑圧システムにおいて、前記音出力装置は、更に、周波数帯域毎に、複数の音信号の振幅の大きさを所定の方法で比較し、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上か否かを判定する比較部を更に備え、前記通過部は、前記比較部が所定値以上と判定した周波数帯域に対しては、全ての音信号を通過させる様にしてあることを要件とする。
第10のエコー抑圧システムは、第1乃至第9のいずれかのエコー抑圧システムにおいて、前記通過部は、通過させる音信号毎の周波数帯域の成分を、経時的に変更する様にしてあることを要件とする。
第11のエコー抑圧方法は、音信号に基づいて音を出力する音出力装置と、音を入力される音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置とを用いたエコー抑圧方法において、前記音出力装置により、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過手順と、夫々異なる周波数帯域の成分が通過した複数の音信号に基づく音を夫々出力する音出力手順と、前記音入力装置により、入力された音を音信号に変換する音入力手順と、前記エコー抑圧装置により、夫々異なる周波数帯域の成分が通過した複数の音信号を加算して参照音信号を生成する加算手順と、前記音入力装置から音信号を観測音信号として入力される入力手順と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正手順とを含むことを要件とする。
第12のエコー抑圧プログラムは、音信号に基づいて音を出力する音出力装置、及び入力された音に基づいて音信号を生成する音入力装置と連携し、前記音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧させる手順をエコー抑圧装置に実行させるエコー抑圧プログラムにおいて、前記エコー抑圧装置に、前記音出力装置から出力された夫々異なる周波数帯域の成分を通過させた複数の音信号を加算して生成した参照音信号と、前記音入力装置にて生成された音信号である観測音信号とに基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正手順を実行させることを要件とする。
第13のエコー抑圧装置は、音信号に基づいて音を出力する音出力装置、及び入力された音に基づいて音信号を生成する音入力装置と連携し、前記音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置において、前記音出力装置から出力された夫々異なる周波数帯域の成分を通過させた複数の音信号を加算して参照音信号を生成する加算部と、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部とを有することを要件とする。
第14の音出力装置は、複数の音信号に基づく音を出力する複数の音出力部を備えており、入力された音に基づいて音信号を生成する音入力装置及び該音入力装置が入力された音から前記音出力部から出力した音に基づくエコーを抑圧するエコー抑圧装置と連携する音出力装置において、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部を有し、前記複数の音出力部は、前記通過部を通過した複数の音信号に基づく音を夫々出力する様に構成してあることを要件とする。
第15のオーディオシステムは、音信号に基づいて音を出力する音出力装置と、入力された音を音信号に変換する音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置と、前記音出力装置、音入力装置及びエコー抑圧装置の少なくとも一を制御する制御部を有する制御装置とを備えたオーディオシステムにおいて、前記音出力装置は、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部とを有し、前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、前記エコー抑圧装置は、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と、該補正部が補正した観測音信号を前記制御装置へ出力する出力部とを有し、前記制御装置は、前記出力された補正後の観測音信号を入力される入力部と、該入力部から入力された補正後の観測音信号に基づいて音声認識処理を行う認識部とを有し、前記制御部は、認識部による認識結果に基づき制御を行うことを要件とする。
第16のナビゲーションシステムは、音信号に基づいて音を出力する音出力装置と、入力された音を音信号に変換する音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置と、ナビゲーション処理を行う制御部を有するナビゲーション装置とを備えるナビゲーションシステムにおいて、前記音出力装置は、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部とを有し、前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、前記エコー抑圧装置は、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と、該補正した観測音信号を前記ナビゲーション装置へ出力する出力部とを有し、前記ナビゲーション装置は、前記出力された補正後の観測音信号を入力される入力部と、該入力部から入力された補正後の観測音信号に基づいて音声認識処理を行う認識部とを有し、前記制御部は、前記認識部による認識結果に基づいてナビゲーション処理を行うことを要件とする。
第17の移動体は、音信号に基づいて音を出力する音出力装置と、入力された音を音信号に変換する音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置と、ナビゲーション処理を行う制御部を有するナビゲーション装置とを備える移動体において、前記音出力装置は、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部とを有し、前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、前記エコー抑圧装置は、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と、該補正した観測音信号を前記ナビゲーション装置へ出力する出力部とを有し、前記ナビゲーション装置は、前記出力された補正後の観測音信号を入力される入力部と、該入力部から入力された補正後の観測音信号に基づいて音声認識処理を行う認識部とを有し、前記制御部は、前記認識部による認識結果に基づいてナビゲーション処理を行うことを要件とする。
第1、第2、第5及び第6のエコー抑圧システム、第11のエコー抑圧方法、第12のエコー抑圧プログラム、第13のエコー抑圧装置、第14の音出力装置、第15のオーディオシステム、第16のナビゲーションシステム並びに第17の移動体では、周波数毎に音信号が異なることから、観測音信号の任意の周波数に対し、一の音信号に基づく一の経路のエコーのみが含まれているため、エコーの推定精度を上げることができるので、残留エコーを抑制することが可能である。しかも複数の音信号の夫々に対してエコーを抑圧するための補正部を設ける必要がなく、一の補正部にて複数の音信号によるエコーを抑圧することができるので、補正部の増設に伴うコストの増加及び装置の大型化を防止することが可能である。
第3及び第4のエコー抑圧システムでは、例えば第1音信号及び第2音信号の和に基づく和音信号、第1音信号を所定時間遅延させた遅延第1音信号、第2音信号を遅延させた遅延第2音信号等の加工音信号を用いて擬似5チャネルステレオを実現する場合に、加工音信号に対しては、第1音信号に用いる第1フィルタ係数及び第2音信号に用いる第2フィルタ係数を転用して周波数帯域の割り当てを行うことにより、二種類のフィルタで三種類以上の音信号に対する処理を行うことができるので、音出力装置のリソースを効率的に利用することが可能となる。
第7のエコー抑圧システムでは、例えば人の声に対応する周波数帯を除去帯域として設定し、観測音信号の除去帯域の成分に基づいて、話者が発声しているダブルトークの状態であるか発声していないシングルトークの状態であるかを検出し、例えばダブルトークの状態であると判定した場合に、フィルタ係数の更新を停止させることにより、音声が含まれている区間の認識精度を向上させ、音声認識処理の精度を向上させることが可能である。
第8及び第9のエコー抑圧システムでは、一の音信号の振幅の大きさが他の全ての音信号の振幅の大きさに対して、所定の条件以上大きい場合に、一の音信号が通過部で遮断されることを防止するので、複数チャネルで違和感のない音を出力させることが可能である。
第10のエコー抑圧システムでは、夫々の音信号で出力に偏りがある場合でも、特定の周波数帯域において、特定の音信号が遮断され続けることがないので、複数チャネルで違和感のない音を出力させることが可能である。
本願は、マルチチャネルオーディオ等の複数の音信号に対し、夫々異なる周波数帯域の成分を通過させ、夫々異なる周波数帯域の成分が通過した複数の音信号に基づく音をスピーカ等の複数の音出力部から夫々出力する。マイク等の音入力部を有する音入力装置は、入力された音を音信号に変換する。そしてエコー抑圧装置は、夫々異なる周波数帯域の成分を有する複数の音信号を加算した参照音信号と、音入力装置から入力された音信号である観測音信号とに基づいて、観測音信号に含まれるエコーを抑圧すべく観測音信号を補正するという技術を開示する。
この構成により、本願では、周波数毎に割り当てられている音信号が異なることから、観測音信号の任意の周波数に対し、一の音信号に基づく一の経路のエコーのみが含まれているため、出力した音の任意の周波数による影響は、入力した音の同じ周波数に出現するという線形性を利用して、エコーの推定精度を上げることができるので、残留エコーを抑制することが可能である等、優れた効果を奏する。しかも本発明では、複数の音信号の夫々に対してエコーを抑圧するための補正部を設ける必要がなく、一の補正部にて複数の音信号によるエコーを抑圧することができるので、補正部の増設に伴うコストの増加及び装置の大型化を防止することが可能である等、優れた効果を奏する。
また本願は、複数の音信号として、第1音信号、第2音信号、第1音信号及び/又は第2音信号を所定の加工方法で加工した加工音信号を用いる場合、例えば第1音信号及び第2音信号が、2チャネルのステレオ信号である場合で、第1音信号及び第2音信号の和に基づく和音信号、第1音信号を所定時間遅延させた遅延第1音信号、第2音信号を遅延させた遅延第2音信号等の加工音信号を用いて擬似5チャネルステレオを実現するときに、加工音信号に対しては、第1音信号に用いる第1フィルタ係数及び第2音信号に用いる第2フィルタ係数を転用して周波数帯域の割り当てを行う技術を開示する。
この構成により、本願では、二種類のフィルタで三種類以上の音信号に対する処理を行うことができるので、音出力装置のリソースを効率的に利用することが可能となる等、優れた効果を奏する。
さらに本願は、音出力装置において、例えば人の声に対応する周波数帯を除去帯域として予め設定しておき、除去帯域に該当する周波数帯域の成分を、何れの音信号に対しても通過させないようにする。そしてエコー抑圧装置では、観測音信号の除去帯域の成分に基づいて、話者が発声しているダブルトークの状態であるか発声していないシングルトークの状態であるかを検出し、シングルトークの状態であると判定した場合、周波数毎に設定されたフィルタ係数にてフィルタリングすることにより、観測音信号の補正に要する補正量を導出する補正用フィルタ部のフィルタ係数の算出及び更新を行い、ダブルトークの状態であると判定した場合、フィルタ係数の更新を停止させる技術を開示する。
この構成により、本願では、音声が含まれている区間の認識精度を向上させ、音声認識精度を向上させることが可能である等、優れた効果を奏する。
さらに本願は、複数の音信号の振幅の大きさを所定の方法で比較して、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上であると判定した周波数帯域に対しては、全ての音信号又は大きさが最大である一の音信号のみを通過させる技術を開示する。
この構成により、本願では、例えばオーケストラにおけるソロ演奏の様に、一の音信号の振幅が他の音信号に対して、所定値以上である場合に、一の音信号が通過部で遮断されることを防止するので、複数チャネルで違和感のない音を出力させることが可能である等、優れた効果を奏する。
さらに本願は、通過させる音信号毎の周波数帯域の成分を、経時的に変更する技術を開示する。
この構成により、本願では、夫々の音信号で出力に偏りがある場合でも、特定の周波数帯域において、特定の音信号が遮断され続けることがないので、複数チャネルで違和感のない音を出力させることが可能である等、優れた効果を奏する。
従来の第1のエコー抑圧装置の構成を示す模式図である。 従来の第2のエコー抑圧装置の構成を示す模式図である。 従来のエコー抑圧装置が備える抑圧機構の機能構成を示す機能ブロック図である。 本発明の実施の形態1に係るエコー抑圧システムの構成例を模式的に示すブロック図である。 本発明の実施の形態1に係る音出力装置の通過機構の構成例を示す機能ブロック図である。 本発明の実施の形態1に係る音出力装置が備える通過機構の通過フィルタ部のフィルタ係数を示すグラフである。 本発明の実施の形態1に係るエコー抑圧装置が備える抑圧機構の構成例を示す機能ブロック図である。 本発明の実施の形態1に係る音処理装置の構成例を示すブロック図である。 本発明の実施の形態1に係る音出力装置の音出力処理の一例を示すフローチャートである。 本発明の実施の形態1に係る音入力装置の音入力処理の一例を示すフローチャートである。 本発明の実施の形態1に係るエコー抑圧装置のエコー抑圧処理の一例を示すフローチャートである。 本発明の実施の形態1に係るエコー抑圧装置のフィルタ係数更新処理の一例を示すフローチャートである。 本発明の実施の形態2に係る音出力装置の通過機構の構成例を示す機能ブロック図である。 本発明の実施の形態2に係る音出力装置が備える通過機構の通過フィルタのフィルタ係数を示すグラフである。 本発明の実施の形態3に係る音出力装置の通過機構の構成例を示す機能ブロック図である。 本発明の実施の形態3に係る音出力装置が備える通過機構の除去部のフィルタ係数を示すグラフである。 本発明の実施の形態3に係るエコー抑圧装置が備える抑圧機構の構成例を示す機能ブロック図である。 本発明の実施の形態3に係るエコー抑圧装置が備える抑圧機構の除去帯域通過フィルタ部のフィルタ係数を示すグラフである。 本発明の実施の形態3に係る音出力装置の音出力処理の一例を示すフローチャートである。 本発明の実施の形態3に係るエコー抑圧装置のフィルタ係数更新処理の一例を示すフローチャートである。 本発明の実施の形態4に係るエコー抑圧システムの構成例を模式的に示すブロック図である。 本発明の実施の形態5に係る音出力装置の通過機構の構成例を示す機能ブロック図である。 本発明の実施の形態5に係る音出力装置の音出力処理の一例を示すフローチャートである。 本発明の実施の形態5に係る音出力装置が備える通過機構の処理の例を概念的に示す説明図である。 本発明の実施の形態6に係る音出力装置の通過機構の構成例を示す機能ブロック図である。 本発明の実施の形態6に係る音出力装置の音出力処理の一例を示すフローチャートである。 本発明の実施の形態7に係る音出力装置の通過機構の構成例を示す機能ブロック図である。 本発明の実施の形態7に係る音出力装置の係数変更処理の一例を示すフローチャートである。 本発明の実施の形態7に係る音出力装置が備える通過機構の各帯域通過フィルタ部のフィルタ係数の経時変化の例を示す説明図である。
符号の説明
1 エコー抑圧装置
10 第1入力機構
11 第2入力機構
12 抑圧機構
120 加算部
121 補正部
1210 線形FIRフィルタ部
1211 減算部
1212 フィルタ係数更新部
1213 検出部
1214 除去帯域通過フィルタ部
13 出力機構
2 音出力装置
20 音出力機構
21 音信号生成機構
22 通過機構
220 FFT変換部
221 帯域通過フィルタ部
222 IFFT変換部
223 除去部
224 比較部
225 係数部
23 操作機構
24 切替機構
3 音入力装置
30 音入力機構
4 音処理装置
40 入力機構
41 認識機構
42 制御機構
5 移動体
100 エコー抑圧プログラム
以下、本発明をその実施の形態を示す図面に基づいて詳述する。
実施の形態1.
図4は、本発明の実施の形態1に係るエコー抑圧システムの構成例を模式的に示すブロック図である。図4中1は、カーナビゲーションシステム等のシステムに適用されるエコー抑圧システムにて用いられるエコー抑圧装置であり、エコー抑圧装置1は、複数チャネルの音を出力するスピーカ等の複数の音出力機構20,20,…を有するマルチチャネルオーディオ等の音出力装置2、コンデンサマイク等のマイクロホンを用いた音入力機構30を有する音入力装置3、及び音声認識システム等の音処理装置4と連携して動作する。そしてエコー抑圧装置1、音出力装置2、音入力装置3及び音処理装置4は、車両等の移動体5に搭載されている。なお本発明のエコー抑圧システムは、図4に例示したカーナビゲーションシステムに限らず、オーディオシステム、テレビ会議システム等の様々なシステムに適用することが可能である。
音出力装置2は、例えば音データを記録する音楽CD(Compact Disc)、DVD(Digital Versatile Disc)等の記録媒体から音データを読み取り、読み取った音データに基づいて複数チャネル分の音信号を生成し、生成した複数の音信号をマルチチャネルオーディオ信号として出力する音信号生成機構21と、複数チャネル分の音信号に対し、夫々異なる周波数帯域の成分を通過させるDSP(Digital Signal Processor)にて構成された通過機構22とを備え、通過機構22を通過した複数チャネル分の音信号は、音出力機構20,20,…から複数チャネルの音として出力される。また音出力装置2は、通過機構22を通過した複数チャネル分の音信号をエコー抑圧装置1へ送信する。なお音信号生成機構21から出力される音信号は、アナログ信号であり、図示しないA/D(Analog to Digital )変換器にてデジタル信号に変換後、通過機構22へ出力される。また通過機構22からはデジタル信号である音信号を出力し、図示しないD/A(Digital to Analog )変換器にてアナログ信号に変換後、音出力機構20,20,…及びエコー抑圧装置1へ出力する。音出力機構20,20,…は、夫々チャネルが割り当てられており、通過機構22を通過した各音信号はチャネルが対応している音出力機構20,20,…へ夫々出力される。なお本発明のエコー抑圧システムは、音出力機構20,20,…にデジタル信号である音信号に基づいて音を出力する機能を持たせ、各機構及び装置間の入出力を全てデジタル信号で行う等、適宜設計することが可能である。
音入力装置3は、音入力機構30により、入力された音に基づいてアナログ信号である音信号を生成し、生成した音信号をゲインアンプ等の図示しない増幅器にて増幅し、増幅した音信号を図示しないA/D変換器にて8000Hz、12000Hz等のサンプリング周波数でサンプリングしてデジタル信号に変換し、デジタル信号に変換した音信号をエコー抑圧装置1へ出力する。
エコー抑圧装置1は、音出力装置2から出力された複数チャネル分の音信号を入力される第1入力機構10と、音入力装置3から出力された音信号を観測音信号として入力される第2入力機構11と、観測音信号に含まれるエコー成分を抑圧するDSP等の抑圧機構12と、抑圧機構12にてエコー成分を抑圧した観測音信号を音処理装置4へ出力する出力機構13とを備えている。
抑圧機構12には、エコー抑圧プログラム100及びデータ等のファームウェアが組み込まれており、ファームウェアとして組み込まれた本発明のエコー抑圧プログラム100を実行することにより、第1入力機構10にて入力された複数チャネル分の音信号を加算して参照音信号を生成する加算部120、観測音信号及び参照音信号に基づいて、観測音信号に含まれるエコーを抑圧すべく観測音信号を補正する補正部121等の各種プログラムモジュールを生成する。そして生成した各種プログラムモジュールを実行することにより、エコー抑圧装置1が備える抑圧機構12は、音出力機構20,20,…から夫々出力された音に基づくエコーを、音入力機構30に入力された音から除去するエコーキャンセラとして機能する。
また第1入力機構10は、音出力装置2から入力されるアナログ信号である複数チャネル分の音信号をデジタル信号に変換するA/D変換器を備えている。但し、第1入力機構10からデジタル信号として音信号が入力される場合、A/D変換器は不要となる。また音入力装置3が備える増幅器及びA/D変換器の機能を第2入力機構11に備えさせる様にしても良い。
図4に示した構成例は、本発明の無限にある形態の一を例示したに過ぎず、必要に応じて適宜ハードウェア及びソフトウェア構成を変更することも可能である。例えば各プログラムモジュールは、VLSI等の演算回路を用いたハードウェアとして構成することも可能であり、更には加算部120の機能を音出力装置2に備えさせる等、適宜、実装形態を変更することができる。また加算部120を、抑圧機構12外のハードウェアとして構成する場合、アナログ信号をミキシングするミキシング回路を用いた加算部120を用いて構成するようにしても良く、その場合、音出力装置2から入力されたアナログ信号である複数チャネルの音信号は、加算部120にてミキシング(加算)された後、図示しないA/D変換器によりデジタル信号に変換される。
図4において、1ch,…,nch(nは自然数)は、複数のチャネルを示しており、x1(t),…,xn(t)は、音出力機構20から通過機構22へ出力される1チャネルからnチャネルまでの音信号を示している。なお変数tは、アナログ信号である音信号を8000Hz、12000Hz等のサンプリング周波数でサンプリングしてデジタル信号に変換した際の各サンプルを特定するサンプル番号である。またx1_f(t),…,xn_f(t)は、通過機構22を通過した1チャネルからnチャネルまでの音信号を示しており、通過機構22を通過した音信号x1_f(t),…,xn_f(t)を加算することにより、参照音信号x_f(t)が生成される。またy(t)は、観測音信号を示しており、r(t)は、抑圧機構12にて観測音信号y(t)のエコー成分が抑圧された抑圧結果を示す音信号であり、抑圧結果r(t)は、音処理装置4へ出力され、音処理装置4にて音声認識等の処理がなされる。
図5は、本発明の実施の形態1に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。DSPを用いた通過機構22は、入力された複数チャネルの音信号をFFT(高速フーリエ変換:Fast Fourier Transformation)処理にて夫々周波数軸上の成分の音信号に変換するFFT変換部220,220,…、周波数軸上の成分に変換した複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる複数の帯域通過フィルタ部221,221,…、夫々の周波数帯域の成分を通過させた周波数軸上の成分に変換されている複数の音信号を、IFFT(逆フーリエ変換)処理にて夫々時間軸上の音信号に変換する複数のIFFT変換部222,222,…等の各種プログラムモジュールを実行する。FFT変換部220は、音信号の変換に際し、例えば512サンプル分の信号を1フレームとしたフレーム単位の音信号を生成する。なお各フレームは、128〜256サンプル分程度ずつオーバーラップしており、各フレームに対しては、ハミング窓、ハニング窓等の窓関数、高域強調フィルタによるフィルタリング等の音声認識の分野で一般的なフレーム処理が施される。そしてFFT変換部220は、生成したフレーム単位の音信号に対してFFT処理を行う。帯域通過フィルタ部221,221,…は、夫々チャネルに対応しており、周波数軸上の成分に変換された各音信号は、チャネルが対応している帯域通過フィルタ部221,221,…を通過する。また各帯域通過フィルタ部221,221,…は、周波数毎の透過度を示した夫々異なるフィルタ係数が予め設定されており、設定されているフィルタ係数に基づいて音信号に対するフィルタリングを行う。
図5において、x1(t),…,xn(t)は、FFT変換部220,220,…に入力された複数のチャネルの音信号であり、FFT変換部220,220,…は、複数チャネルの音信号x1(t),…,xn(t)を周波数軸上の成分に変換した複数の音信号X1(f),…,Xn(f)を帯域通過フィルタ部221,221,…へ出力する。なお変数fは、周波数を示す。また帯域通過フィルタ部221,221,…は、夫々の周波数帯域の成分を通過させた複数の音信号X1_f(f),…,Xn_f(f)をIFFT変換部222,222,…へ出力する。さらにIFFT変換部222,222,…は、夫々の周波数帯域の成分を通過させた複数の音信号X1_f(f),…,Xn_f(f)をIFFT処理にて夫々時間軸上の音信号x1_f(t),…,xn_f(t)に変換する。
図6は、本発明の実施の形態1に係る音出力装置2が備える通過機構22の帯域通過フィルタ部221のフィルタ係数を示すグラフである。図6(a),(b),(c)は、夫々第1チャネル1ch、第2チャネル2ch、及び第nチャネルnchの音信号X1(f)、X2(f)、及びXn(f)に対する係数フィルタC1(f)、C2(f)、及びCn(f)を示しており、横軸を周波数fとし、縦軸をフィルタ係数として、その関係を示したグラフである。フィルタ係数とは、音信号に乗じられる周波数毎に設定された係数であり、各帯域通過フィルタ部221,221,…とは、夫々設定されているフィルタ係数を周波数軸上の成分に変換された音信号に乗じる処理を行うプログラムモジュールである。帯域通過フィルタ部221の処理により、フィルタ係数が1.0である周波数帯の成分は、帯域通過フィルタ部221を通過することになるが、フィルタ係数が0.0である周波数帯の成分は、帯域通過フィルタ部221の通過の際に振幅が0となり、帯域通過フィルタ部221で除去されることになる。図6(a),(b),(c)に示す様に、各帯域通過フィルタ部221,221,…のフィルタ係数は、夫々異なる周波数帯域の成分を通過させる様に設定されている。
各帯域通過フィルタ部221,221,…では、周波数帯域を等間隔に分割し、分割した夫々の周波数帯域の成分が、いずれかの帯域通過フィルタ部221のみを通過する様にフィルタ係数が設定されている。図6の様なフィルタ係数を設定することにより、各帯域通過フィルタ部221,221,…は、櫛形フィルタとして機能する。なお帯域通過フィルタ部221,221,…のフィルタ係数の設定に際し、周波数の対数値が等間隔となる様に分割し、分割した夫々の周波数帯域の成分が、いずれかの帯域通過フィルタ部221のみを通過する様にフィルタ係数を設定して櫛形フィルタを形成する様にしても良く、対数値を用いて周波数帯域を分割することにより、聴取時に違和感の少ない音を出力させることが可能となる。
図7は、本発明の実施の形態1に係るエコー抑圧装置1が備える抑圧機構12の構成例を示す機能ブロック図である。DSPを用いた抑圧機構12は、前述した様に加算部120、補正部121等のプログラムモジュールを実行する。
さらに補正部121は、エコーの推定に要する周波数毎に設定されているフィルタ係数を用いた数百次の積和演算にて、参照音信号x_f(t)をフィルタリングすることにより、観測音信号y(t)の補正に要する補正量として、エコー信号x'(t)を導出する線形FIRフィルタ(補正用フィルタ)部1210と、観測音信号y(t)からエコー信号x'(t)を減算することにより、観測音信号y(t)を補正し、エコー成分を抑圧した観測音信号を抑圧結果r(t)として出力する減算部1211と、補正後の観測音信号、即ち抑圧結果r(t)に基づいて、学習同定法を用いた適応処理により、線形FIRフィルタ部1210のフィルタ係数の算出及び更新を行うフィルタ係数更新部1212と、抑圧結果r(t)に基づいて、話者が発声しているダブルトークの状態か発声していないシングルトークの状態かを検出する検出部1213とをサブモジュールとして実行する。そして検出部1213は、抑圧結果r(t)の強度変化に基づいてシングルトークの状態とダブルトークの状態とを検出し、ダブルトークの状態時には、フィルタ係数更新部1212によるフィルタ係数の算出及び更新を停止させる。なお補正部121の処理に際し、必要に応じて、参照音信号x_f(t)及び観測音信号y(t)に対してフレーム化及び周波数軸上の成分へ変換するFFT処理が行われた上でエコー抑圧処理がなされ、更に時間軸上の成分へ変換するIFFT処理が行われた抑圧結果r(t)が出力される様に構成することも可能である。
図8は、本発明の実施の形態1に係る音処理装置4の構成例を示すブロック図である。音処理装置4は、エコー抑圧装置1の出力機構13から出力された抑圧結果r(t)を入力される入力機構40と、入力機構40から入力された抑圧結果r(t)に基づいて音声認識処理を行う認識機構41と、認識機構41による認識結果に基づいてナビゲーション処理の制御を行う制御機構42とを備えている。制御機構42による制御とは、話者が発声した音声から認識した命令に基づく移動体5の目的地の入力、走行経路の導出、走行経路の表示等のカーナビゲーションシステム本来の処理である。なお本発明のシステムをオーディオシステムに適用する場合、音処理装置4は、エコー抑圧装置1、音出力装置2及び音入力装置3を制御する制御装置として機能し、話者が発生した音声による命令、例えば音源切替、再生開始、音声認識終了等の命令に基づいて、制御機構42は、エコー抑圧装置1、音出力装置2及び音入力装置3を制御する。
次に本発明の実施の形態1に係るエコー抑圧システムが備える各装置の処理について説明する。図9は、本発明の実施の形態1に係る音出力装置2の音出力処理の一例を示すフローチャートである。音出力装置2は、音信号生成機構21により、複数チャネル分の音信号x1(t),…,xn(t)を生成し(S101)、生成した音信号x1(t),…,xn(t)を通過機構22へ出力する。
音出力装置2の通過機構22は、入力された複数チャネルの音信号x1(t),…,xn(t)をデジタル信号に変換し、フレーム化して、各FFT変換部220,220,…により、複数の音信号をFFT処理にて夫々周波数軸上の成分の音信号X1(f),…,Xn(f)に変換し(S102)、周波数軸上の成分に変換した各音信号X1(f),…,Xn(f)を、夫々帯域通過フィルタ部221,221,…へ渡す。ステップS102において、周波数軸上の成分に変換する方法としては、必ずしもFFTを用いる必要はなく、DCT(離散コサイン変換:Discrete Cosine Transform )等の他の変換方法を用いてもよい。
音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…により、周波数軸上の成分に変換された複数の音信号X1(f),…,Xn(f)に対し、夫々異なる周波数帯域の成分X1_f(f),…,Xn_f(f)を通過させ(S103)、IFFT変換部222,222,…により、IFFT処理にて夫々時間軸上の音信号x1_f(t),…,xn_f(t)に変換し(S104)、アナログ信号に変換して、音出力機構20,20,…へ出力し、またエコー抑圧装置1へ出力する(S105)。
音出力装置2の音出力機構20,20,…は、入力された音信号x1_f(t),…,xn_f(t)に基づいて音を出力する(S106)。
図10は、本発明の実施の形態1に係る音入力装置3の音入力処理の一例を示すフローチャートである。音入力装置3は、音入力機構30により、音を入力し(S201)、入力された音に基づいて音信号を生成し、生成した音信号を観測音信号y(t)としてエコー抑圧装置1へ出力する(S202)。ステップS201において、音入力装置3は、音出力装置2が音を出力する音場からの音が入力される。従って音入力装置3が入力される音には、音出力装置2から出力された音が混入する可能性がある。
図11は、本発明の実施の形態1に係るエコー抑圧装置1のエコー抑圧処理の一例を示すフローチャートである。エコー抑圧装置1は、第1入力機構10により、音出力装置2から出力された複数チャネル分の音信号x1_f(t),…,xn_f(t)を入力し(S301)、入力された音信号x1_f(t),…,xn_f(t)をデジタル信号に変換して抑圧機構12へ渡し、また第2入力機構11により、音入力装置3から出力された観測音信号y(t)を入力し(S302)、入力された観測音信号y(t)をデジタル信号に変換して抑圧機構12へ渡す。なおステップS301及びステップS302の処理は、実質的に並行して行われる。
エコー抑圧装置1の抑圧機構12は、加算部120により、音出力装置2から出力された複数チャネル分の音信号x1_f(t),…,xn_f(t)を加算して参照音信号x_f(x)を生成し(S303)、生成した参照音信号x_f(x)を補正部121へ渡す。
エコー抑圧装置1の抑圧機構12は、補正部121の処理として、線形FIRフィルタ部1210にて、設定されているフィルタ係数を用いた積和演算により、参照音信号x_f(x)をフィルタリングすることで、観測音信号y(t)の補正に要する補正量としてエコー信号x'(t)を導出し(S304)、導出した補正量であるエコー信号x'(t)を減算部1211へ渡す。
エコー抑圧装置1の抑圧機構12は、補正部121の処理として、減算部1211により、観測音信号y(t)からエコー信号x'(t)を減算することで観測音信号y(t)を補正し(S305)、補正した観測音信号y(t)である抑圧結果r(t)をアナログ信号に変換し、変換した抑圧結果r(t)を音処理装置4へ出力する(S306)。そして音処理装置4では、入力された抑圧結果r(t)に基づいて音声認識等の処理を実行する。
図12は、本発明の実施の形態1に係るエコー抑圧装置1のフィルタ係数更新処理の一例を示すフローチャートである。エコー抑圧装置1では、図11を用いたエコー抑圧処理と並行して、エコー信号の導出に用いるフィルタ係数の更新処理を実行する。エコー抑圧装置1の抑圧機構12は、補正部121の処理として、検出部1213により、減算部1211から出力される抑圧結果r(t)に基づいて、話者が発声しているダブルトークの状態か発声していないシングルトークの状態かを検出し(S401)、検出した結果を示す検出結果をフィルタ係数更新部1212へ渡す。
エコー抑圧装置1の抑圧機構12は、補正部121の処理として、フィルタ係数更新部1212により、検出部1213から受け付けた検出結果に基づいて、フィルタ係数の算出及び更新の要否を判定する(S402)。ステップS402では、検出結果がシングルトークを示す場合、フィルタ係数の算出及び更新を実行し、ダブルトークを示す場合、フィルタ係数の算出及び更新を停止する。
ステップS402において、フィルタ係数の算出及び更新を要すると判定した場合(S402:YES)、エコー抑圧装置1の抑圧機構12は、補正部121の処理として、フィルタ係数更新部1212により、減算部1211から出力される抑圧結果r(t)に基づいて、学習同定法を用いた適応処理にてフィルタ係数を算出し(S403)、線形FIRフィルタ部1210にて用いられているフィルタ係数を、ステップS403にて算出したフィルタ係数に更新し(S404)、ステップS401へ戻り、以降の処理を繰り返す。
ステップS402において、フィルタ係数の算出及び更新を要しないと判定した場合(S402:NO)、エコー抑圧装置1の抑圧機構12は、補正部121の処理として、フィルタ係数更新部1212によるフィルタ係数の算出及び更新を行わず、ステップS401へ戻り、以降の処理を繰り返す。
音出力装置2から音場に対して複数チャネルの音が出力されている場合、当該音場から入力された音信号には音出力装置2から出力された音に基づくエコーが含まれる。当該音場が音に対する線形性を保っている場合、音出力装置2から出力された音は、その周波数を維持して音入力装置3に入力される。また参照音信号x_f(t)は、夫々異なる周波数帯域が割り当てられた複数チャネルの音信号x1_f(t),…,xn_f(t)を加算した信号であるから、任意の周波数fにおいて、参照音信号x_f(t)及び観測音信号y(t)の関係は、1チャネルの音を出力する場合の関係と等価であると見なすことができる。従って本願のエコー抑圧システムでは、複数チャネルの音信号を出力する場合であっても、1チャネルの音信号を出力する場合と同等の精度でエコーを抑圧することが可能である。
実施の形態2.
実施の形態2は、実施の形態1において、原音信号を所定の方法で加工した加工音信号を用いて実現される複数チャネルの音信号に対し、効率的なフィルタリングを実現する形態である。ここでは実施の形態2として、L(Left)チャネルの第1音信号、R(Right)チャネルの第2音信号、第1音信号及び第2音信号の和であるC(Center)チャネルの和音信号、第1音信号を所定時間遅延させたsL(Surround Left)チャネルの遅延第1音信号、及び第2音信号を所定時間遅延させたsR(Surround Right)チャネルの遅延第2音信号による擬似5チャネルのステレオシステムに適用する例について説明する。擬似5チャネルにおいて、第1音信号及び第2音信号は、原音信号であり、和音信号、遅延第1音信号及び遅延第2音信号は、原音信号を加算又は遅延により加工した加工音信号である。但し、本発明の実施の形態2に係るエコー抑圧システムは、必ずしも擬似5チャネルに限らず、第1音信号、第2音信号、遅延第1音信号及び遅延第2音信号からなる擬似4チャネルのステレオシステムに適用する形態、和音信号を遅延させた遅延和音信号を擬似信号として用いる形態等、様々な形態に展開することが可能である。
以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。実施の形態2におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
図13は、本発明の実施の形態2に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。実施の形態2に係る音出力装置2の通過機構22の構成は、実質的に実施の形態1と同様である。なお図13において、xL(t),xR(t),xC(t),xsL(t),xsR(t)は、FFT変換部220,220,…に入力された第1音信号、第2音信号、和音信号、遅延第1音信号及び遅延第2音信号を示す。またこれらの音信号xL(t),xR(t),xC(t),xsL(t),xsR(t)をFFT変換部220,220,…により、周波数軸上の成分に変換した音信号がXL(f),XR(f),XC(f),XsL(f),XsR(f)である。さらに周波数軸上の成分に変換したこれらの音信号XL(f),XR(f),XC(f),XsL(f),XsR(f)が夫々帯域通過フィルタ部221,221,…を通過した音信号がXL_f(f),XR_f(f),XC_f(f),XsL_f(f),XsR_f(f)である。そしてこれらの音信号XL_f(f),XR_f(f),XC_f(f),XsL_f(f),XsR_f(f)をIFFT変換部222,222,…にて変換した時間軸上の音信号がxL_f(t),xR_f(t),xC_f(t),xsL_f(t),xsR_f(t)である。
図14は、本発明の実施の形態2に係る音出力装置2が備える通過機構22の帯域通過フィルタ部221のフィルタ係数を示すグラフである。図14(a),(b),(c),(d),(e)は、夫々Lチャネルの第1音信号XL(f)、Rチャネルの第2音信号XR(f)、Cチャネルの和音信号XC(f)、sLチャネルの遅延第1音信号XsL(f)及びsRチャネルの遅延第2音信号XsR(f)に対する係数フィルタCL(f)、CR(f)、CC(f)、CsL(f)及びCsR(f)を示しており、横軸を周波数fとし、縦軸をフィルタ係数として、その関係を示したグラフである。
図14(a)に示した第1音信号XL(f)に対する係数フィルタCL(f)及び図14(b)に示した第2音信号XR(f)に対する係数フィルタCR(f)は、夫々異なる周波数帯域の成分を通過させるように設定されたフィルタである。和音信号XC(f)は、第1音信号XL(f)及び第2音信号XR(f)を加算した音信号であるので、和音信号XC(f)に対しては、第1音信号XL(f)に対する係数フィルタCL(f)及び第2音信号XR(f)に対する係数フィルタCR(f)の和である図14(c)に示した係数フィルタCC(f)が用いられる。実施の形態2として示す例では、係数フィルタCC(f)は、図14(c)に示す様にフィルタ処理の対象となる全周波数帯域の成分を通過させるフィルタであり、周波数に関わらずフィルタ係数が1.0となる。また遅延第1音信号XsL(f)は、第1音信号XL(f)を遅延した音信号であるので、遅延第1音信号XsL(f)に対しては、第1音信号XL(f)に対する係数フィルタCL(f)を転用(複写)した図14(d)に示す係数フィルタCsL(f)が用いられる。従って第1音信号XL(f)に対する係数フィルタCL(f)と、遅延第1音信号XsL(f)に対する係数フィルタCsL(f)とは、同一のフィルタである。さらに遅延第2音信号XsR(f)は、第2音信号XR(f)を遅延した音信号であるので、遅延第2音信号XsR(f)に対しては、第2音信号XR(f)に対する係数フィルタCR(f)を転用(複写)した図14(e)に示す係数フィルタCsR(f)が用いられる。従って第2音信号XR(f)に対する係数フィルタCR(f)と、遅延第2音信号XsR(f)に対する係数フィルタCsR(f)とは、同一のフィルタ係数を持つフィルタである。
この様に実施の形態2において、帯域通過フィルタ部221,221,…は、5チャネル分の信号を処理するため、5チャネル分の信号を格納するメモリ及びフィルタ処理を行うプログラムモジュールにて構成される。夫々のプログラムモジュールにて用いられるフィルタ係数として、第1音信号XL(f)及び第2音信号XR(f)に対しては夫々独自に設定されたフィルタ係数が用いられる。また和音信号XC(f)に対しては第1音信号XL(f)のフィルタ係数及び第2音信号XR(f)のフィルタ係数の和として算出されるフィルタ係数が用いられる。さらに遅延第1音信号XsL(f)に対しては、第1音信号XL(f)のフィルタ係数を複写したフィルタ係数が用いられ、遅延第2音信号XsR(f)に対しては、第2音信号XR(f)のフィルタ係数を複写したフィルタ係数が用いられる。なお各チャネルのフィルタ処理を行うプログラムモジュールは、一のプログラムモジュールを時分割で使用し、信号毎にフィルタ係数を設定し直すようにしても良い。
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
実施の形態3.
実施の形態3は、実施の形態1において、音信号生成機構が生成した複数チャネル分の音信号に対し、人が発声する音声に対応する周波数帯域等の予め設定されている除去帯域に該当する周波数帯域の成分を、何れの音信号に対しても通過させないようにし、除去帯域に該当する周波数帯域の成分に基づいてダブルトーク及びシングルトークを検出する形態である。
以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。実施の形態3におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
図15は、本発明の実施の形態3に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。実施の形態3に係る通過機構22は、予め設定されている除去帯域f_cutに該当する周波数帯域の成分を除去する除去部223,223,…を備えている。除去部223,223,…は、帯域通過フィルタ部221,221,…を通過した周波数軸上の成分に変換されている複数の音信号X1_f(f),…,Xn_f(f)から、除去帯域f_cutに該当する周波数帯域の成分を除去し、除去帯域f_cutの成分を除去した信号X1_f_c(f),…,Xn_f_c(f)をIFFT変換部222,222,…へ出力する。IFFT変換部222,222,…は、除去部223,223,…を通過させた複数の音信号X1_f_c(f),…,Xn_f_c(f)をIFFT処理にて夫々時間軸上の音信号x1_f_c(t),…,xn_f_c(t)に変換する。そしてIFFT変換部222,222,…は、各音信号x1_f_c(t),…,xn_f_c(t)を、チャネルが対応している音出力機構20,20,…及びエコー抑圧装置1へ出力する。
図16は、本発明の実施の形態3に係る音出力装置2が備える通過機構22の除去部223のフィルタ係数を示すグラフである。図16は、除去用係数フィルタCCUT(f)を示しており、横軸を周波数とし、縦軸をフィルタ係数として、その関係を示したグラフである。図16に示すように除去用係数フィルタCCUT(f)は、人の発声に対応する除去帯域f_cutのフィルタ係数が0.0であり、その他の帯域については1.0となっている。この様にして実施の形態3に係る音出力装置2は、除去帯域f_cutを設定することで、出力する全てのチャネルの音から除去帯域f_cutに対応する周波数成分を除去することになる。なお除去部223を設けるのではなく、帯域通過フィルタ部221,221,…が、除去帯域f_cutに該当する周波数の成分を遮断する様に各帯域通過フィルタ部221,221,…のフィルタ係数を設定するようにしても良い。
図17は、本発明の実施の形態3に係るエコー抑圧装置1が備える抑圧機構12の構成例を示す機能ブロック図である。実施の形態3に係る抑圧機構12の補正部121は、観測音信号y(t)から除去帯域f_cutに対応する周波数成分のみを通過させる除去帯域通過フィルタ部1214を、サブモジュールとして実行する。そして検出部1213は、除去帯域通過フィルタ部1214を通過した検出用観測音信号y_p(t)に基づいてシングルトークの状態かダブルトークの状態かを検出する。音出力装置2が複数チャネルの音を出力する音場が、音に対する線形性を保っている場合、観測音信号y(t)の除去帯域f_cutには、出力した音に基づくエコー成分が含まれていない筈である。従って除去帯域f_cutの成分のみを通過させた検出用観測音信号y_p(t)に基づいて、シングルトークの状態とダブルトークの状態とを検出する場合、実施の形態1に示した様に抑圧結果r(t)から検出する場合と比べて、高精度に状態の検出を行うことが可能である。
図18は、本発明の実施の形態3に係るエコー抑圧装置1が備える抑圧機構12の除去帯域通過フィルタ部1214のフィルタ係数を示すグラフである。図18は、除去帯域通過フィルタ部1214に設定された除去帯域通過係数フィルタCPASS(f)を示しており、横軸を周波数とし、縦軸をフィルタ係数として、その関係を示したグラフである。図18に示すように除去帯域通過係数フィルタCPASS(f)は、除去帯域f_cutのフィルタ係数が1.0であり、その他の帯域については0.0となっている。この様にして実施の形態3に係る除去帯域通過フィルタ部1214は、観測音信号y(t)から除去帯域f_cutに対応する周波数成分のみを通過させることになる。
次に本発明の実施の形態3に係るエコー抑圧システムが備える各装置の処理について説明する。図19は、本発明の実施の形態3に係る音出力装置2の音出力処理の一例を示すフローチャートである。実施の形態3では、実施の形態1に係る音出力処理のフローチャートに示したステップS101〜S103の処理を実行後、通過機構22の除去部223により、除去帯域f_cutに対応する周波数成分を除去する処理を実行する。
音出力装置2は、実施の形態1にて示したステップS101〜S103の処理を実行する。そして音出力装置2の通過機構22は、除去部223により、帯域通過フィルタ部221,221,…を通過した周波数軸上の成分に変換されている複数の音信号X1_f(f),…,Xn_f(f)から、除去帯域f_cutに該当する周波数帯域の成分を除去し(S501)、除去帯域f_cutの成分を除去した信号X1_f_c(f),…,Xn_f_c(f)をIFFT変換部222,222,…へ出力する。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS104以降の処理を実行する。
実施の形態3に係る音入力装置3の音入力処理及びエコー抑圧装置1のエコー抑圧処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。ただしエコー抑圧処理において、抑圧機構12の加算部120は、除去帯域f_cutの成分が除去された複数チャネル分の音信号x1_f_c(t),…,xn_f_c(t)を加算して参照音信号x_f'(x)を生成する。
図20は、本発明の実施の形態3に係るエコー抑圧装置1のフィルタ係数更新処理の一例を示すフローチャートである。エコー抑圧装置1の抑圧機構12は、補正部121の処理として、検出部1213により、除去帯域通過フィルタ部1214を通過した検出用観測音信号y_p(t)に基づいて、話者が発声しているダブルトークの状態か発声していないシングルトークの状態かを検出し(S601)、検出した結果を示す検出結果をフィルタ係数更新部1212へ渡す。そしてエコー抑圧装置1は、実施の形態1のフィルタ係数更新処理にて示したステップS402以降の処理を実行する。
実施の形態4.
実施の形態4は、実施の形態1において、カーナビゲーションシステムの発話スイッチの押下等の所定の操作を行った場合に限り、本発明のエコー抑圧方法を実行する形態である。なお以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。
図21は、本発明の実施の形態4に係るエコー抑圧システムの構成例を模式的に示すブロック図である。実施の形態4に係る音出力装置2は、発話スイッチとして機能する操作機構23と、操作機構23の操作に基づき信号経路の切替処理を行うスイッチ等の切替機構24,24,…を備えている。切替機構24,24,…は、音信号生成機構21から通過機構22へ複数チャネルの音信号を伝送する各信号線上に夫々配設されており、音信号生成機構21から出力された複数チャネルの音信号を、通過機構22又は複数の音出力機構20,20,…へ出力する。
話者が操作機構23に対する押下等の操作を行った場合、操作機構23は、切替機構24,24,…へ操作信号を出力し、切替機構24,24,…は、操作信号を入力中又は操作信号の入力から一定時間の間、音信号生成機構21から出力された複数チャネルの音信号を通過機構22へ出力するように信号経路の切替処理を行う。複数チャネルの音信号が通過機構22へ出力されている間、本発明のエコー抑圧システムは、実施の形態1にて説明した各種処理を行う。
話者が操作機構23に対する操作を行っていない場合、又は操作から一定時間が経過した場合、切替機構24,24,…は、音信号生成機構21から出力された複数チャネルの音信号を音出力機構20,20,…へ出力する様に信号経路を設定する。
この様に実施の形態4では、話者が操作を行った場合にのみ本発明のエコー抑圧方法を実行し、操作を行っていない通常時においては、音信号生成機構21から出力された複数チャネルの音信号をそのまま音出力機構20,20,…へ出力することにより、音信号の周波数成分の選択通過が行われないため、出力する音の音質を維持することができる。
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
実施の形態5.
実施の形態5は、実施の形態1において、音信号間の相関に基づいて通過機構による処理を動的に変更する形態である。
以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。実施の形態5におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
図22は、本発明の実施の形態5に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。実施の形態5に係る通過機構22は、フレーム単位で周波数軸上の成分に変換されている夫々のチャネルの音信号X1(f),…,Xn(f)の振幅を比較し、比較した振幅の相関に基づいて各帯域通過フィルタ部221,221,…のフィルタ係数を動的に変更させる比較部224を備えている。なお各音信号X1(f),…,Xn(f)の振幅を比較するのではなく、振幅の二乗であるパワーを振幅の代替値として比較する様にしても良い。
比較部224は、所定数のフレーム単位又は所定の時間間隔で、周波数帯域毎に各音信号X1(f),…,Xn(f)間の相関を導出する。相関の導出は、夫々の音信号の振幅の大きさを比較することにより行われる。そして比較により他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在すると判定した場合、各音信号X1(f),…,Xn(f)間の相関が弱いと判断し、またその場合に最も振幅が大きい一の音信号を導出する。一の音信号と他の音信号との振幅の比較は、例えば他の音信号の振幅に対する一の音信号の振幅の比、一の音信号の振幅から他の音信号の振幅を減じた差、振幅の絶対値の比或いは差、振幅の二乗であるパワーの比或いは差等の所定の方法で比較した比較結果が、予め設定されている所定値以上であるか否かを判定することにより行われる。比較に用いる所定値は、一の音信号の振幅に対して他の全ての音信号の振幅が無視できる程度に小さいと言える条件を満たす様に設定されている。
例えば周波数fにおける第nチャネルnchの振幅を、nch(f)で表し、所定値をαとすると、下記の式(1)が成立する場合、各音信号X1(f),…,Xn(f)間の相関が弱く、最も振幅が大きい音信号は第nチャネルnchの音信号Xn(f)であると判定する。
nch(f)/1ch(f)≧α,nch(f)/2ch(f)≧α,… 式(1)
比較部224は、各音信号X1(f),…,Xn(f)間の相関が弱いと判定した周波数fを示す偏向周波数fdにおける各帯域通過フィルタ部221,221,…のフィルタ係数を導出する。比較部224は、振幅が最大であるチャネルの音信号に係る帯域通過フィルタ部221のフィルタ係数として1.0を導出し、他のチャネルの音信号に係る帯域通過フィルタ部221のフィルタ係数として0.0を導出する。そして比較部224は偏向周波数fdにおける各帯域通過フィルタ部221,221,…のフィルタ係数を、夫々対応する帯域通過フィルタ部221,221,…へ渡す。
帯域通過フィルタ部221,221,…では、偏向周波数fdにおけるフィルタ係数を受け付けた場合、偏向周波数fdにおけるフィルタ係数を、受け付けたフィルタ係数に変更する。即ち振幅が最大である音信号のみを通過させる様に設定する。
比較部224の比較により、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在しないと判定した場合、各音信号X1(f),…,Xn(f)間の相関が強いと判断する。相関が強いと判断した場合、比較部224は、偏向周波数fd及びフィルタ係数の導出を行わない。従って帯域通過フィルタ部221,221,…では、前述した実施の形態1と同様の処理を実行することになる。
各音信号X1(f),…,Xn(f)間の相関が低く、一の音信号に係る振幅が他の音信号に係る振幅に対して大きくなる状況は、例えば複数チャネルのオーケストラ演奏を再生する場合における、いずれかのチャネルに出力が偏ったソロ演奏時に発生する。この様な状況において、ソロ演奏を行う楽器に係る音信号が帯域通過フィルタ部221,221,…で抑制された場合、聴取者は出力される音に違和感を覚えることになる。実施の形態5では、この様な状況において、ソロ演奏を行う楽器に係る音信号に基づく音を、出力する音として選択することになるので、違和感の少ない音を出力させることが可能となる。
次に本発明の実施の形態5に係るエコー抑圧システムが備える各装置の処理について説明する。図23は、本発明の実施の形態5に係る音出力装置2の音出力処理の一例を示すフローチャートである。実施の形態5では、実施の形態1に係る音出力処理のステップS101〜S102の処理を実行する。そして音出力装置2の通過機構22は、比較部224により、周波数帯域毎に各音信号X1(f),…,Xn(f)の振幅の大きさを比較し、各音信号X1(f),…,Xn(f)間の相関が弱く、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在するか否かを判定する(S701)。
ステップS701において、各音信号X1(f),…,Xn(f)間の相関が弱く、他の全ての音信号の振幅に対して所定値以上大きい振幅を有する一の音信号が存在すると判定した場合(S701:YES)、音出力装置2の通過機構22は、比較部224により、当該周波数f、即ち偏向周波数fdにおいて、最も振幅が大きい一の音信号を特定し、特定した音信号に基づいて各帯域通過フィルタ部221,221,…のフィルタ係数を導出し(S702)、導出したフィルタ係数を夫々対応する帯域通過フィルタ部221,221,…へ偏向周波数fdにおけるフィルタ係数として渡す。ステップS702では、最も振幅が大きい一の音信号に係る帯域通過フィルタ部221のフィルタ係数が1.0として導出され、他の音信号に係る帯域通過フィルタ部221,221,…のフィルタ係数が0.0として導出される。
音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…の偏向周波数fdにおけるフィルタ係数の設定を、夫々受け付けたフィルタ係数に変更する(S703)。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS103以降の処理を実行する。
ステップS701において、各音信号X1(f),…,Xn(f)間の相関が強く、他の全ての音信号の振幅に対して所定値以上大きい振幅を有する一の音信号が存在しないと判定した場合(S701:NO)、音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…のフィルタ係数の設定の変更を解除する(S704)。ステップS704の変更の解除とは、ステップS703でフィルタ係数の設定が変更されていた場合に、その変更された設定を解除して、元のフィルタ係数の設定に戻す処理である。従ってフィルタ係数が変更されていない場合、実質的な処理は行われない。但し、フィルタ係数の設定が変更されていたとしても、当該周波数において、一の音信号の成分のみを通過させるという本来の処理は行われているため、必ずしも元のフィルタ係数の設定に戻す必要はない。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS103以降の処理を実行する。
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
図24は、本発明の実施の形態5に係る音出力装置2が備える通過機構22の処理の例を概念的に示す説明図である。図24は、ある時点における周波数fに対する振幅の大きさを音信号に係るチャネル毎に示したグラフであり、図24(a)は、第1チャネルch1(f)、図24(b)は、第2チャネルch2(f)、そして図24(c)は、第nチャネルchn(f)を夫々示している。周波数f1では、各チャネル間の相関が高いため、通過機構22では、予め設定されているフィルタ係数に基づいて処理が行われる。周波数f2では、相関が低く、第1チャネルch1(f)に係る音信号の振幅が大きいため、第1チャネルch1(f)に係る帯域通過フィルタ部221のフィルタ係数は1.0となり、他のチャネルに係る帯域通過フィルタ部221,221,…のフィルタ係数は0.0となる。また周波数f3では、相関が低く、第2チャネルch2(f)に係る音信号の振幅が大きいため、第2チャネルch2(f)に係る帯域通過フィルタ部221のフィルタ係数は1.0となり、他のチャネルに係る帯域通過フィルタ部221,221,…のフィルタ係数は0.0となる。さらに周波数f4では、相関が低く、第nチャネルchn(f)に係る音信号の振幅が大きいため、第nチャネルchn(f)に係る帯域通過フィルタ部221のフィルタ係数は1.0となり、他のチャネルに係る帯域通過フィルタ部221,221,…のフィルタ係数は0.0となる。
実施の形態6.
実施の形態6は、実施の形態5において、フィルタ係数の設定方法を変更する形態である。
以降の説明において、実施の形態5又は実施の形態5の元となる実施の形態1と同様の構成については、実施の形態5又は実施の形態1を参照するものとし、その説明を省略する。実施の形態6におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
図25は、本発明の実施の形態6に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。通過機構22が備える比較部224は、実施の形態5と同様に、所定数のフレーム単位又は所定の時間間隔で、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在するか否かを判定し、存在すると判定した場合、当該周波数、即ち偏向周波数fdを各帯域通過フィルタ部221,221,…へ渡す。
帯域通過フィルタ部221,221,…では、偏向周波数fdを受け付けた場合、受け付けた偏向周波数fdにおけるフィルタ係数を1.0に変更する。この様に全ての帯域通過フィルタ部221,221,…のフィルタ係数を1.0に設定することにより、全ての音信号X1(f),…,Xn(f)を通過させることになる。一の音信号の振幅に対して、他の全ての音信号の振幅は、無視できる程度に小さいため、全ての音信号X1(f),…,Xn(f)を通過させた場合でも、実質的に実施の形態5と同様の効果が得られる。
比較部224の比較により、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在しないと判定した場合、各音信号X1(f),…,Xn(f)間の相関が強いと判断する。相関が強いと判断した場合、比較部224は、偏向周波数fdの導出を行わない。従って帯域通過フィルタ部221,221,…では、前述した実施の形態1と同様の処理を実行することになる。なお比較部224から帯域通過フィルタ部221,221,…へ、偏向周波数fdのみを渡すのではなく、偏向周波数fdにおける各帯域通過フィルタ部221,221,…のフィルタ係数を、夫々対応する帯域通過フィルタ部221,221,…へ渡す様にしても良い。この場合、比較部224から帯域通過フィルタ部221,221,…へ渡すフィルタ係数は、全て1.0である。
次に本発明の実施の形態6に係るエコー抑圧システムが備える各装置の処理について説明する。図26は、本発明の実施の形態6に係る音出力装置2の音出力処理の一例を示すフローチャートである。実施の形態6では、実施の形態1に係る音出力処理のステップS101〜S102の処理を実行する。そして音出力装置2の通過機構22は、比較部224により、周波数帯域毎に各音信号X1(f),…,Xn(f)の振幅の大きさを比較し、各音信号X1(f),…,Xn(f)間の相関が弱く、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在するか否かを判定する(S801)。
ステップS801において、各音信号X1(f),…,Xn(f)間の相関が弱く、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在すると判定した場合(S801:YES)、音出力装置2の通過機構22は、比較部224から各帯域通過フィルタ部221,221,…へ、偏向周波数fdを渡す。
音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…の偏向周波数fdにおけるフィルタ係数の設定を夫々1.0に変更する(S802)。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS103以降の処理を実行する。
ステップS801において、各音信号X1(f),…,Xn(f)間の相関が強く、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在しないと判定した場合(S801:NO)、音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…のフィルタ係数の設定の変更を解除する(S803)。ステップS803の変更の解除とは、ステップS802でフィルタ係数の設定が変更されていた場合に、その変更された設定を解除して、元のフィルタ係数の設定に戻す処理である。従ってフィルタ係数が変更されていない場合、実質的な処理は行われない。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS103以降の処理を実行する。
ステップS801〜S803の処理後に実行されるステップS103の処理として、音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…により、周波数軸上の成分に変換された複数の音信号X1(f),…,Xn(f)に対し、夫々異なる周波数帯域の成分X1_f(f),…,Xn_f(f)を通過させる。なお各周波数fにおいて、通過する音信号は一つであるが、偏向周波数fdの成分については、全ての音信号X1(fd),…,Xn(fd)が通過する。
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
実施の形態7.
実施の形態7は、実施の形態1において、各帯域通過フィルタ部のフィルタ係数を経時的に変化させる形態である。
以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。実施の形態7におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
図27は、本発明の実施の形態7に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。実施の形態7に係る通過機構22は、各帯域通過フィルタ部221,221,…のフィルタ係数を変更する係数部225を備えている。
係数部225は、時刻を取得する図示しない時計回路を有し、所定の時間間隔で、各帯域通過フィルタ部221,221,…のフィルタ係数を導出する。係数部225は、一の帯域通過フィルタ部221のフィルタ係数として1.0を導出し、他の帯域通過フィルタ部221,221,…のフィルタ係数として0.0を導出する。なおフィルタ係数が1.0となる帯域通過フィルタ部221は毎回変化する。係数部225は、例えば予め時間に対応付けてフィルタ係数を記録したテーブルの使用、フィルタ係数を出力する所定の関数の使用等の様々な方法によりフィルタ係数を導出する。そして導出した各帯域通過フィルタ部221,221,…のフィルタ係数を、夫々対応する帯域通過フィルタ部221,221,…へ渡す。
帯域通過フィルタ部221,221,…では、夫々フィルタ係数を受け付けたフィルタ係数に変更する。係数部225は、所定の時間間隔で毎回変更されるフィルタ係数を導出することにより、各帯域通過フィルタ部221,221,…のフィルタ係数は、所定の時間間隔で、即ち経時的に変更されることになる。またこれにより通過機構22は、通過させる音信号毎の周波数帯域の成分を、経時的に変更することになる。なお時計回路が示す時刻に基づいてフィルタ係数を変更するのではなく、所定のフレーム数毎にフィルタ係数を変更することで、経時的に変更する様にしても良い。
次に本発明の実施の形態7に係るエコー抑圧システムが備える各装置の処理について説明する。図28は、本発明の実施の形態7に係る音出力装置2の係数変更処理の一例を示すフローチャートである。音出力装置2の通過機構22は、係数部225により、時計回路を参照し、予め設定されている所定時間が経過したか否かを判定する(S901)。
ステップS901において、所定時間が経過したと判定した場合(S901:YES)、音出力装置2の通過機構22は、係数部225により、各帯域通過フィルタ部221,221,…のフィルタ係数を導出し(S902)、導出したフィルタ係数を夫々対応する帯域通過フィルタ部221,221,…へ渡す。ステップS901において、所定時間が経過していないと判定した場合(S901:NO)、ステップS901の処理を繰り返す。
音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…のフィルタ係数の設定を夫々変更する(S903)。係数変更処理により、通過機構22は、通過させる音信号毎の周波数帯域の成分を、経時的に変更することになる。
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。
図29は、本発明の実施の形態7に係る音出力装置2が備える通過機構22の各帯域通過フィルタ部221,221,…のフィルタ係数の経時変化の例を示す説明図である。図29(a),(b),(c)は、夫々第1チャネル1ch、第2チャネル2ch、及び第nチャネルnchの音信号X1(f)、X2(f)、及びXn(f)に対する係数フィルタC1(f)、C2(f)、及びCn(f)を示しており、横軸を周波数fとし、縦軸をフィルタ係数として、その関係を示したグラフである。そして図29(d),(e),(f)は、夫々図29(a),(b),(c)に示す状態から所定時間経過後の第1チャネル1ch、第2チャネル2ch、及び第nチャネルnchの音信号X1(f)、X2(f)、及びXn(f)に対する係数フィルタC1(f)、C2(f)、及びCn(f)を示している。図29(a),(b),(c)と、図29(d),(e),(f)とを比較すると明らかな様に、各チャネルの係数フィルタの値、即ちフィルタ係数が経時的に変更されている。そして通過する音信号毎の周波数帯域の成分が、経時的に変化することになる。
前記実施の形態1乃至7は、本発明の無限にある実施の形態の一部を例示したに過ぎず、各種ハードウェア及びソフトフェア等の構成は、適宜設定することが可能であり、また例示した基本的な処理以外にも様々な処理を組み合わせることが可能である。例えば本発明のエコー抑圧システムを、ナビゲーションシステム、テレビ会議システム以外の音声、音響に係る様々なシステムに適用することが可能であり、更にはエコー抑圧装置、音出力装置、音入力装置及び音処理装置の全て又は適宜選択された二或いは三の装置を一の装置として構成する様にしても良い。また音出力装置を、音信号を生成する音信号生成装置と、音出力装置とに分割する等、一の装置を複数の装置として構成する様にしても良い。さらに前記実施の形態1乃至7では、フィルタ係数を0.0又は1.0として櫛形フィルタを形成する形態を示したが、0.0以上1.0以下の値をも取る様にして、台形型フィルタ、三角形型フィルタ等の様々な特性のフィルタを形成させることが可能である。そして前記実施の形態1乃至7は夫々独立して実現されるのではなく、適宜組み合わせることも可能である。

Claims (10)

  1. 音信号に基づいて音を出力する音出力装置と、入力された音を音信号に変換する音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置とを備えるエコー抑圧システムにおいて、
    前記音出力装置は、
    複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、
    該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部と
    を有し、
    前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、
    前記エコー抑圧装置は、
    前記音入力装置から音信号を観測音信号として入力される入力部と、
    前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と
    を有する
    ことを特徴とするエコー抑圧システム。
  2. 前記通過部は、
    複数の音信号を夫々周波数軸上の成分に変換する第1変換部と、
    周波数軸上の成分に変換した複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる帯域通過フィルタ部と、
    夫々の周波数帯域の成分を通過させた周波数軸上の成分に変換されている複数の音信号を、夫々時間軸上の音信号に変換する第2変換部と
    を有することを特徴とする請求項1に記載のエコー抑圧システム。
  3. 前記通過部が夫々異なる周波数帯域の成分を通過させる複数の音信号は、第1音信号、第2音信号、第1音信号及び/又は第2音信号を所定の加工方法で加工した加工音信号であり、
    前記帯域通過フィルタ部は、音信号毎にフィルタ係数が設定されてあり、
    第1音信号に対して第1フィルタ係数、第2音信号に対して第2フィルタ係数、並びに加工音信号に対して加工方法に応じた第1フィルタ係数及び/又は第2フィルタ係数に基づく加工フィルタ係数が夫々設定されている
    ことを特徴とする請求項2に記載のエコー抑圧システム。
  4. 前記音出力装置は、
    予め設定されている除去帯域に該当する周波数帯域の成分を、何れの音信号に対しても通過させない様にしてあり、
    前記補正部は、
    前記参照音信号を、周波数毎に設定されたフィルタ係数にてフィルタリングすることにより、前記観測音信号の補正に要する補正量を導出する補正用フィルタ部と、
    前記補正後の観測音信号に基づいて、前記補正用フィルタのフィルタ係数の算出及び更新を行う係数更新部と、
    前記観測音信号の除去帯域の成分に基づいて、前記係数更新部による更新の可否を判定する更新可否判定部と
    を有する
    ことを特徴とする請求項1乃至請求項のいずれかに記載のエコー抑圧システム。
  5. 前記音出力装置は、更に、
    周波数帯域毎に、複数の音信号の振幅の大きさを所定の方法で比較し、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上か否かを判定する比較部を更に備え、
    前記通過部は、前記比較部が所定値以上と判定した周波数帯域に対しては、前記一の音信号のみを通過させる様にしてある
    ことを特徴とする請求項1乃至請求項のいずれかに記載のエコー抑圧システム。
  6. 前記音出力装置は、更に、
    周波数帯域毎に、複数の音信号の振幅の大きさを所定の方法で比較し、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上か否かを判定する比較部を更に備え、
    前記通過部は、前記比較部が所定値以上と判定した周波数帯域に対しては、全ての音信号を通過させる様にしてある
    ことを特徴とする請求項1乃至請求項のいずれかに記載のエコー抑圧システム。
  7. 音信号に基づいて音を出力する音出力装置と、音を入力される音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置とを用いたエコー抑圧方法において、
    前記音出力装置により、
    複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過手順と、
    夫々異なる周波数帯域の成分が通過した複数の音信号に基づく音を夫々出力する音出力手順と、
    前記音入力装置により、
    入力された音を音信号に変換する音入力手順と、
    前記エコー抑圧装置により、
    夫々異なる周波数帯域の成分が通過した複数の音信号を加算して参照音信号を生成する加算手順と、
    前記音入力装置から音信号を観測音信号として入力される入力手順と、
    前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正手順と
    を含むことを特徴とするエコー抑圧方法。
  8. 音信号に基づいて音を出力する音出力装置、及び入力された音に基づいて音信号を生成する音入力装置と連携し、前記音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧させる手順をエコー抑圧装置に実行させるエコー抑圧プログラムにおいて、
    前記エコー抑圧装置に、
    前記音出力装置から出力された夫々異なる周波数帯域の成分を通過させた複数の音信号を加算して生成した参照音信号と、前記音入力装置にて生成された音信号である観測音信号とに基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正手順を実行させることを特徴とするエコー抑圧プログラム。
  9. 音信号に基づいて音を出力する音出力装置、及び入力された音に基づいて音信号を生成する音入力装置と連携し、前記音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置において、
    前記音出力装置から出力された夫々異なる周波数帯域の成分を通過させた複数の音信号を加算して参照音信号を生成する加算部と、
    前記音入力装置から音信号を観測音信号として入力される入力部と、
    前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と
    を有することを特徴とするエコー抑圧装置。
  10. 複数の音信号に基づく音を出力する複数の音出力部を備えており、入力された音に基づいて音信号を生成する音入力装置及び該音入力装置が入力された音から前記音出力部から出力した音に基づくエコーを抑圧するエコー抑圧装置と連携する音出力装置において、
    複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、
    該通過部を通過した複数の音信号を加算して参照音信号を生成する加算部と
    を備え、
    前記複数の音出力部は、前記通過部を通過した複数の音信号に基づく音を夫々出力する様に構成してあり、
    前記加算部は、生成した参照音信号を前記エコー抑圧装置へ出力する様に構成してあ
    ことを特徴とする音出力装置。
JP2009536910A 2007-10-12 2007-12-10 エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置及び音出力装置 Expired - Fee Related JP5051235B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009536910A JP5051235B2 (ja) 2007-10-12 2007-12-10 エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置及び音出力装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
PCT/JP2007/069930 WO2009047858A1 (ja) 2007-10-12 2007-10-12 エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置、音出力装置、オーディオシステム、ナビゲーションシステム及び移動体
JPPCT/JP2007/069930 2007-10-12
PCT/JP2007/073776 WO2009047871A1 (ja) 2007-10-12 2007-12-10 エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置、音出力装置、オーディオシステム、ナビゲーションシステム及び移動体
JP2009536910A JP5051235B2 (ja) 2007-10-12 2007-12-10 エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置及び音出力装置

Publications (2)

Publication Number Publication Date
JPWO2009047871A1 JPWO2009047871A1 (ja) 2011-02-17
JP5051235B2 true JP5051235B2 (ja) 2012-10-17

Family

ID=47189632

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009536910A Expired - Fee Related JP5051235B2 (ja) 2007-10-12 2007-12-10 エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置及び音出力装置

Country Status (1)

Country Link
JP (1) JP5051235B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0722985A (ja) * 1993-07-01 1995-01-24 Hitachi Denshi Ltd 伝送損失補償回路を備えた伝送路
JPH08213937A (ja) * 1995-02-07 1996-08-20 Nippon Telegr & Teleph Corp <Ntt> エコーキャンセラ装置
JP2002368658A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 多チャネルエコー消去装置、方法、記録媒体及び音声通信システム
JP2003284183A (ja) * 2002-03-20 2003-10-03 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧装置、反響抑圧方法及びプログラム
JP2004222103A (ja) * 2003-01-17 2004-08-05 Toa Corp 放送装置
JP2005536128A (ja) * 2002-08-16 2005-11-24 エマ ミックスド シグナル シー. ブイ. 適応型フィルタを用いてサブバンド信号を処理する方法及びシステム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0722985A (ja) * 1993-07-01 1995-01-24 Hitachi Denshi Ltd 伝送損失補償回路を備えた伝送路
JPH08213937A (ja) * 1995-02-07 1996-08-20 Nippon Telegr & Teleph Corp <Ntt> エコーキャンセラ装置
JP2002368658A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 多チャネルエコー消去装置、方法、記録媒体及び音声通信システム
JP2003284183A (ja) * 2002-03-20 2003-10-03 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧装置、反響抑圧方法及びプログラム
JP2005536128A (ja) * 2002-08-16 2005-11-24 エマ ミックスド シグナル シー. ブイ. 適応型フィルタを用いてサブバンド信号を処理する方法及びシステム
JP2004222103A (ja) * 2003-01-17 2004-08-05 Toa Corp 放送装置

Also Published As

Publication number Publication date
JPWO2009047871A1 (ja) 2011-02-17

Similar Documents

Publication Publication Date Title
US8340963B2 (en) Echo suppressing system, echo suppressing method, recording medium, echo suppressor, sound output device, audio system, navigation system and mobile object
JP5149968B2 (ja) スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法
RU2666316C2 (ru) Аппарат и способ улучшения аудиосигнала, система улучшения звука
CA2908794C (en) Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
JPWO2014103099A1 (ja) 音声認識付き機器及び音声認識方法
RU2601189C2 (ru) Способ и устройство для разложения стереофонической записи с использованием обработки в частотной области, применяющей генератор спектральных весов
WO2017183462A1 (ja) 信号処理装置
JP5051235B2 (ja) エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置及び音出力装置
Uhle Center signal scaling using signal-to-downmix ratios
JP2022531330A (ja) コヒーレンスを使用した信号コンポーネント推定
HK1197782B (en) Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor
HK1197782A (en) Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor
HK1197959B (en) Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
HK1237528B (en) Apparatus and method for enhancing an audio signal, sound enhancing system
HK1237528A1 (en) Apparatus and method for enhancing an audio signal, sound enhancing system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120321

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120626

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120709

R150 Certificate of patent or registration of utility model

Ref document number: 5051235

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees