JP5655378B2 - Sound image control device and program - Google Patents
Sound image control device and program Download PDFInfo
- Publication number
- JP5655378B2 JP5655378B2 JP2010125543A JP2010125543A JP5655378B2 JP 5655378 B2 JP5655378 B2 JP 5655378B2 JP 2010125543 A JP2010125543 A JP 2010125543A JP 2010125543 A JP2010125543 A JP 2010125543A JP 5655378 B2 JP5655378 B2 JP 5655378B2
- Authority
- JP
- Japan
- Prior art keywords
- sound image
- sound
- audio signal
- localization
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stereophonic System (AREA)
Description
本発明は、音像定位技術に関し、特に、音像の見かけの大きさを制御する技術に関する。 The present invention relates to a sound image localization technique, and more particularly to a technique for controlling the apparent size of a sound image.
人は、音源から左右の耳に到来する音の時間差(音の伝搬経路の差に応じた位相差)や、左右の耳に到来する音の大きさの差(音の伝搬経路の差に応じた振幅の減衰量の差)によってその音源の方向を知覚し、その音源に対応する虚像(音像)を知覚する。音像定位技術とは、これを利用したものであり、複数のスピーカの各々から放射する音の振幅や位相の時間差を電気的な信号処理で調整することで、受聴者から見て所定の位置に音像を定位させる技術である。例えば、左右各1つのスピーカを含むステレオオーディオシステムにおいては、各スピーカに与えるオーディオ信号の振幅が等しくなるようにすることで、これらスピーカのちょうど真ん中に上記オーディオ信号に応じた音像を定位させることができる。 Humans depend on the time difference between the sound coming from the sound source to the left and right ears (phase difference corresponding to the difference in the sound propagation path) and the difference in the sound magnitude coming from the left and right ears (difference in the sound propagation path difference). The direction of the sound source is perceived by the difference in amplitude attenuation), and a virtual image (sound image) corresponding to the sound source is perceived. Sound image localization technology uses this, and by adjusting the time difference between the amplitude and phase of sound radiated from each of a plurality of speakers through electrical signal processing, the sound image localization technology is positioned at a predetermined position as viewed from the listener. This is a technology that localizes the sound image. For example, in a stereo audio system including one speaker on each of the left and right, by making the amplitude of the audio signal applied to each speaker equal, the sound image corresponding to the audio signal can be localized in the middle of these speakers. it can.
ところで、音像は、音源に応じた空間的な広がり(以下、このような空間的な広がりを「音像の見かけの大きさ」と呼ぶ)をもって知覚されることが一般に知られている。例えば、対話している者が知覚する音像(すなわち、相手方の話し声に応じた音像)の見かけの大きさは、対話相手の頭部の大きさと略等しいといった具合である。このため、音像定位技術により定位させる音像についても、その見かけの大きさを音源等に応じて定量的に制御できることが好ましい。従来、左右各チャネルのスピーカに与えるオーディオ信号の相関を低くする(例えば、両信号が逆相になるように両オーディオ信号の位相を調整する)ことで音場の広がり感を制御する技術(例えば、特許文献1〜3参照)はあったが、音像の見かけの大きさを定量的に制御する技術はなかった。もっとも、特許文献1等に開示された技術によって音像の見かけの大きさを広げたり逆に縮めたりすることは不可能ではないが、音像がもやもやとした不明りょうなものとなってクリアさに欠け、また、上記位相調整に起因して音場が不自然なものとなる虞があるなどの不具合がある。そもそも、音場の広がり感とは、受聴者を包み込むように到来する音により与えられる聴感的印象(例えば、大きなコンサートホールでオーケストラの演奏を聴いているかのような音に包まれた感じ)のことであり、音像の見かけの大きさとは異なる聴感的印象である。
本発明は、上記課題に鑑みて為されたものであり、音像をクリアに保ったままその見かけの大きさを定量的に制御することを可能にする技術を提供することを目的とする。
By the way, it is generally known that a sound image is perceived as having a spatial extent corresponding to a sound source (hereinafter, such spatial extent is referred to as “apparent size of a sound image”). For example, the apparent size of the sound image perceived by the person who is interacting (that is, the sound image corresponding to the speaking voice of the other party) is approximately equal to the size of the head of the other party. For this reason, it is preferable that the apparent size of the sound image localized by the sound image localization technique can be quantitatively controlled according to the sound source or the like. Conventionally, a technique for controlling the sense of spread of a sound field by lowering the correlation between audio signals applied to left and right channel speakers (for example, adjusting the phase of both audio signals so that both signals are in reverse phase) (for example, However, there is no technique for quantitatively controlling the apparent size of the sound image. However, it is not impossible to widen or shrink the apparent size of the sound image by the technique disclosed in
The present invention has been made in view of the above-described problems, and an object of the present invention is to provide a technique that makes it possible to quantitatively control the apparent size while keeping a sound image clear.
上記課題を解決するために本発明は、ある1つの音像の位置および見かけの大きさを設定させ、設定された位置および大きさにより規定される領域内に定位させる複数の音像であって、それらの合成により、前記位置に定位しかつ前記見かけの大きさを有する1つの音像を聴者に知覚させる複数の音像の各々の位置を示す音像情報を前記設定された位置および前記見かけの大きさに基づいて生成する音像情報生成手段と、入力されるオーディオ信号の振幅を調整して複数のスピーカの各々に与える出力オーディオ信号を生成する手段であって、前記複数のスピーカの各々の配置位置と前記音像情報の示す各音像の位置とから前記複数の音像の各々の定位に寄与するスピーカ群を特定し、各スピーカ群から放射される音により前記音像情報の示す位置に前記複数の音像の各々が定位するように前記各出力オーディオ信号を生成する信号生成手段とを有することを特徴とする音像制御装置、を提供する。また、本発明の別の態様においては、コンピュータを上記各手段として機能させることを特徴とするプログラムを提供する。 In order to solve the above-described problems, the present invention provides a plurality of sound images in which a position and an apparent size of a certain sound image are set, and are localized in an area defined by the set position and size. Based on the set position and the apparent size, sound image information indicating the position of each of the plurality of sound images that causes the listener to perceive a single sound image that is localized at the position and has the apparent size is synthesized. Sound image information generating means for generating the output audio signal to be provided to each of the plurality of speakers by adjusting the amplitude of the input audio signal, wherein the position of each of the plurality of speakers and the sound image are generated. A speaker group contributing to the localization of each of the plurality of sound images is specified from the position of each sound image indicated by the information, and the sound image information is indicated by the sound radiated from each speaker group. Each of the plurality of sound image in a position to provide a sound image control apparatus, characterized in that it comprises a signal generating means for generating the respective output audio signal to be localized. According to another aspect of the present invention, there is provided a program that causes a computer to function as each of the above means.
このような音像制御装置によれば、利用者により位置および大きさが設定された領域内に、複数の音像が定位するように複数のスピーカの各々の駆動制御が為される。上記領域の広さおよびその領域内に定位させる複数の音像の分布を適切に定めておけば、聴者は、これら複数の音像から合成される1つの音像を知覚することになる(それら複数の音像が少しずつ重なり合って知覚されることにより、それら複数の音像の分布に応じた広がりを持った1つの音像として知覚される)。ここで注目すべき点は、本発明では、上記複数の音像の各々の定位を各スピーカに与えるオーディオ信号の振幅の調整によって実現しており、フィルタリング処理や複数信号の加減算を行っていない、という点である。フィルタリング処理や複数信号の加減算などの処理を行っていないため、音場が不自然になり難く、聴者により知覚される1つの音像(上記複数の音像の重ね合わせにより合成される音像)をクリアに保つことができるのである。また、本発明によれば、音像の位置およびその見かけの大きさを数値などで定量的に設定させ、その設定内容に応じて複数の音像を定位させるように出力オーディオ信号の振幅の調整が行われるため、音像の見かけの大きさを定量的に制御することが可能になる。 According to such a sound image control device, drive control of each of the plurality of speakers is performed so that the plurality of sound images are localized in the region where the position and size are set by the user. If the size of the area and the distribution of a plurality of sound images localized in the area are appropriately determined, the listener perceives one sound image synthesized from the plurality of sound images (the plurality of sound images). Are perceived as a single sound image having a spread according to the distribution of the multiple sound images). It should be noted that in the present invention, the localization of each of the plurality of sound images is realized by adjusting the amplitude of the audio signal applied to each speaker, and filtering processing and addition / subtraction of the plurality of signals are not performed. Is a point. Since the filtering process and addition / subtraction of multiple signals are not performed, the sound field is unlikely to be unnatural and one sound image perceived by the listener (the sound image synthesized by superimposing the multiple sound images) is cleared. You can keep it. In addition, according to the present invention, the position of the sound image and its apparent size are quantitatively set with numerical values, and the amplitude of the output audio signal is adjusted so that a plurality of sound images are localized according to the setting contents. Therefore, the apparent size of the sound image can be controlled quantitatively.
以下、本発明の実施形態について図面を参照しつつ説明する。
図1は、本発明の一実施形態である音像制御装置1の構成例を示すブロック図である。
音像制御装置1は、デジタル形式のモノラルオーディオ信号INを受け取り、このモノラルオーディオ信号INから8チャネルのデジタルオーディオ信号(図1では、出力オーディオ信号Zn(n=1〜8))を生成して出力する装置である。出力オーディオ信号Zn(n=1〜8)の各々は、D/A変換器(図1では図示略)によりアナログオーディオ信号に変換され、電力増幅器等(同じく図示略)を経て、音響空間内に配置されるスピーカSPn(n=1〜8)の各々に与えられる。
Embodiments of the present invention will be described below with reference to the drawings.
FIG. 1 is a block diagram illustrating a configuration example of a sound
The sound
図2は、音像制御装置1により駆動される8台のスピーカの配置例を示す図である。
スピーカSPn(n=1〜8)の各々は、図2に示すように、各々を頂点とする正八角形を描くように、そのスピーカ軸を当該正八角形の重心に向けて配置されている。上記正八角形の重心を受聴者の位置(受聴点)とすると、スピーカSPnとスピーカSPn+1に与えるオーディオ信号の振幅を適宜調整することによって、スピーカSPnとスピーカSPn+1の間の任意の位置に音像を定位させることができる。例えば、スピーカSPnとスピーカSPn+1のちょうど真ん中に音像を定位させるには、スピーカSPnとスピーカSPn+1の各々に与えるオーディオ信号の振幅が同じになるようにすれば良い。
FIG. 2 is a diagram illustrating an arrangement example of eight speakers driven by the sound
As shown in FIG. 2, each of the speakers SP n (n = 1 to 8) is arranged with its speaker axis directed toward the center of gravity of the regular octagon so as to draw a regular octagon with each apex. When the position of the listener the center of gravity of the regular octagon (listening point), by appropriately adjusting the amplitude of the audio signal to be supplied to the speaker SP n and the speaker SP n + 1, any position between the speaker SP n and the speaker SP n + 1 The sound image can be localized. For example, in order to localize a sound image to right in the middle of the speaker SP n and the speaker SP n + 1, the amplitude of the audio signal to be supplied to each of the speakers SP n and the speaker SP n + 1 may be such that the same.
本実施形態では、オーディオ信号INに応じて定位させる音像の位置および見かけの大きさを定量的に設定することができるようにするために、スピーカSPn(n=1〜8)が配置される平面上に二次元座標を想定する。より詳細に説明すると、上記正八角形の重心(本実施形態では、受聴点)を座標原点O(0,0)とし、この座標原点OからスピーカSP1へ向う方向を一方の座標軸(図2では、Y軸)の+方向とし、上記座標原点OからスピーカSP3へ向う方向を他方の座標軸(本実施形態では、X軸)の+方向とする二次元直交座標(XY座標)を想定する。このような二次元直交座標を想定すると、図2に示すように、スピーカSP1〜SP8の各々の配置位置は、(0,100)、(71,71)、(100,0)、(71,−71)、(0,−100)、(−71,−71)、(−100,0)、(−71,71)と表わされることになる。本実施形態では、スピーカSPn(n=1〜8)の各々の位置座標を表すスピーカ情報が、音像制御装置1の記憶手段(例えば、ハードディスクやフラッシュメモリなど、図1では図示略)に予め格納されている。
In the present embodiment, the speaker SP n (n = 1 to 8) is arranged so that the position of the sound image to be localized and the apparent size can be quantitatively set according to the audio signal IN. Assume two-dimensional coordinates on a plane. More specifically, the center of gravity of the regular octagon (in this embodiment, the listening point) is defined as a coordinate origin O (0, 0), and the direction from the coordinate origin O toward the speaker SP 1 is set to one coordinate axis (in FIG. 2). , Y axis), and a two-dimensional orthogonal coordinate (XY coordinate) in which the direction from the coordinate origin O toward the speaker SP 3 is the + direction of the other coordinate axis (X axis in this embodiment) is assumed. Assuming such two-dimensional orthogonal coordinates, as shown in FIG. 2, the positions of the speakers SP 1 to SP 8 are (0, 100), (71, 71), (100, 0), ( 71, −71), (0, −100), (−71, −71), (−100, 0), and (−71, 71). In the present embodiment, speaker information representing the position coordinates of each speaker SP n (n = 1 to 8) is stored in advance in storage means (eg, hard disk or flash memory, not shown in FIG. 1) of the sound
本実施形態では、オーディオ信号INに応じて定位させる音像の位置を受聴点から見た方向を表わす角度θ(Y軸の+方向を0度の方向とする時計周りの角度)で利用者に設定させ、さらに、同音像の見かけの大きさ(本実施形態では、受聴点から同音像を見渡す角度φ)を利用者に設定させる。そして、本実施形態では、座標原点Oから角度θの方向に引いた直線と上記正八角形の辺の交点を音像の位置とし、この位置に主音像Mを定位させるとともに、角度φに応じた間隔をあけて対向する2つの副音像S1およびS2を主音像Mを挟んで等距離の位置に定位させる処理を、後述のように位相(遅延時間)を調整するのではなく振幅を調整することにより音像制御装置1に実行させるのである。このように本実施形態では、利用者により設定された角度θおよびφにより規定される領域内に複数の音像(本実施形態では、主音像Mと副音像S1およびS2)を均等に定位させる。その結果、座標原点Oの位置にいる聴者は、主音像Mと副音像S1およびS2を合成した1つの音像(主音像Mと副音像S1およびS2とが互いに少しずつ重なり合って知覚されることにより感得される、主音像Mと副音像S1およびS2の分布に応じた広がりを持った1つの音像)を知覚する。つまり、本実施形態の音像制御装置1によれば、利用者により設定された位置に定位し、かつ同利用者により設定された見かけの大きさを有する1つの音像を上記聴者に知覚させることができるのである。以下、本実施形態の特徴を顕著に示す音像制御装置1の構成および機能について詳細に説明する。
In the present embodiment, the position of the sound image to be localized according to the audio signal IN is set to the user at an angle θ representing the direction viewed from the listening point (clockwise angle with the + direction of the Y axis being the 0 degree direction). Further, the user is allowed to set the apparent size of the same sound image (in this embodiment, the angle φ over which the same sound image is seen from the listening point). In this embodiment, the intersection of a straight line drawn from the coordinate origin O in the direction of the angle θ and the side of the regular octagon is set as the position of the sound image, the main sound image M is localized at this position, and the interval according to the angle φ The process of localizing the two sub-sound images S1 and S2 facing each other at an equal distance across the main sound image M by adjusting the amplitude instead of adjusting the phase (delay time) as described later. This is executed by the sound
音像制御装置1は、例えばDSP(Digital Signal Processor)であり、予めインストールされた信号処理プログラムにしたがって、本実施形態の特徴を顕著に示す音像制御処理を実行する。より詳細に説明すると、音像制御装置1は、上記信号処理プログラムを実行することにより、音像情報生成手段10、アンプ20M、20S1および20S2、音像定位用ゲイン調整手段30M、30S1および30S2、加算器40−n(n=1〜8)として機能する。このように本実施形態では、音像制御装置1の構成要素の各々をソフトウェアで実現したが、電子回路等のハードウェアで実現し、それら電子回路を組み合わせて音像制御装置1を構成しても勿論良い。
The sound
図1の音像情報生成手段10は、スピーカSPn(n=1〜8)が放射する音により定位させようと意図する音像(主音像Mと副音像S1およびS2との合成により得られる音像)の位置(前述したように、本実施形態では、受聴点である座標原点Oから観た同音像の方向を表す角度θ)および同音像の見かけの大きさを表す角度φを利用者に設定させ、その設定内容に応じて主音像M、副音像S1およびS2の各々を定位させる位置を示す音像情報DM、DS1およびDS2を生成する。ここで、音像情報DMは、主音像Mの位置のX座標M_xと同位置のY座標M_yを示すデータであり、音像情報DS1は、副音像S1の位置のX座標S1_xと同位置のY座標S1_yを示すデータであり、音像情報DS2は、副音像S2の位置のX座標S2_xと同位置のY座標S2_yを示すデータである。より詳細に説明すると、音像情報生成手段10は、受聴点から観た音像の方向を表わす角度θと音像の見かけの大きさを示す角度φとを設定させるためのGUI画面を液晶ディスプレイなどの表示装置(図1では図示略)に表示させる。そして、キーボード等を用いた数値入力、或いはマウス等のポインティングデバイスによるドラッグアンドドロップにより(θ、φ)が入力されると、音像情報生成手段10は、以下のように音像情報DM、DS1およびDS2を生成する。 The sound image information generating means 10 in FIG. 1 is a sound image intended to be localized by sound emitted from the speaker SP n (n = 1 to 8) (a sound image obtained by synthesizing the main sound image M and the sub sound images S1 and S2). (In this embodiment, as described above, the angle θ representing the direction of the sound image viewed from the coordinate origin O, which is the listening point) and the angle φ representing the apparent size of the sound image are set by the user. Then, sound image information DM, DS1, and DS2 indicating positions where the main sound image M and the sub sound images S1 and S2 are localized are generated according to the set contents. Here, the sound image information DM is data indicating the Y coordinate M_y at the same position as the X coordinate M_x of the position of the main sound image M, and the sound image information DS1 is the Y coordinate of the same position as the X coordinate S1_x of the sub sound image S1. The sound image information DS2 is data indicating the Y coordinate S2_y at the same position as the X coordinate S2_x of the position of the sub sound image S2. More specifically, the sound image information generating means 10 displays a GUI screen for setting an angle θ indicating the direction of the sound image viewed from the listening point and an angle φ indicating the apparent size of the sound image, such as a liquid crystal display. It is displayed on a device (not shown in FIG. 1). When (θ, φ) is input by numerical input using a keyboard or the like, or by drag and drop using a pointing device such as a mouse, the sound image information generating means 10 performs sound image information DM, DS1, and DS2 as follows. Is generated.
音像情報生成手段10は、まず、スピーカSPn(n=1〜8)の各々を頂点とする正八角形の辺と座標原点Oから角度θの方向に引いた直線との交点を求め、当該交点のX座標M_x、同交点のY座標M_yを取得する。例えば、θ=20度と設定されると、音像情報DMは(32,93)と算出される。次いで、音像情報生成手段10は、上記正八角形の辺と座標原点Oから角度(θ−φ/2)の方向に引いた直線との交点を求め、当該交点のX座標S1_x、同交点のY座標S1_yを取得し、同様に、上記正八角形の辺と座標原点Oから角度(θ+φ/2)の方向に引いた直線との交点を求め、当該交点のX座標S2_x、同交点のY座標S2_yを取得する。例えば、θ=20度、φ=50度と設定されている場合には、受聴点から見た副音像S1の方向は、20−25=−5度(すなわち、355度)の方向とされ、同副音像S2の方向は20+25=45度の方向とされる。なお、本実施形態では、受聴点からみた音像の位置を角度θで設定させたが、座標値で設定させ、この設定内容から角度θを算出するようにしても勿論良く、また、受聴点から見た音像の方向θと音像までの距離rで音像の位置を指定しても良い。このように(r、θ)で音像の位置を設定する態様においては、主音像M、副音像S1および副音像S2の各々の位置については以下の数1で算出すれば良い。
図1のアンプ20M、20S1、20S2、音像定位用ゲイン調整手段30M、30S1、30S2、および加算器40−1〜40−8は、入力オーディオ信号INから出力オーディオ信号Znを生成する信号生成手段として機能する。音像制御装置1へ入力されるオーディオ信号INは、利用者により設定された角度(θ、φ)で規定される領域内に定位させる音像の数(本実施形態では、3つ)に応じて分配され、図1に示すように、アンプ20M、アンプ20S1およびアンプ20S2の各々に与えられる。アンプ20Mはオーディオ信号INの振幅を調整してオーディオ信号XMを、アンプ20S1は同オーディオ信号INの振幅を調整してオーディオ信号XS1を、アンプ20S2は同オーディオ信号INの振幅を調整してオーディオ信号XS2を生成する。詳細については後述するが、オーディオ信号XMは主音像Mの定位を実現するためのオーディオ信号YMn(n=1〜8)の生成に利用され、オーディオ信号XS1は副音像S1の定位を実現するためのオーディオ信号YS1n(n=1〜8)の生成に利用され、オーディオ信号XS2は副音像S2の定位を実現するためのオーディオ信号YS2n(n=1〜8)の生成に利用される。これらオーディオ信号XM、XS1およびXS2の振幅の比率は、主音像M、副音像S1およびS2の各々に対応する音の大きさ(音圧)に関連することとなる。本実施形態では、アンプ20Mにおける振幅の調整量(増幅率)gmと、アンプ20S1および20S2における振幅の調整量gsは、0.5〜1.0の範囲のパラメータxを用いて以下の数2のように表わされ、各々の2乗の和の平方根は数3に示すように一定値(本実施形態では、1)となる。
数2を参照すれば明らかように、x=1.0であればgm=1、gs=0となり、パラメータxが1よりも小さくなるにつれてgmは小さくなり、gsは大きくなる。そして、x=0.5となると、gm=gs(=3の平方根の逆数)となる。したがって、主音像Mのみを定位させ、副音像S1およびS2を定位させないようにする場合には、x=1.0とすれば良く、図3(B)に示すように主音像Mおよび各副音像の大きさを均一なものとする場合には、x=0.5とすれば良い。即ち、パラメータxは、主音像Mと副音像S1およびS2の大きさの比率を表す量であって、副音像S1とS2を同じ大きさの音像とし、かつ主音像Mと副音像S1およびS2の合計3つの音像の、それぞれの音像の音響エネルギに対応する量の総和を1に正規化した場合に対応する量である。本実施形態では、上記パラメータxとして1よりも小さく、かつ0.5よりも大きな値(例えば、0.7など)が予め設定されている。このため、本実施形態では、gm>gsとなり、図3(A)に示すように副音像S1や副音像S2に比較して優位な(音圧が高い)主音像Mを音像情報DMの示す位置に定位させるような信号処理が実行されるのである。なお、本実施形態では、パラメータxの値が0.5〜1.0の範囲で予め設定されていたが、音像情報生成手段10により値をその都度設定するようにしても勿論良い。 As can be seen from Equation 2, when x = 1.0, g m = 1 and g s = 0, and as parameter x becomes smaller than 1, g m decreases and g s increases. When x = 0.5, g m = g s (= the reciprocal of the square root of 3). Therefore, when only the main sound image M is localized and the sub sound images S1 and S2 are not localized, it is only necessary to set x = 1.0. As shown in FIG. In order to make the size of the sound image uniform, x = 0.5 may be set. That is, the parameter x is an amount that represents the ratio of the size of the main sound image M and the sub sound images S1 and S2. The sub sound images S1 and S2 are the same size sound image, and the main sound image M and the sub sound images S1 and S2 Of the total three sound images, the amount corresponding to the sum of the amounts corresponding to the acoustic energy of each sound image is normalized to 1. In the present embodiment, a value smaller than 1 and larger than 0.5 (for example, 0.7) is preset as the parameter x. Therefore, in the present embodiment, g m> g s, and the (higher sound pressure) superior in comparison to the sub-sound S1 and the sub-sound image S2 as shown in FIG. 3 (A) main sound M the sound image information DM The signal processing is performed so as to localize the position indicated by. In the present embodiment, the value of the parameter x is set in advance in the range of 0.5 to 1.0. However, the sound image information generating unit 10 may set the value each time.
図1の音像定位用ゲイン調整手段30Mは、オーディオ信号XMをスピーカSPnの数(本実施形態では、8)に応じて分配し、さらに、分配された各オーディオ信号の振幅を調整してオーディオ信号YMn(n=1〜8)を生成する。同様に、音像定位用ゲイン調整手段30S1は、オーディオ信号XS1からオーディオ信号YS1n(n=1〜8)を生成して出力し、音像定位用ゲイン調整手段30S2は、オーディオ信号XS2からオーディオ信号YS2n(n=1〜8)を生成して出力する。音像定位用ゲイン調整手段30Mにより生成されるオーディオ信号YMn(n=1〜8)は、これらオーディオ信号YMn(n=1〜8)のみをスピーカSPnの各々に与えて音を放射させた場合に、主音像Mのみを音像情報DMの示す当該主音像Mの位置に定位させるものである。同様に、オーディオ信号YS1n(n=1〜8)は、これらオーディオ信号YS1n(n=1〜8)のみをスピーカSPnの各々に与えて音を放射させた場合に、副音像S1のみを音像情報DS1の示す当該副音像S1の位置に定位させるオーディオ信号である。また、オーディオ信号YS2n(n=1〜8)は、これらオーディオ信号YS2n(n=1〜8)のみをスピーカSPnの各々に与えて音を放射させた場合に、副音像S2のみを音像情報DS2の示す当該副音像S2の位置に定位させるオーディオ信号である。音像定位用ゲイン調整手段30M、30S1および30S2の各々が上記各オーディオ信号を生成するために実行する処理は同一であるから、以下では音像定位用ゲイン調整手段30Mについてのみ詳細に説明する。 Sound image localization for gain adjustment means 30M in FIG. 1, an audio signal XM (in this embodiment, 8) the number of speakers SP n distributed according to, further, by adjusting the amplitude of each audio signal distributed audio A signal YM n (n = 1 to 8) is generated. Similarly, the sound image localization gain adjusting unit 30S1 generates and outputs an audio signal YS1 n (n = 1 to 8) from the audio signal XS1, and the sound image localization gain adjusting unit 30S2 receives the audio signal YS2 from the audio signal XS2. n (n = 1 to 8) is generated and output. The audio signal YM n (n = 1 to 8) generated by the sound image localization gain adjusting means 30M gives only the audio signal YM n (n = 1 to 8) to each of the speakers SP n to emit sound. In this case, only the main sound image M is localized at the position of the main sound image M indicated by the sound image information DM. Similarly, when the audio signal YS1 n (n = 1 to 8) is radiated by giving only the audio signal YS1 n (n = 1 to 8) to each of the speakers SP n , only the sub sound image S1 is obtained. Is an audio signal that is localized at the position of the sub sound image S1 indicated by the sound image information DS1. Further, the audio signal YS2 n (n = 1 to 8) is obtained by applying only the audio signal YS2 n (n = 1 to 8) to each of the speakers SP n to emit sound, and only the sub sound image S2 is obtained. This audio signal is localized at the position of the sub sound image S2 indicated by the sound image information DS2. Since each of the sound image localization gain adjustment means 30M, 30S1 and 30S2 executes the same processing to generate each audio signal, only the sound image localization gain adjustment means 30M will be described in detail below.
音像定位用ゲイン調整手段30Mは、まず、主音像Mの定位を担当する2個のスピーカからなるスピーカ群(以下、スピーカ対)を示す番号k(kは1〜8の何れか)として、以下の数4に示す条件を満たすものを特定する。ここで、スピーカ対の番号kに対応するスピーカ対とは、スピーカSPkとSPk+1のことである。例えばk=1の場合、対応するスピーカはスピーカSP1とSP2であり、k=8の場合は、対応するスピーカはスピーカSP8とSP8+1(=SP1)である。なお、数4においてSPk_xはスピーカSPkの配置位置のX座標であり、SPk_yは同配置位置のY座標である(ただし、以下の数4においてk=8の場合は、SPk+1_x=SP1_xであり、SPk+1_y=SP1_yである)。また、数4においてmin(a,b)は、2つの数aおよびbのうちの小さい方を意味し(すなわち、a<bであれば、min(a,b)=a)、max(a,b)は、2つの数aおよびbのうちの大きい方を意味する(すなわち、a<bであれば、max(a,b)=b)。この数4を参照すれば明らかように、音像定位用ゲイン調整手段30Mは、互いに隣り合って並んだ2つのスピーカからなるスピーカ対であって、それら2つのスピーカを結ぶ線分上(より一般的には、当該線分を対角線とする矩形内)に主音像Mが位置するものを主音像Mの定位を担当するスピーカ対として特定するのである。
上記のようにして主音像Mの定位を担当するスピーカ対を示す番号kが定まると、音像定位用ゲイン調整手段30Mは、オーディオ信号XMからオーディオ信号YMn(n=1〜8、ただし、n≠kかつn≠k+1)を生成する際のゲイン(増幅率)Gnをゼロとし、オーディオ信号YMkを生成する際のゲインGkとオーディオ信号YMk+1を生成する際のゲインGk+1とを以下の数5に示す値とする(ただし、数4における場合と同様にk=8の場合はYMk+1=YM1であり、Gk+1=G1である)。数5を参照すれば明らかように、オーディオ信号YMkを生成する際のゲインGkと、オーディオ信号YMk+1を生成する際のゲインGk+1の各々の2乗の和は1になる。また、数5にしたがって算出される値aは、座標原点Oを起点とする主音像Mの位置ベクトルとスピーカSPkの位置ベクトルのベクトル積(外積)の大きさ(両ベクトルを2辺とする平行四辺形の面積、すなわち、両ベクトルの各々の大きさに両ベクトルの為す角度の正弦値を乗算した値)を、受聴点Oを起点とするスピーカSPk+1の位置ベクトルとスピーカSPkの位置ベクトルのベクトル積の大きさで除算して得られる値となっている。同様に、数5にしたがって算出される値bは、座標原点Oを起点とする主音像Mの位置ベクトルとスピーカSPk+1の位置ベクトルのベクトル積の大きさを、受聴点Oを起点とするスピーカSPk+1の位置ベクトルとスピーカSPkの位置ベクトルのベクトル積の大きさで除算して得られる値となっている。ここで、ベクトル積の幾何学的な意味に留意すると、数5は、「主音像Mの定位を担当する2つのスピーカの各々に与えるオーディオ信号のゲインの2乗和が一定値(例えば、1)となり、かつ、各スピーカに与えるオーディオ信号のゲインが、主音像Mの位置から他方のスピーカの位置と座標原点Oとを通る直線に下ろした垂線の長さを、当該スピーカの位置から上記直線に下ろした垂線の長さで除算した値、に比例したものとなるように、両スピーカに与えるオーディオ信号のゲインを定めること」を意味しているのである。
主音像Mと副音像S1およびS2の位置が図3(A)に示すように算出される場合(例えばθ=20度、φ=50度と設定された場合)、主音像MはスピーカSP1とSP2の間に位置するのであるから、音像定位用ゲイン調整手段30Mは、主音像Mの定位を担当するスピーカ対を示す番号kをk=1と特定する。このため、音像定位用ゲイン調整手段30Mは、ゲインG1およびG2を数5にしたがって算出するとともに(具体的には、G1=0.9576、G2=0.2880と算出される)、Gn(n=3〜8)をゼロとし、これら各ゲインに応じた増幅率でオーディオ信号YMn(n=1〜8)を生成して出力する。同様に、副音像S1はスピーカSP8とSP1の間に位置するのであるから(図3(A)参照)、音像定位用ゲイン調整手段30S1は、副音像S1の定位を担当するスピーカ対を示す番号kをk=8と特定し、ゲインG8およびG9(前述したように、G1)を数5にしたがって算出し、Gn(n=2〜7)をゼロとし、これら各ゲインに応じた増幅率でオーディオ信号YS1n(n=1〜8)を生成して出力する。同様に、音像定位用ゲイン調整手段30S2は、副音像S2の定位を担当するスピーカ対を示す番号kをk=2と特定し、ゲインG2およびG3を数5にしたがって算出するとともに、Gn(n=1、4〜8)をゼロとし、これら各ゲインに応じた増幅率でオーディオ信号YS2n(n=1〜8)を生成して出力する。 When the positions of the main sound image M and the sub sound images S1 and S2 are calculated as shown in FIG. 3A (for example, when θ = 20 degrees and φ = 50 degrees are set), the main sound image M is the speaker SP 1. And SP 2 , the sound image localization gain adjusting means 30M specifies k = 1 as the number k indicating the speaker pair responsible for the localization of the main sound image M. For this reason, the sound image localization gain adjusting means 30M calculates the gains G 1 and G 2 in accordance with Equation 5 (specifically, G 1 = 0.9576 and G 2 = 0.2880). , G n (n = 3 to 8) is set to zero, and audio signals YM n (n = 1 to 8) are generated and output with amplification factors corresponding to these gains. Similarly, because the sub-sound S1 is it to position between the speaker SP 8 and SP 1 (see FIG. 3 (A)), the sound image localization for the gain adjustment unit 30S1 is a speaker pair responsible for localization of the secondary sound image S1 The indicated number k is specified as k = 8, gains G 8 and G 9 (G 1 as described above) are calculated according to Equation 5, G n (n = 2 to 7) is set to zero, and each of these gains is calculated. The audio signal YS1 n (n = 1 to 8) is generated and output at an amplification factor according to. Similarly, with the sound image localization for the gain adjustment unit 30S2 is, the number k indicating the speaker pair responsible for localization of the secondary sound S2 identified as k = 2, calculates the gain G 2 and G 3 according to Equation 5, G n (n = 1, 4 to 8) is set to zero, and an audio signal YS2 n (n = 1 to 8) is generated and output at an amplification factor corresponding to each gain.
図1の加算器40−n(n=1〜8)は、オーディオ信号YMn、YS1nおよびYS2nの和信号Zn(すなわち、Zn=YMn+YS1n+YS2n)を生成して出力する。前述したように、主音像M、副音像S1およびS2の各々の位置が図3(A)のように定まる状況においては、オーディオ信号YM1およびYM2の振幅は数5にしたがって算出される値(すなわち、主音像Mの定位に寄与する値)になっており、オーディオ信号YMn(n=3〜8)の振幅は0となっている。同様に、オーディオ信号YS18およびYS11の振幅は数5にしたがって算出される値(すなわち、副音像S1の定位に寄与する値)となっており、オーディオ信号YS1n(n=2〜7)の振幅は0となっている。そして、オーディオ信号YS22およびYS23の振幅は数5にしたがって算出される値(すなわち、副音像S2の定位に寄与する値)となっており、オーディオ信号YS2n(n=1、4〜8)の振幅は0となっている。このため、加算器40−n(n=1〜8)の各々から出力されるオーディオ信号Z1、Z2、Z3およびZ8には各々以下の信号成分が含まれており、その他(Zn:n=4〜7)は0となる。
Z1=主音像Mの定位に寄与する信号成分+副音像S1の定位に寄与する信号成分
Z2=主音像Mの定位に寄与する信号成分+副音像S2の定位に寄与する信号成分
Z3=副音像S2の定位に寄与する信号成分
Z8=副音像S1の定位に寄与する信号成分
Adder Figure 1 40-n (n = 1~8 ) is an audio signal YM n, YS1 n and YS2 n sum signal Z n (i.e., Z n = YM n + YS1 n + YS2 n) generating and outputting To do. As described above, the main sound image M, the value each position of the sub-sound S1 and S2 are in a situation where determined as shown in FIG. 3 (A), the amplitude of the audio signal YM 1 and YM 2 is calculated according to Equation 5 (That is, a value that contributes to localization of the main sound image M), and the amplitude of the audio signal YM n (n = 3 to 8) is zero. Similarly, the amplitudes of the audio signals YS1 8 and YS1 1 are values calculated according to Equation 5 (that is, values that contribute to the localization of the sub sound image S1), and the audio signals YS1 n (n = 2 to 7). Has an amplitude of zero. Then, the audio signals YS2 2 and YS2 3 value amplitude which is calculated according to Equation 5 (i.e., contributing value to localization of the secondary sound S2) has a audio signal YS2 n (n = 1,4~8 ) Is 0. Therefore, the audio signals Z 1 , Z 2 , Z 3 and Z 8 output from each of the adders 40-n (n = 1 to 8) each include the following signal components, and the other (Z n : n = 4 to 7) is 0.
Z 1 = signal component contributing to the localization of the main sound image M + signal component contributing to the localization of the sub sound image S 1 Z 2 = signal component contributing to the localization of the main sound image M + signal component contributing to the localization of the sub sound image S 2 Z 3 = Signal component contributing to localization of sub sound image S2 Z 8 = Signal component contributing to localization of sub sound image S1
このようにして音像制御装置1から出力されるオーディオ信号Zn(n=1〜8)の各々は、D/A変換器(図示略)によるD/A変換、および電力増幅器(同じく図示略)による増幅を経て図2のスピーカSPnに供給される。そして、図2のスピーカSPn(n=1〜8)の各々は、出力オーディオ信号Znに応じた音を放射するのである。前述したように、出力オーディオ信号Z1には主音像Mと副音像S1の各々の定位に寄与する信号成分が、出力オーディオ信号Z2には主音像Mと副音像S2の各々の定位に寄与する信号成分が、出力オーディオ信号Z3には副音像S2の定位に寄与する信号成分が、出力オーディオ信号Z8には副音像S1の定位に寄与する信号成分が含まれており、他の出力オーディオ信号Zn(n=4〜7)はゼロとなっている。このため、スピーカSP1とスピーカSP2の各々から放射される音によって主音像Mの定位が、スピーカSP8とスピーカSP1の各々から放射される音によって副音像S1の定位が、スピーカSP2とスピーカSP3の各々から放射される音によって副音像S2の定位が各々実現され、これら3つの音像の合成によって図3(A)にて一点鎖線で示すような見かけの大きさを伴う音像定位が実現されるのである。
In this way, each of the audio signals Z n (n = 1 to 8) output from the sound
以上説明したように本実施形態の音像制御装置1によれば、利用者により設定された位置および見かけの大きさにより規定される領域内に主音像M、副音像S1およびS2を定位させるようにスピーカSPn(n=1〜8)の駆動制御が行われ、これら3つの音像の合成によって見かけの大きさを伴う音像定位が実現される。これら3つの音像の定位は、スピーカSPn(n=1〜8)の各々に与えるオーディオ信号の振幅を調整することで実現され、位相調整は行われていないため、音場がクリアに保たれ、特許文献1等に開示された技術のように音像の位置の特定が困難になることはなく、音場が不自然になり難い。また、本実施形態では、音像を定位させる位置を受聴点から見た方向θで定量的に設定することが可能で、かつ、音像の見かけの大きさを角度φで定量的に設定することが可能である。このように、本実施形態によれば、音像をクリアに保ったままその見かけの大きさを定量的に制御することが可能になる。
As described above, according to the sound
以上、本発明の実施形態について説明したが、この実施形態に以下に述べる変形を加えても勿論良い。
(1)上述した実施形態では、パラメータxの値を予め設定しておくことによって図3(A)に示すような主音像Mが優位な状態、或いは図3(B)に示すような主音像Mと副音像S1およびS2とが均等な状態の何れかで主音像M、副音像S1および副音像S2の各々を定位させた。しかし、パラメータxを1から0.5へ経時的に変化させるようにして「主音像Mのみが定位している状態」→「主音像Mが優位な状態」→「主音像Mと副音像S1およびS2とが均等な状態」といった具合に状態を経時的に変化させても良い。また、角度φを経時的に変化させることで、副音像S1およびS2と主音像Mとの間隔を経時的に変化させ、音像の見かけの大きさを経時的に変化させても良い。具体的には、各時刻における角度φを表す時系列データを音像制御装置1に与え、時刻毎に副音像S1およびS2の位置をその時刻における角度φを用いて算出するようにすれば良い。同様に、角度θを経時的に変化させ、主音像M、副音像S1およびS2の位置が時々刻々変化するように制御することも可能である。主音像Mと副音像S1およびS2を合成して得られる音像の定位位置は、各スピーカ対の中心に限定されるものではないため、主音像M、副音像S1およびS2の各々の移動制御とそれら3つの音像を合成して得られる音像の見かけの大きさの制御(主音像M、副音像S1およびS2の各々の大きさの制御等)を併用すれば、それらの相乗効果により、多彩な音響効果を実現することができると考えられる。
Although the embodiment of the present invention has been described above, it is needless to say that the following modifications may be added to this embodiment.
(1) In the embodiment described above, the main sound image M as shown in FIG. 3A is dominant by setting the value of the parameter x in advance, or the main sound image as shown in FIG. Each of the main sound image M, the sub sound image S1, and the sub sound image S2 is localized in any state where M and the sub sound images S1 and S2 are equal. However, by changing the parameter x from 1 to 0.5 over time, “the state where only the main sound image M is localized” → “the state where the main sound image M is dominant” → “the main sound image M and the sub sound image S1” Further, the state may be changed with time, such as “the state where S2 and S2 are equal”. Further, by changing the angle φ over time, the interval between the sub-tone images S1 and S2 and the main sound image M may be changed over time, and the apparent size of the sound image may be changed over time. Specifically, time-series data representing the angle φ at each time may be given to the sound
(2)上述した実施形態では、音像制御装置1により8台のスピーカ(SP1〜SP8)の駆動制御を行ったが、2台〜7台、または9台以上のスピーカの駆動制御を行い得ることは言うまでも無い。なお、駆動制御の対象となるスピーカが2台である場合には、前掲数4に示す演算(各音像の定位に寄与するスピーカを特定するための演算)を行う必要はなく上記2台のスピーカの各々に与えるオーディオ信号の増幅率を音像毎に数5にしたがって算出し、それらオーディオ信号をチャネル毎に加算して出力するようにすれば良い。また、上述した実施形態では、音像制御装置1による駆動制御の対象となるスピーカSPn(n=1〜8)を正八角形の頂点に配置したが、例えば、楕円や放物線、双曲線などの任意の二次曲線に沿って各々のスピーカ軸が所定の方向に向くように(例えば、当該二次曲線の焦点に向くように)配置しても良い。また、任意の曲線に沿って各々が所定の方向を向くように複数のスピーカを配置しても良く、直線に沿って各々のスピーカ軸が平行になるように(すなわち、各スピーカが無限遠の一点に向いているように)各スピーカを配置しても良い。さらに、音像制御装置1により駆動制御される複数のスピーカを立体的に配置する態様も考えられる。このように複数のスピーカを立体的に配置する態様においては、各スピーカを頂点として描いた三角形内に当該主音像の配置位置が属し、かつ最小の三角形を描く3つのスピーカからなるスピーカ群を主音像の定位に寄与するもの(上述した実施形態におけるスピーカ対に対応するもの)として特定するようすれば良い。
(2) In the embodiment described above, drive control of eight speakers (SP 1 to SP 8 ) is performed by the sound
(3)上述した実施形態では、利用者により設定された位置および大きさで規定される領域内に1つの主音像と2つの副音像を均等に定位させたが、1つの主音像と2m(mは2以上の整数)の副音像を均等に定位させても良い。つまり、利用者により設定された位置および大きさで規定される領域内に主音像と各副音像とを合わせて奇数個の音像を均等に定位させるのである。また、同領域内に2個或いは4個などの偶数個の音像を均等に定位させても良い。要は、利用者により設定された位置および大きさにより規定される領域内に複数の音像を定位させることで、見かけの大きさを伴う音像定位を実現する態様であれば良い。 (3) In the above-described embodiment, one main sound image and two sub sound images are evenly localized in the area defined by the position and size set by the user. The sub sound image of m is an integer of 2 or more may be localized equally. That is, an odd number of sound images are evenly localized by combining the main sound image and each sub sound image within an area defined by the position and size set by the user. Further, an even number of sound images such as two or four may be localized in the same area. The point is that any sound image localization with an apparent size may be realized by localizing a plurality of sound images within an area defined by the position and size set by the user.
例えば、利用者により設定された位置および大きさで規定される領域内に1つの主音像と4つの副音像とを定位させる態様においては、音像の位置が角度θで設定され、同音像の見かけの大きさが角度φで設定される場合には、角度θの方向に主音像を定位させ、角度(θ−φ/2)、(θ−φ/4)、(θ+φ/4)および(θ+φ/2)の各方向に副音像を1つずつ定位させるようにすれば良い。つまり、利用者により設定された位置および大きさで規定される領域内に1つの主音像と2m(mは1以上の整数)個の副音像とを均等に定位させる態様においては、角度(θ±k×φ/2m:ただし、1≦k≦m)の方向に副音像を1つずつ定位させるようにすれば良い。同様に、上記領域内に偶数(2m:(mは1以上の整数)個の音像を均等に定位させる態様においては、角度(θ±k×φ/2m:ただし、1≦k≦m)の各方向に音像を1つずつ定位させるようにすれば良い。 For example, in a mode in which one main sound image and four sub sound images are localized in an area defined by the position and size set by the user, the position of the sound image is set at an angle θ, and the appearance of the sound image is Is set at an angle φ, the main sound image is localized in the direction of the angle θ, and the angles (θ−φ / 2), (θ−φ / 4), (θ + φ / 4) and (θ + φ) / 2) The sub-sound image may be localized one by one in each direction. That is, in an aspect in which one main sound image and 2m (m is an integer of 1 or more) sub sound images are localized equally in an area defined by the position and size set by the user, the angle (θ ± k × φ / 2m: However, the sub-sound images may be localized one by one in the direction of 1 ≦ k ≦ m). Similarly, in an embodiment in which an even number (2m: (m is an integer of 1 or more)) of sound images is localized in the region, an angle (θ ± k × φ / 2m: where 1 ≦ k ≦ m) The sound image may be localized one by one in each direction.
(4)上述した実施形態では、主音像を挟んで対向する2つの副音像を主音像Mとの間隔が均等になるように定位させたが、各副音像と主音像との間隔が均等にならないように各副音像を定位させても良い。例えば、受聴点から見た音像の方向が角度θの方向と設定され、同音像の大きさが角度φで設定された場合に、角度θの方向に主音像Mを定位させ、副音像S1は角度(θ―2φ/3)方向に、副音像S2は角度(θ+φ/3)方向に定位させるといった具合である。 (4) In the embodiment described above, the two sub sound images facing each other across the main sound image are localized so that the distance between the main sound image M is equal, but the distance between each sub sound image and the main sound image is equal. Each sub sound image may be localized so that it does not occur. For example, when the direction of the sound image viewed from the listening point is set to the direction of the angle θ and the size of the sound image is set to the angle φ, the main sound image M is localized in the direction of the angle θ, and the sub sound image S1 is The secondary sound image S2 is localized in the angle (θ-2φ / 3) direction and the angle (θ + φ / 3) direction.
(5)上述した実施形態では、DSPなどのコンピュータを、音像情報生成手段10と、同音像情報生成手段10により生成される音像情報の示す位置に複数の音像の各々を定位させるように入力オーディオ信号INから出力オーディオ信号Znを生成する信号生成手段(図1のアンプ20M、20S1、20S2、音像定位用ゲイン調整手段30M、30S1、30S2、および加算器40−1〜40−8)として機能させる信号処理プログラムが音像制御装置1に予めインストールされていた。しかし、CD−ROM(Compact Disk-Read Only Memory)などのコンピュータ読み取り可能な記録媒体に上記信号処理プログラムを書き込んで配布しても良く、また、インターネットなどの電気通信回線経由のダウンロードにより上記信号処理プログラムを配布しても良い。
(5) In the above-described embodiment, a computer such as a DSP is used to input audio so as to localize each of the plurality of sound images at the position indicated by the sound image information generating means 10 and the sound image information generated by the sound image information generating means 10. signal signal generating means for generating an output audio signal Z n from the iN (in Fig. 1
(6)上述した実施形態では、入力オーディオ信号INを、利用者により設定された位置および大きさにより規定される領域内に定位させる音像の数に応じて分配して得られるオーディオ信号の各々に対して各音像の大きさを均等(或いは不均等)にするための第1の振幅調整(上記実施形態では、アンプ20M、20S1および20S2による振幅調整)を施した後に、さらに、それら音像の各々を音像情報の示す位置に定位させるための第2の振幅調整(音像定位用ゲイン調整手段30M、30S1および30S2による振幅調整)を施して出力オーディオ信号Znを生成したが、これら第1および第2の振幅調整の実行順序を入れ替えても勿論良い。
(6) In the above-described embodiment, the input audio signal IN is distributed to each of the audio signals obtained by distributing the input audio signal IN according to the number of sound images to be localized in the region defined by the position and size set by the user. On the other hand, after the first amplitude adjustment (in the above embodiment, amplitude adjustment by the
(7)上述した実施形態では、主音像Mと副音像S1およびS2の各々の定位を担当するそれぞれ2つのスピーカに与えるオーディオ信号のゲインを数5に示すパンニングにより決定した。しかし、上記各スピーカに与えるオーディオ信号のゲインの決定方法は上記パンニングに限定されるものではなく、主音像Mと副音像S1およびS2の各々の定位をそれぞれ3つ以上のスピーカに担当させるようにしても良い。例えば、図2のスピーカSP8、SP1、およびSP2の3つのスピーカに主音像Mの定位を担当させる場合、これら3つのスピーカに与えるオーディオ信号のゲインを適宜調整することで、受聴点からスピーカSP1に到る線分上の任意の位置に主音像Mを定位させるといった具合に奥行き方向の定位も可能になる。また、このような態様によれば、受聴点から見た主音像Mの距離と副音像S1およびS2の各々の距離が同一にならないように主音像Mと副音像S1およびS2を定位させることもでき、奥行き方向の大きさを伴う音像定位を実現することができる、と考えられる。 (7) In the above-described embodiment, the gain of the audio signal to be given to each of the two speakers responsible for the localization of the main sound image M and the sub sound images S1 and S2 is determined by panning shown in Formula 5. However, the method of determining the gain of the audio signal to be given to each speaker is not limited to the panning, and the localization of each of the main sound image M and the sub sound images S1 and S2 is assigned to three or more speakers. May be. For example, in the case where three speakers SP 8 , SP 1 and SP 2 in FIG. 2 are responsible for localization of the main sound image M, by appropriately adjusting the gain of the audio signal applied to these three speakers, from the listening point localization in the depth direction so on localizing the main sound image M at an arbitrary position on the line leading to the speaker SP 1 also becomes possible. Further, according to such an aspect, the main sound image M and the sub sound images S1 and S2 can be localized so that the distance of the main sound image M viewed from the listening point and the distances of the sub sound images S1 and S2 are not the same. It is considered that sound image localization with a size in the depth direction can be realized.
1…音像制御装置、SPn(n=1〜8)…スピーカ、10…音像情報生成手段、20M,20S1,20S2…アンプ、30M,30S1,30S2…音像定位用ゲイン調整手段、40−n(n=1〜8)…加算器。 1 ... sound image control apparatus, SP n (n = 1~8) ... speaker, 10 ... acoustic image information generating means, 20M, 20S1,20S2 ... amplifier, 30M, 30S1,30S2 ... sound image localization for the gain adjustment unit, 40-n ( n = 1-8)... Adder.
Claims (6)
前記入力オーディオ信号の振幅を調整して複数のスピーカの各々に与える出力オーディオ信号を生成する手段であって、前記複数のスピーカの各々の配置位置と前記音像情報の示す前記複数の音像の各々の定位位置とから前記複数の音像の各々の定位に寄与するスピーカ群を特定し、各スピーカ群から放射される音により前記複数の音像の各々が前記音像情報の示す各定位位置に定位するように前記各出力オーディオ信号を生成する信号生成手段と、
を有することを特徴とする音像制御装置。 Is set the position and the apparent magnitude of the input audio signal controlled object sound corresponding to the user, the localization of each of the plurality of sound image is localized in the area defined by the position and size set by the user Means for generating sound image information indicating a position based on a position and size set by the user, wherein the sound image information is generated so that the control target sound image is perceived by a listener by combining the plurality of sound images; Sound image information generating means for generating;
A means for adjusting an amplitude of the input audio signal to generate an output audio signal to be provided to each of the plurality of speakers, wherein each of the plurality of sound images indicated by the arrangement position of each of the plurality of speakers and the sound image information ; A speaker group that contributes to localization of each of the plurality of sound images is identified from the localization position, and each of the plurality of sound images is localized at each localization position indicated by the sound image information by sound radiated from each speaker group. Signal generating means for generating each output audio signal;
A sound image control apparatus comprising:
前記複数の音像の間隔、または大きさが均等、または不均等になるように前記各出力オーディオ信号の振幅を調整する
ことを特徴とする請求項1に記載の音像制御装置。 The signal generating means includes
The sound image control apparatus according to claim 1, wherein the amplitude of each output audio signal is adjusted so that intervals or sizes of the plurality of sound images are equal or unequal.
入力オーディオ信号に応じた制御対象音像の位置および見かけの大きさを利用者に設定させ、前記利用者により設定された位置および大きさにより規定される領域内に定位させる複数の音像の各々の定位位置を示す音像情報を前記利用者により設定された位置および大きさに基づいて生成する手段であって、当該複数の音像の合成により前記制御対象音像が聴者に知覚されるように前記音像情報を生成する音像情報生成手段と、 Localization of each of the plurality of sound images that allows the user to set the position and apparent size of the sound image to be controlled according to the input audio signal, and to localize within the region defined by the position and size set by the user Means for generating sound image information indicating a position based on a position and size set by the user, wherein the sound image information is generated so that the control target sound image is perceived by a listener by combining the plurality of sound images; Sound image information generating means for generating;
前記入力オーディオ信号の振幅を調整して複数のスピーカの各々に与える出力オーディオ信号を生成する手段であって、前記複数のスピーカの各々の配置位置と前記音像情報の示す前記複数の音像の各々の定位位置とから前記複数の音像の各々の定位に寄与するスピーカ群を特定し、各スピーカ群から放射される音により前記複数の音像の各々が前記音像情報の示す各定位位置に定位するように前記各出力オーディオ信号を生成する信号生成手段 A means for adjusting an amplitude of the input audio signal to generate an output audio signal to be provided to each of the plurality of speakers, wherein each of the plurality of sound images indicated by the arrangement position of each of the plurality of speakers and the sound image information; A speaker group that contributes to localization of each of the plurality of sound images is identified from the localization position, and each of the plurality of sound images is localized at each localization position indicated by the sound image information by sound radiated from each speaker group. Signal generating means for generating each output audio signal
として機能させることを特徴とするプログラム。 A program characterized by functioning as
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010125543A JP5655378B2 (en) | 2010-06-01 | 2010-06-01 | Sound image control device and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010125543A JP5655378B2 (en) | 2010-06-01 | 2010-06-01 | Sound image control device and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2011254195A JP2011254195A (en) | 2011-12-15 |
| JP5655378B2 true JP5655378B2 (en) | 2015-01-21 |
Family
ID=45417790
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010125543A Active JP5655378B2 (en) | 2010-06-01 | 2010-06-01 | Sound image control device and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5655378B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10715914B2 (en) | 2018-01-31 | 2020-07-14 | Canon Kabushiki Kaisha | Signal processing apparatus, signal processing method, and storage medium |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101619760B1 (en) | 2013-03-28 | 2016-05-11 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | Rendering of audio objects with apparent size to arbitrary loudspeaker layouts |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003244800A (en) * | 2002-02-14 | 2003-08-29 | Matsushita Electric Ind Co Ltd | Sound image localization device |
-
2010
- 2010-06-01 JP JP2010125543A patent/JP5655378B2/en active Active
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10715914B2 (en) | 2018-01-31 | 2020-07-14 | Canon Kabushiki Kaisha | Signal processing apparatus, signal processing method, and storage medium |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2011254195A (en) | 2011-12-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5719458B2 (en) | Apparatus and method for calculating speaker driving coefficient of speaker equipment based on audio signal related to virtual sound source, and apparatus and method for supplying speaker driving signal of speaker equipment | |
| JP4924119B2 (en) | Array speaker device | |
| US20160119737A1 (en) | Arrangement and method for reproducing audio data of an acoustic scene | |
| JP2015531218A (en) | Virtual rendering of object-based audio | |
| JP2005197896A (en) | Audio signal supply apparatus for speaker array | |
| KR102606599B1 (en) | Audio processing device, method, and recording medium | |
| CN101267687A (en) | Array speaker equipment | |
| CN1906971A (en) | Device and method for producing a low-frequency channel | |
| JP6927196B2 (en) | Sound reproduction equipment and methods, and programs | |
| KR20220038478A (en) | Apparatus, method or computer program for processing a sound field representation in a spatial transformation domain | |
| US11221821B2 (en) | Audio scene processing | |
| WO2018197748A1 (en) | Spatial audio processing | |
| US20240323607A1 (en) | Loudspeaker system for arbitrary sound direction rendering | |
| JP2009044261A (en) | Device for forming sound field | |
| CN116193196A (en) | Virtual surround sound rendering method, device, equipment and storage medium | |
| Braasch et al. | A loudspeaker-based projection technique for spatial music applications using virtual microphone control | |
| JP5655378B2 (en) | Sound image control device and program | |
| JP2024540745A (en) | Apparatus, method, or computer program for synthesizing a spatially extended sound source using correction data relating to a potentially correcting object | |
| EP3955590A1 (en) | Information processing device and method, reproduction device and method, and program | |
| JP2011182067A (en) | Speaker array | |
| JP7160312B2 (en) | sound system | |
| US20220014864A1 (en) | Signal processing apparatus, signal processing method, and program | |
| Kareer et al. | Spatial Audio Production with a New Volumetric Amplitude Panning and Diffusion Technique | |
| KR102132892B1 (en) | Acoustic control interface for horizontal array type sound reproducing apparatus using wave field synthesis technology | |
| US20240284132A1 (en) | Apparatus, Method or Computer Program for Synthesizing a Spatially Extended Sound Source Using Variance or Covariance Data |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130419 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140311 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
| RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20140512 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20140512 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140602 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141028 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141110 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 5655378 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |