[go: up one dir, main page]

JP2018120007A - Voice signal converter, voice signal converting method and program - Google Patents

Voice signal converter, voice signal converting method and program Download PDF

Info

Publication number
JP2018120007A
JP2018120007A JP2017009298A JP2017009298A JP2018120007A JP 2018120007 A JP2018120007 A JP 2018120007A JP 2017009298 A JP2017009298 A JP 2017009298A JP 2017009298 A JP2017009298 A JP 2017009298A JP 2018120007 A JP2018120007 A JP 2018120007A
Authority
JP
Japan
Prior art keywords
signal
signals
sound
audio signal
directional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017009298A
Other languages
Japanese (ja)
Other versions
JP6666276B2 (en
Inventor
健太 丹羽
Kenta Niwa
健太 丹羽
小林 和則
Kazunori Kobayashi
和則 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017009298A priority Critical patent/JP6666276B2/en
Publication of JP2018120007A publication Critical patent/JP2018120007A/en
Application granted granted Critical
Publication of JP6666276B2 publication Critical patent/JP6666276B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】位置関係が制限されていない複数のマイクロホンの収音信号を利用して、擬似的にアンビソニックス形式の音声信号を生成する音声信号変換装置等を提供する。【解決手段】音声信号変換装置は、前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号を用いて、無指向性の信号W,x軸方向の双指向性信号X,y軸方向の双指向性信号Y,z軸方向の双指向性信号Zを生成する変換処理部を含み、前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号をそれぞれF,B,L,R,U,Dとし、変換処理部は、W=F+B+L+R+U+D, X=F-B, Y=L-R, Z=U-Dにより、信号W,双指向性信号X,双指向性信号Y,双指向性信号Zを生成する。【選択図】図5An audio signal conversion device and the like that generate an ambisonics-type audio signal in a pseudo manner using sound pickup signals of a plurality of microphones whose positional relationships are not limited. An audio signal conversion device uses a non-directional signal W, a bi-directional signal X in an x-axis direction, using six enhancement signals that emphasize sounds arriving from six directions, front, rear, left, right, and up. It includes a conversion processing unit that generates a bi-directional signal Y in the y-axis direction and a bi-directional signal Z in the z-axis direction. , B, L, R, U, D, the conversion processing unit uses W = F + B + L + R + U + D, X = FB, Y = LR, Z = UD, signal W, bidirectional A signal X, a bidirectional signal Y, and a bidirectional signal Z are generated. [Selection] Figure 5

Description

本発明は、空間や聴取者の頭が回転した際の音場の変化をソフトウェア的に容易に再現できる立体音響技術に関する。   The present invention relates to a three-dimensional acoustic technology that can easily reproduce a change in a sound field when a space or a listener's head rotates by software.

ユーザが見たい任意の方向の映像は360度映像と呼ばれている。近年、映像配信サービスを利用して、360度映像を視聴できる機会が増えている。例えば、2016年4月頃には、360度映像の視聴に対応して、音が変化する(見ている方向に応じた音像定位を実現する)サービスがYouTube(登録商標)にてリリースされた。なお、YouTubeにおける音の収音/再生方式はアンビソニックス形式に基づく(非特許文献1参照)。   The video in any direction that the user wants to see is called a 360-degree video. In recent years, opportunities to view 360-degree video using video distribution services are increasing. For example, around April 2016, YouTube (registered trademark) released a service that changes sound (performs sound image localization according to the viewing direction) in response to viewing 360-degree video. Note that the sound collection / reproduction method on YouTube is based on the ambisonics format (see Non-Patent Document 1).

アンビソニックス形式の音を生成するためのハードウェアとして、通常は専用のマイクロホンアレイ(以下アンビソニックスマイクロホンアレイともいう)を用いる。無指向性マイクまたは単一指向性マイクを四面体の頂点に設置した形状をしており、周囲には反射または回折するような物体を設置しないことが原則とされている。   As hardware for generating ambisonics-type sound, a dedicated microphone array (hereinafter also referred to as an ambisonics microphone array) is usually used. In principle, an omnidirectional microphone or a unidirectional microphone is placed at the apex of a tetrahedron, and an object that reflects or diffracts is not installed around.

西村竜一、"5章 アンビソニックス"、[online]、映像情報メディア学会誌、vol.68, No.8, (2014), [平成29年1月11日検索]、インターネット<URL:https://www.jstage.jst.go.jp/article/itej/68/8/68_616/_pdf>Ryuichi Nishimura, “Chapter 5 Ambisonics”, [online], Journal of the Institute of Image Information and Television Engineers, vol.68, No.8, (2014), [searched on January 11, 2017], Internet <URL: https: / /www.jstage.jst.go.jp/article/itej/68/8/68_616/_pdf>

しかしながら、従来技術のアンビソニックスマイクロホンアレイのマイクロホンの位置は、原則として、四面体の頂点に対応する位置に制限されており、自由度が低い。そのため、アンビソニックスマイクロホンアレイをカメラに直接埋め込むような実装ができない。そこで、図1のように、単一指向性マイクを正四面体の頂点に設置した形状からなるアンビソニックスマイクロホンアレイ92を360度カメラ91の上部に設置する構成が考えられる。この場合には、アンビソニックスマイクロホンアレイ92が360度カメラ91の映像に映り込んでしまうという問題が生じうる。このとき、アンビソニックスマイクロホンアレイ92全体を覆う風防等を設けると、さらにこの問題が生じやすくなる。また、このような構成とすると、装置の一体感が低下し、ポータビリティの低下を招くという問題も生じる。   However, the position of the microphone of the conventional ambisonics microphone array is limited to the position corresponding to the apex of the tetrahedron in principle, and the degree of freedom is low. Therefore, it is impossible to mount the ambisonic microphone array directly in the camera. Therefore, as shown in FIG. 1, a configuration in which an ambisonic microphone array 92 having a shape in which a unidirectional microphone is installed at the apex of a regular tetrahedron is installed on the upper part of the 360-degree camera 91 can be considered. In this case, there may arise a problem that the ambisonic microphone array 92 is reflected in the image of the 360-degree camera 91. At this time, if a windshield or the like covering the entire ambisonic microphone array 92 is provided, this problem is more likely to occur. In addition, such a configuration causes a problem that the sense of unity of the apparatus is lowered and portability is lowered.

本発明は、位置関係が制限されていない複数のマイクロホンの収音信号を利用して、擬似的にアンビソニックス形式の音声信号を生成する音声信号変換装置、その方法、及びプログラムを提供することを目的とする。   It is an object of the present invention to provide an audio signal converter, a method thereof, and a program for generating an ambisonics-type audio signal in a pseudo manner by using sound pickup signals of a plurality of microphones whose positional relationships are not limited. Objective.

上記の課題を解決するために、本発明の一態様によれば、音声信号変換装置は、前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号を用いて、無指向性の信号W,x軸方向の双指向性信号X,y軸方向の双指向性信号Y,z軸方向の双指向性信号Zを生成する変換処理部を含み、前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号をそれぞれF,B,L,R,U,Dとし、変換処理部は、W=F+B+L+R+U+D, X=F-B, Y=L-R, Z=U-Dにより、信号W,双指向性信号X,双指向性信号Y,双指向性信号Zを生成する。   In order to solve the above-described problem, according to one aspect of the present invention, an audio signal conversion device uses six enhancement signals that enhance sounds arriving from six directions, front, rear, left, right, and up, respectively, and is omnidirectional. Signal W, x-axis direction bi-directional signal X, y-axis direction bi-directional signal Y, z-axis direction bi-directional signal Z The six emphasis signals emphasizing the incoming sound are F, B, L, R, U, D, respectively, and the conversion processing unit is W = F + B + L + R + U + D, X = FB, Y By using = LR and Z = UD, a signal W, a bidirectional signal X, a bidirectional signal Y, and a bidirectional signal Z are generated.

上記の課題を解決するために、本発明の他の態様によれば、音声信号変換方法は、前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号を用いて、無指向性の信号W,x軸方向の双指向性信号X,y軸方向の双指向性信号Y,z軸方向の双指向性信号Zを生成する変換処理ステップを含み、前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号をそれぞれF,B,L,R,U,Dとし、変換処理ステップは、W=F+B+L+R+U+D, X=F-B, Y=L-R, Z=U-Dにより、信号W,双指向性信号X,双指向性信号Y,双指向性信号Zを生成する。   In order to solve the above-described problem, according to another aspect of the present invention, an audio signal conversion method uses six emphasis signals respectively emphasizing sounds arriving from six directions, front, rear, left, right, and upper, and is omnidirectional. Signal, W, x-axis direction bi-directional signal X, y-axis direction bi-directional signal Y, z-axis direction bi-directional signal Z The six enhancement signals emphasizing the sounds coming from are respectively F, B, L, R, U, and D, and the conversion processing steps are W = F + B + L + R + U + D, X = FB, A signal W, a bidirectional signal X, a bidirectional signal Y, and a bidirectional signal Z are generated by Y = LR and Z = UD.

本発明によれば、位置関係が制限されていない複数のマイクロホンの収音信号を利用して、擬似的にアンビソニックス形式の音声信号を生成することができるという効果を奏する。   Advantageous Effects of Invention According to the present invention, there is an effect that an ambisonics-type sound signal can be generated in a pseudo manner using sound pickup signals of a plurality of microphones whose positional relationships are not limited.

アンビソニックスマイクロホンアレイと360度カメラとを組合せた構成を示す図。The figure which shows the structure which combined the ambisonics microphone array and the 360 degree camera. 複数のマイクロホンをカメラの筐体に直接埋め込んだ構成の例を示す図。The figure which shows the example of the structure which embedded the some microphone directly in the housing | casing of the camera. 複数のマイクロホンをカメラの筐体に直接埋め込んだ構成の例を示す図。The figure which shows the example of the structure which embedded the some microphone directly in the housing | casing of the camera. 4本の無指向性マイクロホンとBフォーマット信号との関係を説明するための図。The figure for demonstrating the relationship between four omnidirectional microphones and a B format signal. 第一実施形態に係る音声信号変換装置の機能ブロック図。The functional block diagram of the audio | voice signal converter which concerns on 1st embodiment. 第一実施形態に係る音声信号変換装置の処理フローの例を示す図。The figure which shows the example of the processing flow of the audio | voice signal converter which concerns on 1st embodiment. 強調信号を説明するための図。The figure for demonstrating an emphasis signal. 方向別収音部の機能ブロック図。The functional block diagram of the sound collection part classified by direction. 方向別収音部の処理フローの例を示す図。The figure which shows the example of the processing flow of the sound collection part classified by direction.

以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。   Hereinafter, embodiments of the present invention will be described. In the drawings used for the following description, constituent parts having the same function and steps for performing the same process are denoted by the same reference numerals, and redundant description is omitted.

<第一実施形態のポイント>
本実施形態では、位置関係が制限されていない複数のマイクロホンの収音信号を利用して、アンビソニックス形式の音声信号を擬似的に生成する。そのため、複数のマイクロホンをカメラの筐体に直接埋め込むような構成が可能となる。
<Points of first embodiment>
In the present embodiment, an ambisonics-type audio signal is generated in a pseudo manner using sound pickup signals of a plurality of microphones whose positional relationships are not limited. Therefore, a configuration in which a plurality of microphones are directly embedded in the camera casing is possible.

複数のマイクロホンをカメラの筐体に直接埋め込んだ構成の例を図2、図3に示す。図2Aは平板状の筐体の正面、側面、上面にマイクロホン95を配置した例を、図2Bは円筒上の筐体の正面図であり、図2Cは図2Bの背面図である。図2Bでは2つのマイクロホン95を水平方向に並べて配置し、図2Cでは2つのマイクロホン95を垂直方向に並べて配置している。図3Aは球状の筐体にマイクロホンを配置した例を、図3Bは直方体状の筐体にマイクロホンを配置した例を示す。なお、これらの構成は一例であって、他の配置であってもよい。   Examples of configurations in which a plurality of microphones are directly embedded in the camera housing are shown in FIGS. 2A is an example in which microphones 95 are arranged on the front, side, and top surfaces of a flat housing, FIG. 2B is a front view of the cylindrical housing, and FIG. 2C is a rear view of FIG. 2B. In FIG. 2B, two microphones 95 are arranged side by side in the horizontal direction, and in FIG. 2C, two microphones 95 are arranged side by side in the vertical direction. 3A shows an example in which a microphone is arranged in a spherical casing, and FIG. 3B shows an example in which a microphone is arranged in a rectangular parallelepiped casing. In addition, these structures are examples and other arrangement | positioning may be sufficient.

ただし、3本以上のマイクロホンを用いることを前提とする。4本以上のマイクロホンを用いる場合には、それらが同一平面上にないほうが良いと考えられる。また、マイクロホン間隔はある程度狭いほうが好ましい(1〜5cm)。   However, it is assumed that three or more microphones are used. When using four or more microphones, it is better that they are not on the same plane. Further, it is preferable that the distance between the microphones is narrow to some extent (1 to 5 cm).

<アンビソニックスBフォーマット>
360度映像向けのオーディオ生成技術の従来法としてアンビソニックスBフォーマットについて説明する。主に用いられているアンビソニックスマイクロホンアレイは、感度が揃った単一指向性マイク、または、無指向性マイクを四面体の頂点に並べる。マイクロホン間隔は狭いことが多い(1〜4cm程度)。以後、特に説明の一般性を失わないので、無指向性マイクロホン4本を用いてアンビソニックスBフォーマット形式の音声信号(以下、Bフォーマット信号ともいう)を生成する方法について説明する。4本の無指向性マイクロホン93を原点、X軸上、Y軸上、Z軸上に配置する(図4参照)。なお、各軸上の無指向性マイクロホン93は原点から見て等距離に配置する。
<Ambisonics B format>
The Ambisonics B format will be described as a conventional method of audio generation technology for 360-degree video. The ambisonic microphone array used mainly arranges unidirectional microphones or omnidirectional microphones with uniform sensitivity at the apex of the tetrahedron. The microphone spacing is often narrow (about 1 to 4 cm). Hereinafter, a method for generating an ambisonics B format audio signal (hereinafter also referred to as a B format signal) using four omnidirectional microphones will be described because the generality of the description is not lost. Four omnidirectional microphones 93 are arranged on the origin, the X axis, the Y axis, and the Z axis (see FIG. 4). The omnidirectional microphones 93 on each axis are arranged at an equal distance when viewed from the origin.

アンビソニックスBフォーマット形式の音声信号は、無指向性、3種類の双指向性(X方向、Y方向、Z方向)で収音した計4チャネルの信号で構成される。4本のマイクロホン93で観測した時間領域の信号をOt(原点に配置される無指向性マイクロホンの出力信号),At(X軸上に配置される無指向性マイクロホンの出力信号),Bt(Y軸上に配置される無指向性マイクロホンの出力信号),Ct(Z軸上に配置される無指向性マイクロホンの出力信号)と定義する。アンビソニックスBフォーマットの無指向性で収音した時間信号をWt、X軸方向の双指向性信号をXt、Y軸方向の双指向性信号をYt、Z軸方向の双指向性信号をZtとするとその関係は以下で書ける。
Wt=Ot
Xt=At-Ot
Yt=Bt-Ot
Zt=Ct-Ot
An ambisonics B format audio signal is composed of a total of four channels of sound collected with omnidirectionality and three types of bidirectionality (X direction, Y direction, and Z direction). Four time-domain signals observed by the microphones 93 O t (output signal of the omnidirectional microphone is placed at the origin), (the output signal of the omnidirectional microphone disposed on the X axis) A t, B It is defined as t (output signal of an omnidirectional microphone arranged on the Y axis) and C t (output signal of an omnidirectional microphone arranged on the Z axis). Ambisonics B format omnidirectional time signal picked up by W t , X-axis direction bi-directional signal X t , Y-axis direction bi-directional signal Y t , Z-axis direction bi-directional signal Let Z t be the relationship.
W t = O t
X t = A t -O t
Y t = B t -O t
Z t = C t -O t

アンビソニックスBフォーマットは、非常に単純な演算で音場を一次微分表現し、かつ360度映像のための音像定位として一定の効果があることから利用されるケースが増えている。   The Ambisonics B format is increasingly used because it provides a first-order differential representation of the sound field with very simple calculations and has a certain effect as a sound image localization for 360-degree video.

しかしながら、前述の通り、従来技術のアンビソニックスマイクロホンアレイのマイクロホンの位置は、原則として、四面体の頂点に対応する位置に制限されており、自由度が低いという問題がある。また、以下の問題点がある。   However, as described above, the position of the microphone of the conventional ambisonics microphone array is limited to the position corresponding to the apex of the tetrahedron, and there is a problem that the degree of freedom is low. In addition, there are the following problems.

(i)アンビソニックス形式の音を生成するためには、マイクロホンの感度が揃っていないといけない。しかしながら、アンビソニックス形式の音を生成するために必要な水準でマイクロホンの感度を揃えて製造することは容易なことではない。そのため、多くのマイクロホンを製造し、その中から感度が揃っている4つのマイクロホンを選別するという作業を行うことが多い。そのため、製造コストが高くなる。   (i) In order to generate Ambisonics sound, the microphones must have the same sensitivity. However, it is not easy to produce microphones with the same sensitivity as required to generate ambisonics-type sound. For this reason, many microphones are manufactured, and four microphones having the same sensitivity are selected from among them. Therefore, the manufacturing cost is increased.

(ii)アンビソニックスマイクロホンアレイの近傍に反射/回折の発生源を置いてはいけない。アンビソニックスマイクロホンアレイをカメラに直接埋め込むとカメラの筐体が音が反射したり回折する。よって、この観点からも、マイクロホンをカメラに直接埋め込むような実装はできない。   (ii) Do not place reflection / diffraction sources in the vicinity of the ambisonics microphone array. When the ambisonics microphone array is embedded directly in the camera, the camera case reflects or diffracts the sound. Therefore, from this point of view, it is impossible to mount the microphone directly in the camera.

(iii)収音した後に特定のエリアの音の音量調整を原理上、行えないという問題がある。   (iii) In principle, there is a problem that volume adjustment of sound in a specific area cannot be performed after sound collection.

<第一実施形態に係る音声信号変換装置100>
図5は第一実施形態に係る音声信号変換装置100の機能ブロック図を、図6はその処理フローを示す。
<Audio signal conversion apparatus 100 according to the first embodiment>
FIG. 5 is a functional block diagram of the audio signal conversion apparatus 100 according to the first embodiment, and FIG. 6 shows a processing flow thereof.

音声信号変換装置100は、M個のマイクロホンのマイクロホン95−mで収音したM個の収音信号sm,tを入力とし、M個の収音信号sm,tを4つのアンビソニックスBフォーマット形式の音声信号Wt,Xt,Yt,Ztに変換し、出力する。ただし、mをマイクロホンのインデックス、tを離散時間を示すインデックス、m=1,2,…,M、Mを3以上の整数の何れかとする。 The audio signal conversion apparatus 100 receives M sound pickup signals sm , t collected by microphones 95-m of M microphones as input, and outputs the four sound pickup signals sm , t to four ambisonics B. Converted into audio signals W t , X t , Y t , Z t in format format and output. Here, m is an index of a microphone, t is an index indicating discrete time, m = 1, 2,..., M, and M is an integer of 3 or more.

音声信号変換装置100は、CPUと、RAMと、以下の処理を実行するためのプログラムを記録したROMを備えたコンピュータで構成され、機能的には次に示すように構成されている。   The audio signal conversion apparatus 100 is configured by a computer including a CPU, a RAM, and a ROM that stores a program for executing the following processing, and is functionally configured as follows.

音声信号変換装置100は、方向別収音部110と、変換処理部130とを含む。   The audio signal conversion apparatus 100 includes a direction-specific sound collection unit 110 and a conversion processing unit 130.

<方向別収音部110>
方向別収音部110は、M個の収音信号sm,tを入力とし、これらの値を用いて、前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号Ft,Bt,Lt,Rt,Ut,Dtを生成し(S110、図7参照、図中のFt,Bt,Lt,Rt,Ut,Dtは強調信号Ft,Bt,Lt,Rt,Ut,Dtにより強調されている音声信号変換装置100から見た方向を示す)、出力する。強調信号の生成方法は既存のいかなる技術を用いてもよく、利用環境等に合わせて最適なものを適宜選択すればよい。例えば、一例としてビームフォーミングとウィナーフィルタを用いた雑音抑圧方式がある。本方式の詳細については多数述べられているので、詳細はここには記載しない。例えば、特開2016−131343号公報記載の方法を用いることができる。
<Sound Pickup Unit 110 by Direction>
The direction-specific sound pickup unit 110 receives M sound pickup signals sm , t , and uses these values to emphasize six enhancement signals F t that emphasize sounds coming from six directions, front, rear, left, right, and top, respectively. , B t , L t , R t , U t , D t are generated (S110, see FIG. 7, F t , B t , L t , R t , U t , D t in the figure are the enhancement signals F t , B t , L t , R t , U t , and D t indicate the directions seen from the audio signal converter 100), and output. Any existing technique may be used as the method for generating the emphasis signal, and an optimum method may be selected as appropriate in accordance with the use environment. For example, there is a noise suppression method using beam forming and a Wiener filter as an example. Since many details of this scheme have been described, details are not described here. For example, a method described in JP-A-2016-131343 can be used.

図8はビームフォーミングとウィナーフィルタを用いた雑音抑圧方式を採用する場合の方向別収音部110の機能ブロック図を、図9はその処理フローの例を示す。   FIG. 8 is a functional block diagram of the direction-specific sound collection unit 110 when a noise suppression method using beam forming and a Wiener filter is adopted, and FIG. 9 shows an example of the processing flow thereof.

例えば、方向別収音部110は、ビームフォーミング部111とウィーナーフィルタ部113とを含む。   For example, the direction-specific sound collecting unit 110 includes a beam forming unit 111 and a Wiener filter unit 113.

ビームフォーミング部111は、M個の収音信号sm,tを入力とし、これらの値を用いて、前後左右上下の6つの方向から到来する音をそれぞれ強調した音声信号である6つのビームフォーミング出力値F't,B't,L't,R't,U't,D'tを求め(S111)、出力する。 The beam forming unit 111 receives M sound pickup signals sm , t , and uses these values to generate six beam forming signals that are sound signals that emphasize sounds coming from six directions, front, rear, left, right, and up, and down. Output values F ′ t , B ′ t , L ′ t , R ′ t , U ′ t , and D ′ t are obtained (S111) and output.

ウィーナーフィルタ部113は、ウィーナーフィルタを用いて、6つのビームフォーミング出力値F't,B't,L't,R't,U't,D'tからそれぞれ雑音を抑圧した6つの信号を強調信号Ft,Bt,Lt,Rt,Ut,Dtとして求め(S113)、出力する。 The Wiener filter unit 113 uses the Wiener filter to reduce the noise from the six beamforming output values F ′ t , B ′ t , L ′ t , R ′ t , U ′ t , and D ′ t , respectively. Are obtained as enhancement signals F t , B t , L t , R t , U t , D t (S113) and output.

<変換処理部130>
変換処理部130は、6つの強調信号Ft,Bt,Lt,Rt,Ut,Dtを入力とし、これらの値を用いて、無指向性の信号Wt, x軸方向の双指向性信号Xt, y軸方向の双指向性信号Yt, z軸方向の双指向性信号Ztを生成し(S130)、出力する。無指向性の信号Wt, x軸方向の双指向性信号Xt, y軸方向の双指向性信号Yt, z軸方向の双指向性信号Ztは次式により求める。
Wt=Ft+Bt+Lt+Rt+Ut+Dt
Xt=Ft-Bt
Yt=Lt-Rt
Zt=Ut-Dt
<Conversion processing unit 130>
The conversion processing unit 130 receives six enhancement signals F t , B t , L t , R t , U t , and D t and uses these values to determine the omnidirectional signal W t and x-axis direction. generating a bi-directional signal X t, bi-directional signals in the y-axis direction Y t, z-axis direction of the bi-directional signal Z t (S130), and outputs. The omnidirectional signal W t , the x-axis direction bi-directional signal X t , the y-axis direction bi-directional signal Y t , and the z-axis direction bi-directional signal Z t are obtained by the following equations.
W t = F t + B t + L t + R t + U t + D t
X t = F t -B t
Y t = L t -R t
Z t = U t -D t

<効果>
以上の構成により、位置関係が制限されていない複数のマイクロホンの収音信号を利用して、擬似的にアンビソニックス形式の音声信号Wt,Xt,Yt,Ztを生成することができる。生成した信号Wt,Xt,Yt,Ztは、Bフォーマット信号と同様に扱うことができる。例えば、YouTubeにアップロードすることができる。また、独自プレーヤーで再生するのであれば、マルチチャネルオーディオ符号化し、頭部運動に応じた座標系回転を考慮して、バイノーラル合成を行い、独自プレーヤーに対応するステレオチャネルの音声信号を生成してもよい。
<Effect>
With the above configuration, it is possible to generate ambisonics-type audio signals W t , X t , Y t , Z t by using the collected sound signals of a plurality of microphones whose positional relationships are not limited. . The generated signals W t , X t , Y t , Z t can be handled in the same manner as the B format signal. For example, you can upload to YouTube. Also, if you want to play on your own player, encode multi-channel audio, perform binaural synthesis considering the coordinate system rotation according to head movement, and generate a stereo channel audio signal corresponding to your own player. Also good.

本実施形態の場合、複数のマイクロホンの位置関係が制限されないため、カメラに埋め込んだマイクを用いて疑似的にアンビソニックスBフォーマット形式の音を生成できる。それにより、カメラにマイクが映り込んでしまう問題やポータビリティを損なう問題を解決した。   In the case of the present embodiment, the positional relationship between a plurality of microphones is not limited, so that a pseudo-ambisonics B format sound can be generated using a microphone embedded in the camera. As a result, the problem that the microphone is reflected on the camera and the problem that portability is impaired are solved.

さらに、各マイクロホンの感度を揃えずとも、前後左右上下の6つの方向から到来する音に対する感度が揃うように調整することができる。そのため、多くのマイクロホンを製造し、その中から感度が揃っている4つのマイクロホンを選別するという作業を行う必要はなく、製造コストを抑えることができる。   Furthermore, it is possible to make adjustments so that the sensitivity to sounds coming from six directions, front, rear, left, right, up and down is uniform without matching the sensitivity of each microphone. Therefore, it is not necessary to manufacture a large number of microphones and select four microphones having the same sensitivity among them, and the manufacturing cost can be reduced.

また、反射/回折を考慮した収音処理をしているため、アンビソニックスマイクロホンアレイをカメラに直接埋め込むような実装ができる。   In addition, since sound collection processing is performed in consideration of reflection / diffraction, an ambisonic microphone array can be mounted directly in the camera.

本実施形態では、M個の収音信号sm,tをBフォーマット信号に直接変換するのではなく、ビームフォーミングとウィナーフィルタを用いた雑音抑圧方式を利用して一度前後左右上下方向から到来する音を強調した強調信号を求め、強調信号からBフォーマット信号を求める。なお、M個の収音信号sm,tをBフォーマット信号に直接変換した場合、マイクロホン数Mが少なかったり(例えばMが6以下とか)、マイクロホンの周囲に反射・回折を生じさせる構造物(特に非対称性の構造物)が設置されているとき、Bフォーマットを構成する双指向性に相当する収音を実現することが難しい。一方、マイクロホン数Mが少なかったり、マイクロホンの周囲に構造物が設置されているときであっても、単一の方向から到来した音だけを強調しその周囲雑音を抑圧するという処理であれば、マイクロホンアレイ処理で比較的容易に実現することができる。本実施形態では、一度前後左右上下方向から到来する音を強調した強調信号を求め、強調信号からBフォーマット信号を求めるため、マイクロホン数Mや、マイクロホンの周囲の構造物の有無に制限されることなく、マイクロホンアレイ処理で比較的容易に、擬似的にアンビソニックス形式の音声信号を生成することができる。 In this embodiment, the M collected sound signals sm , t are not directly converted into B format signals, but once from the front, back, left, right, up and down directions using a noise suppression method using beam forming and a Wiener filter. An enhancement signal that emphasizes the sound is obtained, and a B format signal is obtained from the enhancement signal. In addition, when M collected sound signals sm , t are directly converted into B format signals, the number of microphones M is small (for example, M is 6 or less), and a structure that causes reflection / diffraction around the microphone ( In particular, when an asymmetric structure) is installed, it is difficult to realize sound collection corresponding to the bidirectionality constituting the B format. On the other hand, even when the number of microphones M is small or when a structure is installed around the microphone, if it is a process that emphasizes only the sound coming from a single direction and suppresses the ambient noise, It can be realized relatively easily by microphone array processing. In the present embodiment, in order to obtain an emphasis signal that emphasizes sounds coming from the front, back, left, right, up and down directions once, and to obtain a B format signal from the emphasis signal, it is limited to the number of microphones M and the presence of structures around the microphone In addition, it is possible to generate an ambisonics-type audio signal in a pseudo manner relatively easily by the microphone array processing.

本実施形態の音声信号変換装置をマイクロホンを内蔵した全方位カメラ内に組み込んでもよいし、マイクロホンを内蔵した全方位カメラの出力信号に含まれるM個の収音信号sm,tを別体の音声信号変換装置の入力としてもよい。 The audio signal conversion apparatus of this embodiment may be incorporated in an omnidirectional camera with a built-in microphone, or M sound pickup signals sm , t included in the output signal of the omnidirectional camera with a built-in microphone are separated. It is good also as an input of an audio signal converter.

<変形例>
本実施形態では、M個の収音信号sm,tを入力としているが、6つの強調信号Ft,Bt,Lt,Rt,Ut,Dtを入力としてもよい。その場合、方向別収音部110を備えなくともよい。例えば、別装置として構成した音声強調装置(例えば国際公開第2012/086834号等参照)の出力値を音声信号変換装置100の入力としてもよい。また、例えば、単一指向性の6つのマイクロホンを前後左右上下の6つの方向から到来する音をそれぞれ収音するように設置し、その出力値を音声信号変換装置100の入力としてもよい。ただし、本実施形態のようにビームフォーミングとウィナーフィルタを用いた雑音抑圧方式を利用したほうが、干渉性雑音を低減し、周囲の雑音を効果的に低減できるため、アンビソニックスマイクロホンアレイ92で収音した信号からBフォーマット信号を合成したときと同じような音を生成することができる。
<Modification>
In this embodiment, M-number of the collected signal s m, although as input t, 6 one enhancement signal F t, B t, L t , R t, U t, may enter D t. In that case, the direction-specific sound collecting unit 110 may not be provided. For example, the output value of a speech enhancement device (see, for example, International Publication No. 2012/088684) configured as a separate device may be used as the input of the speech signal conversion device 100. Further, for example, six unidirectional microphones may be installed so as to pick up sounds arriving from six directions, front, rear, left, right, and up, respectively, and the output values thereof may be input to the audio signal converter 100. However, using the noise suppression method using the beam forming and the Wiener filter as in this embodiment can reduce the coherent noise and effectively reduce the ambient noise. Therefore, the ambisonics microphone array 92 collects sound. It is possible to generate a sound similar to that obtained when a B format signal is synthesized from the processed signal.

音声信号変換装置100は、方向別音量調整部120を含んでもよい(図5中、破線で示す)。方向別音量調整部120は、6つの強調信号Ft,Bt,Lt,Rt,Ut,Dtを入力とし、その音量を個別に調整し(S120、図6中、破線で示す)、音量調整後の強調信号Ft,Bt,Lt,Rt,Ut,Dtを出力する。各領域に掛け合わせるボリューム(0以上の数)をαF, αB, αL, αR, αU, αD と記述すると以下のように調整作業を行うことができる。
Ft←αF・Ft
Bt←αB・Bt
Lt←αL・Lt
Rt←αR・Rt
Ut←αU・Ut
Dt←αD・Dt
方向別音量調整部120を設けることで、前・後・左・右・上・下の各領域の音量を制御できる。例えば、正面方向にいる人の声をもう少し下げて収音したい、特定の方向にいる人の声が小さい場合に音量を上げるといった調整作業を行うことができる。こういった方向別に音量を調整する機能は従来のアンビソニックス収音では実現できない。なぜなら、基本的に場をそのまま再現しようという発想で原理が組まれているからである。言い換えると、従来技術では、収音した後に特定のエリアの音のボリューム調整を原理上、行えないという問題がある。本変形例では、収音した後に、特定のエリアから到来する音のボリュームを調整することが可能となる。
The audio signal conversion apparatus 100 may include a direction-specific volume adjustment unit 120 (indicated by a broken line in FIG. 5). The direction-specific volume adjustment unit 120 receives six enhancement signals F t , B t , L t , R t , U t , and D t and individually adjusts the volume (S120, indicated by a broken line in FIG. 6). ), The enhanced signals F t , B t , L t , R t , U t and D t after the volume adjustment are output. If the volume (number of 0 or more) multiplied by each region is described as α F , α B , α L , α R , α U , α D , the adjustment work can be performed as follows.
F t ← α F・ F t
B t ← α B・ B t
L t ← α L・ L t
R t ← α R・ R t
U t ← α U・ U t
D t ← α D・ D t
By providing the direction-specific volume adjustment unit 120, the volume of each of the front, rear, left, right, upper, and lower areas can be controlled. For example, it is possible to perform adjustment work such as lowering the voice of a person in the front direction to pick up sound a little, or increasing the volume when the voice of a person in a specific direction is low. Such a function for adjusting the volume in each direction cannot be realized by the conventional ambisonics sound pickup. This is because the principle is based on the idea of reproducing the field as it is. In other words, the conventional technique has a problem that, in principle, volume adjustment of sound in a specific area cannot be performed after sound collection. In this modification, it is possible to adjust the volume of sound coming from a specific area after collecting sound.

<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<Other variations>
The present invention is not limited to the above-described embodiments and modifications. For example, the various processes described above are not only executed in time series according to the description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. In addition, it can change suitably in the range which does not deviate from the meaning of this invention.

<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
<Program and recording medium>
In addition, various processing functions in each device described in the above embodiments and modifications may be realized by a computer. In that case, the processing contents of the functions that each device should have are described by a program. Then, by executing this program on a computer, various processing functions in each of the above devices are realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its storage unit. When executing the process, this computer reads the program stored in its own storage unit and executes the process according to the read program. As another embodiment of this program, a computer may read a program directly from a portable recording medium and execute processing according to the program. Further, each time a program is transferred from the server computer to the computer, processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program includes information provided for processing by the electronic computer and equivalent to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In addition, although each device is configured by executing a predetermined program on a computer, at least a part of these processing contents may be realized by hardware.

Claims (7)

前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号を用いて、無指向性の信号W, x軸方向の双指向性信号X, y軸方向の双指向性信号Y, z軸方向の双指向性信号Zを生成する変換処理部を含み、
前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号をそれぞれF,B,L,R,U,Dとし、前記変換処理部は、
W=F+B+L+R+U+D
X=F-B
Y=L-R
Z=U-D
により、前記信号W, 前記双指向性信号X, 前記双指向性信号Y, 前記双指向性信号Zを生成する、
音声信号変換装置。
Using six emphasis signals emphasizing the sound coming from six directions, front, rear, left, right, top, bottom, omnidirectional signal W, x-axis direction bi-directional signal X, y-axis direction bi-directional signal Y, including a conversion processing unit for generating a z-directional bi-directional signal Z;
The six enhancement signals that emphasize the sounds coming from the six directions of front, rear, left, right, top and bottom are F, B, L, R, U, D, respectively,
W = F + B + L + R + U + D
X = FB
Y = LR
Z = UD
To generate the signal W, the bidirectional signal X, the bidirectional signal Y, and the bidirectional signal Z.
Audio signal converter.
請求項1の音声信号変換装置であって、
Mを3以上の整数の何れかとし、M本のマイクロホンで収音した収音信号を入力とし、M個の前記収音信号を用いて、6つの前記強調信号を生成する方向別収音部を含み、
前記方向別収音部は、
M個の前記収音信号を用いて、前後左右上下の6つの方向から到来する音をそれぞれ強調した音声信号である6つのビームフォーミング出力値を求めるビームフォーミング部と、
ウィーナーフィルタを用いて、6つの前記ビームフォーミング出力値からそれぞれ雑音を抑圧した6つの信号をそれぞれ6つの前記強調信号として求めるウィーナーフィルタ部とを含む、
音声信号変換装置。
The audio signal converter according to claim 1,
M is any integer greater than or equal to 3, and the sound collection signals collected by M microphones are input, and the sound collection unit for each direction that generates the six enhancement signals using the M sound collection signals. Including
The direction-specific sound collection unit is:
A beamforming unit that obtains six beamforming output values that are sound signals that emphasize sounds coming from six directions, front, back, left, right, up, and down, using the M collected sound signals,
Using a Wiener filter, including a Wiener filter unit that obtains six signals, each of which suppresses noise from each of the six beamforming output values, as the six enhancement signals,
Audio signal converter.
請求項1または請求項2の音声信号変換装置であって、
6つの前記強調信号の音量を個別に調整する方向別音量調整部とを含む、
音声信号変換装置。
The audio signal converter according to claim 1 or 2, wherein
A direction-specific volume adjustment unit that individually adjusts the volume of the six emphasized signals,
Audio signal converter.
前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号を用いて、無指向性の信号W, x軸方向の双指向性信号X, y軸方向の双指向性信号Y, z軸方向の双指向性信号Zを生成する変換処理ステップを含み、
前後左右上下の6つの方向から到来する音をそれぞれ強調した6つの強調信号をそれぞれF,B,L,R,U,Dとし、前記変換処理ステップは、
W=F+B+L+R+U+D
X=F-B
Y=L-R
Z=U-D
により、前記信号W, 前記双指向性信号X, 前記双指向性信号Y, 前記双指向性信号Zを生成する、
音声信号変換方法。
Using six emphasis signals emphasizing the sound coming from six directions, front, rear, left, right, top, bottom, omnidirectional signal W, x-axis direction bi-directional signal X, y-axis direction bi-directional signal Y, including a transformation processing step for generating a z-directional bi-directional signal Z;
The six enhancement signals that emphasize the sounds arriving from the six directions of front, rear, left, right, top, and bottom are F, B, L, R, U, and D, respectively, and the conversion processing step includes:
W = F + B + L + R + U + D
X = FB
Y = LR
Z = UD
To generate the signal W, the bidirectional signal X, the bidirectional signal Y, and the bidirectional signal Z.
Audio signal conversion method.
請求項4の音声信号変換方法であって、
Mを3以上の整数の何れかとし、M本のマイクロホンで収音した収音信号を入力とし、M個の前記収音信号を用いて、6つの前記強調信号を生成する方向別収音ステップを含み、
前記方向別収音ステップは、
M個の前記収音信号を用いて、前後左右上下の6つの方向から到来する音をそれぞれ強調した音声信号である6つのビームフォーミング出力値を求めるビームフォーミングステップと、
ウィーナーフィルタを用いて、6つの前記ビームフォーミング出力値からそれぞれ雑音を抑圧した6つの信号をそれぞれ6つの前記強調信号として求めるウィーナーフィルタステップとを含む、
音声信号変換方法。
The audio signal conversion method according to claim 4,
Sound collecting step for each direction in which M is one of an integer of 3 or more, and the sound pickup signals picked up by M microphones are input, and the six sound enhancement signals are generated using the M sound pickup signals. Including
The direction-specific sound collection step includes:
A beamforming step for obtaining six beamforming output values, which are audio signals that emphasize sounds coming from six directions, front, back, left, right, up, and down, using the M collected sound signals,
Using a Wiener filter, a Wiener filter step of obtaining six signals, each of which suppresses noise from each of the six beamforming output values, as the six enhancement signals,
Audio signal conversion method.
請求項4または請求項5の音声信号変換方法であって、
6つの前記強調信号の音量を個別に調整する方向別音量調整ステップとを含む、
音声信号変換方法。
The audio signal conversion method according to claim 4 or 5, wherein
A direction-specific volume adjustment step for individually adjusting the volume of the six emphasized signals,
Audio signal conversion method.
請求項1から請求項3の何れかの音声信号変換装置としてコンピュータを機能させるためのプログラム。   The program for functioning a computer as an audio | voice signal converter in any one of Claims 1-3.
JP2017009298A 2017-01-23 2017-01-23 Audio signal conversion device, its method, and program Active JP6666276B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017009298A JP6666276B2 (en) 2017-01-23 2017-01-23 Audio signal conversion device, its method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017009298A JP6666276B2 (en) 2017-01-23 2017-01-23 Audio signal conversion device, its method, and program

Publications (2)

Publication Number Publication Date
JP2018120007A true JP2018120007A (en) 2018-08-02
JP6666276B2 JP6666276B2 (en) 2020-03-13

Family

ID=63045170

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017009298A Active JP6666276B2 (en) 2017-01-23 2017-01-23 Audio signal conversion device, its method, and program

Country Status (1)

Country Link
JP (1) JP6666276B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020148763A (en) * 2019-03-15 2020-09-17 株式会社日立製作所 Omni-directional audible noise source localization apparatus
JP2022007824A (en) * 2020-06-25 2022-01-13 蔵人 小方 Digital camera focusing sound in front, back, left, right, and up and down six directions of digital camera imaging environment, starting accumulating sound source information from operation stage, and registering environmental sound within time specified by shutter operation with video in sd memory
US11245981B2 (en) 2017-11-15 2022-02-08 Mitsubishi Electric Corporation Sound collection and playback apparatus, and recording medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007005969A (en) * 2005-06-22 2007-01-11 Yamaha Corp Microphone array device
JP2008543144A (en) * 2005-05-27 2008-11-27 オイ・マルティン・カントラ・コンサルティング・リミテッド Acoustic signal apparatus, system, and method
JP2013524601A (en) * 2010-03-31 2013-06-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Apparatus and method for measuring multiple speakers and microphone arrays
JP2014502439A (en) * 2010-10-25 2014-01-30 クゥアルコム・インコーポレイテッド System, method, apparatus, and computer readable medium for directional high sensitivity recording control

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008543144A (en) * 2005-05-27 2008-11-27 オイ・マルティン・カントラ・コンサルティング・リミテッド Acoustic signal apparatus, system, and method
JP2007005969A (en) * 2005-06-22 2007-01-11 Yamaha Corp Microphone array device
JP2013524601A (en) * 2010-03-31 2013-06-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Apparatus and method for measuring multiple speakers and microphone arrays
JP2014502439A (en) * 2010-10-25 2014-01-30 クゥアルコム・インコーポレイテッド System, method, apparatus, and computer readable medium for directional high sensitivity recording control

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鹿野 清宏, 音声・音情報のディジタル信号処理(ディジタル信号処理シリーズ5), vol. 第1版, JPN6019049181, 10 November 1997 (1997-11-10), pages 147 - 148, ISSN: 0004175516 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11245981B2 (en) 2017-11-15 2022-02-08 Mitsubishi Electric Corporation Sound collection and playback apparatus, and recording medium
JP2020148763A (en) * 2019-03-15 2020-09-17 株式会社日立製作所 Omni-directional audible noise source localization apparatus
CN111693940A (en) * 2019-03-15 2020-09-22 株式会社日立制作所 Omnidirectional audible noise source positioning device
JP2022007824A (en) * 2020-06-25 2022-01-13 蔵人 小方 Digital camera focusing sound in front, back, left, right, and up and down six directions of digital camera imaging environment, starting accumulating sound source information from operation stage, and registering environmental sound within time specified by shutter operation with video in sd memory

Also Published As

Publication number Publication date
JP6666276B2 (en) 2020-03-13

Similar Documents

Publication Publication Date Title
US11838707B2 (en) Capturing sound
CN109891503B (en) Acoustic scene playback method and device
CN109906616A (en) For determining the method, system and equipment of one or more audio representations of one or more audio-sources
US10477310B2 (en) Ambisonic signal generation for microphone arrays
CN110537221A (en) Two stages audio for space audio processing focuses
CN109314832A (en) Audio signal processing method and device
CN117501362B (en) Audio rendering system, method and electronic device
CN116569255A (en) Vector Field Interpolation of Multiple Distributed Flows for Six Degrees of Freedom Applications
Nicol Sound field
CN117546236A (en) Audio rendering system, method and electronic equipment
JP6666276B2 (en) Audio signal conversion device, its method, and program
JP2018191127A (en) Signal generation apparatus, signal generation method and program
JP2013009112A (en) Sound acquisition and reproduction device, program and sound acquisition and reproduction method
WO2023085186A1 (en) Information processing device, information processing method, and information processing program
JP2009218655A (en) Acoustic signal conversion device, method thereof, and program thereof
JP6569945B2 (en) Binaural sound generator, microphone array, binaural sound generation method, program
JP2008118559A (en) 3D sound field reproduction device
JP7558467B2 (en) SOUND SPACE CONSTRUCTION DEVICE, SOUND SPACE CONSTRUCTION SYSTEM, PROGRAM, AND SOUND SPACE CONSTRUCTION METHOD
JP7493411B2 (en) Binaural playback device and program
JP7260821B2 (en) Signal processing device, signal processing method and signal processing program
JP6027873B2 (en) Impulse response generation apparatus, impulse response generation system, and impulse response generation program
Favilla et al. Acoustic sound localisation: visualisations of a 1st order ambisonic microphone array
TW202508310A (en) Information processing device, information processing method, and program
WO2025218311A9 (en) Acoustic scene playback method and apparatus
WO2025218310A9 (en) Acoustic scene playback method and apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200220

R150 Certificate of patent or registration of utility model

Ref document number: 6666276

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350