WO2014044948A1 - Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs - Google Patents
Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs Download PDFInfo
- Publication number
- WO2014044948A1 WO2014044948A1 PCT/FR2013/052047 FR2013052047W WO2014044948A1 WO 2014044948 A1 WO2014044948 A1 WO 2014044948A1 FR 2013052047 W FR2013052047 W FR 2013052047W WO 2014044948 A1 WO2014044948 A1 WO 2014044948A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- reflections
- impulse responses
- amplitude
- threshold
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Definitions
- the present invention relates to a method and a device for calibrating a sound reproduction system comprising a plurality of loudspeakers or sound reproduction elements. Calibration makes it possible to optimize the quality of listening of the rendering system which constitutes all the elements of reproduction, including the device of the loudspeakers and the listening room.
- the systems of restitution particularly concerned are the sound reproduction systems of the multichannel type (5.1, 7.1, 10.2, 22.2, etc.) or ambisonic type (Ambisonics in English or Higher Order Ambisonics (HOA)).
- the current acoustical calibration devices of the listening place are based on a general method of the "multichannel equalization" type in which the impulse responses of each loudspeaker of the listening system are measured using one or more microphones at one or more points of the listening location and frequency equalization filtering is performed on each speaker, independently, inverting all or part of the measured impulse response for the speaker concerned.
- the inversion is intended to correct the speaker response so that it is as close as possible to a "target" curve generally defined in the frequency domain to improve the rendering of the timbre of the sound sources.
- This type of calibration or correction focuses on the correction of the frequency aspect of the response of the playback system of the listening place without exploiting the temporal information such as reflections phenomena and in particular the first reflections of the sound signals.
- the analysis of the impulse responses carried out in the existing calibration methods is of the monophonic type, that is to say that it also does not take into account the spatial information of the reflections like the direction of incidence. .
- the present invention improves the situation.
- the method is such that it comprises the following steps:
- the effect of the first reflections of the sound waves diffused by the playback system on the auditory perception of the direct waves is evaluated and taken into account to adapt the treatment applied to the channel channels muiti channel according to the specific perceptual effect associated with each reflection.
- the filtering of the channels of the muiti channel signal thus takes into account exclusively the reflections that have an impact on the auditory perception of the direct waves.
- the perceptibility threshold is determined according to characteristics of the direct wave and the first reflections of the predetermined audio signal.
- the threshold of perceptibility can be obtained from characteristics determined by the step of analyzing the multidirectional impulse responses of the loudspeakers.
- the threshold of perceptibility is determined according to the direction of incidence of the direct wave and / or its amplitude, and the directions of incidence of the first reflections and / or their arrival times with respect to Direct tondon.
- the effect of a reflection on the perception of the direct wave generally depends on five parameters in total; on the one hand it depends on two characteristics of the direct wave: its amplitude and its direction; on the other hand it depends on three characteristics of the reflection: its amplitude, its moment of arrival and its incidence.
- the perceptual effect of the reflection by setting the missing characteristic to an arbitrary value, for example by taking the value corresponding to the case the more unfavorable in order to increase the perceptibility.
- the arrival time characteristic of the reflection it is possible to set a value to the arrival time characteristic of the reflection to determine a value of the perceptibility threshold only in relation to the value from the direction, even if only the arrival time information of the reflection is known, one can set the direction value and determine the threshold of perceptibility only according to the value of the time of arrival.
- the value of the threshold can be determined according to these two characteristics.
- the determination of the filtering matrix comprises the steps of:
- the error signal thus determined allows to take into account in the calculation of the filter matrix, only the reflections that have an impact on the auditory perception of the direct wave. Indeed, only the reflections that are not perceptible are removed for the determination of the error signal.
- the predetermined target response signal corresponds to the response of the direct wave alone without any reflection.
- the predetermined target response signal corresponds to the response of a direct wave associated with reflections representative of a predetermined listening location.
- the reference response can then be deliberately chosen as a desired listening place in which the sound is at a desired quality.
- the predetermined target response signal corresponds to the response of a direct wave associated with reflections representative of a different set of restitution.
- the reference response is here chosen according to a chosen reference restitution system, in which the number and the position of the loudspeakers may be different from the restitution system that is the object of the correction.
- the present invention also provides a device for calibrating a sound reproduction assembly of a multi-channel sound signal comprising a plurality of loudspeakers.
- This device is such that it comprises:
- a module for comparing the amplitude of each of the reflections with a determined perceptibility threshold and for identifying non-perceptible reflections for which the amplitude is below the determined threshold;
- This device has the same advantages as the method described above, which it implements.
- the invention also relates to an audio decoder comprising a calibration device as described.
- It relates to a computer program comprising code instructions for implementing the steps of the calibration method as described, when these instructions are executed by a processor.
- the invention relates to a storage medium, readable by a processor, integrated or not to the calibration device, optionally removable, storing a computer program implementing a calibration method as described above.
- FIG. 1 represents a sound reproduction system and a calibration device of the reproduction system according to one embodiment of the invention
- FIG. 2 represents in flowchart form the main steps of a calibration method according to one embodiment of the invention
- Figure 3a is a representation of a spherical landmark
- FIG. 3b illustrates the spherical harmonic components in the case of an ambisonic spatial representation of order 3;
- FIG. 4 represents an example of a table of values in dB that the perceptibility threshold used in the calibration method according to one embodiment of the invention can take, for a direct 60 ° incidence angle sound, in function of the angle of incidence (expressed in degrees) of the reflection and the arrival time (expressed in ms) of this reflection with respect to the instant t0 of arrival of the direct wave; the perceptibility threshold is defined as the level (in dB) of the reflection from which the level (in dB) of the direct wave is subtracted;
- FIG. 5 proposes another illustration of the values taken by the threshold of perceptibility: the threshold is this time represented as a function of the incidence of reflection, and this for different directions of the direct wave; in all cases, the delay of the reflection with respect to the direct wave is fixed and is worth 15 ms;
- FIG. 6 represents an example of an impulse response of a loudspeaker of a rendering system; the threshold of perceptibility associated with each reflection is also reproduced by a dotted line;
- FIG. 7 represents an example of a hardware embodiment of a calibration device according to one embodiment of the invention.
- FIG. 1 thus illustrates an exemplary sound reproduction system in which the calibration method according to one embodiment of the invention is implemented.
- This system comprises a processing device 100 comprising a calibration device E according to an embodiment of the invention driving a reproduction assembly 180 which comprises a plurality of rendering elements (loudspeakers, loudspeakers, ...) represented here by speakers HPi, HP 2 , HP 3 , HP, and HP N.
- rendering elements represented here by speakers HPi, HP 2 , HP 3 , HP, and HP N.
- These speakers are arranged in a listening room in which a microphone or set of microphones MA is also provided.
- a processing device 100 which can be a decoder such as a "set top box” type set-top box for playing or broadcasting audio or video contents, a processing server capable of handling audio and video contents and retransmit them to the rendering assembly, a conference bridge capable of processing the audio signals of different conference locations or any multi-channel audio signal processing device.
- a decoder such as a "set top box” type set-top box for playing or broadcasting audio or video contents
- a processing server capable of handling audio and video contents and retransmit them to the rendering assembly
- a conference bridge capable of processing the audio signals of different conference locations or any multi-channel audio signal processing device.
- the processing device 100 comprises a calibration device E according to one embodiment of the invention and a filtering matrix 170 composed of a plurality of processing filters which are determined by the calibration device according to a calibration method such as illustrated later with reference to Figure 2.
- This filtering matrix receives as input a multi-channel signal Si and outputs the signals SC 1 , SC 2 , SQ, SC N able to be restored by the reproduction unit 180.
- the calibration device E comprises a reception and transmission module 110 capable of transmitting, on the one hand, reference audio signals (Sref) to the various speakers of the reproduction assembly 180 and to receiving by the microphone or the microphone.
- set of microphones MA multidirectional impulse responses (RIS) of these different speakers corresponding to the diffusion of these reference signals.
- a multidirectional impulse response contains the temporal information and the spatial information relating to all the sound waves induced by the speaker considered in the reproduction room.
- the reference signals are for example signals whose frequency increases logarithmically with time, these signals being called in English “chirps” or “sweeps” logarithmic.
- the microphone capable of measuring the multidirectional impulse responses of the loudspeakers is an HOA type microphone placed at a point of the listening location, for example in the center of the speakers of the restitution ensemble.
- This microphone will receive, for each speaker rendering a reference audio signal, the sound restored in several directions.
- the microphone HOA consists of a plurality of microphones.
- the spatial information of the different sounds picked up can be extracted.
- this type of microphone one can refer to the document entitled "Study and realization of advanced spatial encoding tools for sound spatialization technique Higher Order Ambisonics: 3D microphone and distance control" from S. Moreau quoted at Univ. of Maine, PhD thesis, 2006.
- the microphone HOA then retrieves the multidirectional impulse responses of each of the speakers to transmit them to the calibration device or to store them in memory in a local or remote memory space.
- the analysis module 120 of the device E performs a joint analysis of the impulse responses obtained, which makes it possible to obtain these characteristics and in particular the characteristics of the first reflections of the restored signals.
- multidirectional impulse responses are obtained in a spatio-temporal representation where the spatial information is described on the basis of spherical harmonics and makes it possible to identify the directions of incidence. different sound components.
- the analysis of the impulse responses is made on a predetermined time scale, including the moments of the first reflections.
- this time window has a length of between 50 and 100 ms, which corresponds to the time scale of the arrival times of the first reflections.
- the embodiment thus described is adapted to the field of representation of spherical harmonics, but it is quite possible to carry out these same steps in a representation domain WFS (for "Wave Field Synthesis" in English) or in the field of plane waves.
- WFS for "Wave Field Synthesis” in English
- the means for capturing the signals reproduced by the loudspeakers will have to be adapted to these areas of representation to obtain multidirectional impulse responses, without this being outside the scope of the invention.
- the calibration device E also comprises a module 130 for comparing and identifying non-perceptible reflections.
- This module implements a step of comparing the amplitudes of the reflections, obtained by the analysis module 120, at a predetermined threshold of perceptibility Se.
- This perceptibility threshold is determined by the module 140 from a predefined table of values and stored in a memory space.
- the amplitude of a reflection is below the threshold of perceptibility as defined, it means that this reflection has no significant impact on the auditory perception of the direct wave of the restored signal.
- a step of identification of these "non-perceptible" reflections is then implemented by the module 130. These identified reflections allow to implement by the module 150 a step of determining perceptual impulse responses which are deduced from the impulse responses obtained by the module 110 by deleting the reflections judged as not perceptible.
- FIG. 2 illustrates in flowchart form the main steps implemented in one embodiment of the calibration method according to the invention.
- step E201 the multidirectional impulse responses of the various loudspeakers of the reproduction assembly as described with reference to FIG. 1, are obtained. They are obtained by the calibration device, either by simple reading in memory if these were saved in advance, either by receiving the microphone or a set of microphones that made the measurement.
- a step E202 for analyzing the multidirectional impulse responses thus obtained is then implemented.
- This analysis is carried out in a field of spatio-temporal representation.
- Spatial information can for example be described in the field of representation of spherical harmonics.
- each point has, for spherical coordinates, a distance r with respect to the origin 0, an angle ⁇ of azimuth or orientation in the horizontal plane and an angle ⁇ of elevation or d orientation in the vertical plane.
- an acoustic wave is perfectly described if one defines at any point at each instant t, the acoustic pressure noted p (r, ⁇ , ⁇ , t) whose time Fourier transform is noted P (r, ⁇ , ⁇ , where f denotes the time frequency.
- the spatial components are ambisonic components m a n which correspond to the decomposition of the acoustic pressure wave p on the basis of spherical harmonics.
- the ambisonic components B m a n are given by:
- the P mn (sin ⁇ ) are the associated Legendre functions.
- Decomposition on the basis of spherical harmonics can be considered as the dual transform between spatial coordinates and spatial frequencies.
- the components B n therefore define a spatial spectrum.
- a multidirectional impulse response is obtained which consists of K impulse responses corresponding to the K components of the chosen spatial representation.
- K impulse responses corresponding to the K components of the chosen spatial representation.
- the multidirectional impulse response associated with it is thus composed of K elementary responses H t) where the index I locates the index of the spatial component and t corresponds to the temporal sample.
- the vector of the K spatial components measured for the jth loudspeaker is denoted by h j (t):
- h j (t) [ ⁇ :) ... H j i (t) ... H jK (t)].
- the reproduction system comprises a total of N loudspeakers
- the set of multidirectional impulse responses measured for the N loudspeakers and the K spatial components defines a matrix H of size KxN, in which the jth column corresponds to the impulse response multidirectional associated with the jth speaker.
- the K spatial components contained in the vector h j (t) represent the spatial spectrum of the sounds picked up by the microphone.
- This inverse transformation is performed by reconstructing the pressure wave p (r, ⁇ , ⁇ , t) by linear combination of spherical harmonics, each harmonic being weighted by the amplitude of the component associated with it.
- the pressure wave p (r, ⁇ , ⁇ , t) can then be evaluated at any point of a sphere centered on the measurement point of the multidirectional impulse responses by reconstructing the point-by-point pressure wave by linear combination of spherical harmonics.
- This spatial decoding step is for example described in the document entitled “Jérians Daniel, Jean-Bernard Rault and Jean-Dominique Polack's” Ambisonics encoding of other audio formats for multiple listening conditions "in AES 105th Convention, September 1998.
- this transformation of the spatial frequencies (ambisonic components) to the spatial coordinates is carried out by multiplying, for each speaker and each time sample t, the vector hj (t) by a decoding matrix D.
- each column consists of the values of the spherical harmonic K for a given loudspeaker.
- the index i identifies the reflection index considered.
- the estimation accuracy of these characteristics therefore depends on the number P of virtual speakers used for this analysis.
- the first time sample for which a maximum is observed defines the instant of arrival of the direct wave.
- We also note the amplitude (A D ) and the incidence of the latter (C D (9 D , ⁇ D ) where 9 D and ⁇ respectively define the azimuth angle and the angle of elevation identifying the direction of the direct wave).
- the characteristics of the direct wave are determined on the one hand the characteristics of the direct wave as its amplitude A D (j), its arrival time on the microphone T D (j) or its direction of incidence C D (j); and on the other hand the characteristics of the reflections as their amplitudes A Ri (j), their arrival times on the microphone T Ri (j) or their directions bearings C Ri (j).
- the characteristics of the direct wave are determined on the one hand the characteristics of the direct wave as its amplitude A D (j), its arrival time on the microphone T D (j) or its direction of incidence C D (j); and on the other hand the characteristics of the reflections as their amplitudes A Ri (j), their arrival times on the microphone T Ri (j) or their directions bearings C Ri (j).
- the first reflections of a restored audio signal depend on the listening location in which the playback set is placed. In general, these first reflections appear in a time in a range of 50 to 100ms after the direct wave.
- the analysis time window of step E202 will, in a suitable embodiment, be between 50 and 100 ms.
- Step E203 compares the amplitudes obtained by the analysis step with a threshold of perceptibility Se of the reflections which has been previously defined and stored in memory.
- Step E204 makes it possible to recover the predefined threshold value as a function of characteristics of each reflection and of the associated direct wave, obtained at the analysis step E202.
- a first exemplary embodiment only the directional information of the reflections is known and recovered from the analysis step.
- the value of the arrival time characteristic of the reflection for example the most critical value (that which gives a maximum perceptibility) and we determine the value of the threshold of perceptibility only relative to the value of the direction.
- the direction value for example the most critical value (that which gives a maximum perceptibility)
- the perceptibility threshold according to the value of the instant of arrival.
- the value of the threshold can be determined, with a better accuracy, according to these two characteristics.
- an array of perceptibility threshold values is stored in memory.
- An example of such a table is illustrated with reference to FIG. 4.
- the threshold is defined as the relative level of reflection, that is, it represents the difference between the amplitude values (expressed in dB) of the reflection and the direct wave considered.
- This table of values is an example of threshold values defined from psycho-acoustic experiments carried out by considering different types of sound signal (speech, clicks, music, etc.), different angles of incidence and different arrival times of reflections and of the direct wave. A threshold of perceptibility of these reflections is defined according to these parameters.
- FIG. 5 shows different perceptibility threshold curves expressed in dB (which always corresponds to the relative threshold corresponding to the difference between the level of the reflection and that of the direct wave). These different curves correspond to different positions of the direct wave (azimuth of 0 ° for D1, 60 ° for D2, 90 ° for D3 and 150 ° for D4) and represent the thresholds of perceptibility as a function of the direction of reflection, this for a fixed arrival time (corresponding in this case to 15 ms).
- step E204 the threshold value corresponding to the characteristics obtained in the analysis step is recovered.
- This threshold value is compared with the magnitude value of each reflection in step E203.
- the value of the amplitude of reflection is referenced to that of the associated direct wave and expressed in dB:
- Step E203 thus makes it possible to identify all the reflections that have no impact on the perception of the direct wave. Step E203 therefore identifies all the reflections for which the amplitude is below the perceptibility threshold.
- FIG. 6 represents an exemplary impulse response, for a given direction, of one of the speakers of the reproduction assembly in comparison with the curve in dashed line representing the threshold of perceptibility (RMT for "Reflection Masked Threshold") obtained by the table described above with reference to Figure 4.
- the reflections whose level is below the threshold curve are thus identified. Note that in the case illustrated, the first reflections occurring in the first 15 ms are not noticeable.
- the modification consists in eliminating the non-perceptible reflections identified in step E203 in the impulse responses.
- this operation is carried out for example by a thresholding operation.
- the value of the perceptibility threshold S1 is deducted from the impulse response signal that was obtained in step E201.
- the processing can also be applied in the dual domain of space coordinates. In the following, we will describe the operation performed in the case of the spatial spectrum.
- the thresholding operation consists in comparing for each identified reflection its amplitude with the perceptibility threshold associated with its characteristics.
- the threshold Se (i) is determined according to its characteristics [T R (J), C Ri (j)] - This reflection is located at time t , given by:
- HP j i (t) designates the perceptual impulse response associated with H t).
- perceptual impulse responses retain only reflections that have a significant impact on the perception of the direct wave.
- step E206 This filtering matrix is then used to process the multi-channel audio signal before its sound reproduction by the system playback assembly.
- a possible embodiment comprises a step of determining an error signal defined by the difference between a predetermined target response signal of the set. of restitution and a reconstructed response signal from the perceptual impulse responses and a multichannel inversion step by minimizing the error signal thus determined.
- the error signal thus obtained therefore takes into account only the perceptible reflections since it is calculated from a reconstructed signal based on the perceptual impulse responses.
- the inversion can be performed by a gradient descent algorithm or its variants.
- An example of a possible inversion algorithm is that of the ISTA type (for "Iterative Shrinkage-Thresholding algorithm) as described in the document entitled” A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems "by Amir authors. Beck & Marc Teboulle, published in SIAM J. IMAGING SCIENCES, Vol. 2, No. 1, pp. 183-202 in 2009.
- the problem that arises in calculating the filters of the processing matrix is as follows.
- N loudspeakers that make up the actual reproduction system.
- the space of spatial representation is of dimension K.
- the spatial information is thus described by K coefficients.
- the objective is to reproduce with the system of N loudspeakers, a set of V signals defining the multichannel audio input signal.
- V signals are dedicated to an ideal reproduction system consisting of V loudspeakers.
- This ideal system defines the V target signals that one wishes to reproduce, and which therefore correspond to the responses of a fictitious system of V virtual speakers.
- the KxN dimension matrix comprising the impulse responses of the N elements of the rendering system in the spatial analysis domain
- T the matrix containing the V target responses defined in the spatial analysis domain, of dimension KxV
- Each matrix is a matrix of vectors, in the sense that the third dimension corresponds to the time scale.
- the purpose of the inversion operation is to find the elements of the matrix W.
- the resolution of this operation can be done in two stages. Firstly, the correction filters are calculated by correcting only the room effect of the place of restitution, that is to say we take into account the actual loudspeaker device, ie N high- speakers. In a second step, the arrangement of the loudspeakers is compensated for adapting the V signals to a restitution according to a non-ideal configuration of N loudspeakers. For this purpose, the V signals are distributed by matrixing on the N channels associated with the real reproduction system in order to emulate a system of V virtual speakers.
- the elements of the matrix H comprise the perceptual impulse responses as obtained in step E205.
- the target responses may vary depending on the expected sound restitution result.
- this target response corresponds to the impulse response given by the direct wave alone without any reflection. This amounts to removing all the room effect in the expected signal.
- the target response signal corresponds to the response of a direct wave associated with reflections representative of a predetermined listening location.
- a typical listening place with good listening quality may be desired (eg the Pleyel TM room listening room).
- the processing filters will be calculated to obtain a sound reproduction close to this listening quality.
- the target response signal corresponds to the response of a direct wave associated with reflections representative of a set of restitution different from that used to restore the resulting signal.
- a desired rendering system for example having more loudspeakers, is taken as a reference to obtain a restitution close to that which would have been obtained with such a system.
- the implementation of the described method makes it possible to obtain a better quality of listening during the restitution of a multi-channel audio signal by taking into account only the perceptible reflections of the signals by the restitution set in the listening place.
- FIG. 7 represents an example of a hardware embodiment of a calibration device according to the invention. This may be an integral part of an audio / video decoder, a processing server, a conference bridge or any other audio or video playback or broadcasting equipment.
- This type of device comprises a ⁇ processor cooperating with a memory block MEM having a storage and / or working memory.
- the memory block may advantageously comprise a computer program comprising code instructions for implementing the steps of the calibration method in the sense of the invention, when these instructions are executed by the processor, and in particular the steps of obtaining answers.
- multi-directional impulses of the speakers of the reproduction unit to the reproduction of a predetermined audio signal analysis of the multidirectional impulse responses obtained, in a domain of spatio-temporal representation, over at least one time window including the instants d arrival of the first reflections of the reproduced predetermined audio signal to determine a set of characteristics of the first reflections, of comparing the amplitude of each of the reflections with a threshold of predetermined perceptibility and identification of the non-perceptible reflections for which the amplitude is lower than the predetermined threshold, modifying the impulse responses obtained to obtain perceptual impulse responses, by eliminating the reflections identified as non-perceptible and determining a filtering matrix from the perceptual impulse responses for an application of this filtering matrix to the multi-channel audio signal before sound reproduction.
- FIG. 2 repeats the steps of an algorithm of such a computer program.
- the computer program can also be stored on a memory medium readable by a reader of the device or downloadable in the memory space thereof.
- the memory MEM stores a table of perceptibility threshold values as a function of the characteristics of the sound components constituted by the direct wave and the reflections used in the method according to one embodiment of the invention and, in general, all the necessary data. to the implementation of the method.
- Such a device comprises an input module I adapted to receive impulse responses of a reproduction set and an output module S adapted to transmit to a processing module, the calculated filters of a filtering matrix.
- the device thus described may also include the processing functions by the implementation of the processing matrix in the I reception of a multi-channel signal Si for outputting processed signals SCi suitable for be returned by the restitution ensemble.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Description
Calibration optimisée d'un système de restitution sonore multi haut-parleurs
La présente invention se rapporte à un procédé et un dispositif de calibration d'un système de restitution sonore comportant une pluralité de haut-parleurs ou d'éléments de restitution sonore. La calibration permet d'optimiser la qualité d'écoute du système de restitution que constitue l'ensemble des éléments de restitution, comprenant le dispositif des haut-parleurs et la salle d'écoute.
Les systèmes de restitution particulièrement concernés sont les systèmes de restitution sonore de type multicanal (5.1, 7.1, 10.2, 22.2, etc..) ou encore de type ambisonique (Ambisonics en anglais ou Higher Order Ambisonics (HOA)).
Pour permettre une restitution de bonne qualité des signaux multicanaux, les dispositifs actuels de calibration de l'acoustique du lieu d'écoute sont basés sur une méthode générale de type "égalisation multicanale" dans laquelle les réponses impulsionnelles de chaque haut-parleur du système de restitution sont mesurées à l'aide d'un ou plusieurs microphones en un ou plusieurs points du lieu d'écoute et un filtrage d'égalisation fréquentielle est effectué sur chaque haut-parleur, indépendamment, en inversant tout ou partie de la réponse impulsionnelle mesurée pour le haut-parleur concerné.
L'inversion vise à corriger la réponse du haut-parleur de façon à ce qu'elle se rapproche au mieux d'une courbe "cible" généralement définie dans le domaine fréquentiel pour améliorer le rendu du timbre des sources sonores.
Une telle méthode est par exemple décrite dans le document intitulé "Digital Filter Design for Inversion Problems in Sound Reproduction , des auteurs Kirkeby et Nelson, dans JAES 7/8, pp.583-595, 1999.
Ce type de calibration ou correction se focalise sur la correction de l'aspect fréquentiel de la réponse du système de restitution du lieu d'écoute sans exploiter les informations temporelles comme les phénomènes de réflexions et notamment les premières réflexions des signaux sonores.
Or les premières réflexions de signaux sonores ont un impact non négligeable sur la perception auditive du signal sonore restitué.
De plus, l'analyse des réponses impulsionnelles effectuée dans les méthodes de calibration existantes est de type monophonique, c'est-à-dire qu'elle ne prend pas non plus en compte l'information spatiale des réflexions comme la direction d'incidence.
L'absence de données temporelles et spatiales des réflexions, ne permet pas de prendre en compte le rôle des ces réflexions sur la perception de l'onde directe du signal sonore par un auditeur, et ainsi d'ajuster la correction en fonction de leur effet spécifique. La qualité du signal sonore restitué et perçue par l'auditeur n'est alors pas optimale.
Les techniques de l'état de l'art sont basées sur l'application de filtres de correction sur chacun des canaux du signal multi canal, c'est-à-dire que chaque haut-parleur du système
de restitution est corrigé individuellement sans tenir compte de l'ensemble du réseau de haut- parleurs.
Il existe donc un besoin d'optimisation du calibrage effectué sur les systèmes de restitution de signaux audio multicanaux pour d'une part prendre en compte les propriétés temporelles et spatiales des réflexions sonores qui impactent la perception auditive des ondes directes, afin d'ajuster l'effort de traitement selon la perceptibilité des dégradations et ainsi limiter les artefacts audibles susceptibles d'être générés par les traitements trop contraints effectués dans les méthodes de calibration existantes ; et d'autre part utiliser de façon conjointe les différents haut-parleurs, afin de répartir l'effort de traitement sur l'ensemble des haut-parleurs.
La présente invention vient améliorer la situation.
Elle propose à cet effet, un procédé de calibration d'un ensemble de restitution sonore d'un signal sonore muiti canal comportant une pluralité de haut-parleurs. Le procédé est tel qu'il comporte les étapes suivantes:
obtention de réponses impulsionnelles multidirectionnelles des haut-parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé;
analyse des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques des premières réflexions comprenant au moins l'amplitude;
comparaison de l'amplitude de chacune des réflexions à un seuil de perceptibilité déterminé et identification des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil déterminé;
modification des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles;
détermination d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio muiti canal avant restitution sonore.
Ainsi, dans la mise en œuvre de la correction du système de restitution audio muiti canal, l'effet des premières réflexions des ondes sonores diffusées par le système de restitution sur la perception auditive des ondes directes est évalué et pris en compte pour adapter le traitement appliqué aux canaux du signal muiti canal selon l'effet perceptif spécifique associé à chaque réflexion. Le filtrage des canaux du signal muiti canal prend ainsi en compte exclusivement les réflexions qui ont un impact sur la perception auditive des ondes directes.
Ceci permet donc d'augmenter la qualité du signal audio restitué.
De plus, comme il n'est pas nécessaire de prendre en compte les réflexions qui ne sont pas perceptibles, au sens ou leur amplitude est inférieure à un seuil de perceptibilité, les contraintes de la correction sont allégées du fait qu'elles prennent en compte les réponses impulsionnelles perceptives au lieu des réponses impulsionnelles brutes. De plus, certaines des réflexions non perceptibles qui sont éliminées des réponses impulsionnelles obtenues correspondent à des composantes de la réponse impulsionnelle qui sont justement à l'origine d'instabilités du traitement (notamment des composantes à phase non minimale). Avec les réponses impulsionnelles perceptives, on diminue ainsi les risques d'instabilités et d'artefacts qui peuvent être générés lors de traitements prenant en compte la totalité des réflexions.
Les différents modes particuliers de réalisation mentionnés ci-après peuvent être ajoutés indépendamment ou en combinaison les uns avec les autres, aux étapes du procédé défini ci-dessus.
Dans un mode de réalisation de l'invention, le seuil de perceptibilité est déterminé en fonction de caractéristiques de l'onde directe et des premières réflexions du signal audio prédéterminé.
L'influence des réflexions sur la perception de l'onde directe dépend en effet de plusieurs caractéristiques des réflexions. Avantageusement, le seuil de perceptibilité peut être obtenu à partir de caractéristiques déterminées par l'étape d'analyse des réponses impulsionnelles multidirectionnelles des haut-parleurs.
Plus particulièrement, le seuil de perceptibilité est déterminé en fonction de la direction d'incidence de l'onde directe et/ou de son amplitude, et des directions d'incidences des premières réflexions et/ou de leurs délais d'arrivée par rapport à Tonde directe.
L'effet d'une réflexion sur la perception de l'onde directe dépend généralement de cinq paramètres au total ; d'une part il dépend de deux caractéristiques de l'onde directe : son amplitude et sa direction; d'autre part il dépend de trois caractéristiques de la réflexion : son amplitude, son instant d'arrivée et son incidence.
Cependant, si l'une des caractéristiques de l'onde directe n'est pas connue, il est possible d'estimer la caractéristique manquante en fixant à une valeur arbitraire l'autre caractéristique.
De même, si l'une des informations concernant les réflexions n'est pas connue, on peut par exemple estimer l'effet perceptif de la réflexion en fixant à une valeur arbitraire la caractéristique manquante, en prenant par exemple la valeur correspondant au cas le plus défavorable afin de majorer la perceptibilité. Ainsi, dans le cas où seule l'information de direction des réflexions est connue, il est possible de fixer une valeur à la caractéristique d'instant d'arrivée de la réflexion pour déterminer une valeur du seuil de perceptibilité uniquement par rapport à la valeur de la direction, de même si seule l'information d'instant d'arrivée de la réflexion est connue, on peut fixer la valeur de direction et déterminer le seuil de perceptibilité uniquement selon la valeur de l'instant d'arrivée. Enfin, dans le cas où les
deux caractéristiques sont connues, la valeur du seuil peut être déterminée en fonction de ces deux caractéristiques.
Dans un mode de réalisation particulier, la détermination de la matrice de filtrage comporte les étapes de:
- détermination d'un signal d'erreur défini par la différence entre un signal de réponse cible prédéterminé du système de restitution et un signal de réponse reconstruit à partir des réponses impulsionnelles perceptives;
- inversion multicanale par minimisation du signal d'erreur ainsi déterminé pour obtenir les filtres de la matrice de filtrage.
Le signal d'erreur ainsi déterminé permet de prendre en compte dans le calcul de la matrice de filtrage, uniquement les réflexions qui ont un impact sur la perception auditive de l'onde directe. En effet, seules les réflexions qui ne sont pas perceptibles sont enlevées pour la détermination du signal d'erreur.
Dans un mode de réalisation possible, le signal de réponse cible prédéterminé correspond à la réponse de l'onde directe seule sans aucune réflexion.
Ceci permet de prendre en compte comme signal de référence un signal dépourvu de tout effet de salle.
Dans une première variante de réalisation, le signal de réponse cible prédéterminé correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un lieu d'écoute prédéterminé.
La réponse de référence peut alors être volontairement choisie comme un lieu d'écoute voulue dans lequel le son est à une qualité souhaitée.
Dans une seconde variante de réalisation, le signal de réponse cible prédéterminé correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un ensemble de restitution différent.
La réponse de référence est ici choisie en fonction d'un système de restitution de référence choisi, dans lequel le nombre et la position des haut-parleurs peuvent être différents du système de restitution faisant l'objet de la correction.
La présente invention vise également un dispositif de calibration d'un ensemble de restitution sonore d'un signal sonore multi canal comportant une pluralité de ha ut- parleurs. Ce dispositif est tel qu'il comporte:
un module d'obtention de réponses impulsionnelles multidirectionnelles des haut- parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé;
un module d'analyse des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal
audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques des premières réflexions comprenant au moins l'amplitude;
un module de comparaison de l'amplitude de chacune des réflexions à un seuil de perceptibilité déterminé et d'identification des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil déterminé;
un module de modification des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles par le module d'identification;
un module de calcul d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio multi canal avant restitution sonore.
Ce dispositif présente les mêmes avantages que le procédé décrit précédemment, qu'il met en œuvre.
L'invention vise également un décodeur audio comportant un dispositif de calibration tel que décrit.
Elle vise un programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé de calibration tel que décrit, lorsque ces instructions sont exécutées par un processeur.
Enfin l'invention se rapporte à un support de stockage, lisible par un processeur, intégré ou non au dispositif de calibration, éventuellement amovible, mémorisant un programme informatique mettant en œuvre un procédé de calibration tel que décrit précédemment.
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels :
la figure 1 représente un système de restitution sonore et un dispositif de calibration du système de restitution selon un mode de réalisation de l'invention; la figure 2 représente sous forme d'organigramme les étapes principales d'un procédé de calibration selon un mode de réalisation de l'invention;
la figure 3a est une représentation d'un repère sphérique;
la figure 3b, illustre les composantes harmoniques sphériques dans le cas d'une représentation spatiale ambisonique d'ordre 3;
la figure 4 représente un exemple de tableau de valeurs en dB que peut prendre le seuil de perceptibilité utilisé dans le procédé de calibration selon un mode de réalisation de l'invention, pour un son direct d'angle d'incidence de 60°, en fonction de l'angle d'incidence (exprimé en degrés) de la réflexion et du temps d'arrivée (exprimé en ms) de cette réflexion par rapport à l'instant tO d'arrivée de
l'onde directe; le seuil de perceptibilité est défini comme le niveau (en dB) de la réflexion auquel est soustrait le niveau (en dB) de l'onde directe ;
la figure 5 propose une autre illustration des valeurs prises par le seuil de perceptibilité : le seuil est cette fois représenté en fonction de l'incidence de la réflexion, et ceci pour différentes directions de l'onde directe ; dans tous les cas, le retard de la réflexion par rapport à l'onde directe est fixe et vaut 15 ms;
la figure 6 représente un exemple d'une réponse impulsionnelle d'un haut-parleur d'un système de restitution ; le seuil de perceptibilité associé à chaque réflexion est également reproduit par une courbe pointillée;
la figure 7 représente un exemple de réalisation matérielle d'un dispositif de calibration selon un mode de réalisation de l'invention.
La figure 1 illustre donc un exemple de système de restitution sonore dans lequel le procédé de calibration selon un mode de réalisation de l'invention est mis en œuvre. Ce système comporte un dispositif de traitement 100 comportant un dispositif de calibration E selon un mode de réalisation de l'invention pilotant un ensemble de restitution 180 qui comporte une pluralité d'éléments de restitutions (haut-parleurs, enceintes acoustiques, ...) représentés ici par des haut-parleurs HPi, HP2, HP3, HP, et HPN.
Ces haut-parleurs sont agencés dans un lieu d'écoute dans lequel un microphone ou ensemble de microphones MA est aussi prévu.
Ces haut-parleurs et microphones sont pilotés par un dispositif de traitement 100 qui peut être un décodeur tel qu'un décodeur de salon de type "set top box" pour lire ou diffuser des contenus audio ou vidéo, un serveur de traitement apte à traiter des contenus audio et vidéo et à les retransmettre à l'ensemble de restitution, un pont de conférence apte à traiter les signaux audio de différents lieux de conférence ou tout dispositif de traitement audio de signal multi canal.
Le dispositif de traitement 100 comporte un dispositif de calibration E selon un mode de réalisation de l'invention et une matrice de filtrage 170 composée d'une pluralité de filtres de traitement qui sont déterminés par le dispositif de calibration selon un procédé de calibration tel qu'illustré ultérieurement en référence à la figure 2.
Cette matrice de filtrage reçoit en entrée un signal multi canal Si et transmet en sortie les signaux SCi, SC2, SQ, SCN aptes à être restitués par l'ensemble de restitution 180.
Le dispositif de calibration E comporte un module de réception et d'émission 110 apte à transmettre d'une part des signaux audio de référence (Sref) aux différents haut-parleurs de l'ensemble de restitution 180 et à recevoir par le microphone ou l'ensemble de microphones MA, les réponses impulsionnelles multidirectionnelles (Ris) de ces différents haut-parleurs correspondant à la diffusion de ces signaux de référence.
Une réponse impulsionnelle multidirectionnelle contient l'information temporelle et l'information spatiale relatives à l'ensemble des ondes sonores induites par le haut-parleur considéré dans la salle de reproduction.
Les signaux de référence sont par exemple des signaux dont la fréquence augmente de façon logarithmique avec le temps, ces signaux étant appelés en anglais "chirps" ou "sweeps" logarithmiques.
La convolution du signal mesuré à la sortie du haut-parleur avec un signal de référence inverse permet d'obtenir directement la réponse impulsionnelle du haut-parleur.
Dans un mode de réalisation particulier adapté au domaine de représentation des harmoniques sphériques lié au format ambisonique ou HOA, le microphone apte à mesurer les réponses impulsionnelles multidirectionnelles des haut-parleurs est un microphone de type HOA placé en un point du lieu d'écoute, par exemple au centre des haut-parleurs de l'ensemble de restitution.
Ce microphone va recevoir, pour chaque haut-parleur restituant un signal audio de référence, le son restitué dans plusieurs directions. En effet, le microphone HOA est constitué d'une pluralité de microphones. Par un traitement approprié, l'information spatiale des différents sons captés peut être extraite. Pour plus de détails sur ce type de microphone, on peut se référer au document intitulé "Etude et réalisation d'outils avancés d'encodage spatial pour la technique de spatialisation sonore Higher Order Ambisonics : microphone 3D et contrôle de la distance" de S. Moreau cité à Univ. du Maine, PhD thesis, 2006.
Le microphone HOA récupère alors les réponses impulsionnelles multidirectionnelles de chacun des haut-parleurs pour les transmettre au dispositif de calibration ou pour les stocker en mémoire dans un espace mémoire local ou distant.
Lorsque que ces informations sont stockées en mémoire, l'obtention de ces réponses impulsionnelles multidirectionnelles par le dispositif de calibration selon l'invention, s'effectue alors par une simple lecture en mémoire.
Ces réponses impulsionnelles multidirectionnelles permettent d'obtenir des informations sur les directions d'arrivée des ondes directes et des réflexions du signal restitué ainsi que des informations de temps d'arrivée à la fois des ondes directes et des réflexions.
Le module d'analyse 120 du dispositif E effectue une analyse conjointe des réponses impulsionnelles obtenues, ce qui permet d'obtenir ces caractéristiques et notamment les caractéristiques des premières réflexions des signaux restitués. Dans le mode de réalisation particulier adapté au domaine de représentation des harmoniques sphériques, les réponses impulsionnelles multidirectionnelles sont obtenues dans une représentation spatio-temporelle où l'information spatiale est décrite sur la base des harmoniques sphériques et permet d'identifier les directions d'incidence des différentes composantes sonores. Ainsi, on obtient au final l'ensemble des informations sur l'amplitude des réflexions, leurs directions d'arrivée et
leurs temps d'arrivée en comparaison au temps d'arrivée de l'onde directe. Cette étape sera décrite ultérieurement en référence à la figure 2.
L'analyse des réponses impulsionnelles est faite sur une échelle temporelle prédéterminée, englobant les instants des premières réflexions.
Dans un exemple de réalisation cette fenêtre temporelle est de longueur comprise entre 50 et 100 ms, ce qui correspond à l'échelle temporelle des instants d'arrivée des premières réflexions.
Bien entendu, le mode de réalisation ainsi décrit est adapté au domaine de représentation des harmoniques sphériques mais il est tout à fait envisageable d'effectuer ces même étapes dans un domaine de représentation WFS (pour "Wave Field Synthesis" en anglais) ou dans le domaine des ondes planes. Dans ces cas de figures, les moyens de captation des signaux restitués par les haut-parleurs seront à adapter à ces domaines de représentation pour obtenir des réponses impulsionnelles multidirectionnelles, sans que cela s'éloigne du cadre de l'invention.
Le dispositif de calibration E comporte également un module 130 de comparaison et d'identification des réflexions non perceptibles. Ce module met en œuvre une étape de comparaison des amplitudes des réflexions, obtenues par le module d'analyse 120, à un seuil de perceptibilité Se prédéterminé. Ce seuil de perceptibilité est déterminé par le module 140 à partir d'une table de valeurs prédéfinie et stockée dans un espace mémoire.
La détermination de ce seuil de perceptibilité sera explicitée ultérieurement en référence aux figures 4 et 5.
Dans le cas où l'amplitude d'une réflexion est inférieure au seuil de perceptibilité tel que défini, cela veut dire que cette réflexion n'a pas d'impact significatif sur la perception auditive de l'onde directe du signal restitué.
Une étape d'identification des ces réflexions "non perceptibles "est alors mise en œuvre par le module 130. Ces réflexions identifiées permettent de mettre en œuvre par le module 150 une étape de détermination de réponses impulsionnelles perceptives qui sont déduites des réponses impulsionnelles obtenues par le module 110 par suppression des réflexions jugées comme non perceptibles.
Ainsi, seules les réflexions qui ont un impact sur la perception des ondes directes sont prises en compte pour calculer dans le module 160, la matrice de filtrage Filt. du module de filtrage matriciel 170.
La figure 2 illustre sous forme d'organigramme, les étapes principales mises en œuvre dans un mode de réalisation du procédé de calibration selon l'invention.
A l'étape E201, les réponses impulsionnelles multidirectionnelles des différents haut- parleurs de l'ensemble de restitution tel que décrit en référence à la figure 1, sont obtenues. Elles sont obtenues par le dispositif de calibration, soit par simple lecture en mémoire si
celles-ci ont été sauvegardées au préalable, soit par réception du microphone ou d'un ensemble de microphones ayant effectué la mesure.
Ces réponses impulsionnelles multidirectionnelles sont les réponses de chaque haut- parleur suite à la reproduction d'un signal de référence tel que décrit en référence à la figure 1.
Une étape E202 d'analyse des réponses impulsionnelles multidirectionnelles ainsi obtenues est alors mise en œuvre. Cette analyse s'effectue dans un domaine de représentation spatio-temporelle. L'information spatiale peut par exemple être décrite dans le domaine de représentation des harmoniques sphériques. Dans cette représentation illustrée à la figure 3a, chaque point a pour coordonnées sphériques, une distance r par rapport à l'origine 0, un angle Θ d'azimut ou d'orientation dans le plan horizontal et un angle δ d'élévation ou d'orientation dans le plan vertical. Préférentiel lement, la direction définie par (θ=0°,δ=0°) correspond à la direction en face de l'auditeur. Dans un tel repère, une onde acoustique est parfaitement décrite si l'on définit en tout point à chaque instant t, la pression acoustique notée p(r, θ, δ, t) dont la transformée de Fourier temporelle est notée P(r, θ, δ, où f désigne la fréquence temporelle.
Dans le contexte de spatialisation ambisonique d'ordre supérieur (HOA), les composantes spatiales sont des composantes ambisoniques m a n qui correspondent à la décomposition de l'onde de pression acoustique p sur la base des harmoniques sphériques. Par exemple, pour une source sonore en champ lointain, c'est-à-dire une onde plane d'incidence (0s, ôs) portant un signal S(t), les composantes ambisoniques Bm a n sont données par:
Bmn = S(t)- Y£n(. e s> s s) ou les fonctions harmoniques sphériques Y°n (Θ, S) décrivent une base orthonormée:
cos wé? si <T = +1
ύη ηθ si <7 = -l (ignoré si w = 0)
Les Pmn (sin δ) sont les fonctions de Legendre associées.
Une illustration des fonctions harmoniques sphériques est représentée en figure
3b. On peut ainsi voir la composante omnidirective Υ^0 (désignée comme la « composante
W » dans la terminologie ambisonique) correspondant à l'ordre 0, les composantes bidirectives Υ^ , Υ^ , Υ^1 (désignée respectivement comme les « composantes Z, X et Y » dans la terminologie ambisonique) correspondant à l'ordre 1, et les composantes des ordres supérieurs.
Une représentation spatiale tridimensionnelle ou "3D" dite "d'ordre Λ/' comprend K = (M+l)2 composantes dont les triplets d'indices {m,n, σ} sont tels que 0≤m≤M, 0≤n≤m, σ=+1. Une représentation bidimensionnelle ou "2D" d'ordre M comprend un sous-ensemble de ces composantes en ne retenant que les indices m=n, soit K=2M+l composantes.
La décomposition sur la base des harmoniques sphériques peut être considérée comme la transformée duale entre coordonnées spatiales et les fréquences spatiales. Les composantes B n définissent donc un spectre spatial.
Pour chaque haut-parleur, on obtient à l'issue de l'étape E201, une réponse impulsionnelle multidirectionnelle qui est constituée de K réponses impulsionnelles correspondant aux K composantes de la représentation spatiale choisie. Dans le cas de la représentation des harmoniques sphériques, il s'agit des K composantes sur les K=2M+1 harmoniques sphériques considérés. Pour le jième haut-parleur, la réponse impulsionnelle multidirectionnelle qui lui est associée se compose ainsi de K réponses élémentaires H t) où l'indice I repère l'indice de la composante spatiale et t correspond à l'échantillon temporel. Par la suite, on désigne par hj(t) le vecteur des K composantes spatiales mesurées pour le jième haut-parleur :
hj(t) = [ΗμΟ:) ... Hji(t) ... HjK(t)].
Si le système de reproduction comprend au total N haut-parleurs, l'ensemble des réponses impulsionnelles multidirectionnelles mesurées pour les N haut-parleurs et les K composantes spatiales définit une matrice H de taille KxN, dans laquelle la jième colonne correspond à la réponse impulsionnelle multidirectionnelle associée au jième haut-parleur.
Pour chaque haut-parleur, les K composantes spatiales contenues dans le vecteur hj(t) représentent le spectre spatial des sons captés par le microphone. Pour accéder à l'information de direction des sons, il convient donc d'effectuer une transformation inverse pour repasser d'une représentation en fonction des fréquences spatiales à une représentation en fonction des coordonnées spatiales.
Cette transformation inverse est réalisée en reconstruisant l'onde de pression p(r, Θ, δ, t) par combinaison linéaire des harmoniques sphériques, chaque harmonique étant pondéré par l'amplitude de la composante qui lui est associée. On retrouve ces éléments dans la thèse de S. Moreau citée ci-dessus.
On peut alors évaluer l'onde de pression p(r, θ, δ, t) en tout point d'une sphère centrée sur le point de mesure des réponses impulsionnelles multidirectionnelles en reconstruisant l'onde de pression point par point par combinaison linéaire des harmoniques sphériques. On peut par exemple évaluer cette pression sur un réseau de P points définissant un « échantillonnage régulier » de la sphère au sens défini dans le mémoire de thèse de S. Moreau. Cette opération s'apparente alors au décodage spatial des composantes ambisoniques pour une restitution par un réseau sphérique régulier de P haut-parleurs virtuels. Cette étape de décodage spatial est par exemple décrite dans le document intitulé
"Ambisonics encoding of other audio formats for multiple listening conditions" des auteurs Jérôme Daniel, Jean-Bernard Rault et Jean-Dominique Polack dans AES 105th Convention, September 1998.
En pratique, cette transformation des fréquences spatiales (composantes ambisoniques) vers les coordonnées spatiales s'effectue en multipliant, pour chaque haut- parleur et chaque échantillon temporel t, le vecteur hj(t) par une matrice de décodage D. Par exemple, la matrice D peut être obtenue comme D=YT, où la matrice Y est calculée en évaluant les K harmoniques sphériques Υ η (θ, S) pour les P directions des haut-parleurs virtuels, en regroupant les azimuths 0q et élévations Sq dans un unique doublet C = (8q, Sq) associé à un haut-parleur (q désigne l'indice du haut-parleur). Dans la matrice Y, chaque colonne est constituée des valeurs des K harmoniques sphériques pour un haut- parleur donné. Au final, on obtient, pour chaque haut-parleur et chaque échantillon temporel t, un vecteur Gj(t) de longueur P décrivant la distribution spatiale des composantes sonores captées sur un réseau de P points définissant un échantillonnage régulier de la sphère:
¾(t) = ^hj(t)
Le maximum de cette fonction Gj(t) identifie une réflexion. Si Gj(t) présente plusieurs maxima, ces différents maxima identifient chacun une réflexion. Ainsi, pour chaque réflexion identifiée, ses caractéristiques sont déterminées selon la procédure suivante : son instant d'arrivée correspond à l'échantillon tRi = t pour lequel elle est identifiée, son incidence correspond aux coordonnées spatiales
CRÎ = (θκί, SRi) = (6q, Ôq)
du point pour lequel le maximum de Gj(t) est observé, et son amplitude correspond à l'amplitude de ce maximum
Dans ce qui précède, l'indice i repère l'indice de la réflexion considérée. La précision d'estimation de ces caractéristiques dépend donc du nombre P de haut-parleurs virtuels utilisés pour cette analyse. Le premier échantillon temporel pour lequel on observe un maximum définit l'instant d'arrivée de l'onde directe. On a soin de relever aussi l'amplitude (AD) et l'incidence de cette dernière (CD = (9D, ôD) où 9D et δρ définissent respectivement l'angle d'azimut et l'angle d'élévation repérant la direction de l'onde directe).
Ainsi, à partir des réponses impulsionnelles multidirectionnelles obtenues, considérées sur une fenêtre d'analyse temporelle englobant les instants des premières réflexions du signal audio reproduit par les haut-parleurs, il est possible de déterminer, et ce pour chaque haut- parleur, les caractéristiques de l'onde directe et les caractéristiques des réflexions qui lui sont associées. Ainsi, pour le jième haut-parleur, sont déterminées d'une part les caractéristiques de l'onde directe comme son amplitude AD(j), son instant d'arrivée sur le microphone TD(j) ou sa direction d'incidence CD(j) ; et d'autre part les caractéristiques des réflexions comme leurs amplitudes ARi(j), leurs instants d'arrivée sur le microphone TRi(j) ou leurs directions
d'incidences CRi(j). Dans la suite, on utilisera plutôt l'amplitude normalisée par l'amplitude de l'onde directe :
et le retard entre l'onde directe et la réflexion :
·¾(/') = TRi j) - TD j).
Les premières réflexions d'un signal audio restitué dépendent du lieu d'écoute dans lequel est placé l'ensemble de restitution. D'une façon générale, ces premières réflexions apparaissent dans un temps situé dans une plage allant de 50 à 100ms après l'onde directe.
De façon avantageuse, la fenêtre temporelle d'analyse de l'étape E202 sera, dans un mode de réalisation adapté, d'une taille comprise entre 50 et 100 ms.
L'étape E203 compare les amplitudes obtenues par l'étape d'analyse à un seuil de perceptibilité Se des réflexions qui a été défini au préalable et stocké en mémoire. L'étape E204 permet de retrouver la valeur de seuil prédéfinie en fonction de caractéristiques de chaque réflexion et de l'onde directe associée, obtenues à l'étape d'analyse E202.
En effet, plusieurs cas de figure peuvent se présenter. Dans un premier exemple de réalisation, seule l'information de direction des réflexions est connue et récupérée de l'étape d'analyse. Pour retrouver le seuil de perceptibilité correspondant, on fixe la valeur de la caractéristique d'instant d'arrivée de la réflexion, par exemple la valeur la plus critique (celle qui donne une perceptibilité maximale) et on détermine la valeur du seuil de perceptibilité uniquement par rapport à la valeur de la direction.
De même si seule l'information d'instant d'arrivée de la réflexion est connue, on peut fixer la valeur de direction, par exemple la valeur la plus critique (celle qui donne une perceptibilité maximale), et déterminer le seuil de perceptibilité selon la valeur de l'instant d'arrivée.
Enfin, dans le cas où les deux caractéristiques sont connues, la valeur du seuil peut être déterminée, avec une meilleure précision, en fonction de ces deux caractéristiques.
Pour cela, un tableau de valeurs de seuil de perceptibilité est stocké en mémoire. Un exemple d'un tel tableau est illustré en référence à la figure 4. Ce tableau montre, pour un son direct situé à un angle d'azimut à 60°, la valeur du seuil de perceptibilité d'une réflexion exprimée en dB, en fonction des caractéristiques d'angle d'incidence de la réflexion (i.e. son angle d'azimut 9Ri dans le plan horizontal correspondant à l'élévation ôRi= 0°) et de temps d'arrivée de cette réflexion par rapport au temps d'arrivée de l'onde directe TRÎ (J) . Le seuil est défini comme le niveau relatif de la réflexion, c'est-à-dire qu'il représente la différence entre les valeurs d'amplitude (exprimées en dB) de la réflexion et de l'onde directe considérée.
Ce tableau de valeurs est un exemple de valeurs seuils définies à partir d'expériences psycho-acoustiques réalisées en considérant différents types de signal sonore (parole, clics, musique, etc.), différents angles d'incidences et différents temps d'arrivée des réflexions et
de l'onde directe. Un seuil de perceptibilité de ces réflexions est défini en fonction de ces paramètres.
Pour compléter l'illustration des valeurs du seuil de perceptibilité de la figure 4, la figure 5 montre différentes courbes de seuil de perceptibilité exprimé en dB (qui correspond toujours au seuil relatif correspondant à la différence entre le niveau de la réflexion et celui de l'onde directe). Ces différentes courbes correspondent à différentes positions de l'onde directe (azimut de 0° pour Dl, 60° pour D2, 90° pour D3 et 150° pour D4) et représentent les seuils de perceptibilité en fonction de la direction de la réflexion, ceci pour un temps d'arrivée fixe (correspondant en l'occurrence à 15 ms).
Ainsi, à l'étape E204, la valeur de seuil correspondant aux caractéristiques obtenues à l'étape d'analyse est récupérée. On compare cette valeur de seuil à la valeur d'amplitude de chaque réflexion à l'étape E203. Pour être comparée au seuil de perceptibilité, la valeur de l'amplitude de la réflexion est référencée à celle de l'onde directe associée et exprimée en dB:
201og04iVffi(/))-
Dans le cas où la valeur d'amplitude de la réflexion est inférieure à la valeur de seuil de perceptibilité, cela veut dire que cette réflexion n'a pas d'impact sur la perception que peut avoir un auditeur de l'onde directe. Cette réflexion n'est donc pas à prendre en compte pour le traitement d'un signal multi canal avant restitution. L'étape E203 permet ainsi d'identifier toutes les réflexions qui n'ont pas d'impact sur la perception de l'onde directe. L'étape E203 identifie donc toutes les réflexions pour lesquelles l'amplitude est inférieure au seuil de perceptibilité.
Pour illustrer cette étape E203, la figure 6 représente un exemple de réponse impulsionnelle, pour une direction donnée, d'un des haut-parleurs de l'ensemble de restitution en comparaison avec la courbe en trait discontinu représentant le seuil de perceptibilité (RMT pour « Reflection Masked Threshold ») obtenu par la table décrite ci-dessus en référence à la figure 4. Les réflexions dont le niveau est inférieur à la courbe de seuil sont ainsi identifiées. On note que dans le cas illustré, les premières réflexions survenant dans les 15 premières ms ne sont pas perceptibles.
A partir de cette identification des réflexions non perceptibles, l'étape E205 effectue une modification des réponses impulsionnelles hj(t) obtenues à l'étape E201 pour les j= 1 à N haut-parleurs, pour obtenir des réponses impulsionnelles perceptives hpj(t). Pour cela, la modification consiste à éliminer les réflexions non perceptibles identifiées à l'étape E203 dans les réponses impulsionnelles.
De façon plus détaillée, cette opération s'effectue par exemple par une opération de seuillage. A chaque instant t, la valeur du seuil de perceptibilité Se est retranchée au signal de réponse impulsionnelle qui a été obtenue à l'étape E201.
Préférentiel lement ce traitement est appliqué sur le spectre spatial défini par les K composantes hj(t) = [ (t) ... H t) ... HjK(t)] dans le domaine de représentation spatiale
choisi, correspondant par exemple à la représentation sur la base des harmoniques sphériques. Cependant le traitement peut aussi s'appliquer dans le domaine dual des coordonnées d'espace. Dans la suite, nous allons décrire l'opération réalisée dans le cas du spectre spatial.
L'opération de seuillage consiste à comparer pour chaque réflexion identifiée son amplitude au seuil de perceptibilité Se associé à ses caractéristiques. Ainsi, pour la ième réflexion identifiée pour le jième haut-parleur, le seuil Se(i) est déterminé en fonction de ses caractéristiques [ TRÎ(J), CRi(j)]- Cette réflexion est localisée à l'instant t, donné par:
t. = Td G) + ¾(/)■
Pour réaliser le seuillage, on considère donc la réponse impulsionnelle à cet instant, soit hj(ti), ou plus exactement sur le spectre spatial associé et constitué des K composantes [HjiCt,) ... Hji(ti) ... HjK(ti)]. Plusieurs stratégies sont alors possibles. La plus simple consiste à préserver l'amplitude relative des composantes du spectre spatial, c'est-à-dire qu'on applique un traitement identique à toutes les composantes. Dans ce cas, pour chaque composante Hji(ti), l'opération de seuillage peut se traduire par les équations suivantes:
HPjl(ti) = 0 si ANRiG) < io005 Se
HPjx ti = - 100 05Se|) ^ si ANRiG) > 100 05 Se
où HPji(t) désigne la réponse impulsionnelle perceptive associée à H t).
Ainsi, les réponses impulsionnelles perceptives ne conservent que les réflexions ayant un impact significatif sur la perception de l'onde directe.
Ces réponses impulsionnelles perceptives sont alors utilisées pour déterminer la matrice de filtrage, à l'étape E206. Cette matrice de filtrage est ensuite utilisée pour traiter le signal audio multi canal avant sa restitution sonore par l'ensemble de restitution du système.
Pour obtenir l'ensemble de filtres constituant la matrice de filtrage Filt du dispositif de traitement, un mode de réalisation possible comporte une étape de détermination d'un signal d'erreur défini par la différence entre un signal de réponse cible prédéterminé de l'ensemble de restitution et un signal de réponse reconstruit à partir des réponses impulsionnelles perceptives et une étape d'inversion multicanale par minimisation du signal d'erreur ainsi déterminé.
Le signal d'erreur ainsi obtenu ne prend donc en compte que les réflexions perceptibles puisque qu'il est calculé à partir d'un signal reconstruit basé sur les réponses impulsionnelles perceptives.
L'inversion peut être réalisée par un algorithme de descente de gradient ou ses variantes. Un exemple d'algorithme d'inversion possible est celui de type ISTA (pour "Itérative Shrinkage-Thresholding algorithm) tel que décrit dans le document intitulé " A Fast Itérative Shrinkage-Thresholding Algorithm for Linear Inverse Problems" des auteurs Amir
Beck & Marc Teboulle, publié dans SIAM J. IMAGING SCIENCES, Vol. 2, No. 1, pp. 183-202 en 2009.
D'une façon générale, le problème qui se pose pour calculer les filtres de la matrice de traitement, est le suivant. Il y a N haut-parleurs qui constituent le système réel de reproduction. Dans le contexte de spatialisation ambisonique d'ordre supérieur (HOA), l'espace de représentation spatiale est de dimension K. L'information spatiale est donc décrite par K coefficients. L'objectif est de reproduire avec le système de N haut-parleurs, un ensemble de V signaux définissant le signal audio multicanal d'entrée. Ces V signaux sont dédiés à un système idéal de reproduction constitués de V haut-parleurs. Ce système idéal définit les V signaux cibles qu'on souhaite reproduire et qui correspondent donc aux réponses d'un système fictif de V haut-parleurs virtuels. Dans le cas le plus simple, le système réel de reproduction comporte aussi N=V haut-parleurs. Mais dans le cas général, on est capable d'émuler un système de V haut-parleurs virtuels à partir d'un dispositif de N haut-parleurs réels.
L'équation à résoudre est la suivante: T(t)=H*W(t)
avec H, la matrice de dimension KxN comportant les réponses impulsionnelles des N éléments du système de restitution dans le domaine d'analyse spatiale,
W, la matrice comportant les filtres de correction à calculer, de dimension NxV,
T, la matrice contenant les V réponses cibles définies dans le domaine d'analyse spatiale, de dimension KxV,
et l'opération dénotée par « * » est un produit matriciel convolutif où un élément Τ¾ de la matrice T est obtenu de la façon suivante :
Chaque matrice est une matrice de vecteurs, au sens où la troisième dimension correspond à l'échelle des temps.
L'objectif de l'opération d'inversion est de trouver les éléments de la matrice W.
La résolution de cette opération peut s'effectuer en deux temps. Tout d'abord, on calcule les filtres de correction en ne corrigeant que l'effet de salle du lieu de restitution, c'est-à-dire qu'on prend en compte le dispositif réel de haut-parleurs, soit N haut-parleurs. Dans une seconde étape, on compense la disposition des haut-parleurs pour adapter les V signaux à une restitution selon une configuration non idéale de N haut-parleurs. Dans ce but, les V signaux sont répartis par matriçage sur les N canaux associés au système réel de reproduction afin d'émuler un système de V haut-parleurs virtuels.
Dans le cas présent, pour mettre en œuvre l'invention, les éléments de la matrice H comportent les réponses impulsionnelles perceptives telles qu'obtenues à l'étape E205.
Les réponses cibles peuvent varier selon le résultat de restitution sonore attendue.
Dans un mode de réalisation, cette réponse cible correspond à la réponse impulsionnelle donnée par l'onde directe seule sans aucune réflexion. Cela revient à supprimer tout l'effet de salle dans le signal attendu.
Dans une première variante de réalisation, le signal de réponse cible correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un lieu d'écoute prédéterminé.
Un lieu d'écoute caractéristique qui présente une bonne qualité d'écoute peut être souhaitée (par exemple le lieu d'écoute de la salle Pleyel™). Dans ce cas, les filtres de traitement seront calculés pour obtenir une restitution sonore proche de cette qualité d'écoute.
Dans une deuxième variante de réalisation, le signal de réponse cible correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un ensemble de restitution différent de celui utilisé pour restituer le signal résultant.
Ainsi, un système de restitution souhaité, par exemple comportant plus de haut- parleurs, est pris comme référence pour obtenir une restitution proche de celle qui aurait été obtenu avec un tel système.
D'autres signaux de réponse cibles peuvent bien évidemment être choisi selon l'effet de la restitution souhaitée.
Ainsi, la mise en œuvre du procédé décrit permet d'obtenir une meilleure qualité d'écoute lors de la restitution d'un signal audio multi canal grâce à la prise en compte seule des réflexions perceptibles des signaux par l'ensemble de restitution dans le lieu d'écoute.
La figure 7 représente un exemple de réalisation matérielle d'un dispositif de calibration selon l'invention. Celui-ci peut faire partie intégrante d'un décodeur audio/vidéo, d'un serveur de traitement, d'un pont de conférence ou de tout autre équipement de lecture ou de diffusion audio ou vidéo.
Ce type de dispositif comporte un processeur μΡ coopérant avec un bloc mémoire MEM comportant une mémoire de stockage et/ou de travail.
Le bloc mémoire peut avantageusement comporter un programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé de calibration au sens de l'invention, lorsque ces instructions sont exécutées par le processeur, et notamment les étapes d'obtention de réponses impulsionnelles multidirectionnelles des haut-parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé, d'analyse des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques des premières réflexions, de comparaison de l'amplitude de chacune des réflexions à un seuil de perceptibilité prédéterminé et d'identification des
réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil prédéterminé, de modification des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles et de détermination d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio multi canal avant restitution sonore.
Typiquement, la description de la figure 2 reprend les étapes d'un algorithme d'un tel programme informatique. Le programme informatique peut également être stocké sur un support mémoire lisible par un lecteur du dispositif ou téléchargeable dans l'espace mémoire de celui-ci.
La mémoire MEM enregistre une table de valeurs de seuil de perceptibilité en fonction de caractéristiques des composantes sonores constituées de l'onde directe et des réflexions utilisée dans le procédé selon un mode de réalisation de l'invention et de manière générale, toutes les données nécessaires à la mise en œuvre du procédé.
Un tel dispositif comporte un module d'entrée I apte à recevoir des réponses impulsionnelles d'un ensemble de restitution et un module de sortie S apte à transmettre à un module de traitement, les filtres calculés d'une matrice de filtrage.
Dans un mode possible de réalisation, le dispositif ainsi décrit peut également comporter les fonctions de traitement par la mise en œuvre de la matrice de traitement à la réception en I d'un signal multi canal Si pour transmettre en sortie des signaux traités SCi aptes à être restitués par l'ensemble de restitution.
Claims
1. Procédé de calibration d'un ensemble de restitution sonore d'un signal sonore multi canal comportant une pluralité de haut-parleurs, caractérisé en ce qu'il comporte les étapes suivantes:
obtention (E201) de réponses impulsionnelles multidirectionnelles des haut- parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé;
analyse (E202) des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques (A Î, CRI, TRi) des premières réflexions comprenant au moins l'amplitude;
comparaison (E203) de l'amplitude de chacune des réflexions à un seuil de perceptibilité déterminé (E204) et identification (E203) des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil déterminé;
modification (E205) des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles;
détermination (E206) d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio multi canal avant restitution sonore.
2. Procédé selon la revendication 1, caractérisé en ce que le seuil de perceptibilité est déterminé en fonction de caractéristiques de l'onde directe et des premières réflexions du signal audio prédéterminé.
3. Procédé selon la revendication 2, caractérisé en ce que le seuil de perceptibilité est déterminé en fonction de la direction d'incidence de l'onde directe (CD) et/ou de son amplitude (AD), et des directions d'incidences des premières réflexions (CRI) et/ou de leurs délais d'arrivée (xRi) par rapport à Tonde directe.
4. Procédé selon la revendication 1, caractérisé en ce que la détermination de la matrice de filtrage comporte les étapes de:
- détermination d'un signal d'erreur défini par la différence entre un signal de réponse cible prédéterminé du système de restitution et un signal de réponse reconstruit à partir des réponses impulsionnelles perceptives;
- inversion multicanale par minimisation du signal d'erreur ainsi déterminé pour obtenir les filtres de la matrice de filtrage.
5. Procédé selon la revendication 4, caractérisé en ce que le signal de réponse cible prédéterminé correspond à la réponse de l'onde directe seule sans aucune réflexion.
6. Procédé selon la revendication 4, caractérisé en ce que le signal de réponse cible prédéterminé correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un lieu d'écoute prédéterminé.
7. Procédé selon la revendication 4, caractérisé en ce que le signal de réponse cible prédéterminé correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un ensemble de restitution différent.
8. Dispositif de calibration d'un ensemble de restitution sonore d'un signal sonore multi canal comportant une pluralité de haut-parleurs, caractérisé en ce qu'il comporte:
un module d'obtention (110) de réponses impulsionnelles multidirectionnelles des haut-parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé;
un module d'analyse (120) des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques (ARi, CRi, TRi) des premières réflexions comprenant au moins l'amplitude;
un module de comparaison (120) de l'amplitude de chacune des réflexions à un seuil de perceptibilité déterminé (140) et d'identification (120) des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil déterminé;
un module de modification (150) des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles par le module d'identification;
un module de calcul (130) d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio multi canal avant restitution sonore.
9. Décodeur audio comportant un dispositif de calibration selon la revendication 8.
10. Programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé de calibration selon l'une des revendications 1 à 7, lorsque ces instructions sont exécutées par un processeur.
11. Support de stockage, lisible par un processeur, sur lequel est stocké un programme informatique comprenant des instructions de code pour l'exécution des étapes du procédé de calibration selon l'une des revendications 1 à 7.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US14/429,291 US9584947B2 (en) | 2012-09-18 | 2013-09-05 | Optimized calibration of a multi-loudspeaker sound playback system |
| EP13774728.3A EP2898707B1 (fr) | 2012-09-18 | 2013-09-05 | Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR1258760 | 2012-09-18 | ||
| FR1258760A FR2995754A1 (fr) | 2012-09-18 | 2012-09-18 | Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2014044948A1 true WO2014044948A1 (fr) | 2014-03-27 |
Family
ID=47215616
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/FR2013/052047 Ceased WO2014044948A1 (fr) | 2012-09-18 | 2013-09-05 | Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US9584947B2 (fr) |
| EP (1) | EP2898707B1 (fr) |
| FR (1) | FR2995754A1 (fr) |
| WO (1) | WO2014044948A1 (fr) |
Families Citing this family (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
| US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
| US9219460B2 (en) | 2014-03-17 | 2015-12-22 | Sonos, Inc. | Audio settings based on environment |
| US9565497B2 (en) | 2013-08-01 | 2017-02-07 | Caavo Inc. | Enhancing audio using a mobile device |
| US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
| US9952825B2 (en) | 2014-09-09 | 2018-04-24 | Sonos, Inc. | Audio processing algorithms |
| US12087311B2 (en) | 2015-07-30 | 2024-09-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding an HOA representation |
| EP3329486B1 (fr) * | 2015-07-30 | 2020-07-29 | Dolby International AB | Procédé et appareil de génération d'une représentation d'un signal hoa de mezzanine à partir d'une représentation d'un signal hoa |
| EP3531714B1 (fr) | 2015-09-17 | 2022-02-23 | Sonos Inc. | Facilitation de l'étalonnage d'un dispositif de lecture audio |
| US9779759B2 (en) * | 2015-09-17 | 2017-10-03 | Sonos, Inc. | Device impairment detection |
| US9693165B2 (en) | 2015-09-17 | 2017-06-27 | Sonos, Inc. | Validation of audio calibration using multi-dimensional motion check |
| US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
| US10003899B2 (en) | 2016-01-25 | 2018-06-19 | Sonos, Inc. | Calibration with particular locations |
| US9864574B2 (en) | 2016-04-01 | 2018-01-09 | Sonos, Inc. | Playback device calibration based on representation spectral characteristics |
| US9860662B2 (en) | 2016-04-01 | 2018-01-02 | Sonos, Inc. | Updating playback device configuration information based on calibration data |
| US9763018B1 (en) | 2016-04-12 | 2017-09-12 | Sonos, Inc. | Calibration of audio playback devices |
| US9794710B1 (en) | 2016-07-15 | 2017-10-17 | Sonos, Inc. | Spatial audio correction |
| CN112492502B (zh) * | 2016-07-15 | 2022-07-19 | 搜诺思公司 | 联网麦克风设备及其方法以及媒体回放系统 |
| US10372406B2 (en) | 2016-07-22 | 2019-08-06 | Sonos, Inc. | Calibration interface |
| US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
| CN109863764B (zh) * | 2016-10-19 | 2020-09-08 | 华为技术有限公司 | 控制将通过电声音响系统记录和/或再现的声信号的方法和装置 |
| US10299061B1 (en) | 2018-08-28 | 2019-05-21 | Sonos, Inc. | Playback device calibration |
| US10734965B1 (en) | 2019-08-12 | 2020-08-04 | Sonos, Inc. | Audio calibration of a portable playback device |
| US12322390B2 (en) | 2021-09-30 | 2025-06-03 | Sonos, Inc. | Conflict management for wake-word detection processes |
| CN119105089B (zh) * | 2023-06-08 | 2025-09-16 | 中国石油天然气集团有限公司 | 一种水陆检数据交叉虚反射标定方法及装置 |
| WO2025075108A1 (fr) * | 2023-10-06 | 2025-04-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Dispositif de traitement acoustique, dispositif de spécification de seuil et procédé de traitement acoustique |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060262939A1 (en) * | 2003-11-06 | 2006-11-23 | Herbert Buchner | Apparatus and Method for Processing an Input Signal |
-
2012
- 2012-09-18 FR FR1258760A patent/FR2995754A1/fr active Pending
-
2013
- 2013-09-05 EP EP13774728.3A patent/EP2898707B1/fr active Active
- 2013-09-05 US US14/429,291 patent/US9584947B2/en active Active
- 2013-09-05 WO PCT/FR2013/052047 patent/WO2014044948A1/fr not_active Ceased
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060262939A1 (en) * | 2003-11-06 | 2006-11-23 | Herbert Buchner | Apparatus and Method for Processing an Input Signal |
Non-Patent Citations (9)
| Title |
|---|
| AMIR BECK; MARC TEBOULLE: "A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems", SIAM J. IMAGING SCIENCES, vol. 2, no. 1, 2009, pages 183 - 202, XP009167765, DOI: doi:10.1137/080716542 |
| ETIENNE CORTEEL, ROZENN NICOL: "Listening room compensation for Wave Field Synthesis. What can be done?", AES 23 RD INTERNATIONAL CONFERENCE, 23 May 2003 (2003-05-23) - 25 May 2003 (2003-05-25), COPENHAGEN, DENMARK, pages 1 - 17, XP040374481 * |
| HACIHABIBOGLU H ET AL: "Perceptual simplification for model-based binaural room auralisation", APPLIED ACOUSTICS, ELSEVIER PUBLISHING, GB, vol. 69, no. 8, 1 August 2008 (2008-08-01), pages 715 - 727, XP022703192, ISSN: 0003-682X, [retrieved on 20080603], DOI: 10.1016/J.APACOUST.2007.02.006 * |
| JÉRÔME DANIEL; JEAN-BERNARD RAULT; JEAN-DOMINIQUE POLACK: "Ambisonics encoding of other audio formats for multiple listening conditions", AES 105TH CONVENTION, September 1998 (1998-09-01) |
| JÖRG M. BUCHHOLZ, JOHN MOURJOPOULOS, JENS BLAUERT: "Room Masking:Understanding and Modelling the Masking of Room Reflections", AES 110TH CONVENTION 2001, 12 May 2001 (2001-05-12) - 15 May 2001 (2001-05-15), AMSTERDAM, THE NETHERLANDS, pages 1 - 7, XP040371707 * |
| KIRKEBY; NELSON: "Digital Filter Design for Inversion Problems in Sound Reproduction", JAES, vol. 7/8, 1999, pages 583 - 595, XP000846695 |
| RENE E. JENSEN, TODD S. WELTI: "The Importance of Reflections in a BinauralRoom Impulse Response", AES 114TH CONVENTION, 22 March 2003 (2003-03-22) - 25 March 2003 (2003-03-25), Amsterdam, The Netherlands, pages 1 - 18, XP040372098 * |
| ROMAIN DEPREZ ET AL: "Validation théorique de la correction des réflexions sur la base d'une représentation en harmoniques sphériques", 10ÈME CONGRÈS FRANÇAIS D'ACOUSTIQUE,, 12 April 2010 (2010-04-12), Lyon, pages 1 - 6, XP055062229, Retrieved from the Internet <URL:http://hal.archives-ouvertes.fr/docs/00/55/09/06/PDF/000599.pdf> [retrieved on 20130507] * |
| S. MOREAU: "Etude et réalisation d'outils avancés d'encodage spatial pour la technique de spatialisation sonore Higher Order Ambisonics : microphone 3D et contrôle de la distance", PHD THESIS, 2006 |
Also Published As
| Publication number | Publication date |
|---|---|
| FR2995754A1 (fr) | 2014-03-21 |
| EP2898707B1 (fr) | 2020-04-22 |
| US20150223004A1 (en) | 2015-08-06 |
| EP2898707A1 (fr) | 2015-07-29 |
| US9584947B2 (en) | 2017-02-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP2898707B1 (fr) | Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs | |
| EP2374124B1 (fr) | Codage perfectionne de signaux audionumériques multicanaux | |
| EP1992198B1 (fr) | Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal | |
| EP2374123B1 (fr) | Codage perfectionne de signaux audionumeriques multicanaux | |
| EP1836876B1 (fr) | Procédé et dispositif d'individualisation de hrtfs par modélisation | |
| EP3807669B1 (fr) | Localisation de sources sonores dans un environnement acoustique donné | |
| EP1946612B1 (fr) | Individualisation de hrtfs utilisant une modelisation par elements finis couplee a un modele correctif | |
| EP1586220B1 (fr) | Procede et dispositif de pilotage d'un ensemble de restitution a partir d'un signal multicanal | |
| EP1999998A1 (fr) | Procede de synthese binaurale prenant en compte un effet de salle | |
| EP3895446B1 (fr) | Procede d'interpolation d'un champ sonore, produit programme d'ordinateur et dispositif correspondants. | |
| EP3935629A1 (fr) | Codage audio spatialisé avec interpolation et quantification de rotations | |
| EP2517201A1 (fr) | Signal audio épars | |
| FR3049084A1 (fr) | ||
| FR2858403A1 (fr) | Systeme et procede de determination d'une representation d'un champ acoustique | |
| EP3025514B1 (fr) | Spatialisation sonore avec effet de salle | |
| EP3559947B1 (fr) | Traitement en sous-bandes d'un contenu ambisonique réel pour un décodage perfectionné | |
| EP3384688B1 (fr) | Décompositions successives de filtres audio | |
| EP3934282A1 (fr) | Procédé de conversion d'un premier ensemble de signaux représentatifs d'un champ sonore en un second ensemble de signaux et dispositif électronique associé | |
| WO2009081002A1 (fr) | Traitement d'un flux audio 3d en fonction d'un niveau de presence de composantes spatiales | |
| FR2943867A1 (fr) | Traitement d'egalisation de composantes spatiales d'un signal audio 3d | |
| FR3143932A1 (fr) | Obtention d’une réponse impulsionnelle d’une salle | |
| WO2005096268A2 (fr) | Procede de traitement de donnees sonores, en particulier en contexte ambiophonique |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 13774728 Country of ref document: EP Kind code of ref document: A1 |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 14429291 Country of ref document: US |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2013774728 Country of ref document: EP |