[go: up one dir, main page]

RU2018121757A - SYSTEM AND METHOD OF HEADING MOTION OF THE HEAD FOR OBTAINING A PARAMETRIC BINAURAL OUTPUT SIGNAL - Google Patents

SYSTEM AND METHOD OF HEADING MOTION OF THE HEAD FOR OBTAINING A PARAMETRIC BINAURAL OUTPUT SIGNAL Download PDF

Info

Publication number
RU2018121757A
RU2018121757A RU2018121757A RU2018121757A RU2018121757A RU 2018121757 A RU2018121757 A RU 2018121757A RU 2018121757 A RU2018121757 A RU 2018121757A RU 2018121757 A RU2018121757 A RU 2018121757A RU 2018121757 A RU2018121757 A RU 2018121757A
Authority
RU
Russia
Prior art keywords
component
dominant
audio
estimate
presentation
Prior art date
Application number
RU2018121757A
Other languages
Russian (ru)
Other versions
RU2018121757A3 (en
RU2722391C2 (en
Inventor
Дирк Ерун БРЕБАРТ
Дэвид Мэттью КУПЕР
Марк Ф. ДЭВИС
Дэвид С. МАКГРАТ
Кристофер ЧЕРЛИНГ
Харальд МУНДТ
Ронда Дж. УИЛСОН
Original Assignee
Долби Лэборетериз Лайсенсинг Корпорейшн
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лэборетериз Лайсенсинг Корпорейшн, Долби Интернэшнл Аб filed Critical Долби Лэборетериз Лайсенсинг Корпорейшн
Priority claimed from PCT/US2016/062497 external-priority patent/WO2017087650A1/en
Publication of RU2018121757A publication Critical patent/RU2018121757A/en
Publication of RU2018121757A3 publication Critical patent/RU2018121757A3/ru
Application granted granted Critical
Publication of RU2722391C2 publication Critical patent/RU2722391C2/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Claims (39)

1. Способ кодирования входного аудиосигнала, основывающегося на канале или объекте, для воспроизведения, каковой способ содержит этапы, на которых1. A method of encoding an input audio signal based on a channel or an object for reproduction, which method comprises the steps of (a) выполняют первоначальный рендеринг входного аудиосигнала, основывающегося на канале или объекте, в начальное выходное представление;(a) perform initial rendering of an input audio signal based on a channel or an object into an initial output representation; (b) определяют оценку доминантного аудиокомпонента из входного аудиосигнала, основывающегося на канале или объекте, и определяют последовательность весовых компонентов доминантного аудиокомпонента для отображения начального выходного представления в доминантный аудиокомпонент, с тем чтобы обеспечить возможность использования весовых коэффициентов доминантного аудиокомпонента и начального выходного представления для определения оценки доминантного компонента;(b) determining an estimate of the dominant audio component from an input audio signal based on a channel or an object, and determining the sequence of weight components of the dominant audio component to map the initial output representation to the dominant audio component so as to enable the use of the weights of the dominant audio component and the initial output representation to determine the estimate dominant component; (c) определяют оценку направления или положения доминантного аудиокомпонента; и(c) determine an estimate of the direction or position of the dominant audio component; and (d) кодируют начальное выходное представление, весовые коэффициенты доминантного аудиокомпонента, направление или положение доминантного аудиокомпонента как кодированный сигнал для воспроизведения.(d) encode the initial output representation, the weights of the dominant audio component, the direction or position of the dominant audio component as an encoded signal for playback. 2. Способ по п. 1, дополнительно содержащий этап, на котором определяют оценку остаточного микса, представляющую собой начальное выходное представление за вычетом рендеринга либо доминантного аудиокомпонента, либо его оценки.2. The method of claim 1, further comprising determining an estimate of the residual mix, which is the initial output representation minus the rendering of either the dominant audio component or its estimation. 3. Способ по п. 1, дополнительно содержащий этап, на котором генерируют безэховый бинауральный микс входного аудиосигнала, основывающегося на канале или объекте, и определяют оценку остаточного микса, причем оценкой остаточного микса является безэховый бинауральный микс за вычетом либо рендеринга доминантного аудиокомпонента, либо его оценки.3. The method of claim 1, further comprising generating an anechoic binaural mix of the input audio signal based on the channel or object, and determining an estimate of the residual mix, the estimate of the residual mix being the anechoic binaural mix minus either rendering the dominant audio component, or its assessment. 4. Способ по п. 2 или 3, дополнительно содержащий этап, на котором определяют последовательность остаточных матричных коэффициентов для отображения начального выходного представления в оценку остаточного микса.4. The method of claim 2 or 3, further comprising determining a sequence of residual matrix coefficients for mapping the initial output representation into an estimate of the residual mix. 5. Способ по любому из предшествующих пунктов, в котором начальное выходное представление содержит представление посредством наушников или громкоговорителя.5. The method according to any one of the preceding paragraphs, in which the initial output presentation comprises a presentation by means of headphones or a speaker. 6. Способ по любому из предшествующих пунктов, в котором входной аудиосигнал, основывающийся на канале или объекте, разбивается на элементы разбиения по времени и частоте, и упомянутый этап кодирования повторяется в отношении последовательности временных шагов и последовательности полос частот.6. The method according to any one of the preceding paragraphs, in which the input audio signal based on a channel or an object is divided into elements of the division of time and frequency, and said coding step is repeated with respect to a sequence of time steps and a sequence of frequency bands. 7. Способ по любому из предшествующих пунктов, в котором начальное выходное представление содержит микс стереогромкоговорителей.7. The method according to any one of the preceding paragraphs, in which the initial output representation comprises a mix of stereo speakers. 8. Способ декодирования кодированного аудиосигнала, причем кодированный аудиосигнал включает в себя:8. A method for decoding an encoded audio signal, wherein the encoded audio signal includes: начальное выходное представление; initial output presentation; весовые коэффициенты доминантного аудиокомпонента и направления доминантного аудиокомпонента; weighting factors of the dominant audio component and the direction of the dominant audio component; при этом способ содержит этапы, на которых:wherein the method comprises the steps in which: (a) используют весовые коэффициенты доминантного аудиокомпонента и начальное выходное представление, чтобы определить оценочный доминантный компонент;(a) using weights of the dominant audio component and the initial output representation to determine the estimated dominant component; (b) выполняют рендеринг оценочного доминантного компонента с бинаурализацией в пространственном местоположении относительно целевого слушателя в соответствии с направлением доминантного аудиокомпонента, чтобы сформировать отрендеренный бинаурализированный оценочный доминантный компонент;(b) rendering the estimated dominant component with binauralization at a spatial location relative to the target listener in accordance with the direction of the dominant audio component to form a rendered binauralized estimated dominant component; (c) реконструируют оценку остаточного компонента из начального выходного представления; и(c) reconstructing an estimate of the residual component from the initial output representation; and (d) объединяют отрендеренный бинаурализированный оценочный доминантный компонент и оценку остаточного компонента для формирования выходного пространственно ориентированного кодированного аудиосигнала.(d) combine the rendered binauralized estimated dominant component and the residual component estimate to form an output spatially oriented encoded audio signal. 9. Способ по п. 8, в котором кодированный аудиосигнал дополнительно включает в себя последовательность остаточных матричных коэффициентов, представляющих остаточный аудиосигнал, и этап (c) дополнительно содержит этап, на котором9. The method of claim 8, wherein the encoded audio signal further includes a sequence of residual matrix coefficients representing the residual audio signal, and step (c) further comprises the step of (c1) применяют упомянутые остаточные матричные коэффициенты к начальному выходному представлению, чтобы реконструировать оценку остаточного компонента.(c1) apply said residual matrix coefficients to the initial output representation to reconstruct the estimate of the residual component. 10. Способ по п. 8, в котором оценка остаточного компонента реконструируется вычитанием отрендеренного бинаурализированного оценочного доминантного компонента из начального выходного представления.10. The method of claim 8, wherein the residual component estimate is reconstructed by subtracting the rendered binauralized estimated dominant component from the initial output representation. 11. Способ по любому из пп. 8-10, в котором этап (b) включает в себя начальный поворот оценочного доминантного компонента в соответствии с входным сигналом слежения за движением головы, указывающим ориентацию головы целевого слушателя.11. The method according to any one of paragraphs. 8-10, in which step (b) includes an initial rotation of the estimated dominant component in accordance with an input signal tracking the head movement indicating the orientation of the head of the target listener. 12. Способ декодирования и воспроизведения аудиопотока для слушателя, использующего наушники, каковой способ содержит этапы, на которых12. A method of decoding and reproducing an audio stream for a listener using headphones, which method comprises the steps of (a) принимают поток данных, содержащий первую аудиопрезентацию и дополнительные данные аудиопреобразования;(a) receiving a data stream comprising a first audio presentation and additional audio conversion data; (b) принимают данные ориентации головы, представляющие ориентацию слушателя;(b) receiving head orientation data representing the orientation of the listener; (c) создают один или более вспомогательных сигналов на основе первой аудиопрезентации и принятых данных преобразования;(c) creating one or more auxiliary signals based on the first audio presentation and received transform data; (d) создают вторую аудиопрезентацию, состоящую из сочетания первой аудиопрезентации и вспомогательного сигнала(ов), где один или более вспомогательных сигналов модифицированы в ответ на данные ориентации головы; и(d) creating a second audio presentation consisting of a combination of the first audio presentation and an auxiliary signal (s), where one or more auxiliary signals are modified in response to the head orientation data; and (e) выводят вторую аудиопрезентацию в качестве выходного аудиопотока.(e) outputting a second audio presentation as an output audio stream. 13. Способ по п. 12, в котором упомянутая модификация вспомогательных сигналов состоит из моделирования акустического пути прохождения от положения источника звука до ушей слушателя.13. The method according to p. 12, in which said modification of the auxiliary signals consists of modeling the acoustic path from the position of the sound source to the ears of the listener. 14. Способ по п. 12 или 13, в котором упомянутые данные преобразования состоят из коэффициентов матрицирования и по меньшей мере одного из положения источника звука и направления источника звука.14. The method of claim 12 or 13, wherein said transform data consists of matrix coefficients and at least one of a position of the sound source and a direction of the sound source. 15. Способ по любому из пп. 12-14, в котором процесс преобразования применяется как функция времени или частоты.15. The method according to any one of paragraphs. 12-14, in which the conversion process is applied as a function of time or frequency. 16. Способ по любому из пп. 12-15, в котором упомянутые вспомогательные сигналы представляют по меньшей мере один доминантный компонент.16. The method according to any one of paragraphs. 12-15, wherein said auxiliary signals represent at least one dominant component. 17. Способ по любому из пп. 12-16, в котором положение или направление источника звука, принятое как часть данных преобразования, поворачивается в качестве реакции на данные ориентации головы.17. The method according to any one of paragraphs. 12-16, in which the position or direction of the sound source, adopted as part of the conversion data, is rotated in response to head orientation data. 18. Способ по п. 17, в котором максимальная величина поворота ограничивается значением менее 360 градусов по азимуту или по углу места.18. The method according to p. 17, in which the maximum amount of rotation is limited to less than 360 degrees in azimuth or elevation. 19. Способ по любому из пп. 12-17, в котором вторичная презентация получается из первой презентации путем матрицирования в области преобразования или блока фильтров.19. The method according to any one of paragraphs. 12-17, in which the secondary presentation is obtained from the first presentation by matrixing in the transform area or filter block. 20. Способ по любому из пп. 12-19, в котором данные преобразования дополнительно содержат добавочные коэффициенты матрицирования, и этап (d) дополнительно содержит этап, на котором модифицируют первую аудиопрезентацию в качестве реакции на эти добавочные коэффициенты матрицирования, до объединения первой аудиопрезентации и вспомогательного аудиосигнала(ов).20. The method according to any one of paragraphs. 12-19, in which the transform data further comprises additional matrix coefficients, and step (d) further comprises modifying the first audio presentation in response to these additional matrix coefficients, before combining the first audio presentation and the auxiliary audio signal (s). 21. Аппаратура, содержащая одно или более устройств, выполненных с возможностью осуществления способа по любому из пп. 1-20.21. Equipment containing one or more devices configured to implement the method according to any one of paragraphs. 1-20. 22. Машиночитаемый носитель, содержащий программу, состоящую из команд, которые при их исполнении одним или более процессорами предписывают одному или более устройствам выполнять способ по любому из пп. 1-20.22. Machine-readable medium containing a program consisting of instructions that, when executed by one or more processors, instruct one or more devices to perform the method according to any one of claims. 1-20.
RU2018121757A 2015-11-17 2016-11-17 System and method of tracking movement of head for obtaining parametric binaural output signal RU2722391C2 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562256462P 2015-11-17 2015-11-17
US62/256,462 2015-11-17
EP15199854.9 2015-12-14
EP15199854 2015-12-14
PCT/US2016/062497 WO2017087650A1 (en) 2015-11-17 2016-11-17 Headtracking for parametric binaural output system and method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2020116816A Division RU2818687C2 (en) 2015-11-17 2016-11-17 Head tracking system and method for obtaining parametric binaural output signal

Publications (3)

Publication Number Publication Date
RU2018121757A true RU2018121757A (en) 2019-12-19
RU2018121757A3 RU2018121757A3 (en) 2020-03-25
RU2722391C2 RU2722391C2 (en) 2020-05-29

Family

ID=69005065

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018121757A RU2722391C2 (en) 2015-11-17 2016-11-17 System and method of tracking movement of head for obtaining parametric binaural output signal

Country Status (5)

Country Link
JP (1) JP6964703B2 (en)
ES (1) ES2779603T3 (en)
IL (1) IL274432B (en)
MX (1) MX384922B (en)
RU (1) RU2722391C2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116648931A (en) * 2020-10-13 2023-08-25 弗劳恩霍夫应用研究促进协会 Apparatus and method for encoding multiple audio objects using directional information during downmixing or decoding using optimized covariance synthesis
CN115379339A (en) * 2022-08-29 2022-11-22 歌尔科技有限公司 Audio processing method and device and electronic equipment
KR20250103037A (en) * 2023-12-28 2025-07-07 삼성전자주식회사 Electric device for audio processing and method thereof

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
CN102768836B (en) * 2006-09-29 2014-11-05 韩国电子通信研究院 Apparatus and method for coding and decoding multi-object audio signal with various channel
UA94117C2 (en) * 2006-10-16 2011-04-11 Долби Свиден Ав Improved coding and parameter dysplaying of mixed object multichannel coding
AU2008243406B2 (en) * 2007-04-26 2011-08-25 Dolby International Ab Apparatus and method for synthesizing an output signal
RU2011147119A (en) * 2009-04-21 2013-05-27 Конинклейке Филипс Электроникс Н.В. AUDIO SYNTHESIS
KR101567461B1 (en) * 2009-11-16 2015-11-09 삼성전자주식회사 Apparatus for generating multi-channel sound signal
BR112014017457A8 (en) * 2012-01-19 2017-07-04 Koninklijke Philips Nv spatial audio transmission apparatus; space audio coding apparatus; method of generating spatial audio output signals; and spatial audio coding method
US10204614B2 (en) * 2013-05-31 2019-02-12 Nokia Technologies Oy Audio scene apparatus

Also Published As

Publication number Publication date
RU2018121757A3 (en) 2020-03-25
JP2020110007A (en) 2020-07-16
RU2020116816A (en) 2020-07-28
IL274432B (en) 2021-05-31
RU2722391C2 (en) 2020-05-29
IL274432A (en) 2020-06-30
MX2018006075A (en) 2019-10-14
ES2779603T3 (en) 2020-08-18
JP6964703B2 (en) 2021-11-10
MX384922B (en) 2025-03-14

Similar Documents

Publication Publication Date Title
JP7781978B2 (en) Method and apparatus for decoding an ambisonics audio sound field representation for audio reproduction using a 2D setup
KR102829373B1 (en) Headtracking for parametric binaural output system and method
US9984694B2 (en) Method and device for improving the rendering of multi-channel audio signals
JP6047240B2 (en) Segment-by-segment adjustments to different playback speaker settings for spatial audio signals
US11856389B2 (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using direct component compensation
US8407059B2 (en) Method and apparatus of audio matrix encoding/decoding
RU2018121757A (en) SYSTEM AND METHOD OF HEADING MOTION OF THE HEAD FOR OBTAINING A PARAMETRIC BINAURAL OUTPUT SIGNAL
KR20220093158A (en) Multichannel audio encoding and decoding using directional metadata
KR100763919B1 (en) Method and apparatus for decoding an input signal obtained by compressing a multichannel signal into a mono or stereo signal into a binaural signal of two channels
EP3984027B1 (en) Packet loss concealment for dirac based spatial audio coding
CA3246833A1 (en) Apparatus, methods and computer programs for enabling rendering of spatial audio
RU2807473C2 (en) PACKET LOSS MASKING FOR DirAC-BASED SPATIAL AUDIO CODING
RU2024111576A (en) HEAD MOTION TRACKING SYSTEM AND METHOD FOR OBTAINING PARAMETRIC BINAURAL OUTPUT SIGNAL
JP2011002574A (en) 3-dimensional sound encoding device, 3-dimensional sound decoding device, encoding program and decoding program
RU2818687C2 (en) Head tracking system and method for obtaining parametric binaural output signal
HK40052040A (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding using direct component compensation
HK40052040B (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding using direct component compensation
Favrot et al. Reproduction of nearby sound sources using high-order ambisonics: Implementation and evaluation
HK40052468B (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding using diffuse compensation
HK40052468A (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding using diffuse compensation
HK40052467A (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding using low-order, mid-order and high-order components generators
HK40052467B (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding using low-order, mid-order and high-order components generators