[go: up one dir, main page]

RU2024111576A - HEAD MOTION TRACKING SYSTEM AND METHOD FOR OBTAINING PARAMETRIC BINAURAL OUTPUT SIGNAL - Google Patents

HEAD MOTION TRACKING SYSTEM AND METHOD FOR OBTAINING PARAMETRIC BINAURAL OUTPUT SIGNAL

Info

Publication number
RU2024111576A
RU2024111576A RU2024111576A RU2024111576A RU2024111576A RU 2024111576 A RU2024111576 A RU 2024111576A RU 2024111576 A RU2024111576 A RU 2024111576A RU 2024111576 A RU2024111576 A RU 2024111576A RU 2024111576 A RU2024111576 A RU 2024111576A
Authority
RU
Russia
Prior art keywords
component
dominant
audio signal
initial output
estimated
Prior art date
Application number
RU2024111576A
Other languages
Russian (ru)
Inventor
Дирк Ерун Бребарт
Дэвид Мэттью Купер
Марк Ф. ДЭВИС
Дэвид С. МАКГРАТ
Кристофер ЧЕРЛИНГ
Харальд МУНДТ
Ронда Дж. УИЛСОН
Original Assignee
Долби Лэборетериз Лайсенсинг Корпорейшн
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лэборетериз Лайсенсинг Корпорейшн, Долби Интернэшнл Аб filed Critical Долби Лэборетериз Лайсенсинг Корпорейшн
Publication of RU2024111576A publication Critical patent/RU2024111576A/en

Links

Claims (28)

1. Система, выполненная с возможностью декодирования аудиосигнала, причем система содержит:1. A system capable of decoding an audio signal, the system comprising: один или более процессоров; иone or more processors; and долговременный машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают одному или более процессорам выполнять операции, содержащие:a non-transitory machine-readable medium on which instructions are stored that, when executed by one or more processors, cause one or more processors to perform operations comprising: прием кодированного аудиосигнала, причем кодированный аудиосигнал включает в себя:receiving an encoded audio signal, wherein the encoded audio signal includes: - начальное выходное представление,- initial output representation, - направление доминантного аудиокомпонента и- the direction of the dominant audio component and - весовые коэффициенты доминантного аудиокомпонента;- weighting coefficients of the dominant audio component; определение оценочного доминантного компонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;determining an estimated dominant component based on the weighting coefficients of the dominant audio component and the initial output representation; формирование отрендеренного бинаурализированного оценочного доминантного компонента, включая выполнение рендеринга оценочного доминантного компонента с бинаурализацией в пространственном местоположении относительно целевого слушателя в соответствии с направлением доминантного аудиокомпонента;generating a rendered binauralized estimated dominant component, including rendering the estimated dominant component with binauralization at a spatial location relative to the target listener in accordance with the direction of the dominant audio component; реконструкцию оценки остаточного компонента из начального выходного представления; иreconstructing the residual component estimate from the initial output representation; and генерирование выходного пространственно ориентированного аудиосигнала посредством объединения отрендеренного бинаурализированного оценочного доминантного компонента и оценки остаточного компонента.generating an output spatially oriented audio signal by combining the rendered binauralized estimated dominant component and the estimated residual component. 2. Система по п.1, в которой кодированный аудиосигнал дополнительно включает в себя последовательность остаточных матричных коэффициентов, представляющих остаточный аудиосигнал, при этом упомянутая реконструкция оценки остаточного компонента дополнительно содержит применение упомянутых остаточных матричных коэффициентов к начальному выходному представлению, чтобы реконструировать оценку остаточного компонента.2. The system of claim 1, wherein the encoded audio signal further includes a sequence of residual matrix coefficients representing the residual audio signal, wherein said reconstructing the residual component estimate further comprises applying said residual matrix coefficients to the initial output representation to reconstruct the residual component estimate. 3. Система по п.1, в которой оценка остаточного компонента реконструируется вычитанием отрендеренного бинаурализированного оценочного доминантного компонента из начального выходного представления.3. The system of claim 1, wherein the residual component estimate is reconstructed by subtracting the rendered binauralized estimated dominant component from the initial output representation. 4. Система по п.1, в которой упомянутое формирование отрендеренного бинаурализированного оценочного доминантного компонента включает в себя начальный поворот оценочного доминантного компонента в соответствии с входным сигналом слежения за движением головы, указывающим ориентацию головы целевого слушателя.4. The system of claim 1, wherein said generating the rendered binauralized estimated dominant component includes initially rotating the estimated dominant component in accordance with a head tracking input signal indicating the orientation of the head of the target listener. 5. Система по п.1, в которой оценка остаточного компонента реконструируется вычитанием отрендеренного бинаурализированного оценочного доминантного компонента из начального выходного представления, и в которой упомянутое формирование отрендеренного бинаурализированного оценочного доминантного компонента включает в себя начальный поворот оценочного доминантного компонента в соответствии с входным сигналом слежения за движением головы, указывающим ориентацию головы целевого слушателя.5. The system of claim 1, wherein the residual component estimate is reconstructed by subtracting the rendered binauralized estimated dominant component from the initial output representation, and wherein said generating the rendered binauralized estimated dominant component includes initially rotating the estimated dominant component according to a head tracking input signal indicating the orientation of the target listener's head. 6. Система по п.1, в которой начальное выходное представление содержит представление посредством наушников или представление посредством громкоговорителя.6. The system of claim 1, wherein the initial output representation comprises a headphone representation or a loudspeaker representation. 7. Система по п.1, в которой начальное выходное представление содержит микс стереогромкоговорителей.7. The system of claim 1, wherein the initial output representation comprises a stereo speaker mix. 8. Система по п.1, в которой начальное выходное представление содержит стерео даун-микс.8. The system of claim 1, wherein the initial output representation comprises a stereo downmix. 9. Система по п.1, в которой кодированный аудиосигнал соответствует входному аудиосигналу, основывающемуся на канале или объекте, который разбит на элементы разбиения по времени и частоте, при этом входной аудиосигнал кодируется по последовательности временных шагов и последовательности полос частот.9. The system of claim 1, wherein the encoded audio signal corresponds to an input audio signal based on a channel or object that is partitioned into time and frequency partitioning elements, wherein the input audio signal is encoded over a sequence of time steps and a sequence of frequency bands. 10. Долговременный машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают одному или более устройствам выполнять операции, содержащие:10. A non-transitory machine-readable medium on which instructions are stored that, when executed by one or more processors, cause one or more devices to perform operations comprising: прием кодированного аудиосигнала, причем кодированный аудиосигнал включает в себя:receiving an encoded audio signal, wherein the encoded audio signal includes: - начальное выходное представление,- initial output representation, - направление доминантного аудиокомпонента и- the direction of the dominant audio component and - весовые коэффициенты доминантного аудиокомпонента;- weighting coefficients of the dominant audio component; определение оценочного доминантного компонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;determining an estimated dominant component based on the weighting coefficients of the dominant audio component and the initial output representation; формирование отрендеренного бинаурализированного оценочного доминантного компонента, включая выполнение рендеринга оценочного доминантного компонента с бинаурализацией в пространственном местоположении относительно целевого слушателя в соответствии с направлением доминантного аудиокомпонента;generating a rendered binauralized estimated dominant component, including rendering the estimated dominant component with binauralization at a spatial location relative to the target listener in accordance with the direction of the dominant audio component; реконструкцию оценки остаточного компонента из начального выходного представления; иreconstructing the residual component estimate from the initial output representation; and генерирование выходного пространственно ориентированного аудиосигнала посредством объединения отрендеренного бинаурализированного оценочного доминантного компонента и оценки остаточного компонента.generating an output spatially oriented audio signal by combining the rendered binauralized estimated dominant component and the estimated residual component.
RU2024111576A 2015-11-17 2024-04-26 HEAD MOTION TRACKING SYSTEM AND METHOD FOR OBTAINING PARAMETRIC BINAURAL OUTPUT SIGNAL RU2024111576A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/256,462 2015-11-17
EP15199854.9 2015-12-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2020116816A Division RU2818687C2 (en) 2015-11-17 2016-11-17 Head tracking system and method for obtaining parametric binaural output signal

Publications (1)

Publication Number Publication Date
RU2024111576A true RU2024111576A (en) 2025-10-27

Family

ID=

Similar Documents

Publication Publication Date Title
ZA202407202B (en) Method for and apparatus for decoding an ambisonics audio soundfield representation for audio playback using 2d setups
IL314275B1 (en) Coding of audio scenes
MX351577B (en) Apparatus and method realizing a fading of an mdct spectrum to white noise prior to fdns application.
MX2016000699A (en) Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder.
PH12016502356A1 (en) Reducing correlation between higher order ambisonic (hoa) background channels
JP2016523467A5 (en)
MX2022012186A (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation.
MX362419B (en) Apparatus and method for enhancing an audio signal, sound enhancing system.
EP4358083A3 (en) Time-domain stereo encoding and decoding method and related product
JP2017501440A5 (en)
EP4358085A3 (en) Signal processing device, method, and program
MY180290A (en) Decoding method and decoding apparatus
RU2016105686A (en) DEVICE AND METHOD FOR DECODING CODED AUDIO SIGNAL FOR RECEIVING MODIFIED OUTPUT SIGNALS
PH12018501120A1 (en) Intelligent audio rendering
RU2018121757A (en) SYSTEM AND METHOD OF HEADING MOTION OF THE HEAD FOR OBTAINING A PARAMETRIC BINAURAL OUTPUT SIGNAL
RU2024111576A (en) HEAD MOTION TRACKING SYSTEM AND METHOD FOR OBTAINING PARAMETRIC BINAURAL OUTPUT SIGNAL
WO2016149085A3 (en) System and method for dynamic recovery of audio data and compressed audio enhancement
RU2023120507A (en) PROCESSING SPATIALLY DIFFUSE OR LARGE SOUND OBJECTS
RU2021130656A (en) METHOD AND DEVICE FOR APPLYING DYNAMIC RANGE COMPRESSION TO HIGH-ORDER AMBIOPHONY SIGNAL
TH170243A (en) A machine and a method to achieve the gradual reduction of the MDCT spray to white noise prior to the application of FDNS.
TH159444A (en) Rendering of sound objects of the desired size appearing in the broadcast layout.