Claims (28)
1. Система, выполненная с возможностью декодирования аудиосигнала, причем система содержит:1. A system capable of decoding an audio signal, the system comprising:
один или более процессоров; иone or more processors; and
долговременный машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают одному или более процессорам выполнять операции, содержащие:a non-transitory machine-readable medium on which instructions are stored that, when executed by one or more processors, cause one or more processors to perform operations comprising:
прием кодированного аудиосигнала, причем кодированный аудиосигнал включает в себя:receiving an encoded audio signal, wherein the encoded audio signal includes:
- начальное выходное представление,- initial output representation,
- направление доминантного аудиокомпонента и- the direction of the dominant audio component and
- весовые коэффициенты доминантного аудиокомпонента;- weighting coefficients of the dominant audio component;
определение оценочного доминантного компонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;determining an estimated dominant component based on the weighting coefficients of the dominant audio component and the initial output representation;
формирование отрендеренного бинаурализированного оценочного доминантного компонента, включая выполнение рендеринга оценочного доминантного компонента с бинаурализацией в пространственном местоположении относительно целевого слушателя в соответствии с направлением доминантного аудиокомпонента;generating a rendered binauralized estimated dominant component, including rendering the estimated dominant component with binauralization at a spatial location relative to the target listener in accordance with the direction of the dominant audio component;
реконструкцию оценки остаточного компонента из начального выходного представления; иreconstructing the residual component estimate from the initial output representation; and
генерирование выходного пространственно ориентированного аудиосигнала посредством объединения отрендеренного бинаурализированного оценочного доминантного компонента и оценки остаточного компонента.generating an output spatially oriented audio signal by combining the rendered binauralized estimated dominant component and the estimated residual component.
2. Система по п.1, в которой кодированный аудиосигнал дополнительно включает в себя последовательность остаточных матричных коэффициентов, представляющих остаточный аудиосигнал, при этом упомянутая реконструкция оценки остаточного компонента дополнительно содержит применение упомянутых остаточных матричных коэффициентов к начальному выходному представлению, чтобы реконструировать оценку остаточного компонента.2. The system of claim 1, wherein the encoded audio signal further includes a sequence of residual matrix coefficients representing the residual audio signal, wherein said reconstructing the residual component estimate further comprises applying said residual matrix coefficients to the initial output representation to reconstruct the residual component estimate.
3. Система по п.1, в которой оценка остаточного компонента реконструируется вычитанием отрендеренного бинаурализированного оценочного доминантного компонента из начального выходного представления.3. The system of claim 1, wherein the residual component estimate is reconstructed by subtracting the rendered binauralized estimated dominant component from the initial output representation.
4. Система по п.1, в которой упомянутое формирование отрендеренного бинаурализированного оценочного доминантного компонента включает в себя начальный поворот оценочного доминантного компонента в соответствии с входным сигналом слежения за движением головы, указывающим ориентацию головы целевого слушателя.4. The system of claim 1, wherein said generating the rendered binauralized estimated dominant component includes initially rotating the estimated dominant component in accordance with a head tracking input signal indicating the orientation of the head of the target listener.
5. Система по п.1, в которой оценка остаточного компонента реконструируется вычитанием отрендеренного бинаурализированного оценочного доминантного компонента из начального выходного представления, и в которой упомянутое формирование отрендеренного бинаурализированного оценочного доминантного компонента включает в себя начальный поворот оценочного доминантного компонента в соответствии с входным сигналом слежения за движением головы, указывающим ориентацию головы целевого слушателя.5. The system of claim 1, wherein the residual component estimate is reconstructed by subtracting the rendered binauralized estimated dominant component from the initial output representation, and wherein said generating the rendered binauralized estimated dominant component includes initially rotating the estimated dominant component according to a head tracking input signal indicating the orientation of the target listener's head.
6. Система по п.1, в которой начальное выходное представление содержит представление посредством наушников или представление посредством громкоговорителя.6. The system of claim 1, wherein the initial output representation comprises a headphone representation or a loudspeaker representation.
7. Система по п.1, в которой начальное выходное представление содержит микс стереогромкоговорителей.7. The system of claim 1, wherein the initial output representation comprises a stereo speaker mix.
8. Система по п.1, в которой начальное выходное представление содержит стерео даун-микс.8. The system of claim 1, wherein the initial output representation comprises a stereo downmix.
9. Система по п.1, в которой кодированный аудиосигнал соответствует входному аудиосигналу, основывающемуся на канале или объекте, который разбит на элементы разбиения по времени и частоте, при этом входной аудиосигнал кодируется по последовательности временных шагов и последовательности полос частот.9. The system of claim 1, wherein the encoded audio signal corresponds to an input audio signal based on a channel or object that is partitioned into time and frequency partitioning elements, wherein the input audio signal is encoded over a sequence of time steps and a sequence of frequency bands.
10. Долговременный машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают одному или более устройствам выполнять операции, содержащие:10. A non-transitory machine-readable medium on which instructions are stored that, when executed by one or more processors, cause one or more devices to perform operations comprising:
прием кодированного аудиосигнала, причем кодированный аудиосигнал включает в себя:receiving an encoded audio signal, wherein the encoded audio signal includes:
- начальное выходное представление,- initial output representation,
- направление доминантного аудиокомпонента и- the direction of the dominant audio component and
- весовые коэффициенты доминантного аудиокомпонента;- weighting coefficients of the dominant audio component;
определение оценочного доминантного компонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;determining an estimated dominant component based on the weighting coefficients of the dominant audio component and the initial output representation;
формирование отрендеренного бинаурализированного оценочного доминантного компонента, включая выполнение рендеринга оценочного доминантного компонента с бинаурализацией в пространственном местоположении относительно целевого слушателя в соответствии с направлением доминантного аудиокомпонента;generating a rendered binauralized estimated dominant component, including rendering the estimated dominant component with binauralization at a spatial location relative to the target listener in accordance with the direction of the dominant audio component;
реконструкцию оценки остаточного компонента из начального выходного представления; иreconstructing the residual component estimate from the initial output representation; and
генерирование выходного пространственно ориентированного аудиосигнала посредством объединения отрендеренного бинаурализированного оценочного доминантного компонента и оценки остаточного компонента.generating an output spatially oriented audio signal by combining the rendered binauralized estimated dominant component and the estimated residual component.