RU2018132859A

RU2018132859A - Классификация и кодирование аудиосигналов

Info

Publication number: RU2018132859A
Application number: RU2018132859A
Authority: RU
Inventors: Эрик НОРВЕЛЛ; Стефан БРУН
Original assignee: Телефонактиеболагет Лм Эрикссон (Пабл)
Priority date: 2014-05-15
Filing date: 2015-05-12
Publication date: 2018-12-06
Also published as: AR105147A1; RU2016148874A3; RU2668111C2; KR20180095123A; RU2765985C2; CN106415717A; US20160260444A1; EP3143620A1; US20190057708A1; CN111192595A; CN106415717B; US9666210B2; WO2015174912A1; MX2019011956A; US10121486B2; CN111192595B; US9837095B2; US10297264B2; RU2016148874A; KR20160146910A

Claims

1. Способ для декодирования аудиосигнала, при этом способ содержит этапы, на которых:

- определяют (201) значение D(m) стабильности на основе разности, в области преобразования, между диапазоном спектральной огибающей кадра m и соответствующим диапазоном спектральной огибающей смежного кадра m-1, причем каждый диапазон содержит набор квантованных значений спектральной огибающей, связанных с энергией в полосах спектра сегмента аудиосигнала;

- выбирают (204) режим декодирования из множества режимов декодирования на основе значения D(m) стабильности; и

- применяют (205) выбранный режим декодирования.

2. Способ по п. 1, дополнительно содержащий этапы, на которых:

- подвергают (202) фильтрации нижних частот значение D(m) стабильности, за счет этого достигая фильтрованного значения

стабильности;

- преобразуют (203) фильтрованное значение

стабильности в скалярный диапазон [0,1] посредством использования сигмоидальной функции, за счет этого достигая параметра S(m) стабильности; и

- при этом выбор режима декодирования основан на параметре S(m) стабильности.

3. Способ по п. 1 или 2, в котором выбор режима декодирования содержит этап, на котором определяют то, содержит сегмент аудиосигнала, представленного в кадре m, речь или музыку.

4. Способ по любому из предшествующих пунктов, в котором, по меньшей мере, один режим декодирования из множества режимов декодирования является более подходящим для речи, чем для музыки, и, по меньшей мере, один режим декодирования является более подходящим для музыки, чем для речи.

5. Способ по любому из предшествующих пунктов, в котором выбор режима декодирования из множества режимов декодирования связан с маскированием ошибок.

6. Способ по любому из предшествующих пунктов, в котором выбор режима декодирования дополнительно основан на модели Маркова, задающей вероятности перехода состояния, связанные с переходами между различными свойствами сигнала в аудиосигнале.

7. Способ по любому из предшествующих пунктов, в котором выбор режима декодирования дополнительно основан на модели Маркова, задающей вероятности перехода состояния, связанные с переходами между речью и музыкой в аудиосигнале.

8. Способ по любому из пп. 1-4, в котором выбор режима декодирования дополнительно основан на показателе переходных частей, указывающем структуру переходных частей спектрального контента кадра m.

9. Способ по любому из предшествующих пунктов, в котором значение D(m) стабильности определяется следующим образом:

,

где b_i обозначает полосу спектра в кадре m, и E(m,b) обозначает показатель энергии для полосы b частот в кадре m.

10. Декодер для декодирования аудиосигнала, причем декодер выполнен с возможностью:

- определять значение D(m) стабильности на основе разности, в области преобразования, между диапазоном спектральной огибающей кадра m и соответствующим диапазоном спектральной огибающей смежного кадра m-1, причем каждый диапазон содержит набор квантованных значений спектральной огибающей, связанных с энергией в полосах спектра сегмента аудиосигнала;

- выбирать режим декодирования из множества режимов декодирования на основе значения D(m) стабильности; и

- применять выбранный режим декодирования.

11. Декодер по п. 10, дополнительно выполненный с возможностью:

- подвергать фильтрации нижних частот значение D(m) стабильности, за счет этого достигая фильтрованного значения

стабильности; и

- преобразовывать (203) фильтрованное значение

12. Декодер по п. 10 или 11, в котором выбор режима декодирования выполнен с возможностью содержать определение того, содержит сегмент аудиосигнала, представленного в кадре m, речь или музыку.

13. Декодер по любому из пп. 10-12, в котором, по меньшей мере, один режим декодирования из множества режимов декодирования является более подходящим для речи, чем для музыки, и, по меньшей мере, один режим декодирования является более подходящим для музыки, чем для речи.

14. Декодер по любому из пп. 10-13, в котором выбор режима декодирования из множества режимов декодирования связан с маскированием ошибок.

15. Декодер по любому из пп. 10-14, в котором выбор режима декодирования выполнен с возможностью быть основанным на модели Маркова, задающей вероятности перехода состояния, связанные с переходами между речью и музыкой в аудиосигнале.

16. Декодер по любому из пп. 10-13, выполненный с возможностью дополнительно основывать выбор режима декодирования на показателе переходных частей, указывающем структуру переходных частей спектрального контента кадра m.

17. Декодер по любому из пп. 10-16, выполненный с возможностью определять значение D(m) стабильности следующим образом:

,

18. Хост-устройство, содержащее декодер по любому из пп. 10-17.

19. Машиночитаемый носитель хранения данных, содержащий инструкции, которые при выполнении, по меньшей мере, на одном процессоре инструктируют, по меньшей мере, одному процессору осуществлять способ по любому из пп. 1-9.