RU2018132859A - Классификация и кодирование аудиосигналов - Google Patents
Классификация и кодирование аудиосигналов Download PDFInfo
- Publication number
- RU2018132859A RU2018132859A RU2018132859A RU2018132859A RU2018132859A RU 2018132859 A RU2018132859 A RU 2018132859A RU 2018132859 A RU2018132859 A RU 2018132859A RU 2018132859 A RU2018132859 A RU 2018132859A RU 2018132859 A RU2018132859 A RU 2018132859A
- Authority
- RU
- Russia
- Prior art keywords
- decoding mode
- stability
- decoding
- frame
- paragraphs
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (35)
1. Способ для декодирования аудиосигнала, при этом способ содержит этапы, на которых:
- определяют (201) значение D(m) стабильности на основе разности, в области преобразования, между диапазоном спектральной огибающей кадра m и соответствующим диапазоном спектральной огибающей смежного кадра m-1, причем каждый диапазон содержит набор квантованных значений спектральной огибающей, связанных с энергией в полосах спектра сегмента аудиосигнала;
- выбирают (204) режим декодирования из множества режимов декодирования на основе значения D(m) стабильности; и
- применяют (205) выбранный режим декодирования.
2. Способ по п. 1, дополнительно содержащий этапы, на которых:
- при этом выбор режима декодирования основан на параметре S(m) стабильности.
3. Способ по п. 1 или 2, в котором выбор режима декодирования содержит этап, на котором определяют то, содержит сегмент аудиосигнала, представленного в кадре m, речь или музыку.
4. Способ по любому из предшествующих пунктов, в котором, по меньшей мере, один режим декодирования из множества режимов декодирования является более подходящим для речи, чем для музыки, и, по меньшей мере, один режим декодирования является более подходящим для музыки, чем для речи.
5. Способ по любому из предшествующих пунктов, в котором выбор режима декодирования из множества режимов декодирования связан с маскированием ошибок.
6. Способ по любому из предшествующих пунктов, в котором выбор режима декодирования дополнительно основан на модели Маркова, задающей вероятности перехода состояния, связанные с переходами между различными свойствами сигнала в аудиосигнале.
7. Способ по любому из предшествующих пунктов, в котором выбор режима декодирования дополнительно основан на модели Маркова, задающей вероятности перехода состояния, связанные с переходами между речью и музыкой в аудиосигнале.
8. Способ по любому из пп. 1-4, в котором выбор режима декодирования дополнительно основан на показателе переходных частей, указывающем структуру переходных частей спектрального контента кадра m.
9. Способ по любому из предшествующих пунктов, в котором значение D(m) стабильности определяется следующим образом:
где bi обозначает полосу спектра в кадре m, и E(m,b) обозначает показатель энергии для полосы b частот в кадре m.
10. Декодер для декодирования аудиосигнала, причем декодер выполнен с возможностью:
- определять значение D(m) стабильности на основе разности, в области преобразования, между диапазоном спектральной огибающей кадра m и соответствующим диапазоном спектральной огибающей смежного кадра m-1, причем каждый диапазон содержит набор квантованных значений спектральной огибающей, связанных с энергией в полосах спектра сегмента аудиосигнала;
- выбирать режим декодирования из множества режимов декодирования на основе значения D(m) стабильности; и
- применять выбранный режим декодирования.
11. Декодер по п. 10, дополнительно выполненный с возможностью:
- при этом выбор режима декодирования основан на параметре S(m) стабильности.
12. Декодер по п. 10 или 11, в котором выбор режима декодирования выполнен с возможностью содержать определение того, содержит сегмент аудиосигнала, представленного в кадре m, речь или музыку.
13. Декодер по любому из пп. 10-12, в котором, по меньшей мере, один режим декодирования из множества режимов декодирования является более подходящим для речи, чем для музыки, и, по меньшей мере, один режим декодирования является более подходящим для музыки, чем для речи.
14. Декодер по любому из пп. 10-13, в котором выбор режима декодирования из множества режимов декодирования связан с маскированием ошибок.
15. Декодер по любому из пп. 10-14, в котором выбор режима декодирования выполнен с возможностью быть основанным на модели Маркова, задающей вероятности перехода состояния, связанные с переходами между речью и музыкой в аудиосигнале.
16. Декодер по любому из пп. 10-13, выполненный с возможностью дополнительно основывать выбор режима декодирования на показателе переходных частей, указывающем структуру переходных частей спектрального контента кадра m.
17. Декодер по любому из пп. 10-16, выполненный с возможностью определять значение D(m) стабильности следующим образом:
где bi обозначает полосу спектра в кадре m, и E(m,b) обозначает показатель энергии для полосы b частот в кадре m.
18. Хост-устройство, содержащее декодер по любому из пп. 10-17.
19. Машиночитаемый носитель хранения данных, содержащий инструкции, которые при выполнении, по меньшей мере, на одном процессоре инструктируют, по меньшей мере, одному процессору осуществлять способ по любому из пп. 1-9.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201461993639P | 2014-05-15 | 2014-05-15 | |
| US61/993,639 | 2014-05-15 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2016148874A Division RU2668111C2 (ru) | 2014-05-15 | 2015-05-12 | Классификация и кодирование аудиосигналов |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| RU2018132859A true RU2018132859A (ru) | 2018-12-06 |
| RU2018132859A3 RU2018132859A3 (ru) | 2021-09-09 |
| RU2765985C2 RU2765985C2 (ru) | 2022-02-07 |
Family
ID=53276234
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2018132859A RU2765985C2 (ru) | 2014-05-15 | 2015-05-12 | Классификация и кодирование аудиосигналов |
| RU2016148874A RU2668111C2 (ru) | 2014-05-15 | 2015-05-12 | Классификация и кодирование аудиосигналов |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2016148874A RU2668111C2 (ru) | 2014-05-15 | 2015-05-12 | Классификация и кодирование аудиосигналов |
Country Status (8)
| Country | Link |
|---|---|
| US (4) | US9666210B2 (ru) |
| EP (1) | EP3143620A1 (ru) |
| KR (2) | KR20180095123A (ru) |
| CN (2) | CN111192595B (ru) |
| AR (1) | AR105147A1 (ru) |
| MX (2) | MX368572B (ru) |
| RU (2) | RU2765985C2 (ru) |
| WO (1) | WO2015174912A1 (ru) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101291193B1 (ko) * | 2006-11-30 | 2013-07-31 | 삼성전자주식회사 | 프레임 오류은닉방법 |
| KR20180095123A (ko) * | 2014-05-15 | 2018-08-24 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 오디오 신호 분류 및 코딩 |
| EP3796314B1 (en) * | 2014-07-28 | 2021-12-22 | Nippon Telegraph And Telephone Corporation | Coding of a sound signal |
| HK1244948A1 (zh) * | 2014-12-09 | 2018-08-17 | Dolby International Ab | Mdct域错误掩盖 |
| TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
| CN107731223B (zh) * | 2017-11-22 | 2022-07-26 | 腾讯科技(深圳)有限公司 | 语音活性检测方法、相关装置和设备 |
| CN108123786B (zh) * | 2017-12-18 | 2020-11-06 | 中国电子科技集团公司第五十四研究所 | 基于交织多址的tdcs多址接入方法 |
| JP7130878B2 (ja) * | 2019-01-13 | 2022-09-05 | 華為技術有限公司 | 高分解能オーディオコーディング |
| CN112634920B (zh) * | 2020-12-18 | 2024-01-02 | 平安科技(深圳)有限公司 | 基于域分离的语音转换模型的训练方法及装置 |
| WO2023065254A1 (zh) * | 2021-10-21 | 2023-04-27 | 北京小米移动软件有限公司 | 一种信号编解码方法、装置、编码设备、解码设备及存储介质 |
| CN120673771A (zh) * | 2022-12-13 | 2025-09-19 | 瑞典爱立信有限公司 | 多模式音频解码器中的改进转换 |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6256487B1 (en) * | 1998-09-01 | 2001-07-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Multiple mode transmitter using multiple speech/channel coding modes wherein the coding mode is conveyed to the receiver with the transmitted signal |
| CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
| CN1930607B (zh) * | 2004-03-05 | 2010-11-10 | 松下电器产业株式会社 | 差错隐藏装置以及差错隐藏方法 |
| US7596491B1 (en) * | 2005-04-19 | 2009-09-29 | Texas Instruments Incorporated | Layered CELP system and method |
| KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
| CN102768836B (zh) * | 2006-09-29 | 2014-11-05 | 韩国电子通信研究院 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
| CN101025918B (zh) * | 2007-01-19 | 2011-06-29 | 清华大学 | 一种语音/音乐双模编解码无缝切换方法 |
| US8160872B2 (en) * | 2007-04-05 | 2012-04-17 | Texas Instruments Incorporated | Method and apparatus for layered code-excited linear prediction speech utilizing linear prediction excitation corresponding to optimal gains |
| US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
| US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
| PT2301011T (pt) * | 2008-07-11 | 2018-10-26 | Fraunhofer Ges Forschung | Método e discriminador para classificar diferentes segmentos de um sinal de áudio compreendendo segmentos de discurso e de música |
| WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
| KR20120000055A (ko) * | 2009-03-13 | 2012-01-03 | 파나소닉 주식회사 | 음성 부호화 장치, 음성 복호 장치, 음성 부호화 방법 및 음성 복호 방법 |
| CN101661749A (zh) * | 2009-09-23 | 2010-03-03 | 清华大学 | 一种语音和音乐双模切换编/解码的方法 |
| CN102648494B (zh) * | 2009-10-08 | 2014-07-02 | 弗兰霍菲尔运输应用研究公司 | 多模式音频信号解码器、多模式音频信号编码器、使用基于线性预测编码的噪声塑形的方法 |
| KR101551046B1 (ko) * | 2011-02-14 | 2015-09-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 |
| KR20180095123A (ko) * | 2014-05-15 | 2018-08-24 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 오디오 신호 분류 및 코딩 |
-
2015
- 2015-05-12 KR KR1020187023536A patent/KR20180095123A/ko not_active Ceased
- 2015-05-12 RU RU2018132859A patent/RU2765985C2/ru active
- 2015-05-12 CN CN202010186693.3A patent/CN111192595B/zh active Active
- 2015-05-12 RU RU2016148874A patent/RU2668111C2/ru active
- 2015-05-12 EP EP15726394.8A patent/EP3143620A1/en not_active Ceased
- 2015-05-12 US US14/649,573 patent/US9666210B2/en active Active
- 2015-05-12 KR KR1020167032565A patent/KR20160146910A/ko not_active Ceased
- 2015-05-12 MX MX2018000375A patent/MX368572B/es unknown
- 2015-05-12 CN CN201580026065.6A patent/CN106415717B/zh active Active
- 2015-05-12 WO PCT/SE2015/050531 patent/WO2015174912A1/en not_active Ceased
- 2015-05-14 AR ARP150101515A patent/AR105147A1/es unknown
-
2016
- 2016-11-01 MX MX2019011956A patent/MX2019011956A/es unknown
-
2017
- 2017-04-17 US US15/488,967 patent/US9837095B2/en active Active
- 2017-10-30 US US15/797,725 patent/US10121486B2/en active Active
-
2018
- 2018-10-22 US US16/166,976 patent/US10297264B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| AR105147A1 (es) | 2017-09-13 |
| RU2016148874A3 (ru) | 2018-06-18 |
| RU2668111C2 (ru) | 2018-09-26 |
| KR20180095123A (ko) | 2018-08-24 |
| RU2765985C2 (ru) | 2022-02-07 |
| CN106415717A (zh) | 2017-02-15 |
| US20160260444A1 (en) | 2016-09-08 |
| EP3143620A1 (en) | 2017-03-22 |
| US20190057708A1 (en) | 2019-02-21 |
| CN111192595A (zh) | 2020-05-22 |
| CN106415717B (zh) | 2020-03-13 |
| US9666210B2 (en) | 2017-05-30 |
| WO2015174912A1 (en) | 2015-11-19 |
| MX2019011956A (es) | 2019-10-30 |
| US10121486B2 (en) | 2018-11-06 |
| CN111192595B (zh) | 2023-09-22 |
| US9837095B2 (en) | 2017-12-05 |
| US10297264B2 (en) | 2019-05-21 |
| RU2016148874A (ru) | 2018-06-18 |
| KR20160146910A (ko) | 2016-12-21 |
| MX368572B (es) | 2019-10-08 |
| US20180047404A1 (en) | 2018-02-15 |
| US20170221497A1 (en) | 2017-08-03 |
| RU2018132859A3 (ru) | 2021-09-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2018132859A (ru) | Классификация и кодирование аудиосигналов | |
| ES2909183T3 (es) | Procedimientos y aparatos de clasificación de señales de audio | |
| RU2019137625A (ru) | Способ и устройство для предоставления компенсационных смещений для набора восстановленных выборок изображения | |
| JP6364518B2 (ja) | オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 | |
| RU2017103905A (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
| ES2834391T3 (es) | Codificación de una señal de audio | |
| RU2012115551A (ru) | Кодирующее устройство, декодирующее устройство и способ | |
| DE602005006551D1 (de) | Kodierungs-, dekodierungsvorrichtung und methode dafür | |
| RU2015136540A (ru) | Усовершенствованная коррекция потери кадров во время декодирования сигналов | |
| JP2005242363A5 (ru) | ||
| RU2013146688A (ru) | Устройство и способ для выполнения кодирования методом хаффмана | |
| JP6616470B2 (ja) | 符号化方法、復号化方法、符号化装置及び復号化装置 | |
| RU2016136008A (ru) | Улучшенное расширение диапазона частот в декодере звукового сигнала | |
| FI3751566T3 (fi) | Menetelmiä, kooderi ja dekooderi äänisignaalien lineaariseen ennakoivaan koodaukseen ja dekoodaukseen näytteistystaajuudeltaan erilaisten kehysten välillä siirryttäessä | |
| RU2017108839A (ru) | Концепция переключения частот дискретизации в устройствах обработки аудиосигналов | |
| JP6439804B2 (ja) | 損失フレームを処理するための方法および装置 | |
| ES2703565T3 (es) | Aparato, método, programa y soporte de registro de análisis predictivo lineal | |
| CN106409303B (zh) | 处理信号的方法及设备 | |
| CA2912477C (en) | Signal encoding and decoding methods and devices | |
| RU2016146916A (ru) | Усовершенствованная коррекция потери кадров с помощью речевой информации | |
| CN104301064B (zh) | 处理丢失帧的方法和解码器 | |
| RU2016111311A (ru) | Проектирование таблицы частотных диапазонов для алгоритмов высокочастотной реконструкции | |
| JP2011170259A (ja) | 音声符号化装置、方法及びプログラム、並びに、コードブックデータ分類集計装置、方法及びプログラム | |
| TH2301008584A (th) | การประมวลผลแบบปรับตัวโดยมีโนดประมวลผลสื่อหลายแบบ | |
| JP2014026284A (ja) | 信号増強システム及び信号増強方法 |