RU2010120678A - Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра - Google Patents
Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра Download PDFInfo
- Publication number
- RU2010120678A RU2010120678A RU2010120678/08A RU2010120678A RU2010120678A RU 2010120678 A RU2010120678 A RU 2010120678A RU 2010120678/08 A RU2010120678/08 A RU 2010120678/08A RU 2010120678 A RU2010120678 A RU 2010120678A RU 2010120678 A RU2010120678 A RU 2010120678A
- Authority
- RU
- Russia
- Prior art keywords
- spectral lines
- transform
- layer
- spectrum
- celp
- Prior art date
Links
- 238000001228 spectrum Methods 0.000 title claims abstract 33
- 230000003595 spectral effect Effects 0.000 claims abstract 79
- 230000005236 sound signal Effects 0.000 claims abstract 32
- 238000000034 method Methods 0.000 claims abstract 24
- 238000001831 conversion spectrum Methods 0.000 claims 14
- 230000002194 synthesizing effect Effects 0.000 claims 5
- 230000015572 biosynthetic process Effects 0.000 claims 3
- 239000011159 matrix material Substances 0.000 claims 2
- 230000005284 excitation Effects 0.000 claims 1
- 238000003786 synthesis reaction Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. Способ для кодирования в масштабируемом речевом и аудиокодеке, имеющем несколько слоев, содержащий этапы, на которых: ! - получают остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом и аудиокодеке, и при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала; ! - преобразуют остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и ! - кодируют спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования. ! 2. Способ по п.1, в котором слой преобразования DCT-типа является слоем модифицированного дискретного косинусного преобразования (MDCT), и спектр преобразования является MDCT-спектром. ! 3. Способ по п.1, в котором кодирование спектральных линий спектра преобразования включает в себя этап, на котором: ! - кодируют позиции выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий. ! 4. Способ по п.1, дополнительно содержащий этапы, на которых: ! - разбивают множество спектральных линий на множество подполос; и ! - группируют последовательные подполосы в области. ! 5. Способ по п.4, дополнительно содержащий этап, на котором: ! - кодируют основной импульс, выбранный из множе
Claims (40)
1. Способ для кодирования в масштабируемом речевом и аудиокодеке, имеющем несколько слоев, содержащий этапы, на которых:
- получают остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом и аудиокодеке, и при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- преобразуют остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- кодируют спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
2. Способ по п.1, в котором слой преобразования DCT-типа является слоем модифицированного дискретного косинусного преобразования (MDCT), и спектр преобразования является MDCT-спектром.
3. Способ по п.1, в котором кодирование спектральных линий спектра преобразования включает в себя этап, на котором:
- кодируют позиции выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий.
4. Способ по п.1, дополнительно содержащий этапы, на которых:
- разбивают множество спектральных линий на множество подполос; и
- группируют последовательные подполосы в области.
5. Способ по п.4, дополнительно содержащий этап, на котором:
- кодируют основной импульс, выбранный из множества спектральных линий для каждой из подполос в области.
6. Способ по п.4, дополнительно содержащий этап, на котором:
- кодируют позиции выбранного поднабора спектральных линий в рамках области на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий;
- при этом кодирование спектральных линий спектра преобразования включает в себя этап, на котором формируют матрицу, на основе позиций выбранного поднабора спектральных линий, из всех возможных двоичных строк длины, равной всем позициям в области.
7. Способ по п.4, в котором области перекрываются, и каждая область включает в себя множество последовательных подполос.
8. Способ по п.1, в котором технология комбинаторного позиционного кодирования включает в себя этап, на котором:
- формируют лексикографический индекс для выбранного поднабора спектральных линий, при этом каждый лексикографический индекс представляет одну из множества возможных двоичных строк, представляющих позиции выбранного поднабора спектральных линий.
9. Способ по п.8, в котором лексикографический индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
10. Способ по п.1, в котором технология комбинаторного позиционного кодирования включает в себя этап, на котором:
- формируют индекс, представляющий позиции спектральных линий в рамках двоичной строки, причем позиции спектральных линий кодируются на основе комбинаторной формулы:
- где n - длина двоичной строки, k - число выбранных спектральных линий, которые должны быть кодированы, и wj представляет отдельные биты двоичной строки.
11. Способ по п.1, дополнительно содержащий этап, на котором:
- отбрасывают набор спектральных линий, чтобы сократить число спектральных линий, перед кодированием.
12. Способ по п.1, в котором восстановленная версия исходного аудиосигнала получается посредством этапов, на которых:
- синтезируют кодированную версию исходного аудиосигнала из слоя кодирования на основе CELP, чтобы получать синтезированный сигнал;
- повторно вводят предыскажения в синтезированный сигнал; и
- выполняют повышающую дискретизацию сигнала после повторного ввода предыскажений, чтобы получить восстановленную версию исходного аудиосигнала.
13. Устройство масштабируемого речевого и аудиокодера, содержащее:
- модуль слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), выполненный с возможностью формировать остаточный сигнал, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- модуль слоя преобразования типа дискретного косинусного преобразования (DCT), выполненный с возможностью:
- получать остаточный сигнал из модуля слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом модуль слоя кодирования на основе CELP содержит слой кодирования на основе CELP, имеющий один или два предыдущих слоя в масштабируемом речевом и аудиокодеке; и
- преобразовывать остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- комбинаторный кодер спектра, выполненный с возможностью кодировать спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
14. Устройство по п.13, в котором модуль слоя преобразования DCT-типа является модулем слоя модифицированного дискретного косинусного преобразования (MDCT), и спектр преобразования является MDCT-спектром.
15. Устройство по п.13, в котором кодирование спектральных линий спектра преобразования включает в себя:
- кодирование позиций выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий.
16. Устройство по п.13, дополнительно содержащее:
- формирователь подполос, выполненный с возможностью разбивать множество спектральных линий на множество подполос; и
- формирователь областей, выполненный с возможностью группировать последовательные подполосы в области.
17. Устройство по п.16, дополнительно содержащее:
- кодер основных импульсов, выполненный с возможностью кодировать основной импульс, выбираемый из множества спектральных линий для каждой из подполос в области.
18. Устройство по п.16, дополнительно содержащее:
- кодер субимпульсов, выполненный с возможностью кодировать позиции выбранного поднабора спектральных линий в рамках области на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий;
- при этом кодирование спектральных линий спектра преобразования включает в себя формирование матрицы, на основе позиций выбранного поднабора спектральных линий, из всех возможных двоичных строк длины, равной всем позициям в области.
19. Устройство по п.16, в котором области перекрываются, и каждая область включает в себя множество последовательных подполос.
20. Устройство по п.13, в котором технология комбинаторного позиционного кодирования включает в себя:
- формирование лексикографического индекса для выбранного поднабора спектральных линий, при этом каждый лексикографический индекс представляет одну из множества возможных двоичных строк, представляющих позиции выбранного поднабора спектральных линий.
21. Устройство по п.20, в котором лексикографический индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
22. Устройство по п.13, в котором комбинаторный кодер спектра выполнен с возможностью формировать индекс, представляющий позиции спектральных линий в рамках двоичной строки, причем позиции спектральных линий кодируются на основе комбинаторной формулы:
- где n - длина двоичной строки, k - число выбранных спектральных линий, которые должны быть кодированы, и wj представляет отдельные биты двоичной строки.
23. Устройство по п.13, в котором восстановленная версия исходного аудиосигнала получается посредством следующего:
- синтезирование кодированной версии исходного аудиосигнала из слоя кодирования на основе CELP, чтобы получать синтезированный сигнал;
- повторный ввод предыскажений в синтезированный сигнал; и
- повышающая дискретизация сигнала после повторного ввода предыскажений, чтобы получать восстановленную версию исходного аудиосигнала.
24. Устройство масштабируемого речевого и аудиокодера, содержащее:
- средство для получения остаточного сигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- средство для преобразования остаточного сигнала, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- средство для кодирования спектральных линий спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
25. Процессор, включающий в себя схему масштабируемого кодирования речи и аудио, выполненную с возможностью:
- получать остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в речевом и аудиокодеке, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- преобразовывать остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- кодировать спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
26. Машиночитаемый носитель, содержащий инструкции, применяемые для масштабируемого кодирования речи и аудио, которые, когда выполняются посредством одного или более процессоров, побуждают процессоры:
- получать остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- преобразовывать остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- кодировать спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
27. Способ для декодирования в масштабируемом речевом и аудиокодеке, имеющем несколько слоев, содержащий этапы, на которых:
- получают индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодируют индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- синтезируют версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
28. Способ по п.27, дополнительно содержащий этапы, на которых:
- принимают CELP-кодированный сигнал, кодирующий исходный аудиосигнал;
- декодируют CELP-кодированный сигнал, чтобы формировать декодированный сигнал; и
- комбинируют декодированный сигнал с синтезированной версией остаточного сигнала, чтобы получать восстановленную версию исходного аудиосигнала.
29. Способ по п.27, в котором синтезирование версии остаточного сигнала включает в себя этап, на котором:
- применяют обратное преобразование DCT-типа к спектральным линиям спектра преобразования, чтобы сформировать версию остаточного сигнала во временной области.
30. Способ по п.27, в котором декодирование спектральных линий спектра преобразования включает в себя этап, на котором:
- декодируют позиции выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий.
31. Способ по п.27, в котором индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
32. Способ по п.27, в котором слой обратного преобразования DCT-типа является слоем обратного модифицированного дискретного косинусного преобразования (IMDCT), и спектр преобразования является MDCT-спектром.
33. Способ по п.27, в котором полученный индекс представляет позиции спектральных линий в рамках двоичной строки, причем позиции спектральных линий кодируются на основе комбинаторной формулы:
- где n - длина двоичной строки, k - число выбранных спектральных линий, которые должны быть кодированы, и wj представляет отдельные биты двоичной строки.
34. Устройство масштабируемого речевого и аудиодекодера, содержащее:
- комбинаторный декодер спектра, выполненный с возможностью:
- получать индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из модуля слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом модуль слоя кодирования на основе CELP содержит слой кодирования на основе CELP, имеющий один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодировать индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- модуль слоя обратного преобразования типа обратного дискретного косинусного преобразования (IDCT), выполненный с возможностью синтезировать версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования.
35. Устройство по п.34, дополнительно содержащее:
- CELP-декодер, выполненный с возможностью:
- принимать CELP-кодированный сигнал, кодирующий исходный аудиосигнал;
- декодировать CELP-кодированный сигнал, чтобы формировать декодированный сигнал; и
- комбинировать декодированный сигнал с синтезированной версией остаточного сигнала, чтобы получать восстановленную версию исходного аудиосигнала.
36. Устройство по п.34, в котором при синтезировании версии остаточного сигнала, модуль слоя обратного преобразования IDCT-типа выполнен с возможностью применять обратное преобразование типа DCT к спектральным линиям спектра преобразования, чтобы сформировать версию остаточного сигнала во временной области.
37. Устройство по п.34, в котором индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
38. Устройство масштабируемого речевого и аудиодекодера, содержащее:
- средство для получения индекса, представляющего множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- средство для декодирования индекса в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- средство для синтезирования версии остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
39. Процессор, включающий в себя схему масштабируемого декодирования речи и аудио, выполненную с возможностью:
- получать индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодировать индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- синтезировать версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
40. Машиночитаемый носитель, содержащий инструкции, применяемые для масштабируемого декодирования речи и аудио, которые, когда выполняются посредством одного или более процессоров, побуждают процессоры:
- получать индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодировать индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- синтезировать версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US98181407P | 2007-10-22 | 2007-10-22 | |
| US60/981,814 | 2007-10-22 | ||
| US12/255,604 | 2008-10-21 | ||
| US12/255,604 US8527265B2 (en) | 2007-10-22 | 2008-10-21 | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2010120678A true RU2010120678A (ru) | 2011-11-27 |
| RU2459282C2 RU2459282C2 (ru) | 2012-08-20 |
Family
ID=40210550
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2010120678/08A RU2459282C2 (ru) | 2007-10-22 | 2008-10-22 | Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра |
Country Status (13)
| Country | Link |
|---|---|
| US (1) | US8527265B2 (ru) |
| EP (1) | EP2255358B1 (ru) |
| JP (2) | JP2011501828A (ru) |
| KR (1) | KR20100085994A (ru) |
| CN (2) | CN102968998A (ru) |
| AU (1) | AU2008316860B2 (ru) |
| BR (1) | BRPI0818405A2 (ru) |
| CA (1) | CA2701281A1 (ru) |
| IL (1) | IL205131A0 (ru) |
| MX (1) | MX2010004282A (ru) |
| RU (1) | RU2459282C2 (ru) |
| TW (1) | TWI407432B (ru) |
| WO (1) | WO2009055493A1 (ru) |
Families Citing this family (60)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
| ES2817906T3 (es) | 2007-04-29 | 2021-04-08 | Huawei Tech Co Ltd | Método de codificación de impulsos de las señales de excitación |
| KR101649376B1 (ko) | 2008-10-13 | 2016-08-31 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
| WO2010044593A2 (ko) | 2008-10-13 | 2010-04-22 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
| CN101931414B (zh) | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
| US9009037B2 (en) * | 2009-10-14 | 2015-04-14 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, and methods therefor |
| BR112012009446B1 (pt) | 2009-10-20 | 2023-03-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Método e aparelho de armazenamento de dados |
| US9153242B2 (en) * | 2009-11-13 | 2015-10-06 | Panasonic Intellectual Property Corporation Of America | Encoder apparatus, decoder apparatus, and related methods that use plural coding layers |
| EP2502229B1 (en) * | 2009-11-19 | 2017-08-09 | Telefonaktiebolaget LM Ericsson (publ) | Methods and arrangements for loudness and sharpness compensation in audio codecs |
| CN102081926B (zh) * | 2009-11-27 | 2013-06-05 | 中兴通讯股份有限公司 | 格型矢量量化音频编解码方法和系统 |
| MY160067A (en) | 2010-01-12 | 2017-02-15 | Fraunhofer Ges Forschung | Audio encoder, audio decoder, method for encoding and audio information, method for decording an audio information and computer program using a modification of a number representation of a numeric previous context value |
| US9305563B2 (en) | 2010-01-15 | 2016-04-05 | Lg Electronics Inc. | Method and apparatus for processing an audio signal |
| EP2357649B1 (en) | 2010-01-21 | 2012-12-19 | Electronics and Telecommunications Research Institute | Method and apparatus for decoding audio signal |
| CN102918590B (zh) * | 2010-03-31 | 2014-12-10 | 韩国电子通信研究院 | 编码方法和装置、以及解码方法和装置 |
| EP2569767B1 (en) * | 2010-05-11 | 2014-06-11 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for processing of audio signals |
| CN102299760B (zh) * | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
| ES2559981T3 (es) * | 2010-07-05 | 2016-02-17 | Nippon Telegraph And Telephone Corporation | Método de codificación, método de decodificación, dispositivo, programa y medio de registro |
| US20120029926A1 (en) | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
| US8879634B2 (en) | 2010-08-13 | 2014-11-04 | Qualcomm Incorporated | Coding blocks of data using one-to-one codes |
| US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
| SG194945A1 (en) | 2011-05-13 | 2013-12-30 | Samsung Electronics Co Ltd | Bit allocating, audio encoding and decoding |
| KR102048076B1 (ko) * | 2011-09-28 | 2019-11-22 | 엘지전자 주식회사 | 음성 신호 부호화 방법 및 음성 신호 복호화 방법 그리고 이를 이용하는 장치 |
| US9558752B2 (en) * | 2011-10-07 | 2017-01-31 | Panasonic Intellectual Property Corporation Of America | Encoding device and encoding method |
| US8924203B2 (en) | 2011-10-28 | 2014-12-30 | Electronics And Telecommunications Research Institute | Apparatus and method for coding signal in a communication system |
| RU2562383C2 (ru) * | 2012-01-20 | 2015-09-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для кодирования и декодирования аудио, применяющие синусоидальную замену |
| US9905236B2 (en) | 2012-03-23 | 2018-02-27 | Dolby Laboratories Licensing Corporation | Enabling sampling rate diversity in a voice communication system |
| KR101398189B1 (ko) * | 2012-03-27 | 2014-05-22 | 광주과학기술원 | 음성수신장치 및 음성수신방법 |
| CN106847296B (zh) * | 2012-07-12 | 2021-01-22 | 诺基亚技术有限公司 | 矢量量化 |
| EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
| MY171754A (en) * | 2012-11-05 | 2019-10-28 | Panasonic Ip Corp America | Speech audio encoding device, speech audio decoding device, speech audio encoding method, and speech audio decoding method |
| RU2631988C2 (ru) | 2013-01-29 | 2017-09-29 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Заполнение шумом при аудиокодировании с перцепционным преобразованием |
| RU2618848C2 (ru) * | 2013-01-29 | 2017-05-12 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для выбора одного из первого алгоритма кодирования аудио и второго алгоритма кодирования аудио |
| RU2628197C2 (ru) | 2013-02-13 | 2017-08-15 | Телефонактиеболагет Л М Эрикссон (Пабл) | Маскирование ошибок в кадрах |
| KR102148407B1 (ko) * | 2013-02-27 | 2020-08-27 | 한국전자통신연구원 | 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법 |
| CN105052143B (zh) * | 2013-03-26 | 2018-04-20 | 杜比实验室特许公司 | 对多层vdr译码中的感知量化的视频内容进行编码 |
| AU2014283393A1 (en) | 2013-06-21 | 2016-02-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation |
| PL3011555T3 (pl) * | 2013-06-21 | 2018-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Rekonstrukcja ramki sygnału mowy |
| EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
| KR102315920B1 (ko) | 2013-09-16 | 2021-10-21 | 삼성전자주식회사 | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 |
| CN110634495B (zh) * | 2013-09-16 | 2023-07-07 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
| SG11201603046RA (en) | 2013-10-18 | 2016-05-30 | Fraunhofer Ges Forschung | Coding of spectral coefficients of a spectrum of an audio signal |
| TR201901696T4 (tr) * | 2013-10-18 | 2019-02-21 | Ericsson Telefon Ab L M | Spektral tepe konumlarının kodlanması. |
| JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
| AU2014343905B2 (en) | 2013-10-31 | 2017-11-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
| EP3063760B1 (en) | 2013-10-31 | 2017-12-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
| CN104751849B (zh) | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
| JP6633547B2 (ja) * | 2014-02-17 | 2020-01-22 | サムスン エレクトロニクス カンパニー リミテッド | スペクトル符号化方法 |
| WO2015122752A1 (ko) | 2014-02-17 | 2015-08-20 | 삼성전자 주식회사 | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 |
| EP2980797A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
| CN107369454B (zh) * | 2014-03-21 | 2020-10-27 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
| FI3751566T3 (fi) | 2014-04-17 | 2024-04-23 | Voiceage Evs Llc | Menetelmiä, kooderi ja dekooderi äänisignaalien lineaariseen ennakoivaan koodaukseen ja dekoodaukseen näytteistystaajuudeltaan erilaisten kehysten välillä siirryttäessä |
| KR20170037970A (ko) | 2014-07-28 | 2017-04-05 | 삼성전자주식회사 | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 |
| FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
| BR112017010911B1 (pt) * | 2014-12-09 | 2023-11-21 | Dolby International Ab | Método e sistema de decodificação para ocultar erros em pacotes de dados que devem ser decodificados em um decodificador de áudio baseado em transformação de cosseno discreto modificado |
| WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
| US10504525B2 (en) * | 2015-10-10 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Adaptive forward error correction redundant payload generation |
| KR102736785B1 (ko) * | 2017-09-20 | 2024-12-03 | 보이세지 코포레이션 | 씨이엘피 코덱에 있어서 서브-프레임들간에 비트-예산을 할당하는 방법 및 디바이스 |
| CN112669860B (zh) * | 2020-12-29 | 2022-12-09 | 北京百瑞互联技术有限公司 | 一种增加lc3音频编解码有效带宽的方法及装置 |
| WO2022158943A1 (ko) | 2021-01-25 | 2022-07-28 | 삼성전자 주식회사 | 다채널 오디오 신호 처리 장치 및 방법 |
| EP4120253A1 (en) * | 2021-07-14 | 2023-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Integral band-wise parametric coder |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0969783A (ja) | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
| JP3849210B2 (ja) * | 1996-09-24 | 2006-11-22 | ヤマハ株式会社 | 音声符号化復号方式 |
| US6263312B1 (en) * | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
| KR100335611B1 (ko) | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
| US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
| US6351494B1 (en) | 1999-09-24 | 2002-02-26 | Sony Corporation | Classified adaptive error recovery method and apparatus |
| US6662154B2 (en) * | 2001-12-12 | 2003-12-09 | Motorola, Inc. | Method and system for information signal coding using combinatorial and huffman codes |
| EP1483759B1 (en) * | 2002-03-12 | 2006-09-06 | Nokia Corporation | Scalable audio coding |
| EP1619664B1 (en) * | 2003-04-30 | 2012-01-25 | Panasonic Corporation | Speech coding apparatus, speech decoding apparatus and methods thereof |
| CN1898724A (zh) * | 2003-12-26 | 2007-01-17 | 松下电器产业株式会社 | 语音/乐音编码设备及语音/乐音编码方法 |
| JP4445328B2 (ja) | 2004-05-24 | 2010-04-07 | パナソニック株式会社 | 音声・楽音復号化装置および音声・楽音復号化方法 |
| JP4781272B2 (ja) | 2004-09-17 | 2011-09-28 | パナソニック株式会社 | 音声符号化装置、音声復号装置、通信装置及び音声符号化方法 |
| JP5036317B2 (ja) | 2004-10-28 | 2012-09-26 | パナソニック株式会社 | スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法 |
| JP4887279B2 (ja) | 2005-02-01 | 2012-02-29 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
| WO2007105586A1 (ja) | 2006-03-10 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | 符号化装置および符号化方法 |
| US8711925B2 (en) * | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
| US7461106B2 (en) * | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
| US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
-
2008
- 2008-10-21 US US12/255,604 patent/US8527265B2/en not_active Expired - Fee Related
- 2008-10-22 AU AU2008316860A patent/AU2008316860B2/en not_active Ceased
- 2008-10-22 BR BRPI0818405A patent/BRPI0818405A2/pt not_active IP Right Cessation
- 2008-10-22 TW TW097140565A patent/TWI407432B/zh not_active IP Right Cessation
- 2008-10-22 EP EP08843220.8A patent/EP2255358B1/en not_active Not-in-force
- 2008-10-22 RU RU2010120678/08A patent/RU2459282C2/ru not_active IP Right Cessation
- 2008-10-22 JP JP2010531210A patent/JP2011501828A/ja not_active Ceased
- 2008-10-22 CA CA2701281A patent/CA2701281A1/en not_active Abandoned
- 2008-10-22 WO PCT/US2008/080824 patent/WO2009055493A1/en not_active Ceased
- 2008-10-22 CN CN2012104034370A patent/CN102968998A/zh active Pending
- 2008-10-22 MX MX2010004282A patent/MX2010004282A/es active IP Right Grant
- 2008-10-22 KR KR1020107011197A patent/KR20100085994A/ko not_active Ceased
- 2008-10-22 CN CN2008801125420A patent/CN101836251B/zh not_active Expired - Fee Related
-
2010
- 2010-04-15 IL IL205131A patent/IL205131A0/en unknown
-
2013
- 2013-04-11 JP JP2013083340A patent/JP2013178539A/ja not_active Withdrawn
Also Published As
| Publication number | Publication date |
|---|---|
| JP2011501828A (ja) | 2011-01-13 |
| CN101836251B (zh) | 2012-12-12 |
| WO2009055493A1 (en) | 2009-04-30 |
| MX2010004282A (es) | 2010-05-05 |
| EP2255358A1 (en) | 2010-12-01 |
| RU2459282C2 (ru) | 2012-08-20 |
| CN101836251A (zh) | 2010-09-15 |
| JP2013178539A (ja) | 2013-09-09 |
| CA2701281A1 (en) | 2009-04-30 |
| TWI407432B (zh) | 2013-09-01 |
| AU2008316860A1 (en) | 2009-04-30 |
| EP2255358B1 (en) | 2013-07-03 |
| TW200935402A (en) | 2009-08-16 |
| AU2008316860B2 (en) | 2011-06-16 |
| CN102968998A (zh) | 2013-03-13 |
| BRPI0818405A2 (pt) | 2016-10-11 |
| IL205131A0 (en) | 2010-11-30 |
| KR20100085994A (ko) | 2010-07-29 |
| US20090234644A1 (en) | 2009-09-17 |
| US8527265B2 (en) | 2013-09-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2010120678A (ru) | Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра | |
| JP5112309B2 (ja) | 階層符号化/復号化装置 | |
| JP5833557B2 (ja) | 位相情報と残余信号を用いる符号化/復号化装置及び方法 | |
| KR101238239B1 (ko) | 인코더 | |
| US8332213B2 (en) | Multi-reference LPC filter quantization and inverse quantization device and method | |
| JP5695074B2 (ja) | 音声符号化装置および音声復号化装置 | |
| KR20100007738A (ko) | 음성/오디오 통합 신호의 부호화/복호화 장치 | |
| TW201007698A (en) | Audio encoder and audio decoder | |
| FI3958257T3 (fi) | Audiokooderi monikanavasignaalin koodaamiseksi ja audiodekooderi koodatun audiosignaalin dekoodaamiseksi | |
| JP6027538B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 | |
| CA2703700A1 (en) | Technique for encoding/decoding of codebook indices for quantized mdct spectrum in scalable speech and audio codecs | |
| JP2005242363A5 (ru) | ||
| RU2010100875A (ru) | Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов | |
| JP2005260969A5 (ru) | ||
| CN103946918B (zh) | 语音信号编码方法、语音信号解码方法及使用其的装置 | |
| US9240192B2 (en) | Device and method for efficiently encoding quantization parameters of spectral coefficient coding | |
| US20100292986A1 (en) | encoder | |
| CN104380377A (zh) | 用于可缩放低复杂度编码/解码的方法和装置 | |
| UA95185C2 (ru) | Масштабированное кодирование и аудио с использованием комбинаторного кодирования mdct-спектра | |
| HK1145045A (en) | Scalable speech and audio encoding using combinatorial encoding of mdct spectrum | |
| TH132840A (th) | โคเดกเสียงที่รองรับโหมดการลงรหัสโดเมนเวลา และโดเมนความถี่ | |
| WO2008114078A1 (en) | En encoder | |
| RU2009147332A (ru) | Способ и устройство масштабируемого кодирования речи, устойчивого к потерям кадров, с многоимпульсным возбуждением и переменной битовой скоростью для сетей пакетной коммутации |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20151023 |