[go: up one dir, main page]

RU2010120678A - Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра - Google Patents

Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра Download PDF

Info

Publication number
RU2010120678A
RU2010120678A RU2010120678/08A RU2010120678A RU2010120678A RU 2010120678 A RU2010120678 A RU 2010120678A RU 2010120678/08 A RU2010120678/08 A RU 2010120678/08A RU 2010120678 A RU2010120678 A RU 2010120678A RU 2010120678 A RU2010120678 A RU 2010120678A
Authority
RU
Russia
Prior art keywords
spectral lines
transform
layer
spectrum
celp
Prior art date
Application number
RU2010120678/08A
Other languages
English (en)
Other versions
RU2459282C2 (ru
Inventor
Юрий РЕЗНИК (US)
Юрий РЕЗНИК
Пэнцзюнь ХУАН (US)
Пэнцзюнь ХУАН
Original Assignee
Квэлкомм Инкорпорейтед (US)
Квэлкомм Инкорпорейтед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Квэлкомм Инкорпорейтед (US), Квэлкомм Инкорпорейтед filed Critical Квэлкомм Инкорпорейтед (US)
Publication of RU2010120678A publication Critical patent/RU2010120678A/ru
Application granted granted Critical
Publication of RU2459282C2 publication Critical patent/RU2459282C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Способ для кодирования в масштабируемом речевом и аудиокодеке, имеющем несколько слоев, содержащий этапы, на которых: ! - получают остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом и аудиокодеке, и при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала; ! - преобразуют остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и ! - кодируют спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования. ! 2. Способ по п.1, в котором слой преобразования DCT-типа является слоем модифицированного дискретного косинусного преобразования (MDCT), и спектр преобразования является MDCT-спектром. ! 3. Способ по п.1, в котором кодирование спектральных линий спектра преобразования включает в себя этап, на котором: ! - кодируют позиции выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий. ! 4. Способ по п.1, дополнительно содержащий этапы, на которых: ! - разбивают множество спектральных линий на множество подполос; и ! - группируют последовательные подполосы в области. ! 5. Способ по п.4, дополнительно содержащий этап, на котором: ! - кодируют основной импульс, выбранный из множе

Claims (40)

1. Способ для кодирования в масштабируемом речевом и аудиокодеке, имеющем несколько слоев, содержащий этапы, на которых:
- получают остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом и аудиокодеке, и при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- преобразуют остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- кодируют спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
2. Способ по п.1, в котором слой преобразования DCT-типа является слоем модифицированного дискретного косинусного преобразования (MDCT), и спектр преобразования является MDCT-спектром.
3. Способ по п.1, в котором кодирование спектральных линий спектра преобразования включает в себя этап, на котором:
- кодируют позиции выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий.
4. Способ по п.1, дополнительно содержащий этапы, на которых:
- разбивают множество спектральных линий на множество подполос; и
- группируют последовательные подполосы в области.
5. Способ по п.4, дополнительно содержащий этап, на котором:
- кодируют основной импульс, выбранный из множества спектральных линий для каждой из подполос в области.
6. Способ по п.4, дополнительно содержащий этап, на котором:
- кодируют позиции выбранного поднабора спектральных линий в рамках области на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий;
- при этом кодирование спектральных линий спектра преобразования включает в себя этап, на котором формируют матрицу, на основе позиций выбранного поднабора спектральных линий, из всех возможных двоичных строк длины, равной всем позициям в области.
7. Способ по п.4, в котором области перекрываются, и каждая область включает в себя множество последовательных подполос.
8. Способ по п.1, в котором технология комбинаторного позиционного кодирования включает в себя этап, на котором:
- формируют лексикографический индекс для выбранного поднабора спектральных линий, при этом каждый лексикографический индекс представляет одну из множества возможных двоичных строк, представляющих позиции выбранного поднабора спектральных линий.
9. Способ по п.8, в котором лексикографический индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
10. Способ по п.1, в котором технология комбинаторного позиционного кодирования включает в себя этап, на котором:
- формируют индекс, представляющий позиции спектральных линий в рамках двоичной строки, причем позиции спектральных линий кодируются на основе комбинаторной формулы:
Figure 00000001
- где n - длина двоичной строки, k - число выбранных спектральных линий, которые должны быть кодированы, и wj представляет отдельные биты двоичной строки.
11. Способ по п.1, дополнительно содержащий этап, на котором:
- отбрасывают набор спектральных линий, чтобы сократить число спектральных линий, перед кодированием.
12. Способ по п.1, в котором восстановленная версия исходного аудиосигнала получается посредством этапов, на которых:
- синтезируют кодированную версию исходного аудиосигнала из слоя кодирования на основе CELP, чтобы получать синтезированный сигнал;
- повторно вводят предыскажения в синтезированный сигнал; и
- выполняют повышающую дискретизацию сигнала после повторного ввода предыскажений, чтобы получить восстановленную версию исходного аудиосигнала.
13. Устройство масштабируемого речевого и аудиокодера, содержащее:
- модуль слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), выполненный с возможностью формировать остаточный сигнал, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- модуль слоя преобразования типа дискретного косинусного преобразования (DCT), выполненный с возможностью:
- получать остаточный сигнал из модуля слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом модуль слоя кодирования на основе CELP содержит слой кодирования на основе CELP, имеющий один или два предыдущих слоя в масштабируемом речевом и аудиокодеке; и
- преобразовывать остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- комбинаторный кодер спектра, выполненный с возможностью кодировать спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
14. Устройство по п.13, в котором модуль слоя преобразования DCT-типа является модулем слоя модифицированного дискретного косинусного преобразования (MDCT), и спектр преобразования является MDCT-спектром.
15. Устройство по п.13, в котором кодирование спектральных линий спектра преобразования включает в себя:
- кодирование позиций выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий.
16. Устройство по п.13, дополнительно содержащее:
- формирователь подполос, выполненный с возможностью разбивать множество спектральных линий на множество подполос; и
- формирователь областей, выполненный с возможностью группировать последовательные подполосы в области.
17. Устройство по п.16, дополнительно содержащее:
- кодер основных импульсов, выполненный с возможностью кодировать основной импульс, выбираемый из множества спектральных линий для каждой из подполос в области.
18. Устройство по п.16, дополнительно содержащее:
- кодер субимпульсов, выполненный с возможностью кодировать позиции выбранного поднабора спектральных линий в рамках области на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий;
- при этом кодирование спектральных линий спектра преобразования включает в себя формирование матрицы, на основе позиций выбранного поднабора спектральных линий, из всех возможных двоичных строк длины, равной всем позициям в области.
19. Устройство по п.16, в котором области перекрываются, и каждая область включает в себя множество последовательных подполос.
20. Устройство по п.13, в котором технология комбинаторного позиционного кодирования включает в себя:
- формирование лексикографического индекса для выбранного поднабора спектральных линий, при этом каждый лексикографический индекс представляет одну из множества возможных двоичных строк, представляющих позиции выбранного поднабора спектральных линий.
21. Устройство по п.20, в котором лексикографический индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
22. Устройство по п.13, в котором комбинаторный кодер спектра выполнен с возможностью формировать индекс, представляющий позиции спектральных линий в рамках двоичной строки, причем позиции спектральных линий кодируются на основе комбинаторной формулы:
Figure 00000001
- где n - длина двоичной строки, k - число выбранных спектральных линий, которые должны быть кодированы, и wj представляет отдельные биты двоичной строки.
23. Устройство по п.13, в котором восстановленная версия исходного аудиосигнала получается посредством следующего:
- синтезирование кодированной версии исходного аудиосигнала из слоя кодирования на основе CELP, чтобы получать синтезированный сигнал;
- повторный ввод предыскажений в синтезированный сигнал; и
- повышающая дискретизация сигнала после повторного ввода предыскажений, чтобы получать восстановленную версию исходного аудиосигнала.
24. Устройство масштабируемого речевого и аудиокодера, содержащее:
- средство для получения остаточного сигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- средство для преобразования остаточного сигнала, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- средство для кодирования спектральных линий спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
25. Процессор, включающий в себя схему масштабируемого кодирования речи и аудио, выполненную с возможностью:
- получать остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в речевом и аудиокодеке, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- преобразовывать остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- кодировать спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
26. Машиночитаемый носитель, содержащий инструкции, применяемые для масштабируемого кодирования речи и аудио, которые, когда выполняются посредством одного или более процессоров, побуждают процессоры:
- получать остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- преобразовывать остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- кодировать спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
27. Способ для декодирования в масштабируемом речевом и аудиокодеке, имеющем несколько слоев, содержащий этапы, на которых:
- получают индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодируют индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- синтезируют версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
28. Способ по п.27, дополнительно содержащий этапы, на которых:
- принимают CELP-кодированный сигнал, кодирующий исходный аудиосигнал;
- декодируют CELP-кодированный сигнал, чтобы формировать декодированный сигнал; и
- комбинируют декодированный сигнал с синтезированной версией остаточного сигнала, чтобы получать восстановленную версию исходного аудиосигнала.
29. Способ по п.27, в котором синтезирование версии остаточного сигнала включает в себя этап, на котором:
- применяют обратное преобразование DCT-типа к спектральным линиям спектра преобразования, чтобы сформировать версию остаточного сигнала во временной области.
30. Способ по п.27, в котором декодирование спектральных линий спектра преобразования включает в себя этап, на котором:
- декодируют позиции выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий.
31. Способ по п.27, в котором индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
32. Способ по п.27, в котором слой обратного преобразования DCT-типа является слоем обратного модифицированного дискретного косинусного преобразования (IMDCT), и спектр преобразования является MDCT-спектром.
33. Способ по п.27, в котором полученный индекс представляет позиции спектральных линий в рамках двоичной строки, причем позиции спектральных линий кодируются на основе комбинаторной формулы:
Figure 00000001
- где n - длина двоичной строки, k - число выбранных спектральных линий, которые должны быть кодированы, и wj представляет отдельные биты двоичной строки.
34. Устройство масштабируемого речевого и аудиодекодера, содержащее:
- комбинаторный декодер спектра, выполненный с возможностью:
- получать индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из модуля слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом модуль слоя кодирования на основе CELP содержит слой кодирования на основе CELP, имеющий один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодировать индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- модуль слоя обратного преобразования типа обратного дискретного косинусного преобразования (IDCT), выполненный с возможностью синтезировать версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования.
35. Устройство по п.34, дополнительно содержащее:
- CELP-декодер, выполненный с возможностью:
- принимать CELP-кодированный сигнал, кодирующий исходный аудиосигнал;
- декодировать CELP-кодированный сигнал, чтобы формировать декодированный сигнал; и
- комбинировать декодированный сигнал с синтезированной версией остаточного сигнала, чтобы получать восстановленную версию исходного аудиосигнала.
36. Устройство по п.34, в котором при синтезировании версии остаточного сигнала, модуль слоя обратного преобразования IDCT-типа выполнен с возможностью применять обратное преобразование типа DCT к спектральным линиям спектра преобразования, чтобы сформировать версию остаточного сигнала во временной области.
37. Устройство по п.34, в котором индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
38. Устройство масштабируемого речевого и аудиодекодера, содержащее:
- средство для получения индекса, представляющего множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- средство для декодирования индекса в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- средство для синтезирования версии остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
39. Процессор, включающий в себя схему масштабируемого декодирования речи и аудио, выполненную с возможностью:
- получать индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодировать индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- синтезировать версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
40. Машиночитаемый носитель, содержащий инструкции, применяемые для масштабируемого декодирования речи и аудио, которые, когда выполняются посредством одного или более процессоров, побуждают процессоры:
- получать индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодировать индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- синтезировать версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
RU2010120678/08A 2007-10-22 2008-10-22 Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра RU2459282C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US98181407P 2007-10-22 2007-10-22
US60/981,814 2007-10-22
US12/255,604 2008-10-21
US12/255,604 US8527265B2 (en) 2007-10-22 2008-10-21 Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs

Publications (2)

Publication Number Publication Date
RU2010120678A true RU2010120678A (ru) 2011-11-27
RU2459282C2 RU2459282C2 (ru) 2012-08-20

Family

ID=40210550

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010120678/08A RU2459282C2 (ru) 2007-10-22 2008-10-22 Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра

Country Status (13)

Country Link
US (1) US8527265B2 (ru)
EP (1) EP2255358B1 (ru)
JP (2) JP2011501828A (ru)
KR (1) KR20100085994A (ru)
CN (2) CN102968998A (ru)
AU (1) AU2008316860B2 (ru)
BR (1) BRPI0818405A2 (ru)
CA (1) CA2701281A1 (ru)
IL (1) IL205131A0 (ru)
MX (1) MX2010004282A (ru)
RU (1) RU2459282C2 (ru)
TW (1) TWI407432B (ru)
WO (1) WO2009055493A1 (ru)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
ES2817906T3 (es) 2007-04-29 2021-04-08 Huawei Tech Co Ltd Método de codificación de impulsos de las señales de excitación
KR101649376B1 (ko) 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
WO2010044593A2 (ko) 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
CN101931414B (zh) 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US9009037B2 (en) * 2009-10-14 2015-04-14 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, and methods therefor
BR112012009446B1 (pt) 2009-10-20 2023-03-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Método e aparelho de armazenamento de dados
US9153242B2 (en) * 2009-11-13 2015-10-06 Panasonic Intellectual Property Corporation Of America Encoder apparatus, decoder apparatus, and related methods that use plural coding layers
EP2502229B1 (en) * 2009-11-19 2017-08-09 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
MY160067A (en) 2010-01-12 2017-02-15 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for encoding and audio information, method for decording an audio information and computer program using a modification of a number representation of a numeric previous context value
US9305563B2 (en) 2010-01-15 2016-04-05 Lg Electronics Inc. Method and apparatus for processing an audio signal
EP2357649B1 (en) 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
CN102918590B (zh) * 2010-03-31 2014-12-10 韩国电子通信研究院 编码方法和装置、以及解码方法和装置
EP2569767B1 (en) * 2010-05-11 2014-06-11 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for processing of audio signals
CN102299760B (zh) * 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
ES2559981T3 (es) * 2010-07-05 2016-02-17 Nippon Telegraph And Telephone Corporation Método de codificación, método de decodificación, dispositivo, programa y medio de registro
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US8879634B2 (en) 2010-08-13 2014-11-04 Qualcomm Incorporated Coding blocks of data using one-to-one codes
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
SG194945A1 (en) 2011-05-13 2013-12-30 Samsung Electronics Co Ltd Bit allocating, audio encoding and decoding
KR102048076B1 (ko) * 2011-09-28 2019-11-22 엘지전자 주식회사 음성 신호 부호화 방법 및 음성 신호 복호화 방법 그리고 이를 이용하는 장치
US9558752B2 (en) * 2011-10-07 2017-01-31 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method
US8924203B2 (en) 2011-10-28 2014-12-30 Electronics And Telecommunications Research Institute Apparatus and method for coding signal in a communication system
RU2562383C2 (ru) * 2012-01-20 2015-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования и декодирования аудио, применяющие синусоидальную замену
US9905236B2 (en) 2012-03-23 2018-02-27 Dolby Laboratories Licensing Corporation Enabling sampling rate diversity in a voice communication system
KR101398189B1 (ko) * 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
CN106847296B (zh) * 2012-07-12 2021-01-22 诺基亚技术有限公司 矢量量化
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
MY171754A (en) * 2012-11-05 2019-10-28 Panasonic Ip Corp America Speech audio encoding device, speech audio decoding device, speech audio encoding method, and speech audio decoding method
RU2631988C2 (ru) 2013-01-29 2017-09-29 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Заполнение шумом при аудиокодировании с перцепционным преобразованием
RU2618848C2 (ru) * 2013-01-29 2017-05-12 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для выбора одного из первого алгоритма кодирования аудио и второго алгоритма кодирования аудио
RU2628197C2 (ru) 2013-02-13 2017-08-15 Телефонактиеболагет Л М Эрикссон (Пабл) Маскирование ошибок в кадрах
KR102148407B1 (ko) * 2013-02-27 2020-08-27 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법
CN105052143B (zh) * 2013-03-26 2018-04-20 杜比实验室特许公司 对多层vdr译码中的感知量化的视频内容进行编码
AU2014283393A1 (en) 2013-06-21 2016-02-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation
PL3011555T3 (pl) * 2013-06-21 2018-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja ramki sygnału mowy
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
KR102315920B1 (ko) 2013-09-16 2021-10-21 삼성전자주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
CN110634495B (zh) * 2013-09-16 2023-07-07 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
SG11201603046RA (en) 2013-10-18 2016-05-30 Fraunhofer Ges Forschung Coding of spectral coefficients of a spectrum of an audio signal
TR201901696T4 (tr) * 2013-10-18 2019-02-21 Ericsson Telefon Ab L M Spektral tepe konumlarının kodlanması.
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
AU2014343905B2 (en) 2013-10-31 2017-11-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
EP3063760B1 (en) 2013-10-31 2017-12-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
CN104751849B (zh) 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
JP6633547B2 (ja) * 2014-02-17 2020-01-22 サムスン エレクトロニクス カンパニー リミテッド スペクトル符号化方法
WO2015122752A1 (ko) 2014-02-17 2015-08-20 삼성전자 주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
CN107369454B (zh) * 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
FI3751566T3 (fi) 2014-04-17 2024-04-23 Voiceage Evs Llc Menetelmiä, kooderi ja dekooderi äänisignaalien lineaariseen ennakoivaan koodaukseen ja dekoodaukseen näytteistystaajuudeltaan erilaisten kehysten välillä siirryttäessä
KR20170037970A (ko) 2014-07-28 2017-04-05 삼성전자주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
BR112017010911B1 (pt) * 2014-12-09 2023-11-21 Dolby International Ab Método e sistema de decodificação para ocultar erros em pacotes de dados que devem ser decodificados em um decodificador de áudio baseado em transformação de cosseno discreto modificado
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10504525B2 (en) * 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
KR102736785B1 (ko) * 2017-09-20 2024-12-03 보이세지 코포레이션 씨이엘피 코덱에 있어서 서브-프레임들간에 비트-예산을 할당하는 방법 및 디바이스
CN112669860B (zh) * 2020-12-29 2022-12-09 北京百瑞互联技术有限公司 一种增加lc3音频编解码有效带宽的方法及装置
WO2022158943A1 (ko) 2021-01-25 2022-07-28 삼성전자 주식회사 다채널 오디오 신호 처리 장치 및 방법
EP4120253A1 (en) * 2021-07-14 2023-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Integral band-wise parametric coder

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0969783A (ja) 1995-08-31 1997-03-11 Nippon Steel Corp オーディオデータ符号化装置
JP3849210B2 (ja) * 1996-09-24 2006-11-22 ヤマハ株式会社 音声符号化復号方式
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6351494B1 (en) 1999-09-24 2002-02-26 Sony Corporation Classified adaptive error recovery method and apparatus
US6662154B2 (en) * 2001-12-12 2003-12-09 Motorola, Inc. Method and system for information signal coding using combinatorial and huffman codes
EP1483759B1 (en) * 2002-03-12 2006-09-06 Nokia Corporation Scalable audio coding
EP1619664B1 (en) * 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
CN1898724A (zh) * 2003-12-26 2007-01-17 松下电器产业株式会社 语音/乐音编码设备及语音/乐音编码方法
JP4445328B2 (ja) 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法
JP4781272B2 (ja) 2004-09-17 2011-09-28 パナソニック株式会社 音声符号化装置、音声復号装置、通信装置及び音声符号化方法
JP5036317B2 (ja) 2004-10-28 2012-09-26 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JP4887279B2 (ja) 2005-02-01 2012-02-29 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
WO2007105586A1 (ja) 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
US8711925B2 (en) * 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding

Also Published As

Publication number Publication date
JP2011501828A (ja) 2011-01-13
CN101836251B (zh) 2012-12-12
WO2009055493A1 (en) 2009-04-30
MX2010004282A (es) 2010-05-05
EP2255358A1 (en) 2010-12-01
RU2459282C2 (ru) 2012-08-20
CN101836251A (zh) 2010-09-15
JP2013178539A (ja) 2013-09-09
CA2701281A1 (en) 2009-04-30
TWI407432B (zh) 2013-09-01
AU2008316860A1 (en) 2009-04-30
EP2255358B1 (en) 2013-07-03
TW200935402A (en) 2009-08-16
AU2008316860B2 (en) 2011-06-16
CN102968998A (zh) 2013-03-13
BRPI0818405A2 (pt) 2016-10-11
IL205131A0 (en) 2010-11-30
KR20100085994A (ko) 2010-07-29
US20090234644A1 (en) 2009-09-17
US8527265B2 (en) 2013-09-03

Similar Documents

Publication Publication Date Title
RU2010120678A (ru) Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра
JP5112309B2 (ja) 階層符号化/復号化装置
JP5833557B2 (ja) 位相情報と残余信号を用いる符号化/復号化装置及び方法
KR101238239B1 (ko) 인코더
US8332213B2 (en) Multi-reference LPC filter quantization and inverse quantization device and method
JP5695074B2 (ja) 音声符号化装置および音声復号化装置
KR20100007738A (ko) 음성/오디오 통합 신호의 부호화/복호화 장치
TW201007698A (en) Audio encoder and audio decoder
FI3958257T3 (fi) Audiokooderi monikanavasignaalin koodaamiseksi ja audiodekooderi koodatun audiosignaalin dekoodaamiseksi
JP6027538B2 (ja) 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
CA2703700A1 (en) Technique for encoding/decoding of codebook indices for quantized mdct spectrum in scalable speech and audio codecs
JP2005242363A5 (ru)
RU2010100875A (ru) Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов
JP2005260969A5 (ru)
CN103946918B (zh) 语音信号编码方法、语音信号解码方法及使用其的装置
US9240192B2 (en) Device and method for efficiently encoding quantization parameters of spectral coefficient coding
US20100292986A1 (en) encoder
CN104380377A (zh) 用于可缩放低复杂度编码/解码的方法和装置
UA95185C2 (ru) Масштабированное кодирование и аудио с использованием комбинаторного кодирования mdct-спектра
HK1145045A (en) Scalable speech and audio encoding using combinatorial encoding of mdct spectrum
TH132840A (th) โคเดกเสียงที่รองรับโหมดการลงรหัสโดเมนเวลา และโดเมนความถี่
WO2008114078A1 (en) En encoder
RU2009147332A (ru) Способ и устройство масштабируемого кодирования речи, устойчивого к потерям кадров, с многоимпульсным возбуждением и переменной битовой скоростью для сетей пакетной коммутации

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20151023