RU2016119010A - Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра - Google Patents
Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра Download PDFInfo
- Publication number
- RU2016119010A RU2016119010A RU2016119010A RU2016119010A RU2016119010A RU 2016119010 A RU2016119010 A RU 2016119010A RU 2016119010 A RU2016119010 A RU 2016119010A RU 2016119010 A RU2016119010 A RU 2016119010A RU 2016119010 A RU2016119010 A RU 2016119010A
- Authority
- RU
- Russia
- Prior art keywords
- signal
- noise
- information
- encoding
- gain
- Prior art date
Links
- 238000001228 spectrum Methods 0.000 title claims 19
- 230000015572 biosynthetic process Effects 0.000 title claims 7
- 230000005236 sound signal Effects 0.000 claims 14
- 238000000034 method Methods 0.000 claims 4
- 230000003321 amplification Effects 0.000 claims 2
- 238000004364 calculation method Methods 0.000 claims 2
- 238000003199 nucleic acid amplification method Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000001914 filtration Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (47)
1. Кодер (100; 200; 300) для кодирования аудиосигнала (102), причем кодер содержит:
- анализатор (120; 320), выполненный с возможностью извлечения коэффициентов (122; 322) прогнозирования и остаточного сигнала (124; 324) из кадра аудиосигнала (102);
- модуль (160) вычисления информации формант, выполненный с возможностью вычисления информации (162) формирования речевого спектра из коэффициентов (122; 322) прогнозирования;
- модуль (150; 350; 350'; 550) вычисления параметров усиления, выполненный с возможностью вычисления параметра (gn; gc) усиления из невокализованного остаточного сигнала и информации (162) формирования спектра; и
- модуль (190; 690) формирования потоков битов, выполненный с возможностью формирования выходного сигнала (192; 692) на основе информации (142), связанной с вокализованным кадром сигнала, параметром (gn; gc) усиления или параметром ( ; ) квантованного усиления и коэффициентами (122; 322) прогнозирования.
2. Кодер по п. 1, дополнительно содержащий решающий модуль (130), выполненный с возможностью определения того, определен или нет остаточный сигнал из аудиокадра невокализованного сигнала;
3. Кодер по п. 1 или 2, в котором модуль (150; 350; 350'; 550) вычисления параметров усиления содержит:
- генератор (350a) шума, выполненный с возможностью формирования шумоподобного сигнала (n(n)) для кодирования;
- формирователь (350c), выполненный с возможностью усиления (350e) и формирования (350d) спектра шумоподобного сигнала (n(n)) для кодирования с использованием информации (162) формирования речевого спектра и параметра (gn) усиления в качестве временного параметра (gn(temp)) усиления, чтобы получать усиленный шумоподобный сигнал (350g) для кодирования определенной формы;
- модуль (350h) сравнения, выполненный с возможностью сравнения невокализованного остаточного сигнала и усиленного шумоподобного сигнала (350g) для кодирования определенной формы, чтобы получать показатель для сходства между невокализованным остаточным сигналом и усиленным шумоподобным сигналом (350g) для кодирования определенной формы; и
- контроллер (350k), выполненный с возможностью определения параметра (gn) усиления и адаптации временного параметра (gn(temp)) усиления на основе результата сравнения;
- при этом контроллер (350k; 550n) выполнен с возможностью предоставлять параметр (gn) усиления при кодировании в модуль формирования потоков битов, когда значение показателя для сходства выше порогового значения.
4. Кодер по п. 1 или 2, в котором модуль (150; 350; 350'; 550) вычисления параметров усиления содержит:
- генератор (350a) шума, выполненный с возможностью формирования шумоподобного сигнала для кодирования;
- формирователь (350c), выполненный с возможностью усиления (350e) и формирования (350d) спектра шумоподобного сигнала (n(n)) для кодирования с использованием информации (162) формирования речевого спектра и параметра (gn) усиления в качестве временного параметра (gn(temp)) усиления, чтобы получать усиленный шумоподобный сигнал (350g) для кодирования определенной формы;
- синтезатор (350m'), выполненный с возможностью синтезирования синтезированного сигнала (350l') из усиленного шумоподобного сигнала (350g) для кодирования определенной формы и коэффициентов (122; 322) прогнозирования и предоставлять синтезированный сигнал (350l');
- модуль (350h') сравнения, выполненный с возможностью сравнения аудиосигнала (102) и синтезированного сигнала (350l'), чтобы получать показатель для сходства между аудиосигналом (102) и синтезированным сигналом (350l'); и
- контроллер (350k), выполненный с возможностью определения параметра (gn) усиления и адаптации временного параметра (gn(temp)) усиления на основе результата сравнения;
- при этом контроллер (350k) выполнен с возможностью предоставлять параметр (gn) усиления при кодировании в модуль формирования потоков битов, когда значение показателя для сходства выше порогового значения.
5. Кодер по п. 4, дополнительно содержащий запоминающее устройство (350n') усилений, выполненное с возможностью записи информации кодирования, содержащей параметр (gn; gc) усиления при кодировании или информацию , связанную с ним, при этом контроллер (350k) выполнен с возможностью записи информации кодирования во время обработки аудиокадра и определения параметра (gn; gc) усиления для последующего кадра аудиосигнала (102) на основе информации кодирования предшествующего кадра аудиосигнала (102).
6. Кодер по одному из пп. 3-5, в котором генератор (350a) шума выполнен с возможностью формирования множества случайных сигналов и комбинирования множества случайных сигналов, чтобы получать шумоподобный сигнал (n(n)) для кодирования.
8. Кодер по одному из предшествующих пунктов, в котором формирователь (350; 350') выполнен с возможностью комбинирования спектра шумоподобного сигнала (n(n)) для кодирования или спектра, извлекаемого из него, и передаточной функции (Ffe(z)), содержащей:
при этом A(z) соответствует полиному фильтра кодирующего фильтра для фильтрации адаптированного шумоподобного сигнала для кодирования определенной формы, взвешенного посредством весовых коэффициентов w1 или w2, при этом w1 содержит положительное ненулевое скалярное значение самое большее в 1,0, и при этом w2 содержит положительное ненулевое скалярное значение самое большее в 1,00, при этом w2 превышает w1.
9. Кодер по одному из предшествующих пунктов, в котором формирователь (350; 350') выполнен с возможностью комбинирования спектра шумоподобного сигнала для кодирования или спектра, извлекаемого из него, с передаточной функцией (Ft(z)), содержащей:
при этом z указывает представление в z-области, при этом β представляет показатель (вокализацию) для вокализации, определенной посредством связи энергии предыдущего кадра аудиосигнала и энергии текущего кадра аудиосигнала, при этом показатель β определяется в функции значения вокализации.
10. Декодер (200) для декодирования принимаемого сигнала (202), содержащего информацию, связанную с коэффициентами (122; 322) прогнозирования, причем декодер (200) содержит:
- модуль (220) вычисления информации формант, выполненный с возможностью вычисления информации (222) формирования речевого спектра из коэффициентов прогнозирования;
- генератор (240) шума, выполненный с возможностью формирования шумоподобного сигнала (n(n)) для декодирования;
- формирователь (250), выполненный с возможностью формирования (252) спектра шумоподобного сигнала (n(n)) для декодирования или его усиленного представления с использованием информации (222) формирования спектра, чтобы получать шумоподобный сигнал (258) для декодирования определенной формы; и
- синтезатор (260), выполненный с возможностью синтезирования синтезированного сигнала (262) из усиленного шумоподобного сигнала (258) для кодирования определенной формы и коэффициентов (122; 322) прогнозирования.
11. Декодер по п. 10, в котором принимаемый сигнал (202) содержит информацию, связанную с параметром (gn; gc) усиления, при этом формирователь (250) содержит усилитель (254), выполненный с возможностью усиления шумоподобного сигнала (n(n)) для декодирования или шумоподобного сигнала (256) для декодирования определенной формы.
12. Декодер по п. 10 или 11, в котором принимаемый сигнал (202) дополнительно содержит вокализованную информацию (142), связанную с вокализованным кадром кодированного аудиосигнала (102), при этом декодер (200) дополнительно содержит процессор (270) вокализованных кадров, выполненный с возможностью определения вокализованного сигнала (272) на основе вокализованной информации (142), при этом декодер (200) дополнительно содержит модуль (280) комбинирования, выполненный с возможностью комбинирования синтезированного сигнала (262) и вокализованного сигнала (272), чтобы получать кадр последовательности (282) аудиосигналов.
13. Кодированный аудиосигнал (192; 202; 692), содержащий информацию коэффициентов (122; 322) прогнозирования для вокализованного кадра и невокализованного кадра, дополнительную информацию (142), связанную с вокализованным кадром сигнала, и информацию, связанную с параметром (gn; gc) усиления или параметром ( ; ) квантованного усиления для невокализованного кадра.
14. Способ (1200) для кодирования аудиосигнала (102), содержащий этапы, на которых:
- извлекают (1210) коэффициенты (122; 322) прогнозирования и остаточный сигнал из кадра (102) аудиосигнала;
- вычисляют (1220) информацию (162) формирования речевого спектра из коэффициентов (122; 322) прогнозирования;
- вычисляют (1230) параметр (gn; gc) усиления из невокализованного остаточного сигнала и информации (162) формирования спектра; и
15. Способ (1300) для декодирования принимаемого аудиосигнала (202), содержащего информацию, связанную с коэффициентам прогнозирования и параметрами (gn; gc) усиления, при этом способ содержит этапы, на которых:
- вычисляют (1310) информацию (222) формирования речевого спектра из коэффициентов (122; 322) прогнозирования;
- формируют (1320) шумоподобный сигнал (n(n)) для декодирования;
- формируют (1330) спектр шумоподобного сигнала (n(n)) для декодирования или его усиленное представление с использованием информации (222) формирования спектра, чтобы получать шумоподобный сигнал (258) для декодирования определенной формы; и
- синтезируют (1340) синтезированный сигнал (262) из усиленного шумоподобного сигнала (258) для кодирования определенной формы и коэффициентов (122; 322) прогнозирования.
16. Компьютерная программа, имеющая программный код для осуществления, при выполнении на компьютере, способа по п. 14 или 15.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EPEP13189392.7 | 2013-10-18 | ||
| EP13189392 | 2013-10-18 | ||
| EP14178788 | 2014-07-28 | ||
| EP14178788.7 | 2014-07-28 | ||
| PCT/EP2014/071767 WO2015055531A1 (en) | 2013-10-18 | 2014-10-10 | Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2016119010A true RU2016119010A (ru) | 2017-11-23 |
| RU2646357C2 RU2646357C2 (ru) | 2018-03-02 |
Family
ID=51691033
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2016119010A RU2646357C2 (ru) | 2013-10-18 | 2014-10-10 | Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра |
Country Status (17)
| Country | Link |
|---|---|
| US (3) | US10373625B2 (ru) |
| EP (3) | EP4632735A3 (ru) |
| JP (1) | JP6366706B2 (ru) |
| KR (1) | KR101849613B1 (ru) |
| CN (2) | CN105745705B (ru) |
| AU (1) | AU2014336356B2 (ru) |
| BR (1) | BR112016008662B1 (ru) |
| CA (1) | CA2927716C (ru) |
| ES (2) | ES2856199T3 (ru) |
| MX (1) | MX355091B (ru) |
| MY (1) | MY180722A (ru) |
| PL (1) | PL3058568T3 (ru) |
| RU (1) | RU2646357C2 (ru) |
| SG (1) | SG11201603000SA (ru) |
| TW (1) | TWI575512B (ru) |
| WO (1) | WO2015055531A1 (ru) |
| ZA (1) | ZA201603158B (ru) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105009210B (zh) * | 2013-01-29 | 2018-04-10 | 弗劳恩霍夫应用研究促进协会 | 合成音频信号的装置与方法、解码器、编码器、系统以及计算机程序 |
| BR112016008662B1 (pt) * | 2013-10-18 | 2022-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala |
| KR20160070147A (ko) * | 2013-10-18 | 2016-06-17 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 결정론적 및 잡음 유사 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념 |
| PL3139382T3 (pl) * | 2014-05-01 | 2019-11-29 | Nippon Telegraph & Telephone | Urządzenie kodujące sygnał dźwiękowy, sposób kodowania sygnału dźwiękowego, program i nośnik rejestrujący |
| RU2665916C2 (ru) * | 2014-07-29 | 2018-09-04 | Телефонактиеболагет Лм Эрикссон (Пабл) | Оценивание фонового шума в аудиосигналах |
| US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
| WO2020164752A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
| CN113129910B (zh) | 2019-12-31 | 2024-07-30 | 华为技术有限公司 | 音频信号的编解码方法和编解码装置 |
| CN112002338B (zh) * | 2020-09-01 | 2024-06-21 | 北京百瑞互联技术股份有限公司 | 一种优化音频编码量化次数的方法及系统 |
| BR112023017361A2 (pt) * | 2021-03-11 | 2023-10-03 | Dolby Int Ab | Audio codec com controle de ganho adaptativo de sinais via downmix |
| CN114596870A (zh) * | 2022-03-07 | 2022-06-07 | 广州博冠信息科技有限公司 | 实时音频处理方法和装置、计算机存储介质、电子设备 |
Family Cites Families (43)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
| CA2108623A1 (en) * | 1992-11-02 | 1994-05-03 | Yi-Sheng Wang | Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop |
| JP3099852B2 (ja) * | 1993-01-07 | 2000-10-16 | 日本電信電話株式会社 | 励振信号の利得量子化方法 |
| US5864797A (en) * | 1995-05-30 | 1999-01-26 | Sanyo Electric Co., Ltd. | Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors |
| US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
| GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
| JP3747492B2 (ja) | 1995-06-20 | 2006-02-22 | ソニー株式会社 | 音声信号の再生方法及び再生装置 |
| JPH1020891A (ja) * | 1996-07-09 | 1998-01-23 | Sony Corp | 音声符号化方法及び装置 |
| JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
| US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
| JPH11122120A (ja) * | 1997-10-17 | 1999-04-30 | Sony Corp | 符号化方法及び装置、並びに復号化方法及び装置 |
| EP1755227B1 (en) * | 1997-10-22 | 2008-09-10 | Matsushita Electric Industrial Co., Ltd. | Multistage vector quantization for speech encoding |
| AU732401B2 (en) | 1997-12-24 | 2001-04-26 | Blackberry Limited | A method for speech coding, method for speech decoding and their apparatuses |
| US6415252B1 (en) | 1998-05-28 | 2002-07-02 | Motorola, Inc. | Method and apparatus for coding and decoding speech |
| JP3955179B2 (ja) | 1998-06-09 | 2007-08-08 | 松下電器産業株式会社 | 音声符号化装置、音声復号化装置、およびこれらの方法 |
| US6067511A (en) * | 1998-07-13 | 2000-05-23 | Lockheed Martin Corp. | LPC speech synthesis using harmonic excitation generator with phase modulator for voiced speech |
| US6192335B1 (en) | 1998-09-01 | 2001-02-20 | Telefonaktieboiaget Lm Ericsson (Publ) | Adaptive combining of multi-mode coding for voiced speech and noise-like signals |
| US6463410B1 (en) | 1998-10-13 | 2002-10-08 | Victor Company Of Japan, Ltd. | Audio signal processing apparatus |
| CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
| US6311154B1 (en) | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
| JP3451998B2 (ja) * | 1999-05-31 | 2003-09-29 | 日本電気株式会社 | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 |
| US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
| DE10124420C1 (de) | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Codierung und zur Übertragung von Sprachsignalen |
| US6871176B2 (en) * | 2001-07-26 | 2005-03-22 | Freescale Semiconductor, Inc. | Phase excited linear prediction encoder |
| KR101000345B1 (ko) | 2003-04-30 | 2010-12-13 | 파나소닉 주식회사 | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 |
| EP1618557B1 (en) | 2003-05-01 | 2007-07-25 | Nokia Corporation | Method and device for gain quantization in variable bit rate wideband speech coding |
| KR100651712B1 (ko) * | 2003-07-10 | 2006-11-30 | 학교법인연세대학교 | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 |
| JP4899359B2 (ja) * | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
| JP5188990B2 (ja) | 2006-02-22 | 2013-04-24 | フランス・テレコム | Celp技術における、デジタルオーディオ信号の改善された符号化/復号化 |
| US8712766B2 (en) * | 2006-05-16 | 2014-04-29 | Motorola Mobility Llc | Method and system for coding an information signal using closed loop adaptive bit allocation |
| PL2165328T3 (pl) | 2007-06-11 | 2018-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodowanie i dekodowanie sygnału audio zawierającego część impulsową i część stacjonarną |
| CN101971251B (zh) | 2008-03-14 | 2012-08-08 | 杜比实验室特许公司 | 像言语的信号和不像言语的信号的多模式编解码方法及装置 |
| EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
| JP5148414B2 (ja) * | 2008-08-29 | 2013-02-20 | 株式会社東芝 | 信号帯域拡張装置 |
| RU2400832C2 (ru) | 2008-11-24 | 2010-09-27 | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России) | Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием |
| GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
| JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
| RU2591021C2 (ru) | 2011-02-15 | 2016-07-10 | Войсэйдж Корпорейшн | Устройство и способ для квантования усилений адаптивного и фиксированного вкладов возбуждения в кодеке celp |
| US9972325B2 (en) | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
| CN105469805B (zh) | 2012-03-01 | 2018-01-12 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
| BR112016008662B1 (pt) * | 2013-10-18 | 2022-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala |
| KR20160070147A (ko) * | 2013-10-18 | 2016-06-17 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 결정론적 및 잡음 유사 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념 |
| PT3058568T (pt) | 2013-10-18 | 2021-03-04 | Fraunhofer Ges Forschung | Conceito para codificar um sinal de áudio e descodificar um sinal de áudio usando informação de modelação espectral relacionada com a fala |
-
2014
- 2014-10-10 BR BR112016008662-7A patent/BR112016008662B1/pt active IP Right Grant
- 2014-10-10 EP EP25191427.1A patent/EP4632735A3/en active Pending
- 2014-10-10 PL PL14783821T patent/PL3058568T3/pl unknown
- 2014-10-10 AU AU2014336356A patent/AU2014336356B2/en active Active
- 2014-10-10 JP JP2016524523A patent/JP6366706B2/ja active Active
- 2014-10-10 ES ES14783821T patent/ES2856199T3/es active Active
- 2014-10-10 ES ES20210767T patent/ES3044088T3/es active Active
- 2014-10-10 MY MYPI2016000655A patent/MY180722A/en unknown
- 2014-10-10 SG SG11201603000SA patent/SG11201603000SA/en unknown
- 2014-10-10 MX MX2016004923A patent/MX355091B/es active IP Right Grant
- 2014-10-10 KR KR1020167012958A patent/KR101849613B1/ko active Active
- 2014-10-10 CN CN201480057458.9A patent/CN105745705B/zh active Active
- 2014-10-10 WO PCT/EP2014/071767 patent/WO2015055531A1/en not_active Ceased
- 2014-10-10 RU RU2016119010A patent/RU2646357C2/ru active
- 2014-10-10 EP EP20210767.8A patent/EP3806094B1/en active Active
- 2014-10-10 CA CA2927716A patent/CA2927716C/en active Active
- 2014-10-10 EP EP14783821.3A patent/EP3058568B1/en active Active
- 2014-10-10 CN CN202010115752.8A patent/CN111370009B/zh active Active
- 2014-10-16 TW TW103135844A patent/TWI575512B/zh active
-
2016
- 2016-04-18 US US15/131,681 patent/US10373625B2/en active Active
- 2016-05-11 ZA ZA2016/03158A patent/ZA201603158B/en unknown
-
2019
- 2019-07-08 US US16/504,891 patent/US10909997B2/en active Active
-
2020
- 2020-12-14 US US17/121,179 patent/US11881228B2/en active Active
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2016119010A (ru) | Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра | |
| CN102341849B (zh) | 锥形矢量音频编码 | |
| JP6185029B2 (ja) | オーディオコーデックにおけるノイズ生成 | |
| ATE450857T1 (de) | Verfahren und vorrichtung zur kodierung von audiodaten basierend auf vektorquantisierung | |
| TW200746052A (en) | Apparatus and method for encoding and decoding signal | |
| RU2012150075A (ru) | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы | |
| WO2011059254A3 (en) | An apparatus for processing a signal and method thereof | |
| JP2009134303A5 (ru) | ||
| RU2009117181A (ru) | Системы, способы и устройство для восстановления при стирании кадра | |
| JP2012230419A5 (ja) | フレーム消去隠蔽を実行するための装置 | |
| JP2010210680A5 (ru) | ||
| CA2717584A1 (en) | Method and apparatus for processing an audio signal | |
| CN105264596B (zh) | 用于码激励线性预测类编码器的无边信息的噪声填充 | |
| RU2016140233A (ru) | Кодер, декодер и способ кодирования и декодирования | |
| JP2013044921A5 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
| DE69923079D1 (de) | Kodierung von stimmlosen sprachsegmenten mit niedriger datenrate | |
| US11094332B2 (en) | Low-complexity tonality-adaptive audio signal quantization | |
| RU2017129552A (ru) | Звуковые кодирующее устройство и декодирующее устройство | |
| RU2016118979A (ru) | Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации | |
| FI3751566T3 (fi) | Menetelmiä, kooderi ja dekooderi äänisignaalien lineaariseen ennakoivaan koodaukseen ja dekoodaukseen näytteistystaajuudeltaan erilaisten kehysten välillä siirryttäessä | |
| CN102483922A (zh) | 使用加权线性预测变换对音频信号进行编码和解码的设备和方法 | |
| RU2016136008A (ru) | Улучшенное расширение диапазона частот в декодере звукового сигнала | |
| CN105118512B (zh) | 一种面向aac数字音频的通用隐写分析方法 | |
| JP6141443B2 (ja) | 符号化方法、復号化方法、符号化装置及び復号化装置 | |
| CN105336336B (zh) | 一种音频信号的时域包络处理方法及装置、编码器 |