[go: up one dir, main page]

RU2018115191A - Кодер и способ кодирования аудиосигнала с уменьшенным фоновым шумом с использованием кодирования с линейным предсказанием - Google Patents

Кодер и способ кодирования аудиосигнала с уменьшенным фоновым шумом с использованием кодирования с линейным предсказанием Download PDF

Info

Publication number
RU2018115191A
RU2018115191A RU2018115191A RU2018115191A RU2018115191A RU 2018115191 A RU2018115191 A RU 2018115191A RU 2018115191 A RU2018115191 A RU 2018115191A RU 2018115191 A RU2018115191 A RU 2018115191A RU 2018115191 A RU2018115191 A RU 2018115191A
Authority
RU
Russia
Prior art keywords
audio signal
background noise
representation
encoder
linear prediction
Prior art date
Application number
RU2018115191A
Other languages
English (en)
Other versions
RU2018115191A3 (ru
RU2712125C2 (ru
Inventor
Йоханнес ФИШЕР
Том БЕКСТРЕМ
Эмма ЙОКИНЕН
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2018115191A3 publication Critical patent/RU2018115191A3/ru
Publication of RU2018115191A publication Critical patent/RU2018115191A/ru
Application granted granted Critical
Publication of RU2712125C2 publication Critical patent/RU2712125C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (25)

1. Кодер (4) для кодирования аудиосигнала (8') с уменьшенным фоновым шумом с использованием кодирования с линейным предсказанием, причем кодер (4) содержит
средство (10) оценки фонового шума, сконфигурированное с возможностью оценивать представление фонового шума (12) аудиосигнала (8');
средство (14) уменьшения фонового шума, сконфигурированное с возможностью генерировать представление аудиосигнала (16) с уменьшенным фоновым шумом путем вычитания представления оцененного фонового шума (12) аудиосигнала (8') из представления аудиосигнала (8);
средство (18) предсказания, сконфигурированное с возможностью подвергать представление аудиосигнала (8) анализу методом линейного предсказания, чтобы получить первый набор коэффициентов (20a) фильтра линейного предсказания (LPC), и подвергать представление аудиосигнала (12) с уменьшенным фоновым шумом анализу методом линейного предсказания, чтобы получить второй набор коэффициентов (20b) фильтра линейного предсказания (LPC); и
фильтр (22) анализа, состоящий из каскада фильтров (24, 24a, 24b) временной области, управляемых полученным первым набором коэффициентов (20a) LPC и полученным вторым набором коэффициентов (20b) LPC, чтобы получить сигнал (26) невязки из аудиосигнала (8').
2. Кодер (4) по п.1, в котором каскад фильтров (24) временной области содержит два раза фильтр (24a) линейного предсказания с использованием полученного первого набора коэффициентов (20a) LPC и один раз обратную функцию дополнительного фильтра (24b) линейного предсказания с использованием полученного второго набора коэффициентов (20b) LPC.
3. Кодер (4) по п.1, в котором каскад фильтров (24) временной области является фильтром Винера.
4. Кодер (4) по п.1,
в котором средство (10) оценки фонового шума сконфигурировано с возможностью оценить автокорреляцию фонового шума в качестве представления фонового шума (12) аудиосигнала (8);
в котором средство (14) уменьшения фонового шума сконфигурировано с возможностью генерировать представление аудиосигнала (16) с уменьшенным фоновым шумом путем вычитания автокорреляции фонового шума (12) из автокорреляции аудиосигнала (8), причем автокорреляция аудиосигнала (8) является представлением аудиосигнала и причем представление аудиосигнала (16) с уменьшенным фоновым шумом является автокорреляцией аудиосигнала с уменьшенным фоновым шумом.
5. Кодер (4) по п.1, в котором представление является автокорреляцией.
6. Кодер (4) по п.1, дополнительно содержащий передатчик (30), сконфигурированный с возможностью передавать второй набор коэффициентов (20b) LPC.
7. Кодер (4) по п.1, дополнительно содержащий передатчик, сконфигурированный с возможностью передавать сигнал (26) невязки.
8. Кодер (4) по п.1, дополнительно содержащий квантователь (28), сконфигурированный с возможностью квантовать и/или кодировать сигнал (26) невязки перед передачей.
9. Кодер (4) по п.1, дополнительно содержащий квантователь (28), сконфигурированный с возможностью квантовать и/или кодировать второй набор коэффициентов (20b) LPC перед передачей.
10. Кодер по п.8, в котором квантователь сконфигурирован с возможностью использовать линейное предсказание с кодовым возбуждением (CELP), энтропийное кодирование или возбуждение, кодируемое с преобразованием (TCX).
11. Система (2), содержащая
кодер (4) по п.1;
декодер (6), сконфигурированный с возможностью декодировать закодированный аудиосигнал.
12. Способ (800) кодирования аудиосигнала с уменьшенным фоновым шумом с использованием кодирования с линейным предсказанием, причем способ содержит этапы, на которых
оценивают (S802) представление фонового шума аудиосигнала;
генерируют (S804) представление аудиосигнала с уменьшенным фоновым шумом путем вычитания представления оцененного фонового шума аудиосигнала из представления аудиосигнала;
подвергают (S806) представление аудиосигнала анализу методом линейного предсказания, чтобы получить первый набор коэффициентов фильтра линейного предсказания (LPC), и подвергают представление аудиосигнала с уменьшенным фоновым шумом анализу методом линейного предсказания, чтобы получить второй набор коэффициентов фильтра линейного предсказания (LPC); и
управляют (S808) каскадом фильтров временной области посредством полученного первого набора коэффициентов LPC и полученного второго набора коэффициентов LPC, чтобы получить сигнал невязки из аудиосигнала.
13. Компьютерная программа, содержащая программный код для выполнения способа по п.12.
RU2018115191A 2015-09-25 2016-09-23 Кодер и способ кодирования аудиосигнала с уменьшенным фоновым шумом с использованием кодирования с линейным предсказанием RU2712125C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP15186901.3 2015-09-25
EP15186901 2015-09-25
EP16175469 2016-06-21
EP16175469.2 2016-06-21
PCT/EP2016/072701 WO2017050972A1 (en) 2015-09-25 2016-09-23 Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding

Publications (3)

Publication Number Publication Date
RU2018115191A3 RU2018115191A3 (ru) 2019-10-25
RU2018115191A true RU2018115191A (ru) 2019-10-25
RU2712125C2 RU2712125C2 (ru) 2020-01-24

Family

ID=56990444

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018115191A RU2712125C2 (ru) 2015-09-25 2016-09-23 Кодер и способ кодирования аудиосигнала с уменьшенным фоновым шумом с использованием кодирования с линейным предсказанием

Country Status (11)

Country Link
US (1) US10692510B2 (ru)
EP (1) EP3353783B1 (ru)
JP (1) JP6654237B2 (ru)
KR (1) KR102152004B1 (ru)
CN (1) CN108352166B (ru)
BR (1) BR112018005910B1 (ru)
CA (1) CA2998689C (ru)
ES (1) ES2769061T3 (ru)
MX (1) MX374903B (ru)
RU (1) RU2712125C2 (ru)
WO (1) WO2017050972A1 (ru)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3324407A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
WO2018189414A1 (en) * 2017-04-10 2018-10-18 Nokia Technologies Oy Audio coding
EP3742391A1 (en) * 2018-03-29 2020-11-25 Leica Microsystems CMS GmbH Apparatus and computer-implemented method using baseline estimation and half-quadratic minimization for the deblurring of images
US10741192B2 (en) * 2018-05-07 2020-08-11 Qualcomm Incorporated Split-domain speech signal enhancement
EP3671739A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Apparatus and method for source separation using an estimation and control of sound quality
CN119170024A (zh) 2019-01-03 2024-12-20 杜比国际公司 用于混合语音合成的方法、设备及系统
US11195540B2 (en) * 2019-01-28 2021-12-07 Cirrus Logic, Inc. Methods and apparatus for an adaptive blocking matrix
CN110455530B (zh) * 2019-09-18 2021-08-31 福州大学 谱峭度结合卷积神经网络的风机齿轮箱复合故障诊断方法
CN114830640B (zh) * 2019-12-06 2025-02-25 杜比实验室特许公司 级联预测
CN111986686B (zh) * 2020-07-09 2023-01-03 厦门快商通科技股份有限公司 短时语音信噪比估算方法、装置、设备及存储介质
US11875809B2 (en) * 2020-10-01 2024-01-16 Baidu Usa Llc Speech denoising via discrete representation learning
CN113763973A (zh) * 2021-04-30 2021-12-07 腾讯科技(深圳)有限公司 音频信号增强方法、装置、计算机设备和存储介质
US12374348B2 (en) 2021-07-20 2025-07-29 Samsung Electronics Co., Ltd. Method and electronic device for improving audio quality
CN113409810B (zh) * 2021-08-19 2021-10-29 成都启英泰伦科技有限公司 一种联合去混响的回声消除方法
CN114333856B (zh) * 2021-12-24 2024-08-02 南京西觉硕信息科技有限公司 给定线性预测系数时后半帧语音信号的求解方法、装置及系统
CN115762545A (zh) * 2022-12-27 2023-03-07 中国联合网络通信集团有限公司 语音增强方法、装置及电子设备

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5173941A (en) * 1991-05-31 1992-12-22 Motorola, Inc. Reduced codebook search arrangement for CELP vocoders
US5307460A (en) * 1992-02-14 1994-04-26 Hughes Aircraft Company Method and apparatus for determining the excitation signal in VSELP coders
WO1995002288A1 (en) * 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
US5590242A (en) * 1994-03-24 1996-12-31 Lucent Technologies Inc. Signal bias removal for robust telephone speech recognition
US6001131A (en) * 1995-02-24 1999-12-14 Nynex Science & Technology, Inc. Automatic target noise cancellation for speech enhancement
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
CA2206652A1 (en) * 1996-06-04 1997-12-04 Claude Laflamme Baud-rate-independent asvd transmission built around g.729 speech-coding standard
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
JP2002175100A (ja) * 2000-12-08 2002-06-21 Matsushita Electric Ind Co Ltd 適応型雑音抑圧音声符号化装置
US6915264B2 (en) * 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
WO2002101728A1 (es) * 2001-06-11 2002-12-19 Lear Automotive (Eeds) Spain, S.L. Metodo y sistema para cancelacion de exos y ruidos en entornos con condiciones acusticas variables y altamente realimentados
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US7065486B1 (en) * 2002-04-11 2006-06-20 Mindspeed Technologies, Inc. Linear prediction based noise suppression
US7043423B2 (en) * 2002-07-16 2006-05-09 Dolby Laboratories Licensing Corporation Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
CN1458646A (zh) * 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
US7516067B2 (en) * 2003-08-25 2009-04-07 Microsoft Corporation Method and apparatus using harmonic-model-based front end for robust speech recognition
BRPI0515343A8 (pt) * 2004-09-17 2016-11-29 Koninklijke Philips Electronics Nv Codificador e decodificador de áudio, métodos de codificar um sinal de áudio e de decodificar um sinal de áudio codificado, sinal de áudio codificado, meio de armazenamento, dispositivo, e, código de programa legível por computador
EP1640971B1 (en) * 2004-09-23 2008-08-20 Harman Becker Automotive Systems GmbH Multi-channel adaptive speech signal processing with noise reduction
US8949120B1 (en) * 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8700387B2 (en) * 2006-09-14 2014-04-15 Nvidia Corporation Method and system for efficient transcoding of audio data
EP1944761A1 (en) * 2007-01-15 2008-07-16 Siemens Networks GmbH & Co. KG Disturbance reduction in digital signal processing
US8060363B2 (en) * 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
CN101896967A (zh) * 2007-11-06 2010-11-24 诺基亚公司 编码器
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
EP2458586A1 (en) * 2010-11-24 2012-05-30 Koninklijke Philips Electronics N.V. System and method for producing an audio signal
EP2676264B1 (en) * 2011-02-14 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder estimating background noise during active phases
US9208796B2 (en) * 2011-08-22 2015-12-08 Genband Us Llc Estimation of speech energy based on code excited linear prediction (CELP) parameters extracted from a partially-decoded CELP-encoded bit stream and applications of same
US9406307B2 (en) * 2012-08-19 2016-08-02 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
US9263054B2 (en) * 2013-02-21 2016-02-16 Qualcomm Incorporated Systems and methods for controlling an average encoding rate for speech signal encoding
US9520138B2 (en) * 2013-03-15 2016-12-13 Broadcom Corporation Adaptive modulation filtering for spectral feature enhancement
BR112015031606B1 (pt) * 2013-06-21 2021-12-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros
US9538297B2 (en) * 2013-11-07 2017-01-03 The Board Of Regents Of The University Of Texas System Enhancement of reverberant speech by binary mask estimation
GB201617016D0 (en) * 2016-09-09 2016-11-23 Continental automotive systems inc Robust noise estimation for speech enhancement in variable noise conditions

Also Published As

Publication number Publication date
WO2017050972A1 (en) 2017-03-30
BR112018005910B1 (pt) 2023-10-10
US20180204580A1 (en) 2018-07-19
RU2018115191A3 (ru) 2019-10-25
RU2712125C2 (ru) 2020-01-24
EP3353783B1 (en) 2019-12-11
KR102152004B1 (ko) 2020-10-27
MX2018003529A (es) 2018-08-01
JP6654237B2 (ja) 2020-02-26
ES2769061T3 (es) 2020-06-24
JP2018528480A (ja) 2018-09-27
CN108352166B (zh) 2022-10-28
CA2998689C (en) 2021-10-26
CA2998689A1 (en) 2017-03-30
EP3353783A1 (en) 2018-08-01
MX374903B (es) 2025-03-06
KR20180054823A (ko) 2018-05-24
CN108352166A (zh) 2018-07-31
BR112018005910A2 (pt) 2018-10-16
US10692510B2 (en) 2020-06-23

Similar Documents

Publication Publication Date Title
RU2018115191A (ru) Кодер и способ кодирования аудиосигнала с уменьшенным фоновым шумом с использованием кодирования с линейным предсказанием
RU2638734C2 (ru) Кодирование спектральных коэффициентов спектра аудиосигнала
MX2016011692A (es) Codificador, descodificador y metodo para codificar y descodificar.
JP5625126B2 (ja) スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
MX2021010860A (es) Modulacion de codigo de pulso diferencial de bloque de dominio de coeficiente en codificacion de video.
RU2013142079A (ru) Генерирование шума в аудиокодеках
RU2010154747A (ru) Схема кодирования/декодирования аудио сигналов с низким битрейтом с применением каскадных переключений
TWI536369B (zh) 用以基於線性預測編碼之於頻域中編碼的低頻率增強技術
FI3751566T3 (fi) Menetelmiä, kooderi ja dekooderi äänisignaalien lineaariseen ennakoivaan koodaukseen ja dekoodaukseen näytteistystaajuudeltaan erilaisten kehysten välillä siirryttäessä
JP2010210680A5 (ru)
RU2011140533A (ru) Способ кодирования аудиосигнала, способ декодирования аудиосигнала, устройство кодирования, устройство декодирования, система обработки аудиосигнала, программа кодирования аудиосигнала и программа декодирования аудиосигнала
EP4375996A3 (en) Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap
MY160265A (en) Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion
RU2013137251A (ru) Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи
RU2016105517A (ru) Заполнение шумом при многоканальном кодировании аудио
IN2015MN01874A (ru)
RU2015102588A (ru) Основанное на линейном предсказании кодирование аудио с использованием улучшенной оценки распределения вероятностей
JP2015184470A5 (ru)
RU2015149810A (ru) Устройство и способ выбора одного из первого алгоритма кодирования и второго алгоритма кодирования с использованием уменьшения гармоник
RU2015155951A (ru) Устройство и способ кодирования сигналов
EP4418266A3 (en) Method and device for quantizing linear predictive coefficient, and method and device for dequantizing same
JP2015532456A5 (ru)
RU2015116458A (ru) Устройство для кодирования речевого сигнала с использованием acelp в автокорреляционной области
WO2012070866A3 (ko) 스피치 시그널 부호화 방법 및 복호화 방법
EP2936484B1 (en) Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal