[go: up one dir, main page]

RU2001117231A - Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудио-сигнале - Google Patents

Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудио-сигнале

Info

Publication number
RU2001117231A
RU2001117231A RU2001117231/09A RU2001117231A RU2001117231A RU 2001117231 A RU2001117231 A RU 2001117231A RU 2001117231/09 A RU2001117231/09 A RU 2001117231/09A RU 2001117231 A RU2001117231 A RU 2001117231A RU 2001117231 A RU2001117231 A RU 2001117231A
Authority
RU
Russia
Prior art keywords
audio signal
determination
correlation function
result
values
Prior art date
Application number
RU2001117231/09A
Other languages
English (en)
Other versions
RU2251750C2 (ru
Inventor
Йонас СВЕДБЕРГ
Эрик ЭКУДДЕН
Андерс УВЛИДЕН
Ингемар ЙОХАНССОН
Original Assignee
Телефонактиеболагет Лм Эрикссон (Пабл)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/434,787 external-priority patent/US6424938B1/en
Application filed by Телефонактиеболагет Лм Эрикссон (Пабл) filed Critical Телефонактиеболагет Лм Эрикссон (Пабл)
Publication of RU2001117231A publication Critical patent/RU2001117231A/ru
Application granted granted Critical
Publication of RU2251750C2 publication Critical patent/RU2251750C2/ru

Links

Claims (20)

1. Способ сохранения в аудио-сигнале существенной с точки зрения восприятия неречевой информации при кодировании аудио-сигнала, включающий этапы, при которых выполняют первое определение того, содержит ли рассматриваемый аудио-сигнал информацию, представляющую собой речь или шум, отличающийся тем, что выполняют второе определение того, содержит ли аудиосигнал неречевую информацию, являющуюся существенной с точки зрения восприятия слушающим субъектом, и осуществляют выборочную отмену результата первого определения в ответ на результат второго определения.
2. Способ по п.1, отличающийся тем, что этап выполнения второго определения включает сравнение заранее заданного значения со значениями корреляционной функции, связанной с соответствующими кадрами, на которые разделен аудио-сигнал.
3. Способ по п.2, отличающийся тем, что этап выборочной отмены включает отмену результата первого определения в ответ на значение корреляционной функции, превышающее заранее заданное значение.
4. Способ по п.2, отличающийся тем, что этап выборочной отмены включает отмену результата первого определения в ответ на получение за заданный период времени заранее заданного количества значений корреляционной функции, превышающих заранее заданное значение.
5. Способ по п.4, отличающийся тем, что этап выборочной отмены включает отмену результата операции первого определения в ответ на заранее заданное количество последовательных значений корреляционной функции, превышающих заранее заданное значение.
6. Способ по п.2, отличающийся тем, что включает обнаружение для каждого кадра наибольшего нормированного значения корреляционной функции для аудио-сигнала, отфильтрованного посредством фильтра верхних частот, причем наибольшие нормированные значения корреляционной функции соответствуют упомянутым первым значениям корреляционной функции.
7. Способ по п.6, отличающийся тем, что этап обнаружения включает обнаружение для каждого из кадров наибольшего по величине нормированного значения корреляционной функции.
8. Способ по п.1, отличающийся тем, что этап выборочной отмены включает отмену результата "шум", полученного на этапе первого определения, в ответ на результат "неречевая информация, являющаяся существенной с точки зрения восприятия", полученный на этапе второго определения.
9. Способ сохранения в аудио-сигнале существенной с точки зрения восприятия информации, включающий этапы, при которых определяют нормированные значения корреляционной функции для каждого из множества кадров, на которые разделен аудио-сигнал, и выполняют первое определение того, содержит ли рассматриваемый аудио-сигнал информацию, представляющую собой речь или шум, отличающийся тем, что выполняют второе определение того, содержит ли аудио- сигнал неречевую информацию, являющуюся существенной с точки зрения восприятия слушающим субъектом, осуществляют выборочную отмену результата первого определения в ответ на результат второго определения, для каждого из множества кадров, на которые разделен аудио-сигнал, обнаруживают наибольшее нормированное значение корреляционной функции для аудио-сигнала, отфильтрованного посредством фильтра верхних частот, формируют первую последовательность нормированных значений корреляции, определяют вторую последовательность репрезентативных значений для соответствующего отображения нормированных значений корреляционной функции из первой последовательности и выполняют сравнение репрезентативных значений с пороговым значением для получения указания того, содержит ли аудио-сигнал существенную с точки зрения восприятия информацию.
10. Способ по п.9, отличающийся тем, что этап обнаружения включает использование корреляционного анализа аудио-сигнала без формирования аудио-сигнала, отфильтрованного посредством фильтра верхних частот.
11. Способ по п.9, отличающейся тем, что этап обнаружения включает фильтрацию верхних частот аудио-сигнала и выполняемый после этого этап использования корреляционного анализа аудио-сигнала, отфильтрованного посредством фильтра верхних частот.
12. Способ по п.9, отличающийся тем, что этап обнаружения включает обнаружения для каждого из кадров наибольшего по величине нормированного значения корреляционной функции.
13. Устройство (10) для использования в устройстве кодирования аудио-сигнала для сохранения относящейся к восприятию неречевой информации, содержащейся в аудио-сигнале, содержащее устройство (16) определения типа сигнала для приема аудио-сигнала (12) и выполнения первого определения того, содержит ли рассматриваемый аудио-сигнал (12) информацию, представляющую собой речь или шум, отличающееся тем, что дополнительно содержит устройство (14) обнаружения для приема аудио-сигнала (12) и выполнения второго определения того, содержит ли аудио-сигнал (12) неречевую информацию, являющуюся существенной с точки зрения восприятия слушающим субъектом, и логическое устройство (18), соединенное с устройством (16) определения типа сигнала и с устройством (14) обнаружения, причем логическое устройство (18) имеет выход для указания, содержит ли аудио-сигнал (12) информацию, являющуюся существенной с точки зрения восприятия, при этом логическое устройство (18) выборочно выдает на упомянутый выход информацию, указывающую результат первого определения и в ответ на результат второго определения осуществляет выборочную отмену на упомянутом выходе информации, указывающей результат первого определения.
14. Устройство (10) по п.13, отличающееся тем, что устройство (14) обнаружения выполняет сравнение заранее заданного значения со значениями корреляционной функции, связанной с соответствующими кадрами, на которые разделен аудио-сигнал (12).
15. Устройство (10) по п.14, отличающееся тем, что логическое устройство (18) осуществляет отмену информации, указывающей результат первого определения, в ответ на значение корреляционной функции, превышающее заранее заданное значение.
16. Устройство (10) по п.14, отличающееся тем, что логическое устройство (18) осуществляет отмену информации, указывающей результат первого определения, в ответ на получение за заданный период времени заранее заданного количества значений корреляционной функции, превышающих заранее заданное значение.
17. Устройство (10) по п.16, отличающееся тем, что логическое устройство (18) осуществляет отмену информации, указывающей результат первого определения, в ответ на заранее заданное количество соответствующих последовательным во времени кадрам последовательных значений корреляционной функции, превышающих заранее заданное значение.
18. Устройство по п.14, отличающееся тем, что устройство (14) обнаружения в каждом из кадров обнаруживает наибольшее нормированное значение корреляционной функции для аудио-сигнала (12), отфильтрованного посредством фильтра верхних частот, причем наибольшие нормированные значения корреляционной функции соответствуют упомянутым первым значениям корреляционной функции.
19. Устройство по п.18, отличающееся тем, что каждое из наибольших нормированных значений корреляционной функции представляет собой наибольшее по величине нормированное значение корреляционной функции в соответствующем кадре.
20. Устройство (10) по п.13, отличающееся тем, что логическое устройство (18) осуществляет отмену информации, указывающей, что результатом определения является "шум", в ответ на результат "неречевая информация, являющаяся существенной с точки зрения восприятия", полученный на этапе второго определения.
RU2001117231/09A 1998-11-23 1999-11-12 Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале RU2251750C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US10955698P 1998-11-23 1998-11-23
US60/109,556 1998-11-23
US09/434,787 1999-11-05
US09/434,787 US6424938B1 (en) 1998-11-23 1999-11-05 Complex signal activity detection for improved speech/noise classification of an audio signal

Publications (2)

Publication Number Publication Date
RU2001117231A true RU2001117231A (ru) 2003-06-27
RU2251750C2 RU2251750C2 (ru) 2005-05-10

Family

ID=26807081

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2001117231/09A RU2251750C2 (ru) 1998-11-23 1999-11-12 Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале

Country Status (14)

Country Link
US (1) US6424938B1 (ru)
EP (1) EP1224659B1 (ru)
JP (1) JP4025018B2 (ru)
KR (1) KR100667008B1 (ru)
CN (2) CN1257486C (ru)
AR (1) AR030386A1 (ru)
AU (1) AU763409B2 (ru)
BR (1) BR9915576B1 (ru)
CA (1) CA2348913C (ru)
DE (1) DE69925168T2 (ru)
MY (1) MY124630A (ru)
RU (1) RU2251750C2 (ru)
WO (1) WO2000031720A2 (ru)
ZA (1) ZA200103150B (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2416129C2 (ru) * 2005-03-30 2011-04-10 Конинклейке Филипс Электроникс Н.В. Масштабируемое многоканальное кодирование звука

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6633841B1 (en) 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
US6694012B1 (en) * 1999-08-30 2004-02-17 Lucent Technologies Inc. System and method to provide control of music on hold to the hold party
US20030205124A1 (en) * 2002-05-01 2003-11-06 Foote Jonathan T. Method and system for retrieving and sequencing music by rhythmic similarity
US20040064314A1 (en) * 2002-09-27 2004-04-01 Aubert Nicolas De Saint Methods and apparatus for speech end-point detection
EP1569200A1 (en) * 2004-02-26 2005-08-31 Sony International (Europe) GmbH Identification of the presence of speech in digital audio data
EP1861847A4 (en) * 2005-03-24 2010-06-23 Mindspeed Tech Inc ADAPTIVE NOISE STATUS UPDATE FOR VOICE ACTIVITY DETECTOR
US8874437B2 (en) * 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
CA2612903C (en) * 2005-06-20 2015-04-21 Telecom Italia S.P.A. Method and apparatus for transmitting speech data to a remote device in a distributed speech recognition system
KR100785471B1 (ko) 2006-01-06 2007-12-13 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US9966085B2 (en) * 2006-12-30 2018-05-08 Google Technology Holdings LLC Method and noise suppression circuit incorporating a plurality of noise suppression techniques
MX2009007412A (es) * 2007-01-10 2009-07-17 Koninkl Philips Electronics Nv Decodificador de audio.
JP5395066B2 (ja) * 2007-06-22 2014-01-22 ヴォイスエイジ・コーポレーション 音声区間検出および音声信号分類ための方法および装置
CN101889432B (zh) * 2007-12-07 2013-12-11 艾格瑞系统有限公司 处于保持时的音乐的终端用户控制
US20090154718A1 (en) * 2007-12-14 2009-06-18 Page Steven R Method and apparatus for suppressor backfill
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
KR101221919B1 (ko) * 2008-03-03 2013-01-15 연세대학교 산학협력단 오디오 신호 처리 방법 및 장치
WO2009110751A2 (ko) * 2008-03-04 2009-09-11 Lg Electronics Inc. 오디오 신호 처리 방법 및 장치
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
RU2536679C2 (ru) 2008-07-11 2014-12-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
KR101251045B1 (ko) * 2009-07-28 2013-04-04 한국전자통신연구원 오디오 판별 장치 및 그 방법
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102044243B (zh) * 2009-10-15 2012-08-29 华为技术有限公司 语音激活检测方法与装置、编码器
US9773511B2 (en) 2009-10-19 2017-09-26 Telefonaktiebolaget Lm Ericsson (Publ) Detector and method for voice activity detection
WO2011049514A1 (en) * 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection
US20110178800A1 (en) * 2010-01-19 2011-07-21 Lloyd Watts Distortion Measurement for Noise Suppression System
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN102237085B (zh) * 2010-04-26 2013-08-14 华为技术有限公司 音频信号的分类方法及装置
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
EP2619753B1 (en) 2010-12-24 2014-05-21 Huawei Technologies Co., Ltd. Method and apparatus for adaptively detecting voice activity in input audio signal
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
WO2012127278A1 (en) * 2011-03-18 2012-09-27 Nokia Corporation Apparatus for audio signal processing
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
US9208798B2 (en) 2012-04-09 2015-12-08 Board Of Regents, The University Of Texas System Dynamic control of voice codec data rate
RU2609133C2 (ru) 2012-08-31 2017-01-30 Телефонактиеболагет Л М Эрикссон (Пабл) Способ и устройство для обнаружения голосовой активности
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
AU2013366552B2 (en) 2012-12-21 2017-03-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
SG11201504810YA (en) 2012-12-21 2015-07-30 Fraunhofer Ges Forschung Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
SG11201510510PA (en) 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for improved signal fade out in different domains during error concealment
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
RU2720357C2 (ru) 2013-12-19 2020-04-29 Телефонактиеболагет Л М Эрикссон (Пабл) Способ оценки фонового шума, блок оценки фонового шума и машиночитаемый носитель
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
KR102299330B1 (ko) * 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods
CN113345446B (zh) * 2021-06-01 2024-02-27 广州虎牙科技有限公司 音频处理方法、装置、电子设备和计算机可读存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58143394A (ja) * 1982-02-19 1983-08-25 株式会社日立製作所 音声区間の検出・分類方式
SU1594595A1 (ru) * 1988-01-11 1990-09-23 Предприятие П/Я В-2672 Устройство дл измерени меры сходства речевых образцов
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
SU1781701A1 (en) * 1990-09-27 1992-12-15 Le Nii Vektor Method of separation of speech and nonstationary noise signals
ES2240252T3 (es) * 1991-06-11 2005-10-16 Qualcomm Incorporated Vocodificador de velocidad variable.
SE502244C2 (sv) * 1993-06-11 1995-09-25 Ericsson Telefon Ab L M Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5930749A (en) * 1996-02-02 1999-07-27 International Business Machines Corporation Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US6097772A (en) * 1997-11-24 2000-08-01 Ericsson Inc. System and method for detecting speech transmissions in the presence of control signaling
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2416129C2 (ru) * 2005-03-30 2011-04-10 Конинклейке Филипс Электроникс Н.В. Масштабируемое многоканальное кодирование звука

Similar Documents

Publication Publication Date Title
RU2001117231A (ru) Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудио-сигнале
US7135002B2 (en) Determining heart rate
US10249325B2 (en) Pitch detection algorithm based on PWVT of Teager Energy Operator
US20130077797A1 (en) Signal processing system and methods for reliably detecting audible alarms
US20020097882A1 (en) Method and implementation for detecting and characterizing audible transients in noise
JP2002540441A5 (ru)
JP2004004971A5 (ru)
JPH06222789A (ja) 音声検出方法
KR910020642A (ko) 음성신호처리장치 및 음성인식장치
CN104424956A (zh) 激活音检测方法和装置
WO2003095617A3 (en) A method and apparatus for providing signal analysis of a bionems resonator or transducer
ATE211347T1 (de) Gehörangepasste qualitätsbeurteilung von audiosignalen
CN112908303A (zh) 音频信号的处理方法、装置以及电子设备
RU2127912C1 (ru) Способ обнаружения и кодирования и/или декодирования стационарных фоновых звуков и устройство для кодирования и/или декодирования стационарных фоновых звуков
WO2006019555B1 (en) Music detection with low-complexity pitch correlation algorithm
CN107221338A (zh) 声波提取装置以及提取方法
Lee et al. Voice activity detection in personal audio recordings using autocorrelogram compensation
CN112562727A (zh) 应用于音频监控的音频场景分类方法、装置以及设备
CN111048089A (zh) 提高智能穿戴设备语音唤醒成功率的方法、电子设备、计算机可读存储介质
JP2021015137A (ja) 情報処理装置、プログラム及び情報処理方法
JPH09127073A (ja) 自己回帰モデルを利用した時系列データの収集、処理方法
JPH02253298A (ja) 音声通過フィルタ
CN113247730B (zh) 基于多维特征的电梯乘客尖叫检测方法及系统
JP2648779B2 (ja) 通話信号識別装置
JPS5491009A (en) Audio recognition unit