CN104409080B - 语音端点检测方法和装置 - Google Patents
语音端点检测方法和装置 Download PDFInfo
- Publication number
- CN104409080B CN104409080B CN201410779544.2A CN201410779544A CN104409080B CN 104409080 B CN104409080 B CN 104409080B CN 201410779544 A CN201410779544 A CN 201410779544A CN 104409080 B CN104409080 B CN 104409080B
- Authority
- CN
- China
- Prior art keywords
- audio
- voice
- section
- mark
- measured
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000001514 detection method Methods 0.000 claims abstract description 33
- 239000012634 fragment Substances 0.000 claims abstract description 17
- 238000012706 support-vector machine Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 12
- 230000009471 action Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
Claims (8)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201410779544.2A CN104409080B (zh) | 2014-12-15 | 2014-12-15 | 语音端点检测方法和装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201410779544.2A CN104409080B (zh) | 2014-12-15 | 2014-12-15 | 语音端点检测方法和装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN104409080A CN104409080A (zh) | 2015-03-11 |
| CN104409080B true CN104409080B (zh) | 2018-09-18 |
Family
ID=52646703
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201410779544.2A Active CN104409080B (zh) | 2014-12-15 | 2014-12-15 | 语音端点检测方法和装置 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN104409080B (zh) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105118502B (zh) * | 2015-07-14 | 2017-05-10 | 百度在线网络技术(北京)有限公司 | 语音识别系统的端点检测方法及系统 |
| CN107564545A (zh) * | 2016-06-30 | 2018-01-09 | 展讯通信(上海)有限公司 | 语音活动侦测方法及装置 |
| CN106558313A (zh) * | 2016-11-16 | 2017-04-05 | 北京云知声信息技术有限公司 | 语音识别方法及装置 |
| CN108428448A (zh) * | 2017-02-13 | 2018-08-21 | 芋头科技(杭州)有限公司 | 一种语音端点检测方法及语音识别方法 |
| CN108766418B (zh) * | 2018-05-24 | 2020-01-14 | 百度在线网络技术(北京)有限公司 | 语音端点识别方法、装置及设备 |
| CN108877778B (zh) | 2018-06-13 | 2019-09-17 | 百度在线网络技术(北京)有限公司 | 语音端点检测方法及设备 |
| CN109378016A (zh) * | 2018-10-10 | 2019-02-22 | 四川长虹电器股份有限公司 | 一种基于vad的关键词识别标注方法 |
| CN109616097B (zh) * | 2019-01-04 | 2024-05-10 | 平安科技(深圳)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
| CN109817240A (zh) * | 2019-03-21 | 2019-05-28 | 北京儒博科技有限公司 | 信号分离方法、装置、设备及存储介质 |
| CN110034976B (zh) * | 2019-04-08 | 2021-06-15 | Oppo广东移动通信有限公司 | 一种数据识别的方法及装置 |
| CN110473528B (zh) * | 2019-08-22 | 2022-01-28 | 北京明略软件系统有限公司 | 语音识别方法和装置、存储介质及电子装置 |
| CN110808073A (zh) * | 2019-11-13 | 2020-02-18 | 苏州思必驰信息科技有限公司 | 语音活动检测方法、语音识别方法及系统 |
| CN111159464B (zh) * | 2019-12-26 | 2023-12-15 | 腾讯科技(深圳)有限公司 | 一种音频片段的检测方法及相关设备 |
| CN112669822B (zh) * | 2020-12-16 | 2022-11-25 | 爱驰汽车有限公司 | 音频处理方法、装置、电子设备和存储介质 |
Citations (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4803729A (en) * | 1987-04-03 | 1989-02-07 | Dragon Systems, Inc. | Speech recognition method |
| US5611019A (en) * | 1993-05-19 | 1997-03-11 | Matsushita Electric Industrial Co., Ltd. | Method and an apparatus for speech detection for determining whether an input signal is speech or nonspeech |
| US6208967B1 (en) * | 1996-02-27 | 2001-03-27 | U.S. Philips Corporation | Method and apparatus for automatic speech segmentation into phoneme-like units for use in speech processing applications, and based on segmentation into broad phonetic classes, sequence-constrained vector quantization and hidden-markov-models |
| TW200421262A (en) * | 2003-04-04 | 2004-10-16 | Penpower Technology Ltd | Speech model training method applied in speech recognition |
| CN101171624A (zh) * | 2005-03-11 | 2008-04-30 | 株式会社建伍 | 语音合成装置,语音合成方法,以及程序 |
| CN101197130A (zh) * | 2006-12-07 | 2008-06-11 | 华为技术有限公司 | 声音活动检测方法和声音活动检测器 |
| CN101656070A (zh) * | 2008-08-22 | 2010-02-24 | 展讯通信(上海)有限公司 | 一种语音检测方法 |
| CN102170528A (zh) * | 2011-03-25 | 2011-08-31 | 天脉聚源(北京)传媒科技有限公司 | 一种新闻节目的分段方法 |
| CN102945670A (zh) * | 2012-11-26 | 2013-02-27 | 河海大学 | 一种用于语音识别系统的多环境特征补偿方法 |
| CN103440862A (zh) * | 2013-08-16 | 2013-12-11 | 北京奇艺世纪科技有限公司 | 一种语音与音乐合成的方法、装置以及设备 |
| CN103530432A (zh) * | 2013-09-24 | 2014-01-22 | 华南理工大学 | 一种具有语音提取功能的会议记录器及语音提取方法 |
| CN103824555A (zh) * | 2012-11-19 | 2014-05-28 | 腾讯科技(深圳)有限公司 | 音频段提取方法及提取装置 |
| CN103824557A (zh) * | 2014-02-19 | 2014-05-28 | 清华大学 | 一种具有自定义功能的音频检测分类方法 |
| CN103854662A (zh) * | 2014-03-04 | 2014-06-11 | 中国人民解放军总参谋部第六十三研究所 | 基于多域联合估计的自适应语音检测方法 |
| CN103871417A (zh) * | 2014-03-25 | 2014-06-18 | 北京工业大学 | 一种移动手机特定连续语音过滤方法及过滤装置 |
| CN104103280A (zh) * | 2014-07-15 | 2014-10-15 | 无锡中星微电子有限公司 | 基于动态时间归整算法的离线语音端点检测的方法和装置 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20040064314A1 (en) * | 2002-09-27 | 2004-04-01 | Aubert Nicolas De Saint | Methods and apparatus for speech end-point detection |
| KR100930584B1 (ko) * | 2007-09-19 | 2009-12-09 | 한국전자통신연구원 | 인간 음성의 유성음 특징을 이용한 음성 판별 방법 및 장치 |
| DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
-
2014
- 2014-12-15 CN CN201410779544.2A patent/CN104409080B/zh active Active
Patent Citations (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4803729A (en) * | 1987-04-03 | 1989-02-07 | Dragon Systems, Inc. | Speech recognition method |
| US5611019A (en) * | 1993-05-19 | 1997-03-11 | Matsushita Electric Industrial Co., Ltd. | Method and an apparatus for speech detection for determining whether an input signal is speech or nonspeech |
| US6208967B1 (en) * | 1996-02-27 | 2001-03-27 | U.S. Philips Corporation | Method and apparatus for automatic speech segmentation into phoneme-like units for use in speech processing applications, and based on segmentation into broad phonetic classes, sequence-constrained vector quantization and hidden-markov-models |
| TW200421262A (en) * | 2003-04-04 | 2004-10-16 | Penpower Technology Ltd | Speech model training method applied in speech recognition |
| CN101171624A (zh) * | 2005-03-11 | 2008-04-30 | 株式会社建伍 | 语音合成装置,语音合成方法,以及程序 |
| CN101197130A (zh) * | 2006-12-07 | 2008-06-11 | 华为技术有限公司 | 声音活动检测方法和声音活动检测器 |
| CN101656070A (zh) * | 2008-08-22 | 2010-02-24 | 展讯通信(上海)有限公司 | 一种语音检测方法 |
| CN102170528A (zh) * | 2011-03-25 | 2011-08-31 | 天脉聚源(北京)传媒科技有限公司 | 一种新闻节目的分段方法 |
| CN103824555A (zh) * | 2012-11-19 | 2014-05-28 | 腾讯科技(深圳)有限公司 | 音频段提取方法及提取装置 |
| CN102945670A (zh) * | 2012-11-26 | 2013-02-27 | 河海大学 | 一种用于语音识别系统的多环境特征补偿方法 |
| CN103440862A (zh) * | 2013-08-16 | 2013-12-11 | 北京奇艺世纪科技有限公司 | 一种语音与音乐合成的方法、装置以及设备 |
| CN103530432A (zh) * | 2013-09-24 | 2014-01-22 | 华南理工大学 | 一种具有语音提取功能的会议记录器及语音提取方法 |
| CN103824557A (zh) * | 2014-02-19 | 2014-05-28 | 清华大学 | 一种具有自定义功能的音频检测分类方法 |
| CN103854662A (zh) * | 2014-03-04 | 2014-06-11 | 中国人民解放军总参谋部第六十三研究所 | 基于多域联合估计的自适应语音检测方法 |
| CN103871417A (zh) * | 2014-03-25 | 2014-06-18 | 北京工业大学 | 一种移动手机特定连续语音过滤方法及过滤装置 |
| CN104103280A (zh) * | 2014-07-15 | 2014-10-15 | 无锡中星微电子有限公司 | 基于动态时间归整算法的离线语音端点检测的方法和装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN104409080A (zh) | 2015-03-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN104409080B (zh) | 语音端点检测方法和装置 | |
| CN104505090B (zh) | 敏感词的语音识别方法和装置 | |
| KR102128926B1 (ko) | 오디오 정보 처리 방법 및 디바이스 | |
| CN105336324A (zh) | 一种语种识别方法及装置 | |
| CN104156454B (zh) | 搜索词的纠错方法和装置 | |
| CN107967912B (zh) | 一种人声分割方法及装置 | |
| CN110853648B (zh) | 一种不良语音检测方法、装置、电子设备及存储介质 | |
| CN108614987A (zh) | 数据处理的方法、装置和机器人 | |
| CN111462758A (zh) | 智能会议角色分类的方法、装置、设备及存储介质 | |
| CN106571146A (zh) | 噪音信号确定方法、语音去噪方法及装置 | |
| CN110688520A (zh) | 音频特征提取方法、装置及介质 | |
| WO2022134798A1 (zh) | 基于自然语言的断句方法、装置、设备及存储介质 | |
| CN105469801B (zh) | 一种修复输入语音的方法及其装置 | |
| CN109147764A (zh) | 语音交互方法、装置、设备及计算机可读介质 | |
| CN106815193A (zh) | 模型训练方法及装置和错别字识别方法及装置 | |
| CN109935226A (zh) | 一种基于深度神经网络的远场语音识别增强系统及方法 | |
| CN106844412A (zh) | 一种人脸数据收集方法及装置 | |
| CN106650610A (zh) | 一种人脸表情数据收集方法及装置 | |
| CN109300474A (zh) | 一种语音信号处理方法及装置 | |
| CN114049898B (zh) | 一种音频提取方法、装置、设备和存储介质 | |
| CN111986657A (zh) | 音频识别方法和装置、录音终端及服务器、存储介质 | |
| CN114329042B (zh) | 数据处理方法、装置、设备、存储介质及计算机程序产品 | |
| CN111382385A (zh) | 网页所属行业分类方法及装置 | |
| CN107680598B (zh) | 基于好友声纹通讯录的信息交互方法、装置及其设备 | |
| CN104318931B (zh) | 一种音频文件的情绪活跃度获取方法及分类方法、装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
| PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Voice end node detection method and device Effective date of registration: 20190531 Granted publication date: 20180918 Pledgee: Shenzhen Black Horse World Investment Consulting Co.,Ltd. Pledgor: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd. Registration number: 2019990000503 |
|
| CP02 | Change in the address of a patent holder | ||
| CP02 | Change in the address of a patent holder |
Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd. Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd. |
|
| PP01 | Preservation of patent right | ||
| PP01 | Preservation of patent right |
Effective date of registration: 20240604 Granted publication date: 20180918 |