CN104820556A - 唤醒语音助手的方法及装置 - Google Patents
唤醒语音助手的方法及装置 Download PDFInfo
- Publication number
- CN104820556A CN104820556A CN201510227622.2A CN201510227622A CN104820556A CN 104820556 A CN104820556 A CN 104820556A CN 201510227622 A CN201510227622 A CN 201510227622A CN 104820556 A CN104820556 A CN 104820556A
- Authority
- CN
- China
- Prior art keywords
- face image
- ambient sound
- voice assistant
- preset condition
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种唤醒语音助手的方法及装置。所述方法包括步骤:获取人脸图像以及对应的环境声音;检测所述人脸图像是否满足第一预设条件;若所述人脸图像满足第一预设条件,检测所述环境声音是否满足第二预设条件;若所述环境声音满足第二预设条件,则唤醒语音助手,并将所述环境声音作为语音操作指令输入语音助手。本发明在人脸图像和环境声音满足相应的预设条件时,自动唤醒语音助手,并同时将所述环境声音作为语音操作指令输入语音助手,也即是用户可以直接下发操作指令,免去了语音触发的冗余步骤,实现了通信的简化,并节省了安装有语音助手的设备的电量。
Description
技术领域
本发明涉及通信技术领域,特别是涉及一种唤醒语音助手的方法、唤醒语音助手的装置。
背景技术
语音识别技术从20世纪50年代开始出现,刚开始发展比较缓慢,只能识别少量的孤立的词汇,直至90年代,这项技术开始在应用和产品化方面取得了比较大的突破,成为了技术研究的重点,其中应用较广泛的有苹果公司的Siri(苹果智能语音助手),国内的科大讯飞、百度语音、搜狗语音助手等。
在现有的各语音助手中,一般需要输入特定的语音完成触发,从而使语音助手处于语音待输入状态。例如在接电源的情况下,只要对着带Siri的ios(苹果公司的移动操作系统)设备说一声Hey Siri,就会唤醒Siri服务。语音触发作为语音输入的开启动作,不需要接触设备,很好地解决了在特定环境下进行语音输入的问题。
但是,现有的语音助手在使用时需要特定语音唤醒,而长时间开启语音唤醒功能会消耗较多的电量,并且用户需要先通过特定语音唤醒语音助手,然后再向语音助手输入相应的语音操作指令,过程较为冗余。
发明内容
基于此,有必要针对上述问题,提供一种操作简单的唤醒语音助手的方法及装置。
一种唤醒语音助手的方法,包括步骤:
获取人脸图像以及对应的环境声音;
检测所述人脸图像是否满足第一预设条件;
若所述人脸图像满足第一预设条件,检测所述环境声音是否满足第二预设条件;
若所述环境声音满足第二预设条件,则唤醒语音助手,并将所述环境声音作为语音操作指令输入语音助手。
一种唤醒语音助手的装置,包括:
人脸图像获取模块,用于获取人脸图像;
环境声音获取模块,用于获取与人脸图像对应的环境声音;
人脸图像检测模块,用于检测所述人脸图像是否满足第一预设条件;
环境声音检测模块,用于在所述人脸图像满足第一预设条件时,检测所述环境声音是否满足第二预设条件;
唤醒模块,用于在所述环境声音满足第二预设条件时,唤醒语音助手,并将所述环境声音作为语音操作指令输入语音助手。
本发明唤醒语音助手的方法及装置,在人脸图像和环境声音满足相应的预设条件时,自动唤醒语音助手,并同时将所述环境声音作为语音操作指令输入语音助手,也即是用户可以直接下发操作指令,免去了语音触发的冗余步骤,实现了通信的简化,并节省了安装有语音助手的设备的电量。
附图说明
图1为本发明方法实施例的流程示意图;
图2为本发明步骤S120具体实施例的流程示意图;
图3为本发明步骤S130具体实施例的流程示意图;
图4为本发明装置实施例的结构示意图;
图5为本发明人脸图像检测模块实施例的结构示意图;
图6为本发明第一判断单元实施例的结构示意图;
图7为本发明环境声音检测模块实施例的结构示意图。
具体实施方式
下面结合附图对本发明唤醒语音助手的方法的具体实施方式做详细描述。
如图1所示,一种唤醒语音助手的方法,包括步骤:
S110、获取人脸图像以及对应的环境声音;
S120、检测所述人脸图像是否满足第一预设条件;
S130、若所述人脸图像满足第一预设条件,检测所述环境声音是否满足第二预设条件;
S140、若所述环境声音满足第二预设条件,则唤醒语音助手,并将所述环境声音作为语音操作指令输入语音助手。
人脸图像可以根据摄像头获取,环境声音可以根据麦克风等获取。获取的摄像头图像和环境声音需进行存储,以便后续的条件检测。为了节省存储空间,可以设置人脸图像和环境声音的保留存储时间,以便一次操作完成后,无用的数据及时清除,腾出存储空间。
获取人脸图像和环境声音后,可以先检测人脸图像是否满足第一预设条件,其中第一预设条件可以根据用户需要设置为各种具体形式。例如,如图2所示,步骤S120可以包括步骤:
S1201、判断人脸图像是否为正面人脸图像,若是,进入步骤S1202,否则返回步骤S110;
S1202、判断人脸图像中的嘴部是否有动作,若有动作,进入步骤S1203,否则返回步骤S110;
S1203、判定所述人脸图像满足第一预设条件。
用户在使用语音助手时,一般正面面对智能手机或平板等,然后通过嘴部发出语音指令,也即是摄像头捕捉到的人脸图像是正面人脸图像,且检测到嘴部有动作时,按照经验,一般使用语音助手的可能性较大。判断人脸图像是否为正面人脸图像的方式有很多种,例如,步骤S1201包括步骤:
获取人脸图像中双眼的距离;
判断双眼的距离是否在预设范围内;
若是,则判定人脸图像是正面人脸图像,否则判定人脸图像不是正面人脸图像。
由于现实中使用语音助手时,用户不可能完全正向摄像头,所以本发明检测时允许一定的偏值,即本发明不限制于确定人脸图像是正面人脸图像,也可以判断人脸图像是不是近似正面人脸图像。同时确定人脸图像是不是正面人脸图像也不仅仅限制于上述提供的方法,还可以根据现有技术中其它方式实现。
嘴部是人的主要声音源,当需要向语音助手发出语音指令时,会伴随着嘴部的动作。所以在判定人脸图像是正面人脸图像后,加入嘴部动作特征的判定,能够提高准确性。根据获取的人脸图像判断嘴部是否有动作可以根据现有技术中已有的方式实现。
在检测到人脸图像时正面人脸图像且嘴部有动作时,即可以进入环境声音的检测步骤。当然用户可以根据需要添加其它的面部验证条件,从而进一步提高准确性,本发明在此不予详述。
如图3所示,步骤S130可以包括步骤:
S1301、判断所述环境声音的音量是否在预设范围内;
S1302、判断与所述环境声音的声源的距离是否小于预设阈值;
S1303、若所述音量在预设范围内且与所述声源的距离小于预设阈值,则判定所述环境声音满足第二预设条件,否则返回步骤S110。
一般用户使用语音助手时,声音的音量不会太大或者太小,而且距离设备的距离不会太大,所以本发明加入了音量大小以及距离的判断。音量可以根据现有技术中的音量检测仪等得到,设备距离声源的距离可以根据声音在空气中的定性的衰减公式确定。在根据环境声音得到音量和距离后,即可以判断音量是否在预设范围内,距离是否小于预设阈值,从而确定环境声音是否满足第二预设条件,其中预设范围和预设阈值均可以根据经验自行设定。
在环境声音满足第二预设条件时,确定用户需要对智能设备进行语音输入,唤醒语音助手,并同时将环境声音作为语音操作指令输入语音助手,语音助手直接执行相应的操作,免去了特定语音唤醒语音助手的步骤,用户操作简单。
需要说明的是,本发明并不对人脸图像及环境声音的检测顺序加以限定,另外,用户可以根据实际情况进行其他对话特征的排查,例如检测到用户是在哼歌或自言自语时认为不满足第二预设条件等,本发明并不对判定条件加以限定。
为了更好的理解本发明的实施过程,下面结合一个具体应用场景进行说明。
在厨房中做菜时,我们想借助平板电脑进行菜谱展示,从而按照上面的步骤完成一道自己不熟悉的菜式。当做完一道工序之后我们希望平板电脑中的软件能够展示下一道工序,这时候便要向它输入指令,但是这时候有可能双手都在忙或者沾上油渍不方便触碰平板电脑,这时我们只需要脸转向平板电脑说一声“下一步”,然后本发明提供的语音唤醒软件判断出我们是在向平板电脑的语音助手输入指令,而不是对别的人说话,这样便直接完成了语音助手的唤醒步骤,并且语音助手可以立即将语音解析出来,并使菜谱软件的展示翻到下一步。
基于同一发明构思,本发明还提供一种唤醒语音助手的装置,下面结合附图对本发明装置的具体实施方式做详细描述。
如图4所示,一种唤醒语音助手的装置,包括:
人脸图像获取模块410,用于获取人脸图像;
环境声音获取模块420,用于获取与人脸图像对应的环境声音;
人脸图像检测模块430,用于检测所述人脸图像是否满足第一预设条件;
环境声音检测模块440,用于在所述人脸图像满足第一预设条件时,检测所述环境声音是否满足第二预设条件;
唤醒模块450,用于在所述环境声音满足第二预设条件时,唤醒语音助手,并将所述环境声音作为语音操作指令输入语音助手。
人脸图像获取模块410可以根据摄像头获取人脸图像,环境声音获取模块420可以根据麦克风等获取环境声音。人脸图像获取模块410和环境声音获取模块420获取的摄像头图像和环境声音需进行存储,以便后续的条件检测。为了节省存储空间,可以设置人脸图像和环境声音的保留存储时间,以便一次操作完成后,无用的数据及时清除,腾出存储空间。
获取人脸图像和环境声音后,人脸图像检测模块430检测人脸图像是否满足第一预设条件,其中第一预设条件可以根据用户需要设置为各种具体形式。例如,如图5所示,所述人脸图像检测模块430可以包括:
第一判断单元4301,用于判断人脸图像是否为正面人脸图像;
第二判断单元4302,用于在人脸图像时正面人脸图像时,判断人脸图像中的嘴部是否有动作;
判定单元4303,用于在嘴部有动作时,判定所述人脸图像满足第一预设条件。
第一判断单元4301判断人脸图像是否为正面人脸图像的方式有很多种,例如,如图6所示,所述第一判断单元4301可以包括:
双眼距离获取单元43011,用于获取人脸图像中双眼的距离;
双眼距离判断单元43012,用于判断双眼的距离是否在预设范围内;
人脸图像判定单元43013,用于在双眼的距离在预设范围内时,判定人脸图像是正面人脸图像,否则判定人脸图像不是正面人脸图像。
第一判断单元4301不限制于确定人脸图像是正面人脸图像,也可以判断人脸图像是不是近似正面人脸图像。同时第一判断单元4301确定人脸图像是不是正面人脸图像也不仅仅限制于如图6所示的方式,还可以根据现有技术中其它方式实现。在判定人脸图像是正面人脸图像后,第二判断单元4302加入嘴部动作特征的判定,能够提高准确性,其中第二判断单元4302根据获取的人脸图像判断嘴部是否有动作可以根据现有技术中已有的方式实现。
环境声音检测模块440在人脸图像满足第一预设条件时,检测环境声音是否满足第二预设条件。需要说明的是,本发明并不对环境声音检测模块440和人脸图像检测模块430的执行顺序加以限定。环境声音检测模块440的实现方式有很多种,例如,如图7所示,所述环境声音检测模块440可以包括:
音量判断单元4401,用于判断所述环境声音的音量是否在预设范围内,其中音量可以根据现有技术中的音量检测仪等得到;
距离判断单元4402,用于判断与所述环境声音的声源的距离是否小于预设阈值,其中距离判断单元4402可以根据声音在空气中的定性的衰减公式确定与声源的距离;
声音判定单元4403,用于在所述音量在预设范围内且与所述声源的距离小于预设阈值时,判定所述环境声音满足第二预设条件,否则人脸图像获取模块410和环境声音获取模块420重新获取的摄像头图像和环境声音,其中预设范围和预设阈值均可以根据经验自行设定。
唤醒模块450在环境声音满足第二预设条件时,确定用户需要对智能设备进行语音输入,唤醒语音助手,并同时将环境声音作为语音操作指令输入语音助手,语音助手直接执行相应的操作,免去了特定语音唤醒语音助手的步骤,用户操作简单。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种唤醒语音助手的方法,其特征在于,包括步骤:
获取人脸图像以及对应的环境声音;
检测所述人脸图像是否满足第一预设条件;
若所述人脸图像满足第一预设条件,检测所述环境声音是否满足第二预设条件;
若所述环境声音满足第二预设条件,则唤醒语音助手,并将所述环境声音作为语音操作指令输入语音助手。
2.根据权利要求1所述的唤醒语音助手的方法,其特征在于,检测所述人脸图像是否满足第一预设条件的步骤包括:
判断人脸图像是否为正面人脸图像;
若人脸图像为正面人脸图像,判断人脸图像中的嘴部是否有动作,若人脸图像不是正面人脸图像,则返回获取人脸图像以及对应的环境声音的步骤;
若有动作,则判定所述人脸图像满足第一预设条件,否则返回获取人脸图像以及对应的环境声音的步骤。
3.根据权利要求2所述的唤醒语音助手的方法,其特征在于,判断人脸图像是否为正面人脸图像的步骤包括:
获取人脸图像中双眼的距离;
判断双眼的距离是否在预设范围内;
若是,则判定人脸图像是正面人脸图像,否则判定人脸图像不是正面人脸图像。
4.根据权利要求1所述的唤醒语音助手的方法,其特征在于,检测所述环境声音是否满足第二预设条件的步骤包括:
判断所述环境声音的音量是否在预设范围内;
判断与所述环境声音的声源的距离是否小于预设阈值;
若所述音量在预设范围内且与所述声源的距离小于预设阈值,则判定所述环境声音满足第二预设条件,否则返回获取人脸图像以及对应的环境声音的步骤。
5.根据权利要求4所述的唤醒语音助手的方法,其特征在于,与所述声源的距离根据声音在空气中的衰减公式确定。
6.一种唤醒语音助手的装置,其特征在于,包括:
人脸图像获取模块,用于获取人脸图像;
环境声音获取模块,用于获取与人脸图像对应的环境声音;
人脸图像检测模块,用于检测所述人脸图像是否满足第一预设条件;
环境声音检测模块,用于在所述人脸图像满足第一预设条件时,检测所述环境声音是否满足第二预设条件;
唤醒模块,用于在所述环境声音满足第二预设条件时,唤醒语音助手,并将所述环境声音作为语音操作指令输入语音助手。
7.根据权利要求6所述的唤醒语音助手的装置,其特征在于,所述人脸图像检测模块包括:
第一判断单元,用于判断人脸图像是否为正面人脸图像;
第二判断单元,用于在人脸图像是正面人脸图像时,判断人脸图像中的嘴部是否有动作;
判定单元,用于在嘴部有动作时,判定所述人脸图像满足第一预设条件。
8.根据权利要求7所述的唤醒语音助手的装置,其特征在于,所述第一判断单元包括:
双眼距离获取单元,用于获取人脸图像中双眼的距离;
双眼距离判断单元,用于判断双眼的距离是否在预设范围内;
人脸图像判定单元,用于在双眼的距离在预设范围内时,判定人脸图像是正面人脸图像,否则判定人脸图像不是正面人脸图像。
9.根据权利要求6所述的唤醒语音助手的装置,其特征在于,所述环境声音检测模块包括:
音量判断单元,用于判断所述环境声音的音量是否在预设范围内;
距离判断单元,用于判断与所述环境声音的声源的距离是否小于预设阈值;
声音判定单元,用于在所述音量在预设范围内且与所述声源的距离小于预设阈值时,判定所述环境声音满足第二预设条件。
10.根据权利要求9所述的唤醒语音助手的装置,其特征在于,所述距离判断单元根据声音在空气中的衰减公式确定与所述声源的距离。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510227622.2A CN104820556A (zh) | 2015-05-06 | 2015-05-06 | 唤醒语音助手的方法及装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510227622.2A CN104820556A (zh) | 2015-05-06 | 2015-05-06 | 唤醒语音助手的方法及装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN104820556A true CN104820556A (zh) | 2015-08-05 |
Family
ID=53730864
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201510227622.2A Pending CN104820556A (zh) | 2015-05-06 | 2015-05-06 | 唤醒语音助手的方法及装置 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN104820556A (zh) |
Cited By (29)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105204628A (zh) * | 2015-09-01 | 2015-12-30 | 涂悦 | 一种基于视觉唤醒的语音控制方法 |
| CN105700363A (zh) * | 2016-01-19 | 2016-06-22 | 深圳创维-Rgb电子有限公司 | 一种智能家居设备语音控制装置的唤醒方法及系统 |
| CN105912092A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的语音唤醒方法及语音识别装置 |
| WO2017035768A1 (zh) * | 2015-09-01 | 2017-03-09 | 涂悦 | 一种基于视觉唤醒的语音控制方法 |
| CN106782524A (zh) * | 2016-11-30 | 2017-05-31 | 深圳讯飞互动电子有限公司 | 一种混合唤醒方法及系统 |
| CN106847285A (zh) * | 2017-03-31 | 2017-06-13 | 上海思依暄机器人科技股份有限公司 | 一种机器人及其语音识别方法 |
| CN107315561A (zh) * | 2017-06-30 | 2017-11-03 | 联想(北京)有限公司 | 一种数据处理方法和电子设备 |
| CN107517313A (zh) * | 2017-08-22 | 2017-12-26 | 珠海市魅族科技有限公司 | 唤醒方法及装置、终端及可读存储介质 |
| CN107678793A (zh) * | 2017-09-14 | 2018-02-09 | 珠海市魅族科技有限公司 | 语音助手启动方法及装置、终端及计算机可读存储介质 |
| CN107679506A (zh) * | 2017-10-12 | 2018-02-09 | Tcl通力电子(惠州)有限公司 | 智能产品的唤醒方法、智能产品及计算机可读存储介质 |
| CN108055617A (zh) * | 2017-12-12 | 2018-05-18 | 广东小天才科技有限公司 | 一种麦克风的唤醒方法、装置、终端设备及存储介质 |
| CN108098767A (zh) * | 2016-11-25 | 2018-06-01 | 北京智能管家科技有限公司 | 一种机器人唤醒方法及装置 |
| CN108154878A (zh) * | 2017-12-12 | 2018-06-12 | 北京小米移动软件有限公司 | 控制监控设备的方法及装置 |
| CN108154140A (zh) * | 2018-01-22 | 2018-06-12 | 北京百度网讯科技有限公司 | 基于唇语的语音唤醒方法、装置、设备及计算机可读介质 |
| CN108363557A (zh) * | 2018-02-02 | 2018-08-03 | 刘国华 | 人机交互方法、装置、计算机设备和存储介质 |
| CN109671426A (zh) * | 2018-12-06 | 2019-04-23 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
| CN109710131A (zh) * | 2018-12-28 | 2019-05-03 | 联想(北京)有限公司 | 一种信息控制方法及装置 |
| CN109741738A (zh) * | 2018-12-10 | 2019-05-10 | 平安科技(深圳)有限公司 | 语音控制方法、装置、计算机设备及存储介质 |
| CN109992237A (zh) * | 2018-01-03 | 2019-07-09 | 腾讯科技(深圳)有限公司 | 智能语音设备控制方法、装置、计算机设备和存储介质 |
| CN110164444A (zh) * | 2018-02-12 | 2019-08-23 | 优视科技有限公司 | 语音输入启动方法、装置及计算机设备 |
| CN110188179A (zh) * | 2019-05-30 | 2019-08-30 | 浙江远传信息技术股份有限公司 | 语音定向识别交互方法、装置、设备及介质 |
| CN110277094A (zh) * | 2018-03-14 | 2019-09-24 | 阿里巴巴集团控股有限公司 | 设备的唤醒方法、装置及电子设备 |
| CN110941455A (zh) * | 2019-11-27 | 2020-03-31 | 北京声智科技有限公司 | 主动唤醒方法、装置及电子设备 |
| CN111243583A (zh) * | 2019-12-31 | 2020-06-05 | 深圳市瑞讯云技术有限公司 | 一种系统唤醒方法及装置 |
| CN111651135A (zh) * | 2020-04-27 | 2020-09-11 | 珠海格力电器股份有限公司 | 一种声音唤醒方法、装置、存储介质及电器设备 |
| WO2020187050A1 (zh) * | 2019-03-15 | 2020-09-24 | 海信视像科技股份有限公司 | 一种显示设备 |
| US11158314B2 (en) | 2018-06-04 | 2021-10-26 | Pegatron Corporation | Voice control device and method |
| CN114187904A (zh) * | 2020-08-25 | 2022-03-15 | 广州华凌制冷设备有限公司 | 相似度阈值获取方法、语音家电及计算机可读存储介质 |
| WO2025091960A1 (zh) * | 2023-10-31 | 2025-05-08 | 华为技术有限公司 | 语音助手交互的方法和电子设备 |
Citations (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000347692A (ja) * | 1999-06-07 | 2000-12-15 | Sanyo Electric Co Ltd | 人物検出方法、人物検出装置及びそれを用いた制御システム |
| EP1215658A2 (en) * | 2000-12-05 | 2002-06-19 | Hewlett-Packard Company | Visual activation of voice controlled apparatus |
| CN102298443A (zh) * | 2011-06-24 | 2011-12-28 | 华南理工大学 | 结合视频通道的智能家居语音控制系统及其控制方法 |
| CN102945672A (zh) * | 2012-09-29 | 2013-02-27 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
| CN103472994A (zh) * | 2013-09-06 | 2013-12-25 | 乐得科技有限公司 | 一种基于语音实现操作控制的方法、装置和系统 |
| US20140222436A1 (en) * | 2013-02-07 | 2014-08-07 | Apple Inc. | Voice trigger for a digital assistant |
| CN104078041A (zh) * | 2014-06-26 | 2014-10-01 | 美的集团股份有限公司 | 语音识别方法及系统 |
| CN104103274A (zh) * | 2013-04-11 | 2014-10-15 | 纬创资通股份有限公司 | 语音处理装置和语音处理方法 |
| CN104423992A (zh) * | 2013-09-03 | 2015-03-18 | 冠捷投资有限公司 | 显示器语音辨识的启动方法 |
| CN104428832A (zh) * | 2012-07-09 | 2015-03-18 | Lg电子株式会社 | 语音识别装置及其方法 |
-
2015
- 2015-05-06 CN CN201510227622.2A patent/CN104820556A/zh active Pending
Patent Citations (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000347692A (ja) * | 1999-06-07 | 2000-12-15 | Sanyo Electric Co Ltd | 人物検出方法、人物検出装置及びそれを用いた制御システム |
| EP1215658A2 (en) * | 2000-12-05 | 2002-06-19 | Hewlett-Packard Company | Visual activation of voice controlled apparatus |
| US6970824B2 (en) * | 2000-12-05 | 2005-11-29 | Hewlett-Packard Development Company, L.P. | Enabling voice control of voice-controlled apparatus using a head mounted camera system |
| CN102298443A (zh) * | 2011-06-24 | 2011-12-28 | 华南理工大学 | 结合视频通道的智能家居语音控制系统及其控制方法 |
| CN104428832A (zh) * | 2012-07-09 | 2015-03-18 | Lg电子株式会社 | 语音识别装置及其方法 |
| CN102945672A (zh) * | 2012-09-29 | 2013-02-27 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
| US20140222436A1 (en) * | 2013-02-07 | 2014-08-07 | Apple Inc. | Voice trigger for a digital assistant |
| CN104103274A (zh) * | 2013-04-11 | 2014-10-15 | 纬创资通股份有限公司 | 语音处理装置和语音处理方法 |
| CN104423992A (zh) * | 2013-09-03 | 2015-03-18 | 冠捷投资有限公司 | 显示器语音辨识的启动方法 |
| CN103472994A (zh) * | 2013-09-06 | 2013-12-25 | 乐得科技有限公司 | 一种基于语音实现操作控制的方法、装置和系统 |
| CN104078041A (zh) * | 2014-06-26 | 2014-10-01 | 美的集团股份有限公司 | 语音识别方法及系统 |
Cited By (46)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105204628A (zh) * | 2015-09-01 | 2015-12-30 | 涂悦 | 一种基于视觉唤醒的语音控制方法 |
| WO2017035768A1 (zh) * | 2015-09-01 | 2017-03-09 | 涂悦 | 一种基于视觉唤醒的语音控制方法 |
| CN105700363A (zh) * | 2016-01-19 | 2016-06-22 | 深圳创维-Rgb电子有限公司 | 一种智能家居设备语音控制装置的唤醒方法及系统 |
| CN105700363B (zh) * | 2016-01-19 | 2018-10-26 | 深圳创维-Rgb电子有限公司 | 一种智能家居设备语音控制装置的唤醒方法及系统 |
| CN105912092A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的语音唤醒方法及语音识别装置 |
| CN108098767A (zh) * | 2016-11-25 | 2018-06-01 | 北京智能管家科技有限公司 | 一种机器人唤醒方法及装置 |
| CN106782524A (zh) * | 2016-11-30 | 2017-05-31 | 深圳讯飞互动电子有限公司 | 一种混合唤醒方法及系统 |
| CN106847285A (zh) * | 2017-03-31 | 2017-06-13 | 上海思依暄机器人科技股份有限公司 | 一种机器人及其语音识别方法 |
| CN106847285B (zh) * | 2017-03-31 | 2020-05-05 | 上海思依暄机器人科技股份有限公司 | 一种机器人及其语音识别方法 |
| CN107315561A (zh) * | 2017-06-30 | 2017-11-03 | 联想(北京)有限公司 | 一种数据处理方法和电子设备 |
| CN107517313A (zh) * | 2017-08-22 | 2017-12-26 | 珠海市魅族科技有限公司 | 唤醒方法及装置、终端及可读存储介质 |
| CN107678793A (zh) * | 2017-09-14 | 2018-02-09 | 珠海市魅族科技有限公司 | 语音助手启动方法及装置、终端及计算机可读存储介质 |
| CN107679506A (zh) * | 2017-10-12 | 2018-02-09 | Tcl通力电子(惠州)有限公司 | 智能产品的唤醒方法、智能产品及计算机可读存储介质 |
| CN108055617B (zh) * | 2017-12-12 | 2020-12-15 | 广东小天才科技有限公司 | 一种麦克风的唤醒方法、装置、终端设备及存储介质 |
| CN108154878A (zh) * | 2017-12-12 | 2018-06-12 | 北京小米移动软件有限公司 | 控制监控设备的方法及装置 |
| CN108055617A (zh) * | 2017-12-12 | 2018-05-18 | 广东小天才科技有限公司 | 一种麦克风的唤醒方法、装置、终端设备及存储介质 |
| CN114860187B (zh) * | 2018-01-03 | 2025-03-18 | 腾讯科技(深圳)有限公司 | 智能语音设备控制方法、装置、计算机设备和存储介质 |
| CN114860187A (zh) * | 2018-01-03 | 2022-08-05 | 腾讯科技(深圳)有限公司 | 智能语音设备控制方法、装置、计算机设备和存储介质 |
| CN109992237B (zh) * | 2018-01-03 | 2022-04-22 | 腾讯科技(深圳)有限公司 | 智能语音设备控制方法、装置、计算机设备和存储介质 |
| CN109992237A (zh) * | 2018-01-03 | 2019-07-09 | 腾讯科技(深圳)有限公司 | 智能语音设备控制方法、装置、计算机设备和存储介质 |
| CN108154140A (zh) * | 2018-01-22 | 2018-06-12 | 北京百度网讯科技有限公司 | 基于唇语的语音唤醒方法、装置、设备及计算机可读介质 |
| US20190228212A1 (en) * | 2018-01-22 | 2019-07-25 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Wakeup method, apparatus and device based on lip reading, and computer readable medium |
| JP2019128938A (ja) * | 2018-01-22 | 2019-08-01 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 読話による音声ウェイクアップ方法、装置、設備及びコンピュータ可読媒体 |
| US10810413B2 (en) | 2018-01-22 | 2020-10-20 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Wakeup method, apparatus and device based on lip reading, and computer readable medium |
| WO2019149160A1 (zh) * | 2018-02-02 | 2019-08-08 | 刘国华 | 人机交互方法、装置、计算机设备和存储介质 |
| CN108363557A (zh) * | 2018-02-02 | 2018-08-03 | 刘国华 | 人机交互方法、装置、计算机设备和存储介质 |
| US11483657B2 (en) | 2018-02-02 | 2022-10-25 | Guohua Liu | Human-machine interaction method and device, computer apparatus, and storage medium |
| JP7066877B2 (ja) | 2018-02-02 | 2022-05-13 | 國華 劉 | ヒューマンマシンインタラクション方法、装置、コンピュータデバイス及び記憶媒体 |
| JP2021513123A (ja) * | 2018-02-02 | 2021-05-20 | 劉 國華LIU, Guohua | ヒューマンマシンインタラクション方法、装置、コンピュータデバイス及び記憶媒体 |
| CN108363557B (zh) * | 2018-02-02 | 2020-06-12 | 刘国华 | 人机交互方法、装置、计算机设备和存储介质 |
| CN110164444A (zh) * | 2018-02-12 | 2019-08-23 | 优视科技有限公司 | 语音输入启动方法、装置及计算机设备 |
| CN110277094A (zh) * | 2018-03-14 | 2019-09-24 | 阿里巴巴集团控股有限公司 | 设备的唤醒方法、装置及电子设备 |
| US11158314B2 (en) | 2018-06-04 | 2021-10-26 | Pegatron Corporation | Voice control device and method |
| CN109671426A (zh) * | 2018-12-06 | 2019-04-23 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
| CN109741738A (zh) * | 2018-12-10 | 2019-05-10 | 平安科技(深圳)有限公司 | 语音控制方法、装置、计算机设备及存储介质 |
| CN109710131A (zh) * | 2018-12-28 | 2019-05-03 | 联想(北京)有限公司 | 一种信息控制方法及装置 |
| WO2020187050A1 (zh) * | 2019-03-15 | 2020-09-24 | 海信视像科技股份有限公司 | 一种显示设备 |
| CN110188179A (zh) * | 2019-05-30 | 2019-08-30 | 浙江远传信息技术股份有限公司 | 语音定向识别交互方法、装置、设备及介质 |
| CN110941455B (zh) * | 2019-11-27 | 2024-02-20 | 北京声智科技有限公司 | 主动唤醒方法、装置及电子设备 |
| CN110941455A (zh) * | 2019-11-27 | 2020-03-31 | 北京声智科技有限公司 | 主动唤醒方法、装置及电子设备 |
| CN111243583B (zh) * | 2019-12-31 | 2023-03-10 | 深圳市瑞讯云技术有限公司 | 一种系统唤醒方法及装置 |
| CN111243583A (zh) * | 2019-12-31 | 2020-06-05 | 深圳市瑞讯云技术有限公司 | 一种系统唤醒方法及装置 |
| CN111651135A (zh) * | 2020-04-27 | 2020-09-11 | 珠海格力电器股份有限公司 | 一种声音唤醒方法、装置、存储介质及电器设备 |
| CN111651135B (zh) * | 2020-04-27 | 2021-05-25 | 珠海格力电器股份有限公司 | 一种声音唤醒方法、装置、存储介质及电器设备 |
| CN114187904A (zh) * | 2020-08-25 | 2022-03-15 | 广州华凌制冷设备有限公司 | 相似度阈值获取方法、语音家电及计算机可读存储介质 |
| WO2025091960A1 (zh) * | 2023-10-31 | 2025-05-08 | 华为技术有限公司 | 语音助手交互的方法和电子设备 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN104820556A (zh) | 唤醒语音助手的方法及装置 | |
| US10643621B2 (en) | Speech recognition using electronic device and server | |
| KR102293063B1 (ko) | 사용자 정의 가능한 웨이크업 음성 명령 | |
| KR102880884B1 (ko) | 전자 장치 및 그의 동작 방법 | |
| KR102414122B1 (ko) | 사용자 발화를 처리하는 전자 장치 및 그 동작 방법 | |
| CN108735209B (zh) | 唤醒词绑定方法、智能设备及存储介质 | |
| CN108023934B (zh) | 电子装置及其控制方法 | |
| CN110199350B (zh) | 用于感测语音结束的方法和实现该方法的电子设备 | |
| EP3567584B1 (en) | Electronic apparatus and method for operating same | |
| KR102398649B1 (ko) | 사용자 발화를 처리하는 전자 장치 및 그 동작 방법 | |
| US8452597B2 (en) | Systems and methods for continual speech recognition and detection in mobile computing devices | |
| KR102815504B1 (ko) | 콘텐츠 제공 방법 및 이를 수행하는 전자 장치 | |
| US10217477B2 (en) | Electronic device and speech recognition method thereof | |
| CN104580699B (zh) | 一种待机时声控智能终端方法及装置 | |
| CN108509119A (zh) | 用于功能执行的电子设备的操作方法和支持其的电子设备 | |
| KR102414173B1 (ko) | 전자 장치와 서버를 활용한 음성 인식 | |
| US20180286400A1 (en) | Method for operating speech recognition service and electronic device supporting the same | |
| CN108829235A (zh) | 语音数据处理方法和支持该方法的电子设备 | |
| KR20170044426A (ko) | 음성 신호 인식 방법 및 이를 제공하는 전자 장치 | |
| KR20180109625A (ko) | 음성 인식 서비스 운용 방법 및 이를 지원하는 전자 장치 | |
| US11620995B2 (en) | Voice interaction processing method and apparatus | |
| CN106412312A (zh) | 自动唤醒智能终端摄像功能的方法、系统及智能终端 | |
| CN106293064A (zh) | 一种信息处理方法及设备 | |
| CN107526522A (zh) | 黑屏手势识别方法及装置,以及移动终端、存储介质 | |
| CN105718019B (zh) | 一种信息处理方法及电子设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| EXSB | Decision made by sipo to initiate substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150805 |
|
| RJ01 | Rejection of invention patent application after publication |