[go: up one dir, main page]

CN104301526B - 终端遥控方法、装置及设备 - Google Patents

终端遥控方法、装置及设备 Download PDF

Info

Publication number
CN104301526B
CN104301526B CN201410503238.6A CN201410503238A CN104301526B CN 104301526 B CN104301526 B CN 104301526B CN 201410503238 A CN201410503238 A CN 201410503238A CN 104301526 B CN104301526 B CN 104301526B
Authority
CN
China
Prior art keywords
remote control
speech data
target terminal
terminal
guidance command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410503238.6A
Other languages
English (en)
Other versions
CN104301526A (zh
Inventor
张鹏飞
陈勇
夏勇峰
屈恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201410503238.6A priority Critical patent/CN104301526B/zh
Publication of CN104301526A publication Critical patent/CN104301526A/zh
Application granted granted Critical
Publication of CN104301526B publication Critical patent/CN104301526B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本公开是关于一种终端遥控方法、装置及设备,属于终端技术领域。所述方法包括:获取语音数据;对所述语音数据进行识别,得到语音识别结果,所述语音识别结果中包括目标终端的遥控关键词;根据所述遥控关键词,生成所述目标终端的遥控命令;根据所述遥控命令,对所述目标终端进行控制。由于基于语音数据对目标终端进行控制,而无需用户执行任何手动操作,所以较为方便和快捷,降低了误操作的概率,智能性较优。

Description

终端遥控方法、装置及设备
技术领域
本公开涉及终端技术领域,特别涉及一种终端遥控方法、装置及设备。
背景技术
随着信息技术的快速发展,通过智能手机等智能终端,对电视机、冰箱等家居设备进行遥控已成为时下一种广为流行的生活模式。
相关技术中,智能终端在对各种家居设备进行遥控时,通常事先内置对各种家居设备进行遥控的应用程序,并在智能终端上设置对各个家居设备进行遥控的图标或按键。当用户手动操作某一图标或按键时,便实现对相应的家居设备进行遥控。
在实现本公开的过程中,发明人发现相关技术至少存在以下问题:
由于在对家居设备进行遥控时,均需用户执行手动操作实现,因此存在操作复杂,误操作的情况,不够智能化。
发明内容
为克服相关技术中存在的问题,本公开提供一种终端遥控方法、装置及设备。
根据本公开实施例的第一方面,提供一种终端遥控方法,所述方法包括:
获取语音数据;
对所述语音数据进行识别,得到语音识别结果,所述语音识别结果中包括目标终端的遥控关键词;
根据所述遥控关键词,生成所述目标终端的遥控命令;
根据所述遥控命令,对所述目标终端进行控制。
可选地,所述根据所述遥控关键词,生成所述目标终端的遥控命令,包括:
在存储的各个遥控关键词与遥控命令的对应关系中,查找所述目标终端的遥控关键词对应的遥控命令,得到所述目标终端的遥控命令。
可选地,所述对所述语音数据进行识别,得到语音识别结果,包括:
对所述语音数据进行频谱变换,得到所述语音数据对应的声学特征矢量;
在存储的声学特征矢量与遥控关键词的对应关系中,查找与所述语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
可选地,所述语音数据由控制终端获取时,通过所述控制终端对所述语音数据进行识别,得到语音识别结果;
根据所述遥控关键词,通过所述控制终端生成所述目标终端的遥控命令;
通过所述控制终端将所述遥控命令发送至路由设备,由所述路由设备将所述遥控命令转发至所述目标终端,所述遥控命令用于对所述目标终端进行控制。
可选地,所述语音数据由控制终端获取时,通过所述控制终端将所述语音数据发送路由设备,由所述路由设备对所述语音数据进行识别,得到语音识别结果;
根据所述遥控关键词,通过所述路由设备生成所述目标终端的遥控命令;
通过所述路由设备将所述遥控命令转发至所述目标终端,所述遥控命令用于对所述目标终端进行控制。
可选地,所述语音数据由路由设备获取时,通过所述路由设备对所述语音数据进行识别,得到语音识别结果;
根据所述遥控关键词,通过所述路由设备生成所述目标终端的遥控命令;
通过所述路由设备将所述遥控命令转发至所述目标终端,所述遥控命令用于对所述目标终端进行控制。
可选地,所述语音数据由目标终端获取时,通过所述目标终端对所述语音数据进行识别,得到语音识别结果;
根据所述遥控关键词,通过所述目标终端生成所述目标终端的遥控命令。
根据本公开实施例的第二方面,提供一种终端遥控装置,所述装置包括:
获取模块,用于获取语音数据;
识别模块,用于对所述语音数据进行识别,得到语音识别结果,所述语音识别结果中包括目标终端的遥控关键词;
生成模块,用于根据所述遥控关键词,生成所述目标终端的遥控命令;
控制模块,用于根据所述遥控命令,对所述目标终端进行控制。
可选地,所述生成模块,用于在存储的各个遥控关键词与遥控命令的对应关系中,查找所述目标终端的遥控关键词对应的遥控命令,得到所述目标终端的遥控命令。
可选地,所述识别模块,用于对所述语音数据进行频谱变换,得到所述语音数据对应的声学特征矢量;在存储的声学特征矢量与遥控关键词的对应关系中,查找与所述语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
可选地,所述识别模块,用于所述语音数据由控制终端获取时,通过所述控制终端对所述语音数据进行识别,得到语音识别结果;
所述生成模块,用于根据所述遥控关键词,通过所述控制终端生成所述目标终端的遥控命令;
所述装置还包括:
发送模块,用于通过所述控制终端将所述遥控命令发送至路由设备,由所述路由设备将所述遥控命令转发至所述目标终端,所述遥控命令用于对所述目标终端进行控制。
可选地,所述识别模块,用于所述语音数据由控制终端获取时,通过所述控制终端将所述语音数据发送路由设备,由所述路由设备对所述语音数据进行识别,得到语音识别结果;
所述生成模块,用于根据所述遥控关键词,通过所述路由设备生成所述目标终端的遥控命令;
所述装置还包括:
发送模块,用于通过所述路由设备将所述遥控命令转发至所述目标终端,所述遥控命令用于对所述目标终端进行控制。
可选地,所识别模块,用于所述语音数据由路由设备获取时,通过所述路由设备对所述语音数据进行识别,得到语音识别结果;
所述生成模块,用于根据所述遥控关键词,通过所述路由设备生成所述目标终端的遥控命令;
所述装置还包括:
发送模块,用于通过所述路由设备将所述遥控命令转发至所述目标终端,所述遥控命令用于对所述目标终端进行控制。
可选地,所述识别模块,用于所述语音数据由目标终端获取时,通过所述目标终端对所述语音数据进行识别,得到语音识别结果;
所述生成模块,用于根据所述遥控关键词,通过所述目标终端生成所述目标终端的遥控命令。
根据本公开实施例的第三方面,提供一种终端遥控设备,所述设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取语音数据;对所述语音数据进行识别,得到语音识别结果,所述语音识别结果中包括目标终端的遥控关键词;根据所述遥控关键词,生成所述目标终端的遥控命令;根据所述遥控命令,对所述目标终端进行控制。
本公开的实施例提供的技术方案可以包括以下有益效果:
在获取语音数据后,对语音数据进行识别,得到语音识别结果,该语音识别结果中包括目标终端的遥控关键词;之后,根据遥控关键词,生成目标终端的遥控命令,并根据遥控命令对目标终端进行控制,由于基于语音数据对目标终端进行控制,而无需用户执行任何手动操作,所以较为方便和快捷,降低了误操作的概率,智能性较优。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种终端遥控方法的流程图。
图2是根据一示例性实施例示出的一种终端遥控方法的流程图。
图3是根据一示例性实施例示出的一种终端遥控系统的架构示意图。
图4是根据一示例性实施例示出的一种终端遥控方法的流程图。
图5是根据一示例性实施例示出的一种终端遥控方法的流程图。
图6是根据一示例性实施例示出的一种终端遥控系统的架构示意图。
图7是根据一示例性实施例示出的一种终端遥控方法的流程图。
图8是根据一示例性实施例示出的一种终端遥控系统的架构示意图。
图9是根据一示例性实施例示出的一种终端遥控装置的框图。
图10是根据一示例性实施例示出的一种终端遥控设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种终端遥控方法的流程图,如图1所示,该终端遥控方法可用于控制终端、路由设备或目标终端中,包括以下步骤。
在步骤101中,获取语音数据。
在步骤102中,对语音数据进行识别,得到语音识别结果,语音识别结果中包括目标终端的遥控关键词。
在步骤103中,根据遥控关键词,生成目标终端的遥控命令。
在步骤104中,根据遥控命令,对目标终端进行控制。
本公开实施例提供的方法,在获取语音数据后,对语音数据进行识别,得到语音识别结果,该语音识别结果中包括目标终端的遥控关键词;之后,根据遥控关键词,生成目标终端的遥控命令,并根据遥控命令对目标终端进行控制,由于基于语音数据对目标终端进行控制,而无需用户执行任何手动操作,所以较为方便和快捷,降低了误操作的概率,智能性较优。
可选地,根据遥控关键词,生成目标终端的遥控命令,包括:
在存储的各个遥控关键词与遥控命令的对应关系中,查找目标终端的遥控关键词对应的遥控命令,得到目标终端的遥控命令。
可选地,对语音数据进行识别,得到语音识别结果,包括:
对语音数据进行频谱变换,得到语音数据对应的声学特征矢量;
在存储的声学特征矢量与遥控关键词的对应关系中,查找与语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
可选地,语音数据由控制终端获取时,通过控制终端对语音数据进行识别,得到语音识别结果;
根据遥控关键词,通过控制终端生成目标终端的遥控命令;
通过控制终端将遥控命令发送至路由设备,由路由设备将遥控命令转发至目标终端,遥控命令用于对目标终端进行控制。
可选地,语音数据由控制终端获取时,通过控制终端将语音数据发送路由设备,由路由设备对语音数据进行识别,得到语音识别结果;
根据遥控关键词,通过路由设备生成目标终端的遥控命令;
通过路由设备将遥控命令转发至目标终端,遥控命令用于对目标终端进行控制。
可选地,语音数据由路由设备获取时,通过路由设备对语音数据进行识别,得到语音识别结果;
根据遥控关键词,通过路由设备生成目标终端的遥控命令;
通过路由设备将遥控命令转发至目标终端,遥控命令用于对目标终端进行控制。
可选地,语音数据由目标终端获取时,通过目标终端对语音数据进行识别,得到语音识别结果;
根据遥控关键词,通过目标终端生成目标终端的遥控命令。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
图2是根据一示例性实施例示出的一种终端遥控方法的流程图。该终端遥控方法的交互主体为控制终端、路由设备和目标终端。参见图3,控制终端指代智能手机、平板电脑等智能移动终端,目标终端指代电视机、电灯、电冰箱、洗衣机等家居设备。如图2所示,该方法包括以下步骤。
在步骤201中,控制终端获取语音数据。
在本公开实施例中,控制终端在获取语音数据时,可采取下述方式实现:
例如,检测语音的起始端点和终止端点;获取起始端点和终止端点所处时间段内的语音数据。
以检测到语音的起始端点为09:00:00,终止端点为09:00:05为例,则将位于09:00:00与09:00:05之间的时长为5秒的语音数据作为获取到的语音数据。当然,除了上述获取语音数据的方式外,还可采取其他获取方式,本公开实施例对此不作具体限定。
在步骤202中,控制终端对语音数据进行识别,得到语音识别结果,语音识别结果中包括目标终端的遥控关键词。
在本公开实施例中,控制终端在对语音数据进行识别时,可采取下述方式实现:
对语音数据进行频谱变换,得到语音数据对应的声学特征矢量;在存储的声学特征矢量与遥控关键词的对应关系中,查找与该语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
其中,频谱变换包括但不限于傅里叶变换和小波变换等等,本公开实施例对频谱变换的形式不作具体限定。
在本公开实施例中,声学特征矢量与遥控关键词的对应关系可采用背景声学模型及前景声学模型事先离线进行建立并存储。其中,背景声学模型可采用基于LVCSR(LargeVocabulary Continuous Speech Recognition,大词汇量连续语音识别)的Mono-phone(单音素)技术进行对应关系的构建;前景声学模型可采用LVCSR的Tri-phone(三音素)技术进行对应关系的构建,本公开实施例对对应关系建立的方式不作具体限定。在存储上述对应关系时,具体可存储在内存或闪存等存储介质中,本公开实施例对存储介质的类型同样不作具体限定。
其中,在对语音数据进行频谱变换得到声学特征矢量后,根据该声学特征矢量在声学特征矢量与遥控命令词的对应关系中进行遍历查找,得到与该声学特征矢量相匹配的遥控关键词,而该遥控关键词便为得到的语音识别结果。其中,遥控关键词可为目标终端的启动命令词、关闭命令词、功能命令词等等。比如,以目标终端为洗衣机为例,则洗衣机对应的遥控关键词可为“启动洗衣机”、“关闭洗衣机”、“洗涤衣物**分钟”、“脱水**分钟”等。
除采取上述识别方式对语音数据进行识别外,还可采取其他方式,本公开实施例对此不作具体限定。
此外,在控制终端获取语音数据的过程中,常常会出现下述两种情况。第一种情况,由于家居设备的种类多样,控制终端在获取到一段语音数据后,可能无法区分对哪一个家居设备进行控制。因此,为了避免该种情况的发生,在对获取到的语音数据进行识别之前,本公开实施例提供的方法还包括:分别为每一个家居设备设置并存储不同类型的遥控关键词的步骤。比如,洗衣机的一个遥控关键词为“启动洗衣机”,电灯的一个遥控关键词为“电灯**点关闭”,电视机的一个遥控关键词为“电视机**点开启”等等。其中,目标终端的遥控关键词具体可为一个关键字段。
第二种情况,在控制终端获取语音数据的过程中,控制终端可能会获取到用户发出的大量语音数据,而该大量语音数据中可能绝大多数语音数据均与目标终端的遥控操作无关。因此,为了避免控制终端将非遥控关键词转换为相应命令,本公开实施例提供的方法还可包括:确定语音识别结果中是否包含任一家居设备的遥控关键词的步骤。其中,如果语音识别结果中包含任一家居设备的遥控关键词,则执行下述步骤203;如果语音识别结果中未包含任一家居设备的遥控关键词,则处理流程至此结束。
在步骤203中,控制终端根据遥控关键词,生成目标终端的遥控命令。
在本公开实施例中,由于遥控关键词仅为一个纯文本形式的字段,而目标终端无法根据文本形式的遥控关键词执行控制操作。因此,为了实现通过语音遥控目标终端,本公开实施例提供的方法还包括:设置并存储遥控关键词与遥控命令的对应关系的步骤。其中,遥控命令为机器可识别的指令,从而后续过程中目标终端可根据对应的遥控命令执行相应控制操作。
其中,遥控命令可为一串字符。在设置各个家居设备的遥控关键词与遥控命令的对应关系时,可设置诸如下表1所示的对应关系。
表1
遥控关键词 遥控命令
启动洗衣机 遥控命令1
启动电灯 遥控命令2
启动电冰箱 遥控命令3
启动电视机 遥控命令4
…… ……
例如,当设置各个家居设备的遥控关键词与遥控命令的对应关系后,后续再执行该方法时可直接使用该对应关系,即在每次执行本公开实施例提供的方法时无需每次均执行该步骤。仅在某一家居设备的遥控关键词与遥控命令的对应关系有更新时,对该对应关系进行更新即可。
在本公开实施例中,控制终端在根据遥控关键词生成目标终端的遥控命令时,可采取下述方式实现:
在存储的遥控关键词与遥控命令的对应关系中进行遍历查找,确定该遥控关键词对应的遥控命令,得到目标终端的遥控命令。
在步骤204中,控制终端将遥控命令发送至路由设备。
在本公开实施例中,控制终端在向路由设备发送遥控命令时,可采取无线的方式将遥控命令直接发送至路由设备;还可在将遥控命令打包后,采取无线的方式将打包数据发送至路由设备。具体采取哪一种发送方式,本公开实施例对此不作具体限定。
在步骤205中,路由设备将遥控命令发送至目标终端。
在本公开实施例中,为了使得路由设备在接收到遥控命令后,明确具体向哪一个家居设备发送该遥控命令,控制终端在发送遥控命令的同时,还可向路由终端发送目标终端的标识信息。进而路由设备作为一个中转设备,在接收到该标识信息和遥控命令后,便可采取无线的方式将该遥控命令发送至相应目标终端。
在步骤206中,目标终端根据遥控命令执行控制操作。
在本公开实施例中,目标终端在接收到遥控命令后,便可根据该遥控命令执行对应的控制操作。以目标终端为洗衣机为例,若遥控命令对应启动洗衣机,则洗衣机开启启动程序,处于启动状态;若遥控命令对应脱水**分钟,则洗衣机控制甩干桶旋转**分钟,并进行排水。
本公开实施例提供的方法,控制终端在获取语音数据后,对语音数据进行识别,得到语音识别结果,该语音识别结果中包括目标终端的遥控关键词;之后,控制终端根据遥控关键词,生成目标终端的遥控命令,并将该遥控命令发送至路由设备,由路由设备将该遥控命令转发至目标终端,进而目标终端根据遥控命令执行控制操作,由于基于语音数据对目标终端进行控制,而无需用户执行任何手动操作,所以较为方便和快捷,降低了误操作的概率,智能性较优。
图4是根据一示例性实施例示出的一种终端遥控方法的流程图。该终端遥控方法的交互主体为控制终端、路由设备和目标终端。参见图3,控制终端指代智能手机、平板电脑等智能移动终端,目标终端指代电视机、电灯、电冰箱等家居设备。如图4所示,该方法包括以下步骤。
在步骤401中,控制终端获取语音数据。
在本公开实施例中,控制终端在获取语音数据时,可采取下述方式实现:
例如,检测语音的起始端点和终止端点;获取起始端点和终止端点所处时间段内的语音数据。
以检测到语音的起始端点为13:00:00,终止端点为13:00:03为例,则将位于13:00:00与13:00:03之间的时长为3秒的语音数据作为获取到的语音数据。当然,除了上述获取语音数据的方式外,还可采取其他获取方式,本公开实施例对此不作具体限定。
在步骤402中,控制终端将语音数据发送至路由设备。
在本公开实施例中,控制终端在向路由设备发送语音数据时,可采取无线的方式将语音数据直接发送至路由设备;还可在将语音数据打包后,采取无线的方式将打包数据发送至路由设备。具体采取哪一种发送方式,本公开实施例对此不作具体限定。
在步骤403中,路由设备对语音数据进行识别,得到语音识别结果,该语音识别结果中包括目标终端的遥控关键词。
在本公开实施例中,路由设备在对语音数据进行识别时,可采取下述方式实现:
对语音数据进行频谱变换,得到语音数据对应的声学特征矢量;在存储的声学特征矢量与遥控关键词的对应关系中,查找与该语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
其中,频谱变换包括但不限于傅里叶变换和小波变换等等,本公开实施例对频谱变换的形式不作具体限定。
在本公开实施例中,声学特征矢量与遥控关键词的对应关系可采用背景声学模型及前景声学模型事先离线进行建立并存储。其中,背景声学模型可采用基于LVCSR的Mono-phone技术进行对应关系的构建;前景声学模型可采用LVCSR的Tri-phone技术进行对应关系的构建,本公开实施例对对应关系建立的方式不作具体限定。在存储上述对应关系时,具体可存储在内存或闪存等存储介质中,本公开实施例对存储介质的类型同样不作具体限定。
其中,在对语音数据进行频谱变换得到声学特征矢量后,根据该声学特征矢量在声学特征矢量与遥控命令词的对应关系中进行遍历查找,得到与该声学特征矢量相匹配的遥控关键词,而该遥控关键词便为得到的语音识别结果。其中,遥控关键词可为目标终端的启动命令词、关闭命令词、功能命令词等等。比如,以目标终端为空调为例,则空调对应的遥控关键词可为“启动空调”、“关闭空调”、“冷风吹**分钟”、“大风吹**分钟”等。
除采取上述识别方式对语音数据进行识别外,还可采取其他方式,本公开实施例对此不作具体限定。此外,在路由设备接收到语音数据后,常常会出现下述两种情况。第一种情况,由于家居设备的种类多样,路由设备在接收到一段语音数据后,可能无法区分对哪一个家居设备进行控制。因此,为了避免该种情况的发生,在对接收到的语音数据进行识别之前,本公开实施例提供的方法还包括:分别为每一个家居设备设置并存储不同类型的遥控关键词的步骤。比如,洗衣机的一个遥控关键词为“启动洗衣机”,电灯的一个遥控关键词为“电灯**点关闭”,电视机的一个遥控关键词为“电视机**点开启”等等。其中,目标终端的遥控关键词具体可为一个关键字段。
第二种情况,在接收语音数据的过程中,路由设备可能会接收到大量的语音数据,而该大量语音数据中可能绝大多数语音数据均与目标终端的遥控操作无关。因此,为了避免路由设备将非遥控关键词转换为相应命令,本公开实施例提供的方法还可包括:确定语音识别结果中是否包含任一家居设备的遥控关键词的步骤。其中,如果语音识别结果中包含任一家居设备的遥控关键词,则执行下述步骤404;如果语音识别结果中未包含任一家居设备的遥控关键词,则处理流程至此结束。
在步骤404中,路由设备根据遥控关键词,生成目标终端的遥控命令。
在本公开实施例中,由于遥控关键词仅为一个纯文本形式的字段,而目标终端无法根据文本形式的遥控关键词执行控制操作。因此,为了实现通过语音遥控目标终端,本公开实施例提供的方法还包括:设置并存储遥控关键词与遥控命令的对应关系的步骤。其中,遥控命令为机器可识别的指令,从而后续过程中目标终端可根据对应的遥控命令执行相应控制操作。
其中,遥控命令可为一串字符。在设置各个家居设备的遥控关键词与遥控命令的对应关系时,可设置诸如上表1所示的对应关系。
当设置各个家居设备的遥控关键词与遥控命令的对应关系后,后续再执行该方法时可直接使用该对应关系,即在每次执行本公开实施例提供的方法时无需每次均执行该步骤。仅在某一家居设备的遥控关键词与遥控命令的对应关系有更新时,对该对应关系进行更新即可。
在本公开实施例中,路由设备在根据遥控关键词生成目标终端的遥控命令时,可采取下述方式实现:
在存储的遥控关键词与遥控命令的对应关系中进行遍历查找,确定该遥控关键词对应的遥控命令,得到目标终端的遥控命令。
在步骤405中,路由设备将遥控命令发送至目标终端。
在本公开实施例中,路由设备在向目标终端发送遥控命令时,可采取无线的方式将遥控命令直接发送至目标终端;还可在将遥控命令打包后,采取无线的方式将打包数据发送至目标终端。具体采取哪一种发送方式,本公开实施例对此不作具体限定。
在步骤406中,目标终端根据遥控命令执行控制操作。
在本公开实施例中,目标终端在接收到遥控命令后,便可根据该遥控命令执行对应的控制操作。以目标终端为微波炉为例,若遥控命令对应启动微波炉,则微波炉开启启动程序,处于门开启状态;若遥控命令对应高火加热**分钟,则微波炉发射电磁波并控制托盘旋转**分钟。
本公开实施例提供的方法,控制终端在获取语音数据后,将该语音数据发送至路由设备,由路由设备对语音数据进行识别,得到语音识别结果,该语音识别结果中包括目标终端的遥控关键词;之后,路由设备根据遥控关键词,生成目标终端的遥控命令,并将该遥控命令发送至目标终端,进而目标终端根据遥控命令执行控制操作,由于基于语音数据对目标终端进行控制,而无需用户执行任何手动操作,所以较为方便和快捷,降低了误操作的概率,智能性较优。
图5是根据一示例性实施例示出的一种终端遥控方法的流程图。该终端遥控方法的交互主体为路由设备和目标终端。参见图6,目标终端指代电视机、电灯、电冰箱等家居设备。如图5所示,该方法包括以下步骤。
在步骤501中,路由设备获取语音数据。
在本公开实施例中,路由设备在获取语音数据时,可采取下述方式实现:
例如,检测语音的起始端点和终止端点;获取起始端点和终止端点所处时间段内的语音数据。
以检测到语音的起始端点为10:00:01,终止端点为10:00:05为例,则将位于10:00:01与10:00:05之间的时长为4秒的语音数据作为获取到的语音数据。当然,除了上述获取语音数据的方式外,还可采取其他获取方式,本公开实施例对此不作具体限定。
在步骤502中,路由设备对语音数据进行识别,得到语音识别结果,语音识别结果中包括目标终端的遥控关键词。
在本公开实施例中,路由设备在对语音数据进行识别时,可采取下述方式实现:
对语音数据进行频谱变换,得到语音数据对应的声学特征矢量;在存储的声学特征矢量与遥控关键词的对应关系中,查找与该语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
其中,频谱变换包括但不限于傅里叶变换和小波变换等等,本公开实施例对频谱变换的形式不作具体限定。
在本公开实施例中,声学特征矢量与遥控关键词的对应关系可采用背景声学模型及前景声学模型事先离线进行建立并存储。其中,背景声学模型可采用基于LVCSR的Mono-phone技术进行对应关系的构建;前景声学模型可采用LVCSR的Tri-phone技术进行对应关系的构建,本公开实施例对对应关系建立的方式不作具体限定。在存储上述对应关系时,具体可存储在内存或闪存等存储介质中,本公开实施例对存储介质的类型同样不作具体限定。
其中,在对语音数据进行频谱变换得到声学特征矢量后,根据该声学特征矢量在声学特征矢量与遥控命令词的对应关系中进行遍历查找,得到与该声学特征矢量相匹配的遥控关键词,而该遥控关键词便为得到的语音识别结果。其中,遥控关键词可为目标终端的启动命令词、关闭命令词、功能命令词等等。比如,以目标终端为电视机为例,则电视机对应的遥控关键词可为“启动电视机”、“关闭电视机”、“播放体育节目”、“播放综艺节目”等。
除采取上述识别方式对语音数据进行识别外,还可采取其他方式,本公开实施例对此不作具体限定。
此外,在路由设备获取语音数据的过程中,常常会出现下述两种情况。第一种情况,由于家居设备的种类多样,路由设备在获取到一段语音数据后,可能无法区分对哪一个家居设备进行控制。因此,为了避免该种情况的发生,在对获取到的语音数据进行识别之前,本公开实施例提供的方法还包括:分别为每一个家居设备设置并存储不同类型的遥控关键词的步骤。比如,洗衣机的一个遥控关键词为“启动洗衣机”,电灯的一个遥控关键词为“电灯**点关闭”,电视机的一个遥控关键词为“电视机**点开启”等等。其中,目标终端的遥控关键词具体可为一个关键字段。
第二种情况,在路由设备获取语音数据的过程中,路由设备可能会获取到用户发出的大量语音数据,而该大量语音数据中可能绝大多数语音数据均与目标终端的遥控操作无关。因此,为了避免路由设备将非遥控关键词转换为相应命令,本公开实施例提供的方法还可包括:确定语音识别结果中是否包含任一家居设备的遥控关键词的步骤。其中,如果语音识别结果中包含任一家居设备的遥控关键词,则执行下述步骤503;如果语音识别结果中未包含任一家居设备的遥控关键词,则处理流程至此结束。
在步骤503中,路由设备根据遥控关键词,生成目标终端的遥控命令。
在本公开实施例中,由于遥控关键词仅为一个纯文本形式的字段,而目标终端无法根据文本形式的遥控关键词执行控制操作。因此,为了实现通过语音遥控目标终端,本公开实施例提供的方法还包括:设置并存储遥控关键词与遥控命令的对应关系的步骤。其中,遥控命令为机器可识别的指令,从而后续过程中目标终端可根据对应的遥控命令执行相应控制操作。
其中,遥控命令可为一串字符。在设置各个家居设备的遥控关键词与遥控命令的对应关系时,可设置诸如上表1所示的对应关系。
当设置各个家居设备的遥控关键词与遥控命令的对应关系后,后续再执行该方法时可直接使用该对应关系,即在每次执行本公开实施例提供的方法时无需每次均执行该步骤。仅在某一家居设备的遥控关键词与遥控命令的对应关系有更新时,对该对应关系进行更新即可。
在本公开实施例中,路由设备在根据遥控关键词生成目标终端的遥控命令时,可采取下述方式实现:
在存储的遥控关键词与遥控命令的对应关系中进行遍历查找,确定该遥控关键词对应的遥控命令,得到目标终端的遥控命令。
在步骤504中,路由设备将遥控命令发送至目标终端。
在本公开实施例中,路由设备在向目标终端发送遥控命令时,可采取无线的方式将遥控命令直接发送至目标终端;还可在将遥控命令打包后,采取无线的方式将打包数据发送至目标终端。具体采取哪一种发送方式,本公开实施例对此不作具体限定。
在步骤505中,目标终端根据遥控命令执行控制操作。
在本公开实施例中,目标终端在接收到遥控命令后,便可根据该遥控命令执行对应的控制操作。以目标终端为电冰箱为例,若遥控命令对应打开电冰箱的上边门,则电冰箱控制相应程序,打开上边门;若遥控命令对应-30度冷冻**分钟,则电冰箱控制相应程序,将冷冻区的温度调至-30度。
本公开实施例提供的方法,路由设备在获取语音数据后,对语音数据进行识别,得到语音识别结果,该语音识别结果中包括目标终端的遥控关键词;之后,路由设备根据遥控关键词,生成目标终端的遥控命令,并将该遥控命令发送至目标终端,进而目标终端根据遥控命令执行控制操作,由于基于语音数据对目标终端进行控制,而无需用户执行任何手动操作,所以较为方便和快捷,降低了误操作的概率,智能性较优。
图7是根据一示例性实施例示出的一种终端遥控方法的流程图。该终端遥控方法的执行主体为目标终端。参见图8,目标终端指代电视机、电灯、电冰箱等家居设备。如图7所示,该方法包括以下步骤。
在步骤701中,目标终端获取语音数据。
在本公开实施例中,目标终端在获取语音数据时,可采取下述方式实现:
例如,检测语音的起始端点和终止端点;获取起始端点和终止端点所处时间段内的语音数据。
以检测到语音的起始端点为11:00:00,终止端点为11:00:25为例,则将位于11:00:00与11:00:25之间的时长为25秒的语音数据作为获取到的语音数据。当然,除了上述获取语音数据的方式外,还可采取其他获取方式,本公开实施例对此不作具体限定。
在步骤702中,目标终端对语音数据进行识别,得到语音识别结果,语音识别结果中包括目标终端的遥控关键词。
在本公开实施例中,目标终端在对语音数据进行识别时,可采取下述方式实现:
对语音数据进行频谱变换,得到语音数据对应的声学特征矢量;在存储的声学特征矢量与遥控关键词的对应关系中,查找与该语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
其中,频谱变换包括但不限于傅里叶变换和小波变换等等,本公开实施例对频谱变换的形式不作具体限定。
在本公开实施例中,声学特征矢量与遥控关键词的对应关系可采用背景声学模型及前景声学模型事先离线进行建立并存储。其中,背景声学模型可采用基于LVCSR的Mono-phone技术进行对应关系的构建;前景声学模型可采用LVCSR的Tri-phone技术进行对应关系的构建,本公开实施例对对应关系建立的方式不作具体限定。在存储上述对应关系时,具体可存储在内存或闪存等存储介质中,本公开实施例对存储介质的类型同样不作具体限定。
其中,在对语音数据进行频谱变换得到声学特征矢量后,根据该声学特征矢量在声学特征矢量与遥控命令词的对应关系中进行遍历查找,得到与该声学特征矢量相匹配的遥控关键词,而该遥控关键词便为得到的语音识别结果。其中,遥控关键词可为目标终端的启动命令词、关闭命令词、功能命令词等等。比如,以目标终端为电灯为例,则电灯对应的遥控关键词可为“开启电灯”、“关闭电灯”、“**时后关闭电灯”、“**时后开启电灯”等。
除采取上述识别方式对语音数据进行识别外,还可采取其他方式,本公开实施例对此不作具体限定。
此外,在目标终端获取语音数据的过程中,常常会出现下述两种情况。第一种情况,由于家居设备的种类多样,目标终端在获取到一段语音数据后,可能无法区分该语音数据是否为对自身进行控制。因此,为了避免该种情况的发生,在对获取到的语音数据进行识别之前,本公开实施例提供的方法还包括:为每一个家居设备分别设置并存储不同类型的遥控关键词的步骤。比如,洗衣机的一个遥控关键词为“启动洗衣机”,电灯的一个遥控关键词为“电灯**点关闭”,电视机的一个遥控关键词为“电视机**点开启”等等。其中,目标终端的遥控关键词具体可为一个关键字段。
第二种情况,在目标终端获取语音数据的过程中,目标终端可能会获取到用户发出的大量语音数据,而该大量语音数据中可能绝大多数语音数据均与目标终端的遥控操作无关。因此,为了避免目标终端将非遥控关键词转换为相应命令,本公开实施例提供的方法还可包括:目标终端确定语音识别结果中是否包含对自身进行控制的遥控关键词的步骤。其中,如果语音识别结果中包含对自身进行控制的遥控关键词,则执行下述步骤703;如果语音识别结果中未包含对自身进行控制的遥控关键词,则处理流程至此结束。
在步骤703中,目标终端根据遥控关键词,生成目标终端的遥控命令。
在本公开实施例中,由于遥控关键词仅为一个纯文本形式的字段,而目标终端无法根据文本形式的遥控关键词执行控制操作。因此,为了实现通过语音遥控目标终端,本公开实施例提供的方法还包括:设置并存储遥控关键词与遥控命令的对应关系的步骤。其中,遥控命令为机器可识别的指令,从而后续过程中目标终端可根据对应的遥控命令执行相应控制操作。
其中,遥控命令可为一串字符。在设置各个家居设备的遥控关键词与遥控命令的对应关系时,可设置诸如上表1所示的对应关系。
当设置各个家居设备的遥控关键词与遥控命令的对应关系后,后续再执行该方法时可直接使用该对应关系,即在每次执行本公开实施例提供的方法时无需每次均执行该步骤。仅在某一家居设备的遥控关键词与遥控命令的对应关系有更新时,对该对应关系进行更新即可。
在本公开实施例中,目标终端在根据遥控关键词生成目标终端的遥控命令时,可采取下述方式实现:
在存储的遥控关键词与遥控命令的对应关系中进行遍历查找,确定该遥控关键词对应的遥控命令,得到目标终端的遥控命令。
在步骤704中,目标终端根据遥控命令执行控制操作。
在本公开实施例中,目标终端在得到遥控命令后,便可根据该遥控命令执行对应的控制操作。以目标终端为电视机为例,若遥控命令对应开启电视机,则电视机开启启动程序,处于启动状态;若遥控命令对应播放综艺节目,则电视机控制节目频道进行转换,转换至播放综艺节目的频道。
本公开实施例提供的方法,目标终端在获取语音数据后,对语音数据进行识别,得到语音识别结果,该语音识别结果中包括目标终端的遥控关键词;之后,根据遥控关键词,生成目标终端的遥控命令,并根据遥控命令执行控制操作,由于基于语音数据对目标终端进行控制,而无需用户执行任何手动操作,所以较为方便和快捷,降低了误操作的概率,智能性较优。
图9是根据一示例性实施例示出的一种终端遥控装置的框图。参照图9,该装置包括获取模块901、识别模块902、生成模块903、控制模块904。
其中,获取模块901,用于获取语音数据;识别模块902与获取模块901连接,用于对语音数据进行识别,得到语音识别结果,语音识别结果中包括目标终端的遥控关键词;生成模块903与识别模块902连接,用于根据遥控关键词,生成目标终端的遥控命令;控制模块904与生成模块903连接,用于根据遥控命令,对目标终端进行控制。
可选地,生成模块,用于在存储的各个遥控关键词与遥控命令的对应关系中,查找目标终端的遥控关键词对应的遥控命令,得到目标终端的遥控命令。
可选地,识别模块,用于对语音数据进行频谱变换,得到语音数据对应的声学特征矢量;在存储的声学特征矢量与遥控关键词的对应关系中,查找与语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
可选地,识别模块,用于语音数据由控制终端获取时,通过控制终端对语音数据进行识别,得到语音识别结果;
生成模块,用于根据遥控关键词,通过控制终端生成目标终端的遥控命令;
该装置还包括:
发送模块,用于通过控制终端将遥控命令发送至路由设备,由路由设备将遥控命令转发至目标终端,遥控命令用于对目标终端进行控制。
可选地,识别模块,语音数据由控制终端获取时,用于通过控制终端将语音数据发送路由设备,由路由设备对语音数据进行识别,得到语音识别结果;
生成模块,用于根据遥控关键词,通过路由设备生成目标终端的遥控命令;
该装置还包括:
发送模块,用于通过路由设备将遥控命令转发至目标终端,遥控命令用于对目标终端进行控制。
可选地,所识别模块,语音数据由路由设备获取时,用于通过路由设备对语音数据进行识别,得到语音识别结果;
生成模块,用于根据遥控关键词,通过路由设备生成目标终端的遥控命令;
该装置还包括:
发送模块,用于通过路由设备将遥控命令转发至目标终端,遥控命令用于对目标终端进行控制。
可选地,识别模块,用于语音数据由目标终端获取时,通过目标终端对语音数据进行识别,得到语音识别结果;
生成模块,用于根据遥控关键词,通过目标终端生成目标终端的遥控命令。
本公开实施例提供的装置,在获取语音数据后,对语音数据进行识别,得到语音识别结果,该语音识别结果中包括目标终端的遥控关键词;之后,根据遥控关键词,生成目标终端的遥控命令,并根据遥控命令对目标终端进行控制,由于基于语音数据对目标终端进行控制,而无需用户执行任何手动操作,所以较为方便和快捷,降低了误操作的概率,智能性较优。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图10是根据一示例性实施例示出的一种用于对终端进行遥控的设备1000的框图。例如,设备1000可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图10,设备1000可以包括以下一个或多个组件:处理组件1002,存储器1004,电源组件1006,多媒体组件1008,音频组件1010,I/O(Input/Output,输入/输出)的接口1012,传感器组件1014,以及通信组件1016。
处理组件1002通常控制设备1000的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1002可以包括一个或多个处理器1020来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1002可以包括一个或多个模块,便于处理组件1002和其他组件之间的交互。例如,处理组件1002可以包括多媒体模块,以方便多媒体组件1008和处理组件1002之间的交互。
存储器1004被配置为存储各种类型的数据以支持在设备1000的操作。这些数据的示例包括用于在设备1000上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1004可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如SRAM(Static Random Access Memory,静态随机存取存储器),EEPROM(Electrically-Erasable Programmable Read-Only Memory,电可擦除可编程只读存储器),EPROM(Erasable Programmable Read Only Memory,可擦除可编程只读存储器),PROM(Programmable Read-Only Memory,可编程只读存储器),ROM(Read-Only Memory,只读存储器),磁存储器,快闪存储器,磁盘或光盘。
电源组件1006为设备1000的各种组件提供电力。电源组件1006可以包括电源管理系统,一个或多个电源,及其他与为设备1000生成、管理和分配电力相关联的组件。
多媒体组件1008包括在设备1000和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括LCD(Liquid Crystal Display,液晶显示器)和TP(Touch Panel,触摸面板)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1008包括一个前置摄像头和/或后置摄像头。当设备1000处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1010被配置为输出和/或输入音频信号。例如,音频组件1010包括一个MIC(Microphone,麦克风),当设备1000处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1004或经由通信组件1016发送。在一些实施例中,音频组件1010还包括一个扬声器,用于输出音频信号。
I/O接口1012为处理组件1002和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1014包括一个或多个传感器,用于为设备1000提供各个方面的状态评估。例如,传感器组件1014可以检测到设备1000的打开/关闭状态,组件的相对定位,例如组件为设备1000的显示器和小键盘,传感器组件1014还可以检测设备1000或设备1000一个组件的位置改变,用户与设备1000接触的存在或不存在,设备1000方位或加速/减速和设备1000的温度变化。传感器组件1014可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1014还可以包括光传感器,如CMOS(ComplementaryMetal Oxide Semiconductor,互补金属氧化物)或CCD(Charge-coupled Device,电荷耦合元件)图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1014还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1016被配置为便于设备1000和其他设备之间有线或无线方式的通信。设备1000可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1016经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件1016还包括NFC(Near Field Communication,近场通信)模块,以促进短程通信。例如,在NFC模块可基于RFID(Radio FrequencyIdentification,射频识别)技术,IrDA(Infra-red Data Association,红外数据协会)技术,UWB(Ultra Wideband,超宽带)技术,BT(Bluetooth,蓝牙)技术和其他技术来实现。
在示例性实施例中,设备1000可以被一个或多个ASIC(Application SpecificIntegrated Circuit,应用专用集成电路)、DSP(Digital signal Processor,数字信号处理器)、DSPD(Digital signal Processor Device,数字信号处理设备)、PLD(ProgrammableLogic Device,可编程逻辑器件)、FPGA)(Field Programmable Gate Array,现场可编程门阵列)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1004,上述指令可由设备1000的处理器1020执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、RAM(Random Access Memory,随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory,光盘只读存储器)、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种终端遥控方法,该方法包括:
获取语音数据;
对语音数据进行识别,得到语音识别结果,语音识别结果中包括目标终端的遥控关键词;
根据遥控关键词,生成目标终端的遥控命令;
根据遥控命令,对目标终端进行控制。
可选地,根据遥控关键词,生成目标终端的遥控命令,包括:
在存储的各个遥控关键词与遥控命令的对应关系中,查找目标终端的遥控关键词对应的遥控命令,得到目标终端的遥控命令。
可选地,对语音数据进行识别,得到语音识别结果,包括:
对语音数据进行频谱变换,得到语音数据对应的声学特征矢量;
在存储的声学特征矢量与遥控关键词的对应关系中,查找与语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
可选地,语音数据由控制终端获取时,通过控制终端对语音数据进行识别,得到语音识别结果;
根据遥控关键词,通过控制终端生成目标终端的遥控命令;
通过控制终端将遥控命令发送至路由设备,由路由设备将遥控命令转发至目标终端,遥控命令用于对目标终端进行控制。
可选地,语音数据由控制终端获取时,通过控制终端将语音数据发送路由设备,由路由设备对语音数据进行识别,得到语音识别结果;
根据遥控关键词,通过路由设备生成目标终端的遥控命令;
通过路由设备将遥控命令转发至目标终端,遥控命令用于对目标终端进行控制。
可选地,语音数据由路由设备获取时,通过路由设备对语音数据进行识别,得到语音识别结果;
根据遥控关键词,通过路由设备生成目标终端的遥控命令;
通过路由设备将遥控命令转发至目标终端,遥控命令用于对目标终端进行控制。
可选地,语音数据由目标终端获取时,通过目标终端对语音数据进行识别,得到语音识别结果;
根据遥控关键词,通过目标终端生成目标终端的遥控命令。
本公开实施例提供的非临时性计算机可读存储介质,在获取语音数据后,对语音数据进行识别,得到语音识别结果,该语音识别结果中包括目标终端的遥控关键词;之后,根据遥控关键词,生成目标终端的遥控命令,并根据遥控命令对目标终端进行控制,由于基于语音数据对目标终端进行控制,而无需用户执行任何手动操作,所以较为方便和快捷,降低了误操作的概率,智能性较优。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (7)

1.一种终端遥控方法,其特征在于,所述方法包括:
获取语音数据,所述语音数据由控制终端或路由设备获取,当所述语音数据由所述控制终端获取时,所述控制终端将所述语音数据发送给所述路由设备;
通过所述路由设备对所述语音数据进行识别,得到语音识别结果,所述语音识别结果中包括目标终端的遥控关键词;
根据所述遥控关键词,通过所述路由设备生成所述目标终端的遥控命令;
通过所述路由设备将所述遥控命令转发至所述目标终端,根据所述遥控命令,对所述目标终端进行控制。
2.根据权利要求1所述的方法,其特征在于,所述根据所述遥控关键词,生成所述目标终端的遥控命令,包括:
在存储的各个遥控关键词与遥控命令的对应关系中,查找所述目标终端的遥控关键词对应的遥控命令,得到所述目标终端的遥控命令。
3.根据权利要求1所述的方法,其特征在于,所述对所述语音数据进行识别,得到语音识别结果,包括:
对所述语音数据进行频谱变换,得到所述语音数据对应的声学特征矢量;
在存储的声学特征矢量与遥控关键词的对应关系中,查找与所述语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
4.一种终端遥控装置,其特征在于,所述装置包括:
获取模块,用于获取语音数据,所述语音数据由控制终端或路由设备获取,当所述语音数据由所述控制终端获取时,所述控制终端将所述语音数据发送给所述路由设备;
识别模块,用于通过所述路由设备对所述语音数据进行识别,得到语音识别结果,所述语音识别结果中包括目标终端的遥控关键词;
生成模块,用于根据所述遥控关键词,通过所述路由设备生成所述目标终端的遥控命令;
发送模块,用于通过所述路由设备将所述遥控命令转发至所述目标终端;
控制模块,用于根据所述遥控命令,对所述目标终端进行控制。
5.根据权利要求4所述的装置,其特征在于,所述生成模块,用于在存储的各个遥控关键词与遥控命令的对应关系中,查找所述目标终端的遥控关键词对应的遥控命令,得到所述目标终端的遥控命令。
6.根据权利要求4所述的装置,其特征在于,所述识别模块,用于对所述语音数据进行频谱变换,得到所述语音数据对应的声学特征矢量;在存储的声学特征矢量与遥控关键词的对应关系中,查找与所述语音数据对应的声学特征矢量相匹配的遥控关键词,得到包括目标终端的遥控关键词的语音识别结果。
7.一种终端遥控设备,其特征在于,所述设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取语音数据,所述语音数据由控制终端或路由设备获取,当所述语音数据由所述控制终端获取时,所述控制终端将所述语音数据发送给所述路由设备;通过所述路由设备对所述语音数据进行识别,得到语音识别结果,所述语音识别结果中包括目标终端的遥控关键词;根据所述遥控关键词,通过所述路由设备生成所述目标终端的遥控命令;通过所述路由设备将所述遥控命令转发至所述目标终端,根据所述遥控命令,对所述目标终端进行控制。
CN201410503238.6A 2014-09-26 2014-09-26 终端遥控方法、装置及设备 Active CN104301526B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410503238.6A CN104301526B (zh) 2014-09-26 2014-09-26 终端遥控方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410503238.6A CN104301526B (zh) 2014-09-26 2014-09-26 终端遥控方法、装置及设备

Publications (2)

Publication Number Publication Date
CN104301526A CN104301526A (zh) 2015-01-21
CN104301526B true CN104301526B (zh) 2017-04-12

Family

ID=52321078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410503238.6A Active CN104301526B (zh) 2014-09-26 2014-09-26 终端遥控方法、装置及设备

Country Status (1)

Country Link
CN (1) CN104301526B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104936020B (zh) * 2015-06-25 2019-04-02 四川迪佳通电子有限公司 基于机顶盒的远场拾音遥控方法及系统
CN105161099B (zh) * 2015-08-12 2019-11-26 恬家(上海)信息科技有限公司 一种语音控制的遥控装置及其实现方法
CN105242556A (zh) * 2015-10-28 2016-01-13 小米科技有限责任公司 智能设备的语音控制方法、装置、控制设备及智能设备
CN105487396A (zh) * 2015-12-29 2016-04-13 宇龙计算机通信科技(深圳)有限公司 智能家居的控制方法和智能家居的控制装置
CN105609104A (zh) * 2016-01-22 2016-05-25 北京云知声信息技术有限公司 一种信息处理方法、装置及智能语音路由控制器
CN105869643A (zh) * 2016-06-06 2016-08-17 青岛海信移动通信技术股份有限公司 基于语音的终端控制方法及语音控制装置
CN106356060B (zh) * 2016-08-23 2020-08-14 北京小米移动软件有限公司 语音通信方法及装置
CN106530639B (zh) * 2016-11-18 2019-06-21 广东小天才科技有限公司 移动终端的通信方法及系统
CN107948698A (zh) * 2017-12-14 2018-04-20 深圳市雷鸟信息科技有限公司 智能电视的语音控制方法、系统及智能电视
CN108257597A (zh) * 2017-12-28 2018-07-06 合肥凯捷技术有限公司 一种基于语音识别的音频数据检索系统
CN110333836B (zh) * 2019-07-05 2023-08-25 网易(杭州)网络有限公司 信息的投屏方法、装置、存储介质和电子装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102945029A (zh) * 2012-10-31 2013-02-27 鸿富锦精密工业(深圳)有限公司 智能网关、智能家居系统及家电设备的智能控制方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6747566B2 (en) * 2001-03-12 2004-06-08 Shaw-Yuan Hou Voice-activated remote control unit for multiple electrical apparatuses
CN101917530B (zh) * 2010-06-30 2013-04-24 浙江工业大学 电话远程按键语音双模式控制器
CN102538143B (zh) * 2012-02-06 2014-02-26 美的集团股份有限公司 语音智能搜索引擎空调系统及其控制方法
CN102647522A (zh) * 2012-04-07 2012-08-22 西北工业大学 基于手机平台的多功能通用遥控系统
EP3691179A1 (en) * 2012-12-18 2020-08-05 Samsung Electronics Co., Ltd. Method and device for controlling home device remotely in home network system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102945029A (zh) * 2012-10-31 2013-02-27 鸿富锦精密工业(深圳)有限公司 智能网关、智能家居系统及家电设备的智能控制方法

Also Published As

Publication number Publication date
CN104301526A (zh) 2015-01-21

Similar Documents

Publication Publication Date Title
CN104301526B (zh) 终端遥控方法、装置及设备
CN104159226B (zh) 网络连接方法和装置
CN104159218B (zh) 网络连接建立方法和装置
CN105242556A (zh) 智能设备的语音控制方法、装置、控制设备及智能设备
CN105093947A (zh) 智能设备控制方法和装置
CN104159230B (zh) 电话呼叫识别方法及装置
CN104915094A (zh) 终端控制方法、装置及终端
CN105182784A (zh) 控制智能设备的方法、装置及终端
CN104460365A (zh) 设备控制方法和装置
CN104640166A (zh) 通信方法及装置
CN103841264A (zh) 一种保护终端设备的方法、装置及终端设备
CN105353870A (zh) 通过智能穿戴设备控制终端的方法及装置
CN105374145A (zh) 智能终端报警方法及装置
CN104837154A (zh) 无线访问接入点的控制方法及装置
CN105406882A (zh) 终端设备控制方法及装置
CN105516944A (zh) 短信清理方法及装置
CN105487786A (zh) 应用程序图标管理方法及装置
CN105677338A (zh) 应用程序显示方法及装置
CN104950838A (zh) 网络账户绑定方法及装置
CN104539812A (zh) 推荐信息获取方法、终端及服务器
CN105093980A (zh) 控制智能设备启停的方法及装置
CN105372999A (zh) 数据处理方法及装置
CN105281993A (zh) 播放多媒体文件的方法及装置
CN104317911A (zh) 上传文件的方法及装置
CN105187671A (zh) 录音方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant