CN108109618A - 语音交互方法、系统以及终端设备 - Google Patents
语音交互方法、系统以及终端设备 Download PDFInfo
- Publication number
- CN108109618A CN108109618A CN201611054248.1A CN201611054248A CN108109618A CN 108109618 A CN108109618 A CN 108109618A CN 201611054248 A CN201611054248 A CN 201611054248A CN 108109618 A CN108109618 A CN 108109618A
- Authority
- CN
- China
- Prior art keywords
- keyword
- user
- phonetic order
- voice interactive
- terminal device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种语音交互方法,包括:接收用户的语音指令,并对所述语音指令执行语音识别,转换为计算机可读文本;对所述计算机可读文本进行关键字抓取操作;将所抓取的关键字与关键字数据库进行对比,判定所述接收的语音指令为信息类需求还是服务类需求;及当所接收的语音指令为信息类需求时,根据所抓取的关键字进行信息搜索并返回搜索结果;或当所接收的语音指令为服务类需求时,根据所述服务类需求的种类,调用并开启对应的应用程序。本发明还提供一种语音交互系统及终端设备。本发明可以实现用户与终端设备之间深层次的语音交互。
Description
技术领域
本发明涉及人机交互技术领域,具体而言,涉及一种语音交互方法、系统以及终端设备。
背景技术
目前,交互技术趋于多样化,终端设备的人机交互也从原来单一的按键交互,扩展为触屏交互,体感交互,语音交互等方式。语音交互,由于可以解放用户的双手,在某些时候,如用户在开车的过程中,显得尤为重要。
然而,目前的语音助手只能对“拨打电话”、“发短信”、“打开某应用程序”等较为底层和基础的功能实现一步到位,却无法实现更为复杂和深入的生活服务功能,例如“帮我订两张最近评分较高的电影票”,或“我要回家,请帮我评估搭公车和打车哪个更合适,然后引导我去公车站/帮我叫车”等。
因此,如何提高语音交互的复杂度与深度,成为亟需解决的问题。
发明内容
鉴于以上内容,有必要提出一种语音交互方法,可以实现用户与终端设备之间深层次的语音交互。
一种语音交互方法,应用于终端设备中,包括:
接收用户的语音指令,并对所述语音指令执行语音识别,转换为计算机可读文本;
对所述计算机可读文本进行关键字抓取操作;
将所抓取的关键字与关键字数据库进行对比,判定所述接收的语音指令为信息类需求还是服务类需求;及
当所接收的语音指令为信息类需求时,根据所抓取的关键字进行信息搜索并返回搜索结果;或
当所接收的语音指令为服务类需求时,根据所述服务类需求的种类,调用并开启对应的应用程序。
本发明优选实施例中,所述关键字抓取操作是将所述计算机可读文本切分为单个字或者词语,对所述单个字或者词语进行分析,抓取其中的动词、名词、和/或数量词作为关键字。
本发明优选实施例中,所述语音交互方法还包括:
根据所抓取的关键字,并结合用户的位置信息,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
本发明优选实施例中,所述语音交互方法还包括:
根据用户的选择,当用户对所述初步查询结果执行了下一步选择时,控制所开启的应用程序根据用户的选择执行下一步操作,直至完成服务流程。
鉴于以上内容,还有必要提出一种语音交互系统,可以实现用户与终端设备之间深层次的语音交互。
一种语音交互系统,应用于终端设备中,包括:
语音接收及识别模块,用于接收用户的语音指令,并对所述语音指令执行语音识别,转换为计算机可读文本;
关键字抓取模块,用于对所述计算机可读文本进行关键字抓取操作;
需求分析模块,用于将所抓取的关键字与关键字数据库进行对比,判定所述接收的语音指令为信息类需求还是服务类需求;
检索模块,用于当所接收的语音指令为信息类需求时,根据所抓取的关键字进行信息搜索并返回搜索结果;及
程序执行模块,用于当所接收的语音指令为服务类需求时,根据所述服务类需求的种类,调用并开启对应的应用程序。
本发明优选实施例中,所述关键字抓取操作是将所述计算机可读文本切分为单个字或者词语,对所述单个字或者词语进行分析,抓取其中的动词、名词、和/或数量词作为关键字。
本发明优选实施例中,所述程序执行模块还用于:
根据所抓取的关键字,并结合用户的位置信息,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
本发明优选实施例中,所述程序执行模块还用于:
根据用户的选择,当用户对所述初步查询结果执行了下一步选择时,控制所开启的应用程序根据用户的选择执行下一步操作,直至完成服务流程。
鉴于以上内容,还有必要提出一种终端设备,可以实现与用户之间深层次的语音交互。
一种终端设备,包括存储器以及处理器,其中:
所述存储器中存储有程序代码,以及所述处理器用于执行所述程序代 码,以实现:
接收用户的语音指令,并对所述语音指令执行语音识别,转换为计算机可读文本;
对所述计算机可读文本进行关键字抓取操作;
将所抓取的关键字与关键字数据库进行对比,判定所述接收的用户的语音指令为信息类需求还是服务类需求;及
当所接收的用户的语音指令为信息类需求时,根据所抓取的关键字进行信息搜索并返回搜索结果;或
当所接收的用户的语音指令为服务类需求时,根据所述服务类需求的种类,调用并开启对应的应用程序。
本发明优选实施例中,所述处理器执行所述程序代码还实现:
根据所抓取的关键字,并结合用户的位置信息,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
相较于现有技术,本发明所提供的语音交互方法、系统以及终端设备,可以实现用户与终端设备之间深层次的语音交互,让用户不必在与语音助手对话的过程中被打断跳出,而是一直停留在对话的界面,并直接对于结果进行下一步指令要求,整个过程可以完全通过对话完成,不必触碰手机进行手指操作或用眼去看手机,这对于开车人士来说,是一种兼具安全和效率的解决方案。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例和现有技术 描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1及图2是本发明语音交互方法较佳实施例的方法流程图。
图3是本发明语音交互系统较佳实施例的功能模块图。
图4是本发明终端设备较佳实施例的结构示意图。
主要元件符号说明
终端设备 1
语音交互系统 10
语音接收及识别模块 100
关键字抓取模块 101
需求分析模块 102
检索模块 103
程序执行模块 104
存储器 11
处理器 12
输入输出装置 13
通信总线 14
具体实施方式
本发明实施例提供一种语音交互方法,以实现用户与终端设备之间深层 次的语音交互,满足用户利用语音操作终端设备的需求,解放了用户双手,提高了用户体验。本发明实施例还提供相应的语音交互系统、终端设备以及计算机可读存储介质。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面通过各个具体实施例,分别进行详细的说明。
实施例一、
参考图1及图2所示,是本发明所述语音交互方法较佳实施例的方法流程图。
根据不同的需求,该图所示流程图中的执行顺序可以改变,某些可以省略。
在本发明较佳实施例中,所述语音交互方法应用于一个终端设备中。
所述终端设备可以是,但不限于,例如,智能手机,平板电脑,台式机、智能家居设备,包括智能电视等,以及智能穿戴设备,包括手表、手环、眼镜等。
本发明实施例中,所述终端设备安装有多个应用程序。所述应用程序(Application,简称APP)是安装在所述终端设备中的软件,用于实现某种功能,如导航、即时通讯、公交查询、在线购物等。
在本发明较佳实施例中,所述语音交互方法包括:
S10,所述终端设备接收用户的语音指令,并对所述语音指令执行语音识别。例如,所述语音指令可以是,“讲个笑话”,“近距离出行”,“订两张电影票”,“推荐一个餐馆”等。
本发明较佳实施例中,所述终端设备可以采用任何的语音识别技术,将所述用户的语音指令转换为计算机可读的文本。
S11,所述终端设备对根据所述语音指令转换的计算机可读文本进行关键字抓取操作。
本发明较佳实施例中,所述关键字抓取操作是将根据所述语音指令转换的计算机可读文本切分为单个字或者词语,对所述单个字或者词语进行分析,抓取其中的动词、名词、和/或数量词作为关键字。
例如,所述终端设备将“推荐一个餐馆”切分为“推荐”、“一个”、“餐馆”,并分析到所述“推荐”为动词、“一个”为数量词以及“餐馆”为名词。因此,所抓取的关键字可以为“推荐”、“一个”、“餐馆”。
S12,所述终端设备将所抓取的关键字与一个预设的关键字数据库进行对比。
本发明较佳实施例中,所述关键字数据库中存储有多个关键字,其中每个关键字设置有对应的属性信息。所述属性信息可以包括所述关键字属于信息类还是服务类。
当所述终端设备将所抓取的关键字与所述关键字数据库进行对比后,发现所抓取的关键字中的一个或者多个为信息类关键字,并且不存在服务类关键字,则判定上述接收用户的语音指令为信息类需求,并执行下述的S13。
当所述终端设备将所抓取的关键字与所述关键字数据库进行对比后,发 现所抓取的关键字中的一个或者多个为服务类关键字,则判定上述接收用户的语音指令为服务类需求,并执行下述的S14。
例如,根据“讲个笑话”的语音指令抓取中的关键字中,“笑话”为信息类关键字,且不存在服务类关键字,则执行S13,所述终端设备根据所抓取的关键字进行信息搜索并返回搜索结果,例如,利用终端设备中安装的搜索引擎,以“笑话”为关键字,进行搜索,并将搜索结果呈现给用户。
又如,根据“推荐一个餐馆”的语音指令抓取的关键字中,“餐馆”为服务类关键字,则执行S14,所述终端设备根据所述服务类需求的种类,调用并开启对应的应用程序,例如,所述终端设备根据关键字“餐馆”,可以调用所述终端设备中安装的用户常用的用于团购的应用程序或者其他任何相关的应用程序。
在本发明其他较佳实施例中,如图2所示,在执行完S14之后,所述语音交互方法还包括:
S15,所述终端设备根据所抓取的关键字,并结合用户的位置信息等,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
例如,所述终端设备根据关键字“餐馆”,以及当前用户的位置信息,在所开启的应用程序中进行查询距离用户最近的餐馆,并返回前N个餐馆的初步查询结果,供用户进行下一步选择。
S16,所述终端设备根据用户的选择和反馈,判断是否所述用户提出更精确的筛选意见,或者是否所述用户对所述初步查询结果均不满意,或者是否所述用户根据所述初步查询结果做出了下一步选择。
例如,当根据所述终端设备返回的前N个餐馆的初步查询结果,所述用户提出了更精确的筛选意见,如筛选其中的粤菜,则返回上述的S15。
又如,当所述用户对所述初步查询结果都不满意,则返回上述图1中的S10。
进一步地,当用户根据所述终端设备返回的前N个餐馆的初步查询结果,执行了下一步选择,如选择了其中一个餐馆,则执行S17,所述终端设备控制所开启的应用程序根据用户的选择执行下一步操作,直至完成服务流程,如完成所述餐馆的订餐服务。
上述图1~2详细介绍了本发明的语音交互方法,下面结合第3~4图,分别对实现上述语音交互方法的语音交互系统以及终端设备进行介绍。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
如图3所示,是本发明语音交互系统较佳实施例的结构示意图。
本发明所述语音交互系统10可以包括多个由计算机程序代码所组成的程序段,可以安装在终端设备中,并由所述终端设备所执行,以实现用户与所述终端设备之间的语音交互。
参阅图3所示,所述语音交互系统10根据其所执行的功能,可以被划分为多个功能模块。本发明较佳实施例中,所述语音交互系统10中的功能模块至少可以包括:语音接收及识别模块100、关键字抓取模块101、需求分析模块102、检索模块103以及程序执行模块104。
所述语音接收及识别模块100用于接收用户的语音指令,并对所述语音 指令执行语音识别。
例如,所述语音指令可以是,“讲个笑话”,“近距离出行”,“订两张电影票”,“推荐一个餐馆”等。
本发明较佳实施例中,所述语音接收及识别模块100可以采用任何的语音识别技术,将所述用户的语音指令转换为计算机可读的文本。
所述关键字抓取模块101用于对根据所述语音指令转换的计算机可读文本进行关键字抓取操作。
本发明较佳实施例中,所述关键字抓取操作是将根据所述语音指令转换的计算机可读文本切分为单个字或者词语,对所述单个字或者词语进行分析,抓取其中的动词、名词、和/或数量词作为关键字。
例如,所述关键字抓取模块101将“推荐一个餐馆”切分为“推荐”、“一个”、“餐馆”,并分析到所述“推荐”为动词、“一个”为数量词以及“餐馆”为名词。因此,所抓取的关键字可以为“推荐”、“一个”、“餐馆”。
所述需求分析模块102用于将所抓取的关键字与一个预设的关键字数据库进行对比,以判断上述接收的用户的语音指令为信息类需求还是服务类需求。
本发明较佳实施例中,所述关键字数据库中存储有多个关键字,其中每个关键字设置有对应的属性信息。所述属性信息可以包括所述关键字属于信息类还是服务类。
当所述需求分析模块102将所抓取的关键字与所述关键字数据库进行对比后,发现所抓取的关键字中的一个或者多个为信息类关键字,并且不存 在服务类关键字,则判定上述接收用户的语音指令为信息类需求。
当所述需求分析模块102将所抓取的关键字与所述关键字数据库进行对比后,发现所抓取的关键字中的一个或者多个为服务类关键字,则判定上述接收用户的语音指令为服务类需求。
所述检索模块103用于当所接收的用户的语音指令为信息类需求时,根据所抓取的关键字进行信息搜索并返回搜索结果。
例如,根据“讲个笑话”的语音指令抓取中的关键字中,“笑话”为信息类关键字,且不存在服务类关键字,则检索模块103根据所抓取的关键字进行信息搜索并返回搜索结果,例如,利用终端设备中安装的搜索引擎,以“笑话”为关键字,进行搜索,并将搜索结果呈现给用户。
所述程序执行模块104用于当所接收的用户的语音指令为服务类需求时,根据所述服务类需求的种类,调用并开启对应的应用程序。
例如,根据“推荐一个餐馆”的语音指令抓取的关键字中,“餐馆”为服务类关键字,则所述程序执行模块104根据所述服务类需求的种类,调用并开启对应的应用程序,例如,所述终端设备根据关键字“餐馆”,可以调用所述终端设备中安装的用户常用的用于团购的应用程序或者其他任何相关的应用程序。
进一步地,所述程序执行模块104还用于根据所抓取的关键字,并结合用户的位置信息等,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
例如,所述程序执行模块104根据关键字“餐馆”,以及当前用户的位置信息,在所开启的应用程序中进行查询距离用户最近的餐馆,并返回前N 个餐馆的初步查询结果,供用户进行下一步选择。
所述程序执行模块104根据用户的选择和反馈,判断是否所述用户提出更精确的筛选意见,或者是否所述用户对所述初步查询结果不满意,或者是否所述用户根据所述初步查询结果做出了下一步选择。
例如,当根据前N个餐馆的初步查询结果,所述用户提出了更精确的筛选意见,如筛选其中的粤菜,则所述程序执行模块104继续根据所抓取的关键字,并结合用户的位置信息等,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
进一步地,当用户根据返回的前N个餐馆的初步查询结果,执行了下一步选择,如选择了一个餐馆,则所述程序执行模块104控制所开启的应用程序根据用户的选择执行下一步操作,直至完成服务流程,如完成所述餐馆的订餐服务。
此外,当所述用户对所述初步查询结果均不满意,所述语音接收及识别模块100可以重新接收用户的语音指令,并对所述语音指令执行语音识别。
如图4所示,是实现本发明所述语音交互方法的终端设备较佳实施例的结构示意图。
所述终端设备1可以是,但不限于,例如,智能手机,平板电脑,台式机、智能家居设备,包括智能电视等,以及智能穿戴设备,包括手表、手环、眼镜等。
本发明实施例中,所述终端设备安装有多个应用程序。所述应用程序(Application,简称APP)是安装在所述终端设备中的软件,用于实现某种 功能,如导航、即时通讯、公交查询、在线购物等。
如图4所示,本发明实施例中的终端设备1包括至少一个存储器11、至少一个处理器12、至少一个输入输出装置13以及通信总线14。
所述通信总线14可以实现所述存储器11、处理器12、输入输出装置13之间的通信。
所述输入输出装置13是用户与终端设备1进行数据交互的接口,可以包括数据输入以及输出设备,如键盘鼠标、摄像头、麦克风、扬声器、显示屏等。
所述存储器11存储有程序代码。所述存储器11可以为智能媒体卡(smart mediacard)、安全数字卡(secure digital card)、快闪存储器卡(flash card)等储存设备。
所述处理器12可执行所述终端设备1的操作系统以及安装的各类应用程序等。所述处理器12可以包括一个或者多个中央处理器、微处理器、数字处理器等。
本发明较佳实施例中,所述处理器12可通过所述通信总线14,调用所述存储器11中存储的程序代码以执行相关的功能。例如,图3中所述的各个模块(例如,语音接收及识别模块100、关键字抓取模块101、需求分析模块102、检索模块103以及程序执行模块104)是存储在所述存储器11中的程序代码,并由所述处理器12所执行,以实现一种语音交互方法。
具体而言,所述语音交互方法包括:
一种语音交互方法,应用于终端设备中,包括:
接收用户的语音指令,并对所述语音指令执行语音识别,转换为计算机可读文本;
对所述计算机可读文本进行关键字抓取操作;
将所抓取的关键字与关键字数据库进行对比,判定所述接收的语音指令为信息类需求还是服务类需求;及
当所接收的语音指令为信息类需求时,根据所抓取的关键字进行信息搜索并返回搜索结果;或
当所接收的语音指令为服务类需求时,根据所述服务类需求的种类,调用并开启对应的应用程序。
本发明优选实施例中,所述关键字抓取操作是将所述计算机可读文本切分为单个字或者词语,对所述单个字或者词语进行分析,抓取其中的动词、名词、和/或数量词作为关键字。
本发明优选实施例中,所述语音交互方法还包括:
根据所抓取的关键字,并结合用户的位置信息,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
本发明优选实施例中,所述语音交互方法还包括:
根据用户的选择,当用户对所述初步查询结果执行了下一步选择时,控制所开启的应用程序根据用户的选择执行下一步操作,直至完成服务流程。
实施例六、
本发明实施例还提供一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当被包括一个或多个处理器的终端设备1执行时,使所述终端设备1执行如上文方法实施例所述的语音交互方法。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有 详细描述的部分,可以参见其它实施例的相关描述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且 是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个模块或装置也可以由一个模块或装置通过软件或者硬件来16实现。第一,第二等词语用来表示名16称,而并不表示任何特定的顺16序。
最本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种语音交互方法,应用于终端设备中,其特征在于,所述语音交互方法包括:
接收用户的语音指令,并对所述语音指令执行语音识别,转换为计算机可读文本;
对所述计算机可读文本进行关键字抓取操作;
将所抓取的关键字与关键字数据库进行对比,判定所述接收的语音指令为信息类需求还是服务类需求;及
当所接收的语音指令为信息类需求时,根据所抓取的关键字进行信息搜索并返回搜索结果;或
当所接收的语音指令为服务类需求时,根据所述服务类需求的种类,调用并开启对应的应用程序。
2.如权利要求1所述的语音交互方法,其特征在于,所述关键字抓取操作是将所述计算机可读文本切分为单个字或者词语,对所述单个字或者词语进行分析,抓取其中的动词、名词、和/或数量词作为关键字。
3.如权利要求1所述的语音交互方法,其特征在于,所述语音交互方法还包括:
根据所抓取的关键字,并结合用户的位置信息,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
4.如权利要求3所述的语音交互方法,其特征在于,所述语音交互方法还包括:
根据用户的选择,当用户对所述初步查询结果执行了下一步选择时,控制所开启的应用程序根据用户的选择执行下一步操作,直至完成服务流程。
5.一种语音交互系统,应用于终端设备中,其特征在于,所述语音交互系统包括:
语音接收及识别模块,用于接收用户的语音指令,并对所述语音指令执行语音识别,转换为计算机可读文本;
关键字抓取模块,用于对所述计算机可读文本进行关键字抓取操作;
需求分析模块,用于将所抓取的关键字与关键字数据库进行对比,判定所述接收的语音指令为信息类需求还是服务类需求;
检索模块,用于当所接收的语音指令为信息类需求时,根据所抓取的关键字进行信息搜索并返回搜索结果;及
程序执行模块,用于当所接收的语音指令为服务类需求时,根据所述服务类需求的种类,调用并开启对应的应用程序。
6.如权利要求5所述的语音交互系统,其特征在于,所述关键字抓取操作是将所述计算机可读文本切分为单个字或者词语,对所述单个字或者词语进行分析,抓取其中的动词、名词、和/或数量词作为关键字。
7.如权利要求5所述的语音交互系统,其特征在于,所述程序执行模块还用于:
根据所抓取的关键字,并结合用户的位置信息,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
8.如权利要求7所述的语音交互系统,其特征在于,所述程序执行模块还用于:
根据用户的选择,当用户对所述初步查询结果执行了下一步选择时,控制所开启的应用程序根据用户的选择执行下一步操作,直至完成服务流程。
9.一种终端设备,包括存储器以及处理器,其特征在于:
所述存储器中存储有程序代码,以及所述处理器用于执行所述程序代码,以实现:
接收用户的语音指令,并对所述语音指令执行语音识别,转换为计算机可读文本;
对所述计算机可读文本进行关键字抓取操作;
将所抓取的关键字与关键字数据库进行对比,判定所述接收的用户的语音指令为信息类需求还是服务类需求;及
当所接收的用户的语音指令为信息类需求时,根据所抓取的关键字进行信息搜索并返回搜索结果;或
当所接收的用户的语音指令为服务类需求时,根据所述服务类需求的种类,调用并开启对应的应用程序。
10.如权利要求9所述的终端设备,其特征在于,所述处理器执行所述程序代码还实现:
根据所抓取的关键字,并结合用户的位置信息,在所开启的应用程序中进行查询,并返回初步查询结果供用户进行下一步选择。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201611054248.1A CN108109618A (zh) | 2016-11-25 | 2016-11-25 | 语音交互方法、系统以及终端设备 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201611054248.1A CN108109618A (zh) | 2016-11-25 | 2016-11-25 | 语音交互方法、系统以及终端设备 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN108109618A true CN108109618A (zh) | 2018-06-01 |
Family
ID=62204222
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201611054248.1A Pending CN108109618A (zh) | 2016-11-25 | 2016-11-25 | 语音交互方法、系统以及终端设备 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN108109618A (zh) |
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108922527A (zh) * | 2018-06-28 | 2018-11-30 | 西安艾润物联网技术服务有限责任公司 | 车辆缴费语音控制方法、系统及可读存储介质 |
| CN109040481A (zh) * | 2018-08-09 | 2018-12-18 | 武汉优品楚鼎科技有限公司 | 证券领域的自动纠错智能电话问询方法、系统及装置 |
| CN109243450A (zh) * | 2018-10-18 | 2019-01-18 | 深圳供电局有限公司 | 一种交互式的语音识别方法及系统 |
| CN109255064A (zh) * | 2018-08-30 | 2019-01-22 | Oppo广东移动通信有限公司 | 信息搜索方法、装置、智能眼镜及存储介质 |
| CN109461448A (zh) * | 2018-12-11 | 2019-03-12 | 百度在线网络技术(北京)有限公司 | 语音交互方法及装置 |
| CN109618051A (zh) * | 2018-11-28 | 2019-04-12 | 北京小米移动软件有限公司 | 信息查询方法及装置 |
| CN109684540A (zh) * | 2018-12-11 | 2019-04-26 | 北京奇点机智科技有限公司 | 服务信息交互的方法和装置 |
| CN109816423A (zh) * | 2018-12-14 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 基于语音识别的产品规划方法及服务器 |
| CN110853647A (zh) * | 2018-07-27 | 2020-02-28 | Tcl集团股份有限公司 | 一种视频搜索方法、视频播放终端及存储介质 |
| CN111243580A (zh) * | 2018-11-28 | 2020-06-05 | Tcl集团股份有限公司 | 语音控制方法、装置及计算机可读存储介质 |
| CN111724773A (zh) * | 2019-03-22 | 2020-09-29 | 北京京东尚科信息技术有限公司 | 应用开启方法、装置和计算机系统及介质 |
| CN113330489A (zh) * | 2019-05-20 | 2021-08-31 | 深圳市欢太科技有限公司 | 语音信息处理方法、装置、电子设备以及存储介质 |
| CN113886540A (zh) * | 2021-09-29 | 2022-01-04 | 广州广电运通智能科技有限公司 | 一种城市轨道交通的乘客服务系统和方法 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101297355A (zh) * | 2005-08-05 | 2008-10-29 | 沃伊斯博克斯科技公司 | 响应自然语言语音口头表达的系统和方法 |
| JP2015153108A (ja) * | 2014-02-13 | 2015-08-24 | 株式会社東芝 | 音声会話支援装置、及び音声会話支援方法及びプログラム |
| WO2015163068A1 (ja) * | 2014-04-22 | 2015-10-29 | ソニー株式会社 | 情報処理装置、情報処理方法及びコンピュータプログラム |
| CN105117465A (zh) * | 2015-08-26 | 2015-12-02 | 深圳市万音达科技有限公司 | 评价信息的交互方法和系统 |
| CN105874424A (zh) * | 2014-01-10 | 2016-08-17 | 微软技术许可有限责任公司 | 协同的语音和姿态输入 |
| CN106101789A (zh) * | 2016-07-06 | 2016-11-09 | 深圳Tcl数字技术有限公司 | 终端的语音交互方法及装置 |
-
2016
- 2016-11-25 CN CN201611054248.1A patent/CN108109618A/zh active Pending
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101297355A (zh) * | 2005-08-05 | 2008-10-29 | 沃伊斯博克斯科技公司 | 响应自然语言语音口头表达的系统和方法 |
| CN101297355B (zh) * | 2005-08-05 | 2015-05-13 | 沃伊斯博克斯科技公司 | 响应自然语言语音口头表达的系统和方法 |
| CN105874424A (zh) * | 2014-01-10 | 2016-08-17 | 微软技术许可有限责任公司 | 协同的语音和姿态输入 |
| JP2015153108A (ja) * | 2014-02-13 | 2015-08-24 | 株式会社東芝 | 音声会話支援装置、及び音声会話支援方法及びプログラム |
| WO2015163068A1 (ja) * | 2014-04-22 | 2015-10-29 | ソニー株式会社 | 情報処理装置、情報処理方法及びコンピュータプログラム |
| CN105117465A (zh) * | 2015-08-26 | 2015-12-02 | 深圳市万音达科技有限公司 | 评价信息的交互方法和系统 |
| CN106101789A (zh) * | 2016-07-06 | 2016-11-09 | 深圳Tcl数字技术有限公司 | 终端的语音交互方法及装置 |
Cited By (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108922527A (zh) * | 2018-06-28 | 2018-11-30 | 西安艾润物联网技术服务有限责任公司 | 车辆缴费语音控制方法、系统及可读存储介质 |
| CN110853647A (zh) * | 2018-07-27 | 2020-02-28 | Tcl集团股份有限公司 | 一种视频搜索方法、视频播放终端及存储介质 |
| CN109040481A (zh) * | 2018-08-09 | 2018-12-18 | 武汉优品楚鼎科技有限公司 | 证券领域的自动纠错智能电话问询方法、系统及装置 |
| CN109255064A (zh) * | 2018-08-30 | 2019-01-22 | Oppo广东移动通信有限公司 | 信息搜索方法、装置、智能眼镜及存储介质 |
| CN109243450A (zh) * | 2018-10-18 | 2019-01-18 | 深圳供电局有限公司 | 一种交互式的语音识别方法及系统 |
| CN111243580A (zh) * | 2018-11-28 | 2020-06-05 | Tcl集团股份有限公司 | 语音控制方法、装置及计算机可读存储介质 |
| CN109618051A (zh) * | 2018-11-28 | 2019-04-12 | 北京小米移动软件有限公司 | 信息查询方法及装置 |
| CN111243580B (zh) * | 2018-11-28 | 2023-06-09 | Tcl科技集团股份有限公司 | 语音控制方法、装置及计算机可读存储介质 |
| CN109684540A (zh) * | 2018-12-11 | 2019-04-26 | 北京奇点机智科技有限公司 | 服务信息交互的方法和装置 |
| CN109461448A (zh) * | 2018-12-11 | 2019-03-12 | 百度在线网络技术(北京)有限公司 | 语音交互方法及装置 |
| CN109816423A (zh) * | 2018-12-14 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 基于语音识别的产品规划方法及服务器 |
| CN111724773A (zh) * | 2019-03-22 | 2020-09-29 | 北京京东尚科信息技术有限公司 | 应用开启方法、装置和计算机系统及介质 |
| CN113330489A (zh) * | 2019-05-20 | 2021-08-31 | 深圳市欢太科技有限公司 | 语音信息处理方法、装置、电子设备以及存储介质 |
| CN113886540A (zh) * | 2021-09-29 | 2022-01-04 | 广州广电运通智能科技有限公司 | 一种城市轨道交通的乘客服务系统和方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108109618A (zh) | 语音交互方法、系统以及终端设备 | |
| JP7114307B2 (ja) | 情報処理装置 | |
| KR101770527B1 (ko) | 기계학습에 기초한 자동 태스크 분류 방법 | |
| US10521189B1 (en) | Voice assistant with user data context | |
| CN114065057B (zh) | 搜索结果确定方法、展示方法、装置、设备和介质 | |
| EP3720060B1 (en) | Apparatus and method for providing conversation topic | |
| CN105653134B (zh) | 应用切换方法及其系统 | |
| CN107832286A (zh) | 智能交互方法、设备及存储介质 | |
| KR102499198B1 (ko) | 사용자 맞춤형 챗봇 서비스 시스템 및 그 방법 | |
| CN116501960A (zh) | 内容检索方法、装置、设备及介质 | |
| JP2005190476A (ja) | ユーザの共同体のプリファランスエンコーディングの考慮を介したアプリケーションおよびサービスの個人化をサポートする統計的モデルおよび方法 | |
| EP2734938A1 (en) | Method and system of classification in a natural language user interface | |
| CN106572272A (zh) | 一种ivr语音菜单确定方法及装置 | |
| KR101934280B1 (ko) | 발화내용 분석 장치 및 방법 | |
| CN109791551A (zh) | 信息处理系统、信息处理装置、信息处理方法、及存储介质 | |
| US20210021709A1 (en) | Configurable dynamic call routing and matching system | |
| CN109002184A (zh) | 一种输入法候选词的联想方法和装置 | |
| WO2020095776A1 (ja) | 知識情報作成支援装置 | |
| KR20180134099A (ko) | 인공지능 통합 플랫폼 및 그 운영방법 | |
| CN109165180A (zh) | 一种提高房源经纪人作业效率的方法和系统 | |
| US20120278078A1 (en) | Input and displayed information definition based on automatic speech recognition during a communication session | |
| CN117807123A (zh) | 一种服务卡片推荐的方法和电子设备 | |
| CN110456920A (zh) | 一种基于语义分析的内容推荐方法和装置 | |
| CN112631435B (zh) | 一种输入方法、装置、设备及存储介质 | |
| US20210092080A1 (en) | Information processing system and information processing method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180601 |
|
| RJ01 | Rejection of invention patent application after publication |