[go: up one dir, main page]

CN111816173B - 对话数据处理方法、装置、存储介质及计算机设备 - Google Patents

对话数据处理方法、装置、存储介质及计算机设备 Download PDF

Info

Publication number
CN111816173B
CN111816173B CN202010486061.9A CN202010486061A CN111816173B CN 111816173 B CN111816173 B CN 111816173B CN 202010486061 A CN202010486061 A CN 202010486061A CN 111816173 B CN111816173 B CN 111816173B
Authority
CN
China
Prior art keywords
data
user
key information
knowledge graph
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010486061.9A
Other languages
English (en)
Other versions
CN111816173A (zh
Inventor
李明杰
宋德超
贾巨涛
胡天云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai, Zhuhai Lianyun Technology Co Ltd filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN202010486061.9A priority Critical patent/CN111816173B/zh
Publication of CN111816173A publication Critical patent/CN111816173A/zh
Application granted granted Critical
Publication of CN111816173B publication Critical patent/CN111816173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种对话数据处理方法、装置、存储介质及计算机设备,应用于对话系统,该方法包括:通过解释器接收当前文本,并提取当前文本中的关键信息,当前文本为根据接收到的用户数据生成的数据;通过跟踪器中预先定义的对话逻辑标记关键信息;通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略;通过操作器在预设知识图谱数据库中执行目标操作策略。本申请将用户信息与知识库中历史交互信息、用户信息集合、领域知识集合相结合,建立知识性的联系,加强了知识图谱数据库与数据之间的关联,在用户数据对应的关键信息不明确的时候也能推理出用户所需的数据,简化了对话交互流程,精确或推理性地获取更准确的目标数据。

Description

对话数据处理方法、装置、存储介质及计算机设备
技术领域
本申请涉及搜索技术领域,尤其涉及一种对话数据处理方法、装置、存储介质及计算机设备。
背景技术
在互联网技术中依靠语音方式表达需求改变了人们表达需求的方式。语音智能设备种类越来越丰富,智能语音功能也越来越多,例如家庭机器人、语音导厨、语音导购等语音控制或语音搜索功能。但是现有技术中,语音控制或语音搜索以逻辑搜索和模板匹配为主,需要配置大量的逻辑判断,导致当语音对话复杂时获取到搜索结果的过程变得复杂,且搜索结果不够精准,不一定能满足用户需求;且在语音方式表达需求时,有时用户语音表达的意愿可能不够具体或者比较模糊、范围广,也会导致模糊检索时得到的搜索结果不够精准,无法满足精确搜索需求,不能满足用户的实际需求,用户体验差。
发明内容
为了解决上述通过逻辑搜索或模板匹配导致搜索复杂且搜索结果不够精准的技术问题,本申请实施例提供了一种对话数据处理方法、装置、存储介质及计算机设备。
第一方面,本申请实施例提供了一种对话数据处理方法,应用于对话系统,对话系统中包括解释器、跟踪器、策略管理器和操作器,该方法包括:
通过解释器接收当前文本,并提取当前文本中的关键信息,当前文本为根据接收到的用户数据生成的数据;
通过跟踪器中预先定义的对话逻辑标记关键信息;
通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略;
通过操作器在预设知识图谱数据库中执行目标操作策略。
可选地,对话系统中包含多个解释器,对话系统中还包括模式选择器,方法还包括:
通过模式选择器接收原始文本,原始文本携带设备标识;
根据设备标识确定对应的目标解释器;
通过解释器接收当前文本,包括:通过目标解释器接收当前文本,当前文本为原始文本或原始文本的部分文本。
可选地,对话系统中还包括数据接收器和语音识别网关,方法还包括:
通过数据接收器接收用户数据;
当用户数据为语音数据时,通过语音识别网关对用户的语音数据进行识别,得到原始文本。
可选地,对话系统中还包括数据类型判断器,方法还包括:
通过数据类型判断器判断用户数据的数据类型;
当数据类型为文本类型时,将用户数据作为原始文本;
当数据类型为语音类型时,进入通过语音识别网关对用户的语音数据进行识别,得到原始文本的步骤。
可选地,通过跟踪器中预先定义的对话逻辑标记关键信息,包括:
通过跟踪器中存储的当前文本的历史文本,和对话逻辑标记关键信息,其中,历史文本与当前文本为同一会话文本。
可选地,预设知识图谱数据库包括领域知识图谱数据库和个人知识图谱数据库,目标操作策略为第一操作策略或第二操作策略,
通过操作器在预设知识图谱数据库中执行目标操作策略,包括:
当目标操作策略为第一操作策略时,通过操作器在领域知识图谱数据库中执行第一操作策略,
当目标操作策略为第二操作策略时,通过操作器在个人知识图谱数据库中执行第二操作策略,得到第三操作策略,通过操作器在领域知识图谱数据库中执行第三操作策略。
可选地,该方法还包括:
根据执行目标操作策略得到目标数据;
展示目标数据。
第二方面,本申请实施例提供了一种对话数据处理装置,应用于对话系统,对话系统中包括解释器、跟踪器、策略管理器和操作器,该装置包括:
接收提取模块,用于通过解释器接收当前文本,并提取当前文本中的关键信息,当前文本为根据接收到的用户数据生成的数据;
标记模块,用于通过跟踪器中预先定义的对话逻辑标记关键信息;
匹配模块,用于通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略;
执行模块,用于通过操作器在预设知识图谱数据库中执行目标操作策略。
第三方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如前面任一项的方法的步骤。
第四方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时执行如前面任一项的方法的步骤。
本申请实施例实施例提供的上述技术方案与现有技术相比具有如下优点:
本申请实施例通过解释器接收当前文本,并提取当前文本中的关键信息,当前文本为根据接收到的用户数据生成的数据;通过跟踪器中预先定义的对话逻辑标记关键信息;通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略;通过操作器在预设知识图谱数据库中执行目标操作策略。实现了将知识图谱、数据库和数据相结合,建立知识性的联系,加强了知识图谱数据库与数据之间的关联,在用户数据对应的关键信息不明确的时候也能推理出用户所需的数据,实现了精确和推理性的数据提取,且不需要大量逻辑判断,对话交互过程得到简化。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中对话数据处理系统的架构图;
图2为一个实施例中对话数据处理方法的流程示意图;
图3为一个实施例中对话数据处理装置的结构框图;
图4为一个实施例中对话数据处理系统的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为一个实施例中对话数据处理系统的架构图;参考图1,该对话数据处理系统包括前端界面层10、应用服务层20、对话系统层30、数据存储层40。
其中,前端界面层10包括搜索框、对话框,搜索框可以用于接收单次语音搜索或单次文本搜索,对话框可以用于接收多次来回对话的对话语音搜索或对话文本搜索,在该前端界面,用户可以选择是使用搜索框模式还是选择对话框模式。
应用服务层20包括接入服务模块、语音识别服务模块,接入服务用于接收前端界面层接收到的用户数据,语音识别服务用于识别用户数据是文本数据还是语音数据。
对话系统层30包括语义理解模块、对话管理模块、信息获取模块,语义理解模块可以用于通过自然语言处理技术对用户数据进行语义解析并提取关键信息,对话管理模块和信息获取模块可以用于根据关键信息获取操作策略,并根据操作策略从数据存储层40中获取目标数据。其中,数据存储层40包括领域知识图谱、领域数据库、历史交互数据知识图谱、历史交互数据数据库、用户信息知识图谱、用户信息数据库。
对话数据处理系统可以实现语音识别、解析,还可以实现逻辑推理、自动匹配、查询,存储有各种用户信息、所有用户的历史交互信息、各个领域的领域知识信息,用户信息包括年龄、性别、职业、爱好等,历史交互信息包括每个用户通过网络使用过的各种交互数据,领域知识信息包括图片资源、音乐资源、文字资源等各种资源信息。
在一个实施例中,整个对话数据处理系统可以为一个共享的搜索系统。数据处理系统用于根据用户数据进行目标数据的获取。对话数据处理系统可以与智能设备通信。设备可以是带有输入装置和显示装置的终端(例如:手机、平板、电脑、笔记本等等),设备也可以是带有输入装置和显示装置的智能电器(例如智能电视机、智能厨具等),输入装置用于接收用户输入的文本数据,显示装置用于显示对话数据处理系统返回的目标数据,显示的目标数据可以是图片、文字、视频、菜谱等可视化的内容。设备可以是带有语音采集装置和语音播放装置的终端(例如:手机、平板、电脑、笔记本等等),设备也可以是带有语音采集装置和语音播放装置智能电器(例如智能音箱、智能电视机),语音采集装置用于接收用户的语音数据,语音播放装置用于播放目标数据,播放的目标数据可以是音乐、天气播报、新闻等。设备还可以是带有语音采集装置和语音播放装置的智能家电,例如,智能冰箱、智能空调,用于根据目标数据执行对应的操作,此时,目标数据是一种控制指令,例如:调高温度、切换工作模式等等。
本申请采用多层微服务架构,分为4个层次:前端界面、应用服务、对话服务和数据存储。该架构可以让每一层服务独立运行,减少服务的耦合性,可以对每一层服务进行独立更新。将知识图谱与关系数据库相结合,实现泛领域精确搜索。语音对话与搜索相结合,实现多参数信息提取。
本申请的对话数据处理系统可以应用于对话交互任务,例如:语音导购、语音导厨、家庭机器人等场景。
图2为一个实施例中对话数据处理方法的流程示意图;参考图2,该方法包括以下步骤:
S100:通过解释器接收当前文本,并提取当前文本中的关键信息。
具体地,当前文本为根据接收到的用户数据生成的数据。解释器用于解析当前文本的含义,即提取出当前文本中的意图。当前文本可以是通过接收智能设备发送的用户数据获取到的。例如:可以是通过手机或平板等移动终端发送的用户数据,例如:“我要听张三的歌”、“我要看动画片”、“今天是什么天气”,也可以是通过智能音箱发送的用户数据,例如:“我要听李四的歌”,也可以是通过智能电视机发送的用户数据,例如:“我要看电影”。还可以是通过智能空调发送的用户数据,例如:“将空调调到不冷不热的温度”;可以是通过智能厨具发送的用户数据,例如:“将厨房燃气灶的火调至煲汤的火候”等。
从当前文本中可以解析出关键信息,例如“我要听张三的歌”可以解析出关键信息为“听”、“歌”、“张三”,这些关键信息组成意图。例如:“今天是什么天气”可以解析出关键信息为“今天”、“天气”,这些关键信息组成意图。关键信息表征了意图。
S200:通过跟踪器中预先定义的对话逻辑标记关键信息。
具体地,通过跟踪器中存储的当前文本的历史文本,和对话逻辑标记关键信息,其中,历史文本与当前文本为同一会话文本。
跟踪器存储有同一个会话中当前文本的历史文本,结合当前文本的历史文本可以跟踪当前文本的状态。跟踪器用于跟踪当前文本,获取当前文本的状态,并对当前文本进行标识和存储操作。定义的对话逻辑例如:听音乐的的对话逻辑是“play”。对话逻辑根据实际情况而定,没有什么限制。对话逻辑具体可以根据自然语言处理技术定义。
S300:通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略。
具体地,需要确定找到用户想要的目标数据的步骤。操作策略具体可以是通过哪些步骤来找到想要的目标数据。例如,在关键信息明确的时候,只通过一次搜索得到目标数据。在关键信息不明确时,不直接返回不精确的目标数据,重新询问用户以得到明确的关键信息,直到得到的关键信息明确为止,然后给出最终准确的目标数据;或者,在关键信息不明确时,不再重新询问用户以得到明确的关键信息,而是通过知识图谱数据库推理出目标数据。
S400:通过操作器在预设知识图谱数据库中执行目标操作策略。
具体地,知识图谱数据库可以是一个知识图谱与数据库结合的大数据存储区域,包含相互关联的用户信息集合、历史交互信息集合、领域知识集合。其中,用户信息集合存储在用户信息知识图谱和用户信息数据库中;历史交互信息集合存储在历史交互数据知识图谱和历史交互数据数据库中;领域知识集合存储在领域知识图谱和领域数据库中。当关键信息明确时,可以通过关键信息直接从领域知识集合中匹配到精确的目标数据;当关键信息不明确时,则需要结合用户信息和用户信息集合、历史交互信息集合、领域知识集合推理得到目标数据,也可以根据关键信息获取具有对话性质的响应结果,将该具有对话性质的响应结果返回给用户以引导用户表达出更加准确的关键信息,然后根据这个更准确的关键信息通过匹配得到精确的目标数据。操作器可以由用户自定义,主要是为响应指定关键信息和对话逻辑下的目标操作策略所对应的相关操作。操作器还用于将当前文本中携带的用户信息、关键信息、对应的目标操作策略等信息存储到知识图谱数据库中。还用于将标记的关键信息传回跟踪器中存储。
在一个具体实施例中,对话系统中包含多个解释器,对话系统中还包括模式选择器,该方法还包括:通过模式选择器接收原始文本,原始文本携带设备标识;根据设备标识确定对应的目标解释器;通过解释器接收当前文本,包括:通过目标解释器接收当前文本,当前文本为原始文本或原始文本的部分文本。
具体地,对话数据处理系统可以是一个共享的服务器,有各种设备可以与其进行交互,根据设备的种类可以设置对应的解释器,即一类设备共用一个解释器,不同类型的设备对应的解释器不同,使得解释器具有针对性,在对原始文本进行解析时更精准。具体可以通过原始文本携带的设备标识来匹配选择目标解释器。然后由目标解释器来接收当前文本。
在一个具体实施例中,对话系统中还包括数据接收器和语音识别网关,该方法还包括:通过数据接收器接收用户数据;当用户数据为语音数据时,通过语音识别网关对用户的语音数据进行识别,得到原始文本。
具体地,数据接收器依次通过语音识别网关、模式选择器与解释器连接。数据接收器用于接收用户数据,当用户数据为语音类型的数据时,用户数据的语言可能是汉语也可能是英语、法语、德语、日语、韩语等不同国家的语言,因此需要识别语言类型,然后根据具体的语言类型调用不同的语言数据库以将该用户数据转换为文本形式的原始文本。
在一个具体实施例中,对话系统中还包括数据类型判断器,该方法还包括:通过数据类型判断器判断用户数据的数据类型;当数据类型为文本类型时,将用户数据作为原始文本;当数据类型为语音类型时,进入通过语音识别网关对用户的语音数据进行识别,得到原始文本的步骤。
具体地,数据接收器依次通过数据类型判断器、语音识别网关、模式选择器与解释器连接。数据接收器还依次通过数据类型判断器、模式选择器与解释器连接。
数据类型判断器用于判断用户数据是文本类型数据还是语音类型数据。如果用户数据为文本类型的数据,则数据类型判断器直接将用户数据作为原始文本发送至模式选择器。如果用户数据为语音类型的数据,则数据类型判断器先将用户数据发送至语音识别网关,由语音识别网关将用户数据转换为文本形式的原始文本后发送至模式选择器。
在一个具体实施例中,预设知识图谱数据库包括领域知识图谱数据库和个人知识图谱数据库,目标操作策略为第一操作策略或第二操作策略。
具体地,领域知识图谱数据库包括:领域知识图谱、领域数据库,个人知识图谱数据库包括:相互关联的历史交互数据知识图谱、历史交互数据数据库、用户信息知识图谱、用户信息数据库。
第一操作策略为关键信息所表征的意图明确时执行的操作。第二操作策略为关键信息所表征的意图不明确时执行的操作。
步骤S400具体包括:
当目标操作策略为第一操作策略时,通过操作器在领域知识图谱数据库中执行第一操作策略,
当目标操作策略为第二操作策略时,通过操作器在个人知识图谱数据库中执行第二操作策略,得到第三操作策略,通过操作器在领域知识图谱数据库中执行第三操作策略。
具体地,操作器用于执行某个具体的应用操作。当关键信息明确时,通过操作器在领域知识图谱数据库中搜索与关键信息匹配的目标数据。例如:关键信息为“我要看西游记”,则在领域知识图谱数据库中搜索出“西游记”的相关视频数据。
例如,“我要听国歌”,则将国歌的音频数据搜索出来。
当关键信息不明确时,则通过操作器在个人知识图谱数据库中执行第二操作策略,第二操作策略具体为通过当前文本对应的用户信息与个人知识图谱数据库中的用户信息集合、历史交互信息集合通过推理得到第三操作策略。第三操作策略是通过推理得到明确的关键信息后执行的操作。此时,关键信息通过推导而明确,因此通过操作器可以在领域知识图谱数据库中搜索到与推理出的关键信息匹配的目标数据。具体地推理过程:可以从个人知识图谱数据库中获取用户的特征数据,用户的特征数据包括:年龄、性别、职业、爱好等,个人知识图谱数据库中还包括其他用户的特征数据,将此用户的特征数据与其他用户的特征数据进行匹配,可以获取到与此用户特征数据最接近的相似用户,相似用户在相同关键信息下关联的操作策略可以作为该用户对应的第三操作策略。
当然也可以根据用户的历史交互数据获取该用户的历史交互数据中最接近该关键信息的相似关键信息,将该相似关键信息对应的操作策略作为第三操作策略。例如:此次关键信息为“我要听张三的歌”,由于关键信息中意图不明确,可以将该用户历史交互数据中听的张三的歌推荐给该用户。具体可以根据将播放次数最多的那首张三的歌推荐给该用户。
在一个具体实施例中,该方法还包括:根据执行目标操作策略得到目标数据;展示目标数据。
具体地,得到目标数据后展示目标数据。目标数据可以是图片、文字、音乐、视频、天气播报等语音播报、新闻、指令等各种数据。
展示目标数据可以通过将目标数据发送至终端设备,由终端设备展示。例如:由设备将目标数据以语音形式或画面显示呈现给用户。
例如,“我要看西游记”,则将“西游记”的视频反馈给设备,由设备播放“西游记”视频给用户观看。
例如,“我要听国歌”,则将国歌的音频反馈给设备,由设备播放国歌给用户。
例如:“将空调调至不冷不热的温度”,根据解析得到不冷不热的温度是26摄氏度,则目标数据为控制指令,将控制指令下发至空调以控制空调将温度调节至26摄氏度。
在一个具体实施例中,用户可以选择搜索框来确定是单次语音搜索或单次文本搜索;也可以选择对话框来确定是接收多次来回对话的对话语音搜索或对话文本搜索。单次语音搜索和单次文本搜索可以是同一类搜索模式,对话语音搜索和对话文本搜索可以是同一类搜索模式。通过单次语音搜索或单次文本搜索实现的是单次搜索,即,接收用户数据后,系统直接根据用户数据得到目标数据返回给用户。通过对话语音搜索或对话文本搜索实现的是有问有答的双方对话搜索,可以多次接收用户数据,直至用户得到满意目标数据后不再唤醒设备或在连续时间内不再接收到用户数据或用户关闭搜索功能。
例如:用户数据为“我要听张三的A歌曲”,此时关键信息明确,只需要通过匹配查找到张三A歌曲的音频数据,并将张三的A歌曲的音频数据返回给用户即可。当用户数据为“我要听歌”,如果是单次语音搜索,则没有应答结果,只会给出通过通过推荐获取得到的目标数据。推荐获取具体可以是查找该用户的历史交互数据得到与关键信息最相近的目标数据,或,查找到该用户最相似的相似用户中关键信息最相近的目标数据。
例如:用户数据为“我要听歌”,如果是对话语音搜索和对话文本搜索,关键信息虽然是“听歌”,但是“歌”范围太广,造成搜索意图不明确,此时返回给用户的是应答结果,应答结果可以为:“您想听谁的歌”或“您想听什么类型的歌?”等等不局限于此。对这种关键信息或意图不明确,但是搜索范围太广的对话搜索或交互搜索,可以设置语义解析、对话规则,从而能获取对应的应答结果,引导用户将意图回答得更加明确,从而使最终的目标数据更加符合用户期望。当然,也可以模糊搜索,直接给出搜索结果,不再询问用户更详细的意图。
随着人工智能时代的到来,用户期望有更简单自然的方式进行交互,现有的对话交互无法进行精准搜索和推理功能。因此本申请技术基于对话系统基础功能,结合知识图谱技术,解决对话交互过程繁琐,用户无法快速找到满足需求等问题,提升语音对话交互体验。
图3为一个实施例中对话数据处理装置的结构框图;参考图3,该装置包括:
接收提取模块100,用于通过解释器接收当前文本,并提取当前文本中的关键信息,当前文本为根据接收到的用户数据生成的数据;
标记模块200,用于通过跟踪器中预先定义的对话逻辑标记关键信息;
匹配模块300,用于通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略;
执行模块400,用于通过操作器在预设知识图谱数据库中执行目标操作策略。
在一个具体实施例中,该对话系统中包含多个解释器,对话系统中还包括模式选择器,该装置还包括:
文本接收模块,用于通过模式选择器接收原始文本,原始文本携带设备标识;
选择模块,用于根据设备标识确定对应的目标解释器;
接收提取模块100具体用于通过目标解释器接收当前文本,当前文本为原始文本或原始文本的部分文本。
在一个具体实施例中,对话系统中还包括数据接收器和语音识别网关,该装置还包括:
用户数据接收模块,用于通过数据接收器接收用户数据;
转换模块,用于当用户数据为语音数据时,通过语音识别网关对用户的语音数据进行识别,得到原始文本。
在一个具体实施例中,对话系统中还包括数据类型判断器,该装置还包括:
判断模块,用于通过数据类型判断器判断用户数据的数据类型,当数据类型为文本类型时,将用户数据作为原始文本,当数据类型为语音类型时,进入转换模块。
在一个具体实施例中,标记模块200具体用于:通过跟踪器中存储的当前文本的历史文本,和对话逻辑标记关键信息,其中,历史文本与当前文本为同一会话文本。
在一个具体实施例中,预设知识图谱数据库包括领域知识图谱数据库和个人知识图谱数据库,目标操作策略为第一操作策略或第二操作策略,
执行模块400包括:
第一执行模块,用于当目标操作策略为第一操作策略时,通过操作器在领域知识图谱数据库中执行第一操作策略,
第二执行模块,用于当目标操作策略为第二操作策略时,通过操作器在个人知识图谱数据库中执行第二操作策略,得到第三操作策略,通过操作器在领域知识图谱数据库中执行第三操作策略。
在一个具体实施例中,该装置还包括:
数据展示模块,用于根据执行目标操作策略得到目标数据;展示目标数据。
图4为一个实施例中对话数据处理系统的结构框图;参考图4,该对话数据处理系统包括:用来进行数据处理的数据接收器、数据类型判断器、语音识别网关、模式选择器、解释器、跟踪器、策略管理器、操作器,还包括用来存储数据的领域知识图谱、领域数据库、历史交互数据知识图谱、历史交互数据数据库、用户信息知识图谱、用户信息数据库;其中,历史交互数据知识图谱、历史交互数据数据库、用户信息知识图谱、用户信息数据库构成个人知识图谱数据库。
本申请的方法也可以应用于终端设备,例如应用于手机中,手机接收用户数据,通过本申请的对话数据处理方法将搜索到的目标数据通过手机自身的相关模块以图片或视频或语音等各种形式展示给客户。例如:可以将用户想听的歌曲播放出来,将用户想看的影视通过视频播放出来,将用户想要浏览的网页显示出来等等。
本申请的方法也可以应用于智能家居中的智能家电、智能导购、智能导厨等,例如,应用于语音控制空调中,用户数据为语音类型数据,例如为“温度降低些”,空调返回的应答结果为“您想降低多少度”,用户再次返回用户数据为“降低1度”,空调自动在当前温度的基础上将温度降低1度。也可以是例如打开空调、调节温度、打开窗户、打开照明灯、调节亮度等等。
图5为一个实施例中计算机设备的内部结构图,参考图5,该计算机设备通过系统总线连接的处理器、存储器、网络接口、输入装置、语音装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现对话数据处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行对话数据处理方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。计算机设备的语音装置可以包括语音采集功能、语音处理功能、语音解析功能、语音转换功能。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的对话数据处理装置可以实现为一种计算机程序的形式,计算机程序可在如图5所示的计算机设备上运行。计算机设备的存储器中可存储组成该对话数据处理装置的各个程序模块,比如,图3所示的接收提取模块100、标记模块200、匹配模块300、执行模块400。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的对话数据处理中的步骤。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:通过解释器接收当前文本,并提取当前文本中的关键信息,当前文本为根据接收到的用户数据生成的数据;通过跟踪器中预先定义的对话逻辑标记关键信息;通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略;通过操作器在预设知识图谱数据库中执行目标操作策略。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:通过解释器接收当前文本,并提取当前文本中的关键信息,当前文本为根据接收到的用户数据生成的数据;通过跟踪器中预先定义的对话逻辑标记关键信息;通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略;通过操作器在预设知识图谱数据库中执行目标操作策略。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种对话数据处理方法,其特征在于,应用于对话系统,对话系统中包括解释器、跟踪器、策略管理器和操作器,方法包括:
通过解释器接收当前文本,并提取当前文本中的关键信息,当前文本为根据接收到的用户数据生成的数据,其中,所述对话系统为一个共享服务器,所述对话系统中包含多个解释器,不同类型的设备对应的解释器不同;
通过跟踪器中存储的当前文本的历史文本和对话逻辑,标记关键信息,其中,历史文本与当前文本为同一会话文本;
通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略;
通过操作器在预设知识图谱数据库中执行目标操作策略;
其中,通过操作器在预设知识图谱数据库中执行目标操作策略,包括:
当关键信息所表征的意图明确时,通过操作器在领域知识图谱数据库中执行第一操作策略,领域知识图谱数据库包括:领域知识图谱、领域数据库;
当关键信息所表征的意图不明确时,通过操作器在个人知识图谱数据库中执行第二操作策略,得到第三操作策略,通过操作器在领域知识图谱数据库中执行第三操作策略,其中,个人知识图谱数据库包括:相互关联的历史交互数据知识图谱、历史交互数据数据库、用户信息知识图谱、用户信息数据库;或
当关键信息所表征的意图不明确时,根据所述关键信息获取具有对话性质的响应结果,将所述响应结果返回给用户以引导用户表达出更加准确的关键信息,根据所述更加准确的关键信息通过匹配得到精确的目标数据;
其中,通过操作器在个人知识图谱数据库中执行第二操作策略,得到第三操作策略包括:当所述关键信息不明确时,从个人知识图谱数据库中获取用户的特征数据,将所述用户的特征数据与个人知识图谱数据库中其他用户的特征数据进行匹配,获取到与所述用户的特征数据最接近的相似用户,将所述相似用户在相同关键信息下关联的操作策略作为所述用户的第三操作策略。
2.根据权利要求1的方法,其特征在于,对话系统中包含多个解释器,对话系统中还包括模式选择器,方法还包括:
通过模式选择器接收原始文本,原始文本携带设备标识;
根据设备标识确定对应的目标解释器;
通过解释器接收当前文本,包括:通过目标解释器接收当前文本,当前文本为原始文本或原始文本的部分文本。
3.根据权利要求2的方法,其特征在于,对话系统中还包括数据接收器和语音识别网关,方法还包括:
通过数据接收器接收用户数据;
当用户数据为语音数据时,通过语音识别网关对用户的语音数据进行识别,得到原始文本。
4.根据权利要求3的方法,其特征在于,对话系统中还包括数据类型判断器,方法还包括:
通过数据类型判断器判断用户数据的数据类型;
当数据类型为文本类型时,将用户数据作为原始文本;
当数据类型为语音类型时,进入通过语音识别网关对用户的语音数据进行识别,得到原始文本的步骤。
5.根据权利要求1的方法,其特征在于,方法还包括:
根据执行目标操作策略得到目标数据;
展示目标数据。
6.一种对话数据处理装置,应用于对话系统,对话系统中包括解释器、跟踪器、策略管理器和操作器,其特征在于,装置包括:
接收提取模块,用于通过解释器接收当前文本,并提取当前文本中的关键信息,当前文本为根据接收到的用户数据生成的数据,其中,所述对话系统为一个共享服务器,所述对话系统中包含多个解释器,不同类型的设备对应的解释器不同;
标记模块,用于通过跟踪器中存储的当前文本的历史文本和对话逻辑,标记关键信息,其中,历史文本与当前文本为同一会话文本;
匹配模块,用于通过策略管理器对标记后的关键信息进行操作策略匹配,得到目标操作策略;
执行模块,用于通过操作器在预设知识图谱数据库中执行目标操作策略;
其中,所述执行模块用于:
当关键信息所表征的意图明确时,通过操作器在领域知识图谱数据库中执行第一操作策略,领域知识图谱数据库包括:领域知识图谱、领域数据库;
当关键信息所表征的意图不明确时,通过操作器在个人知识图谱数据库中执行第二操作策略,得到第三操作策略,通过操作器在领域知识图谱数据库中执行第三操作策略,其中,个人知识图谱数据库包括:相互关联的历史交互数据知识图谱、历史交互数据数据库、用户信息知识图谱、用户信息数据库;或
当关键信息所表征的意图不明确时,根据所述关键信息获取具有对话性质的响应结果,将所述响应结果返回给用户以引导用户表达出更加准确的关键信息,根据所述更加准确的关键信息通过匹配得到精确的目标数据;
所述执行模块具体用于:
当所述关键信息不明确时,从个人知识图谱数据库中获取用户的特征数据,将所述用户的特征数据与个人知识图谱数据库中其他用户的特征数据进行匹配,获取到与所述用户的特征数据最接近的相似用户,将所述相似用户在相同关键信息下关联的操作策略作为所述用户的第三操作策略。
7.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,计算机程序被处理器执行时,使得处理器执行如权利要求1-5任一项的方法的步骤。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,处理器执行程序时执行如权利要求1-5任一项的方法的步骤。
CN202010486061.9A 2020-06-01 2020-06-01 对话数据处理方法、装置、存储介质及计算机设备 Active CN111816173B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010486061.9A CN111816173B (zh) 2020-06-01 2020-06-01 对话数据处理方法、装置、存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010486061.9A CN111816173B (zh) 2020-06-01 2020-06-01 对话数据处理方法、装置、存储介质及计算机设备

Publications (2)

Publication Number Publication Date
CN111816173A CN111816173A (zh) 2020-10-23
CN111816173B true CN111816173B (zh) 2024-06-07

Family

ID=72848582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010486061.9A Active CN111816173B (zh) 2020-06-01 2020-06-01 对话数据处理方法、装置、存储介质及计算机设备

Country Status (1)

Country Link
CN (1) CN111816173B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732951A (zh) * 2020-12-30 2021-04-30 青岛海信智慧生活科技股份有限公司 一种人机交互的方法及装置
CN115114507A (zh) * 2021-03-17 2022-09-27 京东科技控股股份有限公司 推荐方法、装置、计算机设备和存储介质
CN113098699B (zh) * 2021-03-30 2023-03-07 四川巧夺天工信息安全智能设备有限公司 一种面向智能终端的用户信息分发及配对的方法
CN113688220B (zh) * 2021-09-02 2022-05-24 国家电网有限公司客户服务中心 一种基于语义理解的文本机器人对话方法及系统
CN114610856A (zh) * 2022-03-16 2022-06-10 零犀(北京)科技有限公司 一种基于因果图的对话交互智能决策方法及装置
CN115214703A (zh) * 2022-04-06 2022-10-21 长城汽车股份有限公司 一种车辆控制的方法及装置
CN115214696A (zh) * 2022-04-06 2022-10-21 长城汽车股份有限公司 一种车机虚拟形象交互方法、系统、车辆及存储介质
CN116701662A (zh) * 2023-08-07 2023-09-05 国网浙江浙电招标咨询有限公司 基于知识图谱的供应链数据管理方法、装置、设备及介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1313972A (zh) * 1998-08-24 2001-09-19 Bcl计算机有限公司 自适应的自然语言接口
CN105931638A (zh) * 2016-04-26 2016-09-07 北京光年无限科技有限公司 面向智能机器人的对话系统数据处理方法及装置
CN106228983A (zh) * 2016-08-23 2016-12-14 北京谛听机器人科技有限公司 一种人机自然语言交互中的场景处理方法及系统
CN107590120A (zh) * 2016-07-07 2018-01-16 深圳狗尾草智能科技有限公司 人工智能处理方法及装置
CN108197167A (zh) * 2017-12-18 2018-06-22 深圳前海微众银行股份有限公司 人机对话处理方法、设备及可读存储介质
CN108646918A (zh) * 2018-05-10 2018-10-12 北京光年无限科技有限公司 基于虚拟人的视觉交互方法及系统
CN109002510A (zh) * 2018-06-29 2018-12-14 北京百度网讯科技有限公司 一种对话处理方法、装置、设备和介质
CN109241250A (zh) * 2018-07-25 2019-01-18 南京瓦尔基里网络科技有限公司 一种策略规则对话推进以及意向判别方法及系统
CN110222162A (zh) * 2019-05-10 2019-09-10 天津中科智能识别产业技术研究院有限公司 一种基于自然语言处理和知识图谱的智能问答方法
CN110313154A (zh) * 2017-02-14 2019-10-08 微软技术许可有限责任公司 具有基于意图的信息辨析的智能助理
CN110556097A (zh) * 2018-06-01 2019-12-10 声音猎手公司 定制声学模型
CN110640764A (zh) * 2019-11-04 2020-01-03 卓谨信息科技(常州)有限公司 一种智能机器人控制系统及其工作方法
CN111026857A (zh) * 2019-12-10 2020-04-17 苏州思必驰信息科技有限公司 对话状态跟踪方法、人机对话方法及系统
CN111159371A (zh) * 2019-12-21 2020-05-15 华南理工大学 一种面向任务型对话系统的对话策略方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITTO20011035A1 (it) * 2001-10-30 2003-04-30 Loquendo Spa Metodo per la gestione di dialoghi persona-macchina ad iniziativa mista basato sull'interazione vocale.
US20180025726A1 (en) * 2016-07-22 2018-01-25 International Business Machines Corporation Creating coordinated multi-chatbots using natural dialogues by means of knowledge base

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1313972A (zh) * 1998-08-24 2001-09-19 Bcl计算机有限公司 自适应的自然语言接口
CN105931638A (zh) * 2016-04-26 2016-09-07 北京光年无限科技有限公司 面向智能机器人的对话系统数据处理方法及装置
CN107590120A (zh) * 2016-07-07 2018-01-16 深圳狗尾草智能科技有限公司 人工智能处理方法及装置
CN106228983A (zh) * 2016-08-23 2016-12-14 北京谛听机器人科技有限公司 一种人机自然语言交互中的场景处理方法及系统
CN110313154A (zh) * 2017-02-14 2019-10-08 微软技术许可有限责任公司 具有基于意图的信息辨析的智能助理
CN108197167A (zh) * 2017-12-18 2018-06-22 深圳前海微众银行股份有限公司 人机对话处理方法、设备及可读存储介质
CN108646918A (zh) * 2018-05-10 2018-10-12 北京光年无限科技有限公司 基于虚拟人的视觉交互方法及系统
CN110556097A (zh) * 2018-06-01 2019-12-10 声音猎手公司 定制声学模型
CN109002510A (zh) * 2018-06-29 2018-12-14 北京百度网讯科技有限公司 一种对话处理方法、装置、设备和介质
CN109241250A (zh) * 2018-07-25 2019-01-18 南京瓦尔基里网络科技有限公司 一种策略规则对话推进以及意向判别方法及系统
CN110222162A (zh) * 2019-05-10 2019-09-10 天津中科智能识别产业技术研究院有限公司 一种基于自然语言处理和知识图谱的智能问答方法
CN110640764A (zh) * 2019-11-04 2020-01-03 卓谨信息科技(常州)有限公司 一种智能机器人控制系统及其工作方法
CN111026857A (zh) * 2019-12-10 2020-04-17 苏州思必驰信息科技有限公司 对话状态跟踪方法、人机对话方法及系统
CN111159371A (zh) * 2019-12-21 2020-05-15 华南理工大学 一种面向任务型对话系统的对话策略方法

Also Published As

Publication number Publication date
CN111816173A (zh) 2020-10-23

Similar Documents

Publication Publication Date Title
CN111816173B (zh) 对话数据处理方法、装置、存储介质及计算机设备
US12475908B2 (en) Electronic device providing varying response based on contents included in input, and method and computer readable medium thereof
JP7574183B2 (ja) インタラクティブメッセージ処理方法、装置、コンピュータ機器及びコンピュータプログラム
JP7335062B2 (ja) 音声サービス提供方法および装置
US10922355B2 (en) Method and apparatus for recommending news
CN109325097B (zh) 一种语音引导方法及装置、电子设备、存储介质
KR102887671B1 (ko) 전자 장치, 시스템 및 음성 인식 서비스 이용 방법
KR102277300B1 (ko) 검색 서비스와 연결된 메시지 서비스를 위한 메시지 서비스 제공 방법 및 상기 메시지 서비스 제공 방법을 수행하는 메시지 서버 및 사용자 단말
CN110046227B (zh) 对话系统的配置方法、交互方法、装置、设备和存储介质
CN110797022A (zh) 一种应用控制方法、装置、终端和服务器
CN109165302A (zh) 多媒体文件推荐方法及装置
US9749699B2 (en) Display device, server device, voice input system and methods thereof
JPWO2015146017A1 (ja) 音声検索装置、音声検索方法、および表示装置
CN109600646B (zh) 语音定位的方法及装置、智能电视、存储介质
CN113407828B (zh) 一种搜索方法、装置和用于搜索的装置
CN109547840A (zh) 影视作品搜索引导方法、电视及计算机可读存储介质
US20190164541A1 (en) Real-time utterance verification system and method thereof
CN113938755A (zh) 服务器、终端设备以及资源推荐方法
CN111427444B (zh) 一种智能设备的控制方法和设备
CN112417095A (zh) 语音消息处理方法和装置
CN115862615B (zh) 一种显示设备、语音搜索方法及存储介质
CN114627864A (zh) 显示设备与语音交互方法
CN113254611B (zh) 提问推荐方法及装置、电子设备及存储介质
RU2571520C2 (ru) Устройство обработки изображений и соответствующий способ управления и система обработки изображений
CN110134850B (zh) 一种搜索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant