CN115168558A

CN115168558A - 一种实现多轮人机对话的方法

Info

Publication number: CN115168558A
Application number: CN202210845922.7A
Authority: CN
Inventors: 罗洪祥
Original assignee: Zhejiang Geely Holding Group Co Ltd; Zhejiang Zeekr Intelligent Technology Co Ltd
Current assignee: Zhejiang Geely Holding Group Co Ltd; Zhejiang Zeekr Intelligent Technology Co Ltd
Priority date: 2022-07-18
Filing date: 2022-07-18
Publication date: 2022-10-11

Abstract

本申请提供一种实现多轮人机对话的方法，该方法可以包括：获取当前一轮对话的输入信息；其中，在所述当前一轮对话为首轮对话的情况下，所述输入信息包括用户输入的初始问题和所述初始问题中包含的意图信息；确定所述初始问题的回复信息并返回至所述用户，以及在预设备选问题库所含的备选问题中查找与所述输入信息相匹配的关联问题；将查找到的关联问题输出至所述用户，以开展下一轮对话。通过本申请的技术方案，可以主动引导用户对话，增加对话轮数，增加对话的趣味性和智能性，并丰富用户的体验。

Description

一种实现多轮人机对话的方法

技术领域

本申请一个或多个实施例涉及人机交互领域，尤其涉及一种实现多轮人机对话的方法。

背景技术

自然语言处理(Natural Language Processing，NLP)是信息化时代一个重要的研究方向，简单来讲，就是为了让计算机能够理解人类语言。目前，人机交互方式越来越接近以视觉加自然语言为主。因为语言是人类最重要的信息输出方式，所以，以对话交互为核心的交互系统是人机交互的重要纽带和桥梁。

相关技术中，人机对话系统大多是单轮对话的形式，采用一问一答的方式去解决用户提出的问题。一方面，这种方式往往导致用户在得到第一轮回答之后不知道如何进一步提问，无法得到更多信息。另一方面，当用户陈述的问题不够具体或不够明确时，人机对话系统无法输出准确的答复信息，此时用户不知道该如何提问才能得到所需信息，使得用户对人机对话系统的体验感较差。

发明内容

本申请提供了一种实现多轮人机对话的方法，以解决相关技术中的不足。

根据本申请一个或多个实施例的第一方面，提供一种实现多轮人机对话的方法，该方法包括：

获取当前一轮对话的输入信息；其中，在所述当前一轮对话为首轮对话的情况下，所述输入信息包括用户输入的初始问题和所述初始问题中包含的意图信息；

确定所述初始问题的回复信息并返回至所述用户，以及在预设备选问题库所含的备选问题中查找与所述输入信息相匹配的关联问题；

将查找到的关联问题输出至所述用户，以开展下一轮对话。

可选的，在所述当前一轮对话为非首轮对话的情况下，所述输入信息包括：前一轮对话输出的关联问题、所述用户对所述前一轮对话输出的关联问题反馈的回复内容和所述回复内容包含的意图信息。

根据本申请一个或多个实施例的第二方面，提供一种实现多轮人机对话的装置，该装置包括：

获取单元，用于获取当前一轮对话的输入信息；其中，在所述当前一轮对话为首轮对话的情况下，所述输入信息包括用户输入的初始问题和所述初始问题中包含的意图信息；

查找单元，用于确定所述初始问题的回复信息并返回至所述用户，以及在预设备选问题库所含的备选问题中查找与所述输入信息相匹配的关联问题；

输出单元，用于将查找到的关联问题输出至所述用户，以开展下一轮对话。

根据本申请一个或多个实施例的第三方面，提供一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器通过运行所述可执行指令以实现如上述第一方面的实施例中所述的方法。

根据本申请一个或多个实施例的第四方面，提供一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现如上述第一方面的实施例中所述方法的步骤。

根据本申请一个或多个实施例的第五方面，提供一种车辆，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，该指令被处理器执行时实现如上述第一方面的实施例中所述方法的步骤。

由以上技术方案可见，本申请一个或多个实施例中，通过人机对话系统主动引导用户对话，可以增加对话轮数，增加对话的趣味性和智能性，并丰富用户的体验。一些情况下，用户可能对问题相关的领域不了解，主动发起多轮对话可以协助用户了解相关领域。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是根据本申请一示例性实施例提供的一种实现多轮人机对话的方法的流程图。

图2是根据本申请一示例性实施例提供的一种在预设备选问题库所含的备选问题中查找与输入信息相匹配的关联问题的方法的流程图。

图3是根据本申请一示例性实施例提供的一种特征提取模型的训练方法的流程图。

图4是根据本申请一示例性实施例提供的故事线连接图。

图5是根据本申请一示例性实施例提供的对话过程中每个故事线节点的详情介绍图。

图6是根据本申请一示例性实施例示出的一种电子设备的结构示意图。

图7是根据本申请一示例性实施例示出的一种实现多轮人机对话的装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请一个或多个实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请一个或多个实施例的一些方面相一致的装置和方法的例子。

需要说明的是：在其他实施例中并不一定按照本申请示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中，其方法所包括的步骤可以比本申请所描述的更多或更少。此外，本申请中所描述的单个步骤，在其他实施例中可能被分解为多个步骤进行描述；而本申请中所描述的多个步骤，在其他实施例中也可能被合并为单个步骤进行描述。

近年来，信息技术飞速发展，人机对话系统被广泛应用于各个领域。人机对话系统可以帮助用户快速查找信息以及解答疑问，极大地便利了人们的生活。目前，人机对话系统大多是单轮对话的形式，采用一问一答的方式去解决用户提出的问题。一方面，这种方式往往导致用户在得到第一轮回答之后不知道如何进一步提问，无法得到更多信息。另一方面，当用户陈述的问题不够具体或不够明确时，人机对话系统无法输出准确的答复信息，此时用户不知道该如何提问才能得到所需信息，使得用户对人机对话系统的体验感较差。

本申请提供一种实现多轮人机对话的方法，可以主动引导用户对话，增加对话轮数，增加人机对话系统的主动性和智能性，并丰富用户的体验。

图1是一示例性实施例提供的一种实现多轮人机对话的方法的流程图，如图1所示，该方法可以包括以下步骤：

S101：获取当前一轮对话的输入信息；其中，在当前一轮对话为首轮对话的情况下，所述输入信息包括用户输入的初始问题和所述初始问题中包含的意图信息；

在本实施例中，用户在首轮对话中输入的初始问题可以是不同领域里人机对话时各式各样的问题，本申请并不对此进行限制。比如，在汽车智能语音技术领域，用户输入的初始问题可以是“如何打开雨刮器”；在家庭智能语音技术领域，用户输入的初始问题可以是“今天天气怎么样”；在数字医疗智能语音技术领域，用户输入的初始问题可以是“入职体检有哪些套餐”。通常，对用户输入的初始问题的基本处理方法有分词、词性标注、语法分析、语义分析、实体抽取等技术，通过抽取关键词对用户输入的初始问题进行意图识别，获取初始问题中包含的意图信息。对用户输入的初始问题进行意图识别，可以使用BERT(Bidirectional Encoder Representations from Transformers，基于变换器的双向编码表征器)-CRF(Conditional Random Field，条件随机场)模型或RNN(Recurrent NeuralNetwork，循环神经网络)等模型，本申请并不对此进行限制。

举例而言，用户在清洗车辆时，对玻璃水产生兴趣，那么基于本申请的实施例，用户可以与车辆上装配的人机对话系统进行对话交互。用户在首轮对话输入的初始问题可以是：“什么是玻璃水”。通过BERT-CRF模型对“什么是玻璃水”这一初始问题进行意图识别，识别出该初始问题所包含的意图信息是“玻璃水”。用户输入的初始问题以及该初始问题所包含的意图信息组成了首轮对话的输入信息。

S102：确定所述初始问题的回复信息并返回至用户，以及在预设备选问题库所含的备选问题中查找与所述输入信息相匹配的关联问题。

人机对话系统的基本原理是基于自然语言处理技术、语音识别、语音合成等人工智能技术实现的一类产品，使得机器与用户之间实现交流，理解人类的表达从而实现机器与人的有效沟通。问答对话系统是基于信息检索的一种产品。问答对话系统在接收到用户输入的初始问题后，通过语音识别和文本理解两个步骤，将用户输入的初始问题转化为有结构的表达方式，然后在系统存储的知识库中检索初始问题的答案，并将检索到的答案输出返回至用户。

结合上文所述的实施例，人机对话系统可以基于用户输入的初始问题“什么是玻璃水”以及识别出的意图信息“玻璃水”在系统存储的知识库中检索与玻璃水相关的答案，并将检索到的答案“玻璃水是汽车挡风玻璃清洗液的俗称，又称雨刮水”返回至用户，实现对用户当前一轮输入问题的回复。

在检索用户初始问题的答案的同时，系统会在预设备选问题库所含的备选问题中查找与用户当前一轮对话的输入信息相匹配的关联问题。通过计算输入信息与预设备选问题库中所有备选问题的相似度，输出相似度最高的备选问题为与输入信息相匹配的关联问题。具体可以参见图2。

S103，将查找到的关联问题输出至用户，以开展下一轮对话。

将查找到的关联问题输出至用户，根据用户对该关联问题反馈的回复内容，识别出用户回复内容所包含的意图信息，从而开展下一轮对话。在用户当前一轮对话为非首轮对话的情况下，用户的输入信息包括：前一轮对话输出的关联问题、用户对前一轮对话输出的关联问题反馈的回复内容和该回复内容包含的意图信息。

结合上文所述实施例，根据用户首轮的输入信息，在预设备选问题库所含的备选问题中查找到与首轮输入信息相匹配的关联问题为“是否需要为您介绍玻璃水如何添加”。

在一实施例中，用户对于“是否需要为您介绍玻璃水如何添加”这一关联问题的回复是“好的”或者“需要”等类似的肯定回答，识别出用户当前的意图是肯定意图。将该关联问题、用户对该关联问题反馈的回复内容和回复内容所包含的意图信息共同组成用户当前一轮对话的输入信息。获取到该输入信息之后，可以在人机对话系统存储的知识库中检索“如何添加玻璃水”的相关信息，输出“打开引擎盖，找到玻璃水的添加口，大多数车的喷水壶都在发动机舱右边，直接往里面倒入即可”这一回复信息返回至用户。同时，将用户当前一轮对话的输入信息输入预先训练得到的特征提取模型，通过计算输入信息与预设备选问题库中所有备选问题的相似度，匹配得到相似度最高的新关联问题为“是否需要为您查询玻璃水还有多少”。将新关联问题输出至用户，以开展下一轮对话。

在一实施例中，用户对于输出的关联问题“是否需要为您介绍玻璃水如何添加”的回复是“不用”或者“不需要”等类似的否定回答，识别出用户当前的意图是否定意图，则无需检索该关联问题的回复信息，与上一实施例类似，将前一轮对话输出的关联问题、用户对该关联问题的回复以及回复内容所包含的意图信息作为用户当前一轮对话的输入信息输入前述特征提取模型，匹配得到相似度最高的新关联问题可以是“感谢您的回答，请问还有其他想要了解的问题吗”等类似的问题。将新关联问题输出至用户，以开展下一轮对话。

在一实施例中，用户对于输出的关联问题“是否需要为您介绍玻璃水如何添加”的回复还可以是“能不能说得更清楚一点”或者“行不行”等类似的疑惑回答，识别出用户当前的意图是疑惑意图。与上述实施例类似，此时不需要检索该关联问题的回复信息，可以将前一轮对话输出的关联问题、用户对该关联问题的回复以及回复内容所包含的意图信息作为用户当前一轮对话的输入信息输入前述特征提取模型。通过相似度匹配得到相似度最高的新关联问题和输入的关联问题一致，为“是否需要为您介绍玻璃水如何添加”。将新关联问题输出至用户，以开展下一轮对话。

在另一实施例中，用户对于输出的关联问题“是否需要为您介绍玻璃水如何添加”的回复还可以是“还有其他信息吗”等类似的其他回答，识别出用户当前的意图是其他意图。与上述实施例类似，此时不需要检索该关联问题的回复信息，可以将用户当前一轮对话的输入信息输入前述特征提取模型。通过相似度匹配得到相似度最高的新关联问题为与“玻璃水”无关的新话题，比如“洗车有哪些步骤”等问题。将新关联问题输出至用户，以开展下一轮对话。

当用户对前一轮对话输出的关联问题如“感谢您的提问，请问还有其他想要了解的问题吗”等类似问题进行否定回答时，结束本次人机交互对话。

针对上述步骤S102，本申请还提供一种在预设备选问题库所含的备选问题中查找与输入信息相匹配的关联问题的方法的流程图，具体可以参见图2，该方法可以包括以下步骤：

S201，将输入信息输入预先训练得到的特征提取模型，并得到该特征提取模型输出的对应于输入信息的输入信息特征向量。

系统可以基于用户当前一轮对话的输入信息生成对应的输入信息特征向量，通过将输入信息特征向量与预设备选问题库中所有备选问题对应的备选问题特征向量做相似度匹配，输出相似度最高的备选问题特征向量对应的备选问题为关联问题。生成输入信息特征向量和备选问题特征向量的方式，可以采用TF-IDF(Term Frequency–InverseDocument Frequency，词频-逆向文件频率)、LSTM(Long Short-Term Memory，长短期记忆网络)+余弦距离或BERT等模型，本申请并不对此进行限制。

在一实施例中，可以采用BERT模型作为特征提取模型。将用户当前一轮对话的输入信息输入预先训练得到的特征提取模型，可以对输入信息进行分词，并对得到的词进行编码实现向量转换，生成相应的输入信息特征向量。在一实施例中，特征提取模型可以部署在装配有人机对话系统的设备本地，当前设备接收到用户的输入信息后，在本地完成特征提取、生成输入信息特征向量。

在另一实施例中，特征提取模型也可以部署在云端，在当前设备接收到用户的输入信息之后，将输入信息上传至云端，由云端基于特征提取模型生成输入信息特征向量。

S202，分别计算输入信息特征向量与预设备选问题库中所有备选问题对应的备选问题特征向量之间的相似度，所述备选问题特征向量由前述特征提取模型对所有备选问题进行特征提取得到。

在一实施例中，可以通过前述特征提取模型生成预设备选问题库中所有备选问题对应的备选问题特征向量。其中，备选问题特征向量可以是在用户当前一轮对话开始前预先通过特征提取模型生成的，并将得到的备选问题特征向量存储在装配有人机对话系统的设备本地，或者可以选择将得到的备选问题特征向量存储在云端。当用户发起对话时，由当前装配有人机对话系统的设备从云端临时获得备选问题特征向量。当然，备选问题特征向量也可以是在用户发起对话后临时生成的。本申请并不对此进行限制。

得到特征提取模型输出的对应输入信息的输入信息特征向量之后，分别计算输入信息特征向量与预设备选问题库中所有备选问题对应的备选问题特征向量之间的相似度。在一实施例中，可以通过计算输入信息特征向量与所有备选问题对应的备选问题特征向量之间的点积相似度，来查找与输入信息特征向量相似度最高的备选问题特征向量。点积运算就是计算两个向量之间的夹角大小。当计算出某个备选问题特征向量与输入信息特征向量之间的点积值最大时，说明这两个向量之间的夹角最小，即两个向量最接近，也就是说该备选问题特征向量与输入信息特征向量的相似度最高。

结合上文的实施例，用户当前一轮对话的输入信息包括输入的初始问题“什么是玻璃水”以及初始问题包含的意图信息“玻璃水”，通过计算该输入信息对应的输入信息特征向量与所有备选问题特征向量之间的相似度，可以从预设的备选问题库中查找到相似度最高的备选问题特征向量对应的备选问题是“是否需要为您介绍玻璃水如何添加”。

S203，将相似度最高的备选问题特征向量对应的备选问题确定为关联问题。

由于选择的是与输入信息特征向量相似度最高的备选问题特征向量，因此该备选问题特征向量对应的备选问题与输入信息的关联程度最大，也就是说用户对该备选问题感兴趣的可能性最大，所以可以把该备选问题确定为与输入信息相匹配的关联问题。

针对前述的特征提取模型，本申请还提出了相应的模型训练方案，下面结合图3进行具体介绍。

图3是一示例性实施例提供的一种特征提取模型的训练方法的流程图。如图3所示，该方法可以包括以下步骤：

S301，获取训练样本集，所述训练样本集包括对话样本和样本问题库，且每一对话样本包括：各轮对话的样本输入信息和每轮对话输出的实际关联问题；其中，首轮对话的样本输入信息包括用户输入的样本初始问题和样本初始问题中包含的意图信息，非首轮对话的样本输入信息包括前一轮对话输出的实际关联问题、用户对前一轮对话输出的实际关联问题反馈的回复内容和回复内容包含的意图信息。

在一实施例中，训练样本集可以通过先获取预设数据集，再根据预先配置的样本生成模板，对获取的预设数据集进行转换来获取。而预设数据集可以包括：预先配置的样本备选问题、各个样本备选问题分别对应的实际关联问题以及各个样本备选问题之间的跳转关系。其中，跳转关系用于指示：根据对任一样本备选问题的回复内容所表达的意图，输出所述任一样本备选问题的答案或跳转至另一样本备选问题，以作为对所述回复内容的回应。

举例而言，预先配置的样本备选问题可以是“什么是玻璃水”、“玻璃水如何添加”、“玻璃水促销活动”、“查询玻璃水余量”、“在线下单购买玻璃水”、“播放音乐”等问题。然后，预先配置“什么是玻璃水”这一样本备选问题对应的实际关联问题是“玻璃水如何添加”的概率为0.8，配置“什么是玻璃水”这一样本备选问题对应的实际关联问题是“玻璃水促销活动”的概率为0.2。对于每一个实际关联问题，人机对话系统都会通过询问的方式向用户确定是否对这个问题感兴趣，因此，配置样本备选问题与实际关联问题之间的概率越大，表明用户对该实际关联问题感兴趣的可能性越大。同样的，配置“玻璃水如何添加”这一样本备选问题对应的实际关联问题是“查询玻璃水余量”，配置“玻璃水促销活动”对应的实际关联问题是“在线下单购买玻璃水”。通过前述配置，可以生成多条流水线式故事线，如图4所示。

图5是对话过程中每个故事线节点的详情介绍图，其中，每个节点对应一个样本备选问题，播放话术指的是以询问的方式输出实际关联问题，以确定用户是否对该实际关联问题感兴趣。通过用户对实际关联问题的反馈进行肯定、否定、疑惑、其他等四个意图的判断，基于该意图判断建立各个样本备选问题之间的跳转关系。举例而言，当前节点名称为“什么是玻璃水”，播放话术为“是否需要为您介绍玻璃水如何添加”，若意图为肯定，则跳转前往至如何添加玻璃水的教程。

在获取预设数据集之后，根据预先配置的样本生成模板，对预设数据集进行转换生成训练样本集。结合上文的实施例，对预设数据集进行转换生成的训练样本可以是：

用户：什么是玻璃水？

系统：玻璃水是汽车挡风玻璃清洗液的俗称，又称雨刮水。

系统：是否需要为您介绍玻璃水如何添加？

用户：好的(肯定意图)。

系统：打开引擎盖，找到玻璃水的添加口，大多数车的喷水壶都在发动机舱右边，直接往里面倒入即可。

系统：是否需要为您查询玻璃水还有多少？

用户：不需要(否定意图)。

系统：感谢您的回答，请问还有其他想要了解的问题吗？

用户：还有其他功能可以介绍吗(其他意图)？

系统：是否需要为您介绍行车记录仪？

用户：不需要(否定意图)。

系统：感谢您的反馈，本次服务结束。

S302，将训练样本集输入待训练模型进行迭代训练。当采用任一对话样本进行迭代训练时，该任一对话样本中的任一轮对话对应的迭代训练过程包括：获取待训练模型针对任一轮对话的样本输入信息所输出的样本输入信息特征向量；计算样本输入信息特征向量与样本问题库中的样本备选问题对应的样本备选问题特征向量之间的相似度；其中，样本备选问题特征向量由待训练模型对相应的样本备选问题进行特征提取得到。

在一实施例中，可以采用损失函数(loss function)计算样本输入信息特征向量与样本问题库中的样本备选问题对应的样本备选问题特征向量之间的相似度。损失函数通常用来评价模型的预测值与真实值不一样的程度，有log对数损失函数、平方损失函数、指数损失函数等等分类。计算出的损失值越小，说明预测值与真实值的相似度越高。在本实施例中，为了便于后续描述，这里将样本问题库中除任一对话样本中记录的当前一轮对话的实际关联问题外的其他样本备选问题特征向量称为负样本集。计算损失值的原理具体如公式(1)所示：

其中，L_dialogue表征损失值。S⁺表征样本输入信息特征向量与任一对话样本中记录的当前一轮对话的实际关联问题对应的样本备选问题特征向量之间的相似度，S-表征样本输入信息特征向量与负样本集之间的相似度。Ω^-表征取负样本集的和，<.>表征对话中所有时间步的平均值。由公式可知，当计算出的L_dialogue越小，表明样本输入信息特征向量与任一对话样本中记录的当前一轮对话的实际关联问题对应的样本备选问题特征向量之间的相似度越大，且该样本输入信息特征向量与负样本集的相似度越小。

S303，根据相似度对待训练模型进行优化，直至迭代次数达到次数上限或损失函数收敛，将训练完成的模型作为特征提取模型。

通过多次迭代训练后，当待训练模型满足迭代次数达到次数上限或损失函数收敛时，将训练完成的模型作为特征提取模型，并可以用于实现如图1所示的多轮人机对话方法。其中，损失函数的收敛条件为：样本输入信息特征向量与任一对话样本中记录的当前一轮对话的实际关联问题对应的样本备选问题特征向量之间的相似度最大化，且该样本输入信息特征向量与样本问题库中的其他样本备选问题对应的样本备选问题特征向量之间的相似度最小化。

与上述方法实施例相对应，本申请还提供了一种装置的实施例。

图6是根据本申请一示例性实施例示出的一种电子设备的结构示意图。参考图6，在硬件层面，该电子设备包括处理器602、内部总线604、网络接口606、内存608以及非易失性存储器610，当然还可能包括其他业务所需要的硬件。处理器602从非易失性存储器610中读取对应的计算机程序到内存608中然后运行。当然，除了软件实现方式之外，本申请并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

图7是根据本申请一示例性实施例示出的一种实现多轮人机对话的装置的框图。参照图7，该装置包括获取单元702、查找单元704、输出单元706，其中：

获取单元702，被配置为获取当前一轮对话的输入信息；其中，在所述当前一轮对话为首轮对话的情况下，所述输入信息包括用户输入的初始问题和所述初始问题中包含的意图信息。

查找单元704，被配置为确定所述初始问题的回复信息并返回至所述用户，以及在预设备选问题库所含的备选问题中查找与所述输入信息相匹配的关联问题。

输出单元706，被配置为将查找到的关联问题输出至所述用户，以开展下一轮对话。

可选的，所述获取单元702还被配置为在所述当前一轮对话为非首轮对话的情况下，获取当前一轮对话的输入信息包括：前一轮对话输出的关联问题、所述用户对所述前一轮对话输出的关联问题反馈的回复内容和所述回复内容包含的意图信息。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

1.一种实现多轮人机对话的方法，其特征在于，该方法包括：

将查找到的关联问题输出至所述用户，以开展下一轮对话。

2.根据权利要求1所述的方法，其特征在于，在所述当前一轮对话为非首轮对话的情况下，所述输入信息包括：

前一轮对话输出的关联问题、所述用户对所述前一轮对话输出的关联问题反馈的回复内容和所述回复内容包含的意图信息。

3.根据权利要求1或2所述的方法，其特征在于，所述在预设备选问题库所含的备选问题中查找与所述输入信息相匹配的关联问题，包括：

将所述输入信息输入预先训练得到的特征提取模型，并得到所述特征提取模型输出的对应于所述输入信息的输入信息特征向量；

分别计算所述输入信息特征向量与所述问题库中所有备选问题对应的备选问题特征向量之间的相似度，所述备选问题特征向量由所述特征提取模型对所述所有备选问题进行特征提取得到；

将相似度最高的备选问题特征向量对应的备选问题确定为所述关联问题。

4.根据权利要求3所述的方法，其特征在于，所述特征提取模型通过如下方式训练得到：

获取训练样本集，所述训练样本集包括对话样本和样本问题库，且每一对话样本包括：各轮对话的样本输入信息和每轮对话输出的实际关联问题；其中，首轮对话的样本输入信息包括用户输入的样本初始问题和所述样本初始问题中包含的意图信息，非首轮对话的样本输入信息包括前一轮对话输出的实际关联问题、所述用户对所述前一轮对话输出的实际关联问题反馈的回复内容和所述回复内容包含的意图信息；

将所述训练样本集输入待训练模型进行迭代训练，直至迭代次数达到次数上限或损失函数收敛，将训练完成的模型作为所述特征提取模型；其中，当采用任一对话样本进行迭代训练时，该任一对话样本中的任一轮对话对应的迭代训练过程包括：

获取所述待训练模型针对所述任一轮对话的样本输入信息所输出的样本输入信息特征向量；

计算所述样本输入信息特征向量与所述样本问题库中的样本备选问题对应的样本备选问题特征向量之间的相似度；其中，所述样本备选问题特征向量由所述待训练模型对相应的样本备选问题进行特征提取得到；

根据所述相似度对所述待训练模型进行优化；其中，所述损失函数的收敛条件为：所述样本输入信息特征向量与所述任一对话样本中记录的当前一轮对话的实际关联问题对应的样本备选问题特征向量之间的相似度最大化，且所述样本输入信息特征向量与所述样本问题库中的其他样本备选问题对应的样本备选问题特征向量之间的相似度最小化。

5.根据权利要求4所述的方法，其特征在于，所述获取训练样本集，包括：

获取预设数据集，所述预设数据集包括：预先配置的样本备选问题、各个样本备选问题分别对应的实际关联问题以及各个样本备选问题之间的跳转关系，所述跳转关系用于指示：根据对任一样本备选问题的回复内容所表达的意图，输出所述任一样本备选问题的答案或跳转至另一样本备选问题，以作为对所述回复内容的回应；

根据预先配置的样本生成模板，对所述预设数据集进行转换，生成所述训练样本集。

6.一种实现多轮人机对话的装置，其特征在于，该装置包括：

7.根据权利要求6所述的装置，其特征在于，在所述当前一轮对话为非首轮对话的情况下，所述输入信息包括：

8.一种电子设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器通过运行所述可执行指令以实现如权利要求1-5中任一项所述的方法。

9.一种计算机可读存储介质，其上存储有计算机指令，其特征在于，该指令被处理器执行时实现如权利要求1-5中任一项所述方法的步骤。

10.一种车辆，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，其特征在于，所述处理器执行所述指令时实现如权利要求1-5中任一项所述方法的步骤。