[go: up one dir, main page]

CN118897886B - 基于特定领域知识图谱的问答方法、系统、设备及介质 - Google Patents

基于特定领域知识图谱的问答方法、系统、设备及介质 Download PDF

Info

Publication number
CN118897886B
CN118897886B CN202411388659.9A CN202411388659A CN118897886B CN 118897886 B CN118897886 B CN 118897886B CN 202411388659 A CN202411388659 A CN 202411388659A CN 118897886 B CN118897886 B CN 118897886B
Authority
CN
China
Prior art keywords
relationship
path
question
knowledge
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202411388659.9A
Other languages
English (en)
Other versions
CN118897886A (zh
Inventor
谭子豪
朱文彬
陈清亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN202411388659.9A priority Critical patent/CN118897886B/zh
Publication of CN118897886A publication Critical patent/CN118897886A/zh
Application granted granted Critical
Publication of CN118897886B publication Critical patent/CN118897886B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于特定领域知识图谱的问答方法、系统、设备及介质,所述方法包括:获取目标领域的数据并构建知识图谱;获取用户输入的问题,对问题进行多跳次数预测;若跳数不为零,则基于知识图谱与跳数,预测问题对应的关系路径,以构建问题的初始推理链路径;根据预设的过滤规则对初始推理链路径进行修正,并转换为自然语言形式,得到最终的推理链路径;获取预设的多个指令,分别将每一指令与推理链路径以及问题进行拼接,并根据拼接数据生成多个候选回答;其中不同指令设置有不同的具体内容,指令均用于关联问答与推理链路径;对候选回答进行投票,将票数最多的回答返回给用户。本发明提升了特定领域问答的准确性与全面性。

Description

基于特定领域知识图谱的问答方法、系统、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于特定领域知识图谱的问答方法、系统、设备及介质。
背景技术
近年来,大语言模型(LLM)已在问答和推理任务中展现出卓越的性能,其应用范围已扩展至金融、法律、医学等特定领域。然而,由于LLM通常缺乏特定领域的知识,在问答系统中可能会反馈给提问的用户误导性、错误的信息。现有技术一般通过将特定领域的知识图谱与LLM结合,从而构建能够解答特定领域问题的问答系统。但由于开放域训练的LLM难以直接迁移到特定领域,以及目前问答系统对需要多跳推理的问题的处理不够完善,现有问答系统生成回答的准确性与全面性较差。
发明内容
为解决以上技术问题,本发明提供了一种基于特定领域知识图谱的问答方法、系统、设备及介质,提升了特定领域问答的准确性与全面性。
本发明实施例提供了一种基于特定领域知识图谱的问答方法,包括:
获取目标领域的数据并构建知识图谱;
获取用户输入的问题,对所述问题在所述知识图谱上的多跳次数进行预测,得到对应的跳数;
若所述跳数不为零,则基于所述知识图谱与所述跳数,预测所述问题对应的关系路径,以构建所述问题的初始推理链路径;
根据预设的过滤规则,对所述初始推理链路径进行修正,并将修正后的初始推理链路径转换为自然语言形式,得到最终的推理链路径;
获取预设的多个指令,分别将每一指令与所述推理链路径以及所述问题进行拼接,得到多个拼接数据,并根据所述拼接数据生成多个候选回答;其中,不同指令设置有不同的具体内容,所述指令均用于关联问答与所述推理链路径;
对所述多个候选回答进行投票,将投票数量最多的候选回答作为所述问题的回答返回给用户。
作为上述方案的改进,所述获取目标领域的数据并构建知识图谱,包括:
获取目标领域的数据,并对所述目标领域的数据进行数据清洗与文本长度标准化处理,获得第一数据集;
从所述第一数据集中抽取若干数据,作为第二数据集;初步提取所述第二数据集中的知识三元组,得到第一知识三元组集,以对所述第一知识三元组集进行检查与补充,得到第一训练数据集;其中,所述知识三元组由头实体、关系、尾实体组成;
基于所述第一训练数据集,对基本的大语言模型进行微调,得到知识提取模型;
将所述第一数据集输入所述知识提取模型,得到所述第一数据集对应的第二知识三元组集;根据预设规则,剔除所述第二知识三元组集中的错误信息,得到第三知识三元组集;在所述第三知识三元组集中筛选出概念相同的实体,并将所述概念相同的实体对应的知识三元组合并,得到第四知识三元组集,形成目标领域的知识图谱。
作为上述方案的改进,所述对所述问题在所述知识图谱上的多跳次数进行预测,得到对应的跳数,包括:
将所述问题输入预设的跳数预测模型,得到模型输出的跳数的置信度分布,将该置信度分布中置信度最大值对应的跳数作为所述问题对应的跳数;
其中,所述跳数预测模型的训练方法包括:
获取与所述目标领域无关的若干第一问题及其跳数标签,以及与所述目标领域相关的若干第二问题及其跳数标签,构成第二训练数据集;其中,所述第一问题的跳数标签均为0;
获取预训练的BERT模型,基于所述第二训练数据集,对所述BERT模型进行二次训练,得到所述跳数预测模型。
作为上述方案的改进,所述基于所述知识图谱与所述跳数,预测所述问题对应的关系路径,以构建所述问题的初始推理链路径,包括:
提取所述问题中的实体,得到问题实体;
将所述跳数作为关系路径的预测轮次,对所述问题对应的关系路径进行若干轮预测,得到最后轮次的关系路径集合;在每轮预测中,将上一轮获得的关系路径集合中的每一关系路径分别与所述问题实体进行拼接得到若干个输入数据,将所述输入数据分别输入基于所述知识图谱的关系预测模型进行实体间的关系预测,分别得到对应的关系集合;将每一关系集合中的每一关系分别拼接到所述关系集合对应的上一轮的关系路径后,得到当前轮次的关系路径集合;其中,在第一轮预测时,所述关系预测模型的输入为所述问题与所述问题实体的拼接数据;
对所述最后轮次的关系路径集合进行关系路径的数量优化,得到优化的关系路径集合;
根据所述问题实体以及所述优化的关系路径集合中的每一关系路径,在所述知识图谱中查询并提取对应的知识三元组,构建每一关系路径对应的由若干知识三元组组成的初始推理链路径。
作为上述方案的改进,所述将所述输入数据分别输入基于所述知识图谱的关系预测模型进行实体间的关系预测,分别得到对应的关系集合,包括:
将所述输入数据分别输入基于所述知识图谱的关系预测模型,分别得到模型输出的在所述输入数据的条件下所述知识图谱中所有关系的置信度分布,并选取该置信度分布中大于预设阈值的若干个置信度对应的关系,得到所述输入数据对应的关系集合;
则所述对所述最后轮次的关系路径集合进行关系路径的数量优化,得到优化的关系路径集合,包括:
在所述最后轮次的关系路径集合中,根据每一关系路径所包含的关系的置信度,计算得到所述关系路径的得分;
按所述得分从高到低的顺序选取预设数量的关系路径,得到优化的关系路径集合。
作为上述方案的改进,所述预设的过滤规则包括:
筛选并删除所述初始推理链路径中存在实体缺失的知识三元组所在的路径;
筛选并删除所述初始推理链路径中的重复路径。
作为上述方案的改进,所述根据所述拼接数据生成多个候选回答,包括:
分别将每一拼接数据输入预设的大语言模型,得到每一拼接数据对应的候选回答;
其中,所述预设的大语言模型的训练方法包括:
获取若干第三问题及其答案标签,以及所述第三问题对应的历史推理链路径;
获取所述预设的多个指令,分别将每一指令、所述第三问题以及对应的所述历史推理链路径进行拼接并作为第三训练数据,得到第三训练数据集;
基于所述第三训练数据集,对基本的大语言模型进行微调,得到所述预设的大语言模型。
本发明实施例还提供了一种基于特定领域知识图谱的问答系统,包括:
知识图谱构建模块,用于获取目标领域的数据并构建知识图谱;
多跳次数预测模块,用于获取用户输入的问题,对所述问题在所述知识图谱上的多跳次数进行预测,得到对应的跳数;
推理路径构建模块,用于若所述跳数不为零,则基于所述知识图谱与所述跳数,预测所述问题对应的关系路径,以构建所述问题的初始推理链路径;
推理路径优化模块,用于根据预设的过滤规则,对所述初始推理链路径进行修正,并将修正后的初始推理链路径转换为自然语言形式,得到最终的推理链路径;
候选回答生成模块,用于获取预设的多个指令,分别将每一指令与所述推理链路径以及所述问题进行拼接,得到多个拼接数据,并根据所述拼接数据生成多个候选回答;其中,不同指令设置有不同的具体内容,所述指令均用于关联问答与所述推理链路径;
问题回答输出模块,用于对所述多个候选回答进行投票,将投票数量最多的候选回答作为所述问题的回答返回给用户。
本发明实施例还提供了一种基于特定领域知识图谱的问答设备,包括处理器和存储器,所述存储器中存储有计算机程序,且所述计算机程序被配置为由所述处理器执行,所述处理器执行所述计算机程序时实现上述任一项所述的基于特定领域知识图谱的问答方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任一项所述的基于特定领域知识图谱的问答方法。
相对于现有技术,本发明实施例提供的一种基于特定领域知识图谱的问答方法、系统、设备及介质的有益效果在于:
通过构建目标领域的知识图谱,先对用户输入的问题进行多跳次数预测与关系路径预测,以构建推理链路径,再根据推理链路径、问题以及多个指令生成多个候选回答,进而投票选出最终的回答返回给用户,增强了模型输出的稳健性,实现了更准确的特定领域知识问答;在构建目标领域的知识图谱时,通过先抽取一部分数据并提取其知识三元组,再进一步补全该知识三元组后用于大语言模型微调,从而获得提取能力更强的知识提取模型来提取知识三元组,以构建更完整全面的知识图谱;通过训练跳数预测模型以及关系预测模型,能够根据前面的多跳关系预测下一跳的关系进而形成关系路径集合以及推理链路径,引入了链式推理机制,增强了处理多跳问题的能力,提高了问答的准确性与全面性;通过采用多个指令对模型进行微调,使LLM能够更好地适应特定领域的知识图谱,提升了模型对特定领域知识图谱的学习理解能力。本发明实施例能够自动从目标领域的知识图谱中提取较为全面的知识,提升了效率,能够增强LLM对特定领域知识图谱的适应能力,提升了特定领域知识问答的全面性与准确性。
附图说明
图1是本发明实施例提供的一种基于特定领域知识图谱的问答方法的流程示意图;
图2是本发明实施例提供的一种基于特定领域知识图谱的问答方法中构建知识图谱的流程示意图;
图3是本发明实施例提供的一种基于特定领域知识图谱的问答方法中构建推理链路径的流程示意图;
图4是本发明实施例提供的一种基于特定领域知识图谱的问答方法中生成回答的流程示意图;
图5是本发明实施例提供的一种基于特定领域知识图谱的问答系统的结构示意图;
图6是本发明实施例提供的一种基于特定领域知识图谱的问答设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1是本发明实施例提供的一种基于特定领域知识图谱的问答方法的流程示意图。所述基于特定领域知识图谱的问答方法,包括:
S1:获取目标领域的数据并构建知识图谱。
作为其中一个可选的实施例,所述获取目标领域的数据并构建知识图谱,包括:
获取目标领域的数据,并对所述目标领域的数据进行数据清洗与文本长度标准化处理,获得第一数据集;
从所述第一数据集中抽取若干数据,作为第二数据集;初步提取所述第二数据集中的知识三元组,得到第一知识三元组集,以对所述第一知识三元组集进行检查与补充,得到第一训练数据集;其中,所述知识三元组由头实体、关系、尾实体组成;
基于所述第一训练数据集,对基本的大语言模型进行微调,得到知识提取模型;
将所述第一数据集输入所述知识提取模型,得到所述第一数据集对应的第二知识三元组集;根据预设规则,剔除所述第二知识三元组集中的错误信息,得到第三知识三元组集;在所述第三知识三元组集中筛选出概念相同的实体,并将所述概念相同的实体对应的知识三元组合并,得到第四知识三元组集,形成目标领域的知识图谱。
具体的,请参阅图2,图2是本发明实施例提供的一种基于特定领域知识图谱的问答方法中构建知识图谱的流程示意图。首先,通过人工或网络爬虫等方式收集目标领域的数据,数据可以为PDF、Word或数据表等多种格式;对数据进行数据预处理,具体地,先对数据进行数据清洗得到,然后通过文本截取的方式对中的每条数据进行文本长度标准化处理,其中设置文本最大长度为L,最终得到长度不大于L的文本的集合,即第一数据集,记为
其中,数据清洗的具体过程为:首先利用如PyPDF2、Python-docx和pandas等Python库,从不同格式的文件中抽取符合要求的文本数据;在此基础上,进行初步的数据预处理,先删除无关内容,然后采用统一的编码方式对所有文本数据进行编码,以防止字符解析错误;最后,将所有编码数据转换为统一的CSV格式,以便进行集中处理。
然后,进行知识三元组的提取:首先从第一数据集中抽取n条数据组成第二数据集;使用开源的用于提取三元组的大语言模型LLM,如TechGPT-7B模型等,对第二数据集进行零样本推理得到第一知识三元组集;然后对第一知识三元组集中的知识三元组进行检查,并补全其中由于LLM提取不完整而导致缺失的三元组,得到用于训练的知识三元组集,其中表示补充的知识三元组集,进而得到第一训练数据集。其中,为一组“文本->知识三元组”格式的示例数据,其中包括表示文本对应的知识三元组集,s表示头实体,r表示头实体与尾实体间的关系,o表示尾实体,m表示文本对应的知识三元组的数量,每个文本对应的知识三元组的数量m不一定相等,该数量m可以为零个、一个或多个。
进一步的,利用第一训练数据集对开源的用于提取三元组的大语言模型LLM进行LoRA微调,得到知识提取模型TR_LLM;将第一数据集输入知识提取模型TR_LLM中以执行知识三元组抽取任务,获得第二知识三元组集
进一步的,根据预设规则剔除第二知识三元组集中的错误信息,得到第三知识三元组集,具体的,预设规则包括:删除输出格式不正确的结果,例如缺少头实体的三元组、缺少头实体的三元组等;删除关系不在已定义模式中的结果;删除头实体和尾实体相同的结果。
进一步的,利用文本嵌入工具text2vec把第三知识三元组集中的头实体转化为向量矩阵,其中,为头实体对应的向量,中的头实体的数量;然后计算每两个头实体的余弦相似度,并判断该余弦相似度是否不小于预设的相似性阈值,若该余弦相似度不小于预设的相似性阈值,即,则表示这两个头实体为等效的实体,进而将它们对应的知识三元组集合并,最后得到第四知识三元组集
进一步的,使用Cypher将第四知识三元组集保存到Neo4j数据库中,得到目标领域的知识图谱。
S2:获取用户输入的问题,对所述问题在所述知识图谱上的多跳次数进行预测,得到对应的跳数。
作为其中一个可选的实施例,所述对所述问题在所述知识图谱上的多跳次数进行预测,得到对应的跳数,包括:
将所述问题输入预设的跳数预测模型,得到模型输出的跳数的置信度分布,将该置信度分布中置信度最大值对应的跳数作为所述问题对应的跳数;
其中,所述跳数预测模型的训练方法包括:
获取与所述目标领域无关的若干第一问题及其跳数标签,以及与所述目标领域相关的若干第二问题及其跳数标签,构成第二训练数据集;其中,所述第一问题的跳数标签均为0;
获取预训练的BERT模型,基于所述第二训练数据集,对所述BERT模型进行二次训练,得到所述跳数预测模型。
具体的,在获取用户输入的问题后,将问题输入跳数预测模型H_BERT进行多跳次数预测,得到一个跳数的置信度分布,该置信度分布为,其中表示在问题的条件下跳数对应的置信度,为预设的跳数最大值,置信度分布中所有置信度的和为1。选取置信度分布中最大的置信度,将其对应的跳数作为问题对应的跳数预测结果
在跳数预测模型的训练阶段,首先获取一个开源预训练的BERT模型,然后使用提前标注好的问题和真实跳数作为输入和标签,使用Adam优化器和交叉熵损失函数,对BERT模型进行二次训练,得到跳数预测模型H_BERT。
其中,跳数预测模型的训练数据包括两类,一类是与目标领域完全无关的问题,其对应跳数的真值标签设置为,即跳数为0;另一类是与目标领域相关的问题,其对应跳数的真值标签设置为为预设的跳数最大值,表示真实跳数,其中标签采用独热向量表示。
S3:若所述跳数不为零,则基于所述知识图谱与所述跳数,预测所述问题对应的关系路径,以构建所述问题的初始推理链路径。
具体的,在得到问题对应的跳数预测结果后,判断该跳数是否为0;若,则输出提示信息,提示用户输入的问题与目标领域无关,以使用户重新输入问题;若,则对问题进行关系路径预测并构建对应的推理链路径,进而生成对应的回答。其中,关系路径为关系的顺序集合。
作为其中一个可选的实施例,所述基于所述知识图谱与所述跳数,预测所述问题对应的关系路径,以构建所述问题的初始推理链路径,包括:
提取所述问题中的实体,得到问题实体;
将所述跳数作为关系路径的预测轮次,对所述问题对应的关系路径进行若干轮预测,得到最后轮次的关系路径集合;在每轮预测中,将上一轮获得的关系路径集合中的每一关系路径分别与所述问题实体进行拼接得到若干个输入数据,将所述输入数据分别输入基于所述知识图谱的关系预测模型进行实体间的关系预测,分别得到对应的关系集合;将每一关系集合中的每一关系分别拼接到所述关系集合对应的上一轮的关系路径后,得到当前轮次的关系路径集合;其中,在第一轮预测时,所述关系预测模型的输入为所述问题与所述问题实体的拼接数据;
对所述最后轮次的关系路径集合进行关系路径的数量优化,得到优化的关系路径集合;
根据所述问题实体以及所述优化的关系路径集合中的每一关系路径,在所述知识图谱中查询并提取对应的知识三元组,构建每一关系路径对应的由若干知识三元组组成的初始推理链路径。
作为其中一个可选的实施例,所述将所述输入数据分别输入基于所述知识图谱的关系预测模型进行实体间的关系预测,分别得到对应的关系集合,包括:
将所述输入数据分别输入基于所述知识图谱的关系预测模型,分别得到模型输出的在所述输入数据的条件下所述知识图谱中所有关系的置信度分布,并选取该置信度分布中大于预设阈值的若干个置信度对应的关系,得到所述输入数据对应的关系集合;
则所述对所述最后轮次的关系路径集合进行关系路径的数量优化,得到优化的关系路径集合,包括:
在所述最后轮次的关系路径集合中,根据每一关系路径所包含的关系的置信度,计算得到所述关系路径的得分;
按所述得分从高到低的顺序选取预设数量的关系路径,得到优化的关系路径集合。
请参阅图3,图3是本发明实施例提供的一种基于特定领域知识图谱的问答方法中构建推理链路径的流程示意图。
具体的,当预测得到的跳数时,进行步的关系路径预测。对于每一步(即每一轮次)的预测,默认选取M个候选关系集合。
时,先提取问题中的实体,得到问题实体;其中,问题实体的提取可以采用大语言模型,例如GLM,Llama3等模型,通过将问题与提示:“请根据上述问题提取实体”拼接后输入大语言模型中进行零样本推理,得到问题实体。然后将问题与问题实体用逗号分隔,两者拼接得到作为关系预测模型R_BERT的输入。关系预测模型R_BERT输出关系的置信度分布,其中表示在给定问题的条件下,关系时的置信度,其中为目标领域的知识图谱中的关系总数。最后根据关系的置信度分布,按置信度从高到低的顺序选取前M个关系作为的关系集合,在时的关系路径集合等价于关系集合
时,先获取时得到的关系路径集合,该集合包括条关系路径,其中某条关系路径表示为,其中,表示第条关系路径在第跳(即第轮次)时选择的关系,。将问题实体分别与关系路径集合中的每一条关系路径进行拼接,作为时关系预测模型R_BERT的输入。然后,使用关系预测模型R_BERT对每一输入进行关系预测,得到对应的关系的置信度分布表示在给定的条件下,关系时的置信度,其中为目标领域的知识图谱中的关系总数。对于关系路径集合中的每一条关系路径,均可得到对应的关系的置信度分布,选取每个中按置信度从高到低的顺序排列的前M个关系,作为关系路径对应的在第跳的关系集合。将关系集合中的每个关系分别拼接到关系路径的末尾,得到对应的关系路径集合,具体为:
其中,表示将第跳(即第轮次)得到的第条关系路径分别与第跳得到的M个关系拼接后得到的关系路径集合,第跳一共可以得到个关系路径集合。进一步的,将第跳得到的所有关系路径集合合并,得到对应的关系路径集合,具体为:
时,同理,得到最后轮次的关系路径集合
进一步的,计算关系路径集合中每条关系路径的得分,并预设一个常数,从而选取得分降序排名的前条路径作为优化的关系路径集合。其中,关系路径得分的计算具体为:在时,得到的关系路径集合中的关系路径,其得分的计算公式为:
其中,为第条关系路径在第跳时选择的关系的置信度。
需要说明的是,所述关系预测模型R_BERT的训练方法与跳数预测模型H_BERT的训练方法类似,其根据历史问题及其对应的真实关系标签训练得到,具体过程不再赘述。
进一步的,根据所获得的关系路径集合和问题实体,在目标领域的知识图谱中查找对应的知识三元组,从而构建初始推理链路径。具体的,针对关系路径集合中的第条关系路径,其中为关系路径的总数,关系路径中包含的关系表示为,其中,表示第条关系路径在第跳的关系,。将问题实体作为头实体,并根据关系路径中的关系,在知识图谱中查找对应的尾实体,得到知识三元组,进而得到由知识三元组组成的推理链路径。
具体的,当时,对于第条关系路径的第1跳所构建的知识三元组集合
其中,表示第条关系路径在第1跳的关系,表示第1跳时根据问题实体以及关系在知识图谱中查询得到的第个尾实体,表示尾实体的数量(也表示中的三元组数量),该尾实体的数量可以为零个、一个或多个。
时,对于第条关系路径在第跳所构建的知识三元组集合
其中,表示在第跳时根据实体以及关系在知识图谱中查询得到的知识三元组集合,表示第跳时根据实体以及关系在知识图谱中查询得到的知识三元组总数。对于所有的实体,其在第跳时所得到知识三元组总数为
时,同理,可以得到知识三元组集合
进一步的,利用如下连接规则将,…,连接,得到第条关系路径对应的初始推理链路径,连接规则具体为:
进一步的,对关系路径集合中的每条关系路径,执行上述操作,然后对结果进行汇总,得到总的初始推理链路径
其中,表示第条关系路径对应的初始推理链路径,
S4:根据预设的过滤规则,对所述初始推理链路径进行修正,并将修正后的初始推理链路径转换为自然语言形式,得到最终的推理链路径。
具体的,在得到初始推理链路径后,对该路径进行验证与修正,以进一步保证推理链路径的正确性。
作为其中一个可选的实施例,所述预设的过滤规则包括:
筛选并删除所述初始推理链路径中存在实体缺失的知识三元组所在的路径;
筛选并删除所述初始推理链路径中的重复路径。
需要说明的是,过滤规则可以根据实际的应用场景以及实际模型的输出反馈进行修改与设定。
进一步的,由于LLM接受的输入为文本格式,因此需要将修正后的推理链路径转换为自然文本。
具体的,可以采用开源的大语言模型进行处理,将提示信息:“请将以下由三元组组成的路径转换为自然文本,每个路径的三元组间用‘|’符号隔开”与待转换的数据作为输入,经过大语言模型推理后得到自然文本形式的推理链路径,即最终得到的推理链路径
示例性的,假设一个推理路径是(中国、首都、北京)(北京、区号、010),其转换成自然文本形式为“(中国、首都、北京)|(北京、区号、010)”。
S5:获取预设的多个指令,分别将每一指令与所述推理链路径以及所述问题进行拼接,得到多个拼接数据,并根据所述拼接数据生成多个候选回答;其中,不同指令设置有不同的具体内容,所述指令均用于关联问答与所述推理链路径。
作为其中一个可选的实施例,所述根据所述拼接数据生成多个候选回答,包括:
分别将每一拼接数据输入预设的大语言模型,得到每一拼接数据对应的候选回答;
其中,所述预设的大语言模型的训练方法包括:
获取若干第三问题及其答案标签,以及所述第三问题对应的历史推理链路径;
获取所述预设的多个指令,分别将每一指令、所述第三问题以及对应的所述历史推理链路径进行拼接并作为第三训练数据,得到第三训练数据集;
基于所述第三训练数据集,对基本的大语言模型进行微调,得到所述预设的大语言模型。
具体的,请参阅图4,图4是本发明实施例提供的一种基于特定领域知识图谱的问答方法中生成回答的流程示意图。本发明实施例通过对开源LLM,如Llama3、ChatGLM6B、Baichuan等模型,进行LoRA微调得到LLM’(即预设的大语言模型),进而使用该LLM’来生成回答。LoRA微调作为低资源下的高效微调,能够增加LLM对特定领域事实的理解,从而生成更好的回答。
其中,预设多组指令来构建第三训练数据,以进行LLM微调。示例性的,指令的设计可以是=“基于以上的三元组推理链路径,请回答:”,=“假设你是一个专家,你拥有以上的知识,请回答问题:”等。每个指令的具体表达不同,但其作用类似。本发明实施例通过设计多组指令,能够增强LLM在推理阶段回答问题的准确性,有效防止了由单个指令造成的错误推理。
具体的,在构建第三训练数据集时,先获取用于训练的问题(即第三问题)和答案对,对于每个问题与答案对,将预设指令里的每一指令分别拼接到问题前面,得到数据集
其中,+表示文本拼接,一种有对数据。
基于数据集,根据上述步骤S2~S4的操作,获得第三问题对应的推理链路径,并将推理链路径拼接到数据集中,得到第三训练数据集
其中,为问题对应的推理链路径集,
进一步的,在得到微调的LLM’后,将其用于系统推理生成问题的回答。具体的,将预设指令、用户问题以及推理链路径拼接后,依次输入LLM’,其中一个指令可以对应得到一个输入,每个输入经过LLM’推理后得到一个候选回答,最后得到回答候选集,其中
S6:对所述多个候选回答进行投票,将投票数量最多的候选回答作为所述问题的回答返回给用户。
具体的,对于回答候选集中的I个回答,采用投票的方式选出最优的候选回答作为问题的回答O,并将其返回给用户,优选的,所选出的回答为相同回答数量最多的回答。
本发明实施例通过构建目标领域的知识图谱,先对用户输入的问题进行多跳次数预测与关系路径预测,以构建推理链路径,再根据推理链路径、问题以及多个指令生成多个候选回答,进而投票选出最终的回答返回给用户,增强了模型输出的稳健性,实现了更准确的特定领域知识问答;在构建目标领域的知识图谱时,通过先抽取一部分数据并提取其知识三元组,再进一步补全该知识三元组后用于大语言模型微调,从而获得提取能力更强的知识提取模型来提取知识三元组,以构建更完整全面的知识图谱;通过训练跳数预测模型以及关系预测模型,能够根据前面的多跳关系预测下一跳的关系进而形成关系路径集合以及推理链路径,引入了链式推理机制,增强了处理多跳问题的能力,提高了问答的准确性与全面性;通过采用多个指令对模型进行微调,使LLM能够更好地适应特定领域的知识图谱,提升了模型对特定领域知识图谱的学习理解能力。本发明实施例能够自动从目标领域的知识图谱中提取较为全面的知识,提升了效率,能够增强LLM对特定领域知识图谱的适应能力,提升了特定领域知识问答的全面性与准确性。
相应地,本发明还提供一种基于特定领域知识图谱的问答系统,能够实现上述实施例中的基于特定领域知识图谱的问答方法的所有流程。
请参阅图5,图5是本发明实施例提供的一种基于特定领域知识图谱的问答系统的结构示意图。所述基于特定领域知识图谱的问答系统,包括:
知识图谱构建模块501,用于获取目标领域的数据并构建知识图谱;
多跳次数预测模块502,用于获取用户输入的问题,对所述问题在所述知识图谱上的多跳次数进行预测,得到对应的跳数;
推理路径构建模块503,用于若所述跳数不为零,则基于所述知识图谱与所述跳数,预测所述问题对应的关系路径,以构建所述问题的初始推理链路径;
推理路径优化模块504,用于根据预设的过滤规则,对所述初始推理链路径进行修正,并将修正后的初始推理链路径转换为自然语言形式,得到最终的推理链路径;
候选回答生成模块505,用于获取预设的多个指令,分别将每一指令与所述推理链路径以及所述问题进行拼接,得到多个拼接数据,并根据所述拼接数据生成多个候选回答;其中,不同指令设置有不同的具体内容,所述指令均用于关联问答与所述推理链路径;
问题回答输出模块506,用于对所述多个候选回答进行投票,将投票数量最多的候选回答作为所述问题的回答返回给用户。
优选地,所述知识图谱构建模块501具体用于:
获取目标领域的数据,并对所述目标领域的数据进行数据清洗与文本长度标准化处理,获得第一数据集;
从所述第一数据集中抽取若干数据,作为第二数据集;初步提取所述第二数据集中的知识三元组,得到第一知识三元组集,以对所述第一知识三元组集进行检查与补充,得到第一训练数据集;其中,所述知识三元组由头实体、关系、尾实体组成;
基于所述第一训练数据集,对基本的大语言模型进行微调,得到知识提取模型;
将所述第一数据集输入所述知识提取模型,得到所述第一数据集对应的第二知识三元组集;根据预设规则,剔除所述第二知识三元组集中的错误信息,得到第三知识三元组集;在所述第三知识三元组集中筛选出概念相同的实体,并将所述概念相同的实体对应的知识三元组合并,得到第四知识三元组集,形成目标领域的知识图谱。
优选地,所述多跳次数预测模块502具体用于:
将所述问题输入预设的跳数预测模型,得到模型输出的跳数的置信度分布,将该置信度分布中置信度最大值对应的跳数作为所述问题对应的跳数;
其中,所述跳数预测模型的训练方法包括:
获取与所述目标领域无关的若干第一问题及其跳数标签,以及与所述目标领域相关的若干第二问题及其跳数标签,构成第二训练数据集;其中,所述第一问题的跳数标签均为0;
获取预训练的BERT模型,基于所述第二训练数据集,对所述BERT模型进行二次训练,得到所述跳数预测模型。
优选地,所述推理路径构建模块503具体用于:
提取所述问题中的实体,得到问题实体;
将所述跳数作为关系路径的预测轮次,对所述问题对应的关系路径进行若干轮预测,得到最后轮次的关系路径集合;在每轮预测中,将上一轮获得的关系路径集合中的每一关系路径分别与所述问题实体进行拼接得到若干个输入数据,将所述输入数据分别输入基于所述知识图谱的关系预测模型进行实体间的关系预测,分别得到对应的关系集合;将每一关系集合中的每一关系分别拼接到所述关系集合对应的上一轮的关系路径后,得到当前轮次的关系路径集合;其中,在第一轮预测时,所述关系预测模型的输入为所述问题与所述问题实体的拼接数据;
对所述最后轮次的关系路径集合进行关系路径的数量优化,得到优化的关系路径集合;
根据所述问题实体以及所述优化的关系路径集合中的每一关系路径,在所述知识图谱中查询并提取对应的知识三元组,构建每一关系路径对应的由若干知识三元组组成的初始推理链路径。
优选地,所述将所述输入数据分别输入基于所述知识图谱的关系预测模型进行实体间的关系预测,分别得到对应的关系集合,包括:
将所述输入数据分别输入基于所述知识图谱的关系预测模型,分别得到模型输出的在所述输入数据的条件下所述知识图谱中所有关系的置信度分布,并选取该置信度分布中大于预设阈值的若干个置信度对应的关系,得到所述输入数据对应的关系集合;
则所述对所述最后轮次的关系路径集合进行关系路径的数量优化,得到优化的关系路径集合,包括:
在所述最后轮次的关系路径集合中,根据每一关系路径所包含的关系的置信度,计算得到所述关系路径的得分;
按所述得分从高到低的顺序选取预设数量的关系路径,得到优化的关系路径集合。
优选地,所述预设的过滤规则包括:
筛选并删除所述初始推理链路径中存在实体缺失的知识三元组所在的路径;
筛选并删除所述初始推理链路径中的重复路径。
优选地,所述候选回答生成模块505中,所述根据所述拼接数据生成多个候选回答,包括:
分别将每一拼接数据输入预设的大语言模型,得到每一拼接数据对应的候选回答;
其中,所述预设的大语言模型的训练方法包括:
获取若干第三问题及其答案标签,以及所述第三问题对应的历史推理链路径;
获取所述预设的多个指令,分别将每一指令、所述第三问题以及对应的所述历史推理链路径进行拼接并作为第三训练数据,得到第三训练数据集;
基于所述第三训练数据集,对基本的大语言模型进行微调,得到所述预设的大语言模型。
在具体实施当中,本发明实施例提供的基于特定领域知识图谱的问答系统的工作原理、控制流程及实现的技术效果,与上述实施例中的基于特定领域知识图谱的问答方法对应相同,在此不再赘述。
参见图6,图6是本申请实施例提供的一种基于特定领域知识图谱的问答设备的结构框图,所述基于特定领域知识图谱的问答设备包括:处理器601、存储器602以及存储在所述存储器602中并可在所述处理器601上运行的计算机程序。所述处理器601执行所述计算机程序时实现上述基于特定领域知识图谱的问答方法实施例中的步骤。或者,所述处理器601执行所述计算机程序时实现上述各系统实施例中各模块/单元的功能。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器602中,并由所述处理器601执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述基于特定领域知识图谱的问答设备中的执行过程。
所述基于特定领域知识图谱的问答设备可包括,但不仅限于,处理器601、存储器602。本领域技术人员可以理解,所述示意图仅仅是基于特定领域知识图谱的问答设备的示例,并不构成对基于特定领域知识图谱的问答设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于特定领域知识图谱的问答设备还可以包括输入输出设备、网络接入设备、总线等。
所述处理器601可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器601是所述基于特定领域知识图谱的问答设备的控制中心,利用各种接口和线路连接整个基于特定领域知识图谱的问答设备的各个部分。
所述存储器602可用于存储所述计算机程序和/或模块,所述处理器601通过运行或执行存储在所述存储器602内的计算机程序和/或模块,以及调用存储在存储器602内的数据,实现所述基于特定领域知识图谱的问答设备的各种功能。所述存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述基于特定领域知识图谱的问答设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器601执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或系统、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任一实施例所述的基于特定领域知识图谱的问答方法。
本发明实施例提供的一种基于特定领域知识图谱的问答方法、系统、设备及介质的有益效果在于:
通过构建目标领域的知识图谱,先对用户输入的问题进行多跳次数预测与关系路径预测,以构建推理链路径,再根据推理链路径、问题以及多个指令生成多个候选回答,进而投票选出最终的回答返回给用户,增强了模型输出的稳健性,实现了更准确的特定领域知识问答;在构建目标领域的知识图谱时,通过先抽取一部分数据并提取其知识三元组,再进一步补全该知识三元组后用于大语言模型微调,从而获得提取能力更强的知识提取模型来提取知识三元组,以构建更完整全面的知识图谱;通过训练跳数预测模型以及关系预测模型,能够根据前面的多跳关系预测下一跳的关系进而形成关系路径集合以及推理链路径,引入了链式推理机制,增强了处理多跳问题的能力,提高了问答的准确性与全面性;通过采用多个指令对模型进行微调,使LLM能够更好地适应特定领域的知识图谱,提升了模型对特定领域知识图谱的学习理解能力。本发明实施例能够自动从目标领域的知识图谱中提取较为全面的知识,提升了效率,能够增强LLM对特定领域知识图谱的适应能力,提升了特定领域知识问答的全面性与准确性。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (9)

1.一种基于特定领域知识图谱的问答方法,其特征在于,包括:
获取目标领域的数据并构建知识图谱;
获取用户输入的问题,对所述问题在所述知识图谱上的多跳次数进行预测,得到对应的跳数;
若所述跳数不为零,则基于所述知识图谱与所述跳数,预测所述问题对应的关系路径,以构建所述问题的初始推理链路径;
根据预设的过滤规则,对所述初始推理链路径进行修正,并将修正后的初始推理链路径转换为自然语言形式,得到最终的推理链路径;
获取预设的多个指令,分别将每一指令与所述推理链路径以及所述问题进行拼接,得到多个拼接数据,并根据所述拼接数据生成多个候选回答;其中,不同指令设置有不同的具体内容,所述指令均用于关联问答与所述推理链路径;
对所述多个候选回答进行投票,将投票数量最多的候选回答作为所述问题的回答返回给用户;
其中,所述基于所述知识图谱与所述跳数,预测所述问题对应的关系路径,以构建所述问题的初始推理链路径,包括:
提取所述问题中的实体,得到问题实体;
将所述跳数作为关系路径的预测轮次,对所述问题对应的关系路径进行若干轮预测,得到最后轮次的关系路径集合;在每轮预测中,将上一轮获得的关系路径集合中的每一关系路径分别与所述问题实体进行拼接得到若干个输入数据,将所述输入数据分别输入基于所述知识图谱的关系预测模型进行实体间的关系预测,分别得到对应的关系集合;将每一关系集合中的每一关系分别拼接到所述关系集合对应的上一轮的关系路径后,得到当前轮次的关系路径集合;其中,在第一轮预测时,所述关系预测模型的输入为所述问题与所述问题实体的拼接数据;
对所述最后轮次的关系路径集合进行关系路径的数量优化,得到优化的关系路径集合;
根据所述问题实体以及所述优化的关系路径集合中的每一关系路径,在所述知识图谱中查询并提取对应的知识三元组,构建每一关系路径对应的由若干知识三元组组成的初始推理链路径;
所述初始推理链路径中,相邻两个知识三元组中前一个知识三元组的尾实体与后一个知识三元组的头实体相同;
其中,所述根据所述拼接数据生成多个候选回答,包括:
分别将每一拼接数据输入预设的大语言模型,得到每一拼接数据对应的候选回答;每一所述拼接数据包括所述问题对应的若干推理链路径。
2.如权利要求1所述的基于特定领域知识图谱的问答方法,其特征在于,所述获取目标领域的数据并构建知识图谱,包括:
获取目标领域的数据,并对所述目标领域的数据进行数据清洗与文本长度标准化处理,获得第一数据集;
从所述第一数据集中抽取若干数据,作为第二数据集;初步提取所述第二数据集中的知识三元组,得到第一知识三元组集,以对所述第一知识三元组集进行检查与补充,得到第一训练数据集;其中,所述知识三元组由头实体、关系、尾实体组成;
基于所述第一训练数据集,对基本的大语言模型进行微调,得到知识提取模型;
将所述第一数据集输入所述知识提取模型,得到所述第一数据集对应的第二知识三元组集;根据预设规则,剔除所述第二知识三元组集中的错误信息,得到第三知识三元组集;在所述第三知识三元组集中筛选出概念相同的实体,并将所述概念相同的实体对应的知识三元组合并,得到第四知识三元组集,形成目标领域的知识图谱。
3.如权利要求1所述的基于特定领域知识图谱的问答方法,其特征在于,所述对所述问题在所述知识图谱上的多跳次数进行预测,得到对应的跳数,包括:
将所述问题输入预设的跳数预测模型,得到模型输出的跳数的置信度分布,将该置信度分布中置信度最大值对应的跳数作为所述问题对应的跳数;
其中,所述跳数预测模型的训练方法包括:
获取与所述目标领域无关的若干第一问题及其跳数标签,以及与所述目标领域相关的若干第二问题及其跳数标签,构成第二训练数据集;其中,所述第一问题的跳数标签均为0;
获取预训练的BERT模型,基于所述第二训练数据集,对所述BERT模型进行二次训练,得到所述跳数预测模型。
4.如权利要求1所述的基于特定领域知识图谱的问答方法,其特征在于,所述将所述输入数据分别输入基于所述知识图谱的关系预测模型进行实体间的关系预测,分别得到对应的关系集合,包括:
将所述输入数据分别输入基于所述知识图谱的关系预测模型,分别得到模型输出的在所述输入数据的条件下所述知识图谱中所有关系的置信度分布,并选取该置信度分布中大于预设阈值的若干个置信度对应的关系,得到所述输入数据对应的关系集合;
则所述对所述最后轮次的关系路径集合进行关系路径的数量优化,得到优化的关系路径集合,包括:
在所述最后轮次的关系路径集合中,根据每一关系路径所包含的关系的置信度,计算得到所述关系路径的得分;
按所述得分从高到低的顺序选取预设数量的关系路径,得到优化的关系路径集合。
5.如权利要求1所述的基于特定领域知识图谱的问答方法,其特征在于,所述预设的过滤规则包括:
筛选并删除所述初始推理链路径中存在实体缺失的知识三元组所在的路径;
筛选并删除所述初始推理链路径中的重复路径。
6.如权利要求1所述的基于特定领域知识图谱的问答方法,其特征在于,所述预设的大语言模型的训练方法包括:
获取若干第三问题及其答案标签,以及所述第三问题对应的历史推理链路径;
获取所述预设的多个指令,分别将每一指令、所述第三问题以及对应的所述历史推理链路径进行拼接并作为第三训练数据,得到第三训练数据集;
基于所述第三训练数据集,对基本的大语言模型进行微调,得到所述预设的大语言模型。
7.一种基于特定领域知识图谱的问答系统,其特征在于,包括:
知识图谱构建模块,用于获取目标领域的数据并构建知识图谱;
多跳次数预测模块,用于获取用户输入的问题,对所述问题在所述知识图谱上的多跳次数进行预测,得到对应的跳数;
推理路径构建模块,用于若所述跳数不为零,则基于所述知识图谱与所述跳数,预测所述问题对应的关系路径,以构建所述问题的初始推理链路径;
推理路径优化模块,用于根据预设的过滤规则,对所述初始推理链路径进行修正,并将修正后的初始推理链路径转换为自然语言形式,得到最终的推理链路径;
候选回答生成模块,用于获取预设的多个指令,分别将每一指令与所述推理链路径以及所述问题进行拼接,得到多个拼接数据,并根据所述拼接数据生成多个候选回答;其中,不同指令设置有不同的具体内容,所述指令均用于关联问答与所述推理链路径;
问题回答输出模块,用于对所述多个候选回答进行投票,将投票数量最多的候选回答作为所述问题的回答返回给用户;
其中,所述推理路径构建模块具体用于:
提取所述问题中的实体,得到问题实体;
将所述跳数作为关系路径的预测轮次,对所述问题对应的关系路径进行若干轮预测,得到最后轮次的关系路径集合;在每轮预测中,将上一轮获得的关系路径集合中的每一关系路径分别与所述问题实体进行拼接得到若干个输入数据,将所述输入数据分别输入基于所述知识图谱的关系预测模型进行实体间的关系预测,分别得到对应的关系集合;将每一关系集合中的每一关系分别拼接到所述关系集合对应的上一轮的关系路径后,得到当前轮次的关系路径集合;其中,在第一轮预测时,所述关系预测模型的输入为所述问题与所述问题实体的拼接数据;
对所述最后轮次的关系路径集合进行关系路径的数量优化,得到优化的关系路径集合;
根据所述问题实体以及所述优化的关系路径集合中的每一关系路径,在所述知识图谱中查询并提取对应的知识三元组,构建每一关系路径对应的由若干知识三元组组成的初始推理链路径;
所述初始推理链路径中,相邻两个知识三元组中前一个知识三元组的尾实体与后一个知识三元组的头实体相同;
其中,所述根据所述拼接数据生成多个候选回答,包括:
分别将每一拼接数据输入预设的大语言模型,得到每一拼接数据对应的候选回答;每一所述拼接数据包括所述问题对应的若干推理链路径。
8.一种基于特定领域知识图谱的问答设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,且所述计算机程序被配置为由所述处理器执行,所述处理器执行所述计算机程序时实现如权利要求1至6中任意一项所述的基于特定领域知识图谱的问答方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,其中,所述计算机可读存储介质所在设备执行所述计算机程序时,实现如权利要求1至6中任意一项所述的基于特定领域知识图谱的问答方法。
CN202411388659.9A 2024-10-08 2024-10-08 基于特定领域知识图谱的问答方法、系统、设备及介质 Active CN118897886B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202411388659.9A CN118897886B (zh) 2024-10-08 2024-10-08 基于特定领域知识图谱的问答方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202411388659.9A CN118897886B (zh) 2024-10-08 2024-10-08 基于特定领域知识图谱的问答方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN118897886A CN118897886A (zh) 2024-11-05
CN118897886B true CN118897886B (zh) 2025-02-11

Family

ID=93268010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202411388659.9A Active CN118897886B (zh) 2024-10-08 2024-10-08 基于特定领域知识图谱的问答方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN118897886B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN120069098B (zh) * 2025-04-29 2025-07-11 之江实验室 一种垂直领域大模型的微调方法、装置及介质
CN120449101B (zh) * 2025-05-12 2025-12-26 平顶山学院 一种基于人工智能多模态数据融合处理方法及系统
CN120356139B (zh) * 2025-06-17 2025-09-16 中国铁塔股份有限公司 一种图文问答与人员游泳检测方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115470328A (zh) * 2022-08-11 2022-12-13 天津泰凡科技有限公司 基于知识图谱的开放领域问答方法及相关设备
CN117764177A (zh) * 2024-01-02 2024-03-26 北京达佳互联信息技术有限公司 问题的推理方法、装置、电子设备及存储介质
CN118470415A (zh) * 2024-05-16 2024-08-09 西安电子科技大学 基于知识图谱和大语言模型的空间目标识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240160955A1 (en) * 2022-11-11 2024-05-16 Nec Laboratories America, Inc. Knowledge graph optimized prompt for open-domain common sense reasoning decision making with artificial intelligence
CN117669767A (zh) * 2023-11-17 2024-03-08 招商局金融科技有限公司 语言模型的训练方法、设备及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115470328A (zh) * 2022-08-11 2022-12-13 天津泰凡科技有限公司 基于知识图谱的开放领域问答方法及相关设备
CN117764177A (zh) * 2024-01-02 2024-03-26 北京达佳互联信息技术有限公司 问题的推理方法、装置、电子设备及存储介质
CN118470415A (zh) * 2024-05-16 2024-08-09 西安电子科技大学 基于知识图谱和大语言模型的空间目标识别方法

Also Published As

Publication number Publication date
CN118897886A (zh) 2024-11-05

Similar Documents

Publication Publication Date Title
CN118897886B (zh) 基于特定领域知识图谱的问答方法、系统、设备及介质
CN118170894B (zh) 一种知识图谱问答方法、装置及存储介质
CN111949787A (zh) 基于知识图谱的自动问答方法、装置、设备及存储介质
CN111078837A (zh) 智能问答信息处理方法、电子设备及计算机可读存储介质
CN118981475B (zh) 基于大模型的sql语句生成方法及装置
CN114186076B (zh) 知识图谱构建方法、装置、设备和计算机可读存储介质
CN118036756B (zh) 大模型多轮对话的方法、装置、计算机设备及存储介质
CN116483962A (zh) 一种问答方法、装置、终端设备及可读存储介质
CN119557406B (zh) 一种用户问题的解答方法、装置、设备及介质
CN118761417B (zh) 一种应用三元组校对机制改善大模型知识问答方法
CN119357376A (zh) 基于知识图谱和向量的混合检索方法、装置、设备及存储介质
CN119938823A (zh) 一种用于金融银行的rag知识库大模型增强对话方法及系统
CN116340495A (zh) 问答任务的处理方法及装置、存储介质、计算机设备
CN115062126A (zh) 一种语句分析方法、装置、电子设备及可读存储介质
CN114880453A (zh) 智能问答方法、装置及电子设备
CN114218214A (zh) 基于TaPas模型的数据处理方法、系统和存储介质
CN117634617A (zh) 知识密集型推理问答方法、装置、电子设备和存储介质
CN116610815A (zh) 一种知识图谱的关系预测方法、装置、设备及存储介质
CN113610110B (zh) 基于伪正则表达式意图匹配方法及智能问答系统
CN120123465A (zh) 基于大语言模型的智慧农业图谱交互方法和装置
KR102156249B1 (ko) 변분 순환 오토인코딩 방식의 자동 색인 시스템 및 방법
CN118626617A (zh) 基于知识图谱的大模型多文档问答方法及装置
CN118797004A (zh) 分析报告的生成方法、分析报告的生成装置及电子设备
CN118708684A (zh) 一种智能交互方法、装置及可读存储介质
CN120104762B (zh) 基于大模型检索增强生成的数据库查询方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant