CN119106921A - 一种基于人工智能的风控规则效果评价方法及系统 - Google Patents
一种基于人工智能的风控规则效果评价方法及系统 Download PDFInfo
- Publication number
- CN119106921A CN119106921A CN202411209185.7A CN202411209185A CN119106921A CN 119106921 A CN119106921 A CN 119106921A CN 202411209185 A CN202411209185 A CN 202411209185A CN 119106921 A CN119106921 A CN 119106921A
- Authority
- CN
- China
- Prior art keywords
- wind control
- control rule
- neural network
- artificial intelligence
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Technology Law (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于人工智能的风控规则效果评价方法及系统,涉及人工智能技术领域,包括,收集车险理赔中的结构化数据和非结构化数据,并进行预处理;利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量;基于处理后的结构化数据和非结构化数据,构建理赔关系图谱;利用风控特征向量和理赔关系图谱,构建图神经网络模型;基于图神经网络模型的输出,设定新的风控规则;通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告;本发明结合深度学习与图神经网络技术,对车险理赔的多源数据进行综合分析,提升了欺诈行为的识别准确性与效率,减少了保险公司经济损失,显著改善了用户体验和服务质量。
Description
技术领域
本发明涉及人工智能技术领域,特别是一种基于人工智能的风控规则效果评价方法及系统。
背景技术
随着大数据与人工智能技术的迅猛发展,保险行业面临着日益复杂的欺诈风险挑战,传统的车险理赔风控方法主要依赖人工审核和基于规则的系统,这些方法虽然直观有效,但在面对大量非结构化数据时显得力不从心,近年来,深度学习技术在处理非结构化数据方面展现出巨大潜力,尤其是在图像识别、语音分析和自然语言处理等领域取得了显著成果,目前,大多数风控系统在处理非结构化数据时缺乏有效的特征提取手段,往往忽略了一些关键信息,导致风险评估不够准确,此外,传统的风控规则大多基于专家经验设定,缺乏灵活性和自适应性,难以应对不断变化的风险环境。
发明内容
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种基于人工智能的风控规则效果评价方法及系统解决了现有技术中车险理赔领域缺乏有效融合结构化与非结构化数据进行风控规则效果评估的问题。
为解决上述技术问题,本发明提供如下技术方案:
第一方面,本发明实施例提供了一种基于人工智能的风控规则效果评价方法,其包括,收集车险理赔中的结构化数据和非结构化数据,并进行预处理;
利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量;
基于处理后的结构化数据和非结构化数据,构建理赔关系图谱;
利用风控特征向量和理赔关系图谱,构建图神经网络模型;
基于图神经网络模型的输出,设定新的风控规则;
将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告。
作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:所述结构化数据包括理赔记录和用户基本信息;
所述非结构化数据包括事故现场照片、客户电话录音和文字描述;
所述预处理包括数据清洗和归一化处理。
作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量,包括如下步骤:
使用ResNet-50网络从事故现场照片中提取图像特征向量,表示为,
ximage=fResNet-50(I);
其中,ximage表示从ResNet-50的倒数第二层提取的图像特征向量,fResNet-50表示ResNet-50网络,I表示处理后的事故现场照片形成的适合网络输入的数据格式;
使用带有门控循环单元的循环神经网络从客户电话录音中提取语音特征向量,表示为,
xvoice=fGRU(V);
其中,xvoice表示从GRU的最后一个时间步提取的语音特征向量,V表示处理后的客户电话录音形成的适合网络输入的数据格式,fGRU表示带有门控循环单元的循环神经网络;
使用Word2Vec模型将文字描述中的每个单词转换为文字特征向量表示,然后通过注意力机制聚合单词级别的文字特征向量,得到句子级别的文字特征向量,表示为,
xword,i=fWord2Vec(wi);
其中,xword,i表示当前第i个单词的文字特征向量,zsentence表示通过注意力机制聚合后得到的句子级别的文字特征向量,fWord2Vec表示Word2Vec模型,M表示句子中单词的数量,wi表示文字描述中的第i个单词,αi表示当前第i个单词的注意力权重;
将提取图像特征向量、语音特征向量和句子级别的文字特征向量进行整合,得到风控特征向量。
作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:基于处理后的结构化数据和非结构化数据,构建理赔关系图谱,包括如下步骤:
使用基于BiLSTM-CRF的命名实体识别模型从处理后的文字描述中识别出实体,将识别出的实体与结构化数据中的实体进行连接;
定义实体之间的关系类型,使用基于深度学习的关系抽取技术从结构化数据和非结构化数据中抽取实体之间的关系,并对抽取的关系进行验证;
使用Neo4j图数据库,根据实体识别的结果创建图谱中的节点,每个节点代表一个实体,根据关系抽取的结果创建图谱中的边,每个边代表实体之间的关系,为节点和边添加属性,图谱数据以图数据库支持的格式存储,最后得到理赔关系图谱。
作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:利用风控特征向量和理赔关系图谱,构建图神经网络模型,包括如下步骤:
将风控特征向量整合到对应的理赔关系图谱节点中,对整合后的图谱进行缺失值处理、异常值检测和节点属性标准化处理;
选择GCN作为图神经网络模型的架构,图谱中节点之间的连接关系设定为邻接矩阵,输入包含节点特征和边信息的图谱数据为输入特征矩阵,预测每个节点的欺诈概率,训练图神经网络模型,通过图卷积操作更新节点特征,表示为,
其中,H(l+1)表示经过第l+1层图卷积操作后得到的节点特征矩阵,H(l)表示第l层的节点特征矩阵,输入特征矩阵在第一层的节点特征矩阵中,W(l)表示第l层的权重矩阵,表示加了自环的邻接矩阵,A表示邻接矩阵,表示的度矩阵,σ表示ReLU函数;
定义损失函数和优化器;
利用损失函数和优化器来最小化损失并优化模型参数,最后得到构建好的图神经网络模型。
作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:基于图神经网络模型的输出,设定新的风控规则,包括如下步骤:
使用K-means聚类算法对图神经网络模型输出的欺诈概率进行聚类,以识别具有相似欺诈行为的模式;
根据聚类结果,设定聚类阈值;
当聚类结果大于等于聚类阈值时,表示存在欺诈行为;
当聚类结果小于聚类阈值时,表示不存在欺诈行为。
作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告,包括如下步骤:
对于新的理赔案例,使用新的风控规则进行判断;
风控规则测试是指计算图神经网络模型的准确率、召回率、精确率、F1分数的指标来评价风控规则的效果;
通过汇总准确率、召回率、精确率和F1分数的分析来评价新的风控规则的综合表现,生成新的风控规则效果评价报告。
第二方面,本发明提供了一种基于人工智能的风控规则效果评价系统,包括,数据采集模块,负责收集车险理赔中的结构化数据和非结构化数据,并进行预处理;
非结构化数据深度学习分析模块,负责利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量;
理赔关系图谱构建模块,负责基于处理后的结构化数据和非结构化数据,构建理赔关系图谱;
图神经网络模型构建模块,负责利用风控特征向量和理赔关系图谱,构建图神经网络模型;
风控规则设定与优化模块,负责基于图神经网络模型的输出,设定新的风控规则;
风控规则效果评价模块,负责将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告。
第三方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中:所述计算机程序被处理器执行时实现如本发明第一方面所述的基于人工智能的风控规则效果评价方法的任一步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中:所述计算机程序被处理器执行时实现如本发明第一方面所述的基于人工智能的风控规则效果评价方法的任一步骤。
本发明有益效果为:通过数据收集与预处理,实现了车险理赔中的结构化数据和非结构化数据的有效整合与标准化,确保了后续分析过程的准确性和可靠性。通过非结构化数据特征提取,实现了从不同类型的非结构化数据中提取关键特征,为后续建立图神经网络模型提供了丰富的信息来源。通过构建理赔关系图谱,构建了全面反映理赔过程中各种实体及其关系的图谱,为风险评估提供了直观的可视化工具,提升了风控决策依据。通过构建图神经网络模型,实现了自动化的风险预测功能,提高了欺诈检测的准确性,优化了风险控制流程。通过设定新的风控规则,实现了根据模型输出制定具体的风控策略,提升了欺诈检测效率。通过风控规则测试与评估,为持续改进提供了依据。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为实施例1中基于人工智能的风控规则效果评价方法的流程图。
图2为实施例1中风控特征向量形成图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
实施例1,参照图1和图2,为本发明第一个实施例,该实施例提供了一种基于人工智能的风控规则效果评价方法,包括以下步骤:
S1、收集车险理赔中的结构化数据和非结构化数据,并进行预处理。
结构化数据包括理赔记录和用户基本信息,其中,理赔记录包括案件编号、报案时间、事故时间、事故地点、事故类型和事故描述,用户基本信息包括基本信息、身份信息、住址信息、车辆信息和保险信息;
非结构化数据包括事故现场照片、客户电话录音和文字描述;
预处理包括数据清洗和归一化处理;
具体地,对理赔记录、用户基本信息等结构化数据进行清洗、填充缺失值、标准化等预处理操作,对事故现场照片进行尺寸标准化、归一化等预处理,对客户电话录音进行采样率标准化、降噪等预处理,对文字描述进行分词、去除停用词等预处理。
应说明的是,收集车险理赔中的结构化数据和非结构化数据,并对其进行预处理,实现了数据的有效整合与标准化,然后确保了后续分析过程的准确性和可靠性,最后达到了提高数据质量的有益效果。
S2、利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量。
使用ResNet-50网络从事故现场照片中提取图像特征向量,表示为,
ximage=fResNet-50(I);
其中,ximage表示从ResNet-50的倒数第二层(通常是全局平均池化层之前的层)提取的图像特征向量,fResNet-50表示ResNet-50网络,用于提取图像特征,I表示处理后的事故现场照片形成的适合网络输入的数据格式;
使用带有门控循环单元的循环神经网络从客户电话录音中提取语音特征向量,表示为,
xvoice=fGRU(V);
其中,xvoice表示从GRU的最后一个时间步提取的语音特征向量,V表示处理后的客户电话录音形成的适合网络输入的数据格式,fGRU表示带有门控循环单元(GRU)的循环神经网络,用于提取语音特征;
使用Word2Vec模型将文字描述中的每个单词转换为文字特征向量表示,然后通过注意力机制聚合单词级别的文字特征向量,得到句子级别的文字特征向量,表示为,
xword,i=fWord2Vec(wi);
其中,xword,i表示当前第i个单词的文字特征向量,zsentence表示通过注意力机制聚合后得到的句子级别的文字特征向量,fWord2Vec表示Word2Vec模型,用于将单词转换为文字特征向量表示,M表示句子中单词的数量,wi表示文字描述中的第i个单词,αi表示当前第i个单词的注意力权重;
注意力权重,表示为,
其中,xi表示当前第i个单词的特征向量,hi表示当前第i个单词的隐藏状态向量,Wa表示权重矩阵,用于调整特征向量和隐藏状态向量的线性组合,va表示权重向量,用于计算注意力得分的线性组合,xj表示第j个单词的特征向量,hj表示第j个单词的隐藏状态向量,j表示单词索引;
应说明的是,注意力权重在本步骤的重要性在于它能够突出句子中更重要的单词,从而提高模型对关键信息的敏感度,有益效果体现在能够更准确地捕捉到句子的核心意义,增强模型对文本内容的理解能力。
将提取图像特征向量、语音特征向量和句子级别的文字特征向量进行整合,得到风控特征向量。
应说明的是,利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量,实现了从不同类型的非结构化数据中提取关键特征,然后为后续建立图神经网络模型提供了丰富的信息来源,最后达到了增强模型识别能力的有益效果。
S3、基于处理后的结构化数据和非结构化数据,构建理赔关系图谱。
使用基于BiLSTM-CRF的命名实体识别模型从处理后的文字描述中识别出实体(例如用户ID、车牌号、事故地点等),将识别出的实体与结构化数据中的实体进行连接,确保实体的一致性;
定义实体之间的关系类型(例如用户与车辆的绑定关系、理赔记录中的事故地点与天气条件等),使用基于深度学习的关系抽取技术从结构化数据和非结构化数据中抽取实体之间的关系,并对抽取的关系进行验证,确保关系的准确性和一致性;
使用Neo4j图数据库,根据实体识别的结果创建图谱中的节点,每个节点代表一个实体(如用户、车辆、理赔记录等),根据关系抽取的结果创建图谱中的边,每个边代表实体之间的关系(如用户与车辆的绑定关系等),为节点和边添加属性(如用户年龄、车辆型号、理赔金额等),图谱数据以图数据库支持的格式存储,最后得到理赔关系图谱。
应说明的是,基于处理后的结构化数据和非结构化数据,构建理赔关系图谱,实现了构建全面反映理赔过程中各种实体及其关系的图谱,然后为风险评估提供了直观的可视化工具,最后达到了提升风控决策依据的有益效果。
S4、利用风控特征向量和理赔关系图谱,构建图神经网络模型。
将风控特征向量整合到对应的理赔关系图谱节点中,对整合后的图谱进行缺失值处理、异常值检测和节点属性标准化处理;
选择GCN作为图神经网络模型的架构,图谱中节点之间的连接关系设定为邻接矩阵,输入包含节点特征和边信息的图谱数据为输入特征矩阵,预测每个节点的欺诈概率,训练图神经网络模型,通过图卷积操作更新节点特征,表示为,
其中,H(l+1)表示经过第l+1层图卷积操作后得到的节点特征矩阵,H(l)表示第l层的节点特征矩阵,输入特征矩阵在第一层的节点特征矩阵中,W(l)表示第l层的权重矩阵,表示加了自环的邻接矩阵,A表示邻接矩阵,表示的度矩阵,σ表示ReLU函数;
应说明的是,选择GCN作为图神经网络模型的架构是因为它能够有效处理图结构数据,通过图卷积操作捕获节点间的局部结构信息,进而增强模型的欺诈检测能力,其有益效果体现在能够充分利用图谱中的节点特征和边信息,提高欺诈预测的准确性。
ReLU函数表达式为f(x)=max(0,x),其中,如果x为正数,则输出为x,如果x是负数,则输出为0。
定义损失函数,表示为,
其中,表示损失函数,yq表示样本q的真实标签,表示样本q的预测标签,n表示样本数量;
定义优化器,表示为,
其中,W(l+1)表示第l+1层的权重矩阵,η表示学习率,表示损失函数关于权重矩阵W(l)的梯度;
利用损失函数和优化器来最小化损失并优化模型参数,最后得到构建好的图神经网络模型。
应说明的是,利用风控特征向量和理赔关系图谱,构建图神经网络模型,实现了自动化的风险预测功能,然后提高了欺诈检测的准确性,最后达到了优化风险控制流程的有益效果。
S5、基于图神经网络模型的输出,设定新的风控规则。
使用K-means聚类算法对图神经网络模型输出的欺诈概率进行聚类,以识别具有相似欺诈行为的模式;
根据聚类结果,设定聚类阈值;
当聚类结果大于等于聚类阈值时,表示存在欺诈行为;
当聚类结果小于聚类阈值时,表示不存在欺诈行为。
应说明的是,基于图神经网络模型的输出,设定新的风控规则,实现了根据模型输出制定具体的风控策略,然后增强了风控规则的针对性和有效性,最后达到了提升欺诈检测效率的有益效果。
S6、将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告。
对于新的理赔案例,使用新的风控规则进行判断;
风控规则测试是指计算图神经网络模型的准确率、召回率、精确率、F1分数的指标来评价风控规则的效果,分别表示为,
其中,A1表示准确率,A2表示召回率,P表示精确率,F1表示F1分数,TP表示正确识别的风险案例数,TN表示正确识别的非风险案例数,FN表示错误地识别为非风险的案例数,FP表示错误地识别为风险的案例数;
应说明的是,准确率反映了模型正确分类所有案例的比例,它是一个直观且容易理解的指标,能够快速给出模型整体表现的好坏。但在不平衡数据集的情况下,仅凭准确率可能会误导判断,因为模型可能仅仅依靠预测多数类别就能获得较高的准确率。召回率则关注模型识别出所有实际风险案例的能力,这对于风险管理尤为重要,因为它直接关联到能否有效发现潜在的欺诈行为,减少损失。在风控场景下,错失任何一次真实的风险案例都可能导致重大损失。精确率衡量了被模型标记为风险的案例中有多少确实是风险案例,这有助于避免不必要的调查成本,确保资源被高效利用。在车险理赔领域,降低误报率可以显著减少无效的人工审核工作。F1分数是精确率和召回率的调和平均值,它平衡了两者之间的矛盾,在实际应用中,既要避免漏报风险也要避免误报风险。F1分数可以提供一个单一的度量标准,使得能够在模型的精确性和覆盖性之间做出权衡。通过这些指标的综合考量,可以全面评估模型的性能,并据此调整风控规则,以达到最优的风险管理效果。
通过汇总准确率、召回率、精确率和F1分数的分析来评价新的风控规则的综合表现,生成新的风控规则效果评价报告。
应说明的是,将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,实现了对新风控规则性能的量化评估,然后为持续改进提供了依据,最后达到了持续优化风控系统的有益效果。
本实施例还提供一种基于人工智能的风控规则效果评价系统,包括,数据采集模块,负责收集车险理赔中的结构化数据和非结构化数据,并进行预处理;
非结构化数据深度学习分析模块,负责利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量;
理赔关系图谱构建模块,负责基于处理后的结构化数据和非结构化数据,构建理赔关系图谱;
图神经网络模型构建模块,负责利用风控特征向量和理赔关系图谱,构建图神经网络模型;
风控规则设定与优化模块,负责基于图神经网络模型的输出,设定新的风控规则;
风控规则效果评价模块,负责将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告。
本实施例还提供一种计算机设备,适用于基于人工智能的风控规则效果评价方法的情况,包括:存储器和处理器;存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,实现如上述实施例提出的基于人工智能的风控规则效果评价方法。
该计算机设备可以是终端,该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提出的实现基于人工智能的风控规则效果评价方法;存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
综上,本发明通过数据收集与预处理,实现了车险理赔中的结构化数据和非结构化数据的有效整合与标准化,确保了后续分析过程的准确性和可靠性。通过非结构化数据特征提取,实现了从不同类型的非结构化数据中提取关键特征,为后续建立图神经网络模型提供了丰富的信息来源。通过构建理赔关系图谱,构建了全面反映理赔过程中各种实体及其关系的图谱,为风险评估提供了直观的可视化工具,提升了风控决策依据。通过构建图神经网络模型,实现了自动化的风险预测功能,提高了欺诈检测的准确性,优化了风险控制流程。通过设定新的风控规则,实现了根据模型输出制定具体的风控策略,提升了欺诈检测效率。通过风控规则测试与评估,为持续改进提供了依据。
实施例2
参照表1,为本发明第二个实施例,为进一步验证本发明的先进性,给出了基于人工智能的风控规则效果评价方法的实验仿真数据。
验证所提出的车险理赔风控系统在处理理赔案例时相对于传统方法的改进,特别是在识别潜在欺诈行为方面的能力实验设备与软件包括计算机:Intel Core i7 CPU@3.60GHz,16GB RAM,操作系统:Windows 11,编程环境:Python 3.9,数据库:Neo4j 4.4.6,深度学习框架:TensorFlow 2.8.0。
1、收集了1000条车险理赔案例,其中包括500条结构化数据和500条非结构化数据。
结构化数据包括理赔记录和用户基本信息等。
非结构化数据包括事故现场照片、客户电话录音和文字描述等。
对结构化数据进行了清洗、填充缺失值和标准化等预处理操作。
对非结构化数据进行了尺寸标准化、归一化、采样率标准化、降噪、分词和去除停用词等预处理操作。
2、使用ResNet-50网络从事故现场照片中提取图像特征向量。
使用带有门控循环单元(GRU)的循环神经网络从客户电话录音中提取语音特征向量。
使用Word2Vec模型将文字描述中的每个单词转换为文字特征向量表示,并通过注意力机制聚合单词级别的文字特征向量,得到句子级别的文字特征向量。
整合上述特征向量得到风控特征向量。
3、用基于BiLSTM-CRF的命名实体识别模型从处理后的文字描述中识别出实体。
定义实体之间的关系类型,使用基于深度学习的关系抽取技术从结构化数据和非结构化数据中抽取实体之间的关系。
使用Neo4j图数据库创建图谱中的节点和边,并为节点和边添加属性。
4、将风控特征向量整合到理赔关系图谱节点中。
选择GCN作为图神经网络模型的架构,并通过图卷积操作更新节点特征。
定义损失函数和优化器,训练图神经网络模型。
5、使用K-means聚类算法对图神经网络模型输出的欺诈概率进行聚类。
根据聚类结果设定聚类阈值。
6、使用新的风控规则对新的理赔案例进行判断。
计算准确率、召回率、精确率和F1分数等指标。
具体如表1所示:
表1实验记录表
通过分析表1实验数据,可以看出以下几个方面的有益效果:
1、特征提取的有效性:
图片特征得分平均为0.85,表明ResNet-50网络能够有效地从事故现场照片中提取有用的信息。
语音特征得分平均为0.81,显示GRU循环神经网络能够较好地处理客户电话录音。
文本特征得分平均为0.88,表明Word2Vec模型结合注意力机制能够准确地捕捉文字描述中的关键信息。
2、节点特征整合的优势:
节点特征整合得分平均为0.86,说明将不同类型的特征向量整合在一起能更好地捕捉理赔案例中的复杂关系。
3、风险预测的准确性:
风险预测得分平均为0.82,显示出模型在识别潜在欺诈行为方面的高准确性。
实验结果显示,对于真实欺诈案例(真实标签为1),模型的预测得分较高,而对于非欺诈案例(真实标签为0),模型的预测得分较低。
4、与现有技术的比较:
与传统方法相比,本发明的风控系统能够更加精准地识别潜在的欺诈行为,减少了误报和漏报的情况。
通过对模型的准确率、召回率、精确率和F1分数的计算,可以看出本发明在识别欺诈行为方面的显著优势。
综上,通过实施本发明的内容,可以显著提高车险理赔过程中的欺诈检测能力,有效降低了误报和漏报的概率,从而提高了整个理赔系统的效率和准确性。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种基于人工智能的风控规则效果评价方法,其特征在于:包括,
收集车险理赔中的结构化数据和非结构化数据,并进行预处理;
利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量;
基于处理后的结构化数据和非结构化数据,构建理赔关系图谱;
利用风控特征向量和理赔关系图谱,构建图神经网络模型;
基于图神经网络模型的输出,设定新的风控规则;
将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告。
2.如权利要求1所述的基于人工智能的风控规则效果评价方法,其特征在于:所述结构化数据包括理赔记录和用户基本信息;
所述非结构化数据包括事故现场照片、客户电话录音和文字描述;
所述预处理包括数据清洗和归一化处理。
3.如权利要求1所述的基于人工智能的风控规则效果评价方法,其特征在于:利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量,包括如下步骤:
使用ResNet-50网络从事故现场照片中提取图像特征向量,表示为,
ximage=fResNet-50(I);
其中,ximage表示从ResNet-50的倒数第二层提取的图像特征向量,fResNet-50表示ResNet-50网络,I表示处理后的事故现场照片形成的适合网络输入的数据格式;
使用带有门控循环单元的循环神经网络从客户电话录音中提取语音特征向量,表示为,
xvoice=fGRU(V);
其中,xvoice表示从GRU的最后一个时间步提取的语音特征向量,V表示处理后的客户电话录音形成的适合网络输入的数据格式,fGRU表示带有门控循环单元的循环神经网络;
使用Word2Vec模型将文字描述中的每个单词转换为文字特征向量表示,然后通过注意力机制聚合单词级别的文字特征向量,得到句子级别的文字特征向量,表示为,
xword,i=fword2Vec(wi);
其中,xword,i表示当前第i个单词的文字特征向量,zsentence表示通过注意力机制聚合后得到的句子级别的文字特征向量,fWord2Vec表示Word2Vec模型,M表示句子中单词的数量,wi表示文字描述中的第i个单词,αi表示当前第i个单词的注意力权重;
将提取图像特征向量、语音特征向量和句子级别的文字特征向量进行整合,得到风控特征向量。
4.如权利要求3所述的基于人工智能的风控规则效果评价方法,其特征在于:基于处理后的结构化数据和非结构化数据,构建理赔关系图谱,包括如下步骤:
使用基于BiLSTM-CRF的命名实体识别模型从处理后的文字描述中识别出实体,将识别出的实体与结构化数据中的实体进行连接;
定义实体之间的关系类型,使用基于深度学习的关系抽取技术从结构化数据和非结构化数据中抽取实体之间的关系,并对抽取的关系进行验证;
使用Neo4j图数据库,根据实体识别的结果创建图谱中的节点,每个节点代表一个实体,根据关系抽取的结果创建图谱中的边,每个边代表实体之间的关系,为节点和边添加属性,图谱数据以图数据库支持的格式存储,最后得到理赔关系图谱。
5.如权利要求4所述的基于人工智能的风控规则效果评价方法,其特征在于:利用风控特征向量和理赔关系图谱,构建图神经网络模型,包括如下步骤:
将风控特征向量整合到对应的理赔关系图谱节点中,对整合后的图谱进行缺失值处理、异常值检测和节点属性标准化处理;
选择GCN作为图神经网络模型的架构,图谱中节点之间的连接关系设定为邻接矩阵,输入包含节点特征和边信息的图谱数据为输入特征矩阵,预测每个节点的欺诈概率,训练图神经网络模型,通过图卷积操作更新节点特征,表示为,
其中,H(l+1)表示经过第l+1层图卷积操作后得到的节点特征矩阵,H(l)表示第l层的节点特征矩阵,输入特征矩阵在第一层的节点特征矩阵中,W(l)表示第l层的权重矩阵,表示加了自环的邻接矩阵,A表示邻接矩阵,表示的度矩阵,σ表示ReLU函数;
定义损失函数和优化器;
利用损失函数和优化器来最小化损失并优化模型参数,最后得到构建好的图神经网络模型。
6.如权利要求5所述的基于人工智能的风控规则效果评价方法,其特征在于:基于图神经网络模型的输出,设定新的风控规则,包括如下步骤:
使用K-means聚类算法对图神经网络模型输出的欺诈概率进行聚类,以识别具有相似欺诈行为的模式;
根据聚类结果,设定聚类阈值;
当聚类结果大于等于聚类阈值时,表示存在欺诈行为;
当聚类结果小于聚类阈值时,表示不存在欺诈行为。
7.如权利要求6所述的基于人工智能的风控规则效果评价方法,其特征在于:将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告,包括如下步骤:
对于新的理赔案例,使用新的风控规则进行判断;
风控规则测试是指计算图神经网络模型的准确率、召回率、精确率、F1分数的指标来评价风控规则的效果;
通过汇总准确率、召回率、精确率和F1分数的分析来评价新的风控规则的综合表现,生成新的风控规则效果评价报告。
8.一种基于人工智能的风控规则效果评价系统,基于权利要求1~7任一所述的基于人工智能的风控规则效果评价方法,其特征在于:包括,
数据采集模块,负责收集车险理赔中的结构化数据和非结构化数据,并进行预处理;
非结构化数据深度学习分析模块,负责利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量;
理赔关系图谱构建模块,负责基于处理后的结构化数据和非结构化数据,构建理赔关系图谱;
图神经网络模型构建模块,负责利用风控特征向量和理赔关系图谱,构建图神经网络模型;
风控规则设定与优化模块,负责基于图神经网络模型的输出,设定新的风控规则;
风控规则效果评价模块,负责将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1~7任一所述的基于人工智能的风控规则效果评价方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1~7任一所述的基于人工智能的风控规则效果评价方法的步骤。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202411209185.7A CN119106921A (zh) | 2024-08-30 | 2024-08-30 | 一种基于人工智能的风控规则效果评价方法及系统 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202411209185.7A CN119106921A (zh) | 2024-08-30 | 2024-08-30 | 一种基于人工智能的风控规则效果评价方法及系统 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN119106921A true CN119106921A (zh) | 2024-12-10 |
Family
ID=93716779
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202411209185.7A Pending CN119106921A (zh) | 2024-08-30 | 2024-08-30 | 一种基于人工智能的风控规则效果评价方法及系统 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN119106921A (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119513558A (zh) * | 2025-01-16 | 2025-02-25 | 湖南千家万护网络科技服务有限公司 | 一种基于多模态预训练大模型的保险数据分析方法及系统 |
| CN120125355A (zh) * | 2025-05-13 | 2025-06-10 | 易点无忧(北京)网络科技有限责任公司 | 一种基于多模态数据融合的车辆互助理赔方法及系统 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111652704A (zh) * | 2020-06-09 | 2020-09-11 | 唐松 | 一种基于知识图谱和图深度学习的金融信用风险评估方法 |
| CN114140025A (zh) * | 2021-12-13 | 2022-03-04 | 之江实验室 | 面向多模态数据的车险欺诈行为预测系统、方法和装置 |
| CN114549216A (zh) * | 2022-01-18 | 2022-05-27 | 之江实验室 | 基于专家规则的人工智能模型结果溯源方法、系统、装置 |
| CN116562901A (zh) * | 2023-06-25 | 2023-08-08 | 福建润楼数字科技有限公司 | 基于机器学习的反欺诈规则自动生成方法 |
| CN117011030A (zh) * | 2023-08-17 | 2023-11-07 | 上海晓途网络科技有限公司 | 信贷逾期的风险预估方法、装置、设备及存储介质 |
-
2024
- 2024-08-30 CN CN202411209185.7A patent/CN119106921A/zh active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111652704A (zh) * | 2020-06-09 | 2020-09-11 | 唐松 | 一种基于知识图谱和图深度学习的金融信用风险评估方法 |
| CN114140025A (zh) * | 2021-12-13 | 2022-03-04 | 之江实验室 | 面向多模态数据的车险欺诈行为预测系统、方法和装置 |
| CN114549216A (zh) * | 2022-01-18 | 2022-05-27 | 之江实验室 | 基于专家规则的人工智能模型结果溯源方法、系统、装置 |
| CN116562901A (zh) * | 2023-06-25 | 2023-08-08 | 福建润楼数字科技有限公司 | 基于机器学习的反欺诈规则自动生成方法 |
| CN117011030A (zh) * | 2023-08-17 | 2023-11-07 | 上海晓途网络科技有限公司 | 信贷逾期的风险预估方法、装置、设备及存储介质 |
Non-Patent Citations (1)
| Title |
|---|
| 易东义;邓根强;董超雄;祝苗苗;吕周平;朱岁松;: "基于图卷积神经网络的医保欺诈检测算法", 计算机应用, no. 05, 31 December 2020 (2020-12-31), pages 36 - 41 * |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119513558A (zh) * | 2025-01-16 | 2025-02-25 | 湖南千家万护网络科技服务有限公司 | 一种基于多模态预训练大模型的保险数据分析方法及系统 |
| CN119513558B (zh) * | 2025-01-16 | 2025-06-06 | 湖南千家万护网络科技服务有限公司 | 一种基于多模态预训练大模型的保险数据分析方法及系统 |
| CN120125355A (zh) * | 2025-05-13 | 2025-06-10 | 易点无忧(北京)网络科技有限责任公司 | 一种基于多模态数据融合的车辆互助理赔方法及系统 |
| CN120125355B (zh) * | 2025-05-13 | 2025-07-18 | 易点无忧(北京)网络科技有限责任公司 | 一种基于多模态数据融合的车辆互助理赔方法及系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN119106921A (zh) | 一种基于人工智能的风控规则效果评价方法及系统 | |
| WO2018184518A1 (zh) | 微博数据处理方法、装置、计算机设备及存储介质 | |
| CN116468271A (zh) | 一种基于大数据的企业风险分析方法、系统及介质 | |
| CN120123700B (zh) | 一种基于人工智能的数据分析方法及系统 | |
| CN118886405B (zh) | 一种智能财务报表生成方法、装置、设备及介质 | |
| CN119090681A (zh) | 电子合同审核方法、装置、计算机设备和存储介质 | |
| CN117314623A (zh) | 融合外部知识的贷款欺诈预测方法、装置及存储介质 | |
| CN119003780B (zh) | 一种基于大数据的政务数据提取分析方法及系统 | |
| CN120541721A (zh) | 一种异常检测方法、设备、程序产品和存储介质 | |
| CN119629636A (zh) | 垃圾电话的识别方法、装置、计算机设备及存储介质 | |
| CN119474492A (zh) | 情绪指数构建方法、装置、计算机设备及存储介质 | |
| CN118734826A (zh) | 一种基于bert的文本主题提取及时空演化分析方法及系统 | |
| CN116796909A (zh) | 一种司法诉讼风险预测方法、装置、设备及存储介质 | |
| CN119599806B (zh) | 保单质检方法、装置、计算机设备及存储介质 | |
| CN119515556B (zh) | 理赔分析方法、装置、计算机设备及存储介质 | |
| CN119226909B (zh) | 一种基于大数据的用户信用分析系统 | |
| CN119379453B (zh) | 一种应用于小样本场景的客户经理风险模型构建方法 | |
| CN121190219A (zh) | 一种保险欺诈识别方法、系统、设备及存储介质 | |
| CN118070805A (zh) | 信息判别方法、装置、计算机设备及存储介质 | |
| CN119904301A (zh) | 一种基于半监督学习的企业信用评估方法及其相关设备 | |
| CN121029848A (zh) | 用户信息展示方法、装置及电子设备 | |
| CN120954024A (zh) | 电子合同风险识别方法、装置、设备及存储介质 | |
| CN119647984A (zh) | 一种评估软件系统开发延时的方法、装置及电子设备 | |
| CN119577449A (zh) | 一种样本自动化处理方法、装置、计算机设备及存储介质 | |
| CN120975940A (zh) | 一种基于大数据预算指标会计核算控制方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |