[go: up one dir, main page]

CN116011810A - 区域风险识别方法、装置、设备及存储介质 - Google Patents

区域风险识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116011810A
CN116011810A CN202211658951.9A CN202211658951A CN116011810A CN 116011810 A CN116011810 A CN 116011810A CN 202211658951 A CN202211658951 A CN 202211658951A CN 116011810 A CN116011810 A CN 116011810A
Authority
CN
China
Prior art keywords
feature
population
risk
characteristic
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211658951.9A
Other languages
English (en)
Inventor
吴勇
柯晨怡
陈晞
陈亚君
李宁
卢世温
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202211658951.9A priority Critical patent/CN116011810A/zh
Publication of CN116011810A publication Critical patent/CN116011810A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种区域风险识别方法、装置、设备及存储介质。本申请涉及人工智能技术领域。该方法包括:获取待检测区域内各资源关联事务在不同维度下的风险指标数据;提取各风险指标数据中的区域风险特征;根据区域风险特征,确定待检测区域的区域风险类别。上述方案,通过获取不同维度下的风险指标数据,提高了风险指标数据的丰富性和可扩展性;同时,根据从各风险指标数据中提取的区域风险特征,确定待检测区域的区域风险类别,提高了区域风险类别确定结果的准确度。

Description

区域风险识别方法、装置、设备及存储介质
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种区域风险识别方法、装置、设备及存储介质。
背景技术
随着社会经济的高速发展,各大资源存储机构会为客户办理各种资源租借业务,以满足客户的日常生活需求。但是,部分资源租借业务会存在异常情况。
由于资源关联机构对区域的风险识别关注度不够,导致区域资源存在异常的可能性加大,区域风险类别确定结果的准确度较低,无法及时进行风险预警或有效干预。
发明内容
本申请实施例提供一种区域风险识别方法、装置、设备及存储介质,用以提高区域风险类别确定结果的准确度。
第一方面,本申请实施例提供了一种区域风险识别方法,包括:
获取待检测区域内各资源关联事务在不同维度下的风险指标数据;
提取各风险指标数据中的区域风险特征;
根据区域风险特征,确定待检测区域的区域风险类别。
第二方面,本申请实施例还提供了一种区域风险识别装置,该装置包括:
风险指标数据获取模块,用于获取待检测区域内各资源关联事务在不同维度下的风险指标数据;
区域风险特征提取模块,用于提取各风险指标数据中的区域风险特征;
区域风险类别确定模块,用于根据区域风险特征,确定待检测区域的区域风险类别。
第三方面,本申请实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如本申请第一方面实施例提供的任意一种区域风险识别方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请第一方面实施例提供的任意一种区域风险识别方法。
第五方面,本申请实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如本申请第一方面实施例提供的任意一种区域风险识别方法。
本申请实施例提供的区域风险识别方案,通过获取待检测区域内各资源关联事务在不同维度下的风险指标数据;提取各风险指标数据中的区域风险特征;根据区域风险特征,确定待检测区域的区域风险类别。上述方案,通过获取不同维度下的风险指标数据,提高了风险指标数据的丰富性和可扩展性;同时,根据从各风险指标数据中提取的区域风险特征,确定待检测区域的区域风险类别,提高了区域风险类别确定结果的准确度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本申请实施例提供的一种区域风险识别方法的流程图;
图2是本申请实施例提供的另一种区域风险识别方法的流程图;
图3是本申请实施例提供的另一种区域风险识别方法的流程图;
图4是本申请实施例提供的一种区域风险识别装置的结构示意图;
图5是本申请实施例提供的一种实现区域风险识别方法的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。本申请技术方案中对风险指标数据、区域风险特征、初始特征数据和权重系数等数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
本申请实施例提供的各区域风险识别方法和区域风险识别装置,适用于对待检测区域进行风险识别的应用场景。本申请实施例所提供的各区域风险识别方法,可以由区域风险识别装置执行,该装置可采用软件和/或硬件的方式实现,并具体配置于具备一定计算和存储能力的电子设备中。
为了便于理解,首先对区域风险识别方法进行详细说明。
参见图1所示的区域风险识别方法,包括:
S110、获取待检测区域内各资源关联事务在不同维度下的风险指标数据。
其中,待检测区域是指需要进行异常检测的区域。本申请实施例对待检测区域不作具体限定,可以是技术人员根据经验进行设置。示例性的,待检测区域可以是行政区域、人为设定区域和商圈等中的至少一种。
其中,资源关联事务是指待检测区域进行与资源交互有关的事务。
本申请实施例对不同维度的数量和/或内容不作具体限定,可以是技术人员根据经验进行设置。示例性的,不同维度可以包括资源租借方维度、资源担保方维度、汇率维度、资源租借机构维度和利率维度等中的至少一种。
其中,风险指标数据是指进行资源关联事务时,生成的风险评估数据。本申请实施例对风险指标数据的内容不作任何限定,可以是技术人员根据经验进行设置。
举例说明,若待检测区域为人为设定区域或商圈,则风险指标数据可以包括资源租借方的租借信息、资源租借方的租借时间、资源担保方的担保信息、资源租借时的汇率、资源租借机构的信息和资源租借时的利率等中的至少一种;若待检测区域为行政区域,则风险指标数据可以包括资源租借方的风险数据、资源担保方的风险数据、资源租借时的汇率风险数据、资源租借机构的风险数据和资源租借时的利率风险数据等中的至少一种。其中,资源租借方的风险数据是指资源租借方无法按照规定的归还时间和归还资源,进行资源偿还的风险值。资源担保方的风险数据是指为资源租借方提供担保的主体,不能在资源租借出现问题时,履行担保义务的风险值。资源租借时的汇率风险数据是指资源租借方在租借资源时,受汇率波动影响带来损失的风险值。资源租借机构的风险数据是指资源租借机构提供资源长租或资源短租时,需要承担的资源租借方无法及时偿还资源的风险值。资源租借时的利率风险数据是指资源租借利率,与市场基准利率不匹配所产生的风险值。
具体的,获取待检测区域内各资源关联事务在至少一个维度下的风险指标数据。
S120、提取各风险指标数据中的区域风险特征。
其中,区域风险特征是指风险指标数据中可以用于进行风险评估的数据。
本申请实施例对提取区域风险特征的方式不作任何限定,可以是技术人员根据经验进行设置。
具体的,从至少一个风险指标数据中,提取相应的区域风险特征。
需要说明的是,在进行区域风险特征提取之前,可以对各风险指标数据进行预处理,以提高区域风险特征提取的准确度。本申请实施例对预处理方式不作任何限定,可以是技术人员根据经验进行设置。
示例性的,可以对各风险指标数据进行标准化处理,以统一各风险指标数据的量纲。
可选的,针对各类风险指标数据,可以确定该类风险指标数据的至少一个统计数据;根据各统计数据,对该类风险指标数据进行标准化处理。其中,统计数据可以包括最大值、最小值、平均值和标准差等中的至少一种。
具体的,可以通过以下公式,对各风险指标数据进行标准化处理:
Figure BDA0004012902320000061
其中,xt'表示标准化处理后的风险指标数据;xt表示风险指标数据;min(xt)表示风险指标数据的最小值;max(xt)表示风险指标数据的最大值。
S130、根据区域风险特征,确定待检测区域的区域风险类别。
其中,区域风险类别可以用于量化待检测区域的异常程度。可选的,区域风险类别可以是直接确定待检测区域有无异常,用于对待检测区域的异常程度进行定性描述。具体的,区域风险类别可以包括有异常和无异常。或者可选的,区域风险类别可以是确定待检测区域的异常概率,用于对待检测区域的异常程度进行定量描述。相应的,可以确定区域风险类别所属于的预设概率区间,不同概率区间对应不同的异常等级;根据预设概率区间对应的异常等级,确定待检测区域是否存在异常。本申请实施例对预设概率区间的划分和/或数量不作任何限定,可以是技术人员根据经验进行设置。举例说明,若预设概率区间包括一级概率区间和二级概率区间;其中,一级概率区间对应一级异常,二级概率区间对应二级异常;若区域风险类别处于一级概率区间,则待检测区域的异常等级为一级异常,即待检测区域无异常;若区域风险类别处于二级概率区间,则待检测区域的异常等级为二级异常,即待检测区域存在异常。
具体的,根据待检测区域的各区域风险特征,确定该待检测区域的区域风险类别。本申请实施例对确定区域风险类别的方式不作任何限定,可以是技术人员根据经验进行设置。
本申请实施例提供的区域风险识别方案,通过获取待检测区域内各资源关联事务在不同维度下的风险指标数据;提取各风险指标数据中的区域风险特征;根据区域风险特征,确定待检测区域的区域风险类别。上述方案,通过获取不同维度下的风险指标数据,提高了风险指标数据的丰富性和可扩展性;同时,根据从各风险指标数据中提取的区域风险特征,确定待检测区域的区域风险类别,提高了区域风险类别确定结果的准确度。
在上述实施例的基础上,本申请还提供了一个可选实施例。在该可选实施例中,对区域风险特征的提取机制进行了优化改进。
进一步的,将“提取各风险指标数据中的区域风险特征”操作,细化为“对各风险指标数据进行特征提取,得到初始特征数据;确定初始特征数据的权重系数;根据初始特征数据和权重系数,确定降噪阈值;根据降噪阈值和初始特征数据,确定区域风险特征”,从而提供了一种完善的区域风险特征的提取机制。需要说明的是,在本申请实施例中未详述的部分,可参见其他实施例的表述。
参见图2所示的区域风险识别方法,包括:
S210、获取待检测区域内各资源关联事务在不同维度下的风险指标数据。
S220、对各风险指标数据进行特征提取,得到初始特征数据。
其中,初始特征数据是指对风险指标数据进行粗提取的数据。具体的,初始特征数据中包含冗余噪声。
具体的,从各风险指标数据中,提取出相应的初始特征数据。
S230、确定初始特征数据的权重系数。
其中,本申请实施例对权重系数的大小不作任何限定,可以是技术人员根据经验或需要进行设置。示例性的,权重系数可以通过深度学习的注意力机制生成。
需要说明的是,不同初始特征数据的权重系数可以相同,也可以不同,本申请实施例对此不作任何限定。
S240、根据初始特征数据和权重系数,确定降噪阈值。
其中,降噪阈值可以用于去除初始特征数据中的冗余噪声。本申请实施例对降噪阈值的确定方式不作任何限定,可以是技术人员根据经验进行设置,还可以是通过大量试验反复确定。
在一个可选实施例中,降噪阈值可以人为根据经验进行设置。上述方案,确定降噪阈值的效率较低、准确性较差,且当初始特征数据发生变化时,需要重新设置。
为了提高确定降噪阈值的效率和确定结果准确度,实现降噪阈值的实时动态更新。在另一可选实施例中,可以将深度学习的注意力机制加入降噪阈值的确定过程中,实现降噪阈值的动态更新。
S250、根据降噪阈值和初始特征数据,确定区域风险特征。
本申请实施例中,根据降噪阈值对初始特征数据进行软阈值处理。具体的,将初始特征数据中的信号域转化为接近于零的数值域空间。其中,将信号域中的信号特征转化为正特征或负特征;将噪声特征转化为接近零的特征;之后,通过降噪阈值将接近零的噪声特征的特征值置于零。
示例性的,可以通过以下公式,对初始特征数据进行处理,得到区域风险特征:
Figure BDA0004012902320000081
其中,y表示经过处理后的初始特征数据中的特征值;x表示初始特征数据中的任一特征值;τ表示降噪阈值。
根据上式可知,当初始特征数据中的任一特征值属于[-τ,τ]之间时,该特征值会被置零处理;若该特征值大于降噪阈值τ或小于降噪阈值τ的负数时,则会呈现线性变化。这样做的好处是,使得初始特征数据中的特征数据得到了极大保留。
具体的,本申请实施例中可以通过上述公式,对初始特征数据中的特征值进行处理,得到相应的区域风险特征。
S260、根据区域风险特征,确定待检测区域的区域风险类别。
本申请实施例提供的区域风险识别方案,通过将提取各风险指标数据中的区域风险特征操作,细化为对各风险指标数据进行特征提取,得到初始特征数据;确定初始特征数据的权重系数;根据初始特征数据和权重系数,确定降噪阈值;根据降噪阈值和初始特征数据,确定区域风险特征,通过引入降噪阈值,对提取的初始特征进行处理,得到区域风险特征,避免了初始特征数据中的冗余噪声,对后续处理的影响;同时,确定的区域风险特征中任一特征值的导数非0即1,避免出现梯度弥散的情况,提高了根据区域风险特征确定区域风险类别的准确度。
在上述实施例的基础上,可以通过使用深度残差收缩神经网络(DRSN),进行区域风险特征的提取。其中,深度残差收缩神经网络中可以包括全局池化层和卷积层。深度残差收缩神经网络可以将深度学习注意力机制和降噪阈值的确定相结合,形成了降噪阈值的动态确定。具体的,深度残差收缩神经网络通过注意力机制生成权重系数,并将权重系数与全局池化层输出的初始特征数据相乘,得到降噪阈值;然后将卷积层的输出结果经过降噪阈值进行降噪,得到区域风险特征。需要说明的是,深度残差收缩神经网络中的不同特征通道对应的降噪阈值可以相同,也可以不同,本申请实施例对此不作任何限定。
在上述各技术方案的基础上,本申请还提供了一个可选实施例。在该可选实施例中,将区域风险类别的确定机制进行了优化改进。
进一步的,将“根据区域风险特征,确定待检测区域的区域风险类别”操作,细化为“将区域风险特征输入至训练好的深度森林中,根据深度森林中级联的随机森林层依次进行分类预测,得到待检测区域的至少一个参考风险类别;根据各参考风险类别,确定待检测区域的区域风险类别”,从而提供了一种完善的区域风险类别的确定机制。需要说明的是,在本申请实施例中未详述的部分,可参见其他实施例的表述。
参见图3所示的区域风险识别方法,包括:
S310、获取待检测区域内各资源关联事务在不同维度下的风险指标数据。
S320、提取各风险指标数据中的区域风险特征。
S330、将区域风险特征输入至训练好的深度森林中,根据深度森林中级联的随机森林层依次进行分类预测,得到待检测区域的至少一个参考风险类别。
其中,深度森林可以用于进行待检测区域的区域风险类别的确定。具体的,深度森林是一种基于随机森林的多层级连森林架构,通过“集成再集成”的模式进行表征学习。在深度森林中,每层森林的组成单元是随机森林和完全随机森林,而随机森林和完全随机森林的最小组成单元是决策树。本申请实施例对深度森林的层数不作具体限定,可以是技术人员根据经验进行设置。示例性的,深度森林的层数可以通过自适应确定,即进行K折交叉验证,每训练完成一层森林时,若验证精度不存在明显提升,则森林的层数不再增加。
其中,深度森林中包含随机森林和完全随机森林。其中,随机森林是由普通随机树构成。完全随机森林是由完全随机树构成。具体的,普通随机树和完全随机树的区别在于节点的划分方式不同。组成随机森林的决策树在节点划分时,在整个特征空间中先选取
Figure BDA0004012902320000111
个区域风险特征作为节点划分的候选特征,其中d为区域风险特征总个数。之后在候选特征中选择具有最佳Gini(基尼)值的区域风险特征作为节点划分的属性特征。组成完全随机树森林的决策树则具有完全随机的性质,即在划分节点时,随机选取特征空间中的区域风险特征作为节点划分的属性特征。
其中,参考风险类别是指需要进行确定的待检测区域的风险类别。可选的,参考风险类别可以是为待检测区域提供有无异常的定性依据;或者可选的,参考风险类别还可以是为待检测区域提供异常概率的定量依据。
在一个可选实施例中,可以将区域风险特征输入至深度森林中,深度森林中级联的随机森林层直接输出参考风险类别。
在另一个可选实施例中,可以通过引入类别预测概率,进行参考风险类别的确定。具体的,可以针对深度森林中的任一随机森林层,将在前级联层级的随机森林中不同决策树的类别预测概率,与区域风险特征进行特征融合,得到待处理特征;其中,首部层级的待处理特征为区域风险特征;将待处理特征输入至在后级联层级的随机森林中,得到在后级联层级的随机森林中不同决策树的类别预测概率;将深度森林中尾部层级的随机森林中不同决策树的类别预测概率,作为待检测区域的各参考风险类别。
其中,类别预测概率是指深度森林中任一决策树所生成的待检测区域的风险类别概率。待处理特征是指深度森林中每一层森林所需要进行处理的特征数据。
需要说明的是,在每一层森林中,所有决策树的类别预测概率可以通过投票的方式产生。将该层森林中任一森林的各个决策树生成的类别预测概率相加,再进行数值平均化,所得概率为该森林的参考风险类别。其中,每个森林中的各个决策树的类别预测概率的和为1,且该层森林中,各森林的参考风险类别的和也为1。示例性的,每个森林的参考风险类别可以是该森林中各决策树的类别预测概率的最大值。
可以理解的是,通过引入类别预测概率,进行参考风险类别的确定,可以进一步提高参考风险类别确定结果的准确度。
需要说明的是,在训练每一层森林时,输入每一层森林的待处理样本特征通过级联的方式进行输入。当每一层森林训练完成后,该层森林中会输出各样本参考风险类别;将这一层森林输出的样本参考风险类别进行连接,之后再与输入的样本区域风险特征连接;将连接后的数据输入至下一层森林中。其中,样本区域风险特征是指已知有无异常的样本区域的样本风险评估数据。待处理样本特征是指深度森林中每一层森林所需要进行处理的样本特征数据。样本参考风险类别是指深度森林中任一层森林所生成的样本区域的风险类别。
本申请实施例对深度森林中的各超参数的确定方式不作任何限定,可以是技术人员根据经验进行设置或调整。在一个可选实施例中,深度森林中的各超参数可以是人为设置的。
为了提高深度森林中各超参数的准确度,在另一可选实施例中,可以动态设置超参数。具体的,深度森林中的各超参数采用以下方式确定:构建包括各超参数的初始值的初始种群特征;根据初始种群特征,在超参数解空间进行特征搜索和/或解空间收缩迭代,得到目标种群特征;将目标种群特征中的各特征值,作为深度森林中相应超参数的参数值。
其中,超参数是指深度森林中的框架参数。具体的,深度森林中的各超参数包括下述至少一种:随机森林的层数、各层随机森林的个数、随机森林中决策树的数量和决策树的最大分叉数。
可以理解的是,通过引入随机森林的层数、各层随机森林的个数、随机森林中决策树的数量和决策树的最大分叉数,提高了深度森林中超参数的丰富性,使得超参数的完整性提高。
其中,初始值是指超参数在起始时刻的数值。初始种群特征是指包括各超参数的初始值的特征数据。目标种群特征是指包括各处理后超参数的参数值的特征数据。
其中,特征搜索是指通过在解空间中搜索的方式,寻求最优解。解空间收缩是指通过缩小解空间范围的方式,逐步缩小特征搜索的搜索范围。本申请实施例对选取特征搜索或解空间收缩的方式不作任何限定,可以是技术人员根据经验进行设置。
可以理解的是,通过引入特征搜索和解空间收缩的方式,确定超参数的参数值,提高了确定超参数的参数值的准确度。
在一个可选实施例中,可以人为根据经验或需要,从特征搜索和解空间收缩中选取超参数的确定方式。
在另一个可选实施例中,可以通过引入随机概率,从特征搜索和解空间收缩中选取超参数的确定方式。具体的,针对任一特征迭代过程,根据本次迭代的随机概率,确定目标特征处理方式;其中,目标特征处理方式为特征搜索或解空间收缩;基于目标特征处理方式对应特征处理逻辑,对前次迭代所得的当前种群特征进行特征更新,得到本次迭代所得的当前种群特征;其中,首次迭代所得的当前种群特征为初始种群特征;将最末次迭代所得的当前种群特征,作为目标种群特征。
其中,随机概率是指任一特征迭代过程中选择特征搜索或解空间收缩的概率。目标特征处理方式是指确定超参数的参数值的方法。具体的,目标特征处理方式可以是特征搜索或解空间收缩。特征搜索或解空间收缩均有对应的特征处理逻辑。其中,特征处理逻辑是指确定超参数的参数值的过程。当前种群特征是指包括当前时刻,进行一次特征迭代过程后的各超参数的参数值的特征数据。
本申请实施例对特征迭代的数量不作任何限定,可以是技术人员根据经验进行设置。
示例性的,可以通过以下公式,根据随机概率,确定目标特征处理方式:
Figure BDA0004012902320000141
其中,
Figure BDA0004012902320000142
表示本次迭代所得的当前种群特征;p表示随机概率。
可以理解的是,通过引入随机概率,确定目标特征处理方式,避免了人为确定目标特征处理方式可能出现确定结果错误的情况,为确定目标特征处理方式提供了数据支撑,提高了确定目标特征处理方式的准确度。
在一个可选实施例中,若目标特征处理方式为特征搜索,则基于目标特征处理方式对应特征处理逻辑,对前次迭代所得的当前种群特征进行特征更新,得到本次迭代所得的当前种群特征,包括:根据距离系数,确定参考种群特征;确定参考种群特征与前次迭代所得的当前种群特征之间的特征搜索距离;根据特征搜索距离,在超参数解空间中朝向参考种群特征进行特征搜索,得到本次迭代的当前种群特征。
其中,本申请实施例对距离系数的大小不作任何限定,可以是技术人员根据经验进行设置。参考种群特征可以用于为确定本次迭代的当前种群特征提供依据。可选的,参考种群特征可以是通过随机搜索确定的任一种群特征,参考种群特征还可以是通过最优搜索确定的最优的种群特征。特征搜索距离是指特征搜索方式下,前次迭代的当前种群特征与参考种群特征之间的距离。
本申请实施例对根据距离系数,确定参考种群特征的方式不作具体限定。在一个可选实施例中,可以人为根据距离系数,确定参考种群特征。
为了提高确定参考种群特征的准确度,在另一可选实施例中,可以引入随机搜索条件和最优搜索条件,确定参考种群特征。具体的,若距离系数满足随机搜索条件,则选取超参数解空间中的任一候选种群特征作为参考种群特征;若距离系数满足最优搜索条件,则选取超参数解空间中的适配度较高的候选种群特征作为参考种群特征;其中,随机搜索条件与最优搜索条件互补。
其中,超参数解空间可以用于存储至少一组超参数的参数值的特征数据。候选种群特征是指包括超参数解空间中的一组超参数的参数值的特征数据。本申请实施例对随机搜索条件和/或最优搜索条件的内容不作任何限定,可以是技术人员根据经验进行设置,只需保证随机搜索条件与最优搜索条件互补即可。示例性的,随机搜索条件可以是指距离系数的绝对值大于或等于1;最优搜索条件可以是指距离系数的绝对值小于1。适配度是指超参数解空间中的各候选种群特征可以作为本次迭代的当前种群特征的概率。
需要说明的是,当距离系数满足最优搜索条件时,可以选取超参数解空间中适配度最高的候选种群特征作为参考种群特征。
可以理解的是,通过引入随机搜索条件和最优搜索条件,确定参考种群特征,为参考种群特征的选取提供了判断依据,提高了确定的参考种群特征的准确度。
进一步的,根据确定的参考种群特征,确定特征搜索距离。示例性的,若距离系数满足随机搜索条件,则可以通过以下公式,确定特征搜索距离:
Figure BDA0004012902320000161
Figure BDA0004012902320000162
其中,
Figure BDA0004012902320000163
表示随机搜索下的特征搜索距离;C表示系数向量,即为距离系数;
Figure BDA0004012902320000164
表示参考种群特征,即为超参数解空间中的任一候选种群特征;
Figure BDA0004012902320000165
表示前次迭代所得的当前种群特征;
Figure BDA0004012902320000166
表示[0,1]之间的随机向量。
示例性的,若距离系数满足最优搜索条件,则可以通过以下公式,确定特征搜索距离:
Figure BDA0004012902320000167
其中,
Figure BDA0004012902320000168
表示最优搜索下的特征搜索距离;
Figure BDA0004012902320000169
表示参考种群特征,即为超参数解空间中的适配度较高的候选种群特征。
进一步的,根据特征搜索距离,在超参数解空间中朝向参考种群特征进行特征搜索,得到本次迭代的当前种群特征。在一个可选实施例中,可以根据确定的特征搜索距离,直接确定本次迭代的当前种群特征。
为了提高确定的本次迭代的当前种群特征的准确度,在另一个可选实施例中,可以对特征搜索距离进行更新。具体的,根据距离系数,更新特征搜索距离;根据更新后的特征搜索距离,在超参数解空间中朝向参考种群特征进行特征搜索,得到本次迭代的当前种群特征。
示例性的,若距离系数满足随机搜索条件,可以根据距离系数
Figure BDA0004012902320000171
更新特征搜索距离
Figure BDA0004012902320000172
根据更新后的特征搜索距离
Figure BDA0004012902320000173
通过以下公式,确定本次迭代的当前种群特征:
Figure BDA0004012902320000174
Figure BDA0004012902320000175
其中,
Figure BDA0004012902320000176
表示随机搜索下本次迭代的当前种群特征;
Figure BDA0004012902320000177
表示系数向量,即为距离系数;
Figure BDA0004012902320000178
表示随机搜索下更新后的特征搜索距离;
Figure BDA0004012902320000179
表示在迭代过程中从2线性下降为0的收敛系数。
示例性的,若距离系数满足最优搜索条件,可以根据距离系数
Figure BDA00040129023200001710
更新特征搜索距离
Figure BDA00040129023200001711
根据更新后的特征搜索距离
Figure BDA00040129023200001712
通过以下公式,确定本次迭代的当前种群特征:
Figure BDA00040129023200001713
其中,
Figure BDA00040129023200001714
表示最优搜索下本次迭代的当前种群特征;
Figure BDA00040129023200001715
表示最优搜索下更新后的特征搜索距离。
需要说明的是,本申请实施例中可以根据距离系数
Figure BDA00040129023200001716
的大小,确定采用随机搜索方式或最优搜索方式。
可以理解的是,通过更新特征搜索距离,确定本次迭代的当前种群特征,避免了特征搜索距离在迭代过程中保持固定,导致确定的本次迭代的当前种群特征不准确,提高了确定本次迭代的当前种群特征的准确度。
本申请实施例中,通过引入参考种群特征和特征搜索距离,确定本次迭代的当前种群特征,提高了确定本次迭代的当前种群特征的准确度。
在另一个可选实施例中,若目标特征处理方式为解空间收缩,则基于目标特征处理方式对应特征处理逻辑,对前次迭代所得的当前种群特征进行特征更新,得到本次迭代所得的当前种群特征,包括:将超参数解空间中的适配度较高的候选种群特征作为参考种群特征;确定参考种群特征与前次迭代所得的当前种群特征之间的空间搜索距离;根据预设盘旋系数,更新空间搜索距离;根据更新后的空间搜索距离,在超参数解空间中朝向参考种群特征进行特征搜索,得到本次迭代所得的当前种群特征。
其中,空间搜索距离是指解空间收缩方式下,参考种群特征与前次迭代的当前种群特征之间的距离。本申请实施例对预设盘旋系数的大小不作任何限定,可以是技术人员根据经验进行设置,还可以是通过大量试验反复确定。
示例性的,可以通过以下公式,确定空间搜索距离:
Figure BDA0004012902320000181
其中,
Figure BDA0004012902320000182
表示空间搜索距离。
进一步的,根据预设盘旋系数,对确定的空间搜索距离
Figure BDA0004012902320000183
进行更新;根据更新后的空间搜索距离
Figure BDA0004012902320000184
通过以下公式,确定本次迭代的当前种群特征:
Figure BDA0004012902320000185
其中,
Figure BDA0004012902320000186
表示解空间收缩下本次迭代的当前种群特征;
Figure BDA0004012902320000187
表示更新后的空间搜索距离;b表示预设盘旋系数,是一个常数;l表示[-1,1]之间的随机数。
可以理解的是,通过引入预设盘旋系数,对空间搜索距离进行更新,提高了空间搜索距离的准确度,进而提高了本次迭代所得的当前种群特征的准确度,避免了迭代过程中根据固定的空间搜索距离,确定本次迭代的当前种群特征不准确。
S340、根据各参考风险类别,确定待检测区域的区域风险类别。
示例性的,在深度森林的层数自适应确定以后,分类层森林中的随机森林和完全随机森林对各参考风险类别进行分类,将各参考风险类别进行逐类别取平均,最后将均值最大的各参考风险类别对应的风险类别作为待检测区域的区域风险类别。
本申请实施例提供的区域风险识别方案,通过将根据区域风险特征,确定待检测区域的区域风险类别操作,细化为将区域风险特征输入至训练好的深度森林中,根据深度森林中级联的随机森林层依次进行分类预测,得到待检测区域的至少一个参考风险类别;根据各参考风险类别,确定待检测区域的区域风险类别,通过引入深度森林,进行区域风险类别的确定,提高了区域风险类别确定结果的准确度;同时,深度森林可以对不同待检测区域进行区域风险类别的确定,提高了确定区域风险类别的适用性;并且,通过使用深度森林进行区域风险类别的确定,提高了区域风险类别的准确度,鲁棒性高,泛化能力强。
作为上述各区域风险识别方法的实现,本申请实施例还提供了一种实施区域风险识别方法的执行装置的可选实施例。
参见图4所示的一种区域风险识别装置,包括:风险指标数据获取模块410、区域风险特征提取模块420和区域风险类别确定模块430。其中,
风险指标数据获取模块410,用于获取待检测区域内各资源关联事务在不同维度下的风险指标数据;
区域风险特征提取模块420,用于提取各风险指标数据中的区域风险特征;
区域风险类别确定模块430,用于根据区域风险特征,确定待检测区域的区域风险类别。
本申请实施例提供的区域风险识别方案,通过风险指标数据获取模块获取待检测区域内各资源关联事务在不同维度下的风险指标数据;通过区域风险特征提取模块提取各风险指标数据中的区域风险特征;通过区域风险类别确定模块根据区域风险特征,确定待检测区域的区域风险类别。上述方案,通过获取不同维度下的风险指标数据,提高了风险指标数据的丰富性和可扩展性;同时,根据从各风险指标数据中提取的区域风险特征,确定待检测区域的区域风险类别,提高了区域风险类别确定结果的准确度。
可选的,区域风险特征提取模块420,包括:
初始特征数据获取单元,用于对各风险指标数据进行特征提取,得到初始特征数据;
权重系数确定单元,用于确定初始特征数据的权重系数;
降噪阈值确定单元,用于根据初始特征数据和权重系数,确定降噪阈值;
区域风险特征确定单元,用于根据降噪阈值和初始特征数据,确定区域风险特征。
可选的,区域风险类别确定模块430,包括:
参考风险类别获取单元,用于将区域风险特征输入至训练好的深度森林中,根据深度森林中级联的随机森林层依次进行分类预测,得到待检测区域的至少一个参考风险类别;
区域风险类别确定单元,用于根据各参考风险类别,确定待检测区域的区域风险类别。
可选的,参考风险类别获取单元,包括:
待处理特征获取子单元,用于针对深度森林中的任一随机森林层,将在前级联层级的随机森林中不同决策树的类别预测概率,与区域风险特征进行特征融合,得到待处理特征;其中,首部层级的待处理特征为区域风险特征;
类别预测概率获取子单元,用于将待处理特征输入至在后级联层级的随机森林中,得到在后级联层级的随机森林中不同决策树的类别预测概率;
参考风险类别确定子单元,用于将深度森林中尾部层级的随机森林中不同决策树的类别预测概率,作为待检测区域的各参考风险类别。
可选的,该装置还包括超参数确定单元,超参数确定单元,包括:
初始种群特征构建子单元,用于构建包括各超参数的初始值的初始种群特征;
目标种群特征获取子单元,用于根据初始种群特征,在超参数解空间进行特征搜索和/或解空间收缩迭代,得到目标种群特征;
参数值确定子单元,用于将目标种群特征中的各特征值,作为深度森林中相应超参数的参数值。
可选的,目标种群特征获取子单元,包括:
目标特征处理方式确定从单元,用于针对任一特征迭代过程,根据本次迭代的随机概率,确定目标特征处理方式;其中,目标特征处理方式为特征搜索或解空间收缩;
当前种群特征获取从单元,用于基于目标特征处理方式对应特征处理逻辑,对前次迭代所得的当前种群特征进行特征更新,得到本次迭代所得的当前种群特征;其中,首次迭代所得的当前种群特征为初始种群特征;
目标种群特征获取从单元,用于将最末次迭代所得的当前种群特征,作为目标种群特征。
可选的,若目标特征处理方式为特征搜索,则当前种群特征获取从单元,具体用于:
根据距离系数,确定参考种群特征;
确定参考种群特征与前次迭代所得的当前种群特征之间的特征搜索距离;
根据特征搜索距离,在超参数解空间中朝向参考种群特征进行特征搜索,得到本次迭代的当前种群特征。
可选的,当前种群特征获取从单元,在执行根据距离系数,确定参考种群特征方法时,具体用于:
若距离系数满足随机搜索条件,则选取超参数解空间中的任一候选种群特征作为参考种群特征;
若距离系数满足最优搜索条件,则选取超参数解空间中的适配度较高的候选种群特征作为参考种群特征;
其中,随机搜索条件与最优搜索条件互补。
可选的,当前种群特征获取从单元,在执行根据特征搜索距离,在超参数解空间中朝向参考种群特征进行特征搜索,得到本次迭代的当前种群特征方法时,具体用于:
根据距离系数,更新特征搜索距离;
根据更新后的特征搜索距离,在超参数解空间中朝向参考种群特征进行特征搜索,得到本次迭代的当前种群特征。
可选的,若目标特征处理方式为解空间收缩,则当前种群特征获取从单元,具体用于:
将超参数解空间中的适配度较高的候选种群特征作为参考种群特征;
确定参考种群特征与前次迭代所得的当前种群特征之间的空间搜索距离;
根据预设盘旋系数,更新空间搜索距离;
根据更新后的空间搜索距离,在超参数解空间中朝向参考种群特征进行特征搜索,得到本次迭代所得的当前种群特征。
可选的,深度森林中的各超参数包括下述至少一种:随机森林的层数、各层随机森林的个数、随机森林中决策树的数量和决策树的最大分叉数。
本申请实施例所提供的区域风险识别装置可执行本申请任意实施例所提供的区域风险识别方法,具备执行各区域风险识别方法相应的功能模块和有益效果。
图5是本申请实施例提供一种实现区域风险识别方法的电子设备的结构示意图。图5显示的电子设备512仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,电子设备512以通用计算设备的形式表现。电子设备512的组件可以包括但不限于:一个或者多个处理器或者处理单元516,系统存储器528,连接不同系统组件(包括系统存储器528和处理单元516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)530和/或高速缓存存储器532。电子设备512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储器528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储器528中,这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本申请所描述的实施例中的功能和/或方法。
电子设备512也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该电子设备512交互的设备通信,和/或与使得该电子设备512能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,电子设备512还可以通过网络适配器520与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器520通过总线518与电子设备512的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备512使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元516通过运行存储在系统存储器528中的多个程序中其他程序的至少一个,从而执行各种功能应用以及数据处理,例如实现本申请实施例所提供的区域风险识别方法。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时用于执行本申请实施例所提供的区域风险识别方法。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本申请实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现如本申请任一实施例所提供的区域风险识别方法。
计算机程序产品在实现的过程中,可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (25)

1.一种区域风险识别方法,其特征在于,包括:
获取待检测区域内各资源关联事务在不同维度下的风险指标数据;
提取各所述风险指标数据中的区域风险特征;
根据所述区域风险特征,确定所述待检测区域的区域风险类别。
2.根据权利要求1所述的方法,其特征在于,所述提取所述风险指标数据中的区域风险特征,包括:
对各所述风险指标数据进行特征提取,得到初始特征数据;
确定所述初始特征数据的权重系数;
根据所述初始特征数据和所述权重系数,确定降噪阈值;
根据所述降噪阈值和所述初始特征数据,确定所述区域风险特征。
3.根据权利要求1所述的方法,其特征在于,所述根据所述区域风险特征,确定所述待检测区域的区域风险类别,包括:
将所述区域风险特征输入至训练好的深度森林中,根据所述深度森林中级联的随机森林层依次进行分类预测,得到所述待检测区域的至少一个参考风险类别;
根据各所述参考风险类别,确定所述待检测区域的区域风险类别。
4.根据权利要求3所述的方法,其特征在于,所述将所述区域风险特征输入至训练好的深度森林中,根据所述深度森林中级联的随机森林层依次进行分类预测,得到所述待检测区域的至少一个参考风险类别,包括:
针对所述深度森林中的任一随机森林层,将在前级联层级的随机森林中不同决策树的类别预测概率,与所述区域风险特征进行特征融合,得到待处理特征;其中,首部层级的待处理特征为所述区域风险特征;
将待处理特征输入至在后级联层级的随机森林中,得到在后级联层级的随机森林中不同决策树的类别预测概率;
将所述深度森林中尾部层级的随机森林中不同决策树的类别预测概率,作为所述待检测区域的各所述参考风险类别。
5.根据权利要求3所述的方法,其特征在于,所述深度森林中的各超参数采用以下方式确定:
构建包括各超参数的初始值的初始种群特征;
根据所述初始种群特征,在超参数解空间进行特征搜索和/或解空间收缩迭代,得到目标种群特征;
将所述目标种群特征中的各特征值,作为所述深度森林中相应超参数的参数值。
6.根据权利要求5所述的方法,其特征在于,所述根据所述初始种群特征,在超参数解空间进行特征搜索和/或解空间收缩迭代,得到目标种群特征,包括:
针对任一特征迭代过程,根据本次迭代的随机概率,确定目标特征处理方式;其中,所述目标特征处理方式为特征搜索或解空间收缩;
基于所述目标特征处理方式对应特征处理逻辑,对前次迭代所得的当前种群特征进行特征更新,得到本次迭代所得的当前种群特征;其中,首次迭代所得的当前种群特征为所述初始种群特征;
将最末次迭代所得的当前种群特征,作为所述目标种群特征。
7.根据权利要求6所述的方法,其特征在于,若所述目标特征处理方式为特征搜索,则所述基于所述目标特征处理方式对应特征处理逻辑,对前次迭代所得的当前种群特征进行特征更新,得到本次迭代所得的当前种群特征,包括:
根据距离系数,确定参考种群特征;
确定所述参考种群特征与前次迭代所得的当前种群特征之间的特征搜索距离;
根据所述特征搜索距离,在所述超参数解空间中朝向所述参考种群特征进行特征搜索,得到本次迭代所述的当前种群特征。
8.根据权利要求7所述的方法,其特征在于,所述根据距离系数,确定参考种群特征,包括:
若所述距离系数满足随机搜索条件,则选取所述超参数解空间中的任一候选种群特征作为所述参考种群特征;
若所述距离系数满足最优搜索条件,则选取所述超参数解空间中的适配度较高的候选种群特征作为所述参考种群特征;
其中,所述随机搜索条件与所述最优搜索条件互补。
9.根据权利要求7所述的方法,其特征在于,所述根据所述特征搜索距离,在所述超参数解空间中朝向所述参考种群特征进行特征搜索,得到本次迭代所述的当前种群特征,包括:
根据所述距离系数,更新所述特征搜索距离;
根据更新后的特征搜索距离,在所述超参数解空间中朝向所述参考种群特征进行特征搜索,得到本次迭代所述的当前种群特征。
10.根据权利要求6所述的方法,其特征在于,若所述目标特征处理方式为解空间收缩,则所述基于所述目标特征处理方式对应特征处理逻辑,对前次迭代所得的当前种群特征进行特征更新,得到本次迭代所得的当前种群特征,包括:
将所述超参数解空间中的适配度较高的候选种群特征作为参考种群特征;
确定所述参考种群特征与前次迭代所得的当前种群特征之间的空间搜索距离;
根据预设盘旋系数,更新所述空间搜索距离;
根据更新后的空间搜索距离,在所述超参数解空间中朝向所述参考种群特征进行特征搜索,得到本次迭代所得的当前种群特征。
11.根据权利要求5-10任一项所述的方法,其特征在于,所述深度森林中的各超参数包括下述至少一种:随机森林的层数、各层随机森林的个数、随机森林中决策树的数量和决策树的最大分叉数。
12.一种区域风险识别装置,其特征在于,包括:
风险指标数据获取模块,用于获取待检测区域内各资源关联事务在不同维度下的风险指标数据;
区域风险特征提取模块,用于提取各所述风险指标数据中的区域风险特征;
区域风险类别确定模块,用于根据所述区域风险特征,确定所述待检测区域的区域风险类别。
13.根据权利要求12所述的装置,其特征在于,所述区域风险特征提取模块,包括:
初始特征数据获取单元,用于对各所述风险指标数据进行特征提取,得到初始特征数据;
权重系数确定单元,用于确定所述初始特征数据的权重系数;
降噪阈值确定单元,用于根据所述初始特征数据和所述权重系数,确定降噪阈值;
区域风险特征确定单元,用于根据所述降噪阈值和所述初始特征数据,确定所述区域风险特征。
14.根据权利要求12所述的装置,其特征在于,所述区域风险类别确定模块,包括:
参考风险类别获取单元,用于将所述区域风险特征输入至训练好的深度森林中,根据所述深度森林中级联的随机森林层依次进行分类预测,得到所述待检测区域的至少一个参考风险类别;
区域风险类别确定单元,用于根据各所述参考风险类别,确定所述待检测区域的区域风险类别。
15.根据权利要求14所述的装置,其特征在于,所述参考风险类别获取单元,包括:
待处理特征获取子单元,用于针对所述深度森林中的任一随机森林层,将在前级联层级的随机森林中不同决策树的类别预测概率,与所述区域风险特征进行特征融合,得到待处理特征;其中,首部层级的待处理特征为所述区域风险特征;
类别预测概率获取子单元,用于将待处理特征输入至在后级联层级的随机森林中,得到在后级联层级的随机森林中不同决策树的类别预测概率;
参考风险类别确定子单元,用于将所述深度森林中尾部层级的随机森林中不同决策树的类别预测概率,作为所述待检测区域的各所述参考风险类别。
16.根据权利要求14所述的装置,其特征在于,所述装置还包括超参数确定单元,所述超参数确定单元,包括:
初始种群特征构建子单元,用于构建包括各超参数的初始值的初始种群特征;
目标种群特征获取子单元,用于根据所述初始种群特征,在超参数解空间进行特征搜索和/或解空间收缩迭代,得到目标种群特征;
参数值确定子单元,用于将所述目标种群特征中的各特征值,作为所述深度森林中相应超参数的参数值。
17.根据权利要求16所述的装置,其特征在于,所述目标种群特征获取子单元,包括:
目标特征处理方式确定从单元,用于针对任一特征迭代过程,根据本次迭代的随机概率,确定目标特征处理方式;其中,所述目标特征处理方式为特征搜索或解空间收缩;
当前种群特征获取从单元,用于基于所述目标特征处理方式对应特征处理逻辑,对前次迭代所得的当前种群特征进行特征更新,得到本次迭代所得的当前种群特征;其中,首次迭代所得的当前种群特征为所述初始种群特征;
目标种群特征获取从单元,用于将最末次迭代所得的当前种群特征,作为所述目标种群特征。
18.根据权利要求17所述的装置,其特征在于,若所述目标特征处理方式为特征搜索,则所述当前种群特征获取从单元,具体用于:
根据距离系数,确定参考种群特征;
确定所述参考种群特征与前次迭代所得的当前种群特征之间的特征搜索距离;
根据所述特征搜索距离,在所述超参数解空间中朝向所述参考种群特征进行特征搜索,得到本次迭代所述的当前种群特征。
19.根据权利要求18所述的装置,其特征在于,所述当前种群特征获取从单元,在执行所述根据距离系数,确定参考种群特征方法时,具体用于:
若所述距离系数满足随机搜索条件,则选取所述超参数解空间中的任一候选种群特征作为所述参考种群特征;
若所述距离系数满足最优搜索条件,则选取所述超参数解空间中的适配度较高的候选种群特征作为所述参考种群特征;
其中,所述随机搜索条件与所述最优搜索条件互补。
20.根据权利要求18所述的装置,其特征在于,所述当前种群特征获取从单元,在执行所述根据所述特征搜索距离,在所述超参数解空间中朝向所述参考种群特征进行特征搜索,得到本次迭代所述的当前种群特征方法时,具体用于:
根据所述距离系数,更新所述特征搜索距离;
根据更新后的特征搜索距离,在所述超参数解空间中朝向所述参考种群特征进行特征搜索,得到本次迭代所述的当前种群特征。
21.根据权利要求17所述的装置,其特征在于,若所述目标特征处理方式为解空间收缩,则所述当前种群特征获取从单元,具体用于:
将所述超参数解空间中的适配度较高的候选种群特征作为参考种群特征;
确定所述参考种群特征与前次迭代所得的当前种群特征之间的空间搜索距离;
根据预设盘旋系数,更新所述空间搜索距离;
根据更新后的空间搜索距离,在所述超参数解空间中朝向所述参考种群特征进行特征搜索,得到本次迭代所得的当前种群特征。
22.根据权利要求16-21任一项所述的装置,其特征在于,所述深度森林中的各超参数包括下述至少一种:随机森林的层数、各层随机森林的个数、随机森林中决策树的数量和决策树的最大分叉数。
23.一种电子设备,其特征在于,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-11中任一项所述的区域风险识别方法。
24.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-11中任一所述的区域风险识别方法。
25.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-11中任一项所述的区域风险识别方法。
CN202211658951.9A 2022-12-22 2022-12-22 区域风险识别方法、装置、设备及存储介质 Pending CN116011810A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211658951.9A CN116011810A (zh) 2022-12-22 2022-12-22 区域风险识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211658951.9A CN116011810A (zh) 2022-12-22 2022-12-22 区域风险识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116011810A true CN116011810A (zh) 2023-04-25

Family

ID=86027601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211658951.9A Pending CN116011810A (zh) 2022-12-22 2022-12-22 区域风险识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116011810A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117011063A (zh) * 2023-09-25 2023-11-07 中国建设银行股份有限公司 客户交易风险预测处理方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310114A (zh) * 2018-03-27 2019-10-08 阿里巴巴集团控股有限公司 对象分类方法、装置、服务器及存储介质
CN111523793A (zh) * 2020-04-21 2020-08-11 北京易点淘网络技术有限公司 一种信用租赁业务中的风险监控预警方法及系统
CN112508300A (zh) * 2020-12-21 2021-03-16 北京百度网讯科技有限公司 建立风险预测模型的方法、区域风险预测方法及对应装置
CN113159389A (zh) * 2021-03-25 2021-07-23 大连海事大学 一种基于深度森林生成对抗网络的金融时间序列预测方法
CN113298438A (zh) * 2021-06-22 2021-08-24 中国平安财产保险股份有限公司 区域风险等级的评估方法、装置、计算机设备及存储介质
CN113344432A (zh) * 2021-06-29 2021-09-03 云南电网有限责任公司信息中心 一种区域性客户服务风险的判断方法及装置
CN113657993A (zh) * 2021-08-19 2021-11-16 中国平安财产保险股份有限公司 信用风险识别方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310114A (zh) * 2018-03-27 2019-10-08 阿里巴巴集团控股有限公司 对象分类方法、装置、服务器及存储介质
CN111523793A (zh) * 2020-04-21 2020-08-11 北京易点淘网络技术有限公司 一种信用租赁业务中的风险监控预警方法及系统
CN112508300A (zh) * 2020-12-21 2021-03-16 北京百度网讯科技有限公司 建立风险预测模型的方法、区域风险预测方法及对应装置
CN113159389A (zh) * 2021-03-25 2021-07-23 大连海事大学 一种基于深度森林生成对抗网络的金融时间序列预测方法
CN113298438A (zh) * 2021-06-22 2021-08-24 中国平安财产保险股份有限公司 区域风险等级的评估方法、装置、计算机设备及存储介质
CN113344432A (zh) * 2021-06-29 2021-09-03 云南电网有限责任公司信息中心 一种区域性客户服务风险的判断方法及装置
CN113657993A (zh) * 2021-08-19 2021-11-16 中国平安财产保险股份有限公司 信用风险识别方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117011063A (zh) * 2023-09-25 2023-11-07 中国建设银行股份有限公司 客户交易风险预测处理方法及装置
CN117011063B (zh) * 2023-09-25 2023-12-29 中国建设银行股份有限公司 客户交易风险预测处理方法及装置

Similar Documents

Publication Publication Date Title
CN111460250B (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
TWI723528B (zh) 電腦執行的事件風險評估方法及裝置、電腦可讀儲存媒體以及計算設備
CN109189767B (zh) 数据处理方法、装置、电子设备及存储介质
US20210319093A1 (en) Using multimodal model consistency to detect adversarial attacks
CN112632980A (zh) 一种基于大数据深度学习的企业分类方法、系统及电子设备
CN111368878B (zh) 一种基于ssd目标检测的优化方法、计算机设备和介质
CN112883990A (zh) 数据分类方法及装置、计算机存储介质、电子设备
CN111767390B (zh) 技能词评估方法及装置、电子设备、计算机可读介质
CN119830907A (zh) 一种大语言模型的临床文本中tnm分期预测方法及系统
CN113762308A (zh) 分类模型的训练方法、分类方法、装置、介质及设备
CN119106921A (zh) 一种基于人工智能的风控规则效果评价方法及系统
CN113836297B (zh) 文本情感分析模型的训练方法及装置
US20240386897A1 (en) Systems and methods for adaptive preprocessor selection for efficient multi-modal classification
CN114429140A (zh) 一种基于相关图信息进行因果推断的案由认定方法及系统
US11954685B2 (en) Method, apparatus and computer program for selecting a subset of training transactions from a plurality of training transactions
CN116011810A (zh) 区域风险识别方法、装置、设备及存储介质
CN117112395A (zh) Api异常访问检测方法、装置、设备和介质
CN114860945A (zh) 基于规则信息的高质量噪音检测方法与装置
CN120148488A (zh) 语音识别模型获取方法、装置、计算机设备、可读存储介质和程序产品
CN116304033B (zh) 一种基于半监督、双层多分类的诉请识别方法
CN113806558B (zh) 问题选择方法、知识图谱构建方法、装置及电子设备
CN116932487A (zh) 一种基于数据段落划分的量化式数据分析方法及系统
Idhom et al. Evaluation of CART and XGBoost Methods on Customer Loan Risk Prediction Based on Consumer Behavior.
CN116028880B (zh) 训练行为意图识别模型的方法、行为意图识别方法及装置
CN116703616A (zh) 核保方法、装置、终端设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination