具体实施方式
本说明书一个或多个实施例提供一种风险账户的识别方法及装置,用于解决现有的风险账户识别准确率低的问题。
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书一个或多个实施例保护的范围。
图1是根据本说明书一实施例的一种风险账户的识别方法的示意性流程图,如图1所示,该方法包括:
S102,获取多个待识别账户之间的账户交易信息。
其中,账户交易信息包括交易时间、交易对象、交易关系、交易量、交易类型、交易备注等。
交易对象可以是生活账户或风险账户,生活账户可以是不具有风险、可用于进行生活类交易(如购买车票、水电费缴费等交易)的账户。
交易关系用于表征交易双方的交易资源流向。例如,账户A和账户B之间进行了资源交易,具体为账户A向账户B转入了X量的资源,则账户A和账户B的交易关系(即资源流向)为:账户A→账户B。其中,箭头“→”表示资源流向。
本实施例中,多个待识别账户之间预先发生了资源交易。资源交易可包括直接资源交易和间接资源交易,直接资源交易即为两个账户之间不经过其他账户、直接进行交易的交易方式,间接资源交易即为两个账户之间经过其他账户间接进行交易的交易方式。
例如,账户A、账户B和账户C之间进行了如下资源交易:账户A→账户B→账户C,则账户A和账户B之间进行了直接资源交易,账户A和账户C之间进行了间接资源交易。
S104,根据账户交易信息,构建多个待识别账户对应的交易网络。
其中,各待识别账户分别对应交易网络中的各网络节点,每相邻两个网络节点之间的边对应一次交易。
在构建交易网络时,若两个待识别账户之间发生了直接资源交易,则该两个待识别账户对应的网络节点之间产生一条边,且每条边为有向边,边的方向表征了待识别账户之间的交易关系(即资源流向)。
S106,确定各待识别账户对应的网络节点在交易网络中的第一网络层级,及,确定各待识别账户的第一账户特征信息。
其中,第一账户特征信息可包括账户属性信息、账户行为信息、账户交易信息等。账户交易信息的内容已在上述步骤中详述,此处不再赘述。
账户属性信息可包括实名认证的姓名、职业、个人资质等信息。账户行为信息可包括缴费行为(如水电煤气缴费行为等)、信贷行为(如信用卡还款、金融借贷行为等)、保险理财消费行为(如购买保险、基金)、航旅出行行为(如交通工具购票、高速缴费等)等任意具有生活特征的信息。
S108,根据第一网络层级、第一账户特征信息、预先训练的账户识别模型及预先构建的账户风险识别架构,确定各待识别账户是否属于风险账户。
其中,账户识别模型由多个样本账户的账户特征信息训练得到,账户风险识别架构为根据各样本账户对应的网络层级及账户识别模型构建而成,样本账户包括风险账户和生活账户。账户识别模型的训练及账户风险识别架构的构建将在下述实施例中详细说明。
采用本说明书一个或多个实施例的技术方案,通过构建多个待识别账户对应的交易网络,并确定各待识别账户对应的网络节点在交易网络中的网络层级和各待识别账户的账户特征信息,进而根据各待识别账户对应的网络层级、账户特征信息、预先训练的账户识别模型及预先构建的账户风险识别架构,确定各待识别账户是否属于风险账户。由于账户识别模型由多个样本账户(包括生活账户和风险账户)的账户特征信息训练得到,账户风险识别架构为根据各样本账户对应的网络层级及账户识别模型构建而成,因此该技术方案能够基于生活账户的特征对待识别账户进行识别,从而避免将生活账户误认为风险账户的情况;并且,由于各待识别账户对应的网络层级能够体现出交易网络中待识别账户与交易源头之间的距离远近,而距离交易源头越远的账户风险越低,因此将待识别账户对应的网络层级作为识别依据,进一步提升了风险账户识别的准确率。
下面详细说明本说明书一个或多个实施例提供的风险账户的识别方法。
在获取多个待识别账户之间的账户交易信息(即S102)之前,可根据账户交易记录来确定符合第一预设条件的的多个待识别账户。
其中,账户交易记录可包括交易时间、交易量等。第一预设条件可包括交易频率高于预设频率、单次交易量大于第一预设阈值、预设时长内的总交易量大于第二预设阈值等。单次交易量可从历史交易记录中直接获取,预设时长内的总交易量则需通过从账户交易记录中获取到的单次交易量统计得到。
例如,第一预设条件为24小时内的总交易量大于预设阈值X,若账户A在24小时内的总交易量(包括转入和转出的)达到预设阈值X,则将账户A确定为待识别账户。
本实施例中,通过预先确定符合第一预设条件的待识别账户,使得待识别账户基于第一预设条件进行了初步筛选,而不符合第一预设条件的则不认为具有风险,这种情况下无需执行上述风险账户识别方法,因此可大大省去了不必要的风险账户识别流程。
确定符合第一预设条件的的多个待识别账户之后,执行S102,即获取多个待识别账户之间的账户交易信息。
在一个实施例中,获取多个待识别账户之间的账户交易信息时,可获取各待识别账户之间符合第二预设条件的账户交易信息,并基于符合第二预设条件的账户交易信息构建交易网络。
其中,第二预设条件可包括交易时间位于预设时间段内、交易层级小于或等于第三预设阈值等。交易层级基于交易关系确定。例如,账户A、账户B和账户C之间的交易关系如下:账户A→账户B→账户C,则账户A、账户B和账户C的交易层级为3。
例如,第二预设条件为交易时间位于最近24小时内,则可获取待识别账户在最近24小时内的账户交易信息。再例如,第二预设条件为交易层级小于或等于5,则可获取待识别账户5级内(包括5级)的账户交易信息。当然,第二预设条件也可以是上述多项条件的结合。
获取到多个待识别账户之间的账户交易信息之后,执行S104,即根据账户交易信息构建多个待识别账户对应的交易网络。在构建交易网络时,若两个待识别账户之间发生了直接资源交易,则该两个待识别账户对应的网络节点之间产生一条边,且每条边为有向边,边的方向表征了待识别账户之间的交易关系(即资源流向)。
以风险账户为洗钱账户为例,待识别账户可能是洗钱账户,也可能是生活账户。对多个待识别账户构建的交易网络如图2所示,在图2中,示意性地以“洗钱账户”和“生活账户”标识出了各网络节点处的待识别账户。但需要说明的是,图2中对各待识别账户的区分仅是一种举例,实际应用中各网络节点对应的待识别账户均可能是洗钱账户或生活账户。
如图2所示,待识别账户包括涉案账户V0、洗钱账户A1、洗钱账户B1、洗钱账户C1、洗钱账户A2、洗钱账户B2、洗钱账户C2、洗钱账户Ak1、洗钱账户Bk2、洗钱账户Ck3、生活账户L1、生活账户L2、生活账户Ln等。图2中的“账户层级”即为各待识别账户对应的网络节点在交易网络中的网络层级,可用正整数的大小表示账户层级的高低,账户层级越高,距离交易源账户(即涉案账户V0)的距离越远。图2中的箭头表示交易关系(即资源流向)。
构建多个待识别账户对应的交易网络之后,执行S106,即确定各待识别账户对应的网络节点在交易网络中的第一网络层级,及,确定各待识别账户的第一账户特征信息。
其中,第一账户特征信息可包括账户属性信息、账户行为信息、账户交易信息等。账户属性信息可包括实名认证的姓名、职业、个人资质等信息。账户行为信息可包括缴费行为(如水电煤气缴费行为等)、信贷行为(如信用卡还款、金融借贷行为等)、保险理财消费行为(如购买保险、基金)、航旅出行行为(如交通工具购票、高速缴费等)等任意具有生活特征的信息。账户交易信息包括交易时间、交易对象、交易关系、交易量、交易类型、交易备注等。
在一个实施例中,可按照以下步骤确定各待识别账户对应的网络节点在交易网络中的第一网络层级:
步骤A1、根据各待识别账户之间的交易关系确定各待识别账户中的交易源账户,并将交易源账户对应的网络节点确定为交易网络中的初始网络节点;以及,确定初始网络节点在交易网络中的第一网络层级为初始层级。
上述实施例中提及,各待识别账户之间的交易关系在交易网络图中以有向边表示,因此,可根据有向边的方向确定出各待识别账户中的交易源账户。
以图2所示的交易网络为例,根据有向边的方向,可确定出各待识别账户中的交易源账户为“涉案账户V0”,交易源账户“涉案账户V0”所在的第一网络层级(即零级)即为初始层级。
步骤A2、根据预设的最短路径算法,确定初始网络节点到其他各网络节点之间的最短节点距离。
其中,每相邻两个网络节点之间的节点距离为单位距离。
预设的最短路径算法可以是现有的任一种最短路径算法,如Dijkstra算法、Floyd算法等。由于最短路径算法已为现有技术,因此这里不再赘述。
步骤A3、根据最短节点距离,确定其他各网络节点在交易网络中的第一网络层级。
仍以图2所示的交易网络为例,假设单位距离为1,由于每相邻两个网络节点之间的节点距离为单位距离(即为1),因此可根据各网络节点与初始网络节点之间的最短节点距离来确定网络层级。在初始网络节点对应的网络层级为0级的情况下,某网络节点与初始网络节点之间的节点距离的数值,即为该网路节点对应的网络层级。
例如,洗钱账户A1与涉案账户V0之间的节点距离为1,由于涉案账户V0对应的网络层级为0,因此洗钱账户A1对应的网络层级为1。再例如,洗钱账户Ak1与涉案账户V0之间的节点距离为k,由于涉案账户V0对应的网络层级为0,因此洗钱账户Ak1对应的网络层级为k。
确定出各待识别账户对应的网络节点在交易网络中的第一网络层级以及各待识别账户的第一账户特征信息之后,执行S108,即根据各待识别账户对应的第一网络层级、第一账户特征信息、预先训练的账户识别模型及预先构建的账户风险识别架构,确定各待识别账户是否属于风险账户。
首先说明账户识别模型的训练过程及账户风险识别架构的构建过程。
在一个实施例中,可按照如下步骤训练账户识别模型:
步骤B1、获取多个样本账户及各样本账户分别对应的标签信息。
其中,样本账户包括风险账户和生活账户。标签信息包括风险账户标签和生活账户标签。
步骤B2、获取各样本账户对应的账户特征信息。
其中,账户特征信息可包括账户属性信息、账户行为信息、账户交易信息等。账户属性信息可包括实名认证的姓名、职业、个人资质等信息。账户行为信息可包括缴费行为(如水电煤气缴费行为等)、信贷行为(如信用卡还款、金融借贷行为等)、保险理财消费行为(如购买保险、基金)、航旅出行行为(如交通工具购票、高速缴费等)等任意具有生活特征的信息。账户交易信息包括交易时间、交易对象、交易关系、交易量、交易类型、交易备注等。
步骤B3、基于各样本账户对应的账户特征信息及标签信息进行模型训练,得到账户识别模型。
本实施例中,账户识别模型的输入数据为各样本账户对应的账户特征信息及标签信息;输出数据则可以是属于风险账户的概率值,如80%,也可以是属于风险账户的准确结果,如“是”或“否”。
在另一个实施例中,账户识别模型可包括账户特征信息与账户类型之间的映射关系,账户类型包括风险账户和生活账户。即,提取出各样本账户的账户特征信息后,即可建立各账户特征信息与账户类型之间的映射关系。
在一个实施例中,账户识别模型的输出数据包括待识别账户属于风险账户的概率值。账户风险识别架构包括网络层级、上述概率值以及待识别账户的风险程度之间的映射关系,且上述概率值可采用0到1之间的分数等级表征,即概率值落入0到1之间的哪个分数等级中。基于此,可按照如下步骤构建账户风险识别架构:
步骤C1、针对多个具有交易关系的样本账户,构建多个样本账户对应的交易网络。
其中,各样本账户分别对应交易网络中的各网络节点,每相邻两个网络节点之间的边对应一次交易。在构建交易网络时,若两个样本账户之间发生了直接资源交易,则该两个样本账户对应的网络节点之间产生一条边,且每条边均为有向边,边的方向表征了样本账户之间的交易关系(即资源流向)。
步骤C2、确定各样本账户对应的网络节点在交易网络中的网络层级。
该步骤中,确定各样本账户对应的网络层级的方法和上述实施例中确定待识别网络对应的第一网络层级的方法类似,此处不再赘述。
步骤C3、根据各样本账户对应的网络层级和账户识别模型对应的分数等级,构建账户风险识别架构。
其中,账户识别模型对应的分数等级为预先根据账户识别模型的输出数据划分得到。本实施例中,账户识别模型的输出数据为待识别账户属于风险账户的概率值。由于概率值位于0到1之间,因此分数等级是被划分为0到1之间的多个等级范围,如分数等级包括以下几个等级:[0,S1)、[S1,S2)……[Sk,Sk+1)……[Sn,1]。
图3示出了本说明书一实施例中账户风险识别架构的示意图。在图3所示实施例中,账户风险识别架构采用表格形式表征。账户识别模型分数等级包括以下n个等级:[0,S1)、[S1,S2)……[Sk,Sk+1)……[Sn,1],网络层级包括0、1、2…K…N,表格中的“高”、“中”、“低”分别表示账户的风险程度。例如,若基于网络层级和账户识别模型分数等级确定出风险程度为高,则可直接确定该账户为风险账户;若基于网络层级和账户识别模型分数等级确定出风险程度为低,则可直接确定该账户为生活账户;若基于网络层级和账户识别模型分数等级确定出风险程度为中,则可进一步通过人工或其它方法确定该账户为风险账户或生活账户。
基于上述实施例中训练账户识别模型及构建账户风险识别架构的方法,可按照如下步骤确定各待识别账户是否属于风险账户:
步骤D1、将第一账户特征信息作为账户识别模型的输入数据,以确定待识别账户属于风险账户的第一概率值。
步骤D2、根据第一概率值、第一网络层级及映射关系,确定第一概率值及第一网络层级对应的目标风险程度。
以图3所示的账户风险识别架构为例,首先确定第一概率值落入了哪个账户识别模型分数等级中,然后基于确定的账户识别模型分数等级以及待识别账户对应的第一网络层级,确定出待识别账户的风险程度。
步骤D3、根据目标风险程度确定各待识别账户是否属于风险账户。
在一个实施例中,风险程度包括高风险程度、低风险程度或中风险程度。基于此,若目标风险程度为高风险程度,则确定待识别账户属于风险账户。若目标风险程度为低风险程度,则确定待识别账户属于生活账户。若目标风险程度为中风险程度,则确定待识别账户对应的网络节点的相邻节点对应的账户类别,基于相邻节点对应的账户类别确定待识别账户是否属于风险账户。
在一个实施例中,若目标风险程度为中风险程度,则基于相邻节点对应的账户类别确定待识别账户是否属于风险账户。具体的,若相邻节点对应的账户类别为风险账户,则确定待识别账户属于风险账户;若相邻节点对应的账户类别为生活账户,则确定待识别账户属于生活账户。若相邻节点对应的账户类别既包括风险账户,也包括生活账户,则可进一步通过人工或其它方法确定待识别账户属于生活账户或风险账户。
可见,上述实施例中,通过构建多个待识别账户的交易网络,进而结合待识别账户在交易网络中的网络层级、待识别账户的账户特征信息以及预先训练的账户识别模型及预先构建的账户风险识别架构来确定待识别账户是否属于风险账户。由于账户识别模型由多个样本账户(包括生活账户和风险账户)的账户特征信息训练得到,账户风险识别架构为根据各样本账户对应的网络层级及账户识别模型构建而成,因此该技术方案能够基于生活账户的特征对待识别账户进行识别,从而避免将生活账户误认为风险账户的情况;并且,由于各待识别账户对应的网络层级能够体现出交易网络中待识别账户与交易源头之间的距离远近,而距离交易源头越远的账户风险越低,因此将待识别账户对应的网络层级作为识别依据,进一步提升了风险账户识别的准确率。
综上,已经对本主题的特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
以上为本说明书一个或多个实施例提供的风险账户的识别方法,基于同样的思路,本说明书一个或多个实施例还提供一种风险账户的识别装置。
图4是根据本说明书一实施例的一种风险账户的识别装置的示意性框图,如图4所示,该装置包括:
第一获取模块410,获取多个待识别账户之间的账户交易信息;所述账户交易信息包括交易时间、交易对象、交易关系中的至少一项。
构建模块420,根据所述账户交易信息,构建所述多个待识别账户对应的交易网络;各所述待识别账户分别对应所述交易网络中的各网络节点;每相邻两个所述网络节点之间的边对应一次交易。
第一确定模块430,确定各所述待识别账户对应的所述网络节点在所述交易网络中的第一网络层级;及,确定各所述待识别账户的第一账户特征信息;所述第一账户特征信息包括以下至少一项:账户属性信息、账户行为信息、所述账户交易信息。
第二确定模块440,根据所述第一网络层级、所述第一账户特征信息、预先训练的账户识别模型及预先构建的账户风险识别架构,确定各所述待识别账户是否属于风险账户;所述账户识别模型由多个样本账户的账户特征信息训练得到;所述账户风险识别架构为根据各所述样本账户对应的网络层级及所述账户识别模型构建而成;所述样本账户包括风险账户和生活账户。
在一个实施例中,所述装置还包括:
第三确定模块,所述获取多个待识别账户之间的账户交易信息之前,根据账户交易记录,确定符合第一预设条件的的所述多个待识别账户;所述账户交易记录包括交易时间和/或交易量;所述第一预设条件包括以下至少一项:交易频率高于预设频率、单次交易量大于第一预设阈值、预设时长内的总交易量大于第二预设阈值。
在一个实施例中,所述第一获取模块410包括:
获取单元,获取各所述待识别账户之间符合第二预设条件的所述账户交易信息;所述第二预设条件包括以下至少一项:所述交易时间位于预设时间段内、交易层级小于或等于第三预设阈值;
其中,所述交易层级基于所述交易关系确定。
在一个实施例中,所述装置还包括:
第二获取模块,获取所述样本账户及各所述样本账户分别对应的标签信息;所述标签信息包括风险账户标签和生活账户标签;
第三获取模块,获取各所述样本账户对应的所述账户特征信息;
模型训练模块,基于各所述样本账户对应的所述账户特征信息及所述标签信息进行模型训练,得到所述账户识别模型。
在一个实施例中,所述账户识别模型的输出数据包括属于所述风险账户的概率值;所述账户风险识别架构包括各网络层级、各概率值以及风险程度之间的映射关系;
所述第二确定模块440包括:
第一确定单元,将所述第一账户特征信息作为所述账户识别模型的输入数据,以确定所述待识别账户属于所述风险账户的第一概率值;
第二确定单元,根据所述第一概率值、所述第一网络层级及所述映射关系,确定所述第一概率值及所述第一网络层级对应的目标风险程度;
第三确定单元,根据所述目标风险程度确定各所述待识别账户是否属于所述风险账户。
在一个实施例中,所述风险程度包括高风险程度、低风险程度或中风险程度;
所述第三确定单元,若所述目标风险程度为所述高风险程度,则确定所述待识别账户属于所述风险账户;若所述目标风险程度为所述低风险程度,则确定所述待识别账户属于所述生活账户;若所述目标风险程度为所述中风险程度,则确定所述待识别账户对应的网络节点的相邻节点对应的账户类别;基于所述相邻节点对应的账户类别确定所述待识别账户是否属于所述风险账户。
在一个实施例中,所述第三确定单元,若所述相邻节点对应的账户类别为所述风险账户,则确定所述待识别账户属于所述风险账户;若所述相邻节点对应的账户类别为所述生活账户,则确定所述待识别账户属于所述生活账户。
在一个实施例中,所述第一确定模块430包括:
第四确定单元,根据所述交易关系确定各所述待识别账户中的交易源账户,将所述交易源账户对应的网络节点确定为所述交易网络中的初始网络节点;以及,确定所述初始网络节点在所述交易网络中的所述第一网络层级为初始层级。
第五确定单元,根据预设的最短路径算法,确定所述初始网络节点到其他各网络节点之间的最短节点距离;其中,每相邻两个网络节点之间的节点距离为单位距离。
第六确定单元,根据所述最短节点距离,确定其他各所述网络节点在所述交易网络中的所述第一网络层级。
采用本说明书一个或多个实施例的装置,通过构建多个待识别账户对应的交易网络,并确定各待识别账户对应的网络节点在交易网络中的网络层级和各待识别账户的账户特征信息,进而根据各待识别账户对应的网络层级、账户特征信息、预先训练的账户识别模型及预先构建的账户风险识别架构,确定各待识别账户是否属于风险账户。由于账户识别模型由多个样本账户(包括生活账户和风险账户)的账户特征信息训练得到,账户风险识别架构为根据各样本账户对应的网络层级及账户识别模型构建而成,因此该装置能够基于生活账户的特征对待识别账户进行识别,从而避免将生活账户误认为风险账户的情况;并且,由于各待识别账户对应的网络层级能够体现出交易网络中待识别账户与交易源头之间的距离远近,而距离交易源头越远的账户风险越低,因此将待识别账户对应的网络层级作为识别依据,进一步提升了风险账户识别的准确率。
本领域的技术人员应可理解,上述风险账户的识别装置能够用来实现前文所述的风险账户的识别方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
基于同样的思路,本说明书一个或多个实施例还提供一种风险账户的识别设备,如图5所示。风险账户的识别设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器501和存储器502,存储器502中可以存储有一个或一个以上存储应用程序或数据。其中,存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对风险账户的识别设备中的一系列计算机可执行指令。更进一步地,处理器501可以设置为与存储器502通信,在风险账户的识别设备上执行存储器502中的一系列计算机可执行指令。风险账户的识别设备还可以包括一个或一个以上电源503,一个或一个以上有线或无线网络接口504,一个或一个以上输入输出接口505,一个或一个以上键盘506。
具体在本实施例中,风险账户的识别设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对风险账户的识别设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取多个待识别账户之间的账户交易信息;所述账户交易信息包括交易时间、交易对象、交易关系中的至少一项;
根据所述账户交易信息,构建所述多个待识别账户对应的交易网络;各所述待识别账户分别对应所述交易网络中的各网络节点;每相邻两个所述网络节点之间的边对应一次交易;
确定各所述待识别账户对应的所述网络节点在所述交易网络中的第一网络层级;及,确定各所述待识别账户的第一账户特征信息;所述第一账户特征信息包括以下至少一项:账户属性信息、账户行为信息、所述账户交易信息;
根据所述第一网络层级、所述第一账户特征信息、预先训练的账户识别模型及预先构建的账户风险识别架构,确定各所述待识别账户是否属于风险账户;所述账户识别模型由多个样本账户的账户特征信息训练得到;所述账户风险识别架构为根据各所述样本账户对应的网络层级及所述账户识别模型构建而成;所述样本账户包括风险账户和生活账户。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
所述获取多个待识别账户之间的账户交易信息之前,根据账户交易记录,确定符合第一预设条件的的所述多个待识别账户;所述账户交易记录包括交易时间和/或交易量;所述第一预设条件包括以下至少一项:交易频率高于预设频率、单次交易量大于第一预设阈值、预设时长内的总交易量大于第二预设阈值。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
获取各所述待识别账户之间符合第二预设条件的所述账户交易信息;所述第二预设条件包括以下至少一项:所述交易时间位于预设时间段内、交易层级小于或等于第三预设阈值;
其中,所述交易层级基于所述交易关系确定。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
获取所述样本账户及各所述样本账户分别对应的标签信息;所述标签信息包括风险账户标签和生活账户标签;
获取各所述样本账户对应的所述账户特征信息;
基于各所述样本账户对应的所述账户特征信息及所述标签信息进行模型训练,得到所述账户识别模型。
可选地,述账户识别模型的输出数据包括属于所述风险账户的概率值;所述账户风险识别架构包括各网络层级、各概率值以及风险程度之间的映射关系;
计算机可执行指令在被执行时,还可以使所述处理器:
将所述第一账户特征信息作为所述账户识别模型的输入数据,以确定所述待识别账户属于所述风险账户的第一概率值;
根据所述第一概率值、所述第一网络层级及所述映射关系,确定所述第一概率值及所述第一网络层级对应的目标风险程度;
根据所述目标风险程度确定各所述待识别账户是否属于所述风险账户。
可选地,所述风险程度包括高风险程度、低风险程度或中风险程度;
计算机可执行指令在被执行时,还可以使所述处理器:
若所述目标风险程度为所述高风险程度,则确定所述待识别账户属于所述风险账户;
若所述目标风险程度为所述低风险程度,则确定所述待识别账户属于所述生活账户;
若所述目标风险程度为所述中风险程度,则确定所述待识别账户对应的网络节点的相邻节点对应的账户类别;基于所述相邻节点对应的账户类别确定所述待识别账户是否属于所述风险账户。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
若所述相邻节点对应的账户类别为所述风险账户,则确定所述待识别账户属于所述风险账户;
若所述相邻节点对应的账户类别为所述生活账户,则确定所述待识别账户属于所述生活账户。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
根据所述交易关系确定各所述待识别账户中的交易源账户,将所述交易源账户对应的网络节点确定为所述交易网络中的初始网络节点;以及,确定所述初始网络节点在所述交易网络中的所述第一网络层级为初始层级;
根据预设的最短路径算法,确定所述初始网络节点到其他各网络节点之间的最短节点距离;其中,每相邻两个网络节点之间的节点距离为单位距离;
根据所述最短节点距离,确定其他各所述网络节点在所述交易网络中的所述第一网络层级。
本说明书一个或多个实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述风险账户的识别方法,并具体用于执行:
获取多个待识别账户之间的账户交易信息;所述账户交易信息包括交易时间、交易对象、交易关系中的至少一项;
根据所述账户交易信息,构建所述多个待识别账户对应的交易网络;各所述待识别账户分别对应所述交易网络中的各网络节点;每相邻两个所述网络节点之间的边对应一次交易;
确定各所述待识别账户对应的所述网络节点在所述交易网络中的第一网络层级;及,确定各所述待识别账户的第一账户特征信息;所述第一账户特征信息包括以下至少一项:账户属性信息、账户行为信息、所述账户交易信息;
根据所述第一网络层级、所述第一账户特征信息、预先训练的账户识别模型及预先构建的账户风险识别架构,确定各所述待识别账户是否属于风险账户;所述账户识别模型由多个样本账户的账户特征信息训练得到;所述账户风险识别架构为根据各所述样本账户对应的网络层级及所述账户识别模型构建而成;所述样本账户包括风险账户和生活账户。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。