CN111382403A

CN111382403A - 用户行为识别模型的训练方法、装置、设备及存储介质

Info

Publication number: CN111382403A
Application number: CN202010184727.5A
Authority: CN
Inventors: 邱君华; 李宏宇
Original assignee: Tongdun Holdings Co Ltd
Current assignee: Tongdun Holdings Co Ltd
Priority date: 2020-03-17
Filing date: 2020-03-17
Publication date: 2020-07-07

Abstract

本发明公开一种用户行为识别模型的训练方法、装置、设备及存储介质。所述用户行为识别模型的训练方法包括：获取用户的至少一条行为数据；以及基于所述用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练。根据本发明提供的用户行为识别模型的训练方法，通过使用待识别用户的任意条行为数据优化基础模型，能够获得用于高精度识别该用户行为的个性化模型，从而有效地保障该用户的个人信息安全。

Description

用户行为识别模型的训练方法、装置、设备及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种用户行为识别模型的训练方法、装置、计算机设备及计算机可读存储介质。

背景技术

随着社会信息化程度的不断提升，人们的工作和生活方式逐渐由线下转移到了线上，例如：电子商务、网上银行业务等。相应地，在线用户势必面临个人敏感信息泄漏、银行账户失盗等安全问题。

为保障用户的信息安全，需要对用户在终端设备的操作行为进行认证以识别用户的身份。然而，目前常用的认证方式普遍存在识别精度低、用户体验差等诸多缺陷。

需要说明的是，在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解，因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

有鉴于此，本发明提供一种用户行为识别模型的训练方法、装置、计算机设备及计算机可读存储介质。

本发明的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本发明的实践而习得。

根据本发明的一方面，提供一种用户行为识别模型的训练方法，包括：获取用户的至少一条行为数据；以及基于所述用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练。

根据本发明的一实施方式，所述用户行为识别模型的预先训练过程包括：获取多个样本用户的多条行为数据；及基于所述多个样本用户的多条行为数据，对初始的用户行为识别模型进行训练。

根据本发明的一实施方式，基于所述多个样本用户的多条行为数据，对初始的用户行为识别模型进行训练，包括：分别抽取所述多个样本用户中一个样本用户的第一数量条行为数据和其它样本用户的第二数量条行为数据，组成一个训练任务的训练数据；针对每个训练任务，分别执行下述操作：从所述训练任务的训练数据中选出第三数量条行为数据，并根据所述第三数量条行为数据，对所述用户行为识别模型进行第一训练，以计算得到所述用户识别模型的第一模型参数；及从所述训练任务的训练数据中选出除所述第三数量条行为数据之外的第四数量条行为数据，并根据所述第四数量条行为数据，基于所述第一模型参数，对所述用户行为识别模型进行第二训练；以及基于每个训练任务的第二训练结果，更新所述用户识别模型的第二模型参数。

根据本发明的一实施方式，根据所述第三数量条行为数据，对所述用户行为识别模型进行第一训练，以计算得到所述用户识别模型的第一模型参数，包括：基于当前的第二模型参数，对所述用户行为识别模型的损失函数进行求导，获得第一梯度值；及将所述第二模型参数减去所述第一梯度值与第一学习率的乘积，以计算得到所述第一模型参数。

根据本发明的一实施方式，基于所述第一模型参数，对所述用户行为识别模型进行第二训练，包括：基于所述第一模型参数，对所述用户识别模型的损失函数进行求导，获得第二梯度值；基于每个训练任务的第二训练结果，更新所述用户识别模型的第二模型参数，包括：将所述当前的第二模型参数减去各训练任务的第二梯度值之和与第二学习率的乘积，以更新所述第二模型参数。

根据本发明的一实施方式，基于所述用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练，包括：基于更新后的所述第二模型参数，对所述用户识别模型的损失函数进行求导，获得第三梯度值；及将所述第二模型参数减去所述第三梯度值与所述第一学习率的乘积，以得到所述第一模型参数。

根据本发明的一实施方式，获取用户的至少一条行为数据包括：获取用户的1～10条行为数据。

根据本发明的另一方面，提供一种用户行为识别模型的训练装置，包括：数据获取模块，用于获取用户的至少一个行为数据；以及模型训练模块，用于基于所述用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练。

根据本发明的再一方面，提供一种计算机设备，包括：存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令，所述处理器执行所述可执行指令时实现上述任一种用户行为识别模型的训练方法。

根据本发明的再一方面，提供一种计算机可读存储介质，其上存储有计算机可执行指令，所述可执行指令被处理器执行时实现上述任一种用户行为识别模型的训练方法。

根据本发明提供的用户行为识别模型的训练方法，通过使用待识别用户的任意条行为数据优化基础模型，能够获得用于高精度识别该用户行为的个性化模型，从而有效地保障该用户的个人信息安全。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据一示例性实施方式示出的一种用户行为识别模型的训练方法的流程图。

图2是根据一示例性实施方式示出的另一种用户行为识别模型的训练方法的流程图。

图3是根据一示例性实施方式示出的再一种用户行为识别模型的训练方法的流程图。

图4是根据一示例性实施方式示出的再一种用户行为识别模型的训练方法的流程图。

图5是根据一示例性实施方式示出的再一种用户行为识别模型的训练方法的流程图。

图6是根据一示例性实施方式示出的再一种用户行为识别模型的训练方法的流程图。

图7是根据一示例性实施方式示出的一种用户行为识别模型的训练装置的框图。

图8是根据一示例性实施方式示出的一种计算机设备的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本发明将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本发明的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本发明的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本发明的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、装置、步骤等。在其它情况下，不详细示出或描述公知结构、方法、装置、实现或者操作以避免喧宾夺主而使得本发明的各方面变得模糊。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

如上所述，为了解决目前常用的用户行为认证方式存在诸多缺陷的问题，本发明提出了一种用户行为识别模型的训练方法，通过对用户在终端设备的操作行为进行无感认证以识别用户的身份，从而保障其信息安全。

无感认证是未来身份认证领域的重要发展方向。所谓无感认证，即根据人的行为数据来判断当前使用者的身份是否为专属用户本人，从而保护专属用户的信息安全。无感认证无需引导输入账户密码等验证信息：当前使用者敲击键盘、点击鼠标或者在移动终端(例如：智能手机、平板电脑等)的触屏等行为，均可使其在没有任何感觉的情况下完成身份认证。

下面通过各种实施方式对本发明方法进行具体说明。

图1是根据一示例性实施方式示出的一种用户行为识别模型的训练方法的流程图。如图1所示的用户行为识别模型的训练方法既可以应用于服务器端，也可以应用于客户端。

参考图1，用户行为识别模型的训练方法10包括：

在步骤S102中，获取用户的至少一条行为数据。

其中，用户的行为数据例如可包括从终端设备采集到的该用户：在PC端敲击键盘的行为数据、点击鼠标的行为数据，以及在移动端触屏的行为数据、手势的行为数据等操作行为数据。需要说明的是，本发明不以用户行为数据的类型为限。

在步骤S104中，基于用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练。

在本发明中，初始的用户行为识别模型(基础模型)不局限于任何形式或架构的神经网络模型，例如可以为多层感知机(Multi-Layer Perception，MLP)模型、卷积神经网络(Convolutional Neural Networks，CNN)模型、循环卷积神经网络(Recurrent NeuralNetworks，RNN)模型等。

网络模型的深度和宽度取决于用户行为数据的规模，具体可以根据实际的应用场景进行选择，例如：当预先训练过程中的样本数据量较大时，可选择层数较深的神经网络模型，以学习到更多的模型参数且不产生过拟合；而当应用于移动客户端时，则可选择较为简化的神经网络模型。

根据本发明实施方式提供的用户行为识别模型的训练方法，通过使用待识别用户的任意条行为数据优化基础模型，能够获得用于高精度识别该用户行为的个性化模型，从而有效地保障该用户的个人信息安全。

应清楚地理解，本发明描述了如何形成和使用特定示例，但本发明的原理不限于这些示例的任何细节。相反，基于本发明公开的内容的教导，这些原理能够应用于许多其它实施方式。

承上述，图2是根据一示例性实施方式示出的另一种用户行为识别模型的训练方法的流程图。与图1所示方法10的不同之处在于，图2所示的方法进一步提供了基础模型的预先训练过程。同样地，如图2所示的用户行为识别模型的训练方法例如也可以应用于服务器端和客户端。

参考图2，用户行为识别模型的预先训练过程20可包括：

在步骤S202中，获取多个样本用户的多条行为数据。

在步骤S204中，基于多个样本用户的多条行为数据，对初始的用户行为识别模型进行训练。

在一些实施例中，如图3所示，步骤S204可进一步包括：

在步骤S2042中，分别抽取多个样本用户中一个样本用户的第一数量条行为数据和其它样本用户的第二数量条行为数据，组成一个训练任务的训练数据。

对于每一个训练任务而言，“一个样本用户”可以是从多个样本用户中随机选出的；第一数量条行为数据可以是从该样本用户的多个行为数据中随机抽取的，第二数量条行为数据可以是从该样本用户之外的其它所有样本用户所汇总的多个行为数据中随机抽取的；第一数量与第二数量可以相等，也可以不相等，加和优选为偶数。

在步骤S2044中，针对每个训练任务，分别执行下述操作：

在步骤S2044’中，从该训练任务的训练数据中选出第三数量条行为数据，并根据第三数量条行为数据，对用户行为识别模型进行第一训练，以计算得到用户识别模型的第一模型参数。

其中，第三数量条行为数据可以是从该训练任务的训练数据中随机选出的；第三数量优选为该训练任务训练数据(偶数)的一半，但本发明对此并不作任何限定。

在步骤S2044”中，从该训练任务的训练数据中选出除第三数量条行为数据之外的第四数量条行为数据，并根据第四数量条行为数据，基于第一模型参数，对用户行为识别模型进行第二训练。

其中，第四数量条行为数据也可以是从除第三数量条行为数据之外的训练数据中随机选出的，也即第四数量≤第三数量。优选地，第四数量＝第三数量＝(第一数量+第二数量)÷2，但本发明对此同样不作任何限定。

在步骤S2046中，基于每个训练任务的第二训练结果，更新用户识别模型的第二模型参数。

需要说明的是，所述“第一”与“第二”仅用于清楚地区分每个训练任务中的步骤S2044’和步骤S2044”，而非隐含表达两步的训练阶段具有实质性区别。也即，“第一模型参数”与“第二模型参数”均为用户识别模型的模型参数，其中“第一模型参数”可理解为每个训练任务的中间结果，“第二模型参数”是在“第一模型参数”的基础上进一步优化后的结果。同理，“第一训练”与“第二训练”也仅是为了区分两步训练阶段，二者不存在学习方法上的实质性区别。

在本发明实施例中，上述步骤S2042～S2046可以是循环的迭代训练过程，迭代的终止节点为用户识别模型的模型参数已收敛或者达到预先设置的迭代次数。

承上述，用户行为认证本质上是一个“二分类”任务，即判断当前使用者的行为数据是否为专属用户的行为数据。在现有的技术中，用户行为认证主要是基于支持向量机、决策树、欧式/马氏距离等工具，对当前使用者的行为数据进行分类。然而，这些方法在构造分类工具时需要对样本用户及专属用户的大量行为数据进行训练，导致用户体验极差，同时识别精度普遍偏低，无法有效地保证用户的信息安全。

在本发明实施例中，所用样本用户的行为数据可以很少，也即基础模型的训练更为容易，适用于样本用户较多但各样本用户的行为数据存量较少的场景。例如，每个训练任务的训练数据可以仅为20条(第一数量＝第二数量＝10或者第一数量＝8、第二数量＝12等)。

相对应地，在一些实施例中，本发明方法在基础模型的更新训练阶段所用的专属用户的行为数据也可以很少，例如仅需获取用户在终端设备操作的1～10条行为数据。也即，本发明实施例使用某用户少量的行为数据更新基础模型的模型参数，即可快速获得针对该用户的个性化模型，在保证用户行为识别精度的同时，还可有效地提升用户体验。

下面通过各种实施方式对上述步骤S2044～S2046中涉及的训练过程进行具体说明。

图4是根据一示例性实施方式示出的再一种用户行为识别模型的训练方法的流程图。与图3所示方法的不同之处在于，图4所示的方法进一步提供了第一训练阶段的一种具体方法，即进一步提供了上述步骤S2044’的一实施例。如上所述，第一训练阶段所使用的训练数据为第三数量条。

参考图4，步骤S2044’可进一步包括：

在步骤S402中，基于当前的第二模型参数，对用户行为识别模型的损失函数进行求导，获得第一梯度值。

在步骤S404中，将第二模型参数减去第一梯度值与第一学习率的乘积，以得到第一模型参数。

针对每个训练任务T_i，可基于当前的模型参数θ_(n)，对用户行为识别模型的损失函数

在当前梯度方向上进行预设步数的学习，公式如下：

其中，(n+1)为步骤S2042～S2046所处的迭代循环序号，f为用户行为识别模型，α为第一学习率，

为梯度运算符。

最终，学习得到的θ′_i，(n+1)即为第(n+1)次迭代循环中，训练任务T_i环境下更新的(第一)模型参数。

承上述，图5是根据一示例性实施方式示出的再一种用户行为识别模型的训练方法的流程图。与图3所示方法的不同之处在于，图5所示的方法进一步提供了第二训练阶段的一种具体方法，即分别提供了上述步骤S2044”及步骤S2046的一实施例。如上所述，第二训练阶段所使用的训练数据为第四数量条。

参考图5，步骤S2044”可进一步包括：

在步骤S502中，基于第一模型参数，对用户识别模型的损失函数进行求导，获得第二梯度值。

继而，步骤S2046可进一步包括：

在步骤S504中，将当前的第二模型参数减去各训练任务的第二梯度值之和与第二学习率的乘积，以更新第二模型参数。

也即，在第(n+1)次迭代循环中，基于各训练任务T_i在第一训练阶段学习得到的参数θ′_i，(n+1)，分别对用户识别模型的损失函数

再次求导，并汇总获得的多个第二梯度值，公式如下：

其中，β为第二学习率。

在每一次迭代循环中，上式(2)中的θ_(n+1)相比于上式(1)中的θ＇_i，(n+1)，鲁棒性和稳定性均得到增强。当用户识别模型的模型参数已收敛或者达到预设的迭代次数N时，最终学习得到的θ_(N)即为用户识别模型经预先训练过程更新后的(第二)模型参数，也是步骤S104中针对某用户进行模型更新训练以获得个性化模型前的初始化模型参数。

图6是根据一示例性实施方式示出的再一种用户行为识别模型的训练方法的流程图。承上图5，图6所示的方法进一步提供了获得专属于一个用户的个性化模型的具体方法，即进一步提供了上述方法10中步骤S104的一实施例。

参考图6，步骤S104可进一步包括：

在步骤S602中，基于更新后的第二模型参数，对用户识别模型的损失函数进行求导，获得第三梯度值。

在步骤S604中，将第二模型参数减去第三梯度值与第一学习率的乘积，以得到第一模型参数。

与第一训练阶段相类似地，可基于更新后的模型参数θ_(N)，对用户行为识别模型的损失函数

在当前梯度方向上进行预设步数的学习，公式如下：

最终，学习得到的θ_e即为该用户的个性化模型的模型参数，后续可用于实时地识别该用户的终端设备所采集到的行为数据，

即为用户身份认证的结果。

需要说明的是，模型更新训练阶段所使用的训练数据包括：该用户的至少一条行为数据及来自多个样本用户的至少一条行为数据。如上所述，在本发明实施例中，模型更新训练阶段所用的该用户及样本用户的行为数据均可以很少，例如仅需该用户的1～10条行为数据及1～10条样本用户的行为数据。

下面以用户敲击键盘的行为数据为例，对本发明实施例提出的用户行为识别模型的小样本训练方法进行说明。以下所涉及的具体数值均仅作为描述方案的示例性数值，而非对本发明方法的任何限定。

假设有40个样本用户，每个样本用户敲击100次键盘，共计4000条行为数据。对于该场景，本发明方法的完整训练过程如下：

步骤一：生成多个训练任务：在每个训练任务T_i中，随机地从40个样本用户中选出一个样本用户，并从该样本用户的100条敲击键盘的行为数据中随机抽取出10条、从其它39个样本用户的3900条敲击键盘的行为数据中随机抽取出10条，组成包含20条行为数据的训练数据集；

步骤二：分别针对每个训练任务T_i，从训练数据集中随机选出10条行为数据，使用这10条行为数据训练初始的用户行为识别模型，并通过上式(1)得到更新后的模型参数θ＇_i，(n+1)；

步骤三：分别针对每个训练任务T_i，使用训练数据集中剩余的10条行为数据再次训练更新后的用户行为识别模型，并通过上式(2)进行所有训练任务的汇总，得到模型参数θ_(n+1)；

步骤四：重复上述步骤一至三，对模型参数θ_(n+1)进行迭代，直至其收敛或者达到预设的迭代次数N；

上述步骤一至四构成了基础模型的预先训练过程。

步骤五：获取某用户在其PC端敲击5次键盘对应的5条行为数据，并从40个样本用户的4000条行为数据中随机抽取出5条；

步骤六：使用这10条行为数据对经过预先训练的用户行为识别模型进行又一次训练，并通过上式(3)得到更新后的模型参数θ_e；

上述步骤五至六构成了将通用模型优化为专用于识别该用户行为的模型的快速迁移过程。

本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时，执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中，该存储介质可以是只读存储器，磁盘或光盘等。

此外，需要注意的是，上述附图仅是根据本发明示例性实施方式的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

下述为本发明装置实施例，可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节，请参照本发明方法实施例。

参考图7，用户行为识别模型的训练装置70包括：数据获取模块702以及模型训练模块704。

其中，数据获取模块702用于获取用户的至少一个行为数据。

模型训练模块704用于基于用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练。

根据本发明实施方式提供的用户行为识别模型的训练装置，通过使用待识别用户的任意条行为数据优化基础模型，能够获得用于高精度识别该用户行为的个性化模型，从而有效地保障该用户的个人信息安全。

需要注意的是，上述附图中所示的框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

图8是根据一示例性实施方式示出的一种计算机设备的结构示意图。需要说明的是，图8示出的计算机设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图8所示，计算机设备800包括中央处理单元(CPU)801，其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中，还存储有设备800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

以下部件连接至I/O接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地，根据本发明的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时，执行本发明的设备中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：

获取用户的至少一条行为数据；以及基于用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练。

以上具体地示出和描述了本发明的示例性实施方式。应可理解的是，本发明不限于这里描述的详细结构、设置方式或实现方法；相反，本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

Claims

1.一种用户行为识别模型的训练方法，其特征在于，包括：

获取用户的至少一条行为数据；以及

基于所述用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练。

2.根据权利要求1所述的方法，其特征在于，所述用户行为识别模型的预先训练过程包括：

获取多个样本用户的多条行为数据；及

基于所述多个样本用户的多条行为数据，对初始的用户行为识别模型进行训练。

3.根据权利要求2所述的方法，其特征在于，基于所述多个样本用户的多条行为数据，对初始的用户行为识别模型进行训练，包括：

分别抽取所述多个样本用户中一个样本用户的第一数量条行为数据和其它样本用户的第二数量条行为数据，组成一个训练任务的训练数据；

针对每个训练任务，分别执行下述操作：

从所述训练任务的训练数据中选出第三数量条行为数据，并根据所述第三数量条行为数据，对所述用户行为识别模型进行第一训练，以计算得到所述用户识别模型的第一模型参数；及

从所述训练任务的训练数据中选出除所述第三数量条行为数据之外的第四数量条行为数据，并根据所述第四数量条行为数据，基于所述第一模型参数，对所述用户行为识别模型进行第二训练；以及

基于每个训练任务的第二训练结果，更新所述用户识别模型的第二模型参数。

4.根据权利要求3所述的方法，其特征在于，根据所述第三数量条行为数据，对所述用户行为识别模型进行第一训练，以计算得到所述用户识别模型的第一模型参数，包括：

基于当前的第二模型参数，对所述用户行为识别模型的损失函数进行求导，获得第一梯度值；及

将所述第二模型参数减去所述第一梯度值与第一学习率的乘积，以计算得到所述第一模型参数。

5.根据权利要求4所述的方法，其特征在于，基于所述第一模型参数，对所述用户行为识别模型进行第二训练，包括：基于所述第一模型参数，对所述用户识别模型的损失函数进行求导，获得第二梯度值；

基于每个训练任务的第二训练结果，更新所述用户识别模型的第二模型参数，包括：将所述当前的第二模型参数减去各训练任务的第二梯度值之和与第二学习率的乘积，以更新所述第二模型参数。

6.根据权利要求5所述的方法，其特征在于，基于所述用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练，包括：

基于更新后的所述第二模型参数，对所述用户识别模型的损失函数进行求导，获得第三梯度值；及

将所述第二模型参数减去所述第三梯度值与所述第一学习率的乘积，以得到所述第一模型参数。

7.根据权利要求1-6任一项所述的方法，其特征在于，获取用户的至少一条行为数据包括：获取用户的1～10条行为数据。

8.一种用户行为识别模型的训练装置，其特征在于，包括：

数据获取模块，用于获取用户的至少一个行为数据；以及

模型训练模块，用于基于所述用户及多个样本用户的多条行为数据，对经预先训练的用户行为识别模型进行模型更新训练。

9.一种计算机设备，包括：存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令，其特征在于，所述处理器执行所述可执行指令时实现如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其上存储有计算机可执行指令，其特征在于，所述可执行指令被处理器执行时实现如权利要求1-7任一项所述的方法。