CN116401400B

CN116401400B - 模型训练方法以及相关设备

Info

Publication number: CN116401400B
Application number: CN202310442515.6A
Authority: CN
Inventors: 黄昕
Original assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Current assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date: 2023-04-14
Filing date: 2023-04-14
Publication date: 2026-01-09
Anticipated expiration: 2043-04-14
Also published as: CN116401400A

Abstract

本申请公开了一种模型训练方法以及相关设备，方法包括：获取根据目标用户的多首歌曲的歌曲信息生成的初始歌曲序列，每首歌曲对应一个歌曲标签，歌曲标签为正例标签或者负例标签；根据歌曲标签为正例标签的每首歌曲的歌曲属性对初始歌曲序列进行掩码处理，得到对比歌曲序列；将初始歌曲序列和对比歌曲序列分别输入初始歌曲推荐模型中进行处理，得到初始歌曲序列的参考特征序列以及对比歌曲序列的对比特征序列；根据参考特征序列和对比特征序列确定第一差异参数，根据第一差异参数对初始歌曲推荐模型的模型参数进行调整，得到目标歌曲推荐模型。通过该方法，可以提升模型训练效果，使得到的目标歌曲推荐模型可以精准地推荐用户感兴趣的歌曲。

Description

模型训练方法以及相关设备

技术领域

本申请涉及计算机技术领域，尤其涉及一种模型训练方法、一种计算机设备以及一种计算机可读存储介质。

背景技术

音乐推荐系统会根据用户的听歌兴趣点进行歌曲推荐，听歌兴趣点是根据用户的历史听歌数据确定的。但当用户的听歌行为特别丰富，听歌的历史数量达到一定数值(如2000)以上时，很容易产生“兴趣塌陷”问题。所谓“兴趣塌陷”，是指用户行为过于丰富后，推荐系统反而难以精准识别用户的核心兴趣点，被其他偶然兴趣点所淹没。

因此，如何解决“兴趣塌陷”问题，更为精准地向用户推荐歌曲成为亟待解决的技术问题。

发明内容

本申请实施例提供了一种模型训练方法以及相关设备，可以提升模型训练效果，使得到的目标歌曲推荐模型可以精准地推荐用户感兴趣的歌曲。

一方面，本申请实施例公开了一种模型训练方法，该模型训练方法包括：

获取目标用户的初始歌曲序列，所述初始歌曲序列是根据所述目标用户的听歌行为所涉及的多首歌曲的歌曲信息生成，所述多首歌曲中的每一首歌曲对应一个歌曲标签，所述歌曲标签为正例标签或者负例标签，所述歌曲标签是根据歌曲对应的播放特征确定的；

确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性，并根据所述歌曲属性对所述初始歌曲序列进行掩码处理，得到对比歌曲序列，所述歌曲属性为关键歌曲属性或者非关键歌曲属性；

将所述初始歌曲序列输入初始歌曲推荐模型中进行处理，得到所述初始歌曲序列的参考特征序列，将所述对比歌曲序列输入所述初始歌曲推荐模型中进行处理，得到所述对比歌曲序列的对比特征序列；

根据所述参考特征序列和所述对比特征序列确定第一差异参数，并根据所述第一差异参数对所述初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。

相应地，本申请实施例公开了一种模型训练装置，该模型训练装置包括：

获取单元，用于获取目标用户的初始歌曲序列，所述初始歌曲序列是根据所述目标用户的听歌行为所涉及的多首歌曲的歌曲信息生成，所述多首歌曲为所述目标用户的听歌行为所涉及的歌曲，所述多首歌曲中的每一首歌曲对应一个歌曲标签，所述歌曲标签为正例标签或者负例标签，所述歌曲标签是根据歌曲对应的播放特征确定的；

确定单元，用于确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性，并根据所述歌曲属性对所述初始歌曲序列进行掩码处理，得到对比歌曲序列，所述歌曲属性为关键歌曲属性或者非关键歌曲属性；

处理单元，用于将所述初始歌曲序列输入初始歌曲推荐模型中进行处理，得到所述初始歌曲序列的参考特征序列，将所述对比歌曲序列输入所述初始歌曲推荐模型中进行处理，得到所述对比歌曲序列的对比特征序列；

确定单元，还用于根据所述参考特征序列和所述对比特征序列确定第一差异参数，并根据所述第一差异参数对所述初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。

在一种可能实现方式中，确定单元，用于确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性时，具体用于执行以下步骤：

获取用户针对目标歌曲的操作行为，所述目标歌曲为所述多首歌曲中所述歌曲标签为所述正例标签的任意一首歌曲；

若用户针对所述目标歌曲的操作行为存在目标行为，则确定所述目标歌曲的歌曲属性为所述关键歌曲属性；所述目标行为包括下载行为、收藏行为、分享行为以及评论行为中的一种或多种；

若用户针对所述目标歌曲的操作行为不存在所述目标行为，则确定所述目标歌曲的歌曲属性为所述非关键歌曲属性。

在一种可能实现方式中，确定单元用于确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性时，具体用于执行以下步骤：

确定第一歌曲的歌曲特征和第二歌曲的歌曲特征，所述第一歌曲为歌曲集合中的任意一首歌曲，所述第二歌曲为所述歌曲集合中除所述第一歌曲之外的任意一首歌曲，所述歌曲集合由所述多首歌曲中所述歌曲标签为所述正例标签的歌曲构成；

根据所述第一歌曲的歌曲特征和所述第二歌曲的歌曲特征，确定所述第一歌曲和所述第二歌曲的歌曲相似度；

根据所述歌曲相似度，确定所述歌曲集合中与所述第一歌曲的歌曲相似度大于或者等于相似度阈值的歌曲的占比；

若所述占比大于或者等于占比阈值，则确定所述第一歌曲的歌曲属性为所述关键歌曲属性；

若所述占比小于所述占比阈值，则确定所述第一歌曲的歌曲属性为所述非关键歌曲属性。

在一种可能的实现方式中，处理单元，用于根据所述歌曲属性对所述初始歌曲序列进行掩码处理，得到对比歌曲序列时，具体用于执行如下步骤：

从所述歌曲属性为所述关键歌曲属性的歌曲中确定第一待处理歌曲，将所述初始歌曲序列中所述第一待处理歌曲对应的序列元素进行掩码处理，得到第一歌曲序列；

从所述歌曲属性为所述非关键歌曲属性的歌曲中确定第二待处理歌曲，将所述初始歌曲序列中所述第二待处理歌曲对应的序列元素进行掩码处理，得到第二歌曲序列；

将所述第一歌曲序列和所述第二歌曲序列确定为对比歌曲序列；

其中，所述将所述对比歌曲序列输入所述初始歌曲推荐模型中进行处理，得到所述对比歌曲序列的对比特征序列，包括：

将所述第一歌曲序列输入所述初始歌曲推荐模型中进行处理，得到第一对比特征序列；

将所述第二歌曲序列输入所述初始歌曲推荐模型中进行处理，得到第二对比特征序列；

将所述第一对比特征序列和所述第二对比特征序列确定为对比特征序列。

在一种可能的实现方式中，确定单元用于根据所述参考特征序列和所述对比特征序列确定第一差异参数时，具体用于执行如下步骤：

确定所述参考特征序列和所述第一对比特征序列之间的第一相似参数，

确定所述参考特征序列和所述第二对比特征序列之间的第二相似参数，

根据所述第一相似参数和所述第二相似参数，确定第一差异参数。

在一种可能的实现方式中，所述目标用户包含于用户集合中，所述用户集合包括多个用户，确定单元，用于根据所述参考特征序列和所述对比特征序列确定第一差异参数时，具体用于执行如下步骤：

获取参考用户的初始歌曲序列，将所述参考用户的初始歌曲序列输入初始歌曲推荐模型中进行处理，得到所述参考用户的初始歌曲序列的特征序列；所述参考用户为所述用户集合中除所述目标用户之外的任意一个用户；

确定所述参考特征序列和所述参考用户的初始歌曲序列的特征序列之间的第三相似参数；

根据所述第一相似参数、所述第二相似参以及各个所述参考用户对应的第三相似参数，确定第一差异参数。

在一种可能的实现方式中，所述初始歌曲推荐模型对所述初始歌曲序列的处理结果还包括所述初始歌曲序列的预测结果集合，所述预测结果集合包括所述多首歌曲中每一首歌曲的预测结果，所述预测结果用于指示所述每一首歌曲的推荐程度；

确定单元，根据所述多首歌曲中每一首歌曲的预测结果和所述歌曲标签确定第二差异参数；

其中，处理单元，根据所述第一差异参数对所述初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型时，具体用于执行如下步骤：

根据所述第一差异参数和所述第二差异参数确定目标差异参数；

根据所述目标差异参数对所述初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。

在一种可能的实现方式中，获取单元，获取待推荐歌曲的歌曲信息以及待推荐用户的歌曲推荐指示信息；

处理单元，将所述歌曲推荐指示信息和所述待推荐歌曲的歌曲信息输入所述目标歌曲推荐模型中进行处理，得到所述待推荐歌曲的推荐分数；根据所述推荐分数针对所述待推荐歌曲进行歌曲推荐。

相应地，本申请实施例公开了一种计算机设备，该计算机设备包括处理器，适于实现一条或多条计算机程序；以及，计算机存储介质，所述计算机存储介质存储有一条或多条计算机程序，所述一条或多条计算机程序适于由所述处理器加载并执行以上述的模型训练方法。

相应地，本申请实施公开了一种计算机可读存储介质，该计算机可读存储介质存储有一条或多条计算机程序，所述一条或多条计算机程序适于由处理器加载并执行上述的模型训练方法。

相应地，本申请实施例公开了一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序，处理器执行该计算机程序，使得该计算机设备执行上述的模型训练方法。

本申请实施例中，获取目标用户的初始歌曲序列，初始歌曲序列是根据多首歌曲的歌曲信息(名称、歌手、曲风、语言)生成的，多首歌曲为目标用户的听歌行为所涉及的歌曲(历史听歌歌曲)，多首歌曲中的每一首歌曲对应一个歌曲标签，歌曲标签为正例标签或者负例标签，歌曲标签是根据歌曲对应的播放特征确定的；确定歌曲标签为正例标签的每一首歌曲的歌曲属性，并根据歌曲属性对初始歌曲序列进行掩码处理，得到对比歌曲序列，歌曲属性为关键歌曲属性或者非关键歌曲属性；对歌曲标签为正例标签的歌曲进行属性划分，得到对比歌曲序列，引入属性信息后构成的对比歌曲序列，可以更精确地对用户的初始歌曲序列进行划分，可以更为准确地确定用户的兴趣点。将初始歌曲序列输入初始歌曲推荐模型中进行处理，得到初始歌曲序列的参考特征序列，将对比歌曲序列输入初始歌曲推荐模型中进行处理，得到对比歌曲序列的对比特征序列；根据参考特征序列和对比特征序列确定第一差异参数，并根据第一差异参数对初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。用上述的步骤处理过的数据进行模型训练，可以提升模型训练效果，也就是更能训练出用户的兴趣点，从而使得到的目标歌曲推荐模型可以精准地推荐用户感兴趣的歌曲。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种模型训练系统的网络架构示意图；

图2是本申请实施例提供的一种模型训练方法的流程示意图；

图3是本申请实施例提供的一种构建对比歌曲序列的示意图；

图4是申请实施例提供的一种模型的框架图；

图5是本申请实施例提供的另一种模型训练方法的流程示意图；

图6是本申请实施例提供的一种模型训练装置的结构示意图；

图7是本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了更准确地向用户推荐歌曲，本申请实施例提出了一种模型训练方法，对原有的歌曲推荐模型进行了改进，具体是对训练数据进行了准确地划分，从而使提升了模型的训练效果，使得得到的目标歌曲推荐模型可以精准地推荐用户感兴趣的歌曲。

本申请实施例提供的模型训练方法可以基于人工智能(人工智能(ArtificialIntelligence，AI)，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供的模型训练方法主要涉及AI技术中的机器学习(MachineLearning，ML)技术。机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

在可行的实施例中，本申请实施例提供的模型训练方法还可以基于云技术(CloudTechnology)和/或区块链技术实现。具体可以涉及云技术中的云存储(Cloud Storage)、云数据库(Cloud Database)、大数据(Big data)中的一种或者多种。例如，从云数据库中获取执行该模型训练方法所需要的数据(例如目标用户的初始歌曲序列、初始歌曲推荐模型等)。又例如，执行该模型训练方法所需要的数据可以是以区块的形式存储在区块链上；可以将执行该模型训练方法所产生的数据(例如目标歌曲推荐模型)以区块的形式存储到区块链上；另外，执行该模型训练方法的数据处理设备可以是区块链网络中的节点设备。

具体的，云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。云技术是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。云存储(cloud storage)是在云计算概念上延伸和发展出来的一个新的概念，分布式云存储系统(以下简称存储系统)是指通过集群应用、网格技术以及分布存储文件系统等功能，将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作，共同对外提供数据存储和业务访问功能的一个存储系统。数据库(Data base)，简而言之可视为电子化的文件柜——存储电子文件的处所，用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

下面结合图1对适于实现本申请实施例提供的模型训练方法的模型训练系统和，模型训练方法的应用场景进行介绍。请参见图1，图1为本申请实施例的一种模型训练系统的网络架构示意图，如图1所示，该模型训练系统可以至少包括服务器101和终端设备102，终端设备102的数量可以为一个或多个。服务器101可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(ContentDelivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器，本申请实施例对此不进行限定；终端设备102可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能手表、车载终端、智能家电、飞行器等，但并不局限于此；服务器101和终端设备102之间可以通过有线通信的方式建立直接地通信连接，或者可以通过无线通信的方式建立间接地通信连接，本申请实施例对此不进行限定。

基于图1的模型训练系统，本申请实施例提供的模型训练方法可以由服务器101执行，模型训练过程包括：服务器101，获取目标用户的初始歌曲序列，初始歌曲序列是根据多首歌曲的歌曲信息(名称、歌手、曲风、语言)生成的，多首歌曲为目标用户的听歌行为所涉及的歌曲(历史听歌歌曲)，多首歌曲中的每一首歌曲对应一个歌曲标签，歌曲标签为正例标签或者负例标签，歌曲标签是根据歌曲对应的播放特征确定的；确定歌曲标签为正例标签的每一首歌曲的歌曲属性，并根据歌曲属性对初始歌曲序列进行掩码处理，得到对比歌曲序列，歌曲属性为关键歌曲属性或者非关键歌曲属性；对歌曲标签为正例标签的歌曲进行属性划分，得到对比歌曲序列；将初始歌曲序列输入初始歌曲推荐模型中进行处理，得到初始歌曲序列的参考特征序列，将对比歌曲序列输入初始歌曲推荐模型中进行处理，得到对比歌曲序列的对比特征序列；根据参考特征序列和对比特征序列确定第一差异参数，并根据第一差异参数对初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。

在基于训练过程训练得到目标歌曲推荐模型后，模型的应用具体可以由终端设备102执行，可以理解成，将目标歌曲推荐模型部署于终端设备102中，并在各类音乐推荐系统中向用户推荐音乐，即音乐推荐场景。在音乐推荐场景中，利用目标歌曲推荐模型向用户推荐歌曲，当用户启动一个音乐应用程序a后，终端设备102可以调用该目标歌曲推荐模型获取该用户的属性信息(包括用户的标识、头像、性别、该用户的歌曲推荐指示信息)，然后根据用户的属性信息和兴趣点推荐用户喜欢的歌曲，推荐的歌曲可以是一个集合，然后将该集合存放于一个音乐列表中，可以用户“推荐列表”、“每日推荐”等进行展示，用户可以通过该列表进行播放。

或者，终端设备102实时向用户推荐歌曲，当用户启动一个音乐应用程序a后，终端设备102可以调用该目标歌曲推荐模型获取该用户的属性信息(包括用户的标识、头像、性别、该用户的歌曲推荐指示信息)，当用户点击实时类播放控件、如“电台”、“直播”等，终端设备102基于用户的属性信息以及用户的兴趣点实时向用户推荐歌曲，在用户听完一首歌曲A后，再实时向用户推荐和歌曲A风格接近的歌曲。

可选的，上述的模型训练可以用于训练任何和推荐相关的模型，例如，商品推荐模型，商品推荐模型可以向用户推荐用户感兴趣的商品；文学推荐模型，文学推荐模型可以向用户推荐用户感兴趣的文学作品、视频推荐模型，视频推荐模型可以向用户推荐用户感兴趣的视频。

可以理解的是，本申请实施例描述的模型训练系统是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着系统架构的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

需要特别说明的是，在本申请的各个实施例中，涉及到采集对象的歌曲信息等相关的数据，当本申请的各个实施例运用到具体产品或技术中时，需要获得对象的许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

请参见图2，为本申请实施例公开的一种模型训练方法的流程示意图，该模型训练方法主要介绍目标歌曲推荐模型的训练过程。该模型训练方法可以由计算机设备执行，计算机设备可以是上述模型训练系统中的服务器101。如图2所示，该模型训练方法可以包括但不限于以下步骤S201-步骤S204：

S201：获取目标用户的初始歌曲序列，初始歌曲序列是根据目标用户的听歌行为所涉及的多首歌曲的歌曲信息生成，多首歌曲中的每一首歌曲对应一个歌曲标签，歌曲标签为正例标签或者负例标签，歌曲标签是根据歌曲对应的播放特征确定的。

在一种可能的实现过程中，获取目标用户的初始歌曲序列的过程可以包括：可以先获取目标用户的听歌行为所涉及的多首歌曲，即目标用户的历史听歌歌曲，可以是从数据库(包括本地存储和线上存储)中获取的，并同时获取多首歌曲的歌曲信息，歌曲信息可以包括歌曲名称、歌曲歌手、歌曲曲风、歌曲语言、歌曲时间信息以及歌曲播放特征等。然后利用自然语言处理技术，对多首歌曲的歌曲信息以及目标用户的用户信息进行特征提取处理，得到目标用户的初始歌曲序列，特征提取方法种类繁多，包括主成分分析方法、模型提取方法等。由上述可知，每一首歌曲都对应了一个歌曲标签，每一首歌曲对应的歌曲标签的确定过程可以包括：获取歌曲信息中包括的歌曲的播放特征，将满足预设播放特征的歌曲的歌曲标签确定为正例标签，将不满足预设播放特征的歌曲的歌曲标签确定为负例标签。在本申请中，满足预设条件可以包括：播放特征为完播或者播放时长达到时长阈值中的一种或者多种。不满足预设条件包括：播放时长未达到时长阈值，用户的具体表现为切歌，即未听完这首歌就切换到下一首歌曲了。

在进行模型训练之前，需要先获取相关的训练数据，在本申请实施例中，目标用户的初始歌曲序列即训练数据。目标用户只是示例性的，在实际的训练过程中，获取的可以是N个用户的初始歌曲序列，N是一个较大的数值。

S202：确定歌曲标签为正例标签的每一首歌曲的歌曲属性，并根据歌曲属性对初始歌曲序列进行掩码处理，得到对比歌曲序列，歌曲属性为关键歌曲属性或者非关键歌曲属性。

为了训练出一个推荐命中率更高的目标歌曲推荐模型，在确定出目标用户的歌曲标签为正例标签的所有歌曲和歌曲标签为负例标签的所有歌曲后，针对歌曲标签为正例标签的所有歌曲再进行一次区分，以解决“兴趣塌陷”问题。在本申请实施例中，确定歌曲标签为正例标签的所有歌曲的歌曲属性可以采用以下两种方案：

方案一，先获取用户针对目标歌曲的操作行为，目标歌曲为多首歌曲中歌曲标签为正例标签的任意一首歌曲；可以理解成，对于歌曲标签为正例标签的每一首歌曲都执行该步骤。若用户针对目标歌曲的操作行为存在目标行为，则确定目标歌曲的歌曲属性为关键歌曲属性；目标行为包括下载行为、收藏行为、分享行为以及评论行为中的一种或多种；若用户针对所述目标歌曲的操作行为不存在目标行为，则确定目标歌曲的歌曲属性为非关键歌曲属性。关键歌曲属性指的是这样属性对应的歌曲目标用户更感兴趣，非关键歌曲属性指的是这样属性对应的歌曲可能是用户不感兴趣的歌曲。

方案二，确定第一歌曲的歌曲特征和第二歌曲的歌曲特征(如向量表达形式)，第一歌曲为歌曲集合中的任意一首歌曲，第二歌曲为所述歌曲集合中除第一歌曲之外的任意一首歌曲，歌曲集合由多首歌曲中歌曲标签为正例标签的歌曲构成；根据第一歌曲的歌曲特征和第二歌曲的歌曲特征，确定第一歌曲和第二歌曲的歌曲相似度；根据歌曲相似度，确定歌曲集合中与第一歌曲的歌曲相似度大于或者等于相似度阈值的歌曲的占比；若占比大于或者等于占比阈值，则确定第一歌曲的歌曲属性为关键歌曲属性；若占比小于占比阈值，则确定第一歌曲的歌曲属性为非关键歌曲属性。这个过程可以采用自注意力(self-attention)机制实现，其实质就是比较各个歌曲之间的相似性，通过这样的方法可以获取更为精确的划分。

或者，方案一和方案二结合确定出歌曲标签为正例标签的所有歌曲的歌曲属性。例如，可以是基于方案一确定出一个中间的分支，然后在基于方案二确定出每首歌曲的歌曲属性。具体可以包括：先获取用户针对目标歌曲的操作行为，目标歌曲为多首歌曲中歌曲标签为正例标签的任意一首歌曲；若用户针对目标歌曲的操作行为存在目标行为，则确定目标歌曲的歌曲属性为参考关键歌曲属性；目标行为包括下载行为、收藏行为、分享行为以及评论行为中的一种或多种；若用户针对所述目标歌曲的操作行为不存在目标行为，则确定目标歌曲的歌曲属性为非关键歌曲属性。然后利用歌曲属性为参考关键歌曲属性的歌曲执行方案二，确定第三歌曲的歌曲特征和第四歌曲的歌曲特征(如向量表达形式)，第三歌曲为第二歌曲集合中的任意一首歌曲，第四歌曲为第二歌曲集合中除第三歌曲之外的任意一首歌曲，第二歌曲集合由多首歌曲中歌曲标签为正例标签中歌曲属性为参考关键属性的歌曲构成；根据第三歌曲的歌曲特征和第四歌曲的歌曲特征，确定第三歌曲和第四歌曲的歌曲相似度；根据歌曲相似度，确定歌曲集合中与第三歌曲的歌曲相似度大于或者等于相似度阈值的歌曲的占比；若占比大于或者等于占比阈值，则确定第三歌曲的歌曲属性为关键歌曲属性；若占比小于占比阈值，则确定第三歌曲的歌曲属性为非关键歌曲属性。

或者，可以是利用方案一确定歌曲标签为正例标签的所有歌曲的歌曲属性，然后利用方案二进行校验；再或者，可以是利用方案二确定歌曲标签为正例标签的所有歌曲的歌曲属性，然后利用方案一进行校验。两种方案利用是以任意的方式进行组合，对歌曲标签为正例标签的所有歌曲的进行处理，以确定歌曲的属性信息。

其中，这里的用户也包括目标用户，任意用户的关键歌曲属性和非关键歌曲属性的确定都可以采用上述方法。

进一步的，在确定出歌曲标签为正例标签的所有歌曲的歌曲属性后，根据歌曲属性对初始歌曲序列进行掩码处理，得到对比歌曲序列，可以包括：先从歌曲属性为关键歌曲属性的歌曲中确定第一待处理歌曲，第一待处理歌曲是歌曲属性为关键歌曲属性的部分歌曲或者全部歌曲，可以是按着一定的规则或者随机选取的，将初始歌曲序列中第一待处理歌曲对应的序列元素进行掩码处理，得到第一歌曲序列；从歌曲属性为非关键歌曲属性的歌曲中确定第二待处理歌曲，第二待处理歌曲是歌曲属性为非关键歌曲属性的部分歌曲或者全部歌曲，也可以是按着一定的规则或者随机选取的，将初始歌曲序列中第二待处理歌曲对应的序列元素进行掩码处理，得到第二歌曲序列。将第一歌曲序列和第二歌曲序列确定为对比歌曲序列，也即对比歌曲序列包括两个歌曲序列，一个是第一歌曲序列，另一个是第二歌曲序列。

或者，根据歌曲属性对初始歌曲序列进行掩码处理，得到对比歌曲序列，还可以包括：先从歌曲属性为关键歌曲属性的歌曲中确定关键歌曲，将初始歌曲序列中关键歌曲对应的序列元素进行第一随机掩码处理，得到第一歌曲序列；从歌曲属性为非关键歌曲属性的歌曲中确定非关键歌曲，将初始歌曲序列中非关键歌曲对应的序列元素进行第二随机掩码处理，得到第二歌曲序列。将第一歌曲序列和第二歌曲序列确定为对比歌曲序列。其中，关键歌曲指的是歌曲标签为正例标签，且歌曲属性为关键歌曲属性的全部歌曲，非关键歌曲指的是歌曲标签为正例标签，且歌曲属性为非关键歌曲属性的全部歌曲。第一随机掩码处理和第二随机掩码处理可以是相同的，也可以是不同，随机掩码处理，就是对关键歌曲与非关键歌曲对应的序列元素进行部分掩码或者全部掩码。可以根据不同情况进行设置，本申请不予限定。

其中，对比歌曲序列的构造是本申请实施例的一个重点，可以举例进行说明，请参见图3，是本申请实施例提供的一种构建对比歌曲序列的示意图，对初始歌曲序列进行关键歌曲序列和非关键歌曲序列的识别，得到关键歌曲序列和非关键歌曲序列。然后进行对比歌曲序列的构造，基于关键歌曲序列对初始歌曲序列进行掩码处理，得到第一歌曲序列，基于非关键歌曲序列对初始歌曲序列进行掩码处理，得到第二歌曲序列。其中，在图3中的初始歌曲序列是经过步骤S201处理后，即歌曲标签为正例标签的歌曲序列。

S203：将初始歌曲序列输入初始歌曲推荐模型中进行处理，得到初始歌曲序列的参考特征序列，将对比歌曲序列输入初始歌曲推荐模型中进行处理，得到对比歌曲序列的对比特征序列。

步骤S203主要是阐述的模型对数据的处理过程，可以结合图4对步骤S203进行阐述，图4是本申请实施例提供的一种模型的框架图，可以包括嵌入层、特征融合层以及多任务处理层。可以先将初始歌曲序列输入初始歌曲推荐模型的嵌入层中进行处理，得到初始歌曲序列的参考特征序列，如图4中的401代表的是模型的初始歌曲序列，包括用户的基本信息(如标识、头像、性别、城市等等)、歌曲标识、歌曲特征以及用户特征；根据步骤S202可知，对比歌曲序列包括第一歌曲序列和第二歌曲序列，从而将对比歌曲序列输入初始歌曲推荐模型中的嵌入层进行处理，得到对比歌曲序列的对比特征序列，具体可以包括：将第一歌曲序列输入初始歌曲推荐模型中进行处理，得到第一对比特征序列；将第二歌曲序列输入初始歌曲推荐模型中进行处理，得到第二对比特征序列；将第一对比特征序列和第二对比特征序列确定为对比特征序列，即对比特征序列包括第一对比特征序列和第二对比特征序列。如图4中的402所示，第一对比特征序列和第二对比特征序列的处理过程是中间步骤，其作用是对正例歌曲序列的输入进行加强。

其中，需要注意的是，图4示出的模型结构只是示例性的，也可以直接采用简单地DNN网络。

S204：根据参考特征序列和对比特征序列确定第一差异参数，并根据第一差异参数对初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。

其中，第一差异参数指的图4中示出的402所示部分的损失。根据参考特征序列和对比特征序列确定第一差异参数，主要可以包括：确定参考特征序列和第一对比特征序列之间的第一相似参数，确定参考特征序列和第二对比特征序列之间的第二相似参数，根据第一相似参数和第二相似参数，确定第一差异参数。

进一步的，由于本申请实施例训练的是一个通用模型，因此，想要确定出目标用户对应的目标歌曲推荐模型，需要大量的其他用户的数据，各种用户的数据都进行训练，以此来训练出一个通用的目标歌曲推荐模型，适用于所有人群。目标用户是用户集合中的任意一个，用户集合包括多个用户，针对参考用户，获取参考用户的初始歌曲序列，将参考用户的初始歌曲序列输入初始歌曲推荐模型中进行处理，得到参考用户的初始歌曲序列的特征序列；参考用户为用户集合中除目标用户之外的任意一个用户。然后确定参考特征序列和参考用户的初始歌曲序列的特征序列之间的第三相似参数。最后，根据第一相似参数、第二相似参以及各个参考用户对应的第三相似参数，确定第一差异参数。

其中，第一差异参数L1的计算公式可以参见如下公式(1)：

公式(1)计算的一次训练的损失，其中，s()代表一个函数，例如，可以是一个内积函数，即将两个数据进行内积操作，两个向量越接近，其内积值越大。指的是第i个用户的用户表征(即第i个用户的初始歌曲序列的特征序列，若第i个用户是目标用户，则即是参考特征序列)，指的是第i个用户的第一对比特征序列，指的是第i个用户的第二对比特征序列。指的是第j个用户的用户表征(即第j个用户的初始歌曲序列的特征序列)。该公式的目标就使用户i的用户表征和第一对比特征序列(正例)向量接近，和第二对比特征序列(负例)拉远。这样提取用户的兴趣点更准确。

在实际的训练过程中，除了上述第一差异参数这个辅助损失外，模型的主要输出也有一个损失，即根据每一首歌曲的预测结果和每一首歌曲的标签数据(要么是正例标签，要么是负例标签)计算出来的损失。在本申请实施例中，用第二差异参数来描述该损失，第二差异参数可以采用交叉熵损失函数。根据上述阐述可知，初始歌曲推荐模型对初始歌曲序列的处理结果还包括初始歌曲序列的预测结果集合，预测结果集合包括多首歌曲中每一首歌曲的预测结果，预测结果可以是一个概率值，因此，结合第一差异参数，模型的具体训练过程可以包括：根据多首歌曲中每一首歌曲的预测结果和歌曲标签确定第二差异参数；根据第一差异参数和第二差异参数确定目标差异参数；根据目标差异参数对初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。即根据目标差异参数对初始歌曲推荐模型的模型参数进行不断的调整，当模型的目标差异参数小于差异阈值或者迭代次数达到设定次数时，停止对模型的参数的调整，将当前调整得到的模型作为目标歌曲推荐模型。通过这样的训练，希望目标歌曲推荐模型能够对待推荐歌曲进行预估，准确预估到用户会听多久以及是否会完整播放等。

其中，目标差异参数Lall的计算公式可以参见如下公式(2)：

公式(2)中，L1为第一差异参数，L2为第二差异参数，l2_norm₂表示的是对预测数据进行特征归一化得到的特征序列，l2_norm₁表示的是对计算第一差异参数后的输出数据进行特征归一化后的特征序列，r代表权重参数。在本申请实施例中，两个差异参数可以采用meta-balance的方法进行融合，由于在推荐场景中使用多任务学习，通常会遇到严重的优化不平衡问题。一方面，一个或多个辅助任务可能比目标任务具有更大的影响，甚至主导网络权重，导致目标任务的推荐精度降低。另一方面，一个或多个辅助任务的影响可能太弱，无法帮助目标任务。这种不平衡在整个训练过程中动态变化，并在同一网络的不同部分发生变化。Meta-balance方法对辅助任务的梯度依据目标任务的梯度进行缩放，并且在缩放的同时保留一部分自身的梯度，从而缓解辅助任务梯度过大过小的问题。即对r值进行调整，使不同任务的梯度相近。

本申请实施例中，主要阐述的是目标歌曲推荐模型是如何训练得到的，先对训练样本数据进行处理，即获取目标用户的初始歌曲序列，初始歌曲序列是根据多首歌曲的歌曲信息(名称、歌手、曲风、语言)生成的，多首歌曲为目标用户的听歌行为所涉及的歌曲(历史听歌歌曲)，多首歌曲中的每一首歌曲对应一个歌曲标签，歌曲标签为正例标签或者负例标签，歌曲标签是根据歌曲对应的播放特征确定的；确定歌曲标签为正例标签的每一首歌曲的歌曲属性，并根据歌曲属性对初始歌曲序列进行掩码处理，得到对比歌曲序列，歌曲属性为关键歌曲属性或者非关键歌曲属性。然后将处理过的训练样本输入到初始歌曲推荐模型中，对模型进行训练，即将初始歌曲序列输入初始歌曲推荐模型中进行处理，得到初始歌曲序列的参考特征序列，将对比歌曲序列输入初始歌曲推荐模型中进行处理，得到对比歌曲序列的对比特征序列；根据参考特征序列和对比特征序列确定第一差异参数，并根据第一差异参数对初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。用上述的步骤处理过的数据进行模型训练，可以提升模型训练效果，也就是更能训练出用户的兴趣点，从而使得到的目标歌曲推荐模型可以精准地推荐用户感兴趣的歌曲。

结合上述的训练过程，请参见图5，图5本申请实施例公开的另一种模型训练方法的流程示意图，该模型训练方法主要介绍目标歌曲推荐模型的训练过程和预测过程，该模型训练方法由服务器和终端设备交互执行。如图5所示，该模型训练方法可以包括但不限于以下步骤S201-步骤S204：

S501：服务器获取用户集合中每个用户的初始歌曲序列。

用户集合中每个用户的初始歌曲序列是根据多首歌曲的歌曲信息生成的，多首歌曲为每个用户的听歌行为所涉及的歌曲，多首歌曲中的每一首歌曲对应一个歌曲标签，歌曲标签为正例标签或者负例标签，歌曲标签是根据歌曲对应的播放特征确定的。具体的确定过程可以参见步骤S201。

S502：服务器将用户集合中每个用户的初始歌曲序列进行划分，得到多组训练数据。例如，有N个用户，每个用户的初始歌曲序列对应M首歌，可以每次抽取一个用户的10首歌，由10*N组成一组训练数。

S503：服务器利用多组训练数据对初始歌曲推荐模型进行训练，得到目标歌曲推荐模型。即针对多组训练数据中的每一组数据中的每一个用户都执行如图2所示出的相关步骤。分别计算目标差异参数，即总损失，并基于总损失对初始歌曲推荐模型的网络参数进行调整，以得到目标歌曲推荐模型。

S504：服务器将目标歌曲推荐模型部署于终端设备中。目标歌曲推荐模型可以部署于任何终端设备中，或者也可以将目标歌曲推荐模型部署于区块链网络中，使用时，从区块链网络中获取即可。

S505：终端设备获取待推荐歌曲的歌曲信息以及待推荐用户的歌曲推荐指示信息。

待推荐歌曲的歌曲信息可以从曲库中获取的(曲库中包括已发布的所有的歌曲，包括本地存储的歌曲)，也可以是根据在用户的听歌过程中从各个网络平台拉取的。同时，还需要根据待推荐用户的用户信息获取待推荐歌曲的歌曲信息以及待推荐用户的歌曲推荐指示信息，这里的用户信息主要可以指的是用户标识，如用户id、用户昵称、用户头像等信息。歌曲推荐指示信息是在训练过程中生成的一个向量池的向量，该歌曲推荐指示信息主要用于表征待推荐用户的历史听歌特性。其中，待推荐歌曲可以指示的是一首歌，也可以指示的是一个歌曲集合。

S506：终端设备将歌曲推荐指示信息和待推荐歌曲的歌曲信息输入目标歌曲推荐模型中进行处理，得到待推荐歌曲的推荐分数。

在一种可能的实现方式中，若待推荐歌曲指示的是一首歌，则终端设备将待推荐用户的歌曲推荐指示信息和待推荐歌曲的歌曲信息输入目标歌曲推荐模型中进行处理，得到待推荐歌曲的推荐分数。

在另一种可能的实现方式中，若待推荐歌曲指示的是一个歌曲集合时，可以是将整个歌曲集合中的歌曲的歌曲信息和待推荐用户的歌曲推荐指示信息输入指示的输入目标歌曲推荐模型中进行处理，得到整个歌曲集合中各个歌曲的推荐分数。

S507：终端设备根据推荐分数针对待推荐歌曲进行歌曲推荐。

其中，若待推荐歌曲的推荐分数达到分数阈值，则终端设备向待推荐用户推荐这首待推荐歌曲。

根据步骤S507可知，当得到的是整个歌曲集合中各个歌曲的推荐分数时，先确定推荐分数大于分数阈值的歌曲，然后按照分数高低对大于分数阈值的歌曲进行排序，将排序后的歌曲添加到待播放列表，并将待播放列表展示给待推荐用户，待推荐用可以对列表中的歌曲进行选择播放。

其中，步骤S505-S507也可以由服务器执行，相当于终端设备将播放请求发送给服务器，服务器获取待推荐歌曲的歌曲信息以及待推荐用户的歌曲推荐指示信息，将歌曲推荐指示信息和待推荐歌曲的歌曲信息输入目标歌曲推荐模型中进行处理，得到待推荐歌曲的推荐分数，再根据推荐分数针对待推荐歌曲进行歌曲推荐，向终端设备返回推荐结果，终端设备再进行展示。

基于上述的目标歌曲推荐模型，开发人员对其进行了上线测试，基于目标歌曲推荐模型，在用户的听歌过程中，用户对推荐歌曲的听歌时长增加了3.01％；对推荐歌曲的收藏行为提升了5.21％。因此，本申请实施例提供的方法可以更为精准地向用户推荐歌曲。

本申请实施例，主要阐述的是模型训练方法的整个过程，包括训练过程和预测过程，在训练过程中，对样本数据进行精确地划分，以提升模型训练效果。在预测过程中，通过实验，确定出本申请提供的目标歌曲推荐模型可以更为准确地向用户推荐歌曲。

请参见图6，图6是本申请实施例提供的一种模型训练装置的结构示意图，该模型训练装置600可以设置于本申请实施例提供的计算机设备中，计算机设备可以是上述方法实施例中提及的服务器101。图6所示的模型训练装置600可以是运行于计算机设备中的一个计算机程序(包括程序代码)，该模型训练装置600可以用于执行图2或图5所示的方法实施例中的部分或全部步骤。请参见图6，该模型训练装置600可以包括如下单元：

获取单元601，用于获取目标用户的初始歌曲序列，所述初始歌曲序列是根据所述目标用户的听歌行为所涉及的多首歌曲的歌曲信息生成，所述多首歌曲中的每一首歌曲对应一个歌曲标签，所述歌曲标签为正例标签或者负例标签，所述歌曲标签是根据歌曲对应的播放特征确定的；

确定单元602，用于确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性，并根据所述歌曲属性对所述初始歌曲序列进行掩码处理，得到对比歌曲序列，所述歌曲属性为关键歌曲属性或者非关键歌曲属性；

处理单元603，用于将所述初始歌曲序列输入初始歌曲推荐模型中进行处理，得到所述初始歌曲序列的参考特征序列，将所述对比歌曲序列输入所述初始歌曲推荐模型中进行处理，得到所述对比歌曲序列的对比特征序列；根据所述参考特征序列和所述对比特征序列确定第一差异参数，并根据所述第一差异参数对所述初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。

在一种可能实现方式中，所述确定单元602用于确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性时，具体用于执行以下步骤：

获取目标用户针对目标歌曲的操作行为，所述目标歌曲为所述多首歌曲中所述歌曲标签为所述正例标签的任意一首歌曲；

若所述目标用户针对所述目标歌曲的操作行为存在目标行为，则确定所述目标歌曲的歌曲属性为所述关键歌曲属性；所述目标行为包括下载行为、收藏行为、分享行为以及评论行为中的一种或多种；

若所述目标用户针对所述目标歌曲的操作行为不存在所述目标行为，则确定所述目标歌曲的歌曲属性为所述非关键歌曲属性。

在一种可能的实现方式中，所述处理单元603用于根据所述歌曲属性对所述初始歌曲序列进行掩码处理，得到对比歌曲序列时，具体用于执行如下步骤：

在一种可能的实现方式中，所述确定单元602用于根据所述参考特征序列和所述对比特征序列确定第一差异参数时，具体用于执行如下步骤：

获取参考用户的初始歌曲序列，将所述参考用户的初始歌曲序列输入初始歌曲推荐模型中进行处理，得到所述参考用户的初始歌曲序列的特征序列；所述参考用户为所述目标用户所在用户集合中除所述目标用户之外的任意一个用户；

所述确定单元602，还用于根据所述多首歌曲中每一首歌曲的所述预测结果和所述歌曲标签确定第二差异参数；

其中，所述处理单元603根据所述第一差异参数对所述初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型时，具体用于执行如下步骤：

在一种可能的实现方式中，所述获取单元601获取待推荐歌曲的歌曲信息以及待推荐用户的歌曲推荐指示信息；

所述处理单元603，用于将所述歌曲推荐指示信息和所述待推荐歌曲的歌曲信息输入所述目标歌曲推荐模型中进行处理，得到所述待推荐歌曲的推荐分数；根据所述推荐分数针对所述待推荐歌曲进行歌曲推荐。

可以理解的是，本申请实施例提供的模型训练装置的各功能单元的功能可根据上述方法实施例中的方法具体实现，其具体实现过程可以参照上述方法实施例中的相关描述，此处不再赘述。

在可行的实施例中，本申请实施例提供的模型训练装置可以采用软件方式实现，模型训练装置可以存储在存储器中，其可以是程序和插件等形式的软件，并包括一系列的单元，包括获取单元、处理单元以及确定单元；其中，获取单元、确定单元以及处理单元用于实现本申请实施例提供的模型训练方法。

在其它可行的实施例中，本申请实施例提供的模型训练装置也可以采用软硬件结合的方式实现，作为示例，本申请实施例提供的模型训练装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的模型训练方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application SpecificIntegrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

本申请实施例，获取单元601获取目标用户的初始歌曲序列，初始歌曲序列是根据多首歌曲的歌曲信息(名称、歌手、曲风、语言)生成的，多首歌曲为目标用户的听歌行为所涉及的歌曲(历史听歌歌曲)，多首歌曲中的每一首歌曲对应一个歌曲标签，歌曲标签为正例标签或者负例标签，歌曲标签是根据歌曲对应的播放特征确定的；确定单元602确定歌曲标签为正例标签的每一首歌曲的歌曲属性，并根据歌曲属性对初始歌曲序列进行掩码处理，得到对比歌曲序列，歌曲属性为关键歌曲属性或者非关键歌曲属性；对歌曲标签为正例标签的歌曲进行属性划分，得到对比歌曲序列，引入属性信息后构成的对比歌曲序列，可以更精确地对用户的初始歌曲序列进行划分，可以更为准确地确定用户的兴趣点。处理单元603将初始歌曲序列输入初始歌曲推荐模型中进行处理，得到初始歌曲序列的参考特征序列，将对比歌曲序列输入初始歌曲推荐模型中进行处理，得到对比歌曲序列的对比特征序列；根据参考特征序列和对比特征序列确定第一差异参数，并根据第一差异参数对初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型。用上述的步骤处理过的数据进行模型训练，可以提升模型训练效果，也就是更能训练出用户的兴趣点，从而使得到的目标歌曲推荐模型可以精准地推荐用户感兴趣的歌曲。

基于上述方法以及装置实施例，本申请本实施例提供了一种计算机设备，该计算机设备可以是前述所提及的服务器101。请参见图7，图7为本申请实施例提供的一种计算机设备的结构示意图。本申请实施例中所描述的计算机设备包括：处理器701、通信接口702及存储器703。其中，处理器701、通信接口702及存储器703可通过总线或其他方式连接，本申请实施例以通过总线连接为例，计算机设备可以是图1示出的应用界面的色彩管理系统中的第一终端设备101、第二终端设备103以及服务器102中的任意一个。

其中，处理器701(或称CPU(Central Processing Unit，中央处理器))是计算机设备的计算核心以及控制核心，其可以解析计算机设备内的各类指令以及处理计算机设备的各类数据，例如：CPU可以用于解析用户向计算机设备所发送的开关机指令，并控制计算机设备进行开关机操作；再如：CPU可以在计算机设备内部结构之间传输各类交互数据，等等。通信接口702可选的可以包括标准的有线接口、无线接口(如Wi-Fi、移动通信接口等)，受处理器701的控制用于收发数据。存储器703(Memory)是计算机设备中的记忆设备，用于存放程序和数据。可以理解的是，此处的存储器703既可以包括计算机设备的内置存储器，当然也可以包括计算机设备所支持的扩展存储器。存储器703提供存储空间，该存储空间存储了计算机设备的操作系统，可包括但不限于：Android系统、iOS系统、Windows Phone系统等等，本申请对此并不作限定。

在本申请实施例中，处理器701通过运行存储器703中的可执行程序代码，执行如下操作：

获取目标用户的初始歌曲序列，所述初始歌曲序列是根据所述目标用户的听歌行为所涉及的多首歌曲的歌曲信息生成，所述多首歌曲为所述目标用户的听歌行为所涉及的歌曲，所述多首歌曲中的每一首歌曲对应一个歌曲标签，所述歌曲标签为正例标签或者负例标签，所述歌曲标签是根据歌曲对应的播放特征确定的；

在一种可能实现方式中，所述处理器701用于确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性时，具体用于执行以下步骤：

在一种可能的实现方式中，所述处理器701用于根据所述歌曲属性对所述初始歌曲序列进行掩码处理，得到对比歌曲序列时，具体用于执行如下步骤：

在一种可能的实现方式中，所述处理器701用于根据所述参考特征序列和所述对比特征序列确定第一差异参数时，具体用于执行如下步骤：

在一种可能的实现方式中，所述初始歌曲推荐模型对所述初始歌曲序列的处理结果还包括所述初始歌曲序列的预测结果集合，所述预测结果集合包括所述多首歌曲中每一首歌曲的预测结果，所述预测结果用于指示所述每一首歌曲的推荐程度；所述处理器701，还用于：

根据所述多首歌曲中每一首歌曲的所述预测结果和所述歌曲标签确定第二差异参数；

其中，所述处理器701根据所述第一差异参数对所述初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型时，具体用于执行如下步骤：

在一种可能的实现方式中，所述处理器701还用于：

获取待推荐歌曲的歌曲信息以及待推荐用户的歌曲推荐指示信息；

将所述歌曲推荐指示信息和所述待推荐歌曲的歌曲信息输入所述目标歌曲推荐模型中进行处理，得到所述待推荐歌曲的推荐分数；根据所述推荐分数针对所述待推荐歌曲进行歌曲推荐。

根据本申请的一个方面，本申请实施例还提供了一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序存储在计算机可读存储介质中。处理器701从计算机可读存储介质中读取该计算机程序，处理器701执行该计算机程序，使得计算机设备执行图2以及图5示出的相关方法。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可能可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如上述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的护范围为准。

Claims

1.一种模型训练方法，其特征在于，所述方法包括：

确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性，所述歌曲属性是基于所述目标用户针对所述正例标签中的歌曲的操作行为或在所述正例标签中的歌曲的相似度来确定的，并为关键歌曲属性或者非关键歌曲属性；根据所述歌曲属性对所述初始歌曲序列进行掩码处理，得到对比歌曲序列，其中，对具有所述关键歌曲属性的歌曲和具有所述非关键歌曲属性的歌曲进行不同的掩码处理；

2.根据权利要求1所述的方法，其特征在于，所述确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性，包括：

3.根据权利要求1所述的方法，其特征在于，所述确定所述歌曲标签为所述正例标签的每一首歌曲的歌曲属性，包括：

4.根据权利要求1-3中任一项所述的方法，其特征在于，所述根据所述歌曲属性对所述初始歌曲序列进行掩码处理，得到对比歌曲序列，包括：

从所述歌曲属性为所述关键歌曲属性的歌曲中确定第一待处理歌曲，将所述初始歌曲序列中所述第一待处理歌曲对应的序列元素进行掩码处理，得到第一歌曲序列；从所述歌曲属性为所述非关键歌曲属性的歌曲中确定第二待处理歌曲，将所述初始歌曲序列中所述第二待处理歌曲对应的序列元素进行掩码处理，得到第二歌曲序列；

将所述第一歌曲序列输入所述初始歌曲推荐模型中进行处理，得到第一对比特征序列；将所述第二歌曲序列输入所述初始歌曲推荐模型中进行处理，得到第二对比特征序列；

5.根据权利要求4所述的方法，其特征在于，所述根据所述参考特征序列和所述对比特征序列确定第一差异参数，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据所述参考特征序列和所述对比特征序列确定第一差异参数，包括：

7.根据权利要求1所述的方法，其特征在于，所述初始歌曲推荐模型对所述初始歌曲序列的处理结果还包括所述初始歌曲序列的预测结果集合，所述预测结果集合包括所述多首歌曲中每一首歌曲的预测结果，所述预测结果用于指示所述每一首歌曲的推荐程度；所述方法还包括：

其中，所述根据所述第一差异参数对所述初始歌曲推荐模型的模型参数进行调整，以得到目标歌曲推荐模型，包括：

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将所述歌曲推荐指示信息和所述待推荐歌曲的歌曲信息输入所述目标歌曲推荐模型中进行处理，得到所述待推荐歌曲的推荐分数；

根据所述推荐分数针对所述待推荐歌曲进行歌曲推荐。

9.一种计算机设备，其特征在于，所述计算机设备包括：

处理器，适于实现一条或多条计算机程序；以及，

计算机存储介质，所述计算机存储介质存储有一条或多条计算机程序，所述一条或多条计算机程序适于由所述处理器加载并执行如权利要求1-8任一项所述的模型训练方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有一条或多条计算机程序，所述一条或多条计算机程序适于由处理器加载并执行如权利要求1-8任一项所述的模型训练方法。