[go: up one dir, main page]

CN111026908A - 歌曲标签确定方法、装置、计算机设备以及存储介质 - Google Patents

歌曲标签确定方法、装置、计算机设备以及存储介质 Download PDF

Info

Publication number
CN111026908A
CN111026908A CN201911261720.2A CN201911261720A CN111026908A CN 111026908 A CN111026908 A CN 111026908A CN 201911261720 A CN201911261720 A CN 201911261720A CN 111026908 A CN111026908 A CN 111026908A
Authority
CN
China
Prior art keywords
song
label
class label
model
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911261720.2A
Other languages
English (en)
Other versions
CN111026908B (zh
Inventor
缪畅宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911261720.2A priority Critical patent/CN111026908B/zh
Publication of CN111026908A publication Critical patent/CN111026908A/zh
Application granted granted Critical
Publication of CN111026908B publication Critical patent/CN111026908B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种歌曲标签确定方法、装置、计算机设备以及存储介质,属于数据处理领域。方法包括:获取目标歌曲的频域信息;将频域信息输入到第一类标签确定模型中,由第一类标签确定模型基于频域信息确定目标歌曲的第一类标签,其中,第一类标签用于表示第二类标签的标签类型,第二类标签用于表示目标歌曲的音频特征;基于目标歌曲的第一类标签,确定第一类标签对应的第二类标签确定模型;将频域信息输入到第二类标签确定模型中,由第二类标签确定模型基于频域信息确定目标歌曲的至少一个第二类标签。本申请通过模型来为目标歌曲自动确定第一类标签和第二类标签,无需人工操作,大大提高了确定歌曲标签的效率。

Description

歌曲标签确定方法、装置、计算机设备以及存储介质
技术领域
本申请涉及数据处理领域,特别涉及一种歌曲标签确定方法、装置、计算机设备以及存储介质。
背景技术
随着智能终端的普及,越来越多的人会通过智能终端上安装的歌曲应用来收听歌曲。在向用户推荐歌曲时,各个歌曲应用会基于用户历史收听歌曲、用户关注的歌手的歌曲以及用户收藏的歌曲来向用户推荐歌曲,在歌曲推荐的过程中,往往会基于上述歌曲的歌曲标签来进行,因此给歌曲添加标签在进行歌曲推荐的过程中是必不可少的。
相关技术中往往会通过人工的方式向歌曲添加标签,但是人工添加歌曲标签的效率较低,造成一些歌曲迟迟未被添加标签,而这些未被添加标签的歌曲可能是用户喜欢的歌曲,但是未被添加标签的歌曲可能无法被推荐给用户,造成歌曲推荐效果不佳。因此,亟需一种自动为歌曲确定标签的方法。
发明内容
本申请实施例提供了一种歌曲标签确定方法、装置、计算机设备以及存储介质,可以解决相关技术中添加歌曲标签效率较低的问题。所述技术方案如下:
一方面,提供了一种歌曲标签确定方法,所述方法包括:
获取目标歌曲的频域信息;
将所述频域信息输入到第一类标签确定模型中,由所述第一类标签确定模型基于所述频域信息确定所述目标歌曲的第一类标签,其中,所述第一类标签用于表示第二类标签的标签类型,所述第二类标签用于表示所述目标歌曲的音频特征;
基于所述目标歌曲的第一类标签,确定所述第一类标签对应的第二类标签确定模型;
将所述频域信息输入到所述第二类标签确定模型中,由所述第二类标签确定模型基于所述频域信息确定所述目标歌曲的至少一个第二类标签。
一方面,提供了一种歌曲标签确定装置,所述装置包括:
获取模块,用于获取目标歌曲的频域信息;
第一类标签确定模块,用于将所述频域信息输入到第一类标签确定模型中,由所述第一类标签确定模型基于所述频域信息确定所述目标歌曲的第一类标签,其中,所述第一类标签用于表示第二类标签的标签类型,所述第二类标签用于表示所述目标歌曲的特点;
第一确定模块,用于基于所述目标歌曲的第一类标签,确定所述第一类标签对应的第二类标签确定模型;
第二类标签确定模块,用于将所述频域信息输入到所述第二类标签确定模型中,由所述第二类标签确定模型基于所述频域信息确定所述目标歌曲的至少一个第二类标签。
在一种可能的实施方式中,所述装置还包括:
训练模块,用于基于样本数据集进行模型训练,得到所述第二类标签确定模型,其中,所述样本数据集包括多个样本歌曲的音频信号以及每个样本歌曲的第二类标签,所述每个样本歌曲均为被用户评论过的歌曲。
在一种可能的实施方式中,所述装置还包括:
标签词典获取模块,用于获取每个第一类标签对应的标签词典,所述标签词典基于标注了所述每个第一类标签的文本信息生成;
匹配模块,用于将所述标签词典中包含的各个标签词与所述样本歌曲的评论文本进行匹配,得到至少一个标签词;
第二确定模块,用于确定所述至少一个标签词与所述样本歌曲的评论文本的相关度;
第三确定模块,用于将所述相关度符合目标条件的标签词确定为样本歌曲的第二类标签。
在一种可能的实施方式中,所述训练模块包括:
第一输入单元,用于将任一个样本歌曲的频域信息输入到与样本歌曲所属第一类标签对应的初始模型中;
预测单元,用于由所述初始模型基于所述任一个样本歌曲的频域信息预测该样本歌曲属于任一第二类标签的概率信息;
第一确定单元,用于基于所述概率信息,确定所述样本歌曲的预测第二类标签;
调整单元,用于基于所述样本歌曲的第二类标签和所述样本歌曲的预测第二类标签的差别信息,调整所述初始模型的模型参数,直至所述初始模型的模型参数符合目标截止条件时,停止训练所述初始模型,将训练后的初始模型作为所述第二类标签确定模型。
在一种可能的实施方式中,所述第二类标签确定模块包括:
第二输入单元,用于将所述频域信息输入到所述第二类标签确定模型中,由所述第二类标签确定模型输出多个第二类标签的概率信息;
第二确定单元,用于将至少一个符合目标概率信息的第二类标签确定为所述目标歌曲的至少一个第二类标签。
在一种可能的实施方式中,所述第一类标签确定模型为二分类模型。
在一种可能的实施方式中,所述第二类标签确定模型为序列标注模型。
一方面,提供了一种计算机设备,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现所述歌曲标签确定方法所执行的操作。
一方面,提供了一种存储介质,所述存储介质中存储有至少一条程序代码,所述程序代码由处理器加载并执行以实现所述歌曲标签确定方法所执行的操作。
通过本申请提供的歌曲标签确定方法,无需人工向目标歌曲添加标签,计算机设备可以基于歌曲的频域信息和第一类标签确定模型自动为目标歌曲添加第一类标签,也就是先将歌曲用第一类标签分进了不同的大类中。在此之后,计算机设备可以选择该第一标签对应的第二类标签确定模型,并将歌曲的频域信息输入到第二类标签确定模型中,由第二类标签确定模型自动对目标歌曲添加第二类标签,实现了自动对目标歌曲添加标签,提高了歌曲标签添加的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种歌曲标签确定方法的实施环境的示意图;
图2是本申请实施例提供的一种歌曲标签确定方法的流程示意图;
图3是本申请实施例提供的一种歌曲标签确定方法流程图;
图4是本申请实施例提供的一种第一类标签确定模型的训练方法的流程图;
图5是本申请实施例提供的一种第一类标签确定模型的结构示意图;
图6是本申请实施例提供的一种第二类标签确定模型的训练方法的流程图;
图7是本申请实施例提供的一种第二类标签确定模型的结构示意图;
图8是本申请实施例提供的一种歌曲标签确定装置的结构示意图;
图9是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识子模型使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
图1是本申请实施例提供的一种歌曲标签确定方法的实施环境的示意图,参见图1,该实施环境中包括终端110和服务器140。
终端110通过无线网络或有线网络与服务器110相连。终端110可以是智能手机、平板电脑、便携计算机等设备。终端110安装和运行有支持歌曲标签确定技术的应用程序。该应用程序可以是歌曲播放类应用程序等。示例性的,终端110是用户使用的终端,终端110中运行的应用程序内登录有用户账号。
终端110通过无线网络或有线网络与服务器140相连。
可选地,服务器140包括:接入服务器、歌曲标签确定服务器和数据库。接入服务器用于为终端110提供接入服务。歌曲标签确定服务器用于提供歌曲标签确定有关的后台服务。该数据库可以包括歌曲信息数据库以及用户信息数据库等,当然,还可以基于服务器所提供的不同服务可以对应于不同数据库,歌曲标签确定服务器可以是一台或多台。当歌曲标签确定服务器是多台时,存在至少两台歌曲标签确定服务器用于提供不同的服务,和/或,存在至少两台歌曲标签确定服务器用于提供相同的服务,比如以负载均衡方式提供同一种服务,本申请实施例对此不加以限定。
终端110可以泛指多个终端中的一个,本实施例仅以终端110来举例说明。
本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端可以仅为一个,或者上述终端为几十个或几百个,或者更多数量,此时上述实施环境中还包括其他终端。本申请实施例对终端的数量和设备类型不加以限定。
图2是本申请实施例提供的一种标签确定方法流程示意图,图3是本申请实施例提供的一种歌曲标签确定方法的流程图,结合图2和图3,可以更加清楚的理解本申请实施例提供的歌曲标签确定方法,参见图2和图3,方法包括:
301、计算机设备获取目标歌曲的频域信息。
在一种可能的实施方式中,计算机设备可以从歌曲数据库中获取没有标签且没有被评论过的歌曲,将上述歌曲作为目标歌曲。
在一种可能的实施方式中,计算机设备可以基于目标采样频率对目标歌曲进行采样,得到目标歌曲的音频信息。计算机设备可以将N个采样点集合成一个音频帧,提高计算机设备处理音频信号的速度,这个过程也被成为分帧,其中N为采样点的数量,N为正整数,N的大小可以根据实际需要进行设定,例如N可以取256或512,本申请实施例对于N的大小不作限定。除此之外,计算机设备在进行分帧时,可以在两个相邻的音频帧之间设置重合部分,该重合部分被称为帧移,其中,帧移的大小与N有关,例如可以取N的1/2或1/3,本申请实施例对此不做限定。采用这样的分帧方式可以避免两个相邻的音频帧之间变化过大,使得计算机设备在后续对音频信息的处理过程中可以取得更加精确的效果。
在分帧之后,计算机设备还可以对音频帧进行加窗,具体来说,计算机设备可以将每个音频帧与窗函数进行相乘,得到加窗后的音频帧。例如,加窗之后,计算机设备可以将目标歌曲以离散的时间序列Ti[T1,T2……Tn]来表示,其中每个Ti表示目标歌曲在第i个时刻的音高。窗函数可以选择汉明窗、汉宁窗、三角窗、布莱克曼窗以及凯瑟窗等,本申请实施例对此不做限定。
在加窗之后,计算机设备可以对加窗后的音频帧进行时频转换,将时域的音频信息转换到频域,得到各个音频帧的频谱。通过这样的时频转换,计算机设备可以更加方便的获取音频信号的特性,有利于计算机设备进一步对目标歌曲的频域信息进行分析,例如,计算机设备可以采用时频变换,将离散的时间序列Ti[T1,T2……Tn]表示为离散的频率序列Fj[F1,F2……Fn],其中,Fi为目标歌曲在第j个频率上的幅值。具体的时频转换方法可以采用傅里叶变换或小波变换,本申请实施例对此不做限定。需要说明的是,计算机设备可以直接将离散的频率序列Fj[F1,F2……Fn]作为目标歌曲的频域信息,也可以通过下面两个步骤对离散的频率序列Fj[F1,F2……Fn]做进一步的处理,以得到更加精准的频域信息。
步骤一、计算机设备可以采用滤波器组来对各个音频帧的频谱进行滤波,对各个音频帧的频谱进行精简,也即是,将每个音频帧与滤波器组中每一个滤波器进行频率相乘累加,得到每个音频帧在该滤波器对应频段的能量值,其中,滤波器组中滤波器的数量可以根据实际需要进行设定,本申请实施例对此不做限定。
步骤二、计算机设备可以对每个精简后的音频帧的频谱进行离散余弦变化,得到目标歌曲的频域信息。需要说明的,上述获取目标歌曲频域的方式仅仅是本申请实施例提供的一种示例性的描述,实际上计算机设备还可以通过其他方式来获取目标歌曲的频域信息,本申请实施例对此不做限定。
302、计算机设备将频域信息输入到第一类标签确定模型中,由第一类标签确定模型基于频域信息确定目标歌曲的第一类标签,其中,第一类标签用于表示第二类标签的标签类型,第二类标签用于表示目标歌曲的音频特征。
其中,第一类标签可以是提前设置好,用于表示第二类标签类型的标签,举例来说,第一类标签可以为歌曲的情感标签或歌曲的风格标签,第二标签为属于任意第一类标签的标签,比如歌曲的心情标签下的{开心,嗨},歌曲风格标签下的{乡村音乐,蓝调}以及歌曲音高标签下的{低音}等标签就属于第二类标签,需要说明的是,上述具体的标签名称仅仅是为了便于理解而设定的,并不能对本申请造成不当限定。
在一种可能的实施方式中,第一类标签确定模型是基于样本歌曲的频域信息和样本歌曲的第一类标签训练得到的,因此具有基于目标歌曲的频域信息确定目标歌曲所属的第一类标签的能力,其中,第一类标签确定模型可以为二分类模型,该二分类模型可以根据目标歌曲的频域信息判断该目标歌曲是否属于该第一类标签,每一个第一类标签都有与之对应的一个第一类标签确定模型,也就是说,第一类标签确定模型的数量与第一类标签的数量相同,每一个第一类标签确定模型的模型结构可以是相同的,而每一个第一类标签确定模型的模型参数可以是不同的,该第一类标签确定模型的作用是判断目标歌曲是否属于某一第一类标签。
在本申请实施例中,第一类标签确定模型的训练过程可以参见401-403,在此暂不做赘述。
二分类模型可以采用浅层模型或深层模型,其中,浅层模型可以为支持向量机(Support Vector Machine,SVM),逻辑回归(Logistic Regression,LR)以及决策树模型(Decision Tree,DT)等,深层模型可以采用卷积神经网络(Convolutional NeuralNetworks,CNN)以及循环神经网络(Recurrent Neural Network,RNN)等本申请实施例对二分类模型的类别不做限定。
在一种可能的实施方式中,计算机设备可以将频域信息输入到第一类标签确定模型中,由该第一类标签确定模型基于频域信息预测目标歌曲属于该第一类标签的第一概率,当第一概率大于目标概率时,确定目标歌曲属于该第一类标签,当第一概率小于目标概率时,确定目标歌曲不属于该第一类标签。
为了便于理解,本申请实施例以第一类标签确定模型为LR模型为例进行说明,但是并不能对本申请造成不当限定。
计算机设备将频域信息输入到第一类标签确定模型后,该第一类标签确定模型基于训练后的权重和偏置参数对该频域信息进行运算,再经过S型生长函数(Sigmoid)将运算结果映射到(0,1)的区间上,得到目标歌曲属于该第一类标签的第一概率。计算机设备可以将第一概率与目标概率进行比较,当第一概率大于目标概率时,确定目标歌曲属于该第一类标签,否则确定目标歌曲不属于该第一类标签,其中,目标概率可以根据实际情况进行设定,简单来说,如果希望该第一类标签确定模型预测结果的准确性更高,那么可以将该目标概率设置的较高,如果希望该第一类标签的覆盖范围更大,那么可以相应的降低该目标概率。
303、计算机设备基于目标歌曲的第一类标签,确定第一类标签对应的第二类标签确定模型。
第一类标签用于表示第二类标签的类别,也就是说每一个第一类标签下均存在一个或多个第二类标签。在一种可能的实施方式中,计算机设备可以基于第一类标签,确定与该第一类标签对应的多个第二类标签,从而确定与该第一类标签对应的第二类标签确定模型,也就是说,每个第一类标签均对应有一个不同的第二类标签确定模型。
在一种可能的实施方式中,该第二类标签确定模型是基于样本歌曲的频域信息和样本歌曲所属的第二类标签训练得到的,因此该第二类标签确定模型具有基于目标歌曲的频域信息确定目标歌曲所述的第二类别的能力。
304、计算机设备将频域信息输入到第二类标签确定模型中,由第二类标签确定模型基于频域信息确定目标歌曲的至少一个第二类标签。
具体来说,计算机设备可以将目标歌曲的频域信息输入到第二类标签确定模型中,由第二类标签确定模型输出多个第二类标签的概率信息。将至少一个符合目标概率信息的第二类标签确定为目标歌曲的至少一个第二类标签。除此之外,第二类标签实际上是基于样本歌曲的评论文本生成的,具体的生成步骤可以参见601-603。
在本申请实施例中,第二类标签确定模型的训练过程可以参见601-606,在此暂不做赘述。
在一种可能的实施方式中,第二类标签确定模型可以为序列标注模型。该序列标注模型可以采用CNN、RNN或条件随机场(Conditional Random Field,CRF)。
为了便于理解,下面以该第二类标签确定模型为CRF模型为例进行说明,当然也可以将上述任一种模型作为第二类标签确定模型,或者也可以将任何一种可以实现序列标注的模型作为第二类标签确定模型,本申请实施例对此不做限定。
在一种可能的实施方式中,计算机设备将目标歌曲的频域信息输入到训练后的第二类标签确定模型中,由该第二类标签确定模型目标歌曲的频域信息带入到各个第二类标签的特征函数中,每个第二类标签的特征函数输出的结果进行评分,当评分结果符合目标评分结果时,确定目标歌曲属于该特征函数对应的第二类标签;当评分结果不符合目标评分结果时,确定目标歌曲不属于该特征函数对应的第二类标签。具体来说,该第二类标签确定模型输出的实际上一组序列,例如(110),如果第一个数字的位置表示快乐,第二个数字的位置表示愉悦,第三个数字的位置表示悲伤,而1表示属于,0表示不属于,那么可以将该目标歌曲的第二类标签确定为快乐和愉悦。
通过本申请实施例提供的方法,计算机设备可以基于目标歌曲的频域信息自动为目标歌曲添加标签,大大提高了为目标歌曲添加标签的效率,为后续的歌曲推荐功能的实现奠定了良好的基础。同时,基于训练后的第一类标签确定模型和第二类标签确定模型为目标歌曲添加标签,可以利用深度学习模型泛化能力较强的特性,为更多类型的目标歌曲添加标签。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
图4为本申请实施例提供的一种第一类标签确定模型的训练方法的流程图,参见图4,方法包括:
401、计算机设备获取多个样本歌曲的频域信息。
其中,样本歌曲可以为被用户评论过的且已经被打上了第一类标签和第二类标签的歌曲。
在一种可能的实施方式中,样本歌曲的频域信息的获取方式可以类似于301,在此不再赘述。
402、计算机设备将任一个样本歌曲的频域信息输入到第一初始模型中,由第一初始模型基于任一个样本歌曲的频域信息预测该样本歌曲属于任一第一类标签的第一概率信息,基于第一概率信息,确定样本歌曲的预测第一类标签。
在一种可能的实施方式中,计算机设备可以基于第一类标签的数量生成相应的多个第一初始模型,将每个第一初始模型与对应的第一类标签绑定存储。当计算机设备训练某个第一类标签对应的第一初始模型时,可以直接调用该第一初始模型,将样本歌曲的频域信息输入到该第一初始模型中,由该第一初始模型基于初始化后的模型参数和样本歌曲的频域信息进行运算,得到表示该样本歌曲属于该第一类标签的第一概率信息,将该第一概率信息与第一预设概率信息进行比较,当该第一概率信息大于第一预设概率信息时,第一初始模型可以输出该样本歌曲属于该第一类标签的信息,该第一类标签可以为预测第一类标签,否则输出该样本歌曲不属于该第一类标签的信息,换句话说,该第一初始模型可以为一个二分类模型,模型每次的输出只有两种可能,即样本歌曲属于该第一类标签,或样本歌曲不属于该第一类标签。举例来说,经过运算之后,第一初始模型基于初始化后的模型参数和样本歌曲的频域信息进行运算,得到了该样本歌曲属于某个第一类标签的第一概率信息为40,预设的阈值为35,那么该第一初始模型可以输出该样本歌曲属于该第一类标签的信息,比如1,那么该第一类标签就是样本歌曲的预测第一类标签。
403、计算机设备基于样本歌曲的第一类标签和样本歌曲的预测第一类标签的第一差别信息,调整第一初始模型的模型参数,直至第一初始模型的模型参数符合目标截止条件时,停止训练第一初始模型,将训练后的第一初始模型作为第一类标签确定模型。
在一种可能的实施方式中,计算机设备可以将样本歌曲实际上的第一类标签和第一初始模型输出的预测第一类标签进行比较,得到第一差别信息,基于第一差别信息,对模型参数进行调整,随后基于下一个样本歌曲的频域信息进行预测,得到下一个样本歌曲的预测第一类标签,基于下一个样本歌曲的预测第一类标签和下一个样本歌曲实际的第一类标签的第一差别信息,再次调整模型参数,直至该模型的迭代次数达到预设次数,或者是该模型的成功预测第一标签的次数达到目标值时,停止训练该模型,将该模型作为第一类标签确定模型。具体的第一类标签确定模型结构可以参见图5。
图6为本申请实施例提供的一种第二类标签确定模型的训练方法流程图,参见图6,方法包括:
601、计算机设备获取每个第一类标签对应的标签词典,标签词典基于标注了每个第一类标签的文本信息生成。
其中,第一类标签可以是预先设置的,例如,第一类标签可以为歌曲的情感标签或者是歌曲的风格标签,第一类标签的作用是将第二类标签分类。
在一种可能的实施方式中,计算机设备可以获取目标文本信息,目标文本信息为标注了第一类标签的文本信息。比如第一类标签为“心情”,那么计算机设备可以从网络中获取与“心情”有关的文本,作为目标文本信息。举例来说,计算机设备可以基于网络爬虫获取目标文本信息,当然也可以通过其他方式来获取目标文本信息,本申请实施例对于目标文本信息的获取方式不做限定。
获取到目标文本信息之后,计算机设备可以基于目标文本信息得到标签词集合,标签词由目标文本信息中的连续字符组合而得到。具体来说,计算机设备可以基于不同的数目对目标文本中的连续字符进行组合,得到多个字符集合,还是以第一类标签为“心情”为例,计算机设备可能会得到“兴高”、“采烈”、“兴高采”以及“兴高采烈”等字符集合。
得到多个字符集合之后,计算机设备可以获取连续字符中每个字符的互相关度(Point Wise-Mutual Information,PMI),并基于互相关度来判断字符之间的搭配是否合理。举例来说,如果“兴高采”的PMI值小于“兴高采烈”的PMI值,那么计算机设备可以确定相较于“兴高采”来说,“兴高采烈”是一个更准确,更常用的字符集合。具体可以通过公式(1)来进行PMI值计算。
Figure BDA0002311777380000121
其中,x和y表示两个连续字符,P(x)和P(y)分别表示字符x和字符y在所有标注了第一类标签的文本信息中出现的概率;F(x)和F(y)表示字符x和字符y在标注了第一类标签的文本信息中出现的频率;F(x,y)表示字符x和字符y同时在所有标注了第一类标签的文本信息中出现的频数;K表示所有标注了第一类标签的文本信息的字符总数。
在一种可能的实施方式中,计算机设备可以将PMI值高于目标PMI值的字符集合确定为目标标签词,将多个目标标签词的集合作为标签词典。
602、计算机设备将标签词典中包含的各个标签词与样本歌曲的评论文本进行匹配,得到至少一个标签词。
在一种可能的实施方式中,计算机设备可以获取样本歌曲的评论文本,将标签词典中的标签词与样本歌曲的评论文本进行匹配,将匹配到的评论文本组合形成一个标签词集合。举例来说,当标签词典为情感标签词典时,计算机设备可以将情感标签词典中的情感标签词与样本歌曲的评论文本进行匹配,在匹配过程中,可能会得到“开心”、“愉悦”以及“伤心”等标签词,计算机设备可以将“开心”、“愉悦”以及“伤心”等标签词作为一个标签词集合。
603、计算机设备确定至少一个标签词与样本歌曲的评论文本的相关度,将相关度符合目标条件的标签词确定为样本歌曲的第二类标签。
在一种可能的实施方式中,计算机设备可以基于匹配的到的标签词在评论文本中出现的次数,确定该标签词与样本歌曲的评论文本的相关度,将相关度大于目标相关度的标签词确定为样本歌曲的第二类标签,其中目标相关度可以根据实际需要进行设定,本申请实施例对此不做限定。举例来说,计算机设备基于标签词典与样本歌曲的评论文本进行匹配之后,得到了一个标签词集合,标签词集合中有五个标签词“开心”、“愉悦”、“嗨”、“难过”以及“伤心”,其中“开心”在样本歌曲的评论文本中的出现次数为20,“愉悦”的出现次数为23,“嗨”的出现次数为13,“难过”的出现次数为3而“伤心”的出现次数为5,目标相关度为标签词在样本歌曲的评论文本的出现次数为15,那么计算机设备可以将“开心”和“愉悦”作为样本歌曲的第二类标签。
在一种可能的实施方式中,样本歌曲的评论文本的数量可能较少,匹配出的标签词的数量也可能较少,计算机设备可以直接将出现次数最多的标签词作为目标歌曲的第二类标签。或者,在确定样本歌曲之前,计算机设备可以基于评论文本的数量对歌曲进行筛选,将符合目标评论文本数量的歌曲作为样本歌曲。
在一种可能的实施方式中,计算机设备可以基于标签词的词频(Term Frequency,TF)和逆文档频率(Inverse Document Frequency,IDF)之间的关系,得到标签词与样本歌曲的评论文本的相关度。具体来说,计算机设备可以将某一标签词在样本歌曲的评论文本中的出现次数与样本歌曲的评论文本的总词汇数量相除,得到该标签词的词频;计算机设备可以确定目标文本信息中所包含的目标文本的第一数量,以及存在该标签词的目标文本的第二数量,将第一数量和第二数量相除,得到该标签词的逆文档频率。计算机设备将该标签词的词频和逆文档频率求和,将求和的结果作为该标签词与样本歌曲的评论文本的相关度。
需要说明的是,可以采用上述任一方式确定标签词与样本歌曲的评论的文本的相关度,本申请实施例对此不做限定。
604、计算机设备获取多个样本歌曲的频域信息。
在一种可能的实施方式中,样本歌曲频域信息的获取方式可以类似于步骤301,在此不再赘述。
605、计算机设备将任一个样本歌曲的频域信息输入到与样本歌曲所属第一类标签对应的第二初始模型中,由第二初始模型基于任一个样本歌曲的频域信息预测该样本歌曲属于任一第二类标签的第二概率信息,基于第二概率信息,确定样本歌曲的预测第二类标签。
由于第一类标签用于表示第二类标签的类别,那么每个第一类标签可以对应有多个第二类标签,也就是说,这里所说的第一类标签对应的第二初始模型,实际上是用来确定该第一类标签下的第二类标签的第二概率信息的模型。
在一种可能的实施方式中,计算机设备可以基于第一类标签的数量生成相应的多个第二初始模型,将每个第二初始模型与对应的第一类标签绑定存储。当计算机设备训练某个第一类标签对应的第二初始模型时,可以直接调用该第二初始模型,将样本歌曲的频域信息输入到该第二初始模型中,由该第二初始模型基于初始化后的模型参数和样本歌曲的频域信息进行运算,得到表示该样本歌曲属于该第一类标签下至少一个第二类标签的第二概率信息,将该第二概率信息与第二预设概率信息进行比较,当该第二概率信息大于第二预设概率信息时,第二初始模型可以输出该样本歌曲属于某个第二类标签的信息,也即是样本歌曲的预测第二类标签,否则输出该样本歌曲不属于该第二类标签的信息。举例来说,经过运算之后,第二初始模型基于初始化后的模型参数和样本歌曲的频域信息进行运算,得到了该样本歌曲属于某个第二类标签的第二概率信息为40,第二预设概率信息为35,那么该第二初始模型可以输出该样本歌曲属于该第二类标签的信息,比如1。需要说明的是,第二初始模型可以同时输出多个第二类标签对应的第二概率信息,例如该第二初始模型可以为一个条件随机场(Conditional Random Field,CRF)模型,同时输出一组序列,比如(110),其中以1来表示该歌曲属于某一第二类标签,以0来表示该歌曲不属于某一第二类标签,数字的顺序可以表示不同的第二类标签,那么计算机设备可以基于该第二初始模型输出的序列判定样本歌曲属于的第二类标签。
606、计算机设备基于样本歌曲的第二类标签和样本歌曲的预测第二类标签的第二差别信息,调整第二初始模型的模型参数,直至第二初始模型的模型参数符合目标截止条件时,停止训练第二初始模型,将训练后的第二初始模型作为第二类标签确定模型。
在一种可能的实施方式中,计算机设备可以将样本歌曲实际上的第二类标签和第二初始模型输出的预测第二类标签进行比较,得到第二差别信息,基于第二差别信息,对模型参数进行调整,随后基于下一个样本歌曲的频域信息进行预测,得到下一个样本歌曲的预测第二类标签,基于下一个样本歌曲的预测第二类标签和洗一个样本歌曲实际的第二类标签的第二差别信息,再次调整模型参数,直至该模型的迭代次数达到预设次数,或者是该模型的损失函数达到目标值时,停止训练该模型,将该模型作为第二类标签确定模型。具体的第二类标签确定模型的结构可以参见图7。
本申请实施例中,计算机设备基于第一类标签获取对应的标签词典,从样本歌曲的评论文本中自动挖掘出相应的第二类标签,进一步简化了为目标歌曲添加标签的步骤,提高了标签添加的效率。
图8是本申请实施例提供的一种歌曲标签确定装置的结构图,参见图8,装置包括:获取模块801、第一类标签确定模块802、第一确定模块803以及第二类标签确定模块804。
获取模块801,用于获取目标歌曲的频域信息;
第一类标签确定模块802,用于将频域信息输入到第一类标签确定模型中,由第一类标签确定模型基于频域信息确定目标歌曲的第一类标签,其中,第一类标签用于表示第二类标签的标签类型,第二类标签用于表示目标歌曲的特点;
第一确定模块803,用于基于目标歌曲的第一类标签,确定第一类标签对应的第二类标签确定模型;
第二类标签确定模块804,用于将频域信息输入到第二类标签确定模型中,由第二类标签确定模型基于频域信息确定目标歌曲的至少一个第二类标签。
在一种可能的实施方式中,装置还包括:
训练模块,用于基于样本数据集进行模型训练,得到第二类标签确定模型,其中,样本数据集包括多个样本歌曲的音频信号以及每个样本歌曲的第二类标签,每个样本歌曲均为被用户评论过的歌曲。
在一种可能的实施方式中,装置还包括:
标签词典获取模块,用于获取每个第一类标签对应的标签词典,标签词典基于标注了每个第一类标签的文本信息生成;
匹配模块,用于将标签词典中包含的各个标签词与样本歌曲的评论文本进行匹配,得到至少一个标签词;
第二确定模块,用于确定至少一个标签词与样本歌曲的评论文本的相关度;
第三确定模块,用于将相关度符合目标条件的标签词确定为样本歌曲的第二类标签。
在一种可能的实施方式中,训练模块包括:
第一输入单元,用于将任一个样本歌曲的频域信息输入到与样本歌曲所属第一类标签对应的初始模型中;
预测单元,用于由初始模型基于任一个样本歌曲的频域信息预测该样本歌曲属于任一第二类标签的概率信息;
第一确定单元,用于基于概率信息,确定样本歌曲的预测第二类标签;
调整单元,用于基于样本歌曲的第二类标签和样本歌曲的预测第二类标签的差别信息,调整初始模型的模型参数,直至初始模型的模型参数符合目标截止条件时,停止训练初始模型,将训练后的初始模型作为第二类标签确定模型。
在一种可能的实施方式中,将第二类标签确定模块包括:
第二输入单元,用于将频域信息输入到第二类标签确定模型中,由第二类标签确定模型输出多个第二类标签的概率信息;
第二确定单元,用于将至少一个符合目标概率信息的第二类标签确定为目标歌曲的至少一个第二类标签。
在一种可能的实施方式中,第一类标签确定模型为二分类模型。
在一种可能的实施方式中,第二类标签确定模型为序列标注模型。
通过本申请实施例提供的装置,计算机设备可以基于目标歌曲的频域信息自动为目标歌曲添加标签,大大提高了为目标歌曲添加标签的效率,为后续的歌曲推荐功能的实现奠定了良好的基础。同时,基于训练后的第一类标签确定模型和第二类标签确定模型为目标歌曲添加标签,可以利用深度学习模型泛化能力较强的特性,为更多类型的目标歌曲添加标签。
需要说明的是:上述实施例提供的歌曲标签确定装置在确定歌曲标签时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的歌曲标签确定装置与歌曲标签确定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图9是本申请实施例提供的一种计算机设备的结构示意图,该计算机设备900可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central ProcessingUnits,CPU)901和一个或多个的存储器902,其中,所述一个或多个存储器902中存储有至少一条程序代码,所述至少一条程序代码由所述一个或多个处理器901加载并执行以实现上述各个方法实施例提供的方法。当然,该计算机设备900还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该计算机设备900还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种存储介质,例如包括程序代码的存储器,上述程序代码可由处理器执行以完成上述实施例中的歌曲标签确定方法。例如,该存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来程序代码相关的硬件完成,该程序可以存储于一种存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种歌曲标签确定方法,其特征在于,所述方法包括:
获取目标歌曲的频域信息;
将所述频域信息输入到第一类标签确定模型中,由所述第一类标签确定模型基于所述频域信息确定所述目标歌曲的第一类标签,其中,所述第一类标签用于表示第二类标签的标签类型,所述第二类标签用于表示所述目标歌曲的音频特征;
基于所述目标歌曲的第一类标签,确定所述第一类标签对应的第二类标签确定模型;
将所述频域信息输入到所述第二类标签确定模型中,由所述第二类标签确定模型基于所述频域信息确定所述目标歌曲的至少一个第二类标签。
2.根据权利要求1所述的方法,其特征在于,所述将所述频域信息输入到所述第二类标签确定模型中之前,所述方法还包括:
基于样本数据集进行模型训练,得到所述第二类标签确定模型,其中,所述样本数据集包括多个样本歌曲的频域信息以及每个样本歌曲的第二类标签,所述每个样本歌曲均为被用户评论过的歌曲。
3.根据权利要求2所述的方法,其特征在于,所述基于样本数据集进行模型训练,得到所述第二类标签确定模型之前,所述方法还包括:
获取每个第一类标签对应的标签词典,所述标签词典基于标注了所述每个第一类标签的文本信息生成;
将所述标签词典中包含的各个标签词与所述样本歌曲的评论文本进行匹配,得到至少一个标签词;
确定所述至少一个标签词与所述样本歌曲的评论文本的相关度;
将所述相关度符合目标条件的标签词确定为样本歌曲的第二类标签。
4.根据权利要求2所述的方法,其特征在于,所述基于样本数据集进行模型训练,得到所述第二类标签确定模型包括:
将任一个样本歌曲的频域信息输入到与样本歌曲所属第一类标签对应的初始模型中;
由所述初始模型基于所述任一个样本歌曲的频域信息预测该样本歌曲属于任一第二类标签的概率信息;
基于所述概率信息,确定所述样本歌曲的预测第二类标签;
基于所述样本歌曲的第二类标签和所述样本歌曲的预测第二类标签的差别信息,调整所述初始模型的模型参数,直至所述初始模型的模型参数符合目标截止条件时,停止训练所述初始模型,将训练后的初始模型作为所述第二类标签确定模型。
5.根据权利要求1所述的方法,其特征在于,所述将所述频域信息输入到所述第二类标签确定模型中,由所述第二类标签确定模型基于所述频域信息确定所述目标歌曲的至少一个第二类标签包括:
将所述频域信息输入到所述第二类标签确定模型中,由所述第二类标签确定模型输出多个第二类标签的概率信息;
将至少一个符合目标概率信息的第二类标签确定为所述目标歌曲的至少一个第二类标签。
6.根据权利要求1所述的方法,其特征在于,所述第一类标签确定模型为二分类模型。
7.根据权利要求1所述的方法,其特征在于,所述第二类标签确定模型为序列标注模型。
8.一种歌曲标签确定装置,其特征在于,所述装置包括:
获取模块,用于获取目标歌曲的频域信息;
第一类标签确定模块,用于将所述频域信息输入到第一类标签确定模型中,由所述第一类标签确定模型基于所述频域信息确定所述目标歌曲的第一类标签,其中,所述第一类标签用于表示第二类标签的标签类型,所述第二类标签用于表示所述目标歌曲的特点;
第一确定模块,用于基于所述目标歌曲的第一类标签,确定所述第一类标签对应的第二类标签确定模型;
第二类标签确定模块,用于将所述频域信息输入到所述第二类标签确定模型中,由所述第二类标签确定模型基于所述频域信息确定所述目标歌曲的至少一个第二类标签。
9.一种计算机设备,其特征在于,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求7任一项所述的歌曲标签确定方法所执行的操作。
10.一种存储介质,其特征在于,所述存储介质中存储有至少一条程序代码,所述程序代码由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的歌曲标签确定方法所执行的操作。
CN201911261720.2A 2019-12-10 2019-12-10 歌曲标签确定方法、装置、计算机设备以及存储介质 Active CN111026908B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911261720.2A CN111026908B (zh) 2019-12-10 2019-12-10 歌曲标签确定方法、装置、计算机设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911261720.2A CN111026908B (zh) 2019-12-10 2019-12-10 歌曲标签确定方法、装置、计算机设备以及存储介质

Publications (2)

Publication Number Publication Date
CN111026908A true CN111026908A (zh) 2020-04-17
CN111026908B CN111026908B (zh) 2023-09-08

Family

ID=70208753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911261720.2A Active CN111026908B (zh) 2019-12-10 2019-12-10 歌曲标签确定方法、装置、计算机设备以及存储介质

Country Status (1)

Country Link
CN (1) CN111026908B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100432A (zh) * 2020-09-17 2020-12-18 咪咕文化科技有限公司 样本数据获取方法、特征提取方法、处理装置及存储介质
CN112906369A (zh) * 2021-02-19 2021-06-04 脸萌有限公司 一种歌词文件生成方法及装置
CN114048347A (zh) * 2021-11-11 2022-02-15 广州歌神信息科技有限公司 歌曲标签整理、访问方法及其装置、设备、介质、产品
CN117056556A (zh) * 2023-08-07 2023-11-14 腾讯音乐娱乐科技(深圳)有限公司 训练搜索模型的音乐样本标签处理方法、设备和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080022844A1 (en) * 2005-08-16 2008-01-31 Poliner Graham E Methods, systems, and media for music classification
KR20170091888A (ko) * 2016-02-02 2017-08-10 네이버 주식회사 음악에 적합한 테마를 자동으로 태깅하는 방법 및 시스템
CN107943865A (zh) * 2017-11-10 2018-04-20 阿基米德(上海)传媒有限公司 一种适用于多场景、多类型的音频分类标签方法及系统
CN107967280A (zh) * 2016-10-19 2018-04-27 北京酷我科技有限公司 一种标签推荐歌曲的方法及系统
WO2018196561A1 (zh) * 2017-04-25 2018-11-01 腾讯科技(深圳)有限公司 应用的标签信息生成方法、装置及存储介质
CN109063069A (zh) * 2018-07-23 2018-12-21 天翼爱音乐文化科技有限公司 歌曲标签确定方法、装置、计算机设备和可读存储介质
US20190028766A1 (en) * 2017-07-18 2019-01-24 Audible Magic Corporation Media classification for media identification and licensing
CN109271521A (zh) * 2018-11-16 2019-01-25 北京九狐时代智能科技有限公司 一种文本分类方法及装置
US20190163742A1 (en) * 2017-11-28 2019-05-30 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for generating information
CN109918662A (zh) * 2019-03-04 2019-06-21 腾讯科技(深圳)有限公司 一种电子资源的标签确定方法、装置和可读介质
CN109977255A (zh) * 2019-02-22 2019-07-05 北京奇艺世纪科技有限公司 模型生成方法、音频处理方法、装置、终端及存储介质
CN110163245A (zh) * 2019-04-08 2019-08-23 阿里巴巴集团控股有限公司 业务类别预测方法及系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080022844A1 (en) * 2005-08-16 2008-01-31 Poliner Graham E Methods, systems, and media for music classification
KR20170091888A (ko) * 2016-02-02 2017-08-10 네이버 주식회사 음악에 적합한 테마를 자동으로 태깅하는 방법 및 시스템
CN107967280A (zh) * 2016-10-19 2018-04-27 北京酷我科技有限公司 一种标签推荐歌曲的方法及系统
WO2018196561A1 (zh) * 2017-04-25 2018-11-01 腾讯科技(深圳)有限公司 应用的标签信息生成方法、装置及存储介质
US20190028766A1 (en) * 2017-07-18 2019-01-24 Audible Magic Corporation Media classification for media identification and licensing
CN107943865A (zh) * 2017-11-10 2018-04-20 阿基米德(上海)传媒有限公司 一种适用于多场景、多类型的音频分类标签方法及系统
US20190163742A1 (en) * 2017-11-28 2019-05-30 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for generating information
CN109063069A (zh) * 2018-07-23 2018-12-21 天翼爱音乐文化科技有限公司 歌曲标签确定方法、装置、计算机设备和可读存储介质
CN109271521A (zh) * 2018-11-16 2019-01-25 北京九狐时代智能科技有限公司 一种文本分类方法及装置
CN109977255A (zh) * 2019-02-22 2019-07-05 北京奇艺世纪科技有限公司 模型生成方法、音频处理方法、装置、终端及存储介质
CN109918662A (zh) * 2019-03-04 2019-06-21 腾讯科技(深圳)有限公司 一种电子资源的标签确定方法、装置和可读介质
CN110163245A (zh) * 2019-04-08 2019-08-23 阿里巴巴集团控股有限公司 业务类别预测方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100432A (zh) * 2020-09-17 2020-12-18 咪咕文化科技有限公司 样本数据获取方法、特征提取方法、处理装置及存储介质
CN112100432B (zh) * 2020-09-17 2024-04-09 咪咕文化科技有限公司 样本数据获取方法、特征提取方法、处理装置及存储介质
CN112906369A (zh) * 2021-02-19 2021-06-04 脸萌有限公司 一种歌词文件生成方法及装置
CN114048347A (zh) * 2021-11-11 2022-02-15 广州歌神信息科技有限公司 歌曲标签整理、访问方法及其装置、设备、介质、产品
CN117056556A (zh) * 2023-08-07 2023-11-14 腾讯音乐娱乐科技(深圳)有限公司 训练搜索模型的音乐样本标签处理方法、设备和存储介质
CN117056556B (zh) * 2023-08-07 2025-12-09 腾讯音乐娱乐科技(深圳)有限公司 训练搜索模型的音乐样本标签处理方法、设备和存储介质

Also Published As

Publication number Publication date
CN111026908B (zh) 2023-09-08

Similar Documents

Publication Publication Date Title
CN113672708B (zh) 语言模型训练方法、问答对生成方法、装置及设备
JP2023076413A (ja) 言語モデルを利用してドメインに特化した対話を提供する方法、コンピュータ装置、およびコンピュータプログラム
CN111400470A (zh) 问题处理方法、装置、计算机设备和存储介质
Ashraf et al. A globally regularized joint neural architecture for music classification
CN113392317B (zh) 一种标签配置方法、装置、设备及存储介质
CN111026908B (zh) 歌曲标签确定方法、装置、计算机设备以及存储介质
CN111444967A (zh) 生成对抗网络的训练方法、生成方法、装置、设备及介质
CN111444382A (zh) 一种音频处理方法、装置、计算机设备以及存储介质
CN111881264A (zh) 一种开放领域问答任务中长文本检索的方法和电子设备
CN114780867A (zh) 推荐方法、介质、装置和计算设备
Zhang et al. Early detection of technology opportunity based on analogy design and phrase semantic representation
CN115359785A (zh) 音频识别方法、装置、计算机设备及计算机可读存储介质
CN111460215B (zh) 音频数据处理方法、装置、计算机设备以及存储介质
CN115101052B (zh) 音频识别方法及计算机设备
CN115114910B (zh) 文本处理方法、装置、设备、存储介质及产品
CN116151235A (zh) 文章生成方法、文章生成模型训练方法及相关设备
CN114580533A (zh) 特征提取模型的训练方法、装置、设备、介质及程序产品
Arronte Alvarez et al. Distributed vector representations of folksong motifs
JP2022111020A (ja) 文書類似度学習に基づくディープラーニングモデルの転移学習方法およびコンピュータ装置
CN119398195A (zh) 一种少样本关系分类模型的训练方法及相关设备
Ren [Retracted] Pop Music Trend and Image Analysis Based on Big Data Technology
HK40022485A (zh) 歌曲标签确定方法、装置、计算机设备以及存储介质
CN116994607A (zh) 副歌定位方法、装置、电子设备及存储介质
da Silva et al. Audio plugin recommendation systems for music production
Xue et al. [Retracted] Research on the Filtering and Classification Method of Interactive Music Education Resources Based on Neural Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40022485

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant