CN108876422B - 用于信息推广的方法、装置、电子设备及计算机可读介质 - Google Patents
用于信息推广的方法、装置、电子设备及计算机可读介质 Download PDFInfo
- Publication number
- CN108876422B CN108876422B CN201710322279.9A CN201710322279A CN108876422B CN 108876422 B CN108876422 B CN 108876422B CN 201710322279 A CN201710322279 A CN 201710322279A CN 108876422 B CN108876422 B CN 108876422B
- Authority
- CN
- China
- Prior art keywords
- information
- model
- request information
- ranking
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Recommending goods or services
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0263—Targeted advertisements based upon Internet or website rating
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开一种用于信息推广的方法、装置、电子设备及计算机可读介质。该方法包括:实时获取请求信息,所述请求信息包括用户信息与推广信息;将所述请求信息映射为自然语言以生成第一数据;将所述第一数据输入排序模型以确定排序评分,所述排序模型为深度卷积神经网络模型;以及根据所述排序评分对所述请求信息中的所述推广信息进行推广。本申请的用于信息推广的方法、装置、电子设备及计算机可读介质,能够减少了特征选择及建模等工作,避免了大量的特征工程,增加了排序方法的泛化能力,所有特征采用同一种网络处理,简化了模型复杂度。
Description
技术领域
本发明涉及大数据信息处理领域,具体而言,涉及一种用于信息推广的方法、装置、电子设备及计算机可读介质。
背景技术
排序方法是信息推广,可例如推荐/广告系统中一种核心技术,排序方法直接影响了推荐物品或者广告的展示次序,进而影响用户的点击以及后续的购买转化。好的排序方法可以使质量更好的推荐/广告排在靠前的位置,从而提升用户的点击和消费。因此,排序算法是推荐/广告系统中非常关键的一环。目前,推荐/广告系统中采取的排序方案主要包含两个步骤或者模块:首先是对相关特征的提取和处理;然后是对候选推荐或广告进行排序。在特征提取阶段都是从推荐/广告请求中提取出相关维度的特征,例如用户维度特征、上下文特征等,然后经过一系列的特征工程加工处理。
目前,大多数排序方法在特征提取阶段都需要做大量的特征工作来处理特征,对特征进行建模,且针对不同的特征要做不同的处理,过于复杂。而在排序阶段采取的各种模型算法也有相应的缺点。主流的基于浅层机器学习的模型算法,本质上是一种线性模型,只能学习特征的线性变换,对许多特征的提取和表达不够充分,尤其是对一些非线性的特征。为了在排序中引入非线性的变换,例如逻辑回归,通常会在现有特征的基础上进行特征组合。这也导致两个缺点:首先,需要进行许多额外的特征工程,例如特征筛选、确定特征之间如何组合等;其次,特征组合可以使排序方法学习到很好的记忆能力,可以很好地处理训练数据中频繁出现的特征及组合,但也会导致排序方法的泛化能力不足,对新出现的特征及组合处理不够好。
因此,需要一种新的用于信息推广的方法、装置、电子设备及计算机可读介质。
在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种用于信息推广的方法、装置、电子设备及计算机可读介质,能够减少了特征选择及建模等工作,避免了大量的特征工程,增加了排序方法的泛化能力,所有特征采用同一种网络处理,简化了模型复杂度。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的一方面,提出一种用于信息推广的方法,该方法包括:实时获取请求信息,请求信息包括用户信息与推广信息;将请求信息映射为自然语言以生成第一数据;将第一数据输入排序模型以确定排序评分,排序模型为深度卷积神经网络模型;以及根据排序评分对请求信息中的推广信息进行推广。
在本公开的一种示例性实施例中,还包括:通过历史请求信息与历史请求结果建立排序模型。
在本公开的一种示例性实施例中,通过历史请求信息与历史请求结果建立排序模型,包括:通过历史请求信息与历史请求结果对深度卷积神经网络模型进行训练,以获得排序模型。
在本公开的一种示例性实施例中,排序模型,包括:对应于深度卷积神经网络模型的每一层的模型结构;以及每一层的模型结构对应的权重。
在本公开的一种示例性实施例中,将第一数据输入排序模型以确定排序评分,排序模型为深度卷积神经网络模型,包括:将第一数据进行one-hot编码处理,生成编码矩阵;将编码矩阵进行卷积处理,以提取多个特征矩阵;通过多个特征矩阵提取组合特征;以及通过组合特征与激活函数,确定排序评分。
在本公开的一种示例性实施例中,将第一数据输入排序模型以确定排序评分,排序模型为深度卷积神经网络模型,还包括:对特征矩阵进行降维处理。
在本公开的一种示例性实施例中,将第一数据进行one-hot编码处理,生成编码矩阵,包括:将第一数据中,每个字符均映射为列向量;以及通过列向量生成编码矩阵。
在本公开的一种示例性实施例中,将第一数据进行one-hot编码处理,生成编码矩阵,还包括:通过第一数据确定字符表;以及指定字符表中字符的索引数。
在本公开的一种示例性实施例中,将编码矩阵进行卷积处理,以提多个取特征矩阵,包括:通过查表方式将编码矩阵进行卷积处理,以提多个取特征矩阵。
在本公开的一种示例性实施例中,通过查表方式将编码矩阵进行卷积处理,以提多个取特征矩阵,包括:将编码矩阵中列向量值为1的位置记录在查询表中;在卷积处理时,通过查询表中对应位置的索引值获取卷积核对应位置的元素值;将元素值相加获取卷积处理结果。
根据本发明的一方面,提出一种用于信息推广的装置,该装置包括:信息模块,用于实时获取请求信息,请求信息包括用户信息与推广信息;数据模块,用于将请求信息映射为自然语言以生成第一数据;排序模块,用于将第一数据输入排序模型以确定排序评分,排序模型为深度卷积神经网络模型;以及推广模块,用于根据排序评分对请求信息中的推广信息进行推广。
在本公开的一种示例性实施例中,还包括:模型模块,用于通过历史请求信息与历史请求结果建立排序模型。
根据本发明的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文任一的方法。
根据本发明的一方面,提出一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现如上文中任一的方法。
根据本发明的用于信息推广的方法、装置、电子设备及计算机可读介质,能够减少了特征选择及建模等工作,避免了大量的特征工程,增加了排序方法的泛化能力,所有特征采用同一种网络处理,简化了模型复杂度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种用于信息推广的方法的系统架构。
图2是根据一示例性实施例示出的一种用于信息推广的方法的流程图。
图3是根据另一示例性实施例示出的一种用于信息推广的方法中系统流程图。
图4是根据另一示例性实施例示出的一种用于信息推广的方法中示意图。
图5是根据另一示例性实施例示出的一种用于信息推广的方法中卷积处理示意图。
图6是根据一示例性实施例示出的一种用于信息推广的装置的框图。
图7是根据另一示例性实施例示出的一种电子设备的框图。
具体实施例
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的,因此不能用于限制本发明的保护范围。
下面结合附图对本公开示例实施方式进行详细说明。
图1示出了可以应用本申请的用于信息推广的方法及装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本申请实施例所提供的网页生成方法一般由服务器105执行,相应地,网页生成装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2是根据一示例性实施例示出的一种用于信息推广的方法的流程图。
如图2所示,在S202中,实时获取请求信息,请求信息包括用户信息与推广信息。请求信息可例如为:“request{name:王小明,age:25,gender:男,interest:汽车,ad:奥迪A4,price:125$}”,其中,“name:王小明,age:25,gender:男,interest:汽车”为用户信息,“ad:奥迪A4,price:125$”为推广信息。针对同一用户的请求信息可包括多个,本发明不以数量为限制。
在S204中,将请求信息映射为自然语言以生成第一数据。在现有技术中,通常的做法(非映射为自然语言的方法)是从请求信息中提取出单独的特征,可例如,通过上文的请求信息,提取出“王小明”、“25”、“男”、“汽车”、“奥迪A4”、“125$”等特征值,然后根据特征值属于连续特征(例如价格)或者是类别特征(例如性别、兴趣等)分别进行建模处理。而将请求映射为自然语言的做法,不需要提取特征,也不需要对特征进行进一步加工处理,只需要简单的将整个请求映射为一个扁平的字符串。例如上述请求直接映射为字符串:“name:王小明,age:25,gender:男,interest:汽车,ad:奥迪A4,price:125$”。还可例如,为了方便统一处理,可以将中文替换为拼音,各个字段的分割符做统一替换,进而得到更加简洁的字符串,处理之后的字符串可作为第一数据,以便后续处理:“name wangxiaoming|age 25|gender nan|interest qiche|ad aodiA4|price125$”。这种处理可以带来两种主要的优势:首先,对特征的处理变得简单,不需要额外的特征工程;其次,整个字符串包含了原请求中所携带的所有信息,并将之完整的提交给后续的卷积神经网络处理,避免了信息丢失问题。
在S206中,将第一数据输入排序模型以确定排序评分,排序模型为深度卷积神经网络模型。将第一数据输入已建立好的排序模型中进行排序评分,排序模型可例如采用深度卷积神经网络构建。深度卷积神经网络(CNNs),是人工神经网络的一种,已成为当前语音分析和图像识别领域的研究热点。它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。该方法优点在网络的输入是多维数据时表现的更为明显,使数据可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。卷积网络是为识别二维形状而特殊设计的一个多层感知器,这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。CNNs是第一个真正成功训练多层网络结构的学习算法。它利用空间关系减少需要学习的参数数目以提高一般前向BP算法的训练性能。CNNs作为一个深度学习架构提出是为了最小化数据的预处理要求。
在S208中,根据排序评分对请求信息中的推广信息进行推广。
根据本发明的用于信息推广的方法,通过将请求消息转化为自然语言并输入由深度卷积神经网络构建的排序模型中,得到推广消息的评分的方式,能够减少了特征选择及建模等工作,避免了大量的特征工程,增加了排序方法的泛化能力,所有特征采用同一种网络处理,简化了模型复杂度。
应清楚地理解,本发明描述了如何形成和使用特定示例,但本发明的原理不限于这些示例的任何细节。相反,基于本发明公开的内容的教导,这些原理能够应用于许多其它实施例。
在本公开的一种示例性实施例中,还包括:通过历史请求信息与历史请求结果建立排序模型。包括:通过历史请求信息与历史请求结果对深度卷积神经网络模型进行训练,以获得排序模型。排序模型,包括:对应于深度卷积神经网络模型的每一层的模型结构;以及每一层的模型结构对应的权重。
图3是根据另一示例性实施例示出的一种用于信息推广的方法中系统流程图。
如图3所示,线上用户的实时访问会请求服务器,服务器按照策略筛选出候选广告(ad-1,ad-2……),筛选出候选广告后,继续请求预测器(predictor),预测器可例如,加载排序模型对候选广告预测出打分,然后依据打分进行排序。将排序结果提供给服务器端,服务器端根据排序将广告推荐给用户。
图4是根据另一示例性实施例示出的一种用于信息推广的方法中示意图。
在本公开的一种示例性实施例中,排序模型通过深度卷积神经网络建立,排序模型主要包含5类结构:输入层、卷积层、池化层、全连接层和输出层,其中在输入层和全连接层之间,是很多个卷积层和池化层交替堆叠,而最后输出层之前是多个全连接层。
1)输入层
在本公开的一种示例性实施例中,将第一数据进行one-hot编码处理,生成编码矩阵,包括:将第一数据中,每个字符均映射为列向量;以及通过列向量生成编码矩阵。在本公开的一种示例性实施例中,将第一数据进行one-hot编码处理,生成编码矩阵,还包括:通过第一数据确定字符表;以及指定字符表中字符的索引数。卷积神经网络处理的输入通常是矩阵形式,因为需要请求映射成的字符串编码成矩阵形式。具体而言,首先统计出请求字符串中所有可能出现的字符的数量,组成一个字符表,例如:“abcdefghijklmnopqrstuvwxyz0123456798”,字符表的长度为36。然后按顺序给每一个字符指定一个索引数(index),例如:a对应的index为1,b对应的index为2,以此类推。进而每一个字符都可以根据index值进行one-hot编码,得到一个0,1组成的稀疏的列向量。例如:a编码成列向量[1000 ···]T,b编码成列向量[0100 ···]T,每一个列向量只有index对应的位置为1,其他位置均为0。这样每一个字符都用唯一的一个列向量表示,而将整个字符串中字符都用起对应的列向量替换,便得到整个字符串的编码矩阵,且该矩阵是稀疏的。因为字符与其列向量是一一对应的,所以整个编码过程没有造成任何信息丢失。
根据本发明的用于信息推广的方法,将推广信息统一映射为自然语言。将整个广告请求包含的信息统一映射为一段文本,不对请求中包含的信息进行区分和单独提取,不需要做特征建模,避免大量的特征工程。直接将映射后的文本作为输入提交给模型进行训练,避免了特征工程导致信息损失。
2)卷积层
一般情况下,图中局部的像素联系较为紧密,而距离较远的像素相关性则较弱。因此,网络中每个神经元只需要对局部进行感知,然后在更高层的神经元将局部的信息综合起来就得到了全局的信息。一种卷积核相当于对一个局部视野进行一个线性变换,进而提取出该局部视野所包含的某一种特定的潜在信息,用同一个卷积核来卷积整个矩阵中不同的局部视野,就可以得到新的特征矩阵,新矩阵中的每一个位置都代表了从某一个局部视野提取出的特征值。一种卷积核只能用来提取一种特征,只能得到一个新的特征矩阵,而用不同的卷积核相当于提取了不同种类的特征,可以得到多个不同的特征矩阵。在每一个卷积层,都采用多个不同的卷积核,进而提取多种不同的特征矩阵,将卷积出的新的特征矩阵作为输入,提交给更高层的网络。
根据本发明的用于信息推广的方法,利用深度卷积神经网络处理映射后的文本请求。将文本请求中的每一个字符都进行one-hot编码,进而每一个字符都可以编码出一个稀疏的列向量,所有字符的列向量按顺序拼接一起,得到整个广告请求的稀疏矩阵编码,利用深度卷积神经网络从编码矩阵中提取关键信息。
如图5所示,在输入层处理请求字符串,将每一个字符映射为一个列向量,列向量的长度为字符表的长度。因而要想在一个局部视野内观察到每个字符所携带的完整信息,需要让卷积核的长度等于列向量的长度,进而每一个卷积核在卷积局部视野是都能卷积到字符的整个列向量。这样导致只有输入层得到的特征矩阵是二维的,第一个卷积层以及后续卷积层输出的特征矩阵都是一维的,因此除了第一个卷积层的卷积核是二维的,其余卷积层的卷积核都是一维的。卷积运算相当于对局部输入做了一次线性变换,为了引入非线性,卷积运算的输出需要经过一个非线性的激活函数,将激活函数的输出值作为新特征矩阵中的特征值。激活函数可例如,在排序模型建立过程中确定。
3)池化层
池化层主要目的是仿照人的视觉系统对网络进行降维,例如,可以计算图像一个区域上特征的平均值(或最大值),使用这个特征均值来代替这一区域中所有的特征。这些概要统计特征不仅可以极大降低特征维度(相比使用所有提取得到的特征),同时还会改善模型结果(不容易过拟合)。
4)全连接层
卷积层通过不断卷积局部输入视野来提取局部特征,最后更高层卷积层通过卷积局部视野能够获得整个全局输入的特征,且这些特征是高度聚合的特征。通过多个全连接层可以进一步学习特征的组合,提取出更高层次的组合特征。
5)输出层
输出层以前一个全连接层的输出的组合特征作为输入,通过一组权重参数,对输入特征进行线性变换,然后通过一个激活函数给出一个分数,以此作为当前候选广告的质量。在本发明实施例中,所述激活函数以及权重参数均为通过历史数据构建模型的过程中确定。
在本公开的一种示例性实施例中,将编码矩阵进行卷积处理,以提多个取特征矩阵,包括:通过查表方式将编码矩阵进行卷积处理,以提多个取特征矩阵。在本公开的一种示例性实施例中,通过查表方式将编码矩阵进行卷积处理,以提多个取特征矩阵,包括:将编码矩阵中列向量值为1的位置记录在查询表中;在卷积处理时,通过查询表中对应位置的索引值获取卷积核对应位置的元素值;将元素值相加获取卷积处理结果。
在实际情况中,实时处理大量的数据,对响应时间要求更加严格,为此在本发明实施例中,针对稀疏矩阵的卷积运算提出了一种优化策略,即采用查找表的方式处理稀疏卷积。具体方法如下:以一次卷积运算为例,卷积核是一个8*5的矩阵,而待卷积的稀疏矩阵如下,
| 1 | 0 | 0 | 0 | 0 |
| 0 | 0 | 1 | 0 | 0 |
| 0 | 0 | 0 | 0 | 0 |
| 0 | 0 | 0 | 0 | 0 |
| 0 | 0 | 0 | 0 | 0 |
| 0 | 1 | 0 | 0 | 1 |
| 0 | 0 | 0 | 0 | 0 |
| 0 | 0 | 0 | 1 | 0 |
矩阵是非常稀疏的,只有五个值为1的位置在此次卷积运算中是有效的,其余值为0的位置并不会影响最后的卷积结果。但是为了得到卷积结果,需要做8*5=40次乘法运算和40次加法运算,非常低效。尤其是涉及到大量的稀疏矩阵卷积运算时需要消耗大量的计算时间,而其中绝大多数计算都不会影响最后的卷积结果。为了避免不必要的计算,可例如通过查找表的方法处理。具体而言,将每一个列向量值为1的位置(index)记录在一个查询表内。例如,上述稀疏矩阵用可以表示为:
| 8 | 1 | 6 | 2 | 8 | 6 |
表中第一个元素表示原始列向量的长度为8,从表中第二个元素开始依次表示原始矩阵的每一个列向量中值为1的位置(index)。以第二个元素‘1’为例,可以反向推断出原始矩阵第一个列向量长度为8,列向量的第一个元素值为1,其余起个元素值均为0。而在用卷积核进行卷积运算时,只需要用查询表中对应位置的index值去查找卷积核对应位置的元素值,然后取出对应值相加即可。这样,只需要5次查询和5次加法运算即可,计算复杂度只有原来的1/8。
根据本发明的用于信息推广的方法,通用的卷积运算是针对稠密矩阵的,矩阵的每一个元素都会参与卷积运算,而对于稀疏矩阵来说,值为0的元素是不会影响最终的卷积结果的,如果仍按照通用的稠密矩阵的卷积方式去处理,计算复杂度变高,尤其是对高度稀疏的矩阵。本发明提出了基于查表方式的稀疏卷积方法,可以大幅降低卷积运算的计算复杂度,提高整个模型的运行效率。
本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
图6是根据一示例性实施例示出的一种用于信息推广的装置的框图。
其中,信息模块602用于实时获取请求信息,请求信息包括用户信息与推广信息。
数据模块604用于将请求信息映射为自然语言以生成第一数据。
排序模块606用于将第一数据输入排序模型以确定排序评分,排序模型为深度卷积神经网络模型。
推广模块608用于根据排序评分对请求信息中的推广信息进行推广。
在本公开的一种示例性实施例中,还包括:模型模块(图中未示出)用于通过历史请求信息与历史请求结果建立排序模型。
根据本发明的用于信息推广的装置,通过将请求消息转化为自然语言并输入由深度卷积神经网络构建的排序模型中,得到推广消息的评分的方式,能够减少了特征选择及建模等工作,避免了大量的特征工程,增加了排序方法的泛化能力,所有特征采用同一种网络处理,简化了模型复杂度。
图7是根据另一示例性实施例示出的一种电子设备的框图。
下面参考图7,其示出了适于用来实现本申请实施例的电子设备700的结构示意图。图7示出的电子设设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分509经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:实时获取请求信息,请求信息包括用户信息与推广信息;将请求信息映射为自然语言以生成第一数据;将第一数据输入排序模型以确定排序评分,排序模型为深度卷积神经网络模型;以及根据排序评分对请求信息中的推广信息进行推广。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本发明实施例的方法。
通过以上的详细描述,本领域的技术人员易于理解,根据本发明实施例的用于信息推广的方法、装置、电子设备及计算机可读介质具有以下优点中的一个或多个。
根据本发明的用于信息推广的方法,通过将请求消息转化为自然语言并输入由深度卷积神经网络构建的排序模型中,得到推广消息的评分的方式,能够减少了特征选择及建模等工作,避免了大量的特征工程,增加了排序方法的泛化能力,所有特征采用同一种网络处理,简化了模型复杂度。
根据本发明的用于信息推广的方法,能够提高排序方法的准确性,增加用户的点击、消费,提高转化率,增长GMV。减少了特征选择及建模等工作,避免了大量的特征工程。增加了排序方法的泛化能力,所有特征采用同一种网络处理,简化了模型复杂度。
以上具体地示出和描述了本发明的示例性实施例。应可理解的是,本发明不限于这里描述的详细结构、设置方式或实现方法;相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。
此外,本说明书说明书附图所示出的结构、比例、大小等,均仅用以配合说明书所公开的内容,以供本领域技术人员了解与阅读,并非用以限定本公开可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本公开所能产生的技术效果及所能实现的目的下,均应仍落在本公开所公开的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“第一”、“第二”及“一”等的用语,也仅为便于叙述的明了,而非用以限定本公开可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当也视为本发明可实施的范畴。
Claims (13)
1.一种用于信息推广的方法,其特征在于,包括:
实时获取请求信息,所述请求信息包括用户信息与推广信息;
将所述请求信息映射为自然语言以生成第一数据;其中,将所述请求信息映射为自然语言包括:将所述请求信息不进行特征提取直接映射为字符串,其中将中文替换为拼音;
将所述第一数据输入排序模型以确定排序评分,所述排序模型为深度卷积神经网络模型;以及
根据所述排序评分对所述请求信息中的所述推广信息进行推广;
其中,将所述第一数据输入排序模型以确定排序评分,所述排序模型为深度卷积神经网络模型,包括:
将所述第一数据进行one-hot编码处理,生成编码矩阵;
将所述编码矩阵进行卷积处理,以提取多个特征矩阵;
通过所述多个特征矩阵提取组合特征;以及
通过所述组合特征与激活函数,确定所述排序评分。
2.如权利要求1所述的方法,其特征在于,还包括:
通过历史请求信息与历史请求结果建立所述排序模型。
3.如权利要求2所述的方法,其特征在于,所述通过历史请求信息与历史请求结果建立所述排序模型,包括:
通过所述历史请求信息与所述历史请求结果对深度卷积神经网络模型进行训练,以获得所述排序模型。
4.如权利要求3所述的方法,其特征在于,所述排序模型,包括:
对应于所述深度卷积神经网络模型的每一层的模型结构;以及
每一层的所述模型结构对应的权重。
5.如权利要求1所述的方法,其特征在于,将所述第一数据输入排序模型以确定排序评分,所述排序模型为深度卷积神经网络模型,还包括:
对所述特征矩阵进行降维处理。
6.如权利要求1所述的方法,其特征在于,所述将所述第一数据进行one-hot编码处理,生成编码矩阵,包括:
将所述第一数据中,每个字符均映射为列向量;以及
通过所述列向量生成所述编码矩阵。
7.如权利要求1所述的方法,其特征在于,所述将所述第一数据进行one-hot编码处理,生成编码矩阵,还包括:
通过所述第一数据确定字符表;以及
指定所述字符表中字符的索引数。
8.如权利要求1所述的方法,其特征在于,所述将所述编码矩阵进行卷积处理,以提多个取特征矩阵,包括:
通过查表方式将所述编码矩阵进行卷积处理,以提多个取特征矩阵。
9.如权利要求8所述的方法,其特征在于,所述通过查表方式将所述编码矩阵进行卷积处理,以提多个取特征矩阵,包括:
将所述编码矩阵中列向量值为1的位置记录在查询表中;
在所述卷积处理时,通过所述查询表中对应位置的索引值获取卷积核对应位置的元素值;
将所述元素值相加获取所述卷积处理结果。
10.一种用于信息推广的装置,其特征在于,包括:
信息模块,用于实时获取请求信息,所述请求信息包括用户信息与推广信息;
数据模块,用于将所述请求信息映射为自然语言以生成第一数据;其中,将所述请求信息映射为自然语言包括:将所述请求信息不进行特征提取直接映射为字符串,其中将中文替换为拼音;
排序模块,用于将所述第一数据输入排序模型以确定排序评分,所述排序模型为深度卷积神经网络模型;以及
推广模块,用于根据所述排序评分对所述请求信息中的所述推广信息进行推广;
其中,所述排序模块用于:
将所述第一数据进行one-hot编码处理,生成编码矩阵;
将所述编码矩阵进行卷积处理,以提取多个特征矩阵;
通过所述多个特征矩阵提取组合特征;以及
通过所述组合特征与激活函数,确定所述排序评分。
11.如权利要求10所述的装置,其特征在于,还包括:
模型模块,用于通过历史请求信息与历史请求结果建立所述排序模型。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
13.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201710322279.9A CN108876422B (zh) | 2017-05-09 | 2017-05-09 | 用于信息推广的方法、装置、电子设备及计算机可读介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201710322279.9A CN108876422B (zh) | 2017-05-09 | 2017-05-09 | 用于信息推广的方法、装置、电子设备及计算机可读介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN108876422A CN108876422A (zh) | 2018-11-23 |
| CN108876422B true CN108876422B (zh) | 2022-08-12 |
Family
ID=64287898
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201710322279.9A Active CN108876422B (zh) | 2017-05-09 | 2017-05-09 | 用于信息推广的方法、装置、电子设备及计算机可读介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN108876422B (zh) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109816438B (zh) * | 2019-01-11 | 2020-10-30 | 珠海天燕科技有限公司 | 信息推送方法及装置 |
| CN110321487A (zh) * | 2019-07-01 | 2019-10-11 | 上海硕恩网络科技股份有限公司 | 一种精准标签推荐系统及其工作流程 |
| CN113743972B (zh) * | 2020-08-17 | 2024-06-18 | 北京沃东天骏信息技术有限公司 | 一种生成物品信息的方法和装置 |
| CN112232879B (zh) * | 2020-10-20 | 2025-12-02 | 北京三快在线科技有限公司 | 一种信息推荐方法、装置、电子设备及可读存储介质 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101075320A (zh) * | 2006-05-16 | 2007-11-21 | 申凌 | 信息发布、查询系统和方法 |
| CN102903008B (zh) * | 2011-07-29 | 2016-05-18 | 国际商业机器公司 | 用于计算机问答的方法及系统 |
| CN102346899A (zh) * | 2011-10-08 | 2012-02-08 | 亿赞普(北京)科技有限公司 | 一种基于用户行为的广告点击率预测方法和装置 |
| CN104598611B (zh) * | 2015-01-29 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 对搜索条目进行排序的方法及系统 |
| CN104915386B (zh) * | 2015-05-25 | 2018-04-27 | 中国科学院自动化研究所 | 一种基于深度语义特征学习的短文本聚类方法 |
-
2017
- 2017-05-09 CN CN201710322279.9A patent/CN108876422B/zh active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CN108876422A (zh) | 2018-11-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN112148973B (zh) | 一种信息推送的数据处理方法及装置 | |
| CN111737578B (zh) | 一种推荐方法及系统 | |
| CN110020022B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
| WO2023000574A1 (zh) | 一种模型训练方法、装置、设备及可读存储介质 | |
| WO2021203854A1 (zh) | 用户分类方法、装置、计算机设备和存储介质 | |
| CN110162693A (zh) | 一种信息推荐的方法以及服务器 | |
| CN113610610B (zh) | 基于图神经网络和评论相似度的会话推荐方法和系统 | |
| CN113705698B (zh) | 基于点击行为预测的信息推送方法及装置 | |
| CN109840730B (zh) | 用于数据预测的方法及装置 | |
| CN112085565A (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
| WO2020253357A1 (zh) | 数据产品推荐方法、装置、计算机设备和存储介质 | |
| US20230245210A1 (en) | Knowledge graph-based information recommendation | |
| CN108876422B (zh) | 用于信息推广的方法、装置、电子设备及计算机可读介质 | |
| CN115730125B (zh) | 对象识别方法、装置、计算机设备和存储介质 | |
| CN109189922B (zh) | 评论评估模型的训练方法和装置 | |
| CN113379482B (zh) | 一种物品推荐方法、计算设备以及存储介质 | |
| CN116992158B (zh) | 资源配置的推荐方法和装置、存储介质及电子装置 | |
| CN110321546B (zh) | 账号识别、显示方法、装置、服务器、终端及存储介质 | |
| CN112055038A (zh) | 生成点击率预估模型的方法及预测点击概率的方法 | |
| CN112766019B (zh) | 一种数据处理方法、信息推荐方法和相关装置 | |
| JP7201270B1 (ja) | 情報処理方法、プログラム及び情報処理装置 | |
| CN112449217A (zh) | 一种推送视频的方法和装置 | |
| CN114429384A (zh) | 基于电商平台的产品智能推荐方法及系统 | |
| CN113269600B (zh) | 一种信息发送的方法和装置 | |
| CN111489196B (zh) | 基于深度学习网络的预测方法、装置、电子设备及介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |