CN105809275A - 一种物品评分预测方法及装置 - Google Patents
一种物品评分预测方法及装置 Download PDFInfo
- Publication number
- CN105809275A CN105809275A CN201610112354.4A CN201610112354A CN105809275A CN 105809275 A CN105809275 A CN 105809275A CN 201610112354 A CN201610112354 A CN 201610112354A CN 105809275 A CN105809275 A CN 105809275A
- Authority
- CN
- China
- Prior art keywords
- article
- scoring
- targeted customer
- user
- marked
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的实施例提供的一种物品评分预测方法及装置,涉及数据处理领域,解决了现有的物品推荐系统由于无法准确的为用户确定出相似用户,而导致的无法准确的为用户推荐物品的问题。该方法包括:获取用户对物品的评分信息;根据所述用户对物品的评分信息生成用户‑物品类型评分矩阵;根据用户‑物品类型评分矩阵确定出目标用户的相似用户;根据用户‑物品类型评分矩阵以及用户对物品的评分信息,计算目标用户的相似用户中对待评分物品存在缺失评分的相似用户对目标用户的待评分物品的预测评分;根据目标用户的相似用户对目标用户的待评分物品的评分,为待评分物品预测评分。本发明应用于物品推荐。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种物品评分预测方法及装置。
背景技术
用户对物品的评分是物品推荐系统的重要组成部分之一,它可以直接体现用户对物品的喜好程度。一般的,我们可以通过分析用户对不同物品的评分或是不同用户对相同物品的评分,并结合其他因素来捕捉单个用户的喜好或是多个用户之间的喜好相似度,从而实现为用户提供良好的推荐服务。
但是,近年来随着互联网和电子商务的飞速发展,用户数目和物品数目都变成了非常庞大的数字,而这两组庞大的数字结合成为更加庞大的用户-物品评分矩阵,但是,由于每个用户所能接触的物品有限,被用户打过分的只能占到少数,从而使得该用户-物品评分矩阵中的绝大部分数呈现空缺,进而使得该用户-物品评分矩阵具有较高的稀疏性,这样当数据推荐系统来预测用户对某一物品的评分时,由于用户间的评分重叠较少,因此,通过相似用户的评分数据来为用户的某一物品预测的评分显然准确度并不高。例如,当两个用户没有对共同物品评分时,那么两者之间的相似性就根本无法计算或者直接被认为无相似之处,两者之间可能存在的其他相似之处也就无法被捕捉到,进而导致物品推荐系统无法准确的利用这些数据进行评分预测。
发明内容
本发明的实施例提供一种物品评分预测方法及装置,解决了由于现有的用户-物品评分矩阵具有较高的稀疏性,而导致的用户对物品的评分预测不准确的问题。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种物品评分预测方法,包括:
获取用户对物品的评分信息;
根据所述用户对物品的评分信息生成用户-物品类型评分矩阵;
根据所述用户-物品类型评分矩阵确定出所述目标用户的相似用户;
根据所述用户-物品类型评分矩阵以及所述用户对物品的评分信息,计算所述目标用户的相似用户中对所述待评分物品存在缺失评分的相似用户对所述目标用户的待评分物品的预测评分;
根据所述目标用户的相似用户对所述目标用户的待评分物品的评分,为所述待评分物品预测评分。
第二方面,提供一种物品评分预测装置,包括:
第一获取模块,用于获取用户对物品的评分信息;
生成模块,用于根据所述第一获取模块获取的所述用户对物品的评分信息生成用户-物品类型评分矩阵;
确定模块,用于根据所述生成模块生成的所述用户-物品类型评分矩阵确定出所述目标用户的相似用户;
计算模块,用于根据所述生成模块生成的所述用户-物品类型评分矩阵以及所述第一获取模块获取的所述用户对物品的评分信息,计算所述目标用户的相似用户中对所述待评分物品存在缺失评分的相似用户对所述目标用户的待评分物品的预测评分;
预测模块,用于根据所述目标用户的相似用户对所述目标用户的待评分物品的评分,为所述待评分物品预测评分。
本发明的实施例提供的物品评分预测方法及装置,通过根据用户对物品的评分信息生成用户-物品类型评分矩阵,然后根据该用户-物品类型评分矩阵确定出目标用户的相似用户,根据该用户-物品类型评分矩阵以及用户对物品的评分信息,计算目标用户的相似用户中对待评分物品存在缺失评分的相似用户对目标用户的待评分物品的预测评分,最后,根据该目标用户的相似用户对目标用户的待评分物品的评分,为待评分物品预测评分。相比于现有技术仅仅根据数据缺失的用户-物品评分矩阵来为目标用户的缺失评分进行预测的方法,本方案通过预先将分散的物品聚合到不同的物品类别中,然后结合已有的数据缺失的用户-物品评分矩阵构建数据更为集中的用户-物品类别评分矩阵,从而提高了确定目标用户的相似用户的准确度,进而可以为目标用户的相似用户中对待评分物品存在缺失评分的相似用户对目标用户的待评分物品预测出准确度更高的评分,这样根据这些目标用户的相似用户对目标用户的待评分物品的评分,便可准确的为目标用户的待评分物品预测出评分。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种物品评分预测方法流程图;
图2为本发明实施例提供的另一种物品评分预测方法的方法流程图;
图3为本发明实施例提供的一种物品评分预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的物品评分预测方法的执行主体可以为物品评分预测装置,或者用于执行上述物品评分预测方法的终端设备。具体的,该移动终端可以为智能电视、智能手机、平板电脑、笔记本电脑、超级移动个人计算机(英文:Ultra-mobilePersonalComputer,简称:UMPC)、上网本、个人数字助理(英文:PersonalDigitalAssistant,简称:PDA)等终端设备。其中,物品装置可以为上述终端设备中的中央处理器(英文:CentralProcessingUnit,简称:CPU)或者可以为上述终端设备的中的控制单元或者功能模块。
本实施例中的物品可以为具体的商品(例如,网上商城中需要推荐给用户购买的商品)或店铺(例如,需要推荐给用户的商铺),也可以是视频、音频、图片、文本文档等多媒体文件。为了方便说明下文中均以“物品是视频”来进行阐述,并且具体以为“为某一目标用户推荐物品”为例进行说明。需要说明的是,本领域技术人员应当清楚,下文中所提及的“视频”可以替换为语音、图片、文档等其他任一种多媒体数据。
此外,本发明实施例中用户对物品的评分能够直接体现用户对物品的喜好程度,通常情况下,用户对物品的评分可以以[0,10]区间内的数值来表现,数值越高,则表示用户对物品的评分越高,越低表示用户对物品的评分越低。当然,上述[0,10]区间内的数值仅仅是一种示例,在实际应用中,可以利用其它标识来表现用户对物品的评分,这里并不做限定,本实施例为了方便说明,将用户对物品的评分用[0,10]区间内的数值为例进行说明。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本发明的实施例提供一种物品评分预测方法,如图1所示,该方法具体包括如下步骤:
101、物品评分预测装置获取用户对物品的评分信息。
示例性的,本发明中的物品可以为商品、商店以及多媒体文件,该多媒体文件可以为视频、音频、文本文档等多媒体数据。本实施例中用户对物品的评分信息包括用户的标识、物品的标识、该物品所属的物品类型、用户对物品的评分以及用户对物品评分时的评分时间。其中,上述的用户的标识可以为该用户的登陆账号或者其他可唯一表示该用户的标识,本实施例中采用U1、U2、U3……Un形式表示不同用户的标识;上述的物品的标识可以为该物品的名称或商品代码或其他可唯一表示该物品的标识,本实施例中采用V1、V2、V3、……、Vm表示不同物品的标识。
本实施例中的每个物品可以属于一个物品类型也可以同时属于多个物品类型,例如,某一视频即属于古装片也属于动作片。本实施例中的物品类型的种类可以由技术人员预先进行设定,并确定出每个物品所属的物品类型。
优选的,在步骤101中,可以设置一个更新周期,更新周期的长短可以根据物品数据库更新情况进行设定,例如,可以设为一个月,一周或一天,本发明对此不进行限制,在每个更新周期内获取所述每个更新周期内的用户对物品的评分信息并进行更新。本实施例下述各步骤均以当前周期为例进行说明。
102、物品评分预测装置根据用户对物品的评分信息生成用户-物品类型评分矩阵。
具体的,物品评分预测装置根据用户对物品的评分信息生成用户-物品评分矩阵R和物品-物品类型关系矩阵S,然后根据用户-物品评分矩阵R和物品-物品类型关系矩阵S,生成用户-物品类型评分矩阵Z;其中,上述的矩阵R的行和列分别表示用户的标识和物品的标识,该矩阵R的元素用于表示用户对物品的评分;上述的矩阵S的行和列分别表示物品的标识和物品类型的标识,该矩阵S的元素用于表示物品所属的物品类型;上述的矩阵Z的行和列分别表示用户的标识和物品类型的标识,该矩阵Z中的元素用于表示用户对物品类型的评分。
示例性的,若以物品为视频为例,假设用户集合为U={U1,U2,...,Un}和B={B1,B2,...,Bm},视频集合为V={v1,v2,v3,...,vn},若将用户标识作为矩阵行,将视频标识作为矩阵列,则定义用户与物品间的关系矩阵为矩阵若用户对视频的所有的评分都是整数且在[0,10]范围内时,0表示用户没有对该视频评分。这里以表1来说明对矩阵R的含义,需要说明的是,真实的矩阵R具有百万级的维度,下述的表1仅仅是对矩阵R的含义进行说明,仅仅是一种示例。
| v1 | v2 | v3 | v4 | v5 | v6 | |
| u1 | 0 | 0 | 6 | 2 | 5 | 7 |
| u2 | 3 | 4 | 5 | 0 | 0 | 0 |
| u3 | 7 | 6 | 0 | 0 | 1 | 10 |
| u4 | 8 | 0 | 7 | 5 | 0 | 0 |
表1
示例性的,若视频类别集合为L={l1,l2,l3,l4,l5},视频类别K为5时,这里可以以表2来说明视频-视频类别关系矩阵的含义,其中,一个视频可以属于多个类别,如表2所示,如果视频vi属于类别lj则Bi,j=1,反之Bi,j=0。需要说明的是,真实的矩阵S具有百万级的维度,下述的表2仅仅是对矩阵S的含义进行说明,仅仅是一种示例。
| l1 | l2 | l3 | l4 | l5 | |
| v1 | 1 | 1 | 0 | 0 | 1 |
| v2 | 0 | 1 | 0 | 1 | 0 |
| v3 | 1 | 0 | 1 | 0 | 0 |
| v4 | 0 | 0 | 0 | 1 | 0 |
| v5 | 1 | 1 | 1 | 0 | 1 |
| v6 | 1 | 0 | 1 | 1 | 1 |
表2
通过上述用户-视频评分矩阵R和视频-视频类别关系矩阵S,我们可以得到如下表3所示的用户-视频类别评分矩阵Z。需要说明的是,真实的矩阵Z具有百万级的维度,下述的表3仅仅是对矩阵Z的含义进行说明,仅仅是一种示例。
表3
其中,上述表3中的元素Zi,j为用户ui评过分的视频中,属于类别lj的视频评分的平均值。例如,由表1可知用户u1对视频v3,v5和v6均有评分,同时由表2可知视频v3,v5和v6同属于类别l1,因此,C1,1的取值为用户u1对上述三个视频的评分的平均值6,其他的以此类推。
103、物品评分预测装置根据用户-物品类型评分矩阵确定出目标用户的相似用户。
具体的,物品评分预测装置根据用户-物品类型评分矩阵,计算出目标用户与其他用户间的间的相似度,并将目标用户与其他用户中的每个用户间的相似度进行排序,确定出目标用户的相似用户。示例性的,物品评分预测装置可以基于现有的相似度计算公式或本实施例给出的用户相似度计算公式(下文中描述的公式一),依次计算出目标用户与除该目标用户以外的其他用户间的相似度,并将目标用户与其他用户中的每个用户间的相似度进行排序,按照预设的相似用户选择个数以及相似度的高低从高到低确定出目标用户的相似用户。例如,将计算出的所有用户与目标用户的相似度按照从高到低的顺序排列,选出相似性最高的前30个用户作为用户u'的邻居集合,记为Du'。
示例性的,本发明实施例提供一个用户相似度计算公式:
其中,上述的sim(u',ui)表示所述目标用户u'和所述其他用户ui的相似度,为目标用户u'和其他用户ui均打过分的物品所属的物品类别集合,用于表示目标用户u'对所有物品类别的评分的平均值,用于表示其他用户对所有物品类别的评分的平均值,C为用户-物品类型评分矩阵。此外,上述的θ为阈值,θ的取值为视频划分的类别数目,若以表2为例可知,由于表2中的视频类别共有5种视频类别,因此这里θ取5,如此一来,当用户u'和ui共同打分过的视频类别数不足时,乘积的系数值便会小于1,两个用户之间的相似性就降低。而当两者共同打分过的类别数足够多时,系数值为1,两个用户之间的相似性不变,这样通过在阈值θ便可缓解过高估计相似性带来的准确度问题,相比于现有的相似度计算公式,本实施所提供的相似度计算公式计算出的用户相似性更加准确。
104、物品评分预测装置根据用户-物品类型评分矩阵以及用户对物品的评分信息,计算目标用户的相似用户中对待评分物品存在缺失评分的相似用户对目标用户的待评分物品的预测评分。
示例性的,由于目标用户的相似用户-物品评分矩阵的稀疏性,为了能够为目标用户推荐更多更为准确的物品,本发明实施例通过填充目标用户的相似用户未评分物品的预测评分,从而补全相似用户目标用户的相似用户-物品评分矩阵,使得更多的物品成为目标用户的相似用户已评分而目标用户未评分的物品。
具体的,步骤104具体包括如下步骤:
A1、物品评分预测装置获取目标用户的第一相似用户的第一待评分物品的相似物品集。
其中,上述的相似物品集中的相似物品为第一相似用户已评分且与待评分物品间的相似度大于预定阈值的物品。上述的第一相似用户为目标用户的相似用户中对待评分物品存在缺失评分的相似用户。
A2、物品评分预测装置根据待评分物品与所述相似物品集中的每个相似物品间的相似度、第一相似用户对相似物品集中的每个相似物品的评分、第一待评分物品所得到的评分的平均值以及相似物品集中的每个相似物品所得到的评分的平均值,预测出第一相似用户对第一待评分物品的评分。
基于前文所描述的内容可知,若物品以视频为例时,当为目标用户u'求得相似用户集,例如,Du',而相似用户对待评分视频v'同样存在评分缺失的问题时,使用相似用户数据预测目标用户对视频v'的评分显然是不合适的。因此,我们需要对求得的相似用户数据进行填充,得到新的相似用户数据Eu'。预先的,我们求出视频集合V中与视频v'最相似的前30个视频,构成集合Sv',其中,对于任意视频vk(vk∈Sv'),其与视频v'的相似度用sim(v',vk)表示。
然后,我们对用户u'的相似用户uj(uj∈D)对视频v'的预测评分可以基于下述的公式二进行计算,并将计算出的预测评分进行填充。
其中,上述公式二中和分别为视频v和视频vk所得到的评分的平均值(就是所有用户中有对视频v'打过分的,求这些分的平均值,同理),表示用户uj对视频vk的评分。对于任意视频vk(vk∈Sv′),其与视频v'的相似度用sim(v',vk)表示,而sim(v',vk)可以根据视频v'和视频vk所属的视频类型以及其他特征评分信息(例如,地区、语言、关键字、演员、导演等)来进行计算,目前计算视频间的相似度的计算方式很多(例如,欧氏距离法),本发明实施例对此并不做限定。
经过上述步骤,该物品评分预测装置通过对该目标用户的每个相似用户未评分物品的评分进行预测后,使得该目标用户的每个相似用户对应的用户-物品评分矩阵得到填充,进而使得该目标用户未评分的物品在该目标用户的相似用户处均有评分,提高了物品评分预测装置为目标用户推荐物品的准确度。
105、物品评分预测装置根据目标用户的相似用户对目标用户的待评分物品的评分,为待评分物品预测评分。
示例性的,物品评分预测装置根据目标用户的相似用户对目标用户的待评分物品的评分、目标用户对所有物品的评分的平均值、每个相似用户对所有物品的评分的平均值以及目标用户与所述每个相似用户间的相似度,计算目标用户对待评分物品的预测评分。具体计算可以基于下述的评分预测公式来进行预测。
其中,上述的评分预测公式为:
其中,上述用户u'对视频v'的评分预测值ru',v'为用户u'评分的平均值加上最近邻用户的评分影响。为用户u'的所有评分的平均值,Eu'为用户u'填充后的邻居集合,sim(u',uj)为根据公式一计算的用户u'和用户uj(uj∈Eu')的相似度,为用户uj对视频v'的评分,为用户uj所有评分的平均值。
经过上述步骤,该物品评分预测装置通过对该目标用户未评分的物品的评分进行预测后,使得该目标用户对应的用户-物品评分矩阵得到填充,由于以预测出该目标用户对未评分物品的评分,因此,该物品评分预测装置可以直接从该目标用户对未评分物品中选择评分最高的几个物品推荐给该目标用户即可,保证了物品评分预测装置为目标用户推荐物品的准确度,提高了推荐效率。
本发明的实施例提供的物品评分预测方法及装置,通过根据用户对物品的评分信息生成用户-物品类型评分矩阵,然后根据该用户-物品类型评分矩阵确定出目标用户的相似用户,根据该用户-物品类型评分矩阵以及用户对物品的评分信息,计算目标用户的相似用户中对待评分物品存在缺失评分的相似用户对目标用户的待评分物品的预测评分,最后,根据该目标用户的相似用户对目标用户的待评分物品的评分,为待评分物品预测评分。相比于现有技术仅仅根据数据缺失的用户-物品评分矩阵来为目标用户的缺失评分进行预测的方法,本方案通过预先将分散的物品聚合到不同的物品类别中,然后结合已有的数据缺失的用户-物品评分矩阵构建数据更为集中的用户-物品类别评分矩阵,从而提高了确定目标用户的相似用户的准确度,进而可以为目标用户的相似用户中对待评分物品存在缺失评分的相似用户对目标用户的待评分物品预测出准确度更高的评分,这样根据这些目标用户的相似用户对目标用户的待评分物品的评分,便可准确的为目标用户的待评分物品预测出评分。
可选的,一般情况下,每个用户在不同时期都会因为受到周围各种各样的影响而产生兴趣的变化,因此,能否准确地捕捉到用户近期的兴趣,并将用户当前最可能感兴趣的视频推荐给用户是非常关键的一点。而本发明通过跟踪用户最近一段时间内的兴趣,根据用户为物品进行评分时的评分时间距离当前时间的远近,从而确定出用户对不同物品类别所表现出的偏好值。
具体的,如图2所示,用户对不同物品类别所表现出的偏好值的确定过程如下所示:
201、物品评分预测装置获取用户的目标物品集以及目标物品集对应的目标物品类型集。
本实施例中的目标物品集中的目标物品为用户已评分且评分时的评分时间大于预定阈值的物品,该目标物品类型集中包含了目标物品集中的目标物品所属的所有物品类别。示例性的,若该物品以视频为例时,物品评分预测装置可以将目标用户评过分且评分分值不小于7的视频按照评分时间进行倒序排列,然后挑选出前30个视频形成该用户当前最感兴趣的视频集(即目标物品集)同时,对视频集中每个视频的所属类别去重,进一步得到用户最近最感兴趣的物品类别集合(即目标物品类别集)需要说明的是,这里的用户并不做限制,可以是目标用户,也可以是目标用户的相似用户。
202、物品评分预测装置根据用户的目标物品集以及目标物品类型集,计算出用户对每种物品类别的偏好值。
示例性的,对于每种属于集合的类别k,本方法为其计算一个相对应的权重即在用户ui喜爱的视频集合中属于类别k的视频所占的比例。该权重值用来表示用户ui最近一段时间内对于类别k的偏好程度。值越大,则表示用户ui在最近一段时间内,越喜欢观看属于类别k的视频。
可选的,为了提高物品评分预测装置为目标用户所推荐的物品的准确度,本实施例还可以基于步骤201和步骤202计算出的目标用户对每种物品类别的偏好值来为目标用户的待评分物品预测评分,即基于步骤201和步骤202,步骤105具体包括如下内容:
105a1、物品评分预测装置根据目标用户的相似用户对目标用户的待评分物品的评分、目标用户对所有物品的评分的平均值、每个相似用户对所有物品的评分的平均值、目标用户与所述每个相似用户间的相似度以及目标用户的相似用户对每种物品类型的偏好值,计算目标用户对所述待评分物品的预测评分。
在获取到目标用户的相似用户对每种物品类别的偏好值后,对于每个属于目标物品集的视频vi,本方法为其计算一个相对应的权重用来表示用户ui最近一段时间内对于视频vi的偏好值,首先,将初始化为1,然后,对于每种属于集合的类别k,若当前视频vi属于类别k,则将其类别喜好系数进行累加,即
示例性的,物品评分预测装置在根据目标用户的相似用户对目标用户的待评分物品的评分、目标用户对所有物品的评分的平均值、每个相似用户对所有物品的评分的平均值、目标用户与所述每个相似用户间的相似度以及目标用户的相似用户对每种物品类型的偏好值,计算目标用户对所述待评分物品的预测评分时,可以基于下述的评分预测公式进行预测。
其中,上述的评分预测公式为:
其中,上述用户u'对视频v'的评分预测值ru',v'为用户u'评分的平均值加上最近邻用户的评分影响。为用户u'的所有评分的平均值,Eu'为用户u'填充后的邻居集合,sim(u',uj)为根据公式一计算的用户u'和用户uj(uj∈Eu')的相似度,为用户uj对视频v'的评分,为用户uj所有评分的平均值,为步骤B1中计算的用户uj对视频v'的偏好值,即
此外,物品评分预测装置还可以通过将目标用户对每个待推荐物品的偏好值按照从高至低的顺序进行排序,并选取偏好值最高的几个待推荐物品推荐给目标用户。
这样本方案通过捕捉用户近期的动态的兴趣,加入用户对物品类别的偏好值,来衡量用户对物品的偏好程度。同时结合上对相邻用户未评分的物品的预测评分,以及目标用户未评分的物品的预测评分,从而保证了为目标用户推荐的物品的准确性。
本发明的实施例提供一种物品评分预测装置,该装置用于实现上述的物品推荐方式,如图3所示,该装置包括:第一获取模块21、生成模块22、确定模块23、计算模块24以及预测模块25,其中:
第一获取模块21,用于获取用户对物品的评分信息.
生成模块22,用于根据第一获取模块21获取的用户对物品的评分信息生成用户-物品类型评分矩阵。
确定模块23,用于根据生成模块22生成的用户-物品类型评分矩阵确定出目标用户的相似用户。
计算模块24,用于根据生成模块22生成的用户-物品类型评分矩阵以及第一获取模块21获取的用户对物品的评分信息,计算目标用户的相似用户中对待评分物品存在缺失评分的相似用户对目标用户的待评分物品的预测评分。
预测模块25,用于根据目标用户的相似用户对目标用户的待评分物品的评分,为待评分物品预测评分。
可选的,计算模块24具体用于:
从目标用户的第一相似用户已评分的物品中获取目标用户的待评分物品的第一相似物品集,第一相似物品集中的相似物品为第一相似用户已评分且与所述待评分物品相似的物品;第一相似用户为目标用户的相似用户中对待评分物品存在缺失评分的相似用户;
根据待评分物品与所述相似物品集中的每个相似物品间的相似度、第一相似用户对相似物品集中的每个相似物品的评分、第一待评分物品所得到的评分的平均值以及相似物品集中的每个相似物品所得到的评分的平均值,预测出第一相似用户对第一待评分物品的评分。
可选的,预测模块25具体用于:
根据目标用户的相似用户对目标用户的待评分物品的评分、目标用户对所有物品的评分的平均值、每个相似用户对所有物品的评分的平均值以及目标用户与所述每个相似用户间的相似度,计算目标用户对待评分物品的预测评分。
可选的,评分信息还包括用户对物品进行评分时的评分时间,如图3所示,该装置还包括:第二获取模块26,其中:
第二获取模块26,用于获取用户的目标物品集以及目标物品集对应的目标物品类型集,目标物品集中的目标物品为用户已评分且评分时的评分时间大于预定阈值的物品,目标物品类型集中包含了目标物品集中的目标物品所属的所有物品类别。
计算模块24,还用于根据第二获取模块26获取的用户的目标物品集以及目标物品类型集,计算出用户对每种物品类别的偏好值。
进一步可选的,预测模块25具体用于:
根据目标用户的相似用户对目标用户的待评分物品的评分、目标用户对所有物品的评分的平均值、每个相似用户对所有物品的评分的平均值、目标用户与所述每个相似用户间的相似度以及目标用户的相似用户对每种物品类型的偏好值,计算目标用户对所述待评分物品的预测评分。
可选的,确定模块23具体用于:
根据相似度计算公式以及所述用户-物品类型评分矩阵,计算出目标用户与其他用户间的相似度;
其中,相似度计算公式为: sim(u',ui)表示目标用户u'和其他用户ui的相似度,为目标用户u'和其他用户ui均打过分的物品所属的物品类别集合,用于表示目标用户u'对所有物品类别的评分的平均值,用于表示其他用户对所有物品类别的评分的平均值,C为用户-物品类型评分矩阵,θ为阈值。
本发明的实施例提供的物品评分预测装置,通过根据用户对物品的评分信息生成用户-物品类型评分矩阵,然后根据该用户-物品类型评分矩阵确定出目标用户的相似用户,根据该用户-物品类型评分矩阵以及用户对物品的评分信息,计算目标用户的相似用户中对待评分物品存在缺失评分的相似用户对目标用户的待评分物品的预测评分,最后,根据该目标用户的相似用户对目标用户的待评分物品的评分,为待评分物品预测评分。相比于现有技术仅仅根据数据缺失的用户-物品评分矩阵来为目标用户的缺失评分进行预测的方法,本方案通过预先将分散的物品聚合到不同的物品类别中,然后结合已有的数据缺失的用户-物品评分矩阵构建数据更为集中的用户-物品类别评分矩阵,从而提高了确定目标用户的相似用户的准确度,进而可以为目标用户的相似用户中对待评分物品存在缺失评分的相似用户对目标用户的待评分物品预测出准确度更高的评分,这样根据这些目标用户的相似用户对目标用户的待评分物品的评分,便可准确的为目标用户的待评分物品预测出评分。
此外,本方案还通过捕捉用户近期的动态的兴趣,加入用户对物品类别的偏好值,来衡量用户对物品的偏好程度。同时结合上对相邻用户未评分的物品的预测评分,以及目标用户未评分的物品的预测评分,从而保证了为目标用户推荐的物品的准确性。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(RandomAccessMemory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (12)
1.一种物品评分预测方法,其特征在于,包括:
获取用户对物品的评分信息;
根据所述用户对物品的评分信息生成用户-物品类型评分矩阵;
根据所述用户-物品类型评分矩阵确定出所述目标用户的相似用户;
根据所述用户-物品类型评分矩阵以及所述用户对物品的评分信息,计算所述目标用户的相似用户中对所述待评分物品存在缺失评分的相似用户对所述目标用户的待评分物品的预测评分;
根据所述目标用户的相似用户对所述目标用户的待评分物品的评分,为所述待评分物品预测评分。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户-物品类型评分矩阵以及所述用户对物品的评分信息,计算所述目标用户的相似用户中对所述待评分物品存在缺失评分的相似用户对所述目标用户的待评分物品的预测评分具体包括:
从所述目标用户的第一相似用户已评分的物品中获取所述目标用户的待评分物品的第一相似物品集,所述第一相似物品集中的相似物品为所述第一相似用户已评分且与所述待评分物品相似的物品;所述第一相似用户为所述目标用户的相似用户中对所述待评分物品存在缺失评分的相似用户;
根据所述待评分物品与所述相似物品集中的每个相似物品间的相似度、所述第一相似用户对所述相似物品集中的每个相似物品的评分、所述第一待评分物品所得到的评分的平均值以及所述相似物品集中的每个相似物品所得到的评分的平均值,预测出所述第一相似用户对所述第一待评分物品的评分。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述目标用户的相似用户对所述目标用户的待评分物品的评分,为所述待评分物品预测评分具体包括:
根据所述目标用户的相似用户对所述目标用户的待评分物品的评分、所述目标用户对所有物品的评分的平均值、所述每个相似用户对所有物品的评分的平均值以及所述目标用户与所述每个相似用户间的相似度,计算所述目标用户对所述待评分物品的预测评分。
4.根据权利要求1所述的方法,其特征在于,所述评分信息还包括所述用户对物品进行评分时的评分时间,所述根据所述目标用户的每个相似用户对所述目标用户的待评分物品的预测评分,为所述待评分物品预测评分之前,所述方法还包括:
获取所述用户的目标物品集以及所述目标物品集对应的目标物品类型集,所述目标物品集中的目标物品为所述用户已评分且评分时的评分时间大于预定阈值的物品,所述目标物品类型集中包含了所述目标物品集中的目标物品所属的所有物品类别;
根据所述用户的目标物品集以及目标物品类型集,计算出所述用户对每种物品类别的偏好值。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标用户的相似用户对所述目标用户的待评分物品的评分,为所述待评分物品预测评分具体包括:
根据所述目标用户的相似用户对所述目标用户的待评分物品的评分、所述目标用户对所有物品的评分的平均值、所述每个相似用户对所有物品的评分的平均值、所述目标用户与所述每个相似用户间的相似度以及所述目标用户的相似用户对每种物品类型的偏好值,计算所述目标用户对所述待评分物品的预测评分。
6.根据权利要求1所述的方法,其特征在于,所述根据所述用户-物品类型评分矩阵确定出所述目标用户的相似用户具体包括:
根据相似度计算公式以及所述用户-物品类型评分矩阵,计算出所述目标用户与其他用户间的相似度;
为所述目标用户与其他用户间的相似度进行排序,确定出所述目标用户的相似用户;
其中,所述相似度计算公式为: sim(u',ui)表示所述目标用户u'和所述其他用户ui的相似度,为所述目标用户u'和所述其他用户ui均打过分的物品所属的物品类别集合,用于表示所述目标用户u'对所有物品类别的评分的平均值,用于表示所述其他用户对所有物品类别的评分的平均值,C为所述用户-物品类型评分矩阵,θ为阈值。
7.一种物品评分预测装置,其特征在于,包括:
第一获取模块,用于获取用户对物品的评分信息;
生成模块,用于根据所述第一获取模块获取的所述用户对物品的评分信息生成用户-物品类型评分矩阵;
确定模块,用于根据所述生成模块生成的所述用户-物品类型评分矩阵确定出所述目标用户的相似用户;
计算模块,用于根据所述生成模块生成的所述用户-物品类型评分矩阵以及所述第一获取模块获取的所述用户对物品的评分信息,计算所述目标用户的相似用户中对所述待评分物品存在缺失评分的相似用户对所述目标用户的待评分物品的预测评分;
预测模块,用于根据所述目标用户的相似用户对所述目标用户的待评分物品的评分,为所述待评分物品预测评分。
8.根据权利要求7所述的装置,其特征在于,所述计算模块具体用于:
从所述目标用户的第一相似用户已评分的物品中获取所述目标用户的待评分物品的第一相似物品集,所述第一相似物品集中的相似物品为所述第一相似用户已评分且与所述待评分物品相似的物品;所述第一相似用户为所述目标用户的相似用户中对所述待评分物品存在缺失评分的相似用户;
根据所述待评分物品与所述相似物品集中的每个相似物品间的相似度、所述第一相似用户对所述相似物品集中的每个相似物品的评分、所述第一待评分物品所得到的评分的平均值以及所述相似物品集中的每个相似物品所得到的评分的平均值,预测出所述第一相似用户对所述第一待评分物品的评分。
9.根据权利要求7或8所述的装置,其特征在于,所述预测模块具体用于:
根据所述目标用户的相似用户对所述目标用户的待评分物品的评分、所述目标用户对所有物品的评分的平均值、所述每个相似用户对所有物品的评分的平均值以及所述目标用户与所述每个相似用户间的相似度,计算所述目标用户对所述待评分物品的预测评分。
10.根据权利要求7所述的装置,其特征在于,所述评分信息还包括所述用户对物品进行评分时的评分时间,所述装置还包括:
第二获取模块,用于获取所述用户的目标物品集以及所述目标物品集对应的目标物品类型集,所述目标物品集中的目标物品为所述用户已评分且评分时的评分时间大于预定阈值的物品,所述目标物品类型集中包含了所述目标物品集中的目标物品所属的所有物品类别;
所述计算模块,还用于根据所述第二获取模块获取的所述用户的目标物品集以及目标物品类型集,计算出所述用户对每种物品类别的偏好值。
11.根据权利要求10所述的装置,其特征在于,所述预测模块具体用于:
根据所述目标用户的相似用户对所述目标用户的待评分物品的评分、所述目标用户对所有物品的评分的平均值、所述每个相似用户对所有物品的评分的平均值、所述目标用户与所述每个相似用户间的相似度以及所述目标用户的相似用户对每种物品类型的偏好值,计算所述目标用户对所述待评分物品的预测评分。
12.根据权利要求7所述的装置,其特征在于,所述确定模块具体用于:
根据相似度计算公式以及所述用户-物品类型评分矩阵,计算出目标用户与其他用户间的相似度;
其中,所述相似度计算公式为: sim(u',ui)表示所述目标用户u'和所述其他用户ui的相似度,为所述目标用户u'和所述其他用户ui均打过分的物品所属的物品类别集合,用于表示所述目标用户u'对所有物品类别的评分的平均值,用于表示所述其他用户对所有物品类别的评分的平均值,C为所述用户-物品类型评分矩阵,θ为阈值。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201610112354.4A CN105809275A (zh) | 2016-02-29 | 2016-02-29 | 一种物品评分预测方法及装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201610112354.4A CN105809275A (zh) | 2016-02-29 | 2016-02-29 | 一种物品评分预测方法及装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN105809275A true CN105809275A (zh) | 2016-07-27 |
Family
ID=56466533
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201610112354.4A Pending CN105809275A (zh) | 2016-02-29 | 2016-02-29 | 一种物品评分预测方法及装置 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN105809275A (zh) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106844446A (zh) * | 2016-12-16 | 2017-06-13 | 飞狐信息技术(天津)有限公司 | 基于用户观影行为的视频评分方法、装置及视频系统 |
| CN107220303A (zh) * | 2017-05-10 | 2017-09-29 | 努比亚技术有限公司 | 一种应用的推荐方法、装置及计算机可读介质 |
| CN109101563A (zh) * | 2018-07-13 | 2018-12-28 | 东软集团股份有限公司 | 一种对象推荐方法、装置、介质以及设备 |
| CN110543597A (zh) * | 2019-08-30 | 2019-12-06 | 北京奇艺世纪科技有限公司 | 一种评分确定方法、装置及电子设备 |
| CN110555627A (zh) * | 2019-09-10 | 2019-12-10 | 拉扎斯网络科技(上海)有限公司 | 实体展示方法、装置、存储介质和电子设备 |
| WO2020029401A1 (zh) * | 2018-08-09 | 2020-02-13 | 平安科技(深圳)有限公司 | 商品推荐方法、装置、计算机设备及计算机可读存储介质 |
-
2016
- 2016-02-29 CN CN201610112354.4A patent/CN105809275A/zh active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106844446A (zh) * | 2016-12-16 | 2017-06-13 | 飞狐信息技术(天津)有限公司 | 基于用户观影行为的视频评分方法、装置及视频系统 |
| CN107220303A (zh) * | 2017-05-10 | 2017-09-29 | 努比亚技术有限公司 | 一种应用的推荐方法、装置及计算机可读介质 |
| CN109101563A (zh) * | 2018-07-13 | 2018-12-28 | 东软集团股份有限公司 | 一种对象推荐方法、装置、介质以及设备 |
| WO2020029401A1 (zh) * | 2018-08-09 | 2020-02-13 | 平安科技(深圳)有限公司 | 商品推荐方法、装置、计算机设备及计算机可读存储介质 |
| CN110543597A (zh) * | 2019-08-30 | 2019-12-06 | 北京奇艺世纪科技有限公司 | 一种评分确定方法、装置及电子设备 |
| CN110555627A (zh) * | 2019-09-10 | 2019-12-10 | 拉扎斯网络科技(上海)有限公司 | 实体展示方法、装置、存储介质和电子设备 |
| CN110555627B (zh) * | 2019-09-10 | 2022-06-10 | 拉扎斯网络科技(上海)有限公司 | 实体展示方法、装置、存储介质和电子设备 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111461841B (zh) | 物品推荐方法、装置、服务器及存储介质 | |
| CN103412948B (zh) | 基于聚类的协同过滤的商品推荐方法及系统 | |
| CN106651546B (zh) | 一种面向智慧社区的电子商务信息推荐方法 | |
| CN104679771B (zh) | 一种个性化数据搜索方法和装置 | |
| Poriya et al. | Non-personalized recommender systems and user-based collaborative recommender systems | |
| CN105809275A (zh) | 一种物品评分预测方法及装置 | |
| CN102411754A (zh) | 一种基于商品属性熵值的个性化推荐方法 | |
| Christakopoulou et al. | Hoslim: Higher-order sparse linear method for top-n recommender systems | |
| US20160012511A1 (en) | Methods and systems for generating recommendation list with diversity | |
| US20150379609A1 (en) | Generating recommendations for unfamiliar users by utilizing social side information | |
| CN103559622A (zh) | 基于特征的协同过滤推荐方法 | |
| CN106471491A (zh) | 一种时变的协同过滤推荐方法 | |
| Selke et al. | Pushing the boundaries of crowd-enabled databases with query-driven schema expansion | |
| US10448120B1 (en) | Recommending features for content planning based on advertiser polling and historical audience measurements | |
| Kommineni et al. | Machine learning based efficient recommendation system for book selection using user based collaborative filtering algorithm | |
| CN109064293A (zh) | 商品推荐方法、装置、计算机设备及存储介质 | |
| CN102609523A (zh) | 基于物品分类和用户分类的协同过滤推荐算法 | |
| CN107330727A (zh) | 一种基于隐语义模型的个性化推荐方法 | |
| CN104866530A (zh) | 一种基于滑标评分的推荐系统及方法 | |
| CN108805598A (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
| CN106127506A (zh) | 一种基于主动学习解决商品冷启动问题的推荐方法 | |
| Kavinkumar et al. | A hybrid approach for recommendation system with added feedback component | |
| CN108153792A (zh) | 一种数据处理方法和相关装置 | |
| CN106202151A (zh) | 一种用于提高个性化推荐系统多样性的方法 | |
| Lin et al. | A consumer review-driven recommender service for web e-commerce |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160727 |
|
| RJ01 | Rejection of invention patent application after publication |