常用个性化推荐算法的技术研究

 2022-01-17 11:01

论文总字数:15728字

目 录

摘要及关键字………………………………………………………3

推荐系统的概念及研究背景………………………………………5

推荐系统的研究方向………………………………………………6

个性化推荐算法技术研究…………………………………………7

3.1 基于内容的推荐………………………………………………………………………7

3.2 协同过滤推荐…………………………………………………………………………8

3.2.1基于用户的协同过滤推荐……………………………………………………9

3.2.2基于物品的最近邻推荐………………………………………………………11

3.3 基于社交网络的推荐…………………………………………………………………11

3.3.1基于邻域的社交网络推荐……………………………………………………11

3.3.2基于网络结构的社交网络推荐………………………………………………12

3.4 基于知识的推荐………………………………………………………………………13

3.5 组合推荐………………………………………………………………………………13

3.5.1推荐结果的混合………………………………………………………………14

3.5.2推荐算法的混合………………………………………………………………14

3.5.3相似度的计算…………………………………………………………………14

3.6 部分推荐技术的比较…………………………………………………………………15

对于组合推荐算法的想法…………………………………………16

结论…………………………………………………………………17

参考文献……………………………………………………………19

致谢…………………………………………………………………20

常用个性化推荐算法的技术研究

丁李兵

,China

Abstract:With the emergence and popularity of the Internet, it brings us a vast amounts of information, but also because of the rapid development of the network of online information, it's hard to found in the mass information about their useful information, for this kind of phenomenon, the general solution is represented by the search engine information retrieval system, such as baidu, sogou, etc., and information and its transmission is diverse, now the requirements of the users of information content and information quantity is diversified and personalized, so deal with information overload problem of another very quick way is to use the recommendation system. Now we study the recommendation algorithm mainly includes recommendations based on content, based on the recommendations from the knowledge, the recommendation of association rules, collaborative filtering recommendation, recommendations based on social network analysis method, based on the recommendations from the network structure and mixed is recommended. Recommendation system architecture and performance evaluation is also a research direction of the recommendation system.

Key words:Recommendation algorithm; personalized recommendation system; social networking; information overload;

1、推荐系统的概念及研究背景

早在上个世纪末,Resnick和Varian就已经提出推荐系统的概念:它是以电子商务网站为平台,为消费者提供商品的信息和建议,协助他们决定应该购买什么产品,模拟推销人员协助消费者完成购买过程[2]。由这句话我们可以猜想,一个基本的推荐系统必须包含推荐人群、商品、推荐策略这三个最基本的组成部分。如图一所示推荐系统的常用流程:推荐系统对用户和物品进行数据的收集与建模,再利用用户的基本信息或者隐藏信息关联到物品的标签,对物品的条件依据特定的推荐算法进行计算并筛选出符合用户需求的物品,再将物品推荐给用户。

图1 推荐系统通用模型

虽然搜索引擎对于处理信息过载有着举足轻重的作用,然而搜索引擎仍然具有难以改变的劣势。比如搜索引擎在搜索功能方面不具备基于需求特征的搜索条件,对于意思相差不大的词、句,搜索出来的结果基本上是一样的。对于商业网站而言,根据搜索引擎得出来的结果并不能向用户提供准确、合理的推荐建议。随着网络以及电商的发展,推荐系统被越来越频繁地应用到网络上的网站中,如今它是网络课题研究中的一个比较特别的研究部分。在国内,由于传统的商业模式的没落,正在逐步被电子商务领域的蓬勃发展代替或者改变,推荐系统的运用也“小荷才露尖尖角”。

明尼苏达大学教授John Riedl说过:“推荐系统将成为未来几十年里最重要的变革,社会化网站将由推荐系统作为驱动”[3]。在web2.0时代的今天,因为其潜在的发展前景以及广阔的应用空间,几乎所有的大型电子商务网站和一些个性化服务类的网站都在以不同的方式向用户推荐商品,其中做的很不错的就是Amazon和豆瓣网。拥有个性化推荐系统的网站、电商可以在很大程度上的留存客户的意见和提升用户对商店的信任度和忠诚度,为此类网站带来持续、大量的收益。在产品价格相比之下比较低廉而且商品种类丰富繁多、用户需要个性化推荐系统来进行产品推荐的行业及商品,推荐系统能够在很大的程度上增加产品的销售额从而给企业增加销售利润。随着因特网以及电子商务的发展,未来推荐系统必将成为我们在网上购买商品至关重要的一部分。

日前,我国对于有关推荐策略算法方面的探讨一般还处于研究基于内容的初级阶段,并且在个性化推荐策略方面的理论研究也处于空空如也的状态,假如在中国期刊网上搜索有关推荐策略的文献,只能搜索出极少量的与此相关的期刊文献,这说明个性化推荐策略目前在我国的研究领域以及市场上的使用还不够先进和完善。

2、推荐系统的研究方向

国内对于推荐系统的探究研习已经持续了若干年,也经历过低谷时期。这些年来,由于大规模网络应用包括网络电子商务、手机app之类的需求和计算机高性能运算的发展,很大程度上带动我们对于推荐策略领域的研究状态,值得我们进一步研究而且能够取得良好进展的方向有很多,主要包括:

2.1引入更精确适用的用户和对象特征

对于某项指定问题的适用用户及对象特征,通常可作为样本来训练模型。常用的协同过滤方法并没有适用用户和对象特征,只有用户评分这一指标。而一般的仅利用对象的简单特征,例如:对关键词的描述和人口统计学特征等。而结合数据则可以挖掘出基于网络上下文分析的深层特征,比如发掘出用户浏览网页和对象的时序模式。此种算法要求用户拥有丰富的历史行为数据或者记录且必须精准掌握数据的挖掘算法来分析历史记录中的数据。因此此种方法还没有在基于内容的推荐算法和协同过滤推荐算法的研究中被普遍应用。

2.2可实现的多维度推荐

目前我们所研究的大部分算法一般都是基于用户和对象这两个度量空间的,而不去考虑与对象和用户相关的信息。另外,环境因素也在很大的程度上决定了用户评价和选择物品对象,如某个商品(比如衣服鞋子等)在特定季节时段很受欢迎,用户在特定的熟悉的网站浏览商品时偏向于购买某一类商品等。对于以上的情况来说,我们无法从用户和对象的自带的特征中得到环境因素这一特殊的度量标签,所以我们有必要依据具体的问题来增加推荐的特征维度。有人提出在可增加维度量空间上来定义效用函数。以电影推荐为例:主要的描述有,看电影的用户本身的个体特征、电影的标签或者信息表述,而可增加维度还有环境因素,环境因素同样也决定怎样设定效用函数,环境因素有: (1)看电影的时间段,是下午看还是晚上看;(2)是一个人看还是和亲朋好友一起去看;(3)在什么氛围下看电影,是去电影院看还是在网上看;(4)电影院的环境的好坏等。由于这种思想具有多维度的特征,有人提出利用贝叶斯模型的方法来继续深入研究这个思想。但是这个思想的主要问题就是,多维度的扩展与应用场景有必要的关系,它的可扩展性还需要我们进一步深入研究和改进。

2.3逻辑上的局限性

随着互联网的发展,信息和通信技术得到很大的进步,很早就突破了地理之间壁垒,由局域网(即传统的地理空间巴尔干)发展到了广域网(互联网)。但是同样的局限性却不可避免地发生在了逻辑空间上。推荐系统中算法依赖个人爱好、年龄分段、社会影响程度、职位专业还有个人三观实行推荐时很大可能发生这样的逻辑层面上的局域性限制,甚至可能出现社会分化这种严重的社会问题。然而导致逻辑空间上局限性的原因,本质上就是复杂的个体偏好关系。

2.4推荐算法的评价准则

推荐系统的两个重要指标——有效性和时间效率,对这两个指标的评价准则设计是目前我们研究推荐系统的热点方向。评测推荐系统性能的准则包括查全率和查准率的评测。但是目前这些基于用户评分的数据和评测的方法还存在不可避免的缺点,比如,用户对商品做出的评分往往是买回来可能不满意的商品或者是用户针对他喜欢的商品,而其他马马虎虎的商品对象被用户评价的概率则相对小很多,所以评价准则的设定必须考虑到个人的行为特点,这是一个值得研究的方向。

剩余内容已隐藏,请支付后下载全文,论文总字数:15728字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;