基于协同过滤的个性化算法的研究与实现

 2022-01-17 11:01

论文总字数:18793字

目 录

第一章 绪论 1

1.1研究背景 1

1.1.1 web数据挖掘 1

1.1.2个性化推荐系统和算法 1

1.2国内外研究现状 2

1.2.1国内外研究现状 2

1.2.2推荐系统应用举例 3

1.3本论文的研究内容 5

1.4论文组织结构 6

第二章 个性化推荐系统相关技术 6

2.1推荐系统与web数据挖掘 6

2.2 web挖掘与信息检索IR 7

2.3 web挖掘与信息抽取IE 7

2.4个性化推荐系统概述 8

第三章 协同过滤算法 9

3.1协同过滤的推荐策略 9

3.2协同过滤算法 10

3.2.1 集体智慧与协同过滤 10

3.2.2实现步骤 10

3.3基于内存的协同过滤算法 12

3.3.1基于用户的协同过滤算法User-Based CF(UBCF) 12

3.3.2基于项目的协同过滤算法Item-Based CF(IBCF) 14

3.4基于内存的CF算法应用优缺点分析 15

3.5基于模型的协同过滤算法 16

3.5.1基于线性回归的 Slope one算法描述 16

3.5.2基于关联规则的算法描述 16

第四章 实验与结果分析 18

4.1实验数据 18

4.2实验评价指标 18

4.3实验方案设计 19

4.4实验结果分析 19

第五章 总结与展望 26

5.1总结 26

5.2展望 27

参考文献 28

致谢 29

基于协同过滤的个性化推荐算法研究与实现

李玉

,China

Abstract:Now that we have entered a data explosion era, the Web has become a platform for data sharing, while people are losing in the massive data ,they want to find the information they need become increasingly difficult. In this case, seeking the help of the search engine is a kind of solutions, but the search engine does not fully meet the needs of users of information.as people sometimes are difficult to express their own needs, or their needs are difficult to use simple keywords to express, or they want to be more in line with their personal preferences of the results, so the recommended system emerge, letting people find the information they need more quickly.Collaborative filtering comes from collective wisdom which is based on public behavior for each user to provide personalized recommendations. From the point of view of application analysis, today's successful recommendation engines adopt a collaborative filtering approach.

In this paper, the branch of collaborative filtering (CF) is introduced into two parts: memory-based CF and model-based CF .The conventional memory-based CF collects the evaluation information of other users who are the same as the user's interest to produce the recommended item or directly find a similar item to generate a recommendation. Thus, the memory-based CF is also divided into a user-based CF and a item-based CF .Core idea based on the model is to use the data to train a model and then use it. Association rule based recommendation is based on association rule mining theory. Slope One recommendation based on linear regression predicts the score by linear computation. Finally, the algorithm is applied to the classical data set of the research system. By comparing the prediction and recommendation results of different algorithms, a complete comparative evaluation of its performance is made.

Key words:E-commerce personalized recommendation collaborative filtering association rules Slope One

第一章 绪论

1.1研究背景

1.1.1 web数据挖掘

电子商务由于Web站点设计[[1]], Web站点的导航设计[[2]]等工作正变得越来越繁多。经过Web数据挖掘的工作,从数以亿计存储着丰富的 Web页面和人们对页面的访问行为中获得必要的有效知识。

  1. 从丰富信息中挖掘用户感兴趣的信息

页面浏览和关键词搜索是最常用的获取信息的方式,然而浏览网页面获得的只是页面内的信息,缺乏页面之间的关联。通过关键词查询的搜索引擎虽然可以帮助人们找到有相关信息的网页,但眼前仍以下问题不能回避:

1.这些搜索得出的结果是混乱无序的,所以不能反复利用。

2.准确度低,令搜索得出的结果可使用性降低。比如,你要搜索玫瑰,那么就会得到像歌曲《红玫瑰》等这些与主题相似却不相关的信息。

  1. 将 web上丰富的信息转变成有用的知识

如果说基于关键词检索的搜索引擎是面向查询处理的话,那么web挖掘就应该是面向网络数据进行分析和知识提取的。对用户有用的信息可能在英特网中网页内部,网页间,网页链接,网页访问等,但用户无法直接使用这写知识,需要再次处理,从另一层面上讲,这恰是web挖掘所处理内容的落脚点和目的。

  1. 对用户进行信息个性化

现实中,每个人都是独立的个体,所使用的信息也是可能天差地别。未来的发展趋势是每个客户的个性化服务,而它取决于商家对用户的偏好等信息的了解程度。通过web数据挖掘,我们通过对每个人的访问行为,内容,频度等的分析,可以获得关于一个群体用户访问行为和方法的普遍知识[[3]],用以改进 web服务方的设计,通过对使用者特性的认知,有利于开展个性化的电子商务活动。

1.1.2个性化推荐系统和算法

因特网的遍及为使用者带来了数以亿计的信息,人们可以在其中发现对自己有用的消息,而网络的飞速发展带来的信息量的指数型增加,反而无法从中获得对自己真正有价值的信息,对信息的利用效率下降,这就是所谓的信息超载问题。

个性化推荐系统是解决信息超载问题有前景的办法之一,它会根据使用者的需求、兴趣、历史行为等,将可能感兴趣的推荐出来。推荐引擎通过研究用户的兴趣和历史行为,进行个性化研究与计算,发现用户的可能兴趣点,从而指导用户发现信息需求[[4]]。一个好的推荐系统不但能带来个性化的服务,而且让使用者产生信任。

个性化推荐最早发起于电子商务,海内外大型的电子商务和个性化站点,如淘宝、亚马逊、豆瓣等,都使用了各类形式的推荐引擎并且取得了杰出的效果。相关研究的表示,电子商务在个性化推荐服务推出后,销售额会提高,也有学者将个性化引入 E-learning领域,解决中由于学习资源种类繁多和质量参差不齐所引起的“信息过载”[[5]]问题。

协同过滤是个性化推荐算法中应用范围最广的技术之一,最初由 Goldberg于1992年提出,他们应用此算法设计了Tapestry系统,用于过滤电子邮件, 进而展现出新颖的推荐思想,奠定了推荐系统的基础。

1.2国内外研究现状

1.2.1国内外研究现状

伴随着个性化推荐系统风靡,该技术不仅在电子商务,还在电影、音乐、在线学习等范围维持着较高的热度。近几年来,研究机构出现的同时,也有大量相关的学术论文和期刊,涉及到计算机科学、电子商务、市场经济、教育等。例如,ACM设立了推荐系统年会,而且国际上的高质量期刊(例如IEEE Trans On Knowledge and Data Engineering, ACM Trans on Information System等)近年来都刊载了很多有关协同过滤的文章。

个性化推荐系统以及算法在电子商务具有优良的前景,因此在国外有着广泛的使用。纽约Cyber Dialogue对2001年在线shopping中,使用者对个性化推荐情况的使用和态度进行了研究,结果表明个性化推荐系统已成为电商提高销售额重要的手段。如果提供有效的个性化推荐功能,过半的使用者会乐意在线注册为会员,以想得到符合自己的个性化推荐服务。

剩余内容已隐藏,请支付后下载全文,论文总字数:18793字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;