协同过滤推荐系统的稀疏性问题研究

 2022-01-17 11:01

论文总字数:16738字

目 录

  1. 引言……………………………………………………………………1
    1. 推荐系统介绍……………………………………………………………………5
    2. 推荐系统与搜索引擎的关系……………………………………………………5
    3. 推荐系统的应用…………………………………………………………………6

1.4 个性化推荐系统背景与发展现状…………………………………………………6

1.5 主要推荐系统算法介绍……………………………………………………………7

1.3.1基于内容的推荐算法…………………………………………………………7

1.3.2协同过滤的推荐算法…………………………………………………………8

1.3.3基于社交网络的推荐算法……………………………………………………9

1.3.4混合推荐算法…………………………………………………………………9

1.6推荐系统中的常见问题介绍…………………………………………………………9

1.6.1 冷启动问题…………………………………………………………………10

1.6.2数据稀疏问题…………………………………………………………………10

1.6.3扩展性问题……………………………………………………………………10

2..数据稀疏问题及其解决方法………………………………………10

2.1数据稀疏问题背景与发展现状………………………………………………………10

2.2 数据稀疏问题解决思路………………………………………………………………10

3.基于项的相似度计算方法改进……………………………………11

4.降维方法解决数据稀疏问题………………………………………13

4.1主成分分析………………………………………………………………………………13

4.2 奇异值分解……………………………………………………………………………13

4.3基于降维方法的协同过滤推荐算法……………………………………………………14

4.4 本章小结………………………………………………………………………………14

5.结论…………………………………………………………………14

6.参考文献……………………………………………………………14

7.致谢…………………………………………………………………15

协同过滤个性化推荐系统稀疏性问题的研究

(Research on Collaborative Filtering Recommendation Algorithms for Data Sparsity)

姓名:王伟光

摘要:毋庸置疑,如今是一个信息爆炸的时代,普通用户在面对互联网上海量的信息时往往无所适从。为了满足用户的信息需求,计算机科学家继搜索技术后发明了另一项影响深远的技术:推荐技术。它分析使用者的用户信息(行为、兴趣、情景等),将使用者最有可能感兴趣的项目推荐给使用者。最近十几年,推荐系统技术已迅速发展成为学术研究的热点,并在电子商务、网络广告、社交网络等重要应用领域展现出自己的才华。个性化推荐系统,能够根据用户信息、操作日志、电影项目信息等数据之间的关联,从庞大的项目群中找到使用者感兴趣的项目。

协同过滤算法是应用最广泛的推荐系统算法。在很多领域,尤其是在电子商务方面中,协同过滤推荐算法得以应用并创造着巨大的价值。因为协同过滤算法是根据用户之间的信息来进行推荐,所以和基于内容的推荐算法相比,它能够推荐项目群中的任意项目,推荐效果更好。用户使用协同过滤推荐系统,对物品进行评分形成的U-I矩阵是系统进行个性化推荐的基础,然而在实际运行中,由于用户和项目的数量级庞大,用户留下的个人数据却是非常匮乏,使得经典协同过滤推荐算法评分预测准确度和推荐效果变差,这就形成了协同过滤算法中的一大难题:数据稀疏问题。

在本文中,我们研究了基于协同过滤推荐系统的算法和其他算法的推荐系统的特点,并分析了常见的问题,可能会遇到的问题:冷启动问题,稀疏数据问题。并且研究了在协同过滤推荐算法中处理上述问题的方法。

关键词: 推荐系统,稀疏性问题,算法,协同过滤

Abstract

In the face of vast amounts of information on the Internet, ordinary users are often confused. In order to meet the needs of users of information, computer scientists made the invention of another far-reaching technology after the search technology: the recommended technology. According to the user's interest, behavior, situation and other information, it pushes the user's most interested content to the user. In recent years, recommendation system technology has been rapid development and becomes hotspot of academic research even show their talents in the e-commerce, online advertising, social networking and other important application of the Internet. Personalized recommendation system can be based on user information, operation log, film project information and other data association between the data from a large project group for the user to recommend the content of its interest.

In the recommendation system, the most widely used algorithm is collaborative filtering recommendation algorithm, especially in the field of e-commerce.Collaborative filtering recommendation algorithm has been a great success. Because the collaborative filtering recommendation algorithm is recommended by other users of the information, it can recommend any type of content for the user, so compared to content based recommendation algorithm, collaborative filtering recommendation algorithm has more advantages. Collaborative filtering recommendation algorithm is mainly based on the user's score information left on the site to provide users with personalized recommendation. As the number of users and projects is very large, and the number of users of the project is very limited, making collaborative filtering recommendation algorithm is faced with the problem of data sparsity. Data sparsity problem is a major cause of the traditional collaborative filtering recommendation algorithm, which is not high in accuracy and recommendation.

In this paper, based on collaborative filtering in personalization recommendation system algorithm and other algorithms in personalized recommendation system characteristics, analyzes the common problems that may be encountered in the personalized recommendation system: cold start problem, sparse data problems, and research in collaborative filtering recommendation method to reduce the problems in algorithm.

Key words: recommendation system, sparsity problem, algorithm, collaborative filtering

第一章.引言

1.1推荐系统介绍:

人们在生活中往往会参考甚至依赖于他人的意见,尤其是在自己不是很熟悉的领域,这种现象造就了推荐系统的产生。推荐系统是为用户推荐所需物品的软件工具和技术。提供的推荐旨在通过向用户提供有用的意见,从而在各种决策过程中帮助用户,例如;买什么物品、听什么歌、看什么电影或者读什么新闻。推荐系统是一种非常有价值的在线用户处理信息过载的方法,已成为电子商务领域中最具人气和最流行的工具。推荐算法的原理是通过某种的手段将用户和物品关联起来,而推荐系统的不同仅在于关联的方式。下图展示了联系用户和物品常用的方式:

用户

物品

好友

注册信息

历史兴趣

图1

在过去的十几年中,人们提出很多种基于各种方法的推荐技术,并且在电子商务以及其他领域得到了广泛的实践。大多数推荐系统都是针对一种固定类型的用户或者物品,能够给出个性化的推荐,当然也存在非个性化推荐系统,这种推荐系统往往十分简单,在某些情境下也能满足用户的需求。个性化推荐系统的设计是为了帮助那些由于没有特定知识和经验无法从庞大数据集中做出选择的人。一个设计良好的电子商务推荐系统能够将浏览者变成购买者,让用户能够选择物品,而且还可以提高网站或者应用程序的用户体验,准确有效的推荐结果,加上可用的用户接口,这些措施将会增加用户对系统的主观评价。反过来增加系统的用户量和推荐效果显著的概率。反馈是推荐系统至关重要的一环,推荐系统的精确性离不开用户对于网站的忠诚,一个良好的推荐系统能够获得用户的信任,大量的老客户能够丰富评分矩阵,形成一个良性的循环。

推荐系统的优势是它的功能既能够使服务提供商卖出更多商品,又能使用户得到更好的建议。服务提供商应用推荐系统的原因有:

剩余内容已隐藏,请支付后下载全文,论文总字数:16738字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;