社交网络群体识别方法初探

 2022-01-17 11:01

论文总字数:21223字

目 录

1绪论 1

1.1 研究背景 1

1.2 研究意义 2

1.3 国内外研究现状 4

2社交网络理论 5

2.1六度分割理论 5

2.2复杂网络理论 5

2.2.1复杂网络的概念 5

2.2.2复杂网络特征 6

2.3群体发现方法 8

2.3.1群体结构 8

2.3.2群体发现算法 8

2.4社会网络分析方法 9

2.4.1社会网络分析概述 9

2.4.2网络密度 9

2.4.3网络中心性 9

2.5分析软件UCINET 10

3 facebook网络群体结构分析 10

3.1样本数据获取与处理 10

3.1.1facebook中群体的特点 10

3.1.2数据获取与处理 11

3.2facebook群体的网络特征 12

3.2.1网络图 12

3.2.2网络密度 13

3.2.3中心性分析 13

3.3本章小结 14

4群体识别方法应用实例 15

4.1基于中心性的核心用户识别方法 15

4.1.1中心性分析 15

4.1.2实验分析 15

4.2基于模块度的louvain算法实现群体识别 16

4.2.1 louvain算法 16

4.2.2 facebook用户数据使用louvain算法进行社区发现 17

5总结与展望 19

参考文献 20

致谢 22

社交网络群体识别方法初探

范福龙

,China

Abstract: With the continuous transformation of Internet technology and the rise of various social software, virtual social network gradually replaced the traditional social way to become the new era of people exchanges and information dissemination of the main stage. But the social network is a double-edged sword, in the communication becomes simple, fast at the same time, there are false users, network fraud and other issues. In the wave of large data mining, the analysis of the social network of the community structure, help to understand the user's communication model, the user classification and behavior analysis. It is the goal of this paper to group users into different groups by means of group recognition in social networks. This paper firstly analyzes the group construction method and basic characteristics of social network by means of Facebook as an example, and uses the louvain algorithm based on modularity to identify the user group.

Key words:Data mining; social network analysis; community discovery

1绪论

本章主要说明论文研究背景及意义,简单描述社交网络研究的发展沿革与研究现状,阐述本文的研究目的与主要工作。

研究背景

回溯网络发展的历史,分析方法起初是来源于图论和拓扑学等应用数学的兴起。瑞士数学家L.Eular于18世纪创立了图论学说,图论对成对个体之间的复杂关系进行了分析。20世纪30年代哈佛社会学家强调把社会关系看成是一种网络集团,他们结合了社会计量学与群体动力学,在理论和方法方面对小团体进行了深入的研究。

20世纪50年代,社会学家进行了大量社会网络的统计与调研,他们把社交网络分析技术运用到了人际关系上。20世纪70年代以后,社会学家在社交网络分析领域作用巨大,他们不断的改进社会网络分析这一新兴的探究方向。怀特(White)认为当代社会结构已经成为一种复杂的关系网络结构,他对各种各样的社会关系与群体进行了统一建模,同时依据统计学理论进行社交网络研究。他提出当时已经存在的许多关于社会结构的分类描述不具备坚实的理论体系作为基点,而社会网络分析可以构造成一门独特的理论体系。

20世纪90年代以后,电脑技术持续发展,社会网络分析方法也逐渐成熟,社会网络有个很多更新更有说服了的建模,社会网络分析方法开始从基础领域向很多其他方向延伸。社会网络分析方法提升了自己的价值,变得可以应用于多种问题分析。

随着互联网技术的发展,各种通讯和社交软件不断更新与进步,人类传统的社交方式被打破,简单、快捷、无距离的虚拟社交网络成为主流,人们的关系也越来越呈现网络化趋势,社会网络研究的焦点也逐渐向虚拟社交网络转移。

随着Facebook,Twitter,Delicious等社交网站的兴盛,社交网络的研究越来越活跃。其实不论是社交网络或通信网络,交通网络,互联网还是WSN都是复杂网络,都具有集群效应。所谓的“社区发现”是识别网络中收集的节点。到目前为止,社区发现是复杂网络中知识发现的重要步骤之一。

Facebook是Web 2.0时代出现的新型社交网络,与以往的社交媒体不同,Facebook有着明显的优势和与众不同的特色,逐渐替代传统网络社交,成为世界范围内信息交流的主流平台。在facebook中人们可以可以通过各种方式发生互动:留言、发站内信,评论日志。人们还可以通过简易迅速的聚合功能找到和自己有相似特征的人,并且随时随地查看他人的动态,并且可以随时互动交流。facebook注册方便,消息发布迅速快捷,同时移动端的推出也使得facebook具备随时发布消息,随时使用等优点。所以facebook受到了当代人尤其是年轻人的追捧与热爱。以facebook为例,从 2004年上线以来,使用人数飞速增长,截止2016年9月30日,facebook在全球170个国家用户人数达到14.3亿,比中国的总人口数还要多。

Facebook的出现丰富了社交网络的形式与结构,也使得信息的传播速度以几何倍数增长,研究facebook中的社交网络的结构与模型、识别出其中的用户群体对于商家发布推荐信息,监控各种消息传播等具有重大的意义。

研究意义

计算机网络技术日益发展,虚拟社交网络吸引更多的人参与其中,用户往往在网络中去共享自己的各种信息,丰富自己的关系网络。企业甚至能通过社交平台去直接影响客户,一切都似乎因为社交网络的出现而变的美好,但是有社交网络有三点特性需要我们注意:

1.特性一:网络虚假信息与真实信息同时存在。在社交网络中这种特性尤为突出。人们会在社交网络中会表达自己的真实信息,但是也会在其中发出自己臆想的信息,导致的结果是极容易让谣传成为”事实”

2.特性二:无界。信息可以在网络中无限扩展,甚至最后影响到现实

3.特性三:快速。由于网络信息传递的爆炸性速度使得用户的信息很可能在短期内扩散。

每一条发布的信息,如同石块入水所散开的涟漪,如果不继续投入石块,则涟漪会逐渐淡化直至消失,这便是社交网络的自洁功能,由于有以上三个特性的存在,仅仅依靠“自洁“是远远不够的。如果在涟漪扩散过程中的某个点再继续投入一块石头,则原有涟漪会扩大或者缩小,只要找准了点位,这些涟漪就可能形成波浪。如何去找到这些信息,找准这些点位,扩大品牌正面声量、减少并消除负面声量成为企业在社会化营销中制胜的关键,这个时候社交网络分析就能给企业带来帮助。

社交网络中充斥着各种可能成为“波浪“的信息,有针对一款产品的,有针对某部电影的,还有针对某位明星的——这些信息都可以从网上免费获取。这些评论信息对于企业的价值可以说是巨大的。一个企业如果掌握了这些数据,再加以分析,无论是对现有产品的改进还是对未来产品的走向都是十分有帮助的。目前对于企业来说,社交网络分析主要关注点在于找到消费者,并能分析消费者,了解消费者。与消费者达到最简洁快速的沟通。这就需要通过数据分析找到消费者所在的圈子,进而找到圈子中的意见领袖,通过意见领袖让企业想传达的信息进一步扩大,辐射整个圈子。从而吸纳更多的忠实消费者。

通过社交网络数据挖掘并加以分析,企业能获得:

(1)潜在商机的发现

通过大数据发掘与研究,可以发现某个用户的活动商圈是否在企业的商圈覆盖范围内;可以知道某个用户的消费能力;可以知道某个用户的喜好及最近的购买习惯;可以知道某个用户会购买自己产品的概率;可以知道竞争对手的策略。

托生于Facebook上的线上交友游戏企业Zynga,分析了大量用户信息,从中找到许多增加盈利的机会。Zynga每日至少需要采集数以百亿的信息点,涵盖了人们的游戏时间段,游戏时长,喜欢购买的游戏物品等等。它们请来数据分析专家用这些信息来分析人们的喜好,例如大多数人喜欢购买的游戏物品和他们赠送给朋友某些游戏物品的概率。他们得到这样一个重要结论:当人们时常收到礼物对游戏的热爱程度会加深,反之则对这些游戏逐渐失去原有的兴趣。该公司的高层指出:通过这个结论,可以提出一些对应的解决方案——例如对那些不是时常收到礼品的玩家给他们其他的方式获取这些礼品,如此他们就不会对收不到礼品感到沮丧而是找到其他的兴趣点。Zynga有自己显著的用户信息分析方式:研究玩家的日常活动,猜测玩家的心里活动,通过对比分析为不同类型的玩家设计不同类型的游戏方式。

(2)危机预警

通过数据挖掘与分析,可以对一些网络中突然发布的一条可能对企业产生危机的信息即时的监控起来。并追踪其传播路径,找到其中的关键节点。利用"乱石"打散其传播轨迹。从而让危机尽快消失。一个企业面对社交媒体中网民创造的成千上万,甚至几百万的讨论内容,想要通过人工去判断哪些口碑对品牌有利,哪些将会成为品牌危机是个不可能完成的任务。所以在社交网络群体中利用大数据挖掘分析技术能更加快速的找出人们对企业的大量评价,并且通过后期对数据的分析与处理找到问题关键所在。

(3)效果预测

剩余内容已隐藏,请支付后下载全文,论文总字数:21223字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;