数据可视化方法与实现

 2022-01-17 11:01

论文总字数:22713字

目 录

1 绪论 1

1.1 大数据可视化的研究背景和研究意义 1

1.1.1 大数据可视化的研究背景 1

1.1.2 大数据可视化的研究意义 1

1.2 大数据可视化的国内外发展现状 2

1.3 大数据可视化研究的有利条件及面临的挑战 3

1.3.1 大数据可视化研究的有利条件 3

1.3.2 大数据可视化研究面临的挑战 3

2 大数据可视化的理论知识 4

2.1 大数据可视化的概念 4

2.2 大数据可视化的数据类型及比较 4

2.3大数据可视化的可视化类型及比较 4

3 大数据可视化的应用案例及分析 5

3.1电网企业中大数据可视化的应用 5

3.1.1 电网企业涉及的大数据 5

3.1.2 电网企业中所应用的可视化技术 5

3.1.3 电网企业大数据可视化应用总结 6

3.2 通过一类SVM实现可视化 6

3.3 Python可视应用 6

3.3.1 Pandas 7

3.3.2 Matplotlib 7

3.3.3 Seaborn 7

3.3.4 依赖于Python的可视化及代码解析 7

3.4几种常见可视化工具及简介 9

3.4.1 Excel 9

3.4.2 Processing 9

3.4.3 Gephi 9

3.4.4 iCharts 9

3.4.5 igraph中R语言应用 10

4 大数据可视化中的多维数据可视化研究 10

4.1 多维数据可视化技术 10

4.2 平行坐标可视化 10

4.2.1平行坐标可视化概念 10

4.2.2平行坐标可视化优点与局限性 11

4.3 散点图可视化 11

4.3.1散点图可视化概念 11

4.3.2散点图可视化优点与局限性 11

4.4折线图可视化 15

4.4.1折线图可视化的概念 15

4.4.2折线图可视化优点和局限性 15

4.5条形图可视化 17

4.5.1条形图可视化的概念 17

4.5.2条形图可视化的优点 17

4.6扇形图可视化 20

4.6.1扇形图可视化的概念 20

4.6.2扇形图可视化优点和局限性 20

4.7折线、条形与扇形图并用的可视化方法应用 22

4.7.1折线图、条形图和扇形图的优点及并用可行性 22

4.7.2折线图、条形图和扇形图并用应用及分析 22

4.8对于高维数据可视化优化进行的可视化预处理 22

4.8.1数据采样 22

4.8.2数据清洗 23

4.8.3数据集成 23

4.8.4数据转换 23

5 总结和展望 23

参考文献 24

致谢 25

大数据可视化方法与实现

顾浩

,China

Abstract: The birth of computer and the gradual popularization of the internet bring us into a brand new Internet Age.Alternation of virtual networks and real life leaves us lengthy and jumbled data.The integration and reuse of data provides us new developments opportunity.The effective application of data promotes the development of solid economy,so we usher in the Big Data Age. Visualization affords us a more intuitive solution to big data,it makes great importance to big data including its analysis,integration,reuse and spread.Visualization plays an important role in making data set more cordial and accessible.The study of big data visualization is beneficial to simplifying the information from big data under the Big Data Age background.

In this paper, background and concept of big data and its visualization will be discussed,and current framework of the method of big data visualization will be dissected.It will combine challenge and opportunity it faced under this background,for further study on the new method of visualization.

Key words: Big Data; Visualization; Method; implementation;application

1 绪论

1.1 大数据可视化的研究背景和研究意义

1.1.1 大数据可视化的研究背景

青铜器的伟大诞生,延续了千年的农耕文明;而蒸汽机的惊现所爆发的工业革命,则给人类带来了史无前例的工业文明,打破了世界传统经济格局。人类生产力发展由此有了质的飞越。就在工业文明主宰主流生产力的时候,科技革命应运而生,而计算机的研发和互联网的逐渐普及为我们迎来了一个崭新的互联网时代。由于封建顽固思想的限制和长期的抗战,使得我国在生产力上丢失了原先的霸主地位,而互联网的高速发展则为我国实现民族伟大复兴提供契机。

在经济全球化的推动下,互联网及其相关产业也进入高速发展阶段,信息时代所带来的经济效益已经成为高效经济发展的代名词。显然信息时代来临基于大量数据的流动,那么对于数据的有效处理和合理利用则是形成数据高效作用的必然条件。由于大量电子产品包括手机、平板以及传感器和物联网的出现,产生并沉淀下大量的数据信息,这就加快了大数据时代前进的步伐。该时代背景下,数据的急剧增长使得数据的分析处理繁琐枯燥,而可视化则给其高效处理应用打开了方便之门。

1.1.2 大数据可视化的研究意义

谈及大数据时代,我们不得不提及其显著的四“V”特征:Volume、Variety、Velocity、Value[1]。其数量之多、品类繁重、高速累积、价值之巨需要我们以更高效地方法来挖掘并加以呈现,而可视化的应用则给我们对于大数据的有效处理提供了金钥匙。数据以及数据集的处理应用,对于实体经济的更迅猛发展起到的带动作用,为我们迎来了一个大数据时代。而可视化则为大数据提供一种更为直观的处理方法,对于大数据的分析、应用、传播起到了极其重要作用。可视化对于使大型数据集更容易为用户理解接受有着强大作用,而合理的数据标志可以使数据在分析中减少误差量。剖析基于大数据时代背景的不同数据可视化及其方法,对于简化大数据以提供有效信息是大有裨益的。大数据可视化充分把计算机计算能力与人的主观意识和分析结合起来,有效地提高了观察大数据的应用效率[3]。那么在某种意义上,可视化也就充分发挥了当代人文主义的价值观,从某种程度上促进了社会文明的新进程。

而上述内容侧重于可视化的研究意义,我们往往容易因此把重点偏向可视化,其实大数据重要性也是不容忽视的。就大数据对于商品经济繁荣起到的作用而言,大数据不仅可以最大程度上解释企业的行为模式,也能给探索企业新的发展方向带来启迪作用。企业的发展离不开数据的使用,而一个企业拥有最有效最及时的数据,则在某种程度上决定了该公司近几年乃至近几十年的发展。大数据已然成为企业发展的重要战略资源,并时刻在各个行业的各部门不断渗透影响。那么对于经济高速发展的中国而言,对于大数据的重视、研究所能带来的商品价值[15]也就不言而喻了。

大数据时代对人类的伟大眷顾,是信息社会舞台上最耀眼的“明星”,是信息社会的阶梯上,人类又一次历史性跨越的标志。如果把土地看做农业文明的核心资源,那么工业时代的能源也就顺理成章地成为第一要素,以此类推,数据无疑是这个信息化互联网时代的重中之重。也就是说对于数据的掌握、数据分析方法的研究,不仅能够成就个人的发展进取,而且对企业乃至整个国家未来发展的影响也在不断渗透。

1.2 大数据可视化的国内外发展现状

数据可视化的萌芽要追溯到科学计算可视化的兴起。而可视化概念则是在上世纪70年代由当时欧美的相关科研工作者提出的。1973年,Chernoff提出借助脸谱图描述高维数据。1983年,R.J.LittleField首先提出符号图相关定义及其绘制。1985年,A.Inselberg探讨的多维数据的平行坐标图被带入研究者的眼球。1988年,W.S.Cleveland、M.E.McGill挖掘了散点图矩阵的源头。1996年,D.A.Keim提及像素图。20世纪90年代初,美国IEEE协会一场对可视化的学术研讨,标志着可视化由此进入计算机研究领域。

纵观国内外研究现状,当下对于数据可视化的研究,大多数情况下是以特定的专业领域抑或相关产业为出发点的,且该研究在整个科研领域都占据前沿地位。数据可视化演变于Data Visualization。国外热门研究多从可视化应用技术及其所依赖的可视化工具出发,以此对实际的可视化技术操作加以实践指导。而国内当下现有资料文献也大多数是从国外引进的,缺乏原创。新兴算法的改造对于推动新的可视化技术创新研究,具有非凡意义。具体可行的可视化开始与气象、医学、社会媒体等领域衔接,国内外已经有了初步进展并且正处于更深入的研究中。举例来说,在气象领域,可视化的应用给其专业人员提供了更为直观的气象数据信息,也就是在某种层面上为气象信息的实时推送、深入分析及后续预测创造了条件。而对于可视化的研究,相关人员在不同方面见解各有千秋,但是缺乏对其整体归纳和全面概括[2]

时下,大数据可视化的主要研究领域包括文本、网络(图)、时空数据以及多维数据的可视化[3]。而这些研究领域的相继出现,很多时候是源于当下互联网的发展、经济金融的需求以及社会公共服务等相关产业。而大数据可视化的应用正从不同角度、不同层次改变甚至重塑这些行业领域以及边缘产业的发展。

剩余内容已隐藏,请支付后下载全文,论文总字数:22713字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;