基于Python的旅游数据分析及最佳路线规划

 2022-10-26 11:10

论文总字数:20353字

摘 要

当下的社会生活被各种海量数据充斥着,甚至在其深度广度被拓展的一种生活,各类数据已成了生活中不可或缺的一部分。然而,从各类海量的信息中提取真正有价值有意义的一部分却是一个庞大的工作量,将其可视化更是现在生活中第一步获取有效信息的关键。目前不仅是网络数据,产生在我们周边的实时数据也呈现出爆炸式的增长,面对这些大量数据,传统的处理方式不仅效率低下而且任务量巨大,更是难以发掘出其中所隐藏的信息规律。我们需要借助计算机编程去做数据抓取、筛选、数据建模进行挖掘和分析,采用算法建立恰当的模型,可视化地展示出数据中隐含的规律,让扁平化的数据变得立体起来,让人们有一种信息传达出的视觉冲击,利用这样的方法进而可以为人们的生产生活、经济发展等提供有效的决策和建议。

基于Python的爬虫设计,目的性的获取大数据环境下的指定数据类别,筛选并利用模型实现其可视化,总结出旅游景点数据的规律,基于这些规划可做出避开人流高峰和路线拥堵的方案。同时基于最佳旅游路线的API和maps Markcharts,在地图上标记并可清晰的看到起终点的驾车及公交路线图,并计算出路线距离和时长,利用景点的拓扑关系图及Dijkstra算法可得出最佳旅游路线。

关键字:数据分析; 数据可视化; Python爬虫; 最佳路线

Based on the Python tourist data analysis and the optimal route planning

Abstract

The current social life is flooded with all kinds of massive data, and even in a life where its depth and breadth has been expanded, various types of data have become an indispensable part of life. However, extracting truly valuable and meaningful parts from all kinds of massive information is a huge workload, and visualizing it is the key to getting effective information in the first step in life. At present, not only the network data, but also the real-time data generated around us is exploding. In the face of these large amounts of data, the traditional processing methods are not only inefficient but also have a huge amount of tasks. It is difficult to discover the hidden information rules. . We need computer programming to do data capture, screening, data modeling for mining and analysis, using algorithms to build appropriate models, visually display the implicit rules in the data, and make the flattened data stereoscopic, let People have a visual impact conveyed by information, and this method can be used to provide effective decisions and suggestions for people's production, life, and economic development.

Based on Python crawler design, the purpose is to obtain the specified data categories in the big data environment, filter and use the model to realize its visualization, and summarize the rules of tourist attraction data. Based on these plans, we can make plans to avoid crowd peaks and route congestion. . At the same time, based on the best travel route API and maps Markcharts, mark on the map and clearly see the driving and bus route maps at the end point, and calculate the route distance and duration, using the topological relationship map of the attraction and the Dijkstra algorithm. The best travel route.

Key words: Unprecedented amount of data; data visualization; Python crawler; best route

目 录

摘 要 I

Abstract II

第一章 引言 1

1.1 研究背景 1

1.2 研究意义 1

1.3国内外发展现状 1

1.4主要内容及论文结构 2

第二章 相关技术介绍 3

2.1 Python 爬虫(requests beautifulsoup) 3

2.2 数据可视化(plotly map) 3

2.3 最佳路线规划(BaiduMap API javaScript) 4

2.4本章小结 4

第三章 最佳路径的设计 5

3.1设计概述 5

3.2最佳路径的设计过程 5

3.3本章小结 7

第四章 需求分析 8

4.1 可行性研究 8

4.1.1 可行性研究的前提 8

4.1.2 社会可行性分析 8

4.1.3 技术可行性 9

4.1.4 经济可行性 9

4.2 系统功能分析 9

4.3本章小结 11

第五章 系统设计 12

5.1 系统设计思想 12

5.2 系统框架设计 12

5.2.1数据获取和筛选 12

5.2.2爬虫的系统框架[] 12

5.2.3 Plotly数据分析可视化的应用 14

5.2.4 数据访问层的简单设计 17

5.3本章小结 17

第六章 系统实现 18

6.1系统环境 18

6.2 系统功能的实现概述 18

6.3 系统功能的具体实现 18

6.4本章小结 22

第七章 系统测试 23

7.1测试概述 23

7.1.1测试环境 23

7.1.2测试实现概述 23

7.2功能测试 23

7.2.1设计测试用例 23

7.2.2测试过程 24

7.3测试结果 27

7.4本章小结 28

第八章 总结与展望 29

8.1总结 29

8.2展望 29

致 谢 30

参考文献 31

第一章 引言

研究背景

人们在各类社交媒体平台上分享发布的信息流动传播推动了旅游业、交通业、餐饮业及其相关副产业的兴盛,同时又产生了大量的实时数据流,这些信息存在着非标准化、非统一化,这其中夹杂着实时有效信息、无用信息甚至是虚假信息,各类平台提供的数据大相径庭,面对这混乱复杂的数据我们需要在相对可靠的网站和权威数据库中(如:各地级市旅游总局、携程旅行网等)筛选并提取有用信息供我们进一步的去提取规律和重点信息,可视化数据分析的方法使得数据把信息直接摆在我们面前,图表化的数据更形象,我们可以知道全国旅游热门排名TOP、小众目的地TOP、浏览量靠前的游玩攻略,以及不会踩雷的大众美食评测,这样在海量数据里我们很快就能发现自己的旅游行程和攻略变得清晰了,不再是面对各式各样的数据和帖子一筹莫展了。这或许是当下快节奏生活的人们对出行的最理想化。最佳路线给我们提供了目的地标记,以及景点之间的转移路线,这样使得行程可视化既覆盖景点也确保了行程高效快速的进行。

研究意义

当前这个大数据环境下,在中央政府和国家各级地方政府的大力支持下,旅游业在国家经济中所占的比重越来越大,跟旅游业密不可分的交通运输业、餐饮服务业以及生态环境面临着越来越重的负载。近年来,许多热门景点游客出现客流集中爆流的现象,这不仅大大降低了出行的舒适度,而且增加了交通的拥挤度和景区工作力度、生态环境的承载力度。因此对旅游数据做可视化分析既能让即将出行的游客提前了解景点拥挤区和非拥挤区及时作出调整,做到错峰出行,这样既能缓解景区的压力也可以为其他相关行业分流引流,最佳路线的应用让我们的出行有可视性和规划性,首先提升了出行效率,更使得整个旅游行业看上去更系统化轻盈化。可视化应用到数据量庞大的旅游业,是电子化产业和服务业的交融发展,其可预见性的成果对相关物联网行业、智能产业等具有实际可见的指导性意义。[[1]]

1.3国内外发展现状

从旅游业的特点来说,它是一个信息密集度高、信息量实时刷新快、相关产业部门多的综合产业。旅游业运转和生存的基础就是信息化,可视化则是该产业发展的必经之路。现如今旅游管理的提升决定着旅游信息化的发展脚步,旅游信息化不仅是目前整个旅游业的发展目标也更是我国旅游事务转型的催化剂。

国内旅游业经过长久的发展和经验的积累。很多具有前瞻性从业者早已意识到当下产业要想有心得提高和发展必须紧跟流量的发展脚步。但是,从我国的目前状况还是一种 所谓的买卖模式,游客始终处于一种消费者的角色,而不是旅游的主导者。目前我国在旅游投资发展的上角度上,始终是硬件的投资力度远高于软件应用的投资开发,传统的一把抓的发展模式,[[2]]景区内重复造景建设,人物力资源的投入浪费过大,这导致流量更新速度慢,得不到有效的发展数据。同时传统方式的经营方式主要由于管理水平低、数据共享水平低等弊端,这导致目前的旅游服务业越来越不能满足旅游者的个性化、综合化的需求,也与世界范围内旅游业电子化,网络化的发展趋势相悖。因此,利用信息化对传统旅游业进行改造提升已经刻不缓,如果离开了信息化,我国旅游业将举步维艰。

剩余内容已隐藏,请支付后下载全文,论文总字数:20353字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;