移动Ad Hoc网络中Trace数据的分析与用户行为建模

 2022-10-01 08:10

论文总字数:26034字

摘 要

校园网络是高等院校最重要的信息基础设施之一,是衡量一个高等院校的信息基础建设,科研基础设施等先进水平的重要指标。近两年,我校师生使用的校园网已经由Brass转变为了覆盖学校大多地点的seu-wlan,但是,校园网的覆盖率和带宽等历史与其他问题导致校园网的24小时使用者不多,且上网地点相对集中,这对校园网的推广很不利。

鉴于今年年初开始学校进行的“seu-wlan全覆盖”工作已经进行了全面部署,且大部分AP已经安装完毕,本文对九龙湖校区的trace记录做了分析,找到热点AP与其主要使用时段,针对个人用户进行预测分析,根据此信息可以帮助得出下一步部署AP的位置和网络中心对于各时段热点AP带宽分配,主要进行的工作有:

  1. Trace数据提取。通过分析2月22日到3月16日这三周的九龙湖校区部分AP的trace日志记录,提取关键信息录入数据库,方便分析。
  2. 用户行为分析。通过录入数据库的信息,挑选一到三个典型用户进行分析,主要内容有用户一天中各时间段出现在各地点的频率。
  3. 算法分析。针对用户行为预测做的简单算法进行分析,通过实验结果分析算法好坏。

本文针对东大校园网seu-wlan的trace数据进行分析,得出简单的结论,域用户行为建模,有助于学校推广校园网的使用与其他学术性研究。

关键词:trace数据分析;行为预测;网络规划

Abstract

Campus network is one of the most important information infrastructures in Colleges and universities. It is an important index to measure the advanced level of information infrastructure and research infrastructure in a university. In the past two years, the campus network used by our teachers and students has been changed from Brass to seu-wlan, which covers most of the school’s places. However, the historical and other problems of campus network coverage and bandwidth lead to 24 hours of campus network users, and the location of the Internet is relatively concentrated, which is very harmful to the promotion of campus network.

Since the beginning of this year ,the school’s "seu-wlan full coverage" work has been carried out a comprehensive plan, and most of the AP has been installed.In this paper,the trace record of Jiulonghu campus will be analys, to find the hot AP and its main use time for individual users for predictive analysis, based on this information can help the next deployment the location of the AP and Network Center for each period of hot AP bandwidth allocation, the main work is to:

1. Trace data collection. This paper analyzes the trace log records of AP in Jiulonghu campus during the three weeks from February 22nd to March 16th, and extracts the key information into the database, which is convenient for analysis.

2. user behavior analysis. Through the input of the database information, select one to three typical users for analysis, the main content of the user's day in each period of time in the frequency of points around.

3. algorithm analysis. The simple algorithm for user behavior prediction is analyzed, and the algorithm is analyzed by experimental results.

Based on the analysis of trace data of seu-wlan in southeast university campus network, this paper draws a simple conclusion that domain user behavior modeling can help schools promote the use of campus networks and other academic research.

Keywords: trace data analysis; behavior prediction; network planning

目 录

摘 要 Ⅰ

Abstract Ⅱ

第一章 绪论 1

1.1 研究背景和意义 1

1.2 研究目标及内容 2

1.3 论文的组织结构 3

第二章 trace数据分析与聚类行为的研究现状 4

2.1 trace数据挖掘研究现状 4

2.2 聚类行为研究现状 4

2.3 本章小结 5

第三章 trace数据提取 6

3.1 trace数据提取需求分析 6

3.2 trace数据提取 9

3.2.1 原始trace数据读取模块及代码实现 10

3.2.2 原始trace数据提取模块及代码实现 10

3.2.3 原始trace数据日期转化模块及代码实现 13

3.3 数据库设计及trace数据插入 14

3.3.1 数据库需求分析 14

3.3.2 数据库选取与建表 16

3.3.3 数据库连接 17

3.3.4 数据库操作 17

3.4 本章小结 19

第四章 trace数据分析与用户行为建模 20

4.1 trace数据不同消息类型含义 20

4.2 校内热点AP分布 22

4.3 用户位置预测 24

4.3.1 一天内的活动范围预测算法 25

4.3.2 一天内24小时的活动范围预测算法 28

4.4 本章小结 31

第五章 总结与展望 32

5.1 论文整体总结 32

5.2 论文后续工作展望 32

致 谢 34

参考文献 35

第一章 绪论

1.1 研究背景和意义

2012年以来,随着互联网的飞速发展,“大数据”一词俨然成为了IT届乃至各行各业的最热门词汇,伴随着移动终端的普及以及移动通信技术的飞速发展,我们的生活越来越离不开各种各样的电子产品,诸如手机、平板等移动终端,当然,更离不开移动通信网络,根据《第39次中国互联网络发展状况统计报告》中的数据统计,截止2016年12月底,中国网民规模已达到7.31亿,互联网普及率为53.2%。这充分说明了互联网已经成为人类必不可少的一部分,并逐渐成为人类生活、学习所依赖的一部分。我们完全可以相信,随着科技的进步、移动终端和智能手机的普及,以及无线网络覆盖范围的扩大,互联网将会在现有基础上更加渗透进公众生活的方方面面,更加影响着人们的生活。

人们每天日常进行的各种活动会产生数以BP计的海量数据,其中包括每个人每天的上网记录、通讯记录、位置记录等等,以及机器本身产生大量的日志文件,这些都是数据,尤其在通讯行业飞速发展的今天,我们的每一个微小举动都会产生大量的可分析数据,那么随着2020年将要实现的5G全面商用部署,物联网的全面铺展,我们将要进入一个万物互联的时代,这势必会产生数据量指数级别的爆发式增长,因此我们已经全面进入了大数据时代,对于数据的处理与分析,已经成为现在最热门的研究课题之一,在众多的数据中有一类trace数据格外引人注目,人类对于未来的预测始终没有停下脚步,其实只要是推荐类的软件、程序、算法,都离不开各种各样的历史数据分析即使不是用的trace文件,你也可以把它们看成是不同类型的“trace”,通过预测人的位置可以得到好多有用的信息,尤其是适合商家与运营商联手,拿到客户的原始漫游记录做各种各样的商业推广,这些都是trace数据挖掘与分析的结果,因此对于trace数据的分析及用户行为的建模是非常有必要的。

剩余内容已隐藏,请支付后下载全文,论文总字数:26034字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;