关联规则分析在交通流预测中的应用

 2022-01-17 11:01

论文总字数:26430字

目 录

1绪论 1

1.1交通流预测应用背景 1

1.2交通流预测研究现状 1

1.3交通流预测方法提出 2

1.4主要研究内容 3

2数据挖掘技术 3

2.1数据挖掘的定义 3

2.2数据挖掘的步骤 4

2.3数据挖掘的方法 5

2.3.1 分类 5

2.3.2 回归分析 5

2.3.3 聚类 5

2.3.4 关联规则 5

2.3.5 特征 6

2.3.6 变化和偏差分析 6

2.3.7 Web页挖掘 6

3关联规则挖掘的研究 6

3.1关联规则的定义 6

3.2关联规则挖掘的步骤 7

3.3经典的关联规则算法Apriori 8

3.3.1算法设计思想 8

3.3.2算法描述 9

4关联分析在交通流预测中的应用 10

4.1 获得原始数据 10

4.2 数据预处理 10

4.3 关联规则求解 12

4.4 比较分析 16

5关联规则分析在交通流预测中的实现 17

5.1总体结构设计 17

5.2功能模块设计 18

5.2.1局部道路网模型 18

5.2.2数据生成和预处理模块 18

5.2.3数据导入模块 19

5.2.4关联规则挖掘模块 19

5.3实验及结果分析 20

5.3.1数据源 20

5.3.2执行步骤 21

5.3.3测试结果 21

5.3.4测试结果分析 22

5.3.5做出决策 24

6总结与展望 24

参考文献 25

致谢 26

关联规则分析在交通流预测中的应用

吴海鑫

,China

Abstract: The pace of life is accelerating in today’s society, people have put forward higher and higher requirements for convenient and efficient transportation system. In the local area, especially during the peak hours, serious traffic congestion and even traffic accidents occur frequently. Although in terms of data collection, people have been able to collect massive traffic flow information by using mature database technology, but they just obtain the surface information. Only by extracting the useful information from the massive data, can we forecast the trend of the traffic flow effectively, data mining technology meets the need of people exactly. In this paper, we use association rule analysis, which is the classic data mining method, to analyze the driving path of the vehicle in the urban road network, and then obtain the strong association rule. At last, we can find busy road sections. The results of the survey can not only make the participants of the traffic system easy to know the traffic conditions ahead of time, achieve path guidance and reduce travel time, but also provide feasible reference comments for the managers of the traffic system.

Key words: data mining; association rules; support; confidence

1 绪论

1.1交通流预测应用背景

伴随国民经济持续高速的发展及我国城市化步伐的不断加紧,道路交通难题愈发恶化,交通拥堵、交通事故等负面影响日益凸显。运用了多种先进科技的智能交通系统(Intelligent Transportation System , ITS)[1]成为了本世纪交通运输系统发展的方向,被当作如今处理交通问题最行之有效的方法之一。先进交通管理系统(Advanced Traffic Management System,ATMS)可以说是ITS中重要的应用领域,已经成为各个国家道路交通管理发展的必然趋势。

交通管理系统自身就是一个对象不确定、在管理的实时性方面要求高、结构相当复杂的巨系统。伴随交通事业的智能化,先进交通管理系统中通过使用先进的自动数据产生和采集工具获得的交通数据急剧增加且十分丰富;传统中由行人、车辆、道路和环境组成的交通体系因为海量交通信息的介入,变得更加复杂。

众所周知,在现代社会的交通行为发生期间,不论是具体实施者、参加者,亦或整个体系的组织、治理和监管者;不论在交通行为发生前,亦或交通行为实施过程中,乃至交通行为结束后均需要交通信息的支持。我们可以通过调查了解过去的交通情况,而对未来交通情况的预知则需通过预测方法来获得[2]。因为交通信息本身具备随时间和空间变化的动态特征,为使ATMS的作用能够充分发挥,要求ATMS提供实时、准确的信息辅助人们做出科学决策。如果能找出一套有效预测交通流变化的方法,及时有效的预测各类交通数据中隐含的交通特性,将会使交通行为具体执行者、参与者乃至整个交通体系的组织者、治理者和监管者从中受益,使交通系统真正意义上智能起来。

在城市中,道路网在交叉路口处的延迟是诱发交通堵塞的其中一个关键因素。要实现先进交通管理系统,使得系统真正意义上智能起来,不仅需要实时道路检测数据,更关键的是,要将运用各类检测设备取得的实时信息通过各种预测方式和模型转变为可靠、实时、精确的预测信息,令系统完全发挥出科学现代的管理指挥调度功能。

1.2交通流预测研究现状

交通流预测为ITS实现对交通信号实时监控、交通配置、自主导航、路线引导、事故测验等功能的条件,所以交通流预测是ITS的研究热点。交通流预测指的是通过建模的方式利用已经获取的若干道路数据对之后数分钟内的交通情形进行滚动预测,这称做短期预测。交通流预测的模型分为对道路行驶流量、事故的预测和对叉路口流量的预测[3]

早期的预测方式主要包括:滑动平均模型、自回归模型及自回归滑动平均模型等。伴随分析研究愈加成熟,提出了各种精准度更好的方式[4]。总体来说,可分成两大类:一类是建立在微积分变换和数理统筹这类传统数理知识上的模型;一类是将神经网络、模拟技术、模糊控制这类现代科技和手段作为主要的研究方式的模型,其特征是采取的方式及模型不追寻苛刻的公式推理以及准确的物理定义,而更关注对实际道路交通流现状模拟整合出来的效果。第一类包括参数回归模型(Parametric Regressive Model)、时间序列模型(Time-Series Model)、卡尔曼滤波模型(Kalman Filtering Model)、指数平滑模型(Exponential Smoothing Model)等;第二类包括非参数回归模型(Nonparametric Regressive Model)、谱分析法(Spectral Basis Analysis)、基于小波理论的方法、KARIMA算法、及各类和神经网络(Neural Network)有关的复合预测模型等。

鉴于道路体系具备非固定性、非线性和复杂性这类根本特性,很多无模型预测算法被运用到对短时交通流的预测里并获取了良好的成效。此外,这几年的研究结果显示,结合上下游交通流关联的因果分析法常常比简单的基于时间序列的方法更加可以满足短时间内交通预测的特征,因此对短时间内流量的预测将会以无模型的因果分析方式为趋向[5]。与此同时,各种组合预测模型如:有模型算法跟无模型算法进行组合,神经网络理论跟模糊理论、小波理论等方法进行组合,也必将获取更广阔的应用前景。

1.3交通流预测方法提出

在我国,针对ATMS进行研究开发并投入使用开展的比较迟。在数据收集领域,采集道路数据的方式和技术已经取得了非常大的进步。例如,北京目前在固定探测器数据收集方面进展顺利,据悉,在交通主道路和高速公路上距离500至600米就安装固定探测器来实时获取信息,获取的方法有视频、车牌辨识、环形图测验、超声波测验等。尽管数据采集技术基本达到世界先进水平,但是数据处理能力仍然较弱,并且很难做深层次应用,这就是我国在交通流预测方面辅助决策能力弱的症结所在。如今,由于交通堵塞成排车辆停在道路两旁的现象屡见不鲜,这严重影响了城市的运行效率,滞缓了整个社会成长发展的进程。想解决当前的处境,数据挖掘体系中提出的各类方法能够发挥作用。

数据挖掘也叫做从数据库里发现知识(Knowledge Discovery in Database,简称KDD),它是从海量、不完整、模糊、随机出现、含噪音的现实应用数据里,提炼出隐藏在里面的、事先不为人所知、却潜在具有价值的知识和规律的过程[6]。数据挖掘方法的提出有效的实现了自主、智能化的将大量采集的数据变成有价值的知识,在数据和知识的鸿沟间构建了一条简捷的通道。数据挖掘的任务包括很多种,最常见的有分类(Classification)、聚类(Clustering)、关联规则挖掘(Association Rule Mining)以及序列模式挖掘(Sequential Pattern Mining)。由于关联规则挖掘在商业信息研究、因特网数据关联研究、医疗数据分析等领域有相当关键的影响,因此成为了近年来流行的研究方向。

R.Agrawal等人于上世纪九十年代设计的Apriori算法带领了国际上众多学者研究关联分析的热情,自此,越来越多的科学家专注于关联规则分析,希望寻找相比现有算法更加高效率的挖掘算法。经过他们的不懈努力,关联规则算法已经很大程度的优化和完善且能够投入到实际应用中去。Savasere等人在逻辑上对数据库进行划分实现了对算法的改进,首先对每一块划分后的数据进行挖掘,其次将每块数据挖掘出的结果合并便可得到最终结果,这样就把原本复杂的问题简单化了;Park等人设计了在散列表的基础上生成频繁项集的挖掘算法,从而降低了研究大量数据时的难度;Motwani等人提出了网络搜索引擎即将面对的各类挑战,将关联规则算法研究更进一步的拓展到搜索引擎的应用中,这个概念的提出是关联规则发展史上的重大突破。此外,有些学者专注于杂凑表技术的探究即使用Hash表储存数据,如卢云彬等人在Hash表的基础上就挖掘算法设计了完善方案,该算法使用递归的组合方式获取最终频繁项集,从而得出最终规则以期在需要做重大决定时能提供有说服力的理论支撑;还有学者就Partition算法进行了深层次的探究,该算法以关联规则挖掘经典算法Apriori为根本,通过把数据库分割成多个不交叉的数据块提升算法运行期间的效率。

剩余内容已隐藏,请支付后下载全文,论文总字数:26430字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;