道路性能数据预处理研究

 2022-02-11 07:02

论文总字数:28976字

摘 要

道路性能数据对于道路的维修养护决策非常重要,这就要求有足够精确的数据来分析路面的状况。然而在测量过程中,因为仪器原因,天气原因等等,采集的数据当中部分并不精确,同时由于观测工作者的疏忽使得有一些重要的数据缺失。是以怎么样处理道路性能数据的缺失值问题就成为一项首要的研究课题。在各种各样的缺失原因下,利用相异的处理缺失数据的方法对道路性能的分析以及道路的维修养护都有很重要的影响。

目前国内外的缺失数据的插补方法大致可分成两个类别:确定性单一插补方法和随机插补方法。本文首先借助于现代统计手段即统计学软件spss,着重探讨EM法、回归法、均值填补法和成组删除法、多重填充方法对缺失数据加以处理的推断机理与效果。然后利用数学领域内系统的统计推断方法--贝叶斯理论,贝叶斯理论预测缺失数据值的概率分布,并根据不同的策略来补全缺失数据,确定合适的缺失值恢复方法。

最后,选择连霍高速,盐靖高速,宁杭高速三个路段的各个测度变量关系作实证分析,分析比较不同填充方法的填充效果,分别采取文中介绍的方法对各缺失数据集加以处理,并从参数均值及其标准误差等方面进行分析对照。

实验结果表明, 回归填充和EM算法这两种算法在不同缺失率的情况下相比较而言都是稳定的。在缺失率为5%和10%的时候两者模拟的结果较类似,因此以10%作为临界点将其归为缺失率较低的情况,在这情况下分层均值填充法有着一定的优势。而在缺失率适中以及较高的情况中即缺失率高于10%的缺失情形下,多重填充方法有着较大的发展空间,虽然与未预期的理想效果相比还有一定的距离,但是就结果而言还是能够接受的。

关键词:缺失值 道路性能 单一插补 多重填充 贝叶斯模拟

Pretreatment of Road Performance Data

Abstract

Road performance data has an important effect on the decision of the repairment and maintenance, so it requires accurate enough data to analyze the condition of the road surface. However, due to the factors like instrument, weather and so on, part of the data collected were not accurate in the process of measurement. At the same time, due to the negligence of observers, some important data is lost. So how to deal with the issue of road missing performance data has become an important research topic. According to different reasons, In the absence of different reasons, the use of different methods of handling missing data on road performance analysis and repair and maintenance of roads has a very significant impact.

Currently, missing data interpolation method at home and abroad can be broadly divided into two categories: deterministic single imputation method and random imputation method. Firstly, I use modern statistical methods namely statistical software spss. This article focuses on EM method, regression method, mean imputation method, group delete method and multiple filling method to infer missing data. Then use statistical inference methods in the field of mathematics – Bayesian. Bayesian predicts probability distribution of the missing data. And complement missing data according to different strategies, determine the appropriate recovery method.

Finally, select each measure variable relationship of Lian-Huo Expressway, Yan-Jing Expressway, Nanjing-Hangzhou Expressway as empirical analysis. Analyze and compare different filling method of filling effect, then use the method described by the paper to process each missing data, and from the parameter mean and standard error, standard deviation, estimated value aspect and the true value of the degree of deviation and the sample distribution were analyzed and compared.

The results showed that the regression and EM algorithm are relatively stable in the case of different deletion rates. When missing rate is 5%,the result is as same as 10%.When missing rate is less than 10%, mean imputation method has certain advantages, and in the moderate and high missing rate case that is higher than 10%, multiple filling method has a larger space for development, although it cannot be compared with the expected desired effect, in terms of results, but is still acceptable.

KEY WORDS: missing values road performance single imputation multiple filling Bayesian simulation

目录

摘要 I

Abstract II

第1章 绪论 1

1.1 研究背景和意义 1

1.2 研究目的 2

1.3 国内外研究概况 2

1.3.1 国内研究状况 2

1.3.2 国外研究状况 3

1.4 本文的思路与组织结构 4

第2章 缺失值分类 5

2.1 缺失值产生的原因 5

2.2 缺失值分类 5

2.2.1 缺失机制 5

2.2.2 缺失模式 6

第3章 常见缺失值处理方法的理论基础 8

3.1 删除法 8

3.2 数据填充 8

3.2.1 单值填充 9

3.2.2 多重填充 12

第4章 实证分析 16

4.1 资料来源 16

4.2 原始数据分析 19

4.3 不同缺失率数据集参数估计效果对比 19

4.4 小结 24

第5章 总结与展望 25

致谢 27

参考文献 28

绪论

研究背景和意义

道路性能的观点最早在20世纪60年代由美国各州公路与运输工作者协会(AASHTO)首先提出。定义是路面为了维持公路运输车辆正常安全行驶所应该具有的性能和能力。对道路路面的使用性能加以分析思考,是进行路面使用性能评价和预测工作的条件,同样也是做出高速公路路面养护管理决策的依据。道路性能一般分为功能、安全、结构性、结构承载力还有外观等等,相应的指标有平整度、横向系数、路面破坏、路面弯沉、反光、炫目、能见度等指标。当量累计轴次(ESAL)是根据等效弯沉或等效拉应力的原则,把不一样车型和不一样轴载作用次数换算为与标准轴载100KN相对应的轴载作用次数。车辙(Rutting)是指车辆在路面上行驶后留下的车轮永远痕迹。平整度(IRI)指的是路的表面纵向的凹凸量的偏差值。横向力系数(SFC)为了正确地衡量汽车在圆曲线上行驶时的平稳、安全和惬意程度,利用横向力与竖向力的商值,称作横向力系数。

道路性能数据对于维修养护决策非常重要,这就要求我们要有足够精确的数据来分析路面的状况。但是众所周知,在测量过程中,大体上主要有交通因素、路面特征因素、气候因素、工程因素等等,采集的数据部分当中并不准确,同时由于观测人员的疏忽使得有一些重要的数据丢失。

剩余内容已隐藏,请支付后下载全文,论文总字数:28976字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;