基于深度学习的散乱点聚类与多边形自动成图 - 以广州城中村为例

 2022-07-25 10:07

论文总字数:33394字

摘 要

人工地物是城市空间地理信息库中的一个重要组成部分,准确地掌握人工地物的几何特征信息,对数字城市的建设具有重要意义。本文以广州城中村为例,研究建筑物群体散乱点自动聚类、建筑物单体散乱点自动成图等关键技术,主要完成了以下几方面的工作:

(1) 构建了基于广州城中村地籍数据的多边形散乱点数据集。利用GDAL/OGR库读取shp格式文件,获取多边形顶点数据,并对其进行数据增量处理,构建了多边形散乱点数据集,解决了神经网络训练样本不足的问题。

(2) 开发了基于广州城中村的散乱点聚类算法。研究其人工地物地理特征,根据广州城中村路宽普遍小于房宽的特性,设计出用道路分割建筑的算法,实现了简单建筑物散乱点的自动聚类。

(3) 建立了基于深度学习的人工地物散乱点自动成图(即多边形自动成图)模型。以Pointer Network为基础,构建深度学习模型,并在本文构建的多边形散乱点数据集上进行实验,探讨在不同质量、数量的训练样本以及不同隐层节点数条件下,深度学习模型的性能。最终在凹多边形自动恢复任务上,模型取得56.44%的准确率。

关键词:建筑物,散乱点聚类,多边形自动成图,深度学习

Abstract

Artificial features are an important part of the urban spatial geographic information database. Accurately grasping the geometric features of artificial features is of great significance to the construction of digital cities. Taking the city village in Guangzhou as an example, studying the clustering algorithm of scattered points of the building group and the automatic mapping of the scattered points of the single building, the following work has been completed:

(1) Polygon scattered point datasets based on Guangzhou City Village cadastral data are constructed. By using the GDAL/ORG library to read the file(.shp), the polygon vertex data is acquired, and the data is processed to increase the number of samples, constructing a polygonal scattered point data set, which solves the problem that the neural network training sample is insufficient.

(2) An automatic clustering algorithm based on the scattered data of city village in Guangzhou is developed. Studying the geographical features of artificial features, based on the characteristics of city village in Guangzhou that generally road’s width is smaller than the width of houses, an algorithm that using roads divide buildings is designed, achieving the automatic clustering of simple buildings’ scattered points.

(3) A deep learning model for automatic mapping of artificial features scattered points (polygon automatic mapping) is established. Based on the Pointer Network, the deep learning model is designed, and the model is experimented on the above mentioned polygonal scattered point data set. Through experiments, the model’s performance is tested respectively with different quality and quantity of training samples and different hidden layer nodes. Finally, the model achieved an accuracy of 56.44% on the automatic concave polygon recovery task.

KEY WORDS: buildings, scattered points clustering, polygon automatic mapping, deep learning

目 录

摘 要 I

Abstract II

第一章 绪论 1

1.1 课题研究背景及意义 1

1.2 国内外研究现状 1

1.2.1 空间聚类算法 1

1.2.2 多边形自动成图算法 2

1.3 深度学习概述 3

1.4 本文主要研究内容 4

第二章 LSTM神经网络综述 5

2.1 LSTM神经网络 5

2.1.1 RNN介绍 5

2.1.2 LSTM介绍 6

2.2 基于LSTM的Sequence to sequence模型 9

2.2.1 Encoder-Decoder框架介绍 9

2.2.2 基于LSTM的Seq2seq模型介绍 9

2.3 结合attention的基于LSTM的Seq2seq模型 10

第三章 基于广州城中村的多边形散乱点数据集构建 13

3.1 Shapefile文件介绍 13

3.2 GDAL/OGR库介绍 13

3.3 建筑物散乱点数据自动提取算法 13

3.3.1 读取shp格式文件的程序设计 14

3.3.2 训练样本筛选 15

3.3.3 数据增量处理 16

第四章 基于广州城中村的散乱点聚类算法设计 17

4.1 广州城中村建筑物特征介绍 17

4.2 聚类算法设计 18

4.3 实验设计与结果 23

4.3.1 实验环境 23

4.3.2 实验结果 23

第五章 基于深度学习的多边形自动成图模型的构建 25

5.1 模型概述 25

5.2 Pointer Network模型 25

5.3 实验设计与结果分析 26

5.3.1 实验环境 26

5.3.2 数据预处理 26

5.3.3 参数设置 27

5.3.4 实验结果与分析 27

第六章 总结与展望 32

6.1 工作总结 32

6.2 未来展望 32

致 谢 34

参考文献 35

绪论

课题研究背景及意义

1998年1月31日,美国前副总统艾伯特· 戈尔在演讲中提出了“数字地球”[1](Digital Earth)的概念,迅速得到了各国的政府部门与相关研究人员的高度重视。“数字地球”,顾名思义,就是通过数字的方式将地球上的一切信息、活动记录下来,形成对外开放流通的系统。

近年来,了解地球发展变化、研究人类社会如何能够健康、可持续发展已经成为当今人们关注的重要问题,而“数字地球”的实现可以记录地球上方方面面的变化,借助于计算机,能够充分利用“数字地球”,通过对其进行建模、仿真、分析,能够对全球变化的规律有一定了解,为人们应对全球变化与社会可持续发展问题提供有力的技术支持。

剩余内容已隐藏,请支付后下载全文,论文总字数:33394字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;