基于深度强化学习的声呐图像目标识别技术研究

 2022-05-21 10:05

论文总字数:32351字

摘 要

声呐图像广泛应用于海洋科学、海洋工程、水下目标检测与识别等领域。通过对声呐图像的研究,我们能获得水下目标的一系列信息,进而针对目标物完成特定的研究。在声呐图像的研究中,水下目标物的检测和定位是其重点和难点。传统的物体图像分类和识别算法难以满足图像在处理效率、性能和智能化等方面所提出的要求。

在本文中我们将利用改进后的Faster R-CNN模型进行目标的识别工作。在Faster R-CNN模型中,首先需要对图片的特征进行提取,一般情况下是利用迁移学习的理论,用分类性能良好的卷积神经网络完成这一工作。通常情况下,为了能够充分提取图像的特征,这一卷积神经网络都比较深。在本文中,我们利用强化学习算法,在声呐图像数据集上自动构建表现良好的卷积神经网络,然后用这一较浅的网络替换原有的深层网络,以提高目标识别算法的运行速度,更好地完成实时性任务。在实验中我们用七层的卷积神经网络和VGG16模型做了对比,结果显示,我们比较浅的网络在提高了算法运行速度的同时,准确率也能媲美采用VGG16的Faster R-CNN模型。

关键词:声呐图像,目标检测,强化学习,Faster R-CNN

Abstract

Sonar images are widely used in marine science, marine engineering, underwater target detection and identification and other fields. Through the study of sonar image, we can obtain a series of information of underwater target, and then complete the specific research for the target object. In the research of sonar image, the detection and location of underwater target is its key and difficult point. The traditional object image classification and recognition algorithm is difficult to meet the requirements of image processing efficiency, performance and intelligence.

In this paper, we will use the improved Faster R-CNN model to identify the target. In the Faster R-CNN model, the characteristics of the picture need to be extracted first, in general, the theory of migration learning is used to complete this work with convolution neural networks with good classification performance. Usually, in order to fully extract the characteristics of the image, this convolution neural network is relatively deep. In this paper, we use the Enhanced learning algorithm to automatically build a well-performing convolution neural network on the sonar image dataset, and then replace the original deep network with this shallow network, so as to improve the running speed of the target recognition algorithm and better accomplish the real-time task. In the experiment, we compared the seven-layer convolution neural network with the VGG16 model, and the results show that while our shallow network improves the running speed of the algorithm, the accuracy ratio can be comparable to the Faster R-CNN model using VGG16.

KEY WORDS: Sonar images, Target detection, Reinforcement learning, Faster R-CNN

目录

第一章 绪论 2

1.1引言 2

1.2背景 2

1.3相关工作 2

1.4本文工作 2

第二章 卷积神经网络 2

2.1卷积神经网络组成 2

2.2.卷积神经网络反向传播算法 2

2.3.卷积神经网络训练过程 2

2.4.权值初始化 2

第三章 残差网络和Faster R-CNN 2

3.1残差网络 2

3.1.1退化问题 2

3.1.2残差学习 2

3.3.3残差单元 2

3.2 Faster R-CNN 2

3.2.1Faster R-CNN组成 2

3.2.2RPN损失函数 2

第四章 强化学习 2

4.1马尔可夫决策过程 2

4.2强化学习表示 2

4.3Q-Learning算法 2

4.4 -greedy策略 2

第五章 采用Q-LEARNING算法构建神经网络结构 2

5.1 状态空间 2

5.2动作空间 2

5.3神经网络表示 2

第六章 实验 2

6.1构建卷积神经网络 2

6.1.1数据预处理 2

6.1.2训练过程 2

6.1.3实验结果 2

6.2Faster R-CNN 2

6.2.1数据预处理 2

6.2.2训练过程 2

6.2.3实验结果 2

第八章 总结和展望 2

参考文献 2

致 谢 2

附 录 2

A. 由Q-Learning算法选择的最佳模型 2

B. 声呐图像目标识别结果 2

第一章 绪论

1.1引言

在目标检测算法Faster R-CNN中,首先需要利用卷积神经网络提取图片的特征,通常情况下,这一卷积神经网络会选择在其他数据集上表现良好的经典网络。在本文中,我们将会利用强化学习算法在声呐图像数据集上构建一个分类性能良好的卷积神经网络来代替经典神经网络,以取得更好的表现性能和运行速度。

深度卷积神经网络(Convolutional Neural Network,CNN)已经在机器学习的很多问题上取得了巨大的成功。一个典型的卷积神经网络结构由数个卷积层、池化层和全连接层组成。在构建CNN时,网络设计者必须做出许多设计决策:每种类型层的数量,层之间的顺序,以及每种类型层的超参数,例如,感受野的大小,步长和每个卷积层中感受野的数量。可能的选择数量使得CNN架构的设计空间非常大,因此无法进行详尽的手动搜索。尽管有一些自动或计算机辅助神经网络的设计工作,但新的卷积神经网络架构或网络组成部分仍主要由研究人员从实验中获得的新理论见解或直觉来推动发展。

剩余内容已隐藏,请支付后下载全文,论文总字数:32351字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;