基于卷积神经网络的脑MR图像分割方法研究与应用

 2022-01-17 11:01

论文总字数:13257字

目 录

1.引言 1

2.卷积神经网络 2

2.1 卷积神经网络 2

2.2 卷积层 2

2.3 池化层 3

2.4 激活函数 4

2.5 分割原理 6

2.6 实验结果 6

2.7 结果分析 7

3.全卷积神经网络 7

3.1 全卷积神经网络 7

3.2 改造原理 7

3.3 Upsampling 8

4. U-net 9

4.1 网络结构 9

4.2 实验结果 10

4.3 结果分析 11

5.结论 11

参考文献 12

致谢 13

基于卷积神经网络的脑MR图像分割方法研究与应用

陆召许

)

Abstract: It is easy to obtain the clear images of the brain by using MRI ,its segmented images are widely used in medical research and clinical diagnosis to help doctors accurately identify diseased tissues and normal tissues. However, it is difficult to achieve the desired results with the conventional image segmentation methods because of the noise and bias field during the imaging process . In now days, convolutional neural networks are widely used in MR image segmentation due to its obvious anti-noise effect and ease of solving the problem of image non-uniformity. In this paper, we use the full convolutional neural network to reduces the complexity of the training process, reduce the segmentation time and improve the segmentation accuracy, so that a better segmentation result can be obtained.

Key words:Magnetic Resonance Image; Image Segmentation; Convolutional Neural Network; Fully Convolutional Networks

1.引言

我国为了控制人口于1978年大规模实行计划生育政策。时至今日,该政策使得老龄化人口在我国总人口中的比重逐年提升。而随着老龄化人口的增多,与老年人相关的问题也越来越多,比如老年人的身体健康问题。因为身体器官的衰老造成抵抗力下降,老年人极其容易患病。在我国,老年人最容易患的疾病就是肿瘤。其中,由于大脑的特殊结构和非同寻常的重要性,在脑部的肿瘤既不容易发现又不容易治疗。尤其是诊断方面,由于老年人的脑萎缩和肿瘤起病的多样化,一般很难检测,所以要经常借助于医疗影像技术进行诊断。其中,核磁共振成像[1](MRI)由于能够多方位成像,对软组织有较好的识别力,特别是对人体无害等优点,被广泛的运用于特别是老年人的脑部疾病诊断和分析上。其产生的脑部解剖成像,能有效的帮助医生辨别脑部的各类组织,从而提高诊断的准确率。

目前情况对图像分割[2]的方法有很多,有基于PDE框架下的方法如[3],[4]等等。基于PDE方法可建立连续的图像模型,能直接处理一些常见的几何特征,简化了图像分割的难度,并且水平集方法能有效地规避图像变化带来的拓扑结构问题,极大地提高了分割的精度。但是也正由于此类方法利用水平集方法解模型中的方程,这使得其分割速度变慢,分割时间过长。还有基于边缘检测的分割算法如Sobel梯度算子,高斯拉普拉斯算子(Log算子)等等。此类方法中较知名的高斯拉普拉斯算子有计算方法简单,边缘检测速度快等优点,但在实际操作过程中,该算子在抑制噪声的同时会使得图像中各部分的边缘更加的模糊。还有基于图像灰度分布的阈值法[5],聚类算法[6]等等,这些分割方法各有各的优点和缺点,然而脑核磁共振图像由于设备噪声,偏移场效应等影响,成像图片往往有模糊和不均匀等特性,这使得传统的图像分割方法往往不能得到较为理想的结果。

脑核磁共振图像中的噪声是主要是由成像设备等因素造成,它使得图像中脑组织的边界部分差异较小,给图像的处理带来困难。最早在对脑MR图像进行分割时,采用活动轮廓模型,利用目标的边缘信息进行确定边界,以达到抗噪效果。但在噪声较强的情况下,这种方法分割效果会大大下降,后来研究者又提出了许多改进方法,比如高斯混合模型中引入空间信息来减轻噪声的影响。脑核磁共振图像中的另一个干扰因素—偏移场主要是由设备中射频线圈发出的信号受到干扰,脑组织的容积效应等因素造成。为此,许多研究者从不同方向提出了许多解决办法,如最早的FCM[7][8]缓解容积效应造成的偏移场影响,其改进方法[9][10]加入了不同的模型以耦合FCM区域中感兴趣的信息,进一步减轻了图像偏移场的影响。还有基于模糊聚类技术的 CLIC(coherent local intensity clustering) 算法[11]等等。上述这些图像分割算法大都是针对噪声或者偏移场单独一个方面做出改善,并不能两者兼顾。并且当噪声和偏移场强度增大时,这些方法的改善效果迅速降低,分割效果极不理想。

基于深度学习框架下的方法具有易于引入信息解决噪声和图像不均匀问题等优势,因此成为当前分割脑MR图像的热点方法之一。深度学习框架下的模型有很多,有用于图像识别卷积神经网络(CNN),用于语音识别以及文本处理的递归神经网络(RNN),深度置信神经网络(DBN)等等。因为卷积神经网络模型简单有效,易于理解,所以本文选择了卷积神经网络模型用来对脑核磁共振图像进行分割。

2.卷积神经网络

2.1 卷积神经网络

卷积神经网络是人工神经网络中一种常见的深度学习架构, 其理念来源于Hubel和Wiesel在研究猫脑视觉皮层时发现的特殊的层级神经网络结构。在对这种结构深入研究后, Fukushima 于1980年提出了一种用于视觉识别的神经网络—Neocognitron ,不久之后LeCun等人在此基础上提出卷积神经网络的概念,不久之后又设计了一种多层人工神经网络模型取名为LeNet-5,由此奠定了现代的卷积神经网络结构。该模型主要有三大层,后来的卷积神经网络都是对不同层进行改进,但组成部分均与此结构大致相同。图1是LeCun教授在论文[12]中提出的LeNet-5的模型结构:

图1. LeNet-5网络结构示意图

其中INPUT为输入层,在此层中网络对原始图像做归一化处理,即使得原始图像符合卷积神经网络对输入图片大小的要求。OUTPUT为输出层,CNN在此层输出结果。余下部分即为隐藏层,其中包括卷积层(Convolutions),子采样层(Subsampling)或称为池化层(pooling),全连接层(Full connection)。在隐藏层中,先是卷积层与子采样层交替分布实现对图像的特征提取和分类,最后由卷积方程式组成的全连接层将子采样的层中的特征图矩阵展开为一维矩阵以全连接的方式传递给输出层。

2.2 卷积层

卷积层是由多张代表不同特征的特征图(Feature Map)构成,特征图由神经元组成,每个神经元的值由卷积核(权重矩阵)与输入层上的数据窗口(即与卷积核相同大小的矩阵)内积后加偏置,经激活函数激活所得,此过程即称为卷积操作。为了实现对整个输入层的特征提取,数据窗口必须在图像上移动,每次移动的像素级别的距离称为步长。有时候为了提取边界像素的特征,会用零元素来填充该像素周围缺失的像素,当步长为1,此时卷积得到特征图的大小与输入层图像相等。当不进行填充时,设输入图像矩阵为R大小为,卷积核矩阵J大小为,偏置为,激活函数为S(),则其卷积后所得特征图F的大小为:

(1)

卷积计算为:

(2)

其中表示卷积核矩阵中第i行,j列的元素,表示数据窗口矩阵中第i行,j列的元素,表示特征图中卷积后对应位置的元素。

图2是一次无零元素填充的卷积过程,其中步长为1,卷积核大小为J,:

图2. 卷积过程示意图

在卷积过程中,特征图中的每个神经元的值均由输入层的局部区域卷积而来,这就是卷积神经网络中的局部感知机制。同时同一张特征图的卷积核相同,每次卷积改变的是输入层图像中的不同区域,这就是所谓的权重共享。权重共享机制大大降低了各层之间的连接,既降低了过度拟合的风险又简化了模型的复杂程度。

2.3 池化层

卷积层之后紧跟着的就是池化层,它同样由多张特征图构成,此时特征图代表的特征是由浅层特征组合而成的更深层次的特征,组合的过程就是池化操作。卷积神经网络通过池化操作降低了特征图的维数和分辨率,并使得图像在特征具有空间不变性。池化方法有很多,最常用的方法是平均池化和最大池化。文献[13]详细研究了这两种池化方法的优缺点和适用情况。设卷积特征图矩阵为F大小为,池化核矩阵C大小为,偏置为,池化之后所得特征图为T,则两种池化结果如下:

平均池化: (3)

最大池化: (4)

图3是两种池化方法的对同一图像的处理结果,其中池化核大小为,步长为2。

剩余内容已隐藏,请支付后下载全文,论文总字数:13257字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;