基于四元数的彩色图像分类系统的设计与实现

 2022-01-17 11:01

论文总字数:25238字

目 录

1. 引言 1

2. 相关研究与技术 2

2.1 四元数 2

2.2 PCA、PCANet与QPCANet 3

2.2.1 PCA 3

2.2.2 PCANet 4

2.2.3 QPCANet 6

2.3 支持向量机(SVM) 7

2.4 Matlab介绍 8

3. 系统设计与实现 8

3.1 运行环境 8

3.2 系统结构 9

3.2.1 加载图像库 9

3.2.2 设置QPCANet结构及参数 10

3.2.3 学习训练数据模型 12

3.2.4 对测试数据分类 12

3.2.5 显示分类结果 12

4. 系统测试 14

4.1 测试数据集介绍 14

4.1.1 加州理工学院101数据集 14

4.1.2 UC Merced土地利用数据集 14

4.2 分类性能测试 15

4.2.1 过滤器数量的影响 15

4.2.2 过滤器块大小的影响 16

4.2.3 重叠块区域比率的影响 16

4.2.4 类别数量的影响 17

4.3 分类器对分类结果的影响 18

4.4 与其他系统的对比 18

5. 结论与展望 19

参考文献 20

附录 21

致谢 25

  1. 引言

当前社会,计算机视觉的研究的飞速的进步,大数据的出现及广泛应用,越来越多的信息出现在我们生活的方方面面。照相设备的改进及普及,导致人们拍照越来越方便,越来越多的人喜欢用图像来记录信息、传递信息、保存信息,于是手机、数码相机、各个软件上的截图工具等的使用越来越广泛,数字图像的产生、存储、访问和传输的次数急剧增加,伴随着大量的图像的出现而形成了巨大的图像数据库,那么怎样将这些图片中包含的信息做提取和分析已逐渐化为人们眼前急需处理的问题。

对图片进行分类逐渐变成了图像信息分析的热门的钻研领域,是钻研计算机视觉的首要问题之一,也是事物的识别与定位、图像分割等更高的计算机视觉研究的根本,是近些年人们对图像信息处理研究的热点和重点。

图像分类的研究成果也应用在人们生活的方方面面,比如交通领域的行人识别、互联网领域的图像的批量检索和相册自动分类和车辆统计及安防领域的异常信息监测等各个领域。它的研究成果的普及,逐渐提升了人们的生活质量,它将会在以后的科技发展上发挥举足轻重的作用。

现在利用视觉语义做分类的操作变成异常热门的钻研方面。不仅是因为它需要识别的图片种类复杂,还有对于每一个图像,同一类别的图像也会由于许多因素的影响而导致很大的区别,如光照变化、不匹配不对齐、距离长度、拍摄视角的不同、其他物体的遮掩等外在条件。这些变量的不同使得图片内容受到干扰,使得对图像做分类的操作显得更加艰难。

针对这些影响因素,研究者做了许多的工作,发明了针对各种类型图像库的特征提取算法来处理这些影响变量的干扰。现在对图片做分类操作的研究已经有了很多的成果并形成了相应的算法,首先是对图片做提取特征的操作,特征提取一般分为手动提取特征信息和从大量数据中学习感兴趣的特征信息两种方式,不同的提取特征算法对处理不同的图像内容有不同的影响,其次是学习训练的过程,利用大量的训练数据集去使用一种学习方法来学习一个分类器,分类器也有多种,在学习后便可以使用分类器对测试集进行分类来验证准确率,而类别的多少及类内数据的大小也对准确率有相应的影响。

由于对大型的图像数据集进行标注需要花费大量的时间,往往用户会没有足够的耐心和精力来完成整个样本图像数据集的标注,其次,对于复杂且难以理解的图像,对于普通用户来说内容判断较难,需要借助专用设备或相应领域的有经验的专家来完成,这使得手动提取特征算法的标注拥有极大的制约性[1]。

当前从图像数据中训练提取主要的特征这类算法的出现,变成解决了手动提取特征算法的制约性的一种途径,经由卷积神经网络(CNN)来做获取特征的操作是近些年来人们着重研究的一种提取特征的经典算法。深度学习的实现原理是:首先经由形成多层网络结构的操作,将图像数据做多层的表示。然后经由高层次的特征展现图片的潜在信息,以获取较为准确的分类准确度。一个CNN结构大多由多层训练结构以及分类器两部分组成,在多层训练结构中每一层都可以再分为卷积层、处理层以及采样层三个子层。我们要想学习得到一个准确度高、性能好的卷积神经分类网络,还需要进行多次的调整参数才能实现。

四元数主成分分析网络是一种属于CNN的结构。本文是以四元数矩阵的形式作为彩色图像的输入对其进行主成分分析网络算法达到图片分类的目的,作为利用深度学习的主成分分析网络算法对于图片的分类拥有较好的准确度,但是其对彩色图片的每个彩色通道之间的空间分布信息不能做到充分有效的利用,而四元数被认为是表示彩色图像和旋转操作的强大数学工具,这样以四元数矩阵的形式作为彩色图像的输入,它保留了彩色图片的内在结构以及R,G,B之间的空间关系。于是我们采用了用四元数来表示彩色图片的每个像素来更好的利用每个彩色通道之间的空间关系,形成新的算法-四元数主成分分析网络算法(QPCANet),使图像分类得到更好的准确率,拥有更好的性能。

  1. 相关研究与技术

当前图像分类算法的基本步骤为:图像特征提取、训练图像数据形成模型、对测试图像分类,它们之间的差异在其采用是提取特征算法的不同与选择的分类器不同形成的,而常用的特征提取算法分为手动提取特征信息的算法和从数据中学习提取感兴趣的特征信息的算法两种方式。

手动提取特征信息的算法利用次数较高的是Gabor特征。 它们均在不同类型的图像分类任务中取得了很大的成功,如对象识别,纹理分类和人脸识别。 然而,这种方法的局限性是显而易见的,因为人们需要在对新的图像做分类的任务时手动选择合适的特征,这通常需要人们学习图像内容的专业知识或有相关专业经验的专家学者,因此这类算法具有很大的制约性。

而后一种深度学习方法,近年来已变为研究者非常活跃的钻研领域。深度学习的目标是通过多层次的体系结构从数据中提取内在特征,希望更高层次的特征代表更加简洁的数据语义。目前人们已经提出了很多方法来构建深度学习架构,大致可以分为四类:基于概率模型的深度学习架构、基于重构算法的深度学习体系结构、基于流形学习算法的深度学习架构、基于多层神经网络的深度学习体系结构。

人们使用的分类器也有很多种,利用次数较高的分类器是有支持向量机、K近邻法,还有神经网络、随机森林、提升方法等多种分类器。

目前,大多数上述特征提取算法(SIFT,LBP,PCANet,LDANet等)仅仅是针对灰度图像分类而设计的,在简单地应用于彩色图像分类时会遇到很多问题,如性能退化,维度灾难等等。 于是出现了一种针对彩色图片的分类算法,即四元数主分量分析网络(QPCANet),它是一种基于四元数的深度学习体系结构,它将PCANet方法从实域拓展到四元域。相比较其他算法,该算法可以更好地保留图像中的色彩之间空间关系,对彩色图像的分类拥有较好的分类准确性。

    1. 四元数

四元数是早期的研究学者哈密顿在1843 年提出的一种新颖的数学概念[2]。他最初试图将复数扩展到更高维次,却意外地创造了四元数,由于其提出的乘法不能做交换律的运算规则,所以它的计算法则没有遵守数学计算中的基本规则[3]。后来向量的出现使四元数的作用逐渐降低,但Shoemake提出以四元数的形式来作为彩色图片的输入,当对图片做处理时,能够使图像的潜在信息较好的保存,使的四元数在图像处理方面获得了较好的成果。

四元数p是由一个实数部a和一个向量组成[4],即可以定义为;其中a、b、c、d为实数,i、j、k是符合以下规则的三个虚构单位:。

剩余内容已隐藏,请支付后下载全文,论文总字数:25238字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;