基于SVM的图像分类

 2022-01-17 11:01

论文总字数:18173字

目 录

1 绪论 1

1.1 研究背景和意义 1

1.2 研究现状 1

1.3 论文的主要研究工作 2

2 图像特征与机器学习算法 2

2.1 颜色特征 3

2.1.1 RGB 3

2.1.2 HSV 3

2.2 形状特征 3

2.3 纹理特征 4

2.4 机器学习算法 4

2.4.1机器学习概念 4

2.4.2 机器学习算法SVM 4

3 基于SVM的图像分类 6

3.1 传统图像分类 6

3.2 基于机器学习的图像分类 7

3.3 基于SVM与HOG对图像进行分类 7

3.3.1 方向梯度直方图介绍 7

3.3.2 HOG特征提取 8

3.3.3 SVM结合HOG对图像进行简单分类 9

4 SVM结合多特征对图像进行分类 11

4.1 基于灰度共生矩阵的纹理特征提取 12

4.2 SVM结合HOG特征与GLCM特征对图像进行分类 14

5 GUI设计 16

5.1 GUI界面整体框架 16

5.2 GUI界面程序实现 16

6 总结与展望 19

6.1 本文的工作总结 19

6.2 未来的展望 19

参考文献 21

致谢 22

基于SVM的图像分类

宋仕杰

,China

Abstract:Along with the changes of The Times and the progress of science and technology, artificial intelligence and multimedia information technology with the development of science and technology also updates faster and faster, people can through the use of the smartphone is very easy and convenient to get want to image information from the Internet. In the information age, the number of digital images on the Internet has increased tremendously. In the academic world, how to efficiently and efficiently deal with a large number of image information becomes a hot and urgent problem.

This design by image classification as the research object, using the gradient direction histogram and gray level co-occurrence matrix feature for feature extraction method, based on support vector machine (SVM) algorithm in the machine learning algorithms, classifying the image recognition, and according to the design of image classification program design graphical user interface.

Key words:Artificial intelligence;Image classification;Machine learning;Support vector machine;

1 绪论

1.1 研究背景和意义

随着科学技术的不断探索与进步,互联网技术和多媒体技术得到了前所未有的飞速发展。在这一个数据信息爆炸的时代,互联网中的声音、图像和视频等数据信息呈现出迅猛增长,并且在社交、娱乐和教育等方面具有极其广泛的应用。图像作为其中一种具有丰富内容和直观表现的媒体信息,收到人们的关注[1]。图像与传统文字相比,具有丰富的信息,图像能够轻易显示出语音或者文字无法表达的复杂场景。在现代生活中每时每刻都有大量的图像产生,如何能有效地从图像中获取有用的图像信息并且合理有效的分类,是眼下学术界和科研技术所被关注的问题。图像分类就是模式识别的过程,利用计算机定量地分析图像,将图像分为特定若干类以代替人的视觉判断。图像内容丰富多彩,因此图像分类的技术分为两大类。一是以文本为核心的图像分类,另一个是以特征为核心的图像分类。基于文本的图像分类,是将图像的名称、类别、尺寸以文本描述的形式描述图像。但这种分类方法容易被文本词汇局限性所影响,会产生前后分歧,更新较慢,不适合信息爆炸时代。基于特征的图像分类,是将图像的颜色、纹理、形状等底层特征进行分类。这些特征具有绝对客观性,不受人类的主观影响,能够真实地描述图像,所以现在的图像分类都是以特征为核心。针对图像分类问题,特征是核心,如何有效地描述、提取和应用这些特征是核心问题,因此,处理特征的分类算法的好坏直接影响图像分类的效果[2]。机器学习算法能够使计算机自身模拟或实现人的行为,相比于其他的算法具有天然的优势,通过机器学习算法进行图像分类,分类的效果无限接近人眼的分类效果,这样能够便利有效为人类提供图像的有效信息,对于解决图像数据信息爆炸的问题具有重大的理论研究价值和实际应用价值。

1.2 研究现状

近半个世纪以来,随着科学技术的不断革新,出现了贝叶斯分类、K最近邻分类、神经网络和支持向量机等智能有效的机器学习分类算法,其中神经网络分类,深受科研技术人员的喜爱。神经网络系统原理在于将一组组输入和输出单元互相连接[3],赋予每个连接一定的权值,在学习训练样本中不断调整权值,最后通过已经学习完毕的模型样本对测试样本进行预测。科研人员通过这种机器学习分类方法将分类标签和图像底层标签关联在一起,通过显著的特征进行分类,对一些复杂多样的图像具有较好的识别率。但是,神经网络分类方法在实际应用时需要设置很多的参数,而且合适的寻优方法一直是这种方法所欠缺的。最优解的获得必须通过不断的调试,工作量太大,不适用实时分类问题。

支持向量机方法(Support Vector Machine,SVM)是由Vapnik基于统计学原理提出来的一种具有极强模型泛化能力的机器学习方法[4]。因为其训练的样本数量是有限的,其作用在于从已知信息下或得最优解,其得到的解也是全局的最优解,解决了神经网络无法快速寻优的问题。支持向量机是一种建立在风险最小化基础上的新型机器学习算法,因为其超强的非线性处理能力,被广泛地应用于模式识别、数据挖掘、回归分析、智能控制以及图像处理中去,成为除神经网络系统外机器学习领域的热门研究方向,并且不断推动机器学习和数据图像处理技术的发展。

支持向量机在机器学习研究方面具有至关重要的地位,归功于其强大的非线性处理能力,而支持向量机的核函数便是分线性处理能力的核心因素,它也影响了分类面的结构,是支持向量机发展的关键点和难点。尽管对于核函数的选择以及参数的设置已经有了许多先进有效的成果,但核函数本身还有许多问题等待解决,例如核函数的评判、构造以及核参数的评判和选取问题,这些问题关系着支持向量机的发展命脉。

1.3 论文的主要研究工作

本文提出基于SVM的图像分类的算法,主要研究图像分类的原理,概念和现实应用。图像分类的核心是图像的特征和分类器的选择。将颜色,纹理和形状特征作为基础的图形特征,并利用支持向量机深入研究了方向梯度直方图特征和灰度共生矩阵特征。

接下来简单地介绍下本文的主要研究工作,内容如下:

  1. 图像特征。介绍了图像处理中常用的图像特征以及提取算法,其中颜色方面有RGB和HSV两种颜色定义空间,纹理方面有灰度共生矩阵以及提取灰度共生矩阵特征所运用到的算法,形状方面有边缘梯度特征,边缘算子,方向梯度直方图特征以及提取方向梯度直方图特征所运用到的算法;
  2. 机器学习算法。介绍了机器学习的概念,原理以及在分类系统中承担的功能与应用。众多机器学习分类算法中,选择支持向量机算法SVM作为本文研究图像分类的基础算法。具体介绍支持向量机算法的原理,优势以及算法的核函数;
  3. 图像特征和机器学习算法相结合对图像进行分类;
  4. 设计GUI界面。

2 图像特征与机器学习算法

本章始终围绕着图像分类最基本的图像特征以及机器学习算法而展开,主要介绍了图像的三个最为基础的特征。首先分析了颜色特征的模型概念和特点以及各个模型使用的限制与场合,然后综介绍了纹理特征的概念,接着介绍了形状特征,最后介绍了机器学习算法,在本文中主要运用了支持向量机SVM。

2.1 颜色特征

2.1.1 RGB

RGB颜色空间,也称红绿蓝颜色空间,是通过人眼识别而定义的颜色空间,也是最为直接和接近于现实的,可通过红绿蓝不同比例的调和表示出绝大多数的颜色。然而,RGB颜色空间中的细节不能通过计算机的数字化程序进行调整,所以不适合在科学研究中使用。RGB颜色空间中的红、绿、蓝分量与图像的亮度有着密不可分的关系,只要亮度有改变,图像的红绿蓝的比例也会相应的改变,从而引起图像的失真。所以,RGB颜色空间主要适用于图像的显示,不适用于图像处理。

2.1.2 HSV

HSV颜色空间,也称色调、饱和度、亮度联合空间,是借助颜色直观特性所定义的颜色空间。因其三个分量在三维空间坐标系中呈现的形状为六角椎体,所以HSV也被成为六角椎体颜色空间。这个模型中颜色的参数分别为色调(H),饱和度(S),亮度(V)。这三者的取值范围如下:

色调H:用角度度量。取值角度为0度至360度;

饱和度S:取值度数为0.0至1.0;

亮度V:取值畛域为0.0(黑色)至1.0(白色)。

由于HSV模型坐标系间的欧式距离和颜色之间感觉距离呈正相关,因此该模型在许多实际应用系统中得到了广泛的应用。

2.2 形状特征

形状特征在是人类感知事物的第一特征,其表示的是事物的形状,大小和分布情况,是人类认识事物的基础,也是图像分类中必不可少的特征,它主要承担着匹配相似图像的作用。形状特征主要描述的是图像的轮廓和边缘细节,边缘细节是核心,因此形状特征的关键问题是对边缘细节的描述,检测与提取。按照目前的科学技术的发展,我们有能够比较有效完美地从二维空间中检测和提取边缘细节的算法,但是由于算法难以在三维空间的复杂程度中进行,所以目前从三维空间提取边缘细节仍然是一个需要研究的重点。

目前,人们习惯运用各种不同的算子去检测图像的边缘细节,例如Roberts算子、Prewitt算子和Laplacian-Gauss算子等,这些算子根据自己的原理对图像进行分割,检测,但最后的结果都是提取图像的边缘特征。

剩余内容已隐藏,请支付后下载全文,论文总字数:18173字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;