基于感兴趣区域的图像检索技术研究

 2022-01-17 11:01

论文总字数:17648字

目 录

摘要 I

Abstract II

一、引言 1

1.1 研究背景及意义 1

1.2 本文主要研究内容及技术路线 1

1.2.1主要研究内容 1

1.2.2技术路线 1

二、相关技术研究 3

2.1 图像处理的目的 3

2.2 数字图像相关知识 3

2.2.1 数字图像的数学模型 3

2.2.2 图像分辨率 3

2.2.3 数字图像的存储方式 4

2.3 边缘检测技术 5

2.3.1 概述 5

2.3.2坎尼边缘检测 5

2.4 形态学处理技术 7

2.4.1 形态学处理的目的 7

2.4.2 形态学处理常用技术 8

2.5 图像特征提取 9

2.5.1 颜色特征 9

2.5.1纹理特征 10

三、感兴趣区域提取及多特征融合的图像检索算法 12

3.1 算法流程 12

3.2 图像预处理 13

3.3 特征融合与相似性度量算法 13

3.4 性能评估方法 14

四、实验及结果分析 16

4.1 实验环境设置 16

4.2 实验数据集 16

4.3 实验结果 17

4.3.1 Canny边缘提取结果 17

4.3.2 感兴趣区域提取结果 17

4.3.3 HSV特征检索结果 17

4.3.4 Tamura特征检索结果 18

4.3.5 HSV和Tamura融合特征检索结果 19

4.4 分析 20

4.4.1 HSV、Tamura特征的查准率、查全率和平均检索时间 20

4.4.2 融合特征在不同权值下的查准率、查全率和平均检索时间 21

4.4.3 对比分析 21

五、总结与展望 22

参考文献 23

致谢 23

基于感兴趣区域的图像检索技术

高志宽

,China

Abstract: In the rapid development of information technology, the traditional text based image retrieval technology has been difficult to adapt to the huge image data, and the content based image retrieval technology has become a hot spot of research. In the image content, the redundant information of the background image greatly affects the accuracy of the image retrieval. In view of this problem, an image retrieval technique based on the region of interest is proposed. First, the edge detection is used to detect the main contour of the image, and then the region of interest is extracted by morphological processing, and the HSV color feature Tamura texture feature fusion is extracted as the feature vector. Finally, the standard Euclidean distance between the fused features is computed, and the images near the distance are defined as similar images. The experiment of image retrieval on Corel-1000 image data set shows that the region of interest extracted by this method is more consistent with human vision, and has high precision and recall rate in image retrieval.

Keywords: Region of interest; Multi-feature fusion; Image retrieval; Tamura; HSV

一、引言

1.1 研究背景及意义

随着信息技术与互联网技术等高新技术的快速发展,各种形式的数据浩如烟海,世界著名咨询公司-麦肯锡曾称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”人们挖掘、处理与运用海量数据,必然会给生产、科研、医疗和军事等领域带来巨大的价值。

数字图像是信息的数据表现形式之一。近年来,由于社交媒体与智能设备的兴起与高速发展,人们无时无刻不在互联网上制造、传播海量的图像、视频信息。此外,卫星遥感图像、天气图像、医疗影像等也是重要的数字图像来源,有效地存储及检索数字图像是关键性的技术。

早在上世纪七八十年代,人们就开始研究如何有效管理数字图像数据,其主要是采用基于文本的图像检索技术,即人工对图片文件标注文本关键词,并附加一些相关信息,然后在图片文件名与关键词建立映射关系,将映射关系存储在计算机中。用户检索图像时,需要输入关键词,在数据库查询映射结果。在图片文件数量小的情况下,这种方法比较容易建立数据库,而且用户输入准确的关键词,就会得到精确的查询结果。但是,文本信息具有抽象性,大多数情况下一个关键词会有多义性,无法准确查询。另外,图片包含了许多信息,几个关键词不足以描述整幅图。在信息爆炸的时代,对于海量的图像数据,人工标注不仅耗费大量的人力,而且会丢失数据信息的及时性,已经无法满足人们对图像信息检索的需求。因此,基于内容的图像检索技术更符合人们的需要,成为了研究的热点[1]

与传统的检索方法不同,基于内容的图像检索根据图像的内容进行检索,利用图像处理技术,通过提取图像的特征信息、压缩图像、对图像重编码等进行图像之间的比对。检索时,用户只需输入需要查询的图像,系统将返回相似的图像,实现“以图查图”。

基于内容的图像检索技术对当代的生产生活都有着重要的意义。对于网上冲浪者来说,他们可以在互联网上查询一张图片的来源及相似图片;在医学领域,医生可以对病人的医学影像进行检索类似病例;在气象领域,可以检索识别天气图,实现智能预报;公安人员在追查嫌疑人时也可以利用图像检索技术提高办案效率。

1.2 本文主要研究内容及技术路线

1.2.1主要研究内容

本文以基于内容的图像检索技术为基本框架,重点研究如何提取感兴趣区域、提取图像的特征向量、融合多特征、寻找相似性度量方法、如何提高图像检索的查全率与查准率。后续章节内容如下:

第二章 介绍图像处理的基础知识以及相关技术,包括数字图像的相关概念、Matlab中图像的存储形式、边缘检测技术、形态学处理技术和特征提取技术。这些技术是后续章节中所用到的关键技术。

第三章 提出感兴趣区域提取和多特征融合算法,利用边缘检测技术和形态学处理去除背景冗余信息,提取感兴趣区域。最后提取显著图的多种特征进行融合。定义了相似性度量方法和性能评估方法。

第四章 在Corel-1000图像数据集上进行实验,给出实验结果,分析算法的可行性。

第五章 总结研究心得,分析算法的优缺点,提出新的工作方向。

1.2.2技术路线

颜色特征

纹理特征

颜色特征

纹理特征

感兴趣图像

特征数据库

结果序列

多特征融合

输入图像

边缘检测

形态学处理

二值图像

图像库

边缘检测

形态学处理

二值图像

感兴趣图像

特征提取

图像检索

图1.1 技术路线图

二、相关技术研究

2.1 图像处理的目的

(1)图像增强:以主观形式提高图像的视觉质量,例如突出图像的某些特征以区分不同类别的图像。

(2)特征提取:将数字图像的某些信息提取出来,如轮廓、纹理和颜色等,提取的信息和特征通常用一个向量表示,称作特征向量。

(3)图像压缩:对数字图像的元素进行数学变换、重新编码等,使存储和传输图片更加方便快捷。

(4)图像恢复:以客观的方式改善图像,例如减少图像模糊以使图像更加清晰[2]

2.2 数字图像相关知识

2.2.1 数字图像的数学模型

数字图像各个像素点之间是离散的,通常用离散的二元函数来表示。其中二维变量是空间坐标,任一点坐标处的函数值为数字图像在该点处的亮度,而且二元关系的值域是离散且有界的。因此,可以用一个二维数组来表示一幅数字图像,数组中每个元素就是像素。

数字图像的数学模型如下:

其中,通常情况下都为2的正整数次幂(,为正整数)

2.2.2 图像分辨率

剩余内容已隐藏,请支付后下载全文,论文总字数:17648字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;