基于离散余弦变换的图像压缩技术研究

 2024-01-23 09:01

论文总字数:13970字

摘 要

离散余弦变换是近几年研发的数学工具, 数字图像在经过离散余弦变换之后,它在时域、频域均有了较好的局部化的特性,重建图像能够克服运用离散余弦变换编码而产生的方块效应,并和人类的视觉特性保持一致。论文主要研究的是基于离散余弦变换的图像压缩算法:重点研究离散余弦算法的基本的原理和实现的步骤,在运用MATLAB软件进行算法仿真的同时,利用MATLAB形象地设计出图形用户界面,从而形象直观的看到了图像压缩前后的鲜明的对比,最终取得了理想的效果。

关键词:图像的压缩,离散余弦变换,MATLAB仿真

Abstract: The discrete cosine transform (DCT) is a rising mathematical tool. When an image is transformed by the discrete cosine transform, it has local characteristic in both time-domain and frequency-region. And the rebuilt image can overcame the connatural diamonds affection of the discrete cosine transform. Furthermore, it is identical to Human Visual System. This paper is mainly about the image compression algorithm based on MATLAB. The paper discusses the basic principles and implementation steps of image DCT transform technique. And the algorithm is simulated by MATLAB. At the same time, we can use MATLAB program design the graphical user interface vividly, so that we can see the sharp differences between the former and last images. Eventually, we achieve better results.

Keywords:Image compression, Discrete Cosine Transform, Simulation by MATLAB

目 录

1 绪论 4

1.1论文研究背景 4

1.2图像的压缩技术的发展 4

1.3离散余弦变换及其在图象压缩中的应用 4

1.4论文的结构安排 4

2 图像压缩的基本原理 5

2.1图象压缩效果的评价标准 5

2.1.1客观评价标准 5

2.1.2主观评价标准 5

2.2图像压缩技术标准 6

2.3图像压缩的分类 7

2.4图像压缩处理技术的基本理论 8

2.4.1图像压缩的基本原理 8

2.4.2图像压缩的基本模型 9

3 离散余弦变换的MATLAB实现 10

3.1 MATLAB图像处理工具箱 10

3.2有关离散余弦变换的定义 10

3.3离散余弦变换的基本原理与算法 10

3.3.1离散余弦变换的基本原理 10

3.3.2离散余弦变换算法 11

3.4离散余弦算法的实现 12

4 离散余弦变换的界面实现 13

4.1 图形用户界面简介 13

4.2 界面设计的MATLAB实现 13

4.2.1界面设计总体概述 13

4.2.2 界面设计具体实现 13

5 运行结果显示及分析 14

5.1离散余弦变换的算法实现 14

5.2离散余弦变换的界面实现 14

5.3设计过程中的疑难及改进 16

结 论 17

致 谢 19

附 录 20

1 绪论

1.1论文研究背景

近几年,图像信息以相当迅猛的速度发展,大大推动了多媒体技术、数码技术等产品的发展。随着图像采集设备的分辨率不断提高,每张图像占据的存储空间也在不断地变大,巨大的存储量将增加存储器、计算机处理的压力。为解决以上的问题,要对图像进行数据压缩的处理。本文采用对数字图像进行压缩编码的方法,这样做的就是要以尽量少的bit来表示图像,并且还可保持重建图像的质量。

1.2图像的压缩技术的发展

图像编码技术,从1950开始,由电视信号的数字化逐渐发展而来。图像压缩有两代:传统的和新型的。比如量化法、预测编码、等都是传统型的编码。但是,伴随着人民对传统方法的深层次应用,传统方法的缺点渐渐被人们发现:正交的变换数据,它的频局域性会很差,变换过的系数,原始图像的结构的精细描述丢失了,所以从变换过的图像里面,没有办法得到原始图像轮廓的信息。当压缩比较高时,图像的轮廓会非常模糊。随着图像压缩技术的发展,离散余弦变换成为时下的热点,并且取得了令人满意的结果。现如今,离散余弦变换技术,已经被联合图像专家组定为JPEG2000的核心技术[1]

1.3离散余弦变换及其在图象压缩中的应用

离散余弦变换( Discrete Cosine Transform),简写为DCT, 它类似于离散傅里叶变换( Discrete Fourier Transform),简写为DFT, 但它只使用实数。DCT的长度大概是DFT的两倍。

在信号和图像的处理时会经常使用到离散余弦变换,比如,在JPEG和MPEG的各个标准中均运用了DCT,我们可以得到一个8×8的矩阵。其中元素 (0,0)就是直流分量,其他的元素根据各自的位置来表征不同频率的交流分类[2]

1.4论文的结构安排

本文的主要内容大致如下:

第一章主要写的是论文的背景意义;第二章主要写了图象压缩技术的基本理论知识;第三章主要写的是DCT的MATLAB软件的实现;第四章主要写的是基于DCT的图像用户界面;第五章介绍了利用DCT的算法实现和界面实现的运行结果,总结出设计过程中的疑难及改进;最后是对全文的总结,提出改进的方向。

2 图像压缩的基本原理

数字图像实质上是一个个像素点,可以用不同维的数字来表示。由于照相技术的迅猛发展,不断提高了图像的尺寸、分辨率,使得图像需要更大的存储空间。当存储或传输时,会占用很大的存储空间和网络带宽,所以图像压缩就尤为重要[3]

2.1图象压缩效果的评价标准

对图像进行压缩,必然会引入失真。我们要做的就是在不影响重建图像质量的前提下达到降低压缩比,以此来提高编码效率。这就需要引入一定的失真的测度来评价重新建设图像的质量。重建图像的评价标准有客观评价标准和主观评价标准[1]

2.1.1客观评价标准

客观评价方法是把压缩图像和原始图像对比,得到误差,误差是来衡量压缩质量的关键,我们用I=f(i,j)来表示原始图像, i=l,2,…M;j=1,2,…N,处理后的图像为I’=f’(i,j),i=1,2,…M;j=1,2,…N,可以用下列指标进行评价:

  1. 均方误差

(2.1)

(2)对数信噪比

(2.2)

(3)峰值信噪比

(2.3)

2.1.2主观评价标准

主观评价就是以人作为图像的观察者,对同一幅图像进行评价。此处主要采用的是加权平均法,组织10人的观察组,观察者们按图像的损伤程度打出分数,用加权平均法得到图像的分数,这样的评分方法虽然会耗费时间,但会非常真实。

下表列出一个5级的主观评价标准的尺度。

表2.1主观评价方法尺度

图像的质量

评分

评价的尺度

图像非常好

5分

图像的质量没有变坏

图像很好

4分

图像的质量变坏,但不妨碍观看

图像一般

3分

图像的质量变坏,而且妨碍观看

图像较差

2分

图像的观看受到较大影响

图像非常差

1分

图像损伤严重,基本上不可以看

2.2图像压缩技术标准

随着图像压缩技术的发展,信息传输和交换需要统一的国际标准。部分图像编码的国际标准的名称、目标和内容如下所示[4]

(1) H.261建议

H.261是“p×64kbit/s(p的值域为1~30)”,合它有关的是 i×64kbit/s和j×354kbit/s两类码率。它应用在可视电话和会议电视方面,不过分要求图像的质量。

(2) JPEG2000标准

JPEG2000是把JPEG的顺序、渐进、无损和分层集成在一个标准中,有优秀的压缩性能和有丰富的处理能力。

(3) MPEG-1标准

MPEG是Moving Pictuer Experts Group的简称,它是活动专家组的第一阶段成果,制定于1992年。MPEG-1可以用作视频、音频和软件实现等。

(4)MPEG-2标准

MPEG-2标准的全称是Generie Coding of Moving Pictures and Assoeiated Audio Information,中文名称为“活动图像及其伴音信息的通用编码(标准)”,制定于1994年。MPEG-2包括系统、视频、音频和测试,与MPEG-1是后向兼容的,但不是MPEG-1的简单升级。

(5) H.263建议

它是国际电联的一个标准草案,主要面向低码率的多媒体通信,由于多媒体通信在低码率下实现更困难,它采用了多种先进技术来降低码率,提供各种业务,后来又相继推出了H.263 和H.263 。

(6) MPEG-4

MPEG-4的主要应用在交互式的多媒体方面基于内容的码流操作和编辑,具有高效的压缩算法。

2.3图像压缩的分类

从信号系统的角度看,数据的压缩就是通过对原信号进行某种变换,使得信号的表达更为经济,存储传输更方便。图像压缩的效果好坏,用三个指标来衡量:一是压缩比,二是压缩算法,三是恢复效果。

数字图像数据压缩可分为两大类:无损压缩和有损压缩。

无损压缩:首先是去相关其次是编码冗余压缩。过程是可逆的,拥有较高的压缩比,属于信息保持型数据压缩。

有损压缩:利用人类的视觉特性有针对性地简化不必要的数据,过程是不可逆的,压缩比较低。下面简要介绍几种压缩编码方法[5]

(1) 变换编码:信号经过某种函数变换,然后再进行采样编码,这样可以消除空间冗余和时间冗余。K-L变换、DFT变换、DCT变换、WHT变换均属于变换编码。

(2) 统计编码:主要用于对无记忆信源进行压缩,这些信源是由相互独立、无相关性的消息序列构成的。Huffman编码、Shannon-Fano编码、算术编码均属于这类编码。

(3) 模型编码:基于模型的方法,对需要传输的图像进行参数估测。它可以消除结构冗余和知识冗余,分形编码属于这类编码方法。

下图是按数据域分类的主要压缩的方法[6]

图2.1 主要的压缩方法

2.4图像压缩处理技术的基本理论

2.4.1图像压缩的基本原理

图像压缩的目的是在达到一定图像质量的标准下,尽量用较少的比特数来表示出原始图像,以此来提高图像传输的效率和减少图像所占的存储空间,以上过程在信息论中称为信源编码[7]

  假设有信源,由它产生的消息是{ai},其中1≤i≤N,且出现的概率是知道的,记之为P(ai),那么对它的信息量的定义是:

(2.5)

我们可以发现消息出现的可能性越小,则它所包含的信息量就会越多,这样对信息就越有用,如果出现的可能性越大,对信息的作用就越小[7]

我们把信源的平均信息量称为“熵”:

(2.6)

我们把2.6取以2为底的对数,单位bits:

(2.7)

最大压缩比为:

剩余内容已隐藏,请支付后下载全文,论文总字数:13970字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;