针对医学图像的重压缩检测技术研究

 2022-01-17 11:01

论文总字数:24478字

目 录

1引言 1

1.1 研究的背景和意义 1

1.2 国内外研究现状 1

1.3 论文的主要工作 1

2 JPEG的压缩与解压缩原理 1

2.1 JPEG的压缩过程 1

2.2 JPEG的解压缩过程 5

3误差分析与特征提取 5

3.1 JPEG压缩与解压缩中的误差 5

3.2 基于误差块的分析 6

3.3 特征提取 9

4支持向量机 10

4.1 支持向量机简介 10

4.2 线性可分 10

4.3 线性不可分 11

4.4 SVM的使用步骤 13

5实验与创新 13

5.1 同步重压缩检测 13

5.2 异步重压缩检测 14

5.3 结果分析 15

6总结 18

参考文献: 19

致谢 21

针对医学图像的重压缩检测技术研究

宋相博

,China

Abstract:With the continuous improvement of the medical level, more and more medical images are being used, and forensic techniques for preventing malicious alteration of medical images become more and more important. This paper chooses an effective error-based statistical feature detection method for the recompression of medical images to solve this problem. First, a given JPEG medical image is decompressed to form a reconstructed image, and then an inverse discrete cosine transform is performed on the reconstructed image. The error image is obtained by computing the difference between the coefficient after the inverse discrete cosine transform of the reconstructed image and the coefficient after the former rounding or truncation operation. Two types of error blocks in the error image are analyzed, namely a round-off error block and a truncated error block, and then a set of features are statistically calculated to represent the difference between single or double compression of the medical image. Finally, a support vector machine classifier is used to identify whether a given medical image has been doubly compressed or not.

Key words:medical image,image forensics,double JPEG compression

1.引言

1.1 研究的背景和意义

在医疗诊断中,医学图像扮演着越来越重要的角色,越来越完善的医学成像技术凸显出医学图像在未来临床诊断中更加重要的地位。随着医学图像的存取、传输、管理以及定量评价都带来极大的便利,医学图像的数量会以几何倍数增长,在存储如此多的医学图像情况下就不得不对医学图像进行压缩。众所周知,JPEG是一种广泛被认可的图像压缩格式,因此,对于JPEG格式存储的医学图像的取证问题近来越来越受到关注。为了防止医学图像在存储和传输过程中被恶意篡改致使有人从中非法牟利,我们需要对现有的医学图像进行防伪重压缩检测,来防止这种情况的发生。

1.2 国内外研究现状

为了解决医学图像的重压缩问题,我们不得不先对JPEG重压缩的问题进行介绍,目前已经提出了一些用于检测JPEG重压缩压缩的方法。例如,在图像拼接的情况下,假设来自源JPEG图像的区域被复制到目标图像并且所得到的复合图像被重新压缩,则通过检测复合图像中的区域的JPEG重压缩区域可以揭示拼接的存在。我们可以将JPEG重压缩分成两类,如果两次压缩的质量因子相同我们称之为同步压缩,如果不同我们称之为异步压缩。对于同步压缩,为了检测具有不同量化矩阵的同步JPEG压缩,已经有人提出了一些成功的方法,国外学者Lukas和Fridrich提出通过探索来自各个模式的JPEG系数直方图(即量化的离散余弦变换系数)中称为“双峰”或“缺失值”的统计赝像来检测图像是否被重压缩[2]。国外学者Popescu和Farid提出通过傅里叶变换来检测,通过观察JPEG系数直方图的潜在周期性伪像,以检测JPEG的重压缩[3]。目前也有通过JPEG交流(AC)系数的首位数字的分布遵循广义的本福特定律来区分单次和双次JPEG压缩图像[4]。通过将广义的本福特定律应用于某些特定的单独AC模式,可以进一步提高检测双JPEG压缩的可能性[5]。国外学者Pevný和Fridrich提出使用低频JPEG系数的直方图模式作为特征来对单个和双重JPEG压缩图像进行区分[6]。国内有研究者利用从各种方向差分JPEG二维阵列导出的转移概率矩阵来检测JPEG的重压缩[7]

1.3 论文的主要工作

本篇论文通过介绍JPEG的压缩与解压缩原理,分析JPEG在压缩与解压缩过程中产生的误差,通过对误差的分类和解析,利用误差来提取出压缩不同次数所产生的不同特征,共有13个特征值,再通过支持向量机的原理分别对医学图像的同步和异步重压缩进行检测。

2. JPEG的压缩与解压缩原理

2.1 JPEG的压缩过程

随着互联网的发展,我们正处于一个信息爆炸的时代,图像正是信息携带的主要媒介之一,如何通过有限的带宽让数以万计的图片在网络上传播,我们不得不对图像进行压缩。图像压缩的重要性很多人没有直观的体会,举个例子,一张未经压缩过的普通800×800大小的图片,占用空间为1.7M左右, 但这足以存放一部92万字的《红楼梦》。现在网络上大部分的图像都是JPEG格式,JPEG文件能够达到1/8的压缩比。JPEG格式之所以能够达到这么高的压缩比是因为JPEG压缩技术能够舍去不重要的部分而留下重要的部分,这就是我们常说的有损压缩。例如浮点数100000.1000000001,其中000000001就属于不重要的部分,对整体的影响很小就可以舍去。JPEG压缩技术也利用了这个原理,它的基本思路就是:

(1)区分图像中重要和不重要的部分;

(2)舍去不重要的部分;

(3)保存剩余部分;

JPEG压缩的主要过程[7]有以下四个步骤:

(1)预处理

JPEG采用的是YUV的颜色空间,其中Y代表亮度,U代表色度(Cb), V代表饱和度(Cr),一幅彩色图像需要从RGB的色彩模式转换到YUV的色彩模式。

(2)离散余弦变换 [8]

离散余弦变换是JPEG压缩的核心算法,它是傅里叶变换的一种,即任何周期性的函数,都可以分解为为一系列的三角函数的组合。如图1所示,红色的矩形波是由后面多个正弦波叠加而成,而右边坐标轴表示矩形波的频率图像,它表示矩形波在频率域的分布。当我们处理的对象不是函数,而是一组离散的数据,且这些数组是对称的话,那么傅里叶变化出来的函数只有余弦项,我们称之为离散余弦变换。

图1 波形的叠加

为了更方便地对图像进行处理,我们将图像每一个划分成8×8像素的图像块,将每一个像素值从无符号整数转换为有符号整数使其关于零点对称(即从[0,255]转换成[-128,127])再对每一个图像块进行二维离散余弦变换。变换公式如下:

,

2-1

每一个8×8的图像块经过DCT变换会得到DCT变换系数矩阵。我们用u,v分别代表系数矩阵以左上角为原点的横纵坐标。当u=0,v=0时,,即8×8矩阵左上角的系数,被称为直流(direct-current,DC)系数,它代表了原来64个数字的均值;其余63个系数则被称为交流(alternating-current,AC)系数,交流分量大多是一些接近于0的正负浮点数,它们代表了水平空间频率和垂直空间频率分量的大小。经过DCT变换后的8×8的系数矩阵中,低频分量集中在矩阵的左上角,高频分量则集中在右下角。

(3)量化(Quantization)[9]

DCT变换后的数据仍然是可逆的,也就是说还没对图像进行有损压缩,我们接下来进行的量化就是前文提到的舍去图像中不重要信息的步骤,这是JPEG压缩中主要能量损失的一步。量化步骤为下:

2-2

其中为DCT变换后的矩阵,为量化矩阵,round函数为取整函数,但与计算机编程中的取整不同,要求四舍五入,如式2-3中所示取整规则。

表1 标准亮度量化表

表2 标准色差量化表

2-3

表1和表2分别为标准亮度量化表和标准色差量化表,有上文可知DCT操作后的变换矩阵中每一个系数都代表了不同频率的分量,这两个表是根据人眼对不同频率的敏感程度积累的经验制定的。其中左上角的数字偏小,右下角的数字偏大。这是因为经过DCT操作后,高频分量集中在右下角,低频分量集中在左上角,而人眼对高频分量不敏感,所以在量化的过程中高频分量大都会变成0,确保尽可能的舍去人眼不敏感的高频分量。

在实际的操作中,我们可以对量化表加以改变,通过对量化表系数以不同大小的百分比增大,这样使得更多的分量变成0,以此来控制图片的压缩质量,我们称这个百分比为质量因子(Quality Factor,QF)。在JPEG压缩中通过以下准则(2-4)来控制图像的压缩质量:

2-4

通过量化后的矩阵需要重新排序,这里需要按照zigzag的形式重新排序,如表3中所示的顺序,按照这种方法排序是为了接下来的编码做铺垫,就是把量化后的二维矩阵变成一个一维数组,让系数为0的量尽量放在一起,由于量化后0大都存在于右下角,所以采用从左上角到右下角的顺序。

剩余内容已隐藏,请支付后下载全文,论文总字数:24478字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;