图像信息隐藏技术要点.docx
《图像信息隐藏技术要点.docx》由会员分享,可在线阅读,更多相关《图像信息隐藏技术要点.docx(18页珍藏版)》请在冰点文库上搜索。
![图像信息隐藏技术要点.docx](https://file1.bingdoc.com/fileroot1/2023-7/5/c3abde93-d631-4c1b-857a-04cd43b47051/c3abde93-d631-4c1b-857a-04cd43b470511.gif)
图像信息隐藏技术要点
学院名称:
电子与信息工程学院
专业:
计算机科学与技术
班级:
软件09-1
姓名:
章小丽学号***********
*********
定稿日期:
2012年12月31日
图像信息隐藏
一、摘要
信息隐藏技术使用的载体有图像、视频、语音及文本等数字媒体,包括数字隐写与隐写分析两个方面的内容,本文以使用最为广泛的数字图像作为研究对象,以基于数字图像的隐写方法作为研究内容。
文章介绍了信息隐藏技术的基本知识和图像信息隐藏的常用算法,像信息隐藏技术,并且运用MATLAB7.0进行大量的实验测试,对该方法的性能进行检验分析,表明该方法具有一定的优点。
二、关键词:
数字图像信息隐藏
三、背景及研究意义
二十世纪九十年代以来,网络信息技术在全世界范围内得到了迅猛发展,它极大地方便了人们之间的通信和交流。
借助于计算机网络所提供的强大的多媒体通信功能,人们可以方便、快速地将数字信息(数字音乐、图像、影视等方面的作品)传到世界各地,一份电子邮件可以在瞬息问传遍全球。
但同时计算机网络也成为犯罪集团、非法组织和有恶意的个人利用的工具。
从恶意传播计算机病毒,到非法入侵要害部门信息系统,窃取重要机密甚至使系统瘫痪;从计算机金融犯罪,到利用表面无害的多媒体资料传递隐蔽的有害信息等等,对计算机信息系统进行恶意攻击的手段可谓层出不穷。
因此,在全球联网的形势下,网络信息安全非常重要,一个国家信息系统的失控和崩溃将导致整个国家经济瘫痪,进而影响到国家安全。
密码技术是信息安全技术领域的主要传统技术之一,由于加密技术的局限性,最近十几年以来,一种新的信息安全技术——信息隐藏技术(InformationHiding)迅速地发展起来。
将机密信息嵌入到公开的图像、视频、语音及文本文件等载体信息中,然后通过公开信息的传输来传递机密信息。
信息隐藏技术的研究在信息安全领域中具有重要的地位,它对于军事、情报、国家安全方面的重要意义不言而喻。
它包括了数字隐写与隐写分析两个方面。
一方面要以尽可能隐蔽的方式将信息深藏于浩如烟海的数字多媒体信号中,毫不引起对方的怀疑而达到隐蔽通信的目的;另一方则要以各种手段检测可疑信息的存在,寻找敌对隐蔽通信的信源,阻断隐蔽通信的信道。
设计高度安全的隐写方法是一项富于挑战性的课题,而对隐写的准确性分析往往比隐写本身更加困难。
数字隐写与隐写分析的交互发展正方兴未艾,成为互联网时代信息战技术的一个新课题。
信息网络上的攻防技术水平将反映一个国家的科技水平和防范意识。
四、正文
4.1信息隐藏技术的基本原理
信息隐藏技术通常使用文字、图像、声音及视频等作为载体,信息之所以能够隐藏在多媒体数据中,主要是利用了多媒体信息的时间或空间冗余性和人对信息变化的掩蔽效应。
(1)多媒体信息本身存在很大的冗余性,从信息论的角度看,未压缩的多媒体信息的编码效率是很低的,所以将某些信息嵌入到多媒体信息中进行秘密传送是完全可行的,并不会影响多媒体信息本身的传送和使用。
(2)人的视觉或听觉感官系统对某些信息都有一定的掩蔽效应。
在亮度有变化的边缘上,该边界“掩蔽”了边缘邻近像素的信号感觉,使人的感觉变得不灵敏、不准确,这就是视觉掩蔽效应。
通常人眼对灰度的分辨率只有几十个灰度级,对边缘附近的信息不敏感。
利用这些特点,可以很好地将信息隐藏而不被觉察。
4.1.1信息隐藏技术的实现
信息隐藏是把一个有意义的信息隐藏在另一个称为载体的普通信息中得到隐密载体,然后通过普通信息的传输来传递秘密信息。
如图1所示。
非法者不知道这个普通信息中是否隐藏了其他的信息,而且即使知道,也难以提取隐藏的信息。
载体S
信息M信息隐藏载体S’
图1信息隐藏示意图
4.1.2信息隐藏技术的属于和模型
一个信息隐藏系统的一般化模型可用图2表示。
我们称待隐藏的信息为秘密信息(secretmessage),它可以是版权信息或秘密数据,也可以是一个序列号;称公开信息为载体信息(covermessage),这种信息隐藏过程一般由密钥(Key)来控制,通过嵌入算法(Embeddingalgorithm)将秘密信息隐藏于公开信息中形成隐蔽载体(stegocover),隐蔽载体则通过信道(Communicationchannel)传递,然后检测器(Detector)利用密钥从隐蔽载体中恢复/检测秘密信息
嵌入密钥提取密钥
掩体对象
嵌入对象隐藏对象嵌入对象
掩体对象隐藏分析者
图2信息隐藏系统的一般模型
该系统主要包括一个嵌入过程和一个提取过程,其中嵌入过程是指信息隐藏者利用嵌入算法,将秘密信息添加到掩体对象中,从而生成隐藏对象这一过程。
隐藏对象在传输过程中可能被隐藏分析者截获并进行处理。
提取过程是指利用提取算法从接收到的、可能经过修改的隐藏对象中恢复秘密信息,提取过程中可能需要掩体对象的参与,也可能不需要,通常前者称为非盲提取,后者称为盲提取。
该模型中没有包括对秘密信息的预处理和提取后的后处理,在有些情况下,为了提高保密性需要预先对秘密信息进行预处理(例如加密),相应地在提取过程后要对得到的信息进行后处理(例如解密),恢复出秘密信息。
4.2图像信息隐藏技术
目前信息隐藏研究中使用的载体信息有几种:
文本、图像、语音信号、视频信号和应用软件。
数字图像由于大量存在,因而被研究最多的是图像中的信息隐藏,而且,图像信息隐藏所研究的方法往往经过改进可以轻易地移植到其他的载体中。
在国内15种有关图像工程的重要中文期刊中关于图像和信息隐藏的文献,2003年有49篇,2004年有57篇,2005年有48篇,信息隐藏已成为图像技术中的一个重要研究热点。
用于进行隐蔽通信的图像信息隐藏算法可以分为两大类:
基于空域的信息隐藏算法和基于变换域的信息隐藏算法。
基于空域信息隐藏算法中的典型算法是LSB算法,该算法的主要特点是在载体图像中嵌入的隐藏信息数据量大,但是嵌入位置固定,安全性差,嵌入的隐藏信息易被破坏,鲁棒性不高;基于变换域信息隐藏算法中的典型算法是离散余弦变换域的信息隐藏算法,该算法嵌入信息能够抵御多种攻击,具有较好的鲁棒性,并且嵌入方式多种多样,增加了攻击者提取的难度,具有一定的安全性,但是该类算法嵌入的隐藏信息数据量较小,不适合于进行大数据量的隐蔽通信。
这里介绍了图像的定义和类型,图像的数字化处理过程,灰度直方图的概念和作用,常用的颜色模型,讨论了图像质量评价方法;然后讨论了两种空域隐藏算法:
LSB替换算法和基于统计的信息隐藏算法;接着介绍了变换域隐藏算法的原理和优越性,在此基础上讨论了基于离散傅里叶变换的图像信息隐藏算法、基于离散余弦变换(DCT)的图像信息隐藏算法、基于离散小波变换的图像信息隐藏算法,对基于离散余弦变换(DCT)的图像信息隐藏算法做了详细的论述,给出了算法流程、程序和实例效果。
4.2.1图像
图像是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼并进而产生视知觉的实体。
人的视觉系统(HVS:
humanVisionsystem)就是一个观测系统,通过它得到的图像就是客观景物在人心目中形成的影像。
视觉是人类从大自然中获取信息的最主要的手段。
据统计,在人类获取得信息中,视觉信息约占60%,听觉信息约占20%,其他方式获取的信息加起来约占20%。
由此可见,视觉信息对人类非常重要。
同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。
一幅图像包含了它所表示的物体的有关信息,在较广的定义下,图像也包括
人眼不能感知的各种“表示”。
图像可根据其形式或产生方法来分类。
为此,引入一个集合论的方法,将图像的类型用图3来表示。
图3图像的模型
在图像集合中,包含了所有可见的图像(visibleimage),即可由人眼看见的图像的子集,在该子集中又包含几种不同方法产生的图像的子集,一个子集为图片(picture),它包括照片(photograph)、图(drawing)和画(painting)。
另一个子集为光学图像(opticalimage),即用透镜、光栅和全息技术产生的图像。
图像的另一个子集是由连续函数和离散函数组成的抽象的数学图像,其中后一种是能被计算机处理的数字图像(digitalimage)。
客观世界在空间上是三维的,但一般从客观景物得到的图像是二维的。
一幅图像可以用一个二维函数f(x,y)来表示,也可看作是一个二维数组,x和y表示二维空间XY中一个坐标点的位置,代表图像在点(x,y)的某种性质F的数值,例如一种常用的图像是灰度图(如图4),此时f表示灰度值,它对应客观景物被观察到的亮度。
127
220
178
98
173
252
172
61
127
173
127
36
图4灰度图像及其函数表示
日常见到的图像多是连续的,有时又称之为模拟图像,即f,x和y的值可以是任意实数。
为了便于计算机处理和存储,需要将连续的图像在坐标空间XY和性质空间F都离散化。
这种离散化的图像就是数字图像(digitalimage),可以用I(r,c)来表示。
其中,r代表图像的行(row),c代表图像的列(column)。
这里I,r,c的值都是整数。
在不致引起混淆的情况下我们仍用.f(x,y)表示数字图像,f,x和y都在整数集合中取值。
4.2.2图像的数字化处理
实际的图像具有连续的形式,但必须经过数字化变成离散的形式,才能在计算机中存储和运算。
数字化包括采样和量化两个步骤。
采样就是用一个有限的数字阵列来表示一幅连续的图像,阵列中的每一个点对应的区域为“采样点”,又称为图像基元(pictureelement),简称为像素(pixel)。
采样时要满足“采样定理”。
这个过程是通过扫描实现的,输出的量是连续的电平。
“量化”就是对这个模拟输出量取离散整数值,这个过程用A/D器件实现。
1.图像的采样
图像采样的常见方式是均匀的矩形网格,如图5所示,将平面(x,y)沿x方向和y方向分别以△x和△y为间隔均匀地进行矩形的划分,采样点为x=i△xy=j△y于是连续图像f(x,y)对应的离散图像f1(x,y)可表示为(5-1)
(5-1)
Y
△x
△y
X
图5典型的矩阵网格采样方式
2.图像的量化
经过采样后,模拟图像已被分解成空间上离散的像素,但这些像素的取值仍然是连续量。
量化就是把采样点上表示亮暗信息的连续量离散化后,用数字来表示。
根据人眼的视觉特性,为了使量化后恢复的图像具有良好的视觉效果,通常需要100多个量化等级。
为了计算机的表达方便,通常取为2的整数次幂,如256、128等。
图6所示是量化操作的示意图。
F2
F0
F1
图6量化示意图
将连续图像的像素值分布在[f1,f2]范围内的点的取值量化为f0,称之为灰度值和灰阶。
把真实值f和量化值f0之差称为量化误差。
量化方法有两种。
一般采用等间隔廊一量化,称之为均匀量化。
对于像素灰度值在从黑到白的范围内较均匀分布的图像,这种量化可以得到较小的量化误差。
另一种量化方法是非均匀量化,它是依据一幅图像具体的灰度值分布的概率密度函数,按总的量化误差较小的原则来进行量化。
具体做法是对图像中像素灰度值频繁出现的范围,量化间隔取小一些,而对那些像素灰度值极少出现的范围,则量化间隔取大一些。
这样就可以在满足精度要求的情况下用较少的位数来表示。
3.数字图像的表示
经过采样和量化操作,就可以得到一幅空间上表现为离散分布的有限个像素,灰度取值上表现为有限个离散的可能值的数字图像。
数字化之后的图像用一个矩阵表示g=[g(x,y)]式中x、y是整数,且1≤x≤M,I≤Y≤N,表示矩阵的大小为M*N.其中M为采样的行数N为采样的列数。
除了常见的矩阵形式外,在MATLAB运算等情况下,常将图像表示成一个向量:
g=[g
(1)g
(2)⋯g(j)⋯g(N)]。
式中,g(j)是行向量或列向量。
向量g是把式中元素逐行或逐列串接起来形成的。
4.2.3数字图像的灰度直方图
灰度直方图是数字图像的重要特征之一。
它是关于灰度级分布的函数,反映一幅图像中各灰度级与各灰度级像素出现的频率之间的关系。
灰度级为[O,L-1]的数字图像的灰度直方图通常用离散函数h(Rk)表示,定义如下:
h(Rk)其中Rk为第k级灰度,Nk是图像中具有灰度级Rk的像素个数。
显然0≤k≤L-1,0≤Nk≤n-1,n为图像总的像素数目。
在图像处理中常用的是归一化的直方图P(Rk)。
(5-2)
(5-3)
P(Rk)反映了图像中各个灰度级的分布概率,是能够反映图像整体特征的一个统计量。
可以看出,直方图很直观地反映了图像的视觉效果。
对于视觉效果良好的图像,它的像素灰度应该占据可利用的整个灰度范围,而且各灰度级分布均匀。
值得一提的是,灰度直方图只能反映图像的灰度分布情况,而不能反映图像像素的位置,即丢失了像素的位置信息。
图像的灰度直方图在信息隐藏技术中得到了重要的应用。
提出了基于差分直方图实现LSB信息隐藏的可靠性检测方法,研究了一种基于频率域差分直方图能量分布的可对DFT域、DCT域和DWT域图像信息隐藏实现通用盲检测的方法。
提出了基于空域直方图、频域直方图的无损数据隐藏方法。
一个灰度直方图的例子如图7所示。
P(R
)
0255
图7灰度直方图示例
4.2.4常用颜色模型
所谓颜色模型就是指某个三维颜色空间中的一个可见光子集,它包含某个颜色域的所有颜色。
常用的颜色模型可分为两类,一类面向诸如彩色显示器或打印机之类的硬设备,另一类面向以彩色处理为目的的应用。
面向硬设备的最常用的模型是RGB模型,而面向彩色处理的最常用模型是HIS模型。
这两种模型也是图像技术最常见的模型。
1.RGB模型
RGB颜色模型基于笛卡儿三维直角坐标系,3个轴分别为红、绿、蓝三基色,各个基色混合在一起可以产生复合色,如图3.6所示。
RGB颜色模型通常采用图8所示的单位立方体来表示,在正方体的主对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。
(0,0,0)为黑色,(1,1,1)为白色。
正方体的其它六个角点分别为红、黄、绿、青、蓝和品红。
图8RGB混合效果
蓝(0,0,1)青(0,1,1)
白(1,1,1)
品红(1,0,1)
黑(0,0,0)绿(0,1,0)
红(1,0,0)黄(1,1,0)
图9RGB立方体
根据这个模型,一幅彩色图像每个像素的颜色都用三维空间的一个点来表示,由红、绿、蓝三基色以不同的比例相加混合而产生的。
C=aR+bG+cB(5-3)
其中C为任意彩色光,a,b,c,为三基色R、G、B的权值。
R、G、B的亮度值限定在[0-255]。
2.HSV模型
该模型对应于圆柱坐标系的一个圆锥形子集(图10)。
圆锥的顶面对应于V=1,代表的颜色较亮。
色彩H由绕V轴的旋转角给定,红色对应于角度0度,绿色对应于角度120度,蓝色对应于角度240度。
在HSV颜色模型中,每一种颜色和它的补色相差180度。
饱和度s取值从0到1,由圆心向圆周过渡。
在圆锥的顶点处,V=0,H和S无定义,代表黑色,圆锥顶面中心处S=0,V=1,H无定义,代表白色,从该点到原点代表亮度渐暗的白色,即不同灰度的白色。
任何V=1,S=1的颜色都是纯色。
V
绿(120度)黄
青红(0度)
蓝(240度)品红
H
0S
图10HSV颜色模型
HSV颜色模型对应于画家的配色方法。
画家用改变色浓和色深的方法来从某种纯色获得不同色调的颜色。
其做法是:
在一种纯色中加入白色以改变色浓,加入黑色以改变色深,同时加入不同比例的白色,黑色即可得到不同色调的颜色。
如图11所示,为具有某个固定色彩的颜色三角形表示。
色浓
白纯色
色调
灰色深
黑图11颜色三角形
4.3基于DCT的图像信息隐藏实例
离散余弦变换是一种实数域变换,基于DCT变换的编码方法是JPEG标准算法的核心内容,它主要包括编码和解码两个过程。
在对图像进行编码之前首先要对图像进行预处理,也就是把图像划分为数据单元。
在对图像进行处理时,有损模式下,通常DCT算法采用将8×8像素块作为一个数据单元,对8×8大小的图像数据块进行二维离散余弦变换。
在编码器的输入端,把原始图像分割成一系列顺序排列的由8×8像点构成的数据子块。
由于原始图像的采样数据是无符号整数,根据需要,要把其转换为有符号整数。
源图像的8×8数据块由64个像点构成,64个像点实质上就是64个离散信号,输入后被分成64个正交基信号。
每个正交基信号对应于64个独立二维空间频率中的一个。
FDCT即正变换输入64个基信号的幅值称作“DCT系数”,即DCT变换系数。
64个变换系数中包括一个表示直流分量的“DC系数”和63个表示交流分量的“AC系数”。
压缩数据的重要一步,就是对DCT系数进行量化,它是造成DCT编解码信号损失的根源。
DCT系数量化一般根据一张量化表提供的元素进行量化。
量化表中的元素是根据人类的视觉特性制作的。
数字水印算法的实现基本上分为三个部分:
水印的嵌入、水印的提取和相似度计算。
4.3.1水印的嵌入
(1)首先对原始图像进行DCT变换。
(2)水印信号的产生。
Cox等指出由高斯随机序列构成的水印信号具有良好的鲁棒性,在许多文献中也都是将高斯随机序列作为水印信号。
因此本文所采用的水印信号W为服从正态分布N(0,1),长度为n的实数随机序列。
即:
W=(Xi,0≦i≦n)。
(3)水印的嵌入。
选择将水印信号放在宿主信号的哪些位置,才能够更好的保证其具有良好的鲁棒性。
Cox等认为图像水印应该放在视觉上最重要的分量上。
由于视觉上重要的分量是图像信号的主要成分,图像信号的大部分能量都集中在这些分量上,在图像有一定失真的情况下,仍然能保留主要成分,即视觉上重要的分量的抗干扰能力较强,因此将数字水印嵌入到这些分量上,可以获得较好的鲁棒性。
当水印信号相对宿主信号较小时,还可以保证不可见性。
所以本算法将服从N(0,1)分布的随机序列构成的水印序列放到DCT变换后图像的重要系数的幅度中,增强水印的鲁棒性。
水印嵌入公式为(6-1)
V′=V(1+aXk)(6-1)
其中V为原始图像信息,a为嵌入系数,X
为水印信息,V′为生成水印图像信息。
(4)进行二维离散余弦反变换,得到嵌入水印的图像,如图12所示。
图12原始图像与嵌入水印后的图像对比
4.3.2水印的提取
对原始图像和嵌入水印的图像分别进行离散余弦变换。
利用Xk=(V′′/V-1)/a提取水印。
从没有受到攻击的水印图像中提取出水印,与原始水印进行对比,如图13所示。
图13未受攻击的含水印图像提取的水印与原始水印图像比较
4.3.3相似度和峰值信噪比计算
根据相似度的值即可判断图像中是否含有水印信号,从而达到版权保护的目的。
对被恢复出的水印信号和原始水印信号的相似程度进行计算。
MSE指MeanSquareError(均方误差,各值相差的n次方和的平均值的n次平方根)。
MSE=sum[(recpixel-orgpixel)^2]/ImageSize(4-2)
PSNR是“PeakSignaltoNoiseRatio”的缩写。
peak的中文意思是顶点。
而radio的意思是比率或比列的。
整个意思就是到达噪音比率的顶点信号,PSNR是一般是用于最大值信号和背景噪音之间的一个工程项目。
通常在经过影像压缩之后,输出的影像通常都会有某种程度与原始影像不一样。
为了衡量经过处理后的影像品质,我们通常会参考PSNR值来认定某个处理程序够不够令人满意。
PSNR计算公式如(6-3)所示
PSNR=10×log(2552/MSE)(6-3)
PSNR的单位为dB。
所以PSNR值越大,就代表失真越少。
PSNR是最普遍,最广泛使用的评鉴画质的客观量测法,不过许多实验结果都显示,PSNR的分数无法和人眼看到的视觉品质完全一致,有可能PSNR较高者看起来反而比PSNR较低者差。
这是因为人眼的视觉对于误差的敏感度并不是绝对的,其感知结果会受到许多因素的影响而产生变化(例如:
人眼对空间频率较低的对比差异敏感度较高,人眼对亮度对比差异的敏感度较色度高,人眼对一个区域的感知结果会受到其周围邻近区域的影响)。
五、结论
数字水印技术是信息科学中近几年来发展最为迅速的学科之一。
随着多媒体技术和网络技术的飞速发展及广泛应用,对图像、音频、视频等多媒体内容的保护成为迫切需要解决的问题。
多媒体内容的保护包括版权保护和内容完整性保护。
由于现有计算机的计算能力不断翻番以及网络分摊计算技术的不断完善,因此传统的加密方法已受到极大的挑战,而新兴的信息隐藏技术则可以进一步增强系统的安全性与可靠性。
信息隐藏技术用于多媒体保护则被称为数字水印,它是将一些标识信息直接嵌入到被保护的多媒体数据中,但是不影响原始内容的使用价值,而且不易被察觉或注意到。
利用这些隐藏在多媒体数据中的信息,可以达到确认数据拥有者、购买者或进行数据鉴定的真实性。
此外,利用信息隐藏技术还可以实现电子商务中需要的匿名机制以及在军事、国防工业中实现隐藏通信.
不过,数字水印技术毕竟还是一门新兴的科学,它涉及到通信与信息理论、图像与语音处理、信号检测与估计、数据压缩技术、人类视觉与听觉系统、计算机网络与应用、电波传播等多种科学知识。
虽然近几年来在理论和应用中取得了巨大的发展,但是到目前为止还尚未形成一个完整的理论体系,特别是还没有一个统一的评判标准,仍有许多的问题尚未解决。
可以说,数字水印技术是一个充满活力但又垦待开拓的研究领域,而对于国内这一问题的研究正处于起步阶段。
六、文献
[1]曲丽丽.基于数字水印的信息隐藏技术研究[J].光子学报,2004,20,26-27.
[2]钟桦,焦李成.基于特征子空间的数字水印技术[J].计算机学报,2003,26(3):
1-6.
[3]程颖,张明生,王林平等.基于DCT域的自适应图像水印算法.计算机应用研究,2005.1.