MIDI新新技术.docx

上传人:b****7 文档编号:15819034 上传时间:2023-07-08 格式:DOCX 页数:20 大小:116.41KB
下载 相关 举报
MIDI新新技术.docx_第1页
第1页 / 共20页
MIDI新新技术.docx_第2页
第2页 / 共20页
MIDI新新技术.docx_第3页
第3页 / 共20页
MIDI新新技术.docx_第4页
第4页 / 共20页
MIDI新新技术.docx_第5页
第5页 / 共20页
MIDI新新技术.docx_第6页
第6页 / 共20页
MIDI新新技术.docx_第7页
第7页 / 共20页
MIDI新新技术.docx_第8页
第8页 / 共20页
MIDI新新技术.docx_第9页
第9页 / 共20页
MIDI新新技术.docx_第10页
第10页 / 共20页
MIDI新新技术.docx_第11页
第11页 / 共20页
MIDI新新技术.docx_第12页
第12页 / 共20页
MIDI新新技术.docx_第13页
第13页 / 共20页
MIDI新新技术.docx_第14页
第14页 / 共20页
MIDI新新技术.docx_第15页
第15页 / 共20页
MIDI新新技术.docx_第16页
第16页 / 共20页
MIDI新新技术.docx_第17页
第17页 / 共20页
MIDI新新技术.docx_第18页
第18页 / 共20页
MIDI新新技术.docx_第19页
第19页 / 共20页
MIDI新新技术.docx_第20页
第20页 / 共20页
亲,该文档总共20页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

MIDI新新技术.docx

《MIDI新新技术.docx》由会员分享,可在线阅读,更多相关《MIDI新新技术.docx(20页珍藏版)》请在冰点文库上搜索。

MIDI新新技术.docx

MIDI新新技术

1绪论

1.1选题背景和研究意义

是一门交叉学科,它涉及数学、密码学、信息论、计算机视觉、计算机听觉以及其他计算机应用技术,是各国研究者关注和研究的热点。

其原理是利用载体中存在的冗余信息来隐藏秘密消息,以实现保密通信或者数字签名和认证。

信息隐藏技术的研究和应用主要是指数字水印和隐写术两个领域[1]:

第一个领域是数字水印,目前通过互联网,信息能够被轻易地传递和复制,这使得信息的知识产权变得更难保护。

数字水印技术的使用提供了在文档或图像中插入版权提示,用于保护信息的知识产权。

数字水印经常是小的图像或文本,在整个图像或文本中不断地重复。

第二个领域是隐写术,对信息隐藏有兴趣的人们,希望以秘密的方式传递信息并且避免第三方接收者的察觉。

在这种情况下,隐藏的信息比用来运送它的载体更重要。

隐写术经常与加密术一起用于限制未授权信息的访问。

加密术是指通过加密或者打乱信息的方式使信息只能到达指定接收者并解密信息。

当发送加密的信息时就明确地表明,已经发生了某种形式的通信,并发送了加密的信息,使消息不能被非指定的对象解读。

隐写术经常用来隐藏消息的存在。

实现隐蔽通信的主要技术手段是隐写术,隐写术主要研究如何将秘密信息隐藏到可公开的载体信息中,要求尽可能低地改变原始载体的感观质量,从而达到隐匿消息的发送者、接收者和消息本身,传递秘密信息的目的。

使用的载体信息有:

文本、图像、音频、视频信号和应用软件等多种数字类型文件。

隐写术作为一种新兴的信息安全技术己经被许多研究机构所关注[2]。

研究的重点基本上都是如何将秘密信息隐藏在图像、音频、文本、视频等载体中并检测其存在性。

近年来随着因特网的广泛使用,隐写术获得了广泛发展,已经被军事机构、政府部门、金融机构等涉及国计民生的重要部门采用。

据统计,在因特网上己有300多种隐写软件发布,而且每半个月都有一种新的隐写软件或新的版本出现。

隐写分析是对隐写术的攻击,目的是检测秘密消息的存在以至破坏隐秘通信。

通常认为,隐写分析比隐秘通信更为重要,隐写分析技术能探测敌方的通信渠道,阻塞其通信,防止国家机密泄漏。

隐写分析技术有利于防止隐写术的非法应用,可以起到防止机密资料流失、揭示非法信息、打击恐怖主义、预防灾难发生等作用,对保证国家安全和社会稳定有重要意义。

隐写分析不仅具有重要的应用价值,也具有重要的学术意义。

隐写分析可以揭示当前隐写术的缺陷,对隐写术的安全性进行测试与评价,隐写分析算法对于安全的隐写算法设计具有直接的指导作用。

目前,隐写分析的研究主要集中在图像载体,对音频的隐写分析研究较少。

近年来音频隐写术主要代表方法有最不重要位(LSB)方法、扩频方法、基于心理声学模型的方法等。

LSB方法通过改变音频数据样本的最不重要的位来实现数据的嵌入,LSB隐藏的数据量较大,运算简单,它有较高的附加信息数据传送速率;扩频法最早是应用在通信领域的技术,该技术使用相关法来提取,能部分抵抗有损压缩,但嵌入率上的局限使得它很难在实际的信息隐写中应用;基于心理声学模型的方法采用特定算法(如改变MPEG数据流中的缩放因子或是某些字节长度的奇偶性等)在音频数据不可感知部分嵌入秘密信息或者直接在MPEG数据流上进行秘密信息嵌入。

MIDI是20世纪80年代初为解决电声乐器之间的通信问题而提出的。

由于MIDI文件很小,非常适合在因特网上传播,通过因特网就很容易得到最新的乐曲。

无线通信技术的迅速发展,特别是无线通信设备,比如手机上多媒体的应用,反过来也会进一步促进MIDI音频技术的发展。

伴随着手机铃声、彩铃的大量出现,在MIDI音频中隐藏信息的算法也产生了。

本文的研究内容是提出一种针对以MIDI音频作为载体的信息隐藏专用隐写分析算法,可以检测出使用MIDI音频作为载体的隐蔽通信,有巨大的潜在应用价值。

1.2隐写分析研究现状

现代隐写术及隐写分析技术的研究工作与数字水印相比起步稍晚,到上世纪90年代中后期还处于初期。

由于隐写分析的研究时间短,研究本身的困难大,以及出于保密考虑等因素,隐写分析方面的公开研究成果并不多。

对隐写的攻击包括被动攻击和主动攻击。

被动攻击只是检测给定的图像或音频中是否存在隐藏的信息,以及可能采用的嵌入算法和工具;主动攻击需要估计嵌入信息的长度、位置,估计嵌入信息的密钥以及隐藏算法和工具使用的隐藏参数,甚至提取出隐藏的信息。

在隐写分析的基础上提取秘密信息的问题,在未知隐写方法和密钥的情况下还难以解决,至今很少有文献提及,目前的研究主要集中在被动攻击上。

按照分析检测方法的不同可以将隐写分析检测分为三类:

①感官检测,依靠视觉和听觉直接判断秘密信息的存在性;②理论分析法,主要是运用数学方法对隐写系统进行通用的隐写分析;③根据已有的隐写算法和隐写工具,针对性地进行研究,找出已有算法、工具的安全漏洞,专项性地进行隐写分析检测。

隐写分析的最初研究是Westfeld针对GIF图像的EzStego的Chi-Squatre[3][4]分析,该方法利用卡方检验比较隐秘载体中像素值的理论频率和实际从样本中得到的频率,从而检验是否有信息嵌入,但卡方检验只能检测秘密信息连续嵌入的情况。

信息量估计法是[5]对卡方检验的延伸,不但可以

对密写位置随机的情况进行检测,还能有效地检测出密写信息量不高的密写行为。

Fridrich等提出的RS检测法[6]把图像像素分成规则类、异常类和不可使用类,根据待测图像LSB置换操作前后每类像素组的变化曲线,可以可靠检测灰度和真彩色图像并估计嵌入率,但算法的检测结果直接受载体图像随机性噪声和秘密信息嵌入位置的影响;国内的张新鹏等人提出了一种基于统计特性的LSB密写分析方法——GPC分析法[7],根据相邻像素的相关性进行密写分析,该方法在密写量较大时能将虚警率和漏检率都控制在较低的水平。

变换域隐写分析的攻击对象是DCT域隐写术,包括Jsteg、F5、Outguess等。

Fridrich[8]等利用在DCT量化系数上进行LSB隐写会增强图像块效应,以及通过判断DCT量化系数的直方图是否有收缩现象来进行隐写分析。

DWT域隐写分析的研究报道比较少,ShaohuiLi[9]等针对DWT域QTM嵌入算法,提出了基于DFT域能量差分的检测算法,检测率达到90%。

该文是检测DWT域隐写术的积极尝试。

Westfeld[3]等提出了针对MP3Stego等隐写工具进行的低嵌入量隐写的分析方法。

1.3本文研究思路和研究内容

由于隐写分析理论构建并不完善,隐写分析方法评价标准也未形成系统,当前对音频隐写分析的研究也只能根据隐写分析目的的层次需求及通用系统模型,对一些具体隐写现象进行被动隐写分析,评价方法依然是从准确性、实用性、适用性、复杂性几方面综合考虑。

本文的研究思路是根据MIDI音频隐写分析原理,深入分析MIDI典型隐藏算法特点,针对一些具体的MIDI音频隐写技术,寻找对隐写敏感的特征参数,进行MIDI音频被动隐写分析,并用被动隐写分析的评价指标来衡量隐写分析方法。

隐写术试图以一种不可检测的方式在多媒体信号中嵌入数据,但是秘密信息的嵌入会破坏MIDI音频的统计特征,这使得检测数据的嵌入与否成为可能,也为隐写分析提供了依据。

由于音频与图像的格式不同,因此统计特性也不一样;MIDI音频格式又不同于WAV,MP3等存放波形文件的音频,隐写信息有自己的特点。

本文研究内容为通过对MIDI音频格式、人类听觉系统、当前已公开的比较典型的音频隐写算法进行研究,将图像域中的隐写分析方法应用到MIDI音频中,考察实验结果;并根据MIDI音频数据统计特征,提出针对MIDI音频的专用隐写分析方法。

 

2MIDI音频隐写基本原理

2.1引言

声音是一种通过空气传播的连续波,声音信号的两个基本参数是频率和幅度。

频率范围为20Hz~20kHz的声音信号称为音频(Audio)信号,人说话的频率通常为300~3kHz,这种频率范围的信号称为语音(Speech)信号。

语音信号是音频信号中的一种,一般来说,人的听觉器官能感知的声音频率大约也就在20Hz~20kHz之间,能感知的声音幅度大约在0~120db之间,本文所研究的声音信号指的都是音频信号。

声音信号是模拟信号,计算机无法处理模拟信号,只能处理数字信号,因此要对声音信号进行计算机处理,就必须对声音信号进行数字化。

现有的音频文件如WAV,MIDI,AAC等,存储的都是数字信号。

实现隐蔽通信的关键在于利用人类感官冗余,以及多媒体数字信号本身的数据冗余,将秘密信息隐藏于载体信号中,而不影响载体信号的感官效果和使用价值。

数字音频作为多媒体数字信号的一个重要组成部分,也是信息隐藏经常利用算法公开发表。

人类听觉系统原理是音频隐写术的基本依据,正是人类听觉系统的某些感知特性和现代音频编码技术的不完善使得数字音频中存在着一定的信息冗余,为在音频中进行信息隐藏提供了客观条件。

2.2音频的存储方式

音频的编码方式就是数字音频格式,不同的数字音频设备或不同的系统平台一般都对应着不同的音频文件格式。

常见的数字音频格式有如下几种:

⑴WAV[11][12]格式。

Microsoft公司开发的一种声音文件格式,它符合RIFF(ResourceInterchangeFileFormat)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。

WAV格式支持多种音频位数、采样频率和声道,是PC机上最为流行的声音文件格式。

它由文件头和音频数据两部分组成,文件头包含40字节,这些信息若被修改,则文件就不能被播放器识别为WAV格式而不能播放,文件头不能隐藏信息。

⑵MIDI[13]格式。

在计算机多媒体领域中,声音波形文件虽然也可以用来表示数字音乐,但实际上它并不是严格意义上的音乐,因为音乐是完全可用符号来表示的,也就是说音乐可以看作是符号化的声音媒体。

国际上制定了许多音乐符号化的标准,其中最著名的就是MIDI。

MIDI是MusicalInstrumentDigitalInterface的简称,即音乐设备数字接口。

它是一种电子乐器之间以及电子乐器与计算机之间的统一交流协议。

MIDI是由美国SequentialCircuits公司的DavidSmith提出,并于1982年在国际音乐制造者协会的会议上通过。

日本Roland公司于1984年提出了GS标准,大大增强了音乐的表现力。

为了更有利于音乐家广泛地使用不同的合成器设备和促进MIDI文件的交流,国际MIDI生产者协会(MMA)在1991年制定了通用MIDI标准——GM,该标准是以日本Roland公司的通用合成器GS标准为基础而制订的。

MIDI协议的提出,使数据可以在不同厂商生产的电子设备之间精确传输。

此后,所有的商业电子乐器的都携带有MIDI硬件接口,乐器之间不再存在“语言障碍”。

相对于其它音频格式来说,MIDI具有很多的优点。

如果不经过压缩,声音波形文件的数据量的计算公式为:

数据量=(采样频率×采样位数×声道数)/8(字节/秒)(2.1)

一首音频如果采用16位采样位数,44.1K的采样率(高品质),时长30分钟,双声道,用声音波形文件无压缩录制,需要317.52M字节的存储空间。

而同样时间的MIDI音频大约只需200K字节,两者相差1500倍。

因此,在播放长时间的高质量音乐时,MIDI音频比波形文件更合适。

此外,由于MIDI文件体积很小,适合在手机等存储空间有限的便携式移动设备上存储大量音频。

2.3MIDI音频格式

由于MIDI音频存放的是演奏命令,而不是声音波形,因此在对MIDI音频进行隐写分析之前,必须先对MIDI格式有一定的了解[14][15][16]。

2.3.1MIDI头块

一个MIDI文件基本上由两个部分组成,头块和轨道块。

头块用来描述文件的格式、轨道块的数量、节拍等内容;一个轨道可以想象为像一个大型多音轨录音机那样,你可以为某种声音、某种乐谱或者某种乐器分配一个轨道。

大多数MIDI音频拥有多个轨道,能够组合出各种声音。

头块出现在文件的开头,数据格式如下:

4D54686400000006ffffnnnndddd

前四个是ASCII字符“MThd”,用来鉴别是否为MIDI文件,而随后的四个字节是指明文件头描述部分的字节数,它总是6,所以一定是“00000006”,后面的6个字节含义如表2.1:

 

表2.1MIDI音频头块数据

 

ffff

指定MIDI的格式

0000

单音轨

0001

同步多音轨

0002

异步多音轨

nn

nn

指定轨道数

实际轨道数加上一个全局音轨

dd

dd

指定基本事件

一般为120(0078),即一个四分音符的tick数,tick是MIDI中的

最小时间单位

单轨,很显然就只有一个轨道。

同步多音轨意味着所有轨道都是垂直同步的在同一时间开始,并且可以表现一首歌的不同部分;异步多音轨没有必要同时开始,而且可以完全地不同步;轨道数则指明在多音轨时轨道的数量。

头块之后剩下的文件部分是一个或多个音轨块。

MIDI的音轨块是由若干个格式相同的子数据构成的,这些子数据在多音轨的格式中记录了一个轨道的所有信息。

多加一个音轨,就简单地把数据追加在前一音轨的后面就可以了。

在音轨中有一个全局音轨,包含歌曲的附加信息(比如标题和版权)、歌曲速度和系统码等内容。

2.3.2MIDI事件

不论是全局音轨还是含有音符的音轨,都以“4D54726B”开头,它其实是ASCII字符“MTrk”,其后跟着一个4个字节的整数,它标志了该轨道的字节数。

接着就是记录数据的地方了,每一组数据有着相同的结构:

时间差+事件。

所谓时间差,指的是前一个事件到该事件的时间数,它的单位是tick(MIDI的最小时间单位)。

它的构成比较特殊。

一个字节有8位,如果使用7位,它可以表示0~127这128个数,而剩下的一位,则用来作为标志。

当要表示的数据小于128,则这个标志为0;如果要表示的数超出了这个范围(比如240),则把标志设置成1,然后记录下高位字节,剩下的留给下一个字节。

以这种方式记录的字节称为动态字节,它可以根据记录的数据改变自身的长度。

事件大体上可以分为音符、控制器和系统信息这几个类。

对于这些事件,都有统一的表达结构:

控制指令+种类+参数。

一个MIDI事件是由一个状态字节(控制命令)和多个数据字节构成,控制指令是状态字节,种类和参数为数据字节。

两类字节的描述如图2.1所示:

76543210

1

状态字节

76543210

0

数据字节

图2.1MIDI状态字节与数据字节

其中状态字节的最高位(第7位)恒为1,因此它的值介于128至255之间;而数据字节的最高位(第7为)恒为0,因此值介于0至127之间。

根据数据的大小就可以区分出当前字节是状态字节还是数据字节。

根据状态字节的不同,MIDI消息根据性质可分成通道信息(ChannelMessage)和系统消息(SystemMessage)两大类。

通道消息用于控制合成器的声音产生与设定。

对于一个音符,由于它的有效范围是0~127,所以直接用00~7F作为“种类”,比如3C表示中央C。

而一个音符的最重要的参数是力度(也叫速度:

velocity)。

比如,3C64表示一个力度为十进制100的中央C音符;系统消息用来指明MIDI的标题,歌词等。

状态字节最高位为1,再联合其他的7位,则可以表示各种事件。

对事件的不同划分在于事件的控制指令不同。

 

3基于信息量估计法的MIDI音频隐写分析

3.1引言

图像灰度值的统计特征与MIDI音频力度值统计特征的不同,使得一些图像域的LSB隐写分析方法如RS分析法,GPC分析法等,在MIDI音频中应用时效果不明显。

因此,在现有的隐写分析算法中,找到对图像域与MIDI音频域都敏感的特征量,对MIDI音频隐写分析有重要的意义。

本章从信息量的角度对MIDI音频进行了隐写分析,定义信息量为相邻力度值之间的起伏程度之和。

3.2信息量估计法原理

信息量估计法[5][17][18]是在图像中一种有效的密写分析方法,它不但可以检测出信息量不高的密写行为,而且可以精确地对密写信息量进行估计。

秘密信息在嵌入前往往经过加密,可以看作0,1的等概率码流。

设秘密信息的负载率为α,嵌入位置伪随机地分布于整个音频。

我们的目的是估计α的值,如果α的估计值接近于0,便可以认为载体音频中不含秘密信息。

设原始音频中力度值为i的力度数目为fi,密写后灰度值为i的力度数为hi,i∈[0,127]。

根据LSB密写的原理,大约有αf2i/2个力度值由2i变为2i+1,也有大约αf2i/2个力度值由2i+1变为2i,即

(3.1)

(3.2)

其中E(.)表示数学期望,则

(3.3)

从式3.3可以看出,h2i+1与h2i之差与嵌入率有近似的线性关系,随着嵌入率的增大,h2i+1与h2i趋近相等。

下面考虑h2i+2与h2i+1之差,类似有:

(3.4)

(3.5)

虽然密写时力度值2i+1与力度值2i+2之间不会相互变化,但由式3.5可见,h2i+2与h2i+1之差与嵌入率仍然呈近似的线性关系。

不同的是,h2i+2与h2i+1不一定随着嵌入率的增大而逐渐趋近。

对一首待测MIDI音频,统计力度直方图并定义:

(3.6)

(3.7)

如果MIDI音频没有经过密写,F1和F2在统计上并无不同,因此这两个参数的值很接近。

从上面的分析可以得到,在经过密写后,F1与F2嵌入率呈近似线性关系,并且F1随嵌入率的增大而减小,F2不一定减小,即使减小,其速度也远远小于F1减小的速度。

图3.1给出了MIDI音频“灰姑娘”参数F1和F2随密写信息量变化的情况。

从图中可以看出,随着嵌入率的增大,F1、F2曲线变化

趋势与LSB密写特性是一致的。

图3.1MIDI音频“灰姑娘”F1、F2曲线

3.3嵌入率的估计

对于没有经过密写的MIDI音频,F1与F2的值是非常接近的;经过密写后,F1与F2的值则有显著的差别。

对密写信息量的估计,采用二次密写法。

在待测音频力度值中随机选择位置进行二次密写,嵌入率β逐步由10%,20%上升到100%。

对应于每一个β值分别计算F1和F2。

经二次密写后,有部分力度经历了两次改变又回到原始的值,而在两次密写中仅改变过一次的力度值比例为(α+β–αβ)/2,即相当于经历了一次嵌入率为(α+β–αβ)的密写。

也就是说,嵌入率为β的二次密写相当于将嵌入率提高了(1–α)β。

因为二次密写线性地增加了嵌入率,由此得到的F1和F2会呈线性变化。

可以用两条直线分别拟合11个F1和11个F2值。

针对一首待测MIDI音频,用二次密写的方法得到F1,F2曲线,将F1,F2方向延长,得到交点(x,y)。

嵌入率的估计值为:

(3.8)

用MIDI音频“灰姑娘”做实验,在其中60%的力度值嵌入秘密信息,然后用信息量估计法方法计算嵌入率。

实验结果如图3.2所示,图3.2中两条直线焦点p的横坐标为-1.6,计算得到密写嵌入率为61.5%。

再用MIDI音频“灰姑娘”作为载体,当密写嵌入率分别为40%、80%时,应用本方法估计出的嵌入率分别为32.7%、73.2%,与实际数值很接近。

图3.2“灰姑娘”信息量估计法隐写分析结果

3.4信息量估计法实验结果

从互联网上下载了常见的MIDI音频600首,用信息量估计法进行隐写分析。

分别在嵌入率为10%,50%和90%的情况下进行估计,直线拟合时F1和F2均取11个点。

得到的嵌入率估计值如图3.3。

图3.3三种嵌入率下隐写分析结果

从图3.3中可以看出,嵌入率为10%,50%和90%时,绝大多数的MIDI音频估计值误差在实际值的上下10%范围内,只有极少数点估计值相差很大。

将嵌入率依次取10%,20%,30%......100%,进行嵌入率估计,对所有结果取均值和方差,得到表3.1:

表3.1600首MIDI音频嵌入率估计

α

10%

20%

30%

40%

50%

均值(%)

11.7

17.4

25.9

36.0

46.2

方差

0.091

0.106

0.121

0.127

0.124

α

60%

70%

80%

90%

100%

均值(%)

58.3

70.5

81.1

90.2

93.2

方差

0.110

0.099

0.089

0.090

0.115

表3.1给出了在不同嵌入率下采用信息量估计法隐写分析的结果。

从实验数据可以得出,通过二次密写法得到的α估计值跟真实值非常接近,误差在均值的上下10%范围内浮动。

存在一定的误差,这是因为信息量估计法是针对图像LSB密写的隐写分析方法,MIDI音频的统计特性跟图像不完全一致;并且由于MIDI音频自身大小的限制,能够隐藏的信息量不大,在做统计分析时的样本数据偏少,造成分析结果的误差。

图3.4给出了不同嵌入率下的估计值α的绝对误差,图3.5则给出了标准方差。

图3.4信息量估计法绝对误差

图3.5信息量估计法标准方差

采用二次密写方法对嵌入率α进行估计。

设定一个阈值,若α小于阈值,则判定MIDI音频未载密;当大于阈值时,判定为载密音频。

对于阈值的选择,要保证在漏检率足够低的情况下虚警率要低。

根据信息量估计法得到的嵌入率估计值既可以用作是否嵌入了密写信息的判决依据,也可以作为估计的嵌入率。

表3.2为设定阈值分别为0.1,0.2,0.3时未密写信息的MIDI音频的虚警率(FPR):

表3.2未载密音频虚警率

阈值选择

0.1

0.2

0.3

虚警率FPR

30%

14%

4%

当选取阈值0.1时,虚警率偏高,达到30%;选择0.3时,虚警率非常低,只有4%,但是这个时候的相应地漏检率偏高。

综合考虑,最后选择0.2作为信息量估计法判决阈值。

表3.3为阈值0.2时不同嵌入率下的判决正确率(TPR)。

表3.3不同嵌入率下判决正确率(TPR)

嵌入率

10%

20%

30%

40%

50%

TPR

13%

32%

72%

88%

96%

嵌入率

60%

70%

80%

90%

100%

TPR

99%

99%

99%

99%

99%

以FPR率为X轴,TPR率为Y轴,构造二维ROC空间,考察算法灵敏度和特异度,嵌入率取50%。

图3.6为得到的ROC曲线图:

图3.6嵌入率50%时ROC曲线

ROC曲线下的面积为0.9235,虚警和漏检两种错误混淆度较低。

当嵌入率进一步提高时,TPR接近于100%,这时可以认为不存在漏检,只有虚警的错误,ROC曲线接近于一条平行于x轴的直线。

当嵌入率较低,在30%以下时,信息量估计法漏检率较大。

由于MIDI格式音频本身的特性,能够隐藏的信息量较小,一首时间长5分钟的MIDI音频“灰姑娘”,可以隐藏的字符数为1500,其信息量仅相当于一张分辨率为128×128的灰度图片。

而信息密写需要的是大容量的隐藏空间,因此低密写量的MIDI音频密写在实际中很少出现。

结合表3.2和表3.3中的数据,在嵌入率大于30%时,信息量估计法能够比较准确地检测出带有密写信息的MIDI音频,并且漏检率和虚警率都比较低;当嵌入率大于60%时,对载密MIDI音频的检测率达到99%以上。

并且两类错误的混淆度低,算法简单,在实际应用中容易实现,可以作为MIDI音频的专用隐写分析算法。

3.5小结

信息量估计法根据相邻元素间差值和的统计特性,不但可以检测

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2