SCI论文(www.lunwensci.com)
摘要:数字图像由于其真实性和可信度,在新闻报道、司法鉴定、理赔保险等方面得到了广泛的运用。但是,随着图像编辑软件的广泛应用,用户可以轻易地修改图像内容,因此无法辨别被修改图像的真实性。因此,辨别图像真实性变得日益困难。数字图像取证技术是利用图像本身的属性,对图像进行真实性认证、篡改区域定位及历史分析的技术。目前,为了便于储存和传送,大部分的图像都要经过JPEG进行压缩,因此,基于压缩效果的证据收集成为人们研究的热点。
关键词:JPEG图像;盲取证
A review of blind forensics techniques based on JPEG image tampering
Wang Yu
(Xinhua News Agency-Communication Technology Bureau,Beijing,100000)
Abstract:Due to its authenticity and credibility,digital images have been widely used in news reporting,forensic identification,claims insurance,etc.However,with the wide application of image editing software,users can easily modify the content of the image,so as to obtain the authenticity of the modified image cannot be distinguished.As a result,it is becoming increasingly difficult to discern the authenticity of images.Digital image forensics technology is a technology that uses the attributes of the image itself to authenticate the image,locate the tamper area and tamper with the historical analysis.At present,in order to facilitate storage and transmission,most of the images are compressed by JPEG,so the collection of evidence based on the compression effect has become a hot spot for research.
Key words:JPEG images;blind forensics
随着计算机技术的飞速发展和电子产品的普及,以数字图像为主要代表的多媒体技术在日常生活中成了主要的信息载体,在新闻报道、司法鉴定、理赔保险、科研等方面得到了越来越广泛的运用。但是,随着Photoshop、美图秀秀等众多多媒体编辑软件的不断兴起,数字图像的内容修改在更加方便、快速、真实的同时,也使数字图像的真实性愈加难以保证,在鉴别数字图像真伪的过程中变得越来越困难。近年来,国内外出现了大量对数字图像进行篡改和破坏最后导致不良后果的事例。例如,近年来流行的深度假脸,一些不法分子会利用它来进行金融诈骗之类的违法行为。另外,也存在着电子合同、保险单、科研成果等造假的情况。这种造假图像不仅会严重影响人们的日常生活,而且威胁着国家的安全与社会的稳定。由此可以看出,对图像的真假进行鉴别,并揭露伪造图像时使用的技术已成为急需解决的问题。数字图像取证技术正是在这样的大环境下产生的。数字图像取证技术是指通过数字水印、签名或图像本身的属性来保护图像内容、验证真实性、篡改区域定位,并对篡改方式进行解析。
一、常见取证技术
(一)主动取证
主动取证是将标识信息隐藏在数字图像中,不会对图像的使用产生任何负面影响,即在发生版权纠纷和需要认证的情况下,对提取的标识信息进行识别,以确定所提取的信息与原始信息一致或完整,从而鉴别图像的真伪和原始情况。其中,主动识别技术有数字水印和数字签名。
主动取证发送方采用嵌入算法,将需要加密的消息隐藏在载体图像中形成含密图像,并利用有损信息通道传输给接收者。后者在接收到加密图像的同时,可采用提取算法来获取加密的数据。数字水印算法根据水印的抗攻击能力,将水印分为鲁棒水印、半脆弱水印、脆弱水印这三种类型。鲁棒水印主要用于版权保护、知识产权保护等领域。由于脆弱水印无法抵御任何攻击,当含有数字水印的图像在传输过程中被恶意修改时,将会导致其内部的水印信息遭到损坏。在获取含密图像后,接收方无法提取完整的水印信息。评价水印技术的度量标准包括嵌入容量和峰值信噪比(PSNR)。EC的数值越大,则表示包含图像中嵌入的信息越多,而PSNR越高则表示含密图像越接近载体图像。两项数值具有一定的矛盾性,因此,EC值越高,PSNR值就会越低。在水印嵌入过程中,一般都会寻求这两个数据的平衡,选择合适的水印来实现特定的应用。
(二)被动取证
在对图像本身的属性进行取证时,可以直接分析图像的内容来验证真伪,基本原则是任意修改会在一定程度上破坏图像内容的整体性和连贯性。这种技术不需要将数据主动嵌入数字图像,因此又被称作盲取证或被动取证技术。
1.基于物理的取证
在获取图像时,由于不同场景中物体的自然光线方向、物体产生的影子、镜面的反光等物理特性会存在差异,因此可以利用物理特性的非一致性来进行数字图像的取证。
2.基于设备的取证
在数字图像的获取中,可将光学信号透过镜头,由传感器转化成数字信号,再由设备内部装置进行图像加工。如果使用的操作不同,则设备需要的差值算法也会有所不同,因此可以进行设备源的识别。随后,将大量的数据作为驱动,可以从图像中提取区别设备模型的特征,从而提高检测效果。
3.基于内容的取证
“复制—粘贴”是一种常用的数字图像造假方法,通过把图像上某一部分或多个部分的区域粘贴在统一图像的其他位置,以达到隐藏图像局部信息的目的。针对此类数据的篡改技术,可以将其分成两种,一种是基于区块的,另一种是根据关键点进行检测。
4.基于格式的取证
为减轻存储和传输数字图像的负担,JPEG压缩技术在数码相机、图像编辑软件和社交平台等领域得到了广泛应用。在对JPEG图像进行篡改或嵌入秘密信息的过程中,通常会导致图像出现JPEG的双倍压缩。对图像的双重压缩进行检测,则可以实现对篡改图像的区域定位和对隐藏信息的分析。
5.基于操作的取证
为掩饰图像被篡改的痕迹,使被篡改的图像更加真实,技术人员需要对图像进行多种后处理,比如放大对比度、中值滤波、重采样操作等。因此,对这些操作进行检测,可以为图像的取证提供更好的帮助。
利用拉普拉斯分布模型获取抖动噪声,并将噪声信号加入伪造图像的DCT系数,从而获得与原图DCT系数接近的DCT系数。通过这种反取证方法,技术人员可以掩盖图像DCT区域内的压缩痕迹。
DCT系数分布直方图是平滑和连续的。
二、现有JPEG图像篡改的盲取证技术详列
(一)JPEG图像检测
第一,双重JPEG压缩检测方法。利用图像软件篡改图像时,JPEG图像在篡改完成后可能会使用与原始图像压缩因子不同的质量因子再一次压缩存储,即JPEG图像是双重压缩。
第二,JPEG块效应不一致性检测方法。JPEG编码时,分别对每个子块执行DCT变换,这样DCT变换的运算量能明显减少,但可能忽略原有子块间像素值的相关性。在下一个量化过程阶段,为了实现图像压缩,高频位置的量化步长在量化表中一般会较大,因此在量化之后,每个子块边缘处的大部分高频分量将丢失,导致在解码图像中块的边界处出现不连续的现象,从而形成块效应[1]。
(二)详列及其原理特点
通过估计图像第一次压缩量化表来定位篡改区域,采用多种质量因子对JPEG图像进行再压缩检测,当压缩因子与被篡改区域的压缩因子相等时,其统计特征失真变化不大,可以有效地探测到被篡改的区域。
检测不同合成方法处理过的图像不需要完全解压JPEG图像,且对JPEG图像有更好的压缩效果,尤其是在压缩质量较高的情况下,该方法首次完成了JPEG图像篡改区域的自动检测与定位(但是这种方式在不同来源的“复制—粘贴”图像及低质量因子图像中并不有效)。
估计DCT系数和量化步长的兼容性,获得估计的量化步长。(这种方法只能探测被篡改后的BMP格式保存的图像,对JPEG的双重压缩格式不起作用)
第一,利用双压缩量化效应原理,计算DCT系数条件概率,利用直方图的平均概率分布对篡改区域进行近似处理;第二,利用贝叶斯原理求出图像块中一种类型的后验概率,并将其与后验概率分布图相结合,以达到对篡改区域的精确定位,实现自动检测图像篡改区域的算法[2]。
在上一条的基础上,采用粒子群算法建立了自适应阈值优化后验概率密度图,采用后验概率密度图法对阈值进行分级判定,对篡改区域进行识别与分割,从而自动、精确地探测与提取被篡改区域。
对被检测到的图像中的全部质量因子进行三次压缩,并对图像失真程度进行研究,能够检测出待检测图像的原始压缩因子大小。
移植JPEG隐写分析中相邻边缘的密度特征,并先将该密度特征与DCT域边缘密度特征相融合,使之作为学习分类器的检测器,并利用边缘密度和相邻关节密度特征,实现图像算子的识别和捕获后操作[3-4]。
基于块内和块间相关性,利用差分二维数组描述块内和块间相邻JPEG量化DCT系数之间的大小差异,使用阈值技术对差异的二维数组进行处理,结合共生矩阵对这些差分二维数组进行建模,最后应用支持向量机(Support Vector Machine,SVM)分类器对SDJPEG压缩图像进行分类,通过开发的特征集将SDJPEG压缩图像块与单个JPEG压缩图像块进行区分[5]。
采用基于拟合函数的方法,对多个网格的位置进行评估,将贡献最小的区域划分为非连续性网格区域和易被篡改的区域,使用JPEG压缩后的图像位图,通过网格定位来识别图像伪造指标。
选取图像的某一个区域,对此区域的DCT系数进行傅里叶变换,根据频域特性估计出原始量化矩阵。在计算整个图的块效应时,可利用该区域的量化矩阵将差异较大的区域表示为篡改区域。(仅适用于压缩质量因子较大的图像)
针对JPEG频谱的块效应测度的度量算法来鉴定图像的真伪性。该算法在频谱分析的基础上对图像进行二阶差分,并定义了图像块效应测量的新指标,用于篡改图像的盲取证[6]。
利用量化噪声模型检测由双JPEG压缩引起的块效应,以及在空间和变换域上表示JPEG图像的周期特征,压缩次数越多,噪声量化直方图越接近高斯分布。根据块效应原理对图像进行解块,然后进行低频补偿,但仅补偿低频的15个DCT系数,最后修正量化噪声模型,以检测块对齐或不对齐的双压缩块效应。
根据图像块效应网格的错配来检测和定位JPEG伪造图像的篡改区域。该检测方法可以有效处理通过平均邻近像素的值来平滑复制区域边界的图像,以提取和分析JPEG压缩过程中块处理引入的块效应网格,但图像进行多次压缩会产生块效应网格偏移。
三、现有问题综述
(一)针对性强造成应用隔阂
JPEG图像篡改的盲取证大多针对某一种特定的篡改方式进行取证,比如单次压缩、双重压缩、拼接、复制粘贴等。因为分析一幅图像时如果不具有任何先验的知识,那么就很难监测待检测图像伪造的特征,所以为了符合实际需求,需要研究出一种能够检测复杂图像篡改的融合算法,以提升图像取证技术的实用价值。
(二)衡量标准不统一
多数取证算法需要依靠预先训练,而目前常用的盲检测存在性能不佳的情况,因此大部分取证尚无一个统一的评估指标。
四、展望
在双重JPEG压缩检测中采用不同的量化矩阵算法可获得良好的效果。同样的,量化矩阵的双重压缩问题仍然是一个巨大的挑战,尤其是在检测低质量的图像时,截短误差是处理相同量化矩阵双重压缩的关键,但是缺少理论模型和分析。因此,如何有效地运用截短误差,并对其进行深入的理论研究,对于解决这一问题具有重要意义。
五、结语
随着数码照相机的普及,以及多媒体技术的飞速发展,数字图像的获取、修改、编辑等工作变得越来越容易,这给图像的原始性、真实性、完整性等方面的保证造成了越来越大的威胁。因此,对数字图像进行内容的保存与真实性的鉴别,已成为国内外十分关注的问题。图像取证技术是利用图像数据的统计学特征来识别和检测伪造或篡改的数字图像,有较高的实用价值。
【参考文献】
[1]赵洁,郭继昌,张艳.利用块效应特征的JPEG图像盲取证研究进展[J].中国图象图形学报,2013(6).
[2]吴首阳,刘铭.基于量化相关性的JPEG图像盲取证[J].计算机仿真,2010(6).
[3]赵洁,郭继昌.基于JPEG系数变化率的图像复制粘贴篡改检测[J].浙江大学学报(工学版),2015(10).
[4]索士尧,何小海,熊淑华,任超,卿粼波等.基于自适应高维度非局部总变分的压缩图像去块效应算法[J]科学技术与工程,2018,(10).
[5]段新涛,彭涛,李飞飞,王婧娟,李贺.基于JPEG重压缩特性的篡改图像盲分离[J].济南大学学报(自然科学版),2017(2).
[6]黄维,黄添强,张雪莉,肖辉.基于块效应网格偏移的重获取JPEG图像篡改检测[J].网络与信息安全学报,2017(12).
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/51690.html