Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 理工论文 > 正文

一种鲁棒的图像复制粘贴篡改盲检测方法论文

发布时间:2023-10-23 15:30:01 文章来源:SCI论文网 我要评论















SCI论文(www.lunwensci.com)

  摘要 :针对现有图像复制粘贴篡改盲检测技术鲁棒性不强, 容易受图像压缩 、高斯噪声 、亮度和对比度调整等后处理干扰的问题。 提出一种新的基于图像块的高效检测方法, 仅利用离散余弦变换矩阵的低频系数符号, 提取图像块的特征向量; 通过改进的元胞 自动机规则对特征向量进行演化, 有效将数据量从 32 维降至 5 维 。再利用 KD 树模型获取每个图像块的 5 个最近邻相似目标, 最后 通过自定义后处理规则剔除假阳性判定结果 。 实验结果表明, 和同类方法相比, 所提方法即使在强后处理干扰环境下, 依然能表现出更强的鲁棒性, 同时还兼具较好的处理速度 。在压缩和高斯噪声干扰上, 检测精度平均提高了 15%; 而在亮度和对比度调整 干扰上, 检测精度平均提高了 6%。
  A Robust Copy-move Forgery Blind Detection Method for Digital Image

  Zhang Dunli, Zhou Guodong

  (College of Intelligent Manufacturing College, Hunan Open University, Changsha 410004. China)

  Abstract: It’s not so capable in disturbance rejection for current blind copy-move forgery detection methods(CMFD), such as image compression, Gaussian noise, brightness and contrast adjustment. A new robust block-based detection method is proposed. The feature vector is extracted from each block by only sign information of low frequency coefficients which come from discrete cosine transform (DCT) matrix of the image. Cellular Automata is employed to reduce the feature vector from 32 dimensions to 5 dimensions. Feature vectors are matched by utilizing the KD-tree based on the nearest-neighbor searching method to find the duplicated areas . Finally, the false matches are filtered and the forgeries are visualized inside the image. Experimental results show that the proposed method performed exceptionally well relative to the other state-of-the-art methods even when an image is heavily affected by the post-processing attacks . At the same time, it also shows the faster processing speed. The precision is improved by 15% on average under compression and Gaussian noise attacks, and 6% is improved under the brightness and contrast change attacks.

  Key words: image forensics; copy-move forgery; cellular automata; discrete cosine transform

  0 引言

  数 字 图 像 的 复 制 粘 贴 篡 改 (Copy-Move Forgery , CMF ) 对包括新闻传播 、司法取证 、信息安全等诸多领 域都带来了严重的威胁[1] 。而现有的检测技术普遍存在 鲁棒性不强的不足, 容易受图像压缩[2] 、高斯噪声[3] 、亮 度和对比度调整[4]等后处理干扰 。本文提出一种新的基 于图像块的 CMF 检测方法, 利用 DCT 提取图像块特征, 再利用元胞自动机对特征矩阵进行降维 。该方法相对传 统方法, 表现出更强的鲁棒性。

  目前 CMF 检测主要有两个技术路线, 一是基于图像 块 (Block-based) 的方法, 二是基于特征点 (Keypoint- based) 的方法[5] 。两类不同的方法各有优缺点 。基于特 征点的检测方法适用于追求速度, 而忽略精度的场合 。 而基于图像块的检测精度更高, 对部分图像后处理操作 的抗干扰能力也更强, 但缺点是计算量较大, 因此该类方法适用于追求精度的场合 。如何提高在后处理干扰环 境下的检测鲁棒性, 同时减少计算量, 提高检测速度, 成为了基于图像块的 CMFD 主攻方向。

  基 于 离 散 余 弦 变 换 ( Discrete Cosine Transform , DCT ) 的特征提取方法具有计算量小 、抗后处理干扰能 力强等优点[6] 。文献[7]使用 DCT 获取图像块特征后, 先 对特征向量进行字典排序, 压缩特征向量维数, 再进行 匹配操作, 达到了较少计算量的目的, 但实验证明该方 法仅对微弱的后处理操作具有鲁棒性 。文献[8]将奇异值 分解 ( SVD ) 应用到 DCT 矩阵, 实现了数据降维 。文献 [9]将离散小波变换 ( DWT ) 和 DCT 结合, 取得了较好的 数据降维效果 。文献[10]则将 DCT 和驻小波变换 ( SWT ) 结合运用, 有效提升了检测速度。
\

  本文提出一种新方法, 仅利用离散余弦变换矩阵的低 频系数符号, 获取图像块的特征向量。通过改进元胞自动机对特征向量进行哈希降维 。再利用 K 近邻搜索法, 获取 每个图像块的 5 个最近邻目标, 并剔除假阳性判定结果。 该方法能兼顾检测质量和检测效率, 表现出较好的性能。

  1 元胞自动机和离散余弦变换

  1.1 元胞自动机

  元胞自动机是一种具有时间和空间进化机制的离散 模型, 其结构类似一个多维细胞网格[10] 。其工作原理是 根据当前时刻某个元胞及其邻域的值, 按照特定的运算 关系式来进化成下一时刻的值 。在图像处理中, 2 维元 胞结构普遍使用, 典型的有冯诺依曼 ( Von Neumann ) 结构和摩尔 ( Moore ) 结构, 如图 1 所示 。随着时间的运 行, 2 维图像数据将按照规则不断进化, 最终形成特定 的维数更小的数据, 实现降维的目的 。元胞自动机的实 质就是一种高效率的哈希算法, 在图像的置乱[11] 、噪声 移除[12]和加密[13]等领域应用广泛。
\

  1.2 离散余弦变换

  DCT 是一种强大的特征提取技术[14] 。若图像的尺寸 为 M×N, 则 对 应 的 2 维 DCT 系 数 矩 阵 计 算 公 式 如 式( 1 ) [15]:
\

  2 维 DCT 变换后, 图像的主要能量都集中在少量的 低频 DCT 系数中, 因此可以舍掉大量的高频数据, 而不 会大量破坏图像的有用信息 。DCT 的这一特性使得其成 为了图像特征提取的强大工具。

  2 基于 DCT 和CA 的CMFD 方法

  本文提出的基于图像块的 CMFD 方法主要包含以下 5个步骤: ( 1 ) 预处理和图像分割; (2 ) 特征向量提取;

  ( 3 ) 特征向量压缩; (4 ) 特征匹配; (5 ) 后处理。

  预处理过程主要是对图像进行色彩模式转换, 将彩 色模式转换为灰度图, 下一步将图像分割成重叠的小块, 再对各块提取特征, 并两两进行匹配, 最终判断是否存 在复制粘贴篡改 。后处理技术主要包括假阳性图块的移 除以及标定篡改区域的具体位置。

  2.1 预处理和图像分割

  为了提高后续特征提取和比对的计算效率, 本研究 将彩色图像转换为灰度图, 具体的转换公式如式(2)所示。
  I = 0.298 9 × R + 0.587 0 × G + 0. 1140 × B          ( 2 )

  然后将预处理图像分割成一系列重叠的方形规则区域, 大小为 L×L 像素, 也就是图像块 。每个图像块存储 其左上角像素的坐标即可 。对于一个 M×N 的图像, 可以 分割出的图像块数量为 ( M-L+1) × ( N-B+1) 个 。 比如 255×255 的图像, 图像块大小为 12×12. 则图像块数量为 60 025 个。

  图像块大小的选取主要依据图像中关键信息区域的 大小 。图像块过小或者过大, 覆盖的信息与篡改区域匹 配不够, 都可能影响识别准确率 。本文实验使用的测试 图像的篡改区域尺寸为 4×4 到 20×20 像素区间, 因此图 像块大小选择为均值 12×12 。实际应用中, 可根据情况 调整分割图像块大小。

  2.2 特征向量提取

  本文通过研究发现, DCT 变换不仅具有能量聚集功能, 而且其低频系数的符号具有较强的稳定性, 在预处 理操作干扰下表现的更加突出, 提出仅使用 DCT 的低频 系数符号作为图像块的特征向量。

  图 2 所示为 JPEG 图像压缩前后 DCT 系数变化对比图, 压缩质量因子为 50. 其中图 2 (a) 为变换前的系数 符号, 图 2 (b) 为变换后的系数符号。将图 2 中 12×12 的 DCT 系数符号分为 4 个部分, 可以 看出低频部分, 也就是左上部分区域, 系数几乎没有发 生变化, 而其他 3 个高频区域系数符号则变化较大 。为 了验证该规律的普遍性, 采用了 100 张不同图像, 分割成 10 万张 12×12 的图像块, 对它们进行 JPEG 随机品质 因子 (QF=20-90 ) 压缩, 以及添加高斯随机方差 ( VAR = 10-4. 10-3. 10-2 ) 噪声 。 同样对比其 DCT 低频系数符 号变化情况, 结果如表 1 所示。
\

\

  从实验结果可以看出, 低频系数符号既能区分不同 图像块, 又能对前处理操作保持较好的鲁棒性, 因此可 以作为图像块的特征向量。

  最后, 为了编码方便以及减少后续计算量, 采用二 进制模式记录, 阈值公式如式 ( 3 ) 所示。
\

  如此, 每个图像块的特征矩阵便转换为 6×6 的二进 制方阵。

  2.3 特征向量压缩

  为了减少数据存储量, 提高特征匹配的速度, 本文 采用元胞自动机进一步压缩特征矩阵。

  首先是元胞结构的选择, 大量的实验结果表明, 冯 诺依曼结构和摩尔结构对应最后的判别准确率相差无几, 但是冯诺依曼结构的计算量要小, 速度更快, 因此本文 采用冯诺依曼的元胞结构。

  如图 1 所示, 目前得到的是 6×6 的二进制特征矩阵。 而冯诺依曼元胞结构为 3×3 结构, 因此中间 4×4 的区域一共有 16 个元胞结构, 用式 ( 4 ) 表示。
\
 

  接下来定义元胞的演化关系, 其原理就是比较每个 元胞领域的 1 和 0 数量, 以数量多的作为该元胞最后结 果, 定义 F1 (i) 和 F0 (i), i=0. 1. 2. …, 15. 分别表示 16 个元胞的 1 和 0 的数量。演化关系R 如式 ( 5) 所示。
\

  这样, 特征矩阵经过 CA 的转换, 被压缩成了 16 位 二进制的整数 。除此之外, 为了体现原特征矩阵系数正 负号的分布情况, 将 16 个元胞的 0 和 1 做统计, 分别计 算出对应的均值 m 和方差 v 。一共组成图像块的新的 5 维 描述向量 F= ( R, m0. v0. m1. v1 )。 将所有图像块的描 述向量堆叠起来, 便得到了图像的特征描述矩阵 Fm 。

  2.4 特征匹配

  特征匹配的目的是找出相似的特征向量, 作为复制 粘贴篡改的可疑区域 。为了准确找出相似区域, 本文通 过基于 Kd-tree 模型的最近邻搜索方法, 找出每个图像块最相似的 5 个候选块 。关于搜索方法的选择, 有不少研 究者采用基于字典排序的方法以获取更快的搜索速度, 但是本文通过大量实验验证, 发现 Kd-tree 方法能得到更 精确的结果 。综合分析, 本文采用了 Kd-tree 方法 .

  获得了每个图像块的 5 个候选邻居后, 接下来通过 欧式距离来进一步判别其相似性, 若比对的图像块特征 矢量为 Fij 和 Fmn, 则可用式 ( 6 ) 来进行判断, Ts 为设定 的阈值。
\

  其次, 离得太近的两个图像块, 存在较多重叠的区域, 则可能给判定带来干扰, 因此需要对图像块的位置 关系进行约束, Td 为设定的距离阈值 。如式 ( 7 ) 所示, 只有当比对的图像块之间超过一定的距离, 才能判定为 疑似篡改区域。
\

  因此, 必须同时满足式 ( 6 ) 和式 ( 7 ) 的图像块, 才能判定为疑似篡改区域 。另外, 参数 Ts 和 Td 的值可以 根据实际运行情况来设定, 本文后续的实验, 统一设定Ts=0.2. Td=30.

  3 实验及分析

  实验主要验证本文所提出的 CMFD 方法性能, 以及 在各种图像后处理操作 (压缩 、高斯噪声 、模糊 、亮度 和对比度调整) 干扰下的鲁棒性 。实验将采用对比验证 的方法, 将本文的方法和其他 6 种检测方法进行对比, 其 余 6 种 方 法 分 别 来 自 于 文 献 [3]、[5]、[6]、[7]、[8]、 [9] 。这 7 种方法的技术细节如表 2 所示。
\

  实验的软件平台为 MATLAB R2016a, 硬件配置为为 Intel i5 ( 2.4 GHz ) 处理器, 8 GB 内存 。本文提出的方 法所用配置参数为: 图像块大小为 L=12. 相似性阈值 Ts=0.2. 空间 距 离 阈 值 Td=30. 以 及 相 似 群 数 量 阈 值 Tm=200 。实验所用的图片为专用于 CMFD 检测使用的篡 改图像数据集 CASIA2.0 [21], 该图像集共计 12 323 张图 片, 分为 20 个大类, 50 个小类, 其中真实图片 7 200 张, 篡改图片 5 123 张; 篡改图片中无预处理有 1 843 张, 有 预处理 3 280 张; 篡改图片中无模糊后处理有 4 144 张, 有模糊后处理 979 张; 篡改区域为小尺寸 (小于 20×20) 的有 3 358 张, 中尺寸((20×20) ~ ( 120×120)) 819 张, 大尺寸 (大于 120×120) 946 张; 篡改图像都配有篡改区 域的二值图, 用于校验 。为定量分析实验判定结果, 本 文使用精确率 (precision) 和召回率 (recall) 作为评价 指标[22], 其计算方法如式 ( 7 ) 和式 ( 8 ) 所示。
\

  式中: tp 为判别结果为真阳性的数量;fp 为判别结果为假 阳性的数量;fn 为假阴性的数量。

  3.1 图像块大小对检测精度影响

  首先验证图像块大小对本文提出的 CMFD 方法检测 精度的影响 。本实验从图像集中选取 60 张已篡改图像 ( 3 种不同篡改区域各 20 张, 再每个大类选取一张)。 分 别用本文提出的方法进行检测, 结果如表 3 所示。
\

  从实验结果来看, 小尺寸篡改区域在图像块为 12× 12 大小时精度最高, 中尺寸篡改区域则为 72×72. 大尺 寸为 152×152 。结论与前面的分析基本是一致的。

  3.2 运行时间对比分析

  实验分析本文提出的 CMFD 方法的时间复杂度 。每 个图像块都包含前处理 、特征提取 、特征匹配和后处理 4 个过程 。但是相对而言, 特征提取和特征匹配两个过 程时间开销要大得多, 因此实验只对比分析这两个过程。 若图像尺寸为 M×N, 图像块尺寸为 L×L 。则一共可以分割的图像块数为 n= ( M-L+1) × ( N-L+1)。 提取每个块 的特征向量的时间复杂度为 O( L2 ), 所有块的提取时间 为 O( n×L2 )。 匹配阶段, Kd-tree 搜索 k 个最近邻目标时 间为 O(k×logn ), 所有块的匹配时间为 O(n×k×log n ) 。因 此, 总的时间开支约为 O( n×L2 ) + O( n×k×logn )。 可以看 出, 本方法的时间复杂度主要依赖于图像本身的大小。

  本实验从图像集中选取 50 张 512×512 的复制粘贴篡 改图像 (一个小类选取一张), 篡改区域为小尺寸类别, 分别用本文方法和参考文献的 6 种方法进行对比验证, 并将特征提取和特征匹配分开对比 。实验结果如表 4 所 示 。从实验结果来看, 本文提出的检测方法整体时间开 销相比而言具有一定的优势。
\

  4 结束语

  本文提出了一种基于图像块的复制粘贴篡改盲检测 方法 。该方法首先将图像转换为灰度模式, 并划分成固 定大小的图像块, 然后对每个块进行离散余弦变换, 只 保留低频信号系数符号作为特征矩阵, 接下来使用元胞 自动机对特征矩阵进一步压缩, 最终得到 5 维特征向量, 在此基础上, 使用 Kd-tree 进行 5 维最近邻搜索, 最后进 行篡改区域判定以及修正 、标定等后处理。

  实验部分将本文提出的方法和 6 种同类方法进行对 比验证 。结果显示, 本方法在应对常见的 JPEG 压缩 、添 加高斯噪声 、亮度和对比度调整等后处理干扰下, 比同 类方法具有更强的鲁棒性。
\

  在运行时间上, 本文提出的方法还需要进一步提升, 下一步可以在图像块大小的动态调整 、图像块分割方法 等环节做进一步优化。

  参考文献:

  [1] 魏伟一,王婉茹,赵毅凡,等 . 基于区域划分和四元数的彩色图 像复制粘贴篡改检测[J]. 计算机工程与科学,2022.44(7):1256- 1264.
  [2] 全永志, 高树辉 . 基于 Harris 与LCP 的同图复制粘贴篡改检测 [J]. 激光杂志,2020.41(7):32-36.
  [3] 华秀茹,魏为民,栗风永 . 基于超像素分割和 SURF 特征点的图 像复制粘贴篡改检测[J]. 计算机应用与软件,2021.38(4):225- 230.
  [4] 肖斌,景如霞,毕秀丽,等 . 基于分组 SIFT 的图像复制粘贴篡改快速检测算法[J]. 通信学报,2020.41(3):62-70.
  [5] 邢文博,杜志淳 . 数字图像复制粘贴篡改取证[J]. 计算机科学, 2019.46(S1):380-384.
  [6] 饶俊慧,吴晓云 . 融合 DCT 与SVD 的半脆弱图像水印算法研究 [J]. 计算机仿真,2022.39(7):507-511.
  [7] Teerakanok S, Uehara T. Copy-move forgery detection: A state- of-the-art technical review and analysis[J]. IEEE Access, 2019. 7: 40550-40568.
  [8] Wang F, Li C, Tian L. An algorithm of detecting audio copy- move forgery based on DCT and SVD[C]//2017 IEEE 17th Inter‐ national Conference on Communication Technology (ICCT). IEEE, 2017: 1652- 1657.
  [9] 孔凡芝 ,李金龙 , 吴冬梅 . 基于 DWT-DCT 和 Zernike 矩的鲁棒 视频水印算法[J]. 计算机应用与软件,2020.37(4):309-315.
  [10] Mahmood T, Mehmood Z, Shah M, et al. A robust technique for copy-move forgery detection and localization in digital images via stationary wavelet and discrete cosine transform. J Vis Com ‐ mun Image Represent 2018;53:202- 14.
  [11] Jeelani Z, Qadir F. Cellular automata-based approach for digi ‐tal image scrambling[J]. Int J Intell Comput Cybern, 2018. 11: 353-370.
  [12] Kumar P, Ansari M H, Sharma A. MBC-CA: Multithreshold bi‐ nary conversion based salt-and-pepper noise removal using cellular automata[C]//International Conference on Computer Vi‐ sion and Image Processing. Springer, Singapore, 2019: 195-204.
  [13] 陈祥, 张勇, 陈云攀,等 . 融合 Hénon 映射和元胞自动机的图像 加密算法[J]. 小型微型计算机系统,2022.43(5):1061- 1067.
  [14] 王帆,伍世虔 . 一种基于模板和 DCT 变换的柔性电路板配准 方法[J]. 计算机与现代化,2021(10):57-62.
  [15] 刘颖,徐伟,朱婷鸽 . 基于提升小波变换和离散余弦变换的彩 色图像水印算法[J]. 科学技术与工程,2020.20(10):4056-4060.
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/ligonglunwen/65397.html

相关内容

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml