基于SIFT和HSI模型的彩色图像复制-粘贴盲鉴别算法
申铉京1,2, 朱叶1,2, 吕颖达1,2, 陈海鹏1,2
1.吉林大学 计算机科学与技术学院,长春 130012
2.吉林大学 符号计算与知识工程教育部重点实验室,长春 130012
陈海鹏(1978),男,讲师.研究方向:图像处理与模式识别,多媒体信息安全.E-mail:chenhp@jlu.edu.cn

申铉京(1958),男,教授,博士生导师.研究方向:图像处理与模式识别,多媒体信息安全,智能控制技术.E-mail:xjshen@jlu.edu.cn

摘要

针对彩色图像复制-粘贴篡改中误匹配的问题,提出一种基于SIFT和HSI模型的彩色图像复制-粘贴盲鉴别算法。首先确定彩色图像的SIFT特征点和特征向量;然后对每个SIFT特征点提取HSI彩色特征;最后对两两不同特征点的SIFT特征向量和HSI特征向量进行匹配,确定图像的复制-粘贴篡改区域。实验结果表明:本文算法与SIFT算法、SURF算法和改进SIFT算法相比,能有效地降低误匹配率,并对高斯模糊、白噪声和JPEG重压缩有较强的鲁棒性。

关键词: 计算机应用; 盲鉴别; 图像复制-粘贴篡改; SIFT特征向量; HSI彩色空间
中图分类号:TP391 文献标志码:A 文章编号:1671-5497(2014)01-0171-06
Coloured image copy-move forgery detection based on SIFT and HSI
SHEN Xuan-jing1,2, ZHU Ye1,2, LYU Ying-da1,2, CHEN Hai-peng1,2
1.College of Computer Science and Technology, Jilin University, Changchun 130012, China
2.Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Jilin University, Changchun 130012, China
Abstract

In order to solve the problem of the false matching in detecting copy-move forgeries, an improved method based on Scale Invariant Feature Transform (SIFT) and HSI was proposed in this study. First, the SIFT key points and SIFT feature vector are extracted. Secondly, for each SIFT point the HSI feature is extract. Finally, the SIFT feature vector and the HSI feature vector between every two different key points are matched to determine the copy-move regions. The experimental results show that the proposed algorithm based on SIFT and HSI can reduce false matching rate in comparison with the SIFT algorithm, the SURF algorithm and the improved SIFT algorithm. The proposed algorithm has higher robustness even when an image is distorted by Gaussian blur, white noise and JPEG recompression.

Keyword: computer application; blind identification; copy-move forgery; SIFT feature vector; HSI color space
0 引言

图像篡改手段多种多样,其中复制-粘贴操作是最常见的篡改方式[ 1, 2, 3]。复制-粘贴篡改的盲鉴别算法可以分为两类:①基于图像块匹配的盲鉴别算法;②基于特征点匹配的盲鉴别算法。对于第一类盲鉴别算法,2007年,骆伟祺等[ 4]提出了图像块均匀分割得到维数较低的特征算法。2011年,Huang等[ 5]对量化后的DCT(Discrete cosine transform)系数矩阵进行降维,降低了计算复杂性。2012年,Muhammad等[ 6]提取DyWT(Dyadic wavelet transform)特征,增强了算法的鲁棒性。但是,这些算法的分块大小很难确定,不具有旋转、缩放不变性,并且对噪声、模糊等操作的鲁棒性较弱。对于第二类盲鉴别算法,2008年,Huang等[ 7]提出基于尺度不变特征变换SIFT(Scale invariant feature transform)的复制-粘贴篡改盲鉴别算法。2010年,Xu等[ 8]提出了基于SURF特征的检测算法,提高了算法的效率。2011年,Amerini改进了SIFT算法,对SIFT特征点进行分层聚类,淘汰特征点较少的类,以去除误匹配[ 9]。这些基于特征点匹配的盲鉴别算法克服了图像块匹配算法分块大小难确定、鲁棒性弱的缺点,但由于只考虑了图像的梯度信息,改进算法也过于依赖聚类结果,特征点匹配的准确率较低。

针对以上问题,本文提出了基于SIFT和HSI模型的彩色图像复制-粘贴盲鉴别算法,该算法能明显消除传统SIFT算法误匹配的问题,提高鉴别的准确率。

1 特征提取
1.1 SIFT特征提取

SIFT算法是特征点提取的经典算法,SIFT特征向量对旋转、缩放、模糊、JPEG重压缩等操作有较强的鲁棒性。首先建立图像的高斯尺度空间和高斯差分尺度空间;然后确定SIFT特征点;最后统计特征点的SIFT特征,形成128维SIFT特征向量。SIFT特征提取的流程如图1所示。

图1 提取SIFT特征向量流程图Fig.1 Flow chart of SIFT algorithm

对于彩色图像,SIFT算法需要首先将其转变成灰度图像,然后再提取特征,这样会丢失大部分彩色信息。本文对42幅彩色图像进行实验测试,发现每幅图像的误匹配点中,均存在彩色信息不一致的问题。因此,本文将SIFT特征与彩色信息相结合,对彩色图像的复制-粘贴篡改进行检测。

1.2 彩色特征提取

图像的彩色信息能够克服SIFT特征匹配时梯度信息一致、但彩色信息不一致引发的误匹配问题,因此,本文在对特征点提取SIFT特征的基础上,提取其HSI彩色特征。

HSI彩色模型克服了RGB彩色模型只考虑图像亮度信息、忽略图像颜色信息的缺点,它全面考虑彩色图像的亮度、颜色等信息。其中, H代表色调,即人对不同颜色的感受; S代表饱和度,即颜色的纯度; I代表强度,即颜色的明亮程度。

对于一幅RGB彩色图像,可以提取 H S I的信息。本文算法中,对每个SIFT特征点i分别提取H、S和I彩色信息,并记为H(i)、S(i)、I(i),其计算公式如式(1)(2)(3)所示:

(1)

其中:

(2)

(3)

式中:R、G、B分别表示特征点i的R、G和B值。

特征点的HSI彩色特征可以去除梯度特征相似而彩色信息不一致的误匹配特征点。

2 特征匹配

分别构造特征点的SIFT和彩色特征向量后,对于任意两两特征点,进行特征匹配,进而判断图像中是否存在复制-粘贴篡改的区域。特征匹配的过程如下所示:

(1)为了降低不均匀光照的影响,首先分别对SIFT特征和HSI彩色特征进行归一化。对特征点进行特征提取后,可以得到其128维SIFT特征向量和3维HSI彩色特征向量。设特点 的SIFT特征向量为feat_sift(i),其归一化过程如式(4)所示;HSI彩色特征向量为feat_hsi(i),其归一化过程如式(5)所示。

(4)

式中:feat_sift_nor(i)为归一化后的feat_sift(i);|feat_sift(i)|为向量feat_sift(i)的模。

(5)

式中:feat_hsi_nor(i)为归一化后的feat_hsi(i);|feat_hsi(i)|为向量feat_hsi(i)的模。

(2)对于两两特征点 计算其归一化后的SIFT特征向量和彩色特征向量的内积,即in_sift和in_hsi,如式(6)(7)所示:

(6)

(7)

(3)如果特征点i和j匹配,则它们的SIFT特征向量和HSI彩色特征向量都应该是相等的,即feat_sift_nor(i)=feat_sift_nor(j),且feat_hsi_nor(i)=feat_hsi_nor(j),即这两个特征点的SIFT特征和HSI特征的内积分别为1。

设特征向量的匹配阈值为thr(0

(4)将所有匹配的特征点对用连线标记,连线集中的两个区域被判定为复制粘贴的篡改区域。

3 实验结果

本算法实验的硬件环境为:主频2.60 GHz,Intel Celeron E3400处理器,3 G内存;软件环境为Matlab R2009b。

经过多次实验,特征向量的匹配阈值 取为0.99,以平衡算法的计算复杂性和误匹配率。

在相同的实验环境下,针对相同的图像数据,对文献[ 7, 8, 9]中算法和本文算法进行实验对比分析。

3.1 篡改图像实验

图2(a)、图3(a)和图4(a)是未经过篡改的原始图像,图2(b)是对图2(a)中的“鹤”进行顺时针旋转20°、缩放0.5倍后复制粘贴得到的篡改图像,图3(b)是将图3(a)右上角“屋尖”缩放0.9倍复制到左上角得到的篡改图像,图4(b)是将图4(a)右上角“粉色帆船”进行顺时针旋转40°、缩放0.9倍后复制粘贴到左下方得到的篡改图像。图2(c)~(f)、图3(c)~(f)、图4(c)~(f)分别是不同算法的检测结果。

图2 缩放旋转实验结果Fig.2 Result of zoom and rotation experiments

图3 缩放实验结果Fig.3 Result of zoom experiments

图4 缩放旋转实验结果Fig.4 Result of zoom and rotation experiments

图2图3图4中的连线部分标记出了检测到的复制粘贴篡改区域,图2(e)、图3(e)和图4(e)中圆点与五角星点标记的是SIFT特征点的分类结果。

从实验结果可以看出:

(1)在背景简单的图2篡改实验中,文献[ 7]和文献[ 8]算法结果中“鹤翅膀”处有明显的误匹配;由于复制区域与粘贴区域距离较近,文献[ 9]的SIFT特征点匹配对聚类结果不理想,没有达到去除误匹配的效果。

(2)在背景较复杂的图3篡改实验中,文献[ 7]、文献[ 8]和文献[ 9]虽然能检测到篡改区域,但误匹配较多,同时造成文献[ 9]的SIFT特征点匹配对聚类结果出现明显错误。

(3)在背景相似的图4篡改实验中,文献[ 7]存在误匹配的情况,文献[ 8]几乎没有检测到篡改区域,文献[ 9]聚类结果正确,效果较好。

(4)在这三个实验中,本文算法都有效地去除了误匹配,具有良好的实验结果。

3.2 鲁棒性实验

为了去除篡改痕迹,造假者通常会对篡改后的图像进行模糊、加噪、JPEG重压缩等后处理,算法的鲁棒性是指算法抵抗这些后处理操作、检测并定位篡改的能力。

(1)高斯模糊实验

分别对图2(b)添加0.5和1的高斯模糊,然后进行检测,图5图6分别是不同算法的检测结果。

图5 添加0.5高斯模糊实验结果Fig.5 Result of adding 0.5 Gaussian blur experiments

图6 添加1高斯模糊实验结果Fig.6 Result of adding 1 Gaussian blur experiments

(2)白噪声实验

分别对图2(b)添加信噪比为30 dB和70 dB的白噪声,然后进行检测,如图7图8所示。

图7 添加30 dB白噪声实验结果Fig.7 Result of adding 30 dB white noise experiments

图8 添加70 dB白噪声实验结果Fig.8 Result of adding 70 dB white noise experiments

(3)JPEG重压缩实验

图2(b)分别进行质量因子为40和70的JPEG重压缩,然后进行检测,如图9图10所示。

图9 添加40JPEG重压缩实验结果Fig.9 Result of 40 JPEG recompression experiments

图10 添加70JPEG重压缩实验结果Fig.10 Result of 70 JPEG recompression experiments

从以上鲁棒性实验结果可以看出:

(1)由于对篡改图像进行了模糊、噪声和JPEG重压缩后处理操作,像素点的颜色信息发生了变化,本文算法添加HSI彩色特征,去除了一部分颜色信息不一致的匹配点对,因此,鲁棒性实验结果的匹配对明显减少,但仍精确指出了复制粘贴篡改区域。

(2)本文算法不仅可以有效地去除误匹配,而且对于高斯模糊、白噪声和JPEG重压缩等后处理,其检测结果也明显优于文献[ 7]、文献[ 8]和文献[ 9]的算法,说明本文算法具有较强的鲁棒性。

3.3 算法性能分析

设匹配的特征点总数为P,正确匹配的特征点数目为Q,错误匹配的特征点数目为P-Q,则定义误检率w为

(10)

针对100幅图像,测试文献[ 7]、文献[ 8]、文献[ 9]和本文算法的性能,分别统计了其在不同程度高斯模糊、白噪声和JPEG重压缩情况下的误检率,如表1~表3所示。

表1 添加不同高斯模糊的误检率对比表 Table 1 False rate of Gaussian blur with different degree
表2 添加不同白噪声的误检率对比表 Table 2 False rate of white noise with different degree
表3 添加不同JPEG重压缩的误检率对比表 Table 3 False rate of JPEG with different degree

表1~表3中的数据可知,与文献[ 7]、文献[ 8]和文献[ 9]的算法相比,本文算法在不同程度的高斯模糊、白噪声和JPEG重压缩情况下,都能保证较低的误检率,证明了本文算法有较强的鲁棒性。

4 结束语

本文算法对SIFT算法进行了改进,在SIFT特征向量的基础上增加了HSI彩色信息特征,能有效去除因梯度信息一致、但彩色信息不一致而产生的误匹配,与SIFT算法、SURF算法和改进的SIFT算法相比,本文算法增大了篡改检测的精度,并有较强的鲁棒性。但是,由于SIFT特征提取的时间复杂度较高,本文算法在时间复杂度上还有较大的改进空间,将在以后的研究中继续改进。

The authors have declared that no competing interests exist.

参考文献
[1] 陈海鹏. 数字图像真伪鉴别技术研究[D]. 长春: 吉林大学计算机科学与技术学院, 2011.
Chen Hai-peng. Research on identification technology for authenticity of digital images[D]. Changchun: Jilin University, College of Computer Science and Technology, 2011. [本文引用:1]
[2] 吴琼, 李国辉, 涂丹, . 面向真实性鉴别的数字图像盲取证技术综述[J]. 自动化学报, 2008, 34(12): 1458-1466.
Wu Qiong, Li Guo-hui, Tu Dan, et al. A survey of blind digital image forensics technology for authenticity detection[J]. Acta Automatica Sinica, 2008, 34(12): 1458-1466. [本文引用:1] [CJCR: 0.572]
[3] 吕颖达, 申铉京, 苗健, . 基于光源方向不一致性的局部光源图像盲鉴别方法[J]. 吉林大学学报: 工学版, 2010, 40(6): 1673-1677.
Lyu Ying-da, Shen Xuan-jing, Miao Jian, et al. Blind identification for light source images based on inconsistency in light source direction[J]. Journal of Jilin University(Engineering and Technology Edition), 2010, 40(6): 1673-1677. [本文引用:1] [CJCR: 0.701]
[4] 骆伟祺, 黄继武, 丘国平. 鲁棒的区域复制图像篡改检测技术[J]. 计算机学报, 2007, 30(11): 1198-2007.
Luo Wei-qi, Huang Ji-wu, Qiu Guo-ping. Robust detection of region-duplication forgery in digital image[J]. Chinese Journal of Computers, 2007, 30(11): 1198-2007. [本文引用:1] [CJCR: 1.796]
[5] Huang Yan-ping, Lu Wei, Sun Wei, et al. Improved DCT-based detection of copy-move forgery in images[J]. Forensic Science International, 2011, 206(1-3): 178-184. [本文引用:1] [JCR: 2.307]
[6] Ghulam M, Muhammad H, George B. Passive copy move image forgery detection using undecimated dyadic wavelet transform[J]. Digital Investigation, 2012, 9(1): 49-57. [本文引用:1] [JCR: 0.63]
[7] Huang Hai-ling, Guo Wei-qiang, Zhang Yu. Detection of copy-move forgery in digital images using SIFT algorithm[C]∥IEEE Pacific-Asia Workshop on Computational Intelligence and Industrial Application, Wuhan, China, 2008: 1241-1245. [本文引用:8]
[8] Xu Bo, Wang Jun-wen, Liu Guang-jie, et al. Image copy-move forgery detection based on SURF[C]∥IEEE International on Multimedia Information Networking and Security, Nanjing, China, 2010: 889-892. [本文引用:8]
[9] Irene A, Lamberto B, Roberto C, et al. A SIFT-based forensic method for copy-move attack detection and transformation recovery[J]. IEEE Transactions on Information Forensics and Security, 2011, 6(3): 1099-1110. [本文引用:9] [JCR: 1.895]