申铉京(1958),男,教授,博士生导师.研究方向:图像处理与模式识别,多媒体信息安全,智能控制技术.E-mail:xjshen@jlu.edu.cn
针对彩色图像复制-粘贴篡改中误匹配的问题,提出一种基于SIFT和HSI模型的彩色图像复制-粘贴盲鉴别算法。首先确定彩色图像的SIFT特征点和特征向量;然后对每个SIFT特征点提取HSI彩色特征;最后对两两不同特征点的SIFT特征向量和HSI特征向量进行匹配,确定图像的复制-粘贴篡改区域。实验结果表明:本文算法与SIFT算法、SURF算法和改进SIFT算法相比,能有效地降低误匹配率,并对高斯模糊、白噪声和JPEG重压缩有较强的鲁棒性。
In order to solve the problem of the false matching in detecting copy-move forgeries, an improved method based on Scale Invariant Feature Transform (SIFT) and HSI was proposed in this study. First, the SIFT key points and SIFT feature vector are extracted. Secondly, for each SIFT point the HSI feature is extract. Finally, the SIFT feature vector and the HSI feature vector between every two different key points are matched to determine the copy-move regions. The experimental results show that the proposed algorithm based on SIFT and HSI can reduce false matching rate in comparison with the SIFT algorithm, the SURF algorithm and the improved SIFT algorithm. The proposed algorithm has higher robustness even when an image is distorted by Gaussian blur, white noise and JPEG recompression.
图像篡改手段多种多样,其中复制-粘贴操作是最常见的篡改方式[ 1, 2, 3]。复制-粘贴篡改的盲鉴别算法可以分为两类:①基于图像块匹配的盲鉴别算法;②基于特征点匹配的盲鉴别算法。对于第一类盲鉴别算法,2007年,骆伟祺等[ 4]提出了图像块均匀分割得到维数较低的特征算法。2011年,Huang等[ 5]对量化后的DCT(Discrete cosine transform)系数矩阵进行降维,降低了计算复杂性。2012年,Muhammad等[ 6]提取DyWT(Dyadic wavelet transform)特征,增强了算法的鲁棒性。但是,这些算法的分块大小很难确定,不具有旋转、缩放不变性,并且对噪声、模糊等操作的鲁棒性较弱。对于第二类盲鉴别算法,2008年,Huang等[ 7]提出基于尺度不变特征变换SIFT(Scale invariant feature transform)的复制-粘贴篡改盲鉴别算法。2010年,Xu等[ 8]提出了基于SURF特征的检测算法,提高了算法的效率。2011年,Amerini改进了SIFT算法,对SIFT特征点进行分层聚类,淘汰特征点较少的类,以去除误匹配[ 9]。这些基于特征点匹配的盲鉴别算法克服了图像块匹配算法分块大小难确定、鲁棒性弱的缺点,但由于只考虑了图像的梯度信息,改进算法也过于依赖聚类结果,特征点匹配的准确率较低。
针对以上问题,本文提出了基于SIFT和HSI模型的彩色图像复制-粘贴盲鉴别算法,该算法能明显消除传统SIFT算法误匹配的问题,提高鉴别的准确率。
SIFT算法是特征点提取的经典算法,SIFT特征向量对旋转、缩放、模糊、JPEG重压缩等操作有较强的鲁棒性。首先建立图像的高斯尺度空间和高斯差分尺度空间;然后确定SIFT特征点;最后统计特征点的SIFT特征,形成128维SIFT特征向量。SIFT特征提取的流程如图1所示。
对于彩色图像,SIFT算法需要首先将其转变成灰度图像,然后再提取特征,这样会丢失大部分彩色信息。本文对42幅彩色图像进行实验测试,发现每幅图像的误匹配点中,均存在彩色信息不一致的问题。因此,本文将SIFT特征与彩色信息相结合,对彩色图像的复制-粘贴篡改进行检测。
图像的彩色信息能够克服SIFT特征匹配时梯度信息一致、但彩色信息不一致引发的误匹配问题,因此,本文在对特征点提取SIFT特征的基础上,提取其HSI彩色特征。
HSI彩色模型克服了RGB彩色模型只考虑图像亮度信息、忽略图像颜色信息的缺点,它全面考虑彩色图像的亮度、颜色等信息。其中, H代表色调,即人对不同颜色的感受; S代表饱和度,即颜色的纯度; I代表强度,即颜色的明亮程度。
对于一幅RGB彩色图像,可以提取 H 、 S和 I的信息。本文算法中,对每个SIFT特征点i分别提取H、S和I彩色信息,并记为H(i)、S(i)、I(i),其计算公式如式(1)(2)(3)所示:
(1) |
其中:
(2) |
(3) |
式中:R、G、B分别表示特征点i的R、G和B值。
特征点的HSI彩色特征可以去除梯度特征相似而彩色信息不一致的误匹配特征点。
分别构造特征点的SIFT和彩色特征向量后,对于任意两两特征点,进行特征匹配,进而判断图像中是否存在复制-粘贴篡改的区域。特征匹配的过程如下所示:
(1)为了降低不均匀光照的影响,首先分别对SIFT特征和HSI彩色特征进行归一化。对特征点进行特征提取后,可以得到其128维SIFT特征向量和3维HSI彩色特征向量。设特点
(4) |
式中:feat_sift_nor(i)为归一化后的feat_sift(i);|feat_sift(i)|为向量feat_sift(i)的模。
(5) |
式中:feat_hsi_nor(i)为归一化后的feat_hsi(i);|feat_hsi(i)|为向量feat_hsi(i)的模。
(2)对于两两特征点
(6) |
(7) |
(3)如果特征点i和j匹配,则它们的SIFT特征向量和HSI彩色特征向量都应该是相等的,即feat_sift_nor(i)=feat_sift_nor(j),且feat_hsi_nor(i)=feat_hsi_nor(j),即这两个特征点的SIFT特征和HSI特征的内积分别为1。
设特征向量的匹配阈值为thr(0 (4)将所有匹配的特征点对用连线标记,连线集中的两个区域被判定为复制粘贴的篡改区域。
本算法实验的硬件环境为:主频2.60 GHz,Intel Celeron E3400处理器,3 G内存;软件环境为Matlab R2009b。
经过多次实验,特征向量的匹配阈值
在相同的实验环境下,针对相同的图像数据,对文献[ 7, 8, 9]中算法和本文算法进行实验对比分析。
图2(a)、图3(a)和图4(a)是未经过篡改的原始图像,图2(b)是对图2(a)中的“鹤”进行顺时针旋转20°、缩放0.5倍后复制粘贴得到的篡改图像,图3(b)是将图3(a)右上角“屋尖”缩放0.9倍复制到左上角得到的篡改图像,图4(b)是将图4(a)右上角“粉色帆船”进行顺时针旋转40°、缩放0.9倍后复制粘贴到左下方得到的篡改图像。图2(c)~(f)、图3(c)~(f)、图4(c)~(f)分别是不同算法的检测结果。
图2、图3和图4中的连线部分标记出了检测到的复制粘贴篡改区域,图2(e)、图3(e)和图4(e)中圆点与五角星点标记的是SIFT特征点的分类结果。
从实验结果可以看出:
(1)在背景简单的图2篡改实验中,文献[ 7]和文献[ 8]算法结果中“鹤翅膀”处有明显的误匹配;由于复制区域与粘贴区域距离较近,文献[ 9]的SIFT特征点匹配对聚类结果不理想,没有达到去除误匹配的效果。
(2)在背景较复杂的图3篡改实验中,文献[ 7]、文献[ 8]和文献[ 9]虽然能检测到篡改区域,但误匹配较多,同时造成文献[ 9]的SIFT特征点匹配对聚类结果出现明显错误。
(3)在背景相似的图4篡改实验中,文献[ 7]存在误匹配的情况,文献[ 8]几乎没有检测到篡改区域,文献[ 9]聚类结果正确,效果较好。
(4)在这三个实验中,本文算法都有效地去除了误匹配,具有良好的实验结果。
为了去除篡改痕迹,造假者通常会对篡改后的图像进行模糊、加噪、JPEG重压缩等后处理,算法的鲁棒性是指算法抵抗这些后处理操作、检测并定位篡改的能力。
(1)高斯模糊实验
分别对图2(b)添加0.5和1的高斯模糊,然后进行检测,图5、图6分别是不同算法的检测结果。
(2)白噪声实验
分别对图2(b)添加信噪比为30 dB和70 dB的白噪声,然后进行检测,如图7、图8所示。
(3)JPEG重压缩实验
对图2(b)分别进行质量因子为40和70的JPEG重压缩,然后进行检测,如图9、图10所示。
从以上鲁棒性实验结果可以看出:
(1)由于对篡改图像进行了模糊、噪声和JPEG重压缩后处理操作,像素点的颜色信息发生了变化,本文算法添加HSI彩色特征,去除了一部分颜色信息不一致的匹配点对,因此,鲁棒性实验结果的匹配对明显减少,但仍精确指出了复制粘贴篡改区域。
(2)本文算法不仅可以有效地去除误匹配,而且对于高斯模糊、白噪声和JPEG重压缩等后处理,其检测结果也明显优于文献[ 7]、文献[ 8]和文献[ 9]的算法,说明本文算法具有较强的鲁棒性。
本文算法对SIFT算法进行了改进,在SIFT特征向量的基础上增加了HSI彩色信息特征,能有效去除因梯度信息一致、但彩色信息不一致而产生的误匹配,与SIFT算法、SURF算法和改进的SIFT算法相比,本文算法增大了篡改检测的精度,并有较强的鲁棒性。但是,由于SIFT特征提取的时间复杂度较高,本文算法在时间复杂度上还有较大的改进空间,将在以后的研究中继续改进。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|