基于随机置乱的内容感知图像缩放算法
赵旦峰, 王博, 杨大伟
哈尔滨工程大学 信息与通信工程学院,哈尔滨 150001

作者简介:赵旦峰(1961-),男,教授,博士生导师.研究方向:通信信号处理.E-mail:zhaodanfeng@hrbeu.edu.cn

摘要

针对非等比例缩放算法中线裁剪技术动态规划的复杂性,提出基于随机置乱的内容感知图像缩放算法。该算法利用视觉显著图随机重置能量序列的方式,使得在保护主体区域不被破坏的情况下,避免过度删除非重要区域所造成的图像局部失真。仿真结果表明,与线裁剪算法相比,本文算法在有效保护图像内容的同时,显著提高缩放速度,并能避免图像失真。

关键词: 信息处理技术; 视觉显著图; 内容感知; 随机置乱; 图像缩放
中图分类号:TN911.73 文献标志码:A 文章编号:1671-5497(2015)04-1324-05
Content-aware image resizing based on random permutation
ZHAO Dan-feng, WANG Bo, YANG Da-wei
College of Information and Communication Engineering, Harbin Engineering University, Harbin 150001, China
Abstract

A novel content-aware image resizing mechanism based random permutation was proposed for the dynamic programming in seam carving algorithm. The proposed algorithm exploits visual saliency to get a random scrambled energy vector, which is extracted uniform to protect important image content. This algorithm can efficiently avoid the local distortion caused by excessive deleting non-important area. The simulation results show that the proposed algorithm gets a better visual effect. Compared with the seam carving algorithm, the proposed algorithm not only effectively protects the important image content, but also increases the speed for image resizing and avoid image distortion.

Keyword: information processing; visual saliency; content-aware; random permutation; image resizing
0 引 言

随着不同分辨率和尺寸比例显示设备不断普及, 相同分辨率图像在不同显示设备上可能会呈现不同畸变结果。为适应多样化的显示终端, 图像和视频的非等比例缩放成为亟待解决的关键问题。最简单有效的非等比例缩放方法是直接删除不重要的行和列, 但过度删除非重要区域会造成图像局部失真。传统图像缩放算法一般分为均匀缩放算法和图像剪切算法[1, 2, 3]。其中均匀缩放算法在进行非等比例缩放时会造成图像主体拉伸或压扁; 整幅图像采用相同的缩放算子, 且不保留图像主体区域, 在分辨率较低时并不适用。而另一种广泛采用的图像缩放裁剪技术, 不可避免地导致图像信息的丢失。

近年来, 基于内容感知的缩放技术成为图像自适应缩放算法领域的研究热点。文献[4]提出一种基于鱼眼变形的图像缩放算法, 但该算法只能处理含有单个物体的图像。文献[5]利用图像分割划分区域, 在保护图像重要区域的同时却降低了系统的鲁棒性。目前最具代表性的内容感知缩放算法是线裁剪(Seam carving, SC)技术[6], 该算法为获得不失真的非等比例缩放图像, 多次运用动态规划迭代, 使得计算量随图像分辨率而呈几何级数增长, 而且, 能量函数定义的局限也使得其存在结构失真的缺陷[7]。在此基础上, 很多学者又提出多种改进算法[8, 9, 10]。文献[11]提出基于重要度扩散和自适应采样的图像/视频缩放算法, 在重要区域的保护和整体概貌之间进行平衡, 避免过多删除非重要区域。但该算法在每删除一行和一列后都要对其相邻行或列进行重要度提升, 虽能得到较高的图像质量, 但仍存在计算量大的问题, 并不适用于实时的视频信号处理。

本文提出了一种基于随机置乱的内容感知图像缩放算法(Content-aware image resizing algorithm based on random permutation, CARP)。该算法将视觉显著图得到的行/列能量向量进行随机重排, 并按一定规则抽取原始图像中低于阈值的行/列。与SC算法相比, CARP算法在有效保护图像主体区域不发生畸变的同时, 能显著提高缩放速度, 是一种运算复杂度较低, 易于实时处理的内容感知缩放算法。

1 CARP算法描述

内容感知图像缩放结果对图像内容及重要性的定义有很高的依赖性, 比较理想的情况是选择一种符合人眼特性的图像重要度识别方法。文献[12]中提出的基于图形的视觉显著度模型(Graph-based visual saliency, GBVS)得到符合人眼特性98%的重要区域, 且该模型简单、合理。因此, 本文采用GBVS算法建立显著度图, 以提高图像内容识别精度。

1.1 单坐标方向尺寸缩放

单坐标方向尺寸缩放, 图像尺寸改变仅发生在水平或垂直单个方向。本文以列方向尺寸变换为例阐述算法内容。如果行方向尺寸变换, 仅需将图像进行转置处理即可。

CARP算法如图1所示, 本文结合随机置乱能量向量的思想, 目的是在保护主体区域不被破坏的同时, 避免同一区域过度删除行或列, 从而达到非等比例缩放的目的。

图1 CARP算法在单坐标方向的原理框图Fig.1 Schematic diagram of CARP algorithm in single coordinate direction

假设输入原始图像F和待缩放目标图像H分辨率大小分别为m× nm× n', 原始图像F进行单坐标方向尺寸变换, 即n-n'=c(czc≠ 0)。当c> 0时, 通过本文算法删除列实现; 当c< 0时, 通过本文算法插入列实现。不失一般性, 以n-n'=c(c> 0)为例, 本文算法步骤如下:

步骤1 利用GBVS算法由原始图像F得到大小为m× n的显著图G

步骤2 得到显著图G后, 需要计算能量向量。能量向量需要对显著图G的每一列进行求和得到, 令V=sum(G), 得到大小为1× n的能量向量V

步骤3 将能量向量V随机置乱, 即使得置乱后向量内元素顺序随机排列, 令Vs=rand(V), 得到置乱后的向量Vs; 同时根据能量向量确定阈值T=1/2× max(V)。

步骤4 根据抽取列数c以及阈值T, 对置乱后的向量Vs进行均匀抽取, 假设置乱后向量Vs(i)(in, iz+)满足Vs(i)< T, 则抽取; 否则, 寻找下一个满足条件的位置。

步骤5 如果步骤4结束后实际抽取列数c'< c, 即有剩余列未抽取, 返回步骤4继续执行, 直至c'=c, 结束。

经CARP算法计算后, 得到目标图像H, H即为非等比例缩放后的结果。

1.2 双坐标方向的尺寸缩放

当目标图像尺寸在水平和垂直两个方向都发生变化时, 需要讨论水平和垂直方向的次序问题, 在文献[6]中利用索引矩阵解决了这个问题, 但运算复杂度较大。本文利用目标图像与原始图像间的比例计算, 避免双坐标方向改变存在的次序计算问题, 降低运算复杂度。缩放前后尺寸大小的对应关系为:

m-m'=c1(c1zc10)(1)n-n'=c2(c2zc20)(2)

c1> 0且c2> 0时, 为双坐标方向尺寸放大; 当c1< 0且c2< 0时, 为双坐标方向尺寸缩小。以缩小为例, 双坐标方向尺寸变换与单坐标方向尺寸变换区别如下:

(1)令a=m/n, b=m'/n', 判断ab的大小来确定进行行或者列的抽取。当a< b时, 为列抽取; 当a> b时, 为行抽取。

(2)以列抽取为例, 令cd= n-(m/mm)× nn , 其中cd表示待抽取列数, · 为向下取整算子。

(3)确定抽取方向后, 按照单坐标方向尺寸缩放步骤完成双坐标方向变换, 直至变换后图像H与目标图像分辨率相同。

(4)由于双坐标方向变换后图像H与目标图像只具有相同分辨率比例, 但尺寸不同, 还需对其进行等比例缩放直至与目标图像尺寸相同, 其中等比例缩放算法可以采用文献[13]中的算法, 也可以采用其他传统缩放算法[14]。如果a> b时, 抽取行, 方法与抽取列相同。

2 仿真实验和性能分析

为了测试本文算法性能, 与文献[6]的SC算法进行比较, 其中GBVS的算法见文献[15]。在图2中, 给出3幅测试图像, 包括代表性的风景图、人物图和动物图。对3幅测试图像进行两组仿真实验, 表1给出缩放前后图像的分辨率, 第一组仿真实验中原始图像沿水平方向抽取20列, 第二组仿真实验中原始图像沿垂直方向抽取60行。表2显示SC算法和本文算法在二组仿真实验中的平均运行时间, 本文采用平均运行时间作为算法复杂度的评价指标。

图2 测试图像及分辨率Fig.2 Text images and resolution

表1 分辨率改变 Table 1 Resolution changing

表2中两组仿真实验数据分析显示, 本文算法运算速度明显高于SC算法, 并且当缩放尺度较大时, SC算法运算速度明显降低, 而本文算法运算速度变化不明显。图3给出两种算法在图像缩小上的比较, 本文采用主观评价方法对缩放后

表2 两组仿真实验平均运行时间 Table 2 Average run time of two groups simulation

图3 第一组仿真在人物图上主观视觉效果的比较Fig.3 Subjective visual effect comparison in character of the first group simulation

图像质量进行评价。仿真实验结果表明, 本文算法在保护图像重要内容的同时, 获得了较好整体视觉效果, 避免了图像局部严重失真的现象。在图3(d)中, SC算法得到的图片出现明显局部失真现象, 图3(e)中, 用本文算法处理得到的图像主体区域没有失真现象发生, 且获得了较好的整体视觉效果。由于非等比例抽取方式的局限性, 本文算法在单方向抽取行/列数目存在极限, 该极限L为原始图像列/行与视觉主体宽/高之差, 抽取行/列数目越接近L, 得到的图像质量效果越差。如图4所示, 当抽取数目接近极限L时, 主体区域被抽取, 使得主体区域被破坏。

图4 图像行/列抽取数目接近极限L时的效果图Fig.4 Extraction number of row/column closing to limit

3 结束语

本文提出了CARP算法, 引入随机重排视觉显著图能量向量的思想, 在保护重要区域的同时, 避免在同一区域过度删除, 使得缩放后图像效果较好。与SC算法相比, 缩放尺度越大, CARP算法平均运行时间降低幅度越明显; 与直接删除行/列算法相比, 能够提高图像质量, 避免局部失真严重的问题。CARP算法在获得较好图像质量的同时, 大大降低了运算复杂度, 符合非等比例实时缩放的要求, 为今后在硬件平台上的实现提供了理论依据。

The authors have declared that no competing interests exist.

参考文献
[1] 赵旦峰, 王博, 杨大伟, . 可分级视频编码中重采样滤波器设计[J]. 吉林大学学报: 工学版, 2012, 42(1): 199-202.
Zhao Dan-feng, Wang Bo, Yang Da-wei, et al. Resampling filter design within scalable video coding[J]. Journal of Jilin University (Engineering and Technology Edition), 2012, 42(1): 199-202. [本文引用:1]
[2] Suh B, Ling H, Bederson B, et al. Automatic thumbnail cropping and its effectiveness[C]∥Proceedings of the 16th Annual ACM Symposium on User Interface Software and Technology, New York, ACM, 2003: 95-104. [本文引用:1]
[3] Ciocca G, Cusano C, Gasparini F, et al. Self-adaptive image cropping for small displays[J]. IEEE Trans on Consumer Electronics, 2007, 53(4): 1622-1627. [本文引用:1]
[4] Liu F, Gleicher M. Automatic image retargeting with fisheye view warping[C]∥Proceedings of the 16th Annual ACM Symposium on User Interface Software and Technology, New York, ACM, 2005: 153-162. [本文引用:1]
[5] Setlur V, Lechner T, Nienhoucs M, et al. Retargeting images and video for preserving information saliency[J]. IEEE Computer Graphics and Applications, 2007, 27(5): 80-88. [本文引用:1]
[6] Avidan S, Shamir A. Seam carving for content-aware image resizing[J]. ACM Trans on Graphics, 2007, 26(3): 10-18. [本文引用:1]
[7] 聂栋栋, 马勤勇. 基于全局图像结构信息的Seam Carving算法[J]. 计算机应用研究, 2011, 38(3): 1198-1120.
Nie Dong-dong, Ma Qin-yong. Seam carving algorithm based on global image structure[J]. Application Research of Computer, 2011, 38(3): 1198-1120. [本文引用:1]
[8] Wonjun K, Changick K. A novel image importance model for content-aware image resizing[C]∥The 18th IEEE International Conference on Image Processing, 2011: 2469-2472. [本文引用:1]
[9] Liang Y, Su Z, Luo X. Patch-wise scaling method for content-ware image resizing[J]. Journal of Signal Processing, 2012, 92(5): 1243-1257. [本文引用:1]
[10] Chen D Y, Luo Y S. Content-aware video resizing based on salient visual cubes[J]. Journal of Visual Communication and Image Representation, 2011, 22(3): 226-236. [本文引用:1]
[11] 王会千, 杨高波, 张兆扬, . 基于重要度扩散和自适应采样的图像/视频缩放技术[J]. 通信学报, 2011, 32(8): 165-170.
Wang Hui-qian, Yang Gao-bo, Zhang Zhao-yang, et al. Image and video resizing algorithm based on importance diffusion and adaptive scaling[J]. Journal on Communication, 2011, 32(8): 165-170. [本文引用:1]
[12] Harvel J, Koch C, Perona P. Graph-based visual saliency[J]. Advances in Neural Information Processing Systems, 2007, 19: 545-552. [本文引用:1]
[13] 赵旦峰, 王博, 杨大伟. 一种边缘定向平滑图像插值算法[J]. 电子与信息学报, 2012, 34(7): 1543-1546.
Zhao Dan-feng, Wang Bo, Yang Da-wei. An edge-directed smoothness algorithm for image interpolation[J]. Journal of Electronics and Information Technology, 2012, 34(7): 1543-1546. [本文引用:1]
[14] 符祥, 郭宝龙. 图像插值技术综述[J]. 计算机工程与设计, 2009, 30(1): 141-144.
Fu Xiang, Guo Bao-long. Overview of image interpolation technology[J]. Computer Engineering and Design, 2009, 30(1): 141-144. [本文引用:1]
[15] Harvel J. Graph-based visual saliency[EB/OL]. [2012-11-11]. http://www.klab.caltech.edu/~harel/share/gbvs.php. [本文引用:1]