基于小波空间特征谱熵的数字图像识别
肖钟捷1,2
1.武夷学院 数学与计算机学院,福建 武夷山 354300
2.北京航空航天大学 宇航学院,北京 100191

作者简介:肖钟捷(1971-),男,副教授.研究方向:数字图像处理,模式识别与智能系统.E-mail:fjxzj@126.com

摘要

针对目前数字图像识别准确率不高的问题,重点研究了基于小波空间特征谱熵的图像特征提取方法。该方法利用小波变换前后能量不变的原理,构造小波能量模式矩阵,对该矩阵进行奇异值分解,并求取了奇异值的特征谱熵作为图像的特征。实验结果表明,本文提出的图像特征提取方法能够获得很高的图像正确识别率,证明了该方法的有效性和实用性。

关键词: 图像处理; 数字图像; 特征提取; 小波变换; 特征谱熵
中图分类号:TP391 文献标志码:A 文章编号:1671-5497(2015)06-1994-05
Recognition of digital image based on wavelet space feature spectrum entropy
XIAO Zhong-jie1,2
1.Department of Mathematics and Computer Science, Wuyi University, Wuyishan 354300, China
2.School of Astronautics, Beijing University of Aeronautics and Astronautics, Beijing 100191, China
Abstract

The current recognition accuracy of digital image is lower. To overcome this problem, the method of image feature extraction based on wavelet space feature spectrum entropy is proposed. According to the principle that the energy is equal before and after the wavelet transform, the matrix of wavelet energy model is constructed. Then, the singular value decomposition of the matrix is performed. Finally, the feature spectrum entropy of the singular value is taken as the image feature. Experimental results show that the proposed image feature extraction method can obtain higher image recognition accuracy, and the effectiveness and practicality are proved.

Keyword: image processing; digital image; feature extraction; wavelet transform; feature spectrum entropy
0 引 言

随着科技水平的提高, 图像识别技术在生产生活中的应用已经越来越普遍, 发展至今已经在航空航天、医疗卫生、工业控制、运输物流等领域得到广泛使用[1, 2, 3, 4]。其中, 对于包含阿拉伯数字的图像识别是一个非常活跃的研究领域。数字识别在日常生活中非常常见, 比如对于商品条形码的识别、汽车牌照的识别、邮政系统货物标签的识别等等。因此, 研究对于包含数字有用信息图像的识别具有实际应用意义[5, 6]

对于数字图像的识别, 最为重要的一个步骤就是特征提取, 尤其是现实生活中, 很多物品受到自然、人为等因素的影响, 图像往往模糊不清、残缺不全, 给数字图像的特征提取带来了很大麻烦。目前, 应用比较多的特征提取方法包括区域分割矩阵法、不变矩法、主成分分析法、颜色特征法等[7, 8]。这些方法在一定程度上解决了数字图像的识别问题, 但是往往只在部分情况下可行, 对于图像质量不好, 尤其是噪声严重的数字图像, 往往效果不佳。究其原因, 这些方法只是单纯地在时域或频域对图像的特征进行提取, 忽略了一些重要的特征因素。

基于上述分析, 本文将图像的特征提取方法作为重点研究内容, 将小波变换技术应用到数字图像识别之中, 并将图像的小波特征谱熵作为其特征。实验分析可以看出, 本文提出的数字图像特征提取方法可以较为明显地区分不同的数字, 有效地提高了图像的识别准确率。

1 数字图像的识别过程

数字图像识别是一个较为复杂的过程, 一般包括图像采集、预处理、特征提取以及图像识别4个部分。其中, 图像采集就是利用取像设备获取图像; 图像预处理即对图像进行初步的变换操作, 包括灰度化、二值化、滤波等, 为下一步的特征提取打好基础; 特征提取是整个图像识别过程中非常重要的一个环节, 高质量的特征可以在很大程度上提高图像的识别准确率, 因此这个环节本文将重点研究。最后, 图像识别就是利用某种分类器将提取的特征与图像标签一一对应的过程, 目前很多识别算法都可以应用到图像识别中, 本文在最后的实验仿真部分应用神经网络算法对数字图像进行分类识别。

2 基于小波空间特征谱熵的图像特征提取

对图像的某些特征进行数字化并加以抽取的过程被称为特征提取。一幅图像的特征越明显, 即与其他图像的区别越大, 那么就会越容易被正确识别。相比较于其他图像, 数字图像存在一些独有的特性, 例如, 数字字符范围有限, 只有0~9这10种, 但是可能是手写、印刷等多种形式, 而且不同的书写习惯还会出现不同的样式。因此, 只有提取出区分性非常好的数字字符图像特征, 才能提高识别准确率。本文提出利用图像的小波空间特征谱熵作为特征进行识别。

2.1 图像的小波空间特征谱熵

小波分析的基础理论是上世纪80年代初由法国科学家率先提出的, 现已成为一个较成熟的数学分支, 其理论还在不断发展。小波分析相当于一个数学显微镜, 具有放大、缩小和平移功能, 通过检查不同放大倍数下的变化来研究信号的动态特性。因此, 小波分析被广泛地应用于很多领域[9, 10]

一般常见的图像特征提取方法都是提取图像的区域特征或时域特征, 当图像的性质和拍摄环境较为相似时, 这样的特征并不十分明显。为此, 本文提出基于小波变换在时频域中联合研究小波空间特征谱熵这个特征指标。

显然, 在小波变换前后具有有限能量的函数f(t)其能量一定是守恒的, 即:

-f(t)2dt=1Cv0a-2E(a)da1

式中:

Wf(a, b)为小波变换的幅值; Cv为小波函数的允许条件; E(a)为尺度为a时函数f(t)的能量值。

将一维信号等价地映射到二维的小波空间中就是小波变换的实质。而矩阵W= Wf(a, b)2Cφa2被称为是二维小波空间的小波能量分布矩阵, 将W看作是信号的模式矩阵, 对W进行奇异值分解, 设δ 1δ 2≥ …≥ δ n是矩阵W的奇异值。则奇异值谱{δ i}是对原始信号{xi}在时频域中的一种有效划分, 因此可以定义时频域中图像的小波空间特征谱熵为:

Hws=-i=1npilogpi2

式中:pii/ i=1nδ i是第i个奇异值在整个奇异值谱中所占的比例。

小波空间特征谱熵反映了图像能量在时频域内的分布情况。图像特性越简单, 能量越集中于少数几个模式, 小波空间特征谱熵也就越小; 反之, 图像特性越复杂, 能量就越分散, 小波空间特征谱熵也就越大。通过比较图像的小波空间特征谱熵就可以对图像进行很好的识别。

2.2 算法的实现过程

本文提出的基于小波特征谱熵的数字图像特征提取算法的具体实现步骤如下:

步骤1 对数字图像进行预处理, 包括灰度变换、滤波等;

步骤2 选定小波基函数, 本文选择的为DB9;

步骤3 对图像进行小波变换, 并根据式(1)求取Wf(a, b);

步骤4 计算小波能量分布矩阵W=

Wf(a, b)2Cφa2;

步骤5 对W进行奇异值分解, 得到δ i;

步骤6 根据式(2)计算图像的小波空间特征谱熵Hws;

步骤7 将Hws作为分类器的输入, 进而实现对于数字图像的分类识别。

3 实验分析

本实例所使用的数字字符图像来自于美国MIT实验室。首先, 从数据库中对每一个数字随机选取了一副图像, 如图1(a)所示; 然后, 对每一幅图像随机加入了噪声强度为0.2的高斯噪声, 如图1(b)所示; 最后, 利用本文提出的小波特征谱熵方法提取特征, 识别结果分别如图1(c)(d)所示。

图1 小波特征谱熵方法提取特征识别结果Fig.1 Recognition result of wavelet space feature spectrum entropy

图1(c)(d)的识别结果可以看出, 本文所提算法能够准确地识别数字字符, 即使在有噪声干扰的情况下, 依然可以完全正确识别。但是, 单一的一次实验不足以全面验证算法的可靠性, 因此, 本文又从数据库中随机选取100幅图像, 还是利用本文算法进行识别, 结果如图2所示。

图2 多次识别结果准确率比较Fig.2 Comparison of repeatedly recognition result

多次重复实验的结果表明:本文算法识别准确率较高, 正常图像平均为99.02%, 最高到达100%, 即全部识别正确, 最低也达到了96.0%; 噪声图像平均为93.92%, 最高为100%, 最低为85.0%, 尽管在实际工程使用时准确率会与实验有所差别, 但准确率达到的水平完全符合使用要求。同时实验结果再一次证明了本文所提的基于小波空间特征谱熵的图像特征提取方法的有效性。为了体现该方法的优越性, 下面进行一下横向比较分析。

根据目前的研究情况, 在进行数字字符图像识别时最常用的特征提取方法是图像分割法和灰度熵法。图像分割法即按照一定规则对图像进行矩阵分割, 然后对分割后的矩阵计算其数学特征。在使用该方法提取特征时, 根据图像的大小, 本文将图像分割成6行8列共48个子矩阵块。灰度熵法即先计算图像的灰度百分比, 然后求取灰度熵, 因为事先经过预处理, 所以直接计算即可。分别使用这两种方法对图库中随机抽取的100幅图像提取特征, 然后与本文所提小波空间特征谱熵的图像特征提取方法进行比较。图3为针对正常图像分别采用3种方法的识别准确率结果比较, 图4为针对噪声图像, 3种方法的识别准确率结果比较, 图5为3种识别方法的用时结果比较。

图3 正常图像识别准确率比较Fig.3 Comparison of Normal image recognition accuracy

图4 噪声图像识别准确率比较Fig.4 Comparison of Noise image recognition accuracy

图5 识别用时比较Fig.5 Comparison of recognition time

图3图4可以看出, 矩阵分割方法和灰度熵法提取的图像特征的平均识别准确率相当, 对于正常图像分别为94.58%和94.42%; 对于噪声图像分别为82.05%和80.92%; 而本文利用小波空间特征谱熵方法提取的图像特征, 无论是对正常图像, 还是对噪声图像, 识别准确率均在90%以上, 最高达到100%, 远远高于其他两种常用方法。再分析图5可知, 小波空间特征谱熵方法的平均用时约为96.78 s, 灰度熵法的平均用时约为84.92 s, 而矩阵分割方法的平均用时约为81.1769 s。虽然小波空间特征谱熵方法的用时要略高于其他两种方法, 但是相差不是太多, 而且其用时也满足实际工程应用的要求。除此以外, 在使用矩阵分割方法时, 结论中出现了预期编码以外的结果, 该结果不符合数字图像的任何一种状态编码, 无法给出图像的正确识别结果, 而小波空间特征谱熵方法则可以很好地克服这一缺点。

4 结束语

日常生活中数字字符图像的质量容易受到多种因素的影响, 这直接关系到图像是否能够被正确识别, 因此图像的特征提取方法显得尤为重要。本文重点研究了基于小波空间特征谱熵的图像特征提取方法, 该方法利用小波变换前后能量不变的原理, 构造小波能量矩阵, 并对该矩阵的奇异值求熵作为图像的特征。实验结果表明, 利用小波空间特征谱熵方法提取的图像特征具有较好的代表性和可分性, 无论是对正常图像, 还是噪声图像, 识别准确率都可达90%以上, 相比较于目前常用的图像特征提取方法, 本文方法的优越性也较为明显。但是实验同时表明, 本文方法的用时略长, 下一步研究的重点将是如何降低本文方法的复杂度, 提高使用效率。

The authors have declared that no competing interests exist.

参考文献
[1] 张家怡. 图像识别的技术现状和发展趋势[J]. 电脑知识与技术, 2010, 21(6): 6045-6046.
Zhang Jia-yi. Current situation and perspective of image recognition technology[J]. Computer Knowledge and Technology, 2010, 21(6): 6045-6046. [本文引用:1]
[2] 罗翌陈, 杨辉华, 李灵巧, . SIFT算法在CUDA加速下的实时人物识别与定位[J]. 计算机科学, 2012, 39(11A): 391-394.
Luo Yi-chen, Yang Hui-hua, Li Ling-qiao, et al. STIF algorithm on the CUDA-accelerated real-time character recognition and positioning[J]. Computer Science, 2012, 39(11A): 391-394. [本文引用:1]
[3] 张浩, 王玮, 徐丽杰, . 图像识别技术在电力设备监测中的应用[J]. 电力系统保护与控制, 2010, 38(6): 88-91.
Zhang Hao, Wang Wei, Xu Li-jie, et al. Application of image recognition technology in electrical equipment on-line monitoring[J]. Power System Protection and Control, 2010, 38(6): 88-91. [本文引用:1]
[4] 孙继平. 基于图像识别的煤岩界面识别方法研究[J]. 煤炭科学技术, 2011, 39(2): 77-79.
Sun Ji-ping. Study on identified method of coal and rock interface based on image identification[J]. Coal Science and Technology, 2011, 39(2): 77-79. [本文引用:1]
[5] 吴忠, 朱国龙, 黄葛峰, . 基于图像识别技术的手写数字识别方法[J]. 计算机技术与发展, 2011, 21(12): 48-51.
Wu Zhong, Zhu Guo-long, Huang Ge-feng, et al. Hand written digit recognition based on image recognition system[J]. Computer Technology and Development, 2011, 21(12): 48-51. [本文引用:1]
[6] 陈展东, 白宝兴, 韩成, . 数字识别算法研究[J]. 长春理工大学学报: 自然科学版, 2010, 33(1): 147-151.
Chen Zhan-dong, Bai Bao-xing, Han Cheng, et al. Algorithm for numeral recognition[J]. Journal of Changchun University of Science and Technology(Natural Science Edition), 2010, 33(1): 147-151. [本文引用:1]
[7] 徐琴珍, 杨绿溪. 基于改进的混合学习模型的手写阿拉伯数字识别方法[J]. 电子与信息学报, 2010, 32(2): 433-438.
Xu Qin-zhen, Yang Lyu-xi. An improved hybrid learning model based hand written digits recognition approach[J]. Journal of Electronics & Information Technology, 2010, 32(2): 433-438. [本文引用:1]
[8] 杜梅, 赵怀慈. 手写数字识别的研究[J]. 计算机工程与设计, 2010, 31(15): 3464-3467.
Du Mei, Zhao Huai-ci. Research on hand written digit character recognition[J]. Computer Engineering and Design, 2010, 31(15): 3464-3467. [本文引用:1]
[9] Hammond D K, Vand ergheynst P, Gribonval R. Wavelets on graphs via spectral graph theory[J]. Applied and Computational Harmonic Analysis, 2011, 30(2): 129-150. [本文引用:1]
[10] 丁伟杰, 周国民, 任文华. 基于小波分解和颜色熵的浮游生物图像识别[J]. 计算机工程, 2008, 34(14): 188-190.
Ding Wei-jie, Zhou Guo-min, Ren Wen-hua. Plankton image recognition based on wavelet decomposition and color entropy[J] . Computer Engineering, 2008, 34(14): 188-190. [本文引用:1]