查长军(1980),男,博士研究生.研究方向:光学成像与信号处理.E-mail:zcj_longman@sina.com
针对WSN及轮廓检测系统的特点,给出了一种基于WSN的数据处理方法。该方法首先通过主分量分析提取样本特征,然后采用叠加方式对不同样本的特征进行融合,给出数学模型;并以此模型为基础,提出一种新的基于稀疏表示的多类融合样本中特定目标识别算法,该算法根据超完备字典下主要非零系数的分布情况识别出特定目标;数值仿真与实验结果验证了本文算法的有效性,综合性能优于传统方法。
According to the characteristics of Wireless Sensor Network (WSN) and the profile detecting system, a data processing method based on WSN is proposed. In this method, first, the sample features are extracted by principal component analysis; then, the features of different samples were fused using accumulate mode. A mathematical model was given and on the basis of this model, a novel algorithm of special object recognition based on sparse representation in multiclass fusion sample was proposed. This algorithm recognizes the special target according to distribution of the main non-zero coefficients under an over-complete dictionary. Numerical simulation and experimental results demonstrate the effectiveness of the proposed algorithm, the comprehensive performance is better than the traditional methods.
一般而言,跨越边境和特定监控区的除了动物就是人,利用人和动物外形轮廓存在较大差异的特征实现对特定目标(人)的识别与监控已证明切实可行[ 1, 2, 3];但这些研究更多的是关注物体轮廓样本的获取及采用传统的方法进行识别,如:K最近邻(K-nearest neighbor classifier,KNN)、支持向量机(Support vector machines,SVM)等[ 4, 5, 6];并没有进一步探讨构成无线传感器网络(Wireless sensor network,WSN)所涉及的数据融合、降低传输数据量等问题。
本文的主要工作是将前期研究中的轮廓检测系统作为网络节点[ 7],构成一个WSN;网络中汇聚节点接收各网络节点发送过来的样本特征向量后,对样本特征向量进行融合,然后将融合后样本发送给用户端;在用户端采用本文算法对融合样本进行识别,以判断该区域是否有特定目标(人)经过。
为了尽可能地减少WSN中传输的数据量、降低数据融合复杂度,本文给出了一种较简单的数据处理方法及其融合模型;由于该模型下的融合样本中包含多个类别的有效样本,采用经典的稀疏表示分类(Sparse representation-based classification,SRC)算法[ 8, 9, 10]并不能准确地判别样本中是否存在某一个或多个类别。针对这一不足,本文提出了一种基于稀疏表示的多类别融合样本中特定目标识别算法;与SRC方法不同的是,该算法是利用稀疏表示系数向量中主要非零系数的分布情况,识别出融合样本中特定目标;实验验证了该算法的有效性。
根据文献[ 7]可知,作为WSN中网络节点的轮廓检测系统,每次采集到的物体轮廓样本信号 P是大小为 S×L的矩阵;但由于每个样本矩阵的列数 L不同,且存在很大的冗余信息;如果将该矩阵信号通过网络直接发送出去,不仅数据量较大、浪费网络资源,而且由于矩阵维数不同,不便于数据处理。为了解决以上问题,本文采用主分量分析( Principle component analysis, PCA)[11 - 12]对样本数据进行预处理,具体过程如下: ①输入:采集到的物体轮廓样本 P∈ R S×L; ②计算协方差矩阵:令 X= PT∈ R L×S,计算协方差矩阵 C XX =E[( X -E( X))( XT -E( XT))]; ③求解特征值和特征向量:采取任意方法求解 C XX的特征值 λ1, λ2,…, λ L和相应的特征向量 μ1, μ2,…, μ L; ④构造变换矩阵:按照从大到小顺序排列,选取前 k( k≤ L)个较大特征值(即: λ1≥ λ2≥…≥ λ k)所对应的特征向量构造变换矩阵 U∈ R L×k,即: U=[ μ1, μ2,…, μ k]; ⑤降维处理:利用变换矩阵 U对原始样本 P进行变换,得到变换后矩阵为
通过预处理后,将得到的归一化向量 p作为样本的特征向量,发送到汇聚节点进行数据融合。
假设 WSN中含有 N个网络节点,第 j个网络节点采集到物体轮廓样本为 Z j∈
r= y1+ y2+…+ y N=
若考虑到各网络节点的信号发射功率、传输信道衰落以及噪声干扰等因素,式(1)可改写为:
r=(
式中: r∈ R c;参数 ρ j和 α j(1≤ j≤ N)分别为第 j个网络节点信号发射功率和传输路径的链路增益; n为加性高斯白噪声。当各网络节点样本特征向量维数较大时,若需要进一步降低传输数据的数据量,可通过测量矩阵 A∈ R d×c( d<c)将样本特征信息投影到低维空间,由此进一步得到融合样本数学模型:
式中:
为了便于分析融合后样本的稀疏性,假设融合样本 r由两个不同类别的样本特征向量 y1和 y2组成,即:
r= y1+ y2(4)
进一步,假设 x1和 x2分别为样本特征向量 y1和 y2在超完备字典 A1和 A2下的稀疏表示系数,则:
(5) |
结合式(4)得到:
r= y1+ y2= A1 x1+ A2 x2=[ A1, A2]
式中: A a=[ A1, A2]; x a=[
从式(6)中可以看出融合后样本 r在字典 A a下能够稀疏表示,且可通过计算以下最小化问题估计系数[ 13],即:
(7) |
式中:参数ε为允许误差。
同理,当融合样本 r由 k个类别的样本特征向量叠加而成时,同样能够稀疏表示,此时超完备字典应为 A a=[ A1, A2,…, A k], A j(1≤ j≤ k)表示第 j类特征样本字典。
根据稀疏表示理论可知,要想稀疏表示融合后样本,则需要构造一个有效的超完备字典[14 - 15]。由于通过训练样本构造字典相对灵活,故本文采用这种方式[ 7]。假设有 T类训练样本,每类训练样本数为 N1, N2,…, N T,第 j(1≤ j≤ T)类中第 i(1≤ i≤ N j)个训练样本表示为 P j, i∈
通过以上稀疏性分析可知,当融合样本中存在某一类别特征样本时,通过 l1模最小化问题求解得到的稀疏系数向量中主要非零系数就分布在对应类别的原子上,而其他类别原子上的系数为零或很小;如果融合样本中包含多个类别,稀疏系数向量中的主要非零系数就分布在这几个类别原子上。
基于这一特征,本文提出了一种多类别融合样本中特定目标识别算法,该算法流程如下:
(1)输入:字典 A a∈ R c×n和融合样本 r∈ R c,其中: r由式(2)得到。
(2)稀疏表示:利用正交匹配追踪算法求解式(7)最小化问题,得到融合样本 r在字典 A a下的估计系数向量
(3)计算系数向量
(4)多类判别准则:满足以下条件判为融合样本中包含此类,即: s j /‖
(5)特定目标检测输出:根据步骤(4)多类别判别结果,检测是否包含特定目标类别。
本文实验是基于轮廓检测系统,该系统采用 S=16个开关式光电传感器 E3 F-R2 NK组成信号感知单元,传感器有效作用距离为2 m。轮廓检测系统在自然环境下主要收集了人(包括:单人和双人)、单人蹲下经过及动物(狗)三类物体轮廓样本进行训练与测试;每类训练样本数各为50,总数为150;测试样本数各为47,一共有141个样本。对所有样本进行预处理时,将样本维数为16 ×L(L为变量)的矩阵投影到维数为16 ×1的空间。
在以下实验中,融合样本由人和动物(狗)两类组成,并将人作为特定目标。在不同的实验条件下,能够判断出融合样本中存在特定目标(人)视为正确识别。实验循环测试20次,取其平均值作为该条件下的识别率或虚警率。
为了便于分析与比较,假设各网络节点的信号发射功率相同,信道链路增益为常数1,并与传统的最近邻( Nearest neighbor clas sifier, NN)[ 16]、 KNN、 SVM 和 SRC方法进行了性能比较。实验软硬件配置:操作系统为 Windows XP;仿真软件为 Matlab( R2009 a); CPU为3.4 GHz;内存为1.92 GB。
实验一 验证融合后样本的稀疏性
假设 WSN在某一个时段内有4个网络节点检测到物体经过,其中:2个节点为单人;2个节点为动物(狗)。各节点在本地提取样本特征信息后进行数据融合,对融合后样本进行稀疏表示,求解得到的稀疏表示系数分布如图2所示。
从图2可以看到,融合样本通过字典得到的系数仍然稀疏,且主要的非零系数分布在人和动物两个类别原子项上,而其他类别(即单人蹲下经过)上的系数几乎都为零。
该实验结果表明:由多个类别融合得到的样本在字典下能够稀疏表示;根据系数向量中主要非零系数的分布情况能够判别出融合样本中的类别组合,进而可判断存在特定目标(人)。
实验二 验证信噪比(SNR)一定时,检测到动物的节点数与识别率的关系
假设在某一时间段内检测到人的节点数为3,检测到动物的节点数分别为1、2、4、6,实验仿真结果如图3所示。
对于待识别的特定目标(人),受到的干扰随着检测到的动物的节点数的增加而变大;从图3中可以看到,传统的NN、KNN和SRC方法的识别率下降明显,本文方法与SVM方法基本无下降;当检测到的动物的节点数增加到6个时,本文方法识别率几乎达到100%,略高于SVM方法,表现出良好的鲁棒性。
实验三 验证信噪比与识别率的关系
对于WSN来说,在保证需求的前提下,降低信号的发射功率可以有效地延长网络生存时间。本实验假设检测到人和动物的节点数一定,分析不同信噪比对识别性能的影响,仿真实验结果如图4所示。
从图4(a)中可以看到,当检测到动物的节点数为1个时,随着信噪比的增加,本文方法识别率趋于100%;当动物节点数为3个时,尽管各方法识别率都有所下降,但本文方法仍优于传统识别方法,且随着信噪比的增加,识别性能有所改善;而传统的NN、KNN和SRC方法识别率几乎为零。
该实验结果表明:通过适当地增大节点发射功率、提高信噪比,能够有效地改善本文方法的识别性能;在一定程度上弥补其他类别样本的影响。
实验四 验证检测到的动物节点数与虚警率的关系
对于边境或特定监控区域来说,在很长的一段时间内可能只有动物而无人经过,因此能够正确判断无人经过、降低系统虚警率就显得非常重要。仿真实验结果如图5所示。
从图5(a)中可以看到,当信噪比为15 dB时,本文方法虚警率略大于SRC方法,但随着检测到动物节点数的增加,融合样本中动物类别信息也就有所增加,这就降低了虚警的可能,因此本文方法虚警率能逐渐与SRC方法趋于一致;当信噪比增大为20 dB时,本文方法虚警率能明显得到改善,接近零虚警。
该实验结果表明:①随着检测到动物节点数的增加,融合样本中有用信息也随之增大,有利于降低本文方法的虚警率;②当检测到的动物节点数一定时,网络节点通过增大信号发射功率、提高信噪比,可以有效降低虚警率。
综上分析:传统的NN、KNN 、SVM和SRC识别方法,主要是针对单一类别的有效测试样本进行识别,当样本由多个类别融合而成时,融合样本中其他类别相对来说就是一个干扰,从而影响它们的正确识别率;而本文方法是基于稀疏表示理论,当样本由多个类别组成时,通过稀疏表示可以有效地将多类融合样本在稀疏域分离开来,进而根据系数分布情况可以判断出融合样本中类别组合,检测出特定目标。实验结果验证了本文方法的有效性。
针对轮廓检测系统特点,结合WSN及稀疏表示理论,给出了以轮廓检测系统为网络节点的数据处理方法及其数学模型,并以此为基础提出了一种基于稀疏表示的多类融合样本中特定目标的识别算法。仿真实验结果表明:与传统方法相比,本文方法在多方面具有更好的性能;而且在实际应用中,可以根据需要调整系统参数(如网络节点发射功率等)以满足实际需求;但对采用何种易于实现的测量矩阵将信号投影到低维空间等问题,在今后的工作中需要进一步探讨。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|