α稳定分布特征指数估计算法
关济实1,2, 石要武1, 邱建文2, 单泽彪3, 史红伟3
1.吉林大学 通信工程学院,长春 130022
2.中广核研究院有限公司 北京分公司 北京 100083
3.长春理工大学 电子信息工程学院,130022
通信作者:史红伟(1978-),男,讲师,博士. 研究方向:雷达信号处理. E-mail:qitiand@qq.com

作者简介:关济实(1977-),男,高级工程师,博士研究生. 研究方向:雷达阵列信号处理. E-mail:guanjishi@sina.com

摘要

针对 α稳定分布信号参数估计问题,提出一种基于 α稳定分布叠加性质和 p范数性质的特征指数估计算法。该算法利用多个同分布的 α稳定分布变量组合相加结果的 p范数与原变量 p范数之间的关系实现对特征指数 α的估计。介绍了 α稳定分布的定义和基本性质,说明了估计算法的原理和估计步骤,证明了估计算法的无偏性和一致性。仿真实验表明,该算法不需要稳定分布的其他先验知识,在很大的范围内可以有效地估计 α稳定分布的特征指数,在高斯噪声掺杂的情况下仍可准确估计信号的 α值,为 α稳定分布噪声下的信号处理方法提供支持。

关键词: 通信技术; α稳定分布; 参数估计; 叠加性质; p范数
中图分类号:TN911 文献标志码:A 文章编号:1671-5497(2018)02-0618-07
New algorithm to estimate characteristic exponent of α-stable distribution
GUAN Ji-shi1,2, SHI Yao-wu1, QIU Jian-wen2, SHAN Ze-biao3, SHI Hong-wei3
1. College of Communication Engineering, Jilin University,Changchun 130022,China
2.Beijing Branch,China Nuclear Power Technology Research Institute Co. Ltd., Beijing 100083, China
3. School of Electronic and Information Engineering, Changchun University of Science and Technology, Changchun 130022,China
Abstract

To estimate the parameter of α-stable distribution signal, this paper proposes an algorithm based on the plus property and p-norm property of α-stable distribution. The characteristic exponent α is estimated using the relationship between the p-norm of original variable and the new p-norm of variable, which is the combination of several variables with the same α-stable distribution. The definition and the properties of the α-stable distribution are introduced, and then the principle and execution steps of the proposed algorithm are explained. The unbiaseness and uniformity of the algorithm in estimation of the characteristic exponent are discussed. Simulation results show that this method can estimate the characteristics exponent of α-stable distribution in a wide range without any more information of the distribution. It works well even Gaussian noise is added to the α-stable variable. The estimation results can support the subsequent signal processing algorithm with α-stable noise.

Key words: communication technology; α-stable distribution; parameter estimation; plus property; p-norm
0 引 言

一类带有冲击特性的非高斯噪声在大气、水下声学以及电磁干扰等噪声中大量存在, 该类噪声表现出极强的脉冲特性, 由于α 稳定分布可以用来很好地描述这一类噪声[1, 2, 3], 近年来α 稳定分布噪声背景下的信号处理方法得到了广泛研究。在α 噪声背景下的信号处理方法的研究中, 分数低阶矩和共变被大量应用[4, 5, 6], 而分数低阶矩和共变只有在α 稳定分布噪声参数已知的情况下才有意义, 所以大多研究都假设α 噪声的参数已知, 至少是其特征指数α 已知。在实际应用中, 由于没有α 噪声的相关参数, 导致这些算法的应用受到很大的限制, 因此研究α 稳定分布的参数估计方法对于以上这些算法的应用具有支撑作用。在α 稳定分布参数估计方面, Tsihrintzis[7]、Ma等[8]基于分数低阶矩和负阶矩理论提出了多种通过观测序列估计α 稳定参数的方法, Kuruoglu[9]借助混合高斯模型, 提出了α 稳定概率密度函数的一种新的表达式, 并利用该表达式进行α 稳定分布的参数估计。DuMouchel[10]提出了一种最大似然估计方法, Brorsen等[11]对该方法进行蒙特卡罗仿真, 获得了相当好的结果, 然而, 该方法属于高度的非线性优化问题, 由于需要计算复杂的数值积分, 计算量非常大。本文提出一种α 稳定分布信号的α γ 参数估计的方法, 该方法利用α 的叠加性质, 通过简单的运算即可实现对α 估计, 容易理解且计算量小, 估计精度高。

1 α 稳定分布的定义和性质

1.1 α 稳定分布的定义

α 稳定分布的概念是Levy在1925年研究广义中心极限定理时提出的[3], 中心极限定理引出了高斯分布, 而广义中心极限定理则是放开了中心极限定理中有限方差这一限制后形成的。α 稳定分布是负责广义中心极限定理的一簇分布, 高斯分布是α 稳定分布在α =2时的一个特例[12]。除了有限的几种情况, α 稳定分布没有封闭的概率密度函数表达式[13], α 稳定分布的定义是由其概率密度函数的傅里叶变换, 即特征函数给出的。

定义 若一个随机变量X的特征函数可以表示为:

φ (t)= expjμt-γtα1+jβsign(t)tan(απ2),   α1expjμt-γtα1+jβsign(t)2πlogt,   α=1(1)

式中:-¥ < μ < ¥ , γ > 0, 0< α ≤ 2, -1≤ β ≤ 1, 这4个参数决定了该分布的形状, sign(x)为符号函数。称该变量X服从α 稳定分布, 服从α 稳定分布的噪声称为冲击噪声, 脉冲噪声或稳定分布噪声, 写作:

X~Sα (μ , β , γ ) (2)

式中:α 称为特征指数, 它决定了脉冲特性的程度, α 越小, 脉冲程度越高; β 称为对称系数, 当β < 0时, 信号的概率密度函数会出现左倾, 反之出现右倾。当β =0时, α 稳定分布的概率密度函数呈现左右对称形状, 称为对称α 稳定分布(Sα S); μ 称为位置参数, 表示α 稳定分布概率密度函数的中心, 也是α 稳定分布变量的期望值; γ 称为分散系数, 在同一个α 值下, γ 越大, 则概率密度函数的两侧延伸越严重, 中间部分的值则会相对降低, 与高斯噪声的方差类似。

1.2 α 稳定分布的性质

现有文献对α 稳定分布的性质做了详细的研究, 本文不再一一说明, 仅介绍本文算法相关的两条性质, 即叠加性质和p范数性质[14]

性质1 叠加性质, 若X1~Sα (μ 1, β 1, γ 1), X2~Sα (μ 2, β 2, γ 2), 则它们的和变量X=X1+X2服从X~Sα (μ , β , γ ), 其中:

μ =μ 12 (3)

β = β1γ1α+β2γ2αγ1α+γ2α(4)

γ =( γ1α+γ2α)1 (5)

性质2 若X~Sα (u, β , γ ), 0< α < 2且当α =1时, 有β =0, 则对于所有0< p< α , 有:

EXp1/p=Cα , β (p)γ (6)

式中:

Cα , β (p)= EX0p1/p(7)

X0~Sα (0, β , 1) (8)

该性质给出了一个统计量 EXp1/p, 称为p范数, 它的值是标准α 分布的p阶范数与分散系数的积。这一性质表明, α 分布信号的p范数与分散系数γ 呈线性关系。

2 基于组合分布和分数低阶矩的系数估计方法
2.1 特征指数估计算法原理

根据α 分布的性质1, 两个独立的同特征指数的稳定分布变量相加时, 其和变量同样服从α 分布, 并且其分散系数仍为α , 当多个同分布的α 信号相加时, 这一性质可以以如下形式表述:

推理 当X1, X2, …, XN相互独立且均服从于同一分布Sα (μ , β , γ )分布时, 其和分布X=X1+X2++XN服从Sα (μ 0, β 0, γ 0), 则其参数表达式为:

μ 0=Nμ , β 0, γ 0=N1γ (9)

对照性质1, 此推理很容易得证。

从以上推理中可以看到, 多个独立同分布的α 变量的和变量仍服从α 分布, 且其对称系数不变。注意到这一性质分散系数的表达式中并没有对称系数, 所以分散系数的这一性质对于非对称α 分布也是适用的。

综合以上两性质和推理, 多个同分布变量相加时有:

E[|X|p]1/p=Cα , β (p)γ 0=Cα , β (p)N1γ (10)

E[|Xi|p]1/p=Cα , β (p)γ (11)

式中:i=1, 2, …, N

和变量X与原变量Xip阶矩之间具有以下关系:

E|X|p]1/pE|Xi|p]1/p=N1 (12)

因此:

α = plnNln(E|X|p)-ln(E|Xi|p)(13)

由式(13)可知, 当有多个同分布α 稳定分布随机变量时, 可以将多个随机变量组合, 利用组合变量与原变量之间p范数关系, 得到特征指数α 的估计。

2.2 α 稳定分布参数估计方法

2.2.1 参数估计方法

式(13)表明多个同分布的α 信号相加时, 其统计量E[|X|p]1/p之间的比只与参与相加的变量个数和特征指数α 有关。利用这一特征, 可以从实际采样信号中估计得到特征指数α

当一个变量的时间相关性很低时, 相隔足够长时间以外的多个采样值之间可以认为是不相关的。对于一个α 分布的变量, 相隔足够长的时间进行多次采样, 则可以认为多次采样结果为多个独立同分布的α 分布变量, 这多次采样相加, 得到的新变量与原变量之间可以根据式(13)得到α 的估计。对于一个足够长时间的采样序列X, 该方法可以描述如下:

设有序列长度为Lα 稳定分布变量采样序列X={xi, i=1, 2, …, L}, 将X等分为N+1份, 每份长度为K(K=L/(N+1)), 则有:

Xm={xi=X((m-1)K+i), i=1, 2, …, K}

m=1, 2, …, N+1(14)

Y= m=1NXm= yi=m=1Nx(m-1)k+i(15)

Z=Xm+1(16)

由以上定义可知, YZ是相互独立的随机变量。

T'= i=1KyipK(17)

T= i=1KzipK(18)

α̂= plnNlnT'-lnT(19)

式中:即为特征指数α 的估计值。

算法的执行步骤如下:

(1)对待测信号采样L次, 形成X

(2)将L次信号平均分割为N段, 形成Xm, m=1, 2, …, N

(3)将分割的数据相加, 形成X'

(4)对XX'分别计算统计量TT'

(5)将数据代入式(19)得到特征指数α 的估计值。

该方法不需要复杂的计算, 相比于现有的参数估计方法, 计算量较小。并且不涉及α 分布概率密度函数的封闭形式的近似, 原理简单可靠, 便于理解和编程实现。在实际执行时, 由于α 未知, 为了使p阶矩收敛, 可以使p尽量小。

2.2.2 估计方法的无偏性与一致性分析

式(12)由α 稳定分布的性质导出, 因此它是严格成立的, 但在实际运算中, 无法直接得到变量的p阶矩, 只能以式(17)得到E xp的估计, 式(17)中统计量T'的数学期望为:

E=E i=1Kyip= i=1KEyip=E Yp(20)

T'E Yp的无偏估计。同理, T为和E Zp的无偏估计, 且T'T之间相互独立。

定义:

P=E Yp, Q=E Zp(21)

则有:

E[T']=P, E[T]=Q (22)

估计值的数学期望为:

E=E plnNlnT'-lnT=

plnNln(ET')-ln(ET)=

plnNln(EXp)-ln(EXip) (23)

即, 为α 的无偏估计。

再来分析估计的一致性, 定义变量D如下:

D=Np/α =P/Q (24)

α D之间是幂函数关系, 二者之间是一一对应的, 因此如果算法中对D的估计是无偏的, 则对α 的估计也将是无偏的, 算法中D的估计值为:

D^= Np/α^=T'/T (25)

下面分析D估计的无偏性:

E D^-D2=E T'T-PQ2=E T'2T2-2T'PTQ+P2Q2=E T'2T2-2E+ P2Q2=E T'2T2- P2Q2(26)

由于YZ相互独立, 因此式(26)可以表示为:

E T'2T2= ET'2ET2(27)

再来分析E T'2的构成:

E T'2=E i=1KyipK2=

1K2E i=1Kj=1Kyip|yj|p=

1K2E i=1Kyi2p+i=1Kj=1, jiKyip|yj|p=

i=1KEyi2pK2+ Ei=1Kj=1, jiKEyipE|yj|pK2=

E Y2p+ EYp=

E Y2p+E Yp- EYp=

E Y2p+P2- EYp(28)

当2p< α 时, E Y2p和[E[]]均为有限值, 当采样长度无穷长, 即L无穷大时, K=L/N也趋于无穷大, 因此式(28)可写作:

E T'2=P2(29)

因此, 当采样长度无穷大时, 式(27)可表示为:

E D^-D2=E T'2T2- P2Q2=0 (30)

即当采样长度无穷大时, 和D之间的均方误差趋于0, 为D的一致估计, 进而, 为α 的无偏估计。

3 数值仿真实验

实验1 不同α 值的特征指数估计实验

实验目的:验证算法的有效性。

实验方法:α 的取值从0.1至2, 每隔0.1取一个α 值, 利用数值方法实现β =0, γ =1, 长度为10 000的α 分布序列, 分割为两段, 通过式(19), 取p=0.1计算α 的估计值, 并与产生数据所用的α 相比较, 以验证算法的有效性。

估计结果与生成数据时所用α 之间关系如图1所示。

图1 基本的α 估计实验结果Fig.1 Estimation result of α with basic experiment

图1可以看到, 该方法准确地估计了α 的值。为考察算法精度, 定义估计均方误差:

MSE= α^-α2N(31)

每个α 取值进行100次蒙特卡罗实验, 计算均方误差, 图2为均方误差图。

图2 α 估计均方误差Fig.2 Estimation MSE of α with basic experiment

可以看到, 随着α 变大, 均方误差逐渐变大, 当α =2时, 均方误差仅为-12 dB, 具有较高的估计精度。

实验2 分割段数对算法的影响

实验目的:验证分割段数对于算法精度的影响。

实验方法:特征指数取0.6, 0.9, 1.2, 1.6, 分段数分别取[2, 3, 4, 5, 6, 8, 10, 12, 15, 16, 20, 24]进行计算, 每种情况进行100次蒙特卡罗实验, 为了得到完整的分段, 实验数据长度取12 000, 记录估计值和均方误差, 观察分段数对于估计误差的影响。

图3为分段数变化时特征指数的估计结果和均方误差。

图3可以看出, 不同分段数时, 本方法均可以有效估计α 值。从均方误差结果图中可以看到, 段数变大估计均方误差变大, 这是由于分段数变大使得每段数据量变小, 从而使得p范数的估计误差变大引起的。本方法对α 的估计误差始终在-13 dB以下, 估计精度较高。

实验3 分散系数对算法的影响实验

实验目的:验证不同分散系数γ 时的算法性能。

实验方法:γ 从0.1变到10, 每隔0.1取一个点, α 取0.6, 0.9, 1.2, 1.6, 进行4次实验, 每种情况进行100次蒙特卡罗实验, 分段数取4, 每次实验数据长度为10 000, 记录估计值和均方误差并形成曲线。

图4γ 分段数变化时估计误差结果。

图4可以看到, γ 从0.1到10, 本方法始终能正确估计α 值。从估计均方误差结果可以看出, 不同γ 值下, α 值估计的均方误差变化不大, 且始终能保持-14 dB以下的均方误差, 估计精度较高。

图3 分段数对α 估计结果的影响Fig.3 Influence of section number on estimation of α

图4 分散系数对α 估计结果的影响Fig.4 Influence of γ on estimation of α

实验4 高斯噪声与Sα S噪声共存时的估计效果

实验目的:验证高斯信号与Sα S信号共存时算法对于α 的估计效果。

实验方法:α 取0.6, 0.9, 1.2, 1.6, 在Sα S信号中掺杂入广义信噪比不同的高斯噪声, 其他条件与前述实验相同, 依据本算法估计信号α 值。每种情况进行100次蒙特卡罗实验, 记录α 的估计结果均值和均方误差。

图5为高斯噪声掺杂时α 的估计结果。

图5 高斯噪声掺杂时算法对α 的估计结果Fig.5 Estimation of α when Gaussian noise added

图5可以看出, 在信噪比0 dB以下, 高斯噪声的添加对特征指数α 估计结果的影响不大, 估计均方误差在-8 dB以下。说明本算法可以估计高斯随机变量与α 稳定分布随机变量共存时α 稳定分布随机变量的特征指数。

4 结束语

针对α 稳定分布信号处理中的参数估计问题, 本文提出了基于α 稳定分布p-范数和叠加性质的特征指数α 估计方法。将α 稳定分布随机变量的采集序列等分相加, 结果序列的p范数与原序列的p范数之间存在的固定关系可以用来估计特征指数α 。该方法不需要β 的先验知识即可估计α 值, 在很大范围内可以正确估计α 值。在0.1~2范围内, α 值估计的均方误差均小于-13 dB, 分段数和随机变量的γ 变化对估计性能影响不大, 在一定程度的高斯噪声与α 稳定分布掺杂时, 仍能正确估计α 值。本文详细说明了算法原理和算法步骤, 并证明了估计算法的无偏性和一致性。该方法可以为针对α 噪声的信号处理算法提供特征指数α 的先验知识, 为基于分数低阶矩的算法提供阶次选择的依据。

The authors have declared that no competing interests exist.

参考文献
[1] Schilder M. Some structure theorems for the symmetric stable laws[J]. The Annals of Mathematical Statistics, 1970, 41(2): 412-421. [本文引用:1]
[2] Weron A. Stable Processes and Measures: a Survey[M]. Berlin: Springer, 1983: 306-364. [本文引用:1]
[3] Shao M, Nikias C L. Signal processing with fractional lower order moments: stable processes and their applications[J]. Proceeding of the IEEE, 1993, 81(7): 986-1010. [本文引用:2]
[4] 孙永梅. α稳定分布参数估计与谱分析理论及应用研究[D]. 大连: 大连理工大学信息与通信工程学院, 2006.
Sun Yong-mei. Study on the theory and application of parameter estimation and spectral analysis of α-stable distribution[D]. Dalian: School of Information and Communication Engineering, Dalian University of Technology, 2006. [本文引用:1]
[5] 李森. 稳定分布噪声下通信信号处理新算法及性能分析[D]. 大连: 大连理工大学信息与通信工程学院, 2011.
Li Sen. Communication signal processing new algorithms and performance analysis in stable noise[D]. Dalian: School of Information and Communication Engineering, Dalian University of Technology, 2011. [本文引用:1]
[6] 何劲. α稳定分布噪声背景下阵列信号处理方法研究[D]. 南京: 南京理工大学电子工程与光电技术学院, 2007.
He Jin. Investigation on array signal processing a mid α-stable noise[D]. Nanjing: School of Electronic and Optical Engineering, Nanjing University of Science and Technology, 2007. [本文引用:1]
[7] Tsihrintzis G A, Nikias C L. Fast estimation of the parameters of alpha-stable impulsive interference[J]. IEEE Trans on Signal Processing, 1996, 44(6): 1492-1503. [本文引用:1]
[8] Ma X, Nikias C L. Parameter estimation and blind channel identification in impulsive interference[J]. IEEE Trans on Signal Processing, 1995, 43(11): 2884-2897. [本文引用:1]
[9] Kuruoglu E E. Analytical representation for positive α-stable densities[C]∥IEEE International Conference on Acoustics, Hong Kong, 2003: VI-729-32. [本文引用:1]
[10] DuMouchel W H. Stable distributions in statistical inference: information from stably distributed samples[J]. Journal of the American Statistical Association, 1975, 70(350): 386-393. [本文引用:1]
[11] Brorsen B W, Ryongyang S. Maximum likelihood estimates of symmetric stable distribution parameters[J]. Communications on Statisties-Simulation, 1990, 19(4): 1459-1464. [本文引用:1]
[12] 石屹然, 赵晓晖, 单泽彪, . α和高斯噪声背景下线性极化阵列波达方向和极化参数联合估计的FLOCC-SMN方法[J]. 吉林大学学报: 工学版, 2016, 46(4): 1297-1303.
Shi Yi-ran, Zhao Xiao-hui, Shan Ze-biao, et al. FLOCC-SMN method for DOA polarization parameters estimation of linear polarization array in α and Gaussian noise[J]. Journal of Jilin University(Engineering and Technology Edition), 2016, 46(4): 1297-1303. [本文引用:1]
[13] 应文威, 欧勇恒, 蒋宇中, . 新型自适应非高斯接收机设计[J]. 吉林大学学报: 工学版, 2013, 43(6): 1685-1689.
Ying Wen-wei, Ou Yong-heng, Jiang Yu-zhong, et al. New adaptive receiver for channels with non-Gaussian noise[J]. Journal of Jilin University(Engineering and Technology Edition), 2013, 43(6): 1685-1689 . [本文引用:1]
[14] 刘文红. 脉冲噪声下时间延迟估计方法及应用的研究[D]. 大连: 大连理工大学信息与通信工程学院, 2007
Liu Wen-hong. Study on time delay estimation methods and applications in the presence of impulsive noise[D]. Dalian: School of Information and Communication Engineering, Dalian University of Technology, 2007. [本文引用:1]