作者简介:李志慧(1977-),男,副教授,博士.研究方向:交通视频检测与处理.E-mail:lizhih@jlu.edu.cn
针对现有背景模型假设引起的失效问题,根据数据驱动思想,建立了一种基于数据驱动的背景模型表示方法。该方法通过全格式动态线性化的无模型自适应控制方法,引入系统的伪梯度向量,结合多步历史数据,建立背景表达和选择性更新策略,获取视频背景。实验过程通过不同场景视频序列和经典背景模型方法进行对比,实验结果表明:本文算法具有背景更新效果较好、计算量适中、鲁棒性强等优点,且克服了机理模型中对模型假设的依赖及模型失效等问题。因此,本文基于数据驱动的背景模型算法可为在线视频检测系统的背景抽取提供有力的技术支持和参考。
The current modeling assumption may induce background distortion. To solve this problem, a new background model based on data-driven theory is proposed. Model-free adaptive control method is used to express the value of the online video sequence. The slow process of background illumination change is regarded as a nonlinear time-varying system, and is expressed via dynamic linearization using pseudo-gradient vector. Then, the expression is iterated with the combination of historical data and selective background update method to complete the background model iteration process. Experiments are carried out based on different video cases. Results show that the model can get better foreground and more stable background than Kalman filter and Gaussian-mixture model. Furthermore, the data-driven method of the proposed model overcomes the disadvantages of the mechanism models, and its computational efficiency and robustness make it applicable to online video processing and detection of moving objects.
背景模型对运动目标的检测起着至关重要的作用。国内外关于背景模型的研究可归纳为:中值滤波法[1], 该方法通过建立动态视频滑动窗口存储多帧数据再取其中值来估计背景, 但其所需存储数据多; Kalman滤波法[2, 3]与Wiener滤波法[4], 该方法利用线性低通滤波器, 通过对于协方差的迭代来估计背景, 得到的背景噪点较多, 且估计效果依赖于参数的选取; 基于混合高斯模型(Gaussian mixture model, GMM)法[5, 6, 7, 8], 该方法用多个高斯模型描述背景的变化过程, 但算法复杂度较高、迭代缓慢; 自组织背景模型[9, 10], 该方法利用人工神经网络对复杂场景进行建模, 但其寻优过程运算量过大、实时性较差; 视觉背景提取模型[11, 12], 该方法为每个像素点建立随机样本模型并在空间邻域进行传播, 其计算速度较快, 但所建立模型的参数固定、缺乏自适应能力, 且其邻域扩散的策略难以区分缓慢移动的物体。
上述方法虽然在特定场景的应用中均取得了较好的实验效果, 但均依赖于具体特定的模型假设。真实背景由于受光照、检测器噪声、环境等多因素影响, 特定的背景模型难以刻画真实背景。若背景难以满足模型假设, 则导致模型失效等问题。数据驱动方法不包含受控过程的数学模型信息, 仅利用系统的输入及输出数据及经过处理得到的信息来实现控制, 将数学模型的逻辑复杂度转移到数据中来, 从而达到用更加精简的控制律法, 得到稳定性、鲁棒性更好的结果。本文建立了一种基于数据驱动的背景模型表示方法, 该方法利用无模型自适应控制(Model free adaptive control, MFAC)[13]的思想, 构建了背景的表达和更新过程。通过不同视频序列和相关方法的对比实验表明, 该方法得到的背景变化更加稳定, 抗扰能力更强。
本文借助数据驱动理论中已得到广泛验证的MFAC控制理论[14, 15, 16, 17, 18, 19], 通过全格式动态线性化的控制方法, 并引入系统的伪梯度向量, 结合多步历史数据, 对背景进行表达; 再结合选择性更新策略, 得到实时更新的背景模型。
MFAC理论是侯忠生教授于1994年提出的一种基于数据驱动理论的控制方法[20, 21], 该方法仅利用系统的在线的输入输出数据, 建立等价的动态线性化模型对非线性受控系统进行估计, 仅利用多步在线历史数据以及对视频背景变化的参数自适应和结构自适应来完成对背景变化的学习与控制, 不追求特定的估计指标, 不会产生模型失效的问题; 通过控制系统的伪阶数设定采用的历史数据量, 效果及稳定性优于单步学习滤波器; 且与其他数据驱动方法相比, 需要调整的参数少、参与在线运算的数据量适中, 迭代简单, 有利于对在线系统的实时估计。本文将MFAC理论引入背景建模中, 建立图像背景的表达。根据获取到的背景变化信息, 对背景的更新过程进行控制。
令
式中:
由于在图像处理中, 各像素点的值为有界整数, 满足广义Lipschitz条件[21, 22], 故可将背景光照变化的过程表达为如下全格式动态线性化模型:
式中:
系统输入向量
式中:
伪梯度向量
式中:
利用全格式动态线性化的方法, 可以将难以处理的背景光照变化的非线性过程等价地转化为一个带有时变标量的线性时变系统。即可以采用如下MFAC控制方案:
式中:
上述式(5)式(7)即为本方法的三条控制律。其中, 式(5)为对于背景的输入控制迭代, 用系统中虚拟的输入来修正光强变化和检测误差等非线性因素的干扰, 使获取的背景更加真实、稳定; 式(6)为对伪梯度的估计算法, 得到的伪梯度向量为一个慢时变参数, 可以体现出光照的缓慢变化情况与其在前几个时刻取值的内在关联性与影响规律; 式(7)为对伪梯度的重置算法, 使得本方法具有更强的时变参数跟踪能力。
在对视频中的背景进行建模时, 需要考虑背景的值随着光照的变化而产生变化。本文采用式(8)所示的形式进行背景更新:
式中:
式中:
基于全格式MFAC方法的4个控制变量分别为权重因子
当系统的伪阶数增加时, 得到的视频背景稳定性进一步增加, 实际工程实践中常取2至4阶; 出于计算复杂度的考虑, 本文选取伪阶数为3。伪梯度向量的初始值应结合视频中光照变化快慢决定, 本文选取伪梯度向量各分量约为0.16。
试验依托的设备为PC机, 配置为:Intel Core I5, 3.20 GHz, 内存4.00 GB, 利用MATLAB对视频图像验证分析。
2.2.1 谐波的效果分析
由于难以获取图像的背景真值, 本文引入谐波函数
由图1和图2知, 本文方法相比于Kalman滤波器与GMM模型能较好地逼近函数真值且具有较好的鲁棒性; 由图2和表1知, 本文算法误差均小于Kalman滤波器与GMM模型算法。在耗时方面, 本方法运算速度介于GMM模型与Kalman滤波器之间。在波形的稳定性方面, 本方法相比于Kalman滤波器与GMM模型算法更加平稳, 与真值的变化情况更为接近。
2.2.2 单像素点时间序列效果分析
为了有效地测试本文算法单像素点的背景的抽取能力, 选取5000帧光照条件变化缓慢的视频序列, 选取坐标(267, 84)的像素点, 分别利用本文算法、Kalman滤波器与GMM模型获取其背景, 实验对比结果如图3所示。
由图3可见, 本文算法较Kalman滤波器与GMM模型算法更为稳定, 鲁棒性更强。
实验过程选取了不同场景视频序列, 通过本文算法、Kalman滤波器、GMM模型进行对比验证分析, 其对比实验结果如表2和图3与图4所示。
对视频段的背景评价中, 定量分析指标选取为召回率(Recall), 精度(Precision)以及正确分类率(PCC):
式中:
表2给出了视频序列“ PETS2006” 中第300帧、第700帧第950帧和第1200帧的本文算法、Kalman滤波器、GMM模型的前景、背景抽取对比效果以及人工识别出的前景的比较。由表2可以看出本文算法能够较好地获取前景物体和良好的背景抽取能力。图4给出了这一视频序列300至1200帧的定量分析结果。由此图可知, 本文算法在召回率、精度及正确分类率三个方面效果良好, 均超过了98%, 结果优于Kalman滤波器及GMM模型。
表3给出了环境、光照、前景个体数量等不同因素影响下, 采用本文算法、Kalman滤波器、GMM模型处理视频序列的前景、背景抽取对比效果。由表3可以看出:①相比于Kalman滤波器, 本文算法得到的背景值更加稳定, 不会因图像像素值的突变产生过多的前景噪点或将噪声“ 学习” 入背景中; ②相比于GMM模型, 不会因前景物体较多或运动缓慢、长时间停留等原因而使得背景模糊不清、产生“ 鬼影” 现象; ③在光照缓慢变化时可以根据历史数据驱动而准确地学习其变化的规律, 在较长的时间后仍能保持获取到的背景的稳定性。
由此可见, 本文算法具有优于Kalman滤波器、GMM模型的背景抽取能力和较好的鲁棒性。
本文建立了一种基于数据驱动的背景模型表示方法。该方法根据MFAC的思想, 通过对视频中像素点值的历史数据进行动态线性化处理, 结合选择性更新策略, 建立了背景模型。经过多场景视频序列的分析与对比表明, 本文算法具有良好的背景抽取能力和较好的鲁棒性, 可为交通视频监控、视频检测等多应用场景下的背景抽取提供参考和技术支持。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|