作者简介:孟品超(1978-),女,副教授. 研究方向:计算数学.E-mail:mengpc@cust.edu.cn
提出了一种基于滑动平均方法(MA)的城市轨道交通客流预测算法,首先确定用于滑动平均的滑动参数,然后对历史数据求滑动平均值得到各个时间段的预测客流数据,并采用实时客流数据对预测结果进行修正,得到预测客流时间序列。试验结果表明,采用滑动平均方法不仅预测精度要高于支持向量机(SVM)、反向传播神经网络(BPNN)、小波神经网络(WNN)和小波组合支持向量机(WS)这4种预测方法,而且滑动平均方法的计算速度要明显优于以上4种方法,可用于复杂非平稳客流时间序列的短时预测。
This paper presents an algorithm for short-time passenger flow prediction in urban rail transit based on Moving Average (MA) method. First, the moving parameters of MA are determined, then, the direct forecasting passenger flow time is obtained by averaging the historical data. Second, the predicted time series of passenger flow are obtained by modifying the direct forecasting results with the actual-time passenger flow data. Experimental results suggest that the MA method is superior to Support Vector Machine (SVM), Back Propagation Neural Network (BPNN), Wavelet Neural Network (WNN) and the combination of Wavelet and SVM (WS) both in prediction accuracy and computing speed. Therefore, the proposed algorithm can be applied to short-time prediction of complex passenger flow time series.
轨道交通中滑动平均法模型简单易用, 目前多用于对数据预处理, 如裴益轩等[1]在实例应用中用滑动平均法给出了滤掉高频干扰信号的算法; 胡松等[2]用滑动平均法滤波衰减了较高频率的噪声信号, 达到提高信噪比的目的; 何耀等[3]在所提出模型的基础上, 采用滑动平均滤波法削弱噪声项干扰, 起到了较好的估计效果。Hatchett等[4]鉴于较长移动平均效果差的状况, 重新给出了移动平均最佳长度的建议。Shih等[5]将N点滑动平均的方法应用到普通示波血压确定过程, 从而在可接受精确度范围内非常方便且无创地获得中枢主动脉收缩压值。
轨道交通客流具有周期性, 每天客流波动具有一定规律性。客流时间序列在每天同一时间段客流量具有相似性, 其构成的时间序列具有一定的平稳性。因此, 可采用滑动平均法对历史客流数据在每天同一时间间隔内构成的时间序列进行建模, 并采用滑动平均法[6]来一步预测相同时间间隔内的客流量。滑动平均模型简单, 不需大量样本, 且计算速度快, 具有较高的预测精度。故本文提出了一种基于滑动平均法的轨道交通短时客流预测算法。
总体上波动较为平稳的离散时间序列可看成规律性成分的稳定性部分和受噪声因素影响的随机性波动两部分组成, 故较为平稳的离散时间序列可分成两部分:
yt=ft+et, t=1, 2, …, N(1)
为减弱随机误差影响, 通常可对总样本量为N的原始时间序列数据作滑动平均处理, 即对非平稳的时间序列, 在合适的样本量为n的小区间上看作近似平稳的, 其中n为滑动平均参数, 然后在这个近似平稳的区间上采用式(2)进行平均处理, 得到的值可以作为下一时刻的预测值。
k=n+1, n+2, …, N+1
对于时间序列{yt}逐一对各小区间内数据进行局部平均化处理, 得到减弱了噪声因素{et}影响的预测时间序列{
针对预测算法的精度, Dhuyvetter and Kastens[7]采用平均绝对误差的方法衡量预测精度, Hatchett[8]考虑使用均方根误差来衡量预测精度, 这两种衡量方法效果差别不大。本文拟采用消除量纲影响的平均相对误差来比较不同滑动参数下的预测误差。
取不同的滑动参数n就会有不同的滑动平均结果[9], 滑动参数n过小, 起不到抑制随机波动的作用; 滑动平均参数n过大,
RME(n)=
比较不同的RME(n), 平均相对误差最小时所对应的滑动参数取值是合理的。RME(n)的值反映了取不同滑动参数时滑动平均预测的结果与历史数据的拟合程度, 所以这种挑选方法是合理的。
以每天为单位生成的原始客流时间序列受随机因素影响, 波动强烈, 呈现出明显的非平稳特征, 但历史客流数据在每天同一时段内的数据具有相似性, 其组成的时间序列起伏变化不会太大, 可被视为变化较平稳的时间序列。所以, 由历史客流时间序列每天同一时刻数据构成的时间序列, 用滑动平均方法对下一天处于相同时间段数据进行预测, 可得到基于历史数据的预测客流时间序列, 接下来根据实时客流数据进行实时预测[10]。其方法简单、运算速度快, 又具有较好的预测精度。具体算法步骤如下:
步骤1 生成原始客流时间序列矩阵。
A=
其中, N为每天生成的原始客流数据量, m为采集客流数据样本的天数。m天历史客流数据在每天同一时间段j的客流量所生成的新客流时间序列为:Aj=
步骤2 确定用于滑动平均的参数nj。参数nj=2, 3, …, m-1, 计算nj取不同值时的滑动结果:
式中:
不同的滑动参数nj所对应的预测平均相对误差为:
RMEj=
RM
nj=2, 3, …, m-1。
将RM
步骤3 采用滑动平均法预测第m+1天各时刻的客流量数据。将RM
步骤4 基于实时客流数据对预测客流量进行实时预测。实时预测结果为:
式中:cm+1|l0=1, 2, …, N为通过交通系统得到的实时客流数据;
本文拟采用平均相对误差(RME)和均方根误差(RMSE)这两种方法来对算法预测的误差效果进行评价[11]。
2.2.1 RME
平均相对误差用来评价预测客流数据与真实客流数据之间的相对误差的平均值, 其计算公式为:
RME=
式中:yi为真实客流数据;
RME越接近于0, 说明客流预测精确度越高。
2.2.2 RMSE
均方根误差用于评价预测客流数据与真实数据误差平方和的均值平方根, 其公式如下:
RMSE=
RMSE越接近于0, 说明客流预测算法越准确。
基于本文提出的方法, 针对2015年4月1日到29日上海地铁一号线人民广场站进站和莘庄站进站刷卡信息, 分别采取5 min和 15 min时间粒度采样生成原始客流时间序列。由于运营时间不同, 5 min粒度时, 人民广场站每一个完整运营日将获得212个进站观测值, 莘庄站将获得204个进站观测值; 15 min粒度时, 人民广场站每一个完整运营日将获得70个进站观测值, 莘庄站将获得68个进站观测值。共获得29天的原始客流数据。
实验首先通过最小平均相对误差检验方法确定滑动平均参数nj, 然后用式(5)得出最小平均相对误差条件下第30天各时刻预测值
2015年4月1日人民广场地铁站进站客流经过5 min和15 min采样后得到客流时间序列如图1所示。图2为采用滑动平均方法预测4月30日5:45~5:50、6:00~6:15这两个时间段内客流量时, 选取不同的滑动参数nj进行预测所对应的平均相对误差。基于实时交通客流数据, 通过滑动平均方法, 得到4月30日的5 min粒度和15 min粒度预测客流时间序列, 其结果如图3所示。几种不同预测方法的实验误差见表1。
通过表1对人民广场站进站短时客流预测结果分析可以发现, 基于滑动平均法的实时客流预测精度最高, 且计算耗时也远远少于其他方法。从图1和2可以看出, 采取15 min粒度采样生成的原始客流时间序列更平滑, 故预测15 min粒度的客流序列的平均相对误差更小。从图2可以看出, 预测不同时间段的客流量所采用的滑动参数是依据预测RME最小标准自适应选取的。对比图3(a)(b)可知, 在晚高峰时段客流数据波动强烈, 导致拟合效果稍差。而本文提出的基于实时客流数据的滑动平均预测方法对晚高峰波动较强烈的数据具有较好预测效果。
2015年4月1日上海市地铁一号线莘庄进站客流经5 min粒度和15 min粒度采样得到原始客流时间序列如图4所示。图5(a)(b)分别为采用滑动平均方法预测4月30日6:00~6:05、9:15~9:30这两个时段客流时, 取不同滑动参数nj进行预测对应的平均相对误差。采用与实验1同样方法得到4月30日5 min粒度和15 min粒度预测客流时间序列如图6所示。几种不同方法的预测误差见表2。
通过表2对莘庄站进站短时客流预测结果分析可以发现, 基于实时交通客流的滑动平均预测方法精度高于其他4种预测方法, 且运算时间优于其他方法。从图4可看出, 15 min粒度采样生成的原始客流时间序列更平滑, 波动性减弱, 预测精度比5 min粒度的提高很多。对比图6(a)(b)可以发现, 在波动强烈的早高峰时段, 预测算法的拟合效果也较好, 故本文提出的基于实时交通数据的滑动平均方法对早高峰客流数据也具有较好的预测效果。
针对轨道交通客流历史数据在每天相同时段内具有一定相似性的特点, 以及当前应用于短时客流预测领域算法复杂、计算速度慢的不足, 本文将算法简单、计算速度快的滑动平均方法应用于轨道交通短时客流领域。通过采用滑动平均算法对人民广场站和莘庄站两站点进站客流进行预测并验证。结果表明, 本文提出的基于滑动平均算法的实时客流预测方法精度高于非线性预测方法支持向量机、BP神经网络和小波神经网络, 也明显高于小波和支持向量机的组合预测方法。同时, 滑动平均方法还具有算法简单、计算速度快的优点, 具有较好的预测效果。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|