作者简介:姚向明(1987-),男,在站博士后.研究方向:轨道交通规划与管理.E-mail:yaoxm@bjtu.edu.cn
基于最小二乘方法建立了一种滑动平均策略下的动态O-D(origin-destination)矩阵估计模型。通过对自动售检票数据统计分析,发现历史与当前客流的分布结构在连续时段内具有内在关联性,以此引入滑动平均策略来有效利用多个时段的客流信息,构建基于平均策略的动态O-D矩阵估计模型。定义基于O-D行程时间分布特征的客流到达系数,从而有效刻画交通流的动态特性,建立O-D流量与车站进出站客流量之间的影响关系。最后,以北京市轨道交通为对象进行案例分析,结果表明:从全日平均相对误差角度分析,模型估计精度提高约15%~20%,即有效提高城市轨道交通在较短时间范围内O-D矩阵估计精度。
A dynamic Origin-Destination (O-D) matrix model based on least square approach is proposed for urban rail transit using moving-average strategy. Statistic analysis of historic automatic fare collection records shows that, in continuous periods, there is a strong average O-D flow relevance between priori passenger flow and current passenger flow. Therefore, a dynamic O-D matrix estimation model is established based on moving-average strategy. This model can utilize the priori flow information more efficiently. A passenger flow arrival coefficient based on the distribution of O-D travel time is defined to characterize the dynamics of traffic flow, thus establishing the relationship between O-D flow and in-and-out flow at stations. Finally, a case analysis of Beijing rail transit network is carried out. Results show that, comparing with existing model, the accuracy of the proposed model is improved about 15%~20% from the viewpoint of average relative deviation in a day. The proposed model can improve the accuracy of dynamic O-D matrix estimation in short time range for urban rail transit greatly.
动态O-D矩阵反映了时变的交通需求分布模式, 其估计过程利用交通流分配的逆过程, 是以O-D流与监测流(路段流、节点流)之间的内在关系为基础, 通过监测的交通流量来反推O-D矩阵[1]。相应估计模型及算法于20世纪80年代开始不断被提出, 主要包括最小二乘估计模型[2]、状态空间模型[3, 4]、最大似然模型[5, 6]、贝叶斯推论模型[7, 8]等。然而, 受网络规模庞大、交通行为复杂、监测交通流信息有限等因素影响, 既有模型多应用于道路交叉口、城市快速路及高速公路等简单交通网络。目前, 针对大规模轨道交通网络的动态O-D矩阵估计研究仍存在较大不足。
道路交通系统能够有效获取节点及路段的交通流信息, 而轨道交通可采集交通流信息则十分有限。当前, 我国大多数城市的轨道交通系统均无法获取列车载客量(区间客流信息), 如北京、上海、广州市轨道交通系统。有限的交通流监测信息使得在构建流量关系时较为困难, 同时, 估计过程中O-D对数一般远大于流量关系数, 导致求解变量数目大于约束关系数目, 增大了估计结果的不确定性。另外, 随着网络规模的扩大及网络结构的复杂, 乘客出行过程中的随机性增强, 进一步加大了流量关系构建的难度。再者, 轨道交通网络O-D对数与车站数约为平方关系, 常常包含数万个O-D对, 在大规模轨道交通网络条件下对模型及算法的运算效率提出了更高要求。综上, 解决轨道交通动态O-D矩阵估计面临的关键点包括:①如何有效利用其他交通流信息来弥补监测交通流信息的不足; ②如何有效刻画客流的动态移动过程, 建立O-D流量与进出站流量间相互关系; ③如何简化参数及模型计算复杂度, 提高模型对大规模网络的适用性。
为此, 本文结合轨道交通运输特点, 利用充足的先验O-D矩阵信息来辅助完成估计, 并以自动售检票(Automatic fare collection, AFC)数据为基础, 提出基于O-D行程时间分布的客流到达系数计算方法, 有效刻画了O-D流量与进出站流量间相互关系。通过对比分析历史同期(一般为上周同日)与当前客流分布结构的波动变化规律, 发现连续时段内客流分布存在一定的内在关联性, 以此引入滑动平均策略来有效利用多个时段的客流信息, 构建滑动平均策略下的O-D矩阵估计模型, 从而有效提高较短时间范围内模型估计精度。
定义轨道交通网络G=(N, A), 其中N为车站集合, N={1, 2, …, i, j, …}, A为区间集合; Ii(k)为车站i在时间[(k-1)Δ τ , kΔ τ ](时段k)内进站客流量; Oj(k)为车站j在时段k内出站客流量; T为时段集合, T={1, 2, …, k, t, …}; Δ τ 为估计时段的时间长度; qij(k)为时段k内由i站出发去往j站的客流量, 简称O-D流;
根据以上定义, O-D流与进站客流之间满足:
通过构建客流到达系数
分析可知, 客流到达系数
式(4)表明k时段由i站出发的客流在后续时段内均可能到达目的车站j, 而实际中该部分客流到达处于某时间范围内(与起讫点间出行耗时相关)。假设路网上任意O-D间乘客行程时间跨越的最大时段数为M, 则式(2)可简化为:
通过式(1)与式(5)就建立起O-D流量与监测客流量(进站客流量与出站客流量)间基本关系, 该流量关系是构建估计模型的基础。从式(5)可以看出车站j的出站客流是前期M个时段内从路网上任意一个车站出发客流到达该站聚集的结果, 因不同O-D间出行耗时不同, 且客流到达具有分散性, 使得该动态关系的刻画十分复杂。
道路交通领域中常利用分配矩阵[9]来刻画交通流的动态传播特性, 建立O-D流与路段流之间的相互影响关系。然而, 轨道交通无法采集到区间通过客流信息, 更多关注O-D流与车站进出客流之间的相互关系, 受其假设条件、推算过程复杂等因素影响, 分配矩阵不适用于轨道交通网络。为此, 构建客流到达系数来刻画轨道交通客流的动态传播特性, 并提出一种简单的客流到达系数计算方法。
轨道交通客流动态传播特性主要体现在客流时滞及分散特性[10]两方面。当估计时段时间长度较短时, 乘客出行过程会跨越多个时段(见图1), 采集到的出站客流信息晚于进站客流信息, 即形成客流的时滞特性, 并且不同O-D间滞后时间长度不同。另外, 乘客个体差异导致同一起讫车站间乘客出行耗时不同, 客流到达具有分散特性, 且不同O-D间客流到达规律差异较大, 如短距离与中长距离、单路径与多路径O-D间客流到达规律存在明显差异。
考虑到轨道交通乘客具有行程时间可靠性高的特点(区间行程时间基本固定)。同时, AFC系统记录了完整的乘客出行时间信息(进出闸机检票时间), 为乘客出行规律分析提供了充足的数据支撑。因此, 可通过构建每一O-D间乘客行程时间分布曲线来计算客流到达系数, 从而刻画O-D流与车站进出站客流间的相互关系。假设某O-D对(i, j)间乘客行程时间概率分布密度函数为f(Δ t)(见图2), 那么, 客流到达系数计算表达式为:
式中:Δ t为行程时间; [t-, t+]为行程时间范围, t-=(t-k)Δ τ , t+=(t-k+1)Δ τ 。
若已知行程时间概率分布密度函数便可准确计算客流到达系数, 然而, 实际中不同O-D间行程时间概率分布密度函数并不服从相同分布, 且难以确定其准确的分布形式。既有研究中常假设行程时间近似服从正态分布[11], 在交通流状态稳定且O-D间不存在多条径路时, 该假设具有一定的适用性。然而, 对具有复杂结构的轨道交通网络而言则难以适用, 在此, 采用更为直接和简便的方式对客流到达系数进行计算, 将行程时间进行离散化处理, 建立较小统计时间间隔(如1 min)的行程时间分布直方图(见图3), 采用式(7)计算客流到达系数。
式中:F(Δ t)表示行程时间为Δ t的乘客人数; Δ tmin和Δ tmax为最小和最大行程时间, 其他变量含义同上。
对于特殊出行时段, 如早晚高峰时段, 受客流拥挤、发车频率等因素影响使得行程时间分布不同于平峰时段, 为提高参数准确性可对不同时段内乘客的行程时间分布特征进行分析。该方法不仅避免了对乘客复杂出行行为的刻画, 而且利用实际出行数据的统计特征来反应客流的动态传播规律也具有更好的可信度。
为弥补轨道交通实时采集客流信息的不足, 模型中以先验O-D矩阵作为辅助参考。弄清历史与当前客流时空分布的波动性与相关性将有利于更好地完成估计。利用加权相对平均误差(后文简称相对偏差)来表征客流分布的波动性, 如式(8)所示, 式(9)为O-D对权值计算的表达式。利用相关系数来表征客流分布的相关性, 计算公式为式(10)。
式中:γ ij(t)为O-D对(i, j)的权重系数, 即O-D流量占网络总出行流的比重, O-D流量越大则权重系数越大;
利用2011年11月北京市轨道交通连续五日(星期一~星期五)与其对应的上周同期(同一工作日)AFC数据进行对比分析, 统计结果显示不同工作日间客流分布规律具有很强的相似性。在此, 仅列出某日(星期二)客流分析结果。
图4给出了不同统计时段长度(5 min、10 min、15 min、30 min、1 h、2 h及1 d)内历史O-D流与当前O-D流之间的相对偏差。可以看出:①随着统计时段长度的增加, 相对偏差不断减小; ②以全天为分析时段, 历史客流与当前客流相对偏差低于10%, 说明客流具有较强的空间分布稳定性; ③早晚高峰时段乘客出行规律稳定, 存在明显的峰值效应; ④对于较小分析时段(如15 min), 客流分布相对偏差位于30%~75%, 说明在较短时间范围内先验信息不能很好地为当前估计提供参考。
图5给出了不同统计时段长度下历史O-D流与当前O-D流的相关系数, 用于分析客流分布的相关性。可以看出:①随着统计时段长度的增加, 先验客流与实际客流的相关性不断增大; ②当统计时段长度大于等于1 h, 先验信息具有良好的可参考性(相关系数约为0.9), 而统计间隔为15 min时相关系数为0.7左右, 表明在进行动态O-D估计时时段长度应大于等于15 min, 该时段长度为临界点; ③在统计时段较短时(小于30 min), 存在明显的峰值效应, 这与日常工作出行乘客的出行特征保持一致。
综上, 先验客流与当前客流在时空分布上具有一定的波动性和相关性。当时段长度(如小于30 min)较小时客流分布波动性较大, 而时段长度增大时, 先验信息具有良好的参考价值。因此, 确定合理的估计时段长度有利于更好地利用先验客流信息。
结合轨道交通实时客流信息采集时间粒度(一般为15 min)以及动态运营管理的实际需求, 有必要对较短时间范围内O-D矩阵进行估计。为此, 采取滑动平均策略来进一步分析客流分布的内在规律, 为模型改进提供印证依据。
鉴于轨道交通客流在长时间范围内分布稳定(波动性小)的特点, 假设客流在空间分布上稳定性强, 即每天出行起讫站点较为固定, 那么引起较短时间范围内客流波动明显的原因可能是进站时间差异所致, 因此, 若同时考虑前向多个时段信息, 采用滑动平均策略(见图6)则可以规避到站时间差异影响。不难理解, 该策略与扩大分析时段相似, 只是对前续时段内客流信息进行了有效利用。该策略既可减少乘客到达时间的波动影响, 同时维持客流空间分布的稳定性特征。下面通过实际数据来验证该假设是否成立。
以15 min为基础时段长度, 分析不同滑动平均次数下先验与当前平均O-D流间的波动性与相关性, 结果如图7和图8所示。可以看出:①随着前向滑动次数增大, 相对偏差逐渐减小, 相关系数逐渐增大; ②从相对偏差角度来看, 仅仅向前滑动一个时段范围(滑动2次), 相对偏差明显减小, 随着滑动次数的增加, 减小幅度逐步减小; ③从相关性角度来看, 随着滑动次数的增加, 客流相关性增大, 但增大幅度亦逐步减小。
统计结果证实:基于滑动平均策略下的先验与当前平均O-D流间具有较强的稳定性与相关性。该规律存在的前提是交通流在空间分布上较为稳定, 而在时间分布上波动较大。客流主体特征明显的轨道交通具有该特征, 而对于其他交通方式是否具有相似规律尚无法验证。
最小二乘模型是动态O-D矩阵估计中的经典模型, 其通过最小化采集交通量与推算交通量间差值, 并同时最小化先验O-D流与当前O-D流间差值来进行O-D矩阵估计。基于最小二乘理论构建的标准估计模型目标如式(11)所示:
式中:ω 为先验参数, 0≤ ω ≤ 1, 其值越大代表先验信息可参考价值越高, 其值为1时即完全采用先验客流来代替当前客流, 该参数可根据客流波动情况及模型测算予以标定。
分析可知, 估计模型中先验信息起到重要作用, 当先验信息可参考性不高时势必导致估计结果误差较大。鉴于前述已经验证了滑动平均策略下历史与当前O-D流间具有较强的稳定性与相关性, 从提高先验信息可参考性角度来改进既有模型。基于滑动平均策略改进的模型目标为式(12):
式中:R为滑动平均时包含的时段总数; r为t时段的前向时段编号(r=0, 1, …, R)。
动态O-D矩阵动态估计过程为递推过程, 在进行模型求解时前向时段估计结果已经确定, 因此, 该模型不会增加模型变量数, 估计变量数始终为O-D对数。文献[12]也提出一种带滑动窗的改进模型, 其以在连续时段内总体估计偏差之和为优化目标, 保证一定时段内(包含连续多个估计时段)达到最优估计, 其策略与本文的改进方法存在本质差别, 且造成估计变量数增加, 不适用于在线O-D矩阵估计过程。
另外, 不同O-D对间存在差异性, 为减小全网O-D流量估计的总量偏差, 利用权重系数进一步修正模型目标, 使之更符合实际需求, 模型目标修正为式(13)所示。O-D对权重系数计算与式(9)相似, 采用ROD· γ ij计算, 引入ROD的目的是保证模型目标前后两部分处于同一量纲, 消除网络规模(O-D对数)对模型结果的影响。至此, 改进后动态O-D矩阵估计模型的完整形式如下:
式(14)为进站客流量与O-D流量间等式约束关系, 式(15)为O-D流非负整数约束。该模型为二次规划模型, 存在成熟的求解算法, 在此不再重复。
以北京轨道交通网络为对象进行实证分析, 网络拓扑结构如图9所示(包含车站编号), 共包含13条运行线路, 由于房山线尚未联网, 故不包括房山线。以2011年11月某日(工作日)为分析日, 进行全路网动态O-D矩阵估计。
分析网络共包含188个车站(O-D对数为35 156对), 其中对于换乘站采用虚拟站点分开表示, 以便与AFC数据对应。以全日运营时段为估计时间范围, 即5∶ 00~23∶ 00, 估计时段长度为15 min。选取上周同期(同一工作日)AFC数据为先验基础数据, 对先验O-D矩阵以及乘客行程时间分布特征进行分析。
客流到达系数是模型中的最重要参数, 通过对每一O-D对间乘客的实际行程时间进行统计分析, 采用式(7)予以计算。由于O-D对数目过于庞大, 在此仅展示部分O-D间(9对O-D)乘客的行程时间概率分布图(见图10)。可以看出不同O-D间行程时间分布规律差异明显, 也难以确定其特定的分布形式。对于全日所有时段而言, 该参数规模依旧庞大, 可设定k=1, 分别对t=1, 2, …, M内客流到达系数进行计算, 当k值变化时, 采用间隔时段数来推算t时段的客流到达系数, 因此, M个系数矩阵(客流到达系数的矩阵形式)即可涵盖所有时段间客流的到达关系。统计分析得到M设为8较为合适, 即路网乘客所需的最大行程时间为120 min(基本时段长度为15 min)。
利用Matlab编写求解程序, 采用Levenberg-Marquardt算法对模型予以求解。既有模型为常见最小二乘估计模型(式(11)), 改进模型为滑动平均策略下的优化模型(式(13))。经初步测算发现既有模型对先验参数ω 的敏感性较低, 而改进模型中参数ω 设为0.7时能够得到较好的估计结果, 因此, 模型估计时先验参数ω 取值统一设为0.7。采用加权相对偏差(式(8))和相关系数(式(10))两个指标对结果进行分析。
图11为先验客流、既有模型估计结果、改进模型(滑动4次)估计结果与实际O-D流相对偏差对比分析结果。可以看出:①既有估计模型精度较低, 原因主要在于先验信息的参考价值低; ②改进模型能够较大幅度地提高估计精度, 从全日平均相对偏差来看, 相比既有模型估计精度提高约15%~20%, 相对偏差主要位于15%~35%范围, 说明采用滑动平均策略能够有效提高估计精度; ③高峰时段能够得到较好的估计结果, 早晚高峰期间相对偏差位于15%~25%范围, 与高峰时段客流主体为工作出行乘客相关。
图12为先验客流、既有模型估计结果、改进模型(滑动4次)估计结果与实际O-D流相关系数对比分析结果。可以看出:改进模型较大幅度提高了估计值与实际值间的相关性, 从另一层面说明估计精度得到了提高。
另外, 对前向滑动次数进行敏感性分析, 表1给出了不同滑动次数下全日所有时段内的平均估计结果。对比先验与当前实际O-D客流信息, 其全日平均偏差为54.08%, 全日平均相关系数为0.80。表1中Δ RE为改进模型与既有模型的对比; avg(· )为求平均运算。
从表1可以看出:前向滑动次数取2~4较为合适, 虽然前述已经分析随着滑动次数增加, 平均O-D流间相对偏差减小、相关性增强(见2.2节), 但在估计过程中随着滑动次数的增加, 客流内在特征可能会被掩盖, 所以估计精度与滑动次数并不正相关。
(1)结合轨道交通运输特点, 构建了一种滑动平均策略下的动态O-D矩阵估计模型, 案例分析验证了模型的估计精度与适用性, 相比既有模型估计精度提高约15%~20%, 提高了轨道交通在较短时间范围内O-D矩阵的估计精度。
(2)实际AFC数据统计分析得到滑动平均策略下先验与实际平均O-D流之间存在较强的稳定性, 以此为依据改进既有估计模型。
(3)所构建模型对于交通需求空间分布结构相对稳定的轨道交通具有良好的适用性, 对于其他交通方式是否适用有待进一步验证。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|