作者简介:宗芳(1979-),女,副教授,博士.研究方向:交通行为分析.E-mail:zongfang@jlu.edu.cn
构建了通勤者的日活动-出行链,并给出其时间构成要素,对比分析了Hazard和回归支持向量机模型的预测精度,应用回归支持向量机模型建立了出行耗时预测模型和活动持续时间预测模型,预测了通勤日活动-出行链中各次出行的出行耗时和各次活动的持续时间,并应用已建模型考察公交优先策略对出行耗时的影响.研究表明:本文所建模型能够以较高精度预测通勤者的日出行耗时和活动持续时间,在出行耗时预测中回归支持向量机的预测精度高于Hazard模型,相关影响因素分析也有助于掌握居民的通勤出行时间决策规律.研究成果可以为构建通勤日活动-出行行为预测模型系统提供连续时间预测模块,也可以为交通需求管理政策的制定和实施提供决策依据.
The commuter's daily activity-travel schedule is proposed and its key time allocation is investigated. According to the comparison of hazard model and Support Vector Regression (SVR) model, travel time prediction models and activity duration prediction models are developed by employing SVR. Then, the continuous time allocation, i.e. all the travel times and activity durations in daily activity-travel schedule are derived and the transit priority policy is evaluated using these models. The results indicate that the model system has a high level of prediction accuracy, and the goodness-of-fit of SVR models is higher than that of Hazard models. This study provides useful insights into commuter's activity-travel time allocation decision. It also serves a foundation that future models of full-scale daily activity-travel pattern can be built on. Moreover, it provides potential for transportation demand management policy analysis.
日活动-出行链的时间构成要素包括活动时间和出行时间, 以往研究多将二者分开考虑.例如, 在出行时间预测方面, 隽志才等[1]应用Hazard模型预测日出行链中的出行耗时; Bhat[2]和Small[3]分别构建Ordered generalized extreme value(OGEV)模型和非集计经济模型, 预测了购物出行和早通勤的出发时段.在活动时间预测方面, Bhat等[4, 5]应用Hazard模型预测购物活动耗时, 并结合应用连续-离散方法预测活动开始时间和活动持续时间.另外, 以上这些研究多数均仅考虑日活动链中的一部分[2, 3, 4, 5].也有学者[6]结合出行时间预测和活动时间预测, 整体预测通勤日活动-出行时间, 但仅考虑了典型的通勤日活动-出行链, 即仅包含早晚通勤出行, 不包含早晚出行和工作子往返行程.本文将构建完整的通勤日活动-出行链, 对全日所有出行和活动的持续时间进行整体建模预测.
一般来说, 日通勤活动链由图1所示的5个部分组成:① 早出行:指早通勤离家之前的出行和活动, 例如晨练; ② 早通勤:由家到工作单位的出行; ③ 工作子往返:基于工作单位的子往返行程, 如中午从单位出门吃饭; ④ 晚通勤:由工作单位回家的出行; ⑤ 晚出行:下班回家后的出行和活动.每部分又可能由一次以上的出行或者中途驻停组成.为了减少模型复杂度, 仅考虑每部分的第一次出行以及早通勤或晚通勤中的第一次中途驻停.
将所有通勤出行时间要素分为离散时刻和连续时间两类.其中离散时刻包括出发时刻和中途驻停到达时刻, 连续时间包括出行耗时和活动持续时间, 从而确定通勤日活动链中的时间要素(见图2).本文仅预测连续时间, 通勤日活动链中的连续时间要素包括:① 出行耗时:早出行耗时, 早通勤出行耗时, 工作子往返出行耗时, 晚通勤出行耗时和晚出行耗时; ② 活动持续时间:早出行活动持续时间, 早出行中途驻停时间, 工作子往返活动持续时间, 晚通勤中途驻停持续时间和晚出行活动持续时间.
本文数据取自2006年北京市居民日出行调查.调查区域为该市18个区, 涉及人口13.8万(约为常驻总人口的1.17%).经数据筛选得到包括54 398个家庭138 480名居民的202 883次出行数据以及出行者个人和家庭属性数据, 主要数据项及统计结果见表1.其中, 出行目的中的工作包括上班, 上学, 回家, 工作外出等; 生活包括购物, 看病, 探亲访友等; 娱乐包括休闲健身, 文化娱乐等; 其他包括乘车, 换乘, 回程等.
以早出行耗时为例, 应用Stata软件绘制在几个主要因素影响下早出行耗时的分布曲线, 如图3所示.图中横坐标表示出行耗时, 纵坐标表示出行耗时能维持到某一时间点的概率.由图3(a)可见, 随着出行距离的逐渐增大, 出行耗时逐渐增加.结果表明, 另外3个变量, 即出发时段, 出行方式和出行目的也均对早出行耗时有显著影响.
建立出行耗时预测和活动持续时间预测两组模型, 模型框架见图4.
Hazard模型是近年来进行连续时间预测所采用的主要模型[1, 4, 6].然而, 一些学者的研究表明[7], 回归支持向量机(Support vector regression, SVR)在连续时间预测方面具有较高的正确性和可靠性, 应用SVR方法进行出行时间预测可以大大减少相对均值误差和均方根误差.因此, 本文将验证Hazard模型和SVR模型在持续时间预测中的精确度, 选择精度高的模型建立持续时间预测模型.
2.2.1 回归支持向量机
支持向量机(Support vector machines, SVM)是近年来出现的一种新的数据分析和模式识别的机器学习方法.主要研究如何从有限观测数据中挖掘出目前尚不能通过原理分析得到的规律, 并利用这些规律对未知数据或无法观测的新现象进行预测和判断[8].SVR是SVM的一种, 用于连续独立变量的回归建模.
已知
式中:φ(x)为从输入空间x到非线性高维特征空间的映射;w为参数;b为阈值.
将回归估计问题定义为对一个损失函数进行风险最小化的问题, 而最优的回归函数是通过在一定的约束条件下进行最小化, 规则化风险泛函见式(2).
式中:第一项使函数更为平坦, 以提高泛化能力, 称为规则化项; 第二项为经验风险泛函, 由不同的损失函数确定; 常数
对于
式(5)为凸二次优化问题, 引入拉格朗日函数, 可得:
式中:
将核函数
式中:
2.2.2 Hazard模型
将非负持续时间T(连续的出行耗时或活动持续时间)看作随机变量, 将T的条件概率定义为风险函数h(t), 表示一次出行或活动在持续时间t之后的某一时点结束的瞬时概率, 即:
式中:
T的概率密度函数和概率分布函数分别为f(t)和F(t):
定义生存函数S(t)为出行耗时或活动持续时间大于t的概率, 则h(t)与f(t)、F(t)和S(t)之间的关系为:
假设风险函数服从指数分布, 建立出行耗时或活动持续时间的加速失效时间模型, 风险函数h(t)及生存函数s(t)分别为:
式中:
分别应用SVR和Hazard构建早通勤, 晚通勤出行耗时模型和早晚出行活动持续时间模型, 模型标定和预测结果如表2所示.对比二者的预测结果与真实值可知, SVR的预测结果比真实值更集中, 波动小, Hazard的预测结果更发散, 波动大.均方根误差计算结果表明, SVR的预测精度高于Hazard模型.可见, 在活动-出行连续时间预测方面, SVR优于Hazard模型, 因此选用SVR模型进行出行耗时和活动持续时间建模.
基于SVR模型构建出行耗时和活动持续时间2组, 共8个模型, 各模型的标定结果见表2.均方根误差计算结果表明:各模型的预测精度均在可接受范围内[9], 早出行模型和早晚通勤中途驻停模型的预测精度较高, 而工作子往返和早晚出行活动持续时间模型的预测精度较低.另外, 各模型预测值均小于真实值, 预测结果比真实值分布更集中, 浮动小, 这一点也符合建模预测的基本规律.为了验证所建模型的可转移性, 应用已建立的模型, 代入2010年北京市居民出行调查数据, 进行通勤者的出行耗时和活动持续时间预测, 并将预测结果与实际值相对比.结果表明:在出行耗时预测中, 晚通勤的均方根误差最大, 为0.158; 在活动持续时间预测中, 工作子往返活动的均方根误差最大, 为0.382.两项误差均与表2所示的基于2006年出行调查数据的误差结果接近.这说明模型具有良好的稳定性和随时间可转移的特性.
从各模型涉及的变量来看, 出行距离在各个模型中均为显著影响变量, 说明出行距离是通勤者的出行耗时和活动持续时间决策中的一项重要因素.另外, 出行方式对工作子往返出行耗时及早晚出行的活动持续时间影响不显著.统计出行数据表明:工作子往返和早晚出行一般为短距离出行, 其中55.40%采取步行方式, 方式分布的不均衡可能是出行方式影响不显著的原因之一.此外, 出行目的对于早, 晚通勤出行耗时和早, 晚出行活动持续时间外的其他时间要素有影响.标定结果还说明出发时段对于出行耗时以及活动持续时间有影响.
将已建的出行耗时预测模型应用于公交优先政策评价.选取数据库中家庭编号为0101* * * * 585到0102* * * * 853的150位通勤者的早出行, 早通勤, 工作子往返, 晚通勤和晚出行数据.统计得到这五类出行中的公交(含地铁)方式分担率分别为6.0%, 29.3%, 10.7%, 30.7%和9.3%.假设通过实施公交优先相关措施, 使五类出行的公交分担率均提高到50%, 将此值分别代入已建的5个出行耗时预测模型, 预测出行方式调整后的各段出行耗时, 并与真实值对比, 结果见表3.
表3表明:公交出行比例提高后, 各段出行耗时的预测值明显低于真实值, 最高降低比例达到90%.说明公交优先政策可以有效减少居民的通勤出行耗时.
本研究基于活动链理论构建了通勤日活动-出行链, 给出了其中的主要时间要素, 对比分析了Hazard和SVR模型在活动-出行持续时间预测中的精度, 基于SVR模型建立了出行耗时预测模型和活动持续时间预测模型, 预测了通勤活动-出行链中各次出行的出行耗时以及各次活动的持续时间, 并应用出行耗时模型分析了公交优先策略对出行耗时的影响.研究表明, 所建模型能够以较高精度预测通勤者的日出行耗时和活动持续时间, 在连续的出行耗时预测中SVR的预测精度高于Hazard模型.研究结论可以为活动-出行行为的整体建模预测提供模型基础, 同时为掌握居民通勤出行规律, 考察相关交通管理政策的可行性提供决策分析工具.后续研究需继续考虑通勤日活动-出行时间系统中的离散时间要素的预测问题, 并研究如何构建通勤日活动-出行时间预测模型系统以及将其嵌入日活动-出行行为预测模型系统中.
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|