作者简介:宗芳(1979-),女,教授,博士.研究方向:运输系统规划,交通运输发展战略与管理决策.E-mail:zongfang@jlu.edu.cn
应用活动链理论进行日出行模式划分,基于GPS出行数据构建日出行模式-出行目的识别的Logit模型系统。结果表明,在日出行模式划分的基础上再进行各次出行的目的识别,由于考虑了一天中各次出行目的间的相互关联,从而提高了出行目的的整体识别精度。研究结论可用于基于GPS数据的出行目的和日出行模式识别,同时所建立的模型系统可作为基于GPS数据的出行行为提取建模的一部分。研究成果有利于应用大数据平台提取出行数据以代替传统的居民出行调查,从而提高数据获取途径、数据广度和精度,为交通管理和规划提供数据基础。
In this paper, first, the daily travel pattern is defined based on activity theory. Then, a logic model system for detection of daily travel pattern-trip purpose using GPS data is constructed. The results indicate that this study covers interrelationship among daily trips and enhances the identifying prediction as a result by determining the trip purpose based daily travel pattern. The findings can be applied to the detection of trip purpose and travel pattern with GPS data. The model system is also one of the significant sections in identifying travel behavior with GPS data. The findings are benefit for replacing traditional residential travel survey with detecting travel data from big data platform. This study enhances the efficiency and accuracy of travel survey and contributes to transportation planning and management.
应用GPS数据进行出行信息提取可以在一定程度上代替传统的居民出行调查, 是进行交通管理与规划的重要数据基础。而基于GPS数据的出行目的识别是出行信息提取中的重要环节之一。根据GPS数据显示的轨迹点经纬度信息可以推断出行起讫点, 从而确定出行目的地。再以此为基础, 结合出行时间、用地属性、个人家庭属性等信息建模识别出行目的。
以往关于出行目的地识别的研究较多, 而进一步进行目的识别的研究较少。此方面的识别方法主要有经验法和机器学习法。关于经验法的典型研究, Wolf等[1]根据经验确定出行目的与用地性质的对应关系, 采用ArcGIS将出行端点和土地利用现状图叠加, 得到出行端点的用地类型, 从而得出该出行端点的目的候选集, 再结合停留时间和职业确定真实出行目的。Axhausen等[2]除了使用土地利用图之外, 还采用了兴趣点。兴趣点是指餐馆、加油站等点状吸引点, 它弥补了单纯使用土地利用图只能使用面状吸引点信息的不足。Bohte等[3]将用地性质、家庭住址、学校/工作单位地址作为考虑的因素, 用到了兴趣点和基于多边形的信息进行出行目的识别。柴彦威等[4]从外在条件和内生因素的角度提出了出行目的影响因素。其中, 外在条件包括家庭属性、城市形态和政策制度等; 内生因素包括个人认知和个人属性形成的任务安排时间表等。它们共同制约了人们在城市空间中的活动和在交通网络中的移动。机器学习法典型研究有, Feng等[5]将用地性质和活动属性作为自变量, 应用兴趣点采用机器学习方法进行出行目的识别; Lu等[6]根据用地性质、个人和出行属性, 采用决策树和支持向量机进行出行目的建模识别获得了71.3%的识别精度。张治华[7]对相关背景信息类型进行了归纳和定义, 利用机器学习数据挖掘技术, 建立了出行目的与多属性变量的关系, 进行出行目的识别。
以往研究均以单次出行为单位, 将一天内的各次出行独立进行识别, 缺乏对各次出行目的之间关联性的分析。而实际上出行者一天内的各次出行之间在一定程度上具有互补关系, 出行者可能以一天为单位进行出行和活动的安排。因此, 可以采用活动链的思想首先进行日活动和出行安排的分析, 再进行各次出行目的的识别, 这样就考虑了各次出行间的相互关联。
将一天中所有活动按时间顺序先后关系连接起来形成日活动链, 由出行连接各次活动。以往有很多学者对日活动链理论进行研究, 例如, Jones[8]认为出行需求源于家庭关系之外社会活动的需求, 出行选择的决策基于活动的选择。Hä gerstrand[9]认为人的行为受时空的限制, 要在不同的时间和地点进行不同的活动, 需要采取出行将各次活动地点相连接。Chapin[10]指出, 人类的基本欲望激发了活动需求, 比如谋生、社交或娱乐等都会激发出行者进行不同的活动和出行。从国内外相关研究可见, 活动链思想考虑了出行行为发生的本质和一天中各次出行之间的关联, 适用于进行出行行为建模研究。另外, 以往的出行目的建模研究表明, 基于经验法的出行目的识别精度低于机器学习法。因此, 本文将基于活动链理论进行出行目的建模研究, 采用机器学习方法, 并考虑一天中各次出行目的间的互补关系, 以期提高出行目的识别精度。
本文利用2010年北京居民出行调查获得的GPS数据, 数据样本包含900份被调查者的超过100万条的GPS轨迹点纪录, 其中700份样本用于建模, 另外200份用于模型的识别精度分析。平均每位被调查者约有1100条GPS轨迹点数据。其中每条数据均由GPS设备以5 s的时间间隔连续获得, 数据包含有经纬度、高度、速度、出行距离、出发时间、到达时间等信息。
根据日活动链理论, 出行模式可以依据活动时间的长短和发生顺序进行划分, 主要为主出行、早出行、晚出行。主出行的活动一般为上班/上学和回家, 其活动时间最长, 主出行之前的较短的出行为早出行, 主出行之后的出行为晚出行。在主出行中又可能伴随有去时驻停和回时驻停。出行者的日活动链如图1所示。一天中各出行的发生次数可能不止一次, 本研究可对一天中的多次出行进行识别, 数据统计如表1所示。统计结果表明:主出行所占比例最多, 为89.62%; 其次是晚出行, 为3.97%, 比例最小的是去时驻停, 为1.79%。
统计调查数据得到各出行模式的出行目的分布如表2所示。由统计结果可以看出, 出行者早出行的目的主要是购物、休闲和接送人; 主出行的目的主要是上班、上学、回家和一定比例的工作外出; 晚出行的目的主要是购物、休闲、就餐、访友和接送人; 去时驻停的目的主要有购物、休闲、就餐、工作外出和接送人; 回时驻停的目的主要有购物、就餐、访友、工作外出和接送人。将比例大于3.50%的出行目的保留, 比例小于3.50%的出行目的归为其他, 之后进行出行目的识别。
本文选用多项Logit模型来识别GPS数据的出行目的。首先建立1个多项Logit模型来识别日出行模式, 接着建立5个多项Logit模型识别每种出行模式的出行目的。
日出行模式识别模型选择肢见表1中的1~4, 日出行目的识别模型选择肢设置如下:
早出行选择肢为购物、休闲、接送人、其他; 主出行选择肢为上班、上学、回家、工作外出、其他; 晚出行选择肢为购物、休闲、就餐、其他; 去时驻停选择肢为购物、休闲、就餐、其他; 回时驻停选择肢为购物、就餐、访友、工作外出、其他。
根据随机效用理论, 选择肢i对出行者n的效用函数为:
式中:
式中:
在满足
式中:Pin为出行者n选择第i个选择肢的概率;
应用统计分析软件SPSS 21.0进行多项Logit模型的参数标定, 结果见表4、表5。
模型的参数估计值解释如下:以日出行模式识别模型为例, 用地性质对早出行的影响程度按从大到小依次为市场L3、公园L8、商业/服务业L2、学校L6、医院L4、餐饮/娱乐L9、各类办公楼L1。用地性质对主出行的影响程度按从大到小依次为各类办公楼L1、学校L6、住宅/公寓L7、餐饮/娱乐L9、商业/服务业L2、医院L4、体育场馆L5、公园L8、市场L3。用地性质对晚出行的影响程度按从大到小依次为商业/服务业L2、市场L3、医院L4、公园L8、餐饮/娱乐L9、住宅/公寓L7、学校L6、各类办公楼L1。用地性质对去时驻停的影响程度按从大到小依次为商业/服务业L2、体育场馆L5、餐饮/娱乐L9、学校L6、住宅/公寓L7、市场L3、医院L4、各类办公楼L1、公园L8。活动时间与出行者选择早出行、晚出行和去时驻停呈负相关, 说明短时间的活动其对应的出行是早出行、晚出行和去时驻停的概率更大。活动时间与出行者选择主出行呈正相关, 说明长时间的活动其对应的出行是主出行的概率更大。出发时间与早出行呈正相关, 而与晚出行呈负相关, 说明出发时间越早越可能是早出行, 出发时间越晚越可能是晚出行。到达时间与早出行、主出行和去时驻停呈负相关, 说明到达时间越晚, 选择早出行、主出行和去时驻停的可能性就会降低; 而与晚出行呈正相关, 说明到达时间越晚越可能是晚出行。
基于活动链理论建立多项Logit模型, 应用GPS数据进行了出行目的识别。解决了以往研究均以单次出行为单位, 将一天内的各次出行独立进行识别, 缺乏对各次出行目的之间关联性分析的问题。结果表明, 活动链理论应用于出行目的识别在一天中各出行模式划分的基础上再进行目的识别, 整体上提高了出行目的识别的精度, 将精度从以往研究的最高71.3%提高到最低83.6%[6]。所建模型能以较高精度识别出行目的, 在方法上对出行目的建模识别和出行行为分析具有一定的理论意义。研究结论可用于基于GPS数据的出行目的识别, 为交通管理和规划提供数据基础。下一步研究将从增加样本量、进行多日的GPS出行调查和应用其他城市的GPS数据进行模型验证等角度对研究进行深化, 以期提高预测精度以及模型的时间和空间可转移性, 同时用活动链理论对多日的出行目的进行核查, 实现更高精度的多日出行目的整体建模识别。
The authors have declared that no competing interests exist.