基于GPS数据的日出行模式-出行目的识别
宗芳, 齐厚成, 唐明, 吕建宇, 于萍
吉林大学 交通学院,长春130022
通信作者:唐明(1976-),男,讲师,博士.研究方向:运输系统规划与管理.E-mail:tangming@jlu.edu.cn

作者简介:宗芳(1979-),女,教授,博士.研究方向:运输系统规划,交通运输发展战略与管理决策.E-mail:zongfang@jlu.edu.cn

摘要

应用活动链理论进行日出行模式划分,基于GPS出行数据构建日出行模式-出行目的识别的Logit模型系统。结果表明,在日出行模式划分的基础上再进行各次出行的目的识别,由于考虑了一天中各次出行目的间的相互关联,从而提高了出行目的的整体识别精度。研究结论可用于基于GPS数据的出行目的和日出行模式识别,同时所建立的模型系统可作为基于GPS数据的出行行为提取建模的一部分。研究成果有利于应用大数据平台提取出行数据以代替传统的居民出行调查,从而提高数据获取途径、数据广度和精度,为交通管理和规划提供数据基础。

关键词: 交通运输系统工程; 出行目的; GPS; 活动链; 多项Logit模型
中图分类号:U491.1 文献标志码:A 文章编号:1671-5497(2018)05-1374-06
Identifying daily travel pattern-trip purpose using GPG data
ZONG Fang, QI Hou-cheng, TANG Ming, LYU Jian-yu, YU Ping
College of Transportation, Jilin University, Changchun 130022, China
Abstract

In this paper, first, the daily travel pattern is defined based on activity theory. Then, a logic model system for detection of daily travel pattern-trip purpose using GPS data is constructed. The results indicate that this study covers interrelationship among daily trips and enhances the identifying prediction as a result by determining the trip purpose based daily travel pattern. The findings can be applied to the detection of trip purpose and travel pattern with GPS data. The model system is also one of the significant sections in identifying travel behavior with GPS data. The findings are benefit for replacing traditional residential travel survey with detecting travel data from big data platform. This study enhances the efficiency and accuracy of travel survey and contributes to transportation planning and management.

Keyword: engineering of commutations and transportation system; trip purpose; GPS; activity chain; multinomial Logit model
0 引 言

应用GPS数据进行出行信息提取可以在一定程度上代替传统的居民出行调查, 是进行交通管理与规划的重要数据基础。而基于GPS数据的出行目的识别是出行信息提取中的重要环节之一。根据GPS数据显示的轨迹点经纬度信息可以推断出行起讫点, 从而确定出行目的地。再以此为基础, 结合出行时间、用地属性、个人家庭属性等信息建模识别出行目的。

以往关于出行目的地识别的研究较多, 而进一步进行目的识别的研究较少。此方面的识别方法主要有经验法和机器学习法。关于经验法的典型研究, Wolf等[1]根据经验确定出行目的与用地性质的对应关系, 采用ArcGIS将出行端点和土地利用现状图叠加, 得到出行端点的用地类型, 从而得出该出行端点的目的候选集, 再结合停留时间和职业确定真实出行目的。Axhausen等[2]除了使用土地利用图之外, 还采用了兴趣点。兴趣点是指餐馆、加油站等点状吸引点, 它弥补了单纯使用土地利用图只能使用面状吸引点信息的不足。Bohte等[3]将用地性质、家庭住址、学校/工作单位地址作为考虑的因素, 用到了兴趣点和基于多边形的信息进行出行目的识别。柴彦威等[4]从外在条件和内生因素的角度提出了出行目的影响因素。其中, 外在条件包括家庭属性、城市形态和政策制度等; 内生因素包括个人认知和个人属性形成的任务安排时间表等。它们共同制约了人们在城市空间中的活动和在交通网络中的移动。机器学习法典型研究有, Feng等[5]将用地性质和活动属性作为自变量, 应用兴趣点采用机器学习方法进行出行目的识别; Lu等[6]根据用地性质、个人和出行属性, 采用决策树和支持向量机进行出行目的建模识别获得了71.3%的识别精度。张治华[7]对相关背景信息类型进行了归纳和定义, 利用机器学习数据挖掘技术, 建立了出行目的与多属性变量的关系, 进行出行目的识别。

以往研究均以单次出行为单位, 将一天内的各次出行独立进行识别, 缺乏对各次出行目的之间关联性的分析。而实际上出行者一天内的各次出行之间在一定程度上具有互补关系, 出行者可能以一天为单位进行出行和活动的安排。因此, 可以采用活动链的思想首先进行日活动和出行安排的分析, 再进行各次出行目的的识别, 这样就考虑了各次出行间的相互关联。

将一天中所有活动按时间顺序先后关系连接起来形成日活动链, 由出行连接各次活动。以往有很多学者对日活动链理论进行研究, 例如, Jones[8]认为出行需求源于家庭关系之外社会活动的需求, 出行选择的决策基于活动的选择。Hä gerstrand[9]认为人的行为受时空的限制, 要在不同的时间和地点进行不同的活动, 需要采取出行将各次活动地点相连接。Chapin[10]指出, 人类的基本欲望激发了活动需求, 比如谋生、社交或娱乐等都会激发出行者进行不同的活动和出行。从国内外相关研究可见, 活动链思想考虑了出行行为发生的本质和一天中各次出行之间的关联, 适用于进行出行行为建模研究。另外, 以往的出行目的建模研究表明, 基于经验法的出行目的识别精度低于机器学习法。因此, 本文将基于活动链理论进行出行目的建模研究, 采用机器学习方法, 并考虑一天中各次出行目的间的互补关系, 以期提高出行目的识别精度。

1 日出行模式-出行目的分析
1.1 数据

本文利用2010年北京居民出行调查获得的GPS数据, 数据样本包含900份被调查者的超过100万条的GPS轨迹点纪录, 其中700份样本用于建模, 另外200份用于模型的识别精度分析。平均每位被调查者约有1100条GPS轨迹点数据。其中每条数据均由GPS设备以5 s的时间间隔连续获得, 数据包含有经纬度、高度、速度、出行距离、出发时间、到达时间等信息。

1.2 日出行模式划分

根据日活动链理论, 出行模式可以依据活动时间的长短和发生顺序进行划分, 主要为主出行、早出行、晚出行。主出行的活动一般为上班/上学和回家, 其活动时间最长, 主出行之前的较短的出行为早出行, 主出行之后的出行为晚出行。在主出行中又可能伴随有去时驻停和回时驻停。出行者的日活动链如图1所示。一天中各出行的发生次数可能不止一次, 本研究可对一天中的多次出行进行识别, 数据统计如表1所示。统计结果表明:主出行所占比例最多, 为89.62%; 其次是晚出行, 为3.97%, 比例最小的是去时驻停, 为1.79%。

图1 活动链示意图Fig.1 Activity concept

表1 日出行模式统计 Table 1 Statistics of daily travel mode
1.3 出行目的数据统计

统计调查数据得到各出行模式的出行目的分布如表2所示。由统计结果可以看出, 出行者早出行的目的主要是购物、休闲和接送人; 主出行的目的主要是上班、上学、回家和一定比例的工作外出; 晚出行的目的主要是购物、休闲、就餐、访友和接送人; 去时驻停的目的主要有购物、休闲、就餐、工作外出和接送人; 回时驻停的目的主要有购物、就餐、访友、工作外出和接送人。将比例大于3.50%的出行目的保留, 比例小于3.50%的出行目的归为其他, 之后进行出行目的识别。

表2 出行目的统计表 Table 2 Statistics of trip purpose %
2 日出行模式-出行目的识别建模

本文选用多项Logit模型来识别GPS数据的出行目的。首先建立1个多项Logit模型来识别日出行模式, 接着建立5个多项Logit模型识别每种出行模式的出行目的。

2.1 选择肢的确定

日出行模式识别模型选择肢见表1中的1~4, 日出行目的识别模型选择肢设置如下:

早出行选择肢为购物、休闲、接送人、其他; 主出行选择肢为上班、上学、回家、工作外出、其他; 晚出行选择肢为购物、休闲、就餐、其他; 去时驻停选择肢为购物、休闲、就餐、其他; 回时驻停选择肢为购物、就餐、访友、工作外出、其他。

2.2 自变量的选择

主要以用地性质、时间、速度三类特征参数作为特性变量, 建立多项Logit模型, 变量见表3

表3 多项Logit模型变量表 Table 3 Variables in multinomial Logit model
2.3 多项 Logit模型建立

根据随机效用理论, 选择肢i对出行者n的效用函数为:

Uin=Vin+εin(1)

式中: Vin为效用函数中非随机变化部分, 是可以观测到的固定效用项; εin为效应函数中随机变化部分, 即随机项或不可观测到的效用项。

Vin可以采用线性函数的形式表达:

Vin=k=1KθkXkin(2)

式中: Xkin为出行者 n的选择肢 i的第 k个特性变量值; K为变量个数; θk为第k个变量的待定系数。

在满足 Vinεin相互独立且随机项εin服从Gumbel分布的条件下, 模型的表达式为:

Pin=expλVinjexpλVjn(3)

式中:Pin为出行者n选择第i个选择肢的概率; λ2=π2/6σ2, σ2g(ε)的标准方差[11]

2.4 模型标定和结果分析

应用统计分析软件SPSS 21.0进行多项Logit模型的参数标定, 结果见表4表5

表4 日出行模式识别模型参数标定结果 Table 4 Calibration results of daily travel mode identification model
表5 日出行目的识别模型参数标定结果 Table 5 Calibration results of daily trip purpose identification model

模型的参数估计值解释如下:以日出行模式识别模型为例, 用地性质对早出行的影响程度按从大到小依次为市场L3、公园L8、商业/服务业L2、学校L6、医院L4、餐饮/娱乐L9、各类办公楼L1。用地性质对主出行的影响程度按从大到小依次为各类办公楼L1、学校L6、住宅/公寓L7、餐饮/娱乐L9、商业/服务业L2、医院L4、体育场馆L5、公园L8、市场L3。用地性质对晚出行的影响程度按从大到小依次为商业/服务业L2、市场L3、医院L4、公园L8、餐饮/娱乐L9、住宅/公寓L7、学校L6、各类办公楼L1。用地性质对去时驻停的影响程度按从大到小依次为商业/服务业L2、体育场馆L5、餐饮/娱乐L9、学校L6、住宅/公寓L7、市场L3、医院L4、各类办公楼L1、公园L8。活动时间与出行者选择早出行、晚出行和去时驻停呈负相关, 说明短时间的活动其对应的出行是早出行、晚出行和去时驻停的概率更大。活动时间与出行者选择主出行呈正相关, 说明长时间的活动其对应的出行是主出行的概率更大。出发时间与早出行呈正相关, 而与晚出行呈负相关, 说明出发时间越早越可能是早出行, 出发时间越晚越可能是晚出行。到达时间与早出行、主出行和去时驻停呈负相关, 说明到达时间越晚, 选择早出行、主出行和去时驻停的可能性就会降低; 而与晚出行呈正相关, 说明到达时间越晚越可能是晚出行。

2.5 精度验证

应用调查数据进行模型的精度验证, 命中率如表6表7所示。由表可知, 模型的总命中率均在80%以上。而早出行和回时驻停的识别精度较低, 其原因可能是样本量较小导致的, 后期研究需要增加样本量以提高识别精度。

表6 出行模式命中率结果 Table 6 Results for hit ratios of travel mode %
表7 出行目的命中率结果 Table 7 Results for hit ratios of trip purpose %
3 结束语

基于活动链理论建立多项Logit模型, 应用GPS数据进行了出行目的识别。解决了以往研究均以单次出行为单位, 将一天内的各次出行独立进行识别, 缺乏对各次出行目的之间关联性分析的问题。结果表明, 活动链理论应用于出行目的识别在一天中各出行模式划分的基础上再进行目的识别, 整体上提高了出行目的识别的精度, 将精度从以往研究的最高71.3%提高到最低83.6%[6]。所建模型能以较高精度识别出行目的, 在方法上对出行目的建模识别和出行行为分析具有一定的理论意义。研究结论可用于基于GPS数据的出行目的识别, 为交通管理和规划提供数据基础。下一步研究将从增加样本量、进行多日的GPS出行调查和应用其他城市的GPS数据进行模型验证等角度对研究进行深化, 以期提高预测精度以及模型的时间和空间可转移性, 同时用活动链理论对多日的出行目的进行核查, 实现更高精度的多日出行目的整体建模识别。

The authors have declared that no competing interests exist.

参考文献
[1] Wolf J, Guensler R, Bachman W. Elimination of the travel diary: an experiment to derive trip purpose from GPS travel data[J]. Transportation Research Record: Journal of the Transportation Research Record, 2001, 15(3): 125-134. [本文引用:1]
[2] Axhausen K W, Schonfelder S, Wolf J, et al. Eighty weeks of GPS traces, approaches to enriching trip information[C]∥Transportation Research Board 83rd Annual Meeting, Washington DC, 2004: 46-54. [本文引用:1]
[3] Bohte W, Maat K. Deriving and validating trip purposes and travel modes for multi-day GPS-based travel surveys: a large-scale application in the Netherland s[J]. Transportation Research Part C: Emerging Technologies, 2009, 17(3): 285-297. [本文引用:1]
[4] 柴彦威, 沈洁. 基于活动分析法的人类空间行为研究[J]. 地理科学, 2008, 28(5): 594-600.
Chai Yan-wei, Shen Jie. Study on human space behavior based on activity analysis[J]. Geographic Science, 2008, 28(5): 594-600. [本文引用:1]
[5] Feng T, Timmermans H J. Imputation of activity types using spatial and temporal information[C]∥Proceedings of International Conference of Mobile, Ghent, Belgium, 2013: 191-207. [本文引用:1]
[6] Lu Y, Zhu S, Zhang L. Imputing trip purpose based on GPS travel survey data and machine learning methods[C]∥Transportation Research Board 92nd Annual Meeting, Washington DC, 2013: 13-31. [本文引用:2]
[7] 张志华. 基于GPS轨迹的出行信息提取研究[D]. 上海: 华东师范大学地理学系, 2010.
Zhang Zhi-hua. Study on the extraction of travel information based on GPS trajectory[D]. Shanghai: College of Geography, East China Normal University, 2010. [本文引用:1]
[8] Jones P M. The analysis and modeling of multi-trip and multi-purpose journeys[C]∥Nuffield Conference on Multi-trip and Multi-purpose Journey, Dublin, Germany, 1977: 65-76. [本文引用:1]
[9] Hägerstrand T. What about people in regional science?[J]. Urban Planning International, 1970, 24(1): 6-21. [本文引用:1]
[10] Chapin F S. Human activity patterns in the city[J]. Queens Quarterly, 1974, 29(12): 463-469. [本文引用:1]
[11] 李志瑶. 基于活动的出行需求预测模型研究[D]. 长春: 吉林大学交通学院, 2008.
Li Zhi-yao. Study on activity-based travel demand forecasting model[D]. Changchun: College of Transporatation, Jilin University, 2008. [本文引用:1]