基于生存分析的交通事故持续时间预测模型
2020-09-17
来源:易榕旅网
公 路 与 汽 运 68 Highways&Automotive Applications 总第165期 基于生存分析的交通事故持续时间预测模型 陈建军,夏正丰 (东南大学建筑设计研究院有限公司,江苏南京 210096) 摘要:收集了江苏省某高速公路事件数据,提出了基于条件概率的生存分析预测事件持续时 间的实现方法,并用实例试验了基于条件概率的生存分析模型的效果,给出了预测事件持续时间 的一般过程,通过最终得到的累积结束概率图给出事件持续时问的预测值及其对应的概率值。 关键词:公路交通;交通事故;持续时间;高速公路;生存分析 中图分类号:U491.3 文献标志码:A 文章编号:1671—2668(2014)06—0068—04 突发性交通事件易造成二次事故或长时间拥 堵,是引起高速公路拥堵和延误的主要原因之一,其 时间、结束时间等。 (2)气候因素,包括是否雾天、是否雨雪天气。 特征分析是有效管理突发事件的重要基础,而事件 持续时间是交通事件的主要特性之一。国内外对于 (3)事件类型,依据实际高速公路交通事故,将 事故类型分为翻车、危险品泄漏、撞车、撞护栏、撞 人、追尾、白燃等。 (4)位置因素,包括方向、桩号及离救援处的距 离等。 事件持续时间的预测进行了大量研究,目前最常用 的事件持续时间分析方法主要有基于概率分布的预 测方法、线性回归模型、基于条件概率的预测方法、 时间序列模型、决策树预测模型、基于规则的预测方 法等。该文引人生存分析的概念,与概率模型结合, 建立交通事故持续时间预测模型。 (5)事件属性因素,包括涉及车辆数、车型、人 员伤亡情况、是否需要泊载、涉及车道数、路堵情况、 响应时间、救援队旅行时间、事故处理时间和事件持 续时间。 1.2数据处理 1 数据分布及显著性分析 1.1数据收集 根据原始事件数据表中提供的事件开始时间和 结束时间,得到每一事件的持续时间。对原始事件 以江苏省某高速公路事件管理数据为主要研究 对象,共收集其2004--2009年的交通事故205起。 影响交通事故时间的主要因素可以分为: (1)时间因素,包括是否周末、是否夜班、开始 数据表中信息进行分析整理,将文本信息转化为可 用于数学建模的数值或逻辑量,以便计算机对其进 行分析处理,转化结果见表1。 表1事件持续时间相关变量的转化 2014年第6期 陈建军,等:基于生存分析的交通事故持续时间预测模型 69 续表1 2基于生存分析的事故持续时间预测模型 —— 一 ㈤ 生存分析(Survival Analysis)是对一个或多个 依据式(3)、式(4)可知: 非负随机变量进行统计分析,依据观测到的数据对 矗(t)--二 (5) 一个或多个非负随机变量进行统计推断。一种常见 d 的情况是用非负随机变量表示“寿命”,因而生存分 f(t)一S( ) (£) (6) 析可看成是对寿命数据进行分析,在交通事件中也 累积风险函数H( )定义为: 可用来研究其持续时间的预测。 H(£)一I h(“)du一一ln[S( )] (7) 设T为寿命总体(T≥0),为一连续性随机变 量。令f(t)、F( )分别表示T的密度函数、分布函 S( )一exp[一H( )] (8) 从式(4)可看出时间t与事件持续时间的关系: 数,其域为[0,+。。]。反映个体事件持续超过时间 如果风险函数呈现上升趋势,在t时刻有dh(t)/ t的概率函数称为生存函数,将其定义为: d >0,则意味着持续时间与时间正相关,即事件持 S(f)一P(个体事件持续时间大于t)一 续时间越长,其立刻结束的可能性越大;反之,当在 P(T>t) (1) t时刻有dh(t)/dt<0时,随着事件持续时间的增 生存函数是非增函数,当t一0时其值为1,当t 长,其立刻结束的可能性越小;如果有dh(t)/dt一 趋向于无穷大时其值为零。 0,则事件持续时间与事件持续了多长时间没有直接 当T为连续型随机变量时,生存函数与累积分 的关系。 布函数互补,S( )一1一F( ),即F( )一P(T≤t)。 根据分析研究得到交通事故数据适合于正态分 同时生存函数也是概率密度函数_厂(£)的积分,即 布、对数Logistic分布。在此选用对数Logistic分 S(£)一P(T>t)一lr。 f(。 )dx (2) 布对交通事故持续时间数据进行研究分析,其风险 J 函数呈现先增加后减少的趋势,拐点出现在t一167 )一一 (3) arin的位置处。依据上文定义,对于任意一起交通 在生存分析中,另一个基本函数是风险函数,它 事故的持续时间,如果已经持续的时间在167 rain 描述的是个体事件持续时间t后,在后续的时间间 以内,则瞬时结束的概率将随着时问的延长而增加, 隔△ 结束的概率。风险函数通常由风险率函数来 而如果其持续时间超过167 min,那么该事件仍会 刻画,风险率定义为: 持续较长时间。 ,、 ,.P( ≤T≤£+At 1 T≥£) 图1是对单因素作用下交通事件持续时间累积 凡Lt 一llm~一 △ —.o At 概率的汇总。由此可获得当一起事件发生到一定阶 70 公 路 与 汽 运 0 2014年11月 段,在后续阶段中它能持续的时间的概率值,从而可 ∞ ∞ ∞如∞∞加 依据实时情况进行分析,给出持续时间的预测及概 率值。然而该预测只能是基于一种自变量,如天气、 涉及车辆数、车道数,从而使得该方法的运用存在一 定的局限性,需作改进。 {j{L 整 逞 ⅢI{5 总体 ・一非雾天 一雾天 涉及1辆车 涉及2辆车 涉及3辆车以上 堵1条车道 一一堵2条车道 ・一堵3条车道 白天 一—一…一一一…~…一夜晚 0 100 200 30H0 400 500 600 700 800 持续时间/min 图2基于条件概率的生存分析流程 图1 交通事故持续时间累积结束概率 2.2 交通事件持续时间预测实例分析 2.1条件概率生存分析的流程 下面以一实例予以说明。某交通事故发生时, 第一时间获得的情况如下:天气状况(晴)、涉及车辆 数(2)及路堵情况(2)。此时,通过计算机的筛选获 交通事件相关因素获得具有随机性,在分析其 持续时间时,应依据实际获得的因素给出相应的预 测值,这样预测结果才能给现场管理人员及出行者 提供可靠有用的信息。基于条件概率思想的事件持 续时间分析流程见图2。 得该组样本量为26起,利用生存分析方法对该数据 进行分析,结果见图3。从中可见数据的拐点出现 在t一179 min时。 逞 糖 {;{L 丑 lⅢ 鼙 持续时间/min (a)概率密度函数 持续时间/min (b)对数Logistic 婆 丑 1;{卜 筮 0 150 300 450 6oo 持续时间/min 持续时间/min (C)生存函数 (d)危险函数 图3天气=0、涉及车辆=2、堵车道=2时的生存分析概要图 2014年第6期 陈建军,等:基于生存分析的交通事故持续时间预测模型 71 交通事故持续时间累积结束概率见图4。从中 可以看出:整个过程可分为3个阶段,初期累积结束 概率近似为斜率较小的直线,表示结束概率在初始 阶段没有太大的变化;当事件持续时间大于70 min 后,结束概率以较大速度上升至9O%;在265 min 以内又进入平缓期。根据初期获得的资料可得出该 事件8o 概率在208 min结束、85 概率在230 min结束等。 鋈 料 谣 田jl; 持续时间/min 图4天气=0、涉及车辆=2、堵车道=2时的 累积结束概率 随着事件信息的进一步获取,如事故类型为追 尾、事故造成死亡人数为1。此时数据样本会减少 到19起,再次使用生存分析,结果见图5。从中可 见拐点值t一168 min,事件持续时间在194 min内 的概率为80%,在246 min内的概率为9O 。 逞 褂 好 聃器 持续时间/arin 图5天气=0、涉及车辆=2、堵车道=2、事故类型= 追尾、死亡人数=1时的累积结束概率 随着事件相关影响变量的累积,利用同样的方 法,在前面已知条件的基础上利用新条件筛选出新 样本,再利用生存分析方法作进一步分析,可得到交 通事件持续时间的累积结束概率图,获得新增条件 下事件的持续时间预测值及其概率。 3模型验证 为验证生存分析模型的效果,利用2009年2— 12月新采集的9起交通事故数据作为样本,对新采 集数据进行条件概率下的生存分析,得到的预测结 果见图6(给出了95 9/6置信区间预测值的上下限)。 600 口 500 400 暑300 200 豫100 O 事件编号 图g 条件概率生存分析模型的预测结果(天气、 事故类型、涉及车辆数、路堵条件已知) 从图6可看出:随着条件的增加,预测值的上下 范围越来越小,其下限值比较接近实际的观测值,而 上限值较大。这可能是因为新采集的9起事件的持 续时间较短,而之前5年的数据中存在几起特重大 交通事故,其持续时间超过500 min,导致预测结果 的范围较大。第1、第9起事故持续时间的真实值 在预测范围之外,根据原始数据,事件1发生位置的 交通量较小,可能导致救援时间较短;事件9发生在 23:17,此时该高速公路上的交通量相对较小,影响 了预测精度。这两起交通事件表明,交通量的大小 对事件处理效果具有显著影响,但由于无法获得实 时交通量信息,因而无法对其作进一步研究。 4 结语 该文收集某高速公路交通事故数据,建立了交 通事故持续时间基于条件概率的生存分析方法,给 出了分析事件持续时间的步骤。为验证模型的效 果,利用新采集的交通事故数据进行预测,结果表明 基于条件概率的生存分析方法具有良好的学习能 力,能随着获取信息的增加自我完善,提供越来越精 确的预测结果。 参考文献: [1]Golob T F,Wilfred W Recker,John D Leonard.An a— nalysis of the severity and incident duration of truck- involved freeway accidents[J].Accident Analysis& Prevention,1987,19(4). 公 路 与 汽 运 72 Highways&Automotive Applications 总第165期 城市常规公交评价指标体系研究 谭英嘉 ,郭莉 以深圳为例 (1.深圳市综合交通设计研究院,广东深圳 518003;2.深圳市规划国土发展研究中心,广东深圳 518040) 摘要:在对国内常规公交相关规范、评价体系等进行调研、梳理的基础上,建立了城市公交评 价指标体系结构,并基于层次分析法求出各评价指标的权重,以此为依据进行重要性排序和指标 筛选,实现对城市常规公交的评价;将该评价指标体系应用于深圳市常规公交评价,分析了其不 足,进而提出了改善措施。 关键词:城市交通;常规公交;层次分析法;评价指标体系 中图分类号:U491.1 文献标志码:A 文章编号:1671—2668(2014)06—0072—05 2011年,国家交通运输部启动“公交都市建设 示范工程”,在此背景下,通过构建一套适应公交都 国家标准侧重于公交设施与线网建设,而行业标准、 “畅通工程”指标侧重于公交运营管理,缺少一个对 常规公交系统全面衡量的指标体系。应用国内现有 的常规公交评价体系难以对城市公交服务水平进行 市建设需要的公交评价指标体系对城市常规公交发 展水平进行评估,从而寻找公共交通存在的短板,以 便指导公交服务质量的进一步提升是十分必要的。 现有各规范及体系基本涵盖了常规公交指标评价的 大部分内容,然而除某些指标具有明显的相关性外, 全面、准确的评价,需从众多的指标中提炼并构建一 套全面、客观、简洁、实用的评价指标体系。 其他所涉及的指标纷繁复杂,部分指标的获取也存 在相当难度;同时不同城市相同指标的采集也存在 一1评价指标体系架构 1.1指标体系影响因素 常规公交系统服务水平影响因素主要涉及道 定的困难且统计口径不一,城市之间缺乏横向可 比性。此外,各规范、标准的评价侧重点各不相同, 路、站点、车辆等“硬”服务及运营线路、车辆运营组 uliano G.Incident characte ristics,frequency,and du— [2] Giin intelligent transportation systems[M].Boston:Ar— tech House,1999. th.Forecasting theclear— [1O] Kevin W Smith,Brian L Smiration on a high volume urban freeway[J].Transporta— tion Research Part A:General,1989,23(5). ysis of the frequency [35 Jones,Bryan,Lester Janssen.Analance time of freeway accidents[R].University of Vir— ginia,2001. and duration of freeway accidents in seattle[J].Acci— dent Analysis&Prevention,1991,23(4). H K.Predicting freeway traffic incident duration [11] Choi[4] Nam D,F Mannering.An exploratory hazard—based a— in an expert system context using fuzzy logic[R].U— niversity of Southern California,1996. nalysis of highway incident duration[J].Transporta— tion Research Part A:General,2000,34(2). [12] Lin P,N Zou,G Chang.Integration of a discrete un.Development of prediction models for [53 Zhan Chengjfreeway incident durations using data mining tech— choice model and a rule-based system for estimation of incident duration:a case study in Maryland[A]. 83rd Meeting of the Transportation Research Board niques[R].Florida International University,2006. ng freeway incident clearance time MS [6] Wang M.Modeli[C].2003. [13] Zhengfeng Xia.Modeling and prediction of the free— thesis[R].Northwestern University,1991. b A,A E Radwan,H AI—Deek.Estimating magni— [7] Gariway traffic incident duration,master thesis[R].Nan— jing:Southeast University,2010. tude and duration of incident delays[J].Journal of Transportation Engineering,1997,123(6). [14] 曹振华,赵平.概率论与数理统计[M].南京:东南大 学出版社,2004. [8] 刘伟铭,管丽萍,尹湘源.基于多元回归分析的事件持 续时间预测[J].公路交通科技,2005,22(11). n Kachroo.Incident management [9] Ozbay Kaan,Pushki收稿日期:2014—08—19