Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 管理论文 > 正文

基于关联规则挖掘的自行车交通事故严重程度致因分析论文

发布时间:2025-07-21 14:32:06 文章来源:SCI论文网 我要评论














  【摘要】为准确分析影响自行车交通事故产生的各项因素与事故伤害严重程度的相关性,文中以美国北卡罗来纳州12173起自行车交通事故数据为样本,使用灰色关联分析筛选与事故发生数关联程度高的影响因素,保留其数据,利用Apriori算法对保留的数据进行关联规则挖掘,找出与事故伤害严重程度强关联的规则,并借助社会网络分析方法,构建自行车中伤事故和自行车致残及致死事故的关联规则网络,进行边缘-核心分析。研究结果表明:自行车交通事故伤害严重程度与车道数量、道路分隔情况、道路等级和自行车运行方向等因素关系密切;自行车致残及致死事故与机动车超越自行车引发事故、道路双向无隔离、二级公路、车行道事故等因素存在高相关性。
 
  【关键词】自行车交通事故,灰色关联分析,关联规则,Apriori,社会网络分析
 
  1引言
 
  我国是自行车生产、出口和消费的世界第一大国。近年来,自行车、共享单车和电动自行车被广泛应用于通勤出行、运动健身、休闲旅游、快递外卖运输等方面,既是重要的绿色出行工具,也是人们实现绿色低碳生活的工具,全国每日因以自行车、电动自行车为主的两轮出行而减少的碳排放约1万吨[1]。根据中国自行车协会的数据,截至2023年底,我国自行车社会保有量超过2亿辆。伴随着保有量的持续增大,自行车已经成为我国道路交通的重要组成部分,其所带来的道路交通安全问题也日渐严峻。从世卫组织发布的《2023年全球道路安全状况报告》可知,自2010年以来,道路交通事故每年导致全球约119万人死亡,因道路交通事故导致的死亡人数中,自行车骑手所占比例从5%上升到6%[2]。美国国家公路交通安全管理局(NHTSA)2023年公布的数据显示,导致致死后果的自行车交通事故数量逐年上升,达到20年来的最高水平[3]。由此可见,分析影响自行车交通事故严重程度的各项因素,探究自行车交通事故致因因素之间的关联规则,以采取科学的防治措施,改善自行车交通环境,保障自行车骑行者的生命及财产安全,具有十分重要的现实意义。
 
  事故数据是道路交通安全的直接反映,对事故数据进行建模分析,可有效挖掘出事故影响因素间的内在联系,揭示事故特征的实际关系与潜在关联。对事故影响因素的相关关系与因果关系的挖掘被广泛应用于事故描述、解释和预防[4]。Moore等[5]基于美国俄亥俄州2002-2008年的自行车事故数据建立了logit模型来估计速度对机动车-自行车事故严重程度的影响情况,研究结果表明,随着机动车速度的增加,骑行者受到严重伤害的可能性也会增加。Uibeom等[6]使用地理加权负二项回归模型(GWNBR),收集并应用了以往自行车交通事故中未考虑的坡度和公共交通服务水平等因素,得出了随着道路坡度的增大,首尔所有地区的自行车交通事故都有所减少,在首尔某些地区,自行车交通事故的增加与当地公共交通服务水平下降相关联等结果。杨扬[7]在研究北京市自行车道系统改造关键技术时发现,自行车道的颜色、材料及型式都会对自行车安全产生不同的影响。Raihan等[8]采用零膨胀负二项分布(ZINB)的广泛线性模型(GLM)方法进行横截面分析,并建立相关回归模型,对美国佛罗里达州四年(2011-2014)的自行车碰撞事故数据进行分析,得出了车道宽度、车速限速和带有绿化设施的中央分隔带对减少自行车碰撞事故有积极影响的结论。Wang、Akar[9]利用俄亥俄州立大学主校区所收集的调查数据,建立了分层有序的logit模型来研究自行车友好型交叉口的安全效果,研究结果表明,对于骑行者或者有骑行倾向的出行者来说,交叉口专设的自行车设施能够有效地提升他们的安全感知。Chen等[10]在利用美国俄勒冈州波特兰市的自行车事故和交通数据构建安全性能函数时发现,交叉口的相交道路数和总的车道数都与交叉口的自行车事故数量成正比。
 
  本文以美国北卡罗来纳州夏洛特市2007-2019年的自行车与机动车碰撞事故数据为数据集,在数据预处理的基础上,使用灰色关联分析对数据进行筛选,将与事故伤害严重程度无强关联的数据剔除,再运用Apriori关联规则挖掘和社会网络分析探究不同伤害严重程度的自行车交通事故的生成规则及其网络关系,以期为交通部门制定事故防治措施,改善自行车交通环境提供依据。
 
  2基于灰色关联分析的事故数据处理
 
  2.1数据预处理
 
  本文数据来源于美国北卡罗来纳州夏洛特市2007-2019年的自行车与机动车碰撞事故数据统计,共计12173起。剔除掉无效和冗余数据(如事故伤亡情况未知,道路或环境信息缺失,事故原因描述缺失等),再按照事故记录剔除掉无伤害及轻伤事故的数据,最终保留4560起事故数据。将伤害严重程度分为中伤、致残及致死伤害2类,以伤害严重程度作为因变量。其中,中伤事故发生数为3862起,占比84.7%,致残及致死伤害事故发生数为697起,占比15.3%。从事故记录中选取出对事故发生有影响的30个因素作为自变量,将文本形式的数据和不利于灰色关联与关联规则挖掘的数据转换成数字表达形式,详细属性值描述及赋值见表1。
 
 \
 
  2.2数据灰色关联分析
 
  灰色关联分析[11]是指对一个系统发展变化态势的定量描述和比较的方法,其基本原理是根据序列曲线几何形状的相似程度来判断不同序列之间是否存在紧密联系,它反映了曲线之间的关联程度。在系统发展的过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,则可以说这两个因素的关联程度较高;反之,则较低。因此,灰色关联分析方法是将因素之间发展趋势的相似程度或相异程度,即灰色关联度,作为衡量因素之间关联程度的一种方法[12]。
 
  灰色关联分析的研究对象通常是一个系统,而系统的发展会受到多种因素的影响。本文使用灰色关联分析方法对自行车交通事故进行分析,以各年份自行车事故发生数为自变量,探究在人、车、路及环境等众多影响因素中,哪些因素与事故发生数的变化趋势具有一致性,即哪些因素与自行车交通事故的发生有较高关联度。
 
 \
 
  灰色关联度γ0i的大小代表两因素间关联程度的强弱,将灰色关联度阈值γ设置为0.9,以确保筛选出的影响因素都与该伤害严重程度事故发生数有极强的关联性。比较影响因素对应的所有属性值的灰色关联度γ0i是否大于预设的灰色关联度阈值γ,若影响因素中存在某一属性值的灰色关联度γ0i>γ,则说明此属性值与该伤害严重程度事故发生数之间存在强关联,此时保留该影响因素的全部数据。反之,若影响因素对应的所有属性值的灰色关联度γ0i<γ,则将该影响因素对应的全部数据剔除。
 
  将预处理后的数据分为中伤和致残及致死伤害2个数据集,分别对2个数据集进行灰色关联分析。表2为美国夏洛特市2007-2019年中伤事故数据集中道路分隔情况影响因素的数据统计情况,将道路分隔情况影响因素的各属性值数据进行均值化处理后,运用式(1)、式(2)计算得到各属性值的灰色关联度,道路分隔情况为单向无分隔的灰色关联度是0.6898,双向有中央分隔带的灰色关联度是0.7256,双向标线隔离的灰色关联度是0.8768,双向无隔离的灰色关联度是0.9661。预设的灰色关联度阈值为0.9,因为双向无隔离的灰色关联度>0.9,表明道路分隔情况为双向无隔离时,该影响因素与自行车中伤事故发生数存在强关联,所以道路分隔情况影响因素的数据不用剔除,保留至下一步进行Apriori关联规则挖掘。
 
 \
 
  分别在中伤事故数据集和致残及致死事故数据集中,将所有影响因素的属性值都按照上述方法进行分析,得到灰色关联度值,结果如表3所示。由计算结果可知,在中伤事故数据集中,自行车手年龄段为25-60岁,自行车手未饮酒,事故发生区为居民区、商业区,驾驶员未饮酒,机动车类型为小轿车,未肇事逃逸,照明条件为白天,车道数为双车道、四车道,道路线形为平直,道路等级为州道、二级公路、地方道路,路面干湿情况为干燥、潮湿,道路分隔情况为双向无隔离,路面材料为粗沥青、光滑沥青、混凝土,道路限速为25-55英里,天气状况为晴天、多云或阴天、雨天,自行车运行方向为沿交通流顺行的灰色关联度都大于关联度阈值0.9,即这些属性值与自行车中伤事故发生数存在强关联。在致残及致死事故数据集中,没有救援,事故发生区为居民区、商业区、农林区,驾驶员未饮酒,机动车类型为小轿车、小货车、大货车,未肇事逃逸,照明条件为白天,车道数量为双车道、三车道、四车道、五车道,道路线性为平直,道路等级为国道、州道、二级公路、地方道路,道路干湿状况为干燥、潮湿,道路分隔情况为双向无隔离,路面材料为粗沥青、光滑沥青,道路限速为25-55英里,天气状况为晴天、多云或阴天、雨天,自行车运行方向为沿交通流顺行,事故发生具体位置为车行道,事故发生原因描述为自行车未及时让行、自行车汇入车流、机动车超越自行车的灰色关联度都大于关联度阈值0.9,即这些属性值与自行车致残及致死事故发生数存在强关联。对比可知,相较于中伤事故,没有救援,机动车类型为小货车、大货车,事故发生区为农林区,事故发生具体位置为车行道,事故发生原因描述为自行车未及时让行、自行车汇入车流、机动车超越自行车等属性值与致残及致死事故存在更强的关联性。将上述属性值对应的影响因素予以保留,而其他影响因素的所有属性值的灰色关联度都小于关联度阈值0.9,则表明这些影响因素与该伤害严重程度的自行车事故发生数不存在强关联,因此,剔除这些影响因素的数据。经过灰色关联分析处理后,自行车中伤事故数据集中的影

\

\
\
 
  当最小置信度minCon=0.97,最小提升度minLift=1.1时,共筛选出37条中伤事故的强关联规则,其中包括6个4-项集和31个5-项集,共包含15个强关联规则项,结果如表5所示。当最小置信度minCon=0.95,最小提升度minLift=1.4时,共筛选出45条致残及致命伤害事故的强关联规则,其中包括3个4-项集和42个5-项集,共包含21个强关联规则项,结果如表6所示。
 
  4基于社会网络图的关联规则分析
 
  社会网络分析及其可视化可以对某一社会现象的结构和关系进行准确的量化表征与分析。利用UCINET软件强大的矩阵分析功能,对挖掘出的强关联规则进行社会网络分析,构建不同伤害严重程度的自行车事故关联规则网络,并输出网络图。关联规则网络图可直观地显示各强关联规则项的占比及联系,在网络中标签越大,表示该强关联规则项的网络中心性越高,即出现频率越高;网络节点之间的连线越粗,表示两个强关联规则项在项集中共同出现的频率越高。对得到的关联规则网络进行核心-边缘结构分析,其目的是通过计算网络密度分布找出在关联规则网络中,哪些强关联规则项处于网络的核心地位,哪些处于网络的边缘地位,并计算出网络核心区域的区域密度。区域密度表示的是区域网络内节点之间关系的密切程度。在一个规模确定的区域网络中,节点之间的共现频率越高,连线越多,则说明该区域密度越大,关系越紧密。
 
  中伤事故CrashSevr2有双车道NumLanes2,道路分隔双向无隔离RdConfig4,二级公路RdClass4,自行车沿交通流顺行BikeDir1,路面干燥RdConditio1等15个强关联规则项,共计有70条节点连线,其中Developmen3-NumLanes2,Developmen3-RdConfig4,NumLanes2-RdClass4,NumLanes2-RdConfig4,RdClass4-RdConfig4和SpeedLimit2-Decelopmen3的共现频数大于10。对中伤事故的关联规则网络进行核心-边缘结构分析,结果表明CrashSevr2、NumLanes2、SpeedLimit2、Developmen3和RdConfig4是网络核心区域,其区域密度为8.05。中伤事故的关联规则网络如图1所示。

\
 
  致残及致命伤害事故CrashSevr3有自行车沿交通流顺行BikeDir1、机动车超越自行车引发事故CrashGrp9、双车道NumLanes2、二级公路RdClass4、道路限速[25,55)英里SpeedLimit2等21个强关联规则项,共计有109条节点连线,其中,SpeedLimit2-BikeDir1,SpeedLimit2-NumLanes2,BikeDir1-CrashGrp9,CrashGrp9-NumLanes2,CrashGrp9-RdClass4和NumLanes2-RdClass4的共现频数大于10。对致残及致死事故的关联规则网络进行核心-边缘结构分析,结果表明CrashSevr3、SpeedLimit2、BikeDir1、CrashGrp9、NumLanes2和RdClass4是网络核心区域,其区域密度为8.23。致残及致死事故的关联规则网络如图2所示。
 
\
 
  对比可知,自行车中伤事故和致残及致死事故都集中发生在道路限速为[25,55)英里、双车道且双向无隔离的道路,在各道路等级中,自行车中伤事故和致残及致死事故多发生在二级公路。农林区道路较易发生中伤事故,居民区道路较易发生致残及致死事故。与小轿车相比,小货车更容易造成自行车致残及致死事故。机动车超越自行车时发生事故与自行车致残及致死事故为强关联,共现频数为34,表明机动车自后方加速超越自行车时产生碰撞,对自行车骑手的伤害风险最大。由核心-边缘结构分析可知,相较于中伤事故,致残及致死事故的网络更加复杂,核心区域的各节点关联更加密切,且网络特征更突出。
 
  5结论
 
  ①采用灰色关联分析对数据进行预处理,能有效筛选出与事故发生数存在强关联的影响因素。使用灰色关联分析,将中伤事故数据集中30个影响因素减少到16个,将致残及致死事故数据集中30个影响因素减少到17个,在保证数据与伤害严重程度存在强关联的前提下,有效减少了后续关联规则挖掘中冗余规则的产生和时间,提高了挖掘效率。
 
  ②分析自行车事故伤害严重程度的关联规则发现,中伤事故共有双车道、道路双向无隔离、二级公路、自行车沿交通流顺行、路面干燥等14个强关联规则项,致残及致死事故共有自行车沿交通流顺行、机动车超越自行车引发事故、双车道、道路限速[25,55)英里等20个强关联规则项。自行车中伤事故和致残及致死事故都集中发生在道路限速为[25,55)英里、双车道且双向无隔离的道路,在各道路等级中,自行车中伤事故和致残及致死事故多发生在二级公路。机动车超越自行车引发事故、事故位于车行道和事故发生区为居民区3个因素仅对致残及致死事故存在显著影响。
 
  [参考文献]
 
  [1]王建忠.浅析自行车行业绿色低碳发展[J].中国自行车,2023(03):88-90.
 
  [2]World Health Organization.Global status report on road safety 2023[R].World Health Organization,2023.
 
  [3]NHTSA(National Highway Traffic Safety Administration).PEDALCYCLISTS[EB/OL].[2024-5-23].
 
  [4]刘祖德,刘永泰,王淸淸.相关关系和因果关系在事故分析中的应用——研究综述与启示[J].安全与环境学报,2020,20(01):169-177.
 
  [5]Moore N D,Schneider H W,Savolainen T P,et al.Mixed logit analysis of bicyclist injury severity resulting from motor vehicle crashes at intersection and non-intersection locations[J].Accident Analysis and Prevention,2011,43(3):621-630.
 
  [6]Uibeom C,Joonbeom L,Soobeom L,et al.An analysis of bicycle accidents with respect to spatial heterogeneity[J].Scientific Reports,2023,13(1):21812.
 
  [7]杨扬.北京市步行自行车道路系统改造关键技术应用研究[D].北京:北京建筑大学,2018.
 
  [8]Raihan A M,Alluri P,Wu W,et al.Estimation of bicycle crash modification factors(CMFs)on urban facilities using zero inflated negative binomial models[J].Accident Analysis and Prevention,2019,123:303-313.
 
  [9]Wang K,Akar G.The perceptions of bicycling intersection safety by four types of bicyclists[J].Transportation Research Part F:Psychology and Behaviour,2018,59:67-80.
 
  [10]Chen C,Wang H,Roll J,et al.Using bicycle app data to develop Safety Performance Functions(SPFs)for bicyclists at intersections:A generic framework[J].Transportation Research Part A,2020,132:1034-1052.
 
  [11]刘思峰,谢乃明.灰色系统理论及其应用.第4版[M].北京:科学出版社,2008:63-69.
 
  [12]张岐山,郭喜江,邓聚龙.灰关联熵分析方法[J].系统工程理论与实践,1996(08):8-12.

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/guanlilunwen/82397.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml