Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

基于YOLO V3的轨道车辆识别系统设计论文

发布时间:2022-09-13 09:48:16 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):
 
  摘要:人工智能技术近年来发展迅猛,在众多行业中得到广泛应用,不过,在铁路货运领域却未见成熟的应用。因此,本文以YOLO V3神经网络结构为基础算法,对不同类型的车型进行分类,并开展机器学习和特征提取,对算法进行优化,提高货车的识别率,为进一步提高铁路货运水平提供技术铺垫。

  关键词:YOLO V3;神经网络;识别技术;轨道车辆


  Design of Railway Vehicle Identification System based on YOLO V 3

  Li Haodong

  (Beijing University of Civil Engineering and Architecture School of Electrical and Information Engineering,Beijing,102600)


  Abstract:Artificial intelligence technology has developed rapidly in recent years and has been widely used in many industries.However,there is no mature application in thefield of railway freight.Therefore,this paper uses the YOLO V3 neural network structure as the basic algorithm to classify different types of vehicles,and carry out machine learning and feature extraction to optimize the algorithm,improve the recognition rate of freight cars,and provide a technical foundation for further improving the level of railway freight.

  Key Words:YOLOV 3;neural network;recognition technology;rail vehicle


  传统铁路货车图像识别以车辆号码特征识别为主,受现场环境光照影响,既存在受干扰大、识别率低的问题,也存在一定的安全隐患。针对这一问题,笔者利用近年来发展迅速的卷积神经网络、YOLO V3模型及深度学习技术,尝试建立铁路车辆识别模型,优化YOLO V3识别算法,利用GPU加速技术减少CPU的工作负荷,以期实现铁路车辆高速通过环境下的车型识别与统计。笔者先搭建简易的试验系统,通过采集图像、数据分析、特征提取等方式完成铁路车辆车型的识别,在多种环境下进行试验,并与其他深度学习算法进行比对,以证明设计的有效性及先进性,进一步为铁路货运提供技术铺垫,并助力铁路货运智能化发展。

  一、轨道车辆识别技术现状

  目前,我国铁路车辆识别主要参考美国铁路学会(AAR)S-918:1996《自动识别设备标准》中以RFID技术为主的铁路机车车辆自动识别技术,并形成了铁路标准GB/T 25340—2010《铁路机车车辆自动识别设备技术条件》。在该技术条件下,识别轨道车辆需要在车体下方安装车辆标签,在地面安装地面自动识别设备,并与数据信息集中管理、监控设备连接。该技术主要实现了对机车和车辆在运行过程中的自动识别,但对车辆状态、货物类型等车辆信息的感识能力偏弱,且因为安装在车辆和地面的设备成本较高,所以需要定期维护。

\

  铁路运营有基于图像识别的铁路车辆车号识别系统,该系统使用传统的CCD相机采集车辆正侧方图像,分析计算车型车号,但也存在对车辆状态、货物类型等信息感识能力偏弱的问题,同时,正、侧向图像采集设备容易受到光线、障碍物等诸多因素的干扰,车辆识别准确率波动较大[1]。

  在智能交通领域,车辆识别技术的研究发展较早。在信息产业、互联网技术与智能化技术快速发展的阶段,人们开始普遍意识到交通管理数字化、智能化的重要性。近年来,国内交通管理紧跟世界科技更新的节奏与社会发展的步伐,将计算机的快速存储与自动化的交通信息采集结合起来。越来越多的交通领域学者开始探索车辆种类、车速、车流量等数据的自动采集与检测方式。其中,车牌检测与车型检测是公路智能交通的基础。车型识别领域的核心技术涉及模式识别、机器学习和神经网络等众多方向。因此,车型识别的研究一直较为复杂,需要海量数据作为研究支撑。作为车型识别分类效果的核心技术,特征提取一直是国内外专家学者研究的重点与核心内容。而在众多学者积极研究的基础上,车型识别与车型特征提取技术正在不断进步。

       二、YOLO V3神经网络技术

  相较于传统的图像识别方案,基于深度学习的图像识别具有更高的鲁棒性和精度。卷积神经网络(CNN)是一类特殊的人工神经网络,区别于神经网络的其他模型,卷积运算操作在图像相关任务中表现突出,相比传统方法和其他深度学习网络模型有更优的预测效果。本次试验的框架是使用基于YOLO V3的神经网络结构。YOLO V3是基于深度神经网络的对象识别和定位算法,其网络结构借鉴了GoogLeNet分类网络结构,由24个卷积层和2个全连接层组成。传统的图像识别检测算法都是先进行被检分区,再进行检测识别,虽然检测识别率得到了明显提高,但对CPU的运算占用极大,普通运用环境运行速度较慢。YOLO V3将图像识别任务直接当作回归问题来处理,将提取被检区域与检测识别两个步骤合并,一次性分析得到图像中的物体及物体位置。相较于前代的YOLO V1神经网络结构,YOLO V3使用了残差模型和FPN架构,实现了多尺度检测,有更高的准确度和更快的识别推理速度。YOLO V3没有完全放弃被检区的概念,而是将图像细分为多个网格,每个网格预测两个边界,将网络覆盖整个图像。YOLO V3网络根据需要将识别物体在图像中的大小划分为3种不同的识别网格,分别为13*13、26*26、52*52,其中,13*13网格用来识别最大的物体,26*26网格用来识别中等尺寸物体,52*52网格用来识别小尺寸物体,如此最终能实现物体的多尺度检测与识别。

  YOLO V3使用Darknet53作为主干网络,相对于较早提出的ResNet网络,Darknet53在分类精度和速度上更具优势。其主要使用残差结构来避免网络过深导致的梯度消失问题,并使用改变卷积步长来实现下采样,代替传统的Max Pooling下采样方法。在激活函数上,Darlknet53使用了LeakyRelu,相对于Relu激活函数,其在小于0的部分遵循了一定的线性关系,而不是直接置为0,这在一定程度上解决了网络训练反向传播中梯度消失的问题。为解决网络小目标检测的精度问题,YOLO V3使用了融合3个输出特征图与上采样的方法,有效提高了小目标检测的精度。

  在使用YOLO V3网络进行目标识别后,可使用DeepSort网络进行目标识别与检测,并根据检测到的物体运动方向来进行上行车辆和下行车辆的计数和识别。

  三、车辆识别系统设计实现

  (一)系统架构

  车辆图像识别系统使用海康威视DS—2CD1221D—I3的IP摄像头作为图像采集设备,使用TGNETTAS5700千兆交换机作为链路端设备,使用DELL V7000移动图形工作站作为图像处理终端(CPU I7—4720HQ,内存为16G,显卡为GTX960m 4G),使用阿里云SQL服务器作为线上数据存储单元。

  本系统先使用YOLO V3网络进行车辆识别,并再用DeepSort实现车辆的追踪算法,最后将实现的结果通过网页展现。本系统的主要实现流程是通过YOLO V3检测车辆,并将车辆的位置等信息传递到DeepSort以进行车辆的位置追踪。在本系统的通信框架中,使用Flask框架进行可视化显示,可以查看实时图像,追踪物体显示和计数后数据库的数据同步。

  (二)车辆特征分类与识别

  本系统在车辆图像拍摄时,选取正侧视图、俯视图和斜上方视图,经比对后发现完整的车辆俯视图不能有效反映车辆信息,正侧视图受光线、障碍物等因素干扰过大,故在采集图像时,选取有一定侧倾度的俯视图(斜视图),这样可以在图片中尽量多地保留车辆信息,有利于识别和学习。在采集了一定的车辆图片并进行标注后,可以进行物体识别训练[2]。图片标注主要是把需要进行识别的物体进行框选标注,然后把这些物体的位置和大小等信息写入与之对应的log文件。有了这些物体的类别、位置和大小信息后,再使用YOLO V3神经网络模型进行训练。

  (三)算法优化

  YOLO V3模型内部图像处理首先会随机增加或减少图片的20%来调整图像的长宽比,随后将图像进一步调整为416*416的格式,以便用于预测13*13的正方形网格。受网络摄像机的COMS感光元件尺寸的限制,正常采集到的图像基本上是3:2、4:3、16:9、16:10这几种长宽比,YOLO V3模型中的最终图像为正方形,因此,原始图像处理方法对提高识别率有较大影响。在YOLO V3网络中可以在不限长宽比的基础上直接将图片调整到正方形,但会出现较大的失真现象,对训练识别产生影响。如果以长边为基数调整图像为正方形,会填充大量的0数据,对计算无意义,且增加系统负担;以短边为基数裁剪图像则会丢失图像中的关键信息。因此,输入图像应尽量接近正方形,以减少图像调整失真的情况发生。同时,系统中使用Python写一个简单图像裁剪方法,以图像中心点为基准在图片上下左右各延伸416像素裁剪图片,尽量减少核心信息的丢失,并保证图片为正方形,以提升YOLO V3模型的分析识别速度。

  在进行神经网络信息分析时,相较于CPU运算,由于GPU对大型卷积运算有很强的优势,因此在算法实现上采用GPU训练和推理的方式,能显著提高算法实现的速度。在测试中,使用GTX960m的显卡达到7 fps的推理速度,较CPU 0.3 fps的推理速度有很大提升。

\

  (四)试验结果

  将IP摄像机拍摄到的图像通过路由器发送到图像处理服务器后,服务器对图像进行识别与处理,可通过计数线的车辆进行方向和数量的计数,并将车辆信息上传到SQL服务器进行数据储存[3]。由于总体样本数量偏少,故采取测试图像与验证图像各占50%的分配方案。图像原始大小为1600*1200,在识别分析过程中将图片分辨率降为1280*960后,识别效果虽有轻微下降,但GPU的推理速度得到一定程度的提高,同时对内存的占用也有所降低。在模型内部,图像会被进一步调整为416*416的图像格式,以便于预测13*13的正方形网格。因此,试验的输入图像应尽量接近正方形,以减少图像调整失真,总体识别率稳定在90%以上。

  (五)试验结果对比

  目前,能够获取的关于深度学习的识别铁路货车资料非常少,笔者有幸检索到北京交通大学张超同学的硕士专业学位论文《基于深度学习的铁路货车类型识别研究》。文中虽然没有提及基于YOLO V3算法的图像识别,但其分别对VGGNet-16、GoogLeNet、ResNet-50三种神经网络架构下的分类进行了识别比较,试验数据非常完整。笔者将张超同学论文中的数据与本次的试验数据进行比对,发现YOLO V3算法作为新推出的算法,分析识别速度与准确率有明显提高。在张超同学的论文中,识别率最好的是ResNet-50增加训练集后的Models-07,最终的总体分类准确率在91%左右。YOLO V3是2018年新推出的神经网络架构,对图像分析识别有一定的优势,虽然对计算机硬件的要求明显增加,但分析速度与准确率显著提高,这与图像采集时采用斜视图有一定的关系,斜视图可以更好地保留车辆信息。本文试验中的整体车型和学习数量明显少于张超同学的样本图片集,因此会存在一定的误差。但从试验结果看,YOLO V3模型的识别率已超过其他模型。表1为YOLO V3测试的1801张样本评价指标。

\

  (六)下一步优化方向

  YOLO V3是目前速度和精度较为均衡的目标检测网络模型,在当前铁路干线环境下,货运车辆斜视图基本上采用与周边环境有明显反差的单一颜色。在图像处理中,可以以检测50*80像素的单一色块的中心点为基点,向外延伸正方形图像,并用于触发信号。如此,图像识别的准确率和效率能得到明显提高,对系统资源的占用也会显著降低。图1为进一步优化的图像裁减识别。

\

  图1图像裁减识别图
 

  四、结语

  本文运用YOLO V3模型搭建了一个简易试验平台,完成了铁路货车车辆的卷积神经网络人工智能识别,并将YOLO V3模型与其他成熟的人工神经网络模型进行了比对,发现YOLO V3模型在识别中展现出一定优势。相信随着YOLO模型的进化和算法的改进,其识别效率会进一步提高。

  【参考文献】

  [1]张超.基于深度学习的铁路货车类型识别研究[D].北京:北京交通大学,2019.

  [2]刘璇.铁路集装箱号码与车型智能识别系统研究[D].成都:西南交通大学,,2018.

  [3]周奇丰.视觉识别在自动驾驶中的应用[J].汽车实用技术,2020(22).
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
 

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/43014.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml