SCI论文(www.lunwensci.com)
摘 要 :本文提出了一种改进的基于 Faster-RCNN 的人群密度预警方法。通过引入软非极大值抑制算法,对 Faster- RCNN 进行了优化,显著提升了对密集人群的检测能力。经过改进的算法在测试集上的平均绝对误差和均方误差分别降低至 3.4 和 9.8.表现出色。该方法不仅可用于行人检测,还能实时生成人群密度热力图,并根据平均密度分级划分拥挤程度。
Improved Faster-RCNN-based Crowd Density Warning Method
CHANG Zhen
(Taiyuan Emergency Management Comprehensive Administrative Law Enforcement Detachment,
Taiyuan Shanxi 030001)
【Abstract】:This paper presents an enhanced crowd density warning method based on Faster-RCNN. By incorporating the Soft Non-Maximum Suppression algorithm, Faster-RCNN has been optimized to significantly improve its detection capability for dense crowds. The improved algorithm achieved impressive results, reducing the mean absolute error and mean square error on the test dataset to 3.4 and 9.8 respectively. This approach is not only applicable for pedestrian detection, but it also has the capability to generate real-time crowd density heatmaps and classify congestion levels based on average density.
【Key words】:public safety;crowd density estimation;computer vision;Soft-NMS algorithm;Faster-RCNN algorithm
0 引言
近年来,大规模人群聚集引发的拥挤和踩踏事故严 重影响了城市公共安全。为了减少此类事故风险,实时 监测人群并提前预警显得至关重要。
据此,研究者开始采用卷积神经网络(CNN)来 缩短计算时间,实现实时人群密度估计。与传统方法相 比, CNN 能更快地从图像中提取特征进行密度估计, 从而更好地满足实时需求。例如,雷善中等人 [1] 使用多 列卷积神经网络对人群密度进行估算 ;刘志等人 [2] 基于 深度特征对人群密度进行估计,并与传统人群密度估计 方法进行了对比,取得了明显的提升 ;Wang C 等人 [3] 提出了一个端到端的卷积神经网络回归模型直接预测人 群数量,能从极度密集人群的图像中统计人数。
然而,现有研究仅限于估计人群数量,未能划分 风险级别或生成人群密度热力图,也无法辅助管理人员辨认高密度区域。因此,本文提出了一种改进的基 于 Faster-RCNN 的人群密度预警方法。Faster-RCNN 是一种高效准确的基于 CNN 的目标检测框架,通过引 入 Soft-NMS 算法进行改进。实验证明,经过改进的 Faster-RCNN 在测试中的误差显著降低,能有效提升 密集人群检测性能。此外,该方法可实时生成人群密度 热力图,并根据平均密度发出预警。管理人员接到警报 后,能及时采取措施减少高密度区域人群。
总之,本文提出的改进 Faster-RCNN 人群密度预 警方法在应对大规模人群聚集的安全挑战方面具有重要 价值。不仅能优化资源配置和提高服务质量,还适用于 评估建筑物和公共场所的安全性。
1 方法概述
本文提出的方法通过使用改进的 Faster-RCNN 识 别实时视频流中的行人人头,并对人头位置做标记,利用高斯核对标记进行平滑处理,生成人群密度热力图。 同时计算场景中的人群密度,参照 Rahmalan H[4] 的方 案划分拥堵等级,具体如表 1 所示。
当拥堵等级达到高等级时, 发出警报,管理人员可 根据人群密度热力图及时采取措施降低高密度区域的人 群密度,方法框架如图 1 所示。
2 改进的 Faster-RCNN 算法
2.1 整体框架
Faster-RCNN 的架构如图 2 所示。首先,将图像 输入 VGG16 主干的特征提取网络,经过卷积和池化后 得到高维特征图,其中包含了行人的位置和语义信息。 其次,这些特征图同时输入区域生成网络(RPN)和感 兴趣区域池化(ROI)层。最后,目标分类网络对经过 ROI 池化层的候选区域进行分类和预测框回归。此网络 利用 ROI 池化层的输出进行目标分类,确定类别,并通过回归优化目标位置和大小。
在目标分类网络后的目标检测的后处理阶段,采用 非极大值抑制(Non-Maximum Suppression, NMS)操作 来消除高度重叠的预测框,减少冗余的检测结果。NMS 操作根据预测框之间的重叠度(如,交并比 Intersection over Union, IoU)计算出最具代表性的目标框,并剔除 与其高度重叠的其他预测框。最终, Faster R-CNN 将根 据分类得分和预测框调整值确定最终的目标检测结果。
2.2 软非极大值抑制算法
由上文所述可以看出当检测行人时,若预测框之间 重叠现象非常严重, NMS 算法会删除所有 IoU 大于阈 值的预测框。为了解决这一问题,采用了软非极大值抑 制算法(Soft-NMS)。Soft-NMS 基本步骤如下 :
(1)首先将所有的预测框按照置信度得分进行降序 排列,选取置信度最大的预测框记为 M。
(2)接着计算剩余预测框与 M 之间的 IoU,根据计 算得到的 IoU 采用公式 (1) 减少其置信度。
式(1) 中 :i 表示预测框编号, s i(Soft)表示第 i 个预测框的置信度, Nt 表示设定的阈值,经多次实验,我们 将阈值设定为 0.55.
(3)重复步骤(2),直至调整完所有剩余预测框的 置信度。
(4)最后,根据调整后的置信度重新排序预测框,保留置信度高的,删除置信度低的。
3 人群密度热力图
完成行人检测后,本文采用 Zhang Y[5] 的方法生成 人群密度热力图,在二维图像中,用 x 表示图像中的像 素,假设像素 xi 处存在着一个行人标记,那么该标记 就会形成一个函数 δ(x-xi), 当 x=xi 时, δ(x-xi)=1. 否则 δ(x-xi)=0.如果图片中存在着 M 个行人标记,那么该图 片的人群密度函数可以用如式(2)所示的公式表示。
式(2) 中 :β=0.15. βdi 表示第 i 个行人与 10 个
邻居的平均距离。最后利用将 F(x) 进行颜色映射即可 得到人群密度热力图,其中低风险区域映射为蓝色,中 风险区域映射为绿色,高风险区域映射为红色。
4 实验与分析
为了验证本文提出方法的有效性,进行了如下实验。 首先将 Brainwash 人头数据集进行划分,其中 10769 张 作为训练集、500 张作为验证集、500 张作为测试集。
然后使用训练集训练 Faster-RCNN 行人检测模型, 学习率设置为 0.001.批量大小设置为 32.在训练了 20 轮之后,模型在验证集上的识别准确率达到了 80% 以上。 这证明模型已经达到了可用级别,因此停止了训练,开 始对模型进行测试。经过综合考虑,本文选择了平均绝 对误差(MAE)和均方误差(MSE)作为评价模型性 能的指标,具体计算公式如式(3)、式(4)所示 :
式(3)、式(4) 中 :n 表示测试集样本数量, yi 表 示第 i 个样本中实际行人数量, xi 表示第 i 个样本中模 型预测的行人数量。这两个指标值越小,模型性能越好。
为了体现本文改进过的 Faster-RCNN 算法的优越 性, 我们使用 Faster-RCNN、YOLOV3 算法, 并同时 在测试集上进行测试, YOLOV3 也是一种基于 CNN 的 目标检测算法,其在众多领域都得到了广泛应用,因此 本文选取该算法用于对比。实验结果如表 2 所示,可以 看出改进的 Faster-RCNN 模型在 MSE 和 MAE 中均取 得了最优表现,这也证明了我们的改进是有效的。
最后,选取了两张拥挤程度达到非常高的图片,利 用公式(2)计算了对应的人群密度热力图。可以看出 人群密度热力图准确地标注出了高风险区域,这些结果 验证了本文方法的有效性。
本文提出了一种基于改进的 Faster-RCNN 的人 群密度预警方法,并对其进行了评估和验证。通过引入 Soft-NMS 算法对 Faster-RCNN 进行改进, 有效地提高了 检测密集人群的性能。实验结果表明,改进后的 Faster- RCNN 在测试集上的 MAE 和 MSE 分别由 4.2 和 10.3 降 低到了 3.4 和 9.8. 相较于原始的 Faster-RCNN 有了一 定的提升。
此外,本文提出的方法不仅可以完成行人检测,还 能实时生成人群密度热力图,并依据平均人群密度划分 了拥挤等级,当拥挤等级达到高时发出警报。这为商业 中心、交通枢纽、体育场馆等场所的管理者提供了重要 的人员流量和拥挤程度信息,可以借助这些信息来优化 设施布局,制定更有效的流量管理策略,从而提高人员 的流动效率和服务质量。同时,该方法还可以用于评估 现有建筑物、公共场所或疏散通道的安全性。规划者、 建筑设计师和安全专家可以利用我们的方法识别潜在的 风险区域和瓶颈,并提出相应的改进措施。
参考文献
[1] 雷善中,冯飞杨,武文哲,等.基于MCNN人群密度估算的安 全预警[J].软件,2023.44(3):56-58.
[2] 刘志,陈越,陈波,等.基于深度特征的人群密度估计方法[J]. 浙江工业大学学报,2020.48(3):314-318+344.
[3] WANG C,ZHANG H,YANG L,et al.Deep People Counting in Extremely Dense Crowds[C]//Proceedings of the 23rd ACM international conference on Multimedia. New York, NY,USA:Association for Computing Machinery,2015: 1299-1302.
[4] RAHMALAN H,NIXON M S,CARTER J N.On Crowd Density Estimation for Surveillance[C]//2006 IET Conference on Crime and Security,2006:540-545.
[5] ZHANG Y,ZHOU D,CHEN S,et al.Single-Image Crowd Counting via Multi-Column Convolutional Neural Network[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2016:589-597.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/73901.html