Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

基于改进SSD算法的光伏板缺陷检测研究论文

发布时间:2024-03-05 11:46:26 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com)
 
   摘 要 :在光伏产业中,光伏板缺陷的检测至关重要,针对目标检测算法 SSD 在光伏板缺陷检测中精度不高、速度不 快、存在漏检、误检等问题,本文提出了一种改进的 SSD 算法,主要从三个方面改进 :首先,使用融合了 ECA 注意力机制的 Resnet50 网络替换原 SSD 中的 VGG-16 网络,减少了计算量,提高了检测精度 ;其次,使用 Involution 算子替换原 SSD 中 的 Conv7 卷积层,使模型更加轻量 ;最后,引入 Focal Loss 损失函数解决正负样本不平衡的问题。经实验分析,改进的 SSD 算法相较于原 SSD 算法的 mAP 提升了 4.41 个百分点,同时检测速度提升了 6.55frame/s。

  关键词 :SSD算法,ECA-Resnet50,Focal Loss,Involution算子

  Research on Surface Defect Detection of Photovoltaic Panel Based on Improved SSD Algorithm

  JIAO Sitao1. WANG Keqing2. ZHOU Qi1. LI Liuyang1

  (1.School of Automation, Nanjing University of Information Science and Technology, Nanjing Jiangsu 210044;

  2.School of Automation, Wuxi College, Wuxi Jiangsu 214105)

  【Abstract】:In the photovoltaic industry, it is very important to detect the defects of photovoltaic panels. In view of the problems of low accuracy, low detection speed, missed detection and false detection in the target detection algorithm SSD, this paper proposes an improved SSD algorithm, which is mainly improved from three aspects: Firstly, the VGG-16 network in the original SSD is replaced by the Resnet50 network with ECA attention mechanism, which reduces the calculation amount and improves the detection accuracy; Secondly, the Conv7 Involution layer in the original SSD is replaced by the involvement operator, which makes the model lighter. Finally, the Focal Loss function is introduced to solve the problem of unbalanced positive and negative samples. The experimental analysis shows that the improved SSD algorithm improves the mAP by 4.41 percentage points compared with the original SSD algorithm, and the detection speed is improved by 6.55 frame/s.

  【Key words】:SSD algorithm;ECA-Resnet50;Focal Loss;Involution operator

  0引言:随着世界碳排放的增加,温室效应日趋严重,因此 世界各国正大力发展清洁能源,其中光伏发电由于其发 电过程简单、清洁,成为一种理想的发电方式。光伏发 电的主要装置为光伏板,光伏板由于长期在室外放置, 难免会产生一定程度的损坏,破损严重的光伏板如果不 及时发现,轻则使发电效率变低,重则可能出现短路并 引发火灾等严重后果。目前,绝大多数光伏电站的检修方式主要依靠人工检修,这种方式不仅检查周期长、效 率低,而且由于长时间地观察相似实物容易产生视觉疲 劳, 难以保证检修的准确性和及时性,因此研究一个高 效且准确的检测方式具有现实意义 [1]。随着计算机算力的 不断提升,人工智能得到了飞速发展,使用深度学习方法 对图像进行分类的准确度与速度都大幅提高, 目标检测 融合深度学习的方法被广泛应用。此种方法主要分为两 类, 一类是两步法(Two-stage);另一类是一步法(Onestage) [2]。

  两步法指的是实现检测的方式包含两个过程, 先提取物体区域,再对区域进行分类识别,如 R-CNN[3]、 Fast R-CNN[4]、Faster R-CNN[5]。一步法直接经过 CNN 提取特征然后进行回归、分类操作。一步法和两步法相 比, 一步法的检测速度远大于两步法,但鲁棒性会弱一 些。KOU 等人 [6] 基于 YOLO 算法,结合无锚框特征选择, 减少了计算量,增加了检测精度。Fu 等人 [7] 基于SSD算 法提出了 DSSD 算法,使用残差网络 Residual-101 代替 SSD 算法中的 VGG-16 基础特征提取网络,并且加入了反 卷积模块,使得整体的检测精度有了较大提升,但是由于 DSSD 结构复杂,整体训练速度不如 SSD 算法。Shen 等 人 [8] 基于 SSD 算法提出了 DSOD 算法,使用密集卷积 网络代替 VGG-16 网络,该算法可以从零开始训练数据, 不需要预训练网络模型,相比于 SSD 算法,大幅减少了 参数数量。但 DSOD 算法不能完全提取图像中事物的特 征信息, 因此检测时容易丢失一些细节特征信息。Li 等 人 [9] 人提出了一种 FSSD 算法,在 SSD 算法中加入了一 个特征融合模块,对不同层次的特征进行投影、拼接,然 后生成新的特征图。Wang 等人 [10] 开发了 YOLOv7 系列 物体探测系统。Mai 等人 [11] 提出了一种基于 SSD 网络的 扩展卷积模块,可以有效地检测小裂纹。Du 等人 [12] 引 入了 PSA 机制来关注不同通道的重要性,提高了模型 识别裂缝的能力。Yu 等人 [13] 引入扩张卷积增加感受野, 确保输入与输出的图片大小相同。Tian 等人 [14] 提出了 FFSSD 算法,将低层和高层特征结合起来,提高了微 小实例的准确性。Ahmed 等人 [15] 结合 Mobilenetv2 和迁移学习,提高了整体检测性能。Sun 等人 [16] 使用 Mobilenetv2 对 SSD 主干进行优化,大大减少了模型的计算量。

  为了解决光伏板缺陷检测的精度以及效率问题,本文 提出了一种改进的 SSD 算法。该算法针对光伏板检测的问 题, 使用改进的 Resnet50[17] 残差网络代替原 SSD 算法中 的 VGG-16 网络, 将 Conv7 卷积层替换为 Involution 模 块,引入了 Focal Loss 函数优化正负样本不平衡的问题。

  1 改进的 SSD 算法

  1.1 SSD 算法简介


  SSD(Single Shot Multi Box Detector)算法是 由 Liu 等人 [18] 在 ECCV 2016 上提出的经典算法,兼顾 YOLO 算法的速度与 R-CNN 算法的精度,其主要思路是 将 Detection 转化为 Regression, 经过一次检测即可完 成目标的分类和定位,该算法采用了修改后的 VGG-16 网 络作为前置网络,将 VGG 网络的 FC6、FC7 层转化为卷 积层,并去除了 FC8 层和 Dropout 层,将最后的池化层 由 stride=2 的 2×2 变为 stride=1 的 3×3 的池化层, 检 测流程如图 1 所示。


\

 
  SSD 算法的损失函数是分类损失和定位损失的加权 和,计算公式如式(1)所示 :

\
 
  公式 (1) 中, Lconf 为分类损失, Lloc 为定位损失, N 为匹配的搜索框(若 N=0. 则 Loss=0) , x 为当前预测 框的类别匹配信息, l 为预测框, g 为 ground truth, c 为类别置信度预测信息。

  1.2 改进的 SSD 算法

  光伏板缺陷检测的改进 SSD 算法如图 2 所示。该 算法使用改进的 Resnet50 深度残差网络替换原来的VGG-16 网络,由于 Resnet50 网络的复杂度和深度, 使其具有更强的特征提取能力、更高的准确率以及具有 更少的参数量,可以减少计算量、提高检测速度、减少 模型的存储需求等,便于模型部署和应用。将 ECA 注 意力模块嵌入到 Resnet50 网络中,可使神经网络在提 取特征时对显著特征更加关注,在降低模型复杂度的同 时保证其性能 ;使用 Involution 模块替换 Conv7 卷积 层,进一步地提高了网络的检测速度。为了优化正负样 本不均衡的问题,本文引入 Focal Loss 函数修正原 SSD 算法中的损失函数。


\

 
  1.2.1 深度残差网络与注意力机制

  在训练网络模型时,随着网络深度的加深,准确率 会逐渐饱和,深度继续增加,可能会引起网络退化的问 题,主要有梯度消失、梯度爆炸。梯度消失可以通过数 据初始化解决,但会使网络性能下降。使用残差网络则 可以解决梯度消失的问题,同时还可以使网络性能上 升,提升模型的精度。残差网络结构如图 3 所示。


\
 
  在残差为 F(x)=H(x)-x 时,此时输入 x,学习到的特征就为 H(x),在构造残差模块时,可使模型学习残差比 直接学习更容易 ;在残差为 0 时,学习目标就变为恒等 映射的学习,这时堆叠的层数并不会影响精度,可确保 准确率不降低。

  激活函数 Relu,浅层到深层学习的特征如式(2)所示 :


\

 
  在模型中添加通道注意力机制可以改善深度卷积神经 网络的性能, 但复杂的注意力模块同时增加了模型的复杂 性,为了平衡模型的复杂性与性能之间的矛盾,引入了高效通道注意力模块(ECA), ECA 模块结构如图 4 所示。


\
 
  ECA 注意力机制是 SE 注意力机制的改进版,它使 用一维卷积代替了 SE 中的全连接层。卷积核大小通过 通道数确定,计算公式如式(4)所示 :

\

 
  公式(4) 中 :k 为卷积核大小, C 为通道数, γ 设置 为 2. b 设置为 1.用来调节卷积核 k 和通道数 C 的比例, 通道数少时,卷积核小一些,通道数多时,卷积核就稍 大些。

  作为对原始 Resnet 结构的改进,将 ECA 注意力机 制模块加入到残差结构中,形成 ECA-Resnet50 结构, 如图 5 所示。


\

 
  Involution 的设计与卷积相反,在空间维度上 : Involution 使用空间特异的 Kernel,相较于卷积的空间不 变,Involution 建模更灵活 ;在通道维度上 :Involution 所有通道共享 Kernel,卷积的输出通道上的 Kernel 是 近似相关的。Involution 算子相较于卷积计算更加轻量 且高效 [19]。

  Involution 算子的核(Kernel)计算公式如式(5)所示 :


\

 
  Involution 基本工作流程 :对于一处像素,利用 Φ( · ) 生成权重向量, 然后将权重展开成一个 Kernel, 在通道维度上延展,取得卷积核,再与原图进行卷积, 得到最终结果。由于使用了线性变换进行通道压缩,所 以减少了计算量,提高了计算速度。

  设卷积计算的参数量为 x1.Involution 算子的参数量为 x2.如式(6)、式(7)、式(8)所示 :

\
 
  已知在卷积计算中C 远大于G,选取通道缩减比率 r ≥ 1. 由式(8) 可知, 当通道缩减比率 r 越大时, Involution 算子的参数量越少于卷积计算。

  1.2.3 引入 Focal Loss 函数

  算法在定位目标时,会生成很多锚框,但图像中的 真正的目标(正样本) 一般很少,这样就会有很多锚框 处于背景区(负样本),使得正负样本极不平衡,为了 解决此问题,本文引入了 Focal Loss 损失函数 [20], 其定义如式(9)所示 :


\

 
  由式 (11) 可知, 当 γ=0 时,新损失函数等效于原损 失函数, γ 增加时, (1-pi)γ 也增加, γ 越大,易分类样 本的 Loss 就越小,此时我们就能将模型的注意力转向 难分类的样本。

  2 实验设计与分析

  2.1 数据集


  本实验使用的光伏板缺陷数据集采用在公开数据集上 下载的光伏板缺陷图片,共计 1800 张,采用其中的 1500 张作为训练集, 300 张作为测试集。使用 LabelImage 工 具标注光伏板的缺陷类型,并生成 xml 文件,最后将 图集和标注文件依照 VOC2012 数据集的格式存储。

  2.2 实验配置与评价指标

  实验配置如表 1 所示。


\

 
  mAP(mean Average Precision) 常用于衡量目标 检测及分类的优劣, AP 是一个类别的平均精度, mAP 是 所有类别的 AP 的平均值,计算公式如式(12)、式(13)所示 :

\
 
  由式 (12)、式 (13) 可知, precision 为精确度, recall 为召回率, TP、FP、FN 如表 2 所示。

\

 
  可通过 precision 和 recall 画 出 P-R 曲线 图, 取 曲线下方覆盖的面积的平均值即可得到 mAP。

  2.3 复杂度分析

  算法的复杂度分为空间复杂度和运算复杂度,空 间复杂度是指模型的 Params,运算复杂度是指模型 的 FLOPs。如表 3 所示为本文改进的 SSD 算法与原始 SSD 算法空间复杂度与运算复杂度的对比。


\

 
  由于引入了 ECA-Resnet50 网络且使用 Involution 算子替换了 Conv7 卷积层,本文提出的算法前向传播 一次的 FLOPs 低于原始 SSD 算法,同时模型也小于原 始 SSD 算法。

  2.4 实验结果分析

  学习率(IR)是确定每次迭代步长的参数,使损失函数逐渐收敛到最小值,学习率过大可能会跳出最优区 间,过小可能会陷入局部最优解,本文使用学习率下降 法,将初始学习率设置为 0.0005.随着训练周期的增加 逐渐减小。学习率与 Loss 情况如图 6 所示。


\

 
  进行各种算法的实验后,本文改进的 SSD 算法的平 均精度(mAP) 与其他算法(SSD、YOLOv3、YOLOv5) 的比较结果如图 7 所示。


\

 
  算法的 mAP 和检测速度的详细数据如表 4 所示。


\

 
  通过上述实验结果可知,原 SSD 算法的 mAP 为 68.75%, 本文改进的 SSD 算法 mAP 为 72.36%, 相较 于原始 SSD 提升了 4.41 个百分点,同时检测速度提升了 6.55frame/s, 对 比 YOLOv3 算法, 改进 的 SSD 算 法的 mAP 比 YOLOv3 算法提高了 13.53 个百分点,检 测速度提高了 2.58 个百分点,对比 YOLOv5 算法,改 进的 SSD 算法在检测速度上比 YOLOv5 低了 0.73 个百 分点,但在检测精度上大幅领先,比 YOLOv5 算法高 10.19 个百分点,基本实现了预期效果。

  3 结论

  为了提升对光伏板表面缺陷检测的准确性和速度, 本文设计了一种改进的 SSD 检测算法。该算法使用嵌 入了 ECA 注意力机制的 Resnet50 模块替换原算法中 的 VGG-16 模块,增强了网络对光伏板缺陷的特征提取 能力,提高了检测速度与精度,使用 Involution 算子 替换了原算法中的 Conv7 卷积层,进一步地提升了网 络的检测速度,为解决正负样本不平衡的问题,引入了 Focal Loss 损失函数。实验结果表明,本算法在速度与 精度上都超过了原算法,同时对比 YOLO 算法也具有一 定的优势。在下一步的研究中,准备引入迁移学习改善 模型的损失率,使用更少的数据获得更好的效果。

  参考文献

  [1] P.ADDABBO,A.ANGRISANO,M.L.BERNARDI,et al. A UAV Infrared Measurement Approach for Defect Detection in Photovoltaic Plants[C]//In:2017 IEEE International Workshop on Metrology for Aero Space, Padua:IEEE,2017:345-350.

  [2] 包晓敏,王思琪.基于深度学习的目标检测算法综述[J].传感 器与微系统,2022.41(4):5-9.

  [3] GIRSHICK R,DONAHUE J,DARREL T,et al.Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]//Proceedings of European Conference on Computer Vision and Pattern Recognition. Berlin,Germany:Springer,2014:580-587.

  [4] GIRSHICK R.Fast R-CNN[C]//Proceedings of European Conference on Computer Vision.Berlin,Germany:Springer, 2015:1440-1448.

  [5] REN S,HE K,GIRSHICK R,et al.Faster R-CNN: Towards Real-time Object Detection with Region Proposal Net- works[C]//Proceeding of International Conference on Neural Information Processing Systems.[S.l.]:[s.n.],2015:91-99.

  [6] KOU X,LIU S,CHENG K,et al.Development of a YOLOV3-base model for Detecting Defects on Steel Strip Surface[J].Measurement,2021(1-4):109454.

  [7] FU C,LIU W,RANGA A.DSSD:Deconvolutional Single Shot Detector[J].2017.

  [8] SHEN Z Q,LIU Z,LI J G,et al.DSOD:Learning Deeply Supervised Object Detectors from Scratch[C],Proceeding of IEEE International Conference on Computer Vision. Washington D.C.USA:IEEE Press,2017:1937-1945.

  [9] LIZ,ZHOU F.FSSD:Feature Fusion Single Shot Multibox Detector[J].2017.

  [10] WANG C Y,BOCHKOVSKIY A,LIAO H Y M.YOLOv7: Trainable Bag-of-Freebies Sets New State-of-the-Art for Real-Time Object Detectors[C]//IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR),2023.

  [11] MAI Z Y,HU S L,HUANG X M,et al.Fine Crack Detection Algorithm Based on Improved SSD[J]. International Journal on Data Science and Technology, 2022.8(2):43-47.

  [12] DUZ,ZHANG G.An Improved Crack Detection Method Based on Pyramid Split Attention [C]//IEEE (2021).

  [13] YU F,KOLTUN V.Multi-Scale Context Aggregation by Dilated Convolutions[C]//Computer Vision and Pattern Recognition(cs.CV),2016.

  [14] ENVELOPE PTA.FFSSD: Feature Fusion SSD Algorithm with SE on Traffic Sign Detection[J].Procedia Computer Science,2022.208:338-346.

  [15] AHMED I,AHMAD M,AHMAD A,et al.IoT-based Crowd Monitoring System:Using SSD with Transfer Learning[J].Computers & Electrical Engineering,2021. 93(4):107226.

  [16] Sun H,Xu H,Liu B,et al.MEAN-SSD:A Novel Real-time Detector for Apple Leaf Diseases Using Improved Light- weight Convolutional Neural Networks[J].Computers and Electronics in Agriculture,2021.189:106379.

  [17] HE K M,ZHANG X Y,REN S Q,et al.Deep Residual Learning for Image Recognition[C]//IEEE Conference on Computer Vision and Pattern Recognition,2016:770-778.

  [18] LIU W,ANGUELOV D,ERHAN D,et al.SSD:single shot multibox detector[C]//LEIBE B,et al.ECCV 2016.Part I,LNCS 9905.New York:Springer International Publishing AG,2016:21-37.

  [19] LI D,HU J,WANG C, et al. Involution:Inverting the Inherence of Convolution for Visual Recognition[J].2021. [20] LIN T Y, GOYAL P, GIRSHICK R,et al.Focal Loss for Dense Object Detection[J].EEE Transactions on Paer Analsis and Machine intelligence,2020.42(2):318-327.
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/74432.html

相关内容

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml