智能科学与技术学报, 2021, 3(3): 312-321 doi: 10.11959/j.issn.2096-6652.202132

专刊:目标智能检测与识别

基于SE-YOLOv5s的绝缘子检测

田庆1, 胡蓉1, 李佐勇2,3, 蔡远征2,3, 余兆钗2,3

1 福建工程学院计算机科学与数学学院,福建 福州 350118

2 闽江学院计算机与控制工程学院,福建 福州 350121

3 福建省信息处理与智能控制重点实验室,福建 福州 350121

Insulator detection based on SE-YOLOv5s

TIAN Qing1, HU Rong1, LI Zuoyong2,3, CAI Yuanzheng2,3, YU Zhaochai2,3

1 College of Computer Science and Mathematics, Fujian University of Technology, Fuzhou 350118, China

2 College of Computer and Control Engineering, Minjiang University, Fuzhou 350121, China

3 Fujian Provincial Key Laboratory of Information Processing and Intelligent Control, Fuzhou 350121, China

通讯作者: 蔡远征,yuanzheng_cai@mju.edu.cn

修回日期: 2021-07-27   网络出版日期: 2021-09-15

基金资助: 福建省自然科学基金资助项目.  2020J02024
福建省自然科学基金资助项目.  2020J01828
福州市科技计划资助项目.  2020-RC-186

Revised: 2021-07-27   Online: 2021-09-15

Fund supported: The Natural Science Foundation of Fujian Province.  2020J02024
The Natural Science Foundation of Fujian Province.  2020J01828
Fuzhou Science and Technology Project.  2020-RC-186

作者简介 About authors

田庆(1998−),男,福建工程学院计算机科学与数学学院硕士生,主要研究方向为深度学习、计算机视觉 。

胡蓉(1974−),女,博士,福建工程学院计算机科学与数学学院教授,主要研究方向为人工智能、大数据、交通数据挖掘等 。

李佐勇(1980−),男,博士,闽江学院计算机与控制工程学院教授,主要研究方向为计算机视觉、模式识别、深度学习等 。

蔡远征(1987−),男,博士,闽江学院计算机与控制工程学院讲师,主要研究方向为计算机视觉与模式识别 。

余兆钗(1979−),男,闽江学院计算机与控制工程学院讲师,主要研究方向为医学图像分析与模式识别 。

摘要

在电力系统需要巡检的大环境下,人工巡检的传统方式存在很大不便和安全隐患,而采用无人机的目标检测方法在绝缘子检测识别方向有很大的应用前景。针对绝缘子图像检测中存在的场景复杂、视角多变、设备计算能力受限等问题,提出了一种改进的轻量级SE-YOLOv5s卷积神经网络来实现对绝缘子的快速目标检测,该方法首先在YOLOv5s网络中融合SE注意力模块,以强化网络对绝缘子目标的辨识能力,随后采用K-means聚类方法构建绝缘子的先验框,以提升定位精度,最后构造置信度与定位任务联合的损失函数,并引入 Mosaic 数据增强策略训练网络,有效解决训练数据不足的问题。经过实验验证发现,与主流目标检测方法相比,提出的SE-YOLOv5s方法在绝缘子检测准确率、召回率、检测速度及平均精度均值等性能指标上均取得了较好的结果。实验结果表明,该网络对于绝缘子检测有很好的效果,具有更好的鲁棒性,对电力系统的巡检方式具有参考价值。

关键词: 绝缘子 ; 目标检测 ; 深度学习 ; YOLOv5s

Abstract

In a large environment where the power system needs to be inspected, the traditional method of manual inspection has great inconvenience and potential safety risks, and the object detection method of unmanned aerial vehicle has great application prospects in the direction of insulator detection and recognition.SE-YOLOv5s, a lightweight insulator detection network that performs efficient detection for this task was presented.Firstly, backbone of YOLOv5s by fusing the SE attention module was strengthen.Then, the position distribution of insulator object was investigated and predefined templates of a priori box by K-means clustering on prior coordinate vectors were generated.Finally, the network by a multitask loss function was trained combined with confidence and position regression task.Furthermore, Mosaic data augmentation was utilized to supplement additional training samples.Experimental results demonstrate that the proposed SE-YOLOv5s significantly outperforms baseline methods at multiple criterions including accuracy, recall rate, detection rate and mean average precision.In comparison with the baselines, the proposed network has a flexible trade-off between robustness and memory overhead and it is a potential approach to promote the power system development.

Keywords: insulator ; object detection ; deep learning ; YOLOv5s

PDF (4481KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

田庆, 胡蓉, 李佐勇, 蔡远征, 余兆钗. 基于SE-YOLOv5s的绝缘子检测. 智能科学与技术学报[J], 2021, 3(3): 312-321 doi:10.11959/j.issn.2096-6652.202132

TIAN Qing. Insulator detection based on SE-YOLOv5s. Chinese Journal of Intelligent Science and Technology[J], 2021, 3(3): 312-321 doi:10.11959/j.issn.2096-6652.202132

1 引言

对电力系统输电线路的巡检是电力部门的日常工作以及任务之一,特别是对绝缘子的巡检。典型的绝缘子被用于各种导体之间,或导体与接地元件之间,其绝缘磨损程度关乎整个电力线路的安全运行;同时绝缘子又是容易出现故障的组件,它们经常会出现裂纹、污染、损坏等表面缺陷。截至2009年10月,我国在电力系统输电线路中已使用了23亿只绝缘子。据统计,绝缘故障是电力系统中故障率最高的,因此,智能绝缘子应用中的及时巡检尤为重要。但目前电力系统中采用的基本巡检方式依赖人工巡检,由于巡检轨道线路地形复杂且巡检覆盖范围广,人工巡检的成本高、难度大。值得注意的是,随着空中飞行平台(包括直升机和无人机)的逐步应用,采用空中飞行平台的检测方式以高效、准确、安全等优势逐渐成为电力系统输电线路巡检的重要组成部分。如果能够通过无人机、智能检测终端等智能设备获取绝缘子图像,继而利用深度学习技术完成对图像中绝缘子的定位与识别,就能达到减轻人工巡检压力的目的,并避免肉眼解读数据时出现的误判。但现实环境存在无人机航拍对设备计算能力的要求苛刻、巡检轨道线路地形复杂、拍摄图像存在较大角度变化、输电线路的覆盖范围广、图像采集量大等问题,需要进一步研究具有轻量化、快速、鲁棒性高等特点的智能识别模型[1],辅助提高绝缘子的检测速度和精度,减少绝缘子人工巡检的成本和安全隐患[2],使空中智能检测平台系统[3]的实现成为可能。因此需要研究者利用深度学习技术检测绝缘子。综合而言,目前大多数的绝缘子检测方法可以分为3个步骤:首先设计合适的人工特征提取器,然后利用人工特征提取器捕获特征,最后利用捕获到的特征区分航拍绝缘子图像的前景和背景。根据提取的图像特征特点,适用于电力系统绝缘子的人工提取特征可分为颜色特征、形状特征和纹理特征[4],每种特征都有其特殊性。

绝缘子检测方面的主要研究如下。参考文献[5]主要基于颜色特征进行算法构建,Reddy M J B等人[6]首先提出将原始图像转换成实验室色彩空间,然后用 K-means 聚类重现实验室色彩空间中的色彩特征,最后通过自适应网络模糊推理系统(adaptive network fuzzy inference system,ANFIS)对电压强度为11 kV的配电网进行检测识别,共同构成了一套用于处理绝缘子图像的系统。在此研究的基础上,Reddy M J B等人[6]又用支持向量机代替ANFIS作为特征分类器,提高了检测识别的精度。其他基于颜色特征的方法要求图像的背景颜色尽量简单,导致实际应用时识别效果与开放环境下的图像背景不能够很好地匹配。

基于形状特征和纹理特征的方法更能适应图像背景的变化,鲁棒性更高。Oberweger M等人[7]提出了一种基于椭圆描述算子角度的检测算法来有效解决问题,该算法利用高斯差分模型提取特征,然后利用K近邻算法逼近顶点,最后利用基于局部梯度的描述符进行判别训练,并在随后的定位投票方案中判断与目标相关的顶点。Zhao Z B等人[8]提出了一种基于多角度识别和二元形状的先验方法,从算法图等中提取形状图对先验知识进行分类。彭向阳等人[9]提出了一种基于皂苷直方图特征的隔离点检测算法,可自动提取和定位可见光图像中的隔离点。Wu Q G等人[10-11]使用半块算子提取图像的半块分布,并使用最优化的活动轮廓来分割隔离器。Wang W G等人[12]提出了通过融合各种元素(如颜色、形状等特征)来识别图像中的隔离器和平行线段,然后利用区域二值模式和连接域分析来识别绝缘子。

上述方法均依赖人工提取特征,而人工提取特征对图像预处理的要求极高;另外,利用人工提取精细的特征虽然提高了精度,但牺牲了绝缘子的检测速度。因此,绝缘子特征提取器的设计有很大的研究前景,需要权衡检测速度与检测精度,达到检测速度和检测精度双赢的效果。但是面对目前大量的巡检绝缘子图像,高效率的检测方法才能保证日常巡检工作的时效性,保障电力系统的安全可靠,而人工提取特征的方法并不适用于大量图像数据。针对上述问题,本文提出一种改进的轻量级SE-YOLOv5s卷积神经网络来实现对绝缘子的目标检测,该网络可以同时进行特征提取和检测,方便预处理并且提高了检测精度和检测速度,在面对大量的绝缘子图像时也能高效地完成绝缘子检测任务。

2 数据处理

本文的绝缘子数据集中的图像以山丘和土地为主要背景,绝缘子主要在铁塔上,所有图像来自实际的无人机巡检电网线路。图像尺寸为 1 152×864 像素,经过预处理后的尺寸为640×640像素,并将预处理后的图像作为输入。绝缘子图像共600张,本文随机抽取出 540 张作为训练集,余下的 60 张作为测试集。绝缘子数据集标记框宽高归一化后的分布如图1所示。

图1

图1   绝缘子数据集标记框宽高归一化后的分布


标记框宽高归一化后的分布能够很好地反映出绝缘子数据集的特点。从图1可以看出,绝缘子数据集中检测目标的宽高集中于两类尺寸,这可以帮助研究者有效地选择合适尺度的锚框对数据集目标物体进行检测,同时有效提高训练速度和检测效果。

PIL(Python imaging library)提供了大量的图像处理函数以及各种基本图像处理操作,可以高效地实现对原始绝缘子图像的旋转、翻转、亮度增强、对比度增强、颜色增强等预处理操作。利用 PIL对原始绝缘子图像进行预处理的效果示例如图2所示。

图2

图2   利用PIL对原始绝缘子图像进行预处理的效果示例


图2可知,采用旋转、翻转、亮度增强、对比度增强、颜色增强的数据增强策略可以增大绝缘子训练集的规模,提高模型的泛化能力,有效地提升模型的鲁棒性。

3 目标检测相关工作及算法模型

3.1 基于K-means聚类的初始候选框构建策略

本文采用的标记框到类簇中心的距离D如下:

D=1UIO(b,c)    (1)

其中,UIO为求交并比运算,b为标记框,c为类簇中心。对数据集中的绝缘子标记框进行维度聚类,具体过程如算法1所示。

算法1 K-means算法

输入 类簇个数 k,迭代结束的阈值 T,所有标记框的数据样本n

输出 聚类锚框

for i=1,2,3,…,k

for each n

计算标记框到类簇中心的距离D;

将所有标记框的数据样本n分到距离最近的类簇中;

end

更新所有类簇中心;

计算相邻2次迭代的差值ΔU;

if ΔU<T

输出聚类结果;

break;

end

end

聚类之后得到的 9 个先验框的尺度如下:[84,19]、[112,31]、[113,54]、[269,45]、[271,121]、[282,86]、[289,65]、[291,176]、[321,116]。

从机器学习的角度来看,聚类是一个无监督的学习过程,而分类是一个有监督的学习过程,它们之间的区别在于分类依赖于对其属性值的先验知识进行操作,而聚类主要依赖于算法。从统计学的角度来看,聚类分析是一种通过数据建模进行数据简化的方法,在很多数据分析中占有很重要的地位。

3.2 Mosaic数据增强

作为一种进阶的数据增强方式,Mosaic数据增强的基本策略是将4张绝缘子图像拼接在一起,随后进行随机缩放、随机裁剪、随机放置等数据增强操作。其优点如下:不需要增加最小批次(mini-batch)的大小,这是因为Mosaic数据增强在计算批量归一化时能够丰富绝缘子检测对象的背景和目标;可以一次计算4张绝缘子图像的数据,使GPU获得更好的检测效果;可以显著增加用于检测的绝缘子数据集,使网络的鲁棒性更高;可以简化GPU的功能,使性能得到很大的提升。Mosaic数据增强后的图像示例如图3所示。

图3

图3   Mosaic数据增强后的图像示例


Mosaic 数据增强后的图像有利于在训练过程中更好地拟合训练集中的图像,Mosaic数据增强策略是一种仅需较小的代价就能大概率提升模型性能的训练策略。

3.3 注意力机制

有研究者提出将注意力机制[13]作为一种有效的策略引入再识别领域来增强特征,主要捕捉绝缘子的各种辨别性外观。将注意力模块插入卷积神经网络已经被证明可以有效地增强卷积神经网络丰富的表示能力[14]。在更深的层次上,注意力模块可以通过对特征映射进行重新加权求和来接收辨别能力较高的权重注意力特征。可信的注意力权重可以提高注意力模块的性能,并且经过全局比较后的权重分布会更加可信。大多数注意力模块是通过有限的感受野的局部卷积操作实现的,不利于得到更多的全局信息去实现后面的工作,许多增加注意力的工作尝试通过增加网络的深度或者使用更大尺寸的滤波器来挖掘丰富的全局结构信息。

多种增加注意力的方法[15]已经被提出用于增强绝缘子特征表示的辨别能力,输入引用的残差部分为全局池化、两层全连接层和Sigmoid激活函数,最后输出不同的尺度。这些增加注意力的方法根据作用的通道可以分为两种:通道注意力(channel-wise attention)和空间注意力(spatial-wise attention)。通道注意力主要探索不同特征通道之间的特征映射关系;空间注意力利用不同空间位置上的多通道特征构建两两之间的关系,从而起到关联空间上下文的作用。

3.4 目标检测的方案

绝缘子目标检测的主要任务是找出绝缘子图像中所有感兴趣的物体,并且确定物体的类别及位置,属于目标检测领域研究的重要问题之一。由于需要检测的物体具有不同的外观和形状,还要考虑检测成像过程中光照、物体遮挡等因素的干扰,目标检测一直是计算机视觉领域中非常具有挑战性的问题。

已知的基于深度学习的目标检测算法[16]主要分为如下两类。

(1)两阶段的目标检测算法

两阶段的目标检测算法是一种基于候选框的算法,主要通过特征提取生成候选区域(region proposal,RP),最后进行分类和定位回归。具体地,生成候选区域的过程如下:首先产生可能包含待检测物体的预测框集合,然后通过卷积神经网络对各个样本进行分类,接着进行定位回归操作,最终得到待检测物体的位置。常见的两阶段的目标检测算法包括 R-CNN、Fast R-CNN、Faster R-CNN和R-FCN等。

(2)一阶段的目标检测算法

一阶段的目标检测算法是一种基于回归的算法,其没有使用 RP,而是直接在网络中提取特征,然后通过提取到的特征预测物体的类别和位置。常见的一阶段的目标检测算法包括OverFeat、YOLOv1、YOLOv2、YOLOv3、SSD和RetinaNet等。

YOLO(you only look once)是Redmon J等人[17]针对R-CNN、Fast R-CNN和Faster R-CNN推理速度慢的问题,经过大量的研究提出的一个目标检测网络,其核心思想是将感兴趣区域(region of interest,RoI)模块和两阶段的目标检测算法替换为一个一阶段端对端的检测算法,使得YOLO能够直接输出预测框的类别以及位置信息。传统的目标检测方法首先需要生成大量可能包含待检测物体的先验框、感兴趣区域,然后通过分类器判断每个先验框对应的边界框是否包含待检测物体以及对象类别的概率或置信度。同时需要对边界框进行后处理,最后根据一定的准则过滤掉置信度低、重叠度高的边界框,得到检测结果。这种先生成RoI再检测的方法虽然检测准确率较高,但运行速度较慢。YOLO 创造性地将物体检测任务直接当作回归问题,将 RoI和检测两个阶段合二为一,很容易就能够知道每个图像中的检测对象和位置。在检测绝缘子的问题上,本文使用 YOLOv5进行检测。

3.5 SENet

SENet[18]的核心标志在于采用了SEblock,一个SEblock 分为两个步骤:压缩(squeeze)和激发(excitation)。第一个步骤是压缩,即通过在卷积后的特征图(feature map)上执行全局平均池化操作得到当前特征图的全局压缩特征量。第二个步骤是激发,激发通过两层全连接的瓶颈层(bottleneck layer)结构来获得映射特征中每个通道的权值,最后将叠加权重后的特征图作为下一层的输入。

特征图是通过一系列卷积池化操作得到的,通常认为特征图上的每个通道具有相同的重要性,但研究者最关注的是待检测的目标物体,显然同一特征通道对于判别特征属于目标还是背景的重要性并不相同,因此需要给出映射特征的所有特征通道对应的可学习的权重,以区分目标物体和其他目标的重要程度。通过特征通道重要性权重,研究者实际要得到的真实特征图等同于通道重要性权重乘以每个通道上特征的原始值。压缩和激发模块流程示例如图4所示,图中通道的不同颜色代表这个通道具有不同的重要性。

c1和c2为两张特征图;w、h分别为空间通道的宽和高;Ftr(·,)为变换算子,负责将输入x映射到下一张特征图;Fsq(·)按空间通道对特征进行压缩,将每个二维的特征通道变为一维向量,向量具有全局的感受野;Fex(,w)通过参数w来产生每一个特征通道的权重,用于表明通道间的相关性;Fscale(·)将操作后输出的通道重要性权重缩放为与特征通道一致的权重张量。最后权重张量与特征图进行哈达玛乘积运算得到新的特征图x˜

可见,SENet 结构能够被简单地融合到常见的卷积神经网络中,其能够在特征提取阶段增强感受野、增加与待检测目标相关的特征通道的权重,能够有效地抑制与待检测目标无关的特征通道,提高特征图的语义信息,SENet 的网络结构如图5所示。

图5

图5   SENet的网络结构


SENet中的压缩和激发由以下步骤构成:首先,将SENet中输入的特征图经过卷积模块,再进行全局平均池化操作,得到长度为M的实数序列,使得每个通道上的特征图都有一个全局感受野,全局感受野较小的浅层特征图可以使用全局信息提高网络的特征提取能力,获得更丰富的图像语义信息;然后,将长度为M的实数序列输入全连接层,全连接层将序列维度降为原来的1/r(r为缩放系数),再使用 ReLU 激活函数增加通道数,使用 Sigmoid激活函数计算通道的权重系数;最后将权重系数乘以对应的特征通道来更新特征图。

4 改进的SE-YOLOv5s方法

4.1 SE-YOLOv5s

YOLO算法是一种基于回归的目标检测算法,其第5代版本YOLOv5在2020年被推出,YOLOv5共包含4个目标检测版本:YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,它们分别代表不同的网络深度、网络体积、参数量以及特征图宽度。其中YOLOv5s 是特征图宽度最小和网络深度最小的网络,另外3个网络则是在YOLOv5s的基础上不断地拓宽和加深得到的,宽度和深度均可用代码控制,非常方便。从节省计算成本和内存成本以及让网络更轻量级的角度出发,本文实验以 YOLOv5s为基础进行改进。

图4

图4   压缩与激发模块流程示例


YOLOv5s 在目标检测领域表现良好的重要原因之一是其主干网络(backbone)具有强大的特征表示能力。backbone由Focus和CSP[19]模块构成,其中Focus模块中的切片操作在d维输入图像特征图转换过程中表现良好,CSP 模块的作用是降低“瓶颈”和内存成本。提取特征后,在随后的目标检测预测框处理阶段中,YOLOv5s使用了加权的非极大值抑制(non-maximum suppression,NMS)方式来过滤掉大量包含目标的重叠预测框。值得注意的是,YOLOv5s在设计时主要用于通用目标检测,对绝缘子检测这类图像背景中目标混杂程度较高的场景的辨别能力还存在不足。同时,由于通用目标检测的训练集数据规模极大,作用于预测阶段的区域生成网络(region proposal network,RPN)简单地采用统一、对称的初始预定义边界就可以获得较好的目标检测性能。而本文的绝缘子检测任务受到已标注训练数据规模不足的限制,简单采用YOLOv5s模型难以有效实现目标。针对上述问题,本文引入注意力机制,提出在主干网络提取特征后加入 SElayer 模块强化背景混杂场景下的特征表示能力,随后采用第3.1节介绍的K-means算法来构建9类具有先验性的初始预测框,并在训练阶段联合第3.2节中的Mosaic数据增强策略解决绝缘子检测任务中训练数据不足的问题,本文将这种改进后的方法称为SE-YOLOv5s,其整体模块如图6所示。

图6具体说明如下,在输入尺寸为640×640的图像后,使用主干特征提取网络进行特征提取,然后通过检测头模块进行多尺度的检测。主干特征提取网络包含集中切片模块Focus、瓶颈模块BCSP、空间金字塔池化SPP、卷积层Conv(代表一层普通卷积加一层标准归一化层BN和HardSwish激活函数)。BCSP(true)代表两层卷积与残差单元相加, BCSP(false)代表两层卷积,BCSPn代表Conv加n 个 BCSP(true)、普通卷积 conv 以及一个卷积残差 conv,然后使用 Concat 函数进行拼接,拼接后的特征再经过一层标准归一化层 BN、Leaky ReLU激活函数和一个Conv卷积,进而得到输出。蓝色 BCSPn 代表n 个BCSP(false)堆叠。Focus集中切片操作是将数据切分为4份,切分后的每一份数据都相当于经过2倍的下采样过程,然后对通道进行拼接,最后进行卷积操作。空间金字塔池化SPP是在CSP上添加SPP块,因为它能够显著地增大感受野,分离出最重要的上下文特征,并且几乎不会降低网络运行速度。检测头部分主要包括路径聚合网络 PANet 和检测部分 Detect(YOLOv3/v4 head)。在尝试多个位置之后,本文选择将SElayer模块放在主干特征提取网络中的 BCSP1 的后面,此时取得的实验效果较好。

图6

图6   改进后的SE-YOLOv5模块


绝缘子检测步骤如图7所示。利用第3.1节的K-means 算法得到 9 个尺度的先验框,然后在SE-YOLOv5s模块中设置这9个尺度的先验框以便进行训练。输入绝缘子图像并调整图像大小,然后进入设置好先验框的SE-YOLOv5s模块,最终输出检测后的绝缘子图像。

图7

图7   绝缘子检测步骤


4.2 损失函数选择

IoU 是预测的目标边界框和真实目标边界框的交并比,计算式如下:

IoU=|BBgt||BBgt|    (2)

其中,B是预测的目标边界框内所有像素点的集合, Bgt是真实目标边界框内的所有像素点集合。

本文将 GIoU-LOSS 作为定位损失函数,计算式如下:

GIoU=IoU|C\BBgt||C|    (3)

其中,C为包括B和Bgt的最小矩形,C\B∪Bgt的面积为C的面积减去B∪Bgt的面积。

定位损失为预测的目标边界框与真实目标边界框之间的误差,其计算式为:

LGIoU=i=0S2j=0NIijobj×(1GIoU)    (4)

其中,s 2为网格总数,N 是边界框的总数,Iijobj用于判断第i个网格中的第j个边界框是否负责预测目标。置信度损失Lconf和分类损失Lclass都是使用交叉熵损失函数计算得到的,计算式如下:

Lconf=i=0S2j=0NIijobj[C^ijlog(Cij)+(1C^ij)log(1Cij)]

λnoobji=0S2j=0NIijnoobj[C^ijlog(Cij)+(1C^ij)log(1Cij)]    (5)

Lclass=i=0S2IijobjCclasses[P^ijlog(Pij)+(1P^ij)log(1Pij)]   (6)

其中,CijC^ij分别为预测的目标边界框和真实目标边界框的置信度;PijP^ij分别为预测的目标边界框和真实目标边界框的类概率。

总的损失函数为定位损失、置信度损失、分类损失的和,计算式为:

Ltotal=LGIoU+Lconf+Lclass    (7)

由于本文的检测目标仅为绝缘子,因此Lclass可忽略,对不同的损失项采用加权验证得到最后的计算式为:

Ltotal=αLGIoU+(1α)Lconf    (8)

其中,α为权值。不同权值时的准确率和召回率见表1

表1   不同权值时的准确率和召回率

α准确率召回率
-98.24%99.46%
0.698.16%99.17%
0.798.19%99.28%
0.898.19%99.32%
0.998.21%99.43%

新窗口打开| 下载CSV


表1可以看出,不使用α时准确度最高,因此本文不使用α值,即总的损失函数如计算式(7)所示。

5 实验验证

本文提出的检测绝缘子的方法使用深度学习框架PyTorch进行实验,使用SE-YOLOv5s模型进行绝缘子检测。自建数据集按照PASCAL VOC数据集格式进行构建,包括600张绝缘子图像,其中540张图像用于模型训练,60张图像用于模型测试。模型训练在 Ubuntu 系统中完成,实验设备的处理器为Intel Xenon Silver 4208,显卡为NVIDIA Quadro RTX 4000,显存为8 GB。训练数据时采用随机的旋转、翻转、亮度增强、对比度增强、颜色增强和 Mosaic 数据增强的方式进行数据扩充,模型训练的超参数设置如下:批处理(batch_size)参数为16,初始学习率(init_learning_rate)为0.01,学习率衰减策略为指数衰减,动量(momentum)设置为0.937,权重衰减(weight_decay)设置为0.000 5,迭代(epoch)次数设置为100。

整个训练过程中模型的权重是随机初始化的,选择大的学习率会使得模型非常不稳定。本文选择的用于预热学习率的Warmup预热方法可以让训练刚开始的几个epoch中的学习率很小,在预热的小学习率下,模型可以通过小学习率进行调整并逐渐稳定下来,等模型相对稳定后,再选择预先设置的学习率进行训练。Warmup 预热方法可以使模型收敛速度更快,模型效果更好。

本文使用的算法评价指标包括准确率(precision)、召回率(recall)和平均精度均值(mean average precision,mAP)。其中,TP 表示算法将正类预测为正类的目标个数;FP表示将负类预测为正类的目标个数,即检测错误的目标个数;FN 表示将正类预测为负类的目标个数,即漏检的个数;p表示准确率,r表示召回率。

准确率的计算式为:

precision=TPTP+FP    (9)

召回率的计算式为:

recall=TPTP+FN    (10)

平均精度的计算式为:

AP=01P(r)dr    (11)

利用 TensorBoard 可视化工具可以看到,加入注意力机制后的准确度、召回率、mAP变化情况如图8所示。

绝缘子检测的模型性能见表2

表2   绝缘子检测的模型性能

模型mAP平均检测时间/ms
Faster R-CNN95.58%163.7
SSD95.22%53.5
YOLOv3[19]97.02%64.4
YOLOv598.24%36.2
SE-YOLOv5s98.46%19.8

新窗口打开| 下载CSV


图8

图8   加入注意力机制后的mAP、准确度、召回率变化情况


图9

图9   YOLOv5绝缘子检测结果


图10

图10   SE-YOLOv5s绝缘子检测结果


表2可以看出,本文的SE-YOLOv5s在平均精度均值和检测速度方面均表现较好。与YOLOv5相比,SE-YOLOv5s的平均精度均值提升了0.22%,平均每张图像检测时间加快了16.4 ms,总花费时间为19.8 ms。YOLOv5绝缘子检测结果如图9所示, SE-YOLOv5s绝缘子检测结果如图10所示。从图9图10可以看出,相较于YOLOv5,SE-YOLOv5s的效果有所提升。

6 结束语

本文提出了一种基于SE-YOLOv5s的绝缘子检测方法,通过加入注意力机制,平均精度均值以及检测速度得到了提升,并在实验中证实了这个方法的可行性。在接下来的工作中,笔者会继续探索YOLOv5方法,增强模型的鲁棒性和数据集的复杂性,使本文方法能够在复杂背景下的绝缘子目标检测任务中发挥更好的效果,提升模型对复杂场景的处理能力。

参考文献

付晶, 邵瑰玮, 吴亮 ,.

利用层次模型进行训练学习的线路设备缺陷检测方法

[J]. 高电压技术, 2017,43(1): 266-275.

[本文引用: 1]

FU J , SHAO G W , WU L ,et al.

Defect detection of line facility using hierarchical model with learning algorithm

[J]. High Voltage Engineering, 2017,43(1): 266-275.

[本文引用: 1]

陆佳政, 谢鹏康, 方针 ,.

重覆冰条件下防冰防雷绝缘子电场仿真与伞裙优化

[J]. 电力自动化设备, 2018,38(3): 199-204.

[本文引用: 1]

LU J Z , XIE P K , FANG Z ,et al.

Electric field simulation and sheds optimization of anti-icing and anti-lightning insulator under heavy icing condition

[J]. Electric Power Automation Equipment, 2018,38(3): 199-204.

[本文引用: 1]

阳武 .

基于航拍图像的绝缘子识别与状态检测方法研究

[D]. 北京:华北电力大学, 2016.

[本文引用: 1]

YANG W .

Research on insulator recognition and state detection method based on aerial image

[D]. Beijing:North China Electric Power University, 2016.

[本文引用: 1]

程海燕, 韩璞, 王迪 ,.

一种电网巡检航拍图像中绝缘子定位方法

[J]. 系统仿真学报, 2017,29(6): 1327-1336.

[本文引用: 1]

CHENG H Y , HAN P , WANG D ,et al.

Location method of insulators in power grid patrol aerial images

[J]. Journal of System Simulation, 2017,29(6): 1327-1336.

[本文引用: 1]

REDDY M J B , CHANDRA B K , MOHANTA D K .

A DOST based approach for the condition monitoring of 11 kV distribution line insulators

[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2011,18(2): 588-595.

[本文引用: 1]

REDDY M J B , B K C , MOHANTA D K .

Condition monitoring of 11 kV distribution system insulators incorporating complex imagery using combined DOST-SVM approach

[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2013,20(2): 664-674.

[本文引用: 2]

OBERWEGER M , WENDEL A , BISCHOF H .

Visual recognition and fault detection for power line insulators

[C]// Proceedings of the 19th Computer Vision Winter Workshop. Krtiny:Czech Society for Cybernetics and Informatics, 2014: 81-88.

[本文引用: 1]

ZHAO Z B , LIU N , WANG L .

Localization of multiple insulators by orientation angle detection and binary shape prior knowledge

[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2015,22(6): 3421-3428.

[本文引用: 1]

彭向阳, 陈驰, 饶章权 ,.

基于无人机多传感器数据采集的电力线路安全巡检及智能诊断

[J]. 高电压技术, 2015,41(1): 159-166.

[本文引用: 1]

PENG X Y , CHEN C , RAO Z Q ,et al.

Safety inspection and intelligent diagnosis of transmission line based on unmanned helicopter of multi sensor data acquisition

[J]. High Voltage Engineering, 2015,41(1): 159-166.

[本文引用: 1]

WU Q G , AN J B , LIN B .

A texture segmentation algorithm based on PCA and global minimization active contour model for aerial insulator images

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2012,5(5): 1509-1518.

[本文引用: 1]

WU Q G , AN J B .

An active contour model based on texture distribution for extracting inhomogeneous insulators from aerial images

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2014,52(6): 3613-3626.

[本文引用: 1]

WANG W G , WANG Y F , HAN J ,et al.

Recognition and drop-off detection of insulator based on aerial image

[C]// Proceedings of the 2016 9th International Symposium on Computational Intelligence and Design. Piscataway:IEEE Press, 2016: 162-167.

[本文引用: 1]

VASWANI A , SHAZEER N , PARMAR N ,et al.

Attention is all you need

[C]// Proceedings of the 31st Conference on Neural Information Processing Systems.[S.l.:s.n.], 2017.

[本文引用: 1]

WOO S , PARK J , LEE J Y ,et al.

CBAM:convolutional block attention module

[M]. Computer vision – ECCV 2018. Cham: Springer International Publishing, 2018: 3-19.

[本文引用: 1]

LI W , ZHU X T , GONG S G .

Harmonious attention network for person Re-identification

[C]// Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway:IEEE Press, 2018: 2285-2294.

[本文引用: 1]

田思佳, 顾强, 胡蓉 ,.

一种基于深度学习的机械臂分拣方法

[J]. 智能科学与技术学报, 2020,2(3): 268-274.

[本文引用: 1]

TIAN S J , GU Q , HU R ,et al.

A robot sorting method based on deep learning

[J]. Chinese Journal of Intelligent Science and Technology, 2020,2(3): 268-274.

[本文引用: 1]

REDMON J , DIVVALA S , GIRSHICK R ,et al.

You only look once:unified,real-time object detection

[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Piscataway:IEEE Press, 2016: 779-788.

[本文引用: 1]

HU J , SHEN L , SUN G .

Squeeze-and-excitation networks

[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Piscataway:IEEE Press, 2018: 7132-7141.

[本文引用: 1]

WANG C Y , MARK LIAO H Y , WU Y H ,et al.

CSPNet:a new backbone that can enhance learning capability of CNN

[C]// Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. Piscataway:IEEE Press, 2020: 1571-1580.

[本文引用: 2]

/