一种基于YOLOV5改进的广告牌检测方法[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202011221274.5
(22)申请日 2020.11.04
(71)申请人 哈尔滨理工大学
地址 150080 黑龙江省哈尔滨市南岗区学
府路52号
(72)发明人 罗智勇 王建明 张文博 
(51)Int.Cl.
G06K  9/46(2006.01)
G06K  9/34(2006.01)
G06K  9/62(2006.01)
G06N  3/04(2006.01)
(54)发明名称
一种基于YOLOV5改进的广告牌检测方法
(57)摘要
本发明公开了一种基于YOLOv5改进空洞卷
积的广告牌违法检测,设及人工智能领域,包括
以下步骤:(1)广告牌图像信息的获取;(2)广告
牌图像样本的划分;(3)广告牌图像的特征提取;
(4)违法广告牌识别模型的构建。本发明采用
PANet进行违法广告牌检测模型的构建,提出一
种空洞卷积神经网络模型能够提取更多、更有效
的特征信息,且可以避免过拟合,使用性能较好
的GPU进行训练极大提高了训练的速度,扩大了
感受野,不仅可以检测分割大目标且没有降低分
辨率,非常适合违法广告牌的精准、
快速检测。权利要求书1页  说明书5页  附图4页CN 112270331 A 2021.01.26
C N  112270331
A
1.一种基于YOLOv5改进的广告牌违法检测,包括以下步骤:
广告牌图像信息的获取;
广告牌图像样本的划分;
广告牌图像的特征提取;
违法广告牌识别模型的构建
根据权利要求1所描述的一种基于YOLOv5改进的广告牌违法检测方法,其特征在于:所描述步骤(1)中,获取广告牌的图像信息,得到广告牌的图像数据集,为了提高本发明在实际场景中的应用能力,所收集的数据集图片均来自于现实生活中的场景,然后利用目标检测标注工具进行标注,将图片格式化为一定的图片尺寸,进而获得广告牌图像信息,包含违法与不违法两大类。
2.根据权利要求1所描述的一种基于YOLOv5改进的广告牌违法检测方法,其特征在于:所描述步骤(2)中,采取随机抽样的方式将所采集的广告牌图像数据按一定的比例划分为独立不重复的验证集和测试集。
3.根据权利要求1所描述的一种基于YOLOv5改进的广告牌违法检测方法,其特征在于所描述步骤(3)中用于提取广告牌图像信息特征的路径聚合网络
(Path  AggregationNetworks,PANet),是一种实例分割框架下的网络,目的在于提高提高基于提议的实例分割框架的信息流。
4.具体而言,通过自上而下的路径增强在较低层使用精确定位信号来增强整个要素层次结构,缩短了较低层和最顶层功能之间的信息路径。
5.PANet主要包括以下四个部分:
(1)FPN(Feature  PyramidNetworks):通过融合高低层特征提升目标检测的效果;
(2)自底向上路径扩充(bottom -up  path  augmentation):主要考虑网络浅层特征信息对于实例分割的重要性;
(3)自适应池化特征层(Adaptive  Feature  Pooling):每个proposal利用金字塔所有层的特征,避免proposal的随意分配;
(4)全连接层(Fully -connected  Fusion):给掩码预测增加信息来源,并在输出检测头加入空洞卷积网络,提供更大的感受野,使得融合输出的分支结果更加精确。
6.根据权利要求1所描述的一种基于YOLOv5改进的广告牌违法检测方法,其特征在于所描述步骤(4)中,在训练和测试阶段,在PANet的全连接层中加入空洞卷积网络,利用PANet提取广告牌图像特征在验证集上构建违禁广告牌识别模块,确定识别模块的参数,然后利用测试集来检测识别效果,验证模块性能。
权 利 要 求 书1/1页CN 112270331 A
一种基于YOLOV5改进的广告牌检测方法
技术领域
[0001]本发明设及一种基于YOLOv5改进的广告牌违法检测方法,属于人工智能的领域。
背景技术
[0002]为了规范城镇户外广告设施和店招标牌设施的设置行为,确保广告设施的安全可靠,创建健康、有序的城市视觉环境,城市管理部门需要对违法广告设施做定期肃清。但目前执法依赖执法人员在街道上拍照取证,由于涉及街道范围较广,需要耗费大量人力,而且效率也比较低。
[0003]因此本文提出一种新型的“违法广告牌快速检测系统”--基于YOLOv5的检测系统,主要针对是“广告牌检测”,该系统能检测与标记违法广告牌,并在检测出违法广告牌时给出提示,在不影响店铺正常营业的情况下快速检测,更好的提高民众的生活保障。
发明内容
[0004]针对上述问题,本发明提出一种快速简单的违法广告牌识别方法。
[0005]为实现上述目的,本发明发采用的技术方案为:一种基于YOLOv5改进的广告牌违法检测方法,包括以下步骤:
(1)广告牌图像信息的获取;
(2)广告牌图像样本的划分;
(3)广告牌图像的特征提取;
(4)PANet违法广告牌识别模型的构建。
[0006]作为优选,所述步骤(1)中,获取广告牌的图像信息,得到广告牌的图像数据集。[0007]作为优选,所述步骤(2)中,采用随机抽样的方式将所采集的广告牌图像数据按一定比例划分为独立不重复的验证集和测试集。
[0008]作为优选,所述步骤(3)中,用于提取广告牌图像信息特征的路径聚合网络PANet,其中PANet,其中PANet包括四个部分,分别为:FPN特征金字塔;自底向上路径扩充;自适应池化特征层;全连接层等。
[0009]作为优选,所述步骤(4)中,在训练和测试阶段,在PANet的全连接层加入空洞卷积网络,利用PANet提取广告牌图像特征在验证集上构建违法广告牌识别模型,确定识别模型的参数,然后利用测试集来检测识别效果,验证模型性能。
[0010]通过上述技术方案,本发明的有益效果是:提出一种新的基于路径聚合网路PANet 模型,引入空洞卷积网络,扩大了感受野,捕获多尺度上下文信息,从而获取更多、更有效的图像信息,有利于快速、准确检测出街道的违法广告牌。与现有技术相比,本发明的优点是:(1)由PANet网络对数据集进行训练,得到一个高效的训练结果,由此可以对违法广告牌的快速定位,比起以往的方法更高效,节省了大量的时间和人工成本;(2)加入空洞卷积层,可以更好地扩大感受野,捕获多尺度上下文信息,
从而实现准确的定位和分类违法广告牌;
(3)加入空洞卷积,使得输出不同层的特征图更精确,优化了输出数据,提高定位和分类的
准确性。
[0011]YOLOv5主要从以下几个方面有所改进:
Data Augmentation:图像增强是从现有的训练数据中创建新的训练样本。实验中不可能为每一个现实世界场景捕捉一个图像,因需要调整现有的训练数据以推广到其他情况,从而允许模型适应更广泛的情况。
[0012]多样化的先进数据增强技术是最大限度地利用数据集,使对象检测框架取得性能突破的关键。通过一系列图像增强技术步骤,可以在不增加推理时延的情况下提高模型的性能。
[0013]YOLOv5通过数据加载器传递每一批训练数据,并同时增强训练数据。
[0014]数据加载器进行三种数据增强:缩放,彩空间调整和马赛克增强。马赛克数据增强确实能有效解决模型训练中最头疼的“小对象问题”,即小对象不如大对象那样准确地被检测到。
[0015]Auto Learning Bounding Box Anchors:自适应锚框,在YOLOv5之前,主流是采用K均值和遗传学习算法对自定义数据集进行分析,获得适合自定义数据集中对象边界框预测的预设锚框。
[0016]在YOLOv5中锚框是基于训练数据自动学习的。不仅适用于标准数据集(例如COCO,PASCALVOC等),同时也适用于自定义数据集;由于目标识别框架往往需要缩放原始图片尺寸,并且数据集中目标对象的大小可能不同,因此YOLOv5会重新自动学习锚框的尺寸。[0017]Backbone:跨阶段局部网络(CSPDarket),从输入图像中提取丰富的信息特征。CSPNet解决了其他大型卷积神经网络框架Backbone中网络优化的梯度信息重复问题,将梯度的变化从头到尾地集成到特征图中,因此减少了模型的参数量和FLOPS数值,既保证了推理速度和准确率,又减小了模型尺寸。
[0018]Neck:路径聚合网络(PANet),用于生成特征金字塔,其会增强模型对于不同缩放尺度对象的检测,从而能够识别不同大小和尺度的同一个物体。
[0019]Head:YOLO通用检测层,用于最终检测部分,在特征图上应用锚框,并生成带有类概率、对象得分和包围框的最终输出向量。
[0020]Activation Function:激活函数的选择对于深度学习网络是至关重要的。YOLOv5在中间/隐藏层使用了Leaky ReLU和最后的检测层使用了Sigmoid激活函数。
[0021]Optimization Function:提供了两个优化函数Adam和SGD,并都预设了与之匹配的训练超参数。默认为SGD。如果需要训练较小的自定义数据集,Adam是更合适的选择,尽管Adam的学习率通常比SGD低;但是如果训练大型数据集,对于YOLOv5来说SGD效果比Adam好。[0022]Cost Function:损失计算是基于目标得分、类得分和框回归得分,使用GIoU损失作为框损失计算,另外再采用二进制交叉熵和Logistic损失函数计算类概率和目标得分的损失。
附图说明
[0023]图1本发明实施违法广告牌识别方法的训练流程图。
[0024]图2本发明实施用于提取图像特征改进后的网络结构简图。
[0025]图3本发明实施检测改进前后的卷积图。
[0026]图4本发明实施改进前后的检测效果对比图。
[0027]图5本发明实施改进前后的实验数据分析图。
具体实施方式
[0028]下面结合说明书附图,对本发明作进一步说明,以让本领域技术
人员参照说明书文字能够具体实施。
[0029]本发明在Ubuntu16.04.4LTS环境下工作,采用PyTorch为框架进行搭建,主要参数有:初始学习率为0.001,动量参数为0.937,权重系数为0.0005,训练阈值为0.65,imagesize为896 896,epoch为400等,此外,为了提高数据的多样性,对图片进行数据增强,每个步骤均以0.5的概率选择是否使用。
[0030]本发明采用的技术方案为:一种基于YOLOv5改进空洞卷积的广告牌违法检测方法,包括以下步骤:
(1)广告牌图像信息的获取;
(2)广告牌图像样本的划分;
(3)广告牌图像的特征提取;
(4)PANet违法广告牌识别模型的构建。
[0031]下面结合附图,对发明作进一步详细说明,本发明提供一种基于YOLOv5改进空洞卷积的广告牌违法检测方法,训练步骤如图1所示:
广告牌图像信息的获取:获取广告牌的图像信息,得到广告牌的图像数据集,为了提高本发明在实际场景中的应用能力,所收集的数据集图片均来自于现实生活中的场景,然后利用目标检测标注工具进行标注,将图片格式化为一定的图片尺寸,进而获得广告牌图像信息,包含违法与不违法两大类。
[0032]广告牌图像样本的划分:本发明采用随机抽样的方式对街道中的违法广告牌和正常广告牌的图像数据按照验证集80%,测试集20%的比例将广告牌图像数据划分为独立的验证集和测试集。
[0033]PANet广告牌图像的特征提取,如附图2中展示了网络的结构图,该网络主要包括四个部分:(1)FPN特征金字塔,主要作用是通过融合高低层特征提升目标检测的效果,尤其是可以提高小尺寸目标的检测,例如在店面排列拥挤,广告牌尺寸较小,选择FPN可以显著提升效果;(2)自底向上路径扩充,主要考虑到网络浅层特征信息对于实例分割非常重要,浅层特征多是边缘形状等特征,而实例分割是像素级别的分类;(3)自适应池化特征层,主要目的是特征融合,将单层特征换成多层特征,使得提取到的ROI特征更加丰富;(4)全连接层是针对原有的分割支路引入一个前背景二分类的全连接支路,又加入空洞卷积网络.普通卷积网络在检测中精度低且容易出现漏检的情况。因此我们在输出头加入空洞卷积,扩大了感受野的同时没有降低分辨率,提高了精度,且大幅度改善了漏检的情况。如图3所示,在不用池化层(池化层会导致信息损失)且计算量相当的情况下,提供更大的感受野。从直观上讲,感受野就是视觉感受区域的大小。在卷积神经网络中,感受野的定义是卷积神经网络每一层输出的特征图上的像素点在原始图像上映射的区域大小。扩大感受野是为了增加感受野且降低计算量,总
要进行降采样,这样虽然可以增加感受野,但空间分辨率降低了,进而导致信息丢失。为了能不丢失分辨率,且仍然扩大感受野,可以使用空洞卷积。这在检

本文发布于:2024-09-25 14:33:35,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/750626.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:广告牌   检测   特征   图像   违法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议