计算机视觉（十六）：目标检测概述

本溪四高中

计算机视觉（⼗六）：⽬标检测概述

1 什么是⽬标检测

⽬标检测（Object Detection）的任务是出图像中所有感兴趣的⽬标（物体），确定它们的类别和位置。

例⼦：确定某张给定图像中是否存在给定类别（⽐如⼈、车、⾃⾏车、狗和猫）的⽬标实例；如果存在，就返回每个⽬标实例的空间位置和覆盖范围。作为图像理解和计算机视觉的基⽯，⽬标检测是解决分割、场景理解、⽬标追踪、图像描述、事件检测和活动识别等更复杂更⾼层次的视觉任务的基础。

⽬标检测的应⽤场景：

⽬标检测具有巨⼤的实⽤价值和应⽤前景。

应⽤领域包括⼈脸检测、⾏⼈检测、车辆检测、卫星图像中道路的检测、车载摄像机图像中的障碍物检测、医学影像在的病灶检测等。

应⽤场景包括长/视频领域、医学场景、安防领域、⾃动驾驶等等众多领域

⾏⼈车辆检测：

多⼈脸的检测：

⽬标检测的实⽤价值

这⾥我们举⼀些使⽤的场景

在视频中去进⾏检测明星⼈物，检测出某明星的视频只看他的视频。类似在爱奇艺中的只看他功能快速筛选仅有明星出现的⽚段。

2 ⽬标检测算法介绍

堂堂网

下⾯这张图代表了⽬标检测算法的发展历史（基于深度学习），其中红⾊部分是影响较⼤的算法论⽂。是需要着重了解的。

算法分类

两步⾛的⽬标检测：先进⾏区域推荐，⽽后进⾏⽬标分类

包含⼀个⽤于区域提议的预处理步骤，使得整体流程是两级式的。代表：R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN和R-FCN等

端到端的⽬标检测：直接在⽹络中提取特征来预测物体分类和位置

萃取精馏

即⽆区域提议的框架，这是⼀种单独提出的⽅法，不会将检测提议分开，使得整个流程是单级式的。代表：OverFeat、YOLOv1、YOLOv2、YOLOv3、SSD和RetinaNet等

⼏种类别结构的形式如下：

算法效果对⽐

因为对⽐⾓度有很多，性能和准确度，性能⽅⾯不好⽐较，涉及到使⽤的CPU和GPU的区别。不同算法当时实验环境不⼀样。这⾥进⾏了准确度的⽐较

论⽂在常见数据集中的测试效果：

Detector VOC07 (mAP@IoU=0.5)VOC12 (mAP@IoU=0.5)COCO (mAP@IoU=0.5:0.95)Published In

R-CNN58.5--CVPR’14

SPP-Net59.2--ECCV’14

MR-CNN78.2 (07+12)73.9 (07+12)-ICCV’15

Fast R-CNN70.0 (07+12)68.4 (07++12)19.7ICCV’15

Faster R-CNN73.2 (07+12)70.4 (07++12)21.9NIPS’15

YOLO v166.4 (07+12)57.9 (07++12)-CVPR’16

G-CNN66.866.4 (07+12)-CVPR’16

AZNet70.4-22.3CVPR’16

ION80.177.933.1CVPR’16

HyperNet76.3 (07+12)71.4 (07++12)-CVPR’16 Detector VOC07 (mAP@IoU=0.5)VOC12 (mAP@IoU=0.5)COCO (mAP@IoU=0.5:0.95)Published In

OHEM78.9 (07+12)76.3 (07++12)22.4CVPR’16 MPN--33.2BMVC’16 SSD 76.8(07+12)74.9 (07++12)31.2ECCV’16 GBDNet77.2 (07+12)-27.0ECCV’16 CPF76.4 (07+12)72.6 (07++12)-ECCV’16 R-FCN79.5 (07+12)77.6 (07++12)29.9NIPS’16 DeepID-Net69.0--PAMI’16 NoC71.6 (07+12)68.8 (07+12)27.2TPAMI’16 DSSD81.5 (07+12)80.0 (07++12)33.2arXiv’17 TDM--37.3CVPR’17 FPN--36.2CVPR’17 YOLO v278.6 (07+12)73.4 (07++12)-CVPR’17 RON77.6 (07+12)75.4 (07++12)27.4CVPR’17 DeNet77.1 (07+12)73.9 (07++12)33.8ICCV’17 CoupleNet82.7 (07+12)80.4 (07++12)34.4ICCV’17 RetinaNet--39.1ICCV’17 DSOD77.7 (07+12)76.3 (07++12)-ICCV’17 SMN70.0--ICCV’17 Light-Head R-CNN--41.5arXiv’17 YOLO v3--33.0arXiv’18 SIN76.0 (07+12)73.1 (07++12)23.2CVPR’18 STDN80.9 (07+12)--CVPR’18 RefineDet83.8 (07+12)83.5 (07++12)41.8CVPR’18 SNIP--45.7CVPR’18 Relation-Network--32.5CVPR’18 Cascade R-CNN--42.8CVPR’18 MLKP80.6 (07+12)77.2 (07++12)28.6CVPR’18 Fitness-NMS--41.8CVPR’18 RFBNet

82.2 (07+12)--ECCV’18 CornerNet--42.1ECCV’18 PFPNet84.1 (07+12)83.7 (07++12)39.4ECCV’18 Pelee70.9 (07+12)--NIPS’18 HKRM78.8 (07+12)-37.8NIPS’18 M2Det--44.2AAAI’19 R-DAD81.2 (07++12)82.0 (07++12)43.1AAAI’19组合图形的面积教学设计

3 ⽬标检测的任务

分类的任务回顾

分类的损失与优化

微粒算法在训练的时候需要计算每个样本的损失，那么CNN做分类的时候使⽤softmax函数计算结果，损失为交叉熵损失

常见CNN模型

成绩管理系统

对于⽬标检测来说不仅仅是分类这样简单的⼀个图⽚输出⼀个结果，⽽且还需要输出图⽚中⽬标的位置信息，所以从分类到检测，如下图标记了过程:

本文发布于:2024-09-21 18:59:48，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/236707.html

上一篇：五笔拆字五笔拆字规则五笔字型拆字方法

下一篇：钢板金属材料牌号对照表