计算机视觉(十六):目标检测概述

本溪四高中
计算机视觉(⼗六):⽬标检测概述
1 什么是⽬标检测
⽬标检测(Object Detection)的任务是出图像中所有感兴趣的⽬标(物体),确定它们的类别和位置。
例⼦:确定某张给定图像中是否存在给定类别(⽐如⼈、车、⾃⾏车、狗和猫)的⽬标实例;如果存在,就返回每个⽬标实例的空间位置和覆盖范围。作为图像理解和计算机视觉的基⽯,⽬标检测是解决分割、场景理解、⽬标追踪、图像描述、事件检测和活动识别等更复杂更⾼层次的视觉任务的基础。
⽬标检测的应⽤场景:
⽬标检测具有巨⼤的实⽤价值和应⽤前景。
应⽤领域包括⼈脸检测、⾏⼈检测、车辆检测、卫星图像中道路的检测、车载摄像机图像中的障碍物检测、医学影像在的病灶检测等。
应⽤场景包括长/视频领域、医学场景、安防领域、⾃动驾驶等等众多领域
⾏⼈车辆检测:
多⼈脸的检测:
⽬标检测的实⽤价值
这⾥我们举⼀些使⽤的场景
在视频中去进⾏检测明星⼈物,检测出某明星的视频只看他的视频。类似在爱奇艺中的只看他功能快速筛选仅有明星出现的⽚段。
2 ⽬标检测算法介绍
堂堂网
下⾯这张图代表了⽬标检测算法的发展历史(基于深度学习),其中红⾊部分是影响较⼤的算法论⽂。是需要着重了解的。
算法分类
两步⾛的⽬标检测: 先进⾏区域推荐,⽽后进⾏⽬标分类
包含⼀个⽤于区域提议的预处理步骤,使得整体流程是两级式的。代表:R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN和R-FCN等
端到端的⽬标检测: 直接在⽹络中提取特征来预测物体分类和位置
萃取精馏
即⽆区域提议的框架,这是⼀种单独提出的⽅法,不会将检测提议分开,使得整个流程是单级式的。代表:OverFeat、YOLOv1、YOLOv2、YOLOv3、SSD和RetinaNet等
⼏种类别结构的形式如下:
算法效果对⽐
因为对⽐⾓度有很多,性能和准确度,性能⽅⾯不好⽐较,涉及到使⽤的CPU和GPU的区别。不同算法当时实验环境不⼀样。这⾥进⾏了准确度的⽐较
论⽂在常见数据集中的测试效果:
Detector VOC07 (mAP@IoU=0.5)VOC12 (mAP@IoU=0.5)COCO (mAP@IoU=0.5:0.95)Published In
R-CNN58.5--CVPR’14
SPP-Net59.2--ECCV’14
MR-CNN78.2 (07+12)73.9 (07+12)-ICCV’15
Fast R-CNN70.0 (07+12)68.4 (07++12)19.7ICCV’15
Faster R-CNN73.2 (07+12)70.4 (07++12)21.9NIPS’15
YOLO v166.4 (07+12)57.9 (07++12)-CVPR’16
G-CNN66.866.4 (07+12)-CVPR’16
AZNet70.4-22.3CVPR’16
ION80.177.933.1CVPR’16
HyperNet76.3 (07+12)71.4 (07++12)-CVPR’16 Detector VOC07 (mAP@IoU=0.5)VOC12 (mAP@IoU=0.5)COCO (mAP@IoU=0.5:0.95)Published In
OHEM78.9 (07+12)76.3 (07++12)22.4CVPR’16 MPN--33.2BMVC’16 SSD 76.8(07+12)74.9 (07++12)31.2ECCV’16 GBDNet77.2 (07+12)-27.0ECCV’16 CPF76.4 (07+12)72.6 (07++12)-ECCV’16 R-FCN79.5 (07+12)77.6 (07++12)29.9NIPS’16 DeepID-Net69.0--PAMI’16 NoC71.6 (07+12)68.8 (07+12)27.2TPAMI’16 DSSD81.5 (07+12)80.0 (07++12)33.2arXiv’17 TDM--37.3CVPR’17 FPN--36.2CVPR’17 YOLO v278.6 (07+12)73.4 (07++12)-CVPR’17 RON77.6 (07+12)75.4 (07++12)27.4CVPR’17 DeNet77.1 (07+12)73.9 (07++12)33.8ICCV’17 CoupleNet82.7 (07+12)80.4 (07++12)34.4ICCV’17 RetinaNet--39.1ICCV’17 DSOD77.7 (07+12)76.3 (07++12)-ICCV’17 SMN70.0--ICCV’17 Light-Head R-CNN--41.5arXiv’17 YOLO v3--33.0arXiv’18 SIN76.0 (07+12)73.1 (07++12)23.2CVPR’18 STDN80.9 (07+12)--CVPR’18 RefineDet83.8 (07+12)83.5 (07++12)41.8CVPR’18 SNIP--45.7CVPR’18 Relation-Network--32.5CVPR’18 Cascade R-CNN--42.8CVPR’18 MLKP80.6 (07+12)77.2 (07++12)28.6CVPR’18 Fitness-NMS--41.8CVPR’18 RFBNet
82.2 (07+12)--ECCV’18 CornerNet--42.1ECCV’18 PFPNet84.1 (07+12)83.7 (07++12)39.4ECCV’18 Pelee70.9 (07+12)--NIPS’18 HKRM78.8 (07+12)-37.8NIPS’18 M2Det--44.2AAAI’19 R-DAD81.2 (07++12)82.0 (07++12)43.1AAAI’19组合图形的面积教学设计
3 ⽬标检测的任务
分类的任务回顾
分类的损失与优化
微粒算法在训练的时候需要计算每个样本的损失,那么CNN做分类的时候使⽤softmax函数计算结果,损失为交叉熵损失
常见CNN模型
成绩管理系统
对于⽬标检测来说不仅仅是分类这样简单的⼀个图⽚输出⼀个结果,⽽且还需要输出图⽚中⽬标的位置信息,所以从分类到检测,如下图标记了过程:

本文发布于:2024-09-21 18:59:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/236707.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:检测   图像   算法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议