(目标检测)①数据集的建立(拍摄收集、数据集标注)

(⽬标检测)①数据集的建⽴(拍摄收集、数据集标注)⽬录
这⼀系列的博客将会帮助我⾃⼰(和⼤家)认识并熟悉——如何使⽤YOLO训练⾃定义的数据集,同时如何部署到Windows以及Linux上,下⾯有请我的检测⽬标——拉拉猪!
在建⽴数据集之前,我从⽹络上收集了⼀些资料——关于如何建⽴⼀个有效的数据集,⽐如图像数据集的数量,检测⽬标的位置、⼤⼩、⽅向,甚⾄是光线、背景等等其他因素的影响,⼿机出来的资料我总结如下:
1. 从不同的背景中拍摄不同⾓度⽅向的⽬标图像:图像数据集中,检测的对象必须⾄少有⼀个相似的差不多相同的形状、侧⾯的对象、
相对⼤⼩、旋转⾓度、倾斜、照明……
2. 保证采集的数据的质量,⼤⼩最好和使⽤场景的尺⼨接近,尽量在该场景下采集数据的多样性,尽量采集⾃然场景下的各种各样的照
3. 数据集的数量越多越好(1000+/2000+),普遍来说,应该是有2000+,训练迭代2000+或更多
4. 数据集中既要包括想要检测的物体,也要包括不想检测的物体,但是标注的话只标注想要检测的物体
5. 如果是多个类检测的话,那么各个⽬标检测的类在你的数据中出现的次数差不多
6. ⽬标所被标记部分是按照你希望如何被检测到的⽅式去标记(⽐如只检测⼀半、可重叠区域、⽐整个物体⼤⼀点……)
7. 确保要检测的每个对象在训练集中都被标记
8. 制作数据集你可以通过爬⾍的⽅式来获取图像,也可以拍摄⼀段视频然后截取包含⽬标的图像
如何采集数据9. 可以通过图像增强的⽅法来提升数据集的数量
⼀、拍摄收集
(⼀)视频拍摄
从以上的⽅⾯中考虑,我希望制作⼀个数据集:(由于是⼀个⽐较简单的⽬标——图像的数据量在600张左右)背景⼀(桌⾯上):光线不太强、拍摄较近、拍摄各个⾓度(60s-60张)
背景⼆(拿⼿上):光纤适合、拍摄各个⾓度(60s-60张)
背景三(被⼦上):光纤不太强(有阴影)、拍摄各个⾓度、远近结合(60s-60张)
背景四(有⼀个差不多的物体在旁边):拍摄各个⾓度(60s-60张)
背景五:强光照射、拍摄各个⾓度(60s-60张)
背景六:弱光微射、拍摄各个⾓度(60s-60张)
背景七(稍微变形):拍摄各个⾓度(60s-60张)
背景⼋(粉⾊背景):拍摄各个⾓度(60s-60张)
背景九(键盘上):拍摄较远、拍摄各个⾓度(60s-60张)
于是,我⽤⼿机拍摄了拉拉猪的⼀系列的视频:
(⼆)将MP4⽂件截取出图⽚
需要注意的是:名字要从1开始⼀直往后,如果不是⾃⼰截取的图⽚,那么可以通过看图软件对⽂件名批量修改名称(⽹上说:2345看图王可以)
import cv2
import os
# 视频的帧数为30,那么60s的视频⼀共有1800帧,选择60张照⽚,则选择每隔30帧选⼀张
path_video = "E:/work/VOC2021/videos/拉拉猪 ("
form = ").mp4"
save_pictures = "E:/work/VOC2021/JPEGImages/"
count = 0
for num in range(1,10):
# 视频数量⼀共是9个
path_cv = path_video + str(num) + form
vc = cv2.VideoCapture(path_cv)
i = 0
while vc.isOpened():
rval, img = vc.read()
frame_count = vc.get(cv2.CAP_PROP_FRAME_COUNT)  # 视频⽂件的帧数
frame_fps = vc.get(cv2.CAP_PROP_FPS)  # 视频⽂件的帧率
if i==frame_count:
break
else:
i=i+1
if i % int(frame_count/60) == 0:  #选取60照⽚
count = count + 1
# 图⽚命名及保存路径
filename=str(count)+".jpg"
cv2.imwrite(save_pictures+filename,img)
print("第{}个视频截取图⽚完毕!".format(num))
# 释放资源
cv2.destroyAllWindows()
注意:图⽚保存的位置不能有中⽂字符,否则⽣成的图⽚将不到
最后的结果如下:
然后建⽴如下所⽰的⽂件⽬录结构:
VOC:Visual Object Classes
⼆、数据集标注
接下来就是对541张照⽚进⾏图⽚标注了,这⼀步⼀张图⽚都不能少,我们所⽤的软件是LabelImg
软件分享:
界⾯:
1、打开图⽚所在的⽂件夹
2、修改输出⽂件夹

本文发布于:2024-09-23 10:18:40,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/387938.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   拍摄   检测   图像
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议