首页 > 专利技术

(目标检测)①数据集的建立(拍摄收集、数据集标注)

（⽬标检测）①数据集的建⽴（拍摄收集、数据集标注）⽬录

这⼀系列的博客将会帮助我⾃⼰（和⼤家）认识并熟悉——如何使⽤YOLO训练⾃定义的数据集，同时如何部署到Windows以及Linux上，下⾯有请我的检测⽬标——拉拉猪！

在建⽴数据集之前，我从⽹络上收集了⼀些资料——关于如何建⽴⼀个有效的数据集，⽐如图像数据集的数量，检测⽬标的位置、⼤⼩、⽅向，甚⾄是光线、背景等等其他因素的影响，⼿机出来的资料我总结如下：

1. 从不同的背景中拍摄不同⾓度⽅向的⽬标图像：图像数据集中，检测的对象必须⾄少有⼀个相似的差不多相同的形状、侧⾯的对象、

相对⼤⼩、旋转⾓度、倾斜、照明……

2. 保证采集的数据的质量，⼤⼩最好和使⽤场景的尺⼨接近，尽量在该场景下采集数据的多样性，尽量采集⾃然场景下的各种各样的照

⽚

3. 数据集的数量越多越好（1000+/2000+），普遍来说，应该是有2000+，训练迭代2000+或更多

4. 数据集中既要包括想要检测的物体，也要包括不想检测的物体，但是标注的话只标注想要检测的物体

5. 如果是多个类检测的话，那么各个⽬标检测的类在你的数据中出现的次数差不多

6. ⽬标所被标记部分是按照你希望如何被检测到的⽅式去标记（⽐如只检测⼀半、可重叠区域、⽐整个物体⼤⼀点……）

7. 确保要检测的每个对象在训练集中都被标记

8. 制作数据集你可以通过爬⾍的⽅式来获取图像，也可以拍摄⼀段视频然后截取包含⽬标的图像

如何采集数据9. 可以通过图像增强的⽅法来提升数据集的数量

⼀、拍摄收集

（⼀）视频拍摄

从以上的⽅⾯中考虑，我希望制作⼀个数据集：（由于是⼀个⽐较简单的⽬标——图像的数据量在600张左右）背景⼀（桌⾯上）：光线不太强、拍摄较近、拍摄各个⾓度（60s-60张）

背景⼆（拿⼿上）：光纤适合、拍摄各个⾓度（60s-60张）

背景三（被⼦上）：光纤不太强（有阴影）、拍摄各个⾓度、远近结合（60s-60张）

背景四（有⼀个差不多的物体在旁边）：拍摄各个⾓度（60s-60张）

背景五：强光照射、拍摄各个⾓度（60s-60张）

背景六：弱光微射、拍摄各个⾓度（60s-60张）

背景七（稍微变形）：拍摄各个⾓度（60s-60张）

背景⼋（粉⾊背景）：拍摄各个⾓度（60s-60张）

背景九（键盘上）：拍摄较远、拍摄各个⾓度（60s-60张）

于是，我⽤⼿机拍摄了拉拉猪的⼀系列的视频：

（⼆）将MP4⽂件截取出图⽚

需要注意的是：名字要从1开始⼀直往后，如果不是⾃⼰截取的图⽚，那么可以通过看图软件对⽂件名批量修改名称（⽹上说：2345看图王可以）

import cv2

import os

# 视频的帧数为30，那么60s的视频⼀共有1800帧，选择60张照⽚，则选择每隔30帧选⼀张

path_video = "E:/work/VOC2021/videos/拉拉猪 ("

form = ").mp4"

save_pictures = "E:/work/VOC2021/JPEGImages/"

count = 0

for num in range(1,10):

# 视频数量⼀共是9个

path_cv = path_video + str(num) + form

vc = cv2.VideoCapture(path_cv)

i = 0

while vc.isOpened():

rval, img = vc.read()

frame_count = vc.get(cv2.CAP_PROP_FRAME_COUNT) # 视频⽂件的帧数

frame_fps = vc.get(cv2.CAP_PROP_FPS) # 视频⽂件的帧率

if i==frame_count:

break

else:

i=i+1

if i % int(frame_count/60) == 0: #选取60照⽚

count = count + 1

# 图⽚命名及保存路径

filename=str(count)+".jpg"

cv2.imwrite(save_pictures+filename,img)

print("第{}个视频截取图⽚完毕！".format(num))

# 释放资源

cv2.destroyAllWindows()

注意：图⽚保存的位置不能有中⽂字符，否则⽣成的图⽚将不到

最后的结果如下：

然后建⽴如下所⽰的⽂件⽬录结构：

VOC：Visual Object Classes

⼆、数据集标注

接下来就是对541张照⽚进⾏图⽚标注了，这⼀步⼀张图⽚都不能少，我们所⽤的软件是LabelImg

软件分享：

界⾯：

1、打开图⽚所在的⽂件夹

2、修改输出⽂件夹

本文发布于:2024-09-23 10:18:40，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/3/387938.html

上一篇：合格评定功能法的确定活动

下一篇：App违法违规收集使用个人信息的分析与解读

标签：数据拍摄检测图像

留言与评论（共有 0 条评论）