G06K9/00 G06N3/08
1.一种基于SSD的障碍物识别方法,其特征在于:
步骤一,收集的用于训练神经网络的数据,其特征为无固定大小的RGB图像,该应用的图像是有内容(或称为障碍物的物体)的;
步骤二,人工将图像中的障碍物进行标记,其特征在于标记框的长方形且无旋转,且只有一个类别(障碍物类别);
步骤三,将收集的图像数据作为神经网络的输入,其输出与标记框进行比对并产生一个差离值,通过一个给定的函数进行运算,其特征在于在SSD给定的函数运算基础上,添加自行采集的数据,建立机器学习模式,培育神经网络的感知能力;
步骤四,本发明具备结果输出能力,其特征在于:使用已在COCO数据集上训练成熟的神经网络,叠加本发明前面步骤所采集的训练数据,使神经网络具备识别障碍物的能力并将结果输出;
步骤五,本发明可通过多种设备输出结果,其特征在于,本发明是一个应用软件,可根据不同显示设备的接口,定制显示方式,将训练结束的神经网络使用到设备上。
本发明属于计算机视觉以及人工智能领域,涉及一种障碍物检测方法,具体涉及一种基于SSD的障碍物检测方法。
目前的障碍物检测,主要是使用超声波雷达、激光雷达、双目摄像头等设备,去感知周围的3D空间,从而检测到障碍物。这些方法需要复杂且昂贵的器材去实现障碍物识别的目的。已有的通过卷积神经网络去识别障碍物的方法,针对每一类别的障碍物都需要大量的数据,并且,这些神经网络往往存在潜在的问题:基于R-CNN的传统目标检测方法,在分析图像的时候非常缓慢;基于YOLO的方法在不同尺度的物体上泛化能力不够完善,以及较小的目标容易被忽略(由于其每个格子只能有一定数量的预测)。
SSD很好的解决了R-CNN与YOLO的短板,其在拥有比R-CNN更快的速度以及比YOLO更好的泛化能力的同时,保证了较小的目标不被忽略。基于SSD的障碍物检测同时能够更精准地检测目标物体。相比起YOLO,SSD在识别的精准度方面,有绝对的优势。此外,使用SSD可以将硬件的要求降低至一个摄像头以及一个处理模块,舍去了专业器材,使得大众用户能够得益于障碍物检测。由于此障碍物检测只使用一个标签,训练后的神经网络能够在数据量不多的情况下获得足够精准的检测。
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于SSD的障碍物检测方法,用以合理准确地检测障碍物。本发明所指的障碍物检测方法可用于自动驾驶和老年人、病人无人看护时的行动保护设备。
为实现上述目的及其他相关目的,本发明提供一种基于SSD的障碍物检测方法。
一种基于SSD的障碍物检测方法,所述基于SSD的障碍物检测方法包括:
步骤一,收集的用于训练神经网络的数据,其特征为无固定大小的RGB图像,该应用的图像是有内容(或称为障碍物的物体)的。
步骤二,人工将图像中的障碍物进行标记,其特征在于标记框的长方形且无旋转,且只有一个类别(障碍物类别)。
步骤三,将收集的图像数据作为神经网络的输入,其输出与标记框进行比对并产生一个差离值,通过一个给定的函数进行运算,其特征在于在SSD给定的函数运算基础上,添加自行采集的数据,建立机器学习模式,培育神经网络的感知能力。
步骤四,本发明具备结果输出能力,其特征在于:使用已在COCO数据集上训练成熟的神经网络,叠加本发明前面步骤所采集的训练数据,使神经网络具备识别障碍物的能力并将结果输出。
步骤五,本发明可通过多种设备输出结果,其特征在于,本发明是一个应用软件,可根据不同显示设备的接口,定制显示方式,将训练结束的神经网络使用到设备上。
如上所述,本发明所述的基于SSD的障碍物检测方法,具有以下有益效果:
SSD拥有比R-CNN类的识别方法更快的速度以及比YOLO更好的泛化能力,也保证了较小的目标不被忽略。基于SSD的障碍物检测同时能够更精准的检测目标物体。相比起YOLO,SSD 在识别的精准度有绝对的优势。使用此方法进行障碍物检测无需使用高昂的激光雷达或者此外,使用SSD可以将硬件的要求降低至一个摄像头以及一个处理模块,舍去了专业器材,使得大众用户能够得益于障碍物检测。由于此障碍物检测只使用一个标签,训练后的神经网络能够在数据量不多的情况下获得足够精准的检测。
图1为基于SSD的障碍物检测方法的流程图
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
实施例一:为盲人提供步行时障碍物检测和提示
本实施例提供一种基于SSD的障碍物检测方法,该方法尽可能的检测到所有的障碍物及其精确的定位这些障碍物,包括以下步骤:
步骤一,收集的用于训练神经网络的数据,其特征为无固定大小的RGB图像,该应用的图像是有内容(或称为障碍物的物体)的。
步骤二,人工将图像中的障碍物进行标记,其特征在于标记框的长方形且无旋转,且只有一个类别(障碍物类别)。
步骤三,将收集的图像数据作为神经网络的输入,其输出与标记框进行比对并产生一个差离值,通过一个给定的函数进行运算,其特征在于在SSD给定的函数运算基础上,添加自行采集的数据,建立机器学习模式,培育神经网络的感知能力。
步骤四,本发明具备结果输出能力,其特征在于:使用已在COCO数据集上训练成熟的神经网络,叠加本发明前面步骤所采集的训练数据,使神经网络具备识别障碍物的能力并将结果输出。
步骤五,将训练结束的神经网络导出至手机。
步骤六,制作辅助盲人行走的APP以获取手机摄像头的RGB图像信息。
步骤七,将获得的RGB图像信息作为神经网络的输入,获取神经网络的输出。
步骤八,将神经网络的输出转化为图像中的坐标并判断是否需要提醒用户。
因此,本实例将本发明用于辅助盲人行走并协助盲人感知前行道路中的障碍物。
所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
本文发布于:2024-09-24 12:20:16,感谢您对本站的认可!
本文链接:https://www.17tex.com/tex/1/73664.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |