一种基于SSD的单类别障碍物识别的检测方法

著录项

申请号 CN201910591757.5
申请日 20190702
公开（公告）号 CN110334646A
公开日 20191015
申请（专利权）人朱恺晗
发明人朱恺晗
主分类号 G06K9/00
分类号
G06K9/00 G06N3/08
地址上海市浦东新区洪山路1889弄2号1302室
国省代码上海(31)

摘要

本发明提供一种基于计算机视觉卷积神经分类网络MobileNetv2作为基础网络结构的Single Shot Multibox Detector(SSD)的单类别障碍物识别的检测方法，该发明将所有物体归类为需要识别的障碍物，使之成为所有目标物体的父类别，从而使得较少的训练数据便可以实现较好的识别结果。利用了SSD对目标的尺度的不敏感的泛化能力以及其相对较快的计算速度，从而达到在计算能力有限的嵌入式计算机系统上拥有良好障碍物检测效果。

权利要求

1.一种基于SSD的障碍物识别方法，其特征在于：

步骤一，收集的用于训练神经网络的数据，其特征为无固定大小的RGB图像，该应用的图像是有内容(或称为障碍物的物体)的；

步骤二，人工将图像中的障碍物进行标记，其特征在于标记框的长方形且无旋转，且只有一个类别(障碍物类别)；

步骤三，将收集的图像数据作为神经网络的输入，其输出与标记框进行比对并产生一个差离值，通过一个给定的函数进行运算，其特征在于在SSD给定的函数运算基础上，添加自行采集的数据，建立机器学习模式，培育神经网络的感知能力；

步骤四，本发明具备结果输出能力，其特征在于：使用已在COCO数据集上训练成熟的神经网络，叠加本发明前面步骤所采集的训练数据，使神经网络具备识别障碍物的能力并将结果输出；

步骤五，本发明可通过多种设备输出结果，其特征在于，本发明是一个应用软件，可根据不同显示设备的接口，定制显示方式，将训练结束的神经网络使用到设备上。

说明书

技术领域

本发明属于计算机视觉以及人工智能领域，涉及一种障碍物检测方法，具体涉及一种基于SSD的障碍物检测方法。

目前的障碍物检测，主要是使用超声波雷达、激光雷达、双目摄像头等设备，去感知周围的3D空间，从而检测到障碍物。这些方法需要复杂且昂贵的器材去实现障碍物识别的目的。已有的通过卷积神经网络去识别障碍物的方法，针对每一类别的障碍物都需要大量的数据，并且，这些神经网络往往存在潜在的问题：基于R-CNN的传统目标检测方法，在分析图像的时候非常缓慢；基于YOLO的方法在不同尺度的物体上泛化能力不够完善，以及较小的目标容易被忽略(由于其每个格子只能有一定数量的预测)。

SSD很好的解决了R-CNN与YOLO的短板，其在拥有比R-CNN更快的速度以及比YOLO更好的泛化能力的同时，保证了较小的目标不被忽略。基于SSD的障碍物检测同时能够更精准地检测目标物体。相比起YOLO，SSD在识别的精准度方面，有绝对的优势。此外，使用SSD可以将硬件的要求降低至一个摄像头以及一个处理模块，舍去了专业器材，使得大众用户能够得益于障碍物检测。由于此障碍物检测只使用一个标签，训练后的神经网络能够在数据量不多的情况下获得足够精准的检测。

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种基于SSD的障碍物检测方法，用以合理准确地检测障碍物。本发明所指的障碍物检测方法可用于自动驾驶和老年人、病人无人看护时的行动保护设备。

为实现上述目的及其他相关目的，本发明提供一种基于SSD的障碍物检测方法。

一种基于SSD的障碍物检测方法，所述基于SSD的障碍物检测方法包括：

步骤一，收集的用于训练神经网络的数据，其特征为无固定大小的RGB图像，该应用的图像是有内容(或称为障碍物的物体)的。

步骤二，人工将图像中的障碍物进行标记，其特征在于标记框的长方形且无旋转，且只有一个类别(障碍物类别)。

步骤三，将收集的图像数据作为神经网络的输入，其输出与标记框进行比对并产生一个差离值，通过一个给定的函数进行运算，其特征在于在SSD给定的函数运算基础上，添加自行采集的数据，建立机器学习模式，培育神经网络的感知能力。

步骤四，本发明具备结果输出能力，其特征在于：使用已在COCO数据集上训练成熟的神经网络，叠加本发明前面步骤所采集的训练数据，使神经网络具备识别障碍物的能力并将结果输出。

如上所述，本发明所述的基于SSD的障碍物检测方法，具有以下有益效果：

SSD拥有比R-CNN类的识别方法更快的速度以及比YOLO更好的泛化能力，也保证了较小的目标不被忽略。基于SSD的障碍物检测同时能够更精准的检测目标物体。相比起YOLO，SSD 在识别的精准度有绝对的优势。使用此方法进行障碍物检测无需使用高昂的激光雷达或者此外，使用SSD可以将硬件的要求降低至一个摄像头以及一个处理模块，舍去了专业器材，使得大众用户能够得益于障碍物检测。由于此障碍物检测只使用一个标签，训练后的神经网络能够在数据量不多的情况下获得足够精准的检测。

图1为基于SSD的障碍物检测方法的流程图

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。

实施例一：为盲人提供步行时障碍物检测和提示

本实施例提供一种基于SSD的障碍物检测方法，该方法尽可能的检测到所有的障碍物及其精确的定位这些障碍物，包括以下步骤：

步骤一，收集的用于训练神经网络的数据，其特征为无固定大小的RGB图像，该应用的图像是有内容(或称为障碍物的物体)的。

步骤二，人工将图像中的障碍物进行标记，其特征在于标记框的长方形且无旋转，且只有一个类别(障碍物类别)。

步骤五，将训练结束的神经网络导出至手机。

步骤六，制作辅助盲人行走的APP以获取手机摄像头的RGB图像信息。

步骤七，将获得的RGB图像信息作为神经网络的输入，获取神经网络的输出。

步骤八，将神经网络的输出转化为图像中的坐标并判断是否需要提醒用户。

因此，本实例将本发明用于辅助盲人行走并协助盲人感知前行道路中的障碍物。

所以，本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。