深度目标检测模型的边缘计算方案研究

中图分类号:TP183 UDC:621.3学校代码:10004密级:公开
北京交通大学
硕士专业学位论文
深度目标检测模型的边缘计算方案研究Research on Edge Calculation Scheme of Object Detection Model
作者姓名:王梓儒学号:17127085
线性排水沟施工图导师姓名:王奇志职称:副研究员
专业学位:计算机技术学位级别:硕士
毛辊清洗机>消防管道防冻北京交通大学
2020年9月
盛泽坯布网致谢
本论文的工作是在我的导师王奇志老师的悉心指导下完成的,王奇志老师严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来王奇志老师对我的关心和指导。
王奇志老师悉心指导我完成了科研工作,在学习上和生活上都给予了我很大的关心和帮助,在此向王奇志老师表示衷心的谢意。
王奇志老师对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷心的感谢。
摘要
深度学习作为机器学习算法中的一个新兴技术,极大地促进了机器学习的发展,受到了世界各国互联网公司和相关研究人员的关注。但深度学习模型在提供出精度的同时往往也对计算平台有很高的性能要求,加大了平台的存储和运算压力,因此研究如何将大尺寸模型轻量化、提升模型运行速度、减少内存消耗,从而提高算法性能和减少模型吞吐量与运算量,成为近年来的研究热点。由于边缘计算平台具有可移植性、多功能性、高能源效率的特点,现在其正在成为深度学习部署的关键,研究在边缘端高效率的深度学习部署方法具有很强的现实意义。
基于此背景,本文立足于当前深度学习中的计算机视觉目标检测方向,研究目前最优的深度目标检测模型的设计方式和模块结构,并研究轻量化模型的结构设计与模型的轻量化转化方法以及模型的压缩
地下水净化设备
剪枝等计算量缩减方法。针对该研究方向当前的研究痛点,本文基于TensorFlow2.0设计并实现了一个面向边缘计算的单阶段深度目标检测API,基于该API进行了面向边缘计算的神经网络轻量化方案的研究,在研究中将当前前沿的轻量化目标检测网络上进行重设计,成功地在降低计算量的同时提升了网络精度,并将网络进行优化和量化等操作,给出了精度的对比分析。
同时本文在面向边缘计算的不同硬件上进行深度学习的模型部署探索,在包括高性能嵌入式GPU平台,Android平台,消费级ARM平台以及异构芯片平台等多种硬件进行深度目标检测模型的部署研究。在平台框架原生不支持的条件下,进行了针对平台的高效客制化模型算子的实现方法探索,并给出了对比分析,最终针对三种平台给出了四种完整的硬件部署方案。
关键词:神经网络;网络量化;轻量化网络设计;边缘设备
ABSTRACT
As a technology in machine learning algorithms, deep learning has greatly promoted the development of machine learning and has attracted the attention of Internet companies and related researchers from all over the world. However, deep learning models often have high performance requirements for the computing platform while providing excellent accuracy, which increases the storage and computing pressure of the platform. Therefore, we are studying how to reduce the weig
ht of large-size models, improve model operation speed, and reduce memory consumption. Improving the performance of the algorithm and reducing the throughput and calculation of the model has become a research hotspot in recent years. Because the edge computing platform has the characteristics of portability, versatility, and high energy efficiency, it is becoming the key to deep learning deployment. Research on the efficient deep learning deployment method at the edge has strong practical significance.
Based on this background, this thesis is based on the current direction of computer vision target detection in deep learning, researches the current optimal design method and the structure of the deep target detection model, and studies the structural design of lightweight model and lightweight transformation method of the deep target detection model. In response to the current research pain points of this research direction, this thesis designs and implements a single-stage deep target detection API for edge computing based on TensorFlow 2.0. Based on this API, the research on the lightweight scheme of neural network for edge computing is carried out. The current cutting-edge lightweight target detection network is redesigned, and the accuracy of the network is successfully improved while reducing the amount of calculation. The network is optimized and quantified, and a comparative analysis of accuracy is given.
At the same time, we explore the deployment of deep learning models on different hardware for edge computing, and deploys deep detection models on various hardware including high-performance embedded GPU platforms, Android platforms, ARM platforms, and heterogeneous chip platforms. Under the condition that the platform framework isn’t natively supported, the implementation method of the customized model operator for the platform is explored, and a comparative analysis is given. Finally, four complete hardware deployment schemes are given for the three platforms. KEYWORDS:Neural Network; Quantization; Edge devices; Network Optimize
运行网
序言
本论文研究的初衷是导师的课题预研,希望能在用于机器人控制系统的硬件上,同时也能应用上人工智能的前沿成果,因此本论文研究内容中涉及的边缘计算设备主要是区别于大型的高性能计算服务器的嵌入式或者终端设备,类似卡片电脑,便携式移动电脑和智能手机等常见设备。
近年来深度学习发展迅速,各种神经网络模型层出不穷,不断地刷新各种数据集的精度排行榜。而随着精度的提高,自然而然地神经网络的层数也在不断地增加,相对应的模型所占用的存储空间,模型运算所需要的计算量也在不断地增加。所以考虑如何将模型轻量化,提升模型运行速度,减少内存消耗,提高算法性能和减少模型吞吐量与运算量等,也是近年来的研究热门。
自2015年发布了CNNdriod库以来,在刚刚过去的2017年,具有国际影响力的几家大公司也纷纷公布了自家的移动端深度学习框架,例如Facebook的Caffe2,Google的TensorFlow Lite和苹果的Core ML等。Android更是在目前最新的O 版和P版上集成了NNAPI,对边缘设备的深度模型构建已经逐渐趋于成熟。基于此背景,本文注重于深度学习的模型算法落地,针对深度学习中的目标检测模型,希望在低功耗或者较低性能的边缘设备上也能应用上深度学习的前沿结果,对轻量化的目标检测算法模型进行研究并对模型的压缩和优化方法进行研究和应用,在不降低模型的性能或轻微降低模型性能的基础下,降低模型的计算量并将模型应用的低性能的边缘计算设备上。而在研究轻量化模型的同时,也对不同边缘计算的硬件方案进行探索,考虑更多种设备用于深度学习的边缘计算的可能性。学生认为在深度学习应用井喷之时,轻量化实现方案具有很强的现实意义。

本文发布于:2024-09-24 21:19:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/307673.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模型   学习   深度   研究
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议