一种数据采样方法及装置[发明专利]

专利名称:一种数据采样方法及装置
专利类型:发明专利
发明人:周博言,崔权,宋仁杰,赵博睿,陈钊民,谢烟平,魏秀参申请号:CN201910911876.4
申请日:20190925
公开号:CN110717529A
公开日:
20200121
专利内容由知识产权出版社提供
摘要:本发明涉及图像识别技术领域,解决目前解决训练数据集存在长尾问题的数据采样方法,从网络训练开始至结束,每一次网络训练过程中,训练样本相同,进而导致网络对特征学习不全面的问题,本发明提供一种数据采样方法及装置,该方法包括:获取网络当前迭代轮次;基于网络当前迭代轮次及每类样本的样本数,更新每类样本的样本权重,其中,随着所述网络当前迭代轮次的增加,尾部类样本权重逐步增加;根据更新后的每类样本的样本权重,采样符合预设条件的样本,作为目标样本。通过网络迭代轮次的增加,训练数据集中的样本权重均增加,但是尾部类样本权重增加幅度大,尾部类样本被选择为训练样本的概率增加,可有效缓解从长尾问题,网络特征学习效果好。
申请人:南京旷云科技有限公司,徐州旷视数据科技有限公司,北京旷视科技有限公司
地址:210046 江苏省南京市经济技术开发区兴智路兴智科技园A栋15层
国籍:CN
代理机构:北京钲霖知识产权代理有限公司

本文发布于:2024-09-20 19:51:35,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/778740.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:样本   数据   网络   增加   采样   训练
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议