专利类型:发明专利
发明人:周博言,崔权,宋仁杰,赵博睿,陈钊民,谢烟平,魏秀参申请号:CN201910911876.4
申请日:20190925
公开号:CN110717529A
公开日:
20200121
专利内容由知识产权出版社提供
摘要:本发明涉及图像识别技术领域,解决目前解决训练数据集存在长尾问题的数据采样方法,从网络训练开始至结束,每一次网络训练过程中,训练样本相同,进而导致网络对特征学习不全面的问题,本发明提供一种数据采样方法及装置,该方法包括:获取网络当前迭代轮次;基于网络当前迭代轮次及每类样本的样本数,更新每类样本的样本权重,其中,随着所述网络当前迭代轮次的增加,尾部类样本权重逐步增加;根据更新后的每类样本的样本权重,采样符合预设条件的样本,作为目标样本。通过网络迭代轮次的增加,训练数据集中的样本权重均增加,但是尾部类样本权重增加幅度大,尾部类样本被选择为训练样本的概率增加,可有效缓解从长尾问题,网络特征学习效果好。 申请人:南京旷云科技有限公司,徐州旷视数据科技有限公司,北京旷视科技有限公司
地址:210046 江苏省南京市经济技术开发区兴智路兴智科技园A栋15层
国籍:CN
代理机构:北京钲霖知识产权代理有限公司