基于聚类过采样与实例硬度阈值的数据重采样方法[发明专利]

专利名称:基于聚类采样与实例硬度阈值的数据重采样方法专利类型:发明专利
发明人:殷茗,马怀宇,朱奎宇,张小港,高存志
申请号:CN202010949329.8
申请日:20200910
公开号:CN112115992A
公开日:
20201222
专利内容由知识产权出版社提供
摘要:本发明提供了一种基于聚类过采样与实例硬度阈值的数据重采样方法。首先,利用
K‑means方法对数据集进行聚类处理,并对聚类进行过滤处理和采样权重分配;接着,采用SMOTE 算法对数据集进行过采样,生成新的数据使数据集中少数类与多数类样本数量相等,数据集变为类平衡;最后,采用实例硬度阈值算法对数据进行清理,得到最终平衡且噪点较少的数据集。本发明可以将类不平衡数据集处理为平衡数据集,提高分类器对少数类样本的预测性能。
申请人:西北工业大学
地址:710072 陕西省西安市友谊西路127号
国籍:CN
代理机构:西北工业大学专利中心
代理人:常威威

本文发布于:2024-09-21 18:55:25,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/401864.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   采样   专利   进行   聚类
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议