数据挖掘导论(完整版)

数据挖掘导论(完整版)⼀分类算法
  KNN
  神经⽹络
  ⽀持向量机
    适⽤于⾼维数据
  决策树
    gini系数
    熵系数微型红外摄像机
⼆聚类算法
  K-均值
    基于原型,划分类型
    不适⽤密度差别⼤,形状差异⼤
  DBSCAN
    基于密度
三关联⽅法
  apriori
    剪枝
    ⽀持度
    置信度
  FR-growth
四组合⽅法
  bagging
    原理:有放回抽样,63%
澳大利亚霍顿
胸骨    random forest
  boosting
    原理:迭代,修改权重
五数据预处理
  缺失值
  重复值
鹀属
  异常值 -- 离点
  特征提取(维归约)  -- PCA
  特征选择书籍是全世界的营养品
  离散化&⼆元化  -- 某些分类算法的要求
  变量变换
    标准化 -- 某些算法的要求,KNN
    简单函数变化(log)
天津港劳务发展有限公司四变量特征
  连续/离散
  定量/定性
  nominal 标称、ordinal  序数、internal 区间、 ratio ⽐率

本文发布于:2024-09-25 08:23:32,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/326288.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:算法   形状   变量   原理   完整版   分类   迭代   修改
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议