KNN和K-means的区别

KNN和K-means的区别
knn
算法思路:
如果⼀个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的⼤多数属于某⼀个类别,则该样本也属于这个类别。
k近邻模型的三个基本要素:
实战能力
1. k值的选择:k值的选择会对结果产⽣重⼤影响。较⼩的k值可以减少近似误差,但是会增加估计误差;较⼤的k值可以减⼩估计误差,
苏宁猝死
但是会增加近似误差。⼀般⽽⾔,通常采⽤交叉验证法来选取最优的k值。
2. 距离度量:距离反映了特征空间中两个实例的相似程度。可以采⽤欧⽒距离、曼哈顿距离等。
3. 分类决策规则:往往采⽤多数表决。
k-means
算法步骤:
庄荣昌1. 从n个数据中随机选择 k 个对象作为初始聚类中⼼;
2. 根据每个聚类对象的均值(中⼼对象),计算每个数据点与这些中⼼对象的距离;并根据最⼩距离准则,重新对数据进⾏划分;
3. 重新计算每个有变化的聚类簇的均值,选择与均值距离最⼩的数据作为中⼼对象;
4. 循环步骤2和3,直到每个聚类簇不再发⽣变化为⽌。湖州黄萌>金哲夫
k-means⽅法的基本要素:
1. k值的选择:也就是类别的确定,与K近邻中k值的确定⽅法类似。
2. 距离度量:可以采⽤欧⽒距离、曼哈顿距离等。
文史天地
KNN K-Means
1.KNN是分类算法
2.监督学习
3.喂给它的数据集是带label的数据,已经是完全正确的数据1.K-Means是聚类算法
2.⾮监督学习
3.喂给它的数据集是⽆label的数据,是杂乱⽆章的,经过聚类后才变得有点顺序,先⽆序,后有序
没有明显的前期训练过程,属于memory-based
learning有明显的前期训练过程
K的含义:来了⼀个样本x,要给它分类,即求出它的y,就从数据集中,在x附近离它最近的K个数据点,这K个数据点,类别c占的个数最多,就把x的label设为c K的含义:K是⼈⼯固定好的数字,假设数据集合可以分为K个簇,由于是依靠⼈⼯定好,需要⼀点先验知识

本文发布于:2024-09-22 17:23:11,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/326079.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   距离   聚类   对象
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议