KNN和K-means的区别

knn

算法思路：

如果⼀个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的⼤多数属于某⼀个类别，则该样本也属于这个类别。

k近邻模型的三个基本要素：

实战能力

1. k值的选择：k值的选择会对结果产⽣重⼤影响。较⼩的k值可以减少近似误差，但是会增加估计误差；较⼤的k值可以减⼩估计误差，

苏宁猝死

但是会增加近似误差。⼀般⽽⾔，通常采⽤交叉验证法来选取最优的k值。

2. 距离度量：距离反映了特征空间中两个实例的相似程度。可以采⽤欧⽒距离、曼哈顿距离等。

3. 分类决策规则：往往采⽤多数表决。

k-means

算法步骤：

庄荣昌1. 从n个数据中随机选择 k 个对象作为初始聚类中⼼；

2. 根据每个聚类对象的均值（中⼼对象），计算每个数据点与这些中⼼对象的距离；并根据最⼩距离准则，重新对数据进⾏划分；

3. 重新计算每个有变化的聚类簇的均值，选择与均值距离最⼩的数据作为中⼼对象；

4. 循环步骤2和3，直到每个聚类簇不再发⽣变化为⽌。湖州黄萌>金哲夫

k-means⽅法的基本要素：

1. k值的选择：也就是类别的确定，与K近邻中k值的确定⽅法类似。

2. 距离度量：可以采⽤欧⽒距离、曼哈顿距离等。

文史天地

KNN K-Means

1.KNN是分类算法

2.监督学习

3.喂给它的数据集是带label的数据，已经是完全正确的数据1.K-Means是聚类算法

2.⾮监督学习

3.喂给它的数据集是⽆label的数据，是杂乱⽆章的，经过聚类后才变得有点顺序，先⽆序，后有序

没有明显的前期训练过程，属于memory-based

learning有明显的前期训练过程

K的含义：来了⼀个样本x，要给它分类，即求出它的y，就从数据集中，在x附近离它最近的K个数据点，这K个数据点，类别c占的个数最多，就把x的label设为c K的含义：K是⼈⼯固定好的数字，假设数据集合可以分为K个簇，由于是依靠⼈⼯定好，需要⼀点先验知识

本文发布于:2024-09-22 17:23:11，感谢您对本站的认可！

标签：数据距离聚类对象

留言与评论（共有 0 条评论）