诗穷而后工
KNN 算法的全称是K-Nearest Neighbor,中⽂为K 近邻算法,它是基于距离的⼀种算法,简单有效。马弗罐
KNN 算法即可⽤于分类问题,也可⽤于回归问题。
1,准备电影数据
假如我们统计了⼀些电影数据,包括电影名称,打⽃次数,接吻次数,电影类型,如下: 电影名称打⽃次数接吻次数电影类型⿊客帝国1156动作⽚ 功夫1098动作⽚
战狼1209动作⽚台风中心
恋恋笔记本578爱情⽚
阈值效应>反物质世界
泰坦尼克号660爱情⽚
花样年华869爱情⽚
可以看到,电影分成了两类,分别是动作⽚和爱情⽚。
2,⽤KNN 算法处理分类问题
如果现在有⼀部新的电影A,它的打⽃和接吻次数分别是80 和7,那如何⽤KNN 算法对齐进⾏分类呢?
我们可以将打⽃次数作为X 轴,接吻次数作为Y 轴,将上述电影数据画在⼀个坐标系中,如下:
刷镀工艺
关于如何⽤Python 画图,可以参考⽂章《如何使⽤Python 进⾏数据可视化》
通过上图可以直观的看出,动作电影与爱情电影的分布范围是不同的。