小水滴真的是太可爱了吧

【机器学习与深度学习】简单粗暴理解与实现机器学习之聚类算法（三）：聚类算法实现流程、k-means聚类步骤、案例

【机器学习与深...

linux(1) mysql(1) python(2) 【Excel】(1) 【Lambda大数据开发】(51) 【Linux基础与高级】(49) 【PhotoShop】(4) 【Python基础与提高】(47) 【Python工程师面试题】(6) 【Web后端】(19) 【产品经理专栏】(2) 【前端】(95) 【力扣面试刷题】(12) 【吴恩达机器学习】(34) 【吴恩达深度学习】(31) 【小问题解决】(27) 【数据产品】(2) 【数据分析与挖掘】(105) 【数据分析岗位面试】(25) 【数据库】(62) 【数据结构与算法专栏】(45) 【新冠病毒】(2) 【爬虫】(68) 【网络基础与高级】(57) 【面向对象】(14) 产品技能(1) 数据挖掘竞赛(8) 题解(1)

/ 注册

简单粗暴理解与实现机器学习之聚类算法（三）：聚类算法实现流程、k-means聚类步骤、案例

1350 浏览 0 回复 2020-09-22

小水滴真的是太可爱了吧

+关注

聚类算法

文章目录

聚类算法
- 学习目标
6.3 聚类算法实现流程

学习目标

掌握聚类算法实现过程
知道K-means算法原理
知道聚类算法中的评估模型
说明K-means的优缺点
了解聚类中的算法优化方式
应用Kmeans实现聚类任务

6.3 聚类算法实现流程

k-means其实包含两层内容：

K : 初始中心点个数（计划聚类数）

means：求中心点到其他数据点距离的平均值

1 k-means聚类步骤

1、随机设置K个特征空间内的点作为初始的聚类中心
2、对于其他每个点计算到K个中心的距离，未知的点选择最近的一个聚类中心点作为标记类别
3、接着对着标记的聚类中心之后，重新计算出每个聚类的新中心点（平均值）
4、如果计算得出的新中心点与原中心点一样（质心不再移动），那么结束，否则重新进行第二步过程

通过下图解释实现流程：

k聚类动态效果图

2 案例练习

案例：

1、随机设置K个特征空间内的点作为初始的聚类中心（本案例中设置p1和p2）

2、对于其他每个点计算到K个中心的距离，未知的点选择最近的一个聚类中心点作为标记类别

3、接着对着标记的聚类中心之后，重新计算出每个聚类的新中心点（平均值）

4、如果计算得出的新中心点与原中心点一样（质心不再移动），那么结束，否则重新进行第二步过程【经过判断，需要重复上述步骤，开始新一轮迭代】

5、当每次迭代结果不变时，认为算法收敛，聚类完成，K-Means一定会停下，不可能陷入一直选质心的过程。

3 小结

流程:

事先确定常数K，常数K意味着最终的聚类类别数;
首先随机选定初始点为质心，并通过计算每一个样本与质心之间的相似度(这里为欧式距离)，将样本点归到最相似的类中，
接着，重新计算每个类的质心(即为类中心)，重复这样的过程，直到质心不再改变，
最终就确定了每个样本所属的类别以及每个类的质心。

注意:

由于每次都要计算所有的样本与每一个质心之间的相似度，故在大规模的数据集上，K-Means算法的收敛速度比较慢。

举报

收藏

赞

评论加载中...