小水滴真的是太可爱了吧

【数据分析与挖掘】【数据分析学习笔记day19】聚类模型 -- K-Means介绍+聚类模型+K-Means+ K-Means算法 +算法思想+ 算法描述+优缺点

【数据分析与挖掘】

linux(1) mysql(1) python(2) 【Excel】(1) 【Lambda大数据开发】(51) 【Linux基础与高级】(49) 【PhotoShop】(4) 【Python基础与提高】(47) 【Python工程师面试题】(6) 【Web后端】(19) 【产品经理专栏】(2) 【前端】(95) 【力扣面试刷题】(12) 【吴恩达机器学习】(34) 【吴恩达深度学习】(31) 【小问题解决】(27) 【数据产品】(2) 【数据分析岗位面试】(25) 【数据库】(62) 【数据结构与算法专栏】(45) 【新冠病毒】(2) 【机器学习与深度学习】(165) 【爬虫】(68) 【网络基础与高级】(57) 【面向对象】(14) 产品技能(1) 数据挖掘竞赛(8) 题解(1)

/ 注册

【数据分析学习笔记day19】聚类模型 -- K-Means介绍+聚类模型+K-Means+ K-Means算法 +算法思想+ 算法描述+优缺点

980 浏览 0 回复 2020-09-22

小水滴真的是太可爱了吧

+关注

文章目录

聚类模型：K-Means

聚类模型：K-Means

聚类（clustering）属于无监督学习（unsupervised learning）
无类别标记
在线 demo：http://syskall.com/kmeans.js

K-Means算法

数据挖掘十大经典算法之一
算法接收参数k；然后将样本点划分为k个聚类；同一聚类中的样本相似度较高；不同聚类中的样本相似度较小

算法思想：

以空间中k个样本点为中心进行聚类，对最靠近它们的样本点归类。通过迭代的方法，逐步更新各聚类中心，直至达到最好的聚类效果

算法描述：

选择k个聚类的初始中心
在第n次迭代中，对任意一个样本点，求其到k个聚类中心的距离，将该样本点归类到距离最小的中心所在的聚类
利用均值等方法更新各类的中心值
对所有的k个聚类中心，如果利用2,3步的迭代更新后，达到稳定，则迭代结束。

优缺点：

优点：速度快，简单
缺点：最终结果和初始点的选择相关，容易陷入局部最优，需要给定k值

举报

收藏

赞 1

评论加载中...