k-means聚类算法
2020-11-10 13:49:32 4 举报
k-means聚类算法是一种常用的无监督学习算法,主要用于数据的分类和分组。该算法的主要思想是将n个数据点分配到k个聚类中,使得每个数据点都属于离它最近的均值(即聚类中心)对应的聚类,以此来最小化聚类内部的方差。k-means算法的核心步骤包括:随机选择k个数据点作为初始的聚类中心;然后,将剩余的每个数据点分配给最近的聚类中心,形成k个聚类;接着,重新计算每个聚类的均值(即新的聚类中心);最后,如果新的聚类中心与旧的聚类中心相同或者变化很小,那么算法收敛,否则,返回第2步。k-means算法简单易实现,但对于初始聚类中心的选择敏感,可能会陷入局部最优解。
作者其他创作
大纲/内容
计算各个聚类中的平方差,取最小值J作为最佳分类
计算所有数据到值点Oj的欧式距离,并将其归到最近的集合Yj中
随机选择k个数据作为参照点,即集合Y的中心点O
否
距离的计算方法为:dij=min(||Xi-Oj||)span style=\"font-size: inherit;\
是
开始
结束
J = min( )
判断Oj的值是否变化
0 条评论
回复 删除
下一页