K-means算法流程
2017-04-17 23:15:01 0 举报
K-means算法是一种基于划分的聚类方法,其流程如下: 1. 初始化:选择K个初始聚类中心。 2. 分配:将每个样本点分配到最近的聚类中心所代表的簇中。 3. 更新:重新计算每个簇的平均值,并将其作为新的聚类中心。 4. 判断:如果聚类中心不再发生变化,或者达到预设的最大迭代次数,则停止迭代;否则,返回第2步。 5. 输出:输出每个样本点所属的簇以及每个簇的中心。 K-means算法简单、高效,适用于处理大数据集。但是,它对初始聚类中心的选择敏感,可能会收敛到局部最优解。此外,该算法假设数据是球形分布的,对于非球形分布的数据效果不佳。
作者其他创作
大纲/内容
结束
开始
待分配的数据对象是否为空?
是
否
K个质心变化是否低于阈值?
随机选取K个数据为聚类中心
计算心的类簇质心
输入聚类个数K和数据集D
选择一个待分配数据对象,根据最小距离分配到最近簇。
0 条评论
下一页