4-4K-MEANS算法流程
2015-04-02 10:04:58 14 举报
4-4K-MEANS算法是一种基于划分的聚类方法,其流程如下: 1. 随机选择4个初始聚类中心; 2. 将每个数据点分配到距离其最近的聚类中心所代表的簇中; 3. 对于每个簇,计算其所有数据点的均值,并将该均值设置为新的聚类中心; 4. 如果新的聚类中心与旧的聚类中心相同,则停止迭代;否则,返回步骤2。 这种方法可以有效地处理大规模的数据集,并且具有较高的可扩展性和稳定性。它的缺点是需要预先指定聚类簇的数量,而且可能会陷入局部最优解。
作者其他创作
大纲/内容
从文件中读取对象
其他每个对象找到最近的簇中心
如果其成员的变化,则为每个数据对象y增加1
y/N是否大于阈值
while循环
开始
选取初始的K个对象作为原始的簇中心
输出聚类结果
否
是
平均新的簇中心使用集群内的对象
0 条评论
下一页