k-means
2017-04-10 20:34:18 0 举报
k-means是一种常用的聚类算法,其基本思想是将n个数据点划分到k个簇中,使得每个数据点与所属簇的质心距离之和最小。具体步骤如下: 1. 随机选择k个数据点作为初始质心; 2. 将每个数据点分配到距离其最近的质心所在的簇中; 3. 计算每个簇的质心; 4. 重复步骤2和3直到收敛。 k-means算法简单易实现,但存在一些问题,如对初始质心的选择敏感、可能陷入局部最优等。为了解决这些问题,人们提出了许多改进算法,如k-means++、DBSCAN等。