层次聚类是一种无监督学习方法,它通过计算不同类别数据点间的相似度来创建一棵有层次的、分支的树。这种方法的主要优点是它能生成一个可以解释的分类模型,而且它可以捕捉到数据中复杂的结构。然而,层次聚类的缺点是它需要大量的计算时间,尤其是当处理大规模数据集时。此外,一旦开始聚类过程,就不能轻易地停止并重新开始,这可能会导致结果的不同。因此,层次聚类通常适用于小规模数据集或者作为其他聚类方法的预处理步骤。
第4步
第1步
第2步
第0步
a
c
第3步
DIANA(分裂)
d
AGENES(凝聚)
b
e