聚类算法
2021-04-22 10:18:32 0 举报
AI智能生成
聚类算法说明
作者其他创作
大纲/内容
DBSCAN
基本概念
工作流程
特点
K-Means
基本概念
K-Means参数
设定簇的个数(K值)
质心的获取
距离的度量(前提是要标准化)
欧式距离测量法
概念
二维条件
三维条件
多维空间依次类推
使用场景
欧氏距离能够体现个体数值特征的绝对差异,所以更多的用于需要从维度的数值大小中体现差异的分析,如使用用户行为指标分析用户价值的相似度或差异
余弦距离测量法
概念
使用场景
余弦距离更多的是从方向上区分差异,而对绝对的数值不敏感,更多的用于使用用户对内容评分来区分兴趣的相似度和差异,同时修正了用户间可能存在的度量标准不统一的问题(因为余弦距离对绝对数值不敏感)
优化目标
对i-k求最小值
工作流程
1.设置k个簇数,取得初始中心点
2.把每个点划分至相应的簇中
3.依靠算法重新进行中心点计算
4.迭代计算中心点
5.收敛
特点
优势
简单、快速,适合常规数据集
劣势
1.K值难确定
2.复杂度与样本呈线性关系
3.对任意形状的比较难判断簇状
0 条评论
下一页