DBSCAN
2018-04-18 18:51:48 20 举报
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的空间聚类算法,与划分和层次聚类等传统聚类方法不同,它将具有足够高密度的区域划分为簇,并可以发现任意形状的簇。该算法将数据点分为三类:核心点、边界点和噪声点。核心点是指在其邻域内包含超过MinPts数目的其他点;边界点是指落在核心点的邻域内,但不满足MinPts数目要求;噪声点既不是核心点也不是边界点。DBSCAN通过不断扩展核心点的邻域来生长簇,可以有效处理高维数据和异常值。
作者其他创作
大纲/内容
是
标记x及Z中每个点为簇cluidqueue_list=Z中所有未访问点
选取一个未访问点x搜索其eps-邻域,赋值给集合Z
开始
输入:邻域半径eps 邻域点的最小计数minpts 数据集D
|Z|minpts
否
输出标记为某簇或噪声点的集合D
标记y为已访问
|Z|=minpts
对于Z中每个点,标记为cluid对于其中未访问的点加入queue_list
从queue_list中取一个点y搜索其eps-邻域,赋值给集合Z
标记x为已访问cluid=cluid+1
queue_list非空
结束
D中存在未访问点
将D中所有点标记为未访问cluid=1
将x标记为噪声
0 条评论
下一页