登录免费注册

首页  流程图  详情

基于Spark的K-means算法实现流程

2017-04-17 23:25:23   0  举报





仅支持查看

基于Spark的K-means算法实现流程如下：首先，初始化K个中心点；然后，将数据划分为K个簇，每个数据点分配到最近的中心点所在的簇；接着，计算每个簇内数据点的均值，更新中心点位置；重复上述步骤，直到中心点不再发生变化或达到最大迭代次数。最后，返回K个簇及其对应的中心点。

作者其他创作

大纲/内容

No

开始

Reduce全局聚类并更新聚类中心

结束

输出聚类结果

将数据对象Map到最相似的类簇中心

读取数据集并创建RDD

聚类是否收敛？

Yes

数据对象向量化并Cache入缓存

随机选取K个初始聚类中心

 收藏

立即使用

 收藏

立即使用

图1、文本聚类分析整体流程

基于Spark的K-means算法实现流程

 收藏

立即使用

基于Spark的K-means算法实现流程

 收藏

立即使用

K-means算法流程

职业：暂无













评论

0 条评论

下一页

为你推荐

查看更多



k-means聚类算法

K-means算法流程图

基于PHP的教室预约管理系统的设计与实现

基于PHP的教室预约管理系统的设计与实现

基于SpringBoot的旅游网站的设计与实现

基于SpringBoot的旅游网站的设计与实现

K-Means流程图

K-Means算法流程图

4-4K-MEANS算法流程