基于层级树的频繁序列挖掘问题框架
2017-03-08 20:34:43 0 举报
频繁序列挖掘是一种在大规模数据集中寻找出现频率较高的序列模式的任务。基于层级树的频繁序列挖掘问题框架,首先将原始数据集转换为一颗层级树,其中每个节点表示一个项集,树的深度表示项集的长度。然后,通过遍历这颗树,从根节点开始,逐步构建满足最小支持度阈值的频繁序列。在这个过程中,可以使用剪枝策略来减少不必要的计算,提高算法的效率。最后,将找到的频繁序列输出作为结果。这种基于层级树的方法具有较好的扩展性,可以有效地处理大规模数据集中的频繁序列挖掘问题。
作者其他创作
大纲/内容
层级树
频繁序列约束
ID : n
···
ID : 1
map阶段
序列数据集
频繁序列结果
数据集投影
部分频繁序列
频繁序列2:计数
reduce阶段2
频繁序列1:计数
频繁序列m:计数
reduce阶段1
ID : 2
频繁一项集
0 条评论
下一页