prefixspan
2016-05-05 20:12:37 0 举报
PrefixSpan是一种用于关联规则挖掘的算法,它基于Apriori算法的思想,但是使用了更高效的策略。该算法通过迭代地扩展频繁项集来发现所有的强关联规则,同时使用前缀树数据结构来存储和检索频繁项集。PrefixSpan算法的主要优点是其高效性,因为它不需要生成大量的候选项集,而是直接在原始数据上进行操作。此外,PrefixSpan还可以处理大型数据集和高维数据,并且可以很容易地与其他机器学习算法结合使用。总之,PrefixSpan是一种强大而灵活的关联规则挖掘算法,适用于各种类型的数据集和应用场景。
作者其他创作
大纲/内容
扫描数据库中每个序列对每个元素进行排列,删除不满足阈值的元素
找出每个元素作为前缀的后缀,分别形成一个新的投影数据库
是否还有没有进行遍历的前缀
结束
输出该前缀与其投影数据库
更换为该前缀
否
是
是否还有其他后缀
扫描一个前缀对应的投影数据库
开始
新的前缀是否满足阈值
形成新的前缀对应的投影数据库
扫描该投影数据库
将投影数据库其中一个后缀加入前缀中
0 条评论
下一页