LDA
2017-02-06 20:55:53 0 举报
LDA(Latent Dirichlet Allocation)是一种主题模型,它可以将文档集中的每篇文档的主题以概率分布的形式给出。同时,它是一种三层贝叶斯概率模型,包含词、主题和文档三层结构。 LDA的基本思想是:每篇文档可以看作由多个主题混合而成,而每个主题又可以看作是由多个词混合而成。因此,给定一个文档集合,我们的目标是找出每个文档的主题分布以及每个主题的词分布。 为了实现这一目标,LDA采用了一种迭代的方法,即先随机给文档中的每个词分配一个主题,然后根据文档中词的共现信息不断更新主题分布和词分布,直到收敛为止。
作者其他创作
大纲/内容
词语
Φ
RPC trace application
remove noisy nodes
文档
θ
n1 n2 n3 n4 n5 n7 n8
verticaldirection
time interval
Horizontal direction
C
主题
n1 n2 ……n1030min RPC
×
n1 n2 n3 n4 n5n6 n7 n8
n1 n2 ……n1560min RPC
delete noisy RPC
extend time
=
mark timestamp
0 条评论
回复 删除
下一页