LDA主题模型结构图
2022-04-11 15:50:53 29 举报
隐含狄利克雷分布 ( Latent Dirichlet Allocation,LDA) [7] 是由Bei等于2003 年提出来的主题模型, 它是一个“文本-主题-词汇”的 三 层贝叶斯概率生成模型,DA模型将概率引入到主题和词汇分布中,概率分布也会随着不同的输入文本进行变化,并且在对词分布和主题的分布考虑时引入了文档-主题多项式分布先验参数α和主题-词多项式分布的先验参数β。该模型假设文本集中存在着K个潜在主题,而每篇文本是K个主题的概率分布,即在单篇文本中,主题z有不同的概率值P(z|d)。同时,主题z可以表达为一元语言模型,即词项的概率分布——词项w拥有一个概率值P(w|z)。LDA模型的概率图模型进行表示见图。
0 条评论
下一页