LDA
2015-06-16 10:39:35 16 举报
LDA(Latent Dirichlet Allocation)是一种主题模型,它可以将文档集中的每篇文档的主题以概率分布的形式给出。同时,它是一种三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓主题,是某种特定的语义类别,而每个文档则是由不同主题混合而成。LDA模型的基本思想是:每篇文档可以看作是由多个主题混合而成,而每个主题又可以看作是由多个词组成。因此,给定一个文档集合,我们的目标是推断出每个文档中的主题分布以及每个主题中的词分布。LDA模型在自然语言处理、信息检索等领域有着广泛的应用。