草庐IT

matutils

全部标签

Python Gensim : how to calculate document similarity using the LDA model?

我有一个经过训练的LDA模型,我想从我训练模型的语料库中计算两个文档之间的相似度得分。在学习了所有Gensim教程和功能之后,我仍然无法理解它。有人可以给我一个提示吗?谢谢! 最佳答案 取决于您要使用的相似度指标。Cosinesimilarity普遍有用&built-in:sim=gensim.matutils.cossim(vec_lda1,vec_lda2)Hellingerdistance对概率分布(例如LDA主题)之间的相似性很有用:importnumpyasnpdense1=gensim.matutils.sparse2f

Python Gensim : how to calculate document similarity using the LDA model?

我有一个经过训练的LDA模型,我想从我训练模型的语料库中计算两个文档之间的相似度得分。在学习了所有Gensim教程和功能之后,我仍然无法理解它。有人可以给我一个提示吗?谢谢! 最佳答案 取决于您要使用的相似度指标。Cosinesimilarity普遍有用&built-in:sim=gensim.matutils.cossim(vec_lda1,vec_lda2)Hellingerdistance对概率分布(例如LDA主题)之间的相似性很有用:importnumpyasnpdense1=gensim.matutils.sparse2f