如何在各个主题中计算出伯尔图类的主题下的每个文档概率?
我正在尝试使用 bertopic 来分析文档的主题分布,在执行 bertopic 之后,我想计算每个文档中各个主题下的概率,我应该如何做它? # define model mode…
如何测量Sklearn LDA模型(非Gensim LDA模型)中的相干性?
我尝试使用两种技术,但是我得到的结果不同。我只想确定要去哪一个。 方法1: 我尝试使用 from tmtoolkit.topicmod.evaluate import metric_coherence…
面对属性:' int'对象没有属性' toarray'在主题建模中
我正在尝试使用LSA进行主题建模,并使用以下代码进行: 在下一行中,我有一个错误: top_n_words_lsa = get_top_n_words(10, lsa_keys, small_documen…
有没有办法检查一个单词将在哪个主题中?
我已经使用Gensim的LDA主题建模来创建6个主题。但是现在,我想说一个词,看看哪个主题会属于。这可能吗?如果是这样,哪种方法? ex。 输入Word('Fit…
如何使用Scikit-Learn找到LDA中最佳的主题?
我正在通过Scikit-Learn与此脚本计算主题模型(我是从“ DF”开始的,该数据集“ DF”在“文本”中的每个行中有一个文档), from sklearn.decomposit…
主题模块 - 计算Sklearn LDA模型的相干得分?
我尝试了几种方法来计算 sklearn LDA 模型的一致性分数,但没有成功。计算 sklearn LDA 模型的一致性分数的方法是什么? 当我使用标准 gensim 代码计…
.rect_dendrogram(dend, k = k, Palette = rect_border, rect_fill = rect_fill, 中的错误:k 必须介于 2 和 97 之间
我正在尝试在R中估算R中的簇树状图,以估算我制作的98个主题的结构主题模型。 我首先运行以下效果很好: res.hc <- eclust(scale(out_corr$cor), "hcl…
使用Gensim软件包的Pyldavis-ldamodel()用于主题建模的可视化
我尝试使用 pyldavis gensim 库创建主题建模,现在集群已完成。我有一个同样的问题。制作的簇是从边缘切下来的。有问题还是没问题? 类似的示例图为:…
使用主题建模或另一种NLP方法,是否可以定义一个单词,这些单词进入主题/类别以获得更好的定义主题模型?
我有一个问题,我正在使用主题建模并考虑LDA&amp;然而,LSA方法发现,某些主题并未像我喜欢的那样准确地定义。是否可以将单词定义为主题以帮助机器学…
萨格人笔记本中的模型推断期间的Unicode错误
我正在对 Sagemaker 笔记本中训练的模型进行推理。我在传递输入时收到 Unicode 错误。 在部署之前,我尝试了以下方法并且它有效 - 使用 input_fn 处理…
没有分配概率的 GENSIM LDA 主题
我正在使用 LDA 来发现 BOW 数据集中的主题。当我测试 GENSIM 库的安装时,我发现他们网站上的示例结果没有问题( https://radimrehurek.com/gensim/m…