如何使用 gensim 包用一组种子词初始化 LDA

发布于 2024-10-29 00:29:55 字数 62 浏览 5 评论 0原文

我读过几篇论文,其中他们实际上使用 LDA 的种子词集来初始化参数。有谁知道这在 gensim 包中怎么可能?

I have read several papers in which they actually initialize parameteres using a seed set of words for LDA. does anyone know how is this possible in gensim package?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

说不完的你爱 2024-11-05 00:29:55

为了完整起见,请复制并粘贴 gensim 邮件列表回复 :

使用现有文档进行播种是 gensim 某些版本的一部分
返回,在直接从 LDA-C 移植的代码中。本来是为了
提高收敛性(尽管最终的收敛结果是
相同)。

在最近的版本中,该代码被更高效的代码所取代
不再使用播种的算法。这是一个在线(小批量)
算法,所以你可以说它自动“播种”,以更
原则性的方式。

For the sake of completeness, copy&paste from the gensim mailing list reply:

Seeding with existing documents was a part of gensim some versions
back, in the code that was directly ported from LDA-C. It was meant to
improve convergence (although the final, converged result was the
same).

In recent versions, that code was replaced by a more efficient
algorithm which doesn't use seeding anymore. It is an online (mini-batch)
algorithm, so you could say it does "seeding" automatically, in a more
principled manner.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文