使用 Lingpipe 进行词级语言模型

发布于 2024-12-13 18:26:33 字数 207 浏览 3 评论 0原文

我一直在尝试让单词级语言模型在 lingpipe 上工作。我遇到的所有示例和教程都展示了字符-n-语法模型。如何使用 lingpipe 训练单词级模型，然后使用该模型在其他文档上进行测试？

此外，我注意到 TokenizedLM 不可序列化。有没有办法可以保存它并稍后加载，而不必每次都进行重新训练？

最后，是否有任何其他框架/工具可以让我无需任何编码即可完成此操作？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不再见 2024-12-20 18:26:33

我不了解 Java，但如果您不局限于该编程语言，可以使用 Python NLTK，其中有分词器和ngram-models 和很多 < a href="http://nltk.googlecode.com/svn/trunk/doc/api/nltk-module.html" rel="nofollow">其他内容。还有一本书，可以用作介绍和学习获得概览。