当前位置：文江博客话题详情

用于语言建模的交叉熵

发布于 10-20 23:08 字数 166 浏览 10 评论 0原文

我目前正在使用语言建模进行分类任务。该项目的第一部分涉及使用 n-gram 语言模型来使用 c5.0 对文档进行分类。该项目的最后部分要求我使用交叉熵对每个类进行建模，并根据这些模型对测试用例进行分类。

有谁有使用交叉熵的经验，或者有关如何使用交叉熵模型进行数据采样的信息的链接？任何信息都会很棒！谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

野稚2024-10-27 23:08:07

您可以在各种教科书上获得有关将交叉熵与语言模型结合使用的理论背景，例如 Jurafsky 和 Jurafsky 的“语音和语言处理”。马丁，第 2 版第 116-118 页。
至于具体用法，在大多数语言建模工具中，交叉熵不是直接测量的，而是测量“困惑度”，即交叉熵的指数。反过来，困惑度可以用来对文档进行分类。例如，请参阅 SLM 中命令“evallm”的文档，卡内基-梅隆大学语言建模工具 (http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html)

祝你好运:)

回复收藏 0 原文

~没有更多了~