当前位置：文江博客话题详情

用于词性标注器的 Baum-Welch 算法

发布于 2024-10-20 15:28:17 字数 112 浏览 15 评论 0原文

每个人。我正在使用 Baum-Welch 算法来训练词性标注器，它完全是无监督的方式。问题来了：当我得到标签结果时，我只得到一个数字序列。我不知道哪个标签代表 VV、NN、DT。我该如何解决这个问题？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

酒中人 2024-10-27 15:28:17

一般来说，没有办法做到这一点。鲍姆-韦尔奇将找到具有相似分布的单词使用类别，但没有特别的理由假设这些类别将以任何直接的方式映射到任何特定语言理论所提出的类别。因此，无监督词性标注器主要适用于您关心单词或短语的等价类但不关心分配的特定标签的应用程序。

不过，如果您确实需要人类可读的标签（例如，在开发过程中，评估您得到的结果是否可信），我会手动标记几十个句子。然后，您可以将 BW 派生的标记器应用到已标记的迷你语料库，以诱导类编号和 POS 标签之间的映射。

回复收藏 0 原文

~没有更多了~

关于作者

等待我真够勒

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

用于词性标注器的 Baum-Welch 算法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

浪子阿飞

JK.Yang

人间不值得

静待花开

只涨不跌

污浊的双黑

友情链接

用于词性标注器的 Baum-Welch 算法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

浪子阿飞

JK.Yang

人间不值得

静待花开

只涨不跌

污浊的双黑

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。