当前位置：文江博客话题详情

如何将更多标记词添加到斯坦福 POS-Tagger 的训练模型中？

发布于 2024-10-31 06:08:48 字数 45 浏览 10 评论 0原文

我在文档中没有找到任何有关向标记器添加更多标记词的内容，特别是双向词。谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

锦爱 2024-11-07 06:08:48

目前，你还不能。模型训练是一项一次性操作。（由于标记器使用考虑上下文和频率的权重，因此事后向其中添加新单词并不是一件容易的事。）

回复收藏 0 原文

鞋纸虽美，但不合脚ㄋ〞 2024-11-07 06:08:48

有一个解决方法。它很丑陋，但应该能解决问题：

建立一个“你的”单词列表
，扫描这些单词的文本，
如果发现任何与 POS 标记自己匹配的单词（NLTK 可以在这里帮助你）
将其提供给斯坦福解析器。

来自：http://www.cs.ucf.edu/courses/cap5636 /fall2011/nltk.pdf
“你也可以给它 POS 标记的文本；解析器将尝试使用
你的标签，如果它们有意义的话。
如果解析器进行标记，您可能想要这样做
您的文本域中存在错误。”

回复收藏 0 原文

~没有更多了~

关于作者

两个我

暂无简介

文章

28 人气

关注发私信

浪子阿飞

文章 0 评论 0

关注

JK.Yang

文章 0 评论 0

关注

人间不值得

文章 0 评论 0

关注

静待花开

文章 0 评论 0

关注

只涨不跌

文章 0 评论 0

关注

污浊的双黑

文章 0 评论 0

友情链接

文江博客

如何将更多标记词添加到斯坦福 POS-Tagger 的训练模型中？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者