使用 NLTK 对德语文本进行 POS 标记
我想使用 NLTK 来标记德语文本。我发现这个问题和这个项目。两者看起来都很复杂,我找不到一些关于如何训练词性标注器的 NLTK 文档。有什么提示吗?我正在寻找最简单的方法来放入一些德语文本并取回标记的单词。有什么提示吗?
I would like to use NLTK for pos tagging german texts. I found this question and this project. Both look quite complicated and I cannot find some NLTK documentation about how to train pos taggers. Any hint? I'm looking for the most simple way to put in some german text and to get back tagged words. Any hint?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
斯坦福大学标注者接受过德语训练。
http://nlp.stanford.edu/software/tagger.shtml
The Stanford tagger is trained on German.
http://nlp.stanford.edu/software/tagger.shtml
TreeTagger 可用于多种语言,包括德语。但是,它不能用于商业目的。
TreeTagger can be used for a bunch of languages, including German. However, it cannot be used for commercial purposes.