Maxent POS 标签表
我使用 nltk.pos_tag
进行词性标记,它使用 maxent 词性标记器
。我需要一个包含所有可用标签的表格。
我的最终目标是从文本中提取副词和形容词。
任何帮助表示赞赏。
谢谢
I use nltk.pos_tag
for part-of-speech tagging which use maxent part of speech tagger
. I need a table of all available tags.
My ultimate aim is to extract just the adverbs and adjectives from a text.
Any help is appreciated.
Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
尝试:
Try:
pos_tag
,根据其文档字符串,使用“NLTK当前推荐的词性标注器”,因此该建议的有效性可能会过期。为了获得可重现的结果,请使用显式 POS 标记器对象。查看
pos_tag
的源代码< /a>,我们可以看到它调用我们可以从中获取 POS 标签列表
(我必须承认我通过对象检查和试错发现了这一点。)
形容词和副词至少是类别
JJ
(形容词)和RB
(副词),也许还有VBN
(过去分词,例如“累了”)。pos_tag
, according to its docstring, uses "NLTK's currently recommended part of speech tagger", so the validity of this advice might expire. For reproducible results, use an explicit POS tagger object.Looking at the source code for
pos_tag
, we can see that it callsfrom which we can get a list of POS tags with
(I must admit I found this out using object inspection and trial-and-error.)
The adjectives and adverbs would be at least the categories
JJ
(adj) andRB
(adv), plus perhapsVBN
(past participle, e.g. "tired").