当前位置：文江博客话题详情

Python 中 NLTK 工具包的默认分块器是什么？

发布于 2024-08-10 11:15:49 字数 91 浏览 13 评论 0原文

我正在使用他们的默认 POS 标记和默认标记化..这似乎足够了。我也想要他们的默认分块器。

我正在阅读 NLTK 工具包书，但他们似乎没有默认的分块器？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

悲凉≈ 2024-08-17 11:15:49

您可以使用 nltk.ne_chunk() 方法摆脱命名实体分块的束缚。它采用 POS 标记元组列表：

nltk.ne_chunk([('Barack', 'NNP'), ('Obama', 'NNP'), ('lives', 'NNS'), ('in ', 'IN'), ('Washington', 'NNP')])

结果：

Tree('S', [Tree('PERSON', [('Barack', 'NNP') )]), Tree('组织', [('奥巴马', 'NNP')]), ('生活', 'NNS'), ('in', 'IN'), Tree('GPE', [ ('Washington', 'NNP')])])

它将 Barack 标识为一个人，但将 Obama 标识为一个组织。所以，并不完美。

回复收藏 0 原文

一身软味 2024-08-17 11:15:49

我也找不到默认的分块器/浅解析器。尽管这本书描述了如何使用示例功能构建和训练功能。提供额外的功能来获得良好的性能应该不会太困难。

请参阅第 7 章有关基于训练分类器的部分分块器。

回复收藏 0 原文

~没有更多了~

关于作者

阪姬

暂无简介

文章

28 人气

关注发私信

十二

文章 0 评论 0

关注

飞烟轻若梦

文章 0 评论 0

关注

OPleyuhuo

文章 0 评论 0

关注

wxb0109

文章 0 评论 0

关注

旧城空念

文章 0 评论 0

关注

-小熊_

文章 0 评论 0

友情链接

文江博客

Python 中 NLTK 工具包的默认分块器是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者