使用 NLTK 进行分块/文本解析

发布于 2024-08-11 00:22:48 字数 313 浏览 4 评论 0原文

我正在尝试解析一些文本并将其绘制成图表，就像解析一个句子一样。我是 NLTK 的新手，正在尝试在 NLTK 中找到一些可以帮助我实现这一目标的东西。到目前为止，我已经看到了 nltk.ne_chunk 和 nltk.pos_tag。我发现它们不是很有帮助，而且我找不到任何好的在线文档。

我也尝试过使用 LancasterStemmer，但我不完全理解它的作用、应该如何使用它或者它为何存在。

有人可以帮我解决这个问题吗？我真的很茫然，在没有任何指路明灯的情况下感到非常沮丧。

提前致谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

孤者何惧 2024-08-18 00:22:48

你所描述的实际上是一项非常艰巨的任务，因为最终，你的程序成功还是失败完全是一个主观的衡量标准。在这种情况下，通常意味着构建一个程序来解决该问题很困难。有些人在大学里从事此类问题的研究并获得报酬。

如果您想尝试一下，我建议尝试使用某种自动词法分析工具，而不是尝试手动解析和注释，然后利用解析树。通常解析树表示句法分析，即句子的结构。另一方面，您更关心语义分析，即它的含义 - 或者至少两个句子是否相似或不同（这实际上比某些含义更容易）。

您可以研究一些现成的自动摘要工具。这些尝试根据句子对一段文本的重要性来对句子进行评分，并过滤掉重要性低于指定阈值的句子。这并不是说这真的对您有多大帮助，因为您仍然存在需要合并摘要的问题。

回复收藏 0 原文

~没有更多了~

关于作者

隐诗

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

使用 NLTK 进行分块/文本解析

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

使用 NLTK 进行分块/文本解析

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。