当前位置：文江博客话题详情

如何根据上下文从文本中提取单词

发布于 2024-09-28 22:14:35 字数 256 浏览 10 评论 0原文

我想从用户提供的文本语句中提取相关单词。例如。对于“长方形有几条边？”的问题这些词应该是“矩形”、“边数”、“许多”、“如何”。

我们发现我真正想做的是一个 NLP 问答系统。但现在我只想从问题中提取所需的关键字，问题的范围不是很大。

我遇到过各种数据挖掘工具，但不太确定它们是否真的对此有用。它们似乎有点太先进了或者不完全相关。

请告诉我是否有适合要求的工具，或者我应该继续尝试自己编码。

请提供您认为可能有帮助的任何指示。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

注定孤独终老 2024-10-05 22:14:35

如果您只有问题，您可以尝试词性标记 (POS) 和命名实体提取 (NER)。名词尤其令人感兴趣。有许多相同的开源工具，Brill 的 POS tager、Lingpipe、Open NLP 等。但是，如果您还有您感兴趣的领域的语料库，您可以通过以下方式从中提取关键词和短语：使用单词和短语的频率与其他基础语料库相比的差异。给出一个问题，您就可以查找这些关键词和短语。

回复收藏 0 原文