如何识别给定文本中的想法和概念

发布于 2024-09-02 02:18:13 字数 428 浏览 9 评论 0原文

我目前正在开发一个项目，如果能够检测文本正文中何时提到某个主题/想法，这将非常有用。例如，如果文本包含：

如果您告诉我更多有关琼斯先生的信息，也许会有帮助。如果我能描述一下他的外貌，或者最好是一张照片，也会很有用吗？

如果能够检测到这个人要求提供琼斯先生的照片，那就太好了。我可以采取一种非常天真的方法，只寻找“照片”或“照片”这个词，但如果他们写的是这样的东西，这显然是不好的：

请永远不要向我发送琼斯先生的照片。

有人知道从哪里开始吗？有可能吗？

我研究过 nltk 之类的东西，但我还没有找到有人做类似事情的例子，而且我仍然不完全确定这种分析叫什么。任何能让我起步的帮助都会很棒。

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

相对绾红妆 2024-09-09 02:18:13

可能对您有用的最好的东西是自动情绪分析。例如，它用于判断客户评论是正面还是负面。我无法直接向您提供可用工具的指示，但这正是您正在寻找的工具。

但我必须说，这是当前自然语言处理的热门话题，我在会议上看到过很多论文。这绝对是一个相当复杂的问题，如果您从头开始，可能需要相当长的时间才能得到您想要的结果。

回复收藏 0 原文

若水微香 2024-09-09 02:18:13

NLTK 对于解析自然语言来说是一个不错的框架，但要注意这不是一件简单的事情。做这样的事情确实是研究级别的编程。

使它变得更容易的一件好事是，如果您的领域非常有限 - 假设您的应用程序专注于有关著名作家的信息，那么您可以避免自然语言的一些复杂性，例如某些类型的歧义。

从哪里开始？好问题。我不知道有关于这个主题的任何教程（我猜你尝试过 Google 选项），但我想 iTunes U 会有关于这个主题的课程。如果没有，我可以发布一个我完成的课程的链接，该课程提到了该主题并且并不完全可怕：http://www.inf.ed.ac.uk/teaching/courses/inf2a/lecturematerials/index.html#lecture01

回复收藏 0 原文