当前位置：文江博客话题详情

search nlp full-text-search named-entity-recognition

从字典中查找文本字符串中的单词

发布于 2024-11-24 09:52:46 字数 273 浏览 3 评论 0原文

您将如何解析一串自由格式的文本，以根据位置和名称字典来检测位置和名称等内容？在我的特定应用程序中，我的字典中将有数以万计（如果不是更多）的条目，因此我很确定仅运行所有这些条目是不可能的。另外，是否有任何方法可以添加“模糊”匹配，以便您还可以检测字典单词的 x 编辑范围内的子字符串？如果我没记错的话，这属于自然语言处理领域，更具体地说，属于命名实体识别（NER）领域；然而，我试图寻找有关 NER 背后的算法和流程的信息却一无所获。我更喜欢使用 Python，因为我对此最熟悉，尽管我愿意考虑其他解决方案。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

抱着落日 2024-12-01 09:52:47

您可以尝试下载斯坦福命名实体识别器：
http://nlp.stanford.edu/software/CRF-NER.shtml

如果您不想使用别人的代码而想自己做，我建议您查看他们相关论文中的算法，因为他们为此使用的条件随机场模型已经成为相当常见的NER 的方法。

我不确定如何准确回答您问题的第二部分，即在没有更多详细信息的情况下查找子字符串。您可以修改斯坦福大学的程序，或者可以使用词性标注器来标记文本中的专有名词。这不会区分位置和名称，但是可以非常简单地找到距离每个专有名词 x 个单词的单词。

回复收藏 0 原文

~没有更多了~

关于作者

抹茶夏天i‖

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

苦中寻乐

文章 0 评论 0

lueluelue

文章 0 评论 0

嗼ふ静

文章 0 评论 0

王权女流氓

文章 0 评论 0

与花如笺

文章 0 评论 0

残酷

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文