当前位置：文江博客话题详情

Java 自然语言解析器

发布于 2024-09-25 17:22:52 字数 167 浏览 6 评论 0原文

我正在寻找一个java中的解析器（或生成的解析器），它能够执行以下操作：

我将提供已经标记词性的句子。我将使用我自己的标签集。
我没有任何统计数据。因此，如果解析器是统计的，我希望能够在没有此功能的情况下使用它。
轻松适应其他语言。学习曲线低

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

他不在意 2024-10-02 17:22:52

Stanford Parser（已在其他问题中列出）将执行您的所有操作列表。

您可以提供自己的 POS 标签，但如果它们尚未采用该格式，则需要对 Penn TreeBank 集进行一些转换。解析器要么是统计性的，要么不是。如果不是，您需要一套语法规则。除了作为玩具之外，不再真正以这种方式构建解析器，因为它们真的很糟糕™。因此，您可以依赖斯坦福解析器使用的统计数据（无需您进行额外的工作）。然而，这确实意味着有关您自己的标签的统计信息（如果它们没有直接映射到 Penn TreeBank 标签）将被忽略。但由于无论如何你都没有标签的统计数据，所以这应该是可以预料到的。

他们也有针对其他几种语言进行过培训的解析器，但是如果您想使用他们没有的语言，您将需要自己的标记数据。无论您使用哪种解析器，都无法解决这个问题。

如果您了解 Java（我假设您了解），Stanford Parser 非常简单且易于上手。他们的邮件列表也是一个很好的资源并且相当活跃。

回复收藏 0 原文