Java 中的语言识别

发布于 2024-08-22 02:01:52 字数 1536 浏览 6 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

拥有 2024-08-29 02:01:52

了解您对 Apache Tika 中的版本的看法。这假设您想要找出文本的语言,而不是想要为编程语言构建解析器。

See what you think of the version in Apache Tika. This assumes that you want to find out what language text is in, as opposed to wanting to build a parser for a programming language.

遗弃M 2024-08-29 02:01:52

Textcat http://textcat.sourceforge.net/ 没有俄语,但它确实可以处理以下内容:

  • 阿尔巴尼亚语
  • 丹麦语的
  • 荷兰语
  • 英语
  • 芬兰
  • 法语
  • 德语
  • 匈牙利
  • 意大利语
  • 挪威
  • 抛光
  • 斯洛伐克语
  • 斯洛文尼亚语
  • 西班牙语
  • 瑞典

Textcat http://textcat.sourceforge.net/ doesn't have Russian but it does handle the following:

  • albanian
  • danish
  • dutch
  • english
  • finnish
  • french
  • german
  • hungarian
  • italian
  • norwegian
  • polish
  • slovakian
  • slovenian
  • spanish
  • swedish

电影里的梦 2024-08-29 02:01:52

语言检测 API,它通过 HTTP POST 接受文本并返回包含检测到的语言和分数的 JSON。它可以从 Java 或任何其他编程语言中使用。

There is Language Detection API which accepts text via HTTP POST and returns JSON with detected languages and scores. It can be used from Java or any other programming language.

隔纱相望 2024-08-29 02:01:52

我认为 ANTLR 几乎是标准的。

I think ANTLR is pretty much standard.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文