用于翻译语言的服务器端软件?

发布于 2024-10-13 05:01:49 字数 1459 浏览 5 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

鸢与 2024-10-20 05:01:49

开源翻译包

以下是一些最先进的开源机器翻译包:

训练数据

要使用上面的每个包,您需要训练数据。如果您要在多种欧洲语言之间进行翻译,可以使用 Phillip Koehn 的 Europarl 平行语料库。如果您对 Europarl 平行语料库中没有的欧盟 (EU) 语言感兴趣,您可以通过爬网 欧洲议会会议记录。所有欧盟会议记录都被翻译成每种欧盟语言,并免费在线提供,这使得它们成为机器翻译培训数据的良好来源。

您可以从 语言数据联盟 (LDC) 目录获取非欧洲语言的训练数据(例如,< a href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2007T09" rel="nofollow">汉译英)。

Open Source Translation Packages

Here are some state-of-the-art open-source machine translation packages:

Training Data

To use each of the packages above, you'll need training data. If you're translating between many European languages you can use Phillip Koehn's Europarl parallel corpus. If you're interested in a European Union (EU) language that's not in the Europarl parallel corpus, you can gather the data by crawling the proceedings of the European parliament. All the EU proceedings are translated into each of the EU languages and made available for free online, which makes them a very good source of machine translation training data.

You can get training data for non-European languages from the Linguistics Data Consortium (LDC) catalog (e.g., Chinese-to-English).

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文