什么是好的机器翻译指标或黄金组合

发布于 2024-12-21 09:11:47 字数 249 浏览 5 评论 0原文

我开始考虑对搜索查询进行一些机器翻译，并一直在尝试考虑不同的方法来在迭代之间以及与其他系统之间对我的翻译系统进行评级。我想到的第一件事是从一群人那里获取 mturk 的一组搜索词的翻译，并说每个词都是有效的，或者类似的东西，但这会很昂贵，而且可能容易让人输入错误的翻译。

现在我正在尝试想出更便宜或更好的东西，我想我应该向 StackOverflow 寻求想法，以防已经有一些可用的标准，或者有人之前尝试过找到其中一个。例如，有谁知道谷歌翻译如何评价其系统的各种迭代？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

岁月苍老的讽刺 2024-12-28 09:11:47

这里有一些可能有用的信息，因为它提供了 BLEU 评分技术的基本解释，开发人员经常使用该技术来衡量 MT 系统的质量。

第一个链接提供了 BLEU 的基本概述，第二个链接指出了 BLEU 的一些局限性问题。

http://kv-emptypages.blogspot.com /2010/03/need-for-automated-quality-measurement.html

和

http://kv-emptypages.blogspot.com /2010/03/problems-with-bleu-and-new-translation.html

此链接还提供了一些关于如何开发有用的测试集的非常具体的实用建议： AsiaOnline.Net 网站十一月通讯。我无法添加此链接，因为限制为两个。

回复收藏 0 原文

苍白女子 2024-12-28 09:11:47

我建议完善你的问题。机器翻译有很多指标，这取决于您想要做什么。就您而言，我认为问题可以简单地表述为：“给定一组 L1 语言的查询，我如何在网络搜索上下文中衡量 L2 翻译的质量？”

这基本上是跨语言信息检索。

这里要认识到的重要一点是，您实际上并不关心向用户提供查询的翻译：您希望向他们提供他们可以从查询的良好翻译中获得的结果。

为此，您可以简单地测量黄金翻译和系统结果之间的结果列表的差异。您可以使用许多关于排名相关性、集合重叠等指标。重点是，您不需要判断每一个翻译，而只需评估自动翻译是否为您提供与人工翻译相同的结果。

至于提出糟糕翻译的人，您可以评估假定的黄金标准候选者是否具有相似的结果列表（即给定 3 个手动翻译，他们的结果是否一致？如果不一致，请使用最重叠的 2 个）。如果是这样，那么从 IR 的角度来看，这些实际上是同义词。

回复收藏 0 原文

明媚殇 2024-12-28 09:11:47

在我们的机器翻译评估中我们使用 hLEPOR 分数（详细信息请参阅幻灯片）

回复收藏 0 原文

~没有更多了~

关于作者

遗心遗梦遗幸福

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

什么是好的机器翻译指标或黄金组合

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

眼泪淡了忧伤

corot39

守护在此方

github_3h15MP3i7

相思故

滥情空心

友情链接

什么是好的机器翻译指标或黄金组合

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

眼泪淡了忧伤

corot39

守护在此方

github_3h15MP3i7

相思故

滥情空心

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。