当前位置：文江博客话题详情

基于多个 OCR 软件包输出来改进 OCR 结果的软件

发布于 2024-09-10 03:54:32 字数 549 浏览 4 评论 0原文

是否有一款现有的商业或学术软件可以

叠加多个 OCR 软件包（Abbyy FineReader、Adobe Acrobat Professional、ReadIris 等）的结果，
基于多个来源积累的知识提供全自动改进
，允许使用额外的外部运行时的工具设置（词典、批量网络/本地语料库查找等）

？

注意：我已经有了内部解决方案来可视化来自单一来源的结果，所以如果没有这样的软件可用，我不介意开发自己的:)合作询问也将是最多的欢迎！
_{（来源：sourceforge.net）}

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

只是一片海 2024-09-17 03:54:32

在多个 OCR 引擎之间使用投票的想法并不新鲜。问题是它并没有真正发挥作用。如果它们是本质上正交的简单分类器，那么您将结合他们的投票并改进结果，这可能会起作用。但它们都是非常复杂的软件，使用非常相似的一组众所周知的方法，几乎没有差异，但可能以不同的方式组合它们，有些实现更好，有些实现更差。

经验表明，当您结合多种 OCR 技术时，最佳决策规则是依赖最准确的一项技术的结果，而忽略其他技术。根据我的经验（我为 ABBYY 工作），ABBYY OCR 绝对是您提到的最准确的。

据我所知，使用投票的唯一原因是当您需要交叉检查“可疑”字符并将其发送到手动验证（如果需要 100% 的准确性）时。使用这种方法可以增加要验证的字符数量，但会降低错过错误字符的可能性。

回复收藏 0 原文

若无相欠,怎会相见 2024-09-17 03:54:32

我之前使用过并推荐两种选择。

PrimeOCR。 http://www.primerecognition.com/

它是一个商业产品，使用多个 OCR 引擎并投票给确定最佳结果。仅限机器打印。上次我使用它时，他们有 6 个引擎。联系亚历克斯·达尔。

我在一个每天扫描 20,000 多页的大型项目中使用了它。

来自 OpenText 的 RecoStar。

RecoStar采用投票方式，可以手印和机印。

回复收藏 0 原文

~没有更多了~

关于作者

因为看清所以看轻

暂无简介

0 文章

0 评论

671 人气

关注发私信

苦中寻乐

文章 0 评论 0

关注

lueluelue

文章 0 评论 0

关注

嗼ふ静

文章 0 评论 0

关注

王权女流氓

文章 0 评论 0

关注

与花如笺

文章 0 评论 0

关注

残酷

文章 0 评论 0

友情链接

文江博客

基于多个 OCR 软件包输出来改进 OCR 结果的软件

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

基于多个 OCR 软件包输出来改进 OCR 结果的软件

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。