如何查找扫描文档图像上的空白字段

发布于 2024-07-14 01:42:58 字数 882 浏览 19 评论 0原文

我希望我的申请能够填写表格中的一个字段以黑白图像文件形式存在。形式总是开始时是相同的纸质版本，但到了我的应用程序从我的用户那里获取它，它可能已被扫描或传真更多比一次。因此，我需要的字段不在每个文件中的相同位置。

我的用户并不总是从我这里得到空白表格，所以我不有能力打印我可以的标记或占位符以后认得。

原来的空白表格上有文字，但因为可能已经传真了，我的分辨率只有200 dpi。文本总是大到足以让人阅读，但我对此表示怀疑关于OCR。

我有一些预算，所以我不需要免费的解决方案......让我们就说2000美元吧。

也就是说，我正在考虑

获取 OCR 解决方案来查找文本我需要的字段上的标签。我不认为我有资源或自己的专业知识。我不需要完美的认可，因为我已经知道文字说了什么。但我确实需要知道 X- 和 Y 坐标。有软件吗是这样的吗？还是编程比我想象的更容易？
构建或购买软件来识别表格的边缘。从那里，我可以获得的相对位置我需要的领域。我在想我的扫描仪软件在图像周围放置的虚线一个小文件。这是一个已知的算法或者是否有可用的解决方案？
其他一些识别的方法我需要的领域。尝试谷歌表格填写软件给我数百个网络表单匹配项， pdf 表格等不符合我的要求需要。

我对语言并不挑剔。我的应用程序在 Linux 上运行，但如果最好的解决方案是 Microsoft，我可能可以实现这一点。

我很感激你的想法。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

风为裳 2024-07-21 01:42:58

如果我理解正确的话，表格总是相同的，但可能会因复印/传真而移动、缩放或稍微旋转。在这种情况下，您的问题是图像配准之一：找到最佳的刚性变换，使用户的表单与您的“模型”表单对齐，其中您知道字段的位置兴趣。一旦知道了转换，您就可以计算该字段在用户表单中的位置。

有许多图像配准算法，通常是为对齐大脑 MR 图像等应用而开发的。它们的计算成本很高并且需要统计先验。幸运的是，您的情况更简单：您所需要做的就是在用户表单的内容周围放置一个矩形。坐标下降应该有效。您需要对噪音（表单外的垃圾）有一定的容忍度。

回复收藏 0 原文

貪欢 2024-07-21 01:42:58

以下是一些可用 OCR 解决方案（开源和非开源）的小摘要：http://googlesystem.blogspot.com/2007/04/open-source-ocr-software-spoke-by.html

回复收藏 0 原文

最佳男配角 2024-07-21 01:42:58

严格的注册可能还不够。用户可以修改模板表单的布局和格式，例如更改字体、更改复选框或输入框的位置、在不同的换行位置处断开段落等。这些差异处理起来比纯粹的差异更复杂。平移、旋转或缩放变换。此外，如果您的图像是二值图像（黑白），我认为那些医学图像配准算法（处理灰度图像）不会有太大帮助。您的成本函数和最小化策略可能会相应改变。

回复收藏 0 原文

~没有更多了~