在图像中的单词周围绘制矩形的算法

发布于 2024-10-18 20:37:13 字数 166 浏览 6 评论 0原文

问候溢出者,

我需要一种算法来在扫描文档图像中的单词周围绘制矩形。 无论如何,这个算法不需要 100% 准确。 不过,最好在工作过程中需要最少的人为干预。 事先不对扫描文档进行任何假设(未知的字体和语言,可能包括表格和图形)

关于此事有任何现成的解决方案或资源吗?

问候

Greetings Overflowers,

I need an algorithm to draw rectangles around words in images of scanned documents.
This algorithm needs not to be 100% accurate anyway.
Though, it is preferable to require the least of human intervention during its work.
No assumptions on scanned document before hands (unknown fonts and languages, might include tables and figures)

Any ready made solutions or resources on the matter ?

Regards

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

中性美 2024-10-25 20:37:13

大多数 OCR 引擎都提供此类信息。但如果你不想使用引擎 OpenCV 可以用于此目的,但它需要模型构建和调整。

OpenCV 中的 OCR
http://blog.damiles.com/?p=93

这是一大进步。简而言之,这是一个很难解决的问题,如果您想自己解决,则需要很长时间才能解决。您很可能应该考虑使用第 3 方 OCR 软件包。就像纽安斯一样。我已经使用过它并且可以验证它是否具有此类信息以及更多信息。

http://www.nuance.com/for-individuals/by -产品/omnipage/index.htm

most OCR engines provide this kind of information. But if you don't want to use an engine OpenCV can be used for this but it will require model building and tuning.

OCR in OpenCV
http://blog.damiles.com/?p=93

That's a big step. In short this is a hard problem to solve and if you want to do it yourself it's going to take a good while to get it working. Most likely you should consider a 3rd party OCR package. Like Nuance. I've use it and can verify it has exactly this type of information and a lot more.

http://www.nuance.com/for-individuals/by-product/omnipage/index.htm

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文