分割文档图像

发布于 2024-12-29 15:30:54 字数 156 浏览 0 评论 0原文

我正在寻找一种用于检测文档图像中的线条(例如表格)和单词边界框的算法。

目前,我通过执行交替的水平和垂直投影并检查生成的直方图是否有间隙来分割图像。虽然这适用于某些文档,但不适用于那些包含外部有线条的表格的文档,因为直方图不包含允许进一步分段的间隙。因此我正在寻找一种更复杂的算法。

I'm looking for an algorithm for detecting lines (e.g. from tables) and word bounding boxes in document images.

Currently I am segmenting the image by performing alternating horizontal and vertical projections and checking the resulting histogram for gaps. While this works for some documents, it doesn't for those that contain tables with lines on the outside, as the histogram then contains no gaps that would allow a further segmentation. Therefore I am looking for a more sophisticated algorithm.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

温柔嚣张 2025-01-05 15:30:54

不确定我完全理解你的问题。如果您添加您正在谈论的图像,那就更好了。

无论如何,使用 cvHoughLines 函数来检测图像中的线条。

另外,opencv 附带了一个检测正方形的示例。稍微修改一下以检测单词边界框。

Not sure I understood your question completely. It would be better if you add the image you are talking about.

Any way, Use cvHoughLines function to detect lines in image.

Also, opencv comes with a sample to detect squares. Modify it a little to detect word bounding boxes.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文