当前位置：文江博客话题详情

Google 图书如何查找文本区域？

发布于 2024-07-12 00:59:17 字数 162 浏览 18 评论 0原文

计算机视觉中的一个具有挑战性的主题是处理文档扫描。通常，这涉及许多步骤，例如噪声去除、颜色分析、二值化、文本块识别、OCR，然后可能还包括一些上下文分析和校正。

我很好奇是否有人理解、知道或可以向我指出有关 Google 如何在 OCR 阶段之前识别文本块的文献。有什么见解吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

像极了他 2024-07-19 00:59:17

我相信 Google 将 Tesseract OCR 引擎与另一个名为 Ocropus，两者都是开源的。我不知道它们是如何工作的，但您可能有兴趣查看上面的链接中提供的代码。

回复收藏 0 原文

倚栏听风 2024-07-19 00:59:17

这是来自我图书馆的数字化专家的二手信息，但谷歌的方法似乎是将所有内容都通过自动化流程，OCR任何看起来像文本的内容，而不是过多地裁剪单个图像或做太多语义处理他们可能会做一些不明显的微妙事情，但从表面上看，他们肯定是追求数量而不是质量，在我看来，这对他们来说是明智的做法。

回复收藏 0 原文

~没有更多了~

关于作者

鱼窥荷

暂无简介

文章

26 人气

关注发私信

达拉崩吧

文章 0 评论 0

关注

PANGOO

文章 0 评论 0

关注

kkgtx

文章 0 评论 0

关注

WordPress小学生

文章 0 评论 0

关注

酷炫老祖宗

文章 0 评论 0

关注

硪扪都還晓

文章 0 评论 0

友情链接

文江博客

Google 图书如何查找文本区域？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者