当前位置：文江博客话题详情

如何制作 OCR 程序？

发布于 2024-11-18 05:33:10 字数 1436 浏览 7 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

謸气贵蔟 2024-11-25 05:33:10

基本方法是制作黑色像素的直方图。第一：将所有像素投影在一条线上。直方图中的深谷表示线条之间的分离（如果纸张可能倾斜，请尝试不同的角度）。然后，每行（或每页，如果您知道字体是等宽字体）将像素投影到水平直方图上。这将为您提供字符间空间的强烈指示。至少，这会为您提供平均字符高度和宽度的值，这将有助于您执行后续步骤。

之后，您需要处理字距调整（字符重叠的地方）。找到连接的像素，可能首先对图像进行膨胀或腐蚀以补偿扫描伪影。

根据扫描图像的质量，您可能需要使用更先进的技术，但这会让您继续前进。

回复收藏 0 原文

刘备忘录 2024-11-25 05:33:10

这听起来不像人工智能，听起来像是您在谈论 OCR：

http://en。 wikipedia.org/wiki/Optical_character_recognition

请参阅 google tesseract

http://code.google.com/p/tesseract-ocr/

编辑未经编辑的问题是关于人工智能的。

回复收藏 0 原文

岁月流歌 2024-11-25 05:33:10

对我来说，这个问题本身似乎并不明确。

当它谈论 OCR 时，将在这里留下几篇文章，它们可能会有所帮助（它们至少对我有帮助）：

如上所述 tesseract 是一个很好的 OCR 开源 python 库（我个人也使用的那个）。您可以采取的其他方法是通过 sklearn

您可能还需要检查这篇 stackoverflow 帖子。

我也很确定您可以使用 researchgate 来检查那里的任何论文（我发现了一些，只是不确定这是否是您所需要的）

我认为上述通用答案适合通用问题。

回复收藏 0 原文

~没有更多了~

关于作者

懒的傷心

暂无简介

文章

26 人气

关注发私信

櫻之舞

文章 0 评论 0

关注

弥枳

文章 0 评论 0

关注

m2429

文章 0 评论 0

关注

寻找一个思念的角度

文章 0 评论 0

关注

野却迷人

文章 0 评论 0

关注

我怀念的。

文章 0 评论 0

友情链接

文江博客

如何制作 OCR 程序？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

櫻之舞