识别屏幕截图中的字符的最佳方法？

发布于 2024-10-03 05:11:19 字数 409 浏览 10 评论 0 原文

您建议如何从屏幕截图中识别所有字符？屏幕截图非常清晰（白色背景上只有黑色文本），我还可以为文本选择任何标准字体（安装在 Windows 上）。我尝试过一些 OCR 方法（Tesseract 等），但它在识别某些字符时出错（这让我感到困惑，因为文本没有丝毫噪音，而且字体是一些最常见的字体 - Courier New、Fixedsys 等），我需要它 100% 准确。是否有一些库可用于此特定目的，一些模式识别或其他东西？或者我应该使用某种等宽字体获取屏幕截图，并迭代图像移动到右侧 +font_size 像素，然后将捕获的内容与内存中的字母表示和相同大小的相同字体的数量进行比较？解决这个问题的最佳方法是什么？预先非常感谢您。

更新：通过使用等宽字体（Courier New）训练 Tesseract，我终于获得了 100% 的准确率，其大小与我截图的完全相同。希望对将来的人有所帮助:)

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

剧终人散尽 2024-10-10 05:11:19

由于这是 Google 上的第一个tesseract recognize snapshot结果，让我做一些死灵术并添加一个更简单的解决方案。

Tesseract 要求图像大约 300 dpi 或更高，Windows 的标准 dpi 为96. 这意味着您需要将图像重新缩放至 300%。之后，结果显着改善。

100%

结果：您建议使用 Whal 来识别屏幕或 7 上的所有字符

200%

结果：您建议如何从屏幕上识别所有房间？

300%

结果：您建议如何识别屏幕截图中的所有字符？

任何高于 300% 的内容都可以。

回复收藏 0 原文

默嘫て 2024-10-10 05:11:19

如果 OCR 在如此优质的输入上给出如此糟糕的结果，我会感到惊讶。也许您想要做的是选择具有锐利边缘、无抗锯齿功能的字体，较大的字体也会有所帮助。

另外，如果可以接受，请尝试此问题中给出的 OCR 字体：

什么是OCR 的理想字体？

这应该会给你最好的结果 - 如果这没有达到 100%，那么我不知道什么会......

不知道你在 Tesseract 旁边尝试了什么，但是如果你没有，也许值得尝试其他一些。这些似乎是最近更新的（Tesseract 是一年前更新的）：

http://en.wikipedia.org /wiki/Ocrad
http://en.wikipedia.org/wiki/GOCR
http://en.wikipedia.org/wiki/OCRopus （这也有点旧的，但如果没有，请尝试一下）

也有一些在线版本，例如：

，您可以使用它来测试示例文档。通过此链接：

http://www.makeuseof.com/tag/top-5-free-ocr-software-tools-to-convert-your-images-into-text-nb/

看来你可能需要商业化才能得到你想要的东西。

希望这有帮助。

回复收藏 0 原文

城歌 2024-10-10 05:11:19

我知道您已经解决了您的问题，但以防万一这对其他人有帮助：我在处理屏幕截图时发现的两个问题是 OCR 引擎对以下内容敏感：(1) 图像文件标头中的分辨率设置不正确，以及 (2) 透明度问题（看起来像白色背景的东西实际上被标记为透明的）。由于某种原因，这些问题往往经常出现在屏幕截图图像中。

此外，除了 Tesseract 之外，另一种可能性是尝试 http://www.wisetrend.com/wisetrend_ocr_cloud 上的 API .shtml 基于 ABBYY OCR 引擎。（优点是无需安装/配置/等任何东西来尝试它以确保它可以在您的图像上工作 - 只需进行 HTTP POST）。 免责声明：WiseTrend 是我公司的客户。