当前位置：文江博客话题详情

如何从命令行使用 tesseract 在打开的窗口内读取内容？

发布于 2025-01-01 22:50:10 字数 366 浏览 0 评论 0原文

我正在尝试从命令行使用 tesseract 对打开的窗口的内容运行 OCR。特别是，我愿意阅读当前打开的记事本窗口中输入的文本。

我在这里阅读了文档和维基：http://code.google。 com/p/tesseract-ocr/w/list

但我没有找到任何对我这个项目有帮助的东西，此外我也在这里搜索了类似的问题（有很多关于 OCR 的问题），但似乎什么也没有工作/适用于我的情况。

可行吗？

我主要是一名 PHP 编码员（编码只是为了好玩），没有非网络语言的经验。

提前致谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

野味少女 2025-01-08 22:50:10

Tesseract 旨在将 TIFF 图像作为输入，并且对 Windows 或屏幕设备上下文一无所知。因此，您需要添加代码来定位记事本窗口的窗口句柄，根据 Windows 报告的当前窗口大小执行屏幕捕获和剪辑窗口，并将生成的图像保存到文件中。该图像很可能是黑白的，这将使 OCR 变得更容易，因为我怀疑 Tesseract 2.0 只适用于黑白图像。下一个问题是 Tesseract 由于源图像的 DPI（分辨率）较低而导致结果不佳。

为了评估您的方法的适用性，我将通过打开记事本、截取屏幕截图、在 MSPaint 中打开屏幕截图、剪辑您想要 OCR 的文本、将剪辑的图像保存为 TIFF 或 BMP 并将此文件发送到 Tesseract 来执行一些手动测试。如果结果不如您需要或期望的那么好，这可以为您节省大量时间和精力。

回复收藏 0 原文

~没有更多了~