Microsoft Office Document Imaging 使用什么 OCR 算法?不安装office 2003可以使用吗?

发布于 2024-11-03 17:49:23 字数 488 浏览 0 评论 0原文

这个问题相关,我找到了一个程序,JOCR 效果良好。事实证明,它只是使用 Microsoft Office Document Imaging 通过 COM 为其执行 OCR。这对我有用——我可以花一些时间尝试让它从Python(我需要它的地方)工作。

我的问题是:他们使用什么 OCR 算法?是否有可能在其他地方获得它(或类似的东西 - tesseract 和 ocropus 似乎只适用于扫描图像或图片,但 MODI OCR 非常适用于屏幕文本)?是否可以在不安装所有 Office 2003 的情况下将其安装在计算机上?

Related to this question, I found a program, JOCR that has good results. It turns out it just uses Microsoft Office Document Imaging to do the OCR for it using COM. That works for me - I can spend some time trying to get it to work from Python (where I need it).

My questions are: what OCR algorithm do they use? Is it possible to get it (or one like it - tesseract and ocropus seem to only work with scanned images or pictures, but MODI OCR works great with on-screen text) elsewhere? Is it possible to install it on a computer without installing all of Office 2003?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文