Microsoft Office Document Imaging 使用什么 OCR 算法?不安装office 2003可以使用吗?
与这个问题相关,我找到了一个程序,JOCR 效果良好。事实证明,它只是使用 Microsoft Office Document Imaging 通过 COM 为其执行 OCR。这对我有用——我可以花一些时间尝试让它从Python(我需要它的地方)工作。
我的问题是:他们使用什么 OCR 算法?是否有可能在其他地方获得它(或类似的东西 - tesseract 和 ocropus 似乎只适用于扫描图像或图片,但 MODI OCR 非常适用于屏幕文本)?是否可以在不安装所有 Office 2003 的情况下将其安装在计算机上?
Related to this question, I found a program, JOCR that has good results. It turns out it just uses Microsoft Office Document Imaging to do the OCR for it using COM. That works for me - I can spend some time trying to get it to work from Python (where I need it).
My questions are: what OCR algorithm do they use? Is it possible to get it (or one like it - tesseract and ocropus seem to only work with scanned images or pictures, but MODI OCR works great with on-screen text) elsewhere? Is it possible to install it on a computer without installing all of Office 2003?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论