需要库来 OCR 打印页面并从中创建制表符分隔文件
我正在为客户生成 pdf 文件。它有两列... ID 和一个空白列,供最终用户输入一些字符。我希望客户端能够上传带有两列的打印 pdf 的 bmp/jpg/tif 任何(我可以指定)图像,并将其转换为带有两列值的 csv/tab/任何文件。谁能推荐一个ocr包,我可以从php web PHP或win32 DLL访问,我可以从Windows应用程序(delphi 9)使用它?这不一定是免费的软件包;我愿意付钱。我知道您可以制作 PDF 表格并重新处理这些表格......这不是我需要的。我需要对打印文档进行 OCR,但出现问题。
I am generating a pdf for a client. This has two columns ... ID and a blank column for the end user to put in some character. I want the client to be able to upload a bmp/jpg/tif whatever (i can specify) image of the printed pdf with its two columns and turn it into a csv/tab/whatever file with the values of the two columns. Can anyone recommend an ocr package that I can access from either a php web PHP or a win32 DLL that I can use from a Windows App (delphi 9)? This doesn't have to be a free package; I am willing to pay. I am aware that you can do forms in PDF and reprocess those ... that is not what I need. I need to OCR a printed document problematically.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您见过 Tesseract OCR
它是 C,但我假设你可以在 Delphi 中交互
Have you seen Tesseract OCR
It's C but I assume you can interact in Delphi