免费的 OCR SDK for .net,可以将文本、带格式的表格和图像提取到 Office Word 文档中
我想要一个免费的 OCR SDK,它可以从扫描的文档文件(.tiff、.png 等)中提取文本、包含数据的表格和图像并存储到 Office Word 文档文件中。
请帮我解决这个问题。我已经使用 MODI 仅从图像中提取文本,但无法使用 MODI 获取如何提取表格和图像并存储到 Office Word 文档文件中的方法。
I want to have a free OCR SDK which can extract text, tables with data and images from scanned document files (.tiff,.png etc) and store into Office Word document file.
Please help me to short out this issue. I have already done extracting text only from images using MODI but could not get the way using MODI how to extract tables and images and store into Office Word Document file.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我不确定开源 SDK 是否可以解决您的任务。根据您的描述,我发现您需要一个具有文档逻辑结构重建功能的复杂 ocr 应用程序。如果您正在规划商业软件,您可以查看ABBYY FineReader Engine。它有一套文档分析和重建功能,提供c#的api,而且是免费的去尝试。对于免费使用的程序来说,价格昂贵,但对于商业软件而言,ABBYY OCR 技术可以为您的产品增加巨大的价值,因此请考虑尝试一下。我在 ABBYY 工作,如有必要,可以为您提供更多信息。
最好的问候,尼古拉。
I’m not sure whether opensource SDKs can solve your tasks. Based on what you describe I see that you need a complex ocr application with document logical structure reconstruction functions. If you are planning business software you may look at ABBYY FineReader Engine. It has a set of document analyzing and reconstruction features, provides api for c# and it’s free to try. It’s not affordable for free-to-use programs, but when it comes to business software – ABBYY OCR technologies can add a serious value to your product, so consider trying it out. I work @ ABBYY and can provide you additional info if necessary.
Best regards, Nikolay.