如何在没有 microsoft.office.interop 的情况下将 PDF 转换为 doc?

发布于 2024-11-03 02:10:41 字数 99 浏览 7 评论 0原文

我需要使用 C# 将 PDF 文件转换为 .doc 文件。尽管计算机没有安装 Office,但没有文件系统。我有什么好主意可以解决这个问题吗?我做了一些研究,大多数人都使用互操作服务。

I need to convert PDF files into .doc files using C#. The computer has no file system though it doesn't have Office installed. Any good ideas how I can approach this? I did some research and most of people use the interop services.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

掩饰不了的爱 2024-11-10 02:10:41

您需要了解 PDF 并不是真正作为单一文档格式实现的。

如果您的 PDF 文档是通过将文本渲染为 PDF 文件而创建的,那么直接 PDF 转换不仅是可能的,而且可能非常好(可靠)。

如果您的 PDF 来源是扫描仪或传真机(本质上是扫描仪...),那么您拥有的就是带有文本“图片”的文档。这种情况比较难处理。如果您为此打开标记,则没有要转换的“文本”。在这种情况下,您必须处理某种 OCR(光学字符识别)方式,由于各种问题,这种方式不太可靠。

如果您可以选择在将数据呈现为 PDF 之前拦截数据(例如在 SSRS 或 Crystal 中),那么您最好绕过 PDF 阶段并将数据移动到 Word 文档。

如果您不得不接收传真,然后需要解释其内容,请为 OCR 地狱做好准备。自从我在那里已经有一段时间了,所以我希望它变得更好。

即使您的计算机上没有安装 Office,您也可以(使用 Visual Studio)访问 Office 开发人员工具包,该工具包将允许您构建要以 Word 格式分发的文档(.doc/.docx)。

You need to understand that PDF is not really implemented as a single document format.

If your PDF docs are created by rendering text to a PDF file, then direct PDF conversion is not only possible, but can be very good (reliable).

If the source of your PDF is either a scanner or fax (essentially a scanner...) then what you have is a document with an "picture" of text. This scenario is more difficult to deal with. If you open up the markup for this there is no 'text' to be converted. In this situation you have to deal with some manner of OCR (optical character recognition) which is less reliable due to a variety of issues.

If you have the option of intercepting the data before it is rendered to PDF (say like in SSRS or Crystal) then it would be better for you to bypass the PDF stage and move your data to a Word document.

If you are constrained to receiving faxes and then needing to interpret their content, prepare for OCR hell. It has been a while since I was there, so I hope that it has gotten better.

Even with out office installed on your machine, you have access (with Visual Studios) to the Office developer toolkit which will allow you build documents to be distributed in the Word formats.(.doc/.docx).

ゞ花落谁相伴 2024-11-10 02:10:41

一个选项/想法可能是将 PDF 转换为 Html,可以在 Word 中打开?

An option/idea may be to convert the PDF to Html, which can be opened in Word?

放手` 2024-11-10 02:10:41

使用 aspose pdf 工具包将 pdf 转换为文本,然后使用 filestream 或 aspose doc 将文本转换为 doc

use aspose pdf kit to conver pdf to text and then text to doc using filestream or aspose doc

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文