C# 读取word文档
我想阅读服务器中的word文档(doc和docx)。服务器没有 安装了office,因此我不能使用com对象,也不能使用商业软件。
有没有办法让我单独使用office工具,阅读word docs(2003年和2007年)
I want to read a word document in the server (both doc and docx). The server does not have
office installed, therefore i can't use com objects and also no commercial softwares.
Is there a way that I can use office tools alone and read the word docs (2003 and 2007)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
不幸的是,没有很好的免费选项来读取 .doc 和 .docx 文件。即使是价格合理的商业选择也很少,但也有一些非常昂贵的选择。
对于读取 .doc 文件,我所知道的唯一免费选项是 POI for Java,您可以使用 IKVM 在 .NET 中运行它。然而,POI 的 SVN 存储库的一个实验分支支持 Word,所以我不知道它的效果如何。
http://poi.apache.org/
http://www.ikvm.net/
如果您只想从 .doc 文件中取出文本而不关心格式,则可以使用 IFilter 通过 pinvoke 的 Win32 接口。
要读取 .docx 文件,您可以使用 Microsoft Office Open XML SDK。不过,不要让“SDK”欺骗了您,这是对直接处理 XML 的非常简单的抽象。使用起来几乎同样痛苦。
http://www .microsoft.com/downloads/en/details.aspx?FamilyId=C6E744E5-36E9-45F5-8D8C-331DF206E0D0&displaylang=en
Unfortunately there are no good free options for reading .doc and .docx files. Even commercial options are sparse at reasonable prices, but there are good extremely expensive options.
For reading .doc files the only free option I'm aware of is POI for Java which you can run in .NET using IKVM. However, Word support in an experimental branch of POI's SVN repository, so I don't know how well it works.
http://poi.apache.org/
http://www.ikvm.net/
If you just want the text out of the .doc file and don't care about formatting, you can use the IFilter Win32 interface through pinvoke.
For reading .docx files you can use Microsoft Office Open XML SDK. Don't let "SDK" fool you though, this is a very light abstraction over the dealing with the XML directly. It's almost as painful to use.
http://www.microsoft.com/downloads/en/details.aspx?FamilyId=C6E744E5-36E9-45F5-8D8C-331DF206E0D0&displaylang=en
对于 .docx,您的免费选项是 DocX。非常先进且易于使用。对于文档,我还没有看到免费的替代品。
For .docx your free option is DocX. Very advanced and easy to use. For doc I've not seen free alternative.
另一个仅适用于 .docx 文件的免费选项是 OpenXML SDK。
对于 .doc 和 .docx 文件,您可以使用免费版本的 GemBox.Document(如果文件相对而言)尺寸较小,否则您将需要他们的专业版本。
您可以打开并阅读< /a>任何Word格式都用它同样的方式,例如:
Another free option for only .docx files is OpenXML SDK.
For both .doc and .docx files you can use free version of GemBox.Document if the files have relatively smaller size, otherwise you'll need their pro version.
You can open and read any Word format with it in the same way, for example: