使用 ASP.NET 解析 Word 文档
我需要解析一个word文档并从该文件中找出一些关键词。我已经经历了一些读取文档文件的解决方案,例如使用 COM 或使用第三方工具。不使用这两个,还有其他方法读取word文档吗?我正在使用 asp.net 和 c#。
I need to parse a word document and find out some key words from that file. I have gone through some solutions to read doc files like using COM or using third party tools. Is there any other way to read word document without using these two? I am using asp.net with c#.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您可以使用 IFilter 接口,它是 Microsoft 索引服务的一部分。它支持二进制Word 文件。更多信息:
http://www.codeproject.com/KB/cs/IFilter.aspx< /a>
You can use the IFilter interface, which is part of Microsoft's Indexing Service. It supports binary Word files. More information:
http://www.codeproject.com/KB/cs/IFilter.aspx
没有亲自使用过这个,但 http://docx.codeplex.com/ 是推荐的 Word 之一流行的最有用的免费 .NET 库? 帖子中的文档操作库
Haven't personally used this but http://docx.codeplex.com/ is one of the recommended Word Doc Manipulation Libraries on the popular Most useful free .NET libraries? post