适用于多种文件类型的 IFilter 或 SDK?
有谁知道 .NET 中的 API/SDK 或 IFilter 可以从以下文件中读取主题(“标题”元数据)和文本:
.PDF .DOC .XLS .PPT .CSV 。TXT .DOCX .XLS .PPTX + OpenOffice 和开放文档标准。
开源会很棒......但商业也可以。
我到处都找不到任何东西!
Does anybody know of an API/SDK or IFilter in .NET that can read the subject ('title' metadata) and text from the following files:
.PDF
.DOC
.XLS
.PPT
.CSV
.TXT
.DOCX
.XLS
.PPTX
+ the OpenOffice and Open Document standards.
Open source would be awesome... but commercial is OK too.
I can't find anything anywhere!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我认为您无法找到一个能够访问所有这些类型的内容的 IFilter。通常,IFilter 将用于特定技术。
例如,Adobe 有一个用于 PDF 的工具,Microsoft 提供了一个适用于可以处理 Word、Excel、Powerpoint、CSV(我相信 Windows 已预装)的 Office。
I don't think you will be able to find a single IFilter that will be able to access the contents of all of those types. Typically, an IFilter will be for a specific technology.
For example, Adobe have one for PDFs, Microsoft provide one for Office that can do Word, Excel, Powerpoint, CSV (that I believe comes pre-installed with Windows).