适用于多种文件类型的 IFilter 或 SDK?

发布于 2024-08-07 16:56:18 字数 189 浏览 6 评论 0原文

有谁知道 .NET 中的 API/SDK 或 IFilter 可以从以下文件中读取主题(“标题”元数据)和文本:

.PDF .DOC .XLS .PPT .CSV 。TXT .DOCX .XLS .PPTX + OpenOffice 和开放文档标准。

开源会很棒......但商业也可以。

我到处都找不到任何东西!

Does anybody know of an API/SDK or IFilter in .NET that can read the subject ('title' metadata) and text from the following files:

.PDF
.DOC
.XLS
.PPT
.CSV
.TXT
.DOCX
.XLS
.PPTX
+ the OpenOffice and Open Document standards.

Open source would be awesome... but commercial is OK too.

I can't find anything anywhere!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

轮廓§ 2024-08-14 16:56:18

我认为您无法找到一个能够访问所有这些类型的内容的 IFilter。通常,IFilter 将用于特定技术。

例如,Adobe 有一个用于 PDF 的工具,Microsoft 提供了一个适用于可以处理 Word、Excel、Powerpoint、CSV(我相信 Windows 已预装)的 Office。

I don't think you will be able to find a single IFilter that will be able to access the contents of all of those types. Typically, an IFilter will be for a specific technology.

For example, Adobe have one for PDFs, Microsoft provide one for Office that can do Word, Excel, Powerpoint, CSV (that I believe comes pre-installed with Windows).

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文