如何引用 Windows 内置的 PDF IFilter (dll) 接口以通过经典 ASP 提取 pdf 文档的文本和属性

发布于 2024-07-17 07:16:19 字数 183 浏览 14 评论 0原文

我想提取 PDF 文件的文本和属性(作者、标题等)。

我需要在经典 ASP 环境中从 pdf 文件中提取并解析文本。 我读过另一篇关于使用与 Adob​​e Acrobat 9 一起安装的 PDF iFilter 驱动程序的文章,可以通过 COM 引用该驱动程序。

这可能吗? 如果是这样,我该如何开始?

I want to extract text and properties (author, title, etc.) of PDF file.

I need to extract and parse Text from a pdf file in a classic ASP environment. I read another post about using the PDF iFilter driver installed with Adobe Acrobat 9 which can be referenced through COM.

Is this possible? If so, how do I get started?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

一城柳絮吹成雪 2024-07-24 07:16:19

如果您知道 COM 类名或 clsid,则应该能够使用 Server.CreateObject() 来获取实例。 然后,您应该能够对其调用 IFilter 方法。

If you know the COM class name or clsid, you should be able to use Server.CreateObject() to get an instance. You should then be able to call IFilter methods on it.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文