如何引用 Windows 内置的 PDF IFilter (dll) 接口以通过经典 ASP 提取 pdf 文档的文本和属性
我想提取 PDF 文件的文本和属性(作者、标题等)。
我需要在经典 ASP 环境中从 pdf 文件中提取并解析文本。 我读过另一篇关于使用与 Adobe Acrobat 9 一起安装的 PDF iFilter 驱动程序的文章,可以通过 COM 引用该驱动程序。
这可能吗? 如果是这样,我该如何开始?
I want to extract text and properties (author, title, etc.) of PDF file.
I need to extract and parse Text from a pdf file in a classic ASP environment. I read another post about using the PDF iFilter driver installed with Adobe Acrobat 9 which can be referenced through COM.
Is this possible? If so, how do I get started?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如果您知道 COM 类名或 clsid,则应该能够使用 Server.CreateObject() 来获取实例。 然后,您应该能够对其调用 IFilter 方法。
If you know the COM class name or clsid, you should be able to use Server.CreateObject() to get an instance. You should then be able to call IFilter methods on it.