如何从PDF页面获取文本?
如何在 Objective-C 中获取 PDF 页面中的文本?
How can I get the text from PDF page in Objective-C?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
如何在 Objective-C 中获取 PDF 页面中的文本?
How can I get the text from PDF page in Objective-C?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(2)
首先 - 放弃任何“快速而肮脏”的 PDF 解析解决方案 - 它会惨败。我的同事花了很多时间试图在iOS中正确解决这个问题。他的前 3 个(按质量降序)选项:
Mac OS X 可以有更多选项,但我不知道。
First of all - give up on any "quick & dirty" solution for parsing PDF - it will fail miserably. My colleague spent a lot of time trying to solve this problem correctly in iOS. His top 3 (by quality, descending) options:
There can be more options with Mac OS X but I don't know them.
这是适用于 iOS 或 OS X 的吗?如果对于 OS X,您可以简单地创建一个 Automator 工作流程来提取文本,并从您的应用程序中调用该工作流程。 Automator 有一个 PDF 操作“提取 PDF 文本”就是为了这个目的。 Automator 框架 允许调用自动化操作从您的应用程序。一些示例代码可以在 http://rogueamoeba.com/utm/2005/06/ 找到03/(请注意,实际代码已更新以利用 Automator 框架)。
Is this for iOS or OS X? If for OS X you could simply create an Automator workflow to extract the text, and call that workflow from your app. Automator has a PDF action "Extract PDF Text" for exactly this purpose. The Automator framework allows calling of automator actions from your app. And some sample code can be found at http://rogueamoeba.com/utm/2005/06/03/ (note that the actual code has been updated to make use of the Automator framework).