如何查找pdf中文本的x,y位置
有没有工具可以找到pdf文件中文本内容的XY位置?
Is there any tool to find the X-Y location on a text content in a pdf file ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
有没有工具可以找到pdf文件中文本内容的XY位置?
Is there any tool to find the X-Y location on a text content in a pdf file ?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(3)
Docotic.Pdf Library 可以做到。请参阅下面的 C# 示例:
Docotic.Pdf Library can do it. See C# sample below:
尝试在 Acrobat 中运行“印前检查...”并选择
PDF Analysis ->列出页面对象,按对象类型分组
。如果您在结果列表中找到文本对象,您会注意到“文本属性 ->”中有一个位置值(以磅为单位)。 * 字体部分。
Try running "Preflight..." in Acrobat and choosing
PDF Analysis -> List page objects, grouped by type of object
.If you locate the text objects within the results list, you will notice there is a position value (in points) within the
Text Properties -> * Font
section.TET,来自pdflib 系列产品可以做到这一点。 TET 有一个命令行界面,它是我所知道的所有文本提取工具中最强大的。 (它甚至可以处理连字......)
TET, the Text Extraction Toolkit from the pdflib family of products can do that. TET has a commandline interface, and it's the most powerful of all text extraction tools I'm aware of. (It can even handle ligatures...)