当前位置：文江博客话题详情

在 itextSharp 中使用 LocationTextExtractionStrategy 获取文本坐标

发布于 2024-12-05 16:00:45 字数 397 浏览 0 评论 0原文

我的目标是从 PDF 中检索数据，这些数据可能位于 Excel 文件的表结构中。

将 LocationTextExtractionStrategy 与 iTextSharp 结合使用，我们可以以纯文本形式获取字符串数据，并以从左到右的方式获取页面内容。

我怎样才能继续前进，以便在

PdfTextExtractor.GetTextFromPage(reader, i, new LocationTextExtractionStrategy())

我可以使文本在结果字符串中保留其坐标。

例如，如果 pdf 中的第一行文本右对齐，则生成的字符串必须包含尾随空格或保持内容右对齐的空格。

请给出一些建议，我如何才能实现同样的目标。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

乜一 2024-12-12 16:00:45

了解 PDF 不支持表格这一点非常重要。任何看起来像表格的东西实际上只是放置在线条背景上特定位置的一堆文本。这非常重要，您在处理此问题时需要牢记这一点。

也就是说，您需要子类化 TextExtractionStrategy 并将其传递给 GetTextFromPage()。请参阅这篇文章举一个简单的例子。然后查看这篇文章了解更复杂的子类化示例。后者与您的目标并不完全相关，但它确实显示了您可以做的一些更复杂的事情。

回复收藏 0 原文

~没有更多了~

关于作者

素年丶

暂无简介

0 文章

0 评论

22 人气

关注发私信

已经忘了多久

文章 0 评论 0

关注

15867725375

文章 0 评论 0

关注

LonelySnow

文章 0 评论 0

关注

走过海棠暮

文章 0 评论 0

关注

轻许诺言

文章 0 评论 0

关注

信馬由缰

文章 0 评论 0

友情链接

文江博客

在 itextSharp 中使用 LocationTextExtractionStrategy 获取文本坐标

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签