处理 iPhone/iPad 上使用 CGPDFScanner 获得的 PDF 文本矩阵 (Tm) 值

发布于 2024-10-24 22:12:34 字数 1233 浏览 0 评论 0原文

我正在尝试解析 pdf 内容以便搜索和突出显示文本。我设法使用 CGPDF 的东西来查找带有 TJ 和 Tj 运算符的文本，并说出该单词在哪一页。问题来自于突出显示。

我关注了许多其他帖子，例如获取文本位置或此Pdf 搜索。

我知道文本定位的运算符是 Tm （文本矩阵）、TD 和 Td （也许是 T*），但我不知道如何使用这些信息。

当我打印 Tm 值时，我得到一个九位数的整数，我可以假设这是一个 3x3 矩阵。我可以给你输出：

2011-03-23 10:59:07.894 PDFSearch[11035:40b] BT(I) 161361744：
2011-03-23 10:59:07.896 PDFSearch[11035:40b] TM(I) 161361104：
2011-03-23 10:59:07.897 PDFSearch[11035:40b] Tf(I) 161361616：
2011-03-23 10:59:07.899 PDFSearch[11035:40b] TJ: R
2011-03-23 10:59:07.899 PDFSearch[11035:40b] TJ: e
2011-03-23 10:59:07.901 PDFSearch[11035:40b] TJ: t
2011-03-23 10:59:07.901 PDFSearch[11035:40b] TJ：我
2011-03-23 10:59:07.903 PDFSearch[11035:40b] TJ: co
2011-03-23 10:59:07.903 PDFSearch[11035:40b] TJ: l
2011-03-23 10:59:07.905 PDFSearch[11035:40b] TJ: o
2011-03-23 10:59:07.907 PDFSearch[11035:40b] ET(I) 161361872：

知道如何使用它来查找文本定位吗？并用它在带有quartz2D的pdf视图上绘制一个框？

谢谢：）

原文