CGPDFScanner、Identity-H 和解压缩

发布于 2024-11-07 14:42:13 字数 434 浏览 6 评论 0原文

我的 CGPDFScanner 实例正在扫描测试 pdf 文件。

在给定时间，当前字体字典具有 Encoding 值 Identity-H 和带有键 FontFile2 的 FontDescriptor 字典。这个键恰好是一个流值，它的字典有键Filter。该键的值为 FlateDecode。

我不确定如何解释和使用它（例如，将下一个 Tj 块中的文本提取为 Unicode）。例如，我是否只对下一个 Tj 块中的字节进行 zlib 解压缩？（这里没有 ToUnicode 键。）

我以为所有解压都是由 CGPDFScanner 实例执行的。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

玩物 2024-11-14 14:42:13

如果字体使用 Identity-H 编码并且没有 ToUnicode 条目，则无法提取文本。 Tj 运算符的参数是字形索引序列，如果没有 ToUnicode 条目，则该序列无法转换为文本。

FontFile2 条目存储实际的字体文件，在从 PDF 文件中提取文本时它没有任何作用。

回复收藏 0 原文

~没有更多了~

关于作者

薄荷梦

暂无简介

0 文章

0 评论

24 人气

关注发私信

missyouangeled

文章 0 评论 0

关注

三生一梦

文章 0 评论 0

关注

压抑⊿情绪

文章 0 评论 0

关注

天涯离梦残月幽梦

文章 0 评论 0

关注

指尖微凉心微凉

文章 0 评论 0

关注

☆獨立☆

文章 0 评论 0

友情链接

文江博客

CGPDFScanner、Identity-H 和解压缩

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签