当前位置：文江博客话题详情

为什么pdf文档无法搜索？

发布于 2024-08-16 19:57:35 字数 1459 浏览 5 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

聽兲甴掵 2024-08-23 19:57:35

至少有四种不同的方法可以将文本放入 PDF 文档（按顺序或可能性）：

使用标准文本操作符和标准字体放置文本
使用标准文本操作符和非标准字体
放置文本绘制一张或多张表示的图像文本
通过使用各种 PDF 图形命令手动绘制字形来放置文本

情况 1 通常是可搜索的。
如果字体和编码正常，则情况 2 是可搜索的 - 如果不是（非拉丁字体可能就是这种情况），那么可能没有可靠的方法将编码的字形映射回 Unicode（顺便说一下） - PDF 对 Unicode 相当不利）。
如果不了解 PDF 是如何生成的，情况 3 是完全无法搜索的。
案例4是完全无法搜索到的。

也就是说，所有案例都可以使用理解阿拉伯语的 OCR 引擎来阅读。我了解 Iris 引擎支持阿拉伯语。

回复收藏 0 原文

悲喜皆因你 2024-08-23 19:57:35

它实际上可能不是文本，或者可能位于 Reader 不注意的容器中。当您处理大多数人不会在系统上安装的字体时，将文本对象扩展为矢量形状尤其常见。它在屏幕上看起来相同，但无法搜索。

回复收藏 0 原文

~没有更多了~

关于作者

呆°

暂无简介

0 文章

0 评论

23 人气

关注发私信

ni139999

文章 0 评论 0

关注

Smile

文章 0 评论 0

关注

木子李

文章 0 评论 0

关注

仅此而已

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

内心激荡

文章 0 评论 0

友情链接

文江博客

为什么pdf文档无法搜索？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签