当前位置：文江博客话题详情

PDF Unicode acrobat

如何从非 ASCII 编码的 PDF 中剪切粘贴？

发布于 2025-01-02 15:35:38 字数 266 浏览 0 评论 0原文

我有一些 PDF，我正在尝试将其中包含的文本从 Acrobat Reader 剪切并粘贴到 HTML 表单中。似乎其中一些文件使用（我怀疑）unicode 进行文本编码，因此当我尝试粘贴到 HTML 表单（在 Firefox 上）时，我得到的是带有十六进制字符的小框，而不是可读的文本。问题不在于 PDF 尚未经过 OCRed - 当我尝试在 Acrobat Pro 中执行此操作时，它说不能，因为该文件已包含可渲染文本。有什么办法可以解决这个问题吗？例如，我可以在表单中添加某种 JavaScript 来进行转换吗？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（9）

我还不会笑 2025-01-09 15:35:38

您是否能够将从文件复制的文本粘贴到其他程序（例如记事本、Word 或任何其他程序）中？

某些 PDF 文件在生成时没有特殊信息，而这些信息对于成功从中提取文本至关重要。即使使用 Adobe 工具也是如此。基本上，此类文件不包含字形到字符的映射信息。

此类文件可以正常显示和打印，但无法正确复制/提取其中的文本。

例如，当使用“最小文件大小”预设时，Distiller 会生成此类文件。

回复收藏 0 原文

我不咬妳我踢妳 2025-01-09 15:35:38

我有同样的问题...确实在这里解释： http://forums.adobe.com/thread /915012

我的解决方案是使用Acrobat的导出工具将pdf转换为Word，然后从中提取我需要的信息。

这很令人沮丧，但确实有效。

我发现的另一个解决方案是将 pdf 转换为图像（jpeg、png 等），然后运行 OCR 过程。

回复收藏 0 原文

骷髅 2025-01-09 15:35:38

在 Acrobat 中选择文本。
右键单击并从上下文菜单中选择“带格式复制”。
等待进度条处理文本。
粘贴到Word文档中。

回复收藏 0 原文

内心旳酸楚 2025-01-09 15:35:38

文本很可能包含正确复制的字符，但由于缺乏合适的字体，您的浏览器无法显示它们。 PDF 文档可能包含嵌入字体，因此 Adobe Reader 可以正常显示字符，但浏览器无法访问这些字体。

您可以通过尝试复制并粘贴此处的字符来检查这是否是原因（无论如何，这可能是有关问题的有用信息）。您还可以下载并安装 Code200x 字体，其中几乎包含您通常会遇到的任何字符。（不能保证，但很可能，Firefox 将能够在需要时自动使用这些字体。）

回复收藏 0 原文

白色秋天 2025-01-09 15:35:38

我们在尝试将 PDF 文件中的西里尔字母复制/粘贴到 Excel 时遇到了类似的问题。

我们发现的最简单的解决方案是使用浏览器（Chrome、Mozilla 或 Opera）打开 .pdf，然后将文本复制/粘贴到 Word、Excel 中。

正如预期的那样，它不适用于 IE。

回复收藏 0 原文

看轻我的陪伴 2025-01-09 15:35:38

如果以上方法都不适合您，就像它对我不起作用一样，您可以截取 pdf 的屏幕截图并使用 Google Lens（在 Android 手机中）打开它，然后进入文本部分，AI 会检测文本自动，您可以根据需要复制它。

回复收藏 0 原文

神经暖 2025-01-09 15:35:38

我遇到了同样的问题，但我通过使用网络浏览器（在我的例子中是chrome）打开PDF文件解决了这个问题。
复制粘贴非 ASCII 编码在 Chrome 中运行良好。

回复收藏 0 原文

烟柳画桥 2025-01-09 15:35:38

您可以从 acrobat 导出为 jpeg，然后在 acrobat（而不是阅读器）中打开 jpeg，然后运行 OCR 工具。从那里您应该能够复制/粘贴。

回复收藏 0 原文

笨死的猪 2025-01-09 15:35:38

我正在使用 Nitro Pdf。首先，我从 pdf 创建了 600 dpi 的图像。然后我在新的 pdf 文件中打开图像。然后在“审阅”选项卡中我使用了 OCR 选项。这将我带到另一个带有标准编码 pdf 文件的 pdf 文件，我可以在其中复制和粘贴文本。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

紫罗兰の梦幻

文章 0 评论 0

-2134

文章 0 评论 0

liuxuanli

文章 0 评论 0

意中人

文章 0 评论 0

○愚か者の日

文章 0 评论 0

xxhui

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文