在python中将pdf(有图像)转换为word文件(doc,docx)
我有一个包含多个图像的 pdf 文件,我想将其转换为可编辑的 Word 文档。 我使用WPS应用程序进行文字编辑。 我已经尝试过下面的代码,但这只会打开 pdf…
PHP PdfToText 坐标无法识别
我需要帮助,我对这个问题快要疯了。 我正在使用 Php 中的 PdfToText 库来识别我感兴趣的文本部分,但我不明白为什么我不能。 从您在这里找到的文档中…
获取 pdf 坐标以进行文本提取
我正在使用 pdftotext 提取 PDF 某些部分的文本,但发现 x、y和W、H坐标定位是非常困难的。我不确定是否有工具可以做到这一点。 我尝试将 pdf 导入 in…
如何从 PDF 文件中的特定区域提取数据
请参阅此 pdf 我想要此 pdf 中的数据 "91815380284", "BeneficiaryName"=>"Kavita", "Gender" => "Female",…
如何将点击的单词从 pdf 发送到 API 调用?
我正在下一个 js 创建一个反应应用程序并遇到了问题。我想点击显示的 pdf 中的一个单词并将其发送到 API 调用。我之前见过一些 pdf 到文本的解决方案…
使用 Foxit SDK 提取 pdf 文本
我正在使用 Foxit SDK 从 Pdf 文档中提取文本。 一切都很好,但是当我提取其他语言而不是英语的 pdf 时,我没有得到正确的输出。 我也在java中使用过P…
无需 pdftotext 将 PDF 转换为文本?
我必须将 PDF 转换为文本,目前我正在使用 pdftotext.exe。这有时会弄乱生成的文本,所以我不能使用它。 我可以从另一个程序调用另一个免费工具吗?我…
我想使用java在PDF文档中添加一行
我目前正在使用 PDFBox 并从文件夹 1 中找到的 a.pdf 中进行阅读, 我首先列出了该文件夹中找到的所有 Pdf 文件。 然后我检查每个文件的页数。 现在我…
PDFtotext - 命令行上显示为 aacute 的空格
我正在使用 python 从使用 pdftotext 从 pdf 创建的文本文件中提取文本。它是 2000 个文件之一,在这个特定的文件中,一行关键字以 EU 结尾。该行的其…
当我从本地计算机更改为虚拟主机时,从 python 脚本调用 pdftotext 不起作用
我编写了一个小的 python 脚本来解析/提取 PDF 中的信息。我在本地机器上测试了它,我有 python 2.6.2 和 pdftotext 版本 0.12.4。 我正在尝试在我的…
在 python 中使用 subprocess.popen 和 os.tmp 文件,同时传递可选参数
我正在Linux中编写一个Python程序,其中一部分运行pdftotext可执行文件来转换pdf文本。我当前使用的代码如下。 pdfData = currentPDF.read() tf = os.…
解析大型 PDF 文件的方法
我有一个非常大的 PDF 文件(200,000 KB 或更多),其中包含一系列页面,仅包含表格。我想使用 Ruby 以某种方式解析这些信息,并将结果数据导入 MySQL…
使用 pdfcreator 处理 pdf 等图像数据或其他内容
干草所有。 也许你们可以帮助我完成我的项目。 我使用 pdfcreator 作为虚拟打印机来将一些图像打印到文件中。 可以是pdf,也可以是任何类型的图像。但…
适用于 Linux 的 CLI pdf 查看器
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …