PDFBox

PDFBox

文章 16 浏览 84

在 Solr 中解析 PDF 的 Tika/PDFBox 的替代方案(1.4 之后的任何版本)

似乎 Solr 没有正确解析我的 PDF 文件。我想知道是否有其他替代方法可以使用 Apache Tika(我相信它内部使用 PDFBox)来解析 PDF 文件?使用此功能时…

爺獨霸怡葒院 2024-12-15 20:53:44 3 0

使用 PDFBox 将文本写入多边形

我发现了如何使用drawText将文本写入页面,并且使用drawPolygon将多边形显示在正确的位置。 问题是,当我只绘制文本时它可以工作,但是一旦我绘制多边…

↙温凉少女 2024-12-15 16:06:25 1 0

如何使用PDFBOX0.8.0获取pdf嵌入字体

我的代码: FileInputStream pdfFile = new FileInputStream("C:/work/pdf2tiff/test.PDF"); PDDocument pdDocument = PDDocument.load(pdfFile, true…

最终幸福 2024-12-15 13:33:29 1 0

在使用 PDFBox 外部 jar 来处理 PDF 文档时,出现 NoClassDefFound 异常

我正在为我的项目使用 Eclipse IDE,其中我已将“pdfbox-1.6.0.jar”添加到项目的外部 jar 中。当我编写导入此 jar 文件的 API 的代码时,Eclipse 没…

上课铃就是安魂曲 2024-12-15 07:17:48 1 0

Solr ExtractingRequestHandler pdf文本提取

我在 Solr 的 pdf 文本提取方面遇到问题。 Solr 使用 Apache Tika 来提取 PDF 文件的文本,而 tika 使用 PDFBox 来提取 PDF 文件的文本。当我将 PDF …

小猫一只 2024-12-13 22:04:23 2 0

Maven2 Eclipse 插件

我刚刚向项目添加了依赖项,以便我的 jar(特别是 pdfbox 1.6)可以看到其他 jar。右键单击 Maven 提供的项目功能添加依赖项后,我如何确保依赖项有效…

天暗了我发光 2024-12-13 21:29:05 1 0

LucenePDFDocument 是否已从 pdfbox 中消失?

我正在升级项目中的库,并将 pdfbox 从 0.6.7 升级到版本 1.6.0,但找不到 LucenePDFDocument 类。 Apache 页面上的文档/教程中仍然提到了该类。有什…

〆凄凉。 2024-12-13 02:48:36 1 0

XMP 元数据的自定义架构

我想将自定义元数据写入 XMP 标准架构不支持的 pdf 文件,因此我编写了自己的架构,其中包含我自己的属性。我可以使用 PDFBox 或 iTextPDF 库成功地将…

梦回旧景 2024-12-12 22:31:10 3 0

PDFBox 在单词中添加空格

当我尝试从 PDF 文件中提取文本时,它似乎在几个单词之间随机插入空格。 我在本页下载部分的以下示例文件中使用 pdfbox-app-1.6.0.jar(最新版本): …

始终不够 2024-12-12 13:29:39 2 0

使用pdfbox复制一页n次

我制作了一个单页pdf模板文件。然后,我使用 pdfbox 创建一个包含“n”页数的 pdf(取决于报告大小)。我希望所有“n”页都是模板 pdf 文件中的页面。…

指尖上得阳光 2024-12-10 23:09:47 3 0

用pdfbox分割pdf,但丢失字体

我使用 pdfbox API 用 Ja​​va 编写了一些代码,将 pdf 文档拆分为单独的页面,在页面中查找特定字符串,然后从包含该字符串的页面创建一个新的 pdf…

匿名。 2024-12-07 20:16:43 2 0

如何使用 PDFBox drawString 插入换行符

我必须制作一个带有表格的 PDF。到目前为止它工作正常,但现在我想添加一个包装功能。所以我需要插入换行符。 contentStream.beginText(); contentStr…

各自安好 2024-12-07 02:39:03 3 0

线程“main”中的异常java.lang.NoClassDefFoundError: org/apache/commons/logging/LogFactory

我正在java中使用pdfbox将pdf转换为图像。但是当我编译时我收到了消息 线程“main”中出现异常 java.lang.NoClassDefFoundError: org/apache/commons…

一腔孤↑勇 2024-12-06 16:09:58 3 0

解析二进制文件时出错

将 PDFBOX 版本升级到 1.6.0 后,我尝试使用 Apache Tika 解析 pdf 文件...并且我开始在少数 pdf 文件中收到此错误。 有什么建议吗? java.io.IOExcep…

记忆で 2024-12-05 11:23:47 2 0

Java - pdfbox无法导入jar?

大家好,请有人帮我解决这个简单问题,我相信...我已经在 java 聊天网站上询问了超过 8 位专家,但似乎没有人可以帮助我:(。 我已经从以下位置下载了 …

恋你朝朝暮暮 2024-12-04 13:29:24 4 0
更多

推荐作者

紫罗兰の梦幻

文章 0 评论 0

-2134

文章 0 评论 0

liuxuanli

文章 0 评论 0

意中人

文章 0 评论 0

○愚か者の日

文章 0 评论 0

xxhui

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文