使用 PDPageContentStream.drawLine 时出现 pdfbox 错误
我正在使用 PDFBox 从用户输入的表单之一生成 pdf。为了绘制一条线,我使用 PDPageContentStream.drawLine 并使用 PDPageContentStream.drawString 绘…
如何防止我的 PDF 到 SVG 转换代码生成臃肿的内容?
我想将 PDF 转换为 SVG。我使用 Apache PDFBox 和 Batik 库编写了自己的 Java 程序。 PDDocument document = PDDocument.load( pdfFile ); DOMImpleme…
Apache PDFBox Java 库 - 是否有用于创建表的 API?
我正在使用 Apache PDFBox java 库来创建 PDF。有没有办法使用 pdfbox 创建数据表?如果没有这样的API来做到这一点,我需要使用drawLine等手动绘制表…
PDFBox - 使用 IKVM 构建最新版本的 .NET
我想构建最新版本的 PDFBox (http://pdfbox.apache.org/userguide /dot_net.html),用于我的 .NET 项目。 我对 Java 没有任何经验,但我正在使用此处…
.NET 项目最快的 PDF-> 文本库
我正在尝试创建一个应用程序,它基本上是我的 PDF 收藏的目录。我们谈论的是包含数万个 PDF 的 15-20GB。我还计划加入全文搜索机制。我将使用 Lucene.…
使用 PDFBox 解析 PDF 文件(尤其是表格)
我需要解析包含表格数据的 PDF 文件。我正在使用 PDFBox 提取文件文本以稍后解析结果(字符串)。问题是文本提取无法按照我对表格数据的预期工作。例…
PDFBox设置A5页面尺寸
开始使用 PDFBox PDDocument document = new PDDocument(); PDPage page = new PDPage(); document.addPage( page ); PDFont font = PDType1Font.HELV…
从 PDF 中复制和粘贴文本会产生垃圾
我正在写硕士论文——NLP系统。我有一个组件 - 提取器。 它从 PDF 文件中提取纯文本。有一些 PDF 文件无法正确提取。 Extractor(PDFBox 库)返回一个…
使用java一次读取一页pdf uploadstream
我正在尝试在 j2ee 应用程序中阅读 pdf 文档。 对于网络应用程序,我必须将 pdf 文档存储在磁盘上。 为了使搜索变得容易,我想对文档内的文本进行反向…
Java + PDFBox on Linux
I need to write a small program for a server which will use PDFBox. I'm writing under windows with NetBeans. How do I add PDFBox jar to my p…
PdfParser,我在用pdfbox 遇到这个问题
String result = null; FileInputStream is = null; PDDocument document = null; try { is = new File…
用JAVA实现对PDF内容的搜索以及提取相关内容
我想要实现用java对一系列pdf文档进行搜索,同时把包含Keyword的相应上下文内容都显示出来。目前,我用PDFBOX把内容提取出来进行搜索(只提取了文本用…
如何用Java调用打印机打印docx、PDF文档?
最近想做一个WebService提供在线打印服务,要求是可以使用网络打印机(如果较难实现可以退而求其次,使用在本机系统注册过的网络打印机)打印Office文…
PDFBox写入pdf时,如果是中文就会有乱码,如何解决
PDDocument document = PDDocument.load("E:\test\pdfbox\a0-a4.pdf"); PDPage page = getPage(document, 4); PDPageContentStream contentStream = n…