用于 PDF 到图像转换的开源库

发布于 2024-10-27 01:17:57 字数 1136 浏览 3 评论 0原文

可能的重复:
将 PDF 页面导出为 Java 中的一系列图像

请推荐一些好的java 库,可用于PDF 文件到图像的转换。 我尝试使用 PDFBox: http://pdfbox.apache.org/ 但在转换为图像后我的大部分pdf 文件中的文本在图像中出现乱码。它将“T”读作“Y”,将“C”读作“#”,依此类推。

以下是我用于相同目的的代码片段:

PDDocument document = null;  
document = PDDocument.load( pdfFile );  
List  pages = document.getDocumentCatalog().getAllPages();  
for( int i=startPage-1; i<endPage && i<pages.size(); i++ )  
{  
  try  
  {  
    PDPage page = (PDPage)pages.get( i );  
    BufferedImage  image = page.convertToImage();  
  }  
}  
document.close(); 

我猜这是他们在渲染字体时遇到的一些问题。 如果您认为我在使用 PDFBox 时可能遗漏了某些内容,请告诉我。

请建议任何其他替代方案。

我尝试过使用 jPedal: http://www.jpedal.org/ 效果很好,但效果不佳免费,所以请建议所有好的替代方案。

Possible Duplicate:
Export PDF pages to a series of images in Java

Please suggest some good java libraries which can be used for a PDF file to image conversion.
I tried using PDFBox: http://pdfbox.apache.org/ but after conversion to image most of my text from the pdf file was garbled in the image. It read a 'T' as a 'Y' a 'C' as a '#' and so on.

Following is the code snippet I used for the same:

PDDocument document = null;  
document = PDDocument.load( pdfFile );  
List  pages = document.getDocumentCatalog().getAllPages();  
for( int i=startPage-1; i<endPage && i<pages.size(); i++ )  
{  
  try  
  {  
    PDPage page = (PDPage)pages.get( i );  
    BufferedImage  image = page.convertToImage();  
  }  
}  
document.close(); 

I guess it is some issue that they have with rendering fonts.
In case u think I might have missed something out while using PDFBox please let me know.

Please suggest any other alternatives as well.

I have tried using jPedal: http://www.jpedal.org/ which works out fine but its not free so please suggest about all good alternatives on this.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文