用于 PDF 到图像转换的开源库
可能的重复:
将 PDF 页面导出为 Java 中的一系列图像
请推荐一些好的java 库,可用于PDF 文件到图像的转换。 我尝试使用 PDFBox: http://pdfbox.apache.org/ 但在转换为图像后我的大部分pdf 文件中的文本在图像中出现乱码。它将“T”读作“Y”,将“C”读作“#”,依此类推。
以下是我用于相同目的的代码片段:
PDDocument document = null;
document = PDDocument.load( pdfFile );
List pages = document.getDocumentCatalog().getAllPages();
for( int i=startPage-1; i<endPage && i<pages.size(); i++ )
{
try
{
PDPage page = (PDPage)pages.get( i );
BufferedImage image = page.convertToImage();
}
}
document.close();
我猜这是他们在渲染字体时遇到的一些问题。 如果您认为我在使用 PDFBox 时可能遗漏了某些内容,请告诉我。
请建议任何其他替代方案。
我尝试过使用 jPedal: http://www.jpedal.org/ 效果很好,但效果不佳免费,所以请建议所有好的替代方案。
Possible Duplicate:
Export PDF pages to a series of images in Java
Please suggest some good java libraries which can be used for a PDF file to image conversion.
I tried using PDFBox: http://pdfbox.apache.org/ but after conversion to image most of my text from the pdf file was garbled in the image. It read a 'T' as a 'Y' a 'C' as a '#' and so on.
Following is the code snippet I used for the same:
PDDocument document = null;
document = PDDocument.load( pdfFile );
List pages = document.getDocumentCatalog().getAllPages();
for( int i=startPage-1; i<endPage && i<pages.size(); i++ )
{
try
{
PDPage page = (PDPage)pages.get( i );
BufferedImage image = page.convertToImage();
}
}
document.close();
I guess it is some issue that they have with rendering fonts.
In case u think I might have missed something out while using PDFBox please let me know.
Please suggest any other alternatives as well.
I have tried using jPedal: http://www.jpedal.org/ which works out fine but its not free so please suggest about all good alternatives on this.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
尝试 icePDF
Try icePDF