将PDF转换为原始大小的图像
我有一个PDF文件,该文件是由单个PDF文件中连接的书的照片制成的。我正在尝试将其转换回PNG格式的单个图像,我尝试使用的每种工具都要求我设置DPI,以改变所产生图像的大小,是否有一种方法可以获取原始图像与原始图像完全相同的像素大小完全相同的图像?
I have a PDF file which is made of photographs of a book connected in a single PDF file. I'm trying to convert it back to single images in PNG format, every tool I tried asks me to set DPI which alters the size of resulting images, is there a way to get images of the exact same pixel size the original images were?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
大多数书籍的PDF每页都包含一个图像,根据扫描仪的不同,这些图像基本上可以采用三种不同的格式:JPEG,JPEG2000或TIFF。 JPEG2000很少使用,因此您的PDF可能包含JPEG和/或TIFF图像。
JPEG(和JPEG2000)图像的好处是,它们可以嵌入到PDF中!因此,您可以将图像存储在PDF中时提取图像。使用Tiff这有时也是可能的(但我认为并非总是如此……)。
如蒂姆·罗伯茨(Tim Roberts)所述,您应该尝试使用
pdfimages
或hexapdf images
查看和提取存储在PDF中的图像。这将为您带来最好的结果。Most PDFs of books contain a single image per page and depending on the scanner these images can basically be in three different formats: JPEG, JPEG2000 or TIFF. JPEG2000 is rarely used, so your PDF probably contains JPEG and/or TIFF images.
The good thing about JPEG (and JPEG2000) images is that they can be embedded as-is into a PDF! So you can extract the images as they are stored in the PDF. With TIFF this is also sometimes possible (but I don't think always...).
As mentioned by Tim Roberts you should try using
pdfimages
orhexapdf images
to view and extract the images stored in the PDF. This will give you the best result.