如何使用PDFBOX0.8.0获取pdf嵌入字体

发布于 2024-12-15 13:33:29 字数 952 浏览 6 评论 0原文

我的代码：

        FileInputStream pdfFile = new FileInputStream("C:/work/pdf2tiff/test.PDF");
        PDDocument pdDocument = PDDocument.load(pdfFile, true);

        PDDocumentCatalog catalog = pdDocument.getDocumentCatalog();
        List pages = catalog.getAllPages();

        if (pages != null && pages.size() > 0) {

            for (int i = 0; i < pages.size(); i++) {
                PDPage page = (PDPage) pages.get(i);
                Map fonts = page.getResources().getFonts();
                System.out.println("fonts=" + fonts);

我得到输出：

字体={F0=org.apache.pdfbox.pdmodel.font.PDType1Font@8aaed5，
F4=org.apache.pdfbox.pdmodel.font.PDType0Font@dc4414, F2=org.apache.pdfbox.pdmodel.font.PDType0Font@f98ce0, F6=org.apache.pdfbox.pdmodel.font.PDTrueTypeFont@18fcdce}

为什么字体映射的键是 F0/F1/F2/F6？这些是什么意思？我应该迭代所有 pdf 页面以获得所有字体吗？

感谢您的回答。

原文

My code:

        FileInputStream pdfFile = new FileInputStream("C:/work/pdf2tiff/test.PDF");
        PDDocument pdDocument = PDDocument.load(pdfFile, true);

        PDDocumentCatalog catalog = pdDocument.getDocumentCatalog();
        List pages = catalog.getAllPages();

        if (pages != null && pages.size() > 0) {

            for (int i = 0; i < pages.size(); i++) {
                PDPage page = (PDPage) pages.get(i);
                Map fonts = page.getResources().getFonts();
                System.out.println("fonts=" + fonts);

I got output:

fonts={F0=org.apache.pdfbox.pdmodel.font.PDType1Font@8aaed5,
F4=org.apache.pdfbox.pdmodel.font.PDType0Font@dc4414,
F2=org.apache.pdfbox.pdmodel.font.PDType0Font@f98ce0,
F6=org.apache.pdfbox.pdmodel.font.PDTrueTypeFont@18fcdce}

Why the fonts map's key is F0/F1/F2/F6? What these mean?
Should I iterate all pdf pages get all fonts?

Thanks for your answer.

分享到QQ

分享到微博