使用 abcpdf 列出 pdf 文档中的所有标签

发布于 2024-09-25 18:59:12 字数 240 浏览 4 评论 0原文

我正在尝试使用 AbcPdf .net 组件(版本 7)来处理一些 PDF 并生成元数据。我想知道是否有办法列出pdf文档中的所有标签?作为标记 pdf 的示例,我在此处使用此文件

是否有其他组件或工具可用于列出或提取 pdf 标签?

预先感谢您的帮助

I am trying to use the AbcPdf .net component (version 7) to process some PDFs and generate metadata. I was wondering if there is anyway to list all the tags in a pdf document? As an example of a tagged pdf, I am using this file here

Are there any other components or tools available for listing or extracting pdf tags?

Thanks in advance for you help

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

好久不见√ 2024-10-02 18:59:12

使用 iTextSharp。它是免费的,您只需要“itextsharp.dll”。

http://sourceforge.net/projects/itextsharp/

这是一个用于读出文本的简单函数PDF 的。

Public Shared Function GetTextFromPDF(PdfFileName As String) As String
    Dim oReader As New iTextSharp.text.pdf.PdfReader(PdfFileName)

    Dim sOut = ""

    For i = 1 To oReader.NumberOfPages
        Dim its As New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy

        sOut &= iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(oReader, i, its)
    Next

    Return sOut
End Function

ITextSharp 也有处理标签的方法。

Use iTextSharp. It's free and you only need the "itextsharp.dll".

http://sourceforge.net/projects/itextsharp/

Here is a simple function for reading the text out of a PDF.

Public Shared Function GetTextFromPDF(PdfFileName As String) As String
    Dim oReader As New iTextSharp.text.pdf.PdfReader(PdfFileName)

    Dim sOut = ""

    For i = 1 To oReader.NumberOfPages
        Dim its As New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy

        sOut &= iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(oReader, i, its)
    Next

    Return sOut
End Function

ITextSharp also has methods for dealing with tags.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文