什么是“带标签的 PDF”?
有人可以解释一下什么是“带标签的 PDF”,以及它与常规的无标签 PDF 有何不同?
带标签的 PDF 是否包含特殊内容,例如 XML、Rich Media、Javascript 等?
哪些 TeX 工具链生成带标签的 PDF?
Can someone please explain what a "Tagged PDF" is, and how it differs from regular, non-tagged PDF?
Will tagged PDFs contain special content, such as XML, Rich Media, Javascript, or the like?
Which TeX-toolchains generate Tagged PDFs?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
带标签的 PDF 是一种 PDF 文件,其中包含页面内容内某些 PDF 指令组的元信息。此元信息有许多用例:文本提取、内容重排、文档可访问性、包含地图的 PDF 中的地理信息等。
如果您需要了解有关此主题的更多详细信息,我建议您阅读第 10 章 - 文档Adobe PDF 参考版本 1.7 的互换。
Tagged PDF is a PDF file that contains meta-information around certain groups of PDF instructions inside a page content. This meta-information has many use cases: Text-extraction, content-reflow, document accessibility, geographic information in PDF containing maps, etc.
If you need to know more details about this topic I would recommend reading
Chapter 10 - Document Interchange
of Adobe PDF Reference version 1.7.使用它的主要原因是为了可访问性。有了正确的标签,屏幕阅读器(盲人)就可以理解标题在哪里,什么是表格/脚注/图形等等。还有一个称为 PDF 文章线索的功能,对于将文章分成多个框/页面的杂志或报纸布局非常有用。
The main reason it is used is for accessibility. With the correct tags, a screen reader (for a blind person) can understand where headings fall, what is a table/footnote/graphic and so on. Also there is a feature called PDF Article Threading which is useful for magazine or newspaper layouts where an article is split across boxes/pages.