pdf文本提取

发布于 2024-09-02 20:10:13 字数 280 浏览 6 评论 0原文

3 begincidrange 
<20> <7e> 1 
<8140> <817e> 633 
<8180> <81ac> 696 
endcidrange 

这是一个 CMAP 文件示例。

  1. 如何为我自己的数据制作 CMAP?
  2. 什么是 3 in 3 begincidrange
  3. 什么是 <20> <7e>?谁能举个例子
3 begincidrange 
<20> <7e> 1 
<8140> <817e> 633 
<8180> <81ac> 696 
endcidrange 

This is a CMAP file sample.

  1. How do I make a CMAP for my own data ?
  2. What is 3 in 3 begincidrange
  3. what is <20> <7e>? can anyone give an example

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

dawn曙光 2024-09-09 20:10:13

您的 CMap 表建立了所有字符代码到 CID 的映射。

begincidrange操作符前面出现的数字表示映射的个数
线。 endcidrange 运算符终止映射块。

begincidrange 和 endcidrange 之间的行包含映射。每行有 3 个条目。前两个指定字符代码范围,第三个是它们映射到的 CID 值。

因此,字符代码 0x20 到 0x7e 映射到 CID 1。Adobe

Technote 5099 描述了 CID 表的格式。

Your CMap table establishes all of the character code to CID mappings.

The number that appears before the begincidrange operator indicates the number of mapping
lines. The endcidrange operator terminates a block of mappings.

The lines in between begincidrange and endcidrange contain the mappings. There are 3 entries for each line. The first two specify the character code range and the 3rd is the CID value they map to.

So character codes 0x20 to 0x7e map to CID 1.

Adobe Technote 5099 describes the format for CID tables.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文