当前位置：文江博客话题详情

如何使用 CAM::PDF 识别 PDF 文档中未填充的椭圆？

发布于 2024-08-08 09:39:14 字数 1436 浏览 4 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

陌伤浅笑 2024-08-15 09:39:14

$doc->traverse($dereference, $node, $callbackfunc, $callbackdata) 看起来很有前途。检查一下椭圆的类型。

回复收藏 0 原文

吾家有女初长成 2024-08-15 09:39:14

看看 PDF 规范，我想说你在在你面前：

PDF 提供五种类型的图形对象：
路径对象是由直线、矩形和三次贝塞尔曲线组成的任意形状。路径可能会与自身相交，并且可能具有断开的部分和孔。路径对象以一个或多个绘画运算符结尾，这些运算符指定是否应对路径进行描边、填充、用作剪切边界或这些操作的某种组合。
一个文本对象 ...
外部对象 (XObject) 是在内容流外部定义并作为命名资源引用的对象（请参阅 7.8.3“资源字典”）。 XObject 的解释取决于它的类型。 ...
内联图像对象使用特殊语法直接在内容流中表达小图像的数据。
着色对象描述了一个几何形状，其颜色是形状内位置的任意函数。

因此，至少，人们需要知道您感兴趣的椭圆是路径、外部对象、内联图像对象还是着色对象。

然后，您需要一个适当的算法来确定该类型的对象是否是椭圆形。然后，您需要弄清楚unfilled是什么意思。然后，您需要弄清楚如何填充它们。

在我看来，似乎不太可能有人会投入那么多精力来为您提供现成的解决方案。

回复收藏 0 原文

や莫失莫忘 2024-08-15 09:39:14

实际上，将 PDF 渲染为灰度位图并使用简单的形状识别来确定填充椭圆形和未填充椭圆形可能更简单。如果您可以可靠地确定椭圆形的位置（我假设这是来自表格，因此椭圆形的位置将是标准的），您可以进行简单的启发式计算（例如，如果 70% 的像素是 50 ％灰色或更高）来确定它是哪种椭圆形。

例如，在这种情况下：

[ ]        [ ]         [ ]       [X]

[ ]        [X]         [ ]       [ ]

[ ]        [ ]         [X]       [ ]

您可以使用网格分割椭圆：

[ ]   |    [ ]    |    [ ]   |   [X]
------+-----------+----------+------
[ ]   |    [X]    |    [ ]   |   [ ]
------+-----------+----------+------
[ ]   |    [ ]    |    [X]   |   [ ]

然后从那里您只需循环网格，将简单的启发式应用到每个单元格。

It may actually be simpler to render the PDF to a grayscale bitmap and use simple shape recognition to determine filled from unfilled ovals. If you can reliably determine where the ovals are going to be (I'm assuming this is coming from a form, so the position of the ovals would be standard), you can make a simple heuristic (e.g. if 70% of pixels are 50% gray or higher) to determine what kind of oval it is.

For example in this situation:

[ ]        [ ]         [ ]       [X]

[ ]        [X]         [ ]       [ ]

[ ]        [ ]         [X]       [ ]

You can split the ovals using a grid:

[ ]   |    [ ]    |    [ ]   |   [X]
------+-----------+----------+------
[ ]   |    [X]    |    [ ]   |   [ ]
------+-----------+----------+------
[ ]   |    [ ]    |    [X]   |   [ ]

Then from there you just loop over the grid, applying that simple heuristic to each cell.

回复收藏 0 原文

~没有更多了~

关于作者

橙味迷妹

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

如何使用 CAM::PDF 识别 PDF 文档中未填充的椭圆？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

尘世孤行

烟─花易冷

你是年少的欢喜

倒带

忱杏

送君千里

友情链接

如何使用 CAM::PDF 识别 PDF 文档中未填充的椭圆？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

尘世孤行

烟─花易冷

你是年少的欢喜

倒带

忱杏

送君千里

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。