当前位置：文江博客话题详情

从 TIFF 中提取或裁剪图像

发布于 2025-01-06 03:41:24 字数 262 浏览 8 评论 0原文

我需要从 TIFF 文件中提取/裁剪中间的标识 (BEAVER)，如下所示： http: //i41.tinypic.com/2i7rbie.jpg

然后我需要自动化该过程，以便可以重复大约 900 万次...

我的猜测是我必须使用一些 OCR 软件。但是这样的软件是否有可能“裁剪从该点以下开始并在该点以上结束的任何内容”？

想法？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

你不是我要的菜∠ 2025-01-13 03:41:24

通常 OCR 软件仅从图像中提取文本并将其转换为某种特定于文本的格式。它不做作物。但是，您可以使用 OCR 技术来完成您的任务。我建议如下：

OCR 整个页面
获取已识别文本的坐标
将您的魔法规则应用于已识别的文本以定位要裁剪的区域：例如“应用程序填充”和“声明”句子之间的所有内容。
从图像中剪切该区域并将其导出到您想要的位置。

真正的挑战在于您想要处理的文本量。在定义“智能规则”时，您必须非常小心，以确保它们不会提供误报，并始终将可疑图像发送到单独的队列，您稍后将手动检查和更新您的规则。

一般来说，它可能看起来像这样：

获取前 10 个图像，定义徽标检测规则，测试并查看是否一切正常
然后运行下 10 个图像，查看哪些处理错误，哪些未处理，更新规则，重新处理这些10 确保现在一切正常
在相同大小的新批次上重新运行它，直到它开始正常工作。
然后将批量大小从 10 增加到 100，并继续处理这些批量，直到一切再次开始顺利进行。
然后继续以这种方式完善您的规则并增加批量大小。在某个时间点，您将达到生产速度。

您很可能会遇到一些奇怪的图像，这些图像要么与现有规则相矛盾，要么就是错误的。您并不总是需要更新规则来适应它。可能你的 900 万张收藏中只有几十张这样的图像。最好将它们留在异常队列中以进行手动处理，并且不要冒着魔法规则稳定性的风险。

回复收藏 0 原文

~没有更多了~

关于作者

魂ガ小子

暂无简介

文章

28 人气

关注发私信

yuanzihao09

文章 0 评论 0

关注

1337793151

文章 0 评论 0

关注

横笛休吹塞上声

文章 0 评论 0

关注

你在我安

文章 0 评论 0

关注

qq_QhAHT0kB

文章 0 评论 0

关注

aaaa123451

文章 0 评论 0

友情链接

文江博客

从 TIFF 中提取或裁剪图像

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签