当前位置：文江博客话题详情

如何测试 jpeg 是否是照片（或更确切地说是徽标）

发布于 2024-11-26 07:03:09 字数 215 浏览 1 评论 0原文

我使用 pdfimages 工具从给定的 PDF 文件（包含房地产概要）中提取所有图像作为 jpeg。现在我想自动区分照片和其他图片，例如经纪人的徽标。我该怎么做？

有没有像谷歌图像搜索一样可以区分照片和剪贴画/线条图等的开放工具？
是否有一个开放工具可以为我提供给定 jpeg 所使用的颜色数量？

我知道这会带来一定的不确定性，但没关系。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

浅笑轻吟梦一曲 2024-12-03 07:03:09

我会看看颜色分布。在渐变的情况下，颜色可能会密集排列或“过于”均匀分布。或者，您可以查看图像的频率分布。

回复收藏 0 原文

淡淡離愁欲言轉身 2024-12-03 07:03:09

您可以分两步解决问题：(1)从图像中提取某种信息，(2)训练一个可以区分两种类型图像的分类器：

1 - 特征提取

在这一步中，您将必须编写一个程序/函数，它将图像作为输入并返回一个数字向量来描述其视觉信息。正如 koan 在他的回答中指出的那样，颜色分布包含很多有用的信息。所以我会尝试以下措施：
* 每个颜色通道（红、绿、蓝）的直方图，因为这是图像颜色分布的基本描述；
* 每个直方图的平均值、标准差和其他统计矩。这将为您提供有关颜色在图像中如何分布的信息。对于图形，例如徽标，颜色分布应与照片明显不同；
*傅里叶描述符。在绘图中，您可能会发现很多边缘，而在照片中则不会出现这种情况。使用傅立叶描述符，您可以获得此类信息。

2 - 分类

在这一步中，您将训练某种分类器。基本上，获取一组图像并手动将每个图像标记为绘图或照片。另外，使用您在步骤 1 中编写的提取函数从每个图像中提取向量。这将是您的训练集。训练集将用作训练分类器的输入。正如 Neil N 评论的那样，神经网络可能是一种杀伤力过大（或者也许不是？），但是您可以使用很多分类器（例如 k-NN, SVM、决策树）。您不必自己实现分类器，因为您可以使用机器学习软件，例如威卡。

最后，训练完分类器后，从要测试的图像中提取向量。使用此向量作为分类器的输入来预测图像是照片还是徽标。