利用人工智能识别条形码

发布于 2024-09-15 07:28:57 字数 493 浏览 1 评论 0原文

作为一个宠物项目/学习经验（不，这不是家庭作业），我正在开发从照片中识别条形码的软件。我并不是在寻找能够实现这一点的软件或库 - 相反，我将其用作学习练习，我正在写博客并将其发布在 Codeplex 上。

我的代码可以成功识别 EAN13 条形码（我在 CodePlex 上发布）并且应该遵循 UPC 版本 A/E不久。不过，我有两个方面值得关注。首先是解码图片中有点模糊或对比度差等的条形码。其次是在更大的图片中简单地找到实际的条形码（现在你必须给我一张只有条形码的照片）。

我有一种直觉，某种形式的人工智能会帮助我解决这个问题。我过去玩过一点遗传算法，而且我很久以前就学过人工智能课程，所以它对我来说并不完全陌生，但我不太确定从哪里开始。

什么类型的算法最适合此类问题？对于 AI 繁重的工作有什么推荐的读物或代码吗？是的，我想了解发生了什么，但我不一定想自己深入到编码等级别。

需要登录才能够评论，你可以免费注册一个本站的账号。

绝影如岚 2024-09-22 07:28:57

我建议搜索条形码具有的属性。我想到的一些是：

还有其他的吗？

有了这个，我会将图像分成几部分，并使用这些特征进行分类，然后结合结果来计算该部分是否包含条形码的可能性。

对于你的第二个问题（模糊图像），我建议计算一阶导数灰度值，然后检测该空间中线条的边缘。如果图像模糊，导数的最大值会较低，但在一定的模糊系数下应该可以检测到。

这对你有帮助吗？

绿萝 2024-09-22 07:28:57

正如 mp 已经指出的那样，你不需要任何真正的人工智能技术。请参阅 Real World Haskell 的第 12 章。它实现了一个几乎完整的条形码识别器。示例代码是用 Haskell 编写的，但有大量解释，因此即使没有 Haskell 经验，您也可以理解其中的想法和技巧。

如果你想用人工智能解决这个问题，那么最好的选择可能是使用人工神经网络。对于给定的问题，我建议使用一种非常先进的技术，称为 HyperNEAT。请参阅我的解释（和链接）作为 SO 问题的第一个答案神经网络网络大小...

我可能会使用两个或三个不同的网络，

第一个在更大的图片上找到条形码。每个像素/像素组有一个输出神经元，如果该像素似乎是条形码的一部分，则输出值是置信度。根据结果，我将使用一些图像转换将其转换为“标准”格式（x*y 矩形）。
如果您难以找到条形码的位置，请使用第二个。输入第一个的结果，并要求它给出两个角的坐标。然而，我不太确定进化这个会很容易。
最后一个将使用标准化格式，为每行（或正方形，如果您使用可能的二维条形码）输出神经元，说明给定区域是否应被视为黑色或白色。

也许它也有助于对图像进行一些预处理，例如 RWH 中描述的那些预处理。