模式识别——万智牌

发布于 2024-09-16 16:34:12 字数 310 浏览 8 评论 0原文

我希望在我的 Android 上（和/或更可能在服务器上）创建一个程序，以使用手机上的摄像头捕获卡的图像并将其分解为相应的部分，并使用它们来识别卡在我自己创建的数据库中使用。模式识别是我需要帮助的地方。好的，一张卡片有一个黑色边框，顶部有一个“盒子”，上面写着卡片的名称，一张图像，一个带有卡片类型的盒子和一个代表它来自的集合的符号，最后一个盒子是一些更具描述性的文字。首先，我假设所有卡片都遵循该格式。好的，至少要识别该卡，我需要识别顶部框并 OCR 键入的文本。如果我可以匹配中间框中的符号，那就太好了，但是..

任何人都可以向我指出有关我需要自己编码的理论的 API 或文章/书籍吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

缪败 2024-09-23 16:34:12

我取决于你是否真的想知道 border-color & 设置。

因为如果你不这样做，你就真的不需要一个工具来识别整个卡片的图像。
您只需 OCR 卡名即可。

您可以使用如下 API 来完成此操作：

OCR-IT OCR Cloud 2.0 API 提供商业级的高质量免费
轻量级使用 OCR API，无有效期。它很受欢迎
大学项目和应用程序原型最终
可能会切换到更大的付费订阅，但它可以用于
需要持续使用 OCR 的实施。这大概是作为
几乎可以找到一个可以处理低质量问题的免费 OCR API
图像和复杂的多语言文本。

回复收藏 0 原文

也只是曾经 2024-09-23 16:34:12

不久前我问了一个类似的问题。

我还没有这样做，但 opencv 看起来是值得尝试的正确工具。

回复收藏 0 原文

八巷 2024-09-23 16:34:12

我目前正在尝试采用相同的想法，采用更具实验性的方法来适应图像过滤和对象识别。到目前为止，我发现的两种最好的（因为简单）方法是：

第一种也是最简单的方法是等待 Google Goggles API 发布并将其用于所有 OCR 等。它有效对于我测试的所有卡都很好，请查看应用。它的缺点是它将您的图像发送到 Google 服务器并在那里进行计算，这会导致大量的互联网流量（并且在使用 EDGE 时会带来一些痛苦）。

第二个是一些基于特征点的算法，例如（著名的）SIFT David G. Lowe 的特征检测器。这是一个针对特征点的比例和旋转不变检测器，您可以将其与所有卡片的数据库进行匹配。
虽然可以实时执行 SIFT 检测，但我认为不可能在手机上实时执行（尤其是使用 Java 时）。请记住，SIFT 算法本身受美国版权保护，不得免费用于商业用途。但是，在搜索特征点检测器和特征点描述符时，您可以找到大量其他算法。

这两种方法都可以让你摆脱兽人魔法的需要，如果你不知道字母的位置、大小或旋转，这真的会变成一件丑陋的事情。