当前位置：文江博客话题详情

如何从图像中识别特定的物理对象？

发布于 2024-10-15 02:19:09 字数 358 浏览 9 评论 0原文

我的目标是让一个人用手机拍摄我们大学校园内的当地地标（建筑物或其他（例如凉亭、雕像等））的照片，并能够识别该地标并告诉他们什么这是。

例如，他们四处走动，看到一座带有金属圆顶的大型建筑。他们不知道那是什么，但看起来很有趣，所以他们拍了一张照片，应用程序告诉他们这是篮球中心（以及其他相关信息）。

我在这个特定领域的有限知识使我想到使用神经网络并训练程序来识别特定的地方。如果是这种情况，请也给我这个选项的资源，因为我对神经网络的了解程度是，如果它们经过训练，它们可以用来识别事物。 :)

我知道 OpenCV 库，但由于我不是 C 开发人员，我想知道在开始之前我是否需要走这条路。我主要使用 Java 工作，但我并不反对亲自动手。

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一抹淡然 2024-10-22 02:19:09

这是对你原来问题的回应。
最好的资源是 O'Reilly 的书学习 OpenCV

您可以阅读Google 图书上的东西是免费的，它使用 C 和 OpenCV。您可以使用 python 或 Java 来适合您的工作。

OpenCV 库包括 haar 训练和训练它进行人脸/文本识别的示例程序。之后你基本上就必须弄清楚事情。
我刚刚偶然发现的另一个有用的资源是英特尔的 OpenCV 参考手册。
所以，祝你好运！

回复收藏 0 原文

烏雲後面有陽光 2024-10-22 02:19:09

使用第二种方法是更容易的方法，因为您知道 GPS 坐标的位置，并且知道您面对的方向（因为大多数移动设备都有集成的指南针和加速度计）。这已经被几个增强现实浏览器使用 - 如果你使用 Android，你可能想看看“Layar”...

更用户友好的方式是通过摄影，因为不是每部手机都有 GPS，他们总是需要转动它首先...

首先，您需要了解建筑物最显着的结构和特征。 OpenCV 有一些方法可以实现这一点。特征提取是图像处理中的一个大课题。您可能应该提取图像上的边缘，获取突出的特征/点，并将它们与您拥有的所有建筑物的特征数据库进行比较。

您可以使用神经网络进行训练，但您仍然需要大量参考图片来提取数据以获得学习过程。

（为了与其他对象的整个数据库进行比较，您甚至可能想查看服务器端计算，而不是在手机上执行所有这些操作）

希望有所帮助...

回复收藏 0 原文

莫相离 2024-10-22 02:19:09

对于计算机视觉经验很少的人来说，将其作为计算机视觉任务来完成是非常困难的 - 10 年前，这是一个完全未解决的问题。但首先要说明的是：

神经网络（或者更确切地说，具有反向传播式训练的神经网络）已经相当陈旧，不再是首选方法。随机森林很受欢迎，主要是因为它们非常灵活，相当容易实现，并且平均性能不比其他分类方法差。 Criminisi et al 2011 是标准论文。 http://research.microsoft.com/pubs/155552/decisionForests_MSR_TR_2011_114.pdf

上次我检查文献时（几年前），似乎有两个很好的图像特征首选。 SIFT 或稀疏 Haar 小波。

看看 Criminisi 等人 2008 (http://research.microsoft.com/pubs/ 72423/Criminisi_bmvc2008.pdf）用于基于随机森林和哈尔小波的对象识别系统。

Fergus 等人的另一种方法。 2007，（http://cs.nyu.edu/~fergus/papers/fergus_ijcv。 pdf）使用一个简单的图像补丁模型，通过贝叶斯网络连接在一起。

OpenCV 可能是开始查找现有代码的好地方。 Matlab 也声称对这些任务有很好的支持。

回复收藏 0 原文

~没有更多了~