使用 Yolov5 从合成数据到现实生活数据进行对象检测

发布于 2025-01-18 18:49:41 字数 776 浏览 1 评论 0原文

目前正在尝试使用自定义合成数据的 yolov5。我们创建的数据集由 8 个不同的对象组成。每个对象至少有 1500 张图片/标签，其中图片在对象周围分为 500/500/500 个正常/雾/干扰物。数据集中的示例图像位于第一个 imgur 链接中。该模型不是从头开始训练的，而是从yolov5标准.pt开始训练的。

到目前为止，我们已经尝试过：

添加更多数据（从每个对象 300 个图像到 4500 个）
创建更复杂的数据（对象上/周围的干扰因素）
运行多次训练
使用网络大小小、中、大、超大进行训练
不同的批量大小4-32 之间（取决于模型大小）

到目前为止，一切都对合成数据产生了良好/出色的检测，但在实际数据上使用时完全关闭。示例：认为不相关物体的整个图片是纸盒，墙壁是托盘等。最后一个 imgur 链接中的快速示例图像。

有人知道如何改进训练或数据以更好地适合现实生活中的检测吗？或者如何更好地解读结果？我不明白该模型如何得出这样的结论：具有不相关对象的整个图片是一个盒子/托盘。

训练结果上传至 imgur： https://i.sstatic.net/z4GbR.jpg

现实生活数据示例： https://i.sstatic.net/VfHNc.jpg

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

笔芯 2025-01-25 18:49:41

有几件事可以改善结果。

在使用合成数据训练模型后，用实际的培训数据来微调模型，学习率较小（也许1/10）。这将减少合成和现实生活图像之间的差距。在某些情况下而不是微调的情况下，用混合（合成+真实）训练模型会产生更好的结果。
生成图像在结构上类似于现实生活中的例子。例如，将人类放入叉车中，货盘或桶上的叉子等。模型从中学习。
随机对要检测到的项目的纹理进行随机化纹理。模型倾向于专注于检测的纹理。通过随机化纹理，具有许多可变性，包括MON自然发生，您迫使模型学会识别不基于其纹理的对象。尽管对象的纹理有时是一个良好的标识符，但合成数据遭受了不够复制该功能的良好功能，因此域间隙，因此您可以减少其对模型决策的影响。
我不确定屏幕截图是否准确地表示您的数据生成分布，如果是的，则必须将对象，尺寸和遮挡的角度随机化更多。
使用您不想检测到的对象，但会在您将作为干扰因素进行推断的图像中，而不是像球这样的简单形状。
更随机照明。强度，颜色，角度等
增加了背景和地面随机化。使用HDRI，有很多免费的HDRIS
余额您的数据集

https://i.sstatic.net/jq9yj。 JPG

回复收藏 0 原文

无敌元气妹 2025-01-25 18:49:41

检查结果的答案是，您的综合数据与您希望其工作的现实生活数据不同。尝试生成更接近现实生活的合成场景，并再次培训可以显然改善您的结果。其中包括更现实的背景和场景构图。我不知道您的训练集是否类似于您在此处共享的验证图像，但是如果确实，请尝试每个图像具有更多对象，靠近相机并为其相对位置增加变化。在图像的中间只有一个随机的3D对象不会提供良好的结果。顺便说一句，您已经过度拟合了模型，因此在这一点上，更多的培训图像无济于事。

回复收藏 0 原文

~没有更多了~