对于多对象边界框回归,深度学习网络的输出层应该是什么样的?
我正在 Mobilenet SSD v2 的背面构建一个神经网络,它专门用于边界框回归。我很难找到明确的资源来指示如何塑造模型的输出。我的数据通常在任何给定图像中存在 1-4 个框,我可以简单地连接,以便输出为 Dense(16),但是当图像中存在超过 4 个对象时,实例会怎样呢?我不确定如何处理动态多对象输出层,我该怎么做,是否有可以共享的详细资源?
I am building a neural network on the back of Mobilenet SSD v2 and its specifically for bounding box regression. I have had a difficult time looking for clear resources indicating how the output of the model should be shaped. My data generally has 1-4 boxes present in any given image and I could simply concatenate so the output is Dense(16) but what about the instance when there are more than 4 objects present in the image. I am unsure how to handle a dynamic multi-object output layer, how can I do this, are there any detailed resources that can be shared?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论