tensorflow模型输入要求图片是正方形的问题

发布于 2022-09-12 13:48:45 字数 462 浏览 26 评论 0

我正在使用一个开源的tensorflow模型,他的输入节点是[1,256,256,3]的三通道正方形图片,如果输入图片不是正方形,应该如何调整呢?
我能想到的几种方式:
1.将图片拉伸到正方形尺寸
2.将图片放在一个正方形中,正方形留白部分设置纯色,黑色或者白色,这也是我不理解的地方,纯色设置什么颜色对结果影响较小?
3.和2差不多,但是不居中,将图片上对齐

我在使用的模型demo中,官方好像使用了1(因为我只是尝试使用,也不具备对模型内原理的理解,所以这里是好像),他在输入前执行了这段:
img_resized = tf.image.resize(img, [width, height], method='bicubic', preserve_aspect_ratio=False)
其中width,height都是256,输入图片img是个非正方形图片。

我想问下,对于模型输入要求是正方形的,应该采用哪种方式?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

软糖 2022-09-19 13:48:45

1的话,有可能改变原来的空间特征。比如你一张人脸图,拉伸后鼻子可能更眼睛水平。
2,3感觉安全点,纯色尽量选和原图片差异大的。比如原图是黑的,补齐就用白的。
直觉是这个样,具体你可以不同方法试试看效果有啥差异。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文