CNN：为什么我们首先将图像大小调整为 256，然后将裁剪中心裁剪为 224？

发布于 2025-01-11 20:09:12 字数 203 浏览 0 评论 0原文

Alexnet 图像输入的转换如下：

transforms.Resize(256),
transforms.CenterCrop(224),

为什么我们首先将图像大小调整为 256，然后将裁剪中心裁剪为 224？我知道 ImageNet 的默认图像大小是 224x224，但是为什么我们不能直接将图像大小调整为 224x224？

原文

The transformation for Alexnet image input is below:

transforms.Resize(256),
transforms.CenterCrop(224),

Why do we first resize the image to 256 and then center crop to 224? I know that 224x224 is the default image size of ImageNet but why we can't directly resize the image to 224x224?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

风和你 2025-01-18 20:09:13

也许这是最好的视觉说明。考虑以下图像 (128x128px)：

假设我们直接将其大小调整为 16x16px，最终会得到：

但如果我们先将其大小调整为 24x24px，

，然后将其裁剪为 16x16px，它看起来像这样：

如你所见，它去掉了边框，同时保留了中心的细节。请并排注意差异：

这同样适用于 224px 与 256px，只不过分辨率更高。

回复收藏 0 原文

梦行七里 2025-01-18 20:09:13

当使用单个参数 size 调用时，调整大小变换的输出受输入图像的宽高比影响 - 新尺寸为 [size x height / width, size]，不是[尺寸，尺寸]。我认为单独运行这两个步骤是解决此问题并确保输入数据大小一致等于 [224, 224] 的一种方法。

我认为，对于预测，你可以直接调用 Resize(224, 224) 来调整大小，最终的效果是一样的。当然，边框不会被修剪，但我不明白为什么这一步对于任何自定义数据都很重要。

调整大小文档链接： https://pytorch.org/vision/stable /生成/torchvision.transforms.Resize.html

回复收藏 0 原文

~没有更多了~

关于作者

宁愿没拥抱

暂无简介

文章

25 人气

关注发私信

卷耳

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

℉服软

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

凉宸

文章 0 评论 0

关注

gyhjy

文章 0 评论 0

友情链接

文江博客

CNN：为什么我们首先将图像大小调整为 256，然后将裁剪中心裁剪为 224？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

CNN：为什么我们首先将图像大小调整为 256，然后将裁剪中心裁剪为 224？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。