使用运行统计数据训练 BatchNorm 层是个好主意吗？

发布于 2025-01-16 17:08:11 字数 323 浏览 0 评论 0原文

据我所知，BatchNorm 将在 train 模式下使用批处理统计信息，但使用运行统计信息 (running_mean/running_var) 在eval 模式下。总是在 train 和 eval 模式下使用运行统计数据怎么样？

在我看来，我们毕竟在推理阶段使用了eval模式。为什么我们不在训练阶段一开始就使用 eval 风格 BatchNorm 呢？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一抹苦笑 2025-01-23 17:08:11

来自 https://pytorch.org/docs/master/ generated/torch.nn.BatchNorm2d.html?highlight=batchnorm2d#torch.nn.BatchNorm2d

[...]在训练期间，该层不断运行对其计算的均值和方差的估计，然后将其用于评估期间的归一化。

我想如果您从未将 BatchNorm 设置为训练，则不会存储任何值（或一些默认值），并且该层将不会针对您的数据进行优化。它类似于线性/卷积层。 “为什么我们不在训练阶段让它们进行评估呢？”嗯，因为我们希望各层能够学习可以在评估模式中使用的东西。

回复收藏 0 原文

~没有更多了~

关于作者

在梵高的星空下

暂无简介

文章

25 人气

关注发私信

友情链接

文江博客

使用运行统计数据训练 BatchNorm 层是个好主意吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

╰ゝ天使的微笑

少女净妖师

朱洁

觉浅

滥情空心

hl1314520

友情链接

使用运行统计数据训练 BatchNorm 层是个好主意吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

╰ゝ天使的微笑

少女净妖师

朱洁

觉浅

滥情空心

hl1314520

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。