当前位置：文江博客话题详情

如何使用 ktrain 包中的 learner.lr_plot 理解损失学习率（对数刻度）图？

发布于 2025-01-11 10:44:43 字数 324 浏览 6 评论 0原文

我正在使用 ktrain 包对文本进行分类。我的实验显示为：

lr_find 和 lr_plot 是 ktrain 中的函数。它们可用于突出显示最佳学习率，在图中显示为红点。

我不明白如何理解这个图：

如何将对数刻度转换为正常的线性刻度？
为什么最好的刻度是红点？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

黯淡〆 2025-01-18 10:44:43

正如 lr_find 方法中的文本所述，您可以直观地检查该图并在发散之前损失下降的范围内选择学习率。这个范围内的学习率越高，收敛得越快。这是来自 Leslie Smith 的论文的一个名为“LR range test”的想法，该想法通过fastai 库，后来被其他库采用，例如 ktrain 和 Amazon 的 Gluon 库。该图中的红点只是损失急剧下降的数值近似值，这对于自动化场景可能有用，但不一定是最好的。在此图中，红点代表曲线最陡的部分，这是从图中自动选择学习率的一种策略（无需目视检查）。其他自动化策略包括采用与最小损失相关的学习率并除以 10，并找到与最长的山谷。