时间融合变压器（Pytorch 预测）：“hidden_size”参数

发布于 2025-01-15 15:01:41 字数 652 浏览 4 评论 0原文

PytorchForecasting 包中的 Temporal-Fusion-Transformer (TFT) 模型有几个参数（请参阅：https://pytorch-forecasting.readthedocs.io/en/latest/_modules/pytorch_forecasting/models/temporal_fusion_transformer.html#TemporalFusionTransformer）。

hidden_size 参数到底指的是什么？我最好的猜测是，它指的是 TFT 的 GRN 组件中包含的神经元数量。如果是，这些神经元包含在哪一层？

我发现文档在这种情况下并没有多大帮助，因为他们将 hidden_size 参数描述为：“网络的隐藏大小，这是其主要超参数，范围可以从 8 到 512”

旁注：我的部分内容无知可能是因为我不完全熟悉 TFT 模型的各个组件。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

中性美 2025-01-22 15:01:41

对链接中提供的源代码进行了一些研究后，我能够弄清楚 hidden_size 如何成为模型的主要超参数。这里是：

hidden_size 确实描述了 GRN 每个 Dense 层的神经元数量。您可以在https://arxiv.org/pdf/1912.09363.pdf<查看GRN的结构/a>（第 6 页，图 2）。请注意，由于 GRN 的最后一层只是归一化层，因此 GRN 的输出也具有维度 hidden_size。

这是模型的主要超参数吗？通过查看 TFT 模型的结构（也在第 6 页），GRN 单元出现在变量选择过程中、静态丰富部分和位置前馈部分中，因此基本上出现在学习的每个步骤中过程。这些 GRN 中的每一个都是以相同的方式构建的（只是输入大小不同）。

回复收藏 0 原文

~没有更多了~

关于作者

锦欢

暂无简介

文章

28 人气

关注发私信

牛↙奶布丁

文章 0 评论 0

关注

COSO

文章 0 评论 0

关注

落叶

文章 0 评论 0

关注

暗地喜欢

文章 0 评论 0

关注

qq_i8qOEG

文章 0 评论 0

关注

qq_Wl4Sbi

文章 0 评论 0

友情链接

文江博客

时间融合变压器（Pytorch 预测）：“hidden_size”参数

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签