深度学习数据标准化

发布于 2025-01-12 05:47:29 字数 193 浏览 3 评论 0原文

我正在为我的模型使用不同类型的财务数据输入，我想了解有关它们标准化的更多信息。

特别是，在处理一些技术指标时，我将它们归一化为 0 到 1 之间的范围。

其他指标则归一化为 -1 到 1 之间的范围。

您对混合归一化数据有什么经验？

拥有这两个范围是否可以接受，或者训练数据集具有单个范围（即 [0 1]）总是更好？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

瑾夏年华 2025-01-19 05:47:30

需要注意的是，当我们讨论数据标准化时，我们通常指的是连续数据的标准化。分类数据（通常）不需要前者。

此外，并非所有机器学习方法都需要标准化数据才能正常运行。此类方法的示例包括随机森林和梯度增强机。然而，其他人却这样做。例如，支持向量机和神经网络。

输入数据标准化的原因取决于方法本身。对于 SVM，数据标准化是为了确保输入特征在影响模型决策方面具有同等的重要性。对于神经网络，我们对数据进行归一化，以使梯度下降过程顺利收敛。

最后，为了回答您的问题，如果您正在处理连续数据并使用神经网络对数据进行建模，只需确保标准化数据的值彼此接近（即使它们不在同一范围内），因为这是什么决定了梯度下降过程收敛的难易程度。如果您使用 SVM，最好将数据标准化为单个范围，以便 SVM 使用的相似性/距离函数可以赋予所有特征同等的重要性。在其他情况下，无论范围如何，数据标准化的需要都可以完全消除。最终，这取决于您使用的建模技术！

感谢@user3666197 在评论中提供的有用反馈。

回复收藏 0 原文

~没有更多了~