当前位置：文江博客话题详情

使用对数标准化向量以避免溢出

发布于 2024-08-24 01:41:14 字数 685 浏览 2 评论 0原文

使用对数避免数值下溢的算术问题 (采取2）

看过上面的内容并看过softmax标准化后，我试图标准化一个向量，同时避免溢出 -

也就是说，如果我有一个数组 x[1], x[2] x[3], x[4], ... , x[n]

对我来说，标准化形式的元素平方和为 1.0 并通过将每个元素除以得到 sqrt(x[1]*x[1]+x[2]*x[2]+...+x[n]*x[n])

现在平方和可能会溢出即使平方根足够小以适合浮点变量，所以我想人们可以做类似的事情 s=(2*log(fabs(x[1]))+2*log(fabs(x[2]))+...+2*log(fabs(x[n])))/ 2

并将元素计算为

exp(log(fabs(x[1]))-s), ..., exp(log(fabs(x[n]))-s

但是

上面是不正确的，因为 log(A+B) 不是 log(A)+log(B) - 现在有没有一种方法可以进行向量归一化来更好地避免溢出？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

北城半夏 2024-08-31 01:41:14

相反，

norm  = sqrt(x[1] * x[1] + ... + x[n] * x[n])

您可能希望在平方之前将向量的元素除以最大可能值，

max_x = max(x[1], ..., x[n])
y[1] = x[1] / max_x / n
...
y[n] = x[n] / max_x / n
norm = n * sqrt(y[1] * y[1] + ... + y[n] * y[n]) * max_x

然后 y 向量的范数应等于或小于零。 n * max_x 的值仍然可能溢出，因此您也需要小心，确保操作以非溢出顺序执行。

Instead of

norm  = sqrt(x[1] * x[1] + ... + x[n] * x[n])

you might want to divide the elements of the vector by the maximum possible value before squaring

max_x = max(x[1], ..., x[n])
y[1] = x[1] / max_x / n
...
y[n] = x[n] / max_x / n
norm = n * sqrt(y[1] * y[1] + ... + y[n] * y[n]) * max_x

The norm of the y vector should then be equal or smaller than zero. The value of n * max_x could still overflow, so you need to be careful there, too, that the operations are executed in a non-overflowing order.

回复收藏 0 原文

盗梦空间 2024-08-31 01:41:14

您似乎做出这样的假设：

log(x^2 + y^2)

与：

log(x^2) + log(y^2)

但是，这是不正确的，因为您不能像这样简化总和的对数。

You seem to be making the assumption that:

log(x^2 + y^2)

is the same as:

log(x^2) + log(y^2)

However, this isn't correct, as you can't simplify the logarithm of a sum like that.

回复收藏 0 原文

孤凫 2024-08-31 01:41:14

KennyTM 是正确的 - 你关于对数的想法是错误的。

您不能使用 L2 范数，因为它要求您计算向量的大小，而这正是您遇到溢出问题的原因。

也许 L-无穷范数（首先将向量中的每个分量除以最大分量的绝对值）会更好。请务必保留最大绝对值，以便获得正确的幅度。

我完全理解您需要 L2 范数，但如果溢出确实是一个问题，您需要采取中间步骤来获得它：

找到向量的最大绝对值。
将每个分量除以最大绝对值进行归一化；最大值现在为 +/- 1。
计算归一化分量平方和的平方根。我建议对值进行排序并按升序添加它们，以确保小组件不会丢失。
乘以最大绝对值即可得到原始向量的 L2 范数。

回复收藏 0 原文

~没有更多了~

关于作者

追我者格杀勿论

暂无简介

0 文章

0 评论

23 人气

关注发私信

1CH1MKgiKxn9p

文章 0 评论 0

关注

ゞ记忆︶ㄣ

文章 0 评论 0

关注

JackDx

文章 0 评论 0

关注

信远

文章 0 评论 0

关注

yaoduoduo1995

文章 0 评论 0

关注

霞映澄塘

文章 0 评论 0

友情链接

文江博客

使用对数标准化向量以避免溢出

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

使用对数标准化向量以避免溢出

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。