返回介绍

4.2 Hessian 矩阵

发布于 2025-02-18 23:44:01 字数 1929 浏览 0 评论 0 收藏 0

假设 ? :Rn→R 是 n 维向量 A 的的函数,并返回一个实数。那么 x 的 Hessian 矩阵是偏导数的 n×n 矩阵,写作?2xf(x),简记为 H。

换句话说,?2xf(x) ∈ Rn×n ,其中:

需要注意的是 Hessian 矩阵始终是对称的,即:

和梯度类似,Hessian 矩阵只在 f(x) 为实数时有定义。

可以很自然联想到,偏导类似于函数的一阶导数,而 Hessian 类似函数的的二阶导数(我们使用的符号,也表明了这种联系)。通常这种直觉是正确的,但有些注意事项需要牢记。

首先,只有一个变量的实值函数,f : R→R,它的基本定义是二阶导数是一阶导数的导数,即:

然而,对于关于向量的函数,该函数的梯度是一个向量,我们不能取向量的梯度,即;

并且这个表达式没有定义。因此,不能说 Hessian 矩阵是梯度的梯度。然而,在下面的意义上比较靠谱:如果我们取第 i 项(?xf(X))i =?F(X)/?xi,并取对 x 的梯度,我们得到:

这是 Hessian 矩阵的第 i 列(或行)。 因此:

如果此处稍粗略一点,可以得出,只要将其真实的含义理解为对 (?xf(x)) 的每一项求梯度,而不是对向量求梯度即可。

最后注意,虽然可求出对矩阵 A∈Rn的梯度,但在本课程中,将只考虑向量 x∈Rn的 Hessian 矩阵。这仅仅是为了方便起见(而事实上,没有计算需要求矩阵的 Hessian 矩阵),因为矩阵的 Hessian 矩阵必须表示为所有的偏导数?2f(A)/(?Aij?Ak?),而要表示为矩阵却相当麻烦。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文