当前位置：文江博客话题详情

neural-network backpropagation

神经网络反向传播？

发布于 2024-08-18 04:42:50 字数 573 浏览 9 评论 0原文

谁能推荐一个网站或简要介绍一下反向传播如何在神经网络中实现？我理解基本概念，但不确定如何编写代码。

我发现的许多资料来源只是简单地显示方程式，而没有给出任何解释为什么这样做，而且变量名称使得很难找到。

示例：

void bpnn_output_error(delta, target, output, nj, err)
double *delta, *target, *output, *err;
int nj;
{
  int j;
  double o, t, errsum;

  errsum = 0.0;
  for (j = 1; j <= nj; j++) {
    o = output[j];
    t = target[j];
    delta[j] = o * (1.0 - o) * (t - o);
    errsum += ABS(delta[j]);
  }
  *err = errsum;

}

在该示例中，有人可以解释一下“谢谢”的目的吗

delta[j] = o * (1.0 - o) * (t - o);

？

Can anyone recommend a website or give me a brief of how backpropagation is implemented in a NN? I understand the basic concept, but I'm unsure of how to go about writing the code.

Many of sources I've found simply show equations without giving any explanation of why they're doing it, and the variable names make it difficult to find out.

Example:

void bpnn_output_error(delta, target, output, nj, err)
double *delta, *target, *output, *err;
int nj;
{
  int j;
  double o, t, errsum;

  errsum = 0.0;
  for (j = 1; j <= nj; j++) {
    o = output[j];
    t = target[j];
    delta[j] = o * (1.0 - o) * (t - o);
    errsum += ABS(delta[j]);
  }
  *err = errsum;

}

In that example, can someone explain the purpose of

delta[j] = o * (1.0 - o) * (t - o);

Thanks.

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

雨后彩虹 2024-08-25 04:42:50

目的

delta[j] = o * (1.0 - o) * (t - o);

是找到反向传播网络中输出节点的误差。

o 表示节点的输出，t 是节点输出的期望值。

术语 (o * (1.0 - o)) 是常用传递函数 sigmoid 函数的导数。（其他传递函数并不罕见，需要重写具有 sigmoid 一阶导数的代码。函数和导数之间的不匹配可能意味着训练不会收敛。）节点有一个“激活”值，该值通过传递函数馈送以获得输出 o，例如

o = f（激活）

最主要的是反向传播使用梯度下降，并且误差通过应用链式法则向后传播。问题是信用分配问题之一，或者如果你愿意的话，归咎于其输出与预期值无法直接比较的隐藏节点。我们从已知且可比较的输出节点开始。该误差与输出的一阶导数乘以预期输出和实际输出之间的原始误差值成正比。

更具象征意义的是，我们将该行写为

delta[j] = f'(activation_j) * (t_j - o_j)

其中 f 是您的传递函数，f' 是它的一阶导数。

在隐藏层的更深处，节点的误差是其对下一层发现的误差的估计贡献。因此，后续层的增量乘以连接权重，然后将这些乘积相加。该总和乘以隐藏节点激活的一阶导数以获得隐藏节点的增量，或者

delta[j] = f'(activation_j) * Sum(delta[k] * w_jk)

其中 j 现在引用后续层中的隐藏节点和 ka 节点。

回复收藏 0 原文

夜吻♂芭芘 2024-08-25 04:42:50

(to) 是网络输出中的错误，因为 t 是目标输出，o 是实际输出。它以标准化形式存储在 delta 数组中。用于标准化的方法取决于实现，并且 o * ( 1.0 - o ) 似乎正在这样做（我的假设可能是错误的）。

这个归一化误差会针对整个训练集进行累积，以判断训练何时完成：通常是在 errsum 低于某个目标阈值时。

回复收藏 0 原文

柠北森屋 2024-08-25 04:42:50

其实，如果你了解理论，程序应该很容易理解。您可以阅读这本书并使用铅笔做一些简单的示例，以找出传播的确切步骤。这是实现数值程序的一般原则，您必须了解小情况的细节。

如果您了解 Matlab，我建议您阅读一些 Matlab 源代码（例如这里），这比C更容易理解。

对于您问题中的代码，名称非常不言自明，输出可能是您预测的数组，目标可能是数组训练标签中，delta是预测值与真实值之间的误差，它也作为更新到权重向量中的值。

回复收藏 0 原文

春风十里 2024-08-25 04:42:50

本质上，反向传播的作用是在训练数据上运行网络，观察输出，然后调整节点的值，从输出节点迭代回到输入节点。

回复收藏 0 原文

~没有更多了~

关于作者

林空鹿饮溪

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

忆悲凉

文章 0 评论 0

hgfg1645

文章 0 评论 0

qq_qLPLYi

文章 0 评论 0

戏舞

文章 0 评论 0

殊姿

文章 0 评论 0

﹂绝世的画

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文