10.6 递归神经网络
递归神经网络(2)代表循环网络的另一个扩展,它被构造为深的树状结构而不是RNN的链状结构,因此是不同类型的计算图。递归网络的典型计算图如图10.14所示。递归神经网络由Pollack(1990)引入,而Bottou(2011)描述了这类网络的潜在用途——学习推论。递归网络已成功地应用于输入是数据结构的神经网络(Frasconi et al.,1997,1998),如自然语言处理(Socher et al.,2011a,c,2013a)和计算机视觉(Socher et al.,2011b)。
递归网络的一个明显优势是,对于具有相同长度τ的序列,深度(通过非线性操作的组合数量来衡量)可以急剧地从τ减小为O(logτ),这可能有助于解决长期依赖。一个悬而未决的问题是如何以最佳的方式构造树。一种选择是使用不依赖于数据的树结构,如平衡二叉树。在某些应用领域,外部方法可以为选择适当的树结构提供借鉴。例如,处理自然语言的句子时,用于递归网络的树结构可以被固定为句子语法分析树的结构(可以由自然语言语法分析程序提供)(Socher et al.,2011a,c)。理想的情况下,人们希望学习器自行发现和推断适合于任意给定输入的树结构,如(Bottou,2011)所建议。
图10.14 递归网络将循环网络的链状计算图推广到树状计算图。可变大小的序列x(1),x(2),…,x(t)可以通过固定的参数集合(权重矩阵U,V,W)映射到固定大小的表示(输出o)。该图展示了监督学习的情况,其中提供了一些与整个序列相关的目标y
递归网络想法的变种存在很多。例如,Frasconi et al.(1997)和Frasconi et al.(1998)将数据与树结构相关联,并将输入和目标与树的单独节点相关联。由每个节点执行的计算无须是传统的人工神经计算(所有输入的仿射变换后跟一个单调非线性)。例如,Socher et al.(2013a)提出用张量运算和双线性形式,在这之前人们已经发现当概念是由连续向量(嵌入)表示时,这种方式有利于建模概念之间的联系(Weston et al.,2010;Bordes et al.,2012)。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论