第16章 深度学习中的结构化概率模型
深度学习为研究者们提供了许多建模方式,用以设计以及描述算法。其中一种形式是结构化概率模型(structured probabilistic model)的思想。我们曾经在第3.14节中简要讨论过结构化概率模型。此前简要的介绍已经足够使我们充分了解如何使用结构化概率模型作为描述第2部分中某些算法的语言。现在在第3部分,我们可以看到结构化概率模型是许多深度学习重要研究方向的关键组成部分。作为讨论这些研究方向的预备知识,本章将更加详细地描述结构化概率模型。本章内容是自洽的,所以在阅读本章之前读者不需要回顾之前的介绍。
结构化概率模型使用图来描述概率分布中随机变量之间的直接相互作用,从而描述一个概率分布。在这里我们使用了图论(一系列结点通过一系列边来连接)中“图”的概念,由于模型结构是由图定义的,所以这些模型也通常被称为图模型(graphical model)。
图模型的研究社群是巨大的,并提出过大量的模型、训练算法和推断算法。在本章中,我们将介绍图模型中几个核心方法的基本背景,并且重点描述已被证明对深度学习社群最有用的观点。如果你已经熟知图模型,那么你可以跳过本章的绝大部分。然而,我们相信即使是资深的图模型方向的研究者也会从本章的最后一节中获益匪浅,详见第16.7节,其中我们强调了在深度学习算法中使用图模型的独特方式。相比于其他图模型研究领域的是,深度学习的研究者们通常会使用完全不同的模型结构、学习算法和推断过程。在本章中,我们将指明这种区别并解释其中的原因。
我们首先介绍了构建大规模概率模型时面临的挑战。之后,我们介绍如何使用一个图来描述概率分布的结构。尽管这个方法能够帮助我们解决许多挑战和问题,它本身仍有很多缺陷。图模型中的一个主要难点就是判断哪些变量之间存在直接的相互作用关系,也就是对于给定的问题哪一种图结构是最适合的。在第16.5节中,我们通过了解依赖(dependency),简要概括了解决这个难点的两种方法。最后,作为本章的收尾,我们在第16.7节中讨论深度学习研究者使用图模型特定方式的独特之处。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论