一、概率图模型

发布于 2023-07-17 23:38:25 字数 2209 浏览 0 评论 0 收藏 0

考虑三个随机变量 $ MathJax-Element-106 $ ，其联合概率分布为：
$ P(a,b,c)=P(c\mid a,b)P(a,b)=P(c\mid a,b)P(b\mid a)P(a) $
- 对每个随机变量引入一个节点，然后为每个节点关联上式右侧对应的条件概率。
- 对于每个条件概率分布，在图中添加一个链接（箭头）：箭头的起点是条件概率的条件代表的结点。
  对于因子 $ MathJax-Element-97 $ ，因为它不是条件概率，因此没有输入的链接。
- 如果存在一个从结点 $ MathJax-Element-103 $ 到结点 $ MathJax-Element-102 $ 的链接，则称结点 $ MathJax-Element-103 $ 是结点 $ MathJax-Element-102 $ 的父节点，结点 $ MathJax-Element-102 $ 是结点 $ MathJax-Element-103 $ 的子节点。
- 可以看到，上式的左侧关于随机变量 $ MathJax-Element-106 $ 是对称的，但是右侧不是。
  实际上通过对 $ MathJax-Element-105 $ 的分解，隐式的选择了一个特定的顺序（即 $ MathJax-Element-106 $ ）。如果选择一个不同的顺序，则得到一个不同的分解方式，因此也就得到一个不同的图的表现形式。
对于 $ MathJax-Element-464 $ 个随机变量的联合概率分布，有：
$ P(X_1,X_2,\cdots,X_K)=P(X_K\mid X_1,X_2,\cdots,X_{K-1})\cdots P(X_2\mid X_1)P(X_1) $
- 它对应于一个具有 $ MathJax-Element-464 $ 个结点的有向图。
  - 每个结点对应于公式右侧的一个条件概率分布。
  - 每个结点的输入链接包含了所有的编号低于它的结点。
- 这个有向图是全链接的，因为每对结点之间都存在一个链接。
  实际应用中，真正有意义的信息是图中的链接的缺失，因为：
  - 全链接的计算量太大。
  - 链接的缺失代表了某些随机变量之间的不相关或者条件不相关。
- 设节点 $ MathJax-Element-302 $ 的父节点集合为 $ MathJax-Element-119 $ ，则所有随机变量的联合概率分布为：
  $ P(X_1,X_2,\cdots,X_K)=\prod_{k=1}^KP(X_k\mid \Psi_{X_k}) $
前面讨论的是：每个结点对应于一个变量。可以很容易的推广到每个结点代表一个变量的集合（或者关联到一个向量）的情形。
可以证明：如果上式右侧的每一个条件概率分布都是归一化的，则这个表示方法整体总是归一化的。
概率图模型probabilistic graphical model 就是一类用图来表达随机变量相关关系的概率模型：
- 用一个结点表示一个或者一组随机变量。
- 结点之间的边表示变量间的概率相关关系。
概率图描述了：联合概率分布在所有随机变量上能够分解为一组因子的乘积的形式，而每个因子只依赖于随机变量的一个子集。
根据边的性质不同，概率图模型可以大致分为两类：
- 使用有向无环图表示随机变量间的依赖关系，称作有向图模型或者贝叶斯网络Bayesian network。
  有向图对于表达随机变量之间的因果关系很有用。
- 使用无向图表示随机变量间的相关关系，称作无向图模型或者马尔可夫网络Markov network 。
  无向图对于表达随机变量之间的软限制比较有用。
概率图模型的优点：
- 提供了一个简单的方式将概率模型的结构可视化。
- 通过观察图形，可以更深刻的认识模型的性质，包括条件独立性。
- 高级模型的推断和学习过程中的复杂计算可以利用图计算来表达，图隐式的承载了背后的数学表达式。