茄子的个人空间

变分学习笔记

字数统计: 507阅读时长: 1 min
2021/03/29
loading

变分推断

应用举例

  • 文章LAD题目分析

对文本进行自动分析,然后自动从中找出topic

  • 交通数据分析

    美国湾区出租车数据分析,用变分推断的方法可以在一台笔记本电脑上面完成大量数据的计算

贝叶斯推断概述

目标优缺点

Roadmap

接下来主要讲解变分贝叶斯方法,变分贝叶斯方法是近似贝叶斯推断的一大类方法,变分贝叶斯方法又有很多子类,Mean-field变分推断是其中比较有代表性的一类。接下来结合讲解的方法讲三个例子:univariate Gaussian、Mixture of Gaussians和LDA

贝叶斯推断

Data是观测变量,Parameters是模型的参数,通过对观测变量$x$取值的观测,我们可以更新参数$z$, 这里$p(x) = \int_{z}^{}{p(x,z)dz}$,实际应用中$z$是一个高维的分布,很难计算$p(z|x)$

近似贝叶斯推断_

直接计算$p(z|x)$复杂度很高很难,然后就有了近似计算(推断)。常用的近似计算有:MCMC方法和基于优化的方法,MCMC方法虽然精度高但是数据量大时计算很慢,基于随机梯度的优化方法可以使用并行加速,因此可以大大的加速计算速度。
基于随机梯度优化方法的思路为:找到一个简单的分布$q^(z) \in Q$来近似p(z|x), 目标$q^(z)$应该是$Q$中,与$p(z|x)$某种距离最小的那个。

为什么要用KL散步来度量两个分布的距离呢?
KL满足可导和凸性,使得它的计算更快;
我们没法通过上式求得$q^*(z)$,需要通过下面的转换把优化KL最小问题进行转换为求$q(z)$使得ELBO最大的问题.

这里的$log p(x)$是一个固定的常数。

平均场推断

CATALOG
  1. 1. 变分推断
    1. 1.0.1. 应用举例
    2. 1.0.2. 贝叶斯推断概述
      1. 1.0.2.1. 目标优缺点
      2. 1.0.2.2. Roadmap
    3. 1.0.3. 贝叶斯推断
    4. 1.0.4. 近似贝叶斯推断_
    5. 1.0.5. 平均场推断