Importance Sampling

概述
Adaptive Importance Sampling & Sampling-Importance-Resampling

概述

假设我们想计算$E[f(x)]$，而$x$本身服从分布 $p(x)$ ，即 $E[f(x)]=\int_x{f(x)p(x)dx}$ 如果我们不方便在 $p(x)$ 上采样或者，可以引入一个方便采样的 $q(x)$ ， $E[f(x)]=\int_x{f(x)p(x)dx}=\int_xf(x)\frac{p(x)}{q(x)}q(x)dx=\int_xf(x)w(x)q(x)dx$ 这样问题就转化成了求 $f(x)w(x)$ 在 $q(x)$ 分布下的期望。 $w(x)$称为importance weight, $q(x)$称为proposed distribution.

下图表示了$p(x)$很复杂，无法进行采样的情况。 Alt text

另外一种情况如下图所示，左图表示直接从$p(x)$进行采样，会导致$f(x)$大的地方都没有采样点，计算出来的期望可能有所偏差。右图中我们引入$q(x)$来协助采样，如果能在$f(x)p(x)$较大的地方获取较多的样本，则所获得的期望估计结果就能较准确地接近真实值。 Alt text

一个实际的例子

一个工厂里面，工资有三档，低，中，高，分别为100块，200块，300块。其中拿低档工资的工人占60%，拿中档工资的工人占30%，拿高档工资的工人10%人。求该工厂工人工资的期望值。

这很容易，使用Monte Carlo Method即可。随机地对该厂工人采样，求均值，结果随着采样数量增加会收敛该式0.6N∗100+0.3N∗200+0.1N∗300N/N。

接下来，问题改变了。该工厂有一个车间，工人的收入分布有所不同。低档50%，中档30%，高档20%。假设我们只能从该车间工人中采样，如何得到该厂的工人工资的期望值。

如果我们直接从该车间工人中采样取均值，结果是错误的，因为车间工人工资分布与工厂工人工资分布是不同的，从车间工人中采样的结果应该收敛到该式0.5N∗100+0.3N∗200+0.2N∗300N/N，显然与上式不同。

因此，我们在用来自车间的工人采样时，只需要在工人工资数额前乘上一个权重p(x)/q(x)，如对于低档次工资的工人，权重为0.6/0.5，中档0.3/0.3，高档0.1/0.2，把所采工人的工资按权重求均值，就是工厂工人工资的期望值。

Adaptive Importance Sampling & Sampling-Importance-Resampling

Parallel Adaptive Importance Sampling

Adaptive Importance Sampling via Stochastic Convex Programming

在高维空间里找到一个合适的 q(x) 非常难。即使有 Adaptive importance sampling 和 Sampling-Importance-Resampling(SIR) 的出现，find a proposal distribution q(x) which is both easy to sample and can produce good approximations, it is often impossible.

重要性采样

概述

Adaptive Importance Sampling & Sampling-Importance-Resampling

FEATURED TAGS

FRIENDS