Skip to content

扩散模型的两种视角

2026-02-08 · 533字 · 2分钟 · 浏览量

宏观视角-分布的演化 生成模型的目标在于把一个简单的噪声分布 q(x) 演化为真实分布 p(x)。注意这里所谓的噪声分布,只是表明一种采样的简单性,它易于采样,但采出的样本往往是无语义的噪声,因此才称为噪声分布。这并不是说从这个分布中采样得到的值必然是噪声,真实数据也包含在这个分布中,只是其概率值很低而已。我们要做的就是调整这个噪声分布中真实数据的概率值,使其不断逼近真实分布。

微观视角-样本的移动 宏观上我们希望改变一个分布的形状,微观上就是把这些样本重新映射到真实分布的样本,即数据点上。这就要求我们的模型能够学会如何把样本从真实分布中的低概率处(对应于噪声分布的高概率处)输运到高概率处,这个过程被称为重建。而另一方面,我们实际上无法得知真实分布的解析形式,而只能从中采样——即现成的真实数据点,为此我们只能通过把真实数据点先迁移到既定的(先验的)噪声分布的高概率处,然后把这个迁移路径的反向过程视为我们将要学习的目标。

这里的思维转换在于:

  1. 把噪声分布变成真实分布:不可解,因为真实分布解析式未知
  2. 把噪声样本变成真实样本:不可解,因为噪声样本对应的真实样本未知
  3. 把真实样本变成噪声样本:可解,通过将真实样本加噪
  4. 把噪声样本变成真实样本:可解,通过逆转 3 的过程
  5. 把噪声分布变成真实分布:可解,通过对大量噪声样本重复 4 得到大量真实样本,然后用样本分布逼近真实分布
返回

人同此心,心同此理;如风沐面,若水润心