小朋友都能懂的人工智能⑪一滴墨汁成就一代画师（中）

AI调整噪点的分布，将它调整后的分布跟我们给它的图片进行比对，经过不断的反复尝试，直到收敛成正确的分布，下图用钟型曲线来给大家做一个示意，比如紫色的高斯分布曲线为AI的尝试，黄色的高斯分布曲线为实际曲线，经过多次尝试匹配，一次比一次更靠谱，直至紫色和黄色的完全重叠，收敛成功！如果时间间隔足够小，它在上一个时间点曾经所在的位置，也是近似高斯分布的。L：是的，黑色的水就是全都是噪点的图，每次迭代反向

梁敬彬

1258人浏览 · 2025-04-24 11:35:37

梁敬彬 · 2025-04-24 11:35:37 发布

梁敬彬梁敬弘兄弟出品

42. 墨汁的扩散，随机却有规律

L：别着急，咱们也来参透参透。大家都知道墨汁晕开就是一种扩散过程，墨汁最终会和水融为一体。现在我问大家一个问题，谁可以让这杯黑水回到一开始刚刚扩散的样子？

在这里插入图片描述

众人纷纷摇头，说不可能。

L：是的，但是我们还是可以找到一点规律的。墨汁滴入水中是一种随机的扩散过程，为了寻找扩散的规律，我们可以把扩散的过程拍摄下来，然后分成一帧一帧的图片，仔细观查这些图片，我们会发现每一张图片与上一张图片比起来，墨水的微粒都会更散开一点点。其实这里是有数学规律的，即扩散满足高斯分布。

A：L老师，什么叫高斯分布？

L：举个例子，如果你把全世界人的身高做一个统计，以横轴代表每一个身高区间，纵轴代表身高处于这一身高区间的人数，就构成了一个直方图，大致的形状如下。

在这里插入图片描述

大部分人都处于虚线所示的中间区域，越靠近两边人数就越少，但是下降的速度也会变得平缓，这就是高斯分布，又称之为正态分布或钟型分布。

C：为啥会有这么多叫法？

L：叫高斯分布是因为这是德国数学家高斯发现的数据分布规律；而正态英文"normal"，原意是"正规的、常规的、正常的"，表示这种分布在数据分析中频繁出现，太常见了，很多大数据量大分布都符合这个规律，比如身高、体重、收入等等；至于为啥叫“钟型分布”，大家注意看这个图，两端逐渐向下延伸，中间高两端低，看起来像不像寺庙里的大钟？

在这里插入图片描述

C：看起来确实挺像大钟的。
L：这一滴墨汁的微粒，在下一个时间点出现的位置，在概率上是遵循高斯分布的。如果时间间隔足够小，它在上一个时间点曾经所在的位置，也是近似高斯分布的，这可不得了，意味着这从计算上是可逆的。如果我们知道在某一个时间点微粒在水中的位置，是有可能反推出上一个时间点微粒点位置的。
A：哦，原来扩散是有规律的啊。
L：现在大家知道了，虽然我们不能反演墨汁的扩散过程，但是反推大量的微粒运动过程是可能的。接下来重点来了，AI的训练和作画过程也是如此，这种方案是有一个专业的术语，称之为扩散模型(Diffusion Models)。
A爸：哦。

43. 墨汁即原图，扩散即噪点

L：假设我们有一张猫的原图。然后我们逐渐的在图中添加噪点，其实就是像素上的色值，根据高斯分布逐渐扩展的过程。每次散开一些，我们就保留一张当前的图片。直到最后，完全变成一片看不出来的噪点，如下图所示。
在这里插入图片描述

这个时候我们告诉AI，这片什么也看不出来的噪点原来是什么，让它把原来的样子画出来，大家觉得AI可以做到吗？

在这里插入图片描述

C妈：这一团模糊的，AI不可能画出来吧？
L：是的，如果是让AI一步到位，直接从这张完全看不清的照片中得到猫的原图，确实不行。

在这里插入图片描述

不过，有了墨汁扩散的经验后，AI就有办法解决了，它不需要一次生成出最初的图片，它只需要生成出最后一张图片之前的那张图片就可以了。

在这里插入图片描述

A爸：哦，我明白了！您之前说过一滴墨汁的微粒，在下一个时间点出现的位置，在概率上是遵循高斯分布的。如果时间间隔足够小，它在上一个时间点曾经所在的位置，也是近似高斯分布的。如此说来，在足够小的连续时间间隔内，最后一张超级模糊的图片是可以根据高斯分布，往前反推出略微清晰的图片的，就这样一步一步直到最后完全清晰。

L：A爸说的太好了！AI调整噪点的分布，将它调整后的分布跟我们给它的图片进行比对，经过不断的反复尝试，直到收敛成正确的分布，下图用钟型曲线来给大家做一个示意，比如紫色的高斯分布曲线为AI的尝试，黄色的高斯分布曲线为实际曲线，经过多次尝试匹配，一次比一次更靠谱，直至紫色和黄色的完全重叠，收敛成功！请大家仔细看下图的过程。

在这里插入图片描述