小朋友都能懂的人工智能⑪一滴墨汁成就一代画师(中)
AI调整噪点的分布,将它调整后的分布跟我们给它的图片进行比对,经过不断的反复尝试,直到收敛成正确的分布,下图用钟型曲线来给大家做一个示意,比如紫色的高斯分布曲线为AI的尝试,黄色的高斯分布曲线为实际曲线,经过多次尝试匹配,一次比一次更靠谱,直至紫色和黄色的完全重叠,收敛成功!如果时间间隔足够小,它在上一个时间点曾经所在的位置,也是近似高斯分布的。L: 是的,黑色的水就是全都是噪点的图,每次迭代反向
梁敬彬梁敬弘兄弟出品
往期回顾
————————————————————————
小朋友都能懂的人工智能⓵开篇大吉(上)
小朋友都能懂的人工智能⓵开篇大吉(中)
小朋友都能懂的人工智能⓵开篇大吉(下)
————————————————————————
小朋友都能懂的人工智能②卷机神经网络初探(上)
小朋友都能懂的人工智能②卷机神经网络初探(中)
小朋友都能懂的人工智能②卷机神经网络初探(下)
————————————————————————
小朋友都能懂的人工智能⓷ -惊世骇俗的阿“狗”故事(上)
小朋友都能懂的人工智能⓷ -惊世骇俗的阿“狗”故事(中)
小朋友都能懂的人工智能⓷ -惊世骇俗的阿“狗”故事(下)
————————————————————————
小朋友都能懂的人工智能⓸ -狗大师的修仙之路(上)
小朋友都能懂的人工智能⓸ -狗大师的修仙之路(中)
小朋友都能懂的人工智能⓸ -狗大师的修仙之路(下)
————————————————————————
小朋友都能懂的人工智能⓹-不可思议的大模型(上)
小朋友都能懂的人工智能⓹-不可思议的大模型(中)
小朋友都能懂的人工智能⓹-不可思议的大模型(下)
————————————————————————
小朋友都能懂的人工智能⓺- 逆天,句中高能!!(上)
小朋友都能懂的人工智能⓺- 逆天,句中高能!!(中)
小朋友都能懂的人工智能⓺- 逆天,句中高能!!(下)
————————————————————————
小朋友都能懂的人工智能⓻–无名的故事与GPT-4训练流程(上)
小朋友都能懂的人工智能⓻–无名的故事与GPT-4训练流程(中)
小朋友都能懂的人工智能⓻–无名的故事与GPT-4训练流程(下)
————————————————————————
小朋友都能懂的人工智能⓼–无名的故事与GPT-4运行(推理)流程(上)
小朋友都能懂的人工智能⓼–无名的故事与GPT-4运行(推理)流程(中)
小朋友都能懂的人工智能⓼–无名的故事与GPT-4运行(推理)流程(下)
————————————————————————
小朋友都能懂的人工智能⓽ Hi AI, Database is all you need(上)
小朋友都能懂的人工智能⓽ Hi AI, Database is all you need(中)
小朋友都能懂的人工智能⓽ Hi AI, Database is all you need(下)
————————————————————————
小朋友都能懂的人工智能⓾大白话数据库(上)
小朋友都能懂的人工智能⓾大白话数据库(中)
小朋友都能懂的人工智能⓾大白话数据库(下)
————————————————————————
小朋友都能懂的人工智能⑪一滴墨汁成就一代画师(上)
————————————————————————
42. 墨汁的扩散,随机却有规律
L:别着急,咱们也来参透参透。大家都知道墨汁晕开就是一种扩散过程,墨汁最终会和水融为一体。现在我问大家一个问题,谁可以让这杯黑水回到一开始刚刚扩散的样子?

众人纷纷摇头,说不可能。
L:是的,但是我们还是可以找到一点规律的。墨汁滴入水中是一种随机的扩散过程,为了寻找扩散的规律,我们可以把扩散的过程拍摄下来,然后分成一帧一帧的图片,仔细观查这些图片,我们会发现每一张图片与上一张图片比起来,墨水的微粒都会更散开一点点。其实这里是有数学规律的,即扩散满足高斯分布。
A:L老师,什么叫高斯分布?
L:举个例子,如果你把全世界人的身高做一个统计,以横轴代表每一个身高区间,纵轴代表身高处于这一身高区间的人数,就构成了一个直方图,大致的形状如下。

大部分人都处于虚线所示的中间区域,越靠近两边人数就越少,但是下降的速度也会变得平缓,这就是高斯分布,又称之为正态分布或钟型分布。
C:为啥会有这么多叫法?
L:叫高斯分布是因为这是德国数学家高斯发现的数据分布规律;而正态英文"normal",原意是"正规的、常规的、正常的",表示这种分布在数据分析中频繁出现,太常见了,很多大数据量大分布都符合这个规律,比如身高、体重、收入等等;至于为啥叫“钟型分布”,大家注意看这个图,两端逐渐向下延伸,中间高两端低,看起来像不像寺庙里的大钟?

C:看起来确实挺像大钟的。
L:这一滴墨汁的微粒,在下一个时间点出现的位置,在概率上是遵循高斯分布的。如果时间间隔足够小,它在上一个时间点曾经所在的位置,也是近似高斯分布的,这可不得了,意味着这从计算上是可逆的。如果我们知道在某一个时间点微粒在水中的位置,是有可能反推出上一个时间点微粒点位置的。
A:哦,原来扩散是有规律的啊。
L:现在大家知道了,虽然我们不能反演墨汁的扩散过程,但是反推大量的微粒运动过程是可能的。接下来重点来了,AI的训练和作画过程也是如此,这种方案是有一个专业的术语,称之为扩散模型(Diffusion Models)。
A爸:哦。
43. 墨汁即原图,扩散即噪点
L:假设我们有一张猫的原图。然后我们逐渐的在图中添加噪点,其实就是像素上的色值,根据高斯分布逐渐扩展的过程。每次散开一些,我们就保留一张当前的图片。直到最后,完全变成一片看不出来的噪点,如下图所示。
这个时候我们告诉AI,这片什么也看不出来的噪点原来是什么,让它把原来的样子画出来,大家觉得AI可以做到吗?

C妈:这一团模糊的,AI不可能画出来吧?
L:是的,如果是让AI一步到位,直接从这张完全看不清的照片中得到猫的原图,确实不行。

不过,有了墨汁扩散的经验后,AI就有办法解决了,它不需要一次生成出最初的图片,它只需要生成出最后一张图片之前的那张图片就可以了。

A爸:哦,我明白了!您之前说过一滴墨汁的微粒,在下一个时间点出现的位置,在概率上是遵循高斯分布的。如果时间间隔足够小,它在上一个时间点曾经所在的位置,也是近似高斯分布的。如此说来,在足够小的连续时间间隔内,最后一张超级模糊的图片是可以根据高斯分布,往前反推出略微清晰的图片的,就这样一步一步直到最后完全清晰。
L:A爸说的太好了!AI调整噪点的分布,将它调整后的分布跟我们给它的图片进行比对,经过不断的反复尝试,直到收敛成正确的分布,下图用钟型曲线来给大家做一个示意,比如紫色的高斯分布曲线为AI的尝试,黄色的高斯分布曲线为实际曲线,经过多次尝试匹配,一次比一次更靠谱,直至紫色和黄色的完全重叠,收敛成功!请大家仔细看下图的过程。

正确收敛后顺利过关!你们看,略微清晰的图片出来了吧,如下图所示。

接着继续这样类似的操作一张一张图片进行下去,最终,来到最初的图片。

AI在经过无数张类似的图片训练后,AI终于学会了如何省时省力的画画了,从一堆噪点中反向扩散出一张画了,变成画猫高手了,如下图所示。

A爸:真想不到,这画猫和墨汁的扩散过程真是有异曲同工之妙啊。
L: 是的,黑色的水就是全都是噪点的图,每次迭代反向扩散就是根据当前墨水的状态,推测前一个阶段水的状态,最后得到墨水没有散开前的样子就是图像最原始的那只可爱的猫。
两者从本质上是一样的,只要是随机扩散,就遵循高斯分布。有规律,机器就能通过无数次的训练去学习和加以应用。

A爸:还真是挺有趣的!不过,我还是有一个疑问,AI绘画为啥要采用这种扩散模型,正常的一笔一笔画出来的方式不好吗?
未完待续…
小朋友都能懂的人工智能⑪一滴墨汁成就一代画师(下)
系列回顾
更多推荐


所有评论(0)