(文章目录)前言 在生成对抗网络(GenerativeAdversarialNetwork,简称GAN)发明之前,变分自编码器(VAE)被认为是理论完备,实现简单,使用神经网络训练起来很稳定,生成的图片逼近度也较高,但是人眼还是可以很轻易地分辨出真实图片与机器生成的图片。但在2014年GAN被提出之后,在之后的几年里面里迅速发展,生成的图片越来越逼真。1 GAN1.1 相关介绍 GAN模型的核心思想就是博弈思想,是生成器(造假者)和判别器(鉴别者)之间的博弈,在提出GAN的原始论文中,作者举了货币制造的例子。即像一台验钞机和一台制造假币的机器之间的博弈,两者不断博弈,博弈的结果假币越来越像
(文章目录)前言 在生成对抗网络(GenerativeAdversarialNetwork,简称GAN)发明之前,变分自编码器(VAE)被认为是理论完备,实现简单,使用神经网络训练起来很稳定,生成的图片逼近度也较高,但是人眼还是可以很轻易地分辨出真实图片与机器生成的图片。但在2014年GAN被提出之后,在之后的几年里面里迅速发展,生成的图片越来越逼真。1 GAN1.1 相关介绍 GAN模型的核心思想就是博弈思想,是生成器(造假者)和判别器(鉴别者)之间的博弈,在提出GAN的原始论文中,作者举了货币制造的例子。即像一台验钞机和一台制造假币的机器之间的博弈,两者不断博弈,博弈的结果假币越来越像
模型起源2015年的时候,有几位大佬基于非平衡热力学提出了一个纯数学的生成模型(Sohl-Dicksteinetal.,2015)。不过那个时候他们没有用代码实现,所以这篇工作并没有火起来。直到后来斯坦福大学(Songetal.,2019)和谷歌大脑(Hoetal.,2020)有两篇工作延续了15年的工作。再到后来2020年谷歌大脑的几位大佬又把这个模型实现了出来(Hoetal.,2020),因为这个模型一些极其优秀的特性,所以它现在火了起来。扩散模型可以做什么?呢它可以做一些。条件生成和非条件生成。在图像、语音、文本三个方向都已经有了一些应用,并且效果比较突出。比较出圈的工作有我刚介绍的te
模型起源2015年的时候,有几位大佬基于非平衡热力学提出了一个纯数学的生成模型(Sohl-Dicksteinetal.,2015)。不过那个时候他们没有用代码实现,所以这篇工作并没有火起来。直到后来斯坦福大学(Songetal.,2019)和谷歌大脑(Hoetal.,2020)有两篇工作延续了15年的工作。再到后来2020年谷歌大脑的几位大佬又把这个模型实现了出来(Hoetal.,2020),因为这个模型一些极其优秀的特性,所以它现在火了起来。扩散模型可以做什么?呢它可以做一些。条件生成和非条件生成。在图像、语音、文本三个方向都已经有了一些应用,并且效果比较突出。比较出圈的工作有我刚介绍的te