永利网站网址 8

迄今最强可视化工具,华中科大陈俊

原标题:谷歌GAN 实验室来了!迄今最强可视化工具,在浏览器运行GAN

姓名:李振华 学号:17101223418

永利网站网址 1

【嵌牛导读】:生成式对抗网络(GAN)是近两年机器学习领域的新秀,被Yann
LeCun称为”过去十年机器学习界最有趣的idea”,目前已经得到广泛研究者的关注并且以高频论文数出现在各大顶会上。GAN目前已有一百多种变体,在图像、视频、文字、语音等很多实际场景中均得到应用,是一种潜力巨大的理论模型。
【嵌牛鼻子】:在近期雷锋网AI研习社举办的线上直播分享课上,来自华中科技大学的陈俊为大家详细解读了GAN的基本原理,并且分享了几篇GAN在图像风格转换领域应用的文章。
【嵌牛提问】:我们对机器学习了解多少?我们大部分人应该还处于“觉得很神奇”的状态,而在各大实验室,公司,机器学习已经研究得很深入,应用的很广泛,我们是不是应该跟着新的时代前进呢?
【嵌牛正文】:
转载:https://share.iclient.ifeng.com/news/shareNews?fromType=vampire&forward=1&aid=sub\_40975210&token=xUzM1ADO1MDM0UDN0YDO&aman=1531508z530Z454Z468\#backhead

倒计时**13**天

生成式对抗网络(GAN)是近两年机器学习领域的新秀,被Yann
LeCun称为”过去十年机器学习界最有趣的idea”,目前已经得到广泛研究者的关注并且以高频论文数出现在各大顶会上。GAN目前已有一百多种变体,在图像、视频、文字、语音等很多实际场景中均得到应用,是一种潜力巨大的理论模型。本文主要对阐述了GAN的基本原理,以及GAN的优缺点分析和GAN网络研究发展现状。文章内容根据AI研习社线上公开课整理而成。

在近期雷锋网AI研习社举办的线上直播分享课上,来自华中科技大学的陈俊为大家详细解读了GAN的基本原理,并且分享了几篇GAN在图像风格转换领域应用的文章。

来源:poloclub.github.io

陈俊,华中科技大学自动化学院硕士研究生,模式识别专业,研究兴趣包括:计算机视觉(视频理解、行为识别、目标检测与分类等)、深度学习、机器学习等。

编辑:肖琴

分享主题:深度学习之星-GAN的原理

【新智元导读】今天,Google
AI和乔治亚理工学院的研究人员发布了一个学习GAN的交互式网站:GAN
Lab!由TensorFlow.js 驱动,在浏览器就可以运行GAN。

0.jpeg

Google
AI和乔治亚理工学院的研究人员发布了一个学习GAN的交互式网站:GAN
Lab!由TensorFlow.js
驱动,在浏览器就可以运行GAN,非常直观地了解各种GAN模型的机制,可谓是一大神器。发布后迅速获得好评。

分享内容分为以下五部分:

永利网站网址 2

GAN究竟在做什么?

GAN Lab地址:

GAN如何做的?

GAN是如何训练的?

GitHub:

GAN的小实验

GAN性质小结

论文:

大家好!首先为大家介绍一些GAN变体的最新应用,比如GAN可以被用来学生生成各种各样的字体,可模范名人字体进行个性签名;还可以对图片进行修正,比如把春天的山变成白雪覆盖的山,还有马变斑马,视频自动生成,高分辨率图片生成等等。

1.jpeg

网站提供四种数据分布类型,也可以自定义自己的数据分布,可以使用预训练模型。

GAN究竟在做什么?

永利网站网址 3

在低维数据中,GAN是用来学习数据服从什么样的分布。在高维数据中,GAN可以学习复杂的数据模型,可以代表数据分布的样子。一句话总结:它是在学习样本集的数据分布。

点击运行按钮后,即可查看模型的可视化呈现:

2.jpeg

永利网站网址 4

学习数据分布有什么用?

许多机器学习系统需要查看某种复杂的输入(例如图像),然后产生简单的输出(例如“cat”之类的标签)。相比之下,生成模型的目标恰恰相反:取一小部分输入(可能是一些随机数),然后产生复杂的输出,例如一张看起来很逼真的人脸图像。生成对抗网络(GAN)是一种特别有效的生成模型,从几年前推出以来,一直是机器学习的一个热门研究主题。

学习数据分布可以学习到高纬抽象的分布函数,模拟预测未来数据是什么样子。可以处理缺省数据问题:如半监督学习;可以生成真实样本,还有可以建立模型,通过学到的模型分析数据的特征,比如数据均值,方差,再就是还原数据。

机器从头开始“创造”一幅逼真的图像,这一想法看似神奇,但是GAN使用两个关键技巧将看似不可能的目标变为现实,即建立两个竞争的网络——生成器(generator)和判别器(discriminator)。生成器尝试创建随机的合成输出(例如,面部图像),而鉴别器试图将这些输出与实际输出(例如,名人的数据库)区分开来。当两个网络互相对抗,它们将能变得越来越好——最终结果是能够产生逼真输出的生成网络。

7.jpeg

GAN非常复杂,其可视化也有很多难题。研究者的基本想法是:

怎么生成真实样本?

首先,没有把任何像生成真实图像这样复杂的东西形象化。而是展示一个GAN在二维空间中如何学习点的分布(distribution
of
points)。这样简单的东西没有真正的应用,但是有助于展示系统的机制。因为普通二维(x,y)空间中的概率分布比在高分辨率图像空间中的分布更容易可视化。

3.jpeg

永利网站网址 5

生成模型的一些常见方法:

在两个位置展示数据分布

4.jpeg

单击工具栏上的播放按钮即可运行模型。
除了所选择的分布中的实际样本,你还会看到模型生成的假样本。随着训练的进行,假样本的位置不断更新。完美的GAN创建的假样本分布与实际样本的分布几乎无法区分。当发生这种情况时,在分层分布视图中,你将看到两个分布很好地重叠了。

基于上面的方法有两种形式分为显示估计和隐式估计。生成模型常见方法的比较:

永利网站网址 6

显示:或多或少的需要知道或者假设模型的分布;大多通过Markov chains方法;

随着训练的进行,假样本的位置不断更新。最后,真实样本和假样本的分布发生重叠。

隐式:使用隐藏编码,无需假设模型,无需Markov
chains,以最终生成图像的相似性作为目标;

永利网站网址 7

5.jpeg

生成器的数据转换可视化为流形,将输入噪声(最左边)转换为假样本(最右边)。

GAN如何做的?

永利网站网址 8

它的基本思想:启发自博弈论中的二人零和博弈。博弈双方分别是一个生成模型和一个判别模型,这里的模型可理解为分类器或网络结构。

鉴别器的性能可以通过2Dheatmap解释。

分类模型,一般来说是一个二分类模型,用来判断样本是真是假;(分类器输入为样本,输出概率大于0.5为真,否则为假)

下面的视频更好地展示了生成器和判别器的可视化:

生成模型:是一个样本生成器,把一个噪声包装成另一个逼真的样本,使得判别器误认为是真样本。(输入为噪声,输出为样本维持相同的噪声(假样本))

总之,是非常酷的GAN可视化!

永利网站网址,用一张图来解释:

倒计时 13

6.jpeg

返回搜狐,查看更多

有一个真实样本集和一个制造的假样本集,目的是使得判别器无法判断,无论对于真假样本,输出结果概率都是0.5。

8.jpeg

责任编辑:

GAN是如何训练的?

我们有且仅有真实训练样本集,无标注。假样本集:随机制造而来,没有标注。

讨论它是无监督训练还是有监督训练要看是从哪个角度来看。

如果从输入的样本集来看,它是无监督的。因为没有标记。但是无监督没有办法训练,必须造出一种判别机制,一种监督信号,从这种角度来看,它是有监督的,因为它有监督信号
。把样本的真和假当做监督信号,这个监督信号需要我们自己来造。

从生成假样本的角度来讲,我们希望生成器越来越好,生成的假样本越逼真越好。

9.jpeg

训练前提是,有两个网络,分别单独交替训练。需要注意的是,在生成器里面生成的是假样本数据集,但是在训练的时候需要把它当成真样本数据集来训练。这样才能迷惑判别器。

训练过程精髓之处:假样本在训练过程中的真假变换,这也是博弈得以进行的关键之处。

10.jpeg

用数学公式是如何表示出来的?

12.jpeg

14.jpeg

15.jpeg

GAN小实验

16.jpeg

具体实验过程观看文末视频

GAN性质小结:

GAN可以自动学习原始真实样本集的数据分布,无需假设额外的分布模型;

自动学习潜在的损失函数,判别网络潜在学习到的损失函数隐藏在网络之中;

提供无监督的学习方法,无监督学习是机器学习领域的终极目标;

存在的问题:

不收敛的问题:网络不稳定,难以训练;

网络需要调才能得到较好的结果,比如交替迭代次数,对结果的影响就很大。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

标签:, , , , , ,

相关文章

网站地图xml地图