名医指导 足不出户寻医问药
聚焦健康 权威的健康资讯
您的位置: 首页> 正文

生成式对抗网络(GAN)基础

发布网友 发布时间:2024-10-24 11:14

我来回答

1个回答

热心网友 时间:2024-11-10 15:24

生成式对抗网络(GAN)基础

在生成式对抗网络(GAN)被提出之前,深度学习在计算机视觉领域最令人瞩目的成果基本上都是判别模型,如图像分类,目标识别等。但其实故事的另一半是深度生成模型。生成模型的影响力一直很小,主要原因是对深度神经网络(如CNN)使用最大似然估计时,遇到了棘手的概率计算问题,而GAN的提出则巧妙的绕过了这个问题。

GAN是Ian Goodfellow提出的使用对抗过程来获得生成模型的新框架。生成对抗网络主要由两个部分组成,一个是生成器G(Generator),另一个是判别器D(discriminator)。具体过程包括:对于从训练数据中取样出的真实图片x,判别器D希望D(x)的输出值接近1,即判定训练数据为真实图片;给定一个随机噪声z,判别器D希望D(G(z))的输出值接近0,即认定生成器G生成的图片是假的;而生成器G希望D(G(z))的输出值接近1,即G希望能够欺骗D,让D将生成器G生成的样本误判为真实图片。这样G和D就构成了博弈的状态。在博弈的过程中,生成器G和判别器D都不断的提升自己的能力,最后达到一个平衡的状态。G可以生成足以“以假乱真”的图片G(z)。对于D来说,它难以判定G生成的图片究竟是不是真实的,因此D(G(z)) = 0.5。这样我们的目的就达成了:我们得到了一个生成式的模型G,它可以用来生成真实图片。

最大似然估计的基本想法是定义一个能够给出概率分布(参数为[公式] )估计的模型。最大似然的原理实际上就是选择可以最大化训练数据的似然的模型参数。这在对数空间中很容易完成,我们可以将原来的乘积转化为求和。这样可以简化似然关于模型的导数的代数表达式,而且在用计算机实现的时候,也能够避免数值问题,比如说乘上几个很小的概率值的时候出现的下溢情形。使用最大似然估计就是在近似最小化真实数据分布和模型分布之间的KL散度。但是我们注意上述结论是基于我们的一个假设,就是[公式]处在分布 [公式]族中。所以我们可以想象如果用高斯混合模型这样能力不够强的模型去拟合真实数据分布,显然是不行的。所以我们希望使用神经网络这样能力很强的模型。

GAN最大的贡献就是绕开了这个问题,不直接计算似然,而是通过使用判别器D与生成器G的对抗过程,来训练生成器G。在训练中同时更新判别模型分布(D,蓝色,虚线),D区分数据生成分布(黑色,点线)[公式] 和生成模型分布 [公式](绿色,实线)。在算法的内层循环D被训练来区分生成样本和真实数据,收敛于 [公式] 。当更新G时,D的梯度指导G(z)向更可能被判断为真实数据的区域移动。当训练进行一定次数时(steps),如果G和D具有足够的容量(capacity),它们会到达一个彼此都不能提升的点,因为此时 [公式]。判别器(discriminator)不能区分两个分布, [公式] 。训练方式:交替的训练D和G,D训练k步,G训练1步。只要G变化的足够慢,D就能保持接近他的最优解。

算法中,考虑给定任意的生成器G,推导最佳判别器D。命题1. G固定,最优的D是 [公式] 。D的训练目的可以解释为最大化条件概率[公式] 的似然估计,Y代表x是来自 [公式]还是来自 [公式] 。方程(11)可以被重新写成如下形式。定理1 C(G)取得全局最小值当且仅当 [公式]。当[公式] 时我们取得全局最小值,此时我们的生成模型能够完美的复制真实数据生成过程。

本文通过直观介绍GAN的基本工作方式,最大似然估计说明了GAN提出的最大贡献,以及给出了GAN的形式化定义和理论推导,对GAN的基础进行了深入探讨。

热心网友 时间:2024-11-10 15:26

生成式对抗网络(GAN)基础

在生成式对抗网络(GAN)被提出之前,深度学习在计算机视觉领域最令人瞩目的成果基本上都是判别模型,如图像分类,目标识别等。但其实故事的另一半是深度生成模型。生成模型的影响力一直很小,主要原因是对深度神经网络(如CNN)使用最大似然估计时,遇到了棘手的概率计算问题,而GAN的提出则巧妙的绕过了这个问题。

GAN是Ian Goodfellow提出的使用对抗过程来获得生成模型的新框架。生成对抗网络主要由两个部分组成,一个是生成器G(Generator),另一个是判别器D(discriminator)。具体过程包括:对于从训练数据中取样出的真实图片x,判别器D希望D(x)的输出值接近1,即判定训练数据为真实图片;给定一个随机噪声z,判别器D希望D(G(z))的输出值接近0,即认定生成器G生成的图片是假的;而生成器G希望D(G(z))的输出值接近1,即G希望能够欺骗D,让D将生成器G生成的样本误判为真实图片。这样G和D就构成了博弈的状态。在博弈的过程中,生成器G和判别器D都不断的提升自己的能力,最后达到一个平衡的状态。G可以生成足以“以假乱真”的图片G(z)。对于D来说,它难以判定G生成的图片究竟是不是真实的,因此D(G(z)) = 0.5。这样我们的目的就达成了:我们得到了一个生成式的模型G,它可以用来生成真实图片。

最大似然估计的基本想法是定义一个能够给出概率分布(参数为[公式] )估计的模型。最大似然的原理实际上就是选择可以最大化训练数据的似然的模型参数。这在对数空间中很容易完成,我们可以将原来的乘积转化为求和。这样可以简化似然关于模型的导数的代数表达式,而且在用计算机实现的时候,也能够避免数值问题,比如说乘上几个很小的概率值的时候出现的下溢情形。使用最大似然估计就是在近似最小化真实数据分布和模型分布之间的KL散度。但是我们注意上述结论是基于我们的一个假设,就是[公式]处在分布 [公式]族中。所以我们可以想象如果用高斯混合模型这样能力不够强的模型去拟合真实数据分布,显然是不行的。所以我们希望使用神经网络这样能力很强的模型。

GAN最大的贡献就是绕开了这个问题,不直接计算似然,而是通过使用判别器D与生成器G的对抗过程,来训练生成器G。在训练中同时更新判别模型分布(D,蓝色,虚线),D区分数据生成分布(黑色,点线)[公式] 和生成模型分布 [公式](绿色,实线)。在算法的内层循环D被训练来区分生成样本和真实数据,收敛于 [公式] 。当更新G时,D的梯度指导G(z)向更可能被判断为真实数据的区域移动。当训练进行一定次数时(steps),如果G和D具有足够的容量(capacity),它们会到达一个彼此都不能提升的点,因为此时 [公式]。判别器(discriminator)不能区分两个分布, [公式] 。训练方式:交替的训练D和G,D训练k步,G训练1步。只要G变化的足够慢,D就能保持接近他的最优解。

算法中,考虑给定任意的生成器G,推导最佳判别器D。命题1. G固定,最优的D是 [公式] 。D的训练目的可以解释为最大化条件概率[公式] 的似然估计,Y代表x是来自 [公式]还是来自 [公式] 。方程(11)可以被重新写成如下形式。定理1 C(G)取得全局最小值当且仅当 [公式]。当[公式] 时我们取得全局最小值,此时我们的生成模型能够完美的复制真实数据生成过程。

本文通过直观介绍GAN的基本工作方式,最大似然估计说明了GAN提出的最大贡献,以及给出了GAN的形式化定义和理论推导,对GAN的基础进行了深入探讨。
声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
石料加工服务可以全部交给第三人完成吗 山东沃尔德集团集团所辖公司介绍 齐鲁银行无忧贷和市民贷哪个好 什么叫补按揭 后按揭贷款什么意思 买房者续按揭有什么危害 加按揭是什么意思 八月中国最凉快的地方 八月份哪里最凉快,去哪旅游好?美丽的地方 乱字同韵字是什么意思 华硕笔记本电脑触摸板怎么开笔记本电脑触摸板怎么开启和关闭_百度知 ... 陕西职务侵占案立案准则 结婚后我的恋情维系了十年,怎么做到的? 玉米仁子饭产自哪里 中国期货交易所的交易品种有哪些? 历史要怎么读,有啥诀窍 高中历史诀窍 年终会活动策划方案 深度解析:第一财经回放,探索财经新风向 逆水寒手游庄园怎么邀请好友同住 逆水寒手游 逆水寒不同区可以一起组队吗? 逆水寒手游 逆水寒怎么进入好友世界? 逆水寒手游 逆水寒怎么去别人的庄园? 使用puppeteer实现将htmll转成pdf 内卷时代下的前端技术-使用JavaScript在浏览器中生成PDF文档 【译】将HTML转为PDF的几种实现方案 变形金刚08动画怎么样 变形金刚08动画的问题 变形金刚08动画日语版剧情介绍 高分!换显卡nvidia控制面板被我卸了,重新安装显卡驱动后没了nvidia控... 我的nvidia控制面板被卸载了 怎么找回啊 卸载后 这个画面看着很奇怪_百 ... 李卓彬工作简历 林少明工作简历 广东工业职业技术学院怎么样 郑德涛任职简历 唐新桂个人简历 土地入股的定义 ups快递客服电话24小时 贷款记录在征信保留几年? 安徽徽商城有限公司公司简介 安徽省徽商集团新能源股份有限公司基本情况 安徽省徽商集团有限公司经营理念 2019哈尔滨煤气费怎么有税? 快手删除的作品如何恢复 体育理念体育理念 有关体育的格言和理念 什么是体育理念 万里挑一算彩礼还是见面礼 绿萝扦插多少天后发芽 绿萝扦插多久发芽 帮我推荐一款头戴式耳机,主要听无损的流行音乐,偶尔听雅尼的音乐,400... 橐笔释义 生成对抗网络(GAN)损失函数 输入一个字符,若是大写字母将其转化为小写输出,如果是小写,则将其转化... 标准好男人是什么样的 何乐不为运用什么修辞手法 为什么需要IPA签名 女性亚健康应该怎么办? 综漫小说要蔷薇少女,斩赤红之瞳,精灵使的剑舞,魔法少女小圆,刀剑,漆黑... 微信可以不用软件转发小视频吗? ...那种可以自动播放的那种。不是用第三方软件, 鹦鹉的生活习性 鹦鹉有什么生活习性呢 微信视频播放需要下载播放器吗 保险99种疾病包括什么意思 我们的日子中明中得了啥病 脾酒跟红酒哪种好喝不容易醉?拜托各位了 3Q 波心雨后一鱼跃的下一句是什么 如何弹周杰伦的歌晴天 什么酒最好喝啊?度数越高越好喝么?红酒跟啤酒的味道有什么不同啊? 波心雨后一鱼跃的下一句波心雨后一鱼跃的下一句是什么 雕刻机 手柄控制改成电脑控制怎么弄 ...则把它变成小写字母;如果它是一个小写字母,则把它变成大写字母_百度... 生成式对抗网络(GAN)理论详解 请教手机上网有什么好的网站? ...父子徒步橐笔以干有司,又久不遇。翻译过来是啥意思是? 从键盘输入一个字符,若为小写字母,则转化为大写字母;若为大写字母,则转... 商汤和舜什么关系。舜帝儿子商均。估计商汤是舜帝的血脉吧?_百度... 编程:从键盘上输入一个字符,如果是大写的转化成小写的,如果是小写的转... 有好的汽车贷款推荐吗?神州车闪贷怎么样? 减肥期间吃冰糕没事吧? 我正在减肥,吃一根冰糕会胖吗 吃冰糕减肥吗 王之夫的静者静动 非不动也.静即含动 动不舌静反应了什么哲学思想 吃低热量冰糕会胖吗 静者静动概述 怎样去领导家里做客 “岁月悠悠老秩寅”的出处是哪里 ...父子徒步橐笔以干有司,又久不遇。翻译过来是啥意思是? 黑龙江职业学院是一本吗 多少分能被黑龙江艺术职业学院录取
  • 焦点

最新推荐

猜你喜欢

热门推荐