分享好友 最新动态首页 最新动态分类 切换频道
GAN(生成对抗网络)的系统全面介绍(醍醐灌顶)
2024-12-27 00:05


目录

0.预备知识

1.GAN的介绍 

1.1 GAN的基本概念介绍

1.2 GAN的基本架构图

2.一个GAN的形成过程

2.1训练GAN:生成网络和判别网络的训练 (优化)

具体怎么训练的概念介绍

具体怎么训练的原理介绍(数学层面

3.卷积神经网络(ConvNets)

3.1卷积神经网络与传统多层神经网络

3.1.1卷积网络的结构

3.1.2卷积步骤

 4.总结

参考


       对于初学者而言,开始学习GAN,但并不知道GAN是什么东西,认为GAN是一种高大上的东西。学完一问GAN的基本思想,不太清楚,反而将GAN给复杂化了,所以在这里我们要先引入一个简单的GAN的思想概念,在我们脑子中引入一个GAN的基本概念,可以帮助我们今后更好地学习。

人工智能本质上是要构建数据的映射函数,而构建数据的映射函数需要通过一个学习归纳总结的过程,因此需要提供一个用于学习的模型,而生成对抗网络就是一种用来学习的模型 

      GAN的全称是Generative adversarial network,中文翻译过来就是生成对抗网络。生成对抗网络其实是两个网络的组合:生成网络(Generator)负责生成模拟数据;判别网络(Discriminator)负责判断输入的数据是真实的还是生成的。生成网络要不断优化自己生成的数据让判别网络判断不出来,判别网络也要优化自己让自己判断得更准确。二者关系形成对抗,因此叫对抗网络。

       这里的网络指的是神经网络,这是因为GAN是基于神经网络模型(以人类神经网络为原型提出的一种计算模型)设计的。关于神经网络模型的详细介绍,请参考和。至于为什么要用神经网络模型,而不用其他模型,是因为神经网络模型刚好适用于我们生成对抗网络的实现,并不是故意要选这种模型的,这点要搞清楚。

GAN网络架构概念图

GAN网络内部架构图

同我上面讲的一样,生成网络和判别网络都是神经网络的模式。

生成器(Generator):通过机器生成数据(大部分情况下是图像,最终目的是“骗过”判别器。

判别器(Discriminator):判断这张图像是真实的还是机器生成的,目的是找出生成器做的“假数据”。

构建GAN模型的基本逻辑:现实问题需求→建立实现功能的GAN框架(编程)→训练GAN(生成网络、对抗网络)→成熟的GAN模型→应用。
本节主要是介绍“训练GAN”如何实现和其中的核心要点

        GAN模型不是一上来就能实现具体功能的,需要经历一个训练的过程。我将其训练前后状态称为“原始的GAN模型”和“成熟的GAN模型”,原始的GAN模型要经过一个训练的过程成为一个成熟的GAN模型,而这个“成熟的GAN模型”才是我们实际应用的GAN模型。那么这个训练过程具体是训练什么呢?是训练生成网络(Generator)和判别网络(Discriminator)。训练是基于数据集训练的。

具体生成网络和对抗网络的优化是如何实现的? 继续往下走,这就涉及到两个核心的问题神经网络的架构损失函数 (loss function)。神经网络架构和损失函数的定义是能够实现优化(训练)的两个基本要素。

1)神经网络架构之前说了生成网络和对抗网络采用的都是神经网络的框架,也提到了是因为适合才选择神经网络的框架的,那么下面介绍一下为什么神经网络模型适合于事物分布规律的学习(成熟的GAN网络就是学习之后的GAN网络)。

一个简单的神经网络模型

        上图所示的就是生成器和判别器里面会采用的神经网络模型的一个最基础的形式展示 ,一般神经网络模型基本构成包含三个部分(由这三个部分组成)输入层(Input Layer)隐藏层(Hidden Layer)输出层(Output Layer)组成。详细请参考

  • 输入层只有一层,用于接收输入数据的特征X1 、X2……,然后原封不动输出给隐藏层,输入层不进行任何计算
  • 隐藏层可以一层或多层,对上一层过来的数据进行处理然后输出给下一层,最终输出到输出层。指的是激活函数
  • 输出层: 从隐藏层获取输入并执行计算,作为这些计算结果的计算值Y1 、Y2……,即输出。

相邻两层每两个神经元之间的的连线上都有权重(神经元j和神经元i之间的权重优化的核心就是优化这些权重参数。怎么优化呢?首先就要引入损失函数(损失函数相当于误差,有误差,根据误差反过来就可以调整参数(即神经网络优化的原理,又一重要概念误差反向传播往下看)。

2)损失函数(loss function)
目的:损失函数(loss function)是用来估量模型的预测值与真实值的不一致程度(即误差)。更进一步了解请看:。

生成网络的损失函数

上式中,G 代表生成网络,D 代表判别网络,H 代表交叉熵,z 是输入随机数据。 是对生成数据的判断概率,1代表数据绝对真实,0代表数据绝对虚假。 代表判断结果与1的距离。显然生成网络想取得良好的效果,那就要做到,让判别器将生成数据判别为真数据(即D(G(z))与1的距离越小越好)。

判别网络的损失函数

上式中,是真实数据,这里要注意的是,代表真实数据与1的距离,代表生成数据与0的距离。显然,识别网络要想取得良好的效果,那么就要做到,在它眼里,真实数据就是真实数据,生成数据就是虚假数据(即真实数据与1的距离小,生成数据与0的距离小)。

优化原理生成网络和判别网络有了损失函数,就可以基于各自的损失函数,利用误差反向传播(Backpropagation)和最优化方法(如梯度下降法)来实现参数的调整,不断提高生成网络和判别网络的性能(最终生成网络和判别网络的成熟状态就是学习到了合理的映射函数)。

生成对抗网络的训练过程就是参数优化的过程。具体的优化案例介绍请看


至此介绍GAN的部分就结束了, 下面的内容是我对在GAN中经常遇见的”卷积“概念进行简单的拓展讲解,有兴趣的朋友可以看一下。

       我们在学习中GAN时经常遇到“卷积”,对于一部分人来说,时常弄不清楚“卷积”与GAN之间的关系。下面我来介绍一下我理解的“卷积”和GAN之间的区别与联系。“卷积”在这里指的是卷积神经网络(我理解为在神经网络架构上利用卷积的原理来实现某种功能的一种特定神经网络架构,众所周知,卷积神经网络对于图像特征提取具有十分优异的性能,而很多GAN又都是跟图像有关系的(例如图像识别、图形转换等,因此卷积和神经网络就自然而然的结合了起来。

       神经网络不是一个狭义的网络连接形式,而是以神经元为基本单元,按需求进行设计出的神经网络的广义概念。比如,多层感知器网络、卷积神经网络、RNN网络、LSTM网络等。架构设计、权重参数设计、激活函数的等超参数的不同都会设计出各种各样的神经网络模型。它像是一块块积木,具体搭建出怎样的结构因每个人的想法而不同。


卷积的操作就是提取图像特征,这些特征就是输入传统神经网络输入层的数据,也就是相当于在多层感知器网络的前面加一个卷积神经网络。

3.1.1卷积网络的结构

区别2传统网络大多都是二维的,而卷积神经网络则是三维层面。

3.1.2卷积步骤

一、卷积操作的介绍(概念层面)

LeNet 架构(1990 年代

LeNet 是最早帮助推动深度学习领域的卷积神经网络之一。Yann LeCun 的这项开创性工作 在自 1988 年以来多次成功迭代后被命名为LeNet5。当时 LeNet 架构主要用于字符识别任务,例如读取邮政编码、数字等。

下面,我们将直观地了解 LeNet 架构如何学习识别图像,来了解卷积神经网络是如何工作的。

为了避免内容的繁杂,在此不做介绍了,详细的卷积步骤的介绍请看(十分通俗易懂

二、卷积的操作介绍(数学层面)

关于彩色图和灰度图的处理方式的不同
彩色图是由R、G、B三层矩阵,每个神经元带三个卷积核,最后输出为一个矩阵,即原本三层图像输入,然后输出为一层,该层即为特征图。

看下图的卷积层1,内置的卷积核为5×5×3,即为三层卷积核,6个卷积核。 

有关神经网络讲解的具体例子请看

1.生成网络和判别网络的网络架构

以深度卷积神将网络为例(DCGAN)
生成网络:卷积神经网络+反卷积神经网络(前者负责提取图像特征,后者负责根据输入的特征重新生成图像(即假数据))。反卷积神经网络在此不做介绍,有兴趣的同学自行学习。
判别网络:卷积神经网络+全连接层处理(传统神经网络)(前者负责提取图像特征,后者负责判别真假。)

2.神经网络的基本概念

以神经元为基本单元,通过设置不同参数和设计不同形式而构成的网络模型。

3.GAN的核心要点

GAN的核心要点我觉得主要体现在GAN训练的核心上,即神经网络架构损失函数基础下的误差反向传播。

4.卷积神经网络

卷积神经网络和GAN的关系:卷积神经网络对于处理图像相关的GAN来讲至关重要,是提取图像特征的重要工具;卷积神经网络与传统的多层感知器网络的对比;卷积神经网络的卷积操作的介绍。

1.
2.
3.
4.
5.
6.
7.
8.

最新文章
高清美女写真一键生成!揭秘超火的AI绘画工具及使用攻略
DeepArt.io:利用深度学习技术,DeepArt允许用户将自己的照片转换为各种艺术风格的作品。虽然生成过程相对简单且效果抢眼,但对生成的美女写真要求较高的用户可能对细节把控感到不满足。DALL-E 2:这是最近大火的一个AI工具,具有极强的生
SEO整站建设提升用户体验
在当今数字化时代,网站的SEO整站建设不仅影响搜索引擎排名,更直接关系到用户体验。优化网站结构、内容和互动性是提升用户满意度的重要手段。本文将探讨SEO整站建设如何有效提高用户体验,包括网站速度、内容优化以及移动端适配等多个方面
濮阳企业在线曝光度提升攻略,SEO优化与网络推广全方位策略
濮阳SEO优化网络推广方法旨在全面提升企业在线曝光度。通过关键词优化、内容营销、链接建设等多渠道策略,精准触达目标用户,提高网站排名,实现企业品牌及产品的高效推广。随着互联网的普及,越来越多的企业开始重视网络推广,尤其是,SEO
高清美女写真生成工具推荐!超简单AI绘画神器,1分钟轻松掌握!
DALL-E 2:OpenAI推出的DALL-E 2因其强大的图像生成能力而受到广泛关注。它可以根据你的文本描述生成高质量的图像,甚至可以创造原本不存在的角色和场景。它的强大之处在于生成的结果往往很具创意和艺术感,但相对来说,操作上稍显复杂,需
经济与军事的关系的名言及其在现代社会的体现,全面应用分析数据_The37.83.49
摘要:名言指出经济与军事之间存在密切关系,在现代社会中这种关系愈发显现。经济为军事提供资源和支持,军事力量则保障经济发展的安全与稳定。通过应用分析数据,我们可以看到经济数据与军事投入的相关性,以及军事技术对经济领域的推动作
杨建荣医生简介
短剧出海系统全端开源,付费追剧,广告解锁支持iaa广告付费模式
var _hmt = _hmt || [];(function() {var hm = document.createElement("script");hm.src = "https://hm.baidu.com/hm.js?3877f389e858af44b729b97e5e50c214";var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBef
远光软件跌3.15%,短期趋势看,连续3日被主力资金减仓。主力没有控盘
12月17日,跌3.15%,成交额2.54亿元,换手率2.33%,总市值116.97亿元。根据AI大模型测算远光软件后市走势。短期趋势看,连续3日被主力资金减仓。主力没有控盘。中期趋势方面,上方有一定套牢筹码积压。近期筹码减仓,但减仓程度减缓。舆情
销量见证性价比 十月最佳热销手机排行榜
  对于绝大多数购机的朋友来说,最为关心的问题首先是机器怎么样,是否适合自己,其次就是这机器的价格了。机器再好价格高昂,那也只有眼巴巴看着的份,在很多时候兜里钱就直接决定着我们会去关注什么样价位的产品,在购机的过程当中甚至
茂名爱采购运营价格
百度爱采购的服务:全网优质资源。接入全网优质网站,优质在线商家和商品遍布各个行业,覆盖各大类别。爱采购依托百度强大的搜索技术,服务大量用户,利用AI技术快速处理信息,匹配需求线索,准确到达买卖双方。该平台可直接到达全网商品信
相关文章
推荐文章
妖精漫画 免费登录页面看漫画下载
在2023年怎么用Google Play?从零开始的谷歌商店购买教程「剁手...
买淘宝店铺注意事项,买淘宝店铺注意事项怎么写
Python实现微信自动回复+AI智能回复(完整代码)
VOCs在线监测系统 区域气相五参监测设备
VIVO整合营销传播案例:创新推动行业引领
卡牌手游一个就够了 《异次元大作战》迎官方版紧急加开新服
谷歌提交网址收录入口 谷歌收录快车道:一键提交网址入口全攻略
苹果显示时间怎么设置
乌鸦AI日报:Claude推类GPTs功能Projects,原阿里副总裁加盟上海大模型“国家队”
发表评论
0评