资料介绍
在过去几年里,许多计算机视觉相关的深度学习的发展,都可以归结于少数几个神经网络架构。抛开所有关于数学、代码和实现的细节,来探索一个简单的问题:这些模型如何工作以及为什么工作?
在撰写这篇文章时,Keras 库(http://suo.im/4aLGEd)中已经涵盖了6种预训练模型,分别是:
VGG16
VGG19
ResNet50
Inception v3
Xception
MobileNet
▍VGG
VGG网络和从2012年早期的 AlexNet 网络一样,遵循着现有卷积网络的典型布局:在最终的全连接分类层(fully-connected classification layers)之前,由一系列的卷积层(convolutional layers),最大池化层(max-pooling layers)和激活层(activation layers)构成。
MobileNet 本质上是 Xception 架构,针对移动应用而优化的线性版本。剩下的三种架构则真正重新定义了我们看待深度网络的方式。
这篇文章接下来的部分将侧重于ResNet,Inception和Xception三种架构的直观理解,以及为什么它们成为计算机视觉中许多后续工作的基石。
▍ResNet
为什么深度网络在不断增加层的时候,表现反而变的更差?
直观来想, 更深层次的网络,应该不比较浅的网络表现的差,至少在训练的时候应该这样(这时没有过拟合over-fitting的风险)。
让我们作一个思维实验,假设我们已经建立了一个n层的网络,达到了一定的准确性。 如果仅通过复制相同的前n个层并对最后一层执行单位映射,则n + 1层的网络至少应该能够获得完全相同的精度。
类似地,n + 2,n + 3和n + 4层的网络都可以继续执行单位映射并获得相同的准确性。 然而,实际上,这些更深层的网络在性能上几乎都会有所下降。
ResNet的作者将这些问题归结为一个假设:直接映射难以学习。
他们提出了一个解决办法:用学习 x到 H(x) 两者之间的差异,或者“残差”的方式,替代尝试学习从x到 H(x) 的底层映射。这样,我们就可以可以通过输入残差来计算 H(x) 。
假设我们用 F(x)=H(x)-x 来表示残差。 ResNet 网络现在不是试图直接学习 H(x) , 而是学习 F(x)+x。
这引出了你可能知道的著名的ResNet(或“残差网络”)模块:
ResNet中的每个“模块”都由一系列层和一个“捷径”连接,捷径连接将模块的输入值直接添加到其输出值。 “添加”操作以元素对应方式执行,如果输入和输出的大小不同,可以使用补零法(zero-padding)或投影(通过1x1卷积)匹配尺寸。
回到我们的思维实验,捷径连接大大简化了我们对单位层的构建。 直观的看,学习将 F(x) 推到0并将输出值保留为x比从头开始学习单位交换(identity transformation)要容易得多。 一般情况下,ResNet为层提供了一个“参考”点—x—来开始学习。
这个想法在实践中效果惊人。在此之前,深度神经网络经常遇到梯度消失(vanishing gradients)的问题,来自误差函数的梯度信号随着它们向较早层反向传播而呈指数下降。
从本质上说,当误差信号一直传到到早期层时,它们已经小到网络无法进行学习了。然而,由于ResNet中的梯度信号可以通过捷径连接直接返回到早期层,突然间我们就可以建立 50层,101层,152层,甚至(想当然)1000+层的网络,而它们仍然表现良好。用22层的网络赢得了2014年ILSVRC挑战,这在当时是一个巨大的威廉希尔官方网站 飞跃。
- 网络架构的时钟系统——设计与验证
- 改进的多尺度深度网络手势识别模型 8次下载
- 基于深度级联孪生网络的通信信号调制识别算法 33次下载
- 采用自监督CNN进行单图像深度估计的方法 13次下载
- 深度:嵌入式系统的软件架构设计!资料下载
- 基于预训练模型和长短期记忆网络的深度学习模型 19次下载
- 3小时学习神经网络与深度学习课件下载 0次下载
- 结合注意力机制的改进深度学习光流网络 4次下载
- 基于深度神经网络的图像语义分割方法 11次下载
- 基于深度信念网络的实体识别算法 16次下载
- 综述深度神经网络的解释方法及发展趋势 18次下载
- 一种基于多视图架构的深度卷积神经网络模型 5次下载
- 一种多层级特征融合就的深度卷积网络 7次下载
- 基于深度神经网络的文本分类分析 37次下载
- deepid3:非常深的神经网络的人脸识别深度算法的网络架构 25次下载
- 残差网络是深度神经网络吗 702次阅读
- 深度神经网络(DNN)架构解析与优化策略 577次阅读
- 神经网络架构有哪些 321次阅读
- 详解深度学习、神经网络与卷积神经网络的应用 1557次阅读
- 深度ReLU网络的对应浅层网络 467次阅读
- 神经网络的DBN与GAN及RNN等形象的详细资料讲解 4862次阅读
- 深度神经网络的实现机理与决策逻辑难以理解 2799次阅读
- 数据集,网络架构和剪枝方法 5827次阅读
- 浅析深度学习的原理及其架构 6311次阅读
- 如何理解深度学习?深度学习的理论探索分析 3593次阅读
- 基于Unrolling的深度方法及应用 4993次阅读
- 采用的网络架构,实现了基于图像强度的变分深度自编码器 6134次阅读
- 百度发布Visual DL 使得深度学习任务变得生动形象,实现可视分析 4774次阅读
- 斯坦福探索深度神经网络可解释性 决策树是关键 4292次阅读
- 详细剖析神经网络和深度神经网络的区别 3.2w次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB | 1490次下载 | 免费
- 2单片机典型实例介绍
- 18.19 MB | 92次下载 | 1 积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB | 27次下载 | 1 积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB | 18次下载 | 4 积分
- 5开关电源原理及各功能电路详解
- 0.38 MB | 10次下载 | 免费
- 6基于AT89C2051/4051单片机编程器的实验
- 0.11 MB | 4次下载 | 免费
- 7蓝牙设备在嵌入式领域的广泛应用
- 0.63 MB | 3次下载 | 免费
- 89天练会电子电路识图
- 5.91 MB | 3次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB | 66304次下载 | 免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB | 51209次下载 | 免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB | 51043次下载 | 免费
- 5555集成电路应用800例(新编版)
- 0.00 MB | 33562次下载 | 免费
- 6接口电路图大全
- 未知 | 30320次下载 | 免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB | 28588次下载 | 免费
- 8开关电源设计实例指南
- 未知 | 21539次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935053次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537791次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233045次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191183次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183277次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138039次下载 | 免费
评论
查看更多