搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

williamhill

查看更多

查看更多

VIP于到期 william hill官网

登录后你可以

下载海量资料
学习在线课程
观看威廉希尔官方网站视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

卷积神经网络的发展及各模型的优缺点

前言

在CV领域，我们需要熟练掌握最基本的知识就是各种卷积神经网络CNN的模型架构，不管我们在图像分类或者分割，目标检测，NLP等，我们都会用到基本的CNN网络架构。

CNN从最初的2012年AlexNet横空出世到2014年VGG席卷世界以及2015年ResNet奠定了该领域的霸主地位，网络模型变得越变越深，而且也得到证明，越深的网络拟合效果越好，但网络相应的参数量计算量都极速增加，不利于威廉希尔官方网站的推广和应用。

因此，一些轻量级的网络结构也慢慢随之出现，比如MobileNet系列，ShuffleNet系列，以及ResNext、DenseNet、EfficenceNet等模型，他们都互相吸取彼此的优点，不但降低了参数量或者计算量，同时分类精度更高，因而受到了更多的关注。接下来我们就对CNN的各种网络结构以及他们的优缺点进行一次详细的解读！

AlexNet(2012)

1、增加了relu非线性激活函数，增强了模型的非线性表达能力。成为以后卷积层的标配。

2、dropout层防止过拟合，成为以后fc层的标配。

3、通过数据增强，来减少过拟合。

4、引入标准化层（Local Response Normalization）:通过放大那些对分类贡献较大的神经元，抑制那些对分类贡献较小的神经元，通过局部归一的手段，来达到作用。

VGG(2014)

论文的主要创新点在于：

1、用3x3小卷积核代替了5x5或者7x7的卷积核 2、基于ALexnet加深了网络深度,证明了更深的网络，能更好的提取特征。

GoogleNet(2014)

在设计网络结构时，不仅仅考虑网络的深度，也会考虑网络的宽度，并将这种结构定义为Inception结构。

1、引入1x1卷积的主要目的是为了减少维度，还用于修正线性激活（ReLU）

2、网络最后采用了average pooling（平均池化）来代替全连接层

后面的Inception v2/v3都是基于v1的这种方法在扩展，主要目标有：

1、参数量降低，计算量减少。

2、网络变深，网络非线性表达能力更强

ResNet(2015)

问题：

1、增加深度带来的首个问题就是梯度爆炸/消散的问题，这是由于随着层数的增多，在网络中反向传播的梯度会随着连乘变得不稳定，变得特别大或者特别小。这其中经常出现的是梯度消散的问题。

2、为了克服梯度消散也想出了许多的解决办法，如使用BatchNorm，将激活函数换为ReLu，使用Xaiver初始化等，可以说梯度消散已经得到了很好的解决

已知有网络degradation的情况下，不求加深度能提高准确性，能不能至少让深度网络实现和浅层网络一样的性能，即让深度网络后面的层至少实现恒等映射的作用，根据这个想法，作者提出了residual模块来帮助网络实现恒等映射。

ResNet的设计特点：

1、核心单元模块化，可进行简单堆叠。 2、Shortcut方式解决网络梯度消失问题。 3、Average Pooling层代替fc层。 4、引入BN层加快网络训练速度和收敛时的稳定性。 5、加大网络深度，提高模型的特征抽取能力。

MobileNet v1

谷歌在2017年提出专注于移动端或者嵌入式设备中的轻量级CNN网络：MobileNet。最大的创新点是深度可分离卷积。

通过将标准卷积分解为深度卷积核逐点卷积，能够显著的降低参数量和计算量。引入Relu6激活函数。

参数量计算量的计算:

网络结构如下：

MobileNet v2

改进点主要有以下几个方面：

1、引入残差结构，先升维再降维，增强梯度的传播，显著减少推理期间所需的内存占用

Inverted Residuals：

残差模块：输入首先经过1x1的卷积进行压缩，然后使用3x3的卷积进行特征提取，最后在用1x1的卷积把通道数变换回去。整个过程是“压缩-卷积-扩张”。这样做的目的是减少3x3模块的计算量，提高残差模块的计算效率。

倒残差模块：输入首先经过1x1的卷积进行通道扩张，然后使用3x3的depthwise卷积，最后使用1x1的pointwise卷积将通道数压缩回去。整个过程是“扩张-卷积-压缩”。

对低维度做ReLU运算，很容易造成信息的丢失。而在高维度进行ReLU运算的话，信息的丢失则会很少。

Linear Bottleneck:

这个模块是为了解决一开始提出的那个低维-高维-低维的问题，即将最后一层的ReLU6替换成线性激活函数，而其他层的激活函数依然是ReLU6。

MobileNet v3

V3结合了V1的深度可分离卷积，V2的Inverted Residuals 和 Linear Bottleneck，以及加入SE模块、利用NAS（神经结构的搜索）来搜索网络参数。

互补搜索威廉希尔官方网站 —— NAS & NetAdapt

h-swish激活函数

out = F.relu6(x + 3., self.inplace) / 6. return out * x

改进一：下图是MobileNet-v2的整理模型架构，可以看到，网络的最后部分首先通过1x1卷积映射到高维，然后通过GAP收集特征，最后使用1x1卷积划分到K类。所以其中起抽取特征作用的是在7x7分辨率上做1x1卷积的那一层。

而V3是先进行池化然后再进行1x1卷积提取特征，V2是先1X1卷积提取特征再池化。

ShuffleNet

组卷积

Group convolution是将输入层的不同特征图进行分组，然后采用不同的卷积核再对各个组进行卷积，这样会降低卷积的计算量。

因为一般的卷积都是在所有的输入特征图上做卷积，可以说是全通道卷积，这是一种通道密集连接方式（channel dense connection），而group convolution相比则是一种通道稀疏连接方式（channel sparse connection）。

depthwise convolution，这是一种比较特殊的group convolution，此时分组数恰好等于通道数，意味着每个组只有一个特征图。

分组卷积的会带来一个矛盾就是特征通信。group convolution层另一个问题是不同组之间的特征图需要通信。所以MobileNet等网络采用密集的1x1 pointwise convolution，因为要保证group convolution之后不同组的特征图之间的信息交流。

为达到特征通信目的，我们不采用dense pointwise convolution，考虑其他的思路：channel shuffle

ShuffleNet的核心是采用了两种操作：pointwise group convolution和channel shuffle，这在保持精度的同时大大降低了模型的计算量。其基本单元则是在一个残差单元的基础上改进而成。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

cnn

cnn

+关注

关注
3

文章
351

浏览量
22199
卷积神经网络

卷积神经网络

+关注

关注
4

文章
367

浏览量
11863
resnet

resnet

+关注

关注
0

文章
12

浏览量
3158

原文标题：卷积神经网络的发展及各模型的优缺点

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

评论

相关推荐

卷积神经网络与传统神经网络的比较

在深度学习领域，神经网络模型被广泛应用于各种任务，如图像识别、自然语言处理和游戏智能等。其中，卷积神经网络（CNNs）和传统神经网络是两种常

的头像

发表于 11-15 14:53 •279次阅读

卷积神经网络的应用场景及优缺点

1.1 卷积神经网络的定义卷积神经网络是一种深度学习模型，它通过模拟人类视觉系统的工作方式，对输入数据进行特征提取和分类。与传统的

的头像

发表于 07-11 14:45 •664次阅读

三层神经网络模型的优缺点

三层神经网络模型是一种常见的深度学习模型，它由输入层、两个隐藏层和输出层组成。本文将介绍三层神经网络模型的

的头像

发表于 07-11 10:58 •521次阅读

BP神经网络和卷积神经网络的关系

广泛应用的神经网络模型。它们各自具有独特的特点和优势，并在不同的应用场景中发挥着重要作用。以下是对BP神经网络和卷积神经网络关系的详细探讨，

的头像

发表于 07-10 15:24 •1378次阅读

卷积神经网络的实现原理

卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积

的头像

发表于 07-03 10:49 •527次阅读

神经网络算法的优缺点有哪些

神经网络算法是一种模拟人脑神经元结构的计算模型，广泛应用于机器学习、深度学习、图像识别、语音识别等领域。然而，神经网络算法也存在一些优缺点。

的头像

发表于 07-03 09:47 •1276次阅读

卷积神经网络分类方法有哪些

卷积神经网络（Convolutional Neural Networks，CNN）是一种深度学习模型，广泛应用于图像分类、目标检测、语义分割等计算机视觉任务。本文将详细介绍卷积

的头像

发表于 07-03 09:40 •443次阅读

cnn卷积神经网络分类有哪些

卷积神经网络（CNN）是一种深度学习模型，广泛应用于图像分类、目标检测、语义分割等领域。本文将详细介绍CNN在分类任务中的应用，包括基本结构、关键威廉希尔官方网站、常见网络架构以及实际应用案例。

的头像

发表于 07-03 09:28 •593次阅读

卷积神经网络训练的是什么

卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积

的头像

发表于 07-03 09:15 •382次阅读

卷积神经网络的原理与实现

1.卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。卷积

的头像

发表于 07-02 16:47 •546次阅读

卷积神经网络的基本结构及其功能

卷积神经网络（Convolutional Neural Network，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积

的头像

发表于 07-02 14:45 •1419次阅读

卷积神经网络的原理是什么

卷积神经网络（Convolutional Neural Network，简称CNN）是一种深度学习模型，广泛应用于图像识别、语音识别、自然语言处理等领域。本文将详细介绍卷积

的头像

发表于 07-02 14:44 •611次阅读

卷积神经网络和bp神经网络的区别

化能力。随着深度学习威廉希尔官方网站的不断发展，神经网络已经成为人工智能领域的重要威廉希尔官方网站之一。卷积神经网络和BP神经

的头像

发表于 07-02 14:24 •3447次阅读

数学建模神经网络模型的优缺点有哪些

、预测分析等。然而，神经网络模型也存在一些优缺点。本文将详细分析神经网络模型的优缺点。一、优点

的头像

发表于 07-02 11:36 •881次阅读

神经网络模型的原理、类型、应用场景及优缺点

模型的原理、类型、应用场景以及优缺点。 神经网络模型的原理 神经网络模型的基本原理是模拟人脑

的头像

发表于 07-02 09:56 •1280次阅读