卷积神经网络算法三大类
卷积神经网络(Convolutional Neural Network,简称CNN)是一种常用的人工神经网络,它的主要应用领域是图像识别和计算机视觉方面。CNN通过卷积层、池化层和全连接层等组成,这些组成形成了 CNN 的算法三大类,即卷积层、池化层和全连接层。下面,本文将着重讲解 CNN 的算法三大类。
一、卷积层
卷积层是卷积神经网络最重要的部分之一,它是由一组过滤器或卷积核组成的。卷积核的作用就是扫描整张图像的各个像素点,然后提取其中的特征,这些特征可以是边缘、角、颜色、纹理、线条等等。卷积核在扫描时,每扫描一次就移动一定的步长,通常步长为1,也可以是其他的值。卷积核扫描图像时,会在每个窗口区域上做卷积运算,然后再进行汇集。
其中,f和w分别是图像和卷积核,卷积核大小为k x k,步长为s,偏置项为b,输出特征图的大小为 (n-k)/s +1。
卷积操作的目的是对特征进行有效提取,由于卷积层可以有效提取对于某些特征比较敏感的像素值,因此卷积神经网络的性能可以进一步提高。
二、池化层
卷积层的提取特征效果很好,但是在一张大图像的处理中,大量的计算对于神经网络的运行速度带来了不小的影响,为了解决这个问题,人们提出了池化层。池化层的作用是将图像的特征进行降维,从而减少神经网络的参数量,同时也能够避免某些特征的过度拟合。池化层更多的是一种取样策略,该层不是直接对图像进行运算,而是对输出结果进行采样。常见的池化方式有最大池化和平均池化。
最大池化:指选取激活值最大的像素作为采样值,例如 $2 \times 2$ 的矩阵
在最大池化操作中,我们可以采用 $2 \times 2$ 池化器,它将第一行第一列的值和第一行第二列的值做个比较,然后取出最大值。同样的,它也可以采用第二行第一列和第二行第二列中的最大值
最大池化的尺寸可以设定,一般是选择 $2 \times 2$ 的池化器。最大池化不仅可以对像素值进行降维处理,而且能够提取出一些特征,例如它可以提取图像的强度、颜色等等特征。
平均池化:平均池化与最大值池化很相似,不同的是它并不是直接选择激活值最大的像素,而是选择区域内值的平均值。在直觉上,最大池化更适合在数据中选择有用的特征,而平均池化更加适合一些简单的分类任务。
三、全连接层
卷积层和池化层只是对图像的特征进行二维处理,而全连接层是将所有的特征进行展开,并与权重相乘相加。它的作用是将卷积层提取到的图像特征转化为特征向量并输入到分类器中。全连接层和传统的神经网络传输方式一样,但不同的是,它是对每个单元都进行了连接处理,因此它需要处理的数据也比较庞大,是四大环节中运算量最大的一个部分。
总结
卷积神经网络算法可以划分为三大类:卷积层、池化层和全连接层。卷积层是卷积神经网络的核心部分,其目的是对特征进行有效提取;池化层是对特征进行降维,从而减少神经网络的参数量,同时也能够避免某些特征的过度拟合;全连接层将卷积层提取到的图像特征转化为特征向量并输入到分类器中。卷积神经网络通过组合不同的层可以实现卓越的性能,在图像识别、语音识别、自然语言处理等领域都能够起到非常优秀的作用。
-
语音识别
+关注
关注
38文章
1739浏览量
112638 -
人工神经网络
+关注
关注
1文章
119浏览量
14619 -
卷积神经网络
+关注
关注
4文章
367浏览量
11863
发布评论请先 登录
相关推荐
评论