【连载】深度学习笔记14：CNN经典论文研读之Le-Net5及其Tensorflow实现-电子发烧友网

在前几次笔记中，笔者基本上将卷积神经网络的基本原理给讲完了。从本次笔记开始，笔者在深度学习笔记中会不定期的对 CNN 发展过程中的经典论文进行研读并推送研读笔记。今天笔者就和大家一起学习卷积神经网络和深度学习发展历史上具有奠基性的经典论文之一的关于 LeNet-5 网络一文。LeNet-5 是由具有卷积神经网络之父之美誉的 Yann LeCun 在1998年发表在 IEEE 上面的一篇 Gradient-based learning applied to document recognition 上提出来的，所以直接由 LeCun 大佬名字命名了。
论文原文：
http://yann.lecun.com/exdb/publis/pdf/lecun-01a.pdf

LeNet-5 网络结构

该篇论文有 42 页，但关于 LeNet-5 网络的核心部分并没有那么多，我们直接定位第二章的B 小节进行阅读。LeNet-5 的网络结构如下：

LeNet-5 共有 7 层，输入层不计入层数，每层都有一定的训练参数，其中三个卷积层的训练参数较多，每层都有多个滤波器，也叫特征图，每个滤波器都对上一层的输出提取不同的像素特征。所以 LeNet-5 的简略结构如下：

输入-卷积-池化-卷积-池化-卷积（全连接）-全连接-全连接（输出）

各层的结构和参数如下：
C1层是个卷积层，其输入输出结构如下：
输入： 32 x 32 x 1 滤波器大小： 5 x 5 x 1 滤波器个数：6
输出： 28 x 28 x 6
参数个数： 5 x 5 x 1 x 6 + 6 = 156

P2层是个池化层，其输入输出结构如下：
输入： 28 x 28 x 6 滤波器大小： 2 x 2 滤波器个数：6
输出： 14 x 14 x 6
参数个数：2 x 6 = 12
在原文中，P1池化层采用的是平均池化，鉴于现在普遍都使用最大池化，所以在后面的代码实现中我们统一采用最大池化。

C3层是个卷积层，其输入输出结构如下：
输入： 14 x 14 x 6 滤波器大小： 5 x 5 x 6 滤波器个数：16
输出： 10 x 10 x 16
参数个数： 5 x 5 x 6 x 16 + 16 = 2416
640?wx_fmt=png
P2 池化之后的特征图组合计算得到C3的滤波器个数。

P4层是个池化层，其输入输出结构如下：
输入： 10 x 10 x 16 滤波器大小： 2 x 2 滤波器个数：16
输出： 5 x 5 x 16
参数个数： 2 x 16 = 32

C5层在论文中是个卷积层，但滤波器大小为 5 x 5，所以其本质上也是个全连接层。如果将5 x 5 x 16 拉成一个向量，它就是一个全连接层。其输入输出结构如下：
输入： 5 x 5 x 16 滤波器大小： 5 x 5 x 16 滤波器个数：120
输出： 1 x 1 x 120
参数个数： 5 x 5 x 16 x 120 + 120 = 48120

F6层是个全连接层，全连接的激活函数采用的是 tanh 函数，其输入输出结构如下：
输入：120
输出：84
参数个数：120 x 84 + 84 = 10164

F7层即输出层，也是个全连接层，其输入输出结构如下：
输入：84
输出：10
参数个数： 84 x 10 + 10 = 850

LeNet-5 的 Tensorflow 实现

我们前面关于如何使用 Tensorflow 搭建卷积神经网络的过程可以定下实现 LeNet-5 的基本思路。如果在 python 中写的时候我们需要定义创建输入输出的占位符变量模块、初始化各层参数模块、创建前向传播模块、定义模型优化迭代模型，以及在最后设置输入数据。

下面笔者用以上思路编写一个 LeNet-5 的简单实现代码。
导入相关库和创建输入输出的占位符变量：

importtensorflowastf
importnumpyasnp
fromtensorflow.examples.tutorials.mnistimportinput_data
defcreate_placeholder():
X=tf.placeholder(tf.float32,shape=(None,28*28))
Y=tf.placeholder(tf.float32,shape=(None,10))
keep_prob=tf.placeholder(tf.float32)
returnX,Y,keep_prob

初始化各层参数：

definitialize_parameters():
W1=tf.get_variable('W1',[5,5,1,6],initializer=tf.contrib.layers.xavier_initializer())
b1=tf.get_variable('b1',[6],initializer=tf.zeros_initializer())

W2=tf.get_variable('W2',[5,5,6,16],initializer=tf.contrib.layers.xavier_initializer())
b2=tf.get_variable('b2',[16],initializer=tf.zeros_initializer())

W3=tf.get_variable('W3',[5,5,16,120],initializer=tf.contrib.layers.xavier_initializer())
b3=tf.get_variable('b3',[120],initializer=tf.zeros_initializer())

W4=tf.get_variable('W4',[120,84],initializer=tf.contrib.layers.xavier_initializer())
b4=tf.get_variable('b4',[84],initializer=tf.zeros_initializer())

W5=tf.get_variable('W5',[84,10],initializer=tf.contrib.layers.xavier_initializer())
b5=tf.get_variable('b5',[10],initializer=tf.zeros_initializer())

para={'W1':W1,
'b1':b1,
'W2':W2,
'b2':b2,
'W3':W3,
'b3':b3,
'W4':W4,
'b4':b4,
'W5':W5,
'b5':b5}
returnpara

创建 LeNet-5 的前向计算：

defforward_propagation(X,para,dropout):

X=tf.reshape(X,[-1,28,28,1])
X=tf.pad(X,[[0,0],[2,2],[2,2],[0,0]])

c1=tf.nn.conv2d(X,para['W1'],strides=[1,1,1,1],padding='VALID')+para['b1']
p2=tf.nn.max_pool(c1,ksize=[1,2,2,1],strides=[1,2,2,1],padding='VALID')
c3=tf.nn.conv2d(p2,para['W2'],strides=[1,1,1,1],padding='VALID')+para['b2']
p4=tf.nn.max_pool(c3,ksize=[1,2,2,1],strides=[1,2,2,1],padding='VALID')
c5=tf.nn.conv2d(p4,para['W3'],strides=[1,1,1,1],padding='VALID')+para['b3']
c5=tf.contrib.layers.flatten(c5)
f6=tf.nn.tanh(tf.add(tf.matmul(c5,para['W4']),para['b4']))
f7=tf.nn.tanh(tf.add(tf.matmul(f6,para['W5']),para['b5']))
f7=tf.nn.dropout(f7,dropout)
returnf7

创建模型优化计算函数：

640?wx_fmt=png

最后传入 mnist 数据和相关超参数：

640?wx_fmt=png

本文来自《自兴人工智能》项目部：凯文

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47239

浏览量
238352
机器学习

机器学习

+关注

关注
66

文章
8414

浏览量
132601
深度学习

深度学习

+关注

关注
73

文章
5503

浏览量
121132

FPGA加速深度学习模型的案例

：DE5Net_Conv_Accelerator 应用场景：面向深度学习的开源项目，实现了AlexNet的第一层卷积运算加速。威廉希尔官方网站特点：采用了Verilog语言进行编程，与P

发表于 10-25 09:22 •216次阅读

如何在Tensorflow中实现反卷积

在TensorFlow中实现反卷积（也称为转置卷积或分数步长卷积）是一个涉及多个概念和步骤的过程。反卷积在深度学习领域，特别是在图像分割、图像超分辨率、以及生成模型（如生成对抗网络GA

发表于 07-14 10:46 •609次阅读

TensorFlow是什么？TensorFlow怎么用？

TensorFlow是由Google开发的一个开源深度学习框架，它允许开发者方便地构建、训练和部署各种复杂的机器学习模型。TensorFlow

发表于 07-12 16:38 •697次阅读

CNN与RNN的关系

在深度学习的广阔领域中，卷积神经网络（CNN）和循环神经网络（RNN）是两种极为重要且各具特色的神经网络模型。它们各自在图像处理、自然语言处理等领域展现出卓越的性能。本文将从概念、原理、应用场景及代码示例等方面详细探讨

发表于 07-08 16:56 •741次阅读

CNN在多个领域中的应用

，通过多层次的非线性变换，能够捕捉到数据中的隐藏特征；而卷积神经网络（CNN），作为神经网络的一种特殊形式，更是在图像识别、视频处理等领域展现出了卓越的性能。本文旨在深入探究深度学习、神经网络与卷积神经网络的基本原理、结构特点

发表于 07-08 10:44 •1925次阅读

CNN的定义和优势

卷积神经网络（Convolutional Neural Networks, CNN）作为深度学习领域的核心成员，不仅在学术界引起了广泛关注，更在工业界尤其是计算机视觉领域展现出了巨大的应用价值。关于

发表于 07-05 17:37 •4240次阅读

keras模型转tensorflow session

和训练深度学习模型。Keras是基于TensorFlow、Theano或CNTK等底层计算框架构建的。TensorFlow是一个开源的机器学习

发表于 07-05 09:36 •518次阅读

如何在TensorFlow中构建并训练CNN模型

在TensorFlow中构建并训练一个卷积神经网络（CNN）模型是一个涉及多个步骤的过程，包括数据预处理、模型设计、编译、训练以及评估。下面，我将详细阐述这些步骤，并附上一个完整的代码示例。

发表于 07-04 11:47 •924次阅读

如何利用CNN实现图像识别

卷积神经网络（CNN）是深度学习领域中一种特别适用于图像识别任务的神经网络结构。它通过模拟人类视觉系统的处理方式，利用卷积、池化等操作，自动提取图像中的特征，进而实现高效的图像识别。本

发表于 07-03 16:16 •1345次阅读

cnn卷积神经网络分类有哪些

卷积神经网络概述卷积神经网络（Convolutional Neural Network，简称CNN）是一种深度学习模型，由多层卷积层和池化层堆叠而成。CNN通过卷积操作提取图像特征

发表于 07-03 09:28 •619次阅读

深度学习与卷积神经网络的应用

到自然语言处理，深度学习和CNN正逐步改变着我们的生活方式。本文将深入探讨深度学习与卷积神经网络的基本概念、工作原理

发表于 07-02 18:19 •898次阅读

TensorFlow与PyTorch深度学习框架的比较与选择

深度学习作为人工智能领域的一个重要分支，在过去十年中取得了显著的进展。在构建和训练深度学习模型的过程中，深度

发表于 07-02 14:04 •964次阅读

深度神经网络模型cnn的基本概念、结构及原理

，其核心是构建具有多层结构的神经网络模型，以实现对复杂数据的高效表示和处理。在众多深度学习模型中，卷积神经网络（CNN）因其在图像识别等领域的卓越性能而备受关注。

发表于 07-02 10:11 •9723次阅读

基于Python和深度学习的CNN原理详解

卷积神经网络 (CNN) 由各种类型的层组成，这些层协同工作以从输入数据中学习分层表示。每个层在整体架构中都发挥着独特的作用。

发表于 04-06 05:51 •2104次阅读

如何使用TensorFlow构建机器学习模型

在这篇文章中，我将逐步讲解如何使用 TensorFlow 创建一个简单的机器学习模型。

发表于 01-08 09:25 •973次阅读

搜索历史

【连载】深度学习笔记14：CNN经典论文研读之Le-Net5及其Tensorflow实现

LeNet-5 网络结构

LeNet-5 的 Tensorflow 实现

评论

FPGA加速深度学习模型的案例

如何在Tensorflow中实现反卷积

TensorFlow是什么？TensorFlow怎么用？

CNN与RNN的关系

CNN在多个领域中的应用

CNN的定义和优势

keras模型转tensorflow session

如何在TensorFlow中构建并训练CNN模型

如何利用CNN实现图像识别

cnn卷积神经网络分类有哪些

深度学习与卷积神经网络的应用

TensorFlow与PyTorch深度学习框架的比较与选择

深度神经网络模型cnn的基本概念、结构及原理

基于Python和深度学习的CNN原理详解

如何使用TensorFlow构建机器学习模型