循环神经网络（RNN）的详细介绍-电子发烧友网

1. 场景与应用

在循环神经网络可以用于文本生成、机器翻译还有看图描述等，在这些场景中很多都出现了RNN的身影。

2. RNN的作用

传统的神经网络DNN或者CNN网络他们的输入和输出都是独立的。对于这些模型输入的数据跟输出的数据大多是关联不太紧密的场景，但是有些场景输入的数据对后面输入的数据是有关系的，或者说后面的数据跟前面的数据是有关联的。例如，对于文本类的数据，当输入某句话的时候，刚开始输入第一个字的时候，再输入这句话的第二个字时候，其实第二个字要输入什么字其实是跟第一个字是有关联的。所以，对于这样一类的场景，通常是要考虑前面的信息的，以至于引入RNN模型。

对于RNN模型为解决这类问题引入了“记忆”这一概念。循环神经网络的循环来源于其每个元素中都执行相同的任务，但是输出依赖于输入和“记忆”两个部分。

3. RNN结构

从图中看，对于RNN网络是按照时间序列展开的。对于图中的变量Wt，是在时刻t处的输入，St是时间t处的“记忆”，St=f(UXt+WSt−1 + b)，f可以是tanh等，f取tanh会把数据压缩到一个范围内，有时候也可以使用sigmoid函数。Ot是时间t出的输出，比如是预测下个词的话，可能是softmax输出的属于每个候选词的概率，Ot = softmax(VSt)。对于这里的St已经把Xt合并了，所以Ot的公式只有St。

对于循环神经网络，可以把隐状态St视作为“记忆体”，捕捉之前时间点上的信息。输出Ot有当前时间及之前所有“记忆”共同计算得到的。但由于St是一个有限的矩阵，对于之前的信息并不能完全捕捉到，也会随着时间的变长，对于之前的“记忆”也会“变淡”。对于RNN不同于DNN与CNN，这里的RNN其实整个神经网络都在共享一组参数（U,V,W），这样极大的减小了需要训练的参数。图中的Ot再由写任务下是不存在的，只需要对最后的结果输出就可以。

4. 不同类型的RNN

(1). 双向RNN

通过以上经典的RNN模型，它是只关心当前的输入和之前的“记忆”的，但有些情况下，当前的输入不知依赖于之前的序列元素，还依赖于后面序列的元素。比如，一篇文章，当读第一段时候我们并不知道文章的主体要讲什么内容，但当我们读完第一段的时候需要判断文章主要讲什么内容，这时候就需要读后面的内容才能知道这个文章主要讲的是什么。对于这样的场景需要后面的数据才能更好的预测当前的状态，所以引入了双向RNN，就是为了解决这一类问题的。双向RNN的模型如下：

表达式：

双向RNN是考虑到了前后的“记忆”，能够更好的关联到前后的信息。

(2). 深度双向RNN

对于深度双向RNN和双向RNN的区别是每一步和每一个时间点我们设定了多层的结构。结构如下：

深层双向RNN的表达式：

对于深层双向RNN考虑的信息与双向RNN相比变多了，这意味着能够对于某场景，能够关联更多的信息。

5. RNN与BPTT算法

对于循环神经网络的BPTT算法其实是BP算法的一个变体，但是循环神经网络的BPTT是与时间序列有关的。

对于这个问题是个Softmax问题所以这里用交叉熵损失，所以损失函数可以表示为：

对于求所有误差求W得偏导函数为：

但是，

所以，所以根据求导链式法则可以进一步求得：（又因为他们的权值是共享的）

用图表示如下：

通过上面的式子：

通过链式法则，表达式可以进一步表示为：

通过以上的步骤求得损失函数的偏导后，就可以用SGD算法去做参数的更新。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

rnn

rnn

+关注

关注
0

文章
89

浏览量
6886

原文标题：循环神经网络（RNN）的场景与应用

文章出处：【微信号：Imgtec，微信公众号：Imagination Tech】欢迎添加关注！文章转载请注明出处。

什么是RNN （循环神经网络）？

循环神经网络 (RNN) 是一种深度学习结构，它使用过去的信息来提高网络处理当前和将来输入的性能。RNN 的独特之处在于该

发表于 02-29 14:56 •4009次阅读

什么是<b class='flag-5'>RNN</b> （<b class='flag-5'>循环</b><b class='flag-5'>神经网络</b>）？

递归神经网络（RNN）

文本中的一个词。RNN也是一种包含某特殊层的神经网络，它并不是一次处理所有数据而是通过循环来处理数据。由于RNN可以按顺序处理数据，因此可以使用不同长度的向量并生成不同长度的输出。图6

发表于 07-20 09:27

循环神经网络（RNN）和（LSTM）初学者指南

最近，有一篇入门文章引发了不少关注。文章中详细介绍了循环神经网络（RNN），及其变体长短期记忆（LSTM）背后的原理。

发表于 02-05 13:43 •939次阅读

什么是RNN(循环神经网络)？RNN的基本原理和优缺点

RNN（Recurrent Neural Network，循环神经网络）是一种专门用于处理序列数据的神经网络结构，它能够在序列的演进方向上进行递归，并通过所有节点（

发表于 07-04 11:48 •3481次阅读

循环神经网络和递归神经网络的区别

循环神经网络（Recurrent Neural Network，简称RNN）和递归神经网络（Recursive Neural Network，简称RvNN）是深度学习中两种重要的

发表于 07-04 14:19 •888次阅读

循环神经网络和卷积神经网络的区别

循环神经网络（Recurrent Neural Network，RNN）和卷积神经网络（Convolutional Neural Network，CNN）是深度学习领域中两种非常重要的

发表于 07-04 14:24 •1270次阅读

循环神经网络的基本原理是什么

结构具有循环，能够将前一个时间步的信息传递到下一个时间步，从而实现对序列数据的建模。本文将介绍循环神经网络的基本原理。 RNN的基本结构 1

发表于 07-04 14:26 •628次阅读

循环神经网络算法原理及特点

）相比，RNN在处理序列数据时具有明显的优势。本文将介绍循环神经网络的原理、特点及应用。 1. 循环神经

发表于 07-04 14:49 •647次阅读

递归神经网络是循环神经网络吗

递归神经网络（Recurrent Neural Network，简称RNN）和循环神经网络（Recurrent Neural Network，简称R

发表于 07-04 14:54 •737次阅读

rnn神经网络基本原理

RNN（Recurrent Neural Network，循环神经网络）是一种具有循环结构的神经网络，它能够处理序列数据，并且能够捕捉时间序

发表于 07-04 15:02 •715次阅读

rnn神经网络模型原理

RNN（Recurrent Neural Network，循环神经网络）是一种具有循环结构的神经网络，它能够处理序列数据，具有记忆功能。

发表于 07-04 15:40 •579次阅读

rnn是什么神经网络

RNN（Recurrent Neural Network，循环神经网络）是一种具有循环连接的神经网络，它能够处理序列数据，并且具有记忆能力。

发表于 07-05 09:49 •663次阅读

rnn是什么神经网络模型

RNN（Recurrent Neural Network，循环神经网络）是一种具有循环结构的神经网络模型，它能够处理序列数据，并对序列中的元

发表于 07-05 09:50 •597次阅读

rnn是递归神经网络还是循环神经网络

RNN（Recurrent Neural Network）是循环神经网络，而非递归神经网络。循环神经网络

发表于 07-05 09:52 •560次阅读

LSTM神经网络与传统RNN的区别

在深度学习领域，循环神经网络（RNN）因其能够处理序列数据而受到广泛关注。然而，传统RNN在处理长序列时存在梯度消失或梯度爆炸的问题。为了解决这一问题，LSTM（长短期记忆）

发表于 11-13 09:58 •280次阅读

搜索历史

循环神经网络（RNN）的详细介绍

评论

什么是RNN （循环神经网络）？

递归神经网络（RNN）

循环神经网络（RNN）和（LSTM）初学者指南

什么是RNN(循环神经网络)？RNN的基本原理和优缺点

循环神经网络和递归神经网络的区别

循环神经网络和卷积神经网络的区别

循环神经网络的基本原理是什么

循环神经网络算法原理及特点

递归神经网络是循环神经网络吗

rnn神经网络基本原理

rnn神经网络模型原理

rnn是什么神经网络

rnn是什么神经网络模型

rnn是递归神经网络还是循环神经网络

LSTM神经网络与传统RNN的区别