循环神经网络------主要用于NLP文本方向的工作

普通神经网络:
图片说明

一对多:图片生成描述:
图片说明

多对一:文本分类(文本情感分析)
图片说明

多对多:机器翻译
图片说明

实时多对多:视频解说
图片说明

为什么需要循环神经网络???序列式问题
示意图
图片说明

主要流程:
1.维护一个状态作为下一个状态的额外输入
2.每一步使用同样的激活函数和参数
图片说明

最简单的循环神经网络
图片说明

例子:字符语言模型:
1.预测下一字符
2.词典[j,e,p]
3.样本jeep
图片说明

4.test time
5.上一步输出作为下一步的输入

循环神经网络的构成:
1.正向传播
图片说明

图片说明

2.反向传播:
图片说明

图片说明

图片说明

图片说明

它为什么要选择tanh函数呢??

1.tanh输出在-1,1之间
2.梯度消失
3.较远的步骤梯度贡献很小
4.切换为其他激活函数后,可能会导致爆炸

多层网络
1.低层输出作为高层输入
2.同层之间依旧递归
3.增加网络拟合能力
4.一般隐层维数递增:64---128---256

结合残差连接:
图片说明
未结合残差连接的情况:
图片说明

双向网络:
1.另一路以未来状态为输入
2.两个状态拼接后进入输出层
3.进一步提高表达能力
4.无法实时输出结果

图片说明