学习的能力,是智能的本质。

深度学习在计算机视觉方面的应用

1.部分遮蔽(最核心最困难)
2.现状改变(核心)
3.照射角度
4.光照强度
5.背景混入

深度学习常规套路

1.收集数据并给定标签
2.训练一个分类器
3.测试评估

神经网络常用技巧

1.神经网络加层能使训练数据集拟合效果很好,但是层数过多很容易出现过拟合。常用正则化来处理过拟合问题。

卷积神经网络CNN

1.输入层
2.卷积层
3.激活函数
4.池化层
5.全连接层

递归神经网络RNN

RNN尝试考虑之前出现过的信息。比如说:我出生在中国,所以我说中文
RNN加入了记忆功能,使网络能够使用前文出现的中国二字,推断出我说的语言是中文的概率较大。

RNN的局限性

1.计算量大(记住的东西太多会导致网络太庞大,而且有的信息没有价值)
2.梯度消失(sigmoid函数的梯度在x很大和很小时会出现梯度趋近于0)

长短期记忆网络LSTM

升级了RNN使记忆可长可短
其中有一个重要的控制参数C,用来决定什么样的信息会被保留,什么样的会被遗忘
i表示要保留下来的新信息

生成对抗网络GAN

1.生成器Generator
2.判别器Discriminator
其中生成器:瞒天过海,骗过判别器
判别器:火眼金睛,分辨出哪些图片是真实的以及哪些图片是生成的
损失函数的定义:一方面要让判别器能力更强,另一方面要让生成器生成的图片更真实

经典网络模型

LeNet-5
AlexNet
VGGNet
GoogleNet
ResNet