学习的能力,是智能的本质。
深度学习在计算机视觉方面的应用
1.部分遮蔽(最核心最困难)
2.现状改变(核心)
3.照射角度
4.光照强度
5.背景混入
深度学习常规套路
1.收集数据并给定标签
2.训练一个分类器
3.测试评估
神经网络常用技巧
1.神经网络加层能使训练数据集拟合效果很好,但是层数过多很容易出现过拟合。常用正则化来处理过拟合问题。
卷积神经网络CNN
1.输入层
2.卷积层
3.激活函数
4.池化层
5.全连接层
递归神经网络RNN
RNN尝试考虑之前出现过的信息。比如说:我出生在中国,所以我说中文
RNN加入了记忆功能,使网络能够使用前文出现的中国二字,推断出我说的语言是中文的概率较大。
RNN的局限性
1.计算量大(记住的东西太多会导致网络太庞大,而且有的信息没有价值)
2.梯度消失(sigmoid函数的梯度在x很大和很小时会出现梯度趋近于0)
长短期记忆网络LSTM
升级了RNN使记忆可长可短
其中有一个重要的控制参数C,用来决定什么样的信息会被保留,什么样的会被遗忘
i表示要保留下来的新信息
生成对抗网络GAN
1.生成器Generator
2.判别器Discriminator
其中生成器:瞒天过海,骗过判别器
判别器:火眼金睛,分辨出哪些图片是真实的以及哪些图片是生成的
损失函数的定义:一方面要让判别器能力更强,另一方面要让生成器生成的图片更真实
经典网络模型
LeNet-5
AlexNet
VGGNet
GoogleNet
ResNet