第二章 机器学习概述
2.1 基本概念
- 芒果的特征包括颜色、大小、形状、产地、品牌等。
- 芒果的标签 例如 水分甜度成熟度等的综合打分 也可以是好、坏这样的离散值。
- 一个标记好特征以及标签的芒果看作一个样本。
- 一组样本构成的集合称为数据集:一般分为训练集和测试集:
训练集中的样本用来训练模型,测试集中的样本用来测试模式的好坏 - 我们通常将所有的特征构成一个向量,称为特征向量x。
- 而标签通常用标量y来表示。
寻找这个最优的函数的过程就是训练或者称之为学习
2.2 机器学习的三个要素
- 模型
- 不同的机器学习的任务主要是在于输出空间不同。但是模型总结为一个带有参数的函数族。
- 常见的模型分为线性模型和非线性模型
- 不同的机器学习的任务主要是在于输出空间不同。但是模型总结为一个带有参数的函数族。
- 学习准则
- 损失函数
- 交叉熵损失函数 书本上没看懂,自己看到一篇文章供参考https://zhuanlan.zhihu.com/p/38241764
在训练模型的时候,我们使用损失函数,希望参数最小,但是如果我们的学习能力过于强大,就会导致过拟合
过拟合的模型虽然对训练数据的准确率比较高,但是模型的泛化能力差。对测试集的准确度会非常低。
- 优化算法
- 梯度下降算法
- 随机梯度下降法
在每次迭代的时候,只采集一个样本,计算这个损失函数的梯度,并更新参数。 - 小批量梯度下降法
小批量梯度下降法是批量梯度下降和随机梯度下降的折中。每次迭代时,我们随机选取一小部分训练样本来计算梯度并更新参数,这样既可以兼顾随机梯度下降法的优点,也可以提高训练效率。