讲述了回归模型的基本原理和算法,并结合回归介绍了交叉验证的方法

1 预测房价

1.1 通过相似的房子预测你的房子


2 线性回归

2.1 应用线性回归模型



那么哪条线才是最好的呢?

2.2 应用一条线的成本

2.3 预测你的房价

3 加入更高阶的因素

3.1 用直线拟合房价或者…?

3.2 如果用二次函数怎么样?

3.3 更高阶的多项式

4 你相信这个模型吗?

显然,相比二次函数并不好!!!
过拟合

5 通过训练-测试分离来评估过拟合

你相信这个拟合吗?

二次函数怎么样呢

如何选择模型阶数 / 复杂度

训练 / 测试分离

  • 训练集
    用于模型构建
  • 测试集
    用于检测模型构建,此数据只在模型检验时使用,用于评估模型的准确率

训练误差

  • 蓝色点为训练集数据

测试误差

6 训练测试曲线

7 加入新的特征

仅仅通过房屋大小预测

加入其他的特征

应该选择多少特征

8 其他回归示例

薪资预测


股票预测

微博流行度

智能房屋

9 回归总结

机器学习流水线