今天又到了 汇报的时间了 学习一下张振兴 同学 提前梳理一下 知识 以及如何进行一个讲述

首先 自己要讲述的是 西瓜书的 第一章的第四节
主要是承接第三章的 假设空间 产生的 版本空间的 选取 最终的一个结论是 具体问题要具体分析

假设空间 是已经设计好的 模型 决策树 神经网络 boosting 贝叶斯 支持向量机 等等

根据 选出来的样本进行一个 训练 得到 一个 假设 在对假设进行一个调整 得到一个局部最优模型

在对模型进行一个 测试

有可能存在 选取的 样本 采用 假设空间的 不同候选集合 产生了 版本空间 就是不同的 一个模型

都符合 这几个样本的预测 但是 一个算法的好坏 是按照 其 数据的类型来谈论的

不能单单的说一个算法就比一个算法更好 只是 他们的 涉及范围不同

拿这个图来说
image.png

b图可能更加反映实际 情况 但相对于 a来说 b就达到了 一个 过度拟合的状态

一个更加简单的 模型 才能 更加贴切的反映出 一个 数据集的本质