机器学习基础_牛客博客

机器学习基础概念
1.1关于数据

每一个样本都是由不同的特征所描述的。

样本的本质就是在相应的特征所组成的空间中的一个点，这些特征所组成的空间就是特征空间（feature）
机器学习的基本任务
2.1 分类

有一些算法只支持二分类的任务，但是可以把多分类的任务转换成二分类的任务；有一些算法天然可以完成多分类的任务

2.2 回归

机器学习方法的分类
3.1 监督学习

 给机器的训练数据拥有“标记”或者“答案”
 监督学习的算法：
     1. K近邻
     2. 线性回归和多项式回归
     3. 逻辑回归
     4. SVM
     5. 决策树和随机森林

3.2 非监督学习

 给机器的训练数据没有“标记”或者“答案”
 对没有“标记”的数据进行分析--聚类分析

图片说明

特征压缩：在尽量少的损失信息的前提下，将高维的特征向量，压缩成低维的特征向量
         对数据进行降维处理：方便可视化。
 除了进行降维处理还能进行异常值检测

3.3 半监督学习

 先使用无监督学习手段对数据进行处理，使得数据有监督学习的模式，之后再使用监

督学习手段做模型的训练和预测
图片说明

3.4 增强学习

 无人驾驶、机器人

机器学习的其他分类
4.1 在线学习-Online Learning
图片说明

 批量学习-Batch Learning（离线学习）

图片说明

4.2 参数学习-Parametric Learning

 非参数学习-NonParametric Learning
 参数学习的特点是，对模型进行统计学上的假设，喂给机器数据，一旦得到我们想要的参数以后， 
 就不再需要原有的数据集
 非参数学习，不对模型进行假设，非参数学习不等于没参数，非参数学习是不对整个问题进行建 
 模，不把整个问题理解成学习参数