1. 机器学习基础概念
    1.1关于数据

    每一个样本都是由不同的特征所描述的。
    图片说明
    样本的本质就是在相应的特征所组成的空间中的一个点,这些特征所组成的空间就是特征空间(feature)
    图片说明

  2. 机器学习的基本任务
    2.1 分类
    二分类
    图片说明
    有一些算法只支持二分类的任务,但是可以把多分类的任务转换成二分类的任务;有一些算法天然可以完成多分类的任务
    图片说明

    2.2 回归
    图片说明

  3. 机器学习方法的分类
    3.1 监督学习

     给机器的训练数据拥有“标记”或者“答案”
     监督学习的算法:
         1. K近邻
         2. 线性回归和多项式回归
         3. 逻辑回归
         4. SVM
         5. 决策树和随机森林

    3.2 非监督学习

     给机器的训练数据没有“标记”或者“答案”
     对没有“标记”的数据进行分析--聚类分析

    图片说明

    特征压缩:在尽量少的损失信息的前提下,将高维的特征向量,压缩成低维的特征向量
             对数据进行降维处理:方便可视化。
     除了进行降维处理还能进行异常值检测

    3.3 半监督学习

     先使用无监督学习手段对数据进行处理,使得数据有监督学习的模式,之后再使用监        

    督学习手段做模型的训练和预测
    图片说明

    3.4 增强学习
    增强学习

     无人驾驶、机器人
  4. 机器学习的其他分类
    4.1 在线学习-Online Learning
    图片说明
    图片说明

     批量学习-Batch Learning(离线学习)

    图片说明
    图片说明
    4.2 参数学习-Parametric Learning

     非参数学习-NonParametric Learning
     参数学习的特点是,对模型进行统计学上的假设,喂给机器数据,一旦得到我们想要的参数以后, 
     就不再需要原有的数据集
     非参数学习,不对模型进行假设,非参数学习不等于没参数,非参数学习是不对整个问题进行建 
     模,不把整个问题理解成学习参数