机器学习基础概念
1.1关于数据
每一个样本都是由不同的特征所描述的。
样本的本质就是在相应的特征所组成的空间中的一个点,这些特征所组成的空间就是特征空间(feature)
机器学习的基本任务
2.1 分类
有一些算法只支持二分类的任务,但是可以把多分类的任务转换成二分类的任务;有一些算法天然可以完成多分类的任务
2.2 回归
机器学习方法的分类
3.1 监督学习给机器的训练数据拥有“标记”或者“答案” 监督学习的算法: 1. K近邻 2. 线性回归和多项式回归 3. 逻辑回归 4. SVM 5. 决策树和随机森林
3.2 非监督学习
给机器的训练数据没有“标记”或者“答案” 对没有“标记”的数据进行分析--聚类分析
特征压缩:在尽量少的损失信息的前提下,将高维的特征向量,压缩成低维的特征向量 对数据进行降维处理:方便可视化。 除了进行降维处理还能进行异常值检测
3.3 半监督学习
先使用无监督学习手段对数据进行处理,使得数据有监督学习的模式,之后再使用监
督学习手段做模型的训练和预测
3.4 增强学习
无人驾驶、机器人
机器学习的其他分类
4.1 在线学习-Online Learning
批量学习-Batch Learning(离线学习)
4.2 参数学习-Parametric Learning非参数学习-NonParametric Learning 参数学习的特点是,对模型进行统计学上的假设,喂给机器数据,一旦得到我们想要的参数以后, 就不再需要原有的数据集 非参数学习,不对模型进行假设,非参数学习不等于没参数,非参数学习是不对整个问题进行建 模,不把整个问题理解成学习参数