本文共涉及三个问题:

1.机器学习开发流程

2.机器学习算法分类

3.机器学习模型是什么

我们做什么?

  • 分析大量数据
  • 分析具体业务
  • 应用常见算法
  • 特征工程、调参数、优化

    我们应该怎么做?

  • 学会分析问题,使用机器学习算法的目的,想要算法完成何种任务。

  • 掌握算法基本思想,学会对问题用相应的算法解决。
  • 学会利用哭或者框架解决问题。

机器学习算法的判别依据

机器学习算法的分类

监督学习包括:特征值+目标值
无监督学习包括:特征值
监督学习中,分类算法的目标值是离散型,回归算法的目标值是连续型。

监督学习和无监督学习


监督学习(Supervised learning) :可以从输入数据中学习或建立一个模型,并以此模式推测新的结果。输入数据是由特征值和目标值组成。函数的输出值可以是一个连续的值(称为回归),也可以是一个离散的值(称为分类)。

分类是监督学习的一个核心问题,在监督学习中,当输出变量取有限个离散值时,预测问题变为分类问题。最基础的便是二分类问题,即判断是非,从两个类别中选择一个作为预测结果。

回归是监督学习的另一个核心问题,回归用于预测输入变量和输出变量之间的关系,输出是连续型的值。

无监督学习(unSupervised learning):可以从输入数据中学习或建立一个模型,并以此模式推测新的结果。输入数据是由特征值组成。

分类问题的应用:

回归问题的应用:

机器学习开发流程

1.原始数据,明确问题,要做什么(建立模型,根据数据类型划分应用种类)
2.数据的基本处理:pd处理数据(缺失值、合并表…)
3.特征工程(特征处理,特征抽取、降维…)
4.找到合适的算法进行预测
5.模型的评估,判定效果。
6.如果模型评估合格,达到期望值,如准确率百分之九十八以上。上线使用,以API形式提供。
7.如果模型评估不合格,则可以更换算法或者再次进行特征工程处理,然后再次进行模型评估。

机器学习模型是什么

模型:算法+数据