机器学习算法入门介绍

本文共涉及三个问题：

1.机器学习开发流程

2.机器学习算法分类

3.机器学习模型是什么

我们做什么？

分析大量数据
分析具体业务
应用常见算法
特征工程、调参数、优化

我们应该怎么做？
学会分析问题，使用机器学习算法的目的，想要算法完成何种任务。
掌握算法基本思想，学会对问题用相应的算法解决。
学会利用哭或者框架解决问题。

机器学习算法的判别依据

机器学习算法的分类

监督学习包括：特征值+目标值
无监督学习包括：特征值
监督学习中，分类算法的目标值是离散型，回归算法的目标值是连续型。

监督学习和无监督学习

监督学习（Supervised learning）：可以从输入数据中学习或建立一个模型，并以此模式推测新的结果。输入数据是由特征值和目标值组成。函数的输出值可以是一个连续的值（称为回归），也可以是一个离散的值（称为分类）。

分类是监督学习的一个核心问题，在监督学习中，当输出变量取有限个离散值时，预测问题变为分类问题。最基础的便是二分类问题，即判断是非，从两个类别中选择一个作为预测结果。

回归是监督学习的另一个核心问题，回归用于预测输入变量和输出变量之间的关系，输出是连续型的值。

无监督学习（unSupervised learning）：可以从输入数据中学习或建立一个模型，并以此模式推测新的结果。输入数据是由特征值组成。

分类问题的应用：

回归问题的应用：

机器学习开发流程

1.原始数据，明确问题，要做什么（建立模型，根据数据类型划分应用种类）
2.数据的基本处理：pd处理数据（缺失值、合并表…）
3.特征工程（特征处理，特征抽取、降维…）
4.找到合适的算法进行预测
5.模型的评估，判定效果。
6.如果模型评估合格，达到期望值，如准确率百分之九十八以上。上线使用，以API形式提供。
7.如果模型评估不合格，则可以更换算法或者再次进行特征工程处理，然后再次进行模型评估。

机器学习模型是什么

模型：算法+数据