简单介绍: sklearn是Scikit-learn的简称,定位是通用机器学习库。
安装顺序:
- numpy
- scipy
- sklearn
如果直接在命令行用pip安装可能会报错~~~
报错原因: Windows系统的pip install可能对于numpy,scipy等库的安装不大支持,因此需要手动安装
解决方案:手动下载numpy和scipy库 下载链接:https://www.lfd.uci.edu/~gohlke/pythonlibs/
【注意】:自己指定一个文件夹下载,稍后安装numpy和scipy,要进入此文件夹。比如我的是下载到这里(如下图)
- 下载对应自己python版本的numpy
-
下载对应自己python版本的scipy (我自己的是py3.7.0)
安装过程:
0.打开 Anaconda Prompt
1.安装numpy
- 在Anaconda Prompt中打开下载的文件位置 (比如我的保存到了 E:\python machineLearn)
- 则用cd命令打开
-
安装numpy 命令(install 后面是下载的numpy库文件的全名)
pip3 install numpy-1.16.3+mkl-cp37-cp37m-win_amd64.whl
成功安装numpy图示
2.安装scipy
与安装numpy同理,输入安装命令(install后面为你自己的下载的scipy的库文件全名)
pip3 install scipy-1.2.1-cp37-cp37m-win_amd64.whl
成功安装scipy图示
3.安装sklearn
成功安装sklearn图示
4.重启编辑器试试吧
输入以下代码试试吧~~
from sklearn import datasets
from sklearn.linear_model import LinearRegression
loaded_data=datasets.load_boston()
data_X=loaded_data.data
data_y=loaded_data.target
model=LinearRegression()
model.fit(data_X,data_y)
print(model.predict(data_X[:4,:]))#前4个数据的预测值
print (data_y[:4])#真实值
运行结果图示
[sklearn的一些小介绍:]
- 功能:sklearn更倾向于使用者可以自行对数据进行处理,比如选择特征、压缩维度、转换格式,是传统机器学习库。
- 使用的自由度:sklearn 中的模块都是高度抽象化的,所有的分类器基本都可以在3-5行内完成,所有的转换器(如scaler和transformer)也都有固定的格式。这种抽 象化限制了使用者的自由度,但增加了模型的效率,降低了批量化、标准化的的难度(通过使用pipeline)。
- 针对的群体和项目:sklearn主要适合中小型的、实用机器学习项目,尤其是那种数据量不大且需要使用者手动对数据进行处理,并选择合适模型的项目。这类项目往往在CPU上就可以完成,对硬件要求低。