简单介绍:  sklearn是Scikit-learn的简称,定位是通用机器学习库。

安装顺序:

  1. numpy
  2. scipy
  3. sklearn

如果直接在命令行用pip安装可能会报错~~~

报错原因:   Windows系统的pip install可能对于numpy,scipy等库的安装不大支持,因此需要手动安装

解决方案:手动下载numpy和scipy库  下载链接:https://www.lfd.uci.edu/~gohlke/pythonlibs/

 

【注意】:自己指定一个文件夹下载,稍后安装numpy和scipy,要进入此文件夹。比如我的是下载到这里(如下图)

 

  • 下载对应自己python版本的numpy

  • 下载对应自己python版本的scipy  (我自己的是py3.7.0)

 

 

安装过程:

0.打开 Anaconda Prompt

1.安装numpy

  • 在Anaconda Prompt中打开下载的文件位置  (比如我的保存到了  E:\python machineLearn)
  • 则用cd命令打开

  • 安装numpy 命令(install 后面是下载的numpy库文件的全名)

    pip3 install numpy-1.16.3+mkl-cp37-cp37m-win_amd64.whl
    

     

                                                                                  成功安装numpy图示

2.安装scipy

与安装numpy同理,输入安装命令(install后面为你自己的下载的scipy的库文件全名)

pip3 install scipy-1.2.1-cp37-cp37m-win_amd64.whl

 

                                                                                          成功安装scipy图示

3.安装sklearn

                                                               成功安装sklearn图示

4.重启编辑器试试吧

输入以下代码试试吧~~

from sklearn import datasets
from  sklearn.linear_model import LinearRegression

loaded_data=datasets.load_boston()
data_X=loaded_data.data
data_y=loaded_data.target

model=LinearRegression()
model.fit(data_X,data_y)
print(model.predict(data_X[:4,:]))#前4个数据的预测值
print (data_y[:4])#真实值

                                                                                  运行结果图示

 

 

 

 

[sklearn的一些小介绍:]

  1. 功能:sklearn更倾向于使用者可以自行对数据进行处理,比如选择特征、压缩维度、转换格式,是传统机器学习库。
  2. 使用的自由度sklearn 中的模块都是高度抽象化的,所有的分类器基本都可以在3-5行内完成,所有的转换器(如scaler和transformer)也都有固定的格式这种抽 象化限制了使用者的自由度,但增加了模型的效率,降低了批量化、标准化的的难度(通过使用pipeline)。
  3. 针对的群体和项目:sklearn主要适合中小型的、实用机器学习项目,尤其是那种数据量不大且需要使用者手动对数据进行处理,并选择合适模型的项目。这类项目往往在CPU上就可以完成,对硬件要求低