在学习数据分析时,NumPy作为最基础的数据分析库,我们能够熟练的掌握它是学习数据分析的必要条件。接下来就让我们学习该库吧。
学习NumPy库的环境:
python:3.6.6
编辑器:pycharm
NumPy安装:在cmd命令下,直接使用pip语句,pip install NumPy即可!
NumPy是使用Python进行科学计算的基本软件包。它主要包含一下内容:
- 有一个强大的N维数组对象ndarray;
- 拥有复杂的广播功能函数;
- 整合C/C++和Fortran代码的工具;
- 线性代数、傅里叶变换、随机数生成等功能。
具体的内容可参考NumPy官网信息:点击官网
Python基础数据类型中是没有数组概念,NumPy库能够很好的满足了数组缺失,数组对象的优点有:
- 数组对象可以去掉元素间运算的循环,使一维向量更像单个数据;
- 设置专门的数组对象,经过优化,可以提升这类应用的运算速度;
- 数组对象采用相同的数据类型,有助于节省运算和存储空间。
一、ndarray的介绍
1、ndarray的构成:
ndarray有两部分构成,一是实际数据;二是描述这些数据的元数据(数据维度、数据类型等)。ndarray数组一般要求所有元素类型相同(同质),数组的下标从0开始。
其中轴(axis):保存数组的维度;秩(rank):轴的数量
2、ndarray对象的属性:
.ndim:秩,即轴的数量或维度的数量;
.shape:ndarray对象的尺度,对于矩阵,n行m列;
.size:ndarray对象元素的个数,相当于.shape的n*m的值;
.dtype:ndarray对象的元素类型;
.itemsize:ndarray对象中每个元素的大小,以字节为单位。
如下举例说明:
求数组a的平方和数组b的立方和:
import numpy as np def npSum(): a = np.array([0, 1, 2, 3, 4]) b = np.array([9, 8, 7, 6, 5]) c = a ** 2 + b ** 3
return c print(npSum()) [729 513 347 225 141]
如下是ndarray属性的练习:
import numpy as np a = np.array([[0, 1, 2, 3, 4], [9, 8, 7, 6, 5]]) print(a) print(a.ndim) print(type(a)) print(a.shape) print(a.size) print(a.dtype) print(a.itemsize) [[0 1 2 3 4] [9 8 7 6 5]] 2
<class 'numpy.ndarray'> (2, 5) 10 int32 4
3、ndarray数组的创建方法:
- 从python中的列表、元组等类型创建ndarray;
- 使用NumPy中函数创建ndarray数组,如arange,ones,zeros;
- 从字节流(raw bytes)中创建ndarray数组;
- 从文件中读取特定的格式创建ndarray数组。
如下举例说明:
①、从python中的列表、元组等类型创建ndarray数组:
1 import numpy as np 2 x = np.array([[1, 2], [9, 8], (0.1, 0.2)]) 3 print(x) 4 print(x.shape) 5 print(x.size) 6
7 [[1. 2. ] 8 [9. 8. ] 9 [0.1 0.2]] 10 (3, 2) 11 6
②、使用NumPy中函数创建ndarray数组:
np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n-1;
np.ones(shape) 根据shape生成一个全1数组,shape是元组类型;
np.zeros(shape) 根据shape生成一个全0数组,shape是元组类型;
np.full(shape, val) 根据shape生成一个数组,每个元素值都是val;
np.eye(n) 创建一个正方的n*n单位矩阵,对角线为1,其余为0;
类似函数
np.ones_like(a) 根据数组a的形状生成一个全1数组
np.zeros_like(a) 根据数组a的形状生成一个全0数组
np.full_like(a,val) 根据数组a的形状生成一个数组,每个元素值都是val
np.linspace() 根据起止数据等间距地填充数据,形成数组
np.concatenate() 将两个或多个数组合并成一个新的数组
1 import numpy as np 2
3 print(np.arange(10)) 4 print(np.ones((3, 6))) 5 print(np.zeros((3, 6), dtype=np.int32)) 6 print(np.eye(5)) 7
8 [0 1 2 3 4 5 6 7 8 9] 9 [[1. 1. 1. 1. 1. 1.] 10 [1. 1. 1. 1. 1. 1.] 11 [1. 1. 1. 1. 1. 1.]] 12 [[0 0 0 0 0 0] 13 [0 0 0 0 0 0] 14 [0 0 0 0 0 0]] 15 [[1. 0. 0. 0. 0.] 16 [0. 1. 0. 0. 0.] 17 [0. 0. 1. 0. 0.] 18 [0. 0. 0. 1. 0.] 19 [0. 0. 0. 0. 1.]]
1 #不限制数据类型的时候生成的是浮点数
2 a = np.linspace(1, 10, 4) 3 print(a) 4 # endpoint 是指最后一个元素是否是生成的四个元素中的一个
5 b = np.linspace(1, 10, 4, endpoint=False) 6 print(b) 7 c = np.concatenate((a, b)) 8 print(c) 9
10
11 [ 1. 4. 7. 10.] 12 [1. 3.25 5.5 7.75] 13 [ 1. 4. 7. 10. 1. 3.25 5.5 7.75]
4、数组的变换
对于创建后的ndarray数组,可以对其进行维度变换和元素类型变换:
ndarray数组的维度变换
.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
.resize(shape) 与.reshape()功能一致,但修改原数组
.swapaxes(ax1, ax2) 将数组n个维度中的两个维度进行调换
.flatten() 对数组进行降维,返回折叠后的一维数组,原数组不变
1 a = np.ones((2, 3, 4), dtype=np.int32) 2 print(a) 3 print(a.reshape((3, 8))) 4 print(a.resize((3, 8))) 5 print(a) 6 print(a.flatten()) 7
8 [[[1 1 1 1] 9 [1 1 1 1] 10 [1 1 1 1]] 11
12 [[1 1 1 1] 13 [1 1 1 1] 14 [1 1 1 1]]] 15 [[1 1 1 1 1 1 1 1] 16 [1 1 1 1 1 1 1 1] 17 [1 1 1 1 1 1 1 1]] 18 None 19 [[1 1 1 1 1 1 1 1] 20 [1 1 1 1 1 1 1 1] 21 [1 1 1 1 1 1 1 1]] 22 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
# astype()方法一定会创建新的数组(原始数组的一个拷贝),即使两个类型一致
1 a = np.ones((2, 3, 4), dtype=np.int) 2 print(a) 3 b = a.astype(np.float) 4 print(b) 5
6 [[[1 1 1 1] 7 [1 1 1 1] 8 [1 1 1 1]] 9
10 [[1 1 1 1] 11 [1 1 1 1] 12 [1 1 1 1]]] 13 [[[1. 1. 1. 1.] 14 [1. 1. 1. 1.] 15 [1. 1. 1. 1.]] 16
17 [[1. 1. 1. 1.] 18 [1. 1. 1. 1.] 19 [1. 1. 1. 1.]]]
5、ndarray数组向列表的转换
1 import numpy as np 2
3 a = np.full((2, 3, 4), 25, dtype=np.int32) 4 print(a) 5 print(a.tolist()) 6
7 [[[25 25 25 25] 8 [25 25 25 25] 9 [25 25 25 25]] 10
11 [[25 25 25 25] 12 [25 25 25 25] 13 [25 25 25 25]]] 14 [[[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]], [[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]]]