• ###了解python数据分析常用类库


1.IPython–科学计算表准工具集的组成部分


是一个增强型的python shell,目的是提高编写 ,测试 ,调试python代码的速度

主要用于交互式数据并进行处理 ,是分布式计算的基础结构

提供了一个类似于Mathematica的HTML的笔记本 ,一个基于QT框架的GUI控制台
具有绘图 ,多行编辑以及语法高亮显示等功能

####2.NumPy(Numerical Python)–Python科学计算的基础包

快速高效的多维数据对象 ndarray

对数组执行元素级的计算以及直接对数组执行数字运算的函数

读写硬盘上基于数组的数据集的工具

线性代数运算 ,傅里叶变换 ,以及随机数生成的功能

将c,c++,Fortran代码集成到python的工具

####3.SciPy–专门解决科学计算中各种子模块有不同的应用 ,如插值 ,积分 ,优化 ,图像处理和特殊函数等

常用类 作用
scipy.integrate 数值积分例程和微积分方程求解器
scipy.linalg 扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能
scipy.optimize 函数优化器(最小化器)以及根查找算法
scipy.signal 信号处理工具
scipy.sparse 稀疏矩阵和稀疏线性系统求解器
scipy.special SPECFUN(这是一个实现了许多数学函数的Fortran库)的包装器
sscipy.stats 检验连续和离散概率分布,各种统计检验方法,以及更好的描述统计法
scipy.weave 利用内联c++代码加速数组计算的工具

4.Pandas——数据分析核心库

提供了一系列能够快速,便捷地处理结构化数据的数据结构和函数.

高性能的数组计算功能以及电子表格和关系型数据库(如 SQL)灵活的数据处理功能.

复杂精细的索引功能 ,以便便捷地完成重塑,切片和切块,聚合及选取数据子集等操作.

5.Matplotlib——绘制数据图表的Python库

Python的2D绘图库,非常适合创建出版物上用的图表。

操作比较容易,只需几行代码即可生成直方图、功率谱图、条形图、错误图和散点图等图形。

提供了pylab的模块,其中包括了NumPy和pyplot中许多常用的函数,方便用户快速进行计算和绘图。

交互式的数据绘图环境,绘制的图表也是交互式的。