Pandas是基于Numpy的一套数据分析工具.
Series对象,它是创建一个一维的列表(数组),怎么叫也不太清楚,非常的混乱,但是一定要留心别人是怎么叫的,首先要有一个宏观的认识。Series对象创建的是一个带有索引号的数组,所以Series包含两个非常重要的参数,value和index。
使用代码创建一个Series
import pandas as pd data = pd.Series([1,2,3,4,5]) data
运行结果
运行结果中第一列是索引号,第二列是数组,索引号可以按照自己的习惯或者要求重新赋值,例如
data = pd.Series([2,3,5,3,1],index=list('abcde')) data
运行结果
还可以使用字典创建Series对象,因为字典都是键值对的形式存在,故创建的Series对象中的索引为键,代码如下
dict1={'bj':100,'sh':120,'jn':300,'yc':400} data = pd.Series(dict1) data
运行结果
DataFrame对象,直接上代码,还是算了吧,简单的总结一下,DataFrame对象可以创建一个表,需要传进两个Series对象,或许可以传进更多的Series对象,代码如下
population_dict={'beijing':1200,'shanghai':1300,'guangzhou':1250} area_dict={'beijing':120,'shanghai':130,'guangzhou':125} population_Series=pd.Series(population_dict) area_Series=pd.Series(area_dict) city=pd.DataFrame({'area':area_Series,'population':population_Series}) city
运行结果
DataFrame就是往里边传Series对象,可以用字典的形似,可以用列表的形式,使用字典的话键作为前边的索引,使用列表的时候需要给指定索引index=(),代码如下
population_dict={'beijing':1200,'shanghai':1300,'guangzhou':1250} area_dict={'beijing':120,'shanghai':130,'guangzhou':125} population_Series=pd.Series(population_dict) area_Series=pd.Series(area_dict) city=pd.DataFrame([area_Series,population_Series],index=('人口','面积')) city
运行结果