train_data=pd.read_csv('data/used_car_train_20200313.csv',sep=' ')
在天池学习的时候遇到的,给的csv文件只有一列,却含有很多列数据,用空格隔开。
sep=’ '代表用空格区分构成dataframe。
//
head()
describe()
info()
tail()
dtypes
这几个函数用来总体简略地观察数据
//
train_data=pd.DataFrame(train_data,dtype=np.float)
这个用法是让opject类型转换为float类型,
int也可以这样转。
//
msno.bar(data.sample(1000)
=msno.bar(data[:1000])
msno.matrix(data.sample(999)
缺失值可视化
//
data['name'].value_counts
可以查看该数据的数值构成,一般看固定几种数值的,比如0/1和true/false
//2020/4/8