train_data=pd.read_csv('data/used_car_train_20200313.csv',sep=' ')

在天池学习的时候遇到的,给的csv文件只有一列,却含有很多列数据,用空格隔开。
sep=’ '代表用空格区分构成dataframe。
//

head()
describe()
info()
tail()
dtypes 

这几个函数用来总体简略地观察数据
//

train_data=pd.DataFrame(train_data,dtype=np.float)

这个用法是让opject类型转换为float类型,
int也可以这样转。
//

msno.bar(data.sample(1000)
=msno.bar(data[:1000])
msno.matrix(data.sample(999)

缺失值可视化

//

data['name'].value_counts

可以查看该数据的数值构成,一般看固定几种数值的,比如0/1和true/false
//2020/4/8