处理丢失的数据
在python中有两种方法
- np.nan
- None
user.loc['西','sex'] = np.nan
pandas 中对于空的操作
- snull()
- notnull()
- dropna() #过滤空值
- fillna() #填充空值
#把每一列中True和False求和
cond = user.isnull().sum()
col_nan = cond[cond>0].index
user.loc[:,col_nan].isnull()
dropna()
过滤NAN
#删除行还是列
#按照MySQL删除行?
#在数据分析中我们删除行
#在探索性数据分析中,如果行缺失的比较多那就删除行,如果列缺失的比较多那就删除列
user.dropna(axis=1)
fillna() 填充
#男 女
#100 5个信息空缺 80 男 15女 众数 男
#1.指定填充
user.fillna(value=0)
user
#2.前后填充,不能使用value=None
user.fillna(method='ffill')