处理丢失的数据

在python中有两种方法

  • np.nan
  • None
user.loc['西','sex'] = np.nan

pandas 中对于空的操作

  • snull()
  • notnull()
  • dropna() #过滤空值
  • fillna() #填充空值
#把每一列中True和False求和
cond = user.isnull().sum()
col_nan = cond[cond>0].index
user.loc[:,col_nan].isnull()


dropna()

过滤NAN

#删除行还是列
#按照MySQL删除行?
#在数据分析中我们删除行
#在探索性数据分析中,如果行缺失的比较多那就删除行,如果列缺失的比较多那就删除列
user.dropna(axis=1)


fillna() 填充

#男 女
#100 5个信息空缺 80 男 15女 众数 男

#1.指定填充
user.fillna(value=0)

user

#2.前后填充,不能使用value=None
user.fillna(method='ffill')