pandas数据缺失的两种处理办法
1.为NaN数据的处理
1.判断这列有没有NaN
或者直接在控制台根据数据进行判断
2.处理方式
假设我 操作的是original_publication_year
这一列,如何操作才能得到过滤后的显示样式
处理方式1:只考虑单列
这行代码的目的是 去除 original_publication_year 列中含有 NaN 值的行,并生成一个新的 DataFrame(df2),包含了所有 original_publication_year 列中不含 NaN 值的行。
3. df["original_publication_year"] 是获取 df 数据框中的 original_publication_year 这一列。
4. pd.notnull(df["original_publication_year")用于检查数据中的每个元素是否不是 NaN。返回一个布尔值的 Series.
True 的行会被保留;
False 的行会被排除(Book2何Book4被去除)。
5. 返回一个所有 original_publication_year 列中不是NaN 的行新的DataFrame
处理方式2:删除NaN所在的行
any表示有就删,all表示全部是NaN才删
inplace表示是否进行原地修改
处理方式3:填充数据
2:为0数据的处理
设置成NaN后用处理NaN的方法处理。
您可能感兴趣的文章
- 12-31使用Python实现文件查重功能
- 12-31基于Python编写一个PDF转换工具箱
- 12-31python螺旋数字矩阵的实现示例
- 12-31Python使用PyQt5实现中英文切换功能
- 12-31pandas数据缺失的两种处理办法


阅读排行
推荐教程
- 12-31使用Python实现文件查重功能
- 12-31python螺旋数字矩阵的实现示例
- 12-31Python使用PyQt5实现中英文切换功能
- 12-31基于Python编写一个PDF转换工具箱
- 12-31pandas数据缺失的两种处理办法