为了账号安全,请及时绑定邮箱和手机立即绑定

pd.read_excel() 用 `nan` 字符串替换空格,pd.read_csv()

pd.read_excel() 用 `nan` 字符串替换空格,pd.read_csv()

小唯快跑啊 2021-11-23 19:01:54
当我创建了一个DataFrame与pd.read_excel(my_excel_file, dtype=str)电子表格中的空白单元格被替换为字符串nan。另一方面,DataFrame从pd.read_csv(my_csv_file, dtype=str)用numpy.nan对象替换空白。为什么是这样?
查看完整描述

2 回答

?
长风秋雁

TA贡献1757条经验 获得超7个赞

您可以为 指定一个na_values属性read_excel

df = pd.read_excel(my_excel_file, na_values=[''], dtype=object)


查看完整回答
反对 回复 2021-11-23
?
慕标5832272

TA贡献1966条经验 获得超4个赞

我会试着回答你的问题,为什么是这样?使用dtype=str读取 Excel 文件时pd.read_excel,得到的结果与使用时得到的结果不一致pd.read_csv。主要原因或者您可以说,在使用numpy.nan时用对象替换空白单元格的优势pd.read_csv在于它便于您使用pd.isna,它仅适用于numpy.nan对象,否则仅适用于nan.

有很多关于这个的讨论,可以说这个功能反过来允许在pd.read_csv和之间保持一致性pd.read_excel。您可以在 Pandas 的 Github 页面上阅读有关讨论的更多信息,在read_excel中对此进行了一些辩论,dtype=str 将空单元格转换为字符串 'nan' #20377


查看完整回答
反对 回复 2021-11-23
  • 2 回答
  • 0 关注
  • 590 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信