当我创建了一个DataFrame与pd.read_excel(my_excel_file, dtype=str)电子表格中的空白单元格被替换为字符串nan。另一方面,DataFrame从pd.read_csv(my_csv_file, dtype=str)用numpy.nan对象替换空白。为什么是这样?
2 回答
长风秋雁
TA贡献1757条经验 获得超7个赞
您可以为 指定一个na_values
属性read_excel
。
df = pd.read_excel(my_excel_file, na_values=[''], dtype=object)
慕标5832272
TA贡献1966条经验 获得超4个赞
我会试着回答你的问题,为什么是这样?使用dtype=str
读取 Excel 文件时pd.read_excel
,得到的结果与使用时得到的结果不一致pd.read_csv
。主要原因或者您可以说,在使用numpy.nan
时用对象替换空白单元格的优势pd.read_csv
在于它便于您使用pd.isna
,它仅适用于numpy.nan
对象,否则仅适用于nan
.
有很多关于这个的讨论,可以说这个功能反过来允许在pd.read_csv
和之间保持一致性pd.read_excel
。您可以在 Pandas 的 Github 页面上阅读有关讨论的更多信息,在read_excel中对此进行了一些辩论,dtype=str 将空单元格转换为字符串 'nan' #20377
添加回答
举报
0/150
提交
取消