当我的数据集包含所有变量时,我可以通过只选择我需要的变量来创建一个子集。但是,如果缺少一个,我什么都没有。我该如何处理这样的错误?df = df_ori[[ 'FINAL', 'DUE', 'ID', 'NAME', 'BUSINESS 1', 'TAX 2', 'COUNT' ]] 当 df_ori 中的所有变量都存在时,这有效并且 df 存在。但是,如果缺少一个变量,我想通过管理潜在错误来更进一步。if df.empty: print("Field(s) mendatory missing") #doesn't work if in df_ori dataframe the field 'ID' is missing 例如。我无法输入此“IF”没有错误,但没有生成数据框 df 或“字段缺失”没有出现
1 回答
墨色风雨
TA贡献1853条经验 获得超6个赞
IIUC,reindex与 一起使用axis=1:
df = pd.DataFrame(np.random.randint(0,10,(5,5)), columns=[*'ABCDE'])
在哪里,
df[['A','B','C','Z']]
生成KeyError: "['Z'] not in index"
采用,
df.reindex(['A','B','C','Z'], axis=1)
输出:
A B C Z
0 9 9 8 NaN
1 2 6 7 NaN
2 6 6 6 NaN
3 3 7 9 NaN
4 7 2 2 NaN
添加回答
举报
0/150
提交
取消