我有一个df带有形状(500000,70)和几列的数据框,其中包括无效日期,例如4000-01-01 00:00:00. 在这个数据框的较小版本中,我试过df["date"] = df["date"].astype(str)df["date"] = df["date"].replace('4000-01-01 00:00:00', pd.NaT)效果很好。还有版本df["date"] = pd.to_datetime(df["date"].replace("4000-01-01 00:00:00",pd.NaT))工作。对于长数据帧版本,我收到以下错误OutOfBoundsDatetime: Out of bounds nanosecond timestamp: 4000-01-01 00:00:00任何建议如何以优雅的方式解决这个问题或问题可能是什么?谢谢你。
2 回答

慕妹3242003
TA贡献1824条经验 获得超6个赞
错误是因为:
In [332]: pd.Timestamp.max
Out[332]: Timestamp('2262-04-11 23:47:16.854775807')
日期的上限是这里。并且您的值超出范围,因此 OutOfBoundsError。
添加回答
举报
0/150
提交
取消