为了账号安全,请及时绑定邮箱和手机立即绑定

长数据帧的 Python Pandas 越界日期时间时间戳错误

长数据帧的 Python Pandas 越界日期时间时间戳错误

米脂 2021-07-14 14:15:07
我有一个df带有形状(500000,70)和几列的数据框,其中包括无效日期,例如4000-01-01 00:00:00. 在这个数据框的较小版本中,我试过df["date"] = df["date"].astype(str)df["date"] = df["date"].replace('4000-01-01 00:00:00', pd.NaT)效果很好。还有版本df["date"] = pd.to_datetime(df["date"].replace("4000-01-01 00:00:00",pd.NaT))工作。对于长数据帧版本,我收到以下错误OutOfBoundsDatetime: Out of bounds nanosecond timestamp: 4000-01-01 00:00:00任何建议如何以优雅的方式解决这个问题或问题可能是什么?谢谢你。
查看完整描述

2 回答

?
慕妹3242003

TA贡献1824条经验 获得超6个赞

错误是因为:


In [332]: pd.Timestamp.max

Out[332]: Timestamp('2262-04-11 23:47:16.854775807')

日期的上限是这里。并且您的值超出范围,因此 OutOfBoundsError。




查看完整回答
反对 回复 2021-07-21
  • 2 回答
  • 0 关注
  • 1239 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号