无法找到解决我的问题的方法。假设我有一个 df:df = pd.DataFrame({'col':np.random.randn(len(date_rng)),'created_at':pd.date_range('2020-01-01', '2020-12-31', freq='D')})df输出是: col created_at0 1.764052 2020-01-011 0.400157 2020-01-022 0.978738 2020-01-033 2.240893 2020-01-044 1.867558 2020-01-05... ... ...361 0.003771 2020-12-27362 0.931848 2020-12-28363 0.339965 2020-12-29364 -0.015682 2020-12-30365 0.160928 2020-12-31所以问题是我想过滤数据框以显示过去 6 个月到月初的数据。例如,如果今天(2020 年 10 月 23 日),我希望数据框提供 4 月 1 日以来的结果。如果是 11 月,则无论 11 月的日期如何,第一个日期结果都应为 5 月 1 日。关于如何做到这一点有什么想法吗?这应该自动运行,所以类似:df = df[(df.created_at.dt.month >= datetime.datetime.utcnow().month) & (df.created_at.dt.year==datetime.datetime.utcnow().year)]不会工作。谢谢!!!
1 回答
鸿蒙传说
TA贡献1865条经验 获得超7个赞
您可以使用 Between 来指定两个值之间的条件:
today = datetime.today()
target = today - timedelta(days=180)
df = df[lambda x: x['created_at'].between(datetime(target.year,target.month,1),today)]
添加回答
举报
0/150
提交
取消