为了账号安全,请及时绑定邮箱和手机立即绑定

如何在两个日期之间添加 date_range

如何在两个日期之间添加 date_range

慕田峪4524236 2024-01-16 10:28:40
我想处理一些日子之间的时间重叠。正如你在我的 df 中看到的,我的开始日期为 2019-10-25,结束日期为 2019-10-27:begin                       end                          info2019-10-25 10:39:58.352073  2019-10-25 10:40:06.266782   toto2019-10-25 16:35:22.485574  2019-10-27 09:50:31.713179   tata <------ HERE2019-10-27 09:50:31.713179  2019-10-27 09:50:31.713192   titi2019-10-28 14:04:33.095633  2019-10-28 14:05:07.639344   tete我想添加与这两个日期之间的时间段(日期 00:00:00;日期 23:59:59.9)一样多的时间段并复制数据info,如下所示:2019-10-25 16:35:22.485574  2019-10-25 23:59:59.999999   tata2019-10-26 00:00:00.000000  2019-10-26 23:59:59.999999   tata2019-10-27 00:00:00.000000  2019-10-27 09:50:31.713179   tata如果开始日期与结束日期不同,则 => 计算天数保留开始并添加新的结束“日期 23:59:59.9”添加新的 date_range 对应的天数取结束并添加新的开始 'date 00:00:00.0'填写“信息”最终预期结果:begin                       end                          info2019-10-25 10:39:58.352073  2019-10-25 10:40:06.266782   toto2019-10-25 16:35:22.485574  2019-10-25 23:59:59.999999   tata2019-10-26 00:00:00.000000  2019-10-26 23:59:59.999999   tata2019-10-27 00:00:00.000000  2019-10-27 09:50:31.713179   tata2019-10-27 09:50:31.713179  2019-10-27 09:50:31.713192   titi2019-10-28 14:04:33.095633  2019-10-28 14:05:07.639344   tete但我不知道如何实现 date_range、填充信息、添加具体行数。谢谢你的时间
查看完整描述

1 回答

?
慕标5832272

TA贡献1966条经验 获得超4个赞

假设begin和end已经是Timestamp类型:


# Generate a series of Timedeltas for each row

n = (

    (df['end'].dt.normalize() - df['begin'].dt.normalize())

        .apply(lambda d: [pd.Timedelta(days=i) for i in range(d.days+1)])

        .explode()

).rename('n')

df = df.join(n)


# Adjust the begin and end of each row

adjusted_begin = np.max([

    df['begin'],

    df['begin'].dt.normalize() + df['n']

], axis=0)


adjusted_end = np.min([

    df['end'],

    pd.Series(adjusted_begin).dt.normalize() + pd.Timedelta(days=1, milliseconds=-100)

], axis=0)


# Final assembly

df = df.assign(begin_=adjusted_begin, end_=adjusted_end)

结果:


                       begin                        end  info      n                     begin_                       end_

0 2019-10-25 10:39:58.352073 2019-10-25 10:40:06.266782  toto 0 days 2019-10-25 10:39:58.352073 2019-10-25 10:40:06.266782

1 2019-10-25 16:35:22.485574 2019-10-27 09:50:31.713179  tata 0 days 2019-10-25 16:35:22.485574 2019-10-25 23:59:59.900000

1 2019-10-25 16:35:22.485574 2019-10-27 09:50:31.713179  tata 1 days 2019-10-26 00:00:00.000000 2019-10-26 23:59:59.900000

1 2019-10-25 16:35:22.485574 2019-10-27 09:50:31.713179  tata 2 days 2019-10-27 00:00:00.000000 2019-10-27 09:50:31.713179

2 2019-10-27 09:50:31.713179 2019-10-27 09:50:31.713192  titi 0 days 2019-10-27 09:50:31.713179 2019-10-27 09:50:31.713192

3 2019-10-28 14:04:33.095633 2019-10-28 14:05:07.639344  tete 0 days 2019-10-28 14:04:33.095633 2019-10-28 14:05:07.639344

剪掉不需要的列


查看完整回答
反对 回复 2024-01-16
  • 1 回答
  • 0 关注
  • 95 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信