为了账号安全,请及时绑定邮箱和手机立即绑定

获取 DataFrame 中的前一个工作日

获取 DataFrame 中的前一个工作日

哈士奇WWW 2021-07-01 13:19:39
我有一个包含两列、日期和类别的 DataFrame。我想根据规则创建一个新的日期列:如果类别是B那么值应该是最接近日期的工作日(仅来自过去或当天本身),否则它是日期列本身的值。我将工作日定义为不在周末的任何一天,也不出现在holidays下面最小示例中定义的列表中。请考虑以下 DataFrame df:import datetime as dtimport pandas as pdfrom IPython.display import displayholidays = [dt.datetime(2018, 10, 11)]df = pd.DataFrame({"day": ["2018-10-10", "2018-10-11", "2018-10-12",                       "2018-10-13", "2018-10-14", "2018-10-15"                      ],               "category":["A", "B", "C", "B", "C", "A"]              })df["day"] = pd.to_datetime(df.day, format="%Y-%m-%d")display(df)         day category0 2018-10-10        A1 2018-10-11        B2 2018-10-12        C3 2018-10-13        B4 2018-10-14        C5 2018-10-15        A如何获得第三列,其值为下面列出的值?2018-10-102018-10-102018-10-122018-10-122018-10-142018-10-15我创建了一个函数,可以在处理列表时查找最后一个工作日,如果有帮助的话。# creates a list whose elements are all days in the years 2017, 2018 and 2019days = [dt.datetime(2017, 1 , 1) + dt.timedelta(k) for k in range(365*3)]def lastt_bus_day(date):    return max(        [d for d in days if d.weekday() not in [5, 6]                            and d not in holidays                            and d <= date        ]    )for d in df.day:    print(last_bus_day(d))#prints2018-10-10 00:00:002018-10-10 00:00:002018-10-12 00:00:002018-10-12 00:00:002018-10-12 00:00:002018-10-15 00:00:00
查看完整描述

3 回答

?
跃然一笑

TA贡献1826条经验 获得超6个赞

Pandas 支持通过自定义工作日提供您自己的假期。


该解决方案的好处是无缝支持相邻的假期;例如,某些地区的节礼日和圣诞节。


# define custom business days

weekmask = 'Mon Tue Wed Thu Fri'

holidays = ['2018-10-11']


bday = pd.tseries.offsets.CustomBusinessDay(holidays=holidays, weekmask=weekmask)


# construct mask to identify when days must be sutracted

m1 = df['category'] == 'B'

m2 = df['day'].dt.weekday.isin([5, 6]) | df['day'].isin(holidays)


# apply conditional logic

df['day'] = np.where(m1 & m2, df['day'] - bday, df['day'])


print(df)


  category        day

0        A 2018-10-10

1        B 2018-10-10

2        C 2018-10-12

3        B 2018-10-12

4        C 2018-10-14

5        A 2018-10-15

编辑:根据您的评论,“我刚刚意识到我没有问清楚我想要什么。我想找到前一个工作日”,您可以简单地使用:


df['day'] -= bday


查看完整回答
反对 回复 2021-07-13
  • 3 回答
  • 0 关注
  • 309 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信