为了账号安全,请及时绑定邮箱和手机立即绑定

基于两个条件的 Python pandas 数据帧回填

基于两个条件的 Python pandas 数据帧回填

红颜莎娜 2022-06-07 19:15:23
我有一个这样的数据框:   Bool   Hour0  False  121  False  242  False  123  False  244  True   125  False  246  False  127  False  248  False  129  False  2410 False  1211 True   24我想将“布尔”列中的真值回填到“小时”第一次达到“12”时的点。结果将是这样的:   Bool   Hour  Result0  False  12    False1  False  24    False2  False  12    True      <- desired backfill3  False  24    True      <- desired backfill4  True   12    True5  False  24    False6  False  12    False7  False  24    False8  False  12    False9  False  24    False10 False  12    True      <- desired backfill11 True   24    True任何帮助是极大的赞赏!非常感谢!
查看完整描述

3 回答

?
ibeautiful

TA贡献1993条经验 获得超5个赞

这有点难以实现,这里我们可以使用groupbywith idxmax


s=(~df.Bool&df.Hour.eq(12)).iloc[::-1].groupby(df.Bool.iloc[::-1].cumsum()).transform('idxmax')

df['result']=df.index>=s.iloc[::-1]

df

Out[375]: 

     Bool  Hour  result

0   False    12   False

1   False    24   False

2   False    12    True

3   False    24    True

4    True    12    True

5   False    24   False

6   False    12   False

7   False    24   False

8   False    12   False

9   False    24   False

10  False    12    True

11   True    24    True


查看完整回答
反对 回复 2022-06-07
?
杨__羊羊

TA贡献1943条经验 获得超7个赞

s连续创建一个 groupIDFalse并与它们分开True。Groupby on Hourequals12使用s. 使用变换sum和从每组的自下而上获取oncumsum的计数,并返回on和的值True12True0orBool


s = df.Bool.ne(df.Bool.shift()).cumsum()

s1 = df.where(df.Bool).Bool.bfill()

g = df.Hour.eq(12).groupby(s)

df['bfill_Bool'] = (g.transform('sum') - g.cumsum()).eq(0) & s1 | df.Bool


Out[905]:

     Bool  Hour  bfill_Bool

0   False    12       False

1   False    24       False

2   False    12        True

3   False    24        True

4    True    12        True

5   False    24       False

6   False    12       False

7   False    24       False

8   False    12       False

9   False    24       False

10  False    12        True

11   True    24        True


查看完整回答
反对 回复 2022-06-07
?
largeQ

TA贡献2039条经验 获得超7个赞

IIUC,你可以这样做:


s = df['Bool'].shift(-1)

df['Result'] = df['Bool'] | s.where(s).groupby(df['Hour'].eq(12).cumsum()).bfill()

输出:


     Bool  Hour  Result

0   False    12   False

1   False    24   False

2   False    12    True

3   False    24    True

4    True    12    True

5   False    24   False

6   False    12   False

7   False    24   False

8   False    12   False

9   False    24   False

10  False    12    True

11   True    24    True


查看完整回答
反对 回复 2022-06-07
  • 3 回答
  • 0 关注
  • 101 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信