2 回答
TA贡献1951条经验 获得超3个赞
首先添加一列来标识具有负值的行(更准确地说 <= 0):
df['neg'] = (df['value'] <= 0)
然后,对于每个组,找到'neg'设置为 True 且连续的最后几个条目的序列。为此,请颠倒 DataFrame 的顺序(带.iloc[::-1]),然后.cumprod()在'neg'列上使用。cumprod()会将 True 视为 1,将 False 视为 0,因此只要您看到所有 True,累积乘积将为 1,并且一旦您看到第一个 False,累积乘积就会变为并保持 0。由于我们颠倒了顺序,所以我们从末尾倒退,所以我们在末尾找到 True 的序列。
df['upd'] = df.iloc[::-1].groupby('group')['neg'].cumprod().astype(bool)
现在我们知道要更新哪些条目,我们只需要知道将它们更新到什么,这是组的最大值。我们可以transform('max')在 groupby 上使用来获取该值,然后剩下的就是对设置的'value'位置进行实际更新'upd':
df.loc[df['upd'], 'value'] = df.groupby('group')['value'].transform('max')
我们可以通过删除我们在该过程中使用的两个辅助列来完成:
df = df.drop(['neg', 'upd'], axis=1)
我得到的结果与您的预期结果相符。
更新:或者在单个(长!)行中执行整个操作,而不向原始 DataFrame 添加任何辅助列:
df.loc[
df.assign(
neg=(df['value'] <= 0)
).iloc[::-1].groupby(
'group'
)['neg'].cumprod().astype(bool),
'value'
] = df.groupby(
'group'
)['value'].transform('max')
TA贡献1765条经验 获得超5个赞
你可以这样做。
(df.loc[(df.assign(m=df['value'].lt(0)).groupby(['group'], sort=False)['m'].transform('any')) &
(df.index>=df.groupby('group')['value'].transform('idxmin')),'value']) = np.nan
df['value']=df.groupby('group').ffill()
df
输出
group value
0 A 3.0
1 A 0.0
2 A 8.0
3 A 7.0
4 A 0.0
5 B -1.0
6 B 0.0
7 B 9.0
8 B 9.0
9 B 9.0
10 B 9.0
11 C 2.0
12 C 0.0
13 C 5.0
14 C 0.0
15 C 1.0
添加回答
举报