为了账号安全,请及时绑定邮箱和手机立即绑定

删除满足列值条件的 Pandas 数据帧的初始行,同时保持列中的序列值完整

删除满足列值条件的 Pandas 数据帧的初始行,同时保持列中的序列值完整

慕桂英546537 2021-05-30 19:26:28
dt = {'id': [120,120,120,120,121,121,121], 'day': [0, 1,2,3,0,1,2], 'value': [[0.5,3.4,2.7],[0.45,3.4,0.7],[0.25,0.4,0.7],[0.15,0.34,0.17],[0.35,3.4,2.7],[0.5,3.44,2.57],[0.5,0.34,0.37]]}df = pd.DataFrame(data=dt)    day id  value0   0   120 [0.5, 3.4, 2.7]1   1   120 [0.45, 3.4, 0.7]2   2   120 [0.25, 0.4, 0.7]3   3   120 [0.15, 0.34, 0.17]4   0   121 [0.35, 3.4, 2.7]5   1   121 [0.5, 3.44, 2.57]6   2   121 [0.5, 0.34, 0.37]我有一个pandas dataframe. 我希望该序列column "day"的最大值为1。对于column day大于1的值,我要删除其初始行,然后将序列重置为[0-1]这就是在这种情况下,column"id"=120有列“天”有两个额外的值2和3。我想删除自己的前两排在这种情况下,然后更换日的列值(0,1)。结果:    day id  value0   0   120 [0.25, 0.4, 0.7]1   1   120 [0.15, 0.34, 0.17]2   0   121 [0.5, 3.44, 2.57]3   1   121 [0.5, 0.34, 0.37]
查看完整描述

2 回答

?
烙印99

TA贡献1829条经验 获得超13个赞

您可以减去按id和分组时的最大值query


m = df.groupby('id').day.transform('max')

df.assign(day=df.day.sub(m - 1)).query('day >= 0')


   day   id               value

2    0  120    [0.25, 0.4, 0.7]

3    1  120  [0.15, 0.34, 0.17]

5    0  121   [0.5, 3.44, 2.57]

6    1  121   [0.5, 0.34, 0.37]


查看完整回答
反对 回复 2021-06-01
?
三国纷争

TA贡献1804条经验 获得超7个赞

您可以使用groupbywith tail,然后我们会cumcount重新创建这一天


df.groupby('id').tail(2).assign(day=lambda x : x.groupby('id').cumcount())

Out[221]: 

   day   id               value

2    0  120    [0.25, 0.4, 0.7]

3    1  120  [0.15, 0.34, 0.17]

5    0  121   [0.5, 3.44, 2.57]

6    1  121   [0.5, 0.34, 0.37]


查看完整回答
反对 回复 2021-06-01
  • 2 回答
  • 0 关注
  • 149 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号