每组第一次观察后 Groupby 用 0 填充

问题有没有办法使用 groupby 用 0 填充缺失值，但仅在观察第一次出现之后？例如开始 id spiq nopiq spiq pstkq dvy dvpq mibq xidoq miiq2014 1 NaN NaN NaN 0.0 NaN 0.0 0.0 -0.122 0.0002015 1 0.01 0.003 0.1 0.10 NaN NaN NaN -1.309 0.0002016 1 0.04 0.003 NaN 0.10 NaN 0.10 0.10 NaN NaN2017 1 NaN 0.000 NaN NaN 20 NaN NaN 0.000 NaN2018 1 0.05 0.000 NaN 0.0 NaN 0.0 0.0 0.000 0.0002014 2 NaN NaN NaN 0.0 NaN 0.0 0.0 -0.122 0.0002015 2 0.01 0.003 0.1 0.10 NaN NaN NaN -1.309 0.0002016 2 0.04 0.003 NaN 0.10 NaN 0.10 0.10 NaN NaN2017 2 NaN 0.000 NaN NaN 20 NaN NaN 0.000 NaN2018 2 0.05 0.000 NaN 0.0 NaN 0.0 0.0 0.000 0.0002014 3 NaN NaN NaN 0.0 NaN 0.0 0.0 -0.122 0.0002015 3 0.01 0.003 0.1 0.10 NaN NaN NaN -1.309 0.0002016 3 0.04 0.003 NaN 0.10 NaN 0.10 0.10 NaN NaN2017 3 NaN 0.000 NaN NaN 20 NaN NaN 0.000 NaN2018 3 0.05 0.000 NaN 0.0 NaN 0.0 0.0 0.000 0.000期望的 id spiq nopiq spiq pstkq dvy dvpq mibq xidoq miiq2014 1 NaN NaN NaN 0.0 NaN 0.0 0.0 -0.122 0.0002015 1 0.01 0.003 0.1 0.10 NaN 0.0 0.0 -1.309 0.0002016 1 0.04 0.003 0.0 0.10 NaN 0.10 0.10 0.0 0.02017 1 0.0 0.000 0.0 0.0 20 0.0 0.0 0.0 0.02018 1 0.05 0.000 0.0 0.0 0.0 0.0 0.0 0.0 0.0002014 2 NaN NaN NaN 0.0 NaN 0.0 0.0 -0.122 0.0002015 2 0.01 0.003 0.1 0.10 NaN 0.0 0.0 -1.309 0.0002016 2 0.04 0.003 0.0 0.10 NaN 0.10 0.10 0.0 0.02017 2 0.0 0.000 0.0 0.0 20 0.0 0.0 0.000 0.02018 2 0.05 0.000 0.0 0.0 0.0 0.0 0.0 0.000 0.0002014 3 NaN NaN NaN 0.0 NaN 0.0 0.0 -0.122 0.000

查看完整描述

1 回答

慕森卡

TA贡献1806条经验获得超8个赞

IIUC，这是一种方法，因为您不能向前填充零。

df.mask((df.groupby('id').ffill().notna() &

df.isna()).fillna(False), 0)

输出：

id spiq nopiq spiq.1 pstkq dvy dvpq mibq xidoq miiq

2014 1 NaN NaN NaN 0.0 NaN 0.0 0.0 -0.122 0.0

2015 1 0.01 0.003 0.1 0.1 NaN 0.0 0.0 -1.309 0.0

2016 1 0.04 0.003 0.0 0.1 NaN 0.1 0.1 0.000 0.0

2017 1 0.00 0.000 0.0 0.0 20.0 0.0 0.0 0.000 0.0

2018 1 0.05 0.000 0.0 0.0 0.0 0.0 0.0 0.000 0.0

2014 2 NaN NaN NaN 0.0 NaN 0.0 0.0 -0.122 0.0

2015 2 0.01 0.003 0.1 0.1 NaN 0.0 0.0 -1.309 0.0

2016 2 0.04 0.003 0.0 0.1 NaN 0.1 0.1 0.000 0.0

2017 2 0.00 0.000 0.0 0.0 20.0 0.0 0.0 0.000 0.0

2018 2 0.05 0.000 0.0 0.0 0.0 0.0 0.0 0.000 0.0

2014 3 NaN NaN NaN 0.0 NaN 0.0 0.0 -0.122 0.0

2015 3 0.01 0.003 0.1 0.1 NaN 0.0 0.0 -1.309 0.0

2016 3 0.04 0.003 0.0 0.1 NaN 0.1 0.1 0.000 0.0

2017 3 0.00 0.000 0.0 0.0 20.0 0.0 0.0 0.000 0.0

2018 3 0.05 0.000 0.0 0.0 0.0 0.0 0.0 0.000 0.0

细节：

使用ffillaftergroupby用每个组的最后一个有效值填充 NaN，然后检查新创建的数据帧以查看原始 df 中所有非 NaN 值和 NaN 值的位置，并使用 0 填充它们mask。

反对回复 2023-10-18

热搜

最近搜索清空

每组第一次观察后 Groupby 用 0 填充

每组第一次观察后 Groupby 用 0 填充

1 回答

添加回答