为了账号安全,请及时绑定邮箱和手机立即绑定

按列分组并将另一列的值分散到其他列中

按列分组并将另一列的值分散到其他列中

梵蒂冈之花 2023-11-09 21:54:21
我有当前的数据框,我正在尝试按 进行分组Name并将 的值分散weight到列中,并在每次出现时进行计数。谢谢!df = pd.DataFrame({'Name':['John','Paul','Darren','John','Darren'], 'Weight':['Average','Below Average','Above Average','Average','Above Average']})期望的输出:
查看完整描述

3 回答

?
白猪掌柜的

TA贡献1893条经验 获得超10个赞

尝试pandas 交叉表:

pd.crosstab(df.Name, df.Weight)


Weight  Above Average   Average Below Average

Name            

John           0           2        0

Paul           0           0        1

Darren         2           0        0


查看完整回答
反对 回复 2023-11-09
?
ABOUTYOU

TA贡献1812条经验 获得超5个赞

使用 groupby 和 unstack:


    df = pd.DataFrame({'Name':['John','Paul','Darren','John','Darren'],

'Weight':['Average','Below Average','Above Average','Average','Above Average']})

df = df.groupby(['Name', 'Weight'])['Weight'].count().unstack(1).fillna(0).astype(int).reset_index()

df = df.rename_axis('', axis=1).set_index('Name')

df

Out[1]: 

        Above Average  Average  Below Average

Name                                         

Darren              2        0              0

John                0        2              0

Paul                0        0              1


查看完整回答
反对 回复 2023-11-09
?
千巷猫影

TA贡献1829条经验 获得超7个赞

在这里用来get dummies实现你所需要的


pd.get_dummies(df.set_index('Name'), dummy_na=False,prefix=[None]).groupby('Name').sum()

 


         Above Average  Average  Below Average

Name                                         

Darren              2        0              0

John                0        2              0

Paul                0        0              1


查看完整回答
反对 回复 2023-11-09
  • 3 回答
  • 0 关注
  • 152 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信