为了账号安全,请及时绑定邮箱和手机立即绑定

具有多级列的 Pandas Groupby

具有多级列的 Pandas Groupby

森栏 2023-06-27 13:29:56
我想知道如何改造表格并获得我想要的结果:我的示例数据集:df=pd.DataFrame({    "ID":[111,111,111,111,222,222,222,333,333],    "Section":["CS01","CS01","IT01","IT01","CS02","CS02","CS02","HS01","HS01"],    "Subject":["Hist","Pol","Pol","Arts","Pol","Hist","Arts","Pol","Hist"],    "Activity":["Quiz 1","Quiz 2","Quiz 3","Quiz 1","Quiz 2","Quiz 3","Quiz 1","Quiz 2","Quiz 3"],    "Pass":[1,0,0,1,1,1,0,1,0],    })它看起来像什么:    ID      Section     Subject     Activity    Pass0   111     CS01        Hist        Quiz 1      11   111     CS01        Pol         Quiz 2      02   111     IT01        Pol         Quiz 3      03   111     IT01        Arts        Quiz 1      14   222     CS02        Pol         Quiz 2      15   222     CS02        Hist        Quiz 3      16   222     CS02        Arts        Quiz 1      07   333     HS01        Pol         Quiz 2      18   333     HS01        Hist        Quiz 3      0我正在尝试做的事情:ID  Section Subject Quiz 1      Quiz 2      Quiz 3                          0   1   NA  0   1   NA  0   1   NA111 CS01    Hist    0   1   0   0   0   1   0   0   1111 CS01    Pol     0   0   1   1   0   0   0   0   1111 IT01    Arts    0   1   0   0   0   1   0   0   1111 IT01    Pol     0   0   1   0   0   1   1   0   0222 CS02    Arts    1   0   0   0   0   0   0   0   0222 CS02    Hist    0   0   1   0   0   1   0   1   0222 CS02    Pol     0   0   1   0   1   0   0   0   1333 HS01    Hist    0   0   1   0   0   1   1   0   0333 HS01    Pol     0   0   1   0   1   0   0   0   1我想要的是将“主题”列设置为级别 2,将“通过”列设置为级别 1,并使用“NA”列。到目前为止我只有这个:df.groupby(["ID","Section", "Subject","Activity"])["Pass"].value_counts().unstack().fillna(0)但这没有“NA”列,也没有级别 2 的“活动”
查看完整描述

目前暂无任何回答

  • 0 回答
  • 0 关注
  • 122 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信