为了账号安全,请及时绑定邮箱和手机立即绑定

转置数据框中的两列或多列

转置数据框中的两列或多列

白猪掌柜的 2023-03-08 15:06:04
我有一个看起来像的数据框:PRIO   Art  Name      Value1      A     Alpha     01      A     Alpha     01      A     Beta      12      A     Alpha     32      B     Theta     2 我如何转置数据框,我将所有唯一名称作为一列,并具有相应的值(请注意,我想忽略重复的行)?所以在这种情况下:PRIO   Art  Alpha      Alpha_value  Beta   Beta_value  Theta Theta_value1      A    1             0         1       1           NaN    NaN2      A    1             3         NaN     NaN         NaN    NaN2      B    NaN           NaN       NaN     NaN          1     2
查看完整描述

3 回答

?
开心每一天1111

TA贡献1836条经验 获得超13个赞

这是使用pivot_table. 要记住一些棘手的事情:

  • 您需要将两者都指定'PRIO', 'Art'为数据透视索引

  • 我们还可以使用两个聚合函数在一次调用中完成

  • 我们必须重命名 0 级列以区分它们。所以你需要交换级别并重命名

out = df.pivot_table(index=['PRIO', 'Art'], columns='Name', values='Value', 

               aggfunc=[lambda x: 1, 'first'])

# get the column names right

d = {'<lambda>':'is_present', 'first':'value'}

out = out.rename(columns=d, level=0)

out.columns = out.swaplevel(1,0, axis=1).columns.map('_'.join)

print(out.reset_index())


   PRIO Art  Alpha_is_present  Beta_is_present  Theta_is_present  Alpha_value  \

0     1   A               1.0              1.0               NaN          0.0   

1     2   A               1.0              NaN               NaN          3.0   

2     2   B               NaN              NaN               1.0          NaN   


   Beta_value  Theta_value  

0         1.0          NaN  

1         NaN          NaN  

2         NaN          2.0



查看完整回答
反对 回复 2023-03-08
?
千万里不及你

TA贡献1784条经验 获得超9个赞

pd.crosstab()这是和的示例groupby()。


df = pd.concat([pd.crosstab([df['PRIO'],df['Art']], df['Name']),df.groupby(['PRIO','Art','Name'])['Value'].sum().unstack().add_suffix('_value')],axis=1).reset_index()


df

|          |   Alpha |   Beta |   Theta |   Alpha_value |   Beta_value |   Theta_value |

|:---------|--------:|-------:|--------:|--------------:|-------------:|--------------:|

| (1, 'A') |       1 |      1 |       0 |             0 |            1 |           nan |

| (2, 'A') |       1 |      0 |       0 |             3 |          nan |           nan |

| (2, 'B') |       0 |      0 |       1 |           nan |          nan |             2 |



查看完整回答
反对 回复 2023-03-08
?
元芳怎么了

TA贡献1798条经验 获得超7个赞

Groupby 两次,首先以 Name 和 suffix 为中心值。Next groupby 相同的命令并找到唯一的值。加入两者。在加入中,删除重复的列并根据需要重命名其他列


g=df.groupby([ 'Art','PRIO', 'Name'])['Value'].\

first().unstack().reset_index().add_suffix('_value')


print(g.join(df.groupby(['PRIO', 'Art','Name'])['Value'].\

       nunique().unstack('Name').reset_index()).drop(columns=['PRIO_value','Art'])\

      .rename(columns={'Art_value':'Art'}))




 Name Art  Alpha_value  Beta_value  Theta_value  PRIO  Alpha  Beta  Theta

0      A          0.0         1.0          NaN     1    1.0   1.0    NaN

1      A          3.0         NaN          NaN     2    1.0   NaN    NaN

2      B          NaN         NaN          2.0     2    NaN   NaN    1.0


查看完整回答
反对 回复 2023-03-08
  • 3 回答
  • 0 关注
  • 128 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信