为了账号安全,请及时绑定邮箱和手机立即绑定

在 pandas 数据透视表中运行总和(python)

在 pandas 数据透视表中运行总和(python)

慕哥6287543 2023-07-27 16:20:30
我有一个如下所示的数据框:df = pd.DataFrame({'publisher': ['facebook', 'facebook', 'facebook', 'google', 'google', 'google'],          'month_leadgen': ['2019-01', '2019-01', '2019-01', '2019-02', '2019-02', '2019-03'],         'month_payment': ['2019-01', '2019-02', '2019-03', '2019-02', '2019-03', '2019-03'],         'revenue': [60, 25, 45, 85, 90, 60]})我创建了一个数据透视表:df = df.pivot_table(index=['publisher', 'month_leadgen'], columns=['month_payment'], values=['revenue']).reset_index()    publisher   month_leadgen   revenuemonth_payment            2019-01  2019-02  2019-030   facebook    2019-01  60.0     25.0     45.01   google      2019-02  NaN      85.0     90.02   google      2019-03  NaN      NaN      60.0我的预期输出是按月汇总总和。因此,对于 facebook,我希望在 2019-02 列(第 1 个月 + 第 2 个月)中看到 85.0。Facebook 的 2019-03 栏将为 125.0(第 1 个月 + 第 2 个月 + 第 3 个月)。谢谢。
查看完整描述

2 回答

?
料青山看我应如是

TA贡献1772条经验 获得超8个赞

让我们试试.cumsum()axis=1。那就是cumsum(1)。


df=df.join(df[['revenue']].cumsum(1).rename(columns=dict(revenue='Cumsum')))




publisher month_leadgen                     revenue                  Cumsum          \

month_payment                         2019-01 2019-02 2019-03   2019-01 2019-02   

0              facebook       2019-01    60.0    25.0    45.0    60.0    85.0   

1                google       2019-02     NaN    85.0    90.0     NaN    85.0   

2                google       2019-03     NaN     NaN    60.0     NaN     NaN   


                       

month_payment 2019-03  

0               130.0  

1               175.0  

2                60.0  

或者,在枢轴阶段进行;

df2 = df=df.pivot_table(index=['month_leadgen','publisher'], columns=['month_payment'], values=['revenue']).cumsum(axis=1).reset_index()



查看完整回答
反对 回复 2023-07-27
?
Smart猫小萌

TA贡献1911条经验 获得超7个赞

只需以这种方式定义您的数据集,并将发布者作为索引:

df = pd.DataFrame( { 'month_leadgen': ['2019-01', '2019-01', '2019-01', '2019-02', '2019-02', '2019-03'], '月付款': ['2019-01', '2019-02', '2019-03', '2019-02', '2019-03', '2019-03'], '收入': [60, 25, 45, 85, 90, 60] }, 索引 = ['facebook', 'facebook', 'facebook', 'google', 'google', 'google'] )

然后执行执行这一行:

df['TotalShifted'] = df.groupby(level=0)['收入'].transform(lambda x: x.cumsum().shift(0))

您将获得:

Month_leadgen Month_ payment 收入 TotalShifted facebook 2019-01 2019-01 60 60 facebook 2019-01 2019-02 25 85 facebook 2019-01 2019-03 45 130 google 2019-02 2019-02 85 85 google 2019-02 201 9-03 90 175 谷歌2019年3月 2019年3月 60 235


//img1.sycdn.imooc.com//64c229250001b1c806540522.jpg

查看完整回答
反对 回复 2023-07-27
  • 2 回答
  • 0 关注
  • 159 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信