为了账号安全,请及时绑定邮箱和手机立即绑定

根据列后缀对列重新排序

根据列后缀对列重新排序

三国纷争 2021-09-25 16:39:50
这是我的代码:all_data = pd.merge(all_data, meanData, suffixes=["", "_mean"], how='left', on=['id', 'id2'])现在,我想合并all_dataand meanData,但我希望 meanData 列首先出现。像这样:a_mean,b_mean,c_mean,a,b,c不是这样a,b,c,a_mean,b_mean,c_mean注意:我有很多列,所以我不想手动编写代码来更改索引。示例代码(您可以复制):import pandasdf = pd.DataFrame([[0,1, 2], [0,1, 3], [0,4, 6],[1,3,4],[1,4,2]], columns=['id','A', 'B'])features = ['A','B']meanData = df.groupby(['id'])[features].agg('mean')df = pd.merge(df, meanData, suffixes=["", "_mean"], how='left', on=['id'])print(df.columns)输出索引(['id', 'A', 'B', 'A_mean', 'B_mean'], dtype='object')预期输出:索引(['A_mean', 'B_mean','id', 'A', 'B'], dtype='object')
查看完整描述

2 回答

?
海绵宝宝撒

TA贡献1809条经验 获得超8个赞

我认为您可以使用transformaftergroupby来获取mean与每一行的相关信息,然后pd.concat是数据帧,例如:


new_df = pd.concat([(df.groupby('id')[features]

                       .transform(np.mean).add_suffix('_mean')), df],

                   axis=1)

print (new_df)

   A_mean    B_mean  id  A  B

0     2.0  3.666667   0  1  2

1     2.0  3.666667   0  1  3

2     2.0  3.666667   0  4  6

3     3.5  3.000000   1  3  4

4     3.5  3.000000   1  4  2


查看完整回答
反对 回复 2021-09-25
?
达令说

TA贡献1821条经验 获得超6个赞

您可以使用以下命令合并和重新排序列sorted():


v = pd.merge(df, meanData, suffixes=["", "_mean"], how='left', on=['id'])

v[sorted(v.columns, key=lambda x: 'mean' not in x)]


   A_mean    B_mean  id  A  B

0     2.0  3.666667   0  1  2

1     2.0  3.666667   0  1  3

2     2.0  3.666667   0  4  6

3     3.5  3.000000   1  3  4

4     3.5  3.000000   1  4  2


查看完整回答
反对 回复 2021-09-25
  • 2 回答
  • 0 关注
  • 163 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号