为了账号安全,请及时绑定邮箱和手机立即绑定

数据框按一列分组并平均一列,同时在另一列中查找最多出现

数据框按一列分组并平均一列,同时在另一列中查找最多出现

回首忆惘然 2021-12-21 16:06:37
我有一个 Pandas 数据框,我想对一列进行分组,同时对一列求平均值并在另一列中找到出现次数最多的值我能够做到,但我认为有一种简洁的方法可以做到,而不是 4 行代码import pandas as pddf = pd.DataFrame({'Country' : ['USA', 'USA', 'Russia','USA', 'Russia', 'Russia'], 'City' : ['New-York', 'New-York', 'Sankt-Petersburg', 'Chicago', 'Moscow', 'Moscow'], 'Flights' : [22, 45, 32, 16, 31, 25]})w=df.groupby('Country').mean().round(decimals=2)x=(df.groupby('Country')['City'].agg(pd.Series.mode))y=x.to_frame()z = pd.concat([w, y], axis=1 ,join='outer')Country   Flights   CityRussia    29.33         MoscowUSA       27.67         New-York
查看完整描述

1 回答

?
慕森王

TA贡献1777条经验 获得超3个赞

GroupBy.agg与 lambda 函数一起使用,也可以为模式添加Series.iat选择第一个值,因为mode应该返回更多值:


z = df.groupby('Country').agg({'Flights': lambda x: round(x.mean(), 2), 

                               'City': lambda x: x.mode().iat[0]})

print (z)

         Flights      City

Country                   

Russia     29.33    Moscow

USA        27.67  New-York

z = df.groupby('Country', as_index=False).agg({'Flights': lambda x: round(x.mean(),2), 

                                               'City': lambda x: x.mode().iat[0]})

print (z)


  Country  Flights      City

0  Russia    29.33    Moscow

1     USA    27.67  New-York


查看完整回答
反对 回复 2021-12-21
  • 1 回答
  • 0 关注
  • 168 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信