为了账号安全,请及时绑定邮箱和手机立即绑定

pandas DataFrame 中的数据出现在错误的索引位置

pandas DataFrame 中的数据出现在错误的索引位置

子衿沉夜 2022-11-18 16:49:58
在下面的代码中,每个“Person”都有一个对应的“Sales”值,但是当我执行print(compData.max())“Vanessa”时,得到的值是“340”,它在初始的“df”中属于“Amy”import numpy as npimport pandas as pddata = {'Company':['GOOG','GOOG','MSFT','MSFT','FB','FB'],       'Person':['Sam','Charlie','Amy','Vanessa','Carl','Sarah'],       'Sales':[200,120,340,124,243,350]}df = pd.DataFrame(data)compData = df.groupby('Company')print(df)print(compData.max())print(df.loc[3])这是输出:  Company   Person  Sales0    GOOG      Sam    2001    GOOG  Charlie    1202    MSFT      Amy    3403    MSFT  Vanessa    1244      FB     Carl    2435      FB    Sarah    350          Person  SalesCompany                FB         Sarah    350GOOG         Sam    200MSFT     Vanessa    340Company       MSFTPerson     VanessaSales          124此外,当我执行print(df.loc[3])“Vanessa”时获得正确的值
查看完整描述

2 回答

?
隔江千里

TA贡献1906条经验 获得超10个赞

我想为 Pibe_chorro 的答案添加一个替代解决方案,它直接为您提供每家公司的最大销售额和销售人员,包括原始索引:


compData.apply(lambda x: x[x.Sales == x.Sales.max()]).reset_index(level=[0])

这给你:


    Company Person  Sales

5        FB  Sarah  350

0      GOOG    Sam  200

2      MSFT    Amy  340

如果需要,您可以使用pd.DataFrame.sort_index()按索引排序

compData.apply(lambda x: x[x.Sales == x.Sales.max()]).reset_index(level=[0]).sort_index()

结果:


    Company Person  Sales

0      GOOG    Sam  200

2      MSFT    Amy  340

5        FB  Sarah  350


查看完整回答
反对 回复 2022-11-18
?
达令说

TA贡献1821条经验 获得超6个赞

正如 luigigi 指出的那样,groupby.max()返回每列的最大值。


要得到你想要的,你可以像这样搜索具有最大值的索引'Sales':


idx = df.groupby('Company')['Sales'].transform(max) == df['Sales']

print (df[idx])


Company Person  Sales

0    GOOG    Sam    200

2    MSFT    Amy    340

5      FB  Sarah    350

从这里偷来的


也许有更简单的方法,但这就是我发现的


查看完整回答
反对 回复 2022-11-18
  • 2 回答
  • 0 关注
  • 102 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信