在下面的代码中,每个“Person”都有一个对应的“Sales”值,但是当我执行print(compData.max())“Vanessa”时,得到的值是“340”,它在初始的“df”中属于“Amy”import numpy as npimport pandas as pddata = {'Company':['GOOG','GOOG','MSFT','MSFT','FB','FB'], 'Person':['Sam','Charlie','Amy','Vanessa','Carl','Sarah'], 'Sales':[200,120,340,124,243,350]}df = pd.DataFrame(data)compData = df.groupby('Company')print(df)print(compData.max())print(df.loc[3])这是输出: Company Person Sales0 GOOG Sam 2001 GOOG Charlie 1202 MSFT Amy 3403 MSFT Vanessa 1244 FB Carl 2435 FB Sarah 350 Person SalesCompany FB Sarah 350GOOG Sam 200MSFT Vanessa 340Company MSFTPerson VanessaSales 124此外,当我执行print(df.loc[3])“Vanessa”时获得正确的值
2 回答
隔江千里
TA贡献1906条经验 获得超10个赞
我想为 Pibe_chorro 的答案添加一个替代解决方案,它直接为您提供每家公司的最大销售额和销售人员,包括原始索引:
compData.apply(lambda x: x[x.Sales == x.Sales.max()]).reset_index(level=[0])
这给你:
Company Person Sales
5 FB Sarah 350
0 GOOG Sam 200
2 MSFT Amy 340
如果需要,您可以使用pd.DataFrame.sort_index()按索引排序
compData.apply(lambda x: x[x.Sales == x.Sales.max()]).reset_index(level=[0]).sort_index()
结果:
Company Person Sales
0 GOOG Sam 200
2 MSFT Amy 340
5 FB Sarah 350
添加回答
举报
0/150
提交
取消