为了账号安全,请及时绑定邮箱和手机立即绑定

Python 列表到索引数据框

Python 列表到索引数据框

慕森王 2021-06-03 18:53:08
我有一个索引和打印的列表;此处显示的示例:[Home Team                     season    1. FC Kaiserslautern          2010/2011     48                               2011/2012     24 1. FC Köln                    2008/2009     35                               2009/2010     33                               2010/2011     47                               2011/2012     39                               2014/2015     34                               2015/2016     38 1. FC Nürnberg                2009/2010     32                               2010/2011     47                               2011/2012     38                               2012/2013     39                               2013/2014     37不过,我无法将其转换为相同格式的 Pandas 数据帧。使用df = pd.DataFrame(df)创建一个单行数据框,所有内容都成束。我获取列表的代码是:df = []home_goals = leaguesFinal.groupby(('Home Team', 'season'))['home_team_goal'].sum()away_goals = leaguesFinal.groupby(('Away Team', 'season'))['away_team_goal'].sum()df.append((home_goals + away_goals))我只是想总结每支球队每个赛季的主客场进球数。如果有更好的方法来做到这一点,一般我都会听。虽然为了更容易操作,我最终还是想要一个数据框。
查看完整描述

1 回答

?
茅侃侃

TA贡献1842条经验 获得超21个赞

我相信需要rename_axis使用addDataFrame使用相同名称的 MultiIndex reset_index

leaguesFinal = pd.DataFrame({

    'Home Team': ['b','a','a','c','b','a'],

    'Away Team': ['a','b','c','a','a','b'],

    'season': ['2010/2011'] * 3 + ['2012/2013'] * 3,

    'home_team_goal': [1,2,3,4,3,2],

    'away_team_goal': [4,6,7,8,2,1]

})

print (leaguesFinal)

  Home Team Away Team     season  home_team_goal  away_team_goal

0         b         a  2010/2011               1               4

1         a         b  2010/2011               2               6

2         a         c  2010/2011               3               7

3         c         a  2012/2013               4               8

4         b         a  2012/2013               3               2

5         a         b  2012/2013               2               1

home_goals = leaguesFinal.groupby(['Home Team', 'season'])['home_team_goal'].sum()

away_goals = leaguesFinal.groupby(['Away Team', 'season'])['away_team_goal'].sum()


print (home_goals)

Home Team  season   

a          2010/2011    5

           2012/2013    2

b          2010/2011    1

           2012/2013    3

c          2012/2013    4

Name: home_team_goal, dtype: int64


print (away_goals)

Away Team  season   

a          2010/2011     4

           2012/2013    10

b          2010/2011     6

           2012/2013     1

c          2010/2011     7

Name: away_team_goal, dtype: int64

a = home_goals.rename_axis(['Team','season'])

b = away_goals.rename_axis(['Team','season'])

df = (a.add(b, fill_value=0)).reset_index(name='both')

print (df)

  Team     season  both

0    a  2010/2011   9.0

1    a  2012/2013  12.0

2    b  2010/2011   7.0

3    b  2012/2013   4.0

4    c  2010/2011   7.0

5    c  2012/2013   4.0


查看完整回答
反对 回复 2021-06-06
  • 1 回答
  • 0 关注
  • 224 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信