1.GroupBy的使用场景和使用方法2.GroupBy分割、应用和组合的操作内涵3.GroupBy对象的遍历
今天这一集我们开始介绍Pandas中对数据进行处理的一个高逼格的方法:GroupBy。
【妹子说】别说的这么厉害,我只问,这个是干嘛滴
好,我举一个使用场景吧,科学家用不同的测量方法,测出了行星的质量、距离、轨道周期等等,就如同下面的代码所示:
注意一下,这里的seaborn库是一个新的第三方库,我们用它来获取数据,我们在命令行下用pip3 install seaborn就能实现自动安装。
好的,我问你,我要你对使用相同method测出来的distance进行求平均值,你要怎么求?
【妹子说】额,莫不是就要用到你说的GroupBy?
对,我们来做个示范:
可以类比的是,他得到了一个SeriesGroupBy对象,也是一个中间变量。
回到前面提的问题,获取了分组,如果我们想在此基础上求各个不同方法测得的distance的平均值,就非常简单了。
这里可以使用的方法很广,包含了一般的统计方法:求和、求均值、求中位数、方差、累和、最值等常用方法。
自然,describe方法也是可以在此使用的。
用一下我们之前讲过的unstack方法将这个多重索引的Series对象转换成DataFrame对象,可读性更强:
我们通过GroupBy方法获得的DataFrameGroupBy对象可以直接按分组进行迭代,每一轮迭代返回的对象是一个二元元组,包括对应的分组组名和这个组对应的DataFrame片段。
作者:Python末末
链接:https://www.jianshu.com/p/546dd4a3688a
点击查看更多内容
为 TA 点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦