为了账号安全,请及时绑定邮箱和手机立即绑定

给妹子讲python-S02E19GroupBy实现分割、应用和组合

标签:
Python

1.GroupBy的使用场景和使用方法2.GroupBy分割、应用和组合的操作内涵3.GroupBy对象的遍历

webp

今天这一集我们开始介绍Pandas中对数据进行处理的一个高逼格的方法:GroupBy。

【妹子说】别说的这么厉害,我只问,这个是干嘛滴

好,我举一个使用场景吧,科学家用不同的测量方法,测出了行星的质量、距离、轨道周期等等,就如同下面的代码所示:

webp

注意一下,这里的seaborn库是一个新的第三方库,我们用它来获取数据,我们在命令行下用pip3 install seaborn就能实现自动安装。

好的,我问你,我要你对使用相同method测出来的distance进行求平均值,你要怎么求?

【妹子说】额,莫不是就要用到你说的GroupBy?

对,我们来做个示范:

webp

可以类比的是,他得到了一个SeriesGroupBy对象,也是一个中间变量。

回到前面提的问题,获取了分组,如果我们想在此基础上求各个不同方法测得的distance的平均值,就非常简单了。

webp

这里可以使用的方法很广,包含了一般的统计方法:求和、求均值、求中位数、方差、累和、最值等常用方法。

自然,describe方法也是可以在此使用的。

webp

webp

用一下我们之前讲过的unstack方法将这个多重索引的Series对象转换成DataFrame对象,可读性更强:

webp

我们通过GroupBy方法获得的DataFrameGroupBy对象可以直接按分组进行迭代,每一轮迭代返回的对象是一个二元元组,包括对应的分组组名和这个组对应的DataFrame片段。

webp



作者:Python末末
链接:https://www.jianshu.com/p/546dd4a3688a


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消