为了账号安全,请及时绑定邮箱和手机立即绑定

熊猫:如何总结大小不等的数据集?

熊猫:如何总结大小不等的数据集?

繁华开满天机 2021-10-12 16:36:59
假设我有不同大小的数据集,例如X_1 = [1,2,3]和X_2 = [4,5,6,7,8]。我想创建一个包含汇总变量(平均值、标准差等)的数据框,每行一个数据集,每列一个统计数据。我怎么能在熊猫中做到这一点?
查看完整描述

2 回答

?
斯蒂芬大帝

TA贡献1827条经验 获得超8个赞

我会用 describe


df=pd.concat([pd.Series(x) for x in [X_1, X_2]], axis=0, keys=['X_1', 'X_2'])# notice here I am using axis=0 rather than 1 

df.groupby(level=0).describe()

Out[442]: 

     count  mean       std  min  25%  50%  75%  max

X_1    3.0   2.0  1.000000  1.0  1.5  2.0  2.5  3.0

X_2    5.0   6.0  1.581139  4.0  5.0  6.0  7.0  8.0

特别案例


X_1 = [1,2,np.nan] 

X_2 = [4,5,6,7,8]


df=pd.concat([pd.Series(x) for x in [X_1, X_2]], axis=0, keys=['X_1', 'X_2'])

df.groupby(level=0).size()

Out[445]: 

X_1    3

X_2    5

dtype: int64


查看完整回答
反对 回复 2021-10-12
  • 2 回答
  • 0 关注
  • 177 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信