已解决430363个问题，去搜搜看，总会有你想问的

熊猫：如何总结大小不等的数据集？

关注

首页猿问熊猫：如何总结大小不等的数据集？

Python

繁华开满天机 2021-10-12 16:36:59

假设我有不同大小的数据集，例如X_1 = [1,2,3]和X_2 = [4,5,6,7,8]。我想创建一个包含汇总变量（平均值、标准差等）的数据框，每行一个数据集，每列一个统计数据。我怎么能在熊猫中做到这一点？

查看完整描述

2 回答

斯蒂芬大帝

TA贡献1827条经验获得超8个赞

我会用 describe

df=pd.concat([pd.Series(x) for x in [X_1, X_2]], axis=0, keys=['X_1', 'X_2'])# notice here I am using axis=0 rather than 1

df.groupby(level=0).describe()

Out[442]:

count mean std min 25% 50% 75% max

X_1 3.0 2.0 1.000000 1.0 1.5 2.0 2.5 3.0

X_2 5.0 6.0 1.581139 4.0 5.0 6.0 7.0 8.0

特别案例

X_1 = [1,2,np.nan]

X_2 = [4,5,6,7,8]

df=pd.concat([pd.Series(x) for x in [X_1, X_2]], axis=0, keys=['X_1', 'X_2'])

df.groupby(level=0).size()

Out[445]:

X_1 3

X_2 5

dtype: int64

反对回复 2021-10-12

关注

0/150

提交

取消

购课补贴
联系客服咨询优惠详情

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号