假设我的熊猫数据框的某些列中有元组元素,我想使用类似的方法 .describe() id 只考虑每个元组的第一个值例如我的数据框是: col1 col2 col30 6 (5,8) (4,7)1 5 (6,3) (1,2)2 8 (3,7) (3,6)当我使用这个方法时df = pd.describe(df)我希望它为每个带有元组的列采用元组的第一个值来计算平均值和其他统计数据
1 回答
HUH函数
TA贡献1836条经验 获得超4个赞
只需使用str访问器切片并分配回第一个元素:
df.assign(**df[['col2','col3']].apply(lambda x: x.str[0])).describe()
col1 col2 col3
count 3.000000 3.000000 3.000000
mean 6.333333 4.666667 2.666667
std 1.527525 1.527525 1.527525
min 5.000000 3.000000 1.000000
25% 5.500000 4.000000 2.000000
50% 6.000000 5.000000 3.000000
75% 7.000000 5.500000 3.500000
max 8.000000 6.000000 4.000000
在哪里:
df.assign(**df[['col2','col3']].apply(lambda x: x.str[0]))
col1 col2 col3
0 6 5 4
1 5 6 1
2 8 3 3
添加回答
举报
0/150
提交
取消