绘制 Panda 数据帧子集的均值

假设有一大组数据，例如 Height (m) My data0 18 5.01 25 6.02 10 1.03 13 1.54 32 8.05 26 6.76 23 5.07 5 2.08 7 2.0我想绘制“我的数据”的平均值（如果可能的话，标准偏差）作为高度的函数，在范围 [0,5),[5,10),[10,15) 和很快。任何的想法？我尝试了不同的方法，但都不起作用

查看完整描述

2 回答

繁华开满天机

TA贡献1816条经验获得超4个赞

如果我理解正确的话：

# Precompute bins for pd.cut

bins = list(range(0, df['Height (m)'].max() + 5, 5))

# Cut Height into intervals which exclude the right endpoint,

# with bin edges at multiples of 5

df['HeightBin'] = pd.cut(df['Height (m)'], bins=bins, right=False)

# Within each bin, get mean, stdev (normalized by N-1 by default),

# and also show sample size to explain why some std values are NaN

df.groupby('HeightBin')['My data'].agg(['mean', 'std', 'count'])

mean std count

HeightBin

[0, 5) NaN NaN 0

[5, 10) 2.00 0.000000 2

[10, 15) 1.25 0.353553 2

[15, 20) 5.00 NaN 1

[20, 25) 5.00 NaN 1

[25, 30) 6.35 0.494975 2

[30, 35) 8.00 NaN 1

反对回复 2021-12-21

慕侠2389804

TA贡献1719条经验获得超6个赞

如果我理解正确，这就是您想要做的：

import pandas as pd

import numpy as np

bins = np.arange(0, 30, 5) # adjust as desired

df_stats = pd.DataFrame(columns=['mean', 'st_dev']) # DataFrame for the results

df_stats['mean'] = df.groupby(pd.cut(df['Height (m)'], bins, right=False)).mean()['My data']

df_stats['st_dev'] = df.groupby(pd.cut(df['Height (m)'], bins, right=False)).std()['My data']

反对回复 2021-12-21

热搜

最近搜索清空

绘制 Panda 数据帧子集的均值

绘制 Panda 数据帧子集的均值

2 回答

添加回答