为了账号安全,请及时绑定邮箱和手机立即绑定

如何在包含每小时平均值和每小时每个平均值的相应计数的数据帧末尾添加新列。

如何在包含每小时平均值和每小时每个平均值的相应计数的数据帧末尾添加新列。

饮歌长啸 2021-09-11 10:55:41
我一直在搜索,但找不到我的问题的答案。我有太阳能电池测量数据。数据有时间戳值但没有频率。一小时内的值数量不是恒定的。一个小时内可以出现任意数量的值。所以我正在努力创造:一世。包含数据的每小时平均值的列。ii. 另一列保存每小时发生的测量计数。这很重要,因为我的时间戳没有固定频率。因此,重要的是要知道为一天中的特定小时计算的平均值是否有 1 次、2 次或 14 次测量。我的数据框图像:我的代码:yr=df.index.yearmon=df.index.monthday= df.index.dayhr = df.index.hourdf.groupby([yr, mon, day, hr])['KP_sensor'].mean()我如何在此数据帧的末尾添加两列(平均列和该小时内发生的测量计数)。
查看完整描述

2 回答

?
达令说

TA贡献1821条经验 获得超6个赞

这是许多可能的解决方案之一。你已经完成了一部分。


df["hour"] = df.index.hour

df["date"] = df.index.date


dfMeans = df.groupby(["date", "hour"])[["Sol_Data", "Irr_Unc_perc", "ISF_stable", "KP_sensor", "Tamb"]].mean()

dfMeans.reset_index(inplace=True)


dfHours = pd.DataFrame(df.groupby(["date", "hour"])["hour"].count())

dfHours.columns = ["count"]

dfHours.reset_index(inplace=True)


dfFinal = pd.merge(dfHours, dfMeans, how="left", on=["date","hour"])


查看完整回答
反对 回复 2021-09-11
  • 2 回答
  • 0 关注
  • 198 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号