预先感谢您的帮助!(下面提供的代码)(此处的数据)我想删除 5 厘米到 225 厘米列的 5/6 标准差之外的异常值,并将它们替换为该日期(月/日)和深度的平均值。最好的方法是什么?import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings('ignore')raw_data = pd.read_csv('all-deep-soil-temperatures.csv', index_col=1, parse_dates=True)df_all_stations = raw_data.copy()df_selected_station.fillna(method = 'ffill', inplace=True);df_selected_station_D=df_selected_station.resample(rule='D').mean()df_selected_station_D['Day'] = df_selected_station_D.index.dayofyearmean=df_selected_station_D.groupby(by='Day').mean()mean['Day']=mean.indexmean.head()
1 回答
慕村225694
TA贡献1880条经验 获得超4个赞
对于更通用的解决方案,假设给您一个带有df
某些 column 的数据框a
。
from scipy import stats. df[np.abs(stats.zscore(df['a'])) > 5]['a'] = df['a'].mean()
添加回答
举报
0/150
提交
取消