我有df这样的:我需要计算X1, X2, X3, X4 and X5每家公司之间的差异,但我只知道如何计算整列之间的差异。df['dX1'] = df['X1'].shift(-1) - df['X1']df['dX2'] = df['X2'].shift(-1) - df['X2']df['dX3'] = df['X3'].shift(-1) - df['X3']...这是不好的做法,因为它是从其减去X1上线74与X1上线73(这是2家不同的公司,这是没有意义的)。我的问题是,如何计算每个时期和每个公司的行值之间的差异。例如(我可以一个一个加载 csvs 并计算每个公司的差异,然后将所有合并到一个列表中,但需要 2 天,因为我有 700 个 csv 文件)。
1 回答
梵蒂冈之花
TA贡献1900条经验 获得超5个赞
我认为你需要DataFrameGroupBy.diff
:
cols = ['X1','X2','X3','X4','X5'] df1 = df.groupby('company')[cols].diff(-1)
添加回答
举报
0/150
提交
取消