2 回答
TA贡献1856条经验 获得超5个赞
你可以使用np.where然后groupby
df['Buy'] = np.where((df['Digit'] == 'F'), df['Term'], np.nan)
df['Sell'] = np.where((df['Digit'] == 'T'), df['Term'], np.nan)
df['BuyAmt'] = np.where((df['Digit'] == 'F'), df['Amt'], np.nan)
df['SellAmt'] = np.where((df['Digit'] == 'T'), df['Amt'], np.nan)
df.drop(['Digit','Base','Term','Amt'], axis=1, inplace= True)
df = df.groupby('ID').first()
print(df)
Name Date Buy Sell BuyAmt SellAmt
ID
A BROD 2/3/2010 USD JPY 100.0 9082.0
B SSBD 3/4/2007 EUR JPY 60.0 7387.8
此外,如果您需要像您发布的那样按顺序排列您的专栏,您可以使用 pandas reindex
TA贡献1821条经验 获得超6个赞
我认为应该删除重复项,否则您需要更好地解释如何处理相同的行:
>>> df2 = df.drop_duplicates().reset_index(drop=True)
然后我们创建两个数据框,一个用于“F”,一个用于“T”,为每个创建Buy/Sell和Buy Amt/ Sell Amt,并删除未使用的列:
>>> df_F = df2[df2.Digit == 'F'].assign(**{'Buy': lambda x: x.Term, 'Buy Amt': lambda x: x.Amt})
... .drop(['Digit', 'Base', 'Term', 'Amt'], axis=1)
>>> df_T = df2[df2.Digit == 'T'].assign(**{'Sell': lambda x: x.Term, 'Sell Amt': lambda x: x.Amt})
... .drop(['Digit', 'Base', 'Term', 'Amt'], axis=1)
最后,我们合并两个数据框,并重新排列列顺序:
>>> merged = df_F.merge(df_T, on=['ID', 'Name', 'Date'])
>>> merged[['ID', 'Date', 'Name', 'Buy', 'Sell', 'Buy Amt', 'Sell Amt']]
ID Date Name Buy Sell Buy Amt Sell Amt
0 A 2/3/2010 BROD USD JPY 100.0 9082.0
1 B 3/4/2007 SSBD EUR JPY 60.0 7387.8
就是这样。如果“ID”应该是索引,则可以使用merged.set_index('ID')
添加回答
举报