3 回答
TA贡献1812条经验 获得超5个赞
你可以做一些手动:agg
(df.groupby('id', as_index=False)
.agg({'date':'max', 'name':'first',
'unitCount':'sum',
'orderCount':'sum',
'invoiceCount':'sum'})
.to_csv('file.csv')
)
TA贡献1780条经验 获得超4个赞
您可以执行以下操作
# group rows by 'id' column
df.groupby('id', as_index=False).agg({'date':'max',
'name':'first',
'unitCount':'sum',
'orderCount':'sum',
'invoiceCount':'sum'}
# change the order of the columns
df = df[['date', 'id', 'name', 'unitCount', 'orderCount' ,'invoiceCount']]
# set the new column names
df.columns=['date', 'id', 'name', 'total_unitCount', 'total_orderCount' ,'total_invoiceCount']
# save the dataframe as .csv file
df.to_csv('path/to/myfile_sum.csv')
TA贡献1829条经验 获得超4个赞
您只需要调用对象,然后相应地重命名列名,最后将生成的数据帧写入文件。sum()groupbycsv
以下操作应该可以解决问题:
df = pd.read_csv(r'path/to/myfile.csv', sep=';')
df.groupby(['id', 'name'])['unitCount', 'orderCount', 'invoiceCount'] \
.sum() \
.rename(columns={'unitCount':'total_unitCount', 'orderCount' : 'total_orderCount', 'invoiceCount': 'total_invoiceCount'}) \
.to_csv('path/to/myoutputfile_sum.csv', sep=';')
添加回答
举报