我正在用 Python 处理一些数据,想知道是否有人可以提供帮助。我有这样的数据: count source timestamp tokens0 1 alt-right-census 2006-03-21 setting1 1 alt-right-census 2006-03-21 twttr2 1 stormfront 2006-06-24 head3 1 stormfront 2006-10-07 five我需要这样的数据:count_stormfront count_alt-right-census month token2 1 2006-01 setting或者像这样: date token alt_count storm_count4069995 2016-09 zealand 0 04069996 2016-09 zero 11 84069997 2016-09 zika 295 160我如何按年-月和枢轴汇总天数,以便 count 变成 count_source 在一个月内求和?任何帮助,将不胜感激。谢谢!
1 回答
慕容3067478
TA贡献1773条经验 获得超3个赞
df.groupby(['source', df['timestamp'].str[:7]]).size().unstack()
结果:
timestamp 2006-03 2006-06 2006-10
source
alt-right-census 2.0 NaN NaN
stormfront NaN 1.0 1.0
添加回答
举报
0/150
提交
取消