我有以下数据框:它包含 user_ids、推文、位置以及推文的分类为负面和正面。我想创建一个按用户 ID 分组的新数据框,因为每个用户在数据框中都有多个推文。数据框应包含以下列:用户身份该 user_id 的负面推文计数该 user_id 的正面推文计数用户的位置所需样本输出user_id positive_tweets negative_tweets Location418 1 0 CA521 1 0 CA997 0 1 LA1135 1 0 LA此代码是 BlackFox 先生针对我之前未正确询问的问题提出的。df.groupby(['user_id','classification'])['user_id'].count()但是,它与所需的输出不匹配。
1 回答
暮色呼如
TA贡献1853条经验 获得超9个赞
我希望这就是你要找的。
df.groupby(['user_id', 'Location']).apply(lambda x: pd.Series(dict(
positive_tweets=(x.classification == 'positive').sum(),
negative_tweets=(x.classification == 'negative').sum(),
)))
添加回答
举报
0/150
提交
取消