已解决430363个问题，去搜搜看，总会有你想问的

我如何计算重复的 pandas 数据框

首页猿问我如何计算重复的 pandas 数据框

我如何计算重复的 pandas 数据框

Python

慕田峪9158850 2023-04-25 16:52:01

我的初始数据框是： Name Info1 Info20 Name1 Name1-Info1 Name1-Info21 Name1 Name1-Info1 Name1-Info22 Name1 Name1-Info1 Name1-Info23 Name2 Name2-Info1 Name2-Info24 Name2 Name2-Info1 Name2-Info2我想这样返回每一行的重复次数： Name Info1 Info2 Count0 Name1 Name1-Info1 Name1-Info2 31 Name2 Name2-Info1 Name2-Info2 2我如何计算重复的 pandas 数据框？

查看完整描述

4 回答

隔江千里

TA贡献1906条经验获得超10个赞

df.groupby(['Name', 'Info1', 'Info2']).size().reset_index().rename(columns={0:"count"})

反对回复 2023-04-25

墨色风雨

TA贡献1853条经验获得超6个赞

给定你的例子df：

Name Info1 Info2

0 Name1 Name1-Info1 Name1-Info2

1 Name1 Name1-Info1 Name1-Info2

2 Name1 Name1-Info1 Name1-Info2

3 Name2 Name1-Info2 Name1-Info2

4 Name2 Name1-Info2 Name1-Info2

下列：

df.pivot_table(index=list(df), aggfunc='size')

将返回您所追求的：

Name Info1 Info2

Name1 Name1-Info1 Name1-Info2 3

Name2 Name1-Info2 Name1-Info2 2

反对回复 2023-04-25

眼眸繁星

TA贡献1873条经验获得超9个赞

添加列'count'并执行df.groupby

df['count'] = 1

df.groupby(['Name', 'Info1', 'Info2'])['count'].sum().reset_index()

反对回复 2023-04-25

一只甜甜圈

TA贡献1836条经验获得超5个赞

size = df.groupby('Name').size().tolist()

df = df.groupby('Name').tail(1).reset_index()

df['Count'] = size

反对回复 2023-04-25

4 回答
0 关注
259 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

我如何计算重复的 pandas 数据框

我如何计算重复的 pandas 数据框

4 回答

添加回答