已解决430363个问题，去搜搜看，总会有你想问的

如何获得每组连续X次以上相同单词的平均值？

首页猿问如何获得每组连续X次以上相同单词的...

Python

喵喵时光机 2023-07-18 15:28:42

查看完整描述

1 回答

汪汪一只猫

TA贡献1898条经验获得超8个赞

您可以4使用以下方法对连续出现的单词或连续多次进行计数Series.str.count，然后使用Series.groupby对系列cnt进行分组name并使用聚合mean来获得分组平均值。

cnt = df['sentences'].str.count(r'(\w+)(\s\1){3,}')

avg = cnt.groupby(df['name']).mean().reset_index(name='avg')

细节：

print(cnt)

0 0

1 0

2 0

3 0

4 1

5 1

6 0

Name: sentences, dtype: int64

print(avg)

name avg

0 aa 0.0

1 bb 0.0

2 cc 0.0

3 dd 1.0

4 ee 0.5

反对回复 2023-07-18

关注

0/150

提交

取消

购课补贴
联系客服咨询优惠详情

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号