我想知道如何定义一个可以包含其他词的新词。例如:Word Frequency0 game 520551 laura 249532 luke 211333 story 207394 dog 1705435 cat 4244我想“创建”一个新词 ,pet其中包括dog和cat以及它们相应的频率。像这样的东西:Word Frequency0 game 520551 Laura 249534 pet 212982 luke 211333 story 20739我正在考虑使用字典来做到这一点:thisdict = { "dog": "pet", "cat": "pet"}但我不确定如何应用它以及这是否可以让我保留它们的值(总共 21298)
1 回答
缥缈止盈
TA贡献2041条经验 获得超4个赞
replace先做然后做groupby
df.Word.replace(thisdict,inplace=True)
df
Out[104]:
Word Frequency
0 game 52055
1 laura 24953
2 luke 21133
3 story 20739
4 pet 17054
35 pet 4244
df = df.groupby(['Word'], as_index=False).sum()
df
Out[106]:
Word Frequency
0 game 52055
1 laura 24953
2 luke 21133
3 pet 21298
4 story 20739
添加回答
举报
0/150
提交
取消