为了账号安全,请及时绑定邮箱和手机立即绑定

在频率分析中定义新词

在频率分析中定义新词

holdtom 2023-08-03 17:19:52
我想知道如何定义一个可以包含其他词的新词。例如:Word    Frequency0   game    520551   laura   249532   luke    211333   story   207394   dog     1705435  cat     4244我想“创建”一个新词 ,pet其中包括dog和cat以及它们相应的频率。像这样的东西:Word    Frequency0   game    520551   Laura   249534   pet     212982   luke    211333   story   20739我正在考虑使用字典来做到这一点:thisdict = {  "dog": "pet",  "cat": "pet"}但我不确定如何应用它以及这是否可以让我保留它们的值(总共 21298)
查看完整描述

1 回答

?
缥缈止盈

TA贡献2041条经验 获得超4个赞

replace先做然后做groupby


df.Word.replace(thisdict,inplace=True)

df

Out[104]: 

     Word  Frequency

0    game      52055

1   laura      24953

2    luke      21133

3   story      20739

4     pet      17054

35    pet       4244

df = df.groupby(['Word'], as_index=False).sum()

df

Out[106]: 

    Word  Frequency

0   game      52055

1  laura      24953

2   luke      21133

3    pet      21298

4  story      20739


查看完整回答
反对 回复 2023-08-03
  • 1 回答
  • 0 关注
  • 102 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信