为了账号安全,请及时绑定邮箱和手机立即绑定

如何从熊猫的csv文件中计数和百分比

如何从熊猫的csv文件中计数和百分比

萧十郎 2021-06-06 16:06:51
我有 3gb csv 文件以及如何计算重复的 URL 和百分比是计算百分比的总和?import pandas as pddf = pd.read_csv("/Users/url_all/auguesturl.csv",names=['URL','Count'])dd = df.groupby(    df.columns.tolist(),    as_index=False).size().sort_values(ascending=False).apply(lambda r: r/r.sum(),axis=1)# percentage# ss = df.groupby('Count').size() / df.groupby('Count').size().sum()print(dd)我的输出是:setup.iclo.com:443  8354271da.ds-int.net:443   7278819我喜欢这样的输出URL                          Count      Percentagegoogleads.g.doubl.net:443   1,314,530   2.1 s.yimg.com:443              986,275     1.6 
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 177 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信