为了账号安全,请及时绑定邮箱和手机立即绑定

Pandas 系列 value_counts 对不同计数的工作方式不同

Pandas 系列 value_counts 对不同计数的工作方式不同

大话西游666 2021-08-17 15:48:48
例如:df1 = pd.DataFrame(np.repeat(np.arange(1,7),3), columns=['A'])df1.A.value_counts(sort=False)1    32    33    34    35    36    3Name: A, dtype: int64df2 = pd.DataFrame(np.repeat(np.arange(1,7),100), columns=['A'])df2.A.value_counts(sort=False)1    1002    1003    1004    1005    1006    100Name: A, dtype: int64在上面的例子中,value_counts工作完美并给出了所需的结果。而在处理更大的数据帧时,它会给出不同的输出。这里的A值已经排序并且计数也相同,但是索引的顺序A在value_counts. 为什么它对小计数正确但对大计数不正确:df3 = pd.DataFrame(np.repeat(np.arange(1,7),1000), columns=['A'])df3.A.value_counts(sort=False)4    10001    10005    10002    10006    10003    1000Name: A, dtype: int64在这里我可以做df3.A.value_counts(sort=False).sort_index()或df3.A.value_counts(sort=False).reindex(df.A.unique())。我想知道为什么它对不同的计数表现不同?使用:Numpy version :1.15.2Pandas version :0.23.4
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 196 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号