如果我写这段代码:train['id_03'].value_counts(dropna=False, normalize =True).head()我正进入(状态NaN 0.8876892335828220.0 0.1082111287973721.0 0.0014613743353543.0 0.0011311680834492.0 0.000712906831036Name: id_03, dtype: float64如果我改变了 dropna =True我明白了0.0 0.9634971.0 0.0130123.0 0.0100722.0 0.0063485.0 0.001643Name: id_03, dtype: float64
2 回答
米琪卡哇伊
TA贡献1998条经验 获得超6个赞
我认为关键是您指定normalize =True
它是:"If True then the object returned will contain the relative frequencies of the unique values."
根据文档。
在您删除 Na 之前,Na 的计数用于计算相对频率,在您删除它们之后,相对频率的分母发生了变化,因此值发生了变化
神不在的星期二
TA贡献1963条经验 获得超6个赞
您正在对结果进行规范化。的值NaN
相对于其他值似乎非常大。因此,其他索引导致的数字非常小
如果您查看索引 1 和 2 之间的相对比率,您会发现它们在两个结果中是等效的。
添加回答
举报
0/150
提交
取消