我正在尝试计算两个 256*256 图像标签之间的归一化互信息,并将其展平为一个数组。在 sklearn 的文档中,很明显函数 normalized_mutual_info_score 应该只输出 0 到 1 之间的值。但是我意识到当比较包含大量元素的列表时,有时它会给我负值或大于 1 的值。是上溢/下溢问题吗?(我意识到,如果我将 average_method 更改为“算术”、“最小”或“最大”,我会得到一个更现实的答案,但不确定哪一个最适合我的情况。)使用 sklearn 0.20.0,我将提供一个合成示例来重现该问题:metrics.normalized_mutual_info_score([0]*100001, [0]*100000 + [1])metrics.normalized_mutual_info_score([0]*110001, [0]*110000 + [1])我希望下面的答案是 0,但我分别得到了 7.999 和 -7.999。
1 回答

江户川乱折腾
TA贡献1851条经验 获得超5个赞
正如您所提到的,设置 average_method 会给出合理的值。
normalized_mutual_info_score([0]*100001, [0]*100000 + [1],average_method='arithmetic')
#3.166757680223739e-14
我建议使用 ,arithmetic因为它将成为下一个版本 0.22 中的默认值,参考。
添加回答
举报
0/150
提交
取消