为了账号安全,请及时绑定邮箱和手机立即绑定

Seaborn distplot中的y轴是什么?

Seaborn distplot中的y轴是什么?

慕沐林林 2021-05-09 16:47:23
我有一些几何分布的数据。当我想看看它时,我使用sns.distplot(data, kde=False, norm_hist=True, bins=100)结果是图片:但是,垃圾箱高度的总和不等于1,这意味着y轴没有显示概率,这是有所不同的。如果相反,我们使用weights = np.ones_like(np.array(data))/float(len(np.array(data))) plt.hist(data, weights=weights, bins = 100)y轴应显示概率,因为箱柜高度之和为1:在这里可以更清楚地看到:假设我们有一个列表l = [1, 3, 2, 1, 3]我们有两个1,两个3和一个2,因此它们各自的概率分别为2 / 5、2 / 5和1/5。当我们使用带有3个垃圾箱的seaborn histplot时:sns.distplot(l, kde=False, norm_hist=True, bins=3)我们得到:如您所见,第1个和第3个bin的总和为0.6 + 0.6 = 1.2,该数字已经大于1,因此y轴不是概率。当我们使用weights = np.ones_like(np.array(l))/float(len(np.array(l)))plt.hist(l, weights=weights, bins = 3)我们得到:y轴是概率,如预期的那样为0.4 + 0.4 + 0.2 = 1。在这两种情况下,每种情况下使用的两种方法的bin数量都是相同的:100个bin用于几何分布的数据,3个bin用于具有3个可能值的小数组l。因此,垃圾箱数量不是问题。我的问题是:在以norm_hist = True调用的seadist distplot中,y轴的含义是什么?
查看完整描述

2 回答

?
素胚勾勒不出你

TA贡献1827条经验 获得超9个赞

文档中

norm_hist:布尔值,可选

如果为True,则直方图高度显示的是密度而不是计数。如果绘制了KDE或拟合密度,则暗含此信息。

因此,您还需要考虑箱体宽度,即计算曲线下方的面积,而不仅仅是箱体高度的总和。


查看完整回答
反对 回复 2021-05-18
  • 2 回答
  • 0 关注
  • 655 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号