我有一些几何分布的数据。当我想看看它时,我使用sns.distplot(data, kde=False, norm_hist=True, bins=100)结果是图片:但是,垃圾箱高度的总和不等于1,这意味着y轴没有显示概率,这是有所不同的。如果相反,我们使用weights = np.ones_like(np.array(data))/float(len(np.array(data)))
plt.hist(data, weights=weights, bins = 100)y轴应显示概率,因为箱柜高度之和为1:在这里可以更清楚地看到:假设我们有一个列表l = [1, 3, 2, 1, 3]我们有两个1,两个3和一个2,因此它们各自的概率分别为2 / 5、2 / 5和1/5。当我们使用带有3个垃圾箱的seaborn histplot时:sns.distplot(l, kde=False, norm_hist=True, bins=3)我们得到:如您所见,第1个和第3个bin的总和为0.6 + 0.6 = 1.2,该数字已经大于1,因此y轴不是概率。当我们使用weights = np.ones_like(np.array(l))/float(len(np.array(l)))plt.hist(l, weights=weights, bins = 3)我们得到:y轴是概率,如预期的那样为0.4 + 0.4 + 0.2 = 1。在这两种情况下,每种情况下使用的两种方法的bin数量都是相同的:100个bin用于几何分布的数据,3个bin用于具有3个可能值的小数组l。因此,垃圾箱数量不是问题。我的问题是:在以norm_hist = True调用的seadist distplot中,y轴的含义是什么?
添加回答
举报
0/150
提交
取消