为了账号安全,请及时绑定邮箱和手机立即绑定

带有两个数组的 Python 条形图

带有两个数组的 Python 条形图

aluckdog 2023-01-04 16:06:54
我有两个 numpy 数组X和GX(分别为 float 和 int),我想对X数组进行 bin(以及相应GX的值来保存频率)并绘制一个直方图,x 轴上有 bin,y 轴上有频率。我也尝试过使用 pandas'qcut和cutmatplotlib's histogram。它们似乎都不起作用。我从头开始用 numpy 创建了 bin 和频率,但我所能得到的只是一个散点图。bins   = np.linspace(min(X), max(X),100)freq   = []countl = 0for i in range(len(bins)-1):    count = 0    for j in range(len(X)):        if bins[i]<X[j]<bins[i+1]:            count += np.sum(GX[np.where(X==X[j])])    freq.append(count)for j in X:    if bins[-2]<j<bins[-1]:        countl += np.sum(GX[np.where(X==j)])freq.append(countl)plt.figure(figsize=(7,7))plt.scatter(bins,freq,c='b')而不是散点图,我怎样才能得到条形图或直方图(可能是一种更好的 bin 值方法)?
查看完整描述

1 回答

?
慕丝7291255

TA贡献1859条经验 获得超6个赞

使用给定的代码,因为您已经计算了每个箱子,所以直方图只是这些箱子的条形图:

plt.bar(bins, freq, width=bins[1]-bins[0], color='crimson', ec='black')

请注意,该测试bins[i] < X[j] < bins[i+1]会遗漏完全等于 bin 边界的 X 值。在大多数情况下,这种平等是不太可能的,除了 X 的最小值和最大值。因此,bins[i] <= X[j] < bins[i+1]会更安全。此外,为了适应最后一个值,您可以仅使用一个 epsilon 来扩展 bin:例如bins = np.linspace(min(X), max(X)+0.000001, 100)(取决于 X 的大小,确保 epsilon 非常小,但在smaller than测试中不会被忽略)。

或者,如果 GX 的总和不会太大而不会导致内存问题,您可以只使用np.repeat重复X数组GX作为重复因子。然后,matplotlib 可以按照通常的方式计算直方图:

all_X = np.repeat(X, GX)
plt.hist(all_X, bins=100, color='crimson', ec='black')


查看完整回答
反对 回复 2023-01-04
  • 1 回答
  • 0 关注
  • 97 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信