为了账号安全,请及时绑定邮箱和手机立即绑定

如何处理 Python Numpy 中的精度问题?

如何处理 Python Numpy 中的精度问题?

森栏 2023-12-29 17:08:05
有一个功能:def get_acc(real_dpt, real_avg, pre_dpt, pre_avg, axis):    delta_Rf = pre_dpt/pre_avg    delta_Rf_avg = pre_avg    delta_Ro = real_dpt / real_avg    delta_Ro_avg = real_avg    pre = delta_Rf - delta_Rf_avg    obs = delta_Ro - delta_Ro_avg    d1 = np.sum(pre*obs, axis=axis)    d2 = (np.sum(pre**2, axis=axis)*np.sum(obs**2, axis=axis))**0.5    return d1/d2前:obs_DPT, obs_AVG, cwrf_DPT, cwrf_AVG ,The same ndarray shape is passed in,Shape = (29, 1452, 5), dtype = np.float32我有result1 = get_acc(obs_DPT, obs_AVG, cwrf_DPT, cwrf_AVG, axis=1)# result1.shape = (29, 5)  array没有问题然后,我得到了result2 = get_acc(obs_DPT[i, :, 2:3], obs_AVG[i, :, 2:3], cwrf_DPT[i, :, 2:3], cwrf_AVG[i, :, 2:3], axis=0) # i is    0, 1, 2, 3,...,28# result2.shape=(1,)现在,我使 result3 = result1[i, 2:3]result3 = result1[i, 2:3]   # result3.shape=(1,)然后我做出判断if result2[0] == result3[0] :       print("i={}, resul2={}, resul3={}".format(i, resul2[0],  resu3[0]))对于 28 i,只有以下是相等的i=4, resul2=0.9601920247077942, resul3=0.9601920247077942i=21, resul2=0.966850221157074, resul3=0.966850221157074i=27, resul2=0.9409129023551941, resul3=0.9409129023551941其他人不平等i=0, resul2=0.9641021490097046, resul3=0.9641022682189941i=1, resul2=0.937653124332428, resul3=0.9376530647277832i=2, resul2=0.9460444450378418, resul3=0.9460448026657104i=3, resul2=0.9394290447235107, resul3=0.9394280314445496i=5, resul2=0.9721810221672058, resul3=0.9721801280975342i=6, resul2=0.9628128409385681, resul3=0.9628139734268188i=7, resul2=0.9723774790763855, resul3=0.9723766446113586i=8, resul2=0.9653074741363525, resul3=0.9653091430664062i=9, resul2=0.9601299166679382, resul3=0.9601304531097412i=10, resul2=0.9747092127799988, resul3=0.9747100472450256i=11, resul2=0.9554705023765564, resul3=0.9554708003997803i=12, resul2=0.9655697345733643, resul3=0.9655706286430359i=13, resul2=0.9721916317939758, resul3=0.9721908569335938另外,我还有一个问题数组dtype = np.float32当我制作数组时dtype = np.float64我没有得到平等result2的result3不知道我说清楚了没有,如何解决这个问题十分感谢
查看完整描述

1 回答

?
守候你守候我

TA贡献1802条经验 获得超10个赞

您的函数有几个步骤,可能无法立即清楚是哪个步骤导致了差异。


如果您使用完整数组和其中的一个切片并排执行函数,并在每个步骤后比较结果,您会注意到存在差异的第一步是求和。


考虑一个更简单的测试:


import numpy as np


test = np.random.rand(29, 1452, 5)

sum1 = np.sum(test[0, :, 2:3])

sum2 = np.sum(test, axis=1)[0, 2:3]

print(np.max(abs(sum1 - sum2)))


这个例子很可能已经打印出一个非零的数字。


显然,问题的核心在于求和的顺序,该顺序根据输入的形状而不同。这会导致浮点舍入误差的累积。


如需进一步阅读,请考虑 David Goldberg 的“每个计算机科学家应该了解的浮点运算知识”。


更新:在下面的注释中,该示例可以进一步简化。然而,重要的是应用的维度np.sum不是最后一个。


import numpy as np


test = np.random.rand(1452, 5)

sum1 = np.sum(test[:, 2])

sum2 = np.sum(test, axis=0)[2]

print(np.max(abs(sum1 - sum2)))

数字 1452 也没有什么神奇之处。人们经常可以观察到尺寸小得多的数组的非零差异。


查看完整回答
反对 回复 2023-12-29
  • 1 回答
  • 0 关注
  • 119 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信