如何处理 Python Numpy 中的精度问题？

Python

森栏 2023-12-29 17:08:05

有一个功能：def get_acc(real_dpt, real_avg, pre_dpt, pre_avg, axis): delta_Rf = pre_dpt/pre_avg delta_Rf_avg = pre_avg delta_Ro = real_dpt / real_avg delta_Ro_avg = real_avg pre = delta_Rf - delta_Rf_avg obs = delta_Ro - delta_Ro_avg d1 = np.sum(pre*obs, axis=axis) d2 = (np.sum(pre**2, axis=axis)*np.sum(obs**2, axis=axis))**0.5 return d1/d2前：obs_DPT, obs_AVG, cwrf_DPT, cwrf_AVG ，The same ndarray shape is passed in，Shape = (29, 1452, 5)， dtype = np.float32我有result1 = get_acc(obs_DPT, obs_AVG, cwrf_DPT, cwrf_AVG, axis=1)# result1.shape = (29, 5) array没有问题然后，我得到了result2 = get_acc(obs_DPT[i, :, 2:3], obs_AVG[i, :, 2:3], cwrf_DPT[i, :, 2:3], cwrf_AVG[i, :, 2:3], axis=0) # i is 0, 1, 2, 3,...,28# result2.shape=(1,)现在，我使 result3 = result1[i, 2:3]result3 = result1[i, 2:3] # result3.shape=(1,)然后我做出判断if result2[0] == result3[0] : print("i={}, resul2={}, resul3={}".format(i, resul2[0], resu3[0]))对于 28 i，只有以下是相等的i=4, resul2=0.9601920247077942, resul3=0.9601920247077942i=21, resul2=0.966850221157074, resul3=0.966850221157074i=27, resul2=0.9409129023551941, resul3=0.9409129023551941其他人不平等i=0, resul2=0.9641021490097046, resul3=0.9641022682189941i=1, resul2=0.937653124332428, resul3=0.9376530647277832i=2, resul2=0.9460444450378418, resul3=0.9460448026657104i=3, resul2=0.9394290447235107, resul3=0.9394280314445496i=5, resul2=0.9721810221672058, resul3=0.9721801280975342i=6, resul2=0.9628128409385681, resul3=0.9628139734268188i=7, resul2=0.9723774790763855, resul3=0.9723766446113586i=8, resul2=0.9653074741363525, resul3=0.9653091430664062i=9, resul2=0.9601299166679382, resul3=0.9601304531097412i=10, resul2=0.9747092127799988, resul3=0.9747100472450256i=11, resul2=0.9554705023765564, resul3=0.9554708003997803i=12, resul2=0.9655697345733643, resul3=0.9655706286430359i=13, resul2=0.9721916317939758, resul3=0.9721908569335938另外，我还有一个问题数组dtype = np.float32当我制作数组时dtype = np.float64我没有得到平等result2的result3不知道我说清楚了没有，如何解决这个问题十分感谢

查看完整描述

1 回答

守候你守候我

TA贡献1802条经验获得超10个赞

您的函数有几个步骤，可能无法立即清楚是哪个步骤导致了差异。

如果您使用完整数组和其中的一个切片并排执行函数，并在每个步骤后比较结果，您会注意到存在差异的第一步是求和。

考虑一个更简单的测试：

import numpy as np

test = np.random.rand(29, 1452, 5)

sum1 = np.sum(test[0, :, 2:3])

sum2 = np.sum(test, axis=1)[0, 2:3]

print(np.max(abs(sum1 - sum2)))

这个例子很可能已经打印出一个非零的数字。

显然，问题的核心在于求和的顺序，该顺序根据输入的形状而不同。这会导致浮点舍入误差的累积。

如需进一步阅读，请考虑 David Goldberg 的“每个计算机科学家应该了解的浮点运算知识”。

更新：在下面的注释中，该示例可以进一步简化。然而，重要的是应用的维度np.sum不是最后一个。

import numpy as np

test = np.random.rand(1452, 5)

sum1 = np.sum(test[:, 2])

sum2 = np.sum(test, axis=0)[2]

print(np.max(abs(sum1 - sum2)))

数字 1452 也没有什么神奇之处。人们经常可以观察到尺寸小得多的数组的非零差异。

反对回复 2023-12-29

热搜

最近搜索清空

如何处理 Python Numpy 中的精度问题？

如何处理 Python Numpy 中的精度问题？

1 回答

添加回答