例如,如果我有一个 1D array[91, 119, 161, 203, 259]和一个 2D array [[90,120,160,200,260], [95,115,165,204,255]],我如何确定后者的哪一行更适合前者?在这种情况下,它将是第一行,因为大多数数字仅相差 1,而在第二行中,大多数数字相差 4。此外,向量与第一行之间的 RMSE 为 1.612,而对于第二行它是 3.606。
1 回答
尚方宝剑之说
TA贡献1788条经验 获得超4个赞
距离度量有很多,但余弦是衡量向量相似性的一个很好的方法。您可以用来scipy.spatial.distance.cosine求余弦距离。您需要具有最小余弦距离的向量。
在代码中:
import numpy as np
from scipy.spatial.distance import cosine
v = np.array([91, 119, 161, 203, 259])
matrix = np.array([[90,120,160,200,260], [95,115,165,204,255]])
assert np.argmin([cosine(v, row) for row in matrix]) == 0
添加回答
举报
0/150
提交
取消