我想创建一个函数来计算两个数组电影之间的距离。这是我的数据帧:movie_title movieId Action Adventure Fantasy Sci-Fi ThrillerAvatar 1 1.0 1.0 1.0 1.0 0.0Spectre 2 1.0 1.0 0.0 0.0 1 John Carter 3 1.0 1.0 0.0 1.0 0.0然后我将电影表示为一个数组:df_array = userGenreTable.as_matrix(columns=userGenreTable.columns[2:])输出 :array([[1., 1., 1., ..., 0., 0., 0.], [1., 1., 1., ..., 0., 0., 0.], [1., 1., 0., ..., 0., 0., 0.]])我将数据集表示为字典:df_2_dict = userGenreTable_2.to_dict('records')所以我的问题是如何计算两个数组电影之间的距离?
1 回答
函数式编程
TA贡献1807条经验 获得超9个赞
要获得 中所有可能对之间的距离df_array,您需要计算一个距离矩阵。使用scipy.spatial:
from scipy.spatial import distance_matrix
# p = 2 for euclidean distances
distance_matrix(df_array, df_array, p = 2)
添加回答
举报
0/150
提交
取消