我有一个数据框 X,其中包含以下内容Index A B2020-09-08 0.252167 0.263719 2020-09-05 0.266898 0.2703472019-09-04 0.254873 0.273878 我有另一个数据框 Y,其中包含以下内容Index C2021-09-08 0.252167 2015-09-05 0.266898 对于 Y 中的每一行,我希望有效地选择 X 中最近的行并将它们连接在一起。这里的“最近”是索引的函数,即:哪个日期更接近。在这种情况下,应该会返回。Index Index2 C A B2021-09-08 2020-09-08 0.252167 0.252167 0.263719 2015-09-05 2019-09-04 0.266898 0.254873 0.273878 (注意:两个索引都是日期时间对象)由于2020-09-08最接近2021-09-08,2019-09-04最接近2015-09-05。我可以通过迭代 Y 的每个索引并调用来做到这一点X.index.get_loc(currentYIndex, "最近的")有没有更有效的方法来做到这一点?
1 回答
隔江千里
TA贡献1906条经验 获得超10个赞
需要更多细节
df1['Index2']=df1['Index']
Out = pd.merge_asof(df2.sort_values('Index'),
df1.sort_values('Index'),
on = 'Index',
direction = 'nearest',
allow_exact_matches = False)
Out[33]:
Index C A B Index2
0 2015-09-05 0.266898 0.254873 0.273878 2019-09-04
1 2021-09-08 0.252167 0.252167 0.263719 2020-09-08
添加回答
举报
0/150
提交
取消