为了账号安全,请及时绑定邮箱和手机立即绑定

pandas,根据最近的日期选择性加入

pandas,根据最近的日期选择性加入

慕田峪7331174 2023-07-27 14:09:38
我有一个数据框 X,其中包含以下内容Index       A         B2020-09-08  0.252167  0.263719  2020-09-05  0.266898  0.2703472019-09-04  0.254873  0.273878  我有另一个数据框 Y,其中包含以下内容Index       C2021-09-08  0.252167   2015-09-05  0.266898  对于 Y 中的每一行,我希望有效地选择 X 中最近的行并将它们连接在一起。这里的“最近”是索引的函数,即:哪个日期更接近。在这种情况下,应该会返回。Index       Index2     C          A         B2021-09-08  2020-09-08 0.252167   0.252167  0.263719  2015-09-05  2019-09-04 0.266898   0.254873  0.273878 (注意:两个索引都是日期时间对象)由于2020-09-08最接近2021-09-08,2019-09-04最接近2015-09-05。我可以通过迭代 Y 的每个索引并调用来做到这一点X.index.get_loc(currentYIndex, "最近的")有没有更有效的方法来做到这一点?
查看完整描述

1 回答

?
隔江千里

TA贡献1906条经验 获得超10个赞

需要更多细节


df1['Index2']=df1['Index']

Out = pd.merge_asof(df2.sort_values('Index'), 

                    df1.sort_values('Index'), 

                    on = 'Index', 

                    direction = 'nearest', 

                    allow_exact_matches = False)

Out[33]: 

       Index         C         A         B     Index2

0 2015-09-05  0.266898  0.254873  0.273878 2019-09-04

1 2021-09-08  0.252167  0.252167  0.263719 2020-09-08


查看完整回答
反对 回复 2023-07-27
  • 1 回答
  • 0 关注
  • 77 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信