为了账号安全,请及时绑定邮箱和手机立即绑定

为什么 reindex_like(s, method='ffill') 不同于

为什么 reindex_like(s, method='ffill') 不同于

慕少森 2022-12-20 16:27:21
我正在尝试使用另一个系列的索引重新索引一个系列并填充缺失值。pandas版本 1.0.3的演示:>>> import pandas as pd>>> s1 = pd.Series(['[0, 1)', '[1, 3)', '[3, 4)', '[4, 6)', '[6, inf)'], index=[0, 1, 3, 4, 6], dtype='string')>>> s2 = pd.Series(['']*8, index=[6, 2, 5, 0, 4, 7, 1, 3], dtype='string')>>>>>> s10      [0, 1)1      [1, 3)3      [3, 4)4      [4, 6)6    [6, inf)dtype: string>>> s26    2    5    0    4    7    1    3    dtype: string>>> s1.reindex_like(s2).fillna(method='ffill')6    [6, inf)2    [6, inf)5    [6, inf)0      [0, 1)4      [4, 6)7      [4, 6)1      [1, 3)3      [3, 4)dtype: string>>> s1.reindex_like(s2, method='ffill')6    [6, inf)2      [1, 3)5      [4, 6)0      [0, 1)4      [4, 6)7    [6, inf)1      [1, 3)3      [3, 4)dtype: string我期望这两种方法的结果相同,为什么它们的行为不同?
查看完整描述

1 回答

?
30秒到达战场

TA贡献1828条经验 获得超6个赞

第一个选项 ( s1.reindex_like(s2).fillna(method='ffill')) 首先进行重新索引,留下空 ( NaN) 值,然后填充它们。


reindex_like回报 [1] :


s1.reindex_like(s2)

6    [6,inf)

2        NaN

5        NaN

0      [0,1)

4      [4,6)

7        NaN

1      [1,3)

3      [3,4)

dtype: object

现在,您看到fillna(method='ffill')它按系列的顺序向前填充,因为它在此处排序(即它沿着未排序的索引“向前”)。


相反,第二个选项 ( s1.reindex_like(s2, method='ffill')) 在排序的索引中进行前向填充。

您可以通过将此结果(在对其索引进行排序之后)与首先对 s2 的索引进行排序的结果进行比较来验证此声明:


s_when_sort_s2_before = s1.reindex_like(s2.sort_index()).fillna(method='ffill')

s_sorted_after = s1.reindex_like(s2, method='ffill').sort_index()

pd.testing.assert_series_equal(s_when_sort_s2_before, s_sorted_after)

这个断言什么都不做(即不引发AssertionError),因为两者确实相等。


[1] 你可以通过我dtype: object知道我和你不是同一个 pandas 版本,但我可以重现这个问题,所以我认为这个解决方案是可行的——在你这边验证一下。


查看完整回答
反对 回复 2022-12-20
  • 1 回答
  • 0 关注
  • 80 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信