为了账号安全,请及时绑定邮箱和手机立即绑定

熊猫多索引切片无需排序

熊猫多索引切片无需排序

繁星coding 2022-09-06 17:22:17
给定具有多索引列的数据帧import pandas as pdfish = [("Fish", lli) for lli in ["One", "Two"]]dogs = [("Dog", lli) for lli in ["Three", "Four", "Five"]]cats = [("Cat", lli) for lli in ["Three", "Four", "Five"]]df = pd.DataFrame(index=["Blue", "Green", "Red"], columns=pd.MultiIndex.from_tuples(fish+dogs+cats))-df =          Fish       Dog              Cat                    One  Two   Three Four Five  Three Four Five   Blue   NaN  NaN   NaN   NaN  NaN   NaN   NaN  NaN   Green  NaN  NaN   NaN   NaN  NaN   NaN   NaN  NaN   Red    NaN  NaN   NaN   NaN  NaN   NaN   NaN  NaN现在我想同时设置两列的值,例如df.loc[:, ('Dog', ['Four', 'Five'])] = 3.1这导致了一个KeyError说KeyError: 'MultiIndex Slicing requires the index to be fully lexsorted tuple len (2), lexsort depth (0)'该问题可以通过在设置值之前对列进行排序来“解决”df = df.sort_index(axis=1)现在的问题是我不想对列进行排序,因为它们已经以反映所需输出的方式排序。有没有办法在不先排序的情况下设置多个列的值?
查看完整描述

1 回答

?
呼唤远方

TA贡献1856条经验 获得超11个赞

它在上一个版本的熊猫中工作得很好。

如果无法升级,可以升级pandas,可以通过Index.get_level_valuesIndex.isin创建的掩码选择级别,并设置如下值:

m1 = df.columns.get_level_values(0) == 'Dog'

m2 = df.columns.get_level_values(1).isin(['Four','Five'])


df.loc[:, m1 & m2] = 3.1

print (df)

      Fish        Dog             Cat          

       One  Two Three Four Five Three Four Five

Blue   NaN  NaN   NaN  3.1  3.1   NaN  NaN  NaN

Green  NaN  NaN   NaN  3.1  3.1   NaN  NaN  NaN

Red    NaN  NaN   NaN  3.1  3.1   NaN  NaN  NaN


查看完整回答
反对 回复 2022-09-06
  • 1 回答
  • 0 关注
  • 89 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信