为了账号安全,请及时绑定邮箱和手机立即绑定

熊猫系列/数据栏的条件创建

熊猫系列/数据栏的条件创建

函数式编程 2019-06-10 20:51:24
熊猫系列/数据栏的条件创建我有一份数据,大致如下:    Type       Set1    A          Z2    B          Z           3    B          X4    C          Y我希望向dataframe(或生成一个序列)中添加另一列,其长度与dataframe(=相等的记录/行数)相同,如果设置为‘Z’,则设置颜色为绿色;如果设置为“否则”,则设置‘red’。做这件事最好的方法是什么?
查看完整描述

3 回答

?
qq_笑_17

TA贡献1818条经验 获得超7个赞

列表理解是另一种有条件地创建另一列的方法。如果您正在使用列中的对象dtype(如您的示例中所示),则列表理解通常优于大多数其他方法。


示例列表理解:


df['color'] = ['red' if x == 'Z' else 'green' for x in df['Set']]

%timeit测试:


import pandas as pd

import numpy as np


df = pd.DataFrame({'Type':list('ABBC'), 'Set':list('ZZXY')})

%timeit df['color'] = ['red' if x == 'Z' else 'green' for x in df['Set']]

%timeit df['color'] = np.where(df['Set']=='Z', 'green', 'red')

%timeit df['color'] = df.Set.map( lambda x: 'red' if x == 'Z' else 'green')


1000 loops, best of 3: 239 µs per loop

1000 loops, best of 3: 523 µs per loop

1000 loops, best of 3: 263 µs per loop


查看完整回答
反对 回复 2019-06-10
?
MYYA

TA贡献1868条经验 获得超4个赞


下面还有另一种方法,使用字典将新值映射到列表中的键上,从而剥去这只猫的皮:


def map_values(row, values_dict):

    return values_dict[row]


values_dict = {'A': 1, 'B': 2, 'C': 3, 'D': 4}


df = pd.DataFrame({'INDICATOR': ['A', 'B', 'C', 'D'], 'VALUE': [10, 9, 8, 7]})


df['NEW_VALUE'] = df['INDICATOR'].apply(map_values, args = (values_dict,))

它是什么样子的:


df

Out[2]: 

  INDICATOR  VALUE  NEW_VALUE

0         A     10          1

1         B      9          2

2         C      8          3

3         D      7          4

当您有许多方法时,这种方法可能非常强大。ifelse-要进行的类型声明(即许多要替换的唯一值)。


当然,你也可以这样做:


df['NEW_VALUE'] = df['INDICATOR'].map(values_dict)

但是这种方法的速度是apply从上面靠近,在我的机器上。


您也可以这样做,使用dict.get:


df['NEW_VALUE'] = [values_dict.get(v, None) for v in df['INDICATOR']]


查看完整回答
反对 回复 2019-06-10
  • 3 回答
  • 0 关注
  • 471 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信