3 回答
TA贡献1818条经验 获得超7个赞
列表理解是另一种有条件地创建另一列的方法。如果您正在使用列中的对象dtype(如您的示例中所示),则列表理解通常优于大多数其他方法。
示例列表理解:
df['color'] = ['red' if x == 'Z' else 'green' for x in df['Set']]
%timeit测试:
import pandas as pd
import numpy as np
df = pd.DataFrame({'Type':list('ABBC'), 'Set':list('ZZXY')})
%timeit df['color'] = ['red' if x == 'Z' else 'green' for x in df['Set']]
%timeit df['color'] = np.where(df['Set']=='Z', 'green', 'red')
%timeit df['color'] = df.Set.map( lambda x: 'red' if x == 'Z' else 'green')
1000 loops, best of 3: 239 µs per loop
1000 loops, best of 3: 523 µs per loop
1000 loops, best of 3: 263 µs per loop
TA贡献1868条经验 获得超4个赞
下面还有另一种方法,使用字典将新值映射到列表中的键上,从而剥去这只猫的皮:
def map_values(row, values_dict):
return values_dict[row]
values_dict = {'A': 1, 'B': 2, 'C': 3, 'D': 4}
df = pd.DataFrame({'INDICATOR': ['A', 'B', 'C', 'D'], 'VALUE': [10, 9, 8, 7]})
df['NEW_VALUE'] = df['INDICATOR'].apply(map_values, args = (values_dict,))
它是什么样子的:
df
Out[2]:
INDICATOR VALUE NEW_VALUE
0 A 10 1
1 B 9 2
2 C 8 3
3 D 7 4
当您有许多方法时,这种方法可能非常强大。ifelse-要进行的类型声明(即许多要替换的唯一值)。
当然,你也可以这样做:
df['NEW_VALUE'] = df['INDICATOR'].map(values_dict)
但是这种方法的速度是apply从上面靠近,在我的机器上。
您也可以这样做,使用dict.get:
df['NEW_VALUE'] = [values_dict.get(v, None) for v in df['INDICATOR']]
添加回答
举报