对于数据框,我用一系列值替换了列中的一组项目,如下所示:df['borough_num'] = df['Borough'].replace(regex=['MANHATTAN', 'BROOKLYN', 'QUEENS', 'STATEN ISLAND','BRONX'], value=[1, 2, 3, 4,5])我想用值 0 替换 'Borough' 中所有其余元素的问题,我也需要使用正则表达式,因为有些看起来像数据,例如。07 BRONX,我也需要把它换成 5 而不是 0
2 回答
肥皂起泡泡
TA贡献1829条经验 获得超6个赞
或者更短,使用map
:
df['borough_num']=df['Borough'].map(dict(zip(['MANHATTAN', 'BROOKLYN', 'QUEENS', 'STATEN ISLAND','BRONX'],[1, 2, 3, 4,5])))
现在:
print(df)
正如预期的那样。
更新:
df['borough_num']=df['Borough'].str.replace('\d+','').map(dict(zip(['MANHATTAN', 'BROOKLYN', 'QUEENS', 'STATEN ISLAND','BRONX'],[1, 2, 3, 4,5])))
添加回答
举报
0/150
提交
取消