为了账号安全,请及时绑定邮箱和手机立即绑定

使用数据框中的现有列分配列值的问题

使用数据框中的现有列分配列值的问题

SMILET 2021-10-12 15:03:06
我正在尝试在数据框中创建一个新列,该列根据另一列中的值分配值。我使用的代码分配了值,但不是我想要的。我不确定我错过了什么。代码示例如下:#define track stylesshort = [4,6,8,9,11,20,24,28,30,33,35]inter = [2,3,7,12,13,17,19,25,27,32,34,36]long = [5,14,15,21,23,26]plate = [1,10,18,31]road = [16,22,29]#input driver and stat info    driver1 = input('Choose driver: ')#read driver data to dataframedf = pd.read_csv(driver1 + '_2018.csv')#add track typedf['Type'] = ''for i in range(len(df)):    if df['Race'][i] in short:        df['Type'][i] = 'short'    elif df['Race'][i] in inter:        df['Type'] = 'intermediate'    elif df['Race'][i] in long:        df['Type'] = 'long'    elif df['Race'][i] in plate:        df['Type'] = 'plate'    else:        df['Type'] = 'road'print(df.head())我得到以下输出:C:\EclipseWorkspace\csse120\Personal\NASCAR_Projects\Other\driver_review.py:45: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrameSee the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy  df['Type'][i] = 'short'   Race  Start  Mid Race      ...       Total Laps  DRIVER RATING          Type0     1      5        23      ...              207          105.2  intermediate1     2     16         7      ...              325           94.2  intermediate2     3     10         2      ...              267          106.1  intermediate3     4      5        11      ...              311           80.0  intermediate4     5      6         3      ...              200          113.0  intermediate[5 rows x 20 columns]请注意,“类型”列返回所有“中间”,而它应该包括 ['plate', 'intermediate', 'intermediate', 'short', 'long']。
查看完整描述

1 回答

?
qq_笑_17

TA贡献1818条经验 获得超7个赞

使用map和dictionary- 首先通过键中的新名称和值中的列表创建字典,然后在字典理解中相互交换到平面字典:


d = {'short':short, 

     'intermediate':inter,

     'long':long,

     'plate':plate,

     'road':road}


d1 = {k: oldk for oldk, oldv in d.items() for k in oldv}

df['Type'] = df['Race'].map(d1)

print (df)

   Race  Start  Mid Race  Total Laps  DRIVER RATING          Type

0     1      5        23         207          105.2         plate

1     2     16         7         325           94.2  intermediate

2     3     10         2         267          106.1  intermediate

3     4      5        11         311           80.0         short

4     5      6         3         200          113.0          long

如果想要将前 4 个类别中不匹配的所有值设置为从第一个字典中road删除road并添加fillna所有不匹配的值:


d = {'short':short, 

     'intermediate':inter,

     'long':long,

     'plate':plate}


d1 = {k: oldk for oldk, oldv in d.items() for k in oldv}

df['Type'] = df['Race'].map(d1).fillna('road')

详情:


print (d1)


{

    4: 'short', 6: 'short',

    8: 'short', 9: 'short',

    11: 'short',    20: 'short',

    24: 'short',    28: 'short',

    30: 'short',    33: 'short',

    35: 'short',    2: 'intermediate',

    3: 'intermediate',  7: 'intermediate',

    12: 'intermediate', 13: 'intermediate',

    17: 'intermediate', 19: 'intermediate',

    25: 'intermediate', 27: 'intermediate',

    32: 'intermediate', 34: 'intermediate',

    36: 'intermediate', 5: 'long',

    14: 'long', 15: 'long',

    21: 'long', 23: 'long',

    26: 'long', 1: 'plate',

    10: 'plate',    18: 'plate',

    31: 'plate',    16: 'road',

    22: 'road', 29: 'road'

}


查看完整回答
反对 回复 2021-10-12
  • 1 回答
  • 0 关注
  • 145 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号