我有一个如下所示的数据样本(真实数据集有更多列):data = {'stringID':['AB CD Efdadasfd','RFDS EDSfdsadf dsa','FDSADFDSADFFDSA'],'IDct':[1,2,3]}
data = pd.DataFrame(data)
data['Index1'] = [[3],[7,9],[5,6,8]]
data['Index2'] = [[4],[10,13],[8,9,10]]仅当 IDct 数字大于 1 时,我才想获取 Index1 和 Index2 列(列表)中的第二个元素(因为 IDct 数字表示列表中有多少个元素)。我正在尝试以下答案,但都出现“列表索引超出范围”的错误data['pos'] = np.where(data['IDct']>1, data.Index1.map(lambda x: x[1]),0)
data['pos1']= np.where(data['IDct']>1, data.Index2.map(lambda x: x[1]),0)或者data['pos'] = np.where(data['IDct']>1, [x[1] for x in data['Index1']],0)
data['pos1']= np.where(data['IDct']>1, [x[1] for x in data['Index2']],0)我应该采取什么不同的做法?谢谢!
1 回答
Smart猫小萌
TA贡献1911条经验 获得超7个赞
您可以尝试使用 loc 来分配列。
data.loc[data['IDct'] > 1, 'pos'] = data.loc[data['IDct'] > 1]['Index1'].apply(lambda x: x[1]) data.loc[data['IDct'] > 1, 'pos1'] = data.loc[data['IDct'] > 1]['Index2'].apply(lambda x: x[1])
添加回答
举报
0/150
提交
取消