我有一些令人费解的操作,试图使用以下一般形式在数据集上有效完成:id,date,ind_1,ind_2,ind_3,ind_41,2014-01-01,ind_1,NaN,NaN,NaN2,2014-01-02,ind_1,NaN,ind_3,NaN3,2014-01-03,ind_1,ind_2,ind_3,NaN我试图弄清楚如何创建一个新列“ ind_all”,该列将填充任何非空“ ind”列。这很简单。我可以使用.idxmax()。但是,棘手的部分是我每行可以有多个“ ind”。这意味着当有重复项时,我需要创建一个新记录。上面的示例最终应该看起来像这样:id,date,ind_1,ind_2,ind_3,ind_4,ind_all1,2014-01-01,ind_1,NaN,NaN,NaN,ind_12,2014-01-02,ind_1,NaN,ind_3,NaN,ind_12,2014-01-02,ind_1,NaN,ind_3,NaN,ind_33,2014-01-03,ind_1,ind_2,ind_3,NaN,ind_13,2014-01-03,ind_1,ind_2,ind_3,NaN,ind_23,2014-01-03,ind_1,ind_2,ind_3,NaN,ind_3一如既往的技巧或窍门,一如既往地受到赞赏!
添加回答
举报
0/150
提交
取消