为了账号安全,请及时绑定邮箱和手机立即绑定

Python random.shuffle 不会为数据框提供精确的唯一值

Python random.shuffle 不会为数据框提供精确的唯一值

隔江千里 2021-09-01 19:24:11
我正在制作一个公司列表的虚拟数据集作为 user_id,每个公司发布的职位作为 job_id 和 c_id 作为候选人 id。我已经完成了前两个步骤,我的数据集如下所示。user_id         job_id0   HP          HP21   Microsoft   Microsoft42   Accenture   Accenture23   HP          HP04   Dell        Dell45   FIS         FIS16   HP          HP07   Microsoft   Microsoft48   Dell        Dell29   Accenture   Accenture0他们也被洗牌。现在我希望以这样的方式向该数据集添加一个随机候选 id,即不会将 c_id 重复到特定的 job_id。我的方法如下。joblist 是所有 job_id 的列表。for i in range(50):    l = list(range(0,len(df[df['job_id'] == joblist[i]])))    random.shuffle(l)    df['c_id'][df['job_id'] == joblist[i]] = l之后我将其测试为len(df['c_id'][df['job_id'] == joblist[0]])输出 = 168df['c_id'][df['job_id'] == joblist[0]].nunique()输出 = 101所有价值观都在发生同样的事情。我已经重新检查了l每一步之后的唯一性及其 168 个唯一值。我在这里做错了什么?
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 151 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信