为了账号安全,请及时绑定邮箱和手机立即绑定

在 tsv 文件中将索引值修改为随机 ['0', '1']

在 tsv 文件中将索引值修改为随机 ['0', '1']

梦里花落0921 2023-03-01 15:21:05
我有一个 tsv 文件,其中包含 100k 条记录,这些记录具有顺序索引值,index col1 col20     nnn  yyy 1     nnn  yyy2     nnn  yyy3     nnn  yyy4     nnn  yyy5     nnn  yyy.....99999 nnn  yyy我需要将索引值修改为随机 ['0', '1'] 之类的,index col1 col20     nnn  yyy 1     nnn  yyy1     nnn  yyy0     nnn  yyy1     nnn  yyy0     nnn  yyy...........1     nnn  yyy
查看完整描述

1 回答

?
LEATH

TA贡献1936条经验 获得超6个赞

DataFrame.set_index搭配使用numpy.random.choice:


df = df.set_index(np.random.choice([0, 1], size=len(df)))

或具有分配索引的类似解决方案:


df.index = np.random.choice([0, 1], size=len(df))

print (df)

  col1 col2

1  nnn  yyy

0  nnn  yyy

1  nnn  yyy

1  nnn  yyy

0  nnn  yyy

0  nnn  yyy

1  nnn  yyy


查看完整回答
反对 回复 2023-03-01
  • 1 回答
  • 0 关注
  • 96 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信