我有一个 tsv 文件,其中包含 100k 条记录,这些记录具有顺序索引值,index col1 col20 nnn yyy 1 nnn yyy2 nnn yyy3 nnn yyy4 nnn yyy5 nnn yyy.....99999 nnn yyy我需要将索引值修改为随机 ['0', '1'] 之类的,index col1 col20 nnn yyy 1 nnn yyy1 nnn yyy0 nnn yyy1 nnn yyy0 nnn yyy...........1 nnn yyy
1 回答
LEATH
TA贡献1936条经验 获得超6个赞
DataFrame.set_index搭配使用numpy.random.choice:
df = df.set_index(np.random.choice([0, 1], size=len(df)))
或具有分配索引的类似解决方案:
df.index = np.random.choice([0, 1], size=len(df))
print (df)
col1 col2
1 nnn yyy
0 nnn yyy
1 nnn yyy
1 nnn yyy
0 nnn yyy
0 nnn yyy
1 nnn yyy
添加回答
举报
0/150
提交
取消