我正在尝试使用值在数据框中创建一个新列:data = [4.91,4.93,5.02,4.93,4.82,4.57,4.49,4.57,4.54,4.52,4.56,4.73]我在数据框中有超过 50,000 行,我希望将这些值随机分配给新列。所以想法是这些值将被随机分配并在列中重复。我正在考虑使用具有这种逻辑的 lambda 函数:df.assign(value=lambda x: #function here)任何人都可以建议任何其他方式或更简单的方式吗?我无法理解随机分配值的功能的逻辑。谢谢
1 回答
红糖糍粑
TA贡献1815条经验 获得超6个赞
numpy.random.choice与长度一起使用DataFrame:
import numpy as np
df = pd.DataFrame({
'A':[7,8,9,4,2,3],
})
data = [4.91,4.93,5.02,4.93,4.82,4.57,4.49,4.57,4.54,4.52,4.56,4.73]
df = df.assign(value=np.random.choice(data, len(df)))
print (df)
A value
0 7 4.93
1 8 4.91
2 9 4.54
3 4 4.49
4 2 4.56
5 3 4.82
添加回答
举报
0/150
提交
取消