3 回答

TA贡献2080条经验 获得超4个赞
我经常使用的一个技巧是生成一个随机数组,并argsort用于获取唯一索引作为所需的唯一数字。因此,我们可以-
def random_choice_noreplace(m,n, axis=-1):
# m, n are the number of rows, cols of output
return np.random.rand(m,n).argsort(axis=axis)
样品运行-
In [98]: random_choice_noreplace(3,7)
Out[98]:
array([[0, 4, 3, 2, 6, 5, 1],
[5, 1, 4, 6, 0, 2, 3],
[6, 1, 0, 4, 5, 3, 2]])
In [99]: random_choice_noreplace(5,7, axis=0) # unique nums along cols
Out[99]:
array([[0, 2, 4, 4, 1, 0, 2],
[1, 4, 3, 2, 4, 1, 3],
[3, 1, 1, 3, 2, 3, 0],
[2, 3, 0, 0, 0, 2, 4],
[4, 0, 2, 1, 3, 4, 1]])
运行时测试-
# Original approach
def loopy_app(m,n):
a = (np.random.choice(n,size=n,replace=False) for _ in range(m))
return np.vstack(a)
时间-
In [108]: %timeit loopy_app(1000,100)
10 loops, best of 3: 20.6 ms per loop
In [109]: %timeit random_choice_noreplace(1000,100)
100 loops, best of 3: 3.66 ms per loop

TA贡献1891条经验 获得超3个赞
如果我x
不更换就进行采样,那意味着我所取的样本量为<len(x)
,否则该样本将始终相同x
,除了顺序。所以,如果我想随机抽样y
的元素x
,此方法将确保我可以只从第一个绘制y
的价值x
..
添加回答
举报