【Python】Numpy 中的 shuffle VS permutation

原文：https://blog.****.net/u010099080/article/details/73395601

有时候我们会有随机打乱一个数组的需求，例如训练时随机打乱样本，我们可以使用 numpy.random.shuffle() 或者 numpy.random.permutation() 来完成。这两者非常相似，实现的功能是一样的，那么他们到底有什么区别？

本文代码及图片可以在我的GitHub 找到。

参数区别

以下 numpy.random.shuffle() 简称 shuffle，numpy.random.permutation() 简称 permutation。

shuffle 的参数只能是 array_like，而 permutation 除了 array_like 还可以是 int 类型，如果是 int 类型，那就随机打乱 numpy.arange(int)。
shuffle 返回 None，这点尤其要注意，也就是说没有返回值，而 permutation 则返回打乱后的 array。

实现区别

permutation 其实在内部实现也是调用的 shuffle，这点从 Numpy 的源码可以看出来：

def permutation(self, object x):
    '''这里都是帮助文档，我就省略了'''
    if isinstance(x, (int, long, np.integer)):
        arr = np.arange(x)
    else:
        arr = np.array(x)
    self.shuffle(arr)
    return arr

速度区别
为了测试两者的速度区别，我分别使用了 shuffle 和 permutation 对不同长度的 array 进行随机打乱并计时。

关键代码如下:

n = 10 ** np.arange(1, 10)
shuffle_elapsed = []
permutation_elapsed = []
for i in n:
    print(i)
    start = time.time()
    a = np.arange(i)
    np.random.shuffle(a)
    end = time.time()
    shuffle_elapsed.append((i, end - start))

    start = time.time()
    b = np.random.permutation(i)
    end = time.time()
    permutation_elapsed.append((i, end - start))

结果：

【Python】Numpy 中的 shuffle VS permutation

可以看出在达到 109109 级别以前，两者速度几乎没有差别，但是在达到 109109 以后两者速度差距明显拉大，shuffle 的用时明显短于 permutation。

所以在 array 很大的时候还是使用 shuffle 速度更快些，但要注意其不返回打乱后的 array，是 inplace 修改。
---------------------
作者：secondsilverman
来源：****
原文：https://blog.****.net/u010099080/article/details/73395601
版权声明：本文为博主原创文章，转载请附上博文链接！

【Python】Numpy 中的 shuffle VS permutation

参数区别

实现区别

相关推荐