在移动窗口numpy数组上有效地应用函数

问题描述:

我有大约100,000个二维数组,我需要应用本地过滤器。两个尺寸的尺寸都是一样的,而且窗口已经超过了2×2的尺寸,并进一步移动了2个,这样每个元素都会在窗口中显示一次。输出是一个相同大小的二进制二维数组,我的过滤器也是一个二进制2×2块。我的过滤器的0部分将映射到0,我的过滤器部分是1全部映射到1,如果它们具有相同的值,并且映射到0,如果它们不完全相同。这里有一个例子:在移动窗口numpy数组上有效地应用函数

Filter: 0 1  Array to filter: 1 2 3 2 Output: 0 1 0 0 
     1 0      2 3 3 3    1 0 0 0 

我当然可以使用双for循环做然而,这是非常低效的,并必须有一个更好的办法。我读到这个:Vectorized moving window on 2D array in numpy但是我不确定我会如何将它应用于我的案例。

您可以拆分每个2x2子阵列,然后重新塑形,使每个加窗块成为2D阵列中的一行。 从每一行中,使用boolean indexing提取出对应于f==1职位的元素。 然后,看看是否所有提取的元素沿着每一行是相同的,给我们一个面具。重塑后,使用此掩码与f乘以最终的二进制输出。

因此,假设f作为滤波器阵列和A作为数据阵列,量化执行遵循这样的步骤是这样的 -

# Setup size parameters 
M = A.shape[0] 
Mh = M/2 
N = A.shape[1]/2 

# Reshape input array to 4D such that the last two axes represent the 
# windowed block at each iteration of the intended operation  
A4D = A.reshape(-1,2,N,2).swapaxes(1,2) 

# Determine the binary array whether all elements mapped against 1 
# in the filter array are the same elements or not 
S = (np.diff(A4D.reshape(-1,4)[:,f.ravel()==1],1)==0).all(1) 

# Finally multiply the binary array with f to get desired binary output 
out = (S.reshape(Mh,N)[:,None,:,None]*f[:,None,:]).reshape(M,-1) 

样品运行 -

1)输入:

In [58]: A 
Out[58]: 
array([[1, 1, 1, 1, 2, 1], 
     [1, 1, 3, 1, 2, 2], 
     [1, 3, 3, 3, 2, 3], 
     [3, 3, 3, 3, 3, 1]]) 

In [59]: f 
Out[59]: 
array([[0, 1], 
     [1, 1]]) 

2)中间体输出:

In [60]: A4D 
Out[60]: 
array([[[[1, 1], 
     [1, 1]], 

     [[1, 1], 
     [3, 1]], 

     [[2, 1], 
     [2, 2]]], 


     [[[1, 3], 
     [3, 3]], 

     [[3, 3], 
     [3, 3]], 

     [[2, 3], 
     [3, 1]]]]) 

In [61]: S 
Out[61]: array([ True, False, False, True, True, False], dtype=bool) 

3)最终输出:

In [62]: out 
Out[62]: 
array([[0, 1, 0, 0, 0, 0], 
     [1, 1, 0, 0, 0, 0], 
     [0, 1, 0, 1, 0, 0], 
     [1, 1, 1, 1, 0, 0]]) 
+0

相同的方法可以用做'np.kron(〜np.any(np.diff(A4D [...,F == 1]), -1),f)';-) – 2016-05-30 09:22:31

+0

@morningsun啊是在最后一步乘法的'kron'!谢谢! – Divakar