web-dev-qa-db-ja.com

2D numpy配列のサブセット化

ここでドキュメントやその他の質問を調べましたが、numpy配列のサブセット化のコツはまだ得られていないようです。

Numpy配列があり、引数のために、次のように定義します。

import numpy as np
a = np.arange(100)
a.shape = (10,10)
# array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
#        [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
#        [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
#        [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
#        [40, 41, 42, 43, 44, 45, 46, 47, 48, 49],
#        [50, 51, 52, 53, 54, 55, 56, 57, 58, 59],
#        [60, 61, 62, 63, 64, 65, 66, 67, 68, 69],
#        [70, 71, 72, 73, 74, 75, 76, 77, 78, 79],
#        [80, 81, 82, 83, 84, 85, 86, 87, 88, 89],
#        [90, 91, 92, 93, 94, 95, 96, 97, 98, 99]])

ここで、ベクトルn1およびn2で指定されるaの行と列を選択します。例として:

n1 = range(5)
n2 = range(5)

しかし、私が使用する場合:

b = a[n1,n2]
# array([ 0, 11, 22, 33, 44])

次に、5x5ブロック全体ではなく、最初の5番目の対角要素のみが選択されます。私が見つけた解決策は次のようにすることです:

b = a[n1,:]
b = b[:,n2]
# array([[ 0,  1,  2,  3,  4],
#        [10, 11, 12, 13, 14],
#        [20, 21, 22, 23, 24],
#        [30, 31, 32, 33, 34],
#        [40, 41, 42, 43, 44]])

しかし、この単純なタスクをたった1つのコマンドで実行する方法があるはずです。

23
CrossEntropy

あなたはあなたが望むことをする方法のほんの一握りのニースを得ました。ただし、何が起こっているのか、なぜ物事が機能するのかを理解することも役立ちます。将来的に役立ついくつかの簡単なルールがあります。

「派手な」インデックス作成(つまり、リスト/シーケンスを使用)と「通常の」インデックス作成(スライスを使用)には大きな違いがあります。根本的な理由は、配列を「定期的にストライド」できるかどうか、したがってコピーを作成する必要があるかどうかに関係しています。したがって、コピーを作成せずに「ビュー」を作成できるようにするには、任意のシーケンスを異なる方法で処理する必要があります。

あなたの場合:

import numpy as np

a = np.arange(100).reshape(10,10)
n1, n2 = np.arange(5), np.arange(5)

# Not what you want
b = a[n1, n2]  # array([ 0, 11, 22, 33, 44])

# What you want, but only for simple sequences
# Note that no copy of *a* is made!! This is a view.
b = a[:5, :5]

# What you want, but probably confusing at first. (Also, makes a copy.)
# np.meshgrid and np.ix_ are basically equivalent to this.
b = a[n1[:,None], n2[None,:]]

1Dシーケンスを使用した派手なインデックス付けは、基本的にそれらを一緒に圧縮して結果をインデックス付けすることと同等です。

print "Fancy Indexing:"
print a[n1, n2]

print "Manual indexing:"
for i, j in Zip(n1, n2):
    print a[i, j]

ただし、インデックスを作成するシーケンスが、インデックスを作成する配列の次元(この場合は2D)と一致する場合、インデックスの処理は異なります。 「2つを一緒に圧縮する」代わりに、numpyはインデックスをマスクのように使用します。

つまり、a[[[1, 2, 3]], [[1],[2],[3]]]は、a[[1, 2, 3], [1, 2, 3]]とはまったく異なる方法で処理されます。これは、渡すシーケンス/配列が2次元であるためです。

In [4]: a[[[1, 2, 3]], [[1],[2],[3]]]
Out[4]:
array([[11, 21, 31],
       [12, 22, 32],
       [13, 23, 33]])

In [5]: a[[1, 2, 3], [1, 2, 3]]
Out[5]: array([11, 22, 33])

もう少し正確に言うと、

a[[[1, 2, 3]], [[1],[2],[3]]]

次のように処理されます。

i = [[1, 1, 1],
     [2, 2, 2],
     [3, 3, 3]])
j = [[1, 2, 3],
     [1, 2, 3],
     [1, 2, 3]]
a[i, j]

言い換えれば、入力が行/列ベクトルであるかどうかは、インデックス作成でインデックスがどのように繰り返されるべきかを示す省略形です。


np.meshgridおよびnp.ix_は、インデックス付けのために1Dシーケンスを2Dバージョンに変換する便利な方法です。

In [6]: np.ix_([1, 2, 3], [1, 2, 3])
Out[6]:
(array([[1],
       [2],
       [3]]), array([[1, 2, 3]]))

同様に(sparse引数は上記のix_と同一になります):

In [7]: np.meshgrid([1, 2, 3], [1, 2, 3], indexing='ij')
Out[7]:
[array([[1, 1, 1],
       [2, 2, 2],
       [3, 3, 3]]),
 array([[1, 2, 3],
       [1, 2, 3],
       [1, 2, 3]])]
22
Joe Kington

目的のインデックスを作成する別の簡単な方法は、 np.ix_ 関数:

>>> a[np.ix_(n1, n2)]
array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

これは、インデックスのシーケンスからオープンメッシュを構築する便利な方法を提供します。

9
Alex Riley

np.meshgridを使用して、n1n2配列に適切な形状を与え、目的のインデックス作成を実行できます。

In [104]: a[np.meshgrid(n1,n2, sparse=True, indexing='ij')]
Out[104]: 
array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

または、meshgridなし:

In [117]: a[np.array(n1)[:,np.newaxis], np.array(n2)[np.newaxis,:]]
Out[117]: 
array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

この integer array indexing がドキュメントでどのように機能するかを説明した同様の例があります。

クックブックのレシピも参照してください 行と列の選択

6
unutbu

あなたの特定の質問のユースケースは画像操作を扱うようです。サンプルを使用して画像から生じるnumpy配列を編集する範囲で、Python Imaging Library(PIL)を使用できます。

# Import Pillow:
from PIL import Image

# Load the original image:
img = Image.open("flowers.jpg")

# Crop the image
img2 = img.crop((0, 0, 5, 5))

Img2オブジェクトは、結果のトリミングされた画像のnumpy配列です。

ここで Pillowパッケージ (PILパッケージの使いやすいフォーク)を使用して、画像操作の詳細を確認できます。

0
mkultra