web-dev-qa-db-ja.com

多次元配列から列をどのように抽出しますか?

Pythonで多次元配列から列を抽出する方法を知っている人はいますか?

193
jaweria
>>> import numpy as np
>>> A = np.array([[1,2,3,4],[5,6,7,8]])

>>> A
array([[1, 2, 3, 4],
    [5, 6, 7, 8]])

>>> A[:,2] # returns the third columm
array([3, 7])

メモリを割り当てるための "numpy.arange"と "reshape"も参照してください。

例:(行列(3×4)を整形して配列を割り当てる)

nrows = 3
ncols = 4
my_array = numpy.arange(nrows*ncols, dtype='double')
my_array = my_array.reshape(nrows, ncols)
179
Andre Luiz

あなたは NumPy配列 を使っているのでしょうか? Pythonには 配列 モジュールがありますが、それは多次元配列をサポートしません。通常のPythonのリストも一次元です。

しかしながら、あなたがこのような単純な二次元のリストを持っているならば:

A = [[1,2,3,4],
     [5,6,7,8]]

それからあなたはこのようなカラムを抽出することができます:

def column(matrix, i):
    return [row[i] for row in matrix]

2列目(インデックス1)を抽出します。

>>> column(A, 1)
[2, 6]

あるいは、単に:

>>> [row[1] for row in A]
[2, 6]
150
Martin Geisler

次のような配列があるなら

a = [[1, 2], [2, 3], [3, 4]]

次に、そのような最初の列を抽出します。

[row[0] for row in a]

結果は次のようになります。

[1, 2, 3]
67
Andrei Arsenin

見てみな!

a = [[1, 2], [2, 3], [3, 4]]
a2 = Zip(*a)
a2[0]

zipがうまくいくが引数として単一の配列を必要とする、* aという構文は多次元配列を単一の配列引数に展開するという点を除けば、上記と同じことです。

32
Mac D
def get_col(arr, col):
    return map(lambda x : x[col], arr)

a = [[1,2,3,4], [5,6,7,8], [9,10,11,12],[13,14,15,16]]

print get_col(a, 3)

pythonのmap関数はもうひとつの方法です。

10
Peter Paul

ちょっとしたバラエティのために、リスト内包表記ではなくmap-reduceスタイルのpythonが好きなら、itemgetter演算子も役立ちます。

# tested in 2.4
from operator import itemgetter
def column(matrix,i):
    f = itemgetter(i)
    return map(f,matrix)

M = [range(x,x+5) for x in range(10)]
assert column(M,1) == range(1,11)
8
Gregg Lind

これを使うこともできます。

values = np.array([[1,2,3],[4,5,6]])
values[...,0] # first column
#[1,4]

注:これは組み込み配列では機能せず、位置合わせもされません(例:np.array([[1,2,3]、[4,5,6,7]]))。

7
Sergey
[matrix[i][column] for i in range(len(matrix))]
7
renatov

5行4列のn X m行列(n行とm列)があるとしましょう。

matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],[17,18,19,20]]

Pythonで列を抽出するために、リスト内包表記を使うことができます。

[ [row[i] for row in matrix] for in range(4) ]

あなたの行列が持っている何列でも4を置き換えることができます。結果は

[ [1,5,9,13,17],[2,10,14,18],[3,7,11,15,19],[4,8,12,16,20] ]

6
Serge_k

下の配列のような配列から列を抽出したいと思います

import numpy as np
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])

フォーマットの3列目を取得したい場合は

D=array[[3],
[7],
[11]]

それからあなたは最初に配列を行列にする必要があります

B=np.asmatrix(A)
C=B[:,2]
D=asarray(C)

そして今、あなたはExcelでするのと同じように要素ごとの計算をすることができます。

6
>>> x = arange(20).reshape(4,5)
>>> x array([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]])

2列目が必要な場合は使用できます

>>> x[:, 1]
array([ 1,  6, 11, 16])
5
simomod

行列を使うもう一つの方法

>>> from numpy import matrix
>>> a = [ [1,2,3],[4,5,6],[7,8,9] ]
>>> matrix(a).transpose()[1].getA()[0]
array([2, 5, 8])
>>> matrix(a).transpose()[0].getA()[0]
array([1, 4, 7])
3
Shashwat

ちょっと遅れて….

パフォーマンスが重要でデータが長方形の場合は、1次元で格納して通常のスライスで列にアクセスすることもできます。 ...

A = [[1,2,3,4],[5,6,7,8]]     #< assume this 4x2-matrix
B = reduce( operator.add, A ) #< get it one-dimensional

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx::dimX]

def row1d( matrix, dimX, rowIdx ):
  return matrix[rowIdx:rowIdx+dimX] 

>>> column1d( B, 4, 1 )
[2, 6]
>>> row1d( B, 4, 1 )
[2, 3, 4, 5]

きちんとしたことはこれが本当に速いということです。 ただし、では、負のインデックスは機能しません。そのため、インデックス-1では最後の列または行にアクセスできません。

負の索引付けが必要な場合は、アクセサ関数を少し調整することができます。

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx % dimX::dimX]

def row1d( matrix, dimX, dimY, rowIdx ):
  rowIdx = (rowIdx % dimY) * dimX
  return matrix[rowIdx:rowIdx+dimX]
2
Zappotek

私は次のヒントを好む:matrix_aという名前の行列を持ち、column_numberを使う、例えば:

import numpy as np
matrix_a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
column_number=2

# you can get the row from transposed matrix - it will be a column:
col=matrix_a.transpose()[column_number]
2
Vik Ermolenko

入れ子リストの入れ替えにZip(*iterable)を使用しているにもかかわらず、入れ子リストの長さが異なる場合は、以下を使用することもできます。

map(None, *[(1,2,3,), (4,5,), (6,)])

結果は次のとおりです。

[(1, 4, 6), (2, 5, None), (3, None, None)]

したがって、最初の列は次のとおりです。

map(None, *[(1,2,3,), (4,5,), (6,)])[0]
#>(1, 4, 6)
1
Lorenz Lo Sauer

行列から新しいリストへのすべての列:

N = len(matrix) 
column_list = [ [matrix[row][column] for row in range(N)] for column in range(N) ]
0
user136036

複数の列を取得したい場合は、単にsliceを使用してください。

 a = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
    print(a[:, [1, 2]])
[[2 3]
[5 6]
[8 9]]
0
Molina12