web-dev-qa-db-ja.com

パンダシリーズをnumpy配列に変換する

私はpandasとpythonが初めてです。私の入力データは

category   text
1   hello iam fine. how are you
1   iam good. how are you doing.

inputData= pd.read_csv(Input', sep='\t', names=['category','text'])
X = inputData["text"]
Y = inputData["category"]

ここでYはパンダシリーズオブジェクトで、numpy配列に変換したいです。だから私は.as_matrixを試しました

YArray= Y.as_matrix(columns=None)
print YArray

しかし、[1,1]として出力されました(列カテゴリが1つと行が2つしかないため、これは間違っています)。結果を2x1行列として欲しい。

21
vishnu

これを試して:
。as_matrixを系列オブジェクトに適用した後

Y.reshape((2,1))

.as_matrix()はnumpy-arrayではなくnumpy-arrayのみを返すため、 ここにリンク

9
chetan reddy

Numpy配列を取得するには、必要があります

Y.values
38
gzc

Dfがデータフレームの場合、データフレームの列はシリーズであり、配列に変換するには、

df = pd.DataFrame()
x = df.values
print(x.type)

次のプリント、

<class 'numpy.ndarray'>

配列に正常に変換します。

4