web-dev-qa-db-ja.com

ValueError:不明なラベルタイプ:「不明」

次のコードを実行しようとしました。ところで、私はpythonとsklearnの両方が初めてです。

import pandas as pd
import numpy as np
from sklearn.linear_model import LogisticRegression


# data import and preparation
trainData = pd.read_csv('train.csv')
train = trainData.values
testData = pd.read_csv('test.csv')
test = testData.values
X = np.c_[train[:, 0], train[:, 2], train[:, 6:7],  train[:, 9]]
X = np.nan_to_num(X)
y = train[:, 1]
Xtest = np.c_[test[:, 0:1], test[:, 5:6],  test[:, 8]]
Xtest = np.nan_to_num(Xtest)


# model
lr = LogisticRegression()
lr.fit(X, y)

ここで、yは0と1のnp.ndarrayです

次のものを受け取ります。

ファイル「C:\ Anaconda3\lib\site-packages\sklearn\linear_model\logistic.py」、行> 1174、適合check_classification_targets(y)

ファイル "C:\ Anaconda3\lib\site-packages\sklearn\utils\multiclass.py"、172行目、check_classification_targetsでValueValue( "不明なラベルタイプ:%r"%y_type)を発生

ValueError:不明なラベルタイプ:「不明」

sklearnドキュメントから: http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression.fit

y:配列状、形状(n_samples、)ターゲット値(分類のクラスラベル、回帰の実数)

私のエラーは何ですか?

upd:

yはarray([0.0、1.0、1.0、...、0.0、1.0、0.0]、dtype = object)サイズは(891、)

27
Ivan Zhovannik

yobjectタイプであるため、sklearnはそのタイプを認識できません。 y = train[:, 1]行の直後にy=y.astype('int')行を追加します。

62
Miriam Farber