GridSearchCVオブジェクトでTimeSeriesSplitを使用してscikit-learnでモデルを調整するにはどうすればよいですか？

Question

TimeSeriesSplitのsklearnドキュメントとクロス検証のドキュメントを検索しましたが、実際の例を見つけることができませんでした。

Sklearnバージョン0.19を使用しています。

これは私のセットアップです

_import xgboost as xgb from sklearn.model_selection import TimeSeriesSplit from sklearn.grid_search import GridSearchCV import numpy as np X = np.array([[4, 5, 6, 1, 0, 2], [3.1, 3.5, 1.0, 2.1, 8.3, 1.1]]).T y = np.array([1, 6, 7, 1, 2, 3]) tscv = TimeSeriesSplit(n_splits=2) for train, test in tscv.split(X): print(train, test) _

与える：

_[0 1] [2 3] [0 1 2 3] [4 5] _

私が試した場合：

_model = xgb.XGBRegressor() param_search = {'max_depth' : [3, 5]} my_cv = TimeSeriesSplit(n_splits=2).split(X) gsearch = GridSearchCV(estimator=model, cv=my_cv, param_grid=param_search) gsearch.fit(X, y) _

それは与える：TypeError: object of type 'generator' has no len()

問題が発生しました：GridSearchCVがlen(cv)を呼び出そうとしていますが、_my_cv_は長さのない反復子です。ただし、 GridSearchCVのドキュメントを使用できる状態

int、相互検証ジェネレーター、または反復可能なオプション

.split(X)なしでTimeSeriesSplitを使用しようとしましたが、それでも動作しませんでした。

私は単純なものを見落としていると確信しています、ありがとう!!

cd98 · Accepted Answer

問題は、sklearn.grid_searchからGridSearchCVを使用していましたが、これは非推奨です。 sklearn.model_selectionからGridSearchCVをインポートすると、問題が解決しました。

import xgboost as xgb from sklearn.model_selection import TimeSeriesSplit, GridSearchCV import numpy as np X = np.array([[4, 5, 6, 1, 0, 2], [3.1, 3.5, 1.0, 2.1, 8.3, 1.1]]).T y = np.array([1, 6, 7, 1, 2, 3]) model = xgb.XGBRegressor() param_search = {'max_depth' : [3, 5]} tscv = TimeSeriesSplit(n_splits=2) gsearch = GridSearchCV(estimator=model, cv=tscv, param_grid=param_search) gsearch.fit(X, y)

与える：

GridSearchCV(cv=<generator object TimeSeriesSplit.split at 0x11ab4abf8>, error_score='raise', estimator=XGBRegressor(base_score=0.5, colsample_bylevel=1, colsample_bytree=1, gamma=0, learning_rate=0.1, max_delta_step=0, max_depth=3, min_child_weight=1, missing=None, n_estimators=100, nthread=-1, objective='reg:linear', reg_alpha=0, reg_lambda=1, scale_pos_weight=1, seed=0, silent=True, subsample=1), fit_params=None, iid=True, n_jobs=1, param_grid={'max_depth': [3, 5]}, pre_dispatch='2*n_jobs', refit=True, return_train_score=True, scoring=None, verbose=0)