Rキャレットパッケージのロジスティック回帰調整パラメータグリッド？

Question

caret packageを使用して、ロジスティック回帰モデルをRに適合させようとしています。私は次のことをしました：

model <- train(dec_var ~., data=vars, method="glm", family="binomial", trControl = ctrl, tuneGrid=expand.grid(C=c(0.001, 0.01, 0.1, 1,10,100, 1000)))

しかし、このモデルのチューニングパラメータがどうあるべきかわからず、見つけるのに苦労しています。 Cはsklearnで使用されるパラメーターであるため、Cであると想定しました。現在、次のエラーが発生しています-

エラー：チューニングパラメータグリッドには列パラメータが必要です

これを修正する方法について何か提案はありますか？

jmuhlenkamp · Accepted Answer

MaxKuhnのWebブックによると-- ここでmethod = 'glm'を検索、glm内にチューニングパラメータcaretはありません。

いくつかの基本的なtrain呼び出しをテストすることで、これが当てはまることを簡単に確認できます。まず、Webブックごとに調整パラメーター（rpart）を持つメソッド（cp）から始めましょう。

library(caret) data(GermanCredit) # Check tuning parameter via `modelLookup` (matches up with the web book) modelLookup('rpart') # model parameter label forReg forClass probModel #1 rpart cp Complexity Parameter TRUE TRUE TRUE # Observe that the `cp` parameter is tuned set.seed(1) model_rpart <- train(Class ~., data=GermanCredit, method='rpart') model_rpart #CART #1000 samples # 61 predictor # 2 classes: 'Bad', 'Good' #No pre-processing #Resampling: Bootstrapped (25 reps) #Summary of sample sizes: 1000, 1000, 1000, 1000, 1000, 1000, ... #Resampling results across tuning parameters: # cp Accuracy Kappa # 0.01555556 0.7091276 0.2398993 # 0.03000000 0.7025574 0.1950021 # 0.04444444 0.6991700 0.1316720 #Accuracy was used to select the optimal model using the largest value. #The final value used for the model was cp = 0.01555556.

cpパラメーターが調整されていることがわかります。それでは、glmを試してみましょう。

# Check tuning parameter via `modelLookup` (shows a parameter called 'parameter') modelLookup('glm') # model parameter label forReg forClass probModel #1 glm parameter parameter TRUE TRUE TRUE # Try out the train function to see if 'parameter' gets tuned set.seed(1) model_glm <- train(Class ~., data=GermanCredit, method='glm') model_glm #Generalized Linear Model #1000 samples # 61 predictor # 2 classes: 'Bad', 'Good' #No pre-processing #Resampling: Bootstrapped (25 reps) #Summary of sample sizes: 1000, 1000, 1000, 1000, 1000, 1000, ... #Resampling results: # Accuracy Kappa # 0.7386384 0.3478527

この場合、上記のglmでは、パラメーターの調整は実行されませんでした。私の経験から、parameterという名前のparameterは単なるプレースホルダーであり、実際のチューニングパラメーターではないようです。次のコードに示されているように、強制的にparameterを調整しようとしても、基本的には1つの値しか実行しません。

set.seed(1) model_glm2 <- train(Class ~., data=GermanCredit, method='glm', tuneGrid=expand.grid(parameter=c(0.001, 0.01, 0.1, 1,10,100, 1000))) model_glm2 #Generalized Linear Model #1000 samples # 61 predictor # 2 classes: 'Bad', 'Good' #No pre-processing #Resampling: Bootstrapped (25 reps) #Summary of sample sizes: 1000, 1000, 1000, 1000, 1000, 1000, ... #Resampling results across tuning parameters: # Accuracy Kappa parameter # 0.7386384 0.3478527 0.001 # 0.7386384 0.3478527 0.001 # 0.7386384 0.3478527 0.001 # 0.7386384 0.3478527 0.001 # 0.7386384 0.3478527 0.001 # 0.7386384 0.3478527 0.001 # 0.7386384 0.3478527 0.001 #Accuracy was used to select the optimal model using the largest value. #The final value used for the model was parameter = 0.001.