matlabの正規化されたロジスティック回帰コード

Question

私は正規化されたLRで手を試していますが、matlabの次の式で簡単です。

コスト関数：

J(theta) = 1/m*sum((-y_i)*log(h(x_i)-(1-y_i)*log(1-h(x_i))))+(lambda/2*m)*sum(theta_j)

グラデーション：

∂J(theta)/∂theta_0 = [(1/m)*(sum((h(x_i)-y_i)*x_j)] if j=0 ∂j(theta)/∂theta_n = [(1/m)*(sum((h(x_i)-y_i)*x_j)]+(lambda/m)*(theta_j) if j>1

これはMATLABコードではなく、単なる公式です。

これまで私はこれを行いました：

function [J, grad] = costFunctionReg(theta, X, y, lambda) J = 0; grad = zeros(size(theta)); temp_theta = []; %cost function %get the regularization term for jj = 2:length(theta) temp_theta(jj) = theta(jj)^2; end theta_reg = lambda/(2*m)*sum(temp_theta); temp_sum =[]; %for the sum in the cost function for ii =1:m temp_sum(ii) = -y(ii)*log(sigmoid(theta'*X(ii,:)'))-(1-y(ii))*log(1-sigmoid(theta'*X(ii,:)')); end tempo = sum(temp_sum); J = (1/m)*tempo+theta_reg; %regulatization %theta 0 reg_theta0 = 0; for jj=1:m reg_theta0(jj) = (sigmoid(theta'*X(m,:)') -y(jj))*X(jj,1) end reg_theta0 = (1/m)*sum(reg_theta0) grad_temp(1) = reg_theta0 %for the rest of thetas reg_theta = []; thetas_sum = 0; for ii=2:size(theta) for kk =1:m reg_theta(kk) = (sigmoid(theta'*X(m,:)') - y(kk))*X(kk,ii) end thetas_sum(ii) = (1/m)*sum(reg_theta)+(lambda/m)*theta(ii) reg_theta = [] end for i=1:size(theta) if i == 1 grad(i) = grad_temp(i) else grad(i) = thetas_sum(i) end end end

そして、コスト関数は正しい結果を与えていますが、勾配（1ステップ）が正しくない理由がわかりません。コストは正しいJ = 0.6931を与え、勾配grad = 0.3603 -0.1476 0.0320は正しくありません、コストは始まりますパラメータtheta（1）を正則化する必要がないため、2から。コードに問題があると思いますが、4日経っても表示されません。ありがとうございます。

Pedro.Alonso · Accepted Answer

ついにそれを手に入れました。4回目のように書き直した後、これは正しいコードです。

function [J, grad] = costFunctionReg(theta, X, y, lambda) J = 0; grad = zeros(size(theta)); temp_theta = []; for jj = 2:length(theta) temp_theta(jj) = theta(jj)^2; end theta_reg = lambda/(2*m)*sum(temp_theta); temp_sum =[]; for ii =1:m temp_sum(ii) = -y(ii)*log(sigmoid(theta'*X(ii,:)'))-(1-y(ii))*log(1-sigmoid(theta'*X(ii,:)')); end tempo = sum(temp_sum); J = (1/m)*tempo+theta_reg; %regulatization %theta 0 reg_theta0 = 0; for i=1:m reg_theta0(i) = ((sigmoid(theta'*X(i,:)'))-y(i))*X(i,1) end theta_temp(1) = (1/m)*sum(reg_theta0) grad(1) = theta_temp sum_thetas = [] thetas_sum = [] for j = 2:size(theta) for i = 1:m sum_thetas(i) = ((sigmoid(theta'*X(i,:)'))-y(i))*X(i,j) end thetas_sum(j) = (1/m)*sum(sum_thetas)+((lambda/m)*theta(j)) sum_thetas = [] end for z=2:size(theta) grad(z) = thetas_sum(z) end % ============================================================= end

それが誰かを助けるか、誰かが私がそれをより良くする方法についてコメントを持っているなら。 :)

Franck Dernoncourt · Answer

ベクトル化：

function [J, grad] = costFunctionReg(theta, X, y, lambda) hx = sigmoid(X * theta); m = length(X); J = (sum(-y' * log(hx) - (1 - y')*log(1 - hx)) / m) + lambda * sum(theta(2:end).^2) / (2*m); grad =((hx - y)' * X / m)' + lambda .* theta .* [0; ones(length(theta)-1, 1)] ./ m ; end

Fernando Cardenas · Answer

より多くの変数を使用したので、通常の式から何が得られ、「追加された正則化コスト」から何が得られるかが明確にわかりました。さらに、Matlab/Octaveではループの代わりに「ベクトル化」を使用することをお勧めします。これを行うことにより、より最適化されたソリューションを保証します。

 function [J, grad] = costFunctionReg(theta, X, y, lambda) %Hypotheses hx = sigmoid(X * theta); %%The cost without regularization J_partial = (-y' * log(hx) - (1 - y)' * log(1 - hx)) ./ m; %%Regularization Cost Added J_regularization = (lambda/(2*m)) * sum(theta(2:end).^2); %%Cost when we add regularization J = J_partial + J_regularization; %Grad without regularization grad_partial = (1/m) * (X' * (hx -y)); %%Grad Cost Added grad_regularization = (lambda/m) .* theta(2:end); grad_regularization = [0; grad_regularization]; grad = grad_partial + grad_regularization;

Rick · Answer

これがループを排除する答えです

m = length(y); % number of training examples predictions = sigmoid(X*theta); reg_term = (lambda/(2*m)) * sum(theta(2:end).^2); calcErrors = -y.*log(predictions) - (1 -y).*log(1-predictions); J = (1/m)*sum(calcErrors)+reg_term; % prepend a 0 column to our reg_term matrix so we can use simple matrix addition reg_term = [0 (lambda*theta(2:end)/m)']; grad = sum(X.*(predictions - y)) / m + reg_term;