機械学習 – 機械学習の基礎 – 教師あり学習アルゴリズム

【ロジスティック回帰分析 (Logistic regression)】
多変量解析の一種。
ある現象\(X\)の発生確率\(p(X)\)を、ロジスティック関数で回帰した分析法です。
ロジスティック関数は
\( y= \frac{1}{1+\displaystyle \exp(-r)} = \frac{1}{1+\displaystyle \exp[-(b_1x_1+b_2x_2+…+b_ix_i+b_0)]} \)
のような形をしています。シグモイド関数とも呼ばれます。0-1の値を取る、単調増加関数です。
目的関数\(y\)は今回は確率なので発生確率\(p(X)\)で表します。
これを変形して、
\( p(X) = \frac{1}{1+\displaystyle \exp[-(b_1x_1+b_2x_2+…+b_ix_i+b_0)]} \)

\( 1-p(X) = \frac{\displaystyle \exp[-(b_1x_1+b_2x_2+…+b_ix_i+b_0)]}{1+\displaystyle \exp[-(b_1x_1+b_2x_2+…+b_ix_i+b_0)]} \)

\( \frac{p}{1-p(X)} = \displaystyle \exp(b_1x_1+b_2x_2+…+b_ix_i+b_0) \)

\( \displaystyle \ln \frac{p}{1-p(X)} = b_1x_1+b_2x_2+…+b_ix_i+b_0 \)

となります。bは偏回帰係数、xは説明変数と呼ばれます。

説明変数を用いて最小二乗法でbを決めると、発生確率をモデル化する事ができるようになります。

ロジスティック関数は目的変数が2値である、二値判別問題に用いられます。