Sigmod函数和GLM

Logistic Regression中为什么sigmoid函数就可以表示后验概率？这是根据服从的概率分布而得。

指数分布族

$p(y;\eta) = b(y)exp(\eta^T T(y)-a(\eta))$

给定$a, b, T$后，$p(y;\eta)$是一簇关于$\eta$的分布，$\eta$称为规范参数

普通线性模型:$y=\mathrm w^T \mathrm x$

广义线性：$f(y)=\mathrm w^T \mathrm x$,$f(y)$称为连接函数

满足以下假设：

包括高斯分布，伯努利分布等很多分布都满足指数分布族的表达。

Logistic Regression只假设$P(y| \mathrm ,\Phi)$在$\mathrm x$已知的情况下服从参数为$\Phi$的二项分布，而高斯判别假设$P(\mathrm x | y)$服从高斯分布。

若$P(\mathrm x | y)$服从高斯分布，可推出$P( y | \mathrm x)$的概率表达式是logistic函数，但反之未必，也有可能$P(\mathrm x | y)$服从泊松分布，二项分布等，所以逻辑回归有很好的鲁棒性。

$f(x) = \frac {L} {1 + e^{-k(x - x_0)}}$

标准形式：$f(x) = \frac {1} {1 + e^(x-x_0)}$,在$[-6, 6]$区间上的图像如下：

$f(x) = \frac {1} {1 + e^(x-x_0)}$

f^’(x) = f(x) (1 - f(x))

$\int f(x) = \int \frac{e^x}{1+e^x} = log(1+e^x)$