SE-ML03-线性模型
线性可分性
任意两个向量,分别属于两个类别。这两个向量和某个确定的权重向量的线性组合得到的标量值,如果一定落在某个标量值的两侧,那么这两个类别是线性可分的。
感知机
经典的二分类、线性、判别模型。
$$ f(x)=sign(\textbf{w}^T\textbf{x}+b) $$
$\textbf{w}$ 是平面的法向量,$b$ 是到原点位移。用这个超平面来判别。
线性回归
一元线性回归
高中数学知识
最小化均方误差。进行一堆最小二乘估计,得到最优解:
$$ w=\frac{\sum_{i=1}^{m}y_i(x_i-\bar{x})}{\sum_{i=1}^{m}x^2_i-\frac{1}{m}(\sum_{i=1}^mx_i)^2} \quad\quad b=\frac{1}{m}\sum_{i=1}^m(y_i-wx_i) $$
多元线性回归
$$ f(x)=\textbf{w}^T\textbf{x}+b \quad 使得\quad f(\textbf{x}_i\simeq y_i) $$
求解思想是类似的,但是涉及矩阵求逆。
广义线性模型
给线性组合加上一个单调可微的联系函数,这个联系函数可以是非线性的。
$$ y=g^{-1}(\textbf{w}^t\textbf{x}+b) $$
二分类任务
使用特殊的联系函数,使得输出满足 $y\in{0,1}$
联系函数
单位阶跃函数
$$ y=\begin{equation}\begin{cases}0,&z<0\0.5,&z=0\1,&z>0\end{cases}\end{equation} $$
性质不好,因为不是连续函数。不可微。
对数几率函数
大名鼎鼎 Logistic function。高中生物里种群数量的 S 形曲线。
$$ y=\frac{1}{1+e^-z} $$
衍生出了 Logistic 回归。
Logistic 回归
- 无需假设数据分布
- 可以得到类别的近似概率预测
- 使用数值优化算法求最优解
- 是分类算法,而不是回归算法
以 Logistic 函数作为联系函数。
最后的 $ln\frac{y}{1-y}$ 称为“对数几率”。反映了 x 作为正例的相对可能性。
求解过程,是要最小化:
这是个高阶连续可导凸函数。可以用经典牛顿法等方法求解。
线性判别分析 LDA
将一个线性回归模型,通过联系函数,转化成分类模型。
可以看作是一种监督降维技术。上图中把一堆二维的样本投影到直线上,完成了降维。
多分类任务
思想:将多分类拆成多个二分类任务。
OvO 和 OvR
OvO:每次只选取两个类,两类之间分类 OvR:每次选取一个类作为正类,其他全部作为反类