返回题库

线性回归:OLS 系数与方差、R2R^2、调整 $R^2

Linear Regression: Coefficients, Variance, LASSO, Ridge

专题
Statistics / 统计
难度
L4

题目详情

解释 OLS 系数、它们的方差、R2R^2、调整 R2R^2,并比较 LASSO 与 Ridge。

Explain OLS coefficients, their variance, R2R^2, adjusted R2R^2, and compare LASSO vs Ridge.

解析

OLS 系数:在线性模型 y=Xβ+εy=X\beta+\varepsilon(含截距可把 1 列并入 XX)下,最小二乘解为

β^=(XTX)1XTy,\hat\beta=(X^TX)^{-1}X^Ty,

前提是 XTXX^TX 可逆。

系数方差:若误差满足 E[εX]=0\mathbb{E}[\varepsilon\mid X]=0Var(εX)=σ2I\mathrm{Var}(\varepsilon\mid X)=\sigma^2 I(同方差、独立),则

Var(β^X)=σ2(XTX)1.\mathrm{Var}(\hat\beta\mid X)=\sigma^2 (X^TX)^{-1}.

实际中用残差方差估计 σ2\sigma^2,并由对角元得到每个系数的标准误。

R2R^2:衡量拟合优度

R2=1SSESST=SSRSST,R^2=1-\frac{\mathrm{SSE}}{\mathrm{SST}}=\frac{\mathrm{SSR}}{\mathrm{SST}},

其中 SSE 为残差平方和,SST 为总平方和。加入自变量不会降低 R2R^2

调整 R2R^2:惩罚加入过多自变量

Rˉ2=1SSE/(np)SST/(n1),\bar R^2 = 1-\frac{\mathrm{SSE}/(n-p)}{\mathrm{SST}/(n-1)},

其中 nn 为样本数,pp 为参数个数(含截距)。

Ridge vs LASSO

  • Ridge(L2): minβyXβ22+λβ22\min_\beta \|y-X\beta\|_2^2+\lambda\|\beta\|_2^2 使系数连续收缩、降低方差,但通常不会把系数压到严格 0。

  • LASSO(L1): minβyXβ22+λβ1\min_\beta \|y-X\beta\|_2^2+\lambda\|\beta\|_1 倾向于产生稀疏解(部分系数被压到 0),可做变量选择。

两者都是通过引入偏差换取方差下降(bias-variance tradeoff),λ\lambda 越大收缩越强。