贝叶斯统计与计算

把参数也视为随机变量,由先验与数据得后验
$p(\theta\mid D)\propto p(D\mid\theta),p(\theta)$
高维后验用 MCMC(如 Metropolis–Hastings、Gibbs 抽样)或变分推断近似,是现代统计计算的主力。

时间序列与因果推断

时间序列(AR、MA、ARIMA、状态空间)建模与预测带时间相关性的数据。因果推断用反事实、随机试验与工具变量区分“相关”与“因果”——数据科学的关键难点。

高维统计与机器学习

变量数远超样本时需正则化(LASSO 的 $\ell_1$、岭回归的 $\ell_2$)以防过拟合。学习理论用偏差–方差分解与 VC 维刻画泛化能力,为机器学习提供统计保证。

例题

 线性回归的最小二乘 $\hat{\boldsymbol\beta}=(X^\top X)^{-1}X^\top\mathbf y$ 等价于高斯噪声下的极大似然估计——统计与机器学习在此相遇。

应用

推荐系统、风控、医疗诊断、A/B 实验、计量经济都依赖这些方法;贝叶斯方法处理小样本与不确定性,因果推断支撑政策评估,正则化是高维数据建模与深度学习的基石。