概率与随机变量

在样本空间上,概率满足非负、归一与可列可加三公理。条件概率贝叶斯公式
$P(B_i\mid A)=\frac{P(B_i)P(A\mid B_i)}{\sum_j P(B_j)P(A\mid B_j)}$
随机变量有分布、期望 $E(X)$ 与方差 $D(X)$。常见分布:二项、泊松、正态、指数。

极限定理

大数定律:样本均值依概率收敛到期望——这是“频率稳定于概率”的理论依据。中心极限定理 (CLT):大量独立随机变量之和近似正态分布,故正态分布无处不在。

统计推断

由样本推断总体:点估计(矩估计、极大似然 MLE)、区间估计(置信区间)、假设检验($t$ 检验、$\chi^2$ 检验,控制显著性水平 $\alpha$),以及方差分析回归分析

例题

例 1 正态总体均值的 $95%$ 置信区间 $\bar x\pm 1.96,\dfrac{\sigma}{\sqrt n}$。

例 2 抛硬币 $n$ 次正面比例,由 CLT 知其近似 $N!\big(p,,\tfrac{p(1-p)}{n}\big)$。

应用

A/B 测试用假设检验判断改版是否显著更优;质量抽检用区间估计控制不良率;保险与金融用分布给风险定价;机器学习的最大似然最小二乘都源自统计推断。