从数据到规律

当机理未知、却有大量观测时,用数据驱动建模:找一条曲线「最贴近」数据点。最常用的是最小二乘——最小化残差平方和:
$\min_{,a,b}\ \sum_i\big(y_i-(ax_i+b)\big)^2$

回归与插值的区别

  • 回归:数据有噪声,求趋势(不必过点),可线性 / 多项式 / 非线性;
  • 插值:数据精确,曲线必过每个点(Lagrange、三次样条)。
    高次多项式插值易振荡(龙格现象),样条更稳。

拟合优度与过拟合

决定系数 $R^2$ 衡量拟合好坏(越接近 1 越好);但盲目提高次数会过拟合——拟合了噪声、预测变差。建模要在「拟合」与「泛化」间权衡。

例题

 四点近似落在一条直线上,用最小二乘解出斜率与截距,得经验公式 $y=ax+b$,即可内插预测。

应用

回归用于经验公式、传感器标定、趋势预测、经济计量;插值/样条用于工程曲线、动画、数据补全。数据拟合是连接「实验数据」与「可用模型」的桥梁。