从数据到规律
当机理未知、却有大量观测时,用数据驱动建模:找一条曲线「最贴近」数据点。最常用的是最小二乘——最小化残差平方和:
$\min_{,a,b}\ \sum_i\big(y_i-(ax_i+b)\big)^2$
回归与插值的区别
- 回归:数据有噪声,求趋势(不必过点),可线性 / 多项式 / 非线性;
- 插值:数据精确,曲线必过每个点(Lagrange、三次样条)。
高次多项式插值易振荡(龙格现象),样条更稳。
拟合优度与过拟合
用决定系数 $R^2$ 衡量拟合好坏(越接近 1 越好);但盲目提高次数会过拟合——拟合了噪声、预测变差。建模要在「拟合」与「泛化」间权衡。
例题
例 四点近似落在一条直线上,用最小二乘解出斜率与截距,得经验公式 $y=ax+b$,即可内插预测。
应用
回归用于经验公式、传感器标定、趋势预测、经济计量;插值/样条用于工程曲线、动画、数据补全。数据拟合是连接「实验数据」与「可用模型」的桥梁。
评论 (0)
还没有评论,来发表第一条吧。
请先 登录 后发表评论;还没有账号?注册