偏导数与全微分

多元函数 $z=f(x,y)$ 对某一变量求导、其余视为常数,得到偏导数 $f_x,,f_y$。当各偏导连续时,函数可微,其全微分
$dz=f_x,dx+f_y,dy$
它是函数增量 $\Delta z$ 的线性主部,用于误差估计与线性近似。

链式法则、方向导数与梯度

复合函数求导用链式法则;沿单位方向 $\mathbf u$ 的变化率是方向导数 $D_{\mathbf u}f=\nabla f\cdot\mathbf u$,其中
$\nabla f=(f_x,,f_y,,f_z)$
称为梯度。梯度指向函数增长最快的方向,模 $|\nabla f|$ 是最大变化率。

多元极值

驻点满足 $\nabla f=\mathbf 0$;用二阶偏导组成的 Hessian 矩阵判定极大/极小/鞍点。带约束 $g(x,y)=0$ 的极值用拉格朗日乘数法:令 $\nabla f=\lambda\nabla g$。

例题

例 1 $f=x^2+xy+y^2$,则 $f_x=2x+y,\ f_y=x+2y$;解 $\nabla f=\mathbf0$ 得唯一驻点 $(0,0)$,Hessian 正定,为极小值点。

例 2 求 $f=xy$ 在约束 $x+y=10$ 下的最大值:由 $\nabla f=\lambda\nabla g$ 得 $y=\lambda,\ x=\lambda$,故 $x=y=5$,最大值 $25$。

应用

梯度下降是机器学习训练的核心:沿 $-\nabla f$ 方向迭代以最小化损失函数。误差传播用全微分估计测量误差如何累积;经济学用偏导数表示边际效用与替代率。