![](//upload.wikimedia.org/wikipedia/commons/thumb/5/5f/Disambig_gray.svg/25px-Disambig_gray.svg.png)
「
偏微分」重定向至此。關於含有未知函数及其偏导数的方程,請見「
偏微分方程」。
在数学中,偏导数(英語:partial derivative)的定義是:一個多變量的函数(或稱多元函數),對其中一個變量(導數)微分,而保持其他变量恒定[註 1]。
偏导数的作用与价值在向量分析和微分几何以及机器学习领域中受到广泛认可。
函数
关于变量
的偏导数写为
或
。偏导数符号
是全导数符号
的变体,由阿德里安-马里·勒让德引入,并在雅可比的重新引入后得到普遍接受。
f = x2 + xy + y2的图像。我们希望求出函数在点(1, 1)的对x的偏导数;对应的切线与xOz平面平行。
假设ƒ是一个多元函数。例如:
![{\displaystyle z=f(x,y)=x^{2}+xy+y^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b4e5588f8dbc9b41c07d4457e33dd7a84b8e8b26)
因为曲面上的每一点都有无穷多条切线,描述这种函数的导数相当困难。偏导数就是选择其中一条切线,并求出它的斜率。通常,最感兴趣的是垂直于y轴(平行于xOz平面)的切线,以及垂直于x轴(平行于yOz平面)的切线。
一种求出这些切线的好办法是把其他变量视为常数。例如,欲求出以上的函数在点(1, 1)的与xOz平面平行的切线。右图中显示了函数的图像以及这个平面。左图中显示了函数在平面y = 1上是什么样的。我们把变量y视为常数,通过对方程求导,我们可以发现f在点(x, y)的导数,记为:
![{\displaystyle {\frac {\partial f}{\partial x}}=2x+y}](https://wikimedia.org/api/rest_v1/media/math/render/svg/64965bdcf3d930d41591b946401181a61ac0385d)
于是在点(1, 1)的xOz平面平行的切线的斜率是3。
![{\displaystyle {\frac {\partial f}{\partial x}}=3}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4a324e139ca8b473a6e72ea12354ea676ec4b012)
在点(1, 1),或称“f在(1, 1)的关于x的偏导数是3”。
函数f可以解释为y为自变量而x为常数的函数:
。
也就是说,每一个x的值定义了一个函数,记为fx,它是一个一元函数。也就是说:
。
一旦选择了一个x的值,例如a,那么f(a,y)便定义了一个函数fa,把y映射到a2 + ay + y2:
。
在这个表达式中,a是常数,而不是变量,因此fa是只有一个变量的函数,这个变量是y。这样,便可以使用一元函数的导数的定义:
![{\displaystyle f_{a}'(y)=a+2y}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7ebe43dad516cf5ecf0bc565cc245bea26c93e21)
以上的步骤适用于任何a的选择。把这些导数合并起来,便得到了一个函数,它描述了f在y方向上的变化:
![{\displaystyle {\frac {\partial f}{\partial y}}(x,y)=x+2y}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f1a4866393608968a17baacede65d58188ea930d)
这就是f关于y的偏导数,在这裡,∂是一个弯曲的d,称为偏导数符号。为了把它与字母d区分,∂有时读作“der”、“del”、“dah”或“偏”,而不是“dee”。
一般地,函数f(x1,...,xn)在点(a1,...,an)关于xi的偏导数定义为:
![{\displaystyle {\frac {\partial f}{\partial x_{i}}}(a_{1},\ldots ,a_{n})=\lim _{h\to 0}{\frac {f(a_{1},\ldots ,a_{i}+h,\ldots ,a_{n})-f(a_{1},\ldots ,a_{n})}{h}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cdc26fb9eb95442515a8dc9833cd86c72a385804)
在以上的差商中,除了xi以外的所有变量都是固定的。这个固定值的选择决定了一个一元函数
,根据定义,
![{\displaystyle {\frac {df_{a_{1},\ldots ,a_{i-1},a_{i+1},\ldots ,a_{n}}}{dx_{i}}}(a_{1},\ldots ,a_{n})={\frac {\partial f}{\partial x_{i}}}(a_{1},\ldots ,a_{n})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6017b0ea71f55a68df79a9afcdebdfe60b9a097f)
这个表达式说明了偏导数的计算可以化为一元导数的计算。
多变量函数的一个重要的例子,是欧几里德空间Rn(例如R2或R3)上的标量值函数f(x1,...xn)。在这种情况下,f关于每一个变量xj具有偏导数∂f/∂xj。在点a,这些偏导数定义了一个向量:
![{\displaystyle \nabla f(a)=\left({\frac {\partial f}{\partial x_{1}}}(a),\ldots ,{\frac {\partial f}{\partial x_{n}}}(a)\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/96d792e59fad30a6115a47d7f3de3de1cac4c943)
这个向量称为f在点a的梯度。如果f在定义域中的每一个点都是可微的,那么梯度便是一个向量值函数∇f,它把点a映射到向量∇f(a)。这样,梯度便决定了一个向量场。
一个常见的符号滥用是在欧几里得空间R3中用单位向量
来定义Nabla算子 (∇) 如下:
![{\displaystyle \nabla ={\bigg [}{\frac {\partial }{\partial x}}{\bigg ]}\mathbf {\hat {i}} +{\bigg [}{\frac {\partial }{\partial y}}{\bigg ]}\mathbf {\hat {j}} +{\bigg [}{\frac {\partial }{\partial z}}{\bigg ]}\mathbf {\hat {k}} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/d3a85a7de9ee9f583d152b6e08c8d0e34afafeff)
或者,更一般地,对于n维欧几里得空间Rn 的坐标(x1, x2, x3,...,xn)和单位向量(
):
![{\displaystyle \nabla =\sum _{j=1}^{n}{\bigg [}{\frac {\partial }{\partial x_{j}}}{\bigg ]}\mathbf {{\hat {e}}_{j}} ={\bigg [}{\frac {\partial }{\partial x_{1}}}{\bigg ]}\mathbf {{\hat {e}}_{1}} +{\bigg [}{\frac {\partial }{\partial x_{2}}}{\bigg ]}\mathbf {{\hat {e}}_{2}} +{\bigg [}{\frac {\partial }{\partial x_{3}}}{\bigg ]}\mathbf {{\hat {e}}_{3}} +\dots +{\bigg [}{\frac {\partial }{\partial x_{n}}}{\bigg ]}\mathbf {{\hat {e}}_{n}} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/2c83e9cb78d0e11d52d23d1eebfd3b90e3bea09f)
圆锥的体积与它的高度和半径有关
考虑一个圆锥的体积V;它与高度h和半径r有以下的关系:
。
V关于r的偏导数为:
,它描述了高度固定而半径变化时,圆锥的体积的变化率。
V关于h的偏导数为:
,它描述了半径固定而高度变化时,圆锥的体积的变化率。
现在考虑V关于r和h的全导数。它们分别是:
![{\displaystyle {\frac {\operatorname {d} V}{\operatorname {d} r}}=\overbrace {\frac {2\pi rh}{3}} ^{\frac {\partial V}{\partial r}}+\overbrace {\frac {\pi r^{2}}{3}} ^{\frac {\partial V}{\partial h}}{\frac {\partial h}{\partial r}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/79ccd18c8705c30181e1ef7d69249648e2a480e3)
以及
![{\displaystyle {\frac {\operatorname {d} V}{\operatorname {d} h}}=\overbrace {\frac {\pi r^{2}}{3}} ^{\frac {\partial V}{\partial h}}+\overbrace {\frac {2\pi rh}{3}} ^{\frac {\partial V}{\partial r}}{\frac {\partial r}{\partial h}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40b8f42d6e582a1ac43a464bf64d4ed6d6bc5066)
现在假设,由于某些原因,高度和半径的比k需要是固定的:
![{\displaystyle k={\frac {h}{r}}={\frac {\partial h}{\partial r}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4192e71aeb8852cbecf96b34d4285f28c1fa48a2)
这便给出了关于r的全导数:
![{\displaystyle {\frac {\operatorname {d} V}{\operatorname {d} r}}={\frac {2\pi rh}{3}}+k{\frac {\pi r^{2}}{3}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c5b64927277fb97dfcce7afae2f14e81d51397c9)
可以化简为:
![{\displaystyle {\frac {\operatorname {d} V}{\operatorname {d} r}}=k\pi r^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0a1fa2a52233257b62294cc6eaa870c035c9fb48)
类似地,关于h的全导数是:
![{\displaystyle {\frac {\operatorname {d} V}{\operatorname {d} h}}=\pi r^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/74743944608c896dd3b2cbe42e5a1f5440a70a62)
含有未知函数的偏导数的方程,称为偏微分方程,它在物理学、工程学,以及其它应用科学中经常会见到。
与关于r和h二者相关的全导数是由雅可比矩阵给出的,它的形式为梯度向量
。
在以下的例子中,设f为x、y和z的函数。
f的一阶偏导数为:
![{\displaystyle {\frac {\partial f}{\partial x}}=f_{x}=\partial _{x}f}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e6b378c205dbf8cd5f306e9b6e67489ccda66e4e)
二阶偏导数为:
![{\displaystyle {\frac {\partial ^{2}f}{\partial x^{2}}}=f_{xx}=\partial _{xx}f}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9360bc93fcdefb77c81aeb5ef951c2871d929e60)
二阶混合偏导数为:
![{\displaystyle {\frac {\partial ^{2}f}{\partial y\,\partial x}}={\frac {\partial }{\partial y}}\left({\frac {\partial f}{\partial x}}\right)=f_{xy}=\partial _{yx}f}](https://wikimedia.org/api/rest_v1/media/math/render/svg/596c13f728d0f584738410b1a20ce1a821dfb857)
高阶偏导数为:
![{\displaystyle {\frac {\partial ^{i+j+k}f}{\partial x^{i}\,\partial y^{j}\,\partial z^{k}}}=f^{(i,j,k)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/55704a834bf3b7be6e3a7caab53cd99ad05853b2)
当处理多变量函数时,有些变量可能互相有关,这样就需要明确指定哪些变量是固定的。在诸如统计力学的领域中,f关于x的偏导数,把y和z视为常数,通常记为:
![{\displaystyle \left({\frac {\partial f}{\partial x}}\right)_{y,z}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9e4a0deeb6a0d0592e2b9e5d2fad040871fb0aaa)
像导数一样,偏导数也是定义为一个极限。设U为Rn的一个开子集,f : U → R是一个函数。我们定义f在点a = (a1, ..., an) ∈ U关于第i个变量xi的偏导数为:
![{\displaystyle {\frac {\partial }{\partial x_{i}}}f(\mathbf {a} )=\lim _{h\rightarrow 0}{f(a_{1},\dots ,a_{i-1},a_{i}+h,a_{i+1},\dots ,a_{n})-f(a_{1},\dots ,a_{n}) \over h}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/efeb54d68e57fd1c640f3a46f37bebc8aded6887)
即使在某个给定的点a,所有的偏导数∂f/∂xi(a)都存在,函数仍然不一定在该点连续。然而,如果所有的偏导数在a的一个邻域内存在并连续,那么f在该邻域内完全可微分,且全导数是连续的。在这种情况下,我们称f是一个C1函数。
偏导数
可以视为定义在U内的另外一个函数,并可以再次求偏导数。如果所有的混合二阶偏导数在某个点(或集合)连续,我们便称f为在该点(或集合)的一个C2函数;在这种情况下,根据克莱罗定理,偏导数可以互相交换:
。
- George B. Thomas & Ross L. Finney. Calculus and Analytic Geometry. Addison-Wesley Publishing Company, Inc. 1994: 833–840. ISBN 0-201-52929-7.