Refrence

M.E.Peskin & D.V.Schroeder: An Introduction to Quantum Field Theory
M.D.Schwartz: Quantum Field Theory and the Standard Model
David Tong: Quantum Field Theory
S.Weinberg: The Quantum Theory of Field (Volume 1)
黄涛，王伟：量子场论导论（第二版）
刘川：量子场论
郑汉青：量子场论（上）
高显：经典力学讲义
老大中：变分法基础

场论观点的必要性

量子场论是量子力学在场动力学体系中的应用，在这里主要关心基本粒子的动力学，因此涉及到相对论性的场。

场论很多时候意味着粒子数不确定。要从场论观点切入而不能简单地研究确定少数个相对论性粒子的量子力学，有几方面的必要性。例如单粒子的相对论性波动方程——K-G方程或Dirac方程——会出现无穷多负能态等不自洽；相对论性粒子所涉及的能量通常与其静质量相当，因此可能会出现粒子的对产生；即便能量未达到这个水平，在微扰论中也会出现作为中间态的多粒子作用。

此外，对于一个多粒子理论的需求也来自于因果性的要求。考虑一个自由粒子的传播子，即在$t$时间内从$\bf x$到$\bf x_0$的振幅，在非相对论性的形式为

$\begin{aligned} U(t) &= \langle{\bf x} | {\rm e}^{-{\rm i}Ht} |{\bf x}_0 \rangle\\ &= \langle{\bf x} | {\rm e}^{-{\rm i}{\bf p}^2t/2m} |{\bf x}_0 \rangle\\ &= \int\frac{ {\rm d}^3 p}{(2\pi)^3} \langle{\bf x} | {\rm e}^{-{\rm i}Ht} |{\bf p} \rangle \langle{\bf p}|{\bf x}_0 \rangle\\ &= \frac{1}{(2\pi)^3}\int{\rm d}^3p {\rm e}^{-{\rm i}{\bf p}^2t/2m} {\rm e}^{-{\rm i}{\bf p}\cdot ({\bf x}-{\bf x}_0)}\\ &= \left(\frac{m}{2\pi{\rm i}t}\right)^{3/2}{\rm e}^{ {\rm i}m({\bf x}-{\bf x}_0)^2/2t} \end{aligned}$

这个表达式对所有$x$和$t$均非零；这表明可以在任意短时间内传播任意长的距离，显然是违反了相对论性因果性的。那么在相对论框架下呢？如果仅考虑单粒子，也是无法解决的。相对论情形下该传播子为

$\begin{aligned} U(t) &= \langle {\bf x} | {\rm e}^{-{\rm i}t\sqrt{ {\bf p}^2+m^2} } |{\bf x}_0 \rangle\\ &= \frac{1}{(2\pi)^3}\int{\rm d}^3p {\rm e}^{-{\rm i}t\sqrt{ {\bf p}^2+m^2} } {\rm e}^{ {\rm i}{\bf p}\cdot({\bf x}-{\bf x}_0)}\\ &= \frac{1}{2\pi^2|{\bf x}-{\bf x}_0|} \int_0^\infty{\rm d}p\ p\sin(p|{\bf x}-{\bf x}_0|){\rm e}^{-{\rm i}t\sqrt{p^2+m^2} } \end{aligned}$

它在$x^2\gg t^2$的远光锥渐进行为是$U(t)\sim {\rm e}^{-m\sqrt{x^2-t^2} }$，因此传播子的振幅在光锥外具有小但非零的值，因果性仍然破坏。这个问题只有在多粒子的量子场论中才能得到有效的解决。

此外，量子场论还提供了处理变粒子数过程的方法，自然解释了粒子的自旋统计规律，并提供了计算粒子散射截面、寿命等可观测量的方法。

经典场论框架

尽管量子场可以（甚至应该）不依赖于经典连续场来引入，但是掌握经典场论中的基本概念以及很多处理方法仍然是必要的。并且，从经典场出发进行量子化得到粗糙的量子场，再根据其存在的病态行为——虽然这些病态可能恰恰是因为从经典场量子化而带来的——对其进行正规化、重整化等手续以获得具有预言能力的量子场论，也是我们将会遵循的主线。

经典力学与经典场论的理论框架会涉及到不少有关泛函与变分的内容，不熟悉的读者可以在本章附录中找到所需足够的内容补充。

拉格朗日场论

拉格朗日框架的核心是拉格朗日量$L$（在场论中就是拉格朗日密度$\mathscr L$），依最小作用量原理，在以系统的位形坐标及其导数为变量下求出用$\mathcal L$表示的运动方程，即欧拉-拉格朗日方程。

最小作用量原理与欧-拉方程

整个经典力学体系的核心可以取为作用量$S$，即对拉格朗日量的时间积分。在连续场分布的情形下，可以定义拉格朗日密度使得作用量就是其四维时空积分

$S[\phi] = \int_\Omega\mathscr L(\phi(x),\partial_\mu\phi(x)){\rm d}^4x$

其中$\Omega$是我们所关心的有限或无限大的时空区域，$\phi=\phi(x)$是在四维时空连续分布的场自由度，拉格朗日密度$\mathscr L$通常是场变量及其一阶导数的泛函。在这里取度规$g_{\mu\nu}=g^{\mu\nu}={\rm diag}(1,-1,-1,-1)$。$\mathscr L$可以包含多个不同的场，相应地在之后每个场分别服从其各自的场方程。

与有限自由度的经典力学不同，那里的拉格朗日量通常可以显含时间参数$t$来描述处于随时间变化外场中的粒子；但是在经典场论中，我们会把这样的外场一同考虑进研究对象$\phi$中，如无特别说明，$\mathscr L$关于时间的依赖都来自于场变量的时间依赖。需要强调的是在拉格朗日框架下不区分时空坐标，拉格朗日场论天生就是四维协变的理论。

作用量显然是关于场变量$\phi$的泛函。最小作用量原理表明，当场$\phi(x)$在四维时空中演化时，在所有可能的演化里，符合物理真实动力学的演化路径应当使得作用量取平稳值（在较短的演化中通常是极小值）。我们这里遵循大多数教材讨论的方法，即考虑泛函$S[\phi]$在时空区域$\Omega$内的变分为零

$\begin{aligned} 0 &= \delta S[\phi]\\ &= \int_\Omega{\rm d}^4x\left\{\frac{\partial\mathscr L}{\partial\phi}\delta\phi + \frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\delta(\partial_\mu\phi)\right\}\\ &= \int_\Omega{\rm d}^4x \left\{\frac{\partial\mathscr L}{\partial\phi}\delta\phi - \partial_\mu\left(\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\right)\delta\phi + \partial_\mu\left(\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\delta\phi\right)\right\} \end{aligned}$

若记四维时空区域$\Omega$的边界为三维超曲面$\Sigma$，且其面元为${\rm d}\sigma$，$n_\mu$是${\rm d}\sigma$上的单位法矢，${\rm d}\sigma_\mu = n_\mu {\rm d}\sigma$。那么最后一项可以转化为在四维时空积分区域的边界上的表面积分：

$\begin{aligned} 0 = \delta S[\phi] = \int_\Omega{\rm d}^4x \left\{\frac{\partial\mathscr L}{\partial\phi} - \partial_\mu\left(\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\right)\right\}\delta\phi + \int_\Sigma{\rm d}\sigma_\mu \frac{\partial\mathscr L}{\partial(\partial_\mu\phi)} \delta\phi \end{aligned}$

其中

$\pi(x) = n_\mu \frac{\partial\mathscr L}{\partial(\partial_\mu\phi(x))}$

定义为场$\phi$在$x^\mu$处沿垂直于面元${\rm d}\sigma$方向的共轭动量。

特别地，我们所考虑的问题大多是在某参考系中，场在确定的初末时刻分别具有确定的初末态构型，研究其在两个时刻之间随时间的演化问题；另一方面，我们总希望讨论具有定域性的理论，这样只要取空间边界足够远，就可以认为场在边界处的性质不会真正影响区域$\Omega$内部的动力学。这样的问题转换到任意的参考系当中，就是两个类空超曲面$\Sigma_{1}$、$\Sigma_{2}$所夹的时空区域之中场的动力学，因此$n_\mu$大多是类时矢量。

基于上述的考虑，在积分时空区域的类空边界处我们取固定的场构型，而类时边界处（通常为无穷远处）不妨直接假定场为零，那么在整个四维边界上$\delta\phi=0$，因此最后一项边界积分消失了。

此外这一考虑也使得拉格朗日密度具有非唯一性：很显然对应同一组运动方程的拉氏量，可以相差一个全导数，因为这一部分只会产生边界项，而不会影响所关心区域内场的动力学。

于是最小作用量原理给出在所考虑的时空区域内，经典场的运动方程为：

$\partial_\mu\left(\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\right)-\frac{\partial\mathscr L}{\partial\phi} = 0$

此即场的欧拉-拉格朗日方程。一般而言$\mathscr L$是多个不同场的函数，此时该方程对每个场分别成立。

事实上根据本节附录给出的多元函数最简泛函的平稳值条件，可以直接得到该问题的结论，即场运动方程就是作用量对场变量的泛函导数为零：

$- \frac{\delta S[\phi]}{\delta\phi} = \partial_\mu\left(\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\right)-\frac{\partial\mathscr L}{\partial\phi} = 0$

之前扔掉的表面积分，就是在泛函导数的讨论中涉及到的边界项，这是我们所不关心的。

在一些理论中有时也会考虑包含场变量高阶导数的拉格朗日密度：$\mathscr L(\phi,\partial\phi,\cdots,\partial^k\phi)$。其动力学方程也可由最小作用量原理得到，但这样的理论通常会存在一些问题，不在我们的讨论之列。

拉格朗日密度的函数形式

原则上只要知道$\mathscr L$的具体函数形式就可获得场运动方程。目前为止只知道：它可以抽象地表达为场变量与其一阶导数的函数：$\mathscr L(\phi,\partial_\mu\phi)$；对于同一组运动方程，$\mathscr L$还具有非唯一性。事实上拉格朗日密度常被定义为能够通过最小作用量原理生成正确运动方程的数学函数，但这无助于获知其进一步信息。

首先，作用量$S$本身是一个数；同时，狭义相对性原理要求$S$应当在洛伦兹变换下保持不变，具有这种性质的数叫做洛伦兹标量。更一般地，希望拉格朗日框架在引力理论——广义相对论——中也成立，因此希望$S$应当在广义坐标变换下不变。而作用量是$\mathscr L$的四维积分，因此$\mathscr L$至少也应是一个洛伦兹标量。事实上这是一种基于洛伦兹对称性的要求。

从量纲角度，自然单位制下（$c=\hbar=1$），时空、能量、质量的量纲存在关系$[T]=[L]=[E]^{-1}=[M]^{-1}$，作用量$S$具有量纲$1$；而$S$是$\mathscr L$的四维时空积分，因此$\mathscr L$就应该拥有能量四次方的量纲，即$[\mathscr L]=[E]^4$。

最后，$\mathscr L$应当能够反映物理系统的各种对称性，包括时空对称性以及内部对称性。具体的讨论可以在诺特定理一节中得到展现，这里只利用其结论。例如，若认为系统应当存在$\phi\to{\rm e}^{-{\rm i}\alpha}\phi$的对称性，那么系统拉格朗日密度$\mathscr L$应当在这种对称性下不变，至多差一个全导数。

综合上述讨论，符合要求的$\mathscr L$，应当是一个具有能量量纲的洛伦兹标量，且函数形式受到各种对称性的约束；在此基础上希望从其各种等价形式中取最简形式。很多时候只要遵循这些条件，就已经将$\mathscr L$限制在少数几种可能的选择之中了。

尽管拉格朗日密度的具体函数形式可以十分多样，但是基于前述讨论仍可以大致归纳较为常见的类型。在非相对论极限的经典力学中，拉格朗日量通常具有$L=T-V$的形式，其中$T$是广义速度的二次型，一般称之为动能，用以刻画物体本身的运动状态；$V$则是仅与广义坐标有关的标量函数，称之为势能，用以刻画其所受到的外部作用力。在场论中也经常借鉴这样的分离形式。

首先，单一的场$\phi$作为一项出现在$\mathscr L$中不会对运动方程产生影响，其各阶导数也是如此；不考虑这些类型。在所讨论的最简形式$\mathscr L$中，每一项至少存在两个（相同或不同的）场量。

对于任意类型的场$\phi$，其本身可能带有多个不同类型的指标，例如洛伦兹指标（用希腊字母表示）、狄拉克旋量指标甚至其他内部空间指标等等；特别是对时空求导后的$\partial_\mu\phi$，至少会携带一个洛伦兹指标。要得到一个洛伦兹标量，最简单的方法就是用两个相同类型的场、两个求导算符、求导算符与其中一个场缩并掉所有的同类型指标。

最简单的就是不涉及导数算符，只由同一个场出现两次，携带的指标与自己完全缩并：

$\mathscr L_m \supset m^2\phi^2,\quad m^2 A^\mu A_\mu,\quad m\overline\psi\psi,\quad\cdots$

这些项在通过欧拉-拉格朗日方程进入运动方程后，给出关于场变量本身的线性项，如$\propto m^2 \phi$，这在拉格朗日场论中通常被解释为表征场的质量信息。在这些例子中系数$m$都具有能量量纲，一般表示场对应粒子的质量；类似这样的项常被称为质量项。

另一方面，也存在导数算符参与的项，例如：

$\begin{aligned} \mathscr L_K \supset& \frac{1}{2}\partial^\mu\varphi\partial_\mu\phi,\quad\frac{1}{2}\varphi\partial^\mu\partial_\mu\phi,\quad\overline\psi\gamma^\mu\partial_\mu\psi,\\ &\frac{1}{4}(\partial_\mu A_\nu-\partial_\nu A_\mu)(\partial^\mu A^\nu-\partial^\nu A^\mu),\quad \phi\partial_\mu A^\mu,\quad\cdots \end{aligned}$

这些项都是关于两个场的双线性型，在通过欧拉-拉格朗日方程进入运动方程后，通常给出关于场变量的导数项。求导描述了场$\phi$本身的变化与运动，因此期望这些项能够描述场在不涉及相互作用时的自由场动力学。通常把这样只关于两个场（或同一个场出现两次）的双线性型称之为动能项。

在更复杂的情况下，就要涉及到三个或更多的场量：

$\mathscr L_I \supset \varsigma\phi^3,\quad\lambda \phi^4,\quad g\partial_\mu\phi A^\mu \phi^*,\quad g^2A^2_\mu A^2_\nu,\quad \frac{1}{M}\partial_\mu h^{\mu\nu}\partial_\nu h_{\alpha\beta}h^{\alpha\beta},\quad\cdots$

这些项在通过欧拉-拉格朗日方程进入运动方程后，给出的项通常被视作是关于场变量的非齐次项（相对于自由场运动方程而言的驱动项）。在量子场论的观点中，所有的相互作用都是通过三个或以上的场耦合来实现的，因此这些项也被称为相互作用项。其前面的系数则是用以表征耦合强度的耦合常数。在后面中将会看到，若耦合常数很小意味着体系是弱耦合的，此时可以进行微扰场论的计算。

以上这些只是最简单的梳理，在实际的各种理论中、尤其是强相对论性的理论中常常会见到更复杂的构造，甚至无法明确区分场的纯动力学与相互作用，需要再具体分析。

哈密顿场论

与拉格朗日场论天然是四维构造因而是协变性的场论不同，哈密顿框架由于正则方程需要特别关注时间导数，从而必须要构造为$3+1$的结构。但它可以方便地引入一种较为简单的量子化手续——正则量子化；与之相应的，拉格朗日框架则是路径积分量子化的桥梁。

就像经典力学一样，哈密顿框架的核心是哈密顿量$H$，围绕它有三个等价的动力学方程：哈密顿正则方程，泊松括号，以及哈密顿-雅可比方程。

哈密顿正则方程

在三维离散体系中，对每个动力学变量$q$，引入一个共轭动量$p=\partial L/\partial \dot q$，哈密顿量就是$H=\sum p\dot q-L$。

而尽管我们这里讨论的连续场论是四维的，但在前面已经讨论过，由于我们总是考虑场在两个类空超曲面上具有确定初末态的演化问题，这等价于总存在特定的参考系，在其中看来，时空边界就简单取为两个同时面$\Sigma_{t_1}$、$\Sigma_{t_2}$。这样会自然形成对四维时空的3+1分解，在时空点$x^\mu = (t,{\bf x})$处的场变量$\phi(t,{\bf x})$沿着时间方向的共轭动量/正则动量就是：

$\pi(t,{\bf x}) = \frac{\partial\mathscr L}{\partial\dot\phi(t,{\bf x})}$

这样的3+1分解会破坏理论的显式协变性，且从物理出发，假设$\mathscr L$只包含基本变量$\phi(t,{\bf x})$至多到一阶的时间导数，以及各阶空间导数，但不包含时空混合导数。在这里只考虑到一阶空间导数的情况：

$\mathscr L(\phi(x),\partial_\mu\phi(x)) \to \mathscr L^{(3+1)}(\phi({\bf x},t),\dot\phi({\bf x},t),\partial_i\phi({\bf x},t))$

在不引起歧义的情况下可将$\phi(t,{\bf x})$简记为$\phi({\bf x})$，其他场量也是如此，但在记号背后它们仍然具有时间依赖。将共轭动量密度定义代入拉格朗日方程可以得到其时间变化率为

$\dot\pi({\bf x}) = \frac{\partial\mathscr L}{\partial\phi({\bf x})} - \partial_ i\left(\frac{\partial\mathscr L}{\partial(\partial_i\phi({\bf x}))}\right)$

并且定义哈密顿密度为

$\mathscr H = \pi({\bf x})\dot\phi({\bf x})-\mathscr L^{(3+1)}$

反过来说，

$\mathscr L^{(3+1)} = \pi({\bf x})\dot\phi({\bf x})-\mathscr H$

两者之间的这种变换关系在数学上叫做勒让德变换，是一种从一组独立变量到另一组独立变量的变换，在这里就是依赖于变量$\dot\phi$的$\mathscr L^{(3+1)}$与依赖于变量$\pi$的$\mathscr H$之间的变换。数学上讲，变换之后的$\mathscr H$已经不再依赖于$\dot\phi$。从几何语言的角度，拉格朗日密度$\mathscr L$是描述四维时空的底流形的切丛上的函数，拉格朗日框架都是在切丛上进行的；而$\mathscr H$则是余切丛上的函数。

$\mathscr H$实际上只是场变量$\phi$与共轭动量$\pi$的泛函$\mathscr H(\phi,\pi)$，一般不将场变量的一阶空间导数$\partial_i\phi$看作其独立变量。但是明确起见不妨显式地写出其对$\partial_i\phi$的依赖关系，即$\mathscr H(\phi,\partial_i\phi,\pi)$。据此可以明显看出此时利用哈密顿密度所表达的动力学方程，即哈密顿正则方程是

$\begin{aligned} \dot\phi({\bf x})&=\frac{\partial\mathscr H}{\partial \pi({\bf x})}\\ -\dot\pi({\bf x})&=\frac{\partial\mathscr H}{\partial \phi({\bf x})} - \partial_ i\left(\frac{\partial\mathscr H}{\partial(\partial_i\phi({\bf x}))}\right) \end{aligned}$

为了在形式上获得与有限自由度体系类同的形式，可以考虑用泛函导数的语言代替偏导数进行表述。于是可以看到，共轭动量密度就是所谓拉格朗日量对场变量时间导数的泛函导数

$\pi({\bf x}) = \frac{\delta L}{\delta \dot\phi({\bf x})} = \frac{\delta}{\delta \dot\phi({\bf x})}\int{\rm d}^3x\mathscr L$

哈密顿量则是

$H=\int{\rm d}^3x\ \pi({\bf x})\dot\phi({\bf x})- L = \int{\rm d}^3x\mathscr H$

此时的哈密顿正则方程就是

$\begin{aligned} \dot\phi({\bf x}) = \frac{\delta H}{\delta \pi({\bf x})}\\ -\dot\pi({\bf x}) = \frac{\delta H}{\delta \phi({\bf x})} \end{aligned}$

泊松括号

下面考虑场论中的泊松括号。注意到$f(x) = \int{\rm d}y \delta(x-y)f(y)$，可以写出：

$\begin{aligned} \dot\phi({\bf x}) &= \int{\rm d}^3y\ \delta^{(3)}({\bf x}-{\bf y}) \frac{\delta H}{\delta \pi({\bf y})} = \int{\rm d}^3y\ \frac{\delta \phi({\bf x})}{\delta \phi({\bf y})} \frac{\delta H}{\delta \pi({\bf y})}\\ \dot\pi({\bf x}) &= -\int{\rm d}^3y\ \delta^{(3)}({\bf x}-{\bf y}) \frac{\delta H}{\delta \phi({\bf y})} = -\int{\rm d}^3y\ \frac{\delta \pi({\bf x})}{\delta \pi({\bf y})} \frac{\delta H}{\delta \phi({\bf y})} \end{aligned}$

在哈密顿框架下，对描述物理量的泛函$F(\phi,\pi,t)$有

$\begin{aligned} \frac{ {\rm d} F}{ {\rm d}t} &= \frac{\partial F}{\partial t} + \dot\phi({\bf x})\frac{\delta F}{\delta \phi({\bf x})} + \dot\pi({\bf x})\frac{\delta F}{ \delta \pi({\bf x})}\\ &= \frac{\partial F}{\partial t} + \int{\rm d}^3y\ \left[\frac{\delta F}{\delta \phi({\bf y})} \frac{\delta H}{\delta \pi({\bf y})} - \frac{\delta F}{ \delta \pi({\bf y})}\frac{\delta H}{\delta \phi({\bf y})}\right]\\ &= \frac{\partial F}{\partial t} + \{F,H\} \end{aligned}$

该式描述了物理量随时间的变化；同时也用泛函导数定义了在经典场论中两个物理量的泊松括号：

$\{F,G\} = \int{\rm d}^3x\ \left[\frac{\delta F}{\delta \phi({\bf x})} \frac{\delta G}{\delta \pi({\bf x})} - \frac{\delta F}{ \delta \pi({\bf x})}\frac{\delta G}{\delta \phi({\bf x})}\right]$

据此立即可以得到等时正则泊松关系，在这里给出推广到多个场的情形（在积分意义下）：

$\{\phi_i({\bf x}),\phi_j({\bf y})\} = \{\pi_i({\bf x}),\pi_j({\bf y})\} = 0\ ,\quad \{\phi_i({\bf x}),\pi_j({\bf y})\} = \delta_{ij}\delta^{(3)}({\bf x}-{\bf y})$

哈密顿正则方程也可以用泊松括号重写为

$\begin{aligned} \dot\phi({\bf x}) = \{\phi({\bf x}), H\}\\ \dot\pi({\bf x}) = \{\pi({\bf x}), H\} \end{aligned}$

最后值得一提的是，对于我们这里不显含时的哈密顿量

$\frac{ {\rm d} H}{ {\rm d}t} = \frac{\partial H}{\partial t} + \{H,H\} = 0$

不随时间改变。在不考虑一些特殊情况（例如时空背景的动力学），场论中的哈密顿量几乎都是不显含时的，因此场论总会存在一个守恒量，即哈密顿量$H$。将会看到，哈密顿量的守恒正是时间平移对称性的结果。在经典力学中我们知道哈密顿量就是总能量；经典场论中它也被赋予相同的含义，因此$\mathscr H$也被称为能量密度。

哈密顿-雅可比方程

最后，在场论中也有对应的哈密顿-雅可比方程。考虑

$S=\int{\rm d}^4x\mathscr L = \int{\rm d}t L$

而

$H=\int{\rm d}^3x\ \pi({\bf x})\dot\phi({\bf x})- L = \int{\rm d}^3x\mathscr H$

为什么拉格朗日是局域的而哈密顿非局域

连续对称性与守恒律

诺特定理

诺特定理描述了场论中连续对称性与守恒律之间的关系。若系统在某连续变换下运动方程不变，就称其为一种对称变换或对称操作，且系统具有相应变换下的对称性或不变性。这对应于作用量不变或至多差一个边界项，或者拉格朗日密度不变或至多差一个全导数。

在前面导出场运动方程时，我们只考虑了场变量本身的变化；现在考虑更一般情况的无穷小连续变换，即时空坐标和场本身都存在变换：

$x^\mu \to x'^\mu = x^\mu + \epsilon^\mu\ ,\quad \phi(x) \to \phi'(x') = \phi(x) + \alpha \bar\delta \phi(x)$

其中，$\epsilon^\mu=\epsilon^\mu(x)$是任一表征无穷小坐标变换的无穷小4-矢量场；$\alpha$则是无穷小的连续取值实参数。参考本章附录关于函数全变分的讨论，这里用全变分$\bar\delta$表示同时改变了坐标和场量的变换，需要强调偏导数$\partial_\mu$不与全变分$\bar\delta$对易，但与变分$\delta$对易。因此根据变分与全变分的关系，在该无穷小连续变换下，拉格朗日密度的改变可以表示为：

$\begin{aligned} \alpha \bar\delta\mathscr L &= \alpha \delta\mathscr L + \alpha \epsilon^\nu \partial_\nu\mathscr L\\ &= \alpha \frac{\partial\mathscr L}{\partial\phi}\delta\phi + \alpha \frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\delta(\partial_\mu\phi) + \alpha \epsilon^\nu \partial_\nu\mathscr L\\ &= \alpha \left[\frac{\partial\mathscr L}{\partial\phi} - \partial_\mu\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\right]\delta\phi + \alpha \partial_\mu\left[\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\delta\phi\right] + \alpha \epsilon^\nu \partial_\nu\mathscr L\\ &= \alpha \partial_\mu\left[\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\delta\phi\right] + \alpha \epsilon^\nu \partial_\nu\mathscr L \end{aligned}$

最后一步运用了欧-拉方程。相应地，此时的作用量也发生改变。但是注意到坐标变换也会引起积分中的积分测度变化，在只到一阶无穷小时其雅可比行列式为：

$J=\left|\frac{\partial x'}{\partial x}\right| = \det\left(\frac{\partial x'^\mu}{\partial x^\nu}\right) = |{\delta^\mu}_\nu + \partial_\nu\epsilon^\mu| \approx 1 + \partial_\nu\epsilon^\nu$

（注意${ g^\mu }_\nu=g^{ \mu\rho }g_{ \rho\nu }={ \delta^\mu }_\nu$）因此作用量的变化为

$\begin{aligned} \alpha \delta S &= \alpha \int \Big\{[{\rm d}^4x+\bar\delta({\rm d}^4x)](\mathscr L+\bar\delta\mathscr L) - {\rm d}^4x \mathscr L\Big\} = \alpha \int[\bar\delta({\rm d}^4x)\mathscr L+{\rm d}^4x\bar\delta \mathscr L]\\ &=\alpha \int{\rm d}^4x \left\{\mathscr L \partial_\nu\epsilon^\nu + \epsilon^\nu \partial_\nu\mathscr L + \partial_\mu\left[\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\delta\phi\right]\right\}\\ &=\alpha \int{\rm d}^4x\ \partial_\mu\left[\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\delta\phi + \mathscr L \epsilon^\mu\right] \end{aligned}$

可见，若变换是一个对称变换，即$\delta S=0$，必然会导致一个如下的流守恒：

$\begin{aligned} j^\mu &= \frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\delta\phi + \mathscr L \epsilon^\mu\\ &= \frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\bar\delta\phi + \left[{g^\mu}_\nu\mathscr L - \frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\partial_\nu\phi\right]\epsilon^\nu \end{aligned}$

叫做相应对称性的守恒流，或者叫诺特流。

若$\mathscr L$含有多个独立场变量，则守恒流第一项就是这些场各自对应项之和。

守恒流满足守恒方程

$\partial_\mu j^\mu = 0$

相应地，其守恒荷为

$Q=\int{\rm d}^3x\ j^0$

此即诺特定理：若系统存在一个连续的对称性，则必然导致一个守恒律。

需要强调诺特定理成立必须满足的三点：

对称性必须是连续对称性，否则无穷小变换中$\epsilon^\mu$无法定义；
守恒流只有在壳情况下是守恒的，即必须满足运动方程；
诺特定理对于全局和局域的对称性都是成立的（即$\epsilon^\mu$可以是常量场也可以是随坐标变化的场$\epsilon^\mu(x)$）。

上面是从最基本的坐标和场量的变化开始考虑给出守恒流的形式。实际上一般如果确定（或假设）系统具有某种对称性时，经常可以直接从拉格朗日密度的函数形式出发得到守恒流的形式。对于运动方程不变的要求，就是拉格朗日密度至多差一个全导数

$\mathscr L(x) \to \mathscr L(x) + \partial_\mu\mathscr J^\mu(x)$

相当于已知$\delta\mathscr L = \partial_\mu\mathscr J^\mu$，则可以直接得到守恒流$j^\mu$及其守恒方程的形式为

$\partial_\mu j^\mu(x) = \partial_\mu\left[\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\delta\phi(x) - \mathscr J^\mu(x)\right] = 0$

下面将会看到，很多时候所称的“守恒流”并不要求一定是狭义的矢量场（只有一个洛伦兹指标），还可以是拥有更多指标的张量；相应的“守恒荷”也就不一定是标量。

需要强调的是，前述讨论仅仅是在经典水平上证明了诺特定理；但是经典系统被量子化后，其对称性是有可能被破坏的，例如可能存在量子反常的现象。对于量子系统的对称性与守恒律，在之后会具体讨论。

时空对称性与洛伦兹对称性

经典场论最简单也最重要的对称性就是时空对称性。四维时空的全部时空对称性由庞加莱群所描述，包括时间平移变换、空间平移变换、空间旋转变换以及洛伦兹变换所对应的对称性，其中后两种对称变换又由洛伦兹群所描述。它们分别导致了能量、动量、角动量的守恒。

时空平移对称性与能-动张量

考虑四维时空坐标的无穷小平移变换

$x^\mu\to x'^\mu = x^\mu - a^\mu$

其中$a^\mu$是确定的无穷小恒定4-矢量。具有时空平移对称性的场，应当在变换后满足如下关系：

$\phi(x)\to \phi'(x) = \phi(x+a) = \phi(x) + a^\mu\partial_\mu\phi(x)$

这实际上给出了$\bar\delta\phi=0$而$\epsilon^\mu = -a^\mu$。直接代入前面的式子，或者分析拉格朗日密度在前述坐标变换下的变化

$\begin{aligned} \mathscr L(x) &\to \mathscr L(x+a) \approx \mathscr L(x) + a^\mu\partial_\mu \mathscr L(x)\\ &= \mathscr L(x) + \partial_\mu (a^\nu {g^\mu}_\nu\mathscr L(x)) \end{aligned}$

都可以得出此时的守恒流是$j^\mu = a^\nu {T^\mu}_\nu$，其中

${T^\mu}_\nu = \frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}\partial_\nu\phi - {g^\mu}_\nu\mathscr L$

称为能量-动量张量，描述场的能量、动量在时空中的分布。由于$a^\nu$的任意性，所以一般就称${T^\mu}_\nu$是守恒流，其满足的守恒律是

$\partial_\mu{T^\mu}_\nu = 0$

需要注意的是在这里定义的能动张量并不一定是对称的，因此不能直接用于广义相对论。

能动张量对应的守恒荷：

$\begin{aligned} P^\nu &= \int{\rm d}^3x T^{0\nu} = \int{\rm d}^3x \left[\frac{\partial\mathscr L}{\partial(\partial_0\phi)}\partial^\nu\phi - g^{0\nu}\mathscr L\right]\\ &= \int{\rm d}^3x \left[\pi\partial^\nu\phi - g^{0\nu}\mathscr L\right] \end{aligned}$

这就是所谓4-动量，为了看出这一点，考虑其第$0$分量

$E = P^0 = \int {\rm d}^3x T^{00} = \int{\rm d}^3x \left[\pi\dot\phi - \mathscr L\right] = \int {\rm d}^3x \mathscr H = H$

正是系统的总哈密顿量即能量，而$T^{00}=\mathscr H$就是哈密顿密度；能量的守恒对应于时间平移对称性。

另一方面，其空间分量则是

$p^i = \int {\rm d}^3x T^{0i} = -\int{\rm d}^3x\ \pi\partial_i\phi$

或者写为3-矢量形式${\bf p} = -\int{\rm d}^3x\ \pi\nabla\phi$，其中$T^{0i} = -\pi\partial_i\phi$称为动量密度。之所以等式右边的指标$i$取逆变指标是为了遵循在三维场论分析中算符$\nabla = (\partial_i)$的习惯。动量守恒对应于空间平移对称性。

需要强调的是，这里的动量是表征系统运动状态的物理动量，与前面引入作为系统独立自由度的正则动量/共轭动量密度$\pi$不同。

此外，也要区分守恒荷与不变量；守恒荷可以是标量，矢量或张量，强调其不随时间发生变化的性质；而相对论语境下不变量则多指（洛伦兹）标量，强调其在一些对称变换下的不变性。

洛伦兹对称性与角动量

由于可以统一由洛伦兹变换所描述，广义上的洛伦兹对称性包括3个空间旋转与3个洛伦兹boost所联系的对称性。

坐标的齐次变换可以标记为

$x^\mu \to x'^\mu = {\varLambda^\mu}_\nu x^\nu$

若要求这样的齐次变换保持度规不变：${\varLambda^\mu}_\sigma {\varLambda^\nu}_\tau \eta^{\sigma\tau} = 0$，那么这样保持度规不变的齐次坐标变换称为洛伦兹变换。

与时空平移变换不同，洛伦兹变换下场的函数形式通常也会发生变化。例如，在上述此变换之下，可以场的变换形式写为

$\phi^r(x) \to \phi'^r(x') = \varXi(\varLambda)_s^r \phi^s(\varLambda x)$

其中$\varXi(\varLambda)_r^s$是与洛伦兹坐标变换$\Lambda$相应的场的线性变换。场本身可能含有某些指标，用$r,s$指代我们所关心的决定场变换性质的那些指标，它们一般意味着场可能存在某些分量。作为其上的变换，$\varXi(\varLambda)$自然也有这些指标。

为了方便，首先考虑如下形式的无穷小洛伦兹变换：

$x^\mu \to x'^\mu = {\varLambda^\mu}_\nu x^\nu = ({\delta^\mu}_\nu + {\omega^\mu}_\nu) x^\nu$

保持度规不变的条件给出

${\varLambda^\mu}_\sigma {\varLambda^\nu}_\tau \eta^{\sigma\tau} = ({\delta^\mu}_\sigma + {\omega^\mu}_\sigma)({\delta^\nu}_\tau + {\omega^\nu}_\tau) \eta^{\sigma\tau} = \eta^{\mu\nu}\ \Longrightarrow\ \omega^{\mu\nu} + \omega^{\nu\mu} = 0$

那么无穷小的$\omega^{\mu\nu}$对指标$[\mu,\nu]$一定是反对称的。反对称$4\times 4$矩阵的自由度共有6个，正对应于洛伦兹群所描述的6个对称变换。

注意到$x’^\mu - x^\mu = (\varLambda - 1)x’^\mu = {\omega^\mu}_\nu x^\nu$，可以将其重写为

$x'^\mu - x^\mu = -\frac{\rm i}{2} \omega_{\rho\sigma} {(J_x^{\rho\sigma})^\mu}_\nu x^\nu$

其中${(J_x^{\mu\nu})^\rho}_\sigma = i (g^{\mu\rho}\delta^\nu_\sigma - g^{\nu\rho}\delta^\mu_\sigma)$，它对$[\mu,\nu]$也是反对称的。这实际上就是对$\omega^{\mu\nu}$的改写：

${\omega^\mu}_\nu = -\frac{\rm i}{2} \omega_{\rho\sigma} {(J_x^{\rho\sigma})^\mu}_\nu$

为了得到在无穷小洛伦兹变换下场的变换形式，考虑将$\phi^s(\varLambda^{-1} x)$按$\omega^{\mu\nu}$展开：

$\phi'^r(x) = \varXi(\varLambda)_s^r \phi^s(\varLambda^{-1}x) = \varXi(1+\omega)_s^r \phi^s(x^\mu-{\omega^\mu}_\nu x^\nu) + \mathcal O(\omega^2)$ $= \varXi(1+\omega)_s^r \phi^s(x) - \varXi(1+\omega)_s^r \Big[{\omega^\mu}_\nu x^\nu \partial_\mu \phi^s(x) \Big] + \mathcal O(\omega^2)$

考虑再将$\varXi(1+\omega)_s^r$展开，由于它与一个$\omega$相乘，则展开后在$\mathcal O(\omega)$阶只剩下它的常数项$\varXi(1)_s^r = \delta_s^r$，则：

$\phi'^r(x) = \phi^r(x) - \delta_s^r {\omega^\mu}_\nu x^\nu \partial_\mu \phi^s(x)$

考虑到$\omega^{\mu\nu}$的反对称性，总可以将上述表达式拆成六个独立守恒流的线性组合，每个都形如

$D[A]D[B] = D[AB]$

$D[1+w]D[1+x] = D[1+(w+x)]$

$(I+kw)(I+kx) = I+k(w+x)$

相应地，将无穷小洛伦兹变换下场的变换表示为：

$\phi'^r(x') = \phi^r(x) + \frac12 \omega^{\mu\nu} (L_{\mu\nu})_s^r \phi^s(x)$

我们把系数$$

$\phi(x)\to\phi'(x) = \phi(\varLambda^{-1}x) = \phi(x^\mu-{\omega^\mu}_\nu x^\nu) = \phi(x)-{\omega^\mu}_\nu x^\nu\partial_\mu\phi(x)$

应当指出的是，只有一部分场满足这样的变换性质，即所谓的标量场。这里只是举了一个简单的标量场例子；关于更一般的讨论，将会在后面关于庞加莱群表示的部分深入。

注意到由于反对称性${\omega^\mu}_\mu = 0$，且${\omega^\mu}_\nu$ 是恒量，而$\partial_\mu x^\nu = {\delta_\mu}^\nu$，则

$\partial_\mu({\omega^\mu}_\nu x^\nu \phi) = {\omega^\mu}_\nu x^\nu \partial_\mu\phi + {\omega^\mu}_\nu \phi {\delta_\mu}^\nu = {\omega^\mu}_\nu x^\nu\partial_\mu\phi$

因此

$\mathscr L \to \mathscr L - \partial_\mu({\omega^\mu}_\nu x^\nu \mathscr L)$

相差一个全导数，显然此时的守恒流就是

$\begin{aligned} j^\mu &= -\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)}{\omega^\rho}_\nu x^\nu \partial_\rho\phi + {\omega^\mu}_\nu x^\nu\mathscr L\\ &= -{\omega^\rho}_\nu x^\nu \left[\frac{\partial\mathscr L}{\partial(\partial_\mu\phi)} \partial_\rho\phi - {g^\mu}_\rho\mathscr L\right]\\ &= -{\omega^\rho}_\nu x^\nu {T^\mu}_\rho \end{aligned}$

式中再次出现了上一节定义的能-动张量。考虑到$\omega^{\mu\nu}$的反对称性，总可以将上述表达式拆成六个独立守恒流的线性组合，每个都形如

$(M^\mu)^{\rho\nu} = x^\rho T^{\mu\nu} - x^\nu T^{\mu\rho}$

它们的守恒方程是

$\partial_\mu(M^\mu)^{\rho\nu} = 0$

这将给出六个守恒荷。对于$\rho,\nu=1,2,3$的守恒荷就是系统的总角动量

$Q^{ij} = \int{\rm d}^3x(x^i T^{0j} - x^j T^{0i})$

这对应于空间转动对称性。

而另一方面，与洛伦兹boost相联系的守恒荷是

$Q^{0i} = \int{\rm d}^3x(x^0 T^{0i} - x^i T^{00})$

其守恒意味着

$\begin{aligned} 0 &= \frac{ {\rm d}Q^{0i} }{ {\rm d}t} = \int{\rm d}^3x T^{0i} + t\int{\rm d}^3x \frac{\partial T^{0i} }{\partial t} - \frac{ {\rm d} }{ {\rm d}t}\int{\rm d}^3x\ x^i T^{00}\\ &= P^i+t\frac{ {\rm d}P^i }{ {\rm d}t} - \frac{ {\rm d} }{ {\rm d}t}\int{\rm d}^3x\ x^i \mathscr H \end{aligned}$

而动量是守恒的，因此该式得到了一个守恒的常量：

$\frac{ {\rm d} }{ {\rm d}t}\int{\rm d}^3x\ x^i \mathscr H = {\rm constant}$

该式的物理意义是，场的能量分布的“等效中心”（联想质心的定义）以恒定速度运动；某种程度上这就是场论版本的牛顿第一定律。

内部对称性

除了同时涉及时空坐标与场量的时空对称变换之外，场论还经常会处理所谓内部对称性，只会涉及到场量的变换。考虑最简单的一种情况：复标量场

$\psi(x) = \frac{\phi_1(x)+{\rm i}\phi_2(x)}{\sqrt 2}$

构造拉格朗日密度为

$\mathscr L = \partial_\mu\phi^*\partial^\mu\psi-V(|\psi|^2)$

显然拉格朗日密度具有如下的无穷小连续变换对称性

$\psi \to {\rm e}^{-{\rm i}\alpha}\psi \quad {\rm or} \quad \delta\psi=-{\rm i}\alpha\psi$

其中$\alpha$是无穷小的实参数。因此具有相应的守恒流

$j^\mu = {\rm i}(\partial^\mu\psi^*)\psi -{\rm i}\psi^*(\partial^\mu\psi)$

以及守恒荷

$Q={\rm i}\int{\rm d}^3x(\dot\psi^*\psi-\psi^*\dot\psi)$

类似于这样的内部对称性对对应的守恒律在场论中十分重要，其守恒荷往往作为理论的重要特征数出现。由于形如$\psi \to {\rm e}^{ {\rm i}\alpha}\psi$的变换可由连续李群$U(1)$描述，因此本例中的对称性一般也叫（全局的）$U(1)$对称性。此外还可能会有其他连续李群描述的内部对称性，例如本例中的参数$\alpha$若取矩阵值，则可以很方便地推广到非阿贝尔群的情形。

另一方面由于这些对称性往往描述了理论相对于现实的冗余自由度，例如本例中给场量全局地附加一个相位并不会改变其所描述的物理，因此这类对称性也叫规范对称性。

附录

泛函变分与泛函导数

在分析经典力学与经典场论时，不可避免会遇到需要处理泛函的问题。泛函，即某个函数空间$\mathcal F$到某数域（物理上通常是复数域$\mathbb C$）的映射

$\begin{aligned} F:\mathcal F &\to\mathbb C\\ f &\mapsto F[f]\ , \end{aligned}$

在物理中绝大多数会遇到的泛函都可以写成如下的简单积分型泛函：

$F[f]=\int{\rm d}x\ \mathscr F(x,f(x),f'(x),f''(x),\dots)$

泛函的变分

泛函中会出现所谓“变分”的概念，这与函数的微分概念在某种程度上是对应的。具体来说：

作为函数的自变量，$x$会发生一个无穷小的改变${\rm d}x$，称之为自变量的微分

$x \to x+\epsilon\ {\rm d}x$

同时，函数$f(x)$会完全由于自变量$x$发生变化${\rm d}x$而引起函数值的无穷小变化

$\begin{aligned} f(x) &\to f(x+\epsilon\ {\rm d}x)\\ &= f(x) + \epsilon\ {\rm d}f(x) + \frac{\epsilon^2}{2}{\rm d}^2 f(x) + \frac{\epsilon^3}{3!}{\rm d}^3 f(x) + \cdots\\ &= f(x) + \epsilon\ \frac{ {\rm d}f(x)}{ {\rm d}x}{\rm d}x + \frac{\epsilon^2}{2}\frac{ {\rm d}^2f(x)}{ {\rm d}x^2}({\rm d}x)^2 + \frac{\epsilon^3}{3!}\frac{ {\rm d}^3f(x)}{ {\rm d}x^3}({\rm d}x)^3 + \cdots \end{aligned}$

这给出了函数的各阶微分${\rm d}^nf(x)$，例如其线性主部就是（一阶）微分${\rm d}f(x)$，它们本身都是无穷小的数；同时上式也给出了各阶函数导数的定义，即

${\rm d}^{n}f(x) = \frac{ {\rm d}^nf(x)}{ {\rm d}x^n}({\rm d}x)^n$

显然，函数导数的作用，（以一阶导数为例）是将一个无穷小的数${\rm d}x$映射到另一个无穷小的数${\rm d}f(x)$。

与此类似，在泛函问题中，函数本身作为泛函的宗量，也会在函数空间中发生微小变化$\delta f$

$f(x) \to f(x) + \epsilon\ \delta f(x)$

这本身是一个无穷小的函数，称之为函数的变分。泛函$F[f]$也会完全由于函数变分而引起泛函值的无穷小变化

$\begin{aligned} F[f] &\to F[f+\epsilon\ \delta f]\\ &= F[f] + \epsilon\ \delta F[f] + \frac{\epsilon^2}{2}\delta^2 F[f] + \frac{\epsilon^3}{3!}\delta^3 F[f] + \cdots \end{aligned}$

这给出了泛函的各阶变分$\delta^n F[f]$，易见泛函的各阶变分也都是无穷小的数。

我们希望定义泛函$F[f]$对其宗量函数$f(x)$的泛函导数$\frac{\delta F[f]}{\delta f(x)}$。类比于函数导数的作用，泛函导数的作用应当（也以一阶泛函导数为例）是将一个无穷小的函数$\delta f(x)$映射到无穷小的数$\delta F[f]$，这可以由积分来实现

$\delta F[f] = \int{\rm d}x\frac{\delta F[f]}{\delta f(x)}\delta f(x)$

类似地，更高阶的泛函导数也由积分定义为

$\delta^n F[f] = \int{\rm d}x_1{\rm d}x_2\cdots{\rm d}x_n \frac{\delta^n F[f]}{\delta f(x_1) \delta f(x_2)\cdots \delta f(x_n)}\delta f(x_1) \delta f(x_2)\cdots \delta f(x_n)$

从上述定义的角度来讲，泛函导数与所谓的“$\delta$-函数”$\delta(x)$类似，都是只在积分意义下的泛函；但同样我们也可以类比对$\delta(x)$的处理方法，在符号意义下将$\frac{\delta F[f]}{\delta f(x)}$视作$x$的一个“函数”，这也是泛函导数在物理上常扮演的角色。我们希望找到一种能够计算在给定$x$处其“函数值”的方法。

泛函导数的操作性定义

注意到前述定义在具体计算时不甚方便。若将$F[f+\epsilon\ \delta f]$视作关于$\epsilon$的普通函数，则可以给出更具操作性的泛函导数的定义。将$F[f+\epsilon\ \delta f]$按$\epsilon$进行泰勒展开：

$F[f+\epsilon\delta f] = F[f] + \epsilon\frac{ {\rm d} }{ {\rm d}\epsilon}F[f+\epsilon\delta f]\bigg|_{\epsilon = 0} + \frac{\epsilon^2}{2}\frac{ {\rm d}^2}{ {\rm d}\epsilon^2}F[f+\epsilon\delta f]\bigg|_{\epsilon = 0} + \cdots$

与之前的定义式相比，不难得到此时的泛函导数（一阶为例）满足

$\int{\rm d}x\frac{\delta F[f]}{\delta f(x)}\delta f(x) = \frac{ {\rm d}F[f+\epsilon\delta f]}{ {\rm d}\epsilon}\Bigg|_{\epsilon = 0} = \lim_{\epsilon\to 0}\frac{F[f+\epsilon\delta f]-F[f]}{\epsilon}$

这是拉格朗日形式的泛函导数定义，与前述定义是等价的。形式上将最后一项表达成积分，可以写为：

$\frac{\delta F[f]}{\delta f(x)} = \lim_{\epsilon\to 0} \frac{F[f+\epsilon\delta(x)]-F[f]}{\epsilon}$

这给出了$\frac{\delta F[f]}{\delta f(x)}$的操作性定义：我们可以将记号$\frac{\delta F[f]}{\delta f(x)}$看作一个自变量取值为$x$的函数，其在积分下有意义，体现为对任意的函数$g(x)$，积分给出

$\int{\rm d}x\frac{\delta F[f]}{\delta f(x)} g(x) = \lim_{\epsilon\to 0}\frac{F[f+\epsilon g]-F[f]}{\epsilon}$

不难看出这也是一个写成了函数的泛函，即与$\delta(x)$类似的“广义函数”。事实上依据定义，若将函数$f$在某一点$y$处的取值$f(y)$看作$f$本身的泛函，则有

$\frac{\delta f(y)}{\delta f(x)} = \delta(y-x)$

即函数对自身的泛函导数是$\delta$-函数。

据此，在计算一般的泛函导数时，可以采用简单的求普通导数的方法来计算：即从泛函$F[f]$得到普通函数$\Phi(\epsilon) = F[f+\epsilon\delta f]$，求其关于参数$\epsilon$的普通导函数在$\epsilon=0$处的取值$\Phi’(0)$，就是泛函的变分值$\delta F$。通常这会得到一个积分的形式$\Phi’(0) = \int{\rm d}x g(x) \delta f(x)$，其中$g(x)$就是我们所定义的$\frac{\delta F[f]}{\delta f(x)}$。

变分运算规则

本小节给出变分的基本运算规则，有些在之前的讨论中已经用到过。对于自变量$x$的可微函数，函数变分运算的基本规则大多与微分类似：

$\begin{aligned} (1)&\ \delta(f_1+f_2) = \delta f_1+\delta f_2\\ (2)&\ \delta(f_1f_2) = f_2\delta f_1+f_1\delta f_2\\ (3)&\ \delta(f^n) = nf^{0n-1}\delta f\\ (4)&\ \delta\left(\frac{f_1}{f_2}\right) = \delta\left(\frac{f_2\delta f_1-f_1\delta f_2}{f_2^2}\right)\\ (5)&\ \delta\left[\frac{ {\rm d}^n}{ {\rm d}x^n}f\right] = \frac{ {\rm d}^n}{ {\rm d}x^n}(\delta f)\\ (6)&\ \delta\int{\rm d}x f = \int{\rm d}x(\delta f) \end{aligned}$

需要注意的是上述第5、6条表明，对于函数的变分运算可以与求导、积分运算交换。这两条的证明需要用到条件$\delta x=0$，因为变分本来就是函数本身的变化，与宗量无关。

对于形如$\mathscr F(f(x),f’(x))$的复合函数，除了上述规则之外，变分还满足链式法则：

$\delta \mathscr F(f(x),f'(x)) = \frac{\partial \mathscr F}{\partial f}\delta f + \frac{\partial \mathscr F}{\partial f'}\delta f'$

结合链式法则与前述第六条规则，我们可以得到对于简单积分型泛函，其变分

$\begin{aligned} \delta F[f] &= \delta\int{\rm d}x\ \mathscr F(x,f(x),f'(x),f''(x),\dots)\\ &= \int{\rm d}x\ \delta\mathscr F(x,f(x),f'(x),f''(x),\dots)\\ &= \int{\rm d}x \left(\frac{\partial \mathscr F}{\partial f}\delta f + \frac{\partial \mathscr F}{\partial f'}\delta f' + \frac{\partial \mathscr F}{\partial f''}\delta f'' + \dots\right) \end{aligned}$

以右侧积分中第二项为例，可以用分部积分将之变形：

$\frac{\partial \mathscr F}{\partial f'}\delta f' = \frac{\partial \mathscr F}{\partial f'}\delta \left(\frac{ {\rm d}f}{ {\rm d}x}\right) = \frac{\partial \mathscr F}{\partial f'} \frac{ {\rm d}}{ {\rm d}x}(\delta f) = \frac{ {\rm d}}{ {\rm d}x}\left(\frac{\partial \mathscr F}{\partial f'} \delta f\right) - \delta f \frac{ {\rm d}}{ {\rm d}x} \frac{\partial \mathscr F}{\partial f'}$

第一项是一个全导数，在积分之后变为只取决于函数在边界上值的“边界项”，而第二项则由$\delta f’$变为了$\delta f$。对泛函变分$\delta F[f]$其余的部分也进行多次分部积分，最后可以全部变换为$\delta f$，这种变换称之为拉普拉斯变换。

有时我们会需要处理函数与宗量同时变化的情况，即所谓“全变分”的概念，一般用$\bar\delta$表示。需要区分两者的关系，即变分只是函数本身的变化，函数的变分仍是一个函数。但全变分则同时表征函数本身和宗量的变化，函数在某点处的全变分是一个无穷小数。考虑函数由$f(x)$变化一无穷小函数变为$f_1(x)$，则函数的变分作为一个函数，在某点$x$处的取值为

$\delta f(x) = f_1(x)-f(x)$

而其在$x$点的全变分则同时要考虑函数的变化，以及$x$也变化一无穷小数${\rm d}x$，即：

$\bar\delta f(x) = f_1(x+{\rm d}x) - f(x)$

特别地，对于自变量而言，$\bar\delta x={\rm d} x$。对于可微函数，将函数$f_1$在$x$处泰勒展开到一阶无穷小：

$f_1(x+{\rm d}x)-f_1(x) = f_1'(x) {\rm d} x \approx f'(x) {\rm d} x$

最后一步近似是由于函数变分本身就是无穷小量，乘以${\rm d}x$属于高阶无穷小量，于是略去了$\var f(x){\rm d}x$。因此全变分$\bar\delta$与变分$\delta$在只保留一阶无穷小量下近似有：

$\bar\delta f(x) \approx \delta f(x) + f'(x){\rm d}x$

事实上这个式子对任何关于$x$的泛函也成立。第一项表明仅由函数变化所引起的部分，第二项表示函数不变时，仅由自变量变化引起的部分。

需要强调，全变分与求导、积分运算一般均不可交换，因为$\bar\delta x={\rm d} x \neq 0$。

简单积分型泛函导数与欧拉方程

注意到这里无论哪种定义给出的泛函导数都是积分意义下的定义。一般而言，积分会经由分部积分等步骤产生在积分端点（边界）处取值的“边界项”，但通常我们会处理固定边界的泛函问题，边界项与真正关心的内部的$\delta f$无关，因此在泛函导数的计算时经常扔掉边界项。

结合之前的讨论，很容易得到对于我们在物理中所关心的简单积分型泛函，其泛函导数为：

$\begin{aligned} \frac{\delta F}{\delta f} &= \frac{\delta}{\delta f}\int{\rm d}x\mathscr F\quad (-{\rm boundary\ terms})\\ &= \frac{\partial\mathscr F}{\partial f} - \frac{\rm d}{ {\rm d}x}\frac{\partial\mathscr F}{\partial f'} + \frac{ {\rm d}^2}{ {\rm d}x^2}\frac{\partial\mathscr F}{\partial f''} +\cdots\\ &= \sum_{n=0}(-1)^n\frac{ {\rm d}^n}{ {\rm d}x^n}\frac{\partial\mathscr F}{\partial f^{(n)} } \end{aligned}$

或者写为泛函变分的形式

$\delta F[f] = \int{\rm d}x \left(\frac{\partial\mathscr F}{\partial f} - \frac{\rm d}{ {\rm d}x}\frac{\partial\mathscr F}{\partial f'} + \frac{ {\rm d}^2}{ {\rm d}x^2}\frac{\partial\mathscr F}{\partial f''} +\cdots\right)$

这个结论会经常用到。

物理上研究最多的是泛函平稳值问题。当函数$f$发生微小变化时，泛函取平稳值的条件就是$F[f]$对$f$的泛函导数为零。考虑较简单的一种泛函平稳值问题，对于只依赖于$f$一阶导数的最简泛函

$F[f]=\int{\rm d}x\mathscr F(x,f(x),f'(x))$

此时泛函$F[f]$取平稳值的条件就是，函数$f$满足下述微分方程

$\frac{\delta F}{\delta f} = \frac{\partial\mathscr F}{\partial f} - \frac{\rm d}{ {\rm d}x}\frac{\partial\mathscr F}{\partial f'} = 0$

此即最简泛函平稳值问题的欧拉方程，或称欧拉-拉格朗日方程。

我们可以从各个角度对该问题进一步拓展。首先可以考虑依赖于$f$更高阶导数的泛函平稳值问题，显然也有相应于欧拉方程的条件

$\frac{\delta F}{\delta f} = \sum_{n=0}(-1)^n\frac{ {\rm d}^n}{ {\rm d}x^n}\frac{\partial\mathscr F}{\partial f^{(n)} } = 0$

此即涉及高阶导数的欧拉-泊松方程。

另外，也可以考虑依赖于多个一元函数的泛函平稳值问题，例如泛函被积函数取$\mathscr F = \mathscr F(x,f(x),f’(x),g(x),g’(x))$。此时各个一元函数都要分别满足欧-拉方程，整个泛函取平稳值的条件就是

$\left\{\begin{aligned} \frac{\delta F}{\delta f} = \frac{\partial\mathscr F}{\partial f} - \frac{\rm d}{ {\rm d}x}\frac{\partial\mathscr F}{\partial f'} &= 0\\ \frac{\delta F}{\delta g} = \frac{\partial\mathscr F}{\partial g} - \frac{\rm d}{ {\rm d}x}\frac{\partial\mathscr F}{\partial g'} &= 0 \end{aligned}\right.$

即关于多个一元函数的欧-拉方程组。

最后，还可以考虑依赖于多元函数的泛函平稳值问题，即$\mathscr F = \mathscr F(x,y,u(x,y),u_x,u_y)$。此时在每个方程中都要考虑所有自变量的影响，对应的条件是

$\frac{\delta F}{\delta u} = \frac{\partial\mathscr F}{\partial u} - \frac{\partial}{\partial x}\frac{\partial\mathscr F}{\partial u_x} - \frac{\partial}{\partial y}\frac{\partial\mathscr F}{\partial u_y} = 0$

此即涉及多元函数的欧拉-奥斯克罗格拉茨基方程。

上述这些不同形式的方程都具有共性，可统称为欧拉方程。欧拉方程系统地回答了各类简单积分型泛函的平稳值问题。