Refrence

M.E.Peskin & D.V.Schroeder: An Introduction to Quantum Field Theory
M.D.Schwartz: Quantum Field Theory and the Standard Model
David Tong: Quantum Field Theory
S.Weinberg: The Quantum Theory of Field (Volume 1)
刘川: 量子场论
郑汉青:量子场论(上)

相互作用理论的基本假设

前面研究的都是自由场的量子化。所谓自由场,就是指不存在场之间或场与自己的耦合,这样的理论只能描述自由粒子。但是实际世界中的粒子都是存在相互作用的,因此有必要考虑一个包含相互作用的量子场论。

对于自由场论,其拉格朗日密度包含由场算符所构造的所谓动能项和质量项;一个简单的想法是直接在其中加入由多个场算符耦合的项:

其中$\mathscr L_{\rm int}$可以包含$\phi$、$\psi$、$A^\mu$等我们已经熟悉的场类型,以及导数算符$\partial^\mu$等更复杂的形式。最简单的一些相互作用项例如:

它们都只包含场算符的直接相乘(不包含导数算符等)。每一项前的系数称之为耦合常数,它的大小大致代表这一相互作用项的强度。

就像任何一个物理理论一样,在我们即将讨论的相互作用场论中也需要从一些基本假设出发进行演绎。但是相比于自由场论来说,相互作用场论要复杂许多,从零开始讨论如何构造不太现实;而我们相信自由场论和相互作用场论理应是融洽的,因此一个有效的方法是直接借鉴自由场论的假设和结论,再在讨论过程中对细节加以修正。

下面我们仍从正则体系出发考虑,给出相互作用场论的六条基本假设:

  • 量子场算符$\phi_\alpha$满足的算符方程与经典场方程具有相同的形式:

  • 场算符和正则场动量满足等时正则对易关系(反对易关系):

  • 庞加莱群在Hilbert空间上的表示的生成元$P^\mu$、$J^{\mu\nu}$,是场算符在庞加莱变换下的Noether荷:

    其中$(J^{\mu\nu})_\alpha^\beta$是场所属洛伦兹表示的生成元。

  • 理论的Hilbert空间中存在一个真空态$\ket{\Omega}$,它是理论哈密顿量$H$的基态;
  • 理论的Hilbert空间中还存在一系列能量和动量的共同本征态$\ket{\lambda_{\bf p}}$,携带能量$E_\lambda$和动量${\bf p}$,它们是完备的:

  • 存在一系列本征态$\ket{\lambda_{\bf p} }$,称为单粒子态,它们满足在壳条件$E_{\lambda}^2 = {\bf p}^2 + m^2$,其中$m$是这个粒子的物理质量(将会看到,它不一定等于拉格朗日量中的参数$m$;详见重整化部分)。在$E-{\bf p}$图上,这些单粒子态构成一条孤立的曲线。

这就是我们后续讨论相互作用场论的基本出发点。

形式散射理论

散射问题

就像量子力学中曾经做过的一样,在量子场论中我们最常要处理的散射问题,就是两类过程,分别由如下两个可观测量描述:

  • 由两个初态粒子散射到多个末态粒子的过程,其由(微分)散射截面描述,在实验室系(即认为运动的束流轰击到静止靶上的参考系)中可以表示为:

    其中$N$是实验探测到的被散射粒子数,也称事例数;$I$是流通量,即单位时间穿过单位面积的入射粒子数,表示入射粒子束流的强度;于是微分散射截面${\rm d}\sigma/{\rm d}\Omega$就表示在一定时间内,在立体角$\Omega\sim\Omega+{\rm d}\Omega$方向探测到的被散射粒子数,与单位面积入射粒子总数之比;微分截面对所有方向积分就得到总截面:

    表示一定时间内,一起探测到的被散射粒子数与单位面积入射粒子总数之比;因此$\sigma$实际上表示入射粒子所感受到的“有效截面积”,这也是它得名的由来。

  • 由一个初态粒子衰变到多个末态粒子的过程,其由衰变宽度描述:

    其中$N$是未衰变的粒子数。它也称为粒子的衰变率,因为它实际上就是单位时间粒子衰变的概率:

若同时存在多个过程,还可以分别对每个过程计算分截面或分宽度,它们的直接加和就是总的截面或宽度。在下一节将会看到,为什么这样定义可观测量并选取它们来描述散射过程,以及如何在理论上预言这些可观测量。本节首先建立起为描述这些可观测量并理论计算所需要的的理论基础。

场算符的时间演化

在正式进入相互作用场论和散射理论的讨论之前,由于一般而言我们考虑的相互作用过程总是发生在一段时间之内的,因此有必要严谨地考虑“时间演化”在量子场论中的描述方式。

在之前对量子场的讨论一直是以拉格朗日量为核心,将时空完全视作一体,其好处是可以反映理论的协变性,但在描述散射过程这样明显依赖于时间演化的过程时就不甚方便。因此在下面我们将以哈密顿量为核心,检查它如何主导理论中态和场(算符)的演化,并给出对于散射的恰当描述。

回顾在正则量子化中,经典场$\phi(x)$尽管是包含时间依赖的,但对其量子化的方法是施加等时正则对易关系:

也就是量子化条件不包括时间依赖,也就是没有确定场算符的时间演化方式。这允许我们采用量子理论中三种绘景的描述方式来看待量子场及其相应的量子态。

以标量场为例,如无特殊说明,下面的理论中$\phi(x)$都是包含相互作用的场。并且在下面,我们均假定相互作用的结构本身不随时间改变,并设定$t_0$时刻为三个绘景的重合时刻,即$\phi^{\rm H}(t_0,{\bf x}) = \phi^{\rm S}({\bf x}) = \phi^{\rm I}(t_0,{\bf x})$。

薛定谔绘景

薛定谔绘景下,无论是否包含相互作用项,场总是可以模式展开,并且场算符作为算符,不承担时间演化,即

其中的产生湮灭算符$a^{ {\rm S}\dagger}_{\bf k}$、$a^{\rm S}_{\bf k}$​也都是不含时的。

上述结论和形式无论对于自由场论还是相互作用场论都是一致的。

这样的算符没有明显地显示出协变性,因此在相对论性量子场论中,薛定谔绘景并不常用。

海森堡绘景

如果我们希望明显体现协变性,最简单的方式是采取海森堡绘景。海森堡绘景下,场算符的时间演化为:

  • 自由场论:总哈密顿量$H = H_0$,对应的时间演化算符$S(t,t_0) = {\rm e}^{-{\rm i}H_0(t-t_0)}$,场算符$\phi^{\rm H}(t,{\bf x})$满足经典场方程$(\partial^2 - m^2)\phi(x) = 0$​​​,这导致

    并且

    因此海森堡绘景下任意时刻的场算符是

    可见在海森堡绘景下,自由场论的产生湮灭算符$a^{ {\rm H}\dagger}_{\bf k}$、$a^{\rm H}_{\bf k}$是不随时间改变的。

  • 相互作用场论:一般而言,此时$H$与产生湮灭算符的对易关系而比较复杂,场算符在不同时刻的模式展开也不再能保持系数一致的形式:

    其中

    可见在海森堡绘景下,相互作用场论的产生湮灭算符$a^{ {\rm H}\dagger}_{\bf k}(t)$、$a^{\rm H}_{\bf k}(t)$​随时间改变,具体对时间的依赖取决于相互作用项的具体形式。

这表明,尽管海森堡绘景能较方便地处理自由场论,但对于存在相互作用的场论,由于其产生湮灭算符随时间变化,而变得不再方便。为此,我们在处理相互作用场论时引入更方便的描述:相互作用绘景。

相互作用绘景

相互作用绘景下,场算符的时间演化与海森堡绘景中自由场的演化一致:

由于场算符的演化是自由哈密顿量$H_0$决定的,因此

也就是说,这样设计的优点在于,即使是相互作用场论,其在相互作用绘景中的产生湮灭算符$a^{ {\rm I}\dagger}_{\bf k}$、$a^{\rm I}_{\bf k}$也不随时间改变。换句话说,相互作用绘景下的场算符演化行为,与自由场是一致的。

态的构造及其时间演化

LSZ理论

上述描述是从实验角度来看的;那么我们如何用已知(或将会已知)的理论描述这样的散射过程呢?

直观来看,对于一个散射的全过程,当$t\to-\infty$的无穷早过去,应该将会看到相距甚远的若干粒子,彼此之间相互作用可以忽略不计,于是它们可以被视为自由粒子,此时的物理态适合用自由场论的多粒子态来描写;但是随着时间发展,各个粒子逐渐靠近并发生相互作用,尤其是在$t=0$附近的散射时期,此时不可能再用自由场论来描述体系的状态,必须使用相互作用场论中的多粒子态;在相互作用完成之后,随时间的发展,各个粒子有逐渐远离,相互作用也逐渐减弱,体系又将在$t\to+\infty$的无穷远将来,再次近似成为另一个自由多粒子态。

因此可以看到,要想完整描述一个完整的相互作用过程,在我们所需要的理论中至少应该同时存在有三套场论(所谓“一套场论”指的是一个Hilbert空间以及其上的场算符):在$t\to-\infty$时的“自由场论”,在$t\to+\infty$时的“自由场论”,以及在散射阶段的相互作用场论。对“自由场论”加引号是因为,我们期待在$t\to\pm\infty$时它们看起来像自由场论的一些性质,但一个相互作用体系在时间极限下能否真的成为自由场论,还有待讨论。在散射的不同阶段,分别使用这三个不同的场论来描述物理体系;为此我们还需要知道这三个场论如何联系起来,以及对它们有怎样的要求。

下面我们将会以标量场为例,陈述关于散射描述的一套公理化理论的基本假设,这套理论被称为LSZ理论,它是公理化量子场论的一种基础方案。

入态、出态;入场、出场

首先定义入态$\ket{\alpha,{\rm in} }$和出态$\ket{\beta,{\rm out} }$,它们分别用以描述在$t\to-\infty$和$t\to+\infty$时的(具有物理质量$m_{\rm phy}$的)自由粒子态。在之后重整化章节将会看到,“具有物理质量”这一条件将使得它们并不是真正意义上的“自由场论”。

所谓入态、出态是指这样的物理态:它们可以是具有任意粒子数和量子数的态,若是多粒子态,则我们认为其中的粒子之间没有相互作用;态中的每个粒子至多只在自相互作用的影响下传播。我们要求它们同属一个Hilbert空间,并且满足如下条件:

  1. 在$t\to-\infty$时,全部入态构成Hilbert空间中的一个完备集;
  2. 在$t\to+\infty$时,全部出态构成Hilbert空间中的一个完备集。

这是形式散射理论的基本假设,他们保证了我们的确能够用入态、出态分别描述散射前后的物理态,并且任何入态/出态,都能表示为若干出态/入态的线性组合。

接下来定义入场$\phi_{\rm in}$、出场$\phi_{\rm out}$,它们分别是在$t\to-\infty$和$t\to+\infty$时与入态、出态相关联的海森堡绘景场算符。它们满足我们一般对自由场论的要求,这包括:

  • 入场、出场和入态、出态在庞加莱变换下满足自由场、自由态的变换性质,即庞加莱群在入态、出态Hilbert空间上的表示的生成元$P^\mu$、$J^{\mu\nu}$,是入场、出场算符在庞加莱变换下的Noether荷:

  • 入场、出场,满足具有物理质量的自由场方程,例如对于标量场,就是$(\partial^2 + m^2_{\rm phy})\phi_{\rm in/out} = 0$;这意味着它们的拉格朗日密度中质量参数也取物理质量$m = m_{\rm phy}$,于是入场和出场具有相同的拉格朗日密度(这应该是显然的)。
  • 入场、出场满足自由场方程,也意味着它们可以分别模式展开得到两套产生/湮灭算符:

    它们分别满足:

    即入场、出场之间存在平行的两套算符体系。

  • 入态、出态共用一个真空态。具体来说,一个多粒子入态/出态就定义为:

    这里$\ket{0_{\rm in} }$和$\ket{0_{\rm out} }$分别是入态、出态的真空态,而我们将其视为同一个真空$\ket0$,因为入场、出场具有相同的拉格朗日密度,而入态、出态属于同一Hilbert空间,因此在下面将会看到,它们的真空态至多只差一个相因子,而真空上的所有相因子不影响任何可观测量,也不影响用路径积分构建的微扰论;在这个意义下我们认为入态、出态共享一个真空态。

    注:尽管如此,真空的相因子在用相互作用绘景和正则理论构建微扰论时,的确蕴含一些信息:它表明,计算S矩阵时要扔掉所有真空图的贡献。

  • 入场、出场算符分别构成完备算符集。入场的完备性指的是,Hilbert空间中任意两个态,都可以由若干入场算符$\phi_{\rm in}$的泛函作用而实现态矢变换;这意味着Hilbert空间上的任何算符都可由场算符$\phi_{\rm in}$构成;若存在一个算符与全体入场算符对易,那么它只能是c-数。出场的完备性也如上述。
  • 入态、出态的完备性分别等价于入场、出场的完备性。具体来说,入场、出场算符生成的一切可能的粒子数和量子数(动量、自旋……)的入态、出态分别构成Hilbert空间的完备集。在这个意义下,入态的完备性指的就是,Hilbert空间中的任何态,都可以表示为形如:

    即产生算符的任意乘积所构成多粒子态的任意线性组合;其中$\mathcal A\{a^\dagger_{ {\bf k},{\rm in} } \}$表示入态产生算符构成的代数。于是显然,入态完备性等价于入场的完备性;出态和出场的完备性也是等价的。

为区别于下面的内容,我们将入场、出场称为渐近场或辅助场;入态、出态称为渐近态。

内插场,弱渐近条件

现在要引入描述相互作用的工具,即相互作用场论的海森堡绘景场算符$\phi(x)$,它满足我们在本章第一节的讨论和六条基本假设,称之为内插场。注意到它的质量参数满足的是有源运动方程,以标量场为例:

我们只关心对特定入、出态的散射波有贡献的源:

于是相互作用场的场方程可以形式上写为:

我们想要得到内插场与渐近场的关系。注意到我们既然希望在$t\to\pm\infty$的极限下,相互作用场论可以渐近地成为“自由场论”,因此一个尝试就是:

这被称为场的强渐近条件。这是可能实现的吗?答案是否定的。因为结合渐近场方程,并利用超前/推迟函数,可以将内插场方程的解写为:

此即Yang-Feldman方程。要想使前述的强渐近条件成立,除非源$\eta(x)$仅在有限时间内具有非零值;但这意味着当时间大于某一值$|t|>T$,相互作用场的相互作用就消失了,这是不符合我们之前的假设的(我们认为“自由场论”仅在$t\to\pm\infty$的极限才可能存在);事实上,在微扰论将会知道,一个孤立传播的粒子总会存在不能关闭的自相互作用。因此强渐近条件不适合作为我们对内插场的要求。

那么尝试放宽条件,考虑如下的弱渐近条件

即我们仅仅要求在$t\to\pm\infty$时刻,相互作用场论的场在波包意义上渐近于自由场的波包即可。在这个意义上,我们就可以认为在$t\to\pm\infty$时刻的相互作用场所激发出的粒子态是渐近于自由粒子态。

值得指出的是,弱渐近条件在$t\to\pm\infty$时,其等号右侧的函数实际上是随时间高度振荡的,因而实际上不存在可定义的极限,为此需要将其对时间平均以赋予该极限一个确定的意义。具体来说,我们将弱渐近条件中极限的实际意义视为:

其中$f(x)$是任意可归一化的自由场方程解。

单粒子波函数

利用内插场所满足的庞加莱变换性质:$[\phi_\alpha(x),P^\mu] = -{\rm i}\partial^\mu\phi_\alpha(x)$,即:

结合入态、出态在算符$P^\mu$作用下的结果,可以得出一个重要关系。首先考虑内插场在真空态和单粒子态之间的矩阵元:

其中$\bra{0,{\rm in} } \phi(0) \ket{ {\bf k},{\rm in}}$是一个确定的数,因此这个结果实际上就正比于场方程的一个平面波解;而事实上

因此$\bra{0,{\rm in} } \phi(x) \ket{ {\bf k},{\rm in}} \propto \bra{0,{\rm in} } \phi_{\rm in}(x) \ket{ {\bf k},{\rm in}}$。对于出态也是同理:

类比于自由场的情况,我们将上式称为单粒子波函数。

注意到平面波${\rm e}^{-{\rm i}k^\mu x_\mu}$是场方程的解,则

即内插场的源在真空态和单粒子态之间的矩阵元为零。这一等式在讨论色散关系时非常重要。

上述结论对出态也都是成立的。

相对论不变性,微观因果性

前述的若干陈述其实可以归结为LSZ理论的五条基本公理:

  • 庞加莱不变性
  • 微观因果性
  • 粒子谱条件
  • 场算符完备性
  • 场的渐近条件

它们是任何类型的相互作用场论都应该遵循的基本假定。从逻辑上来说,我们首先通过前四条假定来引入合适的内插场,再根据渐近条件引入入场和出场,于是一个完整的相互作用理论就建立起来了。

S矩阵

定义

这样就可以正式开始讨论散射的描述。

无穷早过去的自由$n$粒子态$\ket{\alpha,{\rm in} } = \ket{p_1,\dots,p_n,{\rm in} }$在相互作用哈密顿量$H_{\rm int} = -\mathscr L_{\rm int}$的决定下,从$t\to-\infty$演化到$t\to+\infty$,得到无穷远将来的另一个自由$m$粒子态$\ket{\beta,{\rm out} } = \ket{k_1,\dots,k_m,{\rm out} }$。由于入态和出态分别构成Hilbert空间中的完备集,因此可以定义在两个完备集之间相互变换的幺正算符

,具体来说我们定义**$

$S$

算符**为将特定出态映射到与其量子数相同的入态:

幺正算符$S$保持态的内积,从而也保证概率守恒:

从中立即可以得到$S$算符对渐近场的作用,注意到:

于是可得

形式上,可以将$S$算符表示为:

可见,尽管我们已经知道入态和入态(或出态和出态)算符之间的简单关系,但入态和出态之间的关系都被编码在$S$算符中,而这部分正是散射过程中的非平庸信息。为将这点看得更清楚,我们不妨考察$S$算符在同一套完备集中的矩阵元:

称之为$S$矩阵元。可见$S$矩阵元$S_{\beta\alpha}$事实上正是初末态之间的跃迁概率幅。

因此$S$算符的确包含了任意初态散射为末态的全部概率信息。我们要想知道一个散射过程并求出可观测量,原则上就需要求出这个过程的$S$矩阵。

真空稳定性,单粒子稳定性

为了完整定义$S$矩阵,还需要定义其在真空态的作用;注意到我们认为入态和出态的真空态至多相差一个相因子:

即我们认为真空到真空的跃迁概率是1,跃迁矩阵元是一个单位模的纯虚数,这代表真空态的稳定性,因为这代表如果任何散射都没有发生,体系仍然保持真空态。不妨忽略该相因子,于是

于是

即真空态对入态和出态都是一样的。

另一个类似的要求是其对单粒子态的作用:

根据Yang-Feldman方程,有:

在其两边作用算子${\rm i}\int{\rm d}^3x {\rm e}^{ {\rm i}k^\mu x_\mu}\overset{\leftrightarrow}{\partial_0}$,就得到

于是

其中利用了单粒子波函数是算子$( \partial^2 + m^2 )$的零本征解这一事实。于是得到结论:

即若入态为动量为${\bf k}$的单粒子态,那么一定以概率为1散射到出态也为动量为${\bf k}$的单粒子态,这被称为单粒子态的稳定性。于是:

即单粒子态对于入态和出态也是一样的。

利用真空态和单粒子态的稳定性,前面曾经讨论过的有关单粒子波函数的结论就可写为:

此外,真空态和单粒子态的稳定性给出的推论是:

尽管如此,更多粒子数的多粒子态,对于入态和出态一般来说是不同的。

LSZ约化公式

现在我们明确了散射问题的核心是S矩阵,如何利用我们已经建立的场论方法计算这一矩阵元呢?这就是本章的一个重要结果——LSZ约化公式(以标量场为例):

它将特定出入态的散射S矩阵元与场的编时关联函数相联系起来。其中对每个入态和初态的单粒子动量分别对应于关联函数中的一个场算符,并且通过被算符$\partial^2 + m^2$作用且傅里叶变变换来联系,其中指数上的虚数符号对入态动量是$-{\rm i}$而对出态动量是$+{\rm i}$。积分的时空区域遍及散射发生的全部时空,即由入态、出态所处时空为边界决定的区域,特别地,基于前面的讨论,这里的时间积分从过去渐进时刻到未来渐进时刻$-\infty<T<+\infty$。

简单观察一下该公式的形式。注意到算符$\partial^2 + m^2$在傅里叶变换得到$-p^2 + m^2$,它作用于自由场(或渐近场)的结果是零,因此在对会移除掉编时关联函数中除了具有极点$\frac{1}{p^2-m^2}$之外的所有项,也就是在积分后仅留下渐进时刻在壳的传播子,S矩阵由这些极点的留数给出。因此LSZ约化公式实际上是说,编时关联函数投影出单粒子渐进态就得到S矩阵。

下面证明LSZ约化公式。

首先利用渐近场的产生湮灭算符,定义作为多自由粒子态的入态和出态为:

考虑LSZ公式中的单个部分:

可观测量

如果已经求出S矩阵,下一步就需要将其联系到对可观测量的预言上来,具体来说,就是前面提到的散射截面和衰变宽度。

散射振幅与不变相体积元

假设在归一化初态$\ket i$到归一化末态$\ket f$之间发生散射,跃迁矩阵元$S_{fi} = \bra f S \ket i$给出散射发生的概率:

其中我们只关心$\ket f \neq\ket i$的发生了实际散射的过程,因此从完整的$S$中拆分出:

即真正描述非平凡过程的是S矩阵的非对角部分,称之为T矩阵元$T_{fi}$。又由于我们总是要求初末态的4-动量守恒,于是进一步:

于是概率就写为:

因此$\mathcal M$得名为散射振幅,它的模方是除了一些系数之外真正决定散射发生概率的量。它也是洛伦兹不变的,于是也称不变振幅、不变矩阵元。


但直接与和实验观测相关联的初末态未必是归一化的。假设初态是$m$自由粒子态$\ket\alpha$,末态是$n$自由粒子态$\ket\beta$,那么发生这个过程的概率则是:

注意到在自由场论中我们对产生湮灭算符的对易关系得到$\ket\alpha$的模是

现在分子分母都出现了$\delta^{(4)}(0)$或$\delta^{(3)}({\bf 0})$,看起来它们在动量空间是发散的,这表面原因是因为我们假定动量${\bf p}$可取连续值,但本质原因是在这里没有限制散射发生的时空区域:实际物理发生的散射不可能是持续无穷长时间、占据无穷大空间的。

我们在下面采取这样的假设:认为散射过程仅发生在有限空间体积$V$、有限时间长度$T$的箱内,并且为保持时空平移不变性仍然成立,需要加上周期性边界条件,这就限制可取的动量为离散值。于是在箱归一化下,我们记号里的$\delta$函数实际上的意义是:

于是在箱归一化下,初态的模为:

末态同理。散射概率写为

这个概率表示的是散射到末态动量空间中确定动量${\bf k}_j$附近体积$((2\pi)^3/V)^{n}$的概率,而我们需要的是散射到末态确定动量的概率密度,或者说散射到末态动量空间中确定动量附近的单位体积元${\rm d}^3k_j$的概率:

这本质上就是又将离散化的动量转回连续取值。于是对于初态动量确定的散射过程,总的散射概率只要对所有可能的末态动量积分即可。为简化表达式,可以定义末态$n$粒子洛伦兹不变相空间体积元

它是所有满足4-动量守恒条件的末态相空间体积元。最后,我们还应该考虑当末态处在全同粒子时导致的统计修正。具体来说,若末态中某用$r$标记的全同粒子出现个数为$n_r$,那么整体概率需要一个修正因子$r = 1/\prod_r n_r!$。于是最终可将概率密度写为:

注意到除了全同粒子统计因子和与时空区域相关的因子之外,散射概率由两部分决定:散射振幅$\mathcal M_{\beta\alpha}$与所谓的“末态密度”$\frac