E.密度算符

到目前为止关于测量和演化的讨论都是基于这样一个前提,即假设我们已经明确知道物理系统的初态,它可由希尔伯特中的一个确定的态矢量$|\psi \rangle$所完全描述。

但实际情况下我们对物理系统的状态往往知道地不够确切,而是仅仅知道态的统计分布,例如自然光源中发出光子的偏振态。因此有必要通过引入统计学方法,在理论描述中加入这样不完备知识的影响。可以期望的是,这样得到的处理方法将有望把量子理论应用于统计物理系统。

态的统计混合

一般而言对于体系知识的不完备,都会归结于概率性描述,即我们不能明确知道物理系统处于哪一个态,而仅仅知道它可能处于的一系列态$|\psi_1\rangle,\ |\psi_2\rangle,\ \dots$,并且我们知道它的统计分布,即物理系统处于$|\psi_1\rangle$的概率为$p_1$,处于$|\psi_2\rangle$的概率为$p_2$,且

此时,就称我们所处理的对象是$|\psi_1\rangle,\ |\psi_2\rangle,\ \dots$分别以$p_1,p_2,\dots$所组成的统计混合统计系综

类似这样的由于对系统所知不完全而引入的概率性描述,在经典力学中也曾经做过。它并不来源于量子力学本身独有的性质,也与量子力学在测量过程中所涉及的(我称之为)”量子概率性“完全不同;但将会看到,为了在量子力学中引入这种(我称之为)“经典概率性”,迫使我们选择一种与之前完全不同的量子理论框架来进行描述。

注意:

  1. 要将“态的统计混合”与“态的线性叠加”明确区分。在之前的讨论中,曾经出现过若干态的“叠加态”:

    但它所表达的仍是一个确定的态矢,只不过在某些情况下,若可将诸$|\psi_i\rangle$取为某观察算符的本征矢,那么在对该可观测量进行测量之后,物理系统将会以$p_i=c_i^* c_i = |c_i|^2$的概率处于本征态$|\psi_i\rangle$处。

    正如在Chap.3笔记第5.1节所讨论的那样,对于“态的线性叠加”的情况,其概率结果中通常会出现形如$c_k^* c_h$这样的交叉乘积,即叠加项之间的干涉效应,而在“态的统计混合”中是不会出现的。这是两者的一个重要差别。

  2. 在“态的统计混合”的描述下,理论中将会出现至少“两种”概率:其一是由于我们对系统初态所知不完全而导致的,即前述的”经典概率性“;其二是在测量的过程中,量子力学要求我们只能得到概率性的结果,即前述的、也是一直以来在讨论的”量子概率性“。在态的统计混合情况下,对任意系综进行的测量其最终的结果,一定是两种概率的共同作用。

  3. 一般而言参与统计混合的各个态$|\psi_1\rangle,\ |\psi_2\rangle,\ \dots$不一定是相互正交的。不过在下面的讨论中,将会取它们为归一化的。

正是因为在态叠加情况下干涉项的存在,保证了我们不可能用任何单独的”叠加态“——或者说一个”平均态矢量“来对统计混合系统进行描述,因此传统上利用态矢量对物理系统的描述在统计混合情况下是失效的。看来要想实现对态统计混合的描述,只好使用先分别计算各个可能态下的物理预言、再分别以概率权重对其求和这种不甚方便的办法。

一个想法是,正如在统计学和统计物理中引入了与概率相关的矩阵,在量子力学中是否可以用一个”平均算符“来实现这种对统计混合的描述?

纯态:密度算符的引入

首先考虑一种简单的情况,即一直以来所讨论的,物理系统确切地只处于一个态$|\psi_k\rangle$上,在这里我们称之为在该态的概率为$p_k=1$,而其他任何态的概率均为$0$。将这种已经充分讨论过的简单情况在这里称为”纯态“,相应地,态的统计混合系综则称之为”混态“。如果在纯态中找到一种不同于传统态矢量的新描述方法,那么或许可以将之推广到对混态的更一般的描述上。

回顾在纯态情况下,我们总是取态空间的一组基$\{|u_n\rangle\}$,并将任意态矢量在其中展开:

其归一化条件即为$\sum_n |c_n(t)|^2=1$。在该态上对可观测量$A$的测量期望为:

而态矢的时间演化服从薛定谔方程:

从以上的描述中可以发现,在对可观测量的测量中,诸系数$c_n(t)$总是以$c_n^*(t)c_m(t)$这样的二次项形式出现在期望值中的;而不难发现这些二次项正是如下投影算符的矩阵元:

这一形式实际上在之前的讨论中已经见到过:回顾在坐标表象下的概率密度$\rho({\boldsymbol r},t)=\langle {\boldsymbol r} |\psi(t)\rangle\langle\psi(t)| {\rm r} \rangle$正是$\rho(t)$在坐标表象下的”矩阵元“,而它在我们建立起波函数语言之前,一直是描述古典量子力学的重要工具。

因此自然地可以考虑引入密度算符

及其在基$\{|u_n\rangle\}$下的密度矩阵(注意系数取复共轭的顺序):

显然它是一个厄米算符:

并且对于任意右矢$| v \rangle$:

即$\rho$是正定的。$\langle v | \rho | v \rangle$实际上正是系统处在$|u\rangle$处的概率密度。

下面逐一说明密度算符用于描述量子系统的有效性。首先:

即态的归一化对应于密度算符迹的归一化,这也是概率守恒(概率的全局守恒)的体现,例如在坐标表象下:

另一方面,可观测量的期望值可由由$\rho(t) A$的迹来计算:

可观测量期望值为${\rm Tr} \{\rho(t) A\}$

最后,密度算符的时间演化满足:

即${\rm i}\hbar\dfrac{\rm d}{ {\rm d}t}\rho(t) = [H(t),\rho(t)]$。

当然,作为完整的量子力学理论,必须给出得到某个测量值的准确概率。在标准的量子力学体系中,测量得到本征值$a_n$的概率是其本征子空间上投影算符$P_n$的期望值:

因此在密度算符的语言下,该期望值可以直接得到:

根据上述的讨论可以看到,对于纯态来说,密度算符描述和态矢量描述是完全等价的两种描述。并且在某些方面,密度算符描述还具有一定的优越性。例如:

  • 描述同一个物理态的态矢量在数学上存在一个相位因子的任意性(即便已经归一化);而密度算符则不存在这种相位因子带来的任意性。
  • 在态矢量语言下,很多期望值都是态矢量的二次式;而它们在密度算符语言下则成为$\rho$的线性式。可以期待这会大大简化在混态情况下的计算。

此外,在纯态情况下,由于密度算符是简单的一个投影算符,因此具有一些性质:

而将会看到,在混态情况下,它们是不成立的。

混态:密度算符的应用

考虑态的统计混合情况,即如下纯态组成的系综:

若系统处于其中某个纯态$|\psi_k\rangle$,则对可观测量$A$测量得到本征值$a_n$的概率是

于是在统计混合系综中测量结果就需要对各个态的可能概率进行加权:

在密度算符的语言下,这一概率可以写为:

其中已经对混态定义了混态密度算符

因此对于混态系统的所有物理测量又可以表现为其$\rho$的线性项。

密度算符的一般性质

  1. 正定性仍然成立:

    与纯态的结论是相同的。

  2. 由于各个概率$p_k$均为实数,而各个纯态的密度算符为厄米算符,因此混态的密度算符也是厄米的:

    与纯态的结论是相同的。

  3. 混态密度算符的迹也为1:

    与纯态的结论是相同的。从物理上讲,尽管我们可能不清楚系统的初态具体信息,但其概率守恒至少是保持的。

  4. 在混态下,可观测量的测量结果期望为:

    与纯态的结论是相同的。

  5. 要讨论混态密度算符的时间演化,尽管不清楚系统初态的具体信息,但应当明确知道其哈密顿量$H(t)$。由此可知,若系统在初始时刻$t_0$处于$|\psi_k(t_0)\rangle$的概率为$p_k$,那么在之后的某时刻$t$处于$|\psi_k(t)$的概率也应当为$p_k$。而每个纯态的演化服从薛定谔方程,于是在$t$时刻密度算符为:

    其中每个纯态密度算符的演化均满足:

    于是混态的密度算符演化满足:

    与纯态的结论是相同的。

上述结论,均可由纯态直接推广到混态的情况。尽管如此,对于混态仍有部分结论与纯态不同。例如,混态的密度算符一般不再是投影算符,因而:

只有当系统实际上为纯态时,上述式子才可能取等号,因此这也是判断系统是否为纯态的一个方法。

密度矩阵的矩阵元:布居数、相干元

在基$\{|u_n\rangle\}$下密度矩阵$[\rho]$的矩阵元为:

首先考虑其对角元:

其中$|c_n^{(k)}|^2$的物理意义是在纯态$|\psi_k\rangle$中测量后得到本征态$|u_n\rangle$的概率,因此$\rho_{nn}$则表示在该系综测量后得到$|u_n\rangle$的平均概率,称之为系综在态$|u_n\rangle$的布居数。显然布居数$\rho_{nn}\geq 0$,当且仅当全体$|c_n^{(k)}|^2$都为零时取等号。

而密度矩阵的非对角元则为

正如在Chap.3的笔记中所讨论的,出现$c_n^{(k)} c_m^{(k)*}$的交叉乘积项,表明此时系统存在态$|u_n\rangle$与态$|u_m\rangle$的干涉效应。这一项的存在表明着,在混态系综中有一定概率$p_k$可能存在着$|u_n\rangle$与$|u_m\rangle$的某个线性叠加态(仍然是纯态)$|\psi_k\rangle$。

而混态密度矩阵的非对角元$\rho_{nm}$则表示$|u_n\rangle$与$|u_m\rangle$的各种干涉效应在系综中的平均:由于$c_n^{(k)} c_m^{(k){*} }$是复数,因而即便所有交叉乘积项都非零,非对角元$\rho_{nm}$也可能为零,这意味着各个干涉效应相互抵消了;反之,若非对角元不为零,则说明各个干涉效应不能完全抵消,即$|u_n\rangle$与$|u_m\rangle$存在一定相干性。因此将$\rho_{nm}$称为$|u_n\rangle$与$|u_m\rangle$的相干元

当然,密度矩阵显然是依赖于基的选取的,因此布居数与相干元之间其实并没有明确的界限。由于密度矩阵是厄米的:$\rho^\dagger = \rho$,因此总存在正交归一基$\{|\chi\rangle\}$使$\rho$对角化,此时

且:

因此可以认为密度算符$\rho$描述的是各个$\{|\chi\rangle\}$之间无相干的统计混合。

另一方面, 若选取的基$\{|u_n\rangle\}$是不含时哈密顿量$H$的本征态$H|u_n\rangle = E_n |u_n\rangle$,那么可得$\rho$的对角元和非对角元时间演化分别为:

可见密度矩阵的布居数总为常数,而相干元以玻尔频率进行振荡。

并且密度矩阵的布居数和相干元之间还有关系:

即系统只可能在布居数非零的态之间存在相干元。

F.演化算符

在Chap.3的讨论中已经看到,由于薛定谔方程使态随时间演化的结果是线性的,因此存在一线性算符将初态映射到任意时刻:

称$U(t,t_0)$为系统的演化算符

演化算符的一般性质

显然,演化算符必须满足初值条件:

此外,不难验证其本身也满足薛定谔方程:

因此利用其初值和演化方程,就可完全确定$U(t,t_0)$。可以形式地将之表示为一个积分方程:

需要强调的是,由于薛定谔方程本身并不禁止,演化算符$U(t,t_0)$的两个时间参数$t$和$t_0$实际上并不一定要求存在时间先后顺序关系。

根据其定义,可以得到演化算符的乘法关系

若在其中令$t_0=t$,则可得到

这也回应了先前所述的演化算符对两个时间参数并无顺序要求:顺序交换的意义只是演化算符取逆。

将前述乘法关系进一步扩展就可以得到:

其中$t_n,t_{n-1},\dots,t_0$也都是任意的。

一个能够方便地精确求解演化算符所满足方程的例子是无穷小演化算符。考虑薛定谔方程的无穷小时间间隔形式:

因此得到无穷小演化算符

由于$H(t)$是厄米算符,根据Stone定理可知,$U(t+{\rm d}t,t)$是幺正算符。

于是有限长时间的演化算符总可以表示成无穷小演化算符之乘积,因而也是幺正算符——这是自然的,因为我们期望态矢在演化的过程中总是保持模不变的。于是有:

保守系的演化算符

对于不显含时的$H$,演化算符的积分方程可以直接求解得到:

若将之应用到哈密顿算符$H$的本征态$|\phi_{n,\tau}\rangle$上,就能直接得到定态演化规律:

利用演化算符的概念,我们也可以更方便地描述两次间隔一定时间的测量行为:在第一次测量后系统变为某个本征态,而经过一段时间后其演化到可由演化算符所确定的态,此时再被第二次测量。

需要强调的是,对于显含时的$H(t)$,演化算符所满足方程的解一般不能简单表示为形如${\rm e}^{-\frac{\rm i}{\hbar}\int_{t_0}^t H(t’){\rm d} t’}$这样的形式。严格的求解需要引入编时乘积的概念。

G.量子力学的绘景

在之前的描述中,当我们要将时间演化引入到理论体系中时,我们所选取的做法是将时间演化全部归结于态$|\psi(t)\rangle$的演化,而对应于可观测量的观察算符则一般都是与时间无关的(除了少数的特例,例如哈密顿算符)。在这样的观点下,态矢的演化由薛定谔方程所决定,这也是薛定谔所建立的”波动力学“的基本观点,因此这种对量子体系时间演化的描述被称为薛定谔绘景

然而,量子力学事实上真正可以直接观测并不是态矢,也不是观察算符,而是所谓”标量积“,它是由左矢、算符、右矢所共同构成的标量:

因此量子力学中的时间演化问题,实际上是这样的可观测量的时间演化问题。除了将时间演化归结为态矢的演化:

存在另一种观点,它将时间演化归结为算符本身的演化,而态矢则保持不变:

在历史上,海森堡首先基于这种观点推导出各种可观测量所对应的矩阵随时间的演化,并建立起”矩阵力学“,因此这种对量子体系时间演化的描述被称为海森堡绘景

今天我们知道,薛定谔的波动力学与海森堡的矩阵力学是完全等价的,因而薛定谔绘景与海森堡绘景事实上也是对同一物理过程的描述不同但完全等价的两种观点。

在本节中,加下标$S$的表示其是薛定谔绘景下的量,加下标$H$的表示其是海森堡绘景下的量。

需要强调的是,我们这里所讨论的可观测量,暂时只讨论不显含时的可观测量,例如坐标算符或动量算符,以此来突出其在两种绘景下的差异。若算符本身显含时,那么无论在哪个绘景之中都是显含时的,自然也是随时间变化的。在本节中,当我们使用“演化”一词,指的就是仅仅由于绘景所引起的符号对象随时间的改变,包括态矢的演化和算符的演化,而这一部分包含算符由于其本身显含时而随时间的变化。

两种绘景的时间演化

为了便于比较,我们假设系统从相同的初态开始演化,再在不同的绘景下观察其演化。理论要求两种绘景得到的结果应当是一样的。

假设系统的初态处于$|\psi(t_0)\rangle=|\psi_S(t)\rangle=|\psi_H(t)\rangle$,算符初态为$A(t_0)=A_S(t_0)=A_H(t_0)$。

在薛定谔绘景下,态矢量演化就是熟悉的薛定谔方程:

或者利用演化算符将之表示为:

而算符本身则保持不变:

另一方面,在海森堡绘景下,态矢则是不变的:

而算符承担了时间演化的任务(时间演化算符对其作用服从幺正变换对一般算符的作用):

显而易见,经过一定时间演化过后,两种绘景下的态矢和可观测量之间存在一定的关系,由时间演化算符相联系:

算符演化方程

目前为止,我们仅知道薛定谔绘景下态矢的演化满足的方程——薛定谔方程。那么在海森堡绘景下,算符演化所满足的方程是什么呢?

运动常量的情况

在保守系下,薛定谔绘景的哈密顿算符$H_S$是与时间完全无关的,若此时$A_S$与之可对易,即在薛定谔绘景中$A_S$为运动常量,那么

且它也与$A_S$对易;于是

即此时两种绘景下的算符均与时间无关,且保持相等;换句话说运动常量的算符是不依赖于时间的,与绘景无关。特别是保守系的哈密顿量$H_S=H_H$,因此保守系中实际上无需区分哪种绘景的哈密顿算符。

一般的情况

若$A$是任意的可观测量,那么在海森堡绘景下求其时间演化方程:

此即算符演化的海森堡方程。不难看出,它可以直接类比于经典力学中的泊松括号;这也是海森堡首先得到的矩阵力学基本方程。

相互作用绘景(狄拉克绘景)

除了上述两种比较极端的绘景之外,在一些场合(尤其是微扰论),我们也可以将总的时间演化分别让态矢和算符各承担一部分。

设此时的总哈密顿量可以分为描述体系本身部分$H_0$(不显含时)和与外界相互作用的微扰部分$V_I(t)$(可以显含时)两部分。此时可以将时间演化设置为:

其中

不难看出,在相互作用表象中,算符承担了体系本身$H_0$所带来的时间演化(有时称之为运动学演化),而态矢承担了相互作用所引起的时间演化(有时称之为动力学演化)。这样对量子体系时间演化的描述被称为相互作用绘景,也叫狄拉克绘景

不难得到,相互作用绘景中算符和态矢的时间演化方程分别为:

可以看到相互作用绘景的优点是将来自于系统本身的运动学演化从态矢演化中分离掉,因此态矢的演化能够直接反映系统与外界的相互作用。

同时也可得到三种绘景下态矢和算符之间的关系:

三种绘景之间的变换都是含时幺正变换,并且态矢与算符的变换是配套的,保证了各种概率幅数值不变、运动方程形式不变。

基矢的演化

  1. 在薛定谔绘景:基矢不随时间演化:

  2. 在海森堡绘景:基矢随时间逆演化:

  3. 在相互作用绘景:基矢随时间部分逆演化:

这样规定的基本目的是:保证本征方程可以在各种绘景下保持形式不变:

这样的规定也与态矢和算符的演化相适应。

H.规范不变性

电磁场的势和规范

在经典电磁学中,电场和磁场是相互关联的,满足麦克斯韦方程组。等价地,我们可以引入两个函数——标势$\phi$和矢势${\boldsymbol A}$来代替电场和磁场进行描述,它们之间的关系是:

根据麦克斯韦方恒组,尽管这样的标势$\phi$和矢势${\boldsymbol A}$一定存在,但是却无法将之唯一确定。对于一组满足的$\phi$和${\boldsymbol A}$,总可以做如下变换:

其中$\chi$是任意函数,那么新的$\phi‘$和${\boldsymbol A}’$也会得到相同的电场和磁场。上式也给出了对于特定电磁场的一切可能的标势和矢势。

势函数具有这样的自由度称为“规范自由度”,若选择其中一组特定的势,就进行了一次“规范固定”或者说选择了一种规范。当然,同一种电磁场可以用无穷多种不同的规范来进行描述,因此时常会将一种规范改成另一种规范,即规范变换

在物理学中,当我们写出体系的运动方程,并不是直接包含电场${\boldsymbol E}$和磁场${\boldsymbol B}$,而是包含标势$\phi$和矢势${\boldsymbol A}$,因而需要搞清楚一个问题:理论所给出的物理结果,是只依赖于空间各点处的场${\boldsymbol E}$和${\boldsymbol B}$呢,还是同时依赖于我们所选取的规范呢?若依赖于规范的选取,那么在写出运动方程的同时就有必要明确在哪一种规范下是有效的。

经典力学中的规范不变性

哈密顿力学的规范性

在牛顿力学中,带电粒子在电磁场中运动所受到的洛伦兹力为:

它可以直接代入牛顿方程就得到了此时粒子的运动方程:

显然由于洛伦兹力只与电场和磁场的值有关,因此是规范不变的。

而另一方面,经典力学还可以采用哈密顿表述:我虽然已经知道它与牛顿力学是等价的,但在哈密顿表述中,运动方程会显式包含$\phi$和${\boldsymbol A}$,从而让我们能够更明显地分析体系是否具有规范不变性。

在电磁场中运动的带电粒子,其拉格朗日量为:

据此可以计算出动量为

注意到这里的动量是作为哈密顿表述基本变量的正则动量,而非机械动量${\boldsymbol \pi} = m\dot{\boldsymbol r}$,一般在电磁场中两者的关系是:

在哈密顿力学中,基本变量是正则动量${\boldsymbol p}$,但在动量-能量关系(无论是否相对论性)中的则是机械动量${\boldsymbol \pi}$,因此在描述电磁场中的带电粒子运动时,哈密顿力学存在着所谓最小替换法则:将无电磁场时运动方程中的${\boldsymbol p}={\boldsymbol \pi}$,替换为有电磁场时的${\boldsymbol \pi} = {\boldsymbol p} - q {\boldsymbol A}$(能量也要相应从$E$变为$E+q\phi$)即可,这是将电磁场量耦合进运动方程的基本方法。

哈密顿框架下,体系演化规律是哈密顿正则方程组

显然这里的哈密顿正则方程组在形式上是依赖规范选取的;我们关心基本变量${\boldsymbol r}$和${\boldsymbol p}$是否会有影响。一个trick是直接利用牛顿力学的结论,在那里我们已经知道粒子的速度和位置都与规范无关(在这里用上标$\ ‘\ $表示选取另一套规范下的物理量):

但是在哈密顿力学中我们的基本变量不是机械动量而是正则动量,因此

可见正则动量是规范相关的;若我们将${\boldsymbol A}\to{\boldsymbol A}’$的规范变换函数用$\chi$表示,那么哈密顿正则变量的规范依赖就是:

“物理量”和“非物理量”

到目前为止,我们发现在经典力学的哈密顿体系中,描述粒子运动的量至少存在两种类型:一类是“机械”的、不随规范改变的,例如位置${\boldsymbol r}$、速度${\boldsymbol v}$和机械动量${\boldsymbol \pi}$,另一类则是以正则动量${\boldsymbol p}$为代表的随规范变化的物理量。

而由于规范在我们的观点中,仅仅是一些为了便于计算而引入的工具的冗余自由度,规范变换不应当影响真实的物理。因此对于真正的物理可观测量,一定应当是规范不变量;而随规范改变的量则应当是“非物理量”,仅仅是一种计算工具而非真正的可观测量。

在哈密顿力学中,对于两个基本变量:${\boldsymbol r}$和${\boldsymbol p}$,按照上面的定义,显然一个是“物理量”,一个是“非物理量”。但其他的量基本都表现为这两个基本变量的函数,又应当如何判断其是否是真实的可观测量?

我们用$\mathscr J$代表一种规范的选取。首先从函数形式上来看:若某一个量的函数仅依赖于位置坐标:$\mathscr F_{\mathscr J} = \mathscr F_{\mathscr J}({\boldsymbol r})$,那么其显然是规范不变量;若某量的函数同时依赖于两个基本变量:$\mathscr F_{\mathscr J} = \mathscr F_{\mathscr J}({\boldsymbol r},{\boldsymbol p})$,那么由于${\boldsymbol p}$的存在,$\mathscr F_{\mathscr J}$必然也是随规范变化的;因此若在不同的规范中,某量所对应的函数相同:$\mathscr F_{\mathscr J}({\boldsymbol r},{\boldsymbol p}) = \mathscr F_{ {\mathscr J}’}({\boldsymbol r},{\boldsymbol p})$,它一定是“非物理量”。

因此,除了$\mathscr F_{\mathscr J} = \mathscr F({\boldsymbol r})$的特殊情况,一个物理体系的真实可观测量应当具有随规范变化的函数。通过对前面讨论的分析,不难得出这样的函数其变化规律应当为:

此即可观测量应当具有的规范变换性质。即若将新规范中的函数$\mathscr F_{ {\mathscr J}’}({\boldsymbol r}’,{\boldsymbol p}’)$中的正则动量${\boldsymbol p}$全部替换成${\boldsymbol p}+q\nabla_{\boldsymbol r}\chi$,就会得到旧规范下的函数形式$\mathscr F_{\mathscr J}({\boldsymbol r},{\boldsymbol p})$;反之,若要从旧规范变换到新规范,只需将${\boldsymbol p}$替换为${\boldsymbol p}-q\nabla_{\boldsymbol r}\chi$。

因此,一般来讲可以给出物理真实可观测量的一种函数形式:

下面是一些可观测量的例子:

机械动量:

机械角动量:

动能:

最后要指出的是,经典的哈密顿函数:

其第一部分是规范不变的,但第二部分却是规范相关的,因为势能的选取是任意的。在这个意义上,总能量的绝对值实际上并不具有实际意义;幸运或者说必然的是,在运动方程中这种任意性被导数所消除了,因此由哈密顿函数所导出的运动方程是规范不变的。

量子力学中的规范不变性

在经典力学中,由于牛顿定律的存在,规范不变性的问题比较容易分析。而在量子力学中,不仅没有牛顿定律,而且哈密顿量的作用方式也与经典力学不同;此外还需要考虑态矢在规范变换下的影响。

算符的规范行为

为了从经典力学过渡到量子体系,首先需要考虑的是量子化规则(我们仍然选取正则量子化方法)在规范变换下的行为。一个并不那么显然但合理的假设是:无论规范的选取,特定体系的态空间$\mathscr E$都是不变的,否则规范变换将会造成实质性的物理改变。但是作用在其上的算符在两种规范中可能是不同的。

遵循正则量子化的精神,我们首先考虑算符${\boldsymbol R}$与${\boldsymbol P}$。在坐标表象$\{|{\boldsymbol r}\rangle\}$下,算符${\boldsymbol R}$的作用相当于用${\boldsymbol r}$倍乘,算符${\boldsymbol P}$则是微分算符$-{\rm i}\hbar\nabla$,这些规则在任何规范中都是一样的,因此对于算符${\boldsymbol R}$与${\boldsymbol P}$,不需要特别强调其规范选取。

注:在这里,算符${\boldsymbol P}$相联系的经典物理量是正则动量,而非机械动量。

但是注意到其他物理量利用算符${\boldsymbol R}$、${\boldsymbol P}$表出的式子是来自于经典函数关系,因此可能会与规范相关。例如:

正则角动量的函数形式与规范无关:

与之相反,机械动量与机械角动量的函数形式都是依赖规范的:

哈密顿算符也是如此:

态矢及演化方程的规范行为

接下来考虑规范对态矢的影响。在经典力学(哈密顿力学)中,物理体系的状态由基本变量$\{ {\boldsymbol r},{\boldsymbol p} \}$来标记;而量子力学中,虽然我们使用态矢$|\psi(t)\rangle$来表示物理状态,但是可以计算其在算符${\boldsymbol R}$、${\boldsymbol P}$的期望。对应于经典力学的关系,我们期待两个算符在不同规范下的期望值应当具有如下关系:

显然当且仅当态矢本身随规范一同变换:$|\psi’(t)\rangle\neq|\psi(t)\rangle$,上式才能成立,这对应于一个由规范变换$\chi$所决定的幺正算符:$T_\chi$,其对两个算符的作用满足:

由第一式可知$T_\chi$与${\boldsymbol R}$对易,因此可设其形式为一厄米算符$F({\boldsymbol R},t)$的虚指数函数:

代入第二式,就会得到

因此在相差至多一个总相位因子(而这对物理并无影响)的情况下可以将算符$T_\chi$表示为:

态矢在规范变换下按照下式变换:

需要强调的是,尽管看起来像是仅仅附加了一个并无影响的相位,但其实并非如此,例如在坐标表象下:

熟悉规范场论的读者会对这种形式很熟悉。因此规范变换对波函数$\psi({\boldsymbol r},t)$的影响实际上是随点而异的相位,由此可见利用不同规范下的波函数$\phi$和$\phi’$竟会得到规范不变的物理结果,这并非不证自明的。

此外,对于多粒子体系,其总波函数的规范变换算符应当为:

得出态矢以及哈密顿算符的规范变换后,就可以得到变换规范后的态矢演化方程——薛定谔方程的形式,这也是研究规范变换对量子力学体系影响的核心问题。

由于:

结合$T_\chi$对${\boldsymbol R}$、${\boldsymbol P}$的作用规律,可以得到:

因此可以得到,在变换后的规范下,态矢的演化方程仍然满足:

即体系的演化方程——薛定谔方程的形式是规范不变的。

物理预言的规范不变性

最后需要讨论的是规范变换下理论的物理预言如何保持规范不变。

根据前面的讨论我们知道, 算符在$T_\chi$作用下的行为是:

虽然$\widetilde {\boldsymbol R} = {\boldsymbol R}$,但$\widetilde {\boldsymbol P} \neq {\boldsymbol P}$,类似地:

比较可知,前面提到过的对应于“真实可观测量”的算符,应当是类似于${\boldsymbol R}$和${\boldsymbol \varPi}$这样的:

例子还有机械角动量:

以及动能:

而那些“非物理量”则是类似于正则动量${\boldsymbol P}$的行为:

类似的还有正则角动量以及哈密顿量,因为我们前面已经得到一般而言$\widetilde H_{\mathscr J} \neq H_{ {\mathscr J}’}$。

注:除非是在时间无关的电磁场中,可以只考虑也与时间无关的势,$\widetilde H{\mathscr J} = H{ {\mathscr J}’}$,此时总能量确实是可观测量也是运动常量。

这是一种量子力学中的普遍规律,即真实可观测量的算符都依赖于规范,且满足形式为:

这其实就是将经典力学中的:

算符化后利用$T_\chi$进行幺正变换所得。

当获知算符的规范行为时,为了获知物理预言结果,还应保证本征方程以及概率的不变性。这一点很容易得出:假设在原规范下存在可观测量的本征方程:

观测得到$g_n$的概率是

考虑到在$T_\chi$的作用下:

因此规范变换不改变可观测量的本征方程,并且其观测到$g_n$的概率仍然是:

从而也就证明了,在量子力学中,可观测量的物理预言与规范无关,即任何测量的可能结果和概率都是规范不变的。

一个值得一提的点是,不难证明,概率密度和概率流(例如在坐标表象下)也都是规范不变量。

J.路径积分量子化简述

在电磁学领域中,描述场在时空中的传播行为,存在着两种方式:

  • 麦克斯韦方程组,即微分的观点,给出了时空各点处电磁场的变化率与其邻域内场的关系;
  • 惠更斯原理,即积分的观点,只要知道某一曲面上的单色场,则可通过子波源叠加(积分)的方式获知其他任意一点处的场。

两种方式在描述波的传播行为上是等价的。

在量子力学中,也存在波函数在时空中的传播;而薛定谔方程实际上就是从微分方程的角度确定了其传播行为。事实上将会看到,量子力学中同样存在一种从积分的角度描述波函数传播的方式,即费曼原理

并且,从过往的许多讨论中可以看出,薛定谔波动力学(以及与其等价的海森堡矩阵力学,这些依赖于态矢和算符、并且哈密顿算符居于中心地位的理论我们可以统称为正则量子化框架的量子力学)是与经典力学中的哈密顿力学强烈相关的,可以说其直接由哈密顿力学量子化而来,并继承了哈密顿力学的众多结论。类似地,费曼原理的思想将会引出另一种对量子力学的等价描述,而它则是直接从经典力学中的拉格朗日力学经量子化而来,在其中居于中心地位的是所谓“量子作用量”。这种力学称为路径积分量子化框架的量子力学。

薛定谔方程的传播函数(传播子)

传播子的定义

在薛定谔的力学中,考虑一个态经过时间演化后的结果(取坐标表象):

在其中插入坐标表象的完备性关系即可得到:

这其中的积分核我们定义为薛定谔方程的传播子(传播函数):

很显然,传播子$K(2,1)$的物理意义代表着在$t_1$时刻位于${\boldsymbol r}_1$处的粒子,在$t_2$时刻到达${\boldsymbol r}_2$处的概率幅。

当然,很多时候我们实际考虑的问题只允许时间向正向的传播,于是可以定义一个“推迟传播子”:

之后将会看到,正是由于阶跃函数$\theta(t_2-t_1)$的存在,$K_{\rm ret}$是薛定谔方程的格林函数。

类似地,也有“超前传播子”的定义:

推迟和超前传播子相当于强制规定了波函数在时间上的传播方向,否则传播子$K(2,1)$会向正时和逆时传播。

传播子用能量本征态表示

若哈密顿算符$H$不显含时,那么传播子可以用它的本征函数来表示。设:

利用能量本征态的完备性关系,可将演化算符写为:

于是传播子就是:

传播子满足的方程

下面考虑传播子,准确来说是推迟传播子$K_{\rm ret}$所满足的方程。

首先定义:

是仅作用在变量${\boldsymbol r}_2$和$t_2$的哈密顿算符。并且注意到${\rm e}^{-{\rm i}E_n t_2/\hbar} \varphi_n({\boldsymbol r}_2)$是薛定谔方程的解,即:

而阶跃函数满足方程:

因此可得

由于等式右边存在$\delta(t_2-t_1)$,因此可将指数中取$t_2=t_1$,而

因此传播子所满足的方程为:

由此可以看出,推迟传播子$K_{\rm ret}$在数学上实际上是薛定谔方程的格林函数,因此利用它可以很方便地得到薛定谔方程的解。若要完全确定传播子,还需边界条件:

量子力学的拉格朗日表述(路径积分量子化)

从观测的角度来讲,若我们分别在$t_1$时刻和$t_2$时刻对一个运动的粒子进行观测,只能得到它在两个时刻的位置分别是${\boldsymbol r}_1$、${\boldsymbol r}_2$,而对其在两个时刻的中间运动过程是无从得知的。

经典力学的拉格朗日表述

经典力学中,粒子在两个时刻之间会遵循一定的动力学规律——若从拉格朗日力学的角度来说,就是最小作用量原理——来运动,即沿着该动力学规律所唯一确定的一条时空轨迹${\boldsymbol r}^{(0)}(t)$运动。在拉格朗日力学的观点下,粒子在任意时刻的每一种可能的运动状态(用该时刻的位置和速度来表征)都唯一对应于一个拉格朗日量(考虑不显含时的简单情况):

而拉格朗日力学认为,在确定的起点和终点之间存在着无数条可能的路径${\boldsymbol r}(t)$,每条路径都唯一对应于一个确定的值,即是将这条路径上每个时刻粒子的拉格朗日量对时间进行积分:

不难看出$S$是路径${\boldsymbol r}(t)$的泛函,称之为这条路径的(经典)作用量。而拉格朗日力学的最小作用量原理则表明:在无数可能的路径中,真实的运动路径是使得$\delta S = 0$的路径。由此,拉格朗日力学决定了经典情形下粒子运动的唯一路径。

量子力学传播子的分解

在量子力学中,拉格朗日力学显然不能直接套用——我们甚至不可能确定一条明确的“量子路径”。但是通过对传播子的分析,可以发现拉格朗日力学的思想仍然在量子力学中存在。

注意到演化算符的性质:

这里是将$t_1$到$t_2$的时间段等间隔地分成了$N+1$段,每段时长$\delta t$:

多次利用坐标表象下的完备性关系,可得

可见传播子也具有与演化算符类似的乘法关系,但要在每个分隔的时刻对全体坐标本征态积分。其中被积函数:

或许可以简单地理解为,粒子在运动过程中的各个时刻对其观测,发现粒子依次地经过每个时刻所取的某个位置;当然这并非真实的物理解释。

在上述积分式中令$N$趋于无穷大,我们将会期待每组$\alpha_k$的序列将会确定时空中的一条“路径”,而与之相应的传播子乘积就是这条路径所对应的概率幅。而实际的结果则是要对这无数个可能的概率幅进行无穷维积分——即对两点之间全体可能的时空路径的概率幅进行相干叠加。

费曼原理

前述基本就是费曼的观点,即在量子力学中,起点和终点之间的每条时空路径都对最终的结果有贡献;真实的概率幅要对这所有路径的贡献进行相干叠加,即无穷积分。

尽管这一原理可以独立于早前的观点来得出,但方便起见,下面仍以薛定谔方程的传播子为基础,来详细推导这一原理。注意到传播子的表达式(仍然假设哈密顿量不含时):

在$\delta t$是小量的情况下,指数部分可以近似拆分:

于是利用动量表象的完备性关系:

在$\delta t \to 0$极限下,可以在形式上认为:

同样再约定:

这些记法具有启发性,我们可以定义一个“量子拉格朗日量”:

于是利用这些记号,传播子$K(2,1)$可以表达为:

在$\delta t \to 0$极限下,求和变为积分:

这里$S[{\boldsymbol r}(t)]$是所定义的“量子作用量”,它是路径的泛函。利用它,终于可以写出传播子$K(2,1)$的表达式:

这里积分测度

代表着对所有可能的(经典)路径进行积分,是一个无穷维积分。因此,这样对量子力学的表述被称为路径积分表述

在下面,为了简便,通常用$\Gamma$表示一条经典路径,其作用量为$S_\Gamma$,于是路径积分表达式为:

当然,这只是另一种记法,本质上是没有改变的。

路径积分的简单评述

  1. 利用路径积分求出传播子$K(2,1)$,原则上就可以得到任何波函数$\psi({\boldsymbol r},t)$的时间演化概率幅,而这一积分计算实际上不需要额外的量子假设。因此路径积分的确是对量子力学的一种完整理论框架。

  2. 虽然前面的过程是从薛定谔方程的相关概念出发导出路径积分表述,其中也应用到了一些算符运算,但事实上它是独立于正则量子化理论的另一种量子化理论。不同于正则量子化的核心是对物理态的态矢描述以及对经典可观测量的算符化,在路径积分表述中,一般而言不存在“算符”或“态矢”的概念;它直接给出的是体系的演化传播子,而在路径积分运算过程中涉及到的都是数(这包括一般的可交换数和描述费米子的反交换数——Grassmann数)的运算(主要是积分运算)。

  3. 前面在推导的过程中,曾经引入过诸如$\frac{ {\rm d}{\boldsymbol r}_{\alpha_k} }{ {\rm d}t}$这样的记号,这在正则量子化框架中意义是不明确的;同样,在正则量子化中也难以定义何为“路径”,因此有必要做一澄清。

    事实上,在路径积分框架下,可以看到我们所谈论的路径,(在$\delta t \to 0$极限下)其实就是“经典路径”,也即经典拉格朗日力学中所谓的“粒子运动的可能路径”;同样,在$\delta t \to 0$极限下所谓“量子拉格朗日量”、“量子作用量”其实就是经典力学中的经典拉格朗日量经典作用量。因此,量子力学的路径积分理论事实上是保留了经典力学中相当一部分物理量概念的,包括位置、速度、轨迹等等。

    只不过在经典力学中,有了任意路径的作用量$S$后,下一步是通过$\delta S = 0$取得所谓“真实路径”;而在量子力学中,获知任意经典路径的作用量$S_\Gamma$后,要将它们按照路径积分的形式实现相干叠加,从而得到体系的传播子。

    这也反映了正则量子化与路径积分量子化的根本区别:正则量子化认为量子化发生在一开始对运动的描述上,必须使用态和算符去进行描述;路径积分量子化则认为经典的路径以及一些概念仍然是有效的,只不过在得到作用量之后,如果我们仅仅保留一条“真实路径”那么得到的就是经典的结果,而如果将每个路径的贡献均计入考虑就会得到一个量子的结果。

  4. 当然还需要强调一点,尽管路径积分采取了经典的运动“路径”概念,但并不意味着这一理论承认粒子沿这条路径做经典运动的可能性;事实上注意到传播子$K(2,1)$本身是概率幅意义上的概念,因此路径积分量子化只是针对某一经典路径$\Gamma$计算了它所对应的的“部分概率幅”,而这一部分概率幅恰好可由其经典作用量求出:

    最后再将各个路径的概率幅通过积分进行相干叠加得到总的$K(2,1)$。

  5. 尽管在理论上,任何路径的贡献都要被平等地考虑;但实际上注意到在路径积分中,不同的经典路径对量子结果的贡献,其差异体现在一个相位因子上:

    在费曼的解释中,这意味着各个经典路径的贡献不是简单地相加(当然如此,相干叠加并非数值相加),而是以相位的方式进行振荡;尤其是这会给出在经典极限下的一个有趣结论。

    当取经典极限$\hbar \to 0$时,这时$S_\Gamma\geq \hbar$,两条经典路径之间的作用量差异$\Delta S_\Gamma$通常也远大于$\hbar$(即便它们的相对差异$\Delta S_\Gamma/S_\Gamma$很小),因此$K_\Gamma(2,1)$的变化也十分迅速,从而绝大多数路径的贡献都被它们自己的相位所干涉相消;这在数学上其实是说:

    对于如下形式的积分:

    若参数$\lambda$很大而函数$f(x)$是实函数,且存在极值点$x_0$使$f’(x_0) = 0$,那么在靠近$x_0$的邻域内

    由于邻域较小,更高次项可以忽略;而在邻域外远离$x_0$的那些值处的被积函数会被很大的$\lambda$引起剧烈振荡从而在积分中相消;因此

    这一结论对高维积分都是成立的。此即数学上的稳相近似

    通过这一结论可以发现,尽管路径积分中包含了全部可能的路径,但在经典极限下贡献最主要的其实是来自于$S_\Gamma$与其相邻路径之间变化较缓慢的那些路径;准确来说,就是这样一条“稳定路径”,它在发生过渡到相邻路径的微扰时其作用量的一阶近似为零:

    只有这样的路径与其相邻路径,它们在路径积分时是干涉相长的。我们发现这一条件给出的其实正是经典拉格朗日力学通过最小作用量原理所选出的那条“真实路径”$\Gamma_{\rm cl}$:

    因此可以说,在路径积分量子化的框架下,经典极限的最主要贡献正是来自经典路径,因此路径积分可以自然地回到经典拉格朗日力学;费曼原理实际上包含着最小作用量原理的思想。可以期望在$\hbar \to 0$的经典极限下:

    当然,若存在多条允许的经典“真实路径”,那么在量子力学中的准经典结果将是它们的干涉叠加。