现在我们正式开始尝试建立量子力学的基本理论体系。回顾经典力学,以哈密顿力学为例(这是因为可以直接对哈密顿力学做正则量子化得到量子力学的基本框架;当然,如果要以拉格朗日力学为例也是可以的),它的基本要素是:

物理系统在确定时刻 $t_0$ 的态取决于 $N$ 个广义坐标 $q^i(t_0)$ 和 $N$ 个共轭动量 $p_i(t_0)$ ; 若知道了系统在指定时刻的态,那么系统的各个物理量的值也就随之完全确定,即依据系统在时刻 $t_0$ 的态可以确切预言该时刻对系统的任何测量结果;系统的态随时间演化由哈密顿正则方程描述;只要知道给定时刻 $t_0$ 的初始条件 $\{q^i(t_0),p_i(t_0)\}$ ,则方程在任意时刻的解就是唯一的。

可见对物理系统的经典描述是建立在这些基本假定之上的演绎结果;同样的,量子描述也应建立在一些基本的假设之上,这些假设来源于实验现象和逻辑规律上的总结,这些在前两章已经以非正式的形式进行了讨论。本章即将正式引入这些基本假定,并以数学语言精确表述之,以求回答下列问题:

怎样从数学上描述一个量子系统在给定时刻的态?

知道了系统的态,怎样预言各种物理量的测量结果?

知道了系统在给定时刻的态,怎样求得它在任意时刻的态?

假定的陈述

假定的初步解释

首先不加解释地给出五条基本假设的陈述,它们又可视为量子力学公理化系统的五条公理:

公理一:物理体系在任意时刻 ${t_0}$ 的量子态由一个复可分希尔伯特空间的稠密子空间 ${\mathscr E}$ (态空间)中的矢量 ${|\psi(t_0)\rangle}$ 来描述,称之为态矢量。

公理二:每个可以被测量的物理量 ${\mathscr A}$ 由态空间上的观察算符 ${A}$ 来描述,它是一个稠定自伴算符。

公理三:每次对物理量 ${\mathscr A}$ 的测量值都是它一个的谱点。当系统的归一化态矢为 ${|\psi\rangle}$ 时,物理量观测值属于谱的子集 $X$ 的概率为 ${\langle\psi|E_A(X)|\psi\rangle}$ ,其中 ${E_A}$ 是算符 ${A}$ 对应的谱测度。

公理四:测量前处于归一化 ${|\psi\rangle}$ 态的体系,若测量物理量 ${\mathcal A}$ 得到结果属于谱的子集 $X$ ,则测量后系统的态变为${E_A(X)|\psi\rangle}$。

公理五:态矢随时间的演化满足薛定谔方程 ${ {\rm i}\hbar\dfrac{\rm d}{ {\rm d}t}|\psi(t)\rangle=H(t)|\psi(t)\rangle}$ ,其中 ${H(t)}$ 是与系统总能量相联系的观察算符,称为哈密顿算符。

下面逐条进行解释。

态矢量假定

物理体系在任意时刻 ${t_0}$ 的量子态由一个复可分希尔伯特空间的稠密子空间 ${\mathscr E}$ (态空间)中的矢量 ${|\psi(t_0)\rangle}$ 来描述,称之为态矢量。

这一条假定将具体的物理系统与抽象的线性空间中的矢量联系在了一起,使得我们利用数学工具及其运算来描述物理系统、物理操作成为了可能。

这一假定的合理性前面已经体现过了:最初,我们用一个平方可积的函数来描述粒子在指定时刻的态;它能够直接给出粒子空间位置的概率密度函数,并且能通过一些数学手段间接地获取其他信息,例如动量、能量;后来,我们将这样的波函数与右矢联系起来,构建出了更抽象的框架——态空间,而波函数不过是态矢选取了坐标表象下的“分量”。

这一假定事实上还隐含了:由于 $\mathscr E$ 是一个矢量空间,因此第一个假定就隐含了叠加原理:若干态矢的线性组合(包括连续积分的形式)也是态矢。

关于态空间所选取的数学模型——复可分希尔伯特空间,其相关性质作简单说明。

完备的内积空间叫做希尔伯特空间。

  • 采用复数域上的空间,粗浅地理解是因为根据盖拉赫-斯特恩实验等的实验现象推知,实数域不能很好地描述量子行为。事实上在后面更深入的理论分析也看出来,量子力学的确具有本性的复结构。

  • 内积是复线性空间上的一个正定、共轭对称、半共轭线性半线性的二元函数,有了内积才能讨论模长、正交性等一系列度量概念,从而才有完备性的概念。

  • 完备空间是指任何柯西列都收敛的内积空间。只有满足完备性,才有可能: 1、存在一组正交归一基,使得任何态矢都可以在基上展开。 2、任一态矢都一一对应着一个有界线性泛函(左矢)。 正是完备性保证了我们在态空间中添加“广义右矢”辅助计算的合理性。

有可数稠密子集的拓扑空间叫做可分的。

  • 集合可数是指其元素有限或者可以与自然数集建立双射。

  • 稠密子空间是指其闭包为全空间。对于距离空间,稠密等价于,对于任意点和任意小的距离,都存在另一个点,使它与该点的距离小于给定距离。实际选取的态空间是复可分希尔伯特空间的稠密子空间,实际上有两个作用: 1、完备性保证某些柯西列的极限存在,但是它们并不符合物理实际意义上可能存在的态的要求,因而需要在实际的态空间中剔除; 2、无界算符(例如坐标、动量)不能定义在整个希尔伯特空间上,而只能定义在它的稠密子空间上,因此选取一个稠密子空间可以保证这些算符对态空间中的所有右矢的作用都有定义。

  • 可分的希尔伯特空间保证了,存在可数的正交归一基,且存在一个矢量,它与所有基都不正交。不可分的希尔伯特空间,存在不可数个正交归一基,但任意矢量至多与可数个基不正交。即只有可分空间,才能够保证存在一个态矢,在所有基上的分量不全为0。否则不可分空间中可能存在不可数多个基使得任一态矢分量全为零。

此外,应当注意区分态矢量和态:前者是描述态的数学模型,后者才是真正的物理对象。但是出于一种特殊情况的要求:态矢与自己的线性组合得到的态矢,应该仍表示原来的物理态。因而不同的态矢量在只差一个复常数(即复数意义的“共线”)的情况下可以描述同一个物理态,所以对于任意非零元素 $|\psi\rangle$ ,集合 $r_\psi=\{c|\psi\rangle|\forall c\in\mathbb C\setminus{\{0\} }\}$ 称为过 $|\psi\rangle$ 的一条射线,可以说一条射线对应于一个物理态。以全体射线为元素(特别地,零元素也看做一个特殊的元素)构成的空间,称为射线空间。

注:关于这一点,在假定三中还会再次讨论。

可观测量假定

每个可以被测量的物理量 ${\mathscr A}$ 由态空间上的观察算符 ${A}$ 来描述,它是一个稠定自伴算符。

在之前我们曾经讨论过哈密顿算符 $H$ ,它与系统总能量相联系,即是这一假定的一个特例。此外,关于观察算符的讨论,我们也曾经以 $R$ 、 $P$ 为例详细讨论过它的性质,并且事实上这两个算符所联系的可观测物理量正是坐标和动量;讨论过程中其实已经暗示了这一假定的合理性。

对比经典力学,量子力学是以本质上不同的方式来描述物理系统与相关物理量的——态用矢量表示,物理量用算符表示。
满足 $\langle A\psi|\varphi\rangle=\langle \psi|A\varphi\rangle$ 的算符,称为厄米算符。它能够导出一个很重要的结论,即厄米算符的全体本征值都是实数。厄米算符在物理上十分重要,因为对于可观测量,仪器给出的测量值永远都是实数,因此厄米算符可以非常方便地描述物理上的可观测量。

在前面,我们曾把这一定义当作自伴算子的一个性质,但实际上两者不是等价的。对于有界算子来讲,自伴和厄米没有区别(线性空间上算符有界性的定义是指 $\exists M>0$ , $\forall f\in V$ , $\sqrt{(Af,Af)}\leq M\sqrt{(f,f)}$ );在有限维希尔伯特空间中的线性算子都是有界算子。这个意义下通常不区分厄米算符与自伴算符。

但是反之,量子力学常用的无限维希尔伯特空间中的很多线性算子都是无界算子,例如坐标、动量、能量在非相对论性下都是无界的。而无界算子的自伴性和厄米性却是有差别的。所幸希尔伯特空间具有足够好的性质可以保证我们在物理上不用理会这种差别而糊涂地用却不出错。

  • 无界算符造成最直接的第一个问题就是,如何定义伴随算符。有界算符的定义域总可以自然延拓到整个空间上,但无界算符至多只能定义到它的一个稠密子空间(稠密子集的定义是其闭包等于全空间)上。这样就存在不能被无界算符 $A$ 作用的矢量,从而无法依前定义对偶算子 $A^*$ ;进一步地,也无法依前定义伴随算子 $A^\dagger$ 。

  • 这种情况下的替代方案是, $\forall f,g\in V$ ,若 $\exists$ 唯一的 $h\in V$ 使得 $(f,Ag)=(h,g)$ ,则定义 $h=A^\dagger f$ 。这样伴随算子的定义域就仅局限在满足这些条件的 $f$ 上,即 $V$ 的一个子集。

  • 对于希尔伯特空间,当且仅当线性算符A是稠定的(即定义域是稠密子空间),前述$h\in V$才是唯一的,即才可通过上述过程定义其伴随算符$A^\dagger$。这样定义的 $A^\dagger$ 自然也是线性的。特别地,对于有界算符,上述定义与原定义吻合。但是要注意,原算符的稠定性并不保证伴随算符也是稠定的。不过不稠定的无界算符在量子力学中没什么用处。

 

  • 下一个问题是讨论无界算子的厄米性。有结论:定义在全希尔伯特空间的厄米算符必然有界;换句话说,无界的厄米算符不可能定义在全希尔伯特空间上

  • 希尔伯特空间中的任意稠定算符$A$是厄米的,当且仅当$A^\dagger$的定义域包含A的定义域,且在相同的元素上两者作用相同。此时只能记$A\subset A^\dagger$,并称后者是前者的一个延拓扩张;如要得到自伴性 $A=A^\dagger$ ,还需 $A\supset A^\dagger$ 。这对于有界厄米算符是自然可以保证的,但是对于无界算符来说,自伴性 $A=A^\dagger$ 是比厄米性 $\langle A\psi|\varphi\rangle=\langle \psi|A\varphi\rangle$ 更强的性质,需要更高的条件要求。

因此区分无界算符的厄米性和自伴性是非常重要的;两者的关键差别在于定义域。

物理上常用的坐标、动量都是无界稠定的自伴算符,从而也保证了它们的厄米性;对于哈密顿算符来说,则可以证明在大多数常见场合下它也是无界的稠定自伴算符。

测量假定

每次对物理量 ${\mathscr A}$ 的测量值都是它一个的谱点。当系统的归一化态矢为 ${|\psi\rangle}$ 时,物理量观测值属于谱的子集 $X$ 的概率为 ${\langle\psi|E_A(X)|\psi\rangle}$ ,其中 ${E_A}$ 是算符 ${A}$ 对应的谱测度。

根据之前的例子,系统的总能量是算符 $H$ 的本征值;但事实上只有有限维空间中的算符可能具有分立的本征值。但是在大多数情况下处理的都是无限维空间,其中的厄米甚至自伴算符甚至不一定有本征值;即便有,也不一定完备(即不能构成基),因此需要将本征值的概念推广。

  • 豫解式:对定义在全希尔伯特空间的算符 $A$ ,考虑算符 $(A-\lambda I)$ ,称使之可逆且逆算符也是定义在全空间的有界算符的 $\lambda$ 值全体集合为 $A$ 的正则点集 $\rho(A)$ ,它在 $\mathbb C$ 中的补集称为 $A$ 的谱,记作 $\sigma(A)$ ,它是 $\mathbb C$ 的一个闭子集。显然,若 $A$ 存在本征值 $\lambda_0$ ,则 $\lambda_0\in\sigma(A)$ ,因为本征值使得 $(A-\lambda I)$ 不是单射(它至少将零矢量和本征矢都映射到零)。而定义在 $\mathbb C\setminus\sigma(A)$ 上的映射 $R_\lambda(A)=(A-\lambda I)^{-1}$ 称为 $A$ 的豫解式。

  • 谱点:即谱中的元素。它包括三种类型: 1、点谱:它使得 $(A-\lambda I)$ 不是单射,所以逆不存在。点谱就是特征值的直接推广; 2、连续谱:它使得 $(A-\lambda I)$ 是单射但不是满射,且值域在全空间稠密,所以它有逆,但是逆的定义域不是全空间,而是其稠密子空间; 3、剩余谱:它使得 $(A-\lambda I)$ 是单射但不是满射,且值域在全空间不稠密。对自伴算子而言,剩余谱为空,所以只有点谱和连续谱,而且其谱集是实数集的子集。

  • 有结论:自伴算符的谱点必为实数。例如, $R$ 和 $P$ 的谱就是整个实数轴,且只有连续谱,没有点谱。

注:实际上简并度仅对点谱有意义。

前面曾经讨论过结论,即观察算符可以表示为本征子空间上投影算符按本征值的线性组合 $A=\sum_na_nP_n$ ,且各个投影算符满足 $\sum_nP_n=I$ , $P_iP_j=\delta_{ij}I$ 。这一将观察算符分解为投影算符的过程叫做算符的对角化,因为这相当于是在观察算符自己的本征值构成的基下展开;也叫做投影算符在本征值下的分解。

然而对于无穷维的情况,由于甚至可能不存在本征值,因此问题没有这么简单,必须借助谱来完成“广义对角化”或称“谱分解”。这里直接给出结论:

  • 自伴算符的谱分解定理:希尔伯特空间(有限或无限维)中的任一稠定自伴算符(不论有界或无界),存在唯一的单参投影算符族 $\{E_\lambda|\lambda\in\mathbb R\}$ 使得 $A=\int_{\sigma(A)}\lambda{\rm d}E_\lambda$ 注意我们这里其实没有定义对谱测度的积分,所以上式可以理解为是算符作用于任意右矢,再与任意左矢做内积得到的数值的积分关系。这个定理十分重要,它保证了量子力学中关于算符对角化很多不严谨操作的正确性。

  • 谱族、谱测度:粗略来说,谱族是单参投影算符族;谱测度则是在可测空间上取值为投影算符的测度,它将开集映射为一个(可以是到任一子空间上的)投影算符。谱族和谱测度存在紧密联系:设实数集 $\mathbb R$ 上的布尔可测空间 $(\mathbb R, B)$ 定义了一个谱测度 E 构成谱测度空间 $(\mathbb R, B,E)$ ,则可自然构造一个谱族 $E_\lambda=E\big((-\infty,\lambda]\big)$ 。反之,若给定了一个谱族 $\{E_\lambda|\lambda\in(-\infty,+\infty)\}$ ,也可按照前述关系构造出一个谱测度。这样也就赋予了前面“自伴算子的谱分解定理”中积分的意义,即等价于用谱测度来表达: $A=\int_{\sigma(A)}\lambda{\rm d}E_A(\lambda)$

下面讨论测量假定的最后一部分,即测量值的概率分布。

  • 对于可观测量的测量会得到一个实数值 $a$ ,即它的某一谱点。根据谱分解式的意义, $\langle\psi|A|\psi\rangle=\int_{\sigma(A)}\lambda{\rm d}\langle\psi| E_A(\lambda)|\psi\rangle$ ,而 $|\psi\rangle$ 又可根据 $A$ 的广义本征矢展开 $|\psi\rangle=\int_{\sigma(A)}{\rm d}\lambda c(\lambda)|\chi_\lambda\rangle$ ,则因此 ${\rm d}\langle\psi| E_A(\lambda)|\psi\rangle=|c(\lambda)|^2{\rm d}\lambda$ 。对比从概率诠释出发得到的公式 ${\rm d}\mathscr P(\alpha)=|c(\alpha)|^2{\rm d}\alpha$ ,可见在这里谱测度实际上扮演着概率测度的角色,事实上对于归一化右矢 $\langle\psi|\psi\rangle=1$ , $\mathscr P(\lambda)=\langle\psi|E_A(\lambda)|\psi\rangle$ 就是测量值 $\lambda$ 的概率密度函数;而 $E_A(\lambda)$ 给出的就是到 $\lambda$ 对应的(广义)右矢或子空间的投影算符。
  • 但是对于某些连续的物理量(例如坐标、动量),测量时不可避免地会产生误差或不确定度,即这个时候测得的结果是实数连续分布的某个区间 $X$ ,例如 $[\lambda+{\rm d}\lambda]$ 。那么这时的概率就应当为 $\int_X\mathcal |c(\lambda)|^2{\rm d}\lambda=\int_X{\rm d}\langle\psi|E_A(\lambda)|\psi\rangle=\langle\psi|E_A(X)|\psi\rangle$ 其中 $E_A(X)$ 给出的是到 $X$ 对应的右矢子空间的投影算符。

前述的内容比较抽象,我们可以用物理化的、不那么严谨但是更方便的语言来阐述这件事。具体来说,仍沿用离散谱和连续谱的“直观分类方式”讨论。以下均已归一化。

离散谱

假设 $A$ 的谱是纯离散的,且本征值 $a_n$ 简并度为 $g_n$ ,那么 $A|u^i_n\rangle=a_n|u^i_n\rangle$ ,且 $|u^i_n\rangle$ 构成一个正交归一基,于是态矢可以写作

因此测量处于归一化态 $|\psi\rangle$ 物理系统的物理量 $\mathscr A$ ,得到的可能结果就是其离散本征值集合,结果为简并度为 $g_n$ 的本征值 $a_n$ 的概率为

其中 $|u^i_n\rangle$ 为 $a_n$ 的归一化本征矢。特别地,非简并本征值是它的一个特例。

连续谱

假设 $A$ 的谱是纯连续的, $A|v_\alpha\rangle=\alpha|v_\alpha\rangle$ ,且 $|v_\alpha\rangle$ 构成一个连续的“正交归一基”,于是态矢可以写作

因此测量处于归一化态 $|\psi\rangle$ 物理系统的物理量 $\mathscr A$ ,得到的可能结果构成一个连续集合,结果处于区间 $[\alpha,\alpha+{\rm d}\alpha]$ 的概率为

其中 $|v_\alpha\rangle$ 为 $\alpha$ 的归一化本征矢。

连续谱+离散谱

直接综合上述结果即可:

得到的可能结果构成一个部分连续部分离散的集合,结果为简并度 $g_n$ 的本征值 $a_n$ 概率为

结果处于区间 $[\alpha,\alpha+{\rm d}\alpha]$ 的概率为

其中 $|u^i_n\rangle$ 、 $|v_\alpha\rangle$ 均已归一化。

注:态矢 $|\psi\rangle$ 的归一化是为了保证总概率为 $1$ ,但实际上这一条件并没有实质性的物理意义;如果态矢没有归一化,则只需在上述每个概率上再乘以归一化因子 $\frac{1}{\langle\psi|\psi\rangle}$ 即可。

关于测量部分的讨论并没有结束,还有一个重要内容,即重新回顾一个一直被默认的假设: $|\psi’\rangle=c|\psi\rangle$ 与 $|\psi\rangle$ 代表同一物理态——事实上,根据刚才讨论的测量假定,两个右矢对于任何物理量均给出了相同的测量概率结果(归一化意义上),这也再次证实了上述假设。

现在着重考虑相因子 ${\rm e}^{ {\rm i}\theta}$ 的作用:设

一般而言前两者表示相同的态,但与后者不同(除非 $\theta_1-\theta_2=2n\pi$ )。因此对于线性组合的态来说,总的相因子并不影响物理系统,但是展开式中各分量的相对相因子却有影响。

坍缩假定

测量前处于归一化 ${|\psi\rangle}$ 态的体系,若测量物理量 ${\mathscr A}$ 得到结果属于谱的子集 $X$ ,则测量后系统的态变为 ${E_A(X)|\psi\rangle}$。

在测量假定中我们讨论了可观测量的测量结果与系统原所处状态 $|\psi\rangle$ 之间的关系,重点在于我们能获得怎样的信息;坍缩假定则是讨论了测量这一行为对于物理系统(的态)本身有什么影响。

如何理解“测量”这一行为对量子态本身一定会造成影响呢?

本质上来说“态矢”是我们对物理态的一个建模,它包含了所有我们知道的和不知道的信息,而我们只是用这样一个矢量来打包指代所有这些相关信息;对于那些我们不知道的信息,则只能以概率性的方式来描述它们。而“测量”则是一个从系统获取信息、消除不确定度的行为,因而事实上我们获知了更多的信息,从而对我们的建模产生了影响:至少对于刚刚测量的这一物理量,我们可以不再用概率而是用确知值来描述,或者至少,用一个分布更加集中的概率来描述;这也就是说我们对系统态的建模(即态矢)变成了一个本征矢或者是本征矢附近的集合。比方说,若在一次测量之后立即进行下一次测量,我们就不能再说“得到某个结果的概率”,因为事实上我们已经得到结果了。借用狄拉克的话说:“测量总是导致系统跳到被测量的动力学变量的一个本征态上。

注:某种程度上这或许是量子理论与经典理论的一个根本性的不同之处:经典力学中对研究对象的建模总是确定性的,它总是具有确定的坐标$\boldsymbol r$和确定的动量$\boldsymbol p$(确定的相空间位置$(\boldsymbol r,\boldsymbol p)$)以及由此带来的确定的任何物理量 $\mathscr A(\boldsymbol r,\boldsymbol p)$,即便客观上讲我们不一定事先知道具体的值,但在我们的模型中并不存在“事先不确定”的信息,因此在这样的经典理论模型中,“测量”这一行为仅仅是对已经确定的值的读取,而并不被认为是在消除不确定度,测量前后并不会改变我们对物理态的认知以及建模,从而经典理论中的测量不应改变物理态本身。而上面已经看到,量子理论的观念(自然地或被迫地)与之完全不同。

这种量子系统从原态矢“跳到”或者说“抛进(樱井纯语)”某一本征态或子空间的过程,显然可以用投影算符来表示,即测量前处于归一化 $|\psi\rangle$ 态的体系,若测量物理量 $\mathscr A$ 得到结果为谱点 $\lambda$ ,那么测量后系统变为“本征矢” $P_{\lambda}|\psi\rangle=E_A(\lambda)|\psi\rangle$ ;更一般地,若得到的结果属于谱的子集 $X$ ,则测量后系统的态变为 $E_A(X)|\psi\rangle$。

但是注意到我们一直要求前后的本征矢都是归一化的,而单纯的投影并不能保证这一要求;于是一般还需要添加一个因子来归一化,使得实际的态矢变化更像某种“旋转”。以最简单的测得单一本征值为例,设这个因子为 $c$ ,即需要 $\langle\psi|P^\dagger_\lambda c^*cP_{\lambda}|\psi\rangle=|c|^2\langle\psi|P^2_{\lambda}|\psi\rangle=|c|^2\langle\psi|P_{\lambda}|\psi\rangle=1$ 则 $|c|^2=\frac{1}{\langle\psi|P_{\lambda}|\psi\rangle}$ 。由于归一化因子对相位无法要求,因此最简单的只需要取 $c$ 为实数即可: $c=\frac{1}{\sqrt{\langle\psi|P_{\lambda}|\psi\rangle} }$ 。于是可以总结为:

测量前处于归一化 $|\psi\rangle$ 态的体系,若测量物理量 $\mathscr A$ 得到结果为谱点 $a$ ,则测量后系统的态变为 $\frac{P_{a}|\psi\rangle}{\sqrt{\langle\psi|P_{a}|\psi\rangle} }$ ,即态 $|\psi\rangle$ 在属于 $a$ 的本征子空间上的归一化投影。

特别地,对于非简并的本征值 $a_n$ , $P_{a_n}=|u_n\rangle\langle u_n|$ ,则测量后的态为

可见结果就是对应的本征矢。

而对于简并的本征值 $a_n$ , $P_{a_n}=\sum_i|u_n^i\rangle\langle u_n^i|$ ,则

其中 $c_n^i$ 是 $|\psi\rangle$ 在 $|u_n^i\rangle$ 上的分量。

注:虽然测量后的态矢一定属于 $a_n$ 的本征子空间,但绝不是任一右矢都有可能,而必须是 $|\psi\rangle$ 投影在其中的那一部分。

演化假定

态矢随时间的演化满足薛定谔方程 ${ {\rm i}\hbar\dfrac{\rm d}{ {\rm d}t}|\psi(t)\rangle=H(t)|\psi(t)\rangle}$ ,其中 ${H(t)}$ 是与系统总能量相联系的观察算符,称为哈密顿算符。

这一假设即是薛定谔提出的波动力学的基础。

关于这一假定,其实还可以联系到一个比较重要的话题——演化算符,用以描述量子系统的任何与外部操作无关的“规范性”演化。这类演化不是厄密或者自伴算符,而是用幺正算符(数学上称酉算符)来描述。这将在后面详细讨论。

正则量子化

上一节给出了关于构建一个自洽的量子理论的公理基础框架;但是具体怎样得到理论的细节,例如可观测量假定中算符的具体形式如何,这些还都需要进一步的讨论。

有关这些内容的问题,大都可以被归结为寻找合适的“量子化方法”,来将我们在宏观要进行测量的物理量,转化为量子理论中的对象,最常见的便是本小节将要介绍的“正则量子化”,它与经典力学中的哈密顿力学直接相关。

正则量子化的基本思想是,要构造一个完整的量子理论,由于我们要寻找的物理量(至少是大部分物理量,除去少部分没有宏观对应的,例如自旋)基本上都是从宏观理论启发而来,且宏观与微观理论一定是相容的,因此可以借助宏观物理量之间的关系来尝试对微观进行刻画,也就是利用熟知的哈密顿力学,来尝试是否可以移植到基于前述基本假定的框架之中,至少看看能否找到类似的关系。

因此正则量子化的基本任务就是,对于经典力学中给定的物理量 $\mathscr A$ ,怎样寻找它在量子力学中对应的算符 $A$ 。

正则量子化规则陈述

首先复习一下哈密顿力学。对于处于标量势场中的单粒子,它的运动状态完全由位置 $\boldsymbol r=(x,y,z)$ 和动量 $\boldsymbol p=(p_x,p_y,p_z)$ 所决定,称之为正则变量,满足正则关系。粒子的任何物理量都可表示为正则变量的函数: $\mathscr A(\boldsymbol r,\boldsymbol p,t)$ ,且 $\frac{\rm d}{ {\rm d}t}\mathscr A=\{\mathscr A,\mathscr H\}+\frac{\partial}{\partial t}\mathscr A$ 。

于是正则量子化的规则陈述如下:

  1. 首先考虑处于标量势场中的一个无自旋粒子,

    描述位置 $\boldsymbol r=(x,y,z)$ 的是观察算符 $R=(X,Y,Z)$ ,称之为坐标算符;

    描述共轭动量 $\boldsymbol p=(p_x,p_y,p_z)$ 的是观察算符 $P=(P_x,P_y,P_z)$ ,称之为动量算符。

  2. 任一具有经典对应 $\mathscr A$ 的物理量的观察算符 $A$ 可由 $R$ 、 $P$ 表达。只需将经典关系式 $\mathscr A(\boldsymbol r,\boldsymbol p,t)$ 做对称化处理,再将 $\boldsymbol r$ 、 $\boldsymbol p$ 分别替换为 $R$ 、 $P$ 。

注:这里是针对共轭动量而非机械动量来进行量子化的。

下面是几个要点:

  • 泊松括号——算符对易子(李括号)

注意到这里算符 $R$ 、 $P$ 满足正则对易关系:

其实也是承自经典正则关系(泊松括号)

事实上可以粗略地认为,正则量子化就是将哈密顿力学中的 $\{ {*},{*}\}\longrightarrow\frac{1}{ {\rm i}\hbar}[{*},{*}]$(尽管这种物理对应实际上具有数学上的问题) ,这也包括后面将会看到的海森堡绘景中的运动方程。

  • 内积的量子化——对称化

由于经典内积可交换: $\boldsymbol r\cdot\boldsymbol p=\boldsymbol p\cdot\boldsymbol r$ ,但是算符不对易: $RP\neq PR$ 且均非厄密算符,实际在对这种经典物理量地内积形式进行正则量子化时需要做对称化处理,即

  • 没有经典对应的物理量

例如自旋,并不能从经典力学获知它表达式的启发。对于这类量,需要直接根据实验结果来定义其对应的观察算符。

下面以哈密顿算符为例,给出两个例子。

标量势场中的哈密顿算符

在经典力学中考虑一个质量为 $m$ 的粒子,处于标量势场 $U(\boldsymbol r)$ (例如,静电场)中,耦合强度因子为 $q$ (例如,电荷)使得势能为 $V(\boldsymbol r)=qU(\boldsymbol r)$ ,对应的哈密顿函数为

根据上述规则,其正则量子化容易导出,即考虑处于同样条件下的无自旋微观粒子,哈密顿算符为:

于是薛定谔方程为

矢量势场中的哈密顿算符

现在考虑处于矢量势场(例如,电磁场)中的粒子情形。经典哈密顿函数为

其中 $U(\boldsymbol r,t)$ 、 $A(\boldsymbol r,t)$ 分别是矢量场的标势和矢势;其正则量子化为

薛定谔方程为

第一节中我们给出了量子力学理论框架的基本假设和有关正则量子化的基本概述;具体的物理意义和解释,将会在下面的几节之中逐步给出。

关于可观测量及其测量的假定的物理解释

本节重点解释第三、四条假定的物理意义。

量子化规则与波函数的概率诠释

前面的分析已经自然地引导我们将观察算符 $R$ 、 $P$ 与粒子的位置、动量相联系,尤其是:若将第三条假定应用于这两个算符,就能重新得到之前关于波函数的概率诠释。

详细讨论这一对应关系十分必要。简便起见考虑一维情形,假设粒子处于归一化的态 $|\psi\rangle$ ,则根据假定四,测量其位置所得结果介于坐标区间 $[x,x+{\rm d}x]$ 的概率是 ${\rm d}\mathscr P(x)=|\langle x|\psi\rangle|^2{\rm d}x$ ;这里 $|x\rangle$ 是算符 $X$ 的属于本征值 $x$ 的本征矢。从这立即看到,波函数 $\psi(x)=\langle x|\psi\rangle$ 的模方就是粒子位置的概率密度;这也就回到了波函数的概率诠释。

另一方面,对于粒子动量的测量也有类似的结论,即根据假定四,测量其动量所得结果介于坐标区间 $[p_x,p_x+{\rm d}p_x]$ 的概率是 ${\rm d}\mathscr P(p_x)=|\langle p_x|\psi\rangle|^2{\rm d}p_x$ ;这里 $|p_x\rangle$ 是算符 $P_x$ 的属于本征值 $p_x$ 的本征矢;也即波函数 $\phi(p_x)=\langle p_x|\psi\rangle$ 的模方就是粒子动量的概率密度。

某些物理量的量子化

量子化”的历史本意是指,不同于经典力学中很多物理量取值都是连续变化的,实验中某些情况下测得这些物理量的取值只能取分立的值;或者在某些理论中,需要假定物理量的确具有这种分立取值的特点才能合理解释某些现象。

当然这并不是绝对的:一方面,并非所有物理量在量子理论中一定都是传统意义上的“量子化”(即取离散谱)的;另一方面,同一个物理量的取值是否是量子化的,在不同的物理系统中也不尽然相同。这具体取决于观察算符的谱,而谱的形式又与系统各种条件密切相关。

这个逻辑表明,一个特定的系统中物理量是否量子化,绝非是先验的。

测量的机制

第三、第四个假设,事实上引出了一些根本性的复杂问题,涉及到对于量子力学理论的基本诠释——即理论从应用的角度来说,关于各种物理量计算的框架和细节都已经十分完备;但是对于它们的解释却众说纷纭,未成定论。

在这里不去纠缠于这些深层次的内容,但是需要特别指出的是:在理论研究中我们常常默认离开测量仪器而孤立地研究所观察的物理系统对象,然而事实上我们作为研究主体,与客体对象之间建立联系的过程中,测量仪器是至关重要的——要获得某一物理系统的测量值,即便是最简单的量子系统,也必须通过测量仪器(同样作为一个极其复杂的物理对象)与之耦合作用。而这就不可避免地对原系统产生干扰。

在经典力学中,无数常识和结果已经验证了,一个设计合理的测量系统对于宏观对象系统的这种干扰,相比于系统本身的运动尺度通常是非常小的,因而可以忽略;但是没有证据表明我们可以在微观系统仍然沿用这种忽略的默认。事实上我们本应考虑的是测量仪器与物理对象的整体系统,但是,这样势必会使得物理系统的复杂度极大提升,同时也会引起关于测量的详细机制的一些微妙问题。

这里仅仅指出,关于第三、四条假设的非决定性(概率性)表述,以及波函数的异常行为(所谓坍缩),都与上面提到的这些问题有关,粗略来说,即可以看作是测量仪器对系统干扰的反映;但是由于这种干扰基本是无法预测的,因而测量结果也是非确定的。

还应当指出,这里所指的测量只考虑理想测量。例如检偏器总会吸收一些它本应允许通过的光子;但是在理想测量假定下,我们通常不考虑这种仪器因与测量无关的性质引起的误差,而完全归结为测量这一行为的量子机制。

可观测量在指定态中的期望

第三条假定所给出的表述是概率性的;但是单次测量得到的结果却一定是确定值。为了验证这种假定,必须要对物理系统在全同条件下进行极多次测量——当然全同条件是难以达到的,一次测量就会破坏原有条件,这实际上需要引入系综,但是这里不详细讨论这一点——如果这一假定给出的预言是正确的,那么应当在测量次数 $N\to\infty$ 时得到某一结果的频率趋于理论预言给出的概率。无穷次测量当然是不可能达到的,因此必须引入统计手段

在给定态 $|\psi\rangle$ 中,可观测量 $\mathscr A$ 的期望记作 $\langle \mathscr A\rangle_\psi$ ,或用算符表示为 $\langle A\rangle_\psi$ ,可定义为在态 $|\psi\rangle$ 中对 $\mathscr A$ 测量 $N$ 次的结果的平均值,在 $N\to\infty$ 时的极限。另一方面,假定三从理论上可以给出它的预言(假若 $|\psi\rangle$ 是归一化的):

下面证明这一点。

首先考虑纯粹离散谱的情况:在对 $\mathscr A$ 的 $N$ 次测量,得到本征值 $a_n$ 的次数为 $\mathscr N(a_n)$ ,根据定义

且概率满足归一化条件 $\sum_{n}\mathscr N(a_n)=N$ 。 $N$ 次测量平均值为 $\frac{1}{N}\sum_{n}a_n\mathscr N(a_n)$ ,其极限为

这里利用了概率的定义。再将 $\mathscr P(a_n)$ 表达式代入此式,得到

由于 $A|u_n^i\rangle=a_n|u_n^i\rangle$ ,故

即证。

继续考虑连续谱:在对 $\mathscr A$ 的 $N$ 次测量,得到测量值处于 $[\alpha,\alpha+{\rm d}\alpha]$ 的次数为 ${\rm d}\mathscr N(\alpha)$ ,根据定义

且概率满足归一化条件 $\int{\rm d}\mathscr N(\alpha )=N$ 。 $N$ 次测量平均值为 $\frac{1}{N}\int \alpha{\rm d}\mathscr N(\alpha)$ ,其极限为

这里利用了概率的定义。再将 ${\rm d}\mathscr P(\alpha)$ 表达式代入此式,得到

由于 $A|v_\alpha\rangle=\alpha|v_\alpha\rangle$ ,故

即证。

注意:

  1. 这里的期望 $\langle A\rangle_\psi$ 是多次全同测量的结果平均值,而非对时间的平均值;在涉及到与时间有关的现象时会另外定义时间均值。

  2. 假若态矢 $|\psi\rangle$ 未归一化,则 $\langle A\rangle_\psi=\frac{\langle \psi|A|\psi\rangle}{\langle \psi|\psi\rangle}$

  3. 一般来说要具体算出期望 $\langle A\rangle_\psi$ ,事实上需要在一个确定的表象当中计算。例如在坐标表象下计算坐标的期望:

    又如在动量表象下计算动量的期望

    还可在坐标表象下计算动量的期望

标准差——方均根偏差

期望 $\langle A\rangle_\psi$ 给出了系统测量 $\mathscr A$ 结果的大致数量级,但是并不能刻画测量结果的离散程度,事实上这类信息通常包含在概率密度曲线的形状之中。直观来说,通常可观测量值的概率密度分布函数会是一个单峰的形状,而平均值决定它的整体位置,可能出现的值大部分处在这个峰的范围之内,峰的宽度也就大致反映了整体的离散程度。

一般情况下,刻画一组数据的离散程度,通常会用数学上的方均根偏差,即标准差,记作 $\Delta\mathscr A$ ,或用算符表示为 $\Delta A$ ,顾名思义就是“偏差平方的均值和开根”。它的朴素思想是,对于每一次测量,都求出所得结果与期望值的差,然后计算这些差的平均值;但是位于期望值两侧的结果值会正负抵消,因此可以将这些差平方之后再求均值,即方均偏差——方差

最后,为了使得偏差的量纲与测量值量纲相同,因此再开方即可得到方均根偏差——标准差

代入前面均值期望的表达式

于是给出了计算标准差的另一个方法,即分别计算 $A$ 和 $A^2$ 的期望。

在物理上,方均根偏差,或称标准差,一般被直观地解释为测量值的不确定度

可观测量的相容性与不确定性

本节进一步针对可观测量之间的关系,对第三条假定做一些讨论。

相容性与对易性

考虑两对易的观察算符: $[A,B]=0$ ,简单起见假设两者的谱均为离散谱。则存在共同本征矢构成的基 $\{|a_n,b_p,i\rangle\}$:

因此对于任意的本征值 $a_n$ 和 $b_p$ ,至少存在一个态 $|a_n,b_p,i\rangle$ ,对其测量 $A$ 一定得到 $a_n$ 、测量 $B$ 一定得到 $b_p$ ,即两个可观测量均可同时被完全确定;这样的称为相容的可观测量。

下面更细致地讨论一下对于处在任意(归一化)态 $|\psi\rangle$ 的体系,若已选定了一对相容可观测量 $A$ 、 $B$ ,它们的观测效应。一定有

一般说来它并不是共同本征矢,因而不能同时完全确定测量值。假设对它的测量行为是:刚刚测量 $A$ 之后立即测量 $B$ (假定两次测量之间系统来不及按照薛定谔方程演化)。考虑计算两次结果分别为 $a_n$ 、 $b_p$ 的概率 $\mathscr P(a_n,b_p)$ 。

首先测量 $A$ 得到 $a_n$ 的概率为 $\mathscr P(a_n)=\sum_{p,i}|c_{n,p,i}|^2$ ;接着测量 $B$ 时,系统已不再处于 $|\psi\rangle$ 态,而是在

所以条件概率

于是联合概率

此外,在完成第二次测量之后系统的态变为

由此可知,若立即重新测量 $A$ 、 $B$ 必得到相同的结果,这是因为两次测量已将系统的态变为了它们的共同本征矢 $|\psi’’_{n,p}\rangle$ 。
另一方面,假设交换两个可观测量的测量顺序,那么第一次测量

第二次测量

于是

可见,交换顺序后,无论是测量结果还是测量后对系统产生的影响,都与之前一样。由此可以得出:对于相容的可观测量,无论测量顺序如何,得到的物理结果没有影响;测量结束后系统的状态也没有影响。

换句话说,相容的可观测量,测量一个不会对另一个的测量造成信息损失;测量顺序也无关紧要,或者说,可以同时测量。

不确定性与(共轭)非对易性

与之对比的是不可对易的可观测量,那么一般说来,一个态矢不可能同时为两个不可对易观察算符的本征矢,也就是不存在能够同时确定两个可观测量的态(某些情况下,也许存在一些右矢同时是 $A$ 、 $B$ 的本征矢,但是它们不足以构成一个基)。这就对应于前面提到的“海森堡不确定性原理”。

回顾之前讨论不确定性原理,当时给出的下限只是一个大致值,因为当时对于不确定度还没有准确定义。现在通过标准差给出了精确的定义,于是将之应用于可观测量 $R$ 、 $P$ 的对易关系,可以证明:对于任意态 $|\psi\rangle$ ,均有

此即关于位置和动量的海森堡不确定性关系的精确表达式。下面来证明并讨论这一关系的普遍形式,即两个共轭可观测量的方均根偏差。

关于两个共轭可观测量的不确定度关系

若两个可观测量 $P$ 、 $Q$ 的对易子满足 $[Q,P]={\rm i}\hbar$ ,则称它们为共轭可观测量。考虑如下右矢:

不论实参量 $\lambda$ 取何值,模方总是正的:

这是关于 $\lambda$ 的二次三项式,要成立应当判别式非正

现在引入两个新的可观测量 $P’$ 、 $Q’$ ,定义为:

显然 $[Q’,P’]=Q’P’-P’Q’=[Q,P]={\rm i}\hbar$ ,即它们也是共轭的。将上面关于期望的不等式应用于它们,则有

考虑到方均根偏差的定义: $\Delta A=\sqrt{\Big\langle\big(A-\langle A\rangle\big)^2\Big\rangle}=\sqrt{A’^2}$ ,可得

可见对于任意两个共轭的可观测量,其不确定度的乘积 $\Delta P\cdot\Delta Q$ 有一个明确的下界$\frac{\hbar}{2}$;这可看作是对海森堡不确定性关系的推广。

进一步地,上述结论其实可以推广到任意的两个可观测量之间:

应当说明,无论是哪种情况,上述不等式都应当理解为作用于明确的态;对于不同的态而言,其不确定度乘积可能不同,但是始终都在下界之上。

“极小”波包

预期当前述不确定性关系取等号的时候应当是一个极限情况。若对于某个态 $|\psi\rangle$ , $\Delta P\cdot\Delta Q=\frac{\hbar}{2}$ ,则称此时的 $|\psi\rangle$ 对于可观测量 $P$ 、 $Q$ 而言对应于一个极小波包。

回顾前面的证明过程,右矢 $|\varphi’\rangle=(Q’+{\rm i}\lambda P’)|\psi\rangle$ 的模方非负;取等则对应着 $\lambda$ 的二次式的判别式 $\Delta=0$ ,有唯一重根 $\lambda_0$ 。因此当 $\lambda=\lambda_0$ 时,

解得

而模方为零即表明,此时的态满足

在观察算符 $Q$ 的本征矢构成的表象 $\{|q\rangle\}$ 中看待上述对于态要求满足的式子(简单起见,设本征值 $q$ 非简并)。前面证明了,算符 $P$ 在此表象下的作用为 $\frac{\hbar}{\rm i}\frac{\rm d}{ {\rm d}q}$ ,于是

引入一个函数 $\theta(q)=\psi(q+\langle Q\rangle){\rm e}^{-\frac{\rm i}{\hbar}\langle P\rangle (q+\langle Q\rangle)}$ ,即 $\psi(q)={\rm e}^{-\frac{\rm i}{\hbar}\langle P\rangle q}\theta(q-\langle Q\rangle)$ ,可将上式化简

它的解为 $\theta(q)=C{\rm e}^{-q^2/2\lambda_0\hbar}$ ,于是结合关系 $\lambda_0=\frac{2(\Delta Q)^2}{\hbar}$ 可得

只需令 $C=[2\pi(\Delta Q)^2]^{-1/4}$ 它就是归一化的。

可见:当不确定度的乘积 $\Delta P\cdot\Delta Q$ 取极小值 $\frac{\hbar}{2}$ 时, $\{|q\rangle\}$ 表象中的波函数是一个高斯型波包;当然,在表象 $\{|p\rangle\}$ 中也是如此,因为两个可观测量是完全对称的。粗略可以理解为,乘积取极小值是在两个可观测量之间取了一个平衡,使得既不会 $\Delta P$ 过大也不会 $\Delta Q$ 过大,而这种平衡的结果就是高斯型波包,这就是所谓“极小波包”。

非对易(不相容)可观测量的测量顺序

前面曾经证明相容可观测量的测量结果与顺序无关,且互相之间不会产生信息损失;但是在非对易可观测量情况下前面的推导就不再成立了。

简言之,对于非对易可观测量量 $P$ 、 $Q$ ,设其本征矢构成的基分别是表象 $\{|p\rangle\} 、 \{|q\rangle\}$ ;算符的非对易意味着这两个基不可能重合。对于所研究的归一化初态 $|\psi\rangle$ :

再设两组本征矢分别在对方表象下的分解:

若先测量 $P$ 得到值 $p_m$ ,则系统变到 $|p_m\rangle$ ,再测量 $Q$ 得到值 $q_s$ ,则系统变到 $|q_s\rangle$ ;而若先测量 $Q$ 再测量 $P$ ,即便与之前的到相同的结果 $q_s$ 、 $p_m$ ,但是系统的变化和终态也不相同: $|\psi\rangle\Longrightarrow|q_s\rangle\Longrightarrow|p_m\rangle$ 。可见非对易可观测量的测量顺序对于系统的状态有很大影响。

此外,测量得到同一组结果的概率:

虽然 $f_{s,j}=h_{m,i}$ ,但是一般来说 $c_{m,i}\neq d_{s,j}$ ,因此非对易可观测量的测量顺序不同也会导致测量结果不同(概率意义)。

换句话说,非对易的可观测量是不能同时测量的;后面的测量会抹去第一次测量所得的信息,即第二次测量会立即使得系统的第一个可观测量的值发生改变,因此再重新测量第一个可观测量,结果是不确定的。着与S-G实验的结果是相符的。

态的制备与CSCO

所谓态的制备,就是指获得一个特定的量子态——这里的特定是指,对于我们所关心的可观测量,给定一组测量值,对应的量子态可以被完全确定(态矢仅差一个复常数)。为了设计这种制备方法,首先讨论观测值与末态的关系。

假定四中已经证明,考虑处于态 $|\psi\rangle$ 的物理系统,对其可观测量 $A$ 进行测量,假设得到非简并离散谱点 $a_n$ ,那么测量后系统将会处于对应的本征矢 $|a_n\rangle$ ,这种情况下只要知道测量值就能完全确定测量后的态,即本征值非简并时,只要知道测量值,终态就与初态无关;这是因为 $\frac{c_n}{|c_n|}|a_n\rangle 与 |a_n\rangle$ 在物理上代表完全相同的态。事实上甚至不需要考虑相位问题,因为厄密算符的本征值总是实的。

另一方面,若测得简并的本征值 $a_n$ ,则得到的将会是 $|\psi\rangle$ 在本征子空间中的投影

诸系数 $c_n^i$ 均可能是复数,则它们的模及它们相互的相对相位对终态是有影响的;换句话说本征值存在简并时,即便知道测量值,终态也与初态是有关的。
上述结论是显然的;但是假若考虑一对相容可观测量 $A$ 、 $B$ 同时测量,得到结果 $(a_n,b_p)$ ,即便它们的本征值存在简并,但如果 $A$ 、 $B$ 构成一个CSCO,那么则可唯一确定一个共同本征矢 $|a_n,b_p\rangle$ ,这时仅通过本征值组就能完全确定测量后的态,于是再次出现了若知道测量值,终态就与初态无关的情况。

但如果 $A$ 、 $B$ 不能构成一个CSCO,那么得到的将还会是一个线性组合的形式

这时若知道测量值,终态仍与初态有关,但初态可能的范围被缩小了。如想消除这种不确定性,则还需要继续引入相容的可观测量来构成一个CSCO。

这个过程进一步体现了引入CSCO的必要性:为使系统在测量之后终态可以被唯一地确定,被测量必须构成一个CSCO。

因此制备一个处在完全确定的量子态系统的方法,可以通过类似获得偏振光的方法,即设计这样一种仪器,它针对某可观测量,使得仅有特定本征值的态能通过;再通过我们所关心的可观测量构成的CSCO,依次将针对不同可观测量的仪器串联,这样输入一大批任意态,就能够筛选出特定的态。

对于态空间中的任一态,只要适当地选取CSCO,就一定能够筛选出它。

薛定谔方程的物理意义

本节重点解释第五条假定的物理意义。

薛定谔方程的普遍性质

物理体系演化的确定性

薛定谔方程

是关于时间 $t$ 的一阶常微分方程,由此可知,只要给定初始条件即初态 $|\psi(t_0)\rangle$ ,就足以确定此后任意时刻的态 $|\psi(t)\rangle$ 。因此,在物理系统随时间演化的过程中,不存在任何不确定性——不确定性,或者说概率性,仅仅出现在测量过程中。这时态矢发生了不可预测的“跃变”,或者说波包坍缩。但是在两次测量之间,态矢量的演化则是完全确定的。

叠加原理

薛定谔方程是齐次线性的,因而它的解满足叠加原理,即:

假设 $|\psi_1(t)\rangle$ 、 $|\psi_2(t)\rangle$ 是方程的两个解,分别对应于初态 $|\psi_1(t_0)\rangle$ 、 $|\psi_2(t_0)\rangle$ 。那么假若初态是 $|\psi(t_0)\rangle=\lambda_1|\psi_1(t_0)\rangle+\lambda_2|\psi_2(t_0)\rangle$ ,则方程的解为 $|\psi(t)\rangle=\lambda_1|\psi_1(t)\rangle+\lambda_2|\psi_2(t)\rangle$ 。

由此可见初态 $|\psi(t_0)\rangle$ 与终态 $|\psi(t)\rangle$ 之间的对应关系是线性的,因而薛定谔方程所代表的这种演化关系事实上可以由态空间上的一个线性变换所描述——这将在后面的幺正算符部分详细说明。

概率守恒

态矢量模方恒定

考虑态矢量模方随时间的变化情况:

其中根据薛定谔方程

由哈密顿算符 $H(t)$ 的厄密性可知,两边同取厄密共轭

于是将这两式代回得到

可知态矢量的模方不随时间演化而改变,它是一个守恒量。从概率诠释的角度来讲,这是非常重要的一条性质,因为选取一个表象 $\{|\alpha\rangle\}$ 下(归一化态矢)

可见态矢的归一化等价于波函数的归一化;态矢的模方恒定意味着在该表象下粒子的概率密度函数在全域上的积分恒定(例如,对于坐标表象,就意味着在全空间找到粒子的概率不变),亦即总概率是不变的且为$1$这才是能够将 $|\psi(\alpha,t)|^2$ 解释为概率密度函数的原因。

概率的局域守恒;概率密度和概率流

仅考虑无自旋单粒子,设其在坐标表象 $\{|\boldsymbol r\rangle\}$ 下的归一化波函数为 $\psi(\boldsymbol r,t)$ ,定义:

概率密度,表明在时刻 $t$ ,测量粒子的位置出现在 $\boldsymbol r$ 附近的体积元 ${\rm d}^3r$ 中的概率为 ${\rm d}\mathscr P(\boldsymbol r,t)=\rho(\boldsymbol rt){\rm d}^3r$ 。

虽然 $\rho(\boldsymbol r,t)$ 在全空间的积分是时不变——守恒的,但是它的具体分布,即不同的 $\boldsymbol r$ 处的值却有可能是时变的。那么不同值处的概率密度发生变化,就会产生某种“流”用以表征这种概率的转移。事实上,考虑固定一 $\boldsymbol r$ 处的概率密度随时间变化:

考虑坐标表象下的薛定谔方程及其共轭复数式

于是就可得到

于是只要定义“概率流密度”为

则上式就能够写成

此即数学上的守恒流方程,在这里被称为概率的局域守恒关系式,表示在一个确定局域内部的概率密度的变化量与边界上概率流的通量之和为零。

事实上相比于先验地指定概率密度就是波函数的模方,构造“满足守恒流方程”才是更符合逻辑的对概率密度和概率流的定义;例如,在狄拉克方程中,概率密度就不再是波函数的模方,而是依靠构造守恒流方程来满足概率的局部守恒,这样才能赋予某个量以概率密度或概率流的物理意义。因此,指定波函数模方为概率密度,绝非是先验的,而是基于物理意义的情况。

注意到概率流的定义,事实上并非仅是数学凑成的,实际也具有物理动机。考虑如下算符

它在态 $|\psi(t)\rangle$ 中的期望为

可见概率流密度实际上是算符 $K(\boldsymbol r)$ 的期望(坐标表象下)。

另一方面

可见概率密度实际上是算符 $|\boldsymbol r\rangle\langle\boldsymbol r|$ 的期望(坐标表象下)。

而考虑算符 $K(\boldsymbol r)$ ,结合正则量子化规则不难看出

其中算符 $\frac{P}{m}= v$ 的物理意义显然对应于经典力学中的速度$v$。因此所谓的概率流密度算符 $K(\boldsymbol r)$ 就是由经典的概率密度 $\rho$ 和粒子的速度 $v$ 之乘积经过对称化而正则量子化构成的,这正好对应于经典的流密度矢量 $\rho v$ (例如,经典带电粒子的电流密度就是电荷密度与粒子的迁移速度之积)。

可以将这一结论推广到其他的表象$\{ | u_i \rangle \}$中,在其中$u$处的概率密度$\rho(u)$就是相应表象中算符 $| u \rangle \langle u |$ 的期望,概率流密度也类似。
另外,若粒子不单处于标量势场中,还有矢量场 $A(\boldsymbol r,t)$ ——例如电磁场——那么概率流的定义

这可以直接从经典对应的机械动量与正则动量之间的关系得到。
最后考虑一个平面波的例子,即 $\psi(\boldsymbol r,t)=A{\rm e}^{ {\rm i}( k\cdot\boldsymbol r-\omega t)}$ ,显然对应的概率密度 $\rho=|A|^2$ 为时间和空间上的恒量;换句话说全空间的概率密度都相同,且与时间无关。那么这是否能说明概率流处处为零呢?并不能。事实上根据定义可以得到

其中利用了色散关系 $\omega=\frac{\hbar k^2}{2m}$ 。可见概率流也是分布在全空间处处相等且与时间无关的矢量场,其等于概率密度与其群速度(对应于经典粒子的运动速度)之积。这再次得到了之前 $K(\boldsymbol r)\Longleftrightarrow\rho v$ 的关系。

当然,此时的概率流矢量场在无穷远处也具有恒定的大小,这种奇异性仍然是出于“平面波不是真实的物理状态”的原因;对于实际的局域波包,其概率密度和概率流自然都是分布在有限区域内的。

可观测量的期望随时间的演变

可观测量的期望有可能是随时间而变化的: $\langle A\rangle(t)=\langle \psi(t)|A(t)|\psi(t)\rangle$ ,而产生这种变化的原因可能来自于两方面:

一方面,物理系统的态本身可能就是在随时间演化的,那么显然对它的任意可观测量的期望也将会随时间变化(即便可观测量本身不随时间变化): $\langle A\rangle(t)=\langle \psi(t)|A|\psi(t)\rangle$ ,可见可观测量期望的变化依赖于态矢本身的变化,因此可以用薛定谔方程来分析这种原因所造成的期望的变化。

另一方面,可观测量本身也有可能是时变的,典型例子如时变的标量场中粒子的哈密顿算符就是时变的,这种情况下 $\langle A\rangle(t)=\langle \psi|A(t)|\psi\rangle$ ,这是期望随时间变化的另一个原因。

普遍情况

其中前两项代表由态矢的演化引起的期望变化,可由薛定谔方程代入推导;后一项代表可观测量本身的变化引起的期望变化。于是

此式又可写作

应当指出,它与经典哈密顿力学中的关系

是对应的,而我们这里可以讨论一下经典力学量 $\mathscr A$ 与时间的依赖关系是如何产生的。一般而言,经典力学量在哈密顿力学中总可以表示为 $\mathscr A(\boldsymbol r,\boldsymbol p,t)$ ,它可以直接显含时间;而质点的坐标 $\boldsymbol r$ 和动量 $\boldsymbol p$ 本身也可依赖于时间 $t$ ,因此一个经典力学量 $\mathscr A(\boldsymbol r,\boldsymbol p,t)$ 既可以显含 $t$ 又可以通过宗量 $\boldsymbol r$ 和 $\boldsymbol p$ 隐式地依赖于 $t$ 。于是上面的经典关系式无非就是一个多元函数导数的链式法则,只不过将其中的两项利用经典的“泊松括号”表达成与哈密顿量之间的关系。

当它过渡到量子理论的时候,我们把力学量 $\mathscr A(\boldsymbol r,\boldsymbol p,t)$ 、 $\boldsymbol r$ 、 $\boldsymbol p$ 分别对应于观察算符 $A(R,P,t)$ 、 $R$ 、 $P$ ,而时间 $t$ 仍然作为一个参数,实际上并没有改变。但是量子化后的算符 $R$ 、 $P$ 却不再与时间有关(表现为,它们的本征值和本征矢都与时间无关);但是 $\boldsymbol r$ 与 $\boldsymbol p$ 对时间的依赖性,却转移到了态 $|\psi(t)\rangle$ 中,而不是转移到对应的观察算符中。这是因为在经典哈密顿力学中, $\boldsymbol r$ 与 $\boldsymbol p$ 本身就是经典质点的“态”。

应用到可观测量 $R$ 、 $P$ 上:埃伦费斯特定理

首先考虑一个时间无关标量势场 $V(R)$ 中的粒子,此时哈密顿算符

不显含时间,且分为的两部分分别仅与 $P$ 、 $R$ 有关;另一方面。观察算符 $R$ 、 $P$ 本身也与时间无关,因此(利用两者之间的正则对易关系)

第二式利用了算符的函数的对易子的结论;这里 $\nabla V(R)$ 表示在势函数 $V(\boldsymbol r)$ 的梯度 $\nabla V(\boldsymbol r)$ 的三个分量中将 $\boldsymbol r$ 换成 $R$ 得到的三个算符组成的“矢量算符”。

注:矢量算符,例如 $R$ 的期望 $\langle R\rangle$ 是指一个三元数组 $\big(\langle X\rangle,\langle Y\rangle,\langle Z\rangle\big)$ , $P$ 也是类似。

于是

此即埃伦费斯特定理。它的经典对应物正是哈密顿-雅可比方程,在这里的简单情况下退化为牛顿方程

下面分析埃伦费斯特定理的物理意义。假设波函数 $\psi(\boldsymbol r,t)$ 是一个波包;称 $R$ 在其上的期望 $\langle R\rangle(t)=\big(\langle X\rangle(t),\langle Y\rangle(t),\langle Z\rangle(t)\big)$ 为 $t$ 时刻波包的中心,而曲线 $\langle R\rangle(t)$ 则对应于各个时刻波包中心走过的“轨道”。

注:一般来说波包中心(均值)和极大值是不同的,除非波包的形状是单峰、对称的。

需要注意,量子力学中粒子永远没有轨道可言,这个所谓的“波包中心轨道”只不过是一种近似描述,当波包宽度相比于问题涉及的尺度很小的时候,这种近似程度就比较好;在极限情况下,我们通过这种量子近似描述获得的结论,就应当回到经典理论。

于是最显然的问题就是,波包中心的运动是否满足经典力学规律。根据埃伦费斯特定理,

如果方程左边是作用在波包中心的经典力 $\big[-\nabla V(\boldsymbol r)\big]_{\boldsymbol r=\langle R\rangle}$ ,那么波包中心的运动就满足牛顿定律;但是一般来说, $-\langle \nabla V(R)\rangle\neq\big[-\nabla V(\boldsymbol r)\big]_{\boldsymbol r=\langle R\rangle}$ (一个函数的均值不等于自变量取均值时的函数值),事实上左边是标量场作用在整个波包上的力的平均值。因此波包中心并不严格满足经典规律

于是埃伦费斯特定理的物理意义,实际上指出了两点:

  1. 运动学:波包中心的“坐标”与“动量”,即波包坐标与动量的期望之间的关系,也满足一般粒子坐标与动量的运动学关系;

  2. 动力学:作用在波包整体上的力,决定波包中心的运动,这种决定方式形式上可以回归到经典规律,只不过力项不是单独作用在波包中心的力而是作用在波包整体上的力。

但是对于某些特殊情况(称之为准经典情况),上面的 $-\langle \nabla V(R)\rangle$ 与 $\big[-\nabla V(\boldsymbol r)\big]_{\boldsymbol r=\langle R\rangle}$ 可以(至少在一定允许误差范围内近似)相等。为了看出这一点,在表象 $\{| \boldsymbol r\rangle\}$ 中写出:

要使两者近似相等,就要求

也即 $|\psi(\boldsymbol r,t)|^2$ 具有显著值的区域线度很小,至少要甚小于 $V(\boldsymbol r)$ 有明显变化的距离。于是对于充分狭窄的波包,它整体的运动就可由这样一个近似满足经典运动规律的中心所近似。

保守体系

从薛定谔方程中可以看出,给定初态后,一个系统的哈密顿算符 $H(t)$ 将会完全决定它之后的演化,因而哈密顿算符在系统时间演化的分析中至关重要。这里首先讨论一个简化问题:若一个物理系统的哈密顿函数 $H$ 不显含时( $\frac{\partial H}{\partial t}=0$ ,但不代表 $\frac{ {\rm d} H}{ {\rm d} t}=0$ )。则称该系统是保守系统;这一定义对于经典力学和量子力学都是适用的。在经典力学中,这种情况最重要的后果之一就是能量守恒,或说系统总能量是一个运动常量。下面将会看到量子力学也会给出相同的结果,并且除了之前讨论的性质,还具有一些特别重要的性质。

本节下面全部讨论都是在保守系中进行的。

薛定谔方程的解

首先考虑 $H$ 的本征方程 $H|\varphi_{n,\tau}\rangle=E_n|\varphi_{n,\tau}\rangle$ 。简单起见假设它的谱是离散的,指标 $\tau$ 用以区分从属同一本征值的本征矢。若 $H$ 不显含时,则说明本征值 $E_n$ 、本征矢 $|\varphi_{n,\tau}\rangle$ 均与时间 $t$ 无关。考虑薛定谔方程

全体 $|\varphi_{n,\tau}\rangle$ 构成一个基,所以 $\forall t>0$ ,都有 $|\psi(t)\rangle=\sum_{n,\tau}c_{n,\tau}(t)|\varphi_{n,\tau}\rangle$ 。由于基矢量与时间无关,因此 $|\psi(t)\rangle$ 对 $t$ 的依赖性就完全体现在诸系数 $c_{n,\tau}(t)$ 中。将薛定谔方程投影到每一个基矢量上(下式左边已将 $\langle\varphi_{n,\tau}|$ 置于导数右侧,因为它与时间无关):

上面利用了 $H$ 的厄密性。则

解之得

可见只要知道了 $H$ 的各个本征值 $E_n$ 、本征矢 $|\varphi_{n,\tau}\rangle$ ,就可以很简单地解出薛定谔方程,并确定任一态 $|\psi(t_0)\rangle$ 随时间的演化,只要按照如下步骤:

  1. 将初态 $|\psi(t_0)\rangle$ 按 $H$ 的本征矢 $|\varphi_{n,\tau}\rangle$ 展开: $|\psi(t_0)\rangle=\sum_{n,\tau}c_{n,\tau}(t_0)|\varphi_{n,\tau}\rangle$ ,其实也就是计算各个系数 $c_{n,\tau}(t_0)=\langle\varphi_{n,\tau}|\psi\rangle$ ;

  2. 对任意的 $t$ , $|\psi(t)\rangle=\sum_{n,\tau}c_{n,\tau}(t_0){\rm e}^{-\frac{\rm i}\hbar E_n(t-t_0)}|\varphi_{n,\tau}\rangle$ 。

上面的结果也可自然推广到连续谱: $|\psi(t)\rangle=\sum_{\tau}\int{\rm d}Ec_{\tau}(E,t_0){\rm e}^{-\frac{\rm i}\hbar E(t-t_0)}|\varphi_{E,\tau}\rangle$。

这一结果正是哈密顿算符可以决定系统演化这一论述的表现。因此确定系统演化实际上被归结为寻找哈密顿算符的本征解,换句话说只要将哈密顿算符对角化就可以确定系统的演化

定态

一个重要情况就是,初态 $|\psi(t_0)\rangle$ 本身就是 $H$ 的本征态,但未必是所选取的基矢量,例如记作 $|\psi_n(t_0)\rangle$ 表示它从属本征值 $E_n$ 。这时按照前述方法, $|\psi(t_0)\rangle=\sum_{\tau}c_{n,\tau}(t_0)|\varphi_{n,\tau}\rangle$ ,展开式中仅包含同一本征值的本征矢;当然,如果 $|\psi(t_0)\rangle$ 本身就是基矢量那么就无需展开了,只需取系数 $c=1$ 。

现在要计算任意 t 时刻的态:

可见它与初态之间仅差一个总的相因子,因而在物理上来说表征的是同一个量子态。这就得到一个结论:若 $H$ 不显含时,则处于 $H$ 的本征态中的物理系统,其一切物理性质都不随时间改变。因此也称 $H$ 的本征态为定态

那么量子意义的能量守恒也就呼之欲出了:若 $H$ 不显含时,那么对任意态 $|\psi\rangle$ 测量其能量,例如得到值 $E_k$ ,那么系统就将会落到 $H$ 相应的本征态 $|\varphi_{n,\tau}\rangle$ 上,它是一个定态;也就是说,无论之后怎样演化、何时测量,系统总属于 $E_k$ 的本征值空间,测量值总是 $E_k$ 。
回过头来,用刚才的观点重新来看态演化的本质:由于态的模长始终取归一化(事实上模长也并无影响),因此所谓初态演化到一个新的不同的态,本质上就是它在所选取的基下的分量改变了(在希尔伯特空间中的方向改变了),导致测量的概率性结果出现了不同,因此我们才能区分它们为不同的态。

哈密顿算符如何影响态的演化?通过对每个展开系数 $c_{n,\tau}(t_0)$ 附加一个相因子 ${\rm e}^{-\frac{\rm i}\hbar E_n(t-t_0)}$ 。如果这些相因子对应于不同的本征值 $E_n$ ,那么附加相位就不同,因此造成了展开系数之间的相对相位,从而导致态的演化。但若是对每个系数所附加的相因子都相同(即对应于同一个本征值 $E_n$ ),那么实际上并没有引入相对相位,所以态矢相当于没有变化。

运动常量

经典力学中,运动常量定义为在系统演化过程中,不显含时间 $\frac{\partial \mathscr A}{\partial t}=0$ 、且与哈密顿函数 $\mathscr H$ 满足泊松括号为零 $\{\mathscr A,\mathscr H\}=0 的力学量 \mathscr A$ ;由这两个定义可知:

可见经典运动常量的值不随时间改变,事实上这也是它得名的原因。特别地,对于保守系统来说,哈密顿函数 $\mathscr H$ 本身就是一个运动常量(代表能量守恒)。

在量子力学中运动常量的定义仍然成立,只不过将泊松括号换成对易子:

我们将会从三个角度讨论“运动常量”在量子力学所代表的“守恒”意义。

事实上上面刚刚给出了第一重意义:作为运动常量的可观测量 $A$ ,它的测量值的期望(在任意态中)都不随时间改变。
下面考虑由于运动常量 $A$ 与 $H$ 对易,因此存在共同本征矢:

指标 $\tau$ 实际上可用以表征那些与 $A$ 、 $H$ 共同构成CSCO的可观测量的本征值。对于保守系来说, $|\varphi_{n,p,\tau}\rangle$ 都是定态,因而以它们为初态,系统将会永远保持这个量子态。因此若一个可观测量 $A$ 为运动常量,那么物理系统一定存在这样一些定态 $\{|\varphi_{n,p,\tau}\rangle\}$ ,在任意时刻 $t$ 对它们测量 $A$ 都会得到相同的本征值 $a_p$ ;且对于任一本征值 $a_p$ ,这样的定态都是存在的。此即第二重意义。出于这个原因,称运动常量 $A$ 的本征值为好量子数

但是需要注意的是,并不是每一个定态一定都是 $A$ 的本征态(存在 $H$ 的本征矢但不是 $A$ 的本征矢);另一方面,也并不是 $A$ 的所有本征矢都是定态(存在 $A$ 的本征矢但不是 $H$ 的本征矢),因此并不能说只要对 $A$ 进行一次观测之后就将永远保持这一态不变;但是可以说,只要对 $A$ 进行一次观测之后就将永远保持这一观测值(本征值)不变。这一论点将会立即在下面的第三重意义中讨论。
最后来说明第三重意义:在任意态 $|\psi(t)\rangle$ 中测量运动常量 $A$ ,得到本征值 $a_p$ 的概率不随时间改变。将前述 $A$ 与 $H$ 的共同本征矢构成一个基:

根据前面的结论得到

于是

可见在任意时刻测量结果得到 $a_p$ 的概率都相同。需要注意的是,这里所谓“测量概率不随时间改变”,不是说对一个物理系统多次测量得到的概率结果都相同,而是指对一个自然演化的物理系统来说,无论何时对它测量一次,概率结果都相同。

事实上只要测量过 $A$ 一次得到结果 $a_p$ 之后,之后任何时候再测量 $A$ 得到的结果都将是同一个本征值。这是因为,假若 $t_0$ 时刻系统处于 $A$ 的属于 $a_p$ 的本征态( $\mathscr P(a_p,t_0)=1$ ),那么在其后的任意时刻 $t$ ,尽管态可能发生了变化,但变化仅局限于 $a_p$ 的本征子空间内,即仍是 $A$ 的属于 $a_p$ 的本征态之一( $\mathscr P(a_p,t)=1$ )。

玻尔频率;选择定则

本节将会看到一个保守系统如何自然地产生一个特征频率。假设任一可观测量 $B$ (不一定与 $H$ 对易),则我们知道它在任一态 $|\psi(t)\rangle$ 上期望的变化率

此外,对于保守系统来说,给定初态 $|\psi(t_0)\rangle$ ,其后任意时刻的态 $|\psi(t)\rangle$ 都可由的本征值和本征矢所决定。因此这种情况下我们可以明显地计算 $\langle\psi(t)|B|\psi(t)\rangle=\langle B\rangle(t)$ 而不仅仅是 $\frac{\rm d}{ {\rm d}t}\langle B\rangle$ 。

首先写出 $|\psi(t)\rangle=\sum_{n,\tau}c_{n,\tau}(t_0){\rm e}^{-\frac{\rm i}\hbar E_n(t-t_0)}|\varphi_{n,\tau}\rangle$ 的厄密共轭式,即左矢的展开:

于是

现在假设 $B$ 不显含时,于是全体矩阵元 $\langle\varphi_{n’,\tau’}|B|\varphi_{n,\tau}\rangle$ 都是常数,上式中与时间有关的就全部集中在指数项上;整体的 $\langle\psi(t)|B|\psi(t)\rangle$ 对时间的依赖关系就仅取决于这样一个振荡型的级数

该级数中的每一项的振荡频率 $\nu_{n,n’}=\frac{|E_n-E_{n’}|}{2\pi\hbar}=\left|\frac{E_n-E_{n’} }{h}\right|$ 称为玻尔频率,仅取决于系统的能量特征,或者说取决于哈密顿算符的本征值的分布,而与可观测量 $B$ 本身和系统的初态无关。而初态的信息则包含在 $K_{n,\tau,n’,\tau’}$ 中。

这一结论的重要意义在于,任一保守系统中所有的物理量的期望都以各种玻尔频率的线性组合进行振荡,这些频率的取值与可观测量 $B$ 本身和系统的初态无关,仅取决于 $H$ 的谱。这又从另一个角度论证了哈密顿算符对于保守系(乃至一般的物理系统)的决定性作用。但是这些频率的组合权重却依赖于 $\langle\varphi_{n’,\tau’}|B|\varphi_{n,\tau}\rangle$ (这由 $B$ 和 $H$ 的本征矢共同决定)和 $c^*_{n’,\tau’}(t_0)c_{n,\tau}(t_0)$ (这由初态 $|\psi(t_0)\rangle$ 和 $H$ 的本征矢共同决定)。

特别地,若对于某些值 $(n,n’)$ 来说 $\langle\varphi_{n’,\tau’}|B|\varphi_{n,\tau}\rangle=0$ ,那么不论初态如何,这些值对应的频率成分 $\nu_{n,n’}$ 都将从 $\langle B\rangle(t)$ 展开式中消失;这就得到选择定则:在给定条件下,只有观察算符的非对角 $n\neq n’$ 矩阵元不为零,对应的频率分量才有可能存在。同时,假若初态是一个定态,则级数只有一项不为零,这个时候 $\langle B\rangle$ 是恒定的。

此外,利用这一展开式还可直接证明,运动常量的期望永远与时间无关。

时间-能量不确定度关系式

假设系统处于 $H$ 的一个本征态,则其能量是完全确定的, $\Delta E=0$ ;这样的态是定态,于是可以说它保持在这个态上的时间 $\Delta t$ 为无穷大。

现在假设 $|\psi(t_0)\rangle$ 是 $H$ 的两个本征态 $|\varphi_1\rangle$ 、 $|\varphi_2\rangle$ 的叠加,对应于两个不同的本征值 $E_1$ 、 $E_2$ :

于是

因此若对其测量能量,得到的结果只能是 $E_1$ 、 $E_2$ 之一,因而能量的不确定度

而对于一个任意的、与 $H$ 不对易的可观测量 $B$ ,在 $t$ 时刻测量得到本征值 $b_m$ 、本征矢的 $|u_m\rangle$ 概率为:

这个概率以频率 $\nu_{21}=\left|\frac{E_2-E_1}{h}\right|$ 在两个极值之间随时间振荡;因此这种振荡式演化的特征时间为

于是得到关系 $\Delta E\Delta t\simeq h$ 。
在连续谱的情况下,初态最普遍的形式

于是

同样计算概率:

一般情况下,假若 $E$ 在 $E_0$ 附近变化时, $\langle u_m|\varphi_E\rangle$ 值的变化不大;于是假若限制 $\Delta E$ 即 $E$ 的变化范围充分小,那么在上述积分式中, $\langle u_m|\varphi_E\rangle\simeq\langle u_m|\varphi_{E_0}\rangle$ ,且

可见这个概率在一定近似情况下,正是 $c(E)$ 傅里叶变换系数的模方(差一常数);此外我们这样大致描述一个态保持的时间,即大约是 $\mathscr P(b_m,t)$ 不发生明显变化的时间。因而根据傅里叶变换的性质,函数 $\mathscr P(b_m,t)$ 在 $t$ 轴上的宽度 $\Delta t$ ,与 $c(E)$ 的宽度 $\Delta E$ 也满足

这一关系在离散和连续的情况中都出现,一般被称为“第四个海森堡不确定性关系”(前三个分别是坐标和动量的三对分量);但是它与坐标和动量的类似关系显然不同, 因为这里的时间不是某个算符的测量值,而是一个参数。并且该式仅反映大致的变化规律,而非严格的算符等式。

叠加原理和物理上的预言

现在还有待考察第一个假定的物理意义。按照该假定,叠加原理可以自然导出。这一家顶的重要后果之一,就是所谓的“干涉现象”,一般被称为“波粒二象性”;这一类现象的解释需要我们对概率幅概念的精确讨论。

概率幅与干涉效应

态的线性叠加的物理意义

首先应当区分“线性叠加”与“统计混合”的区别。具体来说,设两个正交归一的态 $|\psi_1\rangle$ 、 $|\psi_2\rangle$ (例如,可以是同一可观测量 $B$ 的两个属于不同本征值的本征态)。那么在对其中任一个测量可观测量 $A$ 的概率都可以明确表示出来:

现在考虑两个态的线性叠加构成一个新的归一化态 $|\psi\rangle$ :

关于这一线性叠加现象的正确表述是:对 $|\psi\rangle$ 测量可观测量 $B$ ,得到的结果为 $b_1$ 的概率为 $|\lambda_1|^2$ ;得到的结果为 $b_2$ 的概率为 $|\lambda_2|^2$ 。

这要区别于所谓“态的统计混合”:由 $N|\lambda_1|^2$ 个处于 $|\psi_1\rangle$ 态的物理系统和 $N|\lambda_2|^2$ 个处于 $|\psi_2\rangle$ 态的物理系统所构成的一共 $N$ 个( $N$ 甚大)全同物理系统的集合,称作是由两个态 $|\psi_1\rangle$ 、 $|\psi_2\rangle$ 各自以权重 $|\lambda_1|^2$、 $|\lambda_2|^2$ 参与构成的统计混合。

不应混淆两者;他们将会导致完全不同的物理结果。下面的例子会说明这一点。

对于线性叠加态 $|\psi\rangle$ ,要对其测量 $A$ 得到 $a_n$ 的概率为

但若是对于态的统计混合,对该集合中的每一个态都进行测量 $A$ ,计算其总体得到 $a_n$ 的概率,即是该集合中得到 $a_n$ 的物理系统数与总数之比值:

显然得到的结果不相同,因此不能将态的叠加简单地理解为态之间机械的混合;事实上关键的区别在于 $2\Re\Big[\lambda_1\lambda_2^{*}\langle u_n|\psi_1\rangle\langle u_n|\psi_2\rangle^{*}\Big]$ 这一项,它与双方的叠加复系数的共轭乘积(复内积)有关,相比起前两项,它体现的是被叠加的态之间的某种相互作用,我们称之为干涉项干涉效应。它不仅与 $\lambda_1$ 、 $\lambda_2$ 的模长有关,还与其相对相位有关。

关于线性叠加与统计混合的一个经典参考,可以考虑光的偏振现象:两个线偏振光的叠加(假若叠加系数都是实数)仍是一个线偏振光,而统计混合则是非偏振光;此外叠加系数的相对相位也会产生影响,即若引入复数作为叠加系数,则有可能产生左旋或右旋的圆偏振光。

对中间态求和

考虑如下两个过程:

  1. 连续测量非对易可观测量 $A$ 、 $C$ :在指定时刻对系统测量 $A$ 得到非简并本征值 $a$ ,系统将会处于本征矢 $|u_a\rangle$ ;在系统还来不及演变时迅速紧接着测量与之非对易的 $C$ ,则得到非简并本征值 $c$ 的概率可表示为
  1. 连续测量非对易可观测量 $A$ 、 $B$ 、 $C$ :在指定时刻对系统测量 $A$ 得到非简并本征值 $a$ ,系统将会处于本征矢 $|u_a\rangle$ ;在系统还来不及演变时迅速紧接着测量与之非对易的 $B$ ,再迅速紧接着测量与两者都非对易的 $C$ ,则分别得到非简并本征值 $b$ 、 $c$ 的概率可表示为

上述两个过程中,测量 $A$ 得到 $a$ 就是为了将系统的初态固定在 $| u_a\rangle 上$,而所关心概率问题的末态也都设为 $|v_c\rangle$ ;不同的是第一个过程是直接转变,而第二个过程还经历了一个中间过程 $|w_b\rangle$ ,这称之为中间态。

如果仅关心初末态,即系统从 $| u_a\rangle$ 演变为 $|v_c\rangle$ 的概率,那么中间态具体是哪个本征矢就是无关紧要的;而在第二个过程中,事实上我们可以说,无论 $B$ 测得的值是多少,对应的 $|w_b\rangle$ 都决定了一条从 $| u_a\rangle$ 演变为 $|v_c\rangle$ 的可能“路径”;这样的路径总数可以说就是 $B$ 的本征矢的个数。

与此同时,在第一个过程中,尽管并没有测量 $B$ ,但是作为观察算符,它的各个本征矢构成一个基,于是在刚要测量 $C$ 之前的时刻系统所处的态(在这个设定中也就是 $| u_a\rangle$ )都能够按照各个 $|w_b\rangle$ 分解;于是我们可以更深刻地分析两个过程的差别,即第一个过程并没有从实验上决定从 $| u_a\rangle$ 演变为 $|v_c\rangle$ 会通过哪条“路径”,但第二个过程则限定在了由本征矢 $|w_b\rangle$ 所决定的那一条路径。但是接下来将会看到,这种“量子路径”与经典路径之间的本质差异。

为了讨论两个概率之间的联系,我们按照上面的想法,将 $| u_a\rangle$ 按各个 $|w_b\rangle$ 分解,即相当于在第一个概率式中插入封闭性关系

这就反映出了“量子路径”与经典路径之间的本质差异:如若是经典概率,那么将可以预期

但是量子概率中多出了交叉项

这一部分正是前面提到过的“干涉项”,也就是说,量子的各条路径之间存在相互作用的干涉效应,这在经典概率中是不存在的。

因此,如若我们没有通过实验来决定系统通过的是哪个量子路径的中间态,那么应当对概率幅求和,而非对概率求和。

综合前两节,我们看到重复出现的“干涉项”是很重要的,而它正是来源于对不同概率之间的交叉干涉作用;无论是线性叠加的不同部分还是演化的不同中间态,“概率”都是通过“概率幅”来产生的。可见在量子力学中,本质的是概率幅,而概率则更多的是作为宏观观测者的我们的理解手段。

若干个态与同一测量结果相联系的情况

本征值简并的情况

前面讨论的都是非简并的简单情况;实际上推广为简并是很简单的。

例如线性叠加态,其测量 $A$ 获得简并本征值 $a_n$ 的概率可以认为是系统落到 $a_n$ 的本征子空间的各本征矢上的概率之和:

又如不同路径之间的干涉,假若 $B$ 的各个本征值存在简并,那么系统从 $| u_a\rangle$ 到 $|v_c\rangle$ 的概率为

实际(而非理想)测量仪器

实际的测量仪器并没有无限精度,总需要一定的判断裕度;并且只能判断测量值而不能判断测量之后系统所处的状态。因而我们可以设计这样一种测量仪器:对于 $A$ 的一个本征值 $a_n$ ,我们选定它周围的一段区间记为 $\Delta_n$ ,则:

  1. 若系统处于 $A$ 的一个本征态,对应的本征值区间 $\Delta_n$ ;或者系统处于若干本征态的线性组合,且各个本征态的本征值都在区间 $\Delta_n$ 内,则测量仪器给出“ $a_n$ ”的结果;

  2. 若系统处于 $A$ 的一个本征态,对应的本征值落在区间 $\Delta_n$ 之外;或者系统处于这一类本征态的线性组合,则测量仪器给出“ $\overline{a_n}$ ”的结果。

可见这一仪器的功能是针对可能出现的本征值 $a_n$ 进行判断,原则上更复杂的测量仪器可以分解为多个这样的判断装置。区间 $\Delta_n$ 则是代表着这一仪器的分辨本领,不具有无限精度意味着这个区间不可能收缩到 $a_n$ 点本身。

假若在区间 $\Delta_n$ 内只分布有一个离散的本征值 $a_n$ ,那么可以说这个仪器给出“ $a_n$ ”结果的概率 $p(a_n)$ 就是理论上测量 $A$ 获得本征值 $a_n$ 的概率,反之不获得的概率就是 $1-p(a_n)$ ;这种情况可能是仪器精度足够好的原因,但必须要求 $A$ 的谱点足够离散。否则,假若在区间 $\Delta_n$ 内分布有包含 $a_n$ 在内的若干谱点,则仪器的判断概率就不再是理论上测量 $A$ 获得本征值 $a_n$ 的概率,或者说它不能有效区分这些不同的本征值,这时就说仪器的选择性能不佳

进一步地,为便于描述仪器对于物理系统的扰动,我们可以假设:第一类的那些物理态,都可以通过仪器传输而不受扰动;而第二类那些物理态则不能通过仪器。
在量子层面上来描述这种性能不佳仪器的特性,有助于我们分析例如下面的问题:假若将任意态 $|\psi\rangle$ 送入仪器,它有可能是前述两类本征态的叠加,结果将会是如何描述?

考虑这样一个投影算符

它对应着区间 $\Delta_n$ 所包含的各个本征值对应的全体本征矢构成的子空间 $\mathcal E_{\Delta_n}$ ,它是由一切可以给出给出“ $a_n$ ”结果的态矢量构成的。反之,对于 $\mathcal E_{\Delta_n}$ 的补空间 $\overline{\mathcal E_{\Delta_n} }$ ,它的每个元素都给出“ $\overline{a_n}$ ”的结果。因而实际上测量仪器的两个结果实际上对应于 $P_{\Delta_n}$ 的本征值“$1$”和“$0$”;换言之,描述这个测量仪器的实际上是投影算符 $P_{\Delta_n}$ 而非观察算符 $A$ 。

于是对于一个任意态 $|\psi\rangle$ ,仪器给出“ $a_n$ ”结果的概率为:

与理论值相比较

可见仪器相当于就是将分辨精度内的不同本征值对应的概率做了一个求和。

同样地,由于仪器仅允许部分本征态通过,那么对于一个任意态 $|\psi\rangle$ 送入仪器,在得到“ $a_n$ ”结果之后,系统的态为

即原态 $|\psi\rangle$ 在子空间 $\mathscr E_{\Delta_n}$ 上的投影。当然,若得到的结果为 $\overline{a_n}$ ,则没有可通过的分量。

概要:概率幅求和还是概率求和?

上面两节中,我们看到了对于求和对象的两种情况:对概率幅求和,以及对于概率求和。总结一下,两者是不矛盾的,可以叙述为:

先将对应于同一末态的诸概率幅相加,然后再将对应于正交末态的诸概率相加。

注:

  1. 所谓对应于同一末态,包括线性叠加、不同路径的叠加等;

  2. 所谓对应于正交末态,包括属于同一本征值的不同本征矢、属于不同本征值的本征矢等。

应用于连续谱

对于实际测量仪器来说,由于不可能“区间 $\Delta$ 内只分布有一个离散的本征值 $a_n$ ”,因而永远只能是性能不佳的。我们应当尽量使之精确化和完备化。

考虑一个具体例子,假定具有连续谱的可观测量 $A$ ,其表象为 $\{|\alpha\rangle\}$ ,于是理论上测得其值在区间 $[\alpha_1,\alpha_2]$ 的概率也就是波函数 $\psi(\alpha)=\langle\alpha|\psi\rangle$ 的积分:

于是若性能不佳仪器对于值 $\alpha_0$ 的分辨区间为 $\Delta_{\alpha_0}$ ,那么仪器判定概率为

同样地,在得到“ $\alpha_0$ ”结果之后,系统的态为

这里投影算符的定义为

它对应的波函数为

为突出重点,归一化因子简记为 N 。于是可见仪器在得到“ $\alpha_0$ ”结果之后的结果:

当然,若得到的结果为 $\overline{a_n}$ ,则没有可通过的分量,就全部为零了。

直观来看,波函数的形状只有仪器允许通过的那段是无畸变的(只是为了整体归一化而调整了大小);其余部分则被测量所抑制,就像原始波包被“切割”了一样。通过这个例子可以更清晰地看到波包“坍缩”的实际操作意义。

当然,在仪器精度足够好的情况下,区间宽度 $\Delta\alpha$ 非常小,此时函数 $\psi(\alpha)$ 变化幅度也不大。不妨取 $\Delta_{\alpha_0}=\left[\alpha_0-\frac{\Delta\alpha}{2},\alpha_0+\frac{\Delta\alpha}{2}\right]$ ,则近似有

可见它的极限值就回到了假定三给出的理论值。