量子化基础

一次量子化

一次量子化是物理量的量子化,它引入了描述物理状态的态矢,并将可观测量提升为态空间上的算符;经典的色散关系经过这样的提升后就得到量子力学的基本动力学方程:

多体态的描述

一次量子化框架下我们利用单体态来描述多体系统的基本方案是态矢的张量积,这对应于单体波函数的乘积:

这样的态称为乘积态。这里指标$r_i$不仅指空间坐标,也包含其他态指标,如自旋、轨道等。

注意到在记号$\ket{\phi_1,\phi_2,\dots,\phi_n}$中,各个单体态的顺序是重要的。处理全同粒子体系时,还需要额外考虑粒子全同性带来的统计问题,此时若交换两个粒子所处的态不会导致体系的物理态(波函数)改变,至多相差一个相因子:

特别地,两次同样的交换会将其变回原来的多体态,于是有条件:

在三维空间中,只允许相角$\alpha$的两种可能取值:

  • $\alpha = 0$,表示交换粒子多体态矢不变,即交换对称,这称为玻色子体系;
  • $\alpha = \pi$,表示交换粒子多体态矢改变一个负号,即交换反对称,这称为费米子体系。

在一维或二维体系中,则相角可以允许是任意有理数(称为任意子)甚至矩阵形式(非阿贝尔任意子)。

交换对称/反对称性要求我们在利用单体态写出多体态时,必须额外进行对称化/反对称化的操作:

并且这也会对张量积空间中那些描述真实物理态的态矢性质作出限制,实际的态空间是单体态空间张量积的子空间。特别地,费米子体系的反对称化多体波函数可以写为Slater行列式的形式:

例子:描述铁磁交换作用

作为一次量子化框架的简单应用,它可以较为方便地描述铁磁交换作用的产生。考虑一个双态电子体系,即两个电子占据两个正交的单电子本征态:

则考虑库仑作用时体系哈密顿量为

电子波函数可以写为空间部分与自旋部分之乘积,根据费米子交换反对称性可以构造四个两电子态:

前三个态的自旋部分是三重态,空间部分是单态;最后一个态的自旋部分是单态,空间部分是三重态。由于哈密顿量与自旋无关,它们都是能量本征态,分别为:

其中

其中第一项为“库仑项”,它在坐标表象下与经典的库仑相互作用一致;第二项是“交换项”,是纯粹由全同粒子的量子效应所产生的修正。

交换项$J$的存在所带来的修正,导致电子倾向于按照自旋三重态排列,也即铁磁型自旋排列;同时自旋三重态的空间部分是单态,即两个电子在实空间倾向于减少波函数的重叠从而降低库仑相互作用能。这就解释了两个费米子正交态的铁磁交换作用的产生。

事实上前述四个态恰好可以对应于一个量子海森堡模型的四个本征态:

其中$J_{\rm eff} = 2J$,$\varepsilon_0 = \varepsilon_\lambda + \varepsilon_\rho - \frac{J}{2}$。可见这的确是一个等效的铁磁海森堡模型。

Hartree-Fock近似

前述讨论中出现的能量结构$\sum_k\varepsilon_k + C - J$是具有普遍性的,尤其是在即将讨论的所谓Hartree-Fock方法。考虑$N$全同费米子体系,哈密顿量写为

其中包含单电子的动能、单电子感受到来自材料背景的外势$U$,以及电子之间的相互作用$V$;这里忽略了自旋自由度。Hartree-Fock近似是指,用不包含相互作用的反对称化乘积态,来近似包含了相互作用的多体态基态,以计算体系的性质,即我们假设存在相互作用的多体波函数可以由自由的Slater行列式来近似:

Hartree-Fock近似通常结合能量变分法等方法,被用于求出多体基态$\Psi$;因此这一过程中需要计算$\psi_{\rm HF}$的能量。

简单起见,首先考虑可分辨粒子的情况,此时的多体波函数就是单体波函数的简单乘积,不需要反对称化:

它的能量可以分为$E_{\rm prd} = E_0 + E_{\rm Hartree}$:

其中第一部分能量$E_0$就是各个单体态的能量之总和;第二部分称之为Hartree能量$E_{\rm Hartree}$,它表示两两电子之间相互作用能的总和,其形式上与经典库仑相互作用完全相同。这是因为我们没有考虑全同粒子的统计性质带来的修正,因此乘积态$\psi_{\rm prd}$某种程度上就是经典极限下的费米子波函数,$E_{\rm Hartree}$也就是经典极限下的相互作用能。

但我们实际上知道体系波函数应当考虑全同费米子的交换反对称性,因此真正需要考虑的波函数是:

可以计算得到:

可见粒子全同性不影响单电子能量部分。而另一方面,相互作用能部分则是:

可见考虑了粒子全同性之后,会比之前多出一项,称为Fock能量$E_{\rm Fock}$,其积分中单电子态进行了交换,因而也叫交换能,相应的$E_{\rm Hartree}$则是库仑能或直接能。显然,$E_{\rm Fock}$是纯粹的量子全同性交换效应,它没有经典对应。

在用HF态$\psi_{\rm HF}$对相互作用多体态近似时,相互作用能中必然会同时出现Hartree能量$E_{\rm Hartree}$和Fock能量$E_{\rm Fock}$。

二次量子化

二次量子化更方便描述全同粒子体系,它不关心特定粒子所处的单粒子态,而是关心特定单粒子态上的占据数。

二次量子化得名于其“看起来像”是进一步将一次量子化中的波函数也提升为所谓场算符,并赋予正则对易/反对易关系:

但事实上在今天的观点看来,所谓“二次量子化”并不是进行第二次量子化,而是对多粒子体系进行“另一类量子化”:不同于一次量子化那样用单体态乘积得到多体态,在二次量子化中,我们关注占据数$n_i$的概念,即在第$i$个单粒子态上有$n_i$​个全同粒子占据。

多体态的描述

利用占据数的概念,一个多体态的形式就是

其中每个状态的占据数$n_i$都是非负整数,体系的基态是$\ket{\rm empty} = \ket{0,0,\dots}$。总粒子数$N = \sum_i n_i$显然是各个占据数之和。这样的多体态称为Fock态;特定总粒子数$N$的全体Fock态张成空间$\mathcal F^N$,而不同总粒子数的空间直和就构成描述全同粒子体系的Fock空间:

不同总粒子数之间可以通过产生/湮灭算符相互转化,对于玻色子体系:

对于费米子体系:

可见费米子体系的泡利不相容原理导致占据数只能取$n_i = 0,1$​两种情况,否则结果为零;费米子的交换反对称性还会带来所谓“费米子弦(fermionic string)”的负号因子。

特别地,占据数算符$\hat n_j = a^\dagger_j a_j$,作用在Fock态上得到相应的占据数。

产生湮灭算符满足的代数性质是对易/反对易关系:

其中对玻色子$\zeta = +1$,费米子$\zeta = -1$。

我们可以在不同的表象下(即关注不同表象的单粒子态)谈论二次量子化形式,在两种表象的产生湮灭算符之间存在简单变换关系:

特别地,坐标表象是连续表象,其中的产生湮灭算符就是前面提到的场算符:$\hat\psi^\dagger(r) = a^\dagger _r$,$\hat\psi(r) = a_r$。

多体算符

二次量子化中与若干粒子相关的算符形式较为简单。

首先考虑单体算符$\hat F = \sum_{i}\hat f(i)$,即单体态算符直接相加形式的算符,其二次量子化形式为:

例如:

  • 粒子数算符:$\displaystyle \hat N = \int {\rm d}r\ \hat\psi^\dagger(r) \hat\psi(r) = \sum_k a^\dagger_k a_k$,两个表象下都是对角的;

  • 动能算符:$\displaystyle \hat T = \int {\rm d}r\ \hat\psi^\dagger(r) \left[ -\frac{\nabla^2}{2m} \right] \hat\psi(r) = \sum_k \dfrac{k^2}{2m} a^\dagger_k a_k$,两个表象下都是对角的;

  • 外势算符:$\displaystyle \hat U = \int {\rm d}r\ U(r) \hat\psi^\dagger(r) \hat\psi(r) = \sum_{k,q} U(q) a^\dagger_{k+q} a_k$,坐标表象是对角的,动量表象依赖于电子的转移动量$q$,其中

接下来考虑两体算符$\hat O = \sum_{i\neq j}\hat o(i,j)$,即与两个单体态相关的算符相加形式的算符,其二次量子化形式为:

例如:

  • 库仑相互作用算符,在坐标表象时:$\displaystyle \hat H_{\rm coulomb} = \frac12 \int {\rm d}r{\rm d}r’\ \hat\psi^\dagger(r) \hat\psi^\dagger(r’) \frac{1}{|r-r’|} \hat\psi(r’) \hat\psi(r)$,是两点关联;
  • 库仑相互作用算符,在动量表象时:$\displaystyle \hat H_{\rm coulomb} = \frac{1}{2V} \sum_{k,k’,q} a^\dagger_{k+q} a^\dagger_{k’-q} \frac{4\pi e^2}{q^2} a_{k} a_{k’}$,其中利用了动量守恒,$V$是箱归一化体积。

电子体系哈密顿量

上述给出的都是未考虑电子自旋的形式,若将之纳入考虑,则体系的二次量子化哈密顿量在坐标表象是:

或者在动量表象就是:

其中携带自旋的电子算符通常是定义在周期边界条件的体积为$V = L^d$的$d$维归一化箱中,从而动量离散化:$k_i = \dfrac{2\pi m_i}{L}$,且:

当取无穷大空间极限时,求和与积分之间存在关系是(利用$\Delta^dk = \Delta k_1\Delta k_2\cdots\Delta k_d \simeq \dfrac{(2\pi)^d}{V}$):

这样的平面波模型适于讨论具有空间平移不变性的系统(如电子气、液氦),及晶格周期势影响不大的晶格电子体系;但对于周期性明显的固体材料,则采用Bloch波作为基矢更合适,此时单粒子项(包括外势项)自动对角化。


库仑电子气的凝胶模型

哈密顿量

现在考虑一个最简单的模型:金属中由库仑相互作用主导的三维电子气体系,其哈密顿量可以写为:

分别代表电子动能、电子之间的库仑相互作用能、离子实构成的正电荷背景的相互作用能、电子与正电荷之间相互作用能。在经典情形它们的形式分别可以写成(为区分起见,我们将正电荷背景视作连续分布而电子则是离散分布):

在这里我们用汤川势$r^{-1}{\rm e}^{-\mu r}$代替了原本的库仑势$r^{-1}$,是一种正规化手段:为了避免长程库仑相互作用带来的发散特性,在计算过程中用衰减项${\rm e}^{-\mu r}$来控制发散,最后再取$\mu\to0$的极限;这实际上是将发散项的行为显式写出,从而可以再过程中对发散进行处理。

上述后两个积分可以计算出来,这里假设正负电荷相等且正电荷均匀分布,于是正电荷的密度就是$n(x) = N/V$,于是

其中$r = x-y$,$R = (x+y)/2$。注意到这两个正规化结果在取$\mu\to0$后都是发散的。这看起来出现问题,但是先暂时搁置,尝试计算电子部分的能量,看它的结果是否可以解决这一发散问题。

接下来要计算的就是电子部分能量,按照二次量子化框架写为:

当取$\mu\to0$后,第二部分存在发散:注意到$k,k’,q$都是离散取值的,因此只在求和中的一项$q=0$处相互作用能发散。为此单独考虑这一项在$\mu$正规化时的形式为:

当取热力学极限$N\to\infty$的时候,上式第一项相较于第二项可以忽略,于是

它恰好可以和另外两个正规化发散项相抵消:

这实际上并不是巧合,而是具有明确的物理意义:$q = 0$意味着电子感受到其他电子提供的负电荷背景的这部分相互作用能而未发生动量交换,因此$H_{\rm ee}(q=0)$描述的是静态电子体系的自相互作用能;而我们在金属电子气模型中又假定忽略了正电荷离子实的动力学,于是上述三项抵消实际上是体系整体为电中性的体现。

于是我们真正需要处理的哈密顿量剩余部分就是纯粹的电子部分,并且不存在发散项:

可以简单估计一下两部分贡献的相对大小,引入一个特征长度$r_0$:

即表示电子之间的平均距离;另一方面,玻尔半径是$a_B = \frac{1}{me^2} = 0.53\ \mathring{\rm A}$,一般金属的$r_s = r_0/a_B \sim 2-6$。据此引入无量纲的体积$\bar V = r_0^{^-3} V$和动量$\bar k = r_0 k$,哈密顿量写为

其中能量尺度$e^2/2a_B\sim13.6{\rm\ eV}$。可见对于$r_s\ll 1$的高密度极限,体系的相互作用相较于动能反而很弱,此时适于按照小参数$r_s$微扰展开计算;而低密度极限$r_s\gg 1$时则是强关联区。

微扰计算

现在利用前述的凝胶模型哈密顿量和微扰论方法来计算体系到小$r_s$的一阶微扰的基态能量,根据量子力学而当微扰理论,形如$H = H_0 + \lambda V$的微扰哈密顿量其能量一阶微扰结果是:

我们关心体系基态$\ket\Omega$的能量。既然体系的相互作用能相较于动能可视作微扰,那么这样的体系就可视作是零温$T\to 0$下无相互作用的自由气体,其基态是电子按照能量从低到高逐个填充的费米球分布,也就是说我们利用HF态来近似基态:

其中电子占据数$n_{k,\sigma} = \theta(k_F-k)$,费米面(费米动量$k_F$及费米能$\varepsilon_F^0 = \dfrac{k_F^2}{2m}$)由粒子数决定:

据此可以计算基态能量。动能部分(零阶项)是:

相互作用能部分(一阶微扰项)是:

由于左右两边都是完全占据的费米球态,可以预计只有当中间四个算符凉凉配成粒子数算符时才有非零值;事实上对于一般的无相互作用费米子体系,有所谓Wick定理的结论:

于是我们再次得到相互作用能的直接项和交换项两部分贡献:

第一项就是Hartree能,第二项是Fock能。但我们已经排除掉了$q=0$的贡献,因此最终只有:

这是一个负的修正,并且只发生在自旋相同的电子之间,意味着交换效应会使自旋相同的电子倾向于远离而降低库仑排斥能。这个式子可以解析算出:

于是得到平均每个电子的能量是

可见它的确在小$r_s$时主导。更高阶的微扰结果是:

单电子能量

现在我们尝试得到基态中动量为$k$的电子的能量$\varepsilon(k)$。

注意到基态总能量的表达式是:

第一项$c^\dagger_{k,\sigma} c_{k,\sigma} = \hat n_{k,\sigma}$就是占据数算符,但是第二项的四个算符乘积不方便直接计算,因此考虑利用算符的平均场近似:

将第二项的四个算符两两组合成两个新算符$A = c^\dagger_{k+q,\sigma}c_{k’,\sigma’}$、$B = c^\dagger_{k’-q,\sigma’}c_{k,\sigma}$,于是

于是相互作用能就可以写为:

基态总能量则是

于是等效的单电子能量就是

第二项的计算和上一节是类似的,结果是:

其中Lindhard函数是

尽管如此,计算体系总能量时并不能简单将其求和,而是:

即相互作用能要排除掉重复计算的部分。对其求化学势:

又得到单电子能量,这就是在费米球基态添加一个电子引起的能量变化。

但这一模型实际上是存在问题的:若要计算费米速度(电子在费米面上的速度),则

即这一模型计算出的费米速度发散。这意味着利用HF近似尽管模型简单,但实际上是非物理的,我们仍需考虑更复杂的效应来消除这种不合理的发散。

长程相互作用的屏蔽

检查凝胶模型中为什么会出现不合理的费米速度发散:我们在一开始取有限大空间体积$V$时,会使动量$k$离散化,此时电子之间的库仑相互作用$H_{\rm ee}(q) = \dfrac{4\pi e^2}{q^2}$在$q = 0$时发散,而在其他任何$q \neq 0$时,由于任何非零的$q$在任一方向的分量总是最小单元$\dfrac{2\pi}{L}$的整数倍,因而$H_{\rm ee}(q\neq 0)$总是一个有限大的值。于是我们将发散的部分$H_{\rm ee}(q=0)$与其他发散项相抵消,用剩余的$H_{\rm ee}(q\neq 0)$进行计算。

但最终我们总是会取$V\to\infty$的极限,此时动量也将逐渐变为连续取值;我们只扔掉相互作用$H_{\rm ee}$中严格$q=0$的部分,但是在连续极限时会出现$q\to 0$的模式,此时它们也是发散的:红外发散,正是这部分贡献导致了我们的计算结果中出现了不合理的发散。

在物理上,趋于零的动量对应于趋于无穷长的空间距离,因此$q\to 0$的发散实际上来自于我们的模型中包含了距离很远的电子之间的相互作用。但在实际的金属中,电子之间实际上几乎没有明显的长程相互作用,这是来自于电荷体系本身对长程相互作用的屏蔽效应。具体来说,由于两个远距离电子之间存在大量的近自由电子,因此一个电子感受到另一个远距离电子的相互作用会受到其他电子的影响,从而变成一个等效的短程相互作用:

将会看到,其中$\epsilon(q,\omega)$代表动量和频率依赖的介电常数,它理应在短程时($q\gg1$时)较小从而几乎不影响短程相互作用的形式,但在长程时($q\to0$时)迅速增长从而压低了长程相互作用。

利用这样的对电子长程库仑相互作用的屏蔽,就可以避免电子费米速度发散的问题。同时屏蔽效应会产生一个直接的动力学后果,即导致电子气中产生集体激发模式,即所谓等离激元

后面将会看到,低频介电常数$\epsilon(q,\omega\to 0)$对应于通常意义上的屏蔽效应,而则会给出电子体系的等离激元。

静态屏蔽

考虑一个静态的模型:在电子气中放入一个固定位置的正电荷,它会在周围吸引大量负电荷电子;而当电子密度过高时又会排斥其它电子的进一步聚集,于是最终形成平衡体系,即在正电荷附近形成电子密度高的区域。于是一个远处的电子感受到来自正电荷的吸引,就会受到正电荷周围聚集电子的屏蔽。

一般地,设在一个原本平衡的电子体系中,加入一定的正电荷,其分布密度为$\rho^{\rm ext}$,激发的电势为$\varphi^{\rm ext}$,满足泊松方程:

此外,正电荷的存在还会在原本电中性的体系中诱导出诱导电荷$\rho^{\rm ind}$,于是加入正电荷后,体系整体的电荷密度是$\rho^{\rm tot} = \rho^{\rm ext} + \rho^{\rm ind}$,其与总电势同样满足泊松方程:

上述电荷密度均以正电荷为正号。这两个式子在动量空间形式是:

那么探测电荷实际能够感受到的总电势(即包含了屏蔽效应的电势)$\varphi^{\rm tot}$,与激发电荷$\rho^{\rm ext}$或其电势$\varphi^{\rm ext}$之间存在怎样的关系呢?首先假设存在如下的非局域线性关系:

由于体系理应具有平移不变性,因此$\epsilon(x,x’) = \epsilon(x-x’)$,于是上述关系具有卷积形式:

其在动量空间就变为乘积形式,于是我们得到:

此即描述了电子体系对于外电荷电势的屏蔽效应,$\epsilon(q)$是依赖于动量(波矢)的介电常数。

另一方面,在静态体系中,诱导电荷$\rho^{\rm ind}$与总电势$\varphi^{\rm tot}$满足如下关系

其中$\chi_c(q)$​是电荷极化率。结合两个泊松方程,可以解得到

进而可以得到介电常数与极化率之间的关系为:

这给出了极化电荷产生的屏蔽效应。因此求体系的屏蔽就归结为求体系的电荷极化率,即诱导电荷$\rho^{\rm ind}$与总电势$\varphi^{\rm tot}$之间的关系。

Thomas-Fermi近似

复杂的电荷体系很难直接求解,Thomas和Fermi给出了一种近似模型,即认为当$\varphi^{\rm tot}$变化足够慢时,电子气对外电荷$\rho^{\rm ext}$的响应方式类似于自由电子,而只会使其能级产生一个移动:$\varepsilon^0_k = \frac{k^2}{2m} \to \varepsilon_k(x) = \frac{k^2}{2m}-e\varphi^{\rm tot}(x)$。具体来说,当存在外电荷时,Thomas-Fermi假设电子气的平衡分布是Fermi-Dirac分布:

于是总电子数密度是(考虑自旋)

其中$n_0$是未加外电荷时的电子数密度。上面只保留到$\varphi^{\rm tot}$的一阶,显然仅在$e\varphi^{\rm tot}\ll\mu$时有效。于是

于是得到

定义Thomas-Fermi屏蔽的特征尺度为:

特别地,若外电荷是带$+Q$的正电荷,那么在距离其$r$处的电子感受到有效的总势为

可见在Thomas-Fermi近似下的考虑,的确给出了对长程作用的屏蔽效应,实空间体现为长程的库仑势被指数压低屏蔽为短程的汤川势(Yukawa势),动量空间表现为给电磁场(光子)附加一个有效质量$\kappa_{\rm TF} = \lambda_{\rm TF}^{-1}$。

简单估算一下屏蔽的量级。注意到在零温时,$n_0 = \frac{4\pi}{3} k_F^3 \frac{2}{(2\pi)^3}$,且零温时化学势$\mu = k_F^2/2m$,于是

注意到一般金属的$r_s \sim 2-6$,于是可见光子的“有效质量”与费米波矢$k_F$在一个量级,汤川屏蔽势的特征长度$\lambda_{\rm TF} \sim 0.34 \sqrt{r_s}\ \mathring{\rm A} \sim 0.48-0.83\ \mathring{\rm A}$​,一般较短于电子平均间距,因此电子之间的相互作用的确被屏蔽了。

不难从定义式看出,随温度升高,$\lambda_{\rm TF}$也将随之增长,使屏蔽效应变弱。定性上讲,是因为电子的热运动使之不易聚集在外电荷周围。

此时若计算电子的费米速度,得到结果为有限值:

可见屏蔽势相比于库仑势的确是更好的近似方案。当屏蔽很强时,$\kappa_{\rm TF}$很大以至于电子之间的相互作用几乎是$\delta$函数形的接触势,此时$v = \frac{k_F}{m} - \frac{e^2}{\pi}$表现为电子的质量修正为$m^* = k_F/v\simeq m(1 + \frac{me^2}{\pi k_F})$,即相互作用体现为增大了电子质量。

Lindhard介电函数

除了采用Thomas-Fermi近似将电子分布视为Fermi-dirac分布来计算之外,还可以采用另一种方法描述屏蔽效应,即将$e\varphi^{\rm tot}$视作微扰,采用非简并微扰论来分析:

其中$\psi_k^0(x) = \frac{1}{\sqrt V}{\rm e}^{ {\rm i}k\cdot x}$是自由电子平面波函数。一阶微扰可以解出:

于是

可得电子密度$n(x) = \sum_k |\psi_k(x)|^2 f_{\rm FD}(k)$,得到诱导电荷密度为

变量代换$k\to k+\frac q2$,$k’\to k’-\frac q2$,变为连续形式就得到体系的电荷极化率为

以及介电常数

当低温和小动量转移时,展开分布函数就会得到Thomas-Fermi近似下的结果。

在零温$T=0$时,可以计算得到

其中$F(x)$就是HF近似计算单电子能量时的Lindhard函数。这个函数在$q = 2k_F$处导数具有奇异性,会导致介电函数在此处产生非解析性,具体来说会使屏蔽后的单电荷势在实空间产生如下振荡行为:

并且使其周围的屏蔽电子分布也出现如此周期性,这称为Friedel振荡。