引子

统计力学的基本任务是将微观层面的粒子动力学与宏观层面涌现出的集群性质联系起来。

对物质的微观描述,通常是包含大量自由度的动力学,例如自由粒子的位置和动量$\{p_i,q_i\}$,磁系统的自旋构型$\{s_i\}$,或全同粒子体系的占据数$\{n_i\}$。这些自由度的演化由经典或量子的动力学方程描述,被体系的哈密顿量$\mathcal H$所控制。

对物质的宏观描述,通常只包含少数几个唯象变量,例如描述平衡态气体的若干而连续函数:压强$P$,体积$V$,温度$T$,内能$E$,熵$S$。这些热力学函数在平衡态时,服从热力学基本定律。

考虑到任何宏观系统所包含微观自由度数目的量级,求解微观动力学方程组从而得到宏观性质,都是不可能也不必要的。与之相反,统计力学提供了两种描述之间的概率联系,这就是在前一本书中详细讨论过的各自系综理论,它的核心在于各类配分函数,将宏观热力学量与微观状态的分布联系起来。

但是尽管避免了求解微观粒子动力学,上一本书所发展起来的统计力学方法,事实上只能对少数简单系统精确求解,也就是无相互作用的自由系统,一些包含弱相互作用的体系则可以视作在自由体系之上的微扰。但是同时我们也了解到,即便对于相对简单的非理想气体的例子,其在相变发生附近,涨落和关联变得非常显著(甚至发散),微扰方法也是会失效的。

另一方面,我们也不仅仅满足于弱相互作用体系;事实上正是粒子间复杂的相互作用和多样的相结构及其转化,使物质的宏观性质变得有趣。具体来说,我们希望回答以下问题:

  1. 在热力学极限下,强相互作用导致例子形成新的相,例如固体,液晶,磁体,超导等等。我们如何基于粒子间相互作用来描述这些截然不同的宏观行为的涌现?描述这些宏观状态的热力学量是什么,它们又如何影响一些可测的体态响应函数,例如热容,磁化率等?
  2. 类似于固体或超流中的声子,各种不同类似宏观系统的低能特征激发是什么?它们是否都可看作是某种包含了大量微观自由度集体运动的集群模式(正如声子是晶格集体振动的简正模式)?来自声子的经验表明,这样的集群模式很容易被热涨落所激发,并通过散射实验进行探测。

除此之外,我们还曾经讨论过相变的临界现象。实验表明,表面上看起来毫不相关的物理体系,它们的临界现象可能具有高度一致的行为,例如气-液相变和铁磁-顺磁相变。这表明,统计意义上,不同系统可能具有相图的统计本质,这也是我们希望在本书寻求的答案。

声子与弹性

弹性理论是一个最简单的场论例子。下面将分别从两种方法来分析得到弹性介质的某些性质:从材料结构微粒的第一性原理出发的较复杂方法,和唯象地利用场论分析对称性的较简单方法。这两者体现了我们分析更一般问题时所可能采用的两类手段。

粒子方法

这一部分已经在上一本书计算晶格振动时充分讨论过了,那里采用的实质上就是基于第一性原理,从材料微观粒子角度的方法。我们已经得到

其中色散关系$\omega_\alpha(\vec k) = \sqrt{\widetilde K(\vec k)/m}$中的$\widetilde K(\vec k)$代表晶格不同集群振动的简正模式,通过分析相互作用项得到,与材料结构性质相关;平均占据数$\left\langle n_\alpha(\vec k) \right\rangle = \left( {\rm e}^{ \beta\hbar\omega_\alpha(\vec k)}-1 \right)^{-1}$。由此,就找到了系统内能这一热力学函数,与微观状态的关系,尽管这一关系十分复杂。其他的一些热力学函数与微观状态的关系也可得到。

那么这些热力学函数,是否在某些情况下(例如当$T\to0$时),表现出与具体微观状态无关的行为特征?答案是肯定的。下面以一维链为例说明这一点。

考虑一维晶格链,格距$a$,每个格点处的例子均可沿链方向存在微小振动$u_n$,因此系统的一个构型就是$\{u_n\}$;在平衡构型附近,二次型形变势能最一般的形式是:

其中$\{K_i\}$分别代表不同近邻阶粒子之间弹性相互作用的胡克系数。通过

得到全体粒子集群振动构成的模式,满足$u(-k) = u^*(k)$。于是势能用它们表为

利用$\sum_n{\rm e}^{-{\rm i}(k+k’)na} = \delta(k+k’)2\pi/a$,则有

这就得到典型的激发频谱,即色散关系

image-20240422165644717

当$k\to0$极限时,色散关系趋于线性

其比例系数就是声速$v = a\sqrt{\overline K/m} = a\sqrt{(K_1+4K_2+\cdots)/m}$。

对于$N$粒子的一维链,这些集群激发的内能是

当$T\to0$,仅有$\hbar\omega(k)<k_BT$的模式可以被激发,因此低温时只有$k\to0$部分的激发谱重要,可将内能简化为

可见,在低温时,系统的内能与具体的微观状态无关,而仅依赖于少数几个宏观参数,例如声速$v$和总粒子数$N$。这允许我们建立一些不依赖于微观细节的唯象理论。

一些要点:

  • 尽管完整的频谱可能非常复杂,

    但当$k\to0$时

    因此即便考虑更高阶邻的相互作用,只会修正斜率$\overline K$的大小(即声速大小),而不会改变色散关系在$k\to0$时的线性关系。

  • 在低温时,热容

    与温度成线性关系。这是一个普适的关系,与材料具体种类、结构或相互作用形式无关。

  • 低温时内能对温度的依赖形式$E\propto T^2$,来自于$k\to0$时的激发谱形式,这对应于大量粒子的集群运动模式。这些恰恰就是统计方法存在重要意义的模式。

场论(唯象)方法

现在用另一种从宏观角度的方法来研究相同的问题,将会看到这回提供新的视角,并且很容易推广到更高维的情况。

粗粒化与有效模型

考虑到一种典型的集群激发模式,其特征尺度可以用声子的特征波长$\lambda = \lambda(T)\approx \hbar v/k_BT$描述。在较低温时,典型的$\lambda(T) \gg a$远大于格距,而我们不关心$\lambda$很短的那些集群激发,因为它们对应于能量较高的声子。因此可以用粗粒化方法来抹掉我们并不关心的短程信息,如图

image-20240422172332359

具体来说,就是选择一个点$x$及其周围$a \ll {\rm d}x \ll \lambda(T)$的区间${\rm d}x$,它远小于声子波长但又包含足够多格点数,因此在此区间内的大量格点具有大致相同的$u_n$,可以将它们平均作为$x$点处的形变场$u(x)$;此时$u(x)$就是对$u_n$的粗粒化,而$\{u_n\}$的集群激发就相当于$u(x)$的简正模式。

从上面的可以看出,$u(x)$的特征尺度在$\lambda$量级,它在任何格距$a$​​​的尺度上几乎都是极其缓变的常数函数。从场论角度来看,粗粒化实际上是一种有效场论方法,它将完整理论中我们不关心的高频(高能)信息抹去(或者积掉),留下低频缓变的场部分,就是相对于完整理论的一个低能有效理论。

为了得到以$u(x)$为基本自由度的哈密顿量,需要分别构造其合适的动能项和势能项,它们都是函数$u(x)$的泛函。

动能项$K[u]$

通过将时间演化纳入考察,可以定义速度场

进而可以定义密度$\rho = m/a$,得到形变场的动能项

势能项$\mathcal V[u]$

一个合理的势能项,需要满足一些普遍原则:

  • 局域性:大多数情况下,粒子间相互作用都是短程的,这体现在场$u(x)$的角度,就是其势能$\mathcal V[u]$,可以表示为逐点$x$的局域函数$\Phi$​的积分

    其中$\Phi(u,\partial_x u,\dots)$是势能密度,通常是$u(x)$及其各阶空间导数的函数;当然,如果考虑到任意高阶导数,实际上可以描述长程的相互作用。但是局域性的事实意味着实际上只有低阶项是重要的;

  • 平移对称性:链整体的平移,即场$u(x)$整体附加一个常数场,不会改变它的内能,因此能量密度必然满足平移对称性(平移不变性):

    这表明$\Phi$不能直接依赖于$u(x)$,而只能依赖于其导数项:$\partial_x u$,$\partial_x^2 u$,……

  • 稳定性:由于热涨落总是无法避免的,因此以合合理的平衡态解应当对于涨落微扰是稳定的;稳定性条件要求,$\Phi$中不能存在$u$​或其各阶导数的线性项,并且它们的二次项必须是正定的。

  • 反射对称性:若系统在空间反射变换下是不变的,那么$u(x)$与其镜像$u(-k)$应当具有相图的能量

    需要注意的是,这一点并不是对任何系统都成立,仅在具有反射不变性的系统才需要。

综合以上考虑,最一般的势能形式可以写为

在场$u(x)$做傅立叶变换之后变为

当$k\to0$时,$k$的高次项(例如$L$项)首先解耦;并且在微小形变时,可以忽略高于$u$的二次的项(例如$M$项)。保留其低能激发的最主要贡献就是

高维哈密顿量

将动能和势能写在一起,最终就可以得到场$u(x)$的哈密顿量最简单的形式

其中$v = \sqrt{K/\rho} = \sqrt{aK/m}$是声速。上式以$\rho$和$v$依赖于材料的种类(即相互作用形式)。但是在这里,我们并不需要知道这些值的微观来源,它们仅仅作为唯象参数出现在唯象模型中,且可以通过实验测定;并且上式的傅立叶变换也的表明,它能够预言在低能激发时色散关系近似是$\omega = v|k|$,这对于一个唯象理论来说已经足够好。

相较于粒子方法,场论方法可以很方便地将上述一维体系推广到任意维各向同性体系,只不过此时需要注意:

  • 场$\vec u(\vec r)$本身也是$d$维矢量,指标$\alpha$描述其分量$u_{\alpha}(\vec r)$,$\alpha = 1,2,\dots,d$;
  • 各向同性体系的势能$\mathcal V[u]$还需要考虑旋转对称性:$u_\alpha(\vec r) \mapsto R_{\alpha\beta} u_{\beta}(\vec r) + c_\alpha$。

可从形变场$u_\alpha(\vec r)$对称化得到应变场$u_{\alpha\beta}(\vec r)$

利用它可以方便地将$d$维哈密顿量表示为

弹性模量$\mu$和$\lambda$是拉梅系数。上式的求和保证了旋转不变性,这在傅立叶变换

之后更明显:

可见它只包含旋转不变量:$\vec u \cdot \vec u$,$\vec k \cdot \vec k$,$\vec k \cdot \vec u$​。

声子模式

从哈密顿量的形式可以看出,可将声子分为两种声子模式:

  • 纵模,$\vec k \parallel \vec u$,声速$u_\ell = \sqrt{(2\mu+\lambda)/\rho}$;
  • 横模,$\vec k \perp \vec u$,声速$v_t = \sqrt{\mu/\rho}$;

因此体积$L^d$内的能量就是

因此在低温$T\to0$时热容具有$C\propto T^{d}$的形式。

一些要点:

  1. 全部与材料种类、性质相关的依赖都归结在唯象参数$\mathcal A(v_\ell,v_t)$​中,而(低温下)关于温度的幂律是普适的;
  2. 从唯象场论得到的结果直接与粒子方法得到的低温结果一致;这一方面是因为这里引入的场本身就是抹去高频信息的低能有效模型,另一方面是因为不关注细节的唯象理论在获得不依赖于微观状态细节的一些普适现象时更为方便。
  3. 这种普适的幂律$E\propto T^{d+1}$来自$k\to0$时还活跃的模式,也就是是低频模式;而高频模式只有在高温时才会显著参与进各个热力学函数中;幂指数不仅与体系的维度,还与相互作用尺度相关;例如,长程的库仑势就会导致完全不同的结果。
  4. 关于幂律的实验观察十分重要,其背后可能蕴含了重要的物理学。例如超流氦观测到热容的幂律是$C\propto T^3$而非理想玻色气体的$C\propto T^{3/2}$​,这意味着其内部结构是类似声子的集群激发。

根据这些例子可以总结出构造唯象模型的基本步骤:

  1. 通过对称性、相互作用尺度、体系维度等方面的考察和限制,构造出粗粒化的(低能有效的)哈密顿量;
  2. 与上面的简单例子不同,一般来说在得到的有效场论中的非线性效应不能被忽略(因为它们通常包含了最低阶相互作用的信息),因此需要各种微扰论或重整化群等方法来处理;
  3. 分析的结果通常表现为一些可以通过实验测定的唯象参数(依赖于材料细节),以及普适的幂律行为。

幂律

上面的讨论体现出一个重要观点:幂律的存在是唯象模型揭示物理本质的重要途径,反映了一些不依赖于具体微观状态的普适性质。

一个例子是:实验观察到粒子运动的某些特征尺度$x$随时间的变化i行为,可以反映出其运动的本质类型:

  • 扩散,$x\propto \sqrt{Dt}$;
  • 定向迁移,$x \propto vt$;
  • 自由受迫运动,$x \propto gt^2$,例如恒定重力场中的运动;

流体力学的纳维-斯托克斯方程是另一个例子。

相变

粒子间相互作用最神奇的结果就是,相同的粒子在不同状态下体现出不同的,其集群行为可以截然不同。其中,相变是最重要的一个课题,粒子系统如何从一类宏观状态转变为另一类完全不同的宏观状态?形式上看,粒子需要的所有宏观性质都应该能从配分函数中得到;但是相变往往伴随着各种宏观响应函数的剧烈变化(奇异性),这必须对应于配分函数的奇点。在有限粒子数系统中,配分函数始终是良定义的解析函数,因此相变只会在热力学极限$N\to\infty$时发生;因此,相变附近系统的行为,与少数粒子系统的行为是截然不同的。

为了描述并研究相变,有必要寻找配分函数$Z$(或者说自由能$F = -k_BT\ln Z$)的各种奇点的起源,并合理地表征它们。

气-液相变

相变的一个经典例子是气-液相变;我们可以从两个角度观察这一过程:

image-20240423140554231

  • 在$(P,T)$图中,气-液相变发生在当跨越一条相共存线时,该线上的点表示两相共存的状态,并且该分界线终止于一个临界点$(T_c,P_c)$​;
  • 在$(P,v)$图中,气-液相变发生在当等温线处于一段平台区间时,此时两相共存,气相、液相分别具有不同的密度$\rho_{\rm gas} = 1/v_{\rm gas}$,$\rho_{\rm liquid} = 1/v_{\rm liquid}$;并且仅在低于临界温度$T<T_c$时才会出现这一两相共存平台;
  • 由于共存线终点的存在,有可能绕过临界点,从一个相连续地转到另一个相。此时液相和气相没有本质的区别。

从数学角度来看,体系的自由能在$(P,T)$平面上都是解析的,除了在割过相边界线时。这种奇异性体现为,在临界点附近,可以观察到若干特殊现象:

  • 从低温接近临界温度$T\to T_c^-$时,共存液相和气相的密度/比体积也相互接近:$\rho_{\rm liquid}\to\rho_{\rm gas}$​。
  • 从高温接近临界温度$T\to T_c^+$时,由$(P,v)$图上等温线逐渐变得平坦可知,等温压缩率$\kappa = v^{-1}(\partial v / \partial P)_T \to \infty$发散。
  • 临界点附近的液态变得“浑浊”,称为临界乳光现象,它表明此时粒子的集群运动尺度——波长$\lambda(T)$已经足够长,以至于可以折射可见光。这也为在此时对体系粗粒化采用场来描述提供了合理性。

铁磁-顺磁相变

另一个与之类似但或许并不熟悉的相变例子,是某些磁性材料(如铁,镍)的铁磁-顺磁相变。实验上看到,当温度低于居里温度$TT_c$,则磁化强度可以连续地变化。这些结论画在图中是

image-20240423145621856

可见,

  • 在$(h,T)$图中,存在一条不同磁化方向态的分界线,且该分界线终止于一个临界点$(T_c,0)$​,其横坐标就是居里温度;
  • 在$(M,h)$图中,仅在低于居里温度$TT_c$时就是连续转变。
  • 由于$h\mapsto -h$的对称性,保证了临界值$h_c = 0$,$M_c = 0$。

这些现象与气-液相变的相似性,暗示我们尽管物理背景完全不同,但是在临界点附近的一些行为可能具有相同的物理本质。

临界行为

临界点附近配分函数的奇异性,体现为若干热力学函数或响应函数的发散,即所谓临界行为,它们可以由相应的临界指数来刻画。

下面引入约化温度

并且用$Y$表示广义力,$X$​表示广义坐标(外参量)。

下面讨论的所有临界行为,都是在临界点附近的。

序参量

序参量是在不同的相中表现不同的热力学函数。

临界指数$\beta$

在$(Y,T)$图中,序参量沿着相共存线接近临界点的临界行为,用临界指数$\beta$来刻画。

例如,气液体系中的气相/液相密度与临界密度之差:

在临界压强时,

因此它可以作为气液体系的序参量

而另一方面,磁性系统中的磁化强度密度

在零场时,顺磁相的$m=0$,而铁磁相的$m$非零

因此磁化强度密度也可作为磁性材料的序参量。

可以看到,序参量仅在相共存线处才会出现非解析性,而在$(Y,T)$平面上的其他任何区域都是解析的;这使人联想到复平面上的割线。

临界指数$\delta$

在$(Y,X)$图中,序参量沿着临界等温线变化的临界行为,用临界指数$\delta$​来刻画。

我们希望描述临界等温线$T=T_c$在临界点附近的平坦度;也就是在临界温度时,当序参量的共轭量变化时,序参量对其的依赖行为。所谓共轭量,对于气液体系的密度差$\rho = 1/v$,其共轭量就是压强$P$;对磁性体系的磁化强度$m$,其共轭量就是外磁场$h$。

在气液体系,临界温度时,密度差在临界点附近的变化量

在磁性体系,临界温度时,磁化率在零场附近的变化量

即在临界温度时,序参量以共轭量的$1/\delta$指数幂的方式接近临界值。


需要指出的是,对于气液体系,在$T<T_c$时,共存的气相和液相具有相同的临界指数。

体态响应函数

可以用系统的序参量或内能,对序参量共轭量的导数,来描述体系对外界条件变化的响应,称为体系在宏观尺度的体态响应函数,它表明在一定体积内全部微观粒子的整体响应。例如气液系统中比体积(密度)对压强的导数;磁性系统中磁化强度对外磁场的导数;以及两者体系的热容。

处于临界状态附近的系统对外界的扰动非常敏感,这体现为当温度从两侧接近临界温度$T\to T_c$​时,系统对一些外界条件变化的响应函数发散。

临界指数$\gamma$​

在气液体系中,典型的响应函数是等温压缩率,即等温线上(比)体积随压强变化的导数

在$T\to T_c$时,临界压强的等温压缩率

在磁性系统中,等温磁化率是等温线上磁化强度随外磁场变化的导数

在$T\to T_c$时,零场的等温磁化率

其中$\gamma^+$、$\gamma^-$分别指温度从高温侧和低温侧接近临界温度时,响应函数的临界指数;在很多情况下,两者是相同的$\gamma^+ = \gamma^- = \gamma$。这类响应函数在临界时总是发散的,因此$\gamma>0$​。

image-20240423172032483

临界指数$\alpha$

在气液体系中,定容热容也是一个重要的响应函数

在$T\to T_c$时,

在磁性系统中,与之对应的是保持外磁场恒定时的热容

在$T\to T_c$时,

其中$\alpha^+$、$\alpha^-$分别指温度动高温侧和低温侧接近临界温度时,响应函数的临界指数。一些体系中,$\alpha>0$,此时热容在临界时也是发散的。但有时也存在$\alpha>0$的情形,此时的临界热容则是有限的;它可能在临界温度处有一个极大值的尖峰,也可能平滑过渡:

image-20240423172157338

同时也存在$\alpha=0$的可能。

长程关联

临界乳光现象表明,在临界点附近,体系内微观粒子的集群行为尺度已经达到宏观尺度,以至于足以散射可见光波段。事实上,由于体系的宏观响应函数与微观结构紧密联系,可知响应函数的发散本身就意味着体系在微观结构上存在长程关联。

下面以磁性材料为背景研究这种长程关联。考虑吉布斯配分函数

其中$\mathcal H_0$描述磁体本身的内能,$-hM$则是引起磁化$M$的外磁场$h$做的功。平衡态磁化强度是

材料对外磁场的敏感性,由磁化率描述,它正是磁化强度$M$的方差

另一方面,将磁化强度表为磁化强度密度的积分

其中$m(\vec r)$是位置坐标定域的函数;就有

齐次体系的平移对称性意味着$m(\vec r) = m$是一个常数,于是

是一个仅依赖于相对位置$\vec r - \vec r’$的函数。定义连通关联函数

于是可以将前述结果表示为

上式左边是宏观的体态响应函数,右边则是序参量的联通关联函数的积分。连通关联函数描述的是,体系中一个部分区域内的涨落,如何影响其他部分区域。

一般而言,这样的影响仅在一个特征长度——关联长度$\xi$之内;具体来说,在远离临界时,关联函数在长距离极限一般会衰减到零,很多情况下它具有指数衰减的形式

但是在近临界时,关联长度可能是发散的$\xi\to\infty$,这造成了长程的关联。这种微观结构的关联性可由散射实验探测,例如临界乳光现象就是因为近临界的液体中,密度涨落对可见光的散射造成的。可见光波长远大于典型的分子间距离,这说明近临界液体中的密度涨落代表着分子间的关联已经达到可见光波长尺度。

临界指数$\nu$

用$g$代表在关联长度内$r<\xi$的关联函数典型值,就有

这也是一般关联长度的定义,即$d$维体系中

其中$\chi$是其体态响应函数。

当临界时,响应函数发散$\chi\to\infty$,意味着关联长度也随之发散$\xi\to\infty$。这解释了临界乳光现象。

关联长度在接近临界点时的发散行为可被描述为

临界指数$\eta$

若关联长度发散,那么序参量的连通关联函数就不再表现出指数衰减的形式。此时的长程关联,体现为关联函数按照距离的幂次衰减;一般而言,对于$d$维自旋模型,在长程关联时,序参量的关联函数的行为是