经典场论 Chap.2:对称性与场的分类
Refrence
S.Weinberg: The Quantum Theory of Field (Volume 1)
群,群作用与群表示
对称变换的描述:群
重新考察四维时空的时空对称性,我们希望找到合适的数学描述。
在物理上,对称性一般由群来描述。所谓群$G$,即是一种定义了二元运算(群乘法)$g\circ h$的代数结构,且运算满足下列性质:
- 封闭性:$\forall g,h\in G,\quad g\circ h\in G$
- 结合律:$\forall g,h,k\in G,\quad (g\circ h)\circ k = g\circ (h\circ k) = g\circ h\circ k$
- 有恒元$e$满足:$\forall g \in G,\quad g\circ e=e\circ g = g$
- 对$\forall g\in G$,有逆元$g^{-1}$满足:$g^{-1}\circ g = g \circ g^{-1} = e$
这恰恰对应了我们在物理上对于对称变换所满足性质的期待:
- 对体系连续施加两个对称变换,其总效果按照定义仍是一种对称变换;
- 连续施行多次对称变换时,总应当可以按顺序任意拆分成几组变换;
- 有恒等变换,即不进行任何改变的操作,也属于特殊的对称变换;
- 对称变换不应该损失体系的信息,总应当可以复原变换前的体系,即对称变换可逆。
因此在大多数情况下我们都会为一类特定的对称变换寻找一个合适的群$G$来描述。
相比于抽象的群结构本身,物理上更关心的是群元素作用在某些对象上的效果,即所谓群作用的概念。若用$G$描述对称变换的操作本身,那么对称变换的对象的全体则作为一个集合$X$,其每个可以被变换的对象都是集合中的一个元素$x\in X$。例如,对于时空对称变换,$X$就可以是时空坐标全体,即四维闵氏空间。
群$G$作用在集合$X$上,就是说每个群元$g\in G$都是集合$X$上的一个可逆变换,代表一个物理的对称变换操作。例如:$x\mapsto g\cdot x \in X$,且满足:
- 群乘法表示对称变换操作的复合:$(g\circ h)\cdot x = g\cdot(h\cdot x)$;
- 特别地,恒元$e$对应的变换是恒等变换:$e\cdot x=x$。
称其为群作用。这样,群$G$及其作用空间$X$共同构成了物理上对一个对称变换的抽象描述。
但是更多时候我们不仅仅只研究对称变换本身,更关心的是在对称变换下某些物理对象——比如说在场论中,这样的对象就是场,也即$X$上各种类型的映射——的变换形式。给定了群$G$在集合$X$上的作用,就能自然诱导出群在其上映射空间的作用。
设$G$作用在集合$X$和$Y$上,群作用分别用$g\cdot x$和$g* y$表示,$\mathcal F[X\to Y ]$是全体$X\to Y$映射的集合,则存在$\mathcal F$上的诱导群作用$\Pi$,对$\forall g\in G$,存在变换$\Pi_g$满足:
对于不同类型的值域$Y$,可能存在不同的群作用$g*y$,则相应函数$f\in\mathcal F$服从的变换律也不同。若群作用是$X$上的对称变换,此时也说映射空间$\mathcal F$具有这种对称性。
据此,时空的对称性就会自然诱导出场的对称性。在下面的讨论中,我们的重点就是各类不同的场在时空对称变换下的行为。之后如无特殊说明,群乘法用普通乘法的记号来简记,即$g_1g_2\equiv g_1\circ g_2$;而群作用一般则用函数的形式表示,即将群元$g$对集合元素$x$的某种作用$g\cdot x$写成某个函数$f_g(x)$。
群表示
物理上的对称性可以由群$G$对某个空间$X$的作用来描述,但是这样抽象的描述不便于物理的计算与分析,因此我们会进一步希望用一些更熟悉的、更具体的工具来定量刻画群的作用,例如线性变换、矩阵代数。我们经常会考虑群在一个线性空间上的作用,此即群表示的概念。
线性空间$V$上的全体可逆线性变换按照变换的复合作为乘法构成群,称为线性变换群${\rm GL}(V)$;群$G$在线性空间$V$上的一个线性表示,是指一个保持群乘法的映射$\varphi:G \to {\rm GL}(V)$,即$\varphi(g)\varphi(h) = \varphi(gh)$,$\forall g,h\in G$;显然它将恒元$e$映射到恒等变换$1_V$,元素$g$的逆元$g^{-1}$映射到变换$\varphi(g)$的逆$\varphi(g)^{-1}$,这样的映射称为群同态。线性空间$V$称为表示空间,其维数$\dim V$称为群表示的次数$\deg\varphi$。
我们看到在这样的群同态下,${\rm GL}(V)$保持了很多群$G$本身的性质和结构,同时它作为一个线性空间上的线性变换群,又比抽象的群$G$更加方便进行研究。若从群作用的观点来看,这实际上就是群$G$在线性空间$V$上的一种“作用”,只不过用线性变换的方式表达了出来。可以说,群在线性空间上的作用本身就是一个线性表示;一般也把群的线性表示称为群在相应线性空间上的作用。
特别地,若表示空间$V$是酉空间(复内积空间)/实内积空间,且$\forall g \in G$,$\varphi(g)$都是$V$上的酉变换(幺正变换)/正交变换,即保内积变换,那么称$\varphi$是酉表示(幺正表示)/正交表示。
给定线性空间的一组基后,$n$维线性空间上的可逆线性变换,与$n$阶可逆矩阵建立起一一对应的关系。因此考虑将群同态$\varPhi:G\to {\rm GL}(n)$称为矩阵表示,这里${\rm GL}(n)$为全体可逆$n$阶矩阵按照矩阵乘法构成的群,$n$也是矩阵表示$\varPhi$的次数$\deg\varPhi$。给定一组基后,线性表示与矩阵表示就是一一对应的,因此就可以不再区分群在其上的线性表示,以及群的$\dim V$维矩阵表示。矩阵表示为我们具体计算群作用和群表示提供了方法。
同一个群可以有多个相同次数的表示,若它们之间通过一个特定的变换矩阵$S\in{\rm GL}(n)$联系:$\forall g\in G$,$\varPsi(g) = S^{-1}\varPhi(g) S$,则称两者是等价表示。通常等价的表示在物理上描述的是具有相同性质的对象,因为它们在某种对称变换下的行为相同。显然一个群可以有许多不等价表示,其之间的区别取决于表示空间本身的性质。因此,物理上我们会用同一个群的不等价表示给物理对象进行分类,即将不等价表示空间中的元素识别为不同的物理对象,以表征它们在相同对称变换下的不同变换性质。
一个群可以在很多不同的表示空间上建立群表示;甚至可以利用较小空间上的表示构造较大空间上的表示,或者反之将较大空间上的表示拆分为较小空间上的表示。那么能否找到一个群全部的线性表示呢?数学上有定理保证,对于在物理上最主要应用的复数域$\mathbb C$上的群表示来说,有限群$G$的矩阵表示总是可以写成如下的分块对角形式:
我们可以用这些最小的不再可分的矩阵块,来构造一个群全部的线性表示,因此将这些基本结构称为群$G$的不可约表示;而这些分块对角矩阵的表示则是可约的。
数学上还可以证明,有限群$G$的不可约表示的维数一定是有限的。因此结合前面两个定理可知,只要找到群$G$的全部有限维不等价不可约表示,就能简单地通过构造得到群$G$在数域$F$上的全部有限维线性表示,从而获知群表示的结构。进一步,用不等价不可约表示来为物理对象进行分类。寻找群的全部不等价不可约表示,这也是群表示在物理上应用的主要难点之一。
在现代物理理论研究之中,群论及群表示的概念经常处于核心地位。没有基础的读者强烈建议先阅读本章附录:群论基础。在下面的物理讨论中,我们将不刻意区分群在线性空间上的群作用、群在该空间上的群表示,以及群的矩阵表示这些概念。
李群——连续对称性
物理上一大类对称性是连续对称性,直观来讲这样的对称变换可由一组连续变化的实参数来标记。这样的连续群就是李群。通常我们用到的是有限维连通李群,即独立变化的实参数是有限多个,且每个群元均可通过群内的一条路径与恒元相连。
用$\alpha^i$,$i=1,\dots,n$来标记这组参数;$g(\alpha)$表示由参数标记的群元,也称$\alpha^i$是其坐标;一般取恒元的坐标为零:$e = g(0)$;那么该群的群乘法应当有如下形式:
其中$f^i(\alpha,\alpha’)$是$\alpha^i$和$\alpha’^i$的函数;显然应当满足:
考虑将其在恒元附近展开,到二阶项的展开形式被上式所唯一限制(出现任何非零的$(\alpha)^2$或$(\alpha’)^2$项都会违反上式):
其中$f^i_{jk}$是实系数。
另一方面,也将群元在恒元附近展开:
将两个展开式代入$g(\alpha’) g(\alpha) = g\left( f(\alpha,\alpha’) \right)$,得到
换句话说,群元展开式的二阶项可以从一阶项中唯一确定,只需要直到给定函数的二次项系数$f^i_{jk}$;进一步考虑到应当有$T_{jk}=T_{kj}$,则可得:
其中$C^i_{jk}$称之为结构常数,显然$C^i_{jk} = -C^i_{kj}$。可以证明,对于更高阶的项,也可以像这样由低阶项确定,最终都归结为一阶项$T_i$以及结构常数$C^i_{jk}$。因此我们将各个$T_i$称为李群$G$的生成元,只要确定了它们的具体形式,以及对易关系,就能够确定一个李群(至少是在恒元附近)。
利用生成元,可以将李群群元表示为:
此即李群群元与生成元之间的指数映射关系。如果指数上只取部分生成元,那么得到的结果构成原本李群的一个由相应生成元所生成的李子群。
若将李群视作一个连续的几何对象(即流形,这也是李群的一种定义方式,即附加了群结构的流形),那么各个$T_i$就是恒元处的切矢量,它们张成一个线性空间,即李群在恒元处的切空间。可以在这个空间上直接定义双线性的二元乘法(即该乘法对两个参与运算的元素都是线性的映射)就是其对易子:$[T_j,T_k] = {\rm i} C^i_{jk} T_i$,不难验证,该运算满足:
- 反对称性:$[A,B] = -[B,A]$
- Jacob恒等式:$\big[A,[B,C]\big] + \big[C,[A,B]\big] + \big[B,[C,A]\big] = 0$
在数学上,定义了双线性二元乘法的线性空间构成一个代数;乘法运算满足反对称性和Jacob恒等式的代数称为李代数,相应的乘法称为李括号。因此李群$G$在恒元处的切空间$V_e$配以生成元对易子作为乘法,就构成一个李代数$\mathfrak g$,其元素是李群的各个生成元$T_i$(及其线性组合),李括号是对易关系$[T_j,T_k] = {\rm i} C^i_{jk} T_i$。
有时,所有$C^i_{jk}$全为零,此时所有生成元都对易,李群的群乘法也满足交换律,这样的李群就是阿贝尔群;否则若$C^i_{jk}$不全为零,就是非阿贝尔群。这与离散群是一致的。
庞加莱群与洛伦兹群
前面已经讨论过,四维时空对称性包括时空平移变换与洛伦兹变换两大类,若是区分时间与空间,则前者又可分为时间平移和空间平移,后者也可分为纯空间的转动与涉及时间的boost。我们用所谓庞加莱群来描述四维时空的所有时空对称性。
本节的一个重要任务就是找到庞加莱群(及其子群洛伦兹群)的不等价不可约表示,将会看到,这些表示不仅仅分类了物理上不同的场,还自然而然给出了一个经典力学所没有的自由度:自旋。
庞加莱群
首先考虑时空坐标的变换,我们考虑的是保度规不变的变换$x\to x’$,即
或者更常用的形式是
满足这样条件的变换一定是线性的,我们通常记为
或者简记为$(\Lambda,a)$,称为庞加莱变换或非齐次洛伦兹变换;其非齐次项$a^\mu$可以是任意常矢量,代表着时空平移变换,而齐次部分$\Lambda$则称为洛伦兹变换,其变换矩阵满足
据此取行列式可得
因此其有逆$\Lambda^{-1}$,为
相应的庞加莱变换也有逆(单位变换是$(I,0)$):
此外,其复合变换满足封闭性:
因此这样的变换$(\Lambda,a)$满足群的定义,构成作用在四维时空上的变换群,也就是四维时空的最大等度规群(等距群)${\rm ISO}(1,3)$,经常也称之为庞加莱群$\mathcal P$或非齐次洛伦兹群。
洛伦兹群
庞加莱群有一些子群,例如其齐次变换$\Lambda\equiv(\Lambda,0)$也构成一个较小的群,即四维时空的正交群${\rm O}(1,3)$,也称为洛伦兹群$\mathcal L$,是保度规不变的;非齐次部分$a\equiv(I,a)$显然代表着平移变换,构成四维平移群${\rm T}(4)$也是保度规的。数学上,满足前述复合变换的群关系是半直积:
其中${\rm T}(4)$是$\mathcal P$的正规子群;由$\Lambda$决定的${\rm T}(4)$上的自同构变换是$a \mapsto \Lambda a$,这也符合洛伦兹变换矩阵作用在4-矢量$a^\mu$上的基本形式。
物理上我们会特别关心一类特殊的洛伦兹变换,称为正规正时变换。
具体来说,由于$\det\Lambda=\pm 1$,可按照行列式符号将洛伦兹变换分为两类,其中$\det\Lambda=1$的变换可以构成子群(包含恒元)${\rm SO}(1,3)$。
另一方面,在式$g_{\mu\nu}{\Lambda^\mu}_\rho {\Lambda^\nu}_\sigma = g_{\rho\sigma}$中取$\rho\sigma = 00$分量:
因此还可根据${\Lambda^0}_0\ge1$和${\Lambda^0}_0\le-1$两种情况再进行分类。
由此,在拓扑结构上$\mathcal L$是4度复连通(非单连通)的,它被分为4个连通分支,或者说4个叶:
- $\mathcal L^\uparrow_+ = \{\Lambda\in L|\det\Lambda=+1,{\Lambda^0}_0\ge1\}$,包含恒元$I$;
- $\mathcal L^\uparrow_- = \{\Lambda\in L|\det\Lambda=-1,{\Lambda^0}_0\ge1\}$,包含特征元为空间反射$r_s$;
- $\mathcal L^\downarrow_- = \{\Lambda\in L|\det\Lambda=-1,{\Lambda^0}_0\le-1\}$,包含特征元为时间反射$r_t$;
- $\mathcal L^\downarrow_+ = \{\Lambda\in L|\det\Lambda=+1,{\Lambda^0}_0\le-1\}$,包含特征元为时空反演$i_{ts}=r_tr_s$;
它们分别都是单连通的,但只有第一个分支$\mathcal L^\uparrow_+ = {\rm SO}^+(1,3)$是李子群,称为固有洛伦兹群,几何上是连通的6维流形,其中的变换是正规正时洛伦兹变换;四个分支各自的元素之间互相不可以通过参数的连续变换相联系,但其他几个分支中的元素则可以表示成相应特征元与某个正规正时变换的乘积,换句话说其他三个分支都是$\mathcal L^\uparrow_+$在不同特征元下的陪集:
相应也有固有庞加莱群:$\mathcal P_{\rm p}={\rm T}(4)\rtimes \mathcal L^\uparrow_+$。在下面若无说明,默认考虑的是固有庞加莱群和固有洛伦兹群。
庞加莱代数与洛伦兹代数
我们可以通过研究李代数,即恒元附近的群元来获知李群的绝大部分性质(除了拓扑等整体性质)。对庞加莱群,考虑恒元附近的庞加莱变换,即所谓无穷小庞加莱变换:
其中${\omega^\mu}_\nu$和$\epsilon^\mu$都是无穷小的。代入保度规条件
那么无穷小变换$\omega^{\mu\nu}$一定是反对称的。反对称$4\times 4$矩阵的自由度共有$6$个,正对应于洛伦兹群所描述的6个对称变换;再加上$\epsilon^\mu$的4个自由度,因此庞加莱群自由度是10个:$\dim \mathcal P = 10$,即对应于10个独立参量,也是四维时空的10个对称性。
用$U(\Lambda,a)$表示对应于物理变换$(\Lambda,a)$的抽象庞加莱群元,特别地$U(1+\omega,\epsilon)$表示无穷小庞加莱变换的对应群元,我们希望了解其群结构。将其在恒元附近展开至无穷小量的线性项
$J^{\mu\nu}$和$P^\mu$分别是时空旋转(包括空间旋转和boost)和时空平移的生成元;因而是相应李代数的元素;利用它们可以通过指数映射将庞加莱群的(非无穷小的)群元表示为:
而洛伦兹群元和时空平移群元只需要取其中不同的参数即可得到。
要满足$U(1+\omega,\epsilon)$的幺正性(即保度规性),$J^{\mu\nu}$和$P^\mu$必须是厄米的(stone定理);并且习惯上将反对称$\omega^{\mu\nu}$的系数$J^{\mu\nu}$也取为反对称的。为了看到这两个量的性质,研究$U(1+\omega,\epsilon)$本身被庞加莱群作用的变换性质:
在第一阶,有
可得
这意味着$P^\mu$是矢量,在纯平移变换下不变;$J^{\mu\nu}$是张量,在纯平移下,它的空间-空间分量的行为类似于角动量。上式在无穷小变换(取$U(\Lambda,a) = U(1+\omega,\varepsilon)$)下得到对易关系:
从而得到$J^{\mu\nu}$和$P^\mu$满足的对易规则:
由于$J^{\mu\nu}$和$P^\mu$是无穷小庞加莱群元的线性项系数,即庞加莱群的生成元,因此构成其相应的李代数——庞加莱代数的一组基,上式就是庞加莱代数的李括号。特别地,其中$J^{\mu\nu}$单独是洛伦兹群的生成元,即构成洛伦兹代数的一组基,第一式就是洛伦兹代数的李括号。
有时候也将$J^{\mu\nu}$和$P^\mu$的时间分量和空间分量拆分开,即令$H = P^0$,${\bf P} = (P^1,P^2,P^3)$,${\bf K} = (J^{01},J^{02},J^{03})$,${\bf J} = (J^{23},J^{31},J^{12})$,后两式相当于$J_i = \dfrac12\epsilon_{ijk} J^{jk}$,$K_i = J^{0i}$;用它们表示的庞加莱代数的李括号为
其中,第一个式子就是角动量代数的李括号,意味着${\bf J}$的确就是描述系统的角动量;而在经典力学中,我们就已经将空间平移生成元${\bf P}$解释为动量,时间平移生成元$H$解释为能量(哈密顿量);因此在正则量子化后,第四个式子表明角动量${\bf J}$守恒,第五个式子表明动量${\bf P}$守恒,而第六个式子则表明描述boost的3-矢量${\bf K}$不守恒,这也是为什么通常不用它(的本征值)来标记物理态的原因。
最后,利用这些量,也可以将时间平移群、空间平移群、空间旋转群、洛伦兹群的群元分别表示为:
其中$\theta_i = \dfrac12\epsilon_{ijk}\omega^{jk}$,$\eta^i = \omega^{0i}$。第四个式子就是洛伦兹变换的普遍表达式,在后面的讨论中比较重要。
作为对比,给出伽利略群的伽利略代数:
这里用3-矢量${\bf C}$表示所谓的“伽利略boost”。可见伽利略代数和庞加莱代数的区别几乎只在于最后两式,即伽利略boost${\bf C}$和洛伦兹boost${\bf K}$的差异。倒数第二式表明伽利略boost${\bf C}$自身分量之间是对易的,而不像洛伦兹boost${\bf K}$那样会产生不封闭的代数性质;最后一式表明它与动量${\bf P}$之间的对易子不再是同为生成元的$H$,而是正比于一个不变参数$m$,这被解释为体系的质量;或者说,质量是伽利略代数的中心荷。这会导致伽利略变换和洛伦兹变换对体系的作用有着本质区别。
庞加莱群和洛伦兹群的表示
既然庞加莱群描述了我们对四维时空的全部时空对称变换,那么自然的想法是,定义在时空上的场作为四维时空中的对象,也随时空一同在庞加莱群下变换,应当可以按照各种场在变换下的不同行为而进行分类。进一步还要要求,按照某种分类标准所确定的不同类型的场,在庞加莱变换下不会相互转化——否则在物理上意味着两个不同惯性系中的观察者会对同一个对象观测到不同的结果,这是没有意义的。
在这个意义下,不同类型的场的集合成为了庞加莱群的不同表示空间,而庞加莱群元对这些不同类型场的变换形式则给出了庞加莱群的不等价表示。换句话说, 我们要对场进行分类,实质上是寻找庞加莱群的不等价不可约表示。
注:不可约意味着我们要寻找的是某种意义上“基本的”、“单独的”场,而非若干类型场的合成或叠加或复合。
庞加莱群表示
场表示及其构成
一个容易被忽略的点是,在经典场论或量子场论的课题中,我们要寻找的庞加莱群(或洛伦兹群)表示,应当是无穷维的。
原因很显然:(至少在通常的做法中)我们处理的是定义在连续时空上的连续场$\phi(x)$,因而无论场的类型如何,它必然包含无穷多自由度。当我们对其施加时空对称变换,一般来说其变换结果是由两部分构成,分别是坐标的变换和场函数本身的变换:
一方面,坐标要进行变换$x\to x’$,意味着当我们对任何连续场施加时空对称变换,必然是在无穷多个自由度上同时进行变换,从而这样的群表示必然是庞加莱群(或洛伦兹群)的无穷维表示。若我们将坐标变换记作$x’^\mu = {\Lambda^\mu}_\nu x^\nu +a^\mu$,那么可将这一变换所引起的场的变换记为:
这里$M^{\rm cdn}(\Lambda,a)$即是单纯由坐标变换所引起的庞加莱群的无穷维表示(的表示矩阵),或称坐标表示。
但是另一方面,场函数本身的变换行为$\phi\to\phi’$,才是真正对场分类的依据,也是我们真正要研究的那类群表示。我们可以将之记为:
其中$M^{\rm fld}(\Lambda,a)$表示场函数本身变换所对应的表示(的表示矩阵),一般来说它具有一些时空指标,在这里略去了。一般物理上遇到的场函数自身的自由度是有限的,因此其变换对应的表示也是有限维表示,一般对于不同类型的场函数有不同的称呼,例如后面将会看到的标量表示,旋量表示,矢量表示等等。
于是我们就可以将场变换的整体写为:
完整的表示实际上就是$M(\Lambda,a)$,称为场表示。因此,庞加莱群(或洛伦兹群)对连续场变换的群表示一定是无穷维的表示。只不过,在一些特殊的庞加莱变换,例如时空平移变换下,一般而言场函数本身是不变的,$M^{\rm fty}(\Lambda,a) = I$,此时庞加莱群的无穷维表示仅仅是由坐标变换所引起的;而在一般的洛伦兹变换下,场函数也要随之变化,此时庞加莱群的无穷维表示实际上是由两部分所合成:坐标变换所引起的无穷维表示,以及场函数本身变换的有限维表示。
我们下面要做的任务,就是分别找到这两部分群表示其具体的形式。习惯上,我们会寻找一组数字来标记区分不等价不可约群表示。而由于$M^{\rm cdn}(\Lambda,a)$对任何类型的场都是普适的,因此一般会直接利用对$M^{\rm fld}(\Lambda,a)$的标记来对场表示$M(\Lambda,a)$做同样的标记进行区分。
庞加莱不变量与卡西米尔算符
考虑到庞加莱群的不等价不可约表示可能有很多,一个实用的问题是如何简单地对其进行标记,例如如何用一组数来区分不同的表示?按照前面的分析,一种特定类型的场,在庞加莱变换下,尽管具体函数形式可能发生变化,但其种类不应发生变化,即仍属于庞加莱群的同一表示空间。若能寻找到一个具体的不变量(称之为庞加莱不变量)来刻画这种在庞加莱变换下的不变性,那么也就能用它来标记一种庞加莱群的不可约表示。
一个直接的想法是寻找一个(或一组)算符$\mathscr C$,并使其作用在庞加莱群表示空间上,表示矩阵为$C$,使得相同类型的场(即庞加莱群某一表示空间中的全体元素)都是$\mathscr C$的属于同一本征值的本征矢,而不同类型的场具有不同的本征值,换句话说庞加莱群的一个不等价表示空间就是$\mathscr C$的一个本征子空间。这样前面提到的不变量就正是算符$\mathscr C$的本征值$c$,那么对于任意场$\phi$(其中$M(\Lambda,a)$是庞加莱群相应的不可约表示):
要求其在变换前后均为算符$\mathscr C$的属于同一本征值的本征矢:
这说明,这样的算符$\mathscr C$(的表示$C$)一定与庞加莱群在该表示下的任意$M(\Lambda,a)$对易:$C M(\Lambda,a) = M(\Lambda,a) C$,$\forall (\Lambda,a)\in \mathcal P$。
这样的算符存在吗?
所谓卡西米尔算符(Casimir Operator)可以扮演这样的角色,其定义为由李群生成元所构成,并且与所有生成元都对易的算符$\mathscr C$。对于庞加莱群$\mathcal P$,也就是:
Schur第二引理(Schur’s second lemma):对于群$G$在代数闭域$F$上的不可约表示$D$,若有$F$上的非零算符$A$满足$\forall g\in G$,$A D(g) = D(g) A$,那么$A = \lambda I$,其中$\lambda\in F$。
因而这样的算符$\mathbb C$在表示空间上正比于单位算符,于是其本征值就确实可以对不等价不可约表示进行分类。
一个例子:${\rm SO}(3)$具有一个卡西米尔算符:${\boldsymbol J}^2 = J_x^2+ J_y^2+ J_z^2$,它是由三个生成元$J_x$、$J_y$、$J_z$构成并分别与之对易。在量子力学中,我们可以使用${\boldsymbol J^2}$的本征值$j(j+1)$(其实是等价地使用$j$)来标记粒子的自旋,不同自旋的粒子对应于${\rm SO}(3)$不同的表示。因此${\boldsymbol J^2}$的构成了对${\rm SO}(3)$不等价不可约表示的标记。
对于庞加莱群,存在两个二阶卡西米尔算符:
其中$P^\mu$是四动量矢量,$W^\mu$是泡利-鲁班斯基赝矢量(Pauli-Lubanski pesudo-vector):
其对易关系为:
为了说明这两个卡西米尔算符的作用,我们在这里不加证明地指出:对于特定的一些表示(其实是有质量场对应的表示),$\mathscr C_1$具有本征值$m^2$,$\mathscr C_2$具有本征值$-m^2 j (j+1)$。这也就得到了两个庞加莱不变量,以及两个值$m$和$j$,特定场的这两个值在庞加莱变换下是不变的,于是它们成为了我们对场分类的一种标准。因此对于庞加莱群的这类表示(有质量场),我们总可以用数组$(m,j)$来唯一标记之。将会看到,在量子场论意义下,$m$被解释为场(所对应的粒子)的质量,而$j$则是其自旋。
直观感受下,特定场的质量$m$完全由生成元$P^\mu$决定,也即对应于庞加莱群的四维平移群部分;而自旋$j$则需要由其在洛伦兹群作用下的行为来决定。因此要进一步明确不同$j$类型场的行为,需要我们对庞加莱群的子群——洛伦兹群的表示继续做研究。
洛伦兹群表示的一般理论
洛伦兹群是庞加莱群的一个非平凡子群。作为一个非单连通的李群,洛伦兹群的表示满足如下的定理:
设李群$\mathcal G$的李代数为$\mathfrak{g}$,则$\mathfrak{g}$的表示与$\mathcal G$的通用覆盖群的表示是一一对应的。
关于李群的通用覆盖群及其表示在之后再作解释;这一定理说明要研究洛伦兹群的表示,那么它的李代数是非常重要的。我们首先来研究洛伦兹代数的结构。
注:以下不加说明的话,“表示”默认为有限维不等价表示。
洛伦兹代数的分解
现在来讨论洛伦兹代数:
这是庞加莱代数的一部分。洛伦兹代数的结构我们不熟悉,但是可以将之分解为熟悉的代数结构。可以看到只有旋转部分的生成元$J_i$构成洛伦兹代数的一个封闭的李子代数,而boost部分生成元$K^i$则不封闭。这说明空间旋转群${\rm SO}(3)$是洛伦兹群的一个李子群,而boost部分并不能构成一个子群。为此考虑引入两个新的算符作为其复线性组合:
容易验证它们的李代数分别是封闭的:
前面已经给出了洛伦兹群元用生成元$\bf J$和$\bf K$的表示形式:
那么用新生成元$\bf J_\pm$的表示为:
这里参数的关系是:
注意到显然$\bf J_+$和$\bf J_-$的对易子分别构成一个李代数$\mathfrak{su}(2)$,这也说明洛伦兹代数可被分成两个对易的封闭李子代数;但注意到$\bf J_+$和$\bf J_-$的构造过程是在复数域$\mathbb C$上进行的,而按照定义的洛伦兹群则是实数域$\mathbb R$上的李群,因此严格来说,此时它们所生成的李代数已经不再是洛伦兹代数$\mathfrak{so}(1,3;\mathbb R)$,而是其复化;李代数直和分解关系为(可以从生成元个数上进行验证):
这是李代数的嘉当分解(Cartan Decomposition)。注意到李代数的同构关系:$\mathfrak{su}(2)_{\mathbb C} \cong \mathfrak{so}(3)_{\mathbb C} \cong \mathfrak{sl}(2,\mathbb C)$(需要注意$\mathfrak{su}(2)$与$\mathfrak{sl}(2,\mathbb R)$并不同构),于是可以写下如下的李代数链:
这给出了一个重要的李代数同构关系:$\mathfrak{so}(1,3)_{\mathbb C}\cong \mathfrak{su}(2)_{\mathbb C} \oplus \mathfrak{su}(2)_{\mathbb C}\cong\mathfrak{sl}(2,\mathbb C)_{\mathbb C}$;并且可以证明,它们的实形(作为实6维李代数)也是同构的:$\mathfrak{sl}(2,\mathbb C)\cong\mathfrak{so}(1,3)$。这是研究洛伦兹群表示的一个重要关系。
上面虽然是复化李代数的关系,但存在另一个重要结论是:复化李代数的表示和其任意实形李代数的表示是一一对应的。这允许我们将实形和复化的李代数表示的结果相互迁移。
李代数$\mathfrak{su}(2)_{\mathbb C}$的表示结构已经非常清楚了,因此在$\mathfrak{su}(2)_{\mathbb C} \oplus \mathfrak{su}(2)_{\mathbb C}$中存在两个卡西米尔算符:
它们与$\mathfrak{so}(1,3)_{\mathbb C}$中任何元素对易,且分别具有本征值$n(n+1)$和$m(m+1)$;其中$n$和$m$又分别是$J_+^3$和$J_-^3$可取的最大本征值,为非负的半整数:
因此利用数对$(n,m)$实际上就可以标记$\mathfrak{so}(1,3)_{\mathbb C}$的表示(并一一对应于其实形$\mathfrak{so}(1,3)$的表示),对应的表示维数为$(2n+1)(2m+1)$。而注意到$J^3 = J_+^3 + J_-^3$,因此值$n+m$又对应于总角动量$J^3$的最大本征值。
旋量群
李代数的同构关系$\mathfrak{so}(1,3)_{\mathbb C} \cong \mathfrak{su}(2)_{\mathbb C} \oplus \mathfrak{su}(2)_{\mathbb C} \cong \mathfrak{sl}(2,\mathbb C)_{\mathbb C}$暗示在群$\mathcal L^\uparrow_+ = {\rm SO}^+(3,1)$、${\rm SU}(2)$、${\rm SL}(2,\mathbb C)$之间,可能存在类似的重要关系。
在物理学中,最常被研究的一类对称群是正交群。若是单连通李群,那么它的表示可以很自然地从其李群的表示来得到。但是正交群${\rm O}(n)$往往不是单连通的,这样它的表示与其李代数的表示的对应关系并不简单;因此有一种动力要去研究其李代数所对应的单连通李群的表示。
首先来看一个二叶通用覆盖的例子:众所周知,存在一个群同态$C_d:{\rm SU}(2)\to {\rm SO}(3)$,对于$\forall r\in {\rm SO}(3)$,$\exists u\in {\rm SU}(2)$使得$C_d(u) = C_d(-u) = r$。这一群同态的核是:
(正规子群)。根据同态基本定理:
像这样群本身之间具有群同态,并且同态核是离散集的,就称${\rm SU}(2)$是${\rm SO}(3)$的(李)覆盖群;当同态核$\cong \mathbb Z_n$,就称为是$n$叶覆盖;而若覆盖群本身的流形结构是单连通的,则称为通用覆盖/万有覆盖。因此,由于${\rm SU}(2)$到${\rm SO}(3)$具有$2\to 1$的群同态。并且从流形结构上${\rm SU}(2) \cong \mathbb S^3$是单连通的,那么它就成为${\rm SO}(3)$的二叶通用覆盖群。特别地;${\rm SU}(2)$和${\rm SO}(3)$具有相同的李代数,这对于李群及其覆盖群是一个普遍的性质。
据此可以定义通用覆盖群的概念:我们称单连通李群$\mathcal {SG}$是连通李群$\mathcal G$的通用覆盖群(Universal Cover Group),若两者拥有相同的李代数$\mathfrak{g}$,并且存在群同态$C:\mathcal {SG} \to \mathcal G$。可以证明,对于有限维实李代数$\mathfrak{g}$,这样的覆盖群总是存在的并且在同构意义下是唯一的。
现在回到前面提到过的定理:
设李群$\mathcal G$的李代数为$\mathfrak{g}$,则$\mathfrak{g}$的表示与$\mathcal G$的通用覆盖群的表示是一一对应的。
它表明,$\mathfrak{g}$的李代数表示与覆盖群$\mathcal{SG}$的群表示是一一对应关系;我们知道,李群$\mathcal G$的群元$g\in\mathcal G$和李代数$\mathfrak{g}$的元素$X\in\mathfrak{g}$之间存在指数映射的关系:$g = \exp(\lambda X)$;因此李群$\mathcal G$的任何表示(即李群同态$\varPhi:\mathcal{G}\to{\rm GL}(n,\mathbb C)$)也可通过李代数$\mathfrak{g}$的表示(即李代数同态$\phi:\mathfrak{g}\to\mathfrak{gl}(n,\mathbb C)$)来得到:
而根据上述定理,$\mathfrak{g}$的李代数表示又可以通过研究覆盖群$\mathcal{SG}$的群表示来获知。于是利用覆盖群$\mathcal{SG}$的表示来获得群$\mathcal G$的表示,就成为研究李群表示的一种重要方法。
回到物理上常见的研究对象:正交群,它的二叶通用覆盖是普遍存在的。与前面的例子类似,可以证明${\rm SL}(2,\mathbb C)\to {\rm SO}^+(1,3)$也是一个二重覆盖,这被称为旋量群覆盖。我们一般地定义:
旋量群:${\rm Pin}(n)$(${\rm Pin}(p,q)$)为正交群${\rm O}(n)$(${\rm O}(p,q)$)的的二叶覆盖群;${\rm Spin}(n)$(${\rm Spin}(p,q)$)为特殊正交群${\rm SO}(n)$(${\rm SO}(p,q)$)的单连通李子群的二叶覆盖群。
特别地,当$n>2$($p+q>2$)时,${\rm Spin}(n)$(${\rm Spin}(p,q)$)是单连通的,从而成为二叶通用覆盖群。于是(紧)单连通旋量群${\rm Spin}(n)$(${\rm Spin}(p,q)$)的表示与李代数$\mathfrak{so}(n)$($\mathfrak{so}(p,q)$)的表示一一对应。
当维数比较低的时候,${\rm Spin}(n)$(${\rm Spin}(p,q)$)群同构于一些比较熟悉的简单群(这里用$=$表示同构关系):
以及
在物理上比较关心的就是${\rm Spin}(3)\cong {\rm SU}(2)$和${\rm Spin}(1,3)\cong{\rm SL}(2,\mathbb C)$。
考虑到二叶覆盖群的定义,假设$p,-p \in {\rm Spin}(n)$是对应于同一$r\in{\rm SO}(n)$的元素,因此${\rm Spin}(n)$的表示(即同态映射$\Phi:{\rm Spin}(n) \to {\rm GL}(n,\mathbb C)$)与覆盖映射(即同态映射$C_d:{\rm Spin}(n) \to {\rm SO}(n)$)两者结合,可以为$\forall r\in{\rm SO}(n)$带来两个“表示矩阵”:$\Phi(p)$与$\Phi(-p)$。
当然,后面将会看到,这并不是${\rm SO}(n)$的“真实表示”,但却对应于其李代数的一个真实表示,在一定程度上同样反映了相应群所代表的对称性。因此,将这种来自于二重覆盖群的表示也看作是群${\rm SO}(n)$的某种特殊表示,称为被覆盖的连通李子群的“旋量表示”。
另一方面,${\rm Spin}(n)$不仅仅给出旋量表示。注意到${\rm Spin}(n)$的表示与$\mathfrak{so}(n)$的表示一一对应,而这其中的一部分一定又对应于${\rm SO}(n)$的真实表示,因此这暗示${\rm SO}(n)$的真实表示(在同构意义下)同样可以由其旋量表示来构造。
Clifford代数
如何找到${\rm Spin}(n)$的表示?先找$\mathfrak{spin}(n) = \mathfrak{so}(n)$的表示;如何找$\mathfrak{spin}(n)$的表示?Clifford代数可以生成。
Clifford代数:对$n$维线性空间$V_{s<n}=span(e_1,\dots, e_n)$定义内积:$(e_i,e_j)=\eta^{(s)}_{ij}$,并引入乘法$uv$满足加法结合律、分配律,以及Clifford条件$\{u,v\}=uv+vu=2(u,v)=2u\eta v$,则$V_s$中全体元素所有可能的加法、数乘、乘积运算扩张生成Clifford代数$Cl(V,\eta)$;$\dim Cl(V,\eta)=2^{\dim V}$。
例:
对${\rm Spin}(p,q)$,其二重覆盖下述特殊正交群的一个单连通子群:
度规$\eta^{\mu\nu}$生成共$p+q$个Clifford基:$\{\gamma^\mu,\gamma^\nu\}=2\eta^{\mu\nu}1$;任意个Clifford基的乘积的线性组合构成的集合就是一个Clifford代数$Cl(p,q)$,$\dim Cl(p,q)=2^{p+q}$。可见只要任意给定一个不定平直度规的号差,就能生成一个Clifford代数。
Clifford 代数重要意义在于可以生成正交群的李代数:由Clifford基的对易子定义$S^{\mu\nu}=[\gamma^\mu,\gamma^\nu]\in Cl(p,q)$,满足
${f^{\mu\nu\rho\sigma}}_{\lambda\tau}$是$\mathfrak{spin}(p,q)=\mathfrak{so}(p,q)$的结构常数,于是$S$是$\mathfrak{so}(p,q)$的基矢($\mathfrak{so}(p,q)$是$Cl(p,q)$的子空间)。这样的$S$共$C_{p+q}^2=\dim\mathfrak {so}(p+q)$个。
根据前面的结论,$Cl(p,q)$代数的表示自然诱导$\mathfrak{so}(p,q)$的李代数表示,从而指数映射到${\rm Spin}(p,q)$的群表示,从而就是${\rm O}(p,q)$的连通子群的旋量表示。
例1:${\rm Cl}(3)$
${\rm SO}(3)$的旋量表示,是${\rm SU}(2)\simeq {\rm Spin}(3)$的基础表示,可由的Clifford代数$Cl(3)$的表示生成:
三维实空间$\eta=\rm diag(1,1,1)$,Clifford基$\sigma^1$、$\sigma^2$、$\sigma^3$,生成$Cl(3)$。显然从它们定义的3个$S^{ij}=[\sigma^i,\sigma^j]=2{\rm i} \epsilon^{ijk} \sigma_k$也是Clifford基之一,构成$\mathfrak{su}( 2 )$的基础表示。于是通过指数映射提升到${\rm SU}(2)$的基础表示${\rm e}^{ {\rm i} t\sigma^in_i}$,也就是${\rm SO}(3)$的旋量表示——Pauli旋量。若取$\sigma^i$的二维矩阵表示,就是Pauli矩阵。
例2:${\rm Cl}(3)$
$L^\uparrow_+={\rm SO}^+(1,3)$的旋量表示,是${\rm SL}(2,\mathbb C)\simeq {\rm Spin}(1,3)$的表示,可由Clifford代数{\rm Cl}(1,3)$的表示生成:
四维闵氏空间$\eta=\rm diag(1,-1,-1,-1)$,Clifford基取为$\gamma^0$、$\gamma^1$、$\gamma^2$、$\gamma^3$,生成$Cl(1,3)$。可以证明$S^{\mu\nu}=[\gamma^\mu,\gamma^\nu]$满足
正是洛伦兹代数的李括号,也就是生成了$\mathfrak{so}(1,3)$。进而通过指数映射提升到${\rm SL}(2,\mathbb C)\simeq {\rm Spin}(1,3)$的表示,即$L^\uparrow_+={\rm SO}^+(1,3)$有旋量表示:$\Lambda={\rm e}^{2 {\rm i} \omega_{\mu\nu}S^{\mu\nu}}$。
题外话:$\dim Cl(1,3)=16$,物理上习惯取其16个基矢分别为:$\mathbb 1$、$\gamma^\mu$、$\gamma^5=i\gamma^0\gamma^1\gamma^2\gamma^3$、$\gamma^\mu\gamma^5$、$\sigma^{\mu\nu}=\dfrac i2[\gamma^\mu,\gamma^\nu]$。它们决定了在洛伦兹变换下所有可能的场变换形式。这些基矢最低阶的忠实矩阵表示是四维表示。
一般结论
前面几个小节的内容,分别从代数结构和群结构两方面,研究得到了关于洛伦兹群的一些重要结论:
- 洛伦兹群${\rm SO}^+(1,3)$和它的二重覆盖群:旋量群${\rm Spin}(1,3)\cong{\rm SL}(2,\mathbb C)$具有相同的李代数$\mathfrak{so}(1,3)$,但是$\mathfrak{so}(1,3)$的表示一一对应于单连通的${\rm SL}(2,\mathbb C)$的表示,却只有一部分对应于洛伦兹群本身的表示——我们将这部分表示称为洛伦兹群${\rm SO}^+(1,3)$的真实表示,其真实表示空间中的元素称为广义上的矢量(这在物理上包含洛伦兹标量、矢量、张量等对象)。
- 而${\rm SL}(2,\mathbb C)$的“独有的”(与洛伦兹群真实表示不共享李代数表示)那些表示,在经典场意义下并不能视作洛伦兹群的表示,因为这本质上是一个双值同态映射。但是在量子理论下,由于量子态的相位自由度,可以引入“投影表示”的概念,从而${\rm SL}(2,\mathbb C)$中对应于洛伦兹群同一个元素的两个元素的表示:$\Phi(p)$与$\Phi(-p)$被投影为一个,在这个意义下可以视作洛伦兹群的表示——我们将这部分表示称为洛伦兹群${\rm SO}^+(1,3)$的投影表示,而${\rm SL}(2,\mathbb C)$表示空间中的元素就是相对于洛伦兹群的旋量。这也说明,“旋量”是只有在量子理论中才能被引入的概念。
- 注意到对于洛伦兹群${\rm SO}^+(1,3)$来说,它的真实表示+投影表示一一对应于其李代数$\mathfrak{so}(1,3)$,同时也一一对应于${\rm SL}(2,\mathbb C)$的全部表示,这导致两个结果:
- 洛伦兹群的任何表示(真实+投影)都可以用李代数$\mathfrak{so}(1,3)$表示的记号来标记;
- 即便是洛伦兹群的真实表示,也同构于${\rm SL}(2,\mathbb C)$的某些表示(的直积或直和)。
据此得到了研究洛伦兹群表示的方法。核心是:
- 洛伦兹代数的分解式$\mathfrak{so}(1,3)_{\mathbb C}\cong \mathfrak{su}(2)_{\mathbb C} \oplus \mathfrak{su}(2)_{\mathbb C}\cong\mathfrak{sl}(2,\mathbb C)_{\mathbb C}$说明,对于$\mathfrak{so}(1,3)_{\mathbb C}$的任何李代数表示(一一对应于其实形$\mathfrak{so}(1,3)$的任何表示),总可以用取非负半整数值的数对$(n,m)$来标记,这也可以用来标记洛伦兹群的全体表示,其表示维数是$(2n+1)(2m+1)$;
- 洛伦兹群的二重覆盖群${\rm Spin}(1,3)\cong{\rm SL}(2,\mathbb C)$的全体表示给出$\mathfrak{so}(1,3)$的全体表示,其中一部分是洛伦兹群的旋量表示,一部分则同构于它的真实表示。因此${\rm SO}^+(1,3)$的真实表示常常存在分解为旋量的分解式。
基于此,下面我们将会讨论几个常见的洛伦兹群的有限维表示。注意到我们要经常利用$\mathfrak{so}(1,3)_{\mathbb C}\cong \mathfrak{su}(2)_{\mathbb C} \oplus \mathfrak{su}(2)_{\mathbb C}$,这意味着我们在下面将会利用比较熟悉的$\mathfrak{su}(2)$的表示论,来构造$L^\uparrow_+$的不同表示。为此首先给出普遍的规律:设若两个$\mathfrak{su}(2)$的有限维表示分别为$D_n$、$D_m$,那么它们通过李代数直和关系$\mathfrak{so}(1,3)_{\mathbb C}\cong \mathfrak{su}(2)_{\mathbb C} \oplus \mathfrak{su}(2)_{\mathbb C}$给出的$L^\uparrow_+$表示应当是子表示的直积:
这意味着其表示空间也是两个子表示空间的直积;考虑$\mathfrak{so}(1,3)_{\mathbb C}$中的元素可以表示为$a_i J_+^i + b_j J_-^j$,于是它的表示矩阵应当具有如下形式:
或者用分量指标表示为:
这同时也给出了在表示$D_{(n,m)}$中洛伦兹生成元$J^i$、$K^i$的表示矩阵,与两个子表示生成元$J_\pm^i$在各自子表示下的表示矩阵之间的关系:
下面我们将会利用这些关系,来得到洛伦兹群的一些重要有限维表示。
洛伦兹群的常见有限维表示
下面,我们就用$\Lambda_{(\alpha)}$表示在洛伦兹群的$D_{(\alpha)}$表示下,洛伦兹变换$\Lambda$所对应的表示矩阵,即:
相应的生成元也采用类似的记法:
基础表示
洛伦兹群的基础表示,即是以其自身作为表示同态的像,基础表示空间就是洛伦兹变换的定义空间——四维闵氏时空$\mathbb R^{(1,3)}$,其表示对象就是四维时空坐标$x^\mu$。结合前面的讨论,四维坐标的洛伦兹变换为:
这也就是洛伦兹群的基础表示的表示矩阵,将其矩阵指标写出为:
这里$\mu,\nu,\rho,\lambda = 0,1,2,3$都是时空指标。从前面的讨论中知道,$J^{\rho\lambda}$是反对称的;在基础表示下,洛伦兹变换实现为四维正交矩阵${\Lambda^\mu}_\nu$,而其生成元也实现为四维矩阵${(J^{\rho\lambda})^\mu}_\nu$。可以显式地将正规正时洛伦兹变换包含的绕3个方向的旋转和沿3个方向的boost写出:
并且可以据此求出6个洛伦兹生成元的基础表示矩阵:
这六个生成元的基础表示矩阵也可以直接由四维反对称厄米矩阵的基得到。从中可以得到一个重要的结论:
空间旋转的三个生成元$J^i$是厄米的;而boost的三个生成元$K^i$是反厄米的;这导致:空间旋转变换是幺正的,而boost变换是非幺正的。这一点直接从洛伦兹变换矩阵中也可以看出。这是由于洛伦兹群是非紧的,我们事实上无法构造出有限维的幺正表示(对应于生成元的有限维厄米表示)。这一差别也将在讨论Dirac旋量的变换性质时扮演重要角色。
标量表示
洛伦兹群$L^\uparrow_+ = {\rm SO}^+(1,3)$最简单的、最低阶的表示就是它的一维平凡表示/单位表示。其表示空间中的元素在物理上对应于洛伦兹标量,因此也叫标量表示。
标量表示是一维表示,则其生成元也是一维的,满足条件的只有:
用李代数分解的符号记为$(0,0)$表示,这也是$\mathfrak{so}(1,3)$唯一的一维表示;显然,$L^\uparrow_+$的标量表示同构于的是${\rm SL}(2,\mathbb C)$的单位表示。此时洛伦兹变换的表示矩阵为:
这直接得到洛伦兹标量的洛伦兹变换律为:
即洛伦兹标量就是洛伦兹不变量。
Weyl旋量表示
$SL(2,\mathbb C)$本身存在两个不等价不可约的二维表示:以其自身作为表示对象的基础表示$\rho:M\mapsto M$,及其复共轭表示$\overline\rho:M\mapsto M^{*}$。这两个表示都是$L^\uparrow_+$的二维旋量表示,分别称为左手/右手Weyl旋量表示。表示空间中的元素就是左手/右手Weyl旋量:$\psi_L$、$\psi_R$,各有2个复分量。
从生成元是二维的这一条件出发,可以得到两种生成元取值的可能性。其中一种可能是:
从中解出:
其中$\sigma^i$是泡利矩阵,正是${\rm SU}(2)$的二维表示矩阵。这种可能对应的表示用符号记为$\left(\frac12,0\right)$表示,其表示矩阵显然为:
这就是左手Weyl旋量表示。
类似地,另一种生成元取值的可能性是:
从中解出:
这种情况对应的表示用符号记为$\left(0,\frac12\right)$表示,其表示矩阵为:
这是右手Weyl旋量表示。
我们也可以使用四维记号:$J^{ij} = \epsilon^{ijk}J_k$,$J^{0i} = K^i$,$\omega^{ij} = \epsilon^{ijk}\theta_k$,$\omega^{0i} = \eta^i$,于是:
其中$J_{L/R}^{ij} = {\epsilon^{ij} }_k J_{L/R}^k$,$J_{L/R}^{0i} = K_{L/R}^i$,分别是左手/右手Weyl旋量表示对应的洛伦兹生成元,其矩阵表示都是二维矩阵。
于是左右手Weyl旋量的变换为:
可见左右手Weyl旋量在洛伦兹变换下行为的区别仅在于boost生成元。将其用二分量旋量指标的形式写出为:
这里$\mu,\nu = 0,1,2,3$是时空指标,而$a,b = 1,2$是Weyl旋量指标。其中
复共轭表示
前面提过,左右手Weyl旋量作为${\rm SL}(2,\mathbb C)$的两个不等价不可约二维表示,是互为复共轭的。所谓复共轭表示是指,设(单)李群$G$存在某一表示$\rho$,在该表示下,生成元的表示是$T_{\rho}^a$,那么群元的表示为:
那么其复共轭表示$\overline\rho$将会给出:
因此互为复共轭的表示之间,生成元的表示关系为
这将会导致,若一个对象$u$属于群$G$的表示$\rho$,即是说它在$G$下的变换满足:
那么它的复共轭将会满足的变换是:
也就是说,属于表示$\rho$的对象,其复共轭将是属于复共轭表示$\overline\rho$的对象。
而厄米共轭只是在复共轭的基础上做一转置,也属于复共轭表示:
左右手Weyl旋量的共轭关系
洛伦兹生成元在左手Weyl旋量表示下为:
生成元在其复共轭表示下为:
注意到泡利矩阵的性质:
这里$\sigma^2 = \begin{pmatrix} 0 & -{\rm i} \\ {\rm i} & 0 \end{pmatrix}$指第二个泡利矩阵。于是就得到:
这是右手Weyl旋量表示的等价表示;反之,右手Weyl旋量的复共轭表示也得到左手Weyl旋量的等价表示。于是我们验证了这一重要结论:左/右手Weyl旋量(在等价意义上)互为复共轭表示。
其满足的无穷小洛伦兹变换律是:
利用性质$\sigma^2\sigma^2 = \mathbb I$,则在上式两边同时取复共轭并左乘$\sigma^2$,就有:
可见若$\psi_L$服从左手Weyl旋量表示,那么$\sigma^2\psi^{*}_L$服从的是右手Weyl旋量表示。习惯上我们取变换矩阵是实的,于是将这一右手Weyl旋量取为:
同理,若$\phi_R$服从右手Weyl旋量表示,那么我们可将对应的左手Weyl旋量表示取为:
我们将两者选取差一负号,是注意到这样的事实:若记$\psi_R = {\rm i}\sigma^2\psi^{*}_L$,它是一个右手旋量,那么可以得到关系:$\psi_L = -{\rm i}\sigma^2 \psi^{*}_R$,这是一个左手旋量。
范德瓦尔登记号
一直利用角标$L/R$来区分左右手旋量,不仅在记号上不太方便,在某些情况下(尤其是超对称等理论中)也不能够反映其背后的物理。因此我们特别引入关于Weyl旋量的范德瓦尔登记号。
Dotted & Undotted
考虑一个左手Weyl旋量,可以表示成旋量空间中的二分量对象;习惯上表示为列向量,我们用下指标$a=1,2$来表示左手旋量的分量指标,即$\xi_{a}$:
右手旋量与之类似,也是旋量空间中的二分量对象。
但是在超对称等经常处理旋量的理论中,习惯上采用范德瓦尔登记号:
- 左手旋量默认用不带点(undotted)的下指标$a,b,\cdots$表示,视作旋量空间的二分量列向量;
- 右手旋量默认用带点(dotted)的上指标$\dot a,\dot b,\cdots$表示,并且习惯上取成有$\dagger$的,视作旋量空间的二分量列向量。
这样定义的好处,在后面会看到。于是一个典型的右手旋量就是:
根据前面的讨论,${\rm i}\sigma^2\psi_L^{*}$是右手旋量,$-{\rm i}\sigma^2\phi_R^{*}$是左手旋量,即左右手旋量之间总是差一个$\varepsilon={\rm i}\sigma^2$,其具体取值为:
事实上这就是2维Levi-Civita符号。下面我们来简单讨论它的性质。
在后面“投影张量”相关的讨论中将会看到,它的角色类似于度规,可以收缩同手性的Weyl旋量指标,例如:
为此我们可以形式化定义左手旋量指标的升降由$\varepsilon^{ab}$来完成:
此外,还约定指标在下的2维Levi-Civita符号$\varepsilon_{ab}$满足:
其具体取值为:
不难验证:
与之类似,右手旋量指标的升降定义为:
因此在旋量空间中,2维Levi-Civita符号具有升降旋量指标的功能。
回到引入$\varepsilon^{ij}$引入的动机,最初是在旋量手性改变的式子中:
可见若从指标升降角度来看,一个左手旋量的复共轭,相当于一个被降指标的右手旋量,两者的变换行为应当相同;再若将旋量视作矩阵,那么复共轭于厄米共轭的变换关系是一致的,于是用范德瓦尔登记号写出为:
这是一个右手旋量;反之用一个右手旋量取厄米共轭,结果亦然:
这是一个左手旋量。这表明,对一个旋量做复共轭,其手性指标也要转换。因此我们关于范德瓦尔登记号的规则是:
- 一个左手旋量,总是undotted & undagger;
- 一个右手旋量,总是dotted & dagger;
- 复共轭$*$、厄米共轭$\dagger$操作,会改变旋量的手性;
- 2维Levi-Civita符号$\varepsilon^{ij}$或$\varepsilon_{ij}$,可以升降旋量指标,但不会改变手性。
相同手性旋量指标缩并
下面考虑Weyl旋量的分量结构。以左手旋量为例,按照习惯将其视作列向量:
但是$\varepsilon^{ab}$并不能简单视作一个矩阵。要看出这一点,考虑两个相同手性的旋量指标收缩运算:
假如升指标的左手旋量$\xi^a$仍是一个列向量,那么这样的运算不能用矩阵相乘来表示,不能令我们满意。具体来说,我们希望$\varepsilon^{ab} \xi_a = {\rm i}\sigma^2 \xi$是一个二分量的行向量,这样就可以将指标缩并表示为行向量右乘列向量得到一个标量 ;注意到:
按照$\psi_R^{*} = {\rm i}\sigma^2 \psi_L$,这应该是一个右手旋量取厄米共轭的形式。我们希望它是旋量空间中的一个二分量行向量,即:
这样指标缩并运算就可以写成:
可见这样约定的好处。
与之类似,我们也将右手旋量约定为:
并且给出旋量指标缩并运算规则:
将$\xi_a$、$\chi^{\dagger,\dot a}$视作二分量列向量;将$\xi^a$、$\chi^\dagger_{\dot a}$视作二分量行向量,指标缩并约定只有最近邻指标上下重复才缩并,按照此约定排序后可以表示成矩阵相乘。
符号$\varepsilon^{ij}$或$\varepsilon_{ij}$与旋量交换位置,会产生一负号,例如:
因此我们约定符号$\varepsilon^{ij}$或$\varepsilon_{ij}$总是从左边作用于旋量。
重复旋量指标缩并,左上-右下方式和左下-右上方式缩并,会差一负号,例如:
因此我们约定,对于不带点的左手指标,按照“左上-右下”方式;对于带点的右手指标,按照“左下-右上”方式缩并。
利用$\varepsilon^{ij}$或$\varepsilon_{ij}$,只能对相同手性的指标进行缩并。
旋量分量都是Grassmann数,因此两旋量的分量交换,会产生一负号;但是两旋量缩并运算对于交换是不变号的,即:
这对$\chi^\dagger \eta^\dagger = \eta^\dagger \chi^\dagger$也是成立的。此即旋量内积具有对称性。
旋量内积取复共轭,等于旋量交换顺序后分别取厄米共轭再做内积;但是注意到两旋量的内积具有对称性,因此:
不同手性旋量指标的缩并
2维Levo-Civita符号只能缩并相同手性的指标,因为它们所携带的两个指标都是同种类型。要想缩并不同手性的指标,需要引入同时携带一个左手和一个右手旋量指标的量:
它们的性质,我们之后再详细讨论。缩并时,将它们置于一左手一右手旋量之间;在这里用没有横线的$\sigma$,左边是左手旋量指标,右边是右手旋量指标;用有横线的$\overline\sigma$,左边是右手旋量指标,右边是左手旋量指标。且为满足前述的不带点指标左上-右下缩并、带点指标左下-右上缩并,因此$\sigma$的两个旋量指标都在下标,$\overline\sigma$的两个旋量指标都在上标。
在后面投影张量一节将会看到,这些带有两种旋量指标的量实际上就是:
它们的每个分量都是$2\times 2$的矩阵。这些构造的旋量指标收缩为:
对于这类型的量取复共轭,就不再有两旋量内积的交换对称性了:
特别地,有如下两个恒等式:
矢量表示
$L^\uparrow_+$存在唯一的四维不可约表示,也是最低阶忠实表示,即以其自身为表示的基础表示。表示空间的元素即洛伦兹矢量,因此也称矢量表示。
由于矢量表示作为$L^\uparrow_+$的真实表示,与${\rm SL}(2,\mathbb C)$的某个表示是同构的,因此可以期望用${\rm SL}(2,\mathbb C)$的基础表示——Weyl旋量表示通过张量积构造$L^\uparrow_+$的矢量表示(以及其他更高维的表示)。
为了说明这一点,我们先不直接给出洛伦兹群矢量表示的自然形式,而是遵循前面利用李代数的分解结构来讨论的方式。满足4维不可约表示的量子数组合只有$\left(\frac12,\frac12\right)$,这对应于:
从中解出:
需要注意,在这种表达形式下,相当于我们为表示$D_{(1/2,1/2)}$选取了一组基,是四维表示空间$M\otimes M^{*}$的自然基底$e^a \otimes e_{\dot a}$,其中$e^a$和$e_{\dot a}$分别是左手Weyl旋量、右手Weyl旋量表示的自然基底。
这种构造相当于,各取一个左手和右手Weyl旋量做张量积:
此时洛伦兹群的矩阵表示自然也就是左/右手Weyl旋量表示的直积:
到此,原则上已经给出了$\left(\frac12,\frac12\right)$表示的具体形式。但是我们希望找到它与矢量表示之间的关系;因此考虑让左手旋量$\psi_L$转置,于是张量积表示为:
这仅仅是重排了对象的四个分量,并未改变任何实质的关系,$\varphi_{LR}$承载的仍然是洛伦兹群的$\left(\frac12,\frac12\right)$表示,只不过此时该表示的变换形式为:
注意到利用$\sigma^2$的性质,可以定义一个变换性质更好的量:
其满足变换为:
其中
这里$\varphi$承载的仍然是洛伦兹群的$\left(\frac12,\frac12\right)$表示。
做这样形式变换的目的是为了给出左右手旋量张量积与洛伦兹矢量之间的关系。分析左右手旋量张量积的矩阵元(下面$\overline\sigma^\mu=(I,-\boldsymbol\sigma)$,$\sigma^\mu=(I,\boldsymbol\sigma)$):
这其中利用了$\sigma^\mu$的完备性关系:
这一性质来源于$\sigma^\mu=(I,\boldsymbol\sigma)$构成$2\times 2$复矩阵的基的事实,即任何$2\times 2$复矩阵都可以表示为$I$和$\sigma^i$的线性组合的形式。
于是我们可以定义一个4-分量的对象:
这样$\psi_L\otimes\phi_R = V^\mu \overline \sigma_\mu$的矩阵结构对应于:
这里$\psi_L\otimes\phi_R$利用前面论证过的变换规律:
可以得到对象$V^\mu$(此时还不能确认它是洛伦兹矢量)的四个分量满足的无穷小洛伦兹变换关系:
使用四维记号:$\omega^{ij} = \epsilon^{ijk}\theta_k$,$\omega^{0i} = \eta^i$,上面的变换关系实际上相当于:
这里$\mu,\nu,\rho,\lambda = 0,1,2,3$都是时空指标。其中
不难验证,$(J_V^{\rho\lambda})^{\mu\nu}$恰好满足洛伦兹群生成元的对易关系——洛伦兹代数,并且简单计算可得,$(J_V^{\rho\lambda})^{\mu\nu}$作为四维表示的生成元表示矩阵,与洛伦兹群基础表示的生成元矩阵$J^i$、$K^i$是相同的。这表明,四分量的对象$V^\mu$的洛伦兹变换规律与四维时空坐标$x^\mu$是相同的,我们把这样的对象称为洛伦兹矢量,相应的洛伦兹群表示称为矢量表示。
据此,我们证明了,通过左右手Weyl旋量张量积构造出来的四分量对象$V^\mu=\psi_L\sigma^\mu\phi_R$正是洛伦兹矢量,它和四维时空坐标$x^\mu$的洛伦兹变换律是相同的(通过同构映射$\rho:M\to\mathbb H(2,\mathbb C)$,$x_\mu\mapsto x_\mu\sigma^\mu$)。这一结论可记为:
此时的$L^\uparrow_+$矢量表示是:
若将矢量对象$V^\mu$的时空指标也显式写出则为:
洛伦兹矢量变换规律是:
这实际上是说,$\Lambda_{LR}$和$\Lambda_{\left(\frac12,\frac12\right)}$是洛伦兹群的两个等价四维不可约表示:
这种从$\Lambda_{LR}$换到$\Lambda_{\left(\frac12,\frac12\right)}$的改变,从表示空间的构造上来说,其实相当于是将自然基底$e^a \otimes e_{\dot a}$换成另一个基底:
这也是我们更常用的四维表示$D_{(1/2,1/2)}$的基。
此外,两个左手或两个右手Weyl旋量的张量积也可以构造一些量,例如${\rm i}\psi_L^\dagger\overline\sigma^\mu\psi_L$、${\rm i}\phi_R^\dagger\sigma^\mu\phi_R$,即$(1/2,0)\otimes(1/2,0)=(0,0)\oplus(1,0)$,$(0,1/2)\otimes(0,1/2)=(0,0)\oplus(0,1)$。
观察矢量表示的生成元,由于$J^i$本身形成一个子代数$\mathfrak{so}(3)$,这意味着洛伦兹群的$\left(\frac12,\frac12\right)$表示可以再按照${\rm SO}(3)$群表示分解;回顾矢量分量的变换,我们只关心它在空间旋转变换下的行为:
可以看到,其第0分量$V^0$在洛伦兹群的子群${\rm SO}(3)$下按照平凡表示——单态表示变换,而空间分量$V^i$按照三重态表示变换,这意味着表示存在类似于直和分解的形式:
这两部分的表示分别对应于自旋0和自旋1,因此可以说矢量场是具有自旋0和自旋1分量的。
张量表示
一旦有了矢量表示,那么张量表示也很容易构造,因为张量可以直接由矢量通过张量积得到。我们在这里只讨论二阶张量。
(待补充)
Dirac旋量表示
再来考虑$SL(2,\mathbb C)$的其他四维表示。
前面已经得到了洛伦兹群的左手/右手Weyl旋量表示。但是注意到左/右手Weyl旋量分别都不是确定宇称的(即不是宇称变换的本征态),在空间反射变换(宇称变换)下,左右Weyl旋量会变为右手的,反之亦然。因此物理上很多具有确定宇称的体系是不能用它们来描述的。
是否存在确定宇称的态,仍保持一定的旋量性质?最直接的构造就是将两个不等价的二维Weyl旋量表示直和,这样就可以得到新的四维可约表示——Dirac旋量表示,符号记为:
这样得到Dirac旋量$\psi=\psi_L\oplus\phi_R$,有4个复分量;由于它同时具有左手和右手分量,因而是确定宇称态。此时$L^\uparrow_+$的Dirac旋量表示就是:
相应狄拉克旋量的洛伦兹变换律为:
若我们更一般地,将Dirac旋量用4分量的形式来表示:
为了将四维矩阵$\Lambda_D$写为洛伦兹生成元指数映射的形式:
这里$\mu,\nu = 0,1,2,3$是时空指标,而$a,b = 1,2,3,4$是Dirac旋量指标。这相当于要为洛伦兹生成元$J_D^{\mu\nu}$在Dirac旋量空间中找到合适的四维表示。根据旋量直和关系,显然有:
于是Dirac旋量的洛伦兹变换律为:
我们可以用 另一种更紧凑的方式来表达$J_D^{\mu\nu}$。利用后面的讨论将会知道,两个Dirac旋量乘积得到洛伦兹不变量的投影张量(即$\Big((1/2,0) \oplus (0,1/2)\Big) \otimes \Big((1/2,0) \oplus (0,1/2)\Big)$到$(0,0)$的投影张量)是:
其中Dirac-$\gamma$矩阵定义为:
关于这些矩阵的构造,在后面再进行讨论。这里不难验证,Dirac旋量表示下的洛伦兹生成元$J_D^{\mu\nu}$正是:
因此这就给出了洛伦兹变换的Dirac旋量表示为:
洛伦兹群的无限维表示(场表示)
现在已经讨论了洛伦兹群的许多有限维表示,他们对应于在洛伦兹变换下行为不同的各种对象,这些在物理上已经足够了。但是要提醒的是,在经典场论中我们研究的对象不是这些单个的对象,而是在四维时空中的场,后者属于洛伦兹群的无限维表示。在这一小节我们要研究的问题是,对于特定表示$D_{(\alpha)}$下的对象$\Phi_{(\alpha)}$,其在时空中连续分布形成场$\Phi_{(\alpha)}(x)$,其服从的洛伦兹变换为:
那么这种变换所对应的洛伦兹群无穷维表示的结构如何?
根据前面的讨论,这等价于我们首先要寻找洛伦兹群的场表示$D_{\rm f}$。它的作用是:
即洛伦兹群的场表示仅作用于场的坐标变换。考虑到坐标变换属于洛伦兹群的基础表示:
其中${(J^{\rho\lambda})^\mu}_\nu$是洛伦兹生成元的基础表示。另一方面,我们也将场表示写为生成元指数映射的形式:
在无穷小变换下:
其中$(J^{\rho\lambda})^{\mu\nu} = {\rm i}\left( g^{\rho\mu} g^{\lambda\nu} - g^{\rho\nu} g^{\lambda\mu} \right)$是洛伦兹群基础表示的生成元,那么就可以得到:
此即洛伦兹群生成元的场表示。于是相应的洛伦兹变换的场表示为:
这也就得到了对应于有限维表示$D_{(\alpha)}$对象$\Phi_{(\alpha)}$的场$\Phi_{(\alpha)}(x)$的无穷维表示是:
子群${\rm SO}(3)$;自旋
我们在第一节曾经简单地讨论过经典场在洛伦兹变换下得到的守恒流和守恒荷,在那里对应于空间旋转变换的守恒荷,我们解释为场的轨道角动量。但是那里我们其实只是讨论了一个非常简单的例子,即标量场。
现在我们讨论了洛伦兹群的更多表示,对应于更多类型的物理对象。因此需要再次考虑这些更一般的场在洛伦兹变换下得到的守恒流和守恒荷。考虑一个任意的无穷维表示:
计算其在该洛伦兹变换下的守恒流,为:
其守恒荷就是:
我们在这里特别关心空间旋转群${\rm SO}(3)$变换下的守恒荷,即系统的总角动量:
其中,第一部分:
与第一章中得到的结果相同,它就是场的轨道角动量,其来源于场作为时空中的分布,在时空中运动而产生的。显然,轨道角动量与场具体属于何种类型是无关系。
而第二部分:
仅仅与有限维表示部分的生成元$J_{(\alpha)}$有关,可见这一部分的值对于不同表示的对象是不同的。并且它也不涉及场在时空中的运动,因而这一部分仅仅与场自身的结构有关,我们把它称为场的自旋角动量。可以说,自旋是在洛伦兹分类意义下非标量类型的场所具有的额外角动量。
自旋的存在引导我们特别关注场的有限维表示对象在空间旋转作用下的行为。
注意到洛伦兹群$L^\uparrow_+$天然具有子群:三维空间转动群${\rm SO}(3)$,其空间旋转部分的三个生成元$J^i$构成${\rm SO}(3)$的生成元,也是李代数$\mathfrak {so}(3)$的自然基;boost部分的三个生成元$K^i$则不能构成封闭的代数,自然也不构成子群的生成元。因此在讨论各种不同类型对象的洛伦兹变换时,关注其在${\rm SO}(3)$作用下的变换行为是很自然的想法。
注意到群的任何表示,一定是其子群的表示,因此前面讨论的洛伦兹群的所有表示都是${\rm SO}(3)$的表示;当然,大群的不可约表示不一定是子群的不可约表示。注意到空间旋转变换的表示为:
形式上看,在仅考虑${\rm SO}(3)$空间旋转变换时,洛伦兹群的表示$D$可被视作两个${\rm SO}(3)$表示的合成;因此我们可以根据两角动量耦合的普遍理论,将该表示分解为若干${\rm SO}(3)$的不可约表示的直和:
这里用上标区分了不同李群的表示。这样的分解给出了在空间旋转变换下,特定类型表示所具有的不同成分。这些不同的成分在空间旋转变换下会反映出不同的性质。
在量子化之后将会看到,若某种洛伦兹群表示分解出的${\rm SO}(3)$表示维数为$(2s_1+1),(2s_2+1),\cdots$,就说该表示下的对象具有$s_1,s_2,\cdots$的自旋分量,他们对对应于量子化后量子场所能够激发出粒子的自旋。
构造拉格朗日量
我们已经对洛伦兹群的各种有限维表示,及其结合场表示形成的无穷维表示做了比较充分的讨论。下一步,为了完成对经典场论的构造,我们希望利用这些不同的表示来构造洛伦兹不变量——拉格朗日量。
因此现在要开始考虑这样的可能性:是否可以将若干洛伦兹群的表示进行直积——物理上对应于场的耦合——来得到属于标量表示$(0,0)$的对象?
投影张量
注意到我们在明确不同类型的场之后,一个重要任务是利用各种场量——例如$\psi$、$\phi$——的乘积,来构造合适的拉格朗日量,而后者是洛伦兹不变量。因此,对于不同的洛伦兹群表示,需要一种普遍方法构造出在洛伦兹变换下不变的对象,也就是洛伦兹平凡表示$D_{(0,0)}$的对象。
若我们构造拉格朗日量所使用的场$\psi$、$\phi$分别按照表示$D_1$、$D_2$进行变换,即:
那么它们的乘积按照直积$D_1\otimes D_2$表示进行变换:
我们希望它们的某种线性组合$C_{ia}(\psi^i \phi^b)$构成洛伦兹不变量,这也就是说希望找到一组特定的系数$C_{ia}$,能够使组合$C_{ia}(\psi^i \phi^b)$按照平凡表示$D_{(0,0)}$进行变换。但是另一方面,$(\psi^i \phi^b)$的任何线性组合(包括其本身)又必然是$D_1\otimes D_2$表示空间中的元素,因此要想能够构造出洛伦兹不变量,就必然要求$D_1\otimes D_2$表示空间存在一个洛伦兹平凡表示$D_{(0,0)}$的不变子空间,或者说,$D_1\otimes D_2$可以通过直和分解来约化出一个平凡表示$D_{(0,0)}$:
而这样的约化方式由特定的系数$C_{ia}$刻画,换句话说只有特定的系数$C_{ia}$来进行线性组合才能得到平凡表示子空间中的元素,称$C_{ia}$为投影张量;它并不是一个真正的张量,只是可以从两个表示的直积空间中约化投影出平凡表示空间。由于它们只是一组线性组合系数,因此$C_{ia}$本身是洛伦兹不变的数。
按照定义,投影张量需要满足:
即
更广义的投影张量是指从多个表示的直积$D_1\otimes\cdots\otimes D_n$中约化投影出某个不可约表示$D_{\rm irre}$,那么此时的投影张量满足:
直积表示的Clebsch-Gordon分解
按照在投影张量一节中的讨论,要想让某种表示构造可以成为洛伦兹不变量,其所在的表示空间必须包含一个$(0,0)$表示的子空间,即该表示的直和分解中存在一个$(0,0)$表示。
标量本身属于$(0,0)$表示,任何标量的耦合仍然属于$(0,0)$表示。但是除它之外的表示就没有这么简单,即便是最简单的Weyl旋量表示,单个的Weyl旋量表示是不可约的,因此要得到洛伦兹不变量只能通过考虑令若干个Weyl旋量表示进行耦合——数学上对应于它们的直积,我们试图从中寻找投影到$(0,0)$表示的方式。
在场论的观点看来,高于或等于三个场量的耦合,描述的是它们之间的相互作用,而只有单个场量与自己的耦合,才是构造自由场拉格朗日量的砖石。因此在这里我们首先仅考虑自由场的简单情况,即只用两个相同的洛伦兹群表示的直积来构造洛伦兹不变量。
如何寻找到两个表示直积的直和分解?
$\mathfrak{su}(2)$表示的Clebsch-Gordon分解
$\mathfrak{su}(2)$的两个表示的直积理论我们已经很熟悉了,这在物理上的一个实例就是两个角动量的耦合,它可以通过Clebsch-Gordon分解为不可约表示的直和。$\mathfrak{su}(2)$代数的一个经典的Clebsch-Gordon分解是:
即两个自旋$1/2$耦合会得到单态和三重态。
对于更一般的耦合,$(s_1)\otimes(s_2)$存在直和分解:
因此,我们可以考虑从直积表示$(s_1)\otimes(s_2)$向某个子表示$(s)$的投影,即利用一组特定的系数——投影张量——来将属于直积空间中的对象$\ket{s_1,s_2;m_1,m_2}$线性组合出一个属于$(s)$表示的对象。用狄拉克符号可以写成熟悉的形式:
其中$\mathfrak{su}(2)$表示的投影张量$C^{s,m}_{s_1,s_2;m_1,m_2} = \braket{s_1,s_2;m_1,m_2}{s,m}$就是所谓Clebsch-Gordon系数。
洛伦兹群表示的Clebsch-Gordon分解
注意到洛伦兹群表示$(n,m)$本身可以视作两个$\mathfrak{su}(2)$表示的直积:$(n,m) = (n)\otimes(m)$。那么对于两个洛伦兹群表示的直积,我们可以交换直积的顺序:
这两个$\mathfrak{su}(2)$在数学上没有区别,但是分别对应于洛伦兹群表示$(n,m)$的第一个量子数和第二个量子数,因此是需要进行区分的。这里我们分别用下角标$+$、$-$来区分两个$\mathfrak{su}(2)$代数各自的表示。在等式最右端,每个方括号内都是同一个$\mathfrak{su}(2)$的两个表示的直积。
因此我们要对两个洛伦兹群表示的直积做直和分解,就可以先对两个$\mathfrak{su}(2)$各自表示的直积分别做Clebsch-Gordon分解,再将结果进行直积。
数学记号更直观一些,在前面我们已经将洛伦兹群两个表示的直积$(n,m)\otimes(n’,m’)$,分解为第一个$\mathfrak{su}(2)$的两个表示的直积$[ (n)\otimes(n’) ]_+$,与第二个$\mathfrak{su}(2)$的两个表示的直积$[ (n)\otimes(n’) ]_-$,两者的直积。而两个$\mathfrak{su}(2)$内部分别可以做Clebsch-Gordon分解,将分解出的不可约表示再组合成为洛伦兹群表示,就得到了洛伦兹群表示的Clebsch-Gordon分解:
以$(1/2,1/2)\otimes(1/2,1/2)$为例:
上式是一个重要结论,它对应于两个矢量表示直积的直和分解。
将两个表示的直积进行直和分解后,若其可以约化出一个$(0,0)$表示,就说明一定存在合适的投影张量,使得我们可以用这两个表示的对象构造出洛伦兹不变量。而根据洛伦兹代数$\mathfrak{so}(1,3)$与$\mathfrak{su}(2)$之间的直和关系,那么洛伦兹群的投影张量理应可以用$\mathfrak{su}(2)$的投影张量来得到。
我们假设两个$\mathfrak{su}(2)$分别投影到子表示$(s_+)_+$、$(s_-)_-$的投影张量分别为$N^{\alpha_+}_{i_+a_+}$、$M^{\alpha_-}_{i_-a_-}$,那么洛伦兹群表示的直积$(n,m)\otimes(n’,m’)$投影到$(s_+,s_-)$的投影张量,就可由子投影张量构造得出:
标量表示构造
正如前面所言,标量本身属于$(0,0)$表示,任何标量的耦合仍然属于$(0,0)$表示。
因此对于两个标量,要构造拉格朗日量,一种显而易见的项是:
事实上,这也是两个标量本身(不包含其导数项)所能构造的唯一的洛伦兹不变量。
Weyl旋量表示构造
我们遵循前面的方法,考虑两个Weyl旋量进行耦合,得到:
从前两个式子可见,两个左手Weyl旋量耦合,或两个右手Weyl旋量耦合,其直和分解都包含平凡表示,于是投影到$(0,0)$表示的投影张量是存在的。而第三个式子就是前面已经见到过的,左手和右手Weyl旋量表示直积得到矢量表示。
注意到在$\mathfrak{su}(2)$表示中,$(1/2)\otimes(1/2)$到$(0)$的投影张量就是简单的2维Levi-Civita符号:
而$(0)\otimes(0)$到$(0)$的投影张量就是单位$1$。于是对于两个左手Weyl旋量耦合,其到洛伦兹不变量的投影张量也就正是携带两个undotted旋量指标的2维Levi-Civita符号:
这样由两个左手Weyl旋量构造的项都是洛伦兹不变量。与之类似,两个右手Weyl旋量耦合投影到洛伦兹不变量的投影张量也是2维Levi-Civita符号,但是其携带的两个旋量指标是dotted的:
这样由两个右手Weyl旋量构造的项也都是洛伦兹不变量。
总结一下,两个同手征旋量的指标完全缩并后得到纯数,即洛伦兹不变量:
或用更简单的记号记为
同理${\rm i}\psi_R^T\sigma^2\phi_R=\psi_L^\dagger\phi_R$也是洛伦兹不变量。但形如$\psi_R^\dagger\phi_R$的则不是不变量,因为根本没有相同指标可以缩并。
矢量表示构造
前面作为例子,已经得到两个矢量耦合的情况:
这说明也一定存在矢量表示的投影张量,能够用两个洛伦兹矢量构造出洛伦兹标量。但是直接由两个左/右手的2维Levi-Civita符号构造出的投影张量,事实上是在自然基底$e^a \otimes e_{\dot a}$下的形式;而对于矢量表示,我们更习惯的是在基底$(\sigma^\mu)_{a \dot a} e^a \otimes e^{\dot a}$下的形式。
因此可以直接从洛伦兹矢量本身的性质出发开始考虑,注意到洛伦兹变换保持度规不变的性质,立即可以验证,两个矢量表示耦合的投影张量正是闵氏时空的度规$g_{\mu\nu}$:
这就是两个矢量耦合所能够构造出的洛伦兹不变量。
Dirac旋量表示构造
Dirac双线性标量
同样进行两个Dirac表示直积的直和分解:
两个$(0,0)$表示,分别来自于两个左手部分的直积,和两个右手部分的直积,它们的投影张量分别是$\varepsilon^{ab}$和$\varepsilon^{\dot a\dot b}$;写在如下的Dirac旋量:
就得到两个投影张量:
但是若直接采用这两个投影张量,得到的结果与Weyl旋量相同。我们希望构造的洛伦兹不变量同时包含Dirac旋量的左右手成分,因此考虑这两个$(0,0)$表示的线性组合,即将这两个投影张量作加减,得到两个新的矩阵:
这两个也是投影张量,分别给出洛伦兹不变量:
其中
第一项$\psi^T \mathcal C \psi$实际上是Majorana质量项的构造方式。但是在物理上,若以$\psi$和$\psi^T$作为基本场变量,则这两个项不能满足费米子数守恒,因此也不是我们想要的。必须选取另外的场量作为基本场变量,例如$\psi$和$\psi^\dagger$。为了用这两者构造出合适的耦合方式,需要详细讨论$\psi$及$\psi^\dagger$所属的表示;前者已经知道是$(1/2,0)\oplus(0,1/2)$表示。后者用Weyl旋量写为:
显然,$\psi^T = \psi^\dagger \mathcal E$,其中
于是可以考虑这样的项:$\psi^\dagger \mathcal E \mathcal C \psi$、$\psi^\dagger \mathcal E \mathcal C \gamma^5 \psi$。为此定义
其中$\overline\psi$称为$\psi$的Dirac共轭旋量。我们用$\psi$和$\overline\psi$即可构造出合适的项:
这样得到的就是Dirac旋量拉格朗日量中常用的洛伦兹不变量,它们两者之间的差别在于在空间反射变换下的行为不同。从$\psi^\dagger$的定义中可以看到,$\beta$扮演的角色非常重要;事实上可以用它除了可以定义旋量的共轭,还可以定义一种$4\times4$矩阵的共轭(其中$\gamma^\mu$将在下一节引入):
此外,矩阵$\gamma^5$的另一个作用是定义投影算符,可以将Dirac旋量的左/右手部分分解出来:
这样投影出来的结果分别只具有纯粹的一种手性分量。
Dirac双线性矢量
前面从两个Dirac旋量表示的直积$[(1/2,0)\oplus(0,1/2)] \otimes [(1/2,0)\oplus(0,1/2)]$,讨论了分解出的两个$(0,0)$表示。现在讨论另外两个$(1/2,1/2)$表示。
遵循上一节的讨论,我们仍尝试用$\overline\psi$、$\psi$来构造。从直积的直和分解过程来看,这两个$(1/2,1/2)$来自于两个Dirac旋量分别取一个左手和一个右手部分。这样得到的投影张量就是$\sigma^\mu_{a\dot a}$、$\overline\sigma^{\mu \dot a a}$。此外还需要一些Levi-Civita符号来升降指标,最后得到投影张量为:
它们需要夹在$\psi^T$和$\psi$中间得到两个矢量表示的对象。为了把基本场变量换成$\overline\psi$,在这两个矩阵左乘$\mathcal C^{-1} = -\mathcal C$:
于是就能得到用$\psi$和$\psi^\dagger$构造的矢量表示:
这里引入了Dirac-$\gamma$矩阵:$\gamma^\mu$,满足反对易关系
并且存在一个关系:
它与其余$\gamma^\mu$的反对易关系是
Dirac双线性张量
最后考虑从$[(1/2,0)\oplus(0,1/2)] \otimes [(1/2,0)\oplus(0,1/2)]$中分解出的最后两个$(0,1)$、$(1,0)$表示。
遵循上一节的讨论,我们仍尝试用$\overline\psi$、$\psi$来构造。
(待补充)
Dirac双线性协变量
至此将两个Dirac旋量耦合得到的全部不可约表示对象都讨论过了,一共16种:
type | construct | independent number |
---|---|---|
Scalar | $\overline\psi \psi$ | 1 |
Vector | $\overline\psi \gamma^\mu \psi$ | 4 |
Tensor | $\overline\psi \sigma^{\mu\nu} \psi$ | 6 |
Axial Vector | $\overline\psi \gamma^\mu \gamma^5 \psi$ | 4 |
Pseudo Scalar | $\overline\psi \gamma^5 \psi$ | 1 |
注意到:
构成$4\times4$矩阵的16个基,因此上述这些不可约表示也构成一组完备基,能够将所有双线性型$\overline\psi \Gamma \psi$进行展开。将这组基稍作修改为:
得到正交归一基底,其中任意矩阵$\Gamma^a$满足:
且有Fierz恒等式:
其中线性组合系数:
导数算符——场的动能项
有必要讨论一个特殊的构造:造场论中,时常会用到导数算符作用于场本身的项;在场论观点看来,导数算符的存在反应了场本身的动力学性质。前面我们在使用标量、Weyl旋量和矢量构造洛伦兹不变量时,都没有使用导数算符,因此在那里构造出的项不能表示场本身的动力学。
由于导数算符$\partial^\mu$与洛伦兹矢量$A^\mu$类似,都携带一个时空指标,因此我们将导数算符也视作一个矢量对象,它所属于的表示也是$(1/2,1/2)$。导数算符参与构造洛伦兹不变量的方法与一般的矢量是类似的。因此我们立即可以构造出如下的洛伦兹不变量:
第一项是两个标量场的导数的耦合,它反映的是标量场的动力学。
第二项的基础是导数算符本身与它所作用的矢量场进行指标收缩,但如果只是一个单一的$\partial_\mu A^\mu$,其实只存在一个真实的场量$A^\mu$,并且是一个全微分项,不进入真实的动力学方程。因此形如$\partial_\mu A^\mu$这样的构造在进入拉格朗日量时至少是两项相乘形式存在的。
第三项则是更一般的指标收缩方式,它反映的是矢量场的动力学,事实上它描述的就是矢量场的动能。
旋量场的动能项
为描述旋量场的动能项,也需要引入导数算符,而在上一节已经讨论过,导数算符属于的表示是$(1/2,1/2)$;我们可以考虑这样一种表示直积结构,即为两个相反手性的Weyl旋量引入一个导数算符,例如让导数算符作用在其中一个Weyl旋量上,此时的表示为:
由于前面看到,$(1/2,0)\otimes(0,1/2)=(1/2,1/2)$,而$(1/2,1/2)\otimes(1/2,1/2)$包含一个$(0,0)$,因此$(1/2,0)\otimes(0,1/2)\otimes(1/2,1/2)$也是包含$(0,0)$的,从而可以构造洛伦兹不变量。
我们已经知道,$(1/2,1/2)\otimes(1/2,1/2)$到$(0,0)$的投影张量就是时空度规$g_{\mu\nu}$,于是要研究的目标就是$(1/2,0)\otimes(0,1/2)$到$(1/2,1/2)$的投影张量。
考虑到$\mathfrak{su}(2)$的表示:$(1/2)\otimes(0)$到$(1/2)$的投影张量就是Kronecker符号$\delta^b_a$,因此洛伦兹群表示:$(1/2,0)\otimes(0,1/2)$到$(1/2,1/2)$的投影张量是:$\delta^b_a \delta^{\dot b}_{\dot a}$。再次考虑到矢量表示的常用基底,利用$\sigma^\mu_{b \dot b}$做变换将投影张量取为:
此即$(1/2,0)\otimes(0,1/2)$到$(1/2,1/2)$的投影张量。
于是,利用$\sigma^\mu_{a \dot a}$和$g_{\mu\nu}$就能构造两个不同手性Weyl旋量和一个”矢量类型“构成的洛伦兹标量:
为方便起见,使用:
它也是$(1/2,0)\otimes(0,1/2)$到$(1/2,1/2)$的投影张量,对应的基底与前述的相差一个变换。利用该记号,上面的两个洛伦兹标量也可写为:
四矢量耦合
有了两矢量耦合的例子,很容易推广到四矢量耦合的情况。尤其是在讨论导数算符参与的洛伦兹不变量时,其实已经举了两个例子是包含四个”矢量类型“的量进行耦合的情况,只不过那里我们还是要求四个指标两两成对收缩。
但是在更一般的四矢量耦合:
它的直和分解中,除了两部分来自于$(1/2,1/2)\otimes(1/2,1/2)$得到的$(0,0)$再直积得到的$(0,0)$外,还存在一个额外的$(0,0)$表示,它的投影张量是四维Levi-Civita符号$\varepsilon^{\mu\nu\rho\sigma}$:
这种类型的耦合也非常值得研究,尤其是第二项,在QCD理论中对应于非阿贝尔规范场的一项CP破坏项,是目前研究的一个重要问题。
场的拉格朗日量及运动方程
中遇可以完成本章最主要的任务:为各种类型的场构造其自由场拉格朗日量。自由场拉格朗日量的原则是:只包含场本身及其导数构成的项;每项之中仅有两个场变量。
在这样的原则之下,考虑前面的构造,那么场的拉格朗日量已经几乎可以被唯一确定:
标量场:
两项分别是标量场的动能项和质量项。这给出运动方程——Klein-Gordon方程:
矢量场:
三项依次是矢量场的动能项、Proca质量项,以及目前理论上并不禁止存在的、破坏CP对称的$\theta$项;在不考虑$\theta$项的存在时,矢量场运动方程——Proca方程:
Weyl旋量场:
左手:
右手:
第一项是旋量场动能项,第二项是质量项,将质量项写成两部分是为了让这一项满足$\psi_L\to {\rm e}^{ {\rm i}\theta}\psi_L$变换下不变的${\rm U}(1)$对称性。
Weyl旋量场运动方程——Weyl方程:
注意:这两个方程事实上不再是自由场方程,因为等号左边的某一手性旋量场的动力学,受到等号右边相反手性旋量场的作用。这也说明,在质量$m\neq0$的情况下,左、右手Weyl旋量一定是相互耦合的,不存在有质量的自由Weyl旋量场。
Dirac旋量场:
注意最后一个等号使用了$\gamma^\mu$的一种特定的表示,即下一节中的“Weyl手征表示”。Dirac旋量运动方程——Dirac方程:
Dirac方程的质量项不与$\psi$之外的场量耦合,意味着该方程可以描述有质量的自由Dirac旋量。
Majorana旋量场:
尽管一般而言,不存在有质量自由Weyl旋量场,根本原因是旋量场的复共轭被视为另一个独立场变量。但是在一种特殊情况下是可以定义的,即复共轭是自己的旋量场。
单个Weyl旋量场的复共轭不可能是自己,因为分属不同表示。但是在构成Dirac旋量时:
注意到它的两个分量都存在一种性质:$\psi_R = {\rm i}\sigma^2\psi^{*}_L$,$\psi_L = -{\rm i}\sigma^2 \psi^{*}_R$,那么考虑用这两个量再构成一个特殊的四分量对象:
另一方面,又注意到
这里$\mathcal C$是前面曾经引入的一个矩阵,我们将它作用于Dirac旋量$\psi$的结果$\psi^c = \mathcal C\psi$称为原旋量的荷共轭。我们把荷共轭是自己的Dirac旋量$\psi_M^c = \psi_M$称为Majorana旋量。从定义上就能看出,其左右手分量并不独立,自由度比一般的Dirac旋量少一半:
它尽管具有4个复分量,但是其中只有2个独立的复分量;从这个意义上来说,它其实相当于一个单独的Weyl旋量,照此即定义$\psi^c = \psi$的Dirac旋量为(2分量的)Majorana旋量。另一方面,2个独立的复分量,等价于4个独立的实分量,因此这样的旋量也总可以取为纯实Dirac旋量,所以也有定义$\psi = \psi^{*}$的Dirac旋量为(4分量的)Majorana 旋量。
将(2分量的)Majorana旋量代入Weyl手征表示下的Dirac方程,得到的就是Weyl方程:
两者只有一个是独立的,一般取为第一式。第二式其实就是右手Weyl方程。但我们对该方程的解释与Weyl旋量不同:这里$\psi_L$和$\psi_L^{*}$都是Majorana旋量$\psi_M$的分量,因此该方程实际上只是它的两个分量之间的耦合,但作为整体来看,Majorana旋量仍然是自由场。因此尽管服从的也是Weyl方程,但是Majorana天然就可以引入质量项。
另一方面,利用下一节将要讨论的Majorana表示,将(4分量的)Majorana旋量代入Majorana表示下的纯实Dirac方程,得到Majorana方程:
它与上面Majorana所满足的的Weyl方程是等价的。
$\gamma^\mu$矩阵的等价表示
总结一下,在Weyl旋量中,已知$\psi_R^\dagger\psi_L$、$\psi_L^\dagger\psi_R$是洛伦兹不变的,但通过Dirac旋量构造洛伦兹不变量更复杂一些,我们已经知道$\psi^\dagger\psi\stackrel{\Lambda}{\longrightarrow}\psi^\dagger\Lambda^\dagger_D\Lambda_D\psi$不是洛伦兹不变量,因为$\Lambda_D$不是幺正的($L^\uparrow_+$非紧)。但考虑到前面给出的:
它导致赝幺正关系:
于是利用$\overline\psi=\psi^\dagger\beta$和$\psi$构造出了合适的洛伦兹不变量和其他协变量。这其中Dirac-$\gamma$矩阵扮演非常重要的角色,事实上它们构成$Cl(1,3)$代数的一组基。
注意到Dirac旋量表示有几个等价的矩阵表示,分别对应$Cl(1,3)$代数的不同四维矩阵表示(始终有$(\gamma^0)^\dagger=\gamma^0$,$(\gamma^i)^\dagger=-\gamma^i$):
Weyl手征表示
该表示就是上一节给出Dirac拉格朗日量及运动方程时使用的表示。在Weyl基的手征表示下
由Dirac旋量得到Weyl旋量可通过构造手征投影算符:
我们把这两个算符作用于$\psi$得到的结果分别定义为Dirac旋量的左右手征分量;但是仅在Weyl手征表象下,这两个分量是左右手的Weyl旋量;在其它表象下,则不是简单的Weyl旋量。
在Weyl手征表示下,Dirac方程可以写为:
仅在$m=0$时左右手旋量脱耦为Weyl方程:
这与前面关于不存在有质量自由Weyl旋量场的讨论是符合的。质量项必须是一个洛伦兹标量,而根据前面的分析,构造这样的双线性型必须各取一个左右手旋量,这就必然导致左右手的混合,不可能由单个Weyl旋量构造质量项。在标准模型中,这导致Dirac旋量和Weyl旋量分别用来描述有质量和无质量的费米子。
Dirac-Pauli正则表示
其优点在于将能量对角化,非相对论极限下比较方便。
Majorana表示
该表象下Dirac方程是实的,$L^\uparrow_+$群元的表示也是实的;从而只要取一个实旋量$\psi=\psi^{*}$,在该表象下Dirac方程就有纯实解,它被$L^\uparrow_+$的任何元素作用的结果都是实旋量。
注:这就是前面(4分量的)Majorana旋量的定义方式之一。
CPT
附录:群论基础
群的基本概念
群作用
有限群$G$的元素个数记为$|G|$,称为群的阶。
群乘法一般可以是不满足交换律的。乘法满足交换律的群称为交换群或阿贝尔群;否则称作非交换群/非阿贝尔群。阿贝尔群中群元满足$g\circ h=h\circ g \Longleftrightarrow a\circ b\circ a^{-1}\circ b^{-1} = e$,称$a\circ b\circ a^{-1}\circ b^{-1}$是元素$a$和$b$的换位子。
在正文中,我们给出了群$G$在集合$X$上作用的概念。特别地,群$G$的作用空间也可以是$G$本身作为一个集合。这种情况下,群作用$h \mapsto g\circ h \in G$,$\forall h\in G$也称为左平移;右平移同理。此外,还有一种特殊的自作用:
称为群作用在自身的共轭作用;给定$h\in G$,$\forall g\in G$,$g\circ h\circ g^{-1}\in G$称为$h$的共轭元。用$\iota_G$表示共轭作用,$\iota_G(g) = {\rm I}_g$则表示这个作用在群元取$g\in G$时的变换。
群同态与群同构
不同的群之间存在一些常用的关系及运算,在此列举一些物理上常用到的。
所谓群同态是指这样的映射$\varphi:G\to G’$(不必单满),它保持群乘法:
这显然包含了:
- 恒元映射到恒元:$\varphi(e)=e’\in G’$;
- 一个群元的逆元映射到其像的逆元:$\varphi(g^{-1}) = [\varphi(g)]^{-1}$;
此时也可记$G \sim G’$,表明两个群之间存在群同态关系。
回顾群$G$在集合$X$上的作用,这事实上自然给出了一个群同态:$\varphi:G\to S_X$,其中$S_X$是集合$X$上的全变换群;反之,若群$G$到集合$X$上的全变换群$S_X$存在一个群同态,那么必然可以据此自然构造一个群$G$在集合$X$上的作用。因此群在某空间上的作用,总是与一个群到该作用空间上全变换群的同态映射一一对应。
该同态$\varphi$的核$\ker\varphi$也称为这个群作用的核;若$\ker\varphi = e$,则称该群作用是忠实作用。
不难验证,共轭作用的核,是群$G$中所有与全体元素都可交换的元素:
称其为群$G$的中心。
若群同态$\varphi$是单满的双射$\widetilde\varphi$,则叫作群同构。此时也可记$G \cong G’$。同构是很强的条件,很多时候可以把同构的两个数学对象视作同一个对象(在这里就是把同构的两个群视作同一个群)。
特别地,到自身的群同构$\widetilde\varphi_I:G\to G$称作自同构。一个群$G$的全体自同构映射构成的集合${\rm Aut}(G)$,按照映射复合作为群乘法:
也构成一个群,称为群$G$的自同构群${\rm Aut}(G)$。
群$G$在自身的共轭作用$\iota_G$,在取$\forall g\in G$时都给出一个特殊的自同构${\rm I}_g = \iota_G(g):G\to G$:
称之为群元$g$诱导的的内自同构,或伴随同构。其全体构成伴随同构群${\rm Inn}(G)$,它是${\rm Aut}(G)$的一个子集。它其实就是共轭作用的像:${\rm Im}\ \iota_G = {\rm Inn}(G)$。
因此,与共轭作用相联系的同态映射,实际上就是
子群与商群
对于一个较大的群,可以将其一部分分离出来单独构成一个较小的群。群$G$的子集$H$若能使用$G$的群乘法也构成群,则称之为群$G$的子群,记为$H < G$。例如,任何同态$\varphi:G\to G’$的核$\ker\varphi$都是$G$的子群,像${\rm Im}\ \varphi = \varphi(G)$都是$G’$的子群。
若子群$H$在$G$的任一内自同构映射下都是封闭的:$g h g^{-1} \in H$,$\forall h\in H, g\in G$,则$H$是$G$的正规子群或不变子群,记为$H \lhd G$。例如,${\rm Inn}(G)$就是${\rm Aut}(G)$的一个正规子群。又如,阿贝尔群的每个子群都是正规子群。显然,$\{e\}$和$G$本身都是$G$的正规子群,称为平凡正规子群。如果一个群$G$只有平凡正规子群$\{e\}$和$G$,那么称$G$是单群。
若$H$是$G$的子群,则$\forall g \in G$,可以定义$gH = \{gh|\forall h\in H\}$是$H$含$g$的左陪集;$Hg = \{hg|\forall h\in H\}$是$H$含$g$的右陪集。特别地,$H=eH$,即$H$本身也是它的一个陪集。
若左右两个陪集有交,则两者一定相等。交换群的左右陪集相等。正规子群的左右陪集相等,这也是正规子群的充要条件。直观来看,陪集就是对子群$H$进行一个由$g$标记的“平移”或整体变换。显然$H$与其任一陪集$gH$之间存在双射$h\mapsto gh$,因此$H$与其每个陪集都等势。
利用子群$H$的左陪集(或右陪集),可以在$G$上建立一个等价关系:$a\sim b \Longleftrightarrow aH = bH \Longleftrightarrow b^{-1}a \in H$;两个左陪集$aH$和$cH$要么相等,要么交为空。这种等价关系事实上对$G$中的元素构成了一种划分,这就是下面商集的概念。
定义$(G/H)_l = \{gH|\forall g \in G\}$是$H$的全体左陪集构成的集合,称为群$G$关于子群$H$的左商集;类似地也可以定义右商集$(G/H)_r$。显然,可以在左右商集之间建立一一对应关系:$gH \leftrightarrow Hg^{-1}$,因此左右商集等势;若$G$是有限群,那么商集中元素个数称为子群$H$在$G$中的指数,记作$[G:H]$。
群$G$可以作用在左/右商集上,例如$aH \mapsto gaH \equiv (ga)H \in (G/H)_l$就是左商集上的左平移。类似也有右商集上的右平移。
前面提到,陪集(所定义的等价关系)对群$G$构成了一种划分,以左陪集为例来说明:
若$[G:H] = t$,由于群$G$中的任何一个元素总是属于$H$的某一左陪集,于是$G$作为一个集合,可以表示为$r$个非交集合之并:
其中各个$a_iH$以及$H$之间等势且两两互不相交;这意味着每个$a_i$来自于不同的左陪集,因此相当于为每个左陪集唯一选择了一个代表元,$\{a_1,a_2,\dots,a_t\}$就称为$H$在$G$中的一个左陪集代表系。上式也称为$G$关于子群$H$的左陪集分解式。该式意味着,$\forall g\in G$,可以唯一地表示为$g = a_i h$,其中$1 \leq i \leq t$,$h\in H$。
当$G$为有限群时,利用其左陪集分解式立即得到拉格朗日定理:
即$G$的任一子群$H$的阶总是$G$的阶的因数。
对于交换群,左右商集相等;而对于一般的情况,可以证明正规子群的左右商集相等,并且可以通过$G$本身的群乘法来自然地定义商集中的乘法:
于是,设$H \lhd G$,可以在$G/H$上定义群结构:
- 群乘法:$gH\times g’H = (gg’) H$;
- 恒元:$e_{G/H} = H$;
- 逆元:$(gH)^{-1} = g^{-1}H$。
于是称$G/H$为群$G$关于正规子群$H$的商群。注意到只有正规子群才能保证这样的群乘法,也就是正规子群才能恰当的定义商群。
商群实质上是对群$G$进行划分的一种方式。正规子群是一个良好的分类标准,它代表了群中元素的一致性,并且是可平移的一致性,而这些一致性是我们在划分群$G$时所不关心的。若在任一个陪集$gH$中选取一个代表元素$a$,那么正规子群的性质可以使得在每个陪集中都唯一确定一个代表元;这些代表元构成陪集代表系,它与$G/H$同构。换句话说,在$G$中商去$H$就得到陪集代表系,它真正反映了$G$我们对群的划分。
通过商群的群乘法,可以自然构造出群$G$到$G/H$的一个满同态映射:$\pi:G\to G/H$,$\pi(g) = gH$,满足$\pi(a)\pi(b)=\pi(ab)$;称其为商群的自然同态,且满足$\ker \pi = H$,${\rm Im}\pi = G/H$。自然同态的存在,意味着一个正规子群总是可以看作某个同态的核;反之,同态核也一定是其定义域$G$的正规子群,这就是重要的同态基本定理:
群同态基本定理:设$\sigma:G\to H$是群同态,则$\ker \sigma \lhd G$;且$G/\ker\sigma \cong {\rm Im}\ \sigma$。
作为该定理的一个结论,我们知道,共轭作用的核是群$G$的中心:$\ker \iota_G = Z(G)$,共轭作用的像是内自同构群:${\rm Im}\ \iota_G = {\rm Inn}(G)$。因此$Z(G) \lhd G$,且$G/ Z(g) \cong {\rm Inn}(G)$。
利用该定理可知,单群只有两个商群:$G/\{e\} \cong G$,$G/G \cong \{e\}$(后者是因为$G/G$是只有一个元素的平凡群)。可见对单群的划分是平凡的;直观来讲,难以找到比单群更小的单位将其划分或拆分,因此单群可视作是群论中的基本结构。
根据群同态基本定理,还可以得到其他一些基本定理:
第一群同构定理:设$H \lhd G$,$K < G$,则:
- $HK \equiv \{hk|\forall h\in H,k\in K\} <G$,其中$HK$的乘法继承$G$的乘法
- $H \cap K \lhd K$,且$K/(H\cap K) \cong HK/H$
该定理表明,当至少存在一个正规子群时,形如$HK$的集合构成一个子群;而只要将自然同态$\pi:G\to G/H$限制在$K$上就能得证。
第二群同构定理:设设$H \lhd G$,$K \lhd G$,且$K\subset H$,则$H/K \lhd G/K$,且$(G/K)/(H/K) \cong G/H$。
利用群$G$在集合$X$上的作用,可以研究群本身的性质。
设群$G$在集合$X$上有作用,对$x\in X$,集合:${\rm Orb}_G(x) = \{gx|g\in G\}$称为是点$x$的$G$-轨道。那么可以在$X$中定义一个等价关系:$x\sim y$当且仅当$y \in {\rm Orb}_G(x)$;因此这给出了集合$X$的一个等价类划分,每条轨道就是一个等价类,不同的轨道之间互不相交,全体轨道之并充满$X$。在每个共轭类中可以选取一个代表元素$x_i$,它们的全体构成$X$的$G$-轨道的完全代表系。
若群$G$在集合$X$上的作用只有一条轨道,即$\forall x,y\in X$,总$\exists g\in G$使$y=gx$,则称该作用是传递的,$X$称为$G$的齐性空间。例如,左商集上的左平移就是一种传递作用。
群$G$的共轭作用的轨道${\rm Conj}_G(h)$称为共轭类,是共轭作用下的等价类;某元素所属的共轭类是其全体共轭元的集合。当且仅当$h\in Z(G)$时,共轭类${\rm Conj}_G(h) = \{h\}$。于是当$G$为有限群时,
其中$h_i$是$G$中非中心元素的共轭类的代表元。该式称为有限群$G$的类方程。
设群$G$在集合$X$上有作用,对$x\in X$,集合:${\rm Stab}_G(x) = \{g\in G|gx=x\}$称为是点$x$的$G$-稳定子;它也是$G$的一个子群,因而也叫稳定子群。
共轭作用下,$h\in G$的稳定子是$\{g\in G|ghg^{-1}=h\} = \{g\in G|gh=hg\}$,记作${\rm Cent}_G(h)$,称其为$h$的中心化子,因为$h$一定属于这个子群的中心:$h \in Z({\rm Cent}_G(h))$。
一个群在点$x$的轨道和$x$的稳定子之间存在关系:$|{\rm Orb}_G(x)| = [ G : {\rm Stab}_G(x) ]$。
群的直积与半直积
除了可以将群进行拆分或划分,另一方面,通过两个较小的群也可以构造较大的群。
直积与直积分解
群$H$和群$K$作为集合,有笛卡尔积$H\otimes K$。若其元素按照下述乘法构成群:
则它构成群$H$和群$K$的(外)直积,记作$H\times K$。
可以发现,直积群$H\times K$的两个子群$\overline H = \{(h,e_K)|\forall h \in H\}$和$\overline K = \{(e_h,k)|\forall k \in K\}$分别是$H\times K$的正规子群。 这暗示我们可以从另一个角度看待直积——群的直积分解。
群的直积分解定理:若群$G$有两个正规子群$H,K\lhd G$,其交集平凡$H \cap K = {e}$,且满足$G = HK$,那么称$G$为$H$和$K$的(内)直积,且满足$G\cong H\times K$,其中$H\times K$是两个子群的(外)直积,内外直积间的同构映射为$\widetilde\varphi: hk \mapsto (h,k)$。
习惯上内直积也记作$G = H\times K$。该定理给出了一个如下的关系图:
这个定理说明,若一个群具有两个交集平凡的正规子群,且其群元可以表示成两个正规子群群元的乘积(可以证明这样的表示是唯一的),那么在同构意义下可将该群分解为两个正规子群的直积。
直积分解定理实际上是说,一个群,与其内直积分解得到两个正规子群的外直积,是同构的。直积群的性质很好,因为它的两个“分量”的运算是独立进行的。可以看到,内直积和外直积实际上是同一个概念的两个角度,外直积通过小群构造大群,内直积将大群分解为小群。
半直积与半直积分解
但是将群进行直积分解的条件较强,例如很多情况下两个子群未必都是正规子群。因此我们尝试削弱其条件,只要求一个子群是正规的,引入半直积的概念:
若群$G$有一个正规子群$H\lhd G$和一个子群$K\leq G$,其交集平凡$H \cap K = {e}$,且满足$G = HK \equiv \{hk|\forall h\in H,k\in K\}$,那么称$G$为$H$和$K$的(内)半直积,记为$G = H \rtimes K$。
可以看到直积实际上是半直积的一个特例。此时同样也可证明$G$群元表示成两个子群群元乘积方式是唯一的。我们希望也找到类似于外直积定义的外半直积定义,即在集合的笛卡尔积$H\otimes K$上定义运算来构造半直积。具体来说,希望构造一种乘法,既与内半直积的定义之一$(h,k)\leftrightarrow hk$相容,又要满足定义在笛卡儿积上的形式$(h,k)(h’,k’) = (h’’,k’’)$。于是可以尝试画出如下关系图:
由于$hkh’k’ = h(kh’k^{-1})kk’$,而$H$是正规子群,则$kh’k^{-1} \in H$,这表明,只要规定$h’’ = h(kh’k^{-1})$,$k’’=kk’$,就能完成这样的对应;而$k h’ k^{-1} = {\rm I}_k(h’)$实际上是$G$上的共轭作用在$k\in K$处的变换在$h’\in H$处的结果,也是$H$上的一个内自同构;于是自然可以考虑将(外)半直积在笛卡尔积$H\otimes K$上的群乘法定义为
但是出于灵活性的考虑,可以将其推广定义如下:
群$H$和群$K$作为集合,有笛卡尔积$H\otimes K$。若其元素按照下述乘法构成群:
其中$\varphi:K\to {\rm Aut(H)}$是某一同态,$\varphi_k = \varphi(k)$,则该群构成群$H$和群$K$的(外)半直积,记作$H \rtimes_\varphi K$。
前面提到的直积是半直积的特例,实际上就是同态$\varphi$为平凡同态时的特例,此时所有$\varphi_k$都是恒同自同构,半直积自然退化为直积。
立即也有半直积分解定理:
群的半直积分解定理:若群$G$有正规子群$H\lhd G$和子群$K$,其交集平凡$H \cap K = {e}$,且满足$G = HK$,那么称$G$为$H$和$K$的(内)半直积,且满足$G\cong H\rtimes_\iota K$,其中$H\rtimes_\iota K$是两个子群在同态映射取为$\varphi_\iota: G \to {\rm Aut}(G)$,$
g \mapsto \iota_G(g) = {\rm I}_g
$时的(外)半直积,内外半直积间的同构映射为$\widetilde\varphi: hk \mapsto (h,k)$。
半直积分解相较于直积分解,不需要两个子群都是正规子群(只需要一个$H$即可);而另一个子群$K$的元素$k$在乘法运算时是独立相乘的。
物理上很多时候,尤其是非齐次线性变换在以复合为群乘法构成变换群的情况下,是不能保证两个子群全部正规的,具体来说线性项部分构成正规子群,而非齐次项则不构成。这时就要用到半直积分解。
群表示
物理上的对称性可以由群$G$对某个空间$X$的作用来描述,但是这样抽象的描述不便于物理的计算与分析,因此我们会进一步希望用一些更熟悉的、更具体的工具来定量刻画群的作用,例如线性变换、矩阵代数。
线性表示
前面已经看到,研究一个特定空间$X$上的映射$f\in\mathcal F[X\to Y ]$在对称变换下的变换律,关键是要研究对称群$G$在不同类型空间$Y$上的群作用。物理上很多时候对所研究的场的一般要求(例如可加性)决定了我们感兴趣的绝大多数都是群在不同线性空间上的作用,此即群(线性)表示的概念:
群$G$的一个线性表示或$K$-表示(简称表示)是指一个从$G$到线性群${\rm GL}(V)$的群同态映射$\varphi:G\to {\rm GL}(V)$,其中$V$是域$K$上的线性空间,称为该群表示的表示空间,${\rm GL}(V)$是其上全体可逆线性变换构成的群,称为一般线性群;$n=\dim V$是表示空间的维数,也称为表示$\varphi$的次数$\deg\varphi$。群表示的两个要素分别是表示空间和同态映射,因此一个确定的群表示可以记为$(\varphi,V)$;由于映射本身也包含了表示空间的信息,因此在表示空间明确的情况下也可将群表示简记为$\varphi$。由于群在线性空间上的群作用与一个同态一一对应,因此群作用本身就是一个线性表示;一般也把群的线性表示称为群在相应线性空间上的作用。
若群同态$\varphi$是单射,此时的表示称为忠实表示,$\ker\widetilde\varphi = {e}$;若$\varphi$将所有群元都映射到恒等变换$1_V\in{\rm GL}(V)$,此时的表示称为平凡表示,$\ker\varphi = G$。特别地,$G$的一次平凡表示也叫主表示或单位表示。
考虑两个同构的线性空间,具有同构映射$\sigma: U\to V$。若同一个群$G$在这样两个空间上的表示分别为$(\varphi,U)$和$(\phi,V)$,且表示映射可与同构映射交换:
这个映射等式对$\forall u\in U$成立,则称$(\varphi,U)$和$(\phi,V)$是等价线性表示。可以画出如下关系图:
表示的等价是与表示空间的同构相适应的;某种程度上来说,等价表示相当于表示的“同构”。
一些重要的表示
若表示空间$V$是酉空间(复内积空间)/实内积空间,且$\forall g \in G$,$\varphi(g)$都是$V$上的酉变换(幺正变换)/正交变换,即保内积变换,那么称$(\varphi,V)$是酉表示(幺正表示)/正交表示。
通过群$G$在$n$元集合$X=\{x_1,x_2,\dots,x_n\}$上的任一作用$g\circ x$,总可以构造出一个$n$次表示:令表示空间为$X$中元素在域$K$上张成的线性空间:$V = {\rm span}(x_1,x_2,\dots,x_n)$,定义映射$\varphi_S:G\to {\rm GL}(V)$为:
可以证明它是一个同态从而构成表示,称之为群$G$在域$K$上的$n$阶置换表示。它完全由群$G$在集合$X$上的作用所决定。
特别地,当群$G$作用在自身$G$作为集合时,左平移作用所构造的域$K$上的置换表示称为(左)正则表示,表示空间为:
同态映射$L_{\rm reg}$定义为
显然,左正则表示是忠实表示,$\ker L_{\rm reg} = \{e\}$。
类似地,右平移作用可以构造出右正则表示,表示空间仍为$K[G]$但是为了保群乘法,将之定义为
这也是忠实的。
上述定义的域$K$上的线性空间$K[G]$可以说是$G$的所有表示空间中包含$G$本身信息最多的;显然$\dim K[G] = |G|$。根据$G$群乘法可以自然地定义$K[G]$中的乘法:
且该乘法与数乘相容,于是$K[G]$成为域$K$上的一个代数,又由其构造于一个群,因而称之为群代数。
利用群$G$关于子群$H$的左陪集分解可知$\forall g\in G$可以唯一地表示为$g = a_i h$,其中$1 \leq i \leq [G:H]$,$h\in H$;于是群代数$K[G]$的元素就可唯一表示成
其中$b_i = \sum_{h\in G} k_{g_ih} h \in K[H]$。因此$K[G]$也有类似的分解式:
代数结构也可以定义线性表示:记${\rm Hom}(V,V)$是线性空间$V$上全体线性变换组成的代数,那么从代数$A$到${\rm Hom}(V,V)$的代数同态(保代数的加法、乘法、数乘及单位元)$T$就是代数$A$的一个线性表示,$V$是表示空间,代数线性表示记作$(T,V)$。
群$G$的表示$(\varphi,V)$可以简单地线性扩充成为群代数$K[G]$在同一表示空间上的表示,定义
易证这是一个代数同态,于是从群$G$的表示$(\varphi,V)$得到了群代数$K[G]$的表示$(\varphi^*,V)$。
反之,群代数$K[G]$的表示$(\varphi^*,V)$也可以自然地给出群$G$的表示,只要将其限制在$|G|$上:
就从群代数$K[G]$的表示$(\varphi^*,V)$得到了群$G$的表示$(\varphi,V)$。由于一般群代数的结构更丰富、性质更好,所以通过研究群代数的表示来获得群的表示是比较方便的。
矩阵表示
为了便于定量计算,引入一个新的概念:矩阵表示$\varPhi:G\to {\rm GL}(n)$,在这里${\rm GL}(n)$为域$K$上的全体可逆$n$阶矩阵构成的矩阵群,$n$也是矩阵表示$\varPhi$的次数$\deg\varPhi$。
根据线性代数的知识,线性空间上的线性变换总可以通过选取一定的基来写成矩阵的形式;反之给定矩阵和一个线性空间,也可以选定一组基定义一个线性变换。由此,域$K$上的$n$阶矩阵表示$\varPhi$与域$K$上某$n$维空间上的线性表示$\varphi$存在选定基下的一一对应关系。
线性表示的很多性质也反映在与其对应的矩阵表示上;例如幺正表示的矩阵表示是幺正矩阵:$\varPhi(g)_U^\dagger = \varPhi(g)^{-1}$。
$n$阶置换表示有天然的矩阵表示基,即集合$X$中元素组成的基;此时的矩阵$\varPhi(g)$是$n$阶置换矩阵,是每行每列只有一个1,其余为0的方阵。
同一个域上可以有多个相同次数的矩阵表示,若它们之间通过一个特定的变换矩阵$S\in{\rm GL}(n)$联系:$\forall g\in G$,$\varPsi(g) = S^{-1}\varPhi(g) S$,则称两者是等价矩阵表示。可以证明,线性表示等价,当且仅当它们对应的矩阵表示等价。
据此,我们可以不区分群在同一个数域上的线性表示与矩阵表示,在之后统称为(群)表示;这样既方便抽象地分析群在某个表示空间上的作用,也提供了从矩阵角度定量计算的方法。大多数情况下也不再区分等价表示,因为通常它们在物理上描述的是具有相同性质的对象。显然一个群可以有许多不等价表示,其之间的区别取决于表示空间本身的性质。因此,物理上我们会用同一个群的不等价表示给物理对象进行分类,以表征它们在相同对称变换下的不同变换性质。
线性表示的结构
作为群的同态,群表示可以自然继承群的很多概念。此外,利用矩阵表示,群表示还可以移植很多线性代数的概念。
设群表示$(\varphi,V)$,$W$是表示空间$V$的一个子空间;若对$\forall g\in G$,$W$是线性变换$\varphi(g)$的不变子空间(即$\varphi(g)(W)\subset W$),则称$W$是表示$\varphi$的不变子空间/稳定子空间,或$W$是$G$-不变子空间/$G$-稳定子空间。显然$\{0\}$和$V$都是$G$-不变子空间,称之为平凡不变子空间。
若群$G$在$X$和$Y$上都有群表示,若$f:X\to Y$是$G$-等变映射,即$g\cdot f(x) = f(g\cdot x)$,$\forall g\in G, x\in X$,那么$\ker f$是$X$的$G$-不变子空间,${\rm Im} f$是$Y$的$G$-不变子空间。
若不变子空间$W \neq \{0\}$,那么表示$(\varphi,V)$通过限制在子空间$W$上可以自然给出一个$W$上的表示:$\varphi_W:G \to {\rm GL}(W)$,$g\mapsto \varphi_W(g) = \varphi(g)|_W$。称$(\varphi_W,W)$是$(\varphi,V)$的一个子表示。
利用矩阵表示的概念,若群表示$(\varphi,V)$存在子表示$(\varphi_W,W)$,且选定不变子空间$W$的一组基$\{e_W^i\}$并将其扩充为$V$的一组基$\{e_W^i,\alpha^j\}$,那么$(\varphi,V)$在基$\{e_W^i,\alpha^j\}$下对应的矩阵表示$\varPhi$具有如下的分块矩阵形式:
其中$\varPhi_W$是$(\varphi_W,W)$在基$\{e_W^i\}$下的矩阵表示。
若不变子空间$W \neq V$,那么表示$(\varphi,V)$可以自然给出一个商空间$V/W$上的表示:$\overline\varphi:G \to {\rm GL}(V/W)$,$g\mapsto \overline\varphi(g)$,其中$\overline\varphi(g): v+W \mapsto \varphi(g)(v) + W$。称$(\overline\varphi,V/W)$是$(\varphi,V)$的一个商表示。
与其他代数结构相同,我们也希望可以通过较小的群表示来构造较大的群表示。
群表示$(\varphi_W,W)$和$(\varphi_U,U)$可以自然给出一个直和空间$W \oplus U$上的群表示:
其中
则称该表示为$(\varphi_W,W)$和$(\varphi_U,U)$的(外)直和,记作$(\varphi_W \oplus \varphi_U, W \oplus U)$。
若群表示$(\varphi,V)$有不变子空间$W_1$和$W_2$,其交集平凡$W_1 \cap w_2 = {0}$,且满足$V = W_1 \oplus W_2$。若$W_i\neq 0$,$i=1,2$,则有$\varphi = \varphi|_{W_1} \oplus \varphi|_{W_2}$,称其为子表示$\varphi|_{W_1}$和$\varphi|_{W_2}$的(内)直和。
有时$W_1 \oplus W_2$仅是$V$的一个子空间,那么可以证明$W_1 \oplus W_2$也是不变子空间,这时一般也把$\varphi|_{W_1 \oplus W_2}$称为子表示$\varphi|_{W_1}$和$\varphi|_{W_2}$的(内)直和,它们也满足$\varphi|_{W_1 \oplus W_2} = \varphi|_{W_1} \oplus \varphi|_{W_2}$。
直和表示的矩阵表示具有准对角矩阵(分块对角矩阵)的形式,即若在子空间$W$和$U$中分别取基$\{\alpha^i\}$和$\{\beta^j\}$,将其合并为$W \oplus U$的基,那么矩阵表示有:
内外直和的概念也是一体两面的,这允许我们用较小表示构造较大表示,或者将较大表示拆分为较小表示。
很多时候我们希望找到某个群$G$的全部群表示,至少要研究其群表示的结构。但是通常群表示是很多、很复杂的;那么是否可以利用群表示的直和,来找到构造这些复杂群表示的最基本、最简单的群表示呢?
类似于整环$\mathbb Z$的基本结构是素数,即所谓“不可约整数”——其正因子只有$0$和它本身;域$K$上的一元多项式环$K[x]$的基本结构是不可约多项式,即因式只有零次多项式和其相伴元。因此考虑在研究群表示的结构时,也要找到这样的基本结构:
若群表示$(\varphi,V)$的不变子空间只有平凡不变子空间:$\{0\}$和$V$,那么称$(\varphi,V)$是不可约的或既约的;否则是可约的。若对$(\varphi,V)$的每一个不变子空间$W$,都存在另一个不变子空间$U$使得$V = W\oplus U$,则称$(\varphi,V)$是完全可约的。不可约表示是完全可约的。
在矩阵表示下,可约表示具有$\varPhi(g) = \begin{bmatrix} \varPhi_W(g) & C(g)\\ 0 & B(g) \end{bmatrix}$的分块形式;完全可约表示具有$(\varPhi_W\oplus\varPhi_U)(g) = \begin{bmatrix} \varPhi_W(g) & 0\\ 0 & \varPhi_U(g) \end{bmatrix}$的分块对角形式。
从中可以看到,完全可约表示的任一子表示,也是完全可约的:因为要么子表示的表示空间是最小不变子空间的直和,此时依旧完全可约;要么子表示不可约,而不可约也是完全可约。因此可以重复对其进行分解,从而得到结论:
有限维完全可约表示的分解定理:群$G$的有限维完全可约表示,可以分解成有限多个不可约子表示的直和。
从矩阵表示的直观来讲,就是将有限阶的分块对角的矩阵,分解成不可再分的最小方块矩阵。那么群$G$的表示是否都是完全可约表示?换言之,设$V = W \oplus W’$其中$W$是不变子空间而$W’$不一定是,那么是否可以从$W’$出发构造一个不变子空间$U$,使其满足$V = W \oplus U$?数学上有:
Maschke定理:有限群$G$在特征不能整除$|G|$的域上的任一线性表示(包括有限维和无限维线性表示)都是完全可约表示。
一个域$F$的特征${\rm char}\ F$只可能取$0$或素数$p$,取决于其所包含的素域是有理数域$\mathbb Q$还是模$p$剩余类域$\mathbb Z_p$。特征不能整除$|G|$意味着,${\rm char}\ F = 0$,或${\rm char}\ F =p > 0$但$p \nmid |G|$。特征不能整除$|G|$的表示称为常表示,否则是模表示。
对于数域,任何数域都包含有理数域$\mathbb Q$,它是最小的数域,因此数域的特征总是$0$;同时任何数域都是复数域$\mathbb C$的子域,它是最大的数域;实数域$\mathbb R$则是有理数域$\mathbb Q$的完备化,意味着有理数域中的收敛数列都收敛于某个实数。
对于物理上常用的群表示,几乎都是在复数域$\mathbb C$上的表示,其特征总是为$0$,因此可以放心地认为都是完全可约表示。数学上还可以证明,有限群$G$的不可约表示的维数一定是有限的:$\deg\varphi<\infty$。因此结合前面两个定理可知,只要找到群$G$在数域$F$上全部有限维的不等价不可约表示,就能简单地通过直和来得到群$G$在数域$F$上的全部有限维线性表示,从而获知群表示的结构。寻找群的全部不等价不可约表示,这也是物理上应用群表示的核心目的之一。
阿贝尔群的不可约复表示
考虑阿贝尔群在复数域上的不可约复表示$(\varphi,V)$,此时$V$是复数域上的线性空间。
$\forall g\in G$,$\varphi(g)$是$V$上的线性变换,设其具有特征值$\lambda_g$,相应的特征子空间$V_{\lambda_g}$满足$\varphi(g)V_{\lambda_g} = \lambda_g V_{\lambda_g}$。由于阿贝尔群乘法可交换,对$\forall h\in G$,$gh=hg$从而$\varphi(g)\varphi(h) = \varphi(h)\varphi(g)$,因此$V_{\lambda_g}$是$\varphi(h)$的不变子空间,从而根据$h$的任意性可知它是$G$-不变子空间;但已经假设$(\varphi,V)$是不可约表示,这说明$V_{\lambda_g} = V$,从而$\varphi(g)$在全$V$上都是简单的数乘变换$\lambda_g I_V$。假设$\dim V >1$则一定存在某个基使得$\varphi(g)$的矩阵表示是$\varPhi(g) = \lambda_g {\rm diag}(1,1,\dots,1)$,但这又与$(\varphi,V)$不可约矛盾;因此只能有$\dim V = 1$,即:
阿贝尔群的有限维不可约复表示都是1次表示。
注意到一维复线性空间在同构意义下其实就是复数集合$\mathbb C$本身以复数加法和复数乘作为线性空间;而其上的线性变换群${\rm GL}(1,\mathbb C)$同构于一维复矩阵群,也就是复数乘法群$\mathbb C^\times$;因此阿贝尔群的任何有限维不可约表示$(\varphi,\mathbb C)$,其中$\varphi:G \to \mathbb C^*$都是定义在$G$上的复值函数,具体来说是若干指数函数乘积的形式,因此是非零的复值函数。
可以证明,对于阿贝尔群,其全体1次复表示,即定义在$G$上的非零复值函数,一一对应于$G$中的元素$h\in G$,标记为$\varphi_h$。$G$的1次复表示的全体以函数乘法$\varphi_h(g)\varphi_{h’}(g) = \varphi_{hh’}(g)$构成群$\widetilde G$,从而有同构关系$G \cong \widetilde G$,且是自然同构,即阿贝尔群$G$有$|G|$个1次不可约复表示;这种同构关系称为Pontryagin对偶。
非阿贝尔群不可约表示的构造
另一方面,非阿贝尔群则可以有次数大于1的不可约复表示,不能简单地得到。获得非阿贝尔群不可约表示的方法主要是利用线性表示与群同态的合成:设$(\varphi,V)$是群$G$的一个线性表示,群$H$到群$G$存在同态$T:H\to G$,则同态映射$\varphi T:H\to G\to {\rm GL}(V)$给出群$H$在$V$上的一个线性表示$(\varphi T,V)$,且:
- 若$\varphi$可约,则$\varphi T$可约;若$\varphi$不可约且$T$是满同态,则$\varphi T$不可约;
- 若$\varphi T$不可约,则$\varphi$不可约;若$\varphi T$可约且$T$是满同态,则$\varphi$可约。
这给了我们利用同态映射,把一个群的表示赋予另一个群的方法。例如下述的几种具体情形:
寻找1次复表示:表示的提升和分解
已知群$G$到商群$G/H$存在自然同态$\pi:G\to G/H$,$\pi(g) = gH$;那么给定商群$G/H$上的一个表示$\overline\varphi: G/H \to {\rm GL}(V)$,可以自然合成出$G$上的一个表示$\varphi:G\to {\rm GL}(V)$,$g\mapsto (\overline\varphi\circ\pi)(g) = \overline\varphi(gH)$,称表示$\varphi = \overline\varphi\pi$是$\overline\varphi$在$G$上的提升,且$H\subset\ker\varphi$。
反之,给定群$G$上的一个表示$\varphi:G\to {\rm GL}(V)$,以及$G$的一个正规子群$H\lhd G$,且$H\subset\ker\varphi$,那么在商群$G/H$上可以自然给出一个表示$\overline\varphi: G/H \to {\rm GL}(V)$,$gH \mapsto \varphi(g)$,称表示$\overline\varphi$是$\varphi$在$G/H$上的分解。
上述关系表明,商群$G/H$的所有表示组成集合$\Omega_{G/H}$,群$G$的所有表示之中满足$\ker\varphi \supset H$的表示组成集合$\Omega_G$,则存在一一对应:$\sigma:\Omega_{G/H}\to\Omega_G$,$\overline\varphi\mapsto\varphi$。且$\varphi$不可约当且仅当$\overline\varphi$不可约。
特别地,若$G/H$是阿贝尔群,则可以利用它的全部1次不可约表示通过提升得到$G$的很多不可约表示。为此考虑将$G$中的全部换位子$aba^{-1}b^{-1}$按照$G$的乘法构成群,称为换位子群或导群$G^c$,显然$G^c\lhd G$。若$G$是阿贝尔群,则$G^c = \{e\}$;否则$G^c$中的非平凡元素就是$G$中具有非交换性的元素的换位子。
于是考虑$G/G^c$,不难证明它确实是一个阿贝尔群;并且可以证明$G/H$为阿贝尔群当且仅当$H\supset G^c$。设$\varphi$是$G$的1次复表示,则根据复数乘法可交换性,$\forall g,h\in G$有$\varphi(ghg^{-1}h^{-1}) = \varphi(g)\varphi(h)\varphi(h)^{-1}\varphi(h)^{-1} = 1$即$ghg^{-1}h^{-1}\in\ker\varphi$,从而$G^c\subset\ker\varphi$。
因此得到结论:群$G$的全部1次复表示的核都包含$G^c$;于是群$G$的全部1次复表示可以通过阿贝尔群$G/G^c$的全部1次不可约复表示经过提升得到;当然这些表示都是不可约的。
从一个不可约表示到另一个:通过自同构的挠表示
设$(\varphi,V)$是群$G$的一个表示,$\sigma$是群$G$的一个自同构,则两者可以合成出另一个群$G$的表示$\varphi^\sigma = \varphi\sigma$,称为是$\varphi$通过自同构$\sigma$的挠表示。且由于自同构当然是满射,因此$\varphi^\sigma$不可约当且仅当$\varphi$不可约。需要注意,挠表示与原表示可能等价,也可能不等价。
- 通过内自同构的挠表示
对每个群元$\forall g\in G$,都有一个内自同构${\rm I}_g(a) = gag^{-1}$,$\forall a\in G$,则$\varphi^{ {\rm I}_g} = \varphi{\rm I}_g$是其相应的挠表示;由于$\varphi^{ {\rm I}_g}(a) = \varphi(gag^{-1}) = \varphi(g)\varphi(a)\varphi(g)^{-1}$,因此通过内自同构的挠表示与原表示等价。
- 共轭表示
设$H\lhd G$,对每个群元$\forall g\in G$,令其内自同构限制在正规子群$H$上:$\tau_g(h) = ghg^{-1}$,$\forall h\in H$,根据定义这是正规子群$H$上的自同构;若$H$有表示$\varphi$,则称$\varphi$通过$\tau_g$的挠表示$\varphi^{\tau_g}$为$\varphi$的共轭表示。共轭表示与原表示可能等价,也可能不等价,取决于元素$g$。令$I(\varphi) = \{g\in G | \varphi^g \cong \varphi\}$是$\varphi$在$G$中的惯性群,其中的元素保持共轭表示等价。显然$H\subset I(\varphi)$。
通过挠表示,可能可以从已知的不可约表示出发构造新的不可约表示。
对偶空间上的表示:逆步表示
设$(\varphi,V)$是群$G$的一个表示,即$\varphi:G\to {\rm GL}(V)$是同态。$V$存在对偶空间$V^{*}$,其中的元素是$V$上的全体线性函数(到复数域的映射),且$V \cong V^{*}$。我们希望以$V^{*}$为表示空间构造新的表示。
定义一个映射$\varphi^{*}$,使$\varphi^{*}(g)$是$V^{*}$上的线性变换,定义为$\varphi^{*}(g)f = f\varphi(g^{-1})$,$\forall f\in V^{*}$,即定义为$\varphi^{*}(g) = \varphi(g^{-1})^{*}$。则可证明$\varphi^{*}(g^{-1})\varphi(g) = 1_{V^{*}}$,即$\varphi^{*}(g)$可逆,因此$\varphi^{*}(g)\in{\rm GL}(V^{*})$。
且这样定义的映射保持乘法,从而是同态;于是$(\varphi^{*},V^{*})$也是群$G$的线性表示,称其为$(\varphi,V)$的对偶表示或逆步表示。
显然表示$\varphi$与$\varphi^{*}$具有相同的次数,且$\varphi^{*}$不可约当且仅当$\varphi$不可约。事实上若在$V$和$V^{*}$中分别取一组基及其对偶基,则两者的矩阵表示满足$\varPhi^{*}(g) = \varPhi(g^{-1})^T$。
表示$\varphi$与$\varphi^{*}$可能等价,也可能不等价。数学上可以证明,$\varphi$与$\varphi^{*}$等价当且仅当存在$\varphi$的非退化不变双线性函数:$f(x,y) = f(\varphi(g)x,\varphi(g)y)$,$\forall g\in G,\ x,y\in V$。对于不可约表示$\varphi$,最多只有一个不变双线性函数(相差一个复常数因子的意义上),且是对称或反对称的。
综上,不可约表示$\varphi$与其不可约的对偶表示$\varphi^{*}$等价当且仅当只存在一个对称或反对称的非退化不变双线性函数。
诱导表示
最后简单介绍一种从子群的表示构造大群表示的方法:诱导表示。其基本思路是,要找一个群的表示,可以先在其一个子群上建立表示,然后由此在原来的群上获得一个唯一确定的表示。
诱导表示的具体概念和陈述相对抽象和复杂,我们这里只给出其矩阵表示的一个结论,帮助建立起诱导表示的一个印象。
设群$H$是群$G$的子群,且$H$有群表示$(\phi,W)$,且表示空间存在一组基$\{w_1,\dots,w_r\}$;则其可以为群$G$诱导一个唯一确定的表示$(\psi^G,W^G)$,其中:
表示空间$W^G$是由下述基所张成的线性空间:
其中,$t = [G:H]$,集合$\{g_i\}$是$H$在$G$中的一个左陪集代表系,它给出$G$关于$H$的一个左陪集分解式:$G = a_1 H \cup a_2 H \cup \cdots \cup a_t H$;因此$\dim W^G = [G:H] \times \dim W = rt$。
而诱导表示$\phi^G$满足:其在基$\{a_i\otimes w_j\}$下的矩阵表示$\varPsi^G$,与$\phi$在基$\{ w_j\}$下的矩阵表示$\varPhi$之间存在关系:
其中$\widetilde \varPhi(y) = \left\{
\begin{aligned}
\varPhi(y)\ ,\quad & y\in H\\
0\ ,\quad & y\notin H
\end{aligned}
\right.\ $。
这里$\varPsi^G(g)$是$rt$阶方阵,$\varPhi(g)$是$r$阶方阵,且由于$a_k^{-1} g a_i,\cdots,a_k^{-1} g a_t$之中有且只有一个属于$H$,因此$\varPsi^G(g)$的每一行有且只有一个子矩阵不为零矩阵;同理$\varPsi^G(g)$的每一列也有且只有一个子矩阵不为零矩阵。
诱导表示具有一些性质:
子群$H$的正则表示所诱导的$G$的诱导表示,也是$G$的正则表示(等价意义上)。
子群$H$若干个表示的直和的诱导$G$的表示,就是它们分别诱导$G$的表示的直和(等价意义上)。
诱导表示具有传递性:设$H$是$G$的子群,$L$是$H$的子群,$L$有表示$\psi$,则$(\psi^H)^G = \psi^G$(等价意义上)。
特别地,由子群的1次表示所诱导的表示,其矩阵表示的每行每列只有一个元素非零,这样的矩阵称为单项矩阵;相应的1次表示的诱导表示为单项表示。结合诱导表示的传递性可知:子群$H$的单项表示所诱导的表示,是$G$的单项表示。