重整化辨义(上)

renormalization

按;此文最初于2014年2月20日发布在博客大巴的弦乐四重奏。这里不加修改重新贴出,有三点考虑。其一,博客大巴服务器很不稳定,常造成图片丢失。而本文中的公式在博客大巴中都是图片格式,一经丢失就无法阅读。其二,贴此旧文,可以顺便熟悉WordPress的TeX编辑功能。其三,这毕竟是未完成的文章,贴在这里以待今后补全。以下是原文。


按:前一段时间有同学怂恿我写一篇解释重整化的文章,而我一直也有这样的想法。但之前忙于自己的事情,无暇分身。这两天抽空开始写后,发现这故事很难用篇幅合适的一篇文章讲清楚。所以目前这篇只是第一部分,请各位指正。至于后续内容,也许要从长计议了。

§1 引言

如果说相对论和量子论代表了现代物理学的两大理论基石,那么从这根基上成长出的最丰硕的成果,大概非量子场论莫属了。作为当代理论物理的标准范式之一,量子场论在好些方面都超出了早前的物理理论。首先是其应用的范围。从基本粒子物理,到凝聚态物理与生物物理,再到宇宙学,几乎穷尽了经验世界所有的尺度。其次是其精确性。作为量子场论典范理论的量子电动力学,是人类迄今所创造出的最精确的理论,其理论与实验十几位有效数字的吻合,为人津津乐道。

或许有人会说,量子场论之复杂艰难,也超过了任何早前的理论。而这倒未必。我觉得,这复杂和艰难很有可能只是由于场论的建立相对晚近,我们理解它的方式仍不够恰当、不够直接。也许物理学家需要经过更久的反刍,才能降低目前理解场论所需的势垒。不过可以聊以自慰的是,似乎任何全新的理论在初创时都是难懂的:我们都知道,Einstein在发明广义相对论后不久,有人对Eddington爵士说,世界上仅有2.5个人懂得它。可是,如果现在还有谁试图用这个故事来鼓吹相对论有多么难懂,我倒想和他分享另一个故事:《自然哲学的数学原理》成书时,有人评价道,Newton写了一本自己都看不懂的书。

不过话说回来,对多数初学者而言,量子场论的曲折繁复,是确凿无疑的。就我极有限的观察,在那些纷繁芜杂的概念中,没有什么比“重整化(renormalization)”引起了更多的误解。有意思的是,初学者的那些典型误解,正是老一辈学者的观点。最典型的例子是Dirac。他说:

“多数物理学家对此状况已非常满意。他们说:‘量子电动力学是个好理论,我们不必再为它苦恼了’。我必须说,我对这状况非常不满意,因为这个所谓的‘好理论’要忽略无穷大,要任意地忽略方程中的无穷大。这不是好的数学。好的数学是,你忽略一个量是因为它小——而不是因为它无穷大、而你又不想要它!”[1]

很明显,Dirac根本没有理解重整化的正确涵义。请注意,他说这话时已是1975年,彼时Wilson关于重整化群的文章业已发表。不过我们自然不可强求Dirac去理解重整化群,因为老一辈学者经常是无可救药的[2]。可是,如果今天还有谁要坚持Dirac的这种看法、还因为自己不正确的理解而攻击重整化本身,那又何异于成天反相对论的民科呢?

所以,我希望在此文中讨论重整化群理论的若干细节,以期有助于澄清某些常见的误解,包括刚才提到的Dirac式误解,也包括我自己在初学场论时时所持有的误解。如我的其它同类文章,在正文前,有必要作几点声明。

首先,我避免将本文做成教科书或讲义。所以,阅读本文不可代替阅读严肃的教科书,更不可代替亲自推导。事实上,若想对量子场论的任何概念有较扎实的理解,亲自推导是不二法门。我以为,单是数学推导的硬功夫有时就足以消除一些习见的误解。

同时,我也避免将本文做成科普,因为我希望澄清误解而不是创造误解。可是据我看,没有什么比科普创造了更多误解。所以,我会尽力将故事的逻辑解释清楚,但偶尔也会不加解释地使用一些并不初级的概念。我当然欢迎所有读者,但我设想读者至少有物理专业的背景。对于离理论物理较远的读者,我只能抱歉地说,读到哪里算哪里。如果遇到奇怪的符号或概念,就当作咒语吧。

为了清晰起见,我们只讨论量子场论的传统理论。此处所谓传统理论,在历史上是指物理学家从量子电动力学到重整化群理论的建立这段时间(1940s-1970s)所发展的场论,在技术上,则指相对论性的、具有经典极限的微扰量子场论。虽然更现代的非微扰方法提供了更有趣、并且也许是更重要的视角,但对本文而言,传统的微扰量子场论已经足够。

最后,我绝不敢妄称自己对这些理论有怎样完备的理解,所以错漏实在难免。不当之处,请读者指正。

§2 QFT in practice: 一切都是输入输出!

让我们以一个问题开始,即,作为一种物理(而不是数学或者形而上学)理论,量子场论如何工作。

大体上,和其他物理理论一样,量子场论可被视为输入输出系统。输入和输出端是可观测量,而其内核,则是一套数学公式体系。一种理论的物理意义就在于,将有限的可观测量输入理论后,理论可以通过公式体系的演绎,给出确定的、可供实验与观测检验的输出。至于这理论内核中的概念是否有经验世界的对应物,则不是物理理论所要解决的问题。

在量子场论的情形,输入输出端是关联函数。粒子探测器的计数、材料对激发的响应、宇宙的大尺度结构,这些可观测量在量子场论中都可化为关联函数。因此,将场论与实验观测建立联系,需要做两件事情:一是将观测量与关联函数建立联系,二是用理论计算关联函数。前者依赖于具体应用的场合且与本文关系不大,所以我们假设这一步已经做到,从而将关联函数径直视作可观测量。而后者,就是本文的中心问题。现在让我们讨论之。

至少在本文所关心的情形,关联函数总可被表达成路径积分,且这路径积分总能从配分函数通过泛函微商求得。因此,问题化归为计算配分函数。配分函数也是路径积分,它由两部分构成:被积泛函与积分测度。被积泛函是以经典作用量为相角的纯相位,而积分测度,一般来说是没有定义好的。我们或许可以像定义有限维线性空间的积分测度那样,将每个方向的微分形式简单地“乘”起来,但对于无穷多自由度来讲,这样做没有定义:正如简单地将所有自然数相加没有定义一样。因此需要其它更聪明的方式来定义这个测度。在场论中,为路径积分的测度赋予定义,就叫做正规化。

至于在实际应用中,我们极少直接定义此测度,因为我们通常并不计算配分函数,而是用微扰论,亦即Feynman图的方式,去逐阶计算散射矩阵元。这逐阶展开的参数,通常就是Planck常数h, 而展开的阶数,就是Feynman图的圈数。通常,领头阶,即“树图”,亦即h的零次项,并不依赖于泛函积分测度的定义,换用物理学家的术语,就是不依赖于正规化。所以,如果你只关心这一阶的结果,那的确不需要去为定义泛函积分的测度而费神[3]。但是,当我们计算圈图的时候,就会遇到麻烦:泛函积分测度无定义,在此就表现为圈积分的无穷大。这就是一切麻烦的根源。

于是,在圈图计算中,正规化的意思是,为圈积分找到合适的定义。这个问题很像为所有自然数的和找到一个定义。一旦被定义好,原来发散的圈积分就收敛于有限大的值了。

表面上看,这里所谓合适的定义,有相当大的自由度。因为,正规化只是将理论定义好的一种手段,不属于可直接观测的物理。但不难想见的是,正规化手续,即下定义的方式,会以某种方式与真实的物理相联系。事实上,当加入来自物理的限制(例如对称性)之后,合用的正规化方式往往相当有限。特别是当理论的对称性很强、从而其限制也很强时,合适的正规化时常求之不得。比如我们至今似乎还不知道如何正规化一个超对称的规范理论,使超对称与BRST对称性同时得以保持

尽管如此,让我们暂时搁下这个问题,且假设已经找到了合适的正规化方法,并继续讨论量子场论如何工作。为确定起见,我们以量子电动力学(QED)为例。

§3 QED: 如何输入?如何输出?

QED的Lagrangian有两个未知参量(至少在表面看来如此[4]),即“电子质量项”的系数m_0 与电磁相互作用项的系数e_0。所以我们需要至少两个输入量,才可以去计算更多可观测量。不要忘记,我们总是以关联函数为窗口做输入。所以,这里所谓的两个输入量,应该是出现在关联函数中的参量。若称这两个参量为A和B,则用 QED计算的结果应有如下形式:
A=A(m_0,e_0);~~~~~~~~B=B(m_0,e_0).
从中反解出m_0 e_0 ,则Lagrangian中的未知参数就变为已知了。于是,我们可以用这个Lagrangian去计算更多关联函数,并和实验结果比对。

这就是QED工作的一般方式。当然,这是一个抽象且过分简化的叙述。现在,让我们在微扰论中逐阶解释之。

在第一阶(即树图),一切都很简单:我们选取电子的两点关联 ,以及双电子-光子的三点关联,作为输入量。除去并不重要的运动学与对称性结构,这两个关联函数就是电子的质量m 与电磁作用的强度e 。在树图阶,对这两个关联函数的计算结果,就是出现在Lagrangian中的参数m_0 e_0 。于是,以上方程简化为,
m=m_0,;~~~~~~e=e_0.
的确,一切都很简单。但是请注意这个细节!我们并没有将me 的测量结果直接赋给Lagrangian中的参数,而是赋给了关联函数。只是在树图近似下,这关联函数的理论结果恰好就是Lagrangian中的参数。无论如何,Lagrangian中的参数并不是可观测量。

现在让我们将以上操作做到下一阶(一圈图)。在操作上,一切都照旧:我们需要通过两点及三点关联函数输入me两个参量,然后用它们反推Lagrangian中的未知量m_0e_0

然而此时有两个新麻烦。一是,一圈图结果依赖于正规化,这一点前已述及。为确定起见,让我们将这结果对正规化的依赖记作对截断尺度\Lambda的依赖。另一个麻烦是,以上用作输入量的关联函数,在一圈图中不仅仅依赖于参量m_0e_0,还依赖于外动量p。考虑到这些复杂性,可知考虑进树图与一圈图之后,的计算结果应有如下形式:
m\sim{}m_0+F(m_0,e_0;p;\Lambda);~~~~~~e\sim{}e_0+G(m_0,e_0;p;\Lambda).
这里不写等号,是因为mm_0,以及ee_0,都是不依赖于外动量的数。但是它们的差,即FG,却依赖于外动量。所以以上表达式显然不够正确。正确的表达式,需要考虑如何测量me。如果它们是在低能实验中被测量的,则应取p=0。可这并非绝对的限制。假如实验是在某个相当高的尺度\mu完成的,那更自然地选取应当是p=\mu。即,
m= m_0+F(m_0,e_0;\mu;\Lambda);~~~~~~e= e_0+G(m_0,e_0;\mu;\Lambda).
这个尺度\mu被称为重整化尺度,而这种从理论上定义可观测量的方式(即,将关联函数中冗余的外动量固定在一个尺度的方式),被称为重整化方案。需要注意的是,重整化尺度无论如何不是由实验完全决定的,而可以人为选取。反解以上方程,可得,
m_0=m+\tilde{F}(m,e;\mu;\Lambda);~~~~~~e_0=e+\tilde{G}(m,e;\mu;\Lambda).
这样,我们就获知了Lagrangian中的未知参数m_0e_0,并可以用它们来计算其他可观测量,如电子的反常磁矩。

可是我们立刻会想到一个问题:经过这一套手续所得的Lagrangian的参数m_0e_0,不仅依赖于实验输入me,还依赖于两个人为选取的参量\mu\Lambda——当然这本身不是问题,因为m_0e_0属于理论的“内核”而非“接口”。我们的担心在于,用它们算出的可观测量是否也依赖于这两个人为选取的参量。当然,一个“好的”理论,其预言不应当强烈依赖于这些人为因素。

我们将在下一节解释,对于QED而言,重整化的奇妙之处,就在于用m_0e_0算出的任何可观测量,对重整化尺度\mu和截断尺度\Lambda的依赖都很弱。(当然,从重整化群理论的观点看来,这个“奇妙之处”完全在情理之中。)你会对这种很弱的依赖感到不适吗?如果会,请不要忘记,我们在使用微扰论做计算,所以在有限阶,本不应期待精确的结果。

§4 正规化方案?重整化方案?

我们在上一节看到,在一圈图水平,QED对可观测量的计算结果依赖于两个人为的参量:截断尺度\Lambda和重整化尺度\mu。其实这只是整个故事的冰山一角。请回忆这两个人为的尺度是如何被引入的。截断尺度来自正规化方案,而重整化尺度来自重整化方案。所以,可观测量的一圈图结果,不只是依赖于两个人为的尺度,而且是两种人为的计算方案。为理解这种依赖性的意义,让我们稍稍进入细节。

先说正规化。前文已反复说明,正规化是定义路径积分测度的手续,在微扰论中,则表现为定义圈积分的手续。这种定义本身,原则上与经验世界并无直接对应,而纯粹是人工的产品。至于这样从心所欲的定义是否恰当,则要看由此导致的理论是否能通过实验观测的检验。实践中,最重要的检验来自对称性。我们在经验世界中观察到了很多很好的对称性,如相对论的时空对称性;我们在理论的构造中还可能因自洽性要求而不得不引入一些形似对称性的冗余自由度,如规范对称性。为了在量子场论中保持这些对称性,在定义正规化时自然要小心。对于时空对称性这种经验世界中的对称性,如果我们在做正规化时能保持它,自然很好;如果不能,亦非大碍,只要由此计算出的可观测量与实验结果吻合即可(这其实相当不容易!)。但是,对于规范对称性这类由理论自洽性要求的产物,正规化非保持它们不可。

实际操作中,我们选取正规化方案,时常也受到物理的启发。姑举一例说明之。固体中的声子本来是晶体格子振动的模式,所以本来是非连续的有限自由度系统。用声子场描述之,是低能近似的结果。在接近及小于晶格间距的尺度上,用以描写声子的场论自然不合用了。所以,晶体本身为声子场理论提供了一个自然的正规化:将时空在晶格尺度上离散化为有限维系统,并宣布理论在此(能量)尺度以上失效。这里的晶格尺度,就是前文提到的正规化尺度\Lambda [5]。

由此不妨设想,时空本身也是离散的格子,只是这格子的间距极小,比当前对撞机所能达到的尺度还小得多,所以尚未被看到。如此一来,我们便可用晶格的方式做正规化,只要正规化的尺度\Lambda足够高,比高能实验中的典型能量尺度还高得多,则这种正规化方案似乎就合用,无论时空本身是否真的是晶格。

然而在粒子物理中,我们极少使用晶格正规化(除非做格点计算),而是它的各种修改版,因为晶格正规化显然破坏时空的连续对称性。但是,这些修改版中,截断尺度\Lambda的物理意义保留了下来(虽然在维数正规化(dimensional regularization)中这不甚明显)。所以,总的想法是,只要这截断尺度足够高就行了。
再说重整化方案。它比正规化方案简单地多。请回忆,在前一节中,我们用电子质量m与电磁作用强度e这两个观测量,在关联函数的外动量p等于一个特定的尺度\mu时,为理论做初始输入。但这不是唯一的做法:只需注意到Lagrangian中有两个未知量,所以我们大可取任意两个“相互独立的”可观测量(比如各种四点关联函数),在任意的尺度\mu做输入,然后将两个未知量反解出来即可。这种对输入量和输入尺度的选择,就叫做重整化方案。

明白了这些,我们就可以解释,用QED的一圈图所算出的可观测量,在多大程度上依赖于正规化方案和重整化方案。

仍然先讨论正规化。在上一节末,我们提到,用QED的圈图展开计算可观测量的结果,对截断尺度\Lambda的依赖很弱。现在我们来刻画这里的“很弱”有多弱。如果我们选择的正规化方案正确(比如,保持了所需的对称性),则由此计算出的可观测量对截断尺度\Lambda的依赖,总是形如(E/\Lambda)^n,其中E是可观测量所在的典型能量尺度,而n是正整数。现在,既然\Lambda是一个任取的高(能量)尺度,则总可以将其取得任意高[6],从而可观测量对截断尺度的依赖就任意弱,所以总可以弱到实验测量的精度之内。因此,对正规化的依赖,不是问题。

请注意,我们单是陈述了这种依赖很弱,但并没有解释其原因。此处我们暂时不解释它,并将这视为一种“奇迹”。物理学家管QED的这种“奇迹”叫做“可重整性”,即是说,QED是一个“可重整化”的理论。反之,我们也有不可重整的理论,如广义相对论。如果说可重整性是奇迹,那么不可重整就是灾难。然而物理理论不是圣经,充满“奇迹”或“灾难”的故事自然无法令人满意。然而事实上,直到七十年代之后,物理学家借助重整化群理论,才理解了,为什么可重整的理论不是奇迹,而不可重整的理论不是灾难。这一点,我们将在以后解释。

现在我们讨论可观测量的理论计算结果对重整化方案的依赖性。按照前文,重整化方案包含两部分,一是选取作为输入的可观测量,二是选取输入的尺度\mu

关于输入量的选取,我们在QED中看到,选取电子的质量m和电磁作用的强度e,(至少在树图)可以简化表达式。然而在实践中,简化表达式的选取并非最佳,因为输入量自身携带着实验精度的限制。所以,最佳的方案,时常是选取那些实验上测量地最精确的量。事实上,这正是电弱理论的标准做法。所以,选取不同的输入量所引起的差别,一部分来自实验的误差,另一部分,来自微扰计算的误差,也就是忽略了更高圈图的误差。

至于输入尺度\mu,一般而言,圈图结果对它的依赖时常形如[\log(\mu/E)]^n,其中E是实验的典型能量。所以,在理想情形下,选取\mu=E可使圈图结果为零,亦即,树图结果就足够精确了。然而,可观测量所对应的关联函数时常依赖于好几个能量E。所以在实际操作中,选取\mu的方法往往是使得高圈图的修正尽量小。

所以,尽管对可观测量的计算结果依赖于人为地重整化方案,但这依赖是可控的:它们一方面来自实验误差,一方面来自微扰计算的误差。所以,至少在低阶的微扰论中,计算到越高的阶数,使用不同重整化方案所造成的差别就越小。下面两张图来自QCD的实际计算[7],它们形象地展示了这个结论。
HbbbarQCD

这两张图展示的计算结果是标准模型的Higgs粒子衰变到一对正反b夸克的衰变宽度(即衰变率的倒数),作为Higgs粒子质量的函数。两张图使用了两种不同的重整化方案。在每张图中,自上而下的曲线对应于微扰计算的阶数逐渐升高的结果。可以明显看到,随着计算到微扰论的更高阶,两种方案的结果越来越接近。同时,这两张图也清晰地展示了,随着阶数的升高,每一阶产生的修正在逐渐减小。这意味着,量子场论的微扰计算方法是可行的。

§5 正规化和重整化是严格的理论吗?

我希望上文已将量子场论工作的逻辑,以及正规化与重整化的初步想法讲清楚。在这过程中,我有意避免重复标准教科书的内容,而另取一种进路,介绍了量子场论,作为一种可以实际工作的理论,而不是板着脸吓唬人的理论,是如何运转的。请注意,自始至终,我们没有遇到“无穷大”的概念。所以Dirac式的质疑不攻自破。

与此同时,我想着意说明的是,我们面对的是一个精度有限的世界,所以并不在意绝对精确的结果,而允许有误差。只是,我希望通过上文已讲清楚,量子场论的微扰计算,尽管有误差,这误差却是可控的。的确,正是有了这套良好可控的计算手续,量子电动力学才有机会成为人类迄今为止所创造的最精确的物理理论。

如果有时间,我会在以后的文章中继续讨论更晚近的重整化群理论。但在此之前,我想谈谈,上文所描写的这套量子场论是否是严格的理论。之所以讨论这个问题,是因为我时常见到两种相反的意见。第一种意见说,量子场论中到处是无穷大,一片混乱。我们已经花了很大篇幅解释,为什么这种意见应该被扫进历史的垃圾堆。但另一种意见说,量子场论是可以被严格化的,同时,他们搬出处理路径积分的各种高深数学理论,并对那些认为重整化是耍流氓的同学说,读完这些艰深的数学,你就明白为什么路径积分是正确的了。

出于物理的角度而不是数学的角度,我个人对此问题的认识是这样。以本文描述的正规化的方式所建立起来的量子场论,可以被做成数学上严格的理论。——毕竟,如果用晶格正规化,我们所做的不过是有限维线性空间中的微积分。所以,这种严格化的方式甚至不需要借助任何高深的数学工具,也许大学一年级的数学知识就足够了。

但是有同学会问,如果换用另一种正规化呢?如果用动量截断正规化、或者维数正规化呢?——在这种情形下,这些正规化很可能只在微扰论的固定阶上有效,对于整个路径积分而言,它们很可能是没有被定义好的。但是,只要我们在做微扰计算,那就不是问题。这就是物理学家明知regularization by dimensional reduction(维数正规化的改进版)在高圈图是不自洽的,却仍然用它来处理超对称理论的原因。

但是,我得说,本文所描写的这套做法,极有可能不是量子场论在数学上的最终形式,即使它可以被严格化。事实上,我们这样处理量子场论的方法,很像Newton当年用几何学的无限分割处理微积分的方法。Newton用这套办法建立的力学是严格的理论吗?——如果我们承认实际测量的总是有限长的时间和有限长的距离,那么用Newton力学和实验比照时,就只需涉及有限量的比和有限量的求和,所以根本不需要导数和积分——你只要把那个区间做得足够小,就可以获得足够的精度。在这种意义上,由于只涉及四则运算,可以说这样的理论在数学上是严格的。换言之,我们用有限区间为Newton的那套涉及无穷量的运算提供了一种“正规化”。

我们当然知道,这不是最终的故事。实际的情形是,19世纪的数学家为Newton的微积分建立了严格的数学基础。至于物理学家,他们也从来不用有限区间的方式,亦即Newton在《原理》中所描写的那套繁琐的方式,去理解Newton力学,而是径直使用微积分。但是我想说,之所以如此,绝不是因为数学家已将微积分严格化,而是,使用微积分比处理有限区间的求和要简便得多。

所以,我的想法很清楚:也许数学家会在将来找到一种将量子场论以不借助于正规化的方式而严格化的方法,并且,这种方法比正规化的方式要简便地多容易地多。但是在此之前,对于物理学家来讲,如果单是为了理解重整化理论,那些高深的数学就纯属多余。


[1] 本文作者译自renormalization的Wikipedia词条,转引自Kragh, Helge ; Dirac: A scientific biography, CUP 1990, p. 184。
[2] Max Planck说:“新生的科学真理并非通过说服它的反对者而取得胜利,而是,它的反对者最终死去、熟悉这真理的新一代成长起来。”
[3] 至于为何树图结果不依赖于泛函积分测度的定义,有一种直观的理解。如所周知,在通常的配分函数中,被积泛函是经典作用量的指数,它包含经典理论的所有信息。而路径积分的测度,则包含相应的量子理论的信息。正文中又提到,树图结果通常不依赖于Planck常数,所以基本上是经典理论的结果,所以自然不会依赖于路径积分的测度。
[4] 更仔细的讨论,须考虑电子场与光子场的归一化。但由于QED的规范对称性,它们并不是独立的量。所以为清晰起见,我们在下文中亦不考虑这两种归一化的量子修正。
[5] 我们使用自然单位制,所以混用空间尺度和能量尺度。
[6] 我请内行的读者在此暂时忘记QED的Landau极点。
[7] A. L. Kataev and V. T. Kim, arXiv: 0902.1442。

Advertisements

重整化辨义(上)”的一个响应

  1. Pingback引用通告: 重整化辨义(上) | yangshuhang

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

You are commenting using your WordPress.com account. Log Out /  更改 )

Google+ photo

You are commenting using your Google+ account. Log Out /  更改 )

Twitter picture

You are commenting using your Twitter account. Log Out /  更改 )

Facebook photo

You are commenting using your Facebook account. Log Out /  更改 )

Connecting to %s