Why yet another?

nature-trendwatch-new-boson-online (5)

1.

在博客搬到WordPress之后,我的美好愿望是做到平均每周更新一次。目前的实际效果略低于预期,不过仍在可忍受的范围内。为了不至于差太多,现在该是写新日志的时候了。其实,从12月15日CERN的发布会之后,我大概就知道这篇日志将会是命题作文。(还不知道发生了什么的读者,请先读这篇文章。)

自然,我不会在这里讨论这个新信号的可能来源,不会讨论目前有多少热门理论如何试图解释它,不会讨论理论家如何千奇百怪的猜测。对这些细节感兴趣的读者,应该去看arXiv的每日更新。而不关心细节的读者,则可借本文的题图一窥12月15日以来理论家们就此题目竞相炮制新论文的盛况。

这张图来自nature的另一篇新闻,其中还提到了高能物理学界近年来的两次类似事件,其一是2011年OPERA实验组宣称发现“中微子超光速”,其二是2014年BICEP2实验组宣称发现原初引力波的结果。当然,这篇新闻没有提到2012年Higgs玻色子的发现。所不同之处,前两者在事后都被确认是闹了乌龙,而后者,即Higgs玻色子的发现,最终成为高能物理学史上的丰碑。而相同之处,无非实验家弄了个大新闻,理论家跑得比谁都快。

这篇新闻继续添油加醋道,前两次乌龙事件中,实验组无论如何都宣布了明确的结果、发表了论文,理论家方才一哄而上。而这次,实验结果只有初步的迹象,全无定数,实验组也没有发表论文或者预印本(只有会议报告),而理论家灌水的热情却丝毫不减,有过之而无不及。

不过公正地看,此轮“灌水”事件实在情有可原。事实上,如果说1897年 J. J. Thomson 发现电子可被视作现代粒子物理学的开端,那么粒子物理学这一百年来的历史,都可以概括为“发现标准模型”。2012年Higgs玻色子的发现为这一历程画上句号。自此以往,实验家如若发现了任何新的基本粒子,都将是超越标准模型的直接证据,从而成为整个基础物理学的划时代事件,其意义之深远,或许连2012年Higgs玻色子的发现都无法比拟。

此番实验结果究竟是新发现的端倪,还是统计涨落的玩笑,目前自然无从得知。不过一切都使人想到2011年末。那时,Higgs玻色子的信号也初露端倪,不强不弱:还没强到能宣称发现,但又没有弱到让人轻易相信是统计涨落。而在LHC提高能量和亮度之后,Higgs玻色子的真身终于在来年夏天破茧而出。现在,如果我们去读理论家近十天的文章,应该不难发现,每个人都在盼望明年的实验结果,每个人都深知现在的结果有可能是假象,但每个人都渴望理解这个信号:如果真有个新粒子在背后,究竟会是什么。这自然就是粒子物理学的刺激之处了。

 

2.

不过抛开此次事件具体的物理背景不谈,我们还是忍不住想问,理论家炮制这么多的文章,究竟在做什么。至少,在我自己刚养成每天刷arXiv的习惯时,望着每天数十篇数十篇的文章,这个问题就一直挥之不去。最近看到有同学就此事件评论说:“实验家拿理论家当猴耍”,倒让我想起很久以前见过的另一个说法:理论家是农夫,实验家是猪;农夫指着哪里,猪就去挖哪里。及至猪挖出来点什么,农夫就立刻宣布:“这是我发现的!”

让我们暂且抛开这些颇有成见的玩笑话,来看看理论家究竟在做什么。高能物理是一门典型的大科学。经过一百多年的发展,在其中从事理论研究的科学家,已经形成了一条范围宽广的光谱。这个光谱的一端系于实验,而另一端则嵌入数学。每个物理学家,在这条光谱上的活动范围或宽或窄不见得非得局限在一处,但是仔细看去,还是能分辨出一些较为清晰的范围,就像虽然光谱上的颜色连续变化,但你还是能粗略地说,其中这一段是黄色、那一段是绿色之类。

其中,最靠近实验的理论家需要帮助实验家处理数据。比如,如何从海量的对撞中初筛我们感兴趣的事例?如何从肮脏的对撞结果中提取出尽可能多的物理信息?如何在起伏变化的数据中量化信号的显著程度?这些问题实验家非常关心,它们需要实验家与理论家的紧密合作。

接下来是离实验稍远一些的工作。比如,如何从理论上将观测量尽可能算准?比如,假设实验的测量精度已经达到3圈图,那么理论家也得设法算到3圈图的精度。再远一些的工作,比如,如何从某个实验结果中提取出一般的、与模型无关的结论?

好了,到此为止都是和实验紧密相关从而非常重要的工作。接下来,离实验更远一些的理论工作,基本上就达到了这个光谱的中点:既非与实验直接相关,也与数学关系不大。这就是理论模型的构造。它们在题图中的那么多论文里占有相当大的比例,也是我想在下文仔细讨论的部分。

印象中,很多量子场论教科书的作者会在序言里自问:前人已经写了那么多,为何还要再写一本?很多试图录制全套贝多芬交响曲的指挥和乐团也得在唱片小册子或者别的什么地方解释一番:前人已经录了那么多,为何还要再录一版?

Why yet another one?现在,我们未尝不可、而且似乎特别有必要对这么多层出不穷的模型发此一问:arXiv上的预印本堆积如山,何故再写一篇?

“因为要灌水刷存在感刷引用数混口饭吃等等等等”,这大概是最容易想到的答案。我一点也不否认这些因素的存在,而且也承认,它们在某些不幸的情形下还有可能成为主导因素。但是除此以外真的没有其他原因吗?

我坚信有。除开别的不说,我很难想象大多数头脑冷静而理智的物理学家会纯粹为了混口饭吃而节操掉尽。所以,我在这里就以我自己的理解、以及过去几年中得到的一点点经验,试着解释这个问题:理论家构造如此多模型的用意何在?

 

3.

不过在解释这个问题之前,我想先讲两个很小的故事。在过去若干年里,我自己也试着做过一些理论模型。而每当我想试图构造一个新的模型时,这两个小场景就会不由自主浮现在眼前。

第一个场景是大学三年级时俞允强老师的课堂。俞老师讲授的宇宙学是我在大学时代听过的最好的物理课。我永远记得,当他讲到宇宙学模型时说,物理学家要想构造一个符合已知所有观测结果的模型,易如反掌。我永远记得,他面露微笑、一字一顿地说出“易如反掌”四个字,同时摊开手掌轻轻翻动的样子。

六年后,俞老师参加了我的博士论文答辩会。在我讲到过去几年自己做过的几个宇宙学模型时,心里还惦记着俞老师当年微笑着慢慢说出“易如反掌”的模样。

第二个场景来自王贻芳老师在清华的一次报告,那时大亚湾中微子实验刚测到中微子的第三个混合角\theta_{13} 。他的幻灯片里有一张图使我印象深刻:这张图的横轴是\sin^2(2\theta_{13}) ,从0一路铺到0.1。而纵轴则是预言\sin^2(2\theta_{13}) 为某特定值的理论的数量,一眼望去,黑压压一片山峦起伏。这时,出现了一道红色的竖线,像一柄利剑径直刺入重峦叠嶂之中,王贻芳老师随之说,这就是我们大亚湾实验测到的混合角。那仿佛就是在说:“被剑刺中的,you are the chosen one;剩下的模型,你们可以去死了。”

模型,这些得于反掌间、朝生而暮死的可怜虫,它们究竟是什么呢?

大而言之,在我们的语境下,“模型”可与“理论”对举。在这对概念中,理论扮演相对普适、恒常、稳定的背景,而模型则是特殊的个例。历史上,随着物理学研究对象的演进,模型的概念经历了持续的蜕变。在作为理论的牛顿万有引力定律中,行星运行是模型、苹果落地是模型。而在更一般的经典力学理论中,牛顿万有引力特殊的平方反比率则是一个特殊的模型。在作为理论的电动力学中,偶极子是一个特别的模型,而在场论的一般理论中,电动力学则是一个特殊的模型。及至今天,蕴含电动力学、弱作用与强作用理论的“标准模型”,也只不过是无数可能性中的一种而已。

上面这样粗略的勾划漏掉了很多关键的细节,但是却传达出一个重要的信息,那就是物理理论中实在性的松动。在历史上,人类花费了上千年时间,才从托勒密的理论中挣脱出来,得到了哥白尼体系、直至17世纪牛顿提出的力学理论。与此对照,人们在19世纪已经做好了将牛顿力学降级为模型的准备,直到1905年狭义相对论的提出,使人们确切意识到牛顿理论的确也只不过是一个近似的模型——这之间仅有两百多年。再后来,人们从20世纪60年代就已开始从理论上提出探测Lorentz对称破坏的可能性,这意味着至迟在60年代,人们已经从心理上做好了将狭义相对论视作一种特殊的模型的准备。而从电动力学、经过量子力学一路演化到标准模型的历史,更明确地证明了这一点:物理学家为突破已有框架而需付出的心理代价越来越小:牛顿力学并不是康德所坚信的先天综合知识,而不过是对现象世界的良好近似。曾被奉为圭臬而牢固不破的理论,无论如何也不过是一种特殊的模型而已。

现在,当我们提出一种新的“模型”来解释诸如750GeV的凸起时,我们是在和“标准模型”并置的意义上使用模型一词。既然人们已经不再视标准模型为颠扑不破的理论,也就没有理由如此要求那些意图取而代之的新模型。在理论降级为模型的过程中,神圣的实在性离场了 [1]。

取而代之的是有效性。这一点我在以前的若干文章中曾多次谈过,这里不再仔细讨论,而只是简单提一个我多次使用过的比喻:在有效性的方法论下,现象世界变成了一个黑箱子。在这黑箱子的表面,有若干的输入输出端,人们通过实验和观测对黑箱子作输入、读输出。而所谓构造“模型”,实为破解黑箱子内部结构的游戏。

 

4.

为了更直观一些,让我在这里换用另一种比喻:为数列猜通项的游戏。我们从现象世界所得的一切实验和观测结果,就像一个数列的前若干项,无论有多少,它们总是有限的。自然,我们永远无法通过有限项而逻辑地得到数列的全部。但是,就像我们在简单的猜通项游戏中遇见的那样,物理学家时常可以发现某些规律。而且,当我们运用这些规律去外推这个数列的更多项时,恰与实验家对更多项的测量吻合。这就是有效性。

我们不仅能从猜通项的比喻理解何为有效性,同时还能藉此认识到模型构造活动的若干特征。首先:对于任何给定的前若干项,我们总能找到无数的通项公式与之吻合。我们甚至很容易写下这个通项公式的函数形式,径直套用到任何给定的题面上。因此,简单地找到一个解释已知项的通项公式,几乎是无意义的。俞老师所称“易如反掌”者,此之谓也。

因而,模型的预言尤其关键。在这个猜通项的游戏中,比方说,让我们假设前5项是已知的,而此后每过一分钟就多出现一项:第6项、第7项、如此下去。此时,一个好的解就不只是能够拟合已知前5项的解,而是能够正确预测此后各项的解、能够和实验相比对的解。可是,实际的高能物理实验大概很难以分钟为单位产出非平庸的新项。这个时间单位很可能以年计。那么,在下一项出现之前,我们为何还要构造如此多的解呢?我们如何判断哪些解更优呢?

让我先回答第二个问题。在理论家的实际操作中,大体有两点考虑:一要“美”,二要“有趣”。

简而言之,物理模型所谓的“美”,不仅涉及其与更底层理论框架的关系,同时关乎个人的偏好。很不幸,这实在是说不清的问题。大概,每个理论家自有其对美的定义和判据、与为此判据分配的权重。我曾多次作文“声讨”那些对物理学的美毫无保留的赞美和崇拜。但是我得说,诉诸美学考虑无论如何都不是物理研究的缺陷,更不是应当清除的非理性残余。原因很简单:尽管物理理论是逻辑和理性的,但探索物理理论的活动本身却不是。

在我自己有限的经验中,我感到构造模型有如雕刻。有时,尽管可以轻易地吻合数列中的已知项,但我“感到”这不大可能是好的答案,这个雕像在我看来遍身凿痕;而另一些时候,我在反复修改自己不满意的作品时,却能逐渐感到那个“美”的雕像原本就藏在这块石料中,而我只是运气好,将它凿出来而已。所谓文章本天成,妙手偶得之。我绝不敢妄称自己有得天的妙手。这只是说,理论家的确有机会从模型构造的游戏中管窥到这句诗的真谛。

所以不妨以维特根斯坦的方式,将我们关于这世界的知识划分为“明述知识”和“默会知识”。在这种区分下,物理理论是明述知识,而对物理理论的探索活动本身,包括其中的美学考虑,则包含了很多默会知识的成分。

至于“有趣”,则相对容易解释。尽管有趣的标准也因人而异,但在实际的模型构造中,“有趣”确有一种相对客观的标准,那就是能预测有趣的实验信号。须知,实验绝不是完全独立于理论的活动,绝不仅仅是那道从天而降、判决生死的光剑。实验家寻找新现象的动机和方向,相当程度上来自理论家的建议。现代的高能物理实验自是极端复杂,很难想象其实验结果的输出有如一分钟跳一项的数列。很有可能,某个模型预测了在某个意想不到的地方有可能隐藏着有趣的物理现象、在某个容易被忽视的反应过程中隐藏着有趣的信号。这意味着,在现有条件下,实验家也许要首先测量数列的第50项而不是第6项。这就是有趣的模型,如果这个模型还不那么“难看”,那就更好了。

现在可以回到我们的最终的问题了:为何还要构造那么多的模型?——因为它们上通下达。所谓上通者,模型是通往更有效的理论的第一步,而且也是我们在物理中理解现象世界的凭藉。当我们说理解了一种自然现象时,永远是指一种理论的理解或者模型的理解,而不是简单地知道一些实验数据而已。就好像你从显示器上的照片中认出一个熟人的面孔,永远是对其轮廓、五官的一种综合认识,而绝不是记住了每个像素上的RGB值。而所谓下达者,即是指它对实验工作的指导意义。理论家对实验的价值绝不仅在于帮助实验家对数据作处理、理解、对比、分析。理论家对实验的有全面而贯穿始终的影响。尽可能多的理论模型,就保证了我们对如此庞大的实验项目有充足的认识和准备,避免挂一漏万。

到此我们应当能够看出,除了简单地解释已有的实验结果外,理论的构造还受到相当多弹性因素的制约。在此约束下,构造模型的工作就远不是易如反掌了。它需要对底层理论以及现有实验结果、甚至未来实验计划的良好理解。在此基础上,模型构造的工作自有其技艺和品味,而绝无类似多项式拟合数列这样的一劳永逸之途。

从经典力学时代以来,我们对世界的知识经历了从体系化到网络化的转变。曾经,构造一套理论或者模型有如构造一套黑格尔式的世界体系。而如今,模型构造则更像是我们认识世界的知识网络上的重要节点。越来越多的模型与越来越多的实验一道,不断扩张我们的知识网络。

 


[1] 我得说,这并不是所有人的观点。老一代的物理学家的观念似乎就更为传统。据说,Steven Weinberg一辈子只构造了一个模型,那就是为他赢得诺贝尔奖的标准模型电弱理论。自此之后他再没有构造任何新的模型,因为他认为自己应当只构造“正确的模型”。

 

 

Why yet another?”的一个响应

  1. Wienberg 至少还构造了一个也挺有名的模型(Precision tests of quantum mechanics, Phys. Rev. Lett. 62:485, 1989,现在引用数484了)—— 一个非线性的量子力学模型, Polchinski 和 Gisin 证明了这个模型可以允许超光速传递信号, Peres 证明它会违反热力学第二定律。(顺便 Polchinski 的回忆录也提到这个:“我的另一些科幻小说归功于温伯格。他另辟蹊径,问了这样一个问题: 我们如何知道量子力学是线性的?因此他设计了一个非线性的量子力学 的推广理论,这个理论满足特定的自洽条件。它可以和实验进行对比,随 后他发现任何非线性的结果都必须要非常地小。当时我正在研究他的模 型,意识到EPR问题是躲不过去了。信息可以超光速地传播(吉森也发现 了这件事)。我们想要找到避免这个问题的替代理论,但结果发现波函数 的不同分支间也可以相互通信。换句话说,温伯格的原始理论允许我们构 造EPR电话,它可以以超光速的形式传递信息;而修正后的理论可以允许 我们构造埃弗里特电话,它可以实验波函数不同分支间的相互通信。几个 月后,这些想法变成了《幻想与科幻》上的一个专栏。”

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s