读书笔记——混沌与分形:郝柏林科普与博客文集(郝柏林/2015)

说到回溯性的工作,我们人类只能做回溯性的研究。在动力系统中有个基本的概念叫作回归(recurrency),你只能研究回归现象,如果一个现象只发生一次,再不重复,没法搞科学。我们做的事都是“似曾相识燕归来”。动力系统中的不动点,老是回归;周期,是定时回归;准周期,差不多回归;混沌轨道也是一种回归,只不过回归的规律比较复杂一些。回溯研究是不可避免的,只能用过去的例子,反过头研究。做结论时,要严格把关,什么结论做到什么程度就完了,不能一般地反对回溯性工作。P97

在随机噪音背景上产生定向的、看起来像是有目的性的运动,是发生在生物活动各种层次上的普遍现象。非平衡统计物理学中经典的郎之万方程,近些年发展的随机共振理论,都会对解释这类现象有所贡献。P150

首先,已经测定的近 2 万个蛋白质的三维结构,只包含不超过一千种基本的折叠单元。为何基本折叠单元的种类这么少?这是一个物理学家们感兴趣的问题,现在已经有了部分答案。原来,稳定的折叠单元不仅要满足某种能量最低的条件,而且要具有唯一性,即同一条一级序列不允许折叠到两个以上能量同样低的结构。那些折叠结果不唯一的序列,已经在演化过程中被淘汰。P151

生物膜的形状问题,是说明描述尺度和粗粒化方法的极好的实例。一提到生物膜,人们就会想到嵌在膜上或穿过膜的各种各样的蛋白质、孔洞和离子通道。然而研究膜的形状时,其实没有必要考虑这些细节,其原因在于它们是尺度相差甚远的两类对象。膜蛋白和蛋白质镶嵌而成的各种通道,是纳米( 1 0 − 9 10^{-9} 109 米)尺度的对象。研究离子通道时,可以在无穷大的平面上模拟,曲率其实没有影响。膜泡通常是微米( 1 0 − 6 10^{-6} 106 米)尺度的对象。研究膜泡时根本看不清嵌在膜上的纳米级对象,膜蛋白的种类或数量只是略为改变宏观描述中使用的一些物质参数。把几何尺度相差千倍的因素混淆在一起,不是提高描述精度,而是模糊研究重点,导致顾此失彼的后果。恰当的粗粒化可以得出精确结论。这是一条重要的方法论原则。P152

考察一个独立生活的单细胞生物。为了维持细胞膜内的生物化学反应,它必须通过细胞膜同外界交换物质。不难估计细胞膜所包容的体积和质量,也容易算出细胞膜的面积,从而得到维持单位体积或质量所必需的表面积。如果把这一比例关系简单地外推到像一个人或一棵树那么大的质量,维持生命活动所需的表面积是颇为巨大的。树木要生长出由粗到细的枝叶,高等动物要发育出从主动脉、支动脉到微血管的循环系统,从气管、支气管直到肺泡的呼吸系统等,其物理原因概在于此。体积比例于线度的 3 次方,面积比例于线度的平方。因此,如果某个特征量 Q Q Q 随线度 L L L 的变化规律是:

Q ∝ L n / 3 Q\propto L^{n/3} QLn/3

而其标度因子 n / 3 n/3 n/3 中的 n n n 的值接近整数,这倒是不足为奇的。

然而,近几年的观察和统计表明,有许多特征量,例如一个生物系统的代谢速率 R R R,其标度因子却是 1 / 4 1/4 1/4 的倍数,即:

R ∝ L n / 4 R\propto L^{n/4} RLn/4

虽然已经有一些解释这件事的理论模型,但争论目前仍在继续。P153

社会科学工作者懂得一些统计知识,社会科学的研究集体里吸收少量有统计训练的人员,可能颇有好处。有些简单的统计概念,其实很有用处。“等概率假设”就是一种重要的分析办法。如果对某事物的各种发展可能性根据现有知识做出分析判断之后,对剩下的各种可能性已经没有更多知识,这时对一切可能状态做等概率假定,往往有一定意义。举一个不十分切题的例子。1992 年在柏林举行第 18 届国际统计物理大会期间,我们与海峡对岸争办 1995 年的下一届大会。当时在 1989 年春夏之交事件的影响下,反对呼声不可忽视。笔者在大会前夕的招待会上动员大陆与会代表分头与相识的国际委员会成员对话。当晚得知,13 位委员 1 人缺席,我们会有 5 票支持,3 票反对,剩下 4 位态度不明。假定双方各得一半票,我们仍操胜算。于是决定不与此 4 人谈话,免得适得其反。结果正如所料,我们以 7 比 5 赢得主办权,顺利地组织了第 19 届大会。

形式逻辑中有一个“充足理由律”,其实还可以补充一个“没有理由律”,就是在没有任何特殊理由时,借助“一般性考虑”寻求答案。这与“等概率假设”有异曲同工之妙。P165

有一位记者曾经对我说过,老百姓习惯于线性思维,要提倡非线性思维。笔者认为不然,老百姓是很懂得非线性思维的。俗话说,某人心眼儿多,那就是非线性。一项新政策出台,人们要“一慢、二看、三通过”,也不是线性思维。相比之下,倒是有些领导总是习惯于线性思维,鼓励则一味鼓励直到出现问题,限制则全面限制,直到僵化管死。

用人们曾经熟悉的说法,要懂得“两点论”,不是两点成一线的简单线性,而是一张一弛、有紧有松的非线性曲线上的两点。P166

热运动是无序之源,温度 T T T 愈高无序程度也愈大。有序来自相互作用,可以用相互作用的能量 E E E 代表。于是,有序和无序两种趋势的消长可以由比值 E / T E/T E/T 刻画。两种趋势的转变点也称为临界点,对于由温度变化引起的相变,这就是临界温度 T c T_{c} Tc

在慢变过程中多种因素都在同时起作用,系统的特殊性表现较多。突变往往由单个参数的微小改变引起,其他的大量参数在突变点上下并无明显区别。为什么是单个而不是一批参数共同起作用?还是前面提到的“没有理由律”或“一般性考虑”。两个参数同时变化而导致突变,要有特殊的条件。单个参数引起突变才是普遍现象。正是因为在突变点附近起作用的参数很少,突变的类型也就有限。突变往往可以根据参数的类型划分为若干普适类,本来不同的许多系统却在突变点附近表现出很大的相似性。P170

突变得以发生的重要条件,在于系统中出现了使原有状态不稳定,而使突变导致的新状态能够“放大”起来的机制,而不在于引发突变的具体事件。这对于我们正确认识和处理各种“突发事件”有重要意义。许多突发事件是自组织临界现象。关键在于消除或化解使系统发生不稳定的内在原因,而不在于寻找和对付可能引发突变的细小和偶然的事件。P171

再说索引。没有索引,是我国不少自然科学书籍不科学的地方,这在社会科学出版物中就更为普遍。值得从第一页读到最后一页的科学著作本来并不多。靠目录和索引迅速查到所需要的内容,原是做学问的一种技巧。P172

引用数字时要注意“有效值”,过高的数值精度,只表示作者心中无数,没有真正的数量级概念。

社会科学中要不要证明?英国剑桥大学三一学院的哲学教授拉斯列特(P. Laslett)自认为是洛克(J. Locke)哲学讲席的现代继承人。我曾经有机会同他谈起带中国研究生的情况。他说,同中国学生工作很困难。这些学生总是喜欢说“我认为”,而不是“我证明”。
P173

SFI(圣菲研究所)的研究工作不是从概念到概念的空洞议论,而是基于大量数据或实地考察,辅以模型研究和计算机模拟,并且尽可能提炼出一些理论思想。P220

我们做理论物理的人粗略地把世界上的问题,把我们做的事情分一分,可以分成两大类:一类叫干净系统,一类叫肮脏系统。干净系统都用很漂亮的一些高深理论。肮脏系统做的一些更实际的东西,液体、固体、气体、软物质、生命物质等。做这些事情你得想办法解决问题,但是不一定从一开始的时候就能够用上干净漂亮的数学。

你们可以问我复杂系统有些什么基本性质,但是不要问我什么是复杂系统。因为做科学不能从定义出发,而要从具体的问题出发。谁要想定义什么是复杂性、什么是复杂科学、什么是复杂行为,然后从此开始研究,这个道路大概走得不对。当你研究过很多很多这样的系统之后,或者读过不少书和文章,对别人的研究也有一定的了解之后,我个人比较概括地总结出复杂系统有三个特点:第一个特点就是它的许多行为、许多表现都是不可逆的,它不会简单地重复,它是随着时间不断向前发展变化的。这件事情大家比较容易承认。太阳系、地球和生命现象都是这样——不断地演化、不断地变化。第二个特点,很多人可能不大注意,实际上非常重要,就是在复杂系统中间可能出现突变,突变就是它的许多行为在某一个转折点发生了突然的变化,它变化的原因来自内部而不是外部。大家想一下牛顿定律告诉我们,在力的作用之下,如果你没有别的作用力,简单的说法叫做“静者恒静,动者恒动”。它沿着一个方向一直运动,如果有力它才可能加速。在你的力作用之下,如果没有一个别的方向的力影响它,它就沿着一个方向走下去,它不会突然转弯。突然转一定有原因,而这个原因在你的力之外,就是有另一个力影响它,它就转弯了——这是简单系统。复杂的系统,往往由于一个内部的原因在某一时刻改变它自己的状态,产生突变。这样的事情在物理学,在社会、在各个方面有很多。当然我今天的目的不是说这件事,只是把突变的这个性质先摆在这里。第三个特点就是它的长时间的行为是不可预见、不可预言的,或者说不可预测的,这指的是长时间的行为。实际上这个不可预测的重要原因之一是因为它可能发生突变,而突变往往很难预测。只有在非常临近突变的时候,你才能感到会发生变化。在我后面讲的内容里,我还会讲这件事。所以我讲的这几个方面都跟时间有关系,它随着时间不断地变化,不返回原来有过的状态,它不可逆,它可能发生突变,它的长时间行为是不可预测的。P278

一些记者、通俗科学文章的作者们把它概括为蝴蝶效应,甚至于有些人说由于蝴蝶效应,一切都变得不可预见、不可预测了。这种说法是不对的。人类不可能丧失他从来没有拥有过的东西。从人类预测的本事说,我们对类似蝴蝶效应所代表的这些事情,在最近二三十年有了更多的了解。实际上这个了解增加了我们的预测本事。P279

我在这个报告里就是讲突变的问题,讲突发事件。我没有具体分析哪件事,但是我的一个基本思想是,看这些突发事件的时候,你要想找到导致突发事件的某个具体原因会极为困难。关键要看一下有没有条件使得一个状态要往另一个状态变,某种状态不稳定了,另外一种状态要冒出来。P284

你要去追求这个对称破缺的原因是非常难的。实际上有些人在做,我个人不去研究这事,因为往往是非常次要的、小的事情决定的。重要的是要有一个机制,使得某种状态得以放大。P285

有不少朋友夸我记忆力好,比方说,我讲话的时候,我可以把很多东西引用出来,很多书我都知道。我自己明白这不是记忆力好,这是下功夫的结果!举个例子,今天中午我在一个地方吃午饭,大家在那儿聊天,聊到了卓文君跟司马相如的故事,聊到了司马相如名声大了,官大了,就想娶小老婆了,卓文君很生气,就写了一首诗给他,跟他断交。卓文君写的这首诗,年轻的时候念过,但是我就想不起来了。我告诉你们,脑子是一个很大的存储器,很多东西放到里头,但是你的这个存储器的索引系统有时候搞不好,到用的时候就拿不出来。我们大家都有这个经验,考试的时候某道题怎么样都答不上来,最后没办法,垂头丧气出了教室。刚一出教室,想起来了。这说明你没忘,就是该用的时候没拿出来。这种情况要自己锻炼,包括要经常想办法,翻箱倒柜地重新组织自己的知识,要很多次地回忆和重复。很重要的一条:不承认自己忘了!P289

复杂系统有什么共同特点呢?我想至少可以指出以下三点。
第一,复杂系统是由大量相互作用着的子系统或小单元组成的,并随时间不断变化着的体系。这里最重要的是相互作用和随时间变化。我们在下面再展开解释。
第二,复杂系统可能因为内部原因而发生结构或行为的突变。这是容易被人提到的突变。
第三,复杂系统的长时间行为是不可预测的,而不可预测的重要原因就是上面提到的突变。

对于线性系统,各个子系统的局部最优就导致整体最优。而非线性系统不是这样,局部优化不一定能导致整体优化。P291

信息论定理、生物学“公理”

香农 1948 年论文的标题是《通信的数学理论》,它分两部分发表在《贝尔系统技术杂志》第 28 卷。香农当时考虑电报信号传输问题,因此讨论 0 和 1 两种符号组成的序列。

这篇论文给出了现在广为人知的信息定义。为了说明这个定义,我们需要回顾一下人们试图为信息下定义的历史。这里的困难之一是如何脱离信息接受者对“信息”的主观评价来客观地给出信息的数量测度。

早在香农论文发表前 20 年,哈特雷(R. Hartley)曾在同一个《贝尔系统技术杂志》上给出第一个客观的信息量定义。假定某个时间有 N N N 种概率相同的发生方式,每种发生方式的概率都是 p = 1 / N p=1/N p=1/N。在没有接收到任何消息时,接收方掌握的信息量为零。一旦知道了某一个方式发生,就得到 − log ⁡ p = log ⁡ N -\log p=\log N logp=logN 的信息量。这里取对数是为保证独立发生的事件的信息量可以相加。例如,只知道朋友要生孩子时,关于孩子性别的信息量为零。一旦知道生了个女孩,得到的信息量是 log ⁡ 2 \log 2 log2;如果取以 2 为底的对数,信息量就是 1。

假定有 N N N 条符号序列,其中每一条序列的概率并不相同,第 i i i 条序列的概率是 p i p_{i} pi, 那么这个集合所包含的信息量就是每条序列的信息 − log ⁡ p i -\log p_{i} logpi 以概率 p i p_{i} pi 做权重的“加权平均”:

H = − ∑ i = 1 N p i log ⁡ p i H=-\sum_{i=1}^{N}p_{i}\log p_{i} H=i=1Npilogpi

这个 H H H 就是香农所定义的信息; H H H 又称为不确定性或香农熵。

香农的论文里还有几个数学定理。我们把其中的第三定理全文抄录在下面。

任意给定两个数 ϵ > 0 \epsilon >0 ϵ>0 δ > 0 \delta >0 δ>0,总可以找到这样一个 N 0 N_{0} N0,使得一切长度 N > N 0 N>N_{0} N>N0 的序列分成两个集合:
(1)一个集合,其全部成员的总概率小于 ϵ \epsilon ϵ
(2)另一个集合,其每一个成员的概率 p p p 都限制在以下范围内:

∣ log ⁡ p − 1 N − H ∣ < δ |\frac{\log p^{-1}}{N}-H|<\delta Nlogp1H<δ

怎样形象直观地理解香农定理的含义呢?我们以 DNA 序列做具体例子。取一切长度为 N N N 的 DNA 序列来,基于 4 个字母的这些序列总共有 4 N 4^{N} 4N 条。只要 N N N 比较大, 4 N 4^{N} 4N 就是非常巨大的数字。对于小小的细菌基因组, N N N 可能达到几百万, 4 N 4^{N} 4N 已经是“超天文学”数字,更不用说人类基因组 N N N 达到 30 亿。香农定理我们,这个巨大的序列集合可以粗略地分成两个子集合:一个小集合,其中各条序列的总概率加到一起不超过事先给定的一个正数 ϵ \epsilon ϵ;一个大集合,其中每条序列的概率虽然可能彼此不同,但是都在由香农熵 H H H 按上式限定的范围之内变化。

这个大集合是最可能遇到的“大路货”的集合。香农在文章里说,这同如何解释“最可能”没有关系;这是典型序列、随机序列的集合,可以从这个集合中任意抽取一条或多条序列,计算它们的一些统计量,例如每种字母的平均出现次数以及偏离平均值的方差等,所得结果不尽相同,但也相差不多。任何一条序列的统计性质可以大致代表整个集合。

与大集合成为鲜明对照,那个小集合是非典型序列的集合。例如,有一条序列全由字母 A A A 组成;这样的序列一共有 4 条,还有 12 条“周期”为 2 的序列,如 A C A C ⋯   , C A C A ⋯ ACAC\cdots,CACA\cdots ACAC,CACA 等。对这类序列做统计分析没有什么意义,倒是前面的简短文字给出了万正确确切的刻画。还可以列举出更复杂的“周期”或“准周期”序列,乃至“混沌”序列等。每一条这样的具体序列的概率都是 p = 1 / N p=1/N p=1/N;当 N N N 很大时, p p p 是很小的数,小集合中所有序列的概率加在一起也小于香农定理中的 ϵ \epsilon ϵ。然而,当 N N N 很大时,小小的非典型子集合中的序列数目其实也很多。

从自然界里用粗粒化方式提出来的 DNA 序列和蛋白质序列,在一切同等长度或更长的序列中,究竟属于大的典型序列集合,还是小的非典型序列的集合?这些序列是几十亿年自然界中突变、竞争和选择的结果。笔者不会证明,但是有一种信念:从自然界中抽取出来的生物学符号序列,不是随机序列,而属于同等长度或更长的序列集合中的非典型序列子集合,对它们几乎要一条一条地具体研究。由于不会证明,我们把这个论断称为生物数学的“基本公理”。

这条基本公理说明了统计方法对研究生物学数据的局限性。首先,由于数据量巨大、不完备,包含着实验噪声和测量误差,统计处理是必不可免的第一步。然而,只有超越统计,才能揭示更基本的生物学规律和内在机制。各种数据采矿、知识发掘、关联分析乃至统计预测,使用得当可以提供一些有益信息,但是很难达到较高的精度,更难深入生物过程的本质。难怪有一篇评论文章,标题就叫作“统计预测的 70 %” 路障
。其实,问题不在方法论或数据量,而在于生物现象的具体、特殊和“非典型”性质。超越统计的努力,必然涉及组合学、图论、代数语言学等离散数学方法,在此只能一笔带过。P304

这里要特别注意物理学和生物学思维方法的巨大差异。物理学比较重视稳恒态、守恒性、能量均分、遍历性。演化是遍历性的破缺,这里没有稳恒、守恒、均分和遍历。演化不是随机过程。然而,某些小概率事件对于生物物种走上显著不同的演化道路却起着决定作用。尽管绝大部分基因组测序计划是为了具体的“功利”目标提出,大量积累的基因组数据却已经有助于认识地球上生物演化过程的整体图像。

达尔文在其 1959 年出版的名著《物种起源》一书临近结尾处有一段话:“很可能所有在这个地球上生活过的有机体都来自某个生命开始第一次呼吸时的原始形式。”在同一年的 9 月 26 日,达尔文写给郝胥黎的信里明确表达了自己的信念,将来会有一天构造出自然界里主要生物门类的亲缘关系之树。根据从自然界中发掘出来的各种事实和数据来寻求芸芸众生的亲缘关系,构建大自然的“生命之树”是达尔文以来一代又一代生物学工作者尝试过而且取得了不少进展的课题。在很长时期里,这些研究基于“观察”。然而,早在 1965 年,鲍林与合作者就指出,蛋白质不仅是生物功能和结构的载体,而且在蛋白质序列里还保留着演化史的残缺记录,可以靠序列比较提取生物演化的知识。时至今日,基因组和蛋白质组数据大量涌现,构建生命之树的努力有了坚实的分子生物学基础。
对于多细胞的动物和植物,从形态学、解剖学、胚胎学、生理学等种种数据构建的亲缘关系,受到从不同地质时代留存下来的各种化石的检验。从分子数据构建的生命之树,并没有推翻从宏观数据得到的结论,而是支持和细化了过去的主要研究结果。这种宏观与微观的一致性是物质世界统一性的表现。P307

王竹溪先生关于遍历理论不是统计物理的基础;细致平衡可以保证总平衡,但总平衡不一定只由细致平衡保证;近平衡的三种非平衡过程的关系等种种论述,多年来指导着我的思维。P310

物理是一门历史科学。一部《普通物理学》的目录,就是一份物理学史提纲。历史和逻辑的一致性,在物理学的发展中表现得极为清楚。P314

我们花了不少笔墨概述物理学史上的一些事件,特别是前文给“转化”二字加上引号,是因为中国传统文化的弱点,至今还在限制着现代科学的发展。科学与技术不是一回事。科学,特别是物理学,不断扩展着人类的世界观、方法论和自然观;科学的内容与作用远远多于“生产力”。中国有着把科学与技术混为一谈、以技术涵盖科学的古老传统。简单、机械的理论和实践观,一直在妨碍着学者们安心致志、长期坚持地做出事情。这是急功近利的科学技术政策,阻碍着我国的工业生产立足于自己的基础研究成果。我们必须从文化层面上考察物理教育,从教育入手来改变状况。

文化需要沉淀和积累,而中国的传统文化里缺少从事科学试验、演绎推理、证实排伪的精神。

两千多年来,多少代优秀的中国知识分子把毕生精力用于遣词造句和诠释前贤。中国历史上没有像布鲁诺那样的科学殉道者。

魏晋时代的清淡之风,当时还有过抵制政治迫害的积极意义。后人忘其所以,乐此不疲。有人以中国文化的“整体”和“综合”傲视西方科学的分析传统,有人热衷于从《周易》里寻求现代科学问题的答案。其实,对自然界的分析研究没有做过多少贡献的人,并无资格侈谈整体和综合。《周易》充其量只是“人类幼年时期的天才创造”(马克思评希腊神话语),少数爱好者继续研读,本来无可厚非;用以误导学子,则理应坚决反对。P319

杨振宁先生对昂萨格说,我可以跟随你的全部推导,计算出那一大堆对易关系,但是始终不明白你是怎样走到这一步的。那天昂萨格的情绪很好,打开了话匣子。昂萨格说,他离开欧洲到美国之际,听说有人把两根一维链连成一架梯子,还可以精确求解。于是试着把三根、四根、五根一维链横着连起来,计算出配分函数。一直算到七根,就悟出一般算法,写成文章。P331

那是在 1984 年到 1986 年,李先生协助把国内的博士后制度建立起来。建立这一制度的关键在于说服邓小平。所以他好几次见邓小平解释博士后制度,讲什么是大学生,什么是博士,什么是博士后。他这段话的大意是:大学生学完几门功课,做出跟标准答案一致的习题和考卷就很好了;研究生在老师建议的方向和范围里头,独立做出别人,包括老师都不知道的新结果,老师请几个同行教授审阅,大家都找不出问题来,认为结果是对的,有创新内容,他就可以拿到博士学位了;博士后则要自己找到方向和题目,把新结果做出来,这才能达到真正独立进行研究的地步。

我们跟学生在一起、带学生,有一条非常重要:就是老老实实做学问,我把这话放在题目里。作为导师,你自己得干活,你自己得工作,你才能够带学生。这里再举计算机的例子,现在的计算机非常发达,我想即使社会科学、人文科学的人也在用机器。我们当老师的一定要提防一件事,就是被自己的好学生给骗了。他也不是存心要骗你,他以为这个结果是正确的,由于你自己实践不足、经验不足,查不出这个问题来,你被他“骗”了。P364

我自己非常怕带已经有了硕士学位、三年里要拿博士学位的学生,我最愿意带的是五年连贯的直博学生,我想很多人可能都有这种感觉。

还有,当老师的不能太聪明。中国的老话,毛主席也引用过的,叫“水至清则无鱼,人至察则无徒”。还有“不聋不瞎,不为公婆”。你太聪明了,徒弟就带不出来了。P367

这次会议上有位学物理的年轻人发言说,根据相对论,珍宝岛事件中谁先开枪,只要换一个参考系就可能颠倒过来。他忘记了洛伦兹变换保持因果性不变这一基本原理。P377

研究机构的设置和大学专业的划分,总是落后于科学发展。从哪一门学科开始并不重要。学科交叉不是议论,而是实践。要自己找切入点,而不是靠别人指点方向。要“眼高手低”:内心深处总是惦记着重大和根本的问题,但从早到晚下功夫掌握事实、搜集数据、静心思考、反复计算和分析,通过粗粒化和视像化来形成概念、提出问题。不管是“用牙啃”,还是“用脚踹”,要想尽一切办法解决问题,而不是把自己欣赏的某种方法或框架强加给大自然。力争“全局在胸”,坚持“单刀直入”。入门是不难的,深入也是办得到的,但是,“找到感觉”是不容易的。P379

猜你喜欢

转载自blog.csdn.net/qq_32515081/article/details/126725404
今日推荐