当前位置:首页 > 睡前小故事 > 正文

曼克斯猫

摘要:睡前故事365收录曼克斯猫,王室贵族的悲歌——近亲繁殖导致消亡 1922年,英国考古学家霍华德·卡特(Howard Carter)发现了图坦卡蒙国王(King...大家一起来看下曼克斯猫吧。

曼克斯猫 第1张

王室贵族的悲歌——近亲繁殖导致消亡

1922年,英国考古学家霍华德·卡特(Howard Carter)发现了图坦卡蒙国王(King Tutankhamun)的陵墓。在那里,他发现了130根手杖。图坦卡蒙国王去世时只有19岁,这一发现表明有人认为他在来世还需要这些手杖,但直到一个世纪以后,人们才搞清楚了究竟是怎么回事。一个由埃及考古学家扎西·哈瓦斯(Zahi Hawass)领导的研究小组通过CT扫描发现,图坦卡蒙国王身上有着各种畸形,他的左脚是畸形足,右脚缺失一个脚趾。除此之外,他还有唇裂和遗传性骨病。这说明,图坦卡蒙国王还真用得着这些手杖。历史记录和DNA测序都表明,在图坦卡蒙家族的谱系中,近亲结婚非常普遍,图坦卡蒙的父母就是兄妹关系。进一步的DNA研究还有了新的发现:图坦卡蒙国王墓中还埋着两个生下来就夭折的胎儿,他们是图坦卡蒙的孩子,一出生就失去了延续皇室血统的资格。

或许图坦卡蒙国王是皇室中第一个因近亲结婚而遭受厄运的人,但他肯定不是最后一个。3 000年后,类似的命运又再次降临在欧洲的哈布斯堡王朝(Habsburg dynasty)。

哈布斯堡家族的人的长相都一言难尽。走进欧洲任何一个大型艺术博物馆,不用看标签,我们就可以轻易认出他们的肖像。泄露身份的线索是他们共同的奇怪、突出的下唇,也就是众所周知的哈布斯堡式嘴唇。

事实证明,他们所遭受的厄运,远非表面看到的这样。哈布斯堡式嘴唇由下颌前突引起,患者的下颌与上齿无法对齐。这种畸形是在长达6个世纪的小范围的近亲结婚中产生的。这种通婚有助于建立政治联盟,阻止战争,还有助于扩充领土。早在20世纪的遗传学家搞清楚为什么近亲结婚会带来灾难性后果之前,这些贵族就已经在现身说法了。光是看西班牙的哈布斯堡家族,从15世纪的菲利普一世到17世纪的查理二世,他们缔结的21次婚姻中有9次是在表亲之间,甚至是叔叔和侄女之间完成的。不需要用到任何遗传学知识,人们就可以知道一定是什么地方出了问题:在这段时间内,皇室儿童的死亡率高达50%,比普通的西班牙人高出两倍多。

旷日持久的近亲结婚经历了好多代人,终点是查理二世。他身上的麻烦远不止下唇,或许应该说他比一个只会流口水的智障者好不到哪里去。他4岁才会说话,8岁才能走路,身材瘦小,身体孱弱,有大舌头,口齿不清,下颌突出,根本无法咀嚼。他对周围的一切都麻木不仁,最糟糕的是,他还有一种对皇室血统而言非常致命的疾病:阳痿。因此在他之后,西班牙哈布斯堡家族就不复存在了。

身心畸形是近亲繁殖所导致的众多缺陷之一,但我们不能据此认为近亲繁殖都是不好的,它也可以成为一种有益的手段。例如,从事动物育种的人就可以借此强化牲畜或宠物的某些特性。和自然选择不同,近亲繁殖与特性本身是好是坏并无关系,它只是可以将某些特性发扬到极致罢了。专门养牛的人可以选择一头角特别长的德州长角牛,然后使这头公牛与多头母牛交配,这样产出的后代就都是同父异母的兄弟姐妹,其中有些就长着和它们的父亲一样的长角。育种者可以使这些特殊的长角牛继续交配,这样的选择性育种发展几代以后,育种者得到的就差不多都是清一色的长角牛了。类似的选择性育种往往需要一个漫长的发展过程,无论是牲畜、宠物还是植物,就像人们从哈布斯堡家族和图坦卡蒙国王身上看到的那样,而且得到的结果往往是意想不到的。现在,我们用最基本的遗传学知识就可以解释这种现象。

一头长角牛的基因超过两万个,每个都有两个副本,分别来自其父亲和母亲。DNA的复制错误会持续发生,因此两个副本的DNA序列会在很多基因上都存在差异,而在某些基因上,突变可能已经破坏了其中一个副本。在大多数情况下,这并不会造成什么问题,因为毕竟还存在着一份完整的副本。但如果两个遭到破坏的副本在同一个基因组里碰到了一起,那么就会导致遗传性疾病。这种情况并不常见,但有时也会发生。例如,某一头长角牛从其父母那里继承了一个受损的副本,而另一个副本也恰巧发生了突变。如果同一个家族的后代个体重复性地互相交配,这种情况的出现频率就不容小视了。公牛的每一个同父异母的后代,都有50%的可能从父亲那里继承一个受损的基因,如果我们让这些后代继续交配繁殖,它们的再下一代得病的可能性就很大——按照遗传学家的计算,确切的数值是25%。在选择育种的过程中,育种人员也可以使用各种方法来减少患病个体的数量,比如周期性地引入远亲繁殖,或宰杀掉患病的个体,但这些方法也无法完全杜绝疾病的发生。

任何一个家族共享的基因很多都有可能受到过损伤,而近亲繁殖会在不同的谱系中导致不同的缺陷。有些缺陷比较温和,比如牛不长尾巴。(养牛人会认为这只是一个影响牛的外观的瑕疵,但这对奶牛来说并不是件无关紧要的事情,没有尾巴,它们就无法驱赶讨厌的吸血昆虫。)有些缺陷比较严重,如牛的毛发很短。这意味着冬季的时候它们的御寒能力会变差,小牛的增重过程也就会减慢。还有一些缺陷则是灾难性的,如早夭、生育能力低等。所有这些现象都不罕见,就跟上文说到的那些皇室成员一样。

正是由于近亲繁殖不加区分地影响着各种性状,所以在不同品种的牛、狗、猫和其他家畜身上,优点和缺点都是同时存在的(通常缺点是隐性的)。

德国牧羊犬的髋关节经常发生变形,原因是其球状结构和关节窝不能紧紧地结合在一起。结果就是,它们在行走时会产生疼痛感,爬楼梯、直立的时候会很费力,年龄变大后会变得一瘸一拐。

缅甸猫的境遇则要更棘手一些。它们是一种美丽的猫科动物,两只间距很宽、天真无邪的大眼睛中充满了好奇。但可悲的是,它们当中的一些会出现一种可怕、致命的头部畸形,有些小猫会发育出两套上口鼻,头部顶端无法发育成型。这种畸形可以追溯到一只专门配种的猫身上,它繁育了很多优等的、获奖无数的后代,但同时也将缺陷引入了这个品种。这只配种猫的名字叫“喜运”(Good Fortune Fortunatas),遗憾的是,它并没有给那些悲惨的小猫带来什么好运。

在一些动物身上,越是那些能带来迷人特征的基因,越是会带来灾难。一个很好的例子是欧斯亚史烈斯猫,一种令人赞不绝口的拥有墨西哥血统的猫,它因为拥有深蓝色的眼睛而深受人们的喜爱。蓝色眼睛是虹膜缺乏色素的体现,是由一个特定的基因突变导致的。在一只猫身上,如果这个基因的两个副本中只有一个发生了突变,那这只猫就是健康的:蓝眼睛且没毛病。但是,如果这个基因的两个副本都发生了突变,那么猫就会出现颅骨畸形,甚至熬不到出生。

大自然发展出了各种机制来避免近亲繁殖。在有些动物种群中,其后代分布在广袤的地理区域里,彼此距离十分遥远。例如,所有的雄狮和部分雌狮会离开它们出生的种群,远走他乡,以寻找自己的繁殖机会。其他动物,如鹌鹑和田鼠,在兄弟姐妹或共同居住在一个巢穴内的同伴之间,极少发生交配。它们一定是“青梅竹马产生性厌恶”这一理念的信奉者,越是两小无猜,越是缺乏性吸引力。在人类中,这种现象被称为“韦斯特马克效应”(Westermarck effect),以一位芬兰人类学家的名字命名。韦斯特马克首次提出,小时候一起长大的伙伴,成年后会失去对彼此的性吸引力。在以色列的集体社区基布兹中,儿童是被集体抚养的,而在同一个集体社区里长大的男女后来很少会选择彼此作为伴侣。近亲繁殖的植物也会出现发育不良、种子不能发芽等现象,有时还会出现“白化”的、无法进行光合作用的植物籽苗。有研究表明,有些植物的花会对外来的花粉进行检测。如果发现对方与自己过于相似,是从近亲植物或同一株植物上来的,那么就不会受精,更不会产出种子。可以肯定的是,上述这些行为特征也可能是由其他原因造成的,比如狮子离开狮群,也可能是为了避免狮群内的性竞争。但总的来说,这些行为都有助于避免近亲繁殖。

不管怎么努力,大自然的孩子有时候还是会被迫陷入乱伦关系。尤其当一个种群被一场风暴摧残得岌岌可危的时候,或者被猎杀到濒临灭绝的时候,抑或是被驱赶到一个偏远的小岛上时,整个种群只剩下了少数几个个体,基因库只能靠着这最后的星星之火来逃脱灭绝的命运。在上述场景中,最让生物学家着迷的是小岛上的放逐。这不仅因为沙滩和未被破坏的森林是开展野外调查的绝佳场地,更因为岛屿就像一个与世隔绝的实验室。在里面,我们可以观察到一些正在进行中的进化,这一点对于我们理解大自然的创造力非常关键。

假如有4个不相干的人——两个男人和两个女人,因为遭遇船舶失事流落到了太平洋中的一个小岛上。岛上并没有太多的空间、水和食物。自然而然的,这4个人会组成两对夫妇,并分别生下自己的孩子。这两对夫妇的孩子在基因上是不相关的。而在孩子们长大后,如果他们都只与另一对夫妇的孩子结婚生子,那么他们后代的基因也将是互不相关的。但问题是,当他们的孙辈结婚生育的时候,近亲繁殖就不可避免了。原因很简单,孙辈们都有着共同的祖父母,或者说拥有约1/4相同的基因。因此,从孙辈起,岛上所有人就都是同一个家庭的一部分了。

就算是一开始的人群规模要更大一些,最终还是会发生同样的事情:岛上每个人的基因都是相关的,只是时间长短不同罢了。根据经验法则,如果最初有10个人流落到了荒岛上,那么他们需要经历数十代人,才会形成一个大家庭;如果是100个人,那就对应着100代人。从基因学角度来看,这个大家庭并不圆满。最初的人越多,形成一个大家庭所需的时间就越长。但最终,任何规模的种群都会落入同样的命运:所有人彼此间都是亲戚,区别只是有些人的亲缘关系近一些,有些人远一些。

无论是环境所施加的选择,还是人类有目的地进行的育种,结果都会指向遗传病。来自马恩岛的曼克斯猫,以爱尔兰海上的一个面积为570平方千米的小岛上的凯尔特土著人的名字命名。曼克斯猫不像图坦卡蒙国王那样长着先天性的畸形足,但在经历了数代的近亲繁殖以后,它们也有着很明显的缺陷:没有尾巴。这种缺陷会对猫的平衡能力和行动的敏捷性产生影响。更有甚者,许多小猫还会发生脊椎变形,无法顺利出生。一般情况下,曼克斯猫的一胎产仔数非常少,生育力低下。所幸,它们也具有一些明显的优势,比如高超的捕猎技巧,这使得曼克斯猫在农场里很受欢迎,而它们像狗一样的顽皮性情也颇受不少人的青睐。

希尔塔岛上的索艾羊也面临着类似的境遇,当然,这也与近亲繁殖有关。希尔塔岛是远离苏格兰西海岸的圣基尔达群岛的一部分,地形崎岖,地表贫瘠,终日遭受着大风的侵袭。1930年,岛上最后的36名居民因为受够了这里艰苦的条件,选择撤离到了大陆。从那以后,圣基尔达群岛上再也没有人类定居过。与人类不同,索艾羊没得选。当然,它们似乎也不介意,自古以来,它们就在岛上过着“小国寡民”的生活。然而,因为摄入的营养物质有限,以及会受到肠道蠕虫争夺营养物质的困扰,在冬季到来时,70%经由近亲繁殖出生的索艾羊都失去了生命。而其中的罪魁祸首就是数量众多的蠕虫,更进一步说,这是因为近亲繁殖削弱了它们的免疫系统。

同样的模式在加拿大的蒙大特岛上也被发现了。这个岛非常小,占地约6万平方米,位于远离不列颠哥伦比亚省海岸的地方。岛上住着大约100只北美歌雀,其数量多年来一直在上下波动。1989年,在一场严峻的冬季风暴的袭击后,绝大多数近亲繁殖的歌雀都没能幸免于难,只有11只得以幸存。

遗传漂变:帮助物种在景观中小范围漫游

图坦卡蒙国王的畸形足,被蠕虫折磨的绵羊,以及其他数不清的近亲繁殖案例,都在强调自然选择不是万能的。在大自然的适合度景观里,自然选择一路向上的牵引力虽然无休无止,但也会时时受到掣肘。那么,在什么时候、什么原因下会出现这样的情况呢?为了回答这个问题,我们需要理解一个在生命起源之时就在施加影响的现象,而这个现象直到20世纪早期才被人们所了解。那时,像赖特这样的生物学家首次发现,研究整个生物种群要比研究个体重要得多,尤其是研究种群的“遗传漂变”(genetic drift)现象。有一段时间里,这种现象也被称为“赖特效应”,以纪念赖特的贡献。

赖特属于第一批不仅把种群看作生物体的集合,而且把种群看作基因或等位基因的集合的人。这种视角的改变,是我们理解基因漂变这个概念的关键。小的种群相当于一个小的基因库,大的种群相当于一个大的基因库。假设有一个非常小的种群,其基因库内只有4个等位基因,而这些等位基因会对生物体的某些性状产生影响,如眼睛的颜色。假设人类的小基因库中包含两个棕色眼睛的等位基因和两个蓝色眼睛的等位基因,而基因库就相当于一个碗,里面盛着两种颜色的4颗珠子,如图3-1左侧的黑色和灰色圆点。有了这些假设,我们就可以来看看遗传漂变是如何在一代又一代中改变生物体等位基因的命运的了。

图3-1 遗传漂变如何改变等位基因

20世纪初遗传学家就已经意识到,基因从一代到下一代的传承,也就是创造下一代的基因库的过程,就像闭着眼睛从一个碗里拿珠子。要创建一个新的基因库,我们就要先随机地拿一个珠子,记下颜色(黑色或灰色),再将其放回碗里去,然后再拿一颗珠子(还是闭着眼睛),记下颜色后再放回碗内,将这一系列动作重复4次,一个包含4个基因的新基因库就生成了。在重新拿之前把原来取出的珠子放回去,其实体现了遗传行为的一个重要特征:不同的精子或卵子可以从父母一方身上继承同一等位基因的副本。

如果你自己在家里做这个实验,你可能会发现最终的颜色组合非常多样,有时是2个黑色、2个灰色,有时是3个黑色、1个灰色,有时是4个灰色,有时是3个灰色、1个黑色(图3-1)。每种颜色的珠子的数量,就代表着不同类型的等位基因出现的频度。重点是,它们的数量在一代又一代之间是随机变化的。

按照这个方法,我们可以在新的基因库里以完全相同的方式拿出4个珠子,形成第三代基因库,然后是第四代、第五代……从这个过程中,我们就能了解一个基因库是如何在代与代之间进化的。

20世纪早期的群体遗传学家运用概率论分析了基因库的长期变化趋势。数学分析很复杂,但主要的结论很简洁。首先,任意颜色珠子的数量,也就是任意一种类型的等位基因的数量,其变化具有随机性和不可预测性,这种趋势将一直保持到只剩下一种类型的等位基因(代表着棕色或蓝色的眼睛)。当两种等位基因中的一种消亡,而剩下的等位基因在种群中固定下来时,基因库将保持不变,除非有DNA突变的结果是形成了以前的那个等位基因,但这种可能性微乎其微。

相关的数学分析还表明,最终固定下来的等位基因究竟是哪一个,和抛硬币的结果一样不可捉摸。在50%的种群中,固定下来的将是决定蓝色眼睛的等位基因,所有个体将都长着蓝色的眼睛。而在另外50%的种群中,所有个体的眼睛将都是棕色的。

尽管在制造精子和卵子的时候,人类基因会以一种复杂的方式进行重组,但其本质还是从碗里拿珠子。每个人类基因都有两个副本,也遵循同样的规律:4个人类基因组成的基因库对应着由两个人组成的“种群”,每个人都携带着一套基因的两个副本。在这两个人生育了两个孩子后(一个女孩、一个男孩),两个孩子长大后又生了一个女孩和一个男孩,如此一直继续下去,最终,在这个高度近亲繁殖的家庭中,所有人都会长着同样颜色的眼睛,但没有人能提前知道到底是哪种颜色。

对更大一些的种群而言,遗传漂变也会产生影响。根据经验,在由10个基因组成的基因库中(5对等位基因),每一代等位基因的波动率大约是10%。在100个基因组成的基因库中,它们的波动率只有1%。而如果有1 000个基因,它们的波动率就成了0.1%。此外,在更大规模的种群中,一个等位基因在基因库中传播并固定下来的时间也会更长一些:基因库每增大10倍,所需时间就会延长10倍。所以,在非常大型的种群内,我们并不是很担心近亲繁殖的后果。遗传漂变确实会对一个拥有10亿个基因的基因库产生影响,但这只会引起等位基因数量的微小波动,每一代的波动率仅为0.0 000 001%。

许多DNA突变导致的遗传疾病都需要两个“坏”副本在同一个个体身上同时出现才会发病。一次突变只会在一个种群之内的单个个体身上出现,也只能产生一个等位基因的一个新副本。通过遗传漂变,与遗传疾病有关的罕见等位基因可以一代代地延续下去,并且与自然选择相安无事。当这个等位基因的数量达到一定程度,在某些个体上两个“坏”副本开始碰头时才是自然选择显露神威的时刻。种群的规模越小,上述情景出现的速度就越快。因为我们拥有的基因很多,所以“坏”的等位基因在至少一个或少数几个基因上聚在一起的可能性并不低。

这就是由近亲繁殖引起的疾病的病因,也是不同的近亲繁殖种群中会出现不同疾病的原因。如果你能够随意地重置进化的时钟,在一个小型的种群内实施近亲繁殖,你就会发现,每次经由遗传漂变传播的“坏”等位基因都是不一样的。

遗传漂变的两面性:使强者恒强,使弱者愈弱

我还想强调的是,漂变和近亲繁殖未必一定会产生不良后果,这两者本身和等位基因的好坏没有任何关系。而基因漂变也未必就一定要和近亲繁殖挂起钩来。有些单细胞真菌和藻类的每个基因只有一个副本,这也就是说,在它们身上不可能发生两个“坏”等位基因聚在一起的事情。细菌也是这样,而且它们采用的是无性生殖的方式,所以,对细菌来说也不存在近亲繁殖的说法。但遗传漂变始终是在起作用的,无论是在藻类、真菌还是其他生物体身上都是一样的。采用随机抽取基因的方式构建一个基因库,其实是所有生命形式繁殖的基础,与繁殖方式无关。所以,近亲繁殖并不是生命的普遍现象,遗传漂变才是。

为了使遗传漂变的影响形象化一些,我们再回忆一下前几章提到的适合度景观。在这些景观里,自然选择一直在把进化朝着上山的方向拉扯。由于遗传漂变会导致一个种群的基因库发生随机的、没有特定方向的变化,你可以将它看作一种持续不断的震动,就仿佛一场地震袭来,景观左摇右晃、不停颤抖一样。震动发生的时候,任何向上攀爬的进程都会被延缓。同时,正因为遗传漂变是无方向的,所以这样的震动会把一个种群抛向任何一个方向——上坡、下坡或者侧向(图3-2)。如果震动不强,特别是在大规模的种群中,其产生的影响也就相应较小。而震动越强,特别是在小规模的种群中,种群所受到的拉扯作用就会越大,爬坡的速度就会越慢。最严重的后果就是突然发生向下拉扯的震动,将一个种群一下子拽到山谷里。那些近亲繁殖的皇室成员和被蠕虫感染的绵羊,经历的就是这种震动。

图3-2 无方向的遗传漂变

通过遗传学中的数学计算,我们也可以知道上述震动的强度要有多大,或者说种群的规模要有多小,才能抵消自然选择产生的向上的拉力。如果一个种群的个体之间的适合度差异为5%,比如一种细菌分裂的速度比其他细菌快5%,一棵苹果树能多结5%的果子,或者一只松鼠能有多5%的机会在严冬中存活下来,即遗传漂变能使它们的等位基因数目的波动超过5%,那么这种震动就能够压倒自然选择。这样的情形往往会出现在由20个或更少的个体组成的种群之中。而如果一个种群的个体在适合度上只有1%的差异,即使是在更大规模的种群中,遗传漂变也可能会压倒自然选择。因为在这种情况下,等位基因数量波动的幅度只要小于1%就可以了,此时,数学分析的结果表明,种群规模在100以下就足以压制自然选择所带来的促使种群上升的趋势。此模式还具有普遍性:如果个体适合度的差异是0.1%,那么种群的规模要小于1 000,遗传漂变才可以战胜自然选择;如果个体适合度的差异是0.01%,那么种群规模只要小于10 000就足够了。

正是因为适合度差异的存在,自然选择才有了用武之地。在进化的过程中,再小的适合度差异都十分重要。之所以这么说,是因为我们可以测量出突变改变适合度的强度。实际上,大多数突变对适合度的影响都很小。然而,就是这么一点点影响,却可以在数百代或数百万年的进化过程中逐渐积累下来。

从长远来看,即使突变只导致了一亿分之一的适合度差异,也可能意味着天壤之别——只要突变发生在一个拥有超过一亿个个体的种群内。而在更小的种群中,面对遗传漂变,自然选择只能举手投降。

我用了控制眼睛颜色的等位基因来说明遗传漂变是如何运行的,这是因为眼睛的颜色似乎是一种无害的性状。但也有研究证明,虹膜颜色较浅、偏蓝的人更容易患上某些眼部癌症。我们的基因组中还有其他成千上万个基因,跟眼睛颜色比起来,它们所影响的性状可就没有那么无害了。具体说来,这些受基因影响的性状可能包括骨头的强度、免疫系统的活力和生育能力。因为所有基因都是基于同样的规则遗传的,所以这些基因的“坏”等位基因也可以通过随机遗传漂变在人类种群内传播。只要种群规模足够小,遗传漂变的影响就会足够强。

14世纪,诗人但丁凭借史诗《神曲》登上了世界文学的巅峰。几乎没有人知道他是如何创作出了这部神作,但在某些从事创造工作的人看来,整个过程应该跟《神曲》的主人公经受的磨难没什么两样:必须下到九层地狱,忍受各种五花八门的可怕折磨,穿过炼狱,才能抵达天堂。

纵然《神曲》妙笔生花,凡夫俗子对其中的寓意却可能还是无动于衷,认为它只不过是诠释了一句老话:事情在变好之前往往会先变得更糟。事实证明,这一条规律远比他们意识到的要深刻得多,其适用范围也远超人类的想象。没有它,40亿年生命的进化之路不会走得这么深远。如果一个种群卡在了进化的死胡同里,放在适合度景观里,就是困在了一座较矮的山峰上,这时,仅靠自然选择是无法将这个种群从困境中拉出来的,遗传漂变却能施以援手、救其困厄,只不过它的方式是将整个种群推入如《神曲》中描述的地狱一般的熔炉,在那里,新颖、奏效的基因组合正在锻造之中。

不幸的是,这座基因地狱危机重重,许多种群还没到达就灭绝了,只剩下遗骸诉说着它们悲惨的命运。

在那些外来物种很少、遗传漂变作用显著的岛屿上,此类遗骸很能说明问题。仅在夏威夷岛上,外来的开花植物物种中就有超过30%没有活下来。昆虫的日子更糟,缺乏适应性的基因加上充满敌意的环境,导致超过150个物种走向了灭绝,约占外来物种总数的80%。

而对那些有幸坚持下来的物种而言,等到原本的苦难之地变成让它们继续前行的大本营之后,在新的生命形式面前,许多新的山峰将不再遥不可及。岛屿又一次成了最佳的实验场所,它们既是灭绝物种的墓地,也是进化的创造力源泉。

在小小的加拉帕戈斯群岛上,一个由雀鸟组成的初始种群分化出了14个不同的物种,其中一些出现在了1835年达尔文乘坐小猎犬号到访此地时。在夏威夷,吸蜜型的管舌雀至少进化出了30个物种。在位于非洲西海岸的加那利群岛上,蓝蓟属内出现了23个新的植物物种。蓝蓟是一种中型的开花植物,长着引人注目的蓝色花序。在夏威夷,生存至今的1 000种开花植物中的90%以上和5 000种昆虫中的98%以上,都是在本岛内进化出来的。

比上述数字更值得注意的是进化创造这些物种的爆炸性速度。在加拉帕戈斯群岛和夏威夷,最古老的岛屿已经存在了将近500万年,这几乎和人类与黑猩猩分离的历史一样长。在进化的漫漫历程中,这些只能算是短暂的一刻,但也足以让大自然创造出数以千计的新颖岛屿物种了。不止如此,许多新的岛屿物种还进化出了新的生活方式。加拉帕戈斯群岛上的第一批雀鸟是以软体昆虫为食的,但今天,其中一些物种已经进化出了像胡桃夹子一样的超大鸟喙,即使是最坚硬的种子,在它们面前也不在话下。在加那利群岛上,一些蓝蓟的近亲已经进化成了5米多高的木质巨型植物,底部由一个耐旱的根系支撑,头上顶着一个华丽的圆柱形花序,深受园丁的喜爱。

有些生物习性曾在不同的岛屿上被反复创造出来,如某些草本植物曾经不止一次变成了木本植物,而其他的则各自形成独一无二的生活方式,其中之一是吸血雀,它的食性是叮啄蓝脚鲣鸟的尾巴并吸食其血液。还有一种是加拉帕戈斯群岛特有的啄木鸟,它能利用仙人掌刺或小树枝这样的工具把藏在树干里面的昆虫吓出来,这又是一项进化所创造的非凡技能。住在毛里求斯附近的圆岛上的裂颚蛇,它的上颚不像人类一样由一根坚硬的骨头构成,而是由一个灵活的关节组合而成,这使得它可以吞下大型的蜥蜴。还有加拉帕戈斯海蜥,它是现存的唯一能在海上生活和觅食的蜥蜴,其独门秘籍之一是拥有能够从体内排出多余盐分的腺体。在夏威夷岛上,某些球果尺蛾属物种的幼虫有着非常奇特的习性,它们跟那些啃食树叶的无害毛毛虫相差甚远,反而更像恐怖电影的素材。它们的拿手好戏是专事暗杀,伪装成树枝或树叶,当昆虫落在附近时,它们就会以迅雷不及掩耳之势,用专门的钳状前肢出手制敌。

所有这些,都只是大自然面对同一个问题时创造出的无数种解决方法的一小部分,而最关键的问题是:当被困在一座岛屿上时,要怎样才能幸免于难?

岛屿向我们呈现了一番创新大爆发的情景:当竞争不是很强烈时,大自然的创造力就会开花结果。然而,这样的情景只在遗传漂变遇上像岛屿一样新鲜、空旷的环境时才可能会发生,而且只会发生在进化史上的某一瞬间。要知道,生命出现至今已经40亿年了,岛屿上的创新大爆发通常会历经数百万年,而数百万年只不过是40亿年中的一个小片段而已。

如果从生命诞生之日算起,其时间跨度之大,其间发生的事情肯定要比岛屿上进化出来的与众不同的动物种群深刻得多。随着进化创造出越来越复杂、越来越大型的生物体,遗传漂变的力量也在缓慢而稳定地增强着。日积月累,遗传漂变就会逐渐改变生物体的遗传基质,进而激活大自然的创造力:基因组的结构天生就是为创新准备的,而遗传漂变所塑造的恰恰就是基因组。但这是怎样做到的呢?

100平方米可以容纳一万亿个微生物,而100平方千米只能勉强容纳几十只大型哺乳动物,比如大约40头狮子、15只老虎,又或者只是两头北极熊。生物体个头越大,它需要的空间就越大。这也意味着较大的生物体通常生活在较小的种群中。大多数情况下,细菌大约是几亿个个体生活在一起的,昆虫或某些蠕虫等小型无脊椎动物大约是几千万个个体生活在一起的,而脊椎动物和树木的群落规模一般在一万个以下。当然,不同的种群也是大小不一的,比如大象和老鼠都是脊椎动物,但地球上的老鼠肯定比大象多。然而,总的趋势是清晰无误的,生物体越大,其种群规模就越小,而这种趋势产生的影响也是不折不扣的:跟较小的生物体比起来,在由较大生物体组成的较小种群中,遗传漂变的影响也较大,相应的自然选择的效果则较弱。拥有数十亿个个体的人类看起来是个例外,但实际上,在人类进化史上的大部分时间里,人类的总人口数都是低于几百万的。而且,在这段时间里,人类被细分成许多孤立的小部落。人口激增是最近才发生的事情,我们的躯体和我们的基因组还远没有进化到位!

跟拥有庞大种群的细菌相比,遗传漂变在大型生物体中的力量要强上万倍,自然选择的功效则远低于此。许多有害的等位基因在细菌种群中很快就会被消灭,而在大型动植物种群中却能长期持续存在,就仿佛自然选择对它们视而不见一样。生物体越大、越复杂,遗传漂变的力量就越强,由此产生的若干令人震惊的后果,最突出的是人类基因组的大小,在数以百万计的年头里,人类的基因组数量一直在以稳定的速度增长着。

像人类这样典型的脊椎动物的基因组中含有30亿个碱基对,几乎是大肠杆菌等细菌的1 000倍。我们的确需要更多的基因来构建和维持自身复杂的身体,但实际的基因数量又没有想象中那么多——不到大肠杆菌(4 500个基因)的7倍。换言之,人类的基因组比其他物种要大得多,但这并不等于说我们的基因数量也要多得多。实际上,人类基因组与其他物种的基因组的差异大多来自基因之外的DNA。由于这些DNA不对任何蛋白质进行编码,它们也被称为非编码DNA。

大肠杆菌等细菌的基因组中也含有一些非编码DNA,其中大多数由基因调控所必需的DNA短序列组成。这些序列可以被转录因子所识别。调控蛋白可以据此锁定一段DNA序列,从而打开或者关闭某个基因的转录过程,而这正是蛋白质合成的前奏。换句话说,大肠杆菌的大多数非编码DNA都具有特定的功能:参与基因的调控。非编码类型的DNA数量相当有限,只占大肠杆菌基因组的12%。

人类的基因组则是一个巨大的非编码DNA的海洋,而基因只不过是其中的一个个小岛,在整个基因组中仅占了3%。两个人类基因之间可能相隔着成千上万个非编码DNA,而两个大肠杆菌基因之间平均只隔着大约120个非编码DNA。此外,人类的非编码DNA中只有很小一部分起到了调控基因的作用。我们还不知道其余部分起着怎样的作用,目前能确定的是,非编码DNA为进化发挥创造力提供了巨大的空间。为了理解这种创造力来自何处,我们还是要把遗传漂变当成一个至关重要的因素来看。

基因组代代相传,它的大小也在以多种方式不断增加,其中一种是DNA重复(DNA duplication),这是一种DNA突变,其发生频率和点突变差不多。当细胞试图修补受损的DNA并发生了某种特定错误的时候,就会出现这种情况。这有点像一个编辑在校对电子文稿的时候,不小心误操作,复制粘贴了一段文本。由于DNA总是会受到损害,细胞也总是在编辑DNA序列,所以此类错误的出现并不是什么稀罕事。这段复制粘贴的文本可以是几个字母、数千个字母,也可以是数百万个字母。同样,这段复制的文字也可以是一个或多个基因,这种情况被称为基因重复(gene duplication)。

基因重复同样会暴露在持续不断地作用在基因组其他位置上的DNA突变的过程中。只有在非常凑巧的情况下,这些突变才会给这个基因带来新功能,也许它正好可以帮助消化一种新的食物分子,或许它能够保护细胞免受某些毒素的侵害。通常来讲,突变只会“成事不足,败事有余”。它们往往会削弱或者干脆破坏基因制造有用蛋白质的能力。这样,突变就将重复基因转变成了一段惰性DNA,也就是被称为假基因(pseudogene)的部分。假基因的产生导致基因组中非编码DNA的部分越来越多。

重复DNA在进化中到底起了何种作用?为了回答这个问题,我们需要考虑一下复制过程的代价,复制过程需要消耗能量,也就是细胞用以生产复制DNA所需的能量。如果复制DNA中包含一个或多个基因,细胞就需要消耗额外的能量来解码DNA,并生产相应的蛋白质。在2007年的一项研究中,通过一系列复杂的实验,我得到了与这些能量有关的数据,并计算出了基因重复通常会消耗一个微生物细胞总体能量的0.01%。消耗掉的这部分能量将无法用于其他目的,如繁殖。

0.01%看起来并不多,而且用科学仪器也测量不到。但自然选择可是一位明察秋毫的大法官。想想有着庞大种群的微生物吧,适合度上的任何一点小小的差异都事关重大。任何一个微生物个体,只要发生了基因重复,就会慢慢地被效率更高的同类比下去。也许这个过程需要耗费数千代或数百万代的时间,但最终都逃脱不了消亡的结局。

而大多数动植物的基因即使发生了同样的重复现象,也不会落入同样的宿命。因为它们的种群规模较小,遗传漂变的作用较强,自然选择根本不会注意到这种重复现象所带来的适合度上的差异。在此基础上,在漫长到无法想象的历史长河里,重复DNA得以一个接一个地累积下来。最终结果就是形成了海量的非编码DNA,包括大约15 000个散布在人类基因组内的假基因,以及更多的数不清的DNA片段。如果把DNA突变想象成一场连绵不断的雨,那么这些片段的功能早就被洗刷得无法识别了。

基因大多是被动复制的,而不是自发的,但例外是,一种移动DNA(mobile DNA)被证明可以积极主动地促进自身的复制。这样的DNA通常有几千个字母长,当编码一个或多个蛋白质分子的时候,它会将编码DNA复制并插入基因组的某些位置。在那里,这种DNA可以一次又一次无限期地被复制下去。

移动DNA也是理查德·道金斯(Richard Dawkins)在《自私的基因》中描述的一个典型例子。它的目的很单纯,就是在宿主基因组内增殖,而不考虑宿主的福祉。如果不受控制,基因组就会被其副本所占领。

但幸运的是,移动DNA是受控于某些力量的,那就是自然选择。

如果你将一本小说中的任意一段拿出来,再把它粘贴到随便一个位置上去,这本小说很可能会变得乱七八糟。同样的道理,当移动DNA将自身插入基因组中一个新的位置时,也会产生有害的后果。如果插入的位置在另一个基因之内,那另一个基因的信息链就会被扰乱,制造蛋白质的指令也会遭到破坏。这样一来,如果另一个基因本来是有用的,比如在胚胎发育的过程中发挥作用,那么结果就是导致胚胎夭折。此外,当移动DNA粘贴在某个基因附近时,它可能会无意间打开该基因。这是因为移动DNA包含了必要的调控序列,而这种调控序列既可以开启自身重新定位的基因,也可以激活任何附近的基因。同样,如果这个基因参与了胚胎发育,而该基因在错误的时间、错误的地点被打开了,发育过程就会发生强烈或微妙的改变——导致两个神经细胞无法正确地结合,血管长在错误的地方,或是一根骨头没有长到应有的强度等。在大部分时间里,这些改变产生的影响并不大,随之出现的宿主适合度的降低程度将不到1%。而且,如果某些移动DNA执行的插入动作造成了严重破坏,那么自然选择就会马上消灭掉它们,而对那些只产生了轻微影响的移动DNA,自然选择并不会一棍子打死它们,而是会和遗传漂变一起来决定它们的命运。

在种群规模较大的小型生物体中,比如大肠杆菌,遗传漂变的影响非常微弱,而自然选择可以毫不费力地清除最具破坏力的移动DNA插入。这也是大多数微生物的基因组中只有少量移动DNA的原因,通常只占基因组的1%或更少。在种群规模较小的大型生物体中,因为遗传漂变的作用过于强烈,自然选择的作用较弱,无法剔除影响较小的移动DNA,所以移动DNA会逐渐累积。最终的结果是,人类基因组中有超过50%的基因都是移动DNA,一些大型动物和植物也是如此。我们的基因组中包含着数百万个移动DNA。

移动DNA一边在基因组中不断累积,一边和DNA的其他部分一样暴露在突变之中。这些突变会破坏移动DNA的复制和移动能力,人类体内的绝大多数移动DNA——超过99%,都是残缺、惰性的,无法移动,不包含真正的基因。不过,残缺归残缺,它仍然是人类基因组中非编码DNA中的一部分。

拜遗传漂变所赐,较大生物体的基因组通常也更为复杂。随着生物体变得更大,种群变得更小——这意味着自然选择之力更弱,遗传漂变之功更强,生物体的基因组会获得更多的基因,接着就是产生更多的重复基因、更多的假基因、更多活跃的移动DNA,以及更多有缺陷的移动DNA。进而非编码DNA的总量也就越来越多了,一路下来,基因组的大小稳定地增长了1 000多倍。

人类基因组的复杂性在不断增加,其中遗传漂变发挥了重要作用。印第安纳大学的生物学家迈克尔·林奇(Michael Lynch)是首批证实这个结论的人之一。林奇比较了数百种生物体的基因组并提出了自己的观点,他的研究数据显示,遗传漂变不仅有助于提升基因组的大小,也有助于提升单个基因的复杂性。当某些基因的DNA转录为RNA的时候,基因中被称为内含子(introns)的部分就会被舍弃,被称为外显子(exons)的部分则结合或拼接在一起。只有那些结合在一起的外显子才能被翻译为蛋白质。换句话说,只有信息被解码以后,基因才能一片一片地被组装起来。在生命前进的过程中,和基因组的大小一样,每个基因上的片段数目都会稳步增加。在微生物体内,一个典型的基因包含一个或两个片段,而对老鼠和人类来说则有七个以上。同时,被舍弃的内含子的大小也在稳步增长,人类的基因组中有超过98%的转录DNA都被舍弃了,只有不到2%的部分被翻译成了蛋白质。基因组的复杂性为进化施展其创造力提供了一个巨大的场所。随着以新的方式混合、搭配起来的基因片段越多,其创造的蛋白质类型也越多。跟果蝇比起来,尽管人类的基因数量不到果蝇的两倍,但因为其基因片段的数量之巨,以至于人类的身体可以生产出来的蛋白质种类比果蝇多了5万种。

此外,由于典型的脊椎动物基因是由数千或数百万个非编码DNA分隔开的,所以其通过随机突变产生新的DNA的概率要比大肠杆菌大得多,而这些新的DNA单词可以被调控蛋白结合,并在基因组中产生新的基因调控方式。大肠杆菌中的非编码DNA的数量实在是太小了。对大型的复杂生物体的进化而言,基因调控机制的改变非常关键,甚至比基因自身的改变还重要。如,人类和黑猩猩的遗传学差异大多数存在于可以改变基因调控机制的非编码DNA上。改变调控机制,就像在调整生命的配方,看似微小,实则影响巨大,乃至能够创造出一个可以驾驭符号语言、艺术和文学的新物种。

微生物的基因组就像是斯巴达式的、几乎没有家具的僧侣修行用的小屋,多细胞生物体的基因组则像是一个发明家的工作室,里面装满了各种配件、工具,还有做了一半的设计。这一团看起来乱糟糟的东西,其实是为下一次的创新突破埋下的伏笔。而负责发明出东西来填满这个工作室,使这些东西能够发挥作用的,正是遗传漂变。只要我们的发明家能够持续约束自然选择这样一个过于热心的看门人,它就能继续在基因组上修修补补。

遗传漂变以两种基本方式影响着生命的进化。短期内,遗传漂变有助于进化在遗传学景观中登上新的山头,同时加速具有独特习性的新物种的诞生。这里说的短期,指的是形成新物种所需要的数百年时间。从长远来看,遗传漂变则改变了基因组的结构,提升了它们未来创新的潜力。

基因漂变的表现形式各不相同,但它们都遵循一个共同的原则:只有当进化可以暂时从自然选择的短视中解放出来,不再一味地埋头上坡时,只有当进化可以自由地探索大自然的创造性景观时,生命才可能会突破限制,创造力才能大放异彩。

事实证明,要想帮助进化穿越大自然的创造性景观,遗传漂变并不是唯一的救命稻草。

虽然想象穿越一座四维或者更高维的山脉很难,但我觉得更难的是另一件事:穿越一座二维的山脉。二维景观的难度不在于缺乏想象力,而是在二维空间里实践达尔文的进化论要困难得多,因为比起三维或更高维来说,在一个平面的山脉里穿越要难多了。

图4-1的上半部分呈现了一个平面世界中的适合度景观。如果一个生活在左部高原上的群体想要跑到右部的高原上去,它们会遇到一个我们非常熟悉的麻烦:自然选择严禁任何下坡的动作,它不会允许这个群体跨过山谷地带。但如果我们将此图看作一个二维的薄片划过一座三维景观,形成了一个宛如流星撞击导致的陨石坑的形状怎么样呢?在图4-1的下半部分,平面里的两座高原变成了一个有着圆形山脊线的起起伏伏的三维高原,在这个景观里,一个群体将可以很容易地在周围绕行,而在大规模的群体中,这只需要少量的遗传漂变就可以实现,无须跨越陨石坑的底部,更无须满足群体规模小、遗传漂变作用强烈等条件。

图4-1 二维与三维的适合度景观

同样的思路在更高维度上也能实现,尽管我们习惯了三维空间的大脑很难将这个过程可视化。想想看,如果我们所知的落基山脉、阿尔卑斯山脉或安第斯山脉都只是一座四维山脉在三维世界的投影,那么这些山脉中被三维世界里的山谷隔开的山峰,现在就可以通过四维世界中的一个山脊连接起来了。进一步看,如果四维世界里的某些山峰还是相隔甚远,很可能我们只要在五维世界里来一次闲庭信步,天堑就会变成通途。以此类推,在五维世界里剩下的数量稀少、互相隔绝的山峰,很可能在六维世界里也是能够相通的。

当然,适合度景观里不仅存在三维、四维或者五维,它们的维数应该是成百上千。每一个维度都代表一个可变的生物体特征,例如,基因组上的一个位置——也许是一个基因,也许是一个核苷酸,在其DNA文本中是可以改变的。从很多方面来说,以三维的视角来看待这些景观就已经可以取得不错的效果了,但当我们试图去理解如何绕过适合度山谷的时候,三维空间就远远不够了。还好,即使大脑无法将高维的景观可视化,但我们还是可以探索和绘制这些景观。

我在苏黎世大学的研究小组和许多其他的团队都正在做这样的努力,并使用了最先进的实验室技术和计算技术。我们的实验着眼于RNA酶和蛋白质酶的进化,比如能够使抗生素失效的β-内酰胺酶。首先,我们制造了大量相同的具备复杂功能的分子。其次,我们在分子群体内散播了带有分子文本突变的个体,再挑选出表现良好的突变体,并重复上述过程。最后,我们还对进化中的个体(成千上万的个体)的分子文本进行测序,并利用计算机跟踪了它们在景观内的位移。

我们发现,进化的创造力不仅至关重要,而且令人啧啧称奇。

在这些实验中,一开始,任何一个群体都处于适合度景观的某个山头之上。如果这座山峰像非洲的乞力马扎罗山一样,孤零零地处在景观的高维平原之上,那么群体成员还将继续聚集在山头附近,所有的突变体都将劣于起始的分子,自然选择只会无情地将突变体清除出去。但实验中的情况并非如此。分子群体不是原地不动,而是在景观内四处扩散的。在每一轮的突变和选择过程中,群体成员都会稳定、持续地朝着更多的突变方向迈出一小步。而且,从起始山峰向外扩散的方向也并非只有一个,而是很多个。当群体在景观内移动的时候,它们不会一下子变得太好,也不会一下子变得太糟,而总是处于景观内高度相差不多的地方。看起来,起始的山峰和它附近的某些山峰是连接在一起的,仿佛有几十条“山脊线”从起始山峰散射出去并通向了其他山峰,而其他的山峰又通过几十条这样的山脊连接到了更远的山峰。

诸如此类的实验告诉我们:在适合度景观的多维架构背后,还存在一些深刻的规律。一座山峰往往并不是像乞力马扎罗山一样的单一位点,而是更像一个由高海拔路径组成的网络,如蛛网般在景观里蔓延、伸展。连接不同山峰的路径并不是完全平滑的,但也不是非常曲折。得到这样的结论的前提是,我们在实验中使用了由几十亿个分子组成的群体,在这么大的群体中,遗传漂变的影响力非常微弱,所以实验中不会出现任何个体下降到远离山头的位置的情况。

在实验室内进行的进化实验只能探索非常小的一部分适合度景观,而大自然在40亿年间探索过的领域可谓浩瀚无垠。它已经发现了具备特殊技能的分子在这样的蛛网上可以走多远。让我们来看看血红蛋白,也就是人类血液中负责与氧分子结合并运送氧分子的蛋白质。其他数以千计的物种——鼠类、爬行动物、鱼类、昆虫和植物,都拥有类似的氧结合蛋白,它们中的每一个都是一段漫长的进化之旅的终点,而每一段进化之旅都源自10亿多年前的某些祖先级的氧结合蛋白。在这个过程中,氧结合蛋白并不是一成不变的,它们的氨基酸文本已经缓慢地、逐字逐句地、不可逆转地改变了。从远古的共同祖先起,这些蛋白质就在一个庞大的、由功能性的氧转运蛋白所组成的蛛网内扩散着。它们的旅程时间之久,以至于到现在,在总计百余个氨基酸字母中,它们只共享着不到15个字母。仅针对氧结合这个问题,它们就利用不同的氨基酸文本找到了各种各样的解决方案。

血红蛋白与其他进化中的无数分子共享着这种进化模式,包括消亡的RNA世界遗下的有催化作用的分子,以及数不清的各种蛋白质。这些蛋白质能催化生化反应,在细胞间通信,支撑我们的身体并协助运动。每一种蛋白质所占据的山峰都不是一座单峰,而是一张由不断拓展的高维路径组成的网络,这个网络通过一个适合度景观向四面八方延伸,直到很远的地方。你不用费劲去想象这张网络长什么样,在三维世界里它根本是不存在的,其中包含着数以百计的维度和可以探索的方向。

更重要的是,所有这些机制不仅适用于分子个体,也适用于这些分子的复杂聚合物,也就是构建、维持人体的生化机制。其中有两种机制特别重要,第一种是由控制许多基因的调控蛋白运作的。这些调控器并不是独立运作,而是在复杂的调控回路中发挥作用,通过彼此互相调控来转录数以百计的其他基因。第二种是新陈代谢,数千种化学反应交织在一起,每一种都由某些基因编码的专用酶来催化。我们和其他的生物体都需要借由新陈代谢获取能量、制造材料(也就是营养物质),并以此来制造生命体所需要的大量分子。

基因组中则存储着这些调控和代谢机制的编码信息,当DNA突变导致基因组变化时,这些机制也会随之改变。这就是在一个种群中,每个个体的新陈代谢过程都不大一样的原因。有的能更有效地获取能量,有的更擅长储存脂肪,有的则对某些食物的耐受性更好,还有的调控回路能构建更好的躯体。比如,更大的翅膀,更强壮的心脏,反应更快的神经元。换句话说,调控和新陈代谢的机制也可以进化,在DNA突变和自然选择的共同作用下持续改善。同样重要的还有,即便是已经达到最优的调控和新陈代谢机制,也是不尽相同的。它们所占据的山峰不是景观里的乞力马扎罗山,而是一个由山脊组成的广阔网络。网络之内,多种形式的调控和新陈代谢机制可以共存,而每一种机制都可以塑造和维持身体的高效运作,八仙过海、各显神通。

我们可以用我写的《适者降临》这本书来描述这个意想不到的高维世界。书中我讲述了这些趣味无穷的故事,讲到了这些蛛网来自何方,为什么它们是近乎普适的,以及为什么它们对进化至关重要。在本书中,我想重点阐述的是它们在如何创造的过程中帮助了大自然,而我们已经通过实验证明了这一点。

其中一个实验是由埃里克·海登完成的,他从一种核酶入手,这种核酶可以将RNA分子与一个特定的字母序列连接起来。从这点出发,埃里克试图创造出一种将其自身与一种不同的RNA连接起来的更加灵活的核酶。实际上,他做了两个实验,每个实验都是从不同的分子群体开始的。从起始的核酶开始,第一个群体集中在适合度景观的一个山头上——由山脊线组成的网络的一个较高的位置上,而第二个群体则沿着这个网络延伸了出去。他想知道哪个群体的创新能力更强一些,也就是谁会更早进化为新的分子。仅仅经过八轮突变和选择,答案就出来了。那个延伸出去的第二个群体发现新分子的速度要比第一个快6倍。原因是,新的核酶占据的是一座更高的山峰,离初始的核酶有一段距离,当第二个群体沿着山脊扩散到新山峰下面的时候,有一些核酶个体恰好就在附近,自然可以更快地登顶。同样的情况也发生在耐抗生素的β-内酰胺酶上。在以色列生物化学家丹·陶菲克(Dan Tawfik)的实验室里进行的一项实验表明,那些沿着适合度景观山峰附近的山脊线扩散进化而来的β-内酰胺酶,更有可能发展出同时摧毁头孢噻肟和青霉素两种抗生素的能力。虽是不同的分子,但背后的原因是一样的:庞大的网络不仅不会使分子群体掉入深谷,还能够帮助它们向新的山峰靠拢。

这一事实有助于解释为什么细菌对新抗生素的耐药性发展如此迅速。因为它们繁殖迅速、群体庞大。除此之外,这也跟它们的抗生素抗性基因种类多样、分布广泛有关。我们可以将其部分归功于遍布景观之内的蛛网。这种多样性提升了一个基因恰好待在某座山峰附近的概率,而这座山峰恰好意味着抵抗新抗生素的能力。

总而言之,适合度景观的独特架构,使得每座山峰实际上都是一个由高维度的山脊线组成的网络。这对进化解决难题起到了促进作用。它有助于创造出丰富多彩的生物体和分子,而其中有一些可能就闯到了邻近的更高峰的周围。对老问题来讲,这将带来更好的解决方案;对新问题而言,这会产生新颖的解决方案。

“斯科特,把我传送上去!”是一句永远不会磨灭的台词,深深地铭刻在那些熟悉早期的《星际迷航》(Star Trek)的人的脑海里。每当星际飞船的船长詹姆斯·柯克需要使自己脱离危急的情境时,就会说上这么一句。通常这种事发生的时候,他都会在一个陌生的星球上,周围挤满了充满敌意的生物。然后,星际飞船的轮机长蒙哥马利·斯科特,就会像施展魔法一样把柯克带回母舰。

遗憾的是,和“进取号”星际飞船一样,这种瞬间远距离传送仍然只是科幻小说里的情节。

但事实证明,大自然也可以使用类似于远距离传送这样的手段使物种到达遥远的地方——不是星际飞船,而是景观中大自然的创造力得以绽放的地方。每个人都知道它,大多数人喜欢它,但只有极少数人真正理解它:性。

性:帮助生物实现大规模基因重组

人类有23对染色体,人类的基因就栖息在染色体上。这也是我们的每个基因都有两个副本的原因。在产生精子和卵子的一种特殊的细胞分裂过程中,一对染色体会并列在一起,交叉互换它们的部分DNA文本。我们可以把每一对染色体都想象成两根长度相同、颜色不同(如黑色和白色)的鞋带。这两根鞋带平行排列在一个平面上,一根在左,一根在右。在保持鞋带对齐的同时,你在鞋带上的任意位置剪几刀,接着将剪好的片段左右交换一下,然后再把鞋带片段黏在一起,就会得到一对黑白相间的混色鞋带。如果左边的鞋带从全黑变成了全白,那右边的那根一定正好相反。

当我们的身体制造精子和卵子时,每一对染色体上都会发生两端对齐、随机切割、交叉互换和重新黏合的过程,这一过程又被称为重组,结果就是形成了一条混杂的DNA串。这样,每一对染色体的同一位置都有一部分被塞入了精子或卵子内。

当受精发生时,精子会将来自父亲的重排过的DNA注入卵子中,而卵子中则含有来自母亲的重排过的DNA。最终的结果是,一个受精卵拥有23对染色体,每一对都是重组过的两个副本。

事实上,两条DNA序列的区别并不在于颜色,而在于字母的排列,而且两者的差别非常小。对一个典型的人来说,大约每1 000个字母中就有一个不同。也就是说,如果沿着自己的任何一个染色体一路比对,你就会发现,每隔1 000个字母,在染色体对的其中一支上就会出现字母不同的情况,比如一个是A,另一个是C、G或T。而在所有剩下的字母中,有99.9%都是相同的。

换句话说,你的23对染色体中的每一对的两支染色体几乎没有差别。但由于DNA总数实在是太多了,足足有30亿个字母塞在这些染色体里,所以所有染色体的两个副本之间的总差异多达300万个字母。

知道了这一点,我们还可以发现一个孩子的基因组和其父母的基因组之间有多大的差异。每个染色体对之中,一支来自父亲,和父亲的基因组没有区别;另外一支来自母亲,与父亲的差异是约300万个字母。总的来说,孩子的基因组与父亲的基因组的差异大约为150万个字母,即0到300万的中间值。同样,孩子与母亲的差异也是约150万个字母,占基因组的0.05%。

适合度景观将可以帮助我们体会其真实的尺度大小。如果我们将景观中行走的一步,也就是基因组中一个字母的变化,看作平常人行走一步的距离,那么,上述的基因组交换过程,就相当于将一个孩子远距离传送到1 000多千米以外的地方,而且是以“瞬间移动”的方式。每次产生一个后代,基因组都会发生这样的一次跃进。如果从堪萨斯州威奇托周围起伏的平原出发,经过这样一次瞬间移动后,你会发现自己正处在科罗拉多州或犹他州的落基山脉之中,而你周围山峦起伏,有着无数种选择。

人类的双亲,或者同一物种中的任意两个生物体,其间的DNA差异要比不同物种间的差异小得多。而双亲的DNA差异越大,重组后的瞬移距离就越远,其创造性后果也就越显著。当来自不同物种的双亲交配并产生后代(即物种杂交)时,重组带来的效果堪比飞跃。可以肯定的是,有些杂交会陷入进化的死胡同,这是因为双亲差异太大,或者在遗传上并不兼容,以至于胚胎无法发育,或者后代即便能够发育成熟,最终也会丧失繁殖能力。比如马与驴杂交产生的骡子,斑马和马杂交产生的斑马马,狮子和老虎杂交产生的狮虎兽。但也有些杂交非常成功,甚至可以在一代之内就形成全新的物种。

我们在植物中常常可以看到成功杂交的例子。大约有10%的新植物物种是通过杂交创造出来的。杂交而生的新物种有时还能够勇敢无畏地探索那些父辈们从未涉足过的地方。一个很好的例子是两种美国向日葵的杂交种。它们的父辈生长在美国大平原上,而新杂交种则可以生活在内华达沙漠中,它们也因此得名“荒漠向日葵”。另一个新杂交种则可以在德州的盐沼地繁衍生息。而后两种栖息环境对它们的父辈来说都是致命的。

动物也能成功杂交。1981年,普林斯顿大学的彼得·格兰特和罗斯玛丽·格兰特夫妇(Peter and Rosemary Grant)发现了一种加拉帕戈斯地雀的新杂交种。他们在大达夫尼岛遇到了一种具有特殊性状的雄性样本,其不仅比其他地雀重50%,鸣唱的声音也与众不同,还有一个不同寻常的大脑袋。它的鸟喙可以撕碎其他地雀无法取食的种子。在接下来的28年中——这需要多么坚韧的毅力啊,格兰特夫妇持续观察了7代这种“大鸟”的后代,结果发现这些性状其实非常有用。在2003年到2005年间,一场大旱消灭了90%的地雀,而“大鸟”的后代却活了下来。DNA分析证实,“大鸟”是其他两种地雀的杂交种。不仅如此,还有很多种达尔文地雀也是杂交种。

细菌无法像植物和动物那样杂交。但大自然并没有忘掉细菌,同样赐予了它们类似的能力,尽管其机制和动植物完全不同。细菌的基因组中包括一类基因,可以使一个细菌向另一个细菌(即受体菌)捐献DNA。在这类基因的作用下,供体菌可以构建一根长长的、中空的蛋白质管子,术语叫性菌毛(sex pilus)。它会附着并缠绕在临近的受体细胞上,协助完成DNA的传送。这个过程也被称为基因水平转移(horizontal gene transfer),可以帮助受体菌在新的环境下躲过一劫。基因水平转移跟人类的性交有一点儿相似,但细菌并不是每一次繁殖都会发生此类行为。即便每次都发生,其和人类的有性繁殖也不一样。它们只是向其他细胞传送DNA的副本,最多包含数百个基因,有时甚至会传送构建性菌毛自身所需的基因,结果就有点像“女”变“男”、“阴”转“阳”。

细菌交配繁殖的对象、种类和数目要比采取两性繁殖的人类和向日葵多百倍。如果我们具备了细菌的重组能力,那就不仅可以从其他人身上,还可以从灵长类、鼠类、鸟类、爬行动物和鱼类的身上来获取基因。细菌甚至还能与动物和植物交换DNA。借助相关研究,我们的生活方式、饥荒问题以及世界经济都会发生巨大的改变。假如我们能像植物一样从太阳光中直接获取能量,那么只要空气中有二氧化碳,我们的身体就能生长。

总之,凭借基因转移,细菌可以在巨大的遗传景观中远距离传送,将自己弹射到数百千米,甚至是数千千米外。

基因重组:帮助物种在适合度景观内远距离跳跃

“人类具备光合作用的能力”这样的说法看起来很激进,但利用这个说法来类比细菌通过远距离传送所能取得的创新,一点儿也不过分。无处不在的细菌无时无刻不在实验着新的基因组合,而从实验中得到的创造性产物当中,一定有一些能帮助它们在恶劣的人造分子,比如滴滴涕、五氯酚之类的杀虫剂或有剧毒的工业废物二英的包围下逃出生天,甚至还能蓬勃发展起来。

这些人造分子是在20世纪才由化学家发明出来的,由此可以知道,细菌发展出将这些人造分子转化为食物的能力的创新速度有多快。在整个进化历程中,这只不过是一眨眼的工夫。而且,基因转移这种方式只要有助于创新的产生,也就有助于将创新成果从一种细菌传播到另一种细菌。这就是为什么短时间内不同的细菌种类都具备了耐抗生素的能力,以至于人类根本来不及研制新的抗生素。

幸好,大自然在适合度景观里玩的远距离跳跃这套把戏,人类也没有忘掉。我们中的一些创新者,正在设想一种新颖的、比细菌的基因转移更加有效的机制,他们想要通过大量、激烈的分子重组在试管内创造出新的DNA,即使是大自然也难以企及。

这些创新者中包括已故的皮姆·施特默尔(Pim Stemmer),一位荷兰生物化学家和拥有10项专利的连续创业者。他在生物技术圈的名望来自1994年发明的DNA改组技术。这项生化技术可以使用DNA聚合酶来复制大量带有一个或多个基因编码信息的DNA分子。

DNA聚合酶绝不是一种由科学家在实验室里造出来的酶,它存在于每一个活细胞内,在细胞分裂的时候对DNA复制起着关键的作用。而生物技术学家运用的是这种酶的一种工程化形式,他们还开发出了一种对DNA改组至关重要的特性。从DNA序列的一端开始,DNA聚合酶会沿着DNA序列滑动并进行逐字复制。同时,它还可以从一条序列跳转到旁边的一条序列上去——生物化学家称之为“切换模板”,并继续复制新的DNA序列。这就好比你把两篇差不多的英语课文并排放在一起,并开始抄写其中一篇课文,过了一段时间后,你又接着抄起了另一篇。如果两条DNA序列是一样的,那么DNA聚合酶的这种跳转动作就不会对复制得到的DNA序列产生任何影响。但如果它们是不一样的,那复制后的结果就是产生一条嵌合体DNA序列,这个序列以第一条DNA序列的首字母开头,以第二条DNA序列的字母结尾。

通过DNA改组技术,生物化学家可以将很多具有不同DNA序列的分子混在一起进行“洗牌”。参与“洗牌”的DNA可能极其多样,比两个“热恋”中的细菌之间的基因差异还要大,甚至可以用土拨鼠和万寿菊之间的差异来形容。更重要的是,在复制这些分子中的任何一个的时候,DNA聚合酶可能会多次切换模板,最终的复制品是来自多条DNA序列的片段组合在一起的产物。

如果我们把DNA改组看作分子的群体性行为,大自然为了创造高效的酶一直在亲力亲为,与大自然辛苦劳作的成果相比,DNA改组技术又能起到多大的作用呢?针对这一点,施特默尔实验室的研究人员进行了测试,结果不负众望:DNA改组技术赋予了酶在适合度景观里瞬间移动的能力。他们专注研究的是一种能够让像头孢噻肟这样的抗生素失去活性的酶,并建立了一个来自4种细菌的基因池,不同的基因编码了这种酶的不同变体。我必须补充强调一下,这些变体的差异性很大:它们的DNA序列中有多达40%的字母是不同的。研究人员想知道,如果一个一个地改变DNA字母,或者说在景观里一步一步地向上走,那么初始的这种酶到底能在多大程度上被改善?答案是8倍。在同样的时间跨度内,最终产生的酶所能够裂解的抗生素分子的数目比初始的酶多8倍。你可能会说,还不错嘛!但如果把初始的酶投入有4种细菌的基因参与的DNA改组过程后,最终产生的酶的效率比其亲代要高出500倍。两者一比,高下立见。另外的DNA改组实验也分别创造出了其他几种酶,它们有的能更快去除衣物上的污垢,有的能裂解新的分子,有的则能降解含砷的采矿废料的毒性。

DNA改组、细菌混交以及物种杂交,这一切都让我们认识到,在遗传景观内,远距离传送对大自然的创造力而言是何等重要。因此,我们也可以预见,根深叶茂的生命之树上到处都是远距离传送的影子。事实也是如此。不过,我们只能说是大部分如此,有些物种身上显然并未发生过基因重组。一些蝾螈目的雌性动物会通过未受精的卵繁殖,有些开花植物的种子会在没有花粉粒的情景下发育。但这些都只是生命之树上的一些小树杈而已。没有任何一个动物或植物的主要分支是无性生殖的。这一观察结果看似无足轻重,实际上深刻地说明了性的重要性。我们不能简单地说无性生殖的物种没有性别,它们是在进化史上的近期才失去性别的,否则我们就会在生命之树上看到一些更大的关于无性物种的分支。在数百万年前就失去性别的物种现在已经不复存在了,它们都遭受了进化的终极判决:灭绝。

这些信息清晰地说明了,没有性,一个物种在这世上就待不长。

一个明显的例外是极小部分被称为“古代无性生殖”(ancient asexuals)的物种。千百万年来,它们似乎一直是孑然一身。其中有大约300种被称为蛭形轮虫的小型淡水动物起源于距今3 000万年之前。人们没有发现任何关于这些小东西在搞些什么的蛛丝马迹,而且,最近的一项研究还揭示了一些比它们表面上的无性生活更让人瞠目结舌的现象:它们的基因组中有超过3 000个不属于自己的基因。这些基因甚至不是来自其他的多细胞动物的,我们也不知道这些基因是从什么地方被插入它们的基因组内的。

我们不知道蛭形轮虫是如何做到这一点的,但就如细菌已经将基因水平转移玩得炉火纯青一样,它们明显是利用了同样的机制来穿越适合度景观的。换句话说,有关它们如何进行远距离传送的机制还有待发现。它们的这种“无性”并不是完全的无性繁殖,或许还有其他的“古代无性生殖”物种和它们一样,或许它们只是偷偷摸摸地完成了一切,而它们的基因组中还隐藏着某些不寻常的关于性行为的特征。都21世纪了,生物学里还是有一些谜团等着我们去破解,而这其实是件好事。

重组现象在自然界中几乎无处不在,这证明了遗传上的远距离传送对促进生命形式的不断创新非常重要。但这同时也提出了一个恼人的问题:为什么柯克船长每次都是降落在母舰上,而不是被抛到了外太空?为什么重组明明就像闭着眼瞎跳,却很少掉到景观中的山谷里去?为什么不会产生乱七八糟的基因组和支离破碎的生物体?抑或是实际上这些情形都发生过了,而远距离传送机把大多数坠入山谷的怪胎都干掉了?遗憾的是,我们很难再发现什么了,因为那些从悬崖上跳下来的生物体甚至都没有出生过,就更谈不上展开研究了。还好,我们还可以另辟蹊径,利用计算机来模拟由分子重组和基因组重组引发的远距离跳跃。

世界各地都有研究人员在利用计算机来进行此项研究,他们得到的答案大同小异。其中,芝加哥大学的艾伦·德拉蒙德(Allan Drummond)研究了重组后基因在适合度景观里落在了哪里的问题:它们是离山头更近,还是离山谷更近?再确切一点说,重组后基因编码的蛋白质是否仍然会安然无恙?同样,在我的实验室里,一些研究人员探索了那些对新陈代谢中的化学反应进行编码的DNA在重组前后的情形。他们试图预测在适合度景观里经历一次长途跳跃后,新陈代谢机制是否还能支撑生命这一问题的结果。还有其他一些人研究了调控基因的重组和帮助构建生物躯体的调控回路。他们的关注点在于,在重组后,曾经用来构建生物体的那份精细配方是否还是完整无缺的。

所有这些科学家都对两种方式进行了比较:到底是远距离跳跃式的重组危害大,还是在同样距离下,每次随机改变一个字母带来的麻烦多。最终的结果是:重组比随机突变更能保护生命,而且可能性要高出数千倍。可以肯定的是,重组当然有可能导致破坏性后果,只要想想那些不育的杂交种就可以了。但其潜在的破坏性比起随机突变要小很多。与重组带来的巨大的创新潜力相比,两种后果简直不具有可比性。

无论是大自然重组基因组,还是生物技术专家重组分子,两者都不会以完全随机的方式改变DNA。相反,他们只是针对那些已经运转良好的生物体或者分子——否则它们也不会存活到现在,实施重组混合的操作。这就好比把两篇故事相近、词语不同的文章互换了一下,并不总是能起到提升的作用,但通常也不会完全破坏原意,就是有时会产生意想不到的转折,或者出现新的情节。不过,假如你只是像排版时犯错一样去硬生生地修改文本,那几乎可以肯定,你一定会篡改原作。

适合度景观的高维特征和景观高处的山脊网络,都可以帮助我们理解重组的潜能有多大。山脊的存在意味着物种在进行远距离跳跃后可以在高处着陆,并保持适应性。它们只需要降落在山脊上就可以了。就像重新洗牌一样,重组总是会将原来那些配合顺畅的分子放在一起,这有助于重组后的分子实现“软着陆”。

自然选择是没有远见的,而遗传漂变、DNA重组以及延展的适应性山脊网络三者叠加在一起,抵消了这种短视。原本自然选择的对象被强制性地要求在适合度景观里就近向上爬坡,而现在这种趋势变缓和了。这三者各具特色:遗传漂变步伐温和,既有上坡,也有下坡;DNA重组则在景观里一跃千里;适应性山脊网络不仅保障了重组后的软着陆,开启了新颖的前景,促成了群体的多样性,还使得部分个体得以登上更高的山峰。

大自然已经想出了很多方法来调和自然选择的作用,这同时也说明了采取调和手段的必要性。事实证明,人类身上也存在类似的需求。在回顾物理学家赫尔曼·冯·亥姆霍兹解决复杂问题的思路时,我们已经看到了一些迹象。稍后,我们还会再次遇到多种形式的调和手段,比如在取得革命性的科学进步的背后,往往离不开各种思想的交叉渗透,而这也是杰出的创造者绞尽脑汁、左思右想的结果。

肉食性毛毛虫、荒漠向日葵、抗抗生素细菌等,都只是在基因重组、遗传漂变和自然选择的共同作用下产生的无数生物体中的少数例子而已。加上适合度景观中的山脊网络,这些进化机制组合在一起成就了大自然的非凡创造力。接下来我们将看到,这些创造之力是如此强大、深远,甚至延伸到了非生命领域。在那里,一如既往地,目光短浅的登山者仍将寸步难行。

完美的巴基球结构

自哥特式尖顶以来,测地线穹顶或许是建筑学史上最大的成就。像蒙特利尔生物圈、佛罗里达州迪士尼乐园的“地球号宇宙飞船”等,均是以撑杆构成的网格为框架形成的空心网笼状建筑,以轻盈、稳定而著称。测地线穹顶的名字来源于围绕球体中心旋转的测地线。德国工程师沃尔特·鲍尔斯菲尔德(Walther Bauersfeld)在第一次世界大战后发明的测地线穹顶,一直等到美国建筑师和发明家巴克敏斯特·富勒(Buckminster Fuller)鼓吹其为全球住房问题的解决方案以后,才变得流行起来。

这些挑战重力、傲然屹立的建筑物本可成为展示人类创造力和独特力量的关键证据,却因一件恼人的小事而未实现。事实上,在数光年之外,在古老的星辰和星云组成的大熔炉中,大自然自始至终都在大量炮制着测地线穹顶的微缩版本。

我们必须感谢化学家哈罗德·克罗托(Harold Kroto)和他同事的发现。1985年,他们从光谱分析仪中得到的数据似乎表明,在遥远的恒星和星际空间里,存在着由十几个原子组成的复杂碳分子。为了了解这些碳分子在外太空的恶劣环境中是怎样形成的,他们试图在实验室的高温环境下(与恒星附近的温度相同)合成这些分子。在莱斯大学进行的一项著名实验中,他们向一块石墨发射了激光束,产生了超过1万摄氏度的极端高温,石墨块立即蒸发成了碳原子。

这些碳原子通过氦气喷流冷却后,形成了比科学家所追求的更复杂、更美丽的分子。每个分子都是由60个碳原子结合成的一个有32个面,由20个六边形和12个五边形相互连接的高度规则的球(图5-1)。这是一个标准足球的形状,用数学术语来说叫截角20面体。

图5-1 巴基球

为了纪念富勒的测地线穹顶,克罗托称这些分子为巴克敏斯特富勒烯(buckminsterfullerenes),但这个名称很快就被另一种更上口、更亲切的叫法——巴基球(bucky-balls)替代了。这一发现使克罗托和他的两位同事获得了1996年的诺贝尔化学奖。

巴基球的复杂性远超克罗托实验中出现的星际碳分子。但事实证明,外太空的确存在着巴基球,而人类光是为了发现它们就花了几十年的时间。2010年,另外一组科学家发现,无数的巴基球聚集在古老恒星的富碳外壳和星际星云里。它们的数量庞大,以至于遮住了附近恒星的光线。在人类,甚至是生命出现之前很久,大自然就创造了今天的宇宙结构,从那时起,宇宙大爆炸的残余物聚集成了原子,原子聚集成了旋涡状的星系,气体又聚集成了数不清的太阳和更多的行星——一切都是自发形成的。若要论大自然的创造力,巴基球这样美丽的分子应该独占鳌头。在理解了巴基球的自我组装原理之后,我们就可以在巴基球的启示下,更好地理解大自然的创造力。

能量景观的最高峰藏在最深的山谷中

在巴基球或其他任何分子中,结合在一起的两个碳原子有点像处在弹簧两端的两个小球。当把它们拉开时,你需要消耗能量。这种能量会被转移到弹簧上,并以物理学家称为“势能”的形式存储起来。我们可以将势能想象成原子所具备的能力,或者说“潜能”。当放开这两个原子时,它们会互相靠近。你拉得越用力,它们积累的势能就越多。如果你把两个原子挤向一起,也会发生同样的事情:它们会储存势能,一旦放手,势能就会释放,原子就会分开得更远。

一旦放任这两个原子不管,它们就会最终停留在某个中间的位置,在那里,由它们所组成的分子的势能是最小的,位于抛物线上的最低点,如图5-2。图中描述的是一个双原子分子的势能变化状况。你把两个原子向一起推,势能增加,它们就会沿着抛物线的左侧向上移动。把它们拉开,势能也增加,只不过这次它们是沿着抛物线的右侧向上移动。你推或拉的力量越大,它们向上移动的距离越长,分子所储存的势能越大。

图5-2 双原子的势能景观

从另一个角度来看,抛物线也是一个简单的二维景观,简单到只有一个山谷,化学家称之为双原子的势能景观。如果你丢一颗珠子在山谷周围的山坡上,珠子会顺着坡壁下滑,接着在谷底附近滚动一会儿,然后停下来。珠子在景观里的落脚点可以类比为两个原子之间的距离。珠子滑动、原子移动,时近时远,最终它们都将停留在势能的最低点。

物理定律作用于相互结合的原子,就好比重力作用于珠子。这个原理首先适用于由共价键连接的两个碳原子,共价键是使原子结合成巴基球的一种强化学键;这个原理也适用于任何两个原子,以及它们之间的任何物理吸引力。其中就包括带电的正负离子,比如食盐里的钠离子和氯离子。将原子结合在一起的各种弱作用力也在其内,如维持蛋白质三维形状的范德华力(van der Waals force,分子间作用力)。所有这些力都基于同样的原理变化而来,就好比由不同刚性的弹簧连接的不同大小的珠子。

更重要的是,同样的原理也适用于两个以上的原子,这也是使事情变得有趣的地方。

为了描述图5-2的情况在二维景观中的位置,你只需要知道一个数值:两个原子间的距离。知道了这个信息,我们马上就能得到景观中的高度。如果是3个原子相连,而不是两个原子时,事情就没那么简单了。3个球,通过3根弹簧相连,可以组成一个三角形。每一根弹簧都可以被挤压、被拉开,从而储存或者释放势能。换句话说,你需要3个数值,即每根弹簧的长度,来描述3个原子之间的距离。这时候,你还需要第四个数值来描述这个原子结构的势能。套用在景观中,前三个数值确定了一个位置,也就是上述三原子分子在势能景观中的位置。第四个数值则确定了这个位置的高度,也就是分子的势能大小。这就相当于为了描述一个三原子分子,就需要一个四维的景观,比我们熟悉的三维空间多出一个维度。

随着原子数量的增加,弹簧的数目也会增加,并且增加得很快。4个原子需要5根弹簧,5个原子需要10根弹簧,6个原子需要15根弹簧……以此类推。所需弹簧的数目,就好像网球运动员捉对厮杀所需要的比赛轮数一样。能量景观的维度也是如此。更复杂的是,通常情况下,原子不会像图5-2那样局限于二维平面。在三维的巴基球世界里,你需要3个数值来描述每个原子的位置,而巴基球有60个原子,总计需要180个坐标。考虑到还要额外增加一个数值来描述巴基球的势能大小,最终形成的将是一个181维的景观。

一个景观,不管是三维,还是三百维,其地形地貌都可以像得克萨斯州茫茫无际的平原一样沉闷枯燥,或者如图5-2那样,像一个弹坑那样简单。事实上,至少要有5个原子才能形成唯一的稳定分子——一种被称为三角双锥体(triangular bipyramid)的结构。归结起来,一个分子的势能景观非常简单,只有一个山谷;6个原子能形成两种可能的稳定分子结构,即景观里有两个山谷;7个原子能形成6种稳定的分子结构;8个原子能形成16种稳定的分子结构;9个原子对应着77种稳定的分子结构;10个原子对应着393种稳定的分子结构——在任意一种排列方式里,原子的位置都是在势能耗尽后稳定下来的。

原子数目一旦超过10,稳定分子结构的数目将爆炸式增加。仅仅几十个原子就可以形成一个含有无数个山谷的能量景观。其中一些山谷很深,对应着那些最稳定的分子结构。它们的原子排列通常呈现为高度规则的立方体、四面体、八面体(把两座金字塔的底部并在一起就形成了一个八面体),或者是像巴基球一样的截角20面体。大多数山谷比较浅,对应着那些不太稳定的由一堆原子组成的不规则分子,轻轻一推,整个分子就会换一个构型。分子的势能景观可以非常崎岖,就像生物进化所展现出的适合度景观一样,每一个位置都对应着不同的DNA序列或者基因型。势能景观也存在于一个抽象的、我们的三维思维无法想象的高维空间内。

这些相似之处非常重要。正如适合度景观可以让我们看到有机生物的进化如何创造新的生命形式一样,能量景观也可以让我们领略无机世界的新颖和精彩。它还向我们揭示了一团原子是怎样自我组装成像巴基球这样的分子的,这些分子不仅精巧严密、赏心悦目,而且结构稳定,即便它们远在其他星系,其辐射特征也可以被我们接收到。

你可能已经注意到这两种景观的不同了。在进化景观中,最好的地方是顶峰,适应性良好的生物都盘踞在那里。在能量景观里,顶峰反倒是最差的地方,它们对应着最不稳定的分子,这些分子中的原子会不断地改变位置以释放势能,分子构型也随之不断重排,直到形成稳定的结构,这个时候,分子就在景观中占据了山谷的位置。

这种差异并没有看上去的那么深奥。我们可以先在脑海里想象一个立体的地形图,就是那种你可以在阿卡迪亚国家公园或者大峡谷国家公园的游客中心找到的景观模型。这是一个三维的、按比例缩小的公园景观模型,上面突出了山峰、山谷。在表面之下,这种模型通常是中空的。如果你把这个中空的景观模型翻转180度,那么山谷就变成了山峰。通过这样简单的一个视角变化,你就可以将一个适合度景观转化为一个分子的能量景观。当进化在苦苦搜索最高峰的时候,原子和分子却在探寻最深的山谷,也就是最稳定的结构。

这些景观所容纳的不仅是架构精美的分子,还包含了让化学工程师和纳米技术人员如获至宝的物质。以净化汽车尾气的催化转换器为例,它要用到一些很昂贵的金属,如铂和金,这些贵金属的原子表面结构可以加速化学反应,进而分解像一氧化碳这样的有害分子。这也是催化转换器帮助净化汽车尾气的原理。

正因为催化剂的表面非常重要,所以在催化转换器里装上一块块黄金并不是什么好主意。一个金块的大部分黄金都在内部,在一个含有10万个金原子的微粒里,只有10%的原子是暴露在外的。如果能够将金块延展、分散成无数微小的金颗粒,形成化学家喜欢说的“金团簇”(gold clusters),那么大多数的金原子就会分布在表面。2012年,西班牙的化学家证实了这种做法带来的巨大改变:使用由不超过10个金原子所组成的团簇,催化效率提升了10万倍。

至于其他不那么昂贵的金属,如铁、镍或钴等,由它们所构成的原子团簇,与硫、碳等非金属结合在一起,其重要性要比催化转换器大得多。它们可以催化无数的化学反应,其中一些对化学工业至关重要,比如用煤制造合成润滑油,或用生物肥料制造燃料等。还有其他一些原子团簇,在帮助我们从营养物质中提取能量、维持身体运转方面发挥着重要作用。这些团簇都可以自我组装成不同的形状,或像面团一样展开,或像球一样团在一起,或排列成晶格。根据形状的不同,我们可以将催化剂分为高效的和惰性的。为了确定某种催化剂簇是否能够自我组装成最佳结构,化学家研究了其能量景观中最深的山谷,彻查了景观中可能阻止其最佳结构出现的障碍。在研究中,他们发现了一个很难对付的障碍,而这个障碍是个老朋友,跟进化在适合度景观中寻找最高峰时遇到的一模一样。

正如自然选择只会把物种往坡上推,重力也只能把原子往坡下拉。当金、碳或铁原子随机组合在一起时,结果一定是一团糟,一个没有组织的原子团簇,相当于一颗珠子随机地落在多维能量景观的任意位置。这颗珠子也许会恰好落在山谷里或者山头上,更多时候则会落在山头和山谷之间的斜坡上。从那里,它将下滑到最近的谷底,而原子团簇也将在谷底找到只需简单重排就可以形成的稳定结构。由于较浅的山谷远比较深的山谷多,所以几乎可以肯定它的这个栖身之所属于较浅的山谷,也就是说,它还是一个不太稳定、一团混乱的原子团簇,但它会被永远困在这个山谷里。

热量变化可以帮助分子从山谷中脱困

但大自然又的确创造了巴基球,所以上述场景中一定少了些东西。这个少了的东西也很容易理解:恰到好处的振动。

我们周围的原子和分子都在持续不断地振动。温度越高,原子和分子的振动越强烈。如果温度达到一定的值,振动就会变得过于强烈,以至于把分子或者团簇连接在一起的化学键会断裂,其原子也会四处散开。相反,如果温度越来越低,振动就会变得越来越弱,直到在绝对零度(即零下273.16摄氏度)完全静止。在振动和静止之间,一个分子的化学键(就是那些我们拿来比喻用的弹簧)仍然能够维持下去,但它们会被不断地拉来扯去,就好像有人在摇晃和推挤原子一样。蛋白质的振动也需要同样的推挤,这样酶才可以执行它们的任务。

还是拿珠子来作比喻。一颗珠子在能量景观里探索时,由于振动,会震颤不已,看起来仿佛是景观本身在持续抖动,这就像在遗传漂变的作用下适合度景观在抖动一样。温度越高,震感越强。如果一开始的时候珠子待在一个浅浅的山谷里,即使只是轻轻一晃也可以帮助它爬上连接附近山谷的鞍部,它就可能掉进更深一些的山谷里。如果珠子一开始是在一个深谷里,那鞍部就会更像一座山隘,除非振动足够强烈,否则珠子是“爬”不过去的。如果温度高到了可以让原子四分五裂的临界点,那么振动将极其强烈,以至于珠子会以一种不规则跳跃的方式遍历景观的角角落落,尽管它大部分时间都待在了最深的山谷里(也就是最难跳出来的山谷)。如此这般的跳跃将有助于这颗珠子探索景观,但也带来了一个新问题:珠子不会永远在一个山谷里待下去,原子会不断地移动、重排。幸运的是,这个问题可以通过冷却原子来避免。冷却,意味着珠子的震颤会减弱,也意味着珠子不太可能离开它正处其中的任何深谷。它会继续探索这个深谷,而山谷里本来就还有很多或宽或窄、或深或浅的裂缝和裂口在等着它。随着温度的进一步降低,这颗珠子会越挖越深,最终发现谷内有谷。当原子的热运动足够慢时,这颗珠子最终会在最深谷的最底部安营扎寨,这时,最稳定的分子也就诞生了。

至少按照统计物理学的观点来说,景观的世界就是这样运作的。统计物理学是物理学的一个分支,专门用来“对付”像原子这样的海量微粒。如果你请一位业余化学家在厨房里用糖、盐或硼砂等日常材料来培植大晶体,他会告诉你“慢慢来”才是成功的法宝,你冷却得越慢,晶体就越大、越规则。许多晶体并不像巴基球,它们的原子不是由强力的等价键连接在一起的,在更多情况下,它们的等价键相对较弱,在较温和的温度下就会断裂,或者溶解在水里,一个典型的例子是盐晶体。构成晶体的基本构件并不一定是碳原子,甚至无须是原子。它们可以是像砂糖这样的分子。但无论是一粒砂糖、一个巴基球还是一个金团簇,原理都是一样的:只要每个构件可以自由地振动和抖动(不要太强,也不要太弱),或者像玩拼图游戏一样,可以自由地探索无数的可能方案,那像分子、原子这样的微粒,最后都可以自组装成一种稳定的结构。每当其中一块拼图落入正确的位置,珠子就会滚入一个更深的山谷——微粒也就获得了一种更稳定的结构。在经历无数次这样的下降后,大自然就创造出了奇迹:数万亿个原子或者分子排列成了完美的几何图形,而这些都是大自然自力更生的结果。

从雪花这种大气奇观到花岗岩等结晶岩,再到钻石、红宝石、绿宝石等,非生命的世界是如此绚丽多姿,而其背后都是无数分子在浩瀚的能量景观里苦苦摸索。它们使用的材料五花八门,所需的热度和冷却速度也多种多样。要组装一个巴基球,碳必须被加热到数千摄氏度,再经过短短几毫秒的冷却时间,完美的球体就产生了。与之形成强烈对比的是,为了解决如何组装一颗钻石这个复杂的难题,大自然花了足足10多亿年的时间。

在自然界,大多数晶体都没有完美的形状,这是因为能否拥有完美的形状取决于原子能否以最低的势能进行排列。雪花的形状之所以千姿百态,令人眼花缭乱,就是因为它们的形状与理想的冰结晶有着天壤之别。雪花的完美形状是六角棱柱体,可以肯定的是,最小的雪晶通常能形成这样的结构,但较大的雪晶则不会。晶体的生长是从一团漩涡状的冰冷水蒸气中的一粒小小的结晶核开始的。在生长过程中,在空气中漂流的水分子会更多地附着在冰晶凸出的角棱上,而附着在冰晶表面的水分子则相对较少。换句话说,雪花在冰晶的某些位置生长得更慢,在其他位置上生长得更快。而那些生长得快的地方会冒出枝杈,物理学家称这个过程为“分支不稳定性”。枝杈上又长出新的枝杈,持续不断,就形成了一朵雪花。

在某个寒冷的冬日,我们静静地看着这些大自然的创造物纷纷扬扬地从天而降,进而领会大自然令人叹为观止的创造性景观。每一片雪花都早已不是一团没有定型的水分子了,在对应的能量景观里,每一片雪花都占据着一座独特的深谷(但不是最深的),这就是每一片雪花都独一无二的原因。

雪花和其他的晶体告诉我们,不完美也可以创造伟大的美。它们还告诉我们,巴基球是多么卓尔不凡。巴基球的景观里也有些无法测量的山谷,其中有些是浅谷,对应的是一团没有定型的碳原子;有些则是还没达到完美结构所在山谷深度的深谷,它们对应的是完美球体的一种变体,一个不完美的卵形体。然而,只要实验条件恰到好处,大多数碳原子都会聚合成巴基球,找到最深的山谷。这给我们的启示是:合适的振动是如此强大,甚至可以征服最复杂的景观。

殊途同归的热运动与遗传漂变

在生命进化的景观和倒转过来的能量景观里,我们遇到了类似的麻烦,这绝非巧合。由于坚持“一直向上”的原旨,许多景观都无法被自然选择征服,而这些景观的粗糙程度并不亚于无机世界的能量景观。在进化的适合度景观中,振动当然不是来自热运动,而是来自可以类比为热运动的遗传漂变。微弱的振动可以使小型群体逃离较矮的适应性山峰。而当振动非常强烈时(在最小的群体中),无论景观地形多么粗糙,它都可以驱动一个种群穿越景观。种群规模越小,遗传漂变的作用越强烈,这些振动也越频繁,种群探索适合度景观的速度越快。遗传漂变可以阻止一个种群被困在较矮的山头上,就跟热运动可以帮助分子、晶体、原子团簇等避免被卡在能量景观的浅谷里是一样的道理。

从创造美的角度来看,热运动对于无机世界,遗传漂变对于生命世界,都是点睛之笔。在表面上看,热运动和遗传漂变毫不相关,但是深究下去,两者却殊途同归——征服创造力的景观。两者既深谙完美之道,又容纳缺憾之美。

令人难以相信吧?尽管钻石和蝴蝶各领风骚,其形成过程却如出一辙。也许,这个源头的机理比大自然本身重要多了。几十年来,一些科学家和工程师一直对这种机理孜孜以求,并且找到了证据。这些证据不仅帮助他们找到了解决复杂问题的完美方案,还推进了一些更重要的事情:人类可以将寻找解决方案的任务委托出去。不是委托给别人,而是委托给计算机——有创造力的计算机。

将寻找解决方案的任务委托给计算机

在说到运输业处境艰难的时候,我们通常想到的都是卡车司机,他们在路上孤独度日,与家人长期分离,缺乏锻炼,还要在高速公路休息站吃那些可能导致动脉堵塞的食物。但对雇用司机的公司来说,生活也不是一片乐土。要想在一个高度竞争、利润微薄的市场中迎难而上,必须解决的实质问题是效率——燃油消耗、停工时长,还有最重要的路线规划。成功或失败,也许就取决于其中百分之几的效率差异。

制定卡车的行车路线似乎很容易。在仓库装货,在地图上标出客户的位置,连点成线,好啦,开车吧!别傻了。每辆卡车的装货量有限,交货日期也被限制在特定的时间窗口内,或许还有多个装货和卸货点,仅仅是找出通往多个卸货点的最短路径,就足够让司机感到为难了。当然,司机是个罕见的天才除外。拜访3个客户有6条不同的路线——好吧,一般的司机都能算出来。别急,我们继续,拜访4个客户有24条路线,拜访5个客户有120条路线。10个客户?300万条路线。15个客户?超过1万亿条路线。问题开始越变越难了,飞快上升的数字难免让人害怕。在现实中,如果客户数目有数百个,那探究其对应的路线数目到底有多少条已经没有什么实际意义了。以上情况针对的只是一辆卡车。而像联邦快递这样拥有超过4万辆卡车的公司,抛开其飞往200多个国家的600架飞机不算,想要为它们规划出最佳路线,靠一个天才可是远远不够的。

以尽可能低的成本交付最大数量的货物是一个数学问题,而且是很多公司每天都会遇到的一个复杂问题,所以这注定是一个为计算机准备的问题。但除非你有一个能够日复一日地解决这个问题的算法,否则就算有计算机也没辙。何为算法?算法是计算机可以遵循的一系列简化的计算序列。

寻找算法同样是一项艰辛的工作,只不过劳神的不是卡车司机,而是计算机科学家。最短送货路线问题太有名也太困难了,以至于计算机科学家为此专门创造了一个缩写:VRP(车辆路径问题,vehicle routing problem)。它是19世纪一个更著名、更古老的问题,即旅行推销员问题(traveling salesman problem,TSP)的伴生问题。在19世纪晚期和20世纪早期,有多达35万名销售人员在全美兜售商品,当一个销售人员需要拜访多个客户并希望走最短路线时,这个问题自然会浮出水面。它不仅对这些旅行销售员而言很重要,对其他行业的人员同样至关重要,如巡回牧师和巡回法官。以法官为例,他们需要以固定的路线在辖区内巡回,并在特定的日子开庭审案。虽然现在已经不再采取这一做法了,但巡回法院的名字还是得以保留了下来。

成千上万的计算机科学家在诸如TSP和VRP这样的难题上投入了巨大的精力,倒不是因为他们对卡车司机和推销员有多关心,而是因为这类问题在许多其他的领域里也会时不时冒出来。为了绘制复杂分子的原子结构图,化学家需要使分子结晶,再将X射线束照射到晶体上,测量其原子如何衍射光束。问题是,单从一个角度是不能达到目的的,化学家需要转换数百个角度来测量光束的衍射。换句话说,晶体的位置需要被旋转数百次。旋转得越合理,这些位置之间的总路径越短,实验所花时间就越短。

一位想在夜空中观察数百颗恒星或星系的天文学家也会面临类似的问题。每一次观测时,望远镜都必须调整到一个精确的位置,对大型望远镜来说,这个调整的活是由计算机驱动的马达来完成的。现代的望远镜非常昂贵,为了让世界各地的研究者能够共享望远镜资源,他们必须排队等候宝贵的观测时间。望远镜对准目标位置的调整速度越快,移动的距离就越短,使用效率就越高,可以留出更多的时间给观测者。

同样,当计算机芯片的设计者在一个新的芯片上摆放数百万个晶体管时,他们需要尽量缩短晶体管之间的线路总长。否则,其设计结果会导致宝贵的、以平方毫米计的芯片面积的浪费。另外,电子如果在晶体管之间进行长距离传播,也会浪费宝贵的能量。

旋转晶体的最短路径,调整望远镜位置最经济的方式,晶体管之间的最短线路长度,这些问题的关注点虽然不同,从数学上看却是类似的。

解决复杂问题需要最具创造性的解决方案

比车辆路径问题的应用更重要的是,该问题对我们有着深刻的启迪作用:复杂问题处处都有,而复杂问题的本质是它需要最具创造性的解决方案。理解了这一点,就相当于拥有了一块能够对创造力进行广义理解的敲门砖。大自然用于创造巴基球和雪花所使用的技巧,同样适用于为上述复杂问题提供创造性的解决方案。而这些技巧,正是跨越那些无法理解的、广袤无际的景观时所需的。

以图6-1为例,图中的序号和箭头代表着从一个仓库出发拜访10个客户的路径。客户由图中的序号代表,图下方的数字串代表访问客户的顺序,每一个数字串代表一条路径编码。

图6-1 车辆路径问题示意图

仅仅10个客户就产生了超过300万条不同的路径,每一条路径都可以用类似的数字串来表示。同时,每一条路径都有相应的代价,可以用旅行距离、时长、燃料消耗量来体现,也可以出于环保的考虑,用二氧化碳排放量来表示。就像任意一个核苷酸序列都编码了一个解决生命问题的方案一样(无论好坏),任意一条访问客户的编码序列都对应着车辆路径问题的一个答案。这些答案当中,大多数是糟糕的、过长的路线,但也有少数是高效的、短的路线。在适合度景观里,一个DNA序列或者一种基因型对应着景观里的一个位置。而车辆路径问题的所有答案加在一起也组成了一个景观,在这个景观中,一条路径也对应着一个位置,路径的长度就是这个位置的标高。而当我们评价一个答案的质量如何的时候,就跟我们说一个生物体的适合度如何是一样的。

这个路径的代价景观也是一个抽象的、高维的景观,而不是一个三维景观。起伏的沙丘和崎岖的山脉、深浅不一的洼地和山涧,就是不同路径的代价在景观里所呈现出来的地貌。与进化景观不同,但与原子和分子的能量景观相同的是:它的最高峰是最糟糕的地方,因为这里也是路径最长的地方。

任何针对车辆或销售人员的路径的算法都是一种预先设定,用于在代价景观中搜索,寻找与最佳和最短路线相对应的最深的那个山谷。此类算法有点像一个分子在寻求一种特别稳定的原子架构,也就是寻找能量景观里的一个深谷。而算法在车辆路径问题的代价景观里的探索,跟振动着的分子在能量景观里到处游历,或者进化中的生物体在适合度景观里寻寻觅觅没有什么区别。

在进化景观里,最小的进化步骤是导致单个字母改变的DNA突变,即点突变。而同样的步骤在车辆路径问题的代价景观里根本不起作用。想象一下,按照图6-1(a)下方的数字序列,将一个客户(比如5号客户)替换为任意一个其他客户(比如10号客户)。这是一种和点突变最为接近的方式,但这种方式造成了两个问题。第一,因为上来就排除了5号客户,所以最终的路径根本不会访问此客户。第二,10号客户被访问了两次。换言之,简单地效仿点突变的方式违反了路径规划的两个基本原则:(1)所有的客户都必须访问到;(2)每个客户只能访问一次。相邻的路径不能只有一个客户不同。我们需要的是一种新的“变异”,变更或者交换访问两个客户的顺序,如图6-1(b)所示,交换5号客户和6号客户的访问顺序。交换,是为了保证每个客户只访问一次。实际上,连接任何数量客户的任何路径都可以用这种交换序列的方式来创建。换个说法,从景观的任意位置出发,你都可以通过交换客户位置的方式到达另一个任意位置,而景观里最少的可能步骤就在其中。

贪婪算法:只接受更优的结果

这种旅行的最终目标是找到最深的山谷。为了达到这个目标,计算机科学家发明了很多算法,有好的,也有差的。让我们来看一个特别简单的例子。

任意选择一条路径——不管它有多长、多么低效,然后随机交换两个客户。如果交换的结果是路径变短了,就留下这条路径,反之则回到原点。然后随机交换其他两个客户,如果路径变短了,就再把它留下。重复这些步骤。每一次成功的交换都会改变路径在景观中的位置。一步接一步,一次成功的交换接着一次成功的交换,最终你将得到一条不能再通过交换而缩短的路径。

这种算法在景观中保持着下降的趋势,目的是寻找最低点。这和自然选择在适合度景观中一路向上的趋势是一致的。自然选择只允许适合度提升,这种算法则只允许路径长度缩短。如果把最初的答案看作景观里的一颗珠子,那这个算法就好比作用于珠子上的重力,把珠子向下一路拉到最近的据点。这样的算法很重要,原因是它们很简单。

计算机科学家给它们取了一个“贪婪”的称号,而贪婪不一定是坏事。假如代价景观是一个陨石坑的话,在经过岁月的风化和侵蚀后,任何的一系列下坡动作都会让你到达底部。但这个“假如”是一个大大的问号。

车辆路径问题属于计算机科学家称为组合优化的一大类问题。这是因为每个解决方案中都包含不同的构件,而算法就是要以不同的方式将这些构件组合起来,并找出一个最佳的或者优化的答案。在车辆路径问题中,构件就是客户。当为卡车规划路径时,你要将同一批客户以不同的顺序进行组合,并找到最短路径。在设计一个电网的时候,你要把不同位置的多个电厂组合起来,以确保客户获得足够的电能。在医院里安排护士工作的时候,你要分配不同的护士轮班组合。而当谋划一场战斗的时候,你要用不同的武器组合去攻击不同的目标,以达到使敌人的损失最大化的目的。

并非所有的组合优化问题都很棘手,而它们都具有一个解决方案景观。针对这些景观,在经过半个多世纪的探索、测绘和研究之后,计算机科学家已经掌握了其中的关键之处,即让这些问题变复杂的因素。

一个问题之所以复杂,不是简单地因为它有很多可能的答案——所有的组合优化问题都是这样。其实我们已经很熟悉产生困难的原因了,只要看看自组装的分子和适合度景观就可以知道:所有的答案组成了一个崎岖不平的、月球般的陨石坑景观,里面有无数的浅坑、不太多的深坑,以及极少数很深的坑,而要从所有的坑里把最深的坑找出来几乎不可能。

车辆路径规划的代价景观就是这样,大大小小的坑不计其数。一个只能下降的算法可能会钻进一个小陨石坑里(这样的坑太多了),陷在里面无法自拔。即便是基于偶然的运气,它掉进了一个大陨石坑里,也可能走不了多远。这是因为大的陨石坑就像麻子脸,里面还有很多小一些的陨石坑,而陨石坑里还套着更小的陨石坑。该算法可能会在一个靠近大坑边缘的小陨石坑里终结旅程,所对应的路径长度比其能达到的最短值要长出很多,但这时已经回天无力了。

复杂问题还有另一个令人讨厌的特性:它们会越来越复杂,这是因为它们的规模会越来越大。随着客户、发电厂、护士或者武器数量的增加,陨石坑的数量会呈指数级增长。将陨石坑“翻译”为技术术语,就是局部极小值(local minima)。就像分子能量景观中的极小值一样,其数量很快就会超过最强大的计算机的处理能力。在一个有10个客户的车辆路径景观中,存在着大约100个局部极小值,对于15个客户来说,相同的景观内存在超过1 000个局部极小值。而对于具有实际意义的客户数目而言,这些极小值的数目是数不清的。在这么多极小值中,只有一条属于最佳路径,或者说全局极小值(global minimum),要找到它如同大海捞针。在现实中,人们所期望的往往只是一个“够好”的答案,即一个在众多极小值中“比较深”的答案,而并不需要那个最优的答案。雪花,才是复杂问题的解决之道。

在这样的环境下,任何算法在探索景观的时候都会面临一个常见的问题:为了走出一个较浅的山谷,它需要克服重力持之以恒的下拉力。进化也遇到了同样的问题,因为它也面临着自己的贪婪算法:自然选择。

模拟退火算法:即使结果变差,也暂时接受它

幸运的是,在贪婪算法失败的地方,其他的算法还能够完成接力。其中一种算法叫作模拟退火(simulated annealing)。退火一词来自冶金业,指的是一种降低钢和其他金属的脆性,增加其可塑性的处理工艺。例如,剑匠在锻造剑的时候就会使用这种工艺。当一个铁块被退火时,它首先会被加热到一定的温度,在这个温度下,铁原子会强烈振动,发生移位。如果以非常慢的速度使铁块冷却,这会使原子形成小晶体,进而使铁更具延展性。这种处理方法的核心是“热”,也就是使分子能够探索能量景观,发现巴基球、金团簇和钻石的方法。这不是巧合,创造力的不同领域之间本来就有着深入的联系。

模拟退火——它的名称已经说明了一切,是一种利用计算机模拟退火过程的算法。该算法可以针对某一问题在其解决方案景观里探索,并一步一步地在景观内游历(如果这个问题是如何确定卡车的路线,那么每一步可能意味着交换两名客户)。在每一个步骤之后,算法都会计算该步骤是否会带来一个更好的答案,如一个更短的路径。如果是的话,算法将接受这个步骤的结果。这与贪婪算法完全相同。关键的区别在于:即使结果变差了,算法也会以一定的概率接受该步骤。在算法运行早期,这个概率很高——算法接受上坡和下坡的可能性差不多。随着时间的推移,算法继续探索景观,“冷却”开始——算法会逐渐降低接受上坡结果的可能性。在1 000步以后,算法或许只会接受1/2的上坡结果;在10 000步以后,算法可能只接受1/10的上坡结果;在10万步以后,则可能只接受1/100的上坡结果……最后,算法将只接受下坡的结果。

如果想了解这个过程和铁块的冷却过程有多少相似之处,我们可以将某一问题的解决方案景观与第5章中的巴基球或雪花的能量景观比较一下。如果把贪婪算法看作重力在向下拉一颗珠子,无论这颗珠子是用来比喻碳原子的结构,还是车辆路径问题的答案,模拟的加热过程都和使珠子逃离重力作用的抖动是一样的。通过加热,粒子的剧烈抖动就像能量景观里的上坡运动(意味着更加不稳定的碳分子)。同时,在模拟退火的早期阶段,算法也允许珠子移动到糟得多的答案上去(意味着长得多的路径)。珠子一旦落入山谷,抖动很快会把它从那里拽出来,而不管山谷有多深,分子有多稳定,路径有多完美。在早期阶段,不管地形如何崎岖不平,珠子所得到的只是探索景观的广度。随着冷却的进行,景观内的抖动会逐渐变弱。珠子更倾向于下坡,倾向于朝着更稳定的分子或者更短的路径前进,也更倾向于锁定在当前的山谷里。如果山谷很深,逃跑基本上就别指望了,因为这需要连着上好多次坡。但在崎岖的景观中,最深的山谷中往往还包含着较浅的山谷,即便景观的抖动变弱了,这颗珠子还是有可能从较浅的山谷里跳出来,滚动到下一个山谷中。只有到了最后,珠子才会被限定在一个山谷里,这时,它将到达这个山谷的底部——最后的安息之地。这个位置,就对应着大自然中最稳定的分子,或者算法所能找到的最佳答案。

模拟退火算法的吸引力在于一个简单的数学事实:只要冷却足够慢,也即振动强度的下降速度足够慢,我们就肯定可以找到最深的山谷,也就是找到全局极小值或者最短送货路径。这里说的振动,和遗传漂变震动一个在适合度景观里探索的种群是一样的。一个小规模的种群在强烈的遗传漂变作用下进化,就好比模拟退火算法的早期阶段。模拟退火算法本身也有点儿像进化,一开始种群规模比较小,而随着时间的推移,种群规模逐渐变大,遗传漂变的作用就变得越来越弱。

与进化相比,模拟退火算法还有一个优势,即它是一个计算机算法,我们可以控制它的每一个细节。而在生物进化中,并没有一个策划者会为了利益最大化而操纵进化中的种群。例如,种群规模取决于许多环境变量,包括气候、食物、竞争者等,这些都没办法进行人为控制。模拟退火算法的成功与否取决于温度高低,而温度是可以由计算机算法精密控制的。正是由于这一点,模拟退火以及人类发明的其他算法不仅能够解决复杂问题,还能比大自然做得更好。

遗传算法:模拟物种进化,找到最佳方案

我们能把同样的思路用到进化上吗?能不能在计算机里模拟进化,让进化变得更可控呢?这种想法并不算牵强,达尔文的进化论本身就可以看作一种算法,只不过步骤简单得多:突变、选择、重复。只是这个算法转换的不是比特和字节,而是生物,所以它可以用于模拟DNA、模拟表现型以及模拟生物体。在这样的模拟中,我们可以控制每一个细节——突变多久发生一次,以何种标准选择最佳变体,是否允许交配和重组等。这种控制水平还可以再次帮助我们提升算法解决问题的能力。更重要的是,工程师不仅可以修改算法,还可以利用它来解决他们所关心的问题,这些问题可能跟车辆路径问题一样,与大自然本身没什么关系。利用进化算法来为人类造福的梦想并不新鲜,这可以回溯到计算机科学的先驱阿兰·图灵(Alan Turing)。

1950年,图灵在一篇题为“计算机器与智能”(Computing Machinery and Intelligence)的开创性文章中,设想了一种既能思考又能学习的机器,而且他认为,与DNA突变类似的“随机元素”可能会帮助造出这台机器。20世纪六七十年代,等到计算机的处理能力强大到能够模拟进化的时候,图灵的愿景实现了。那时,一个新的研究领域出现了:进化计算(evolutionary computation)。这一领域的先驱者之一是约翰·霍兰德(John Holland),他当时是密歇根大学工程与计算机科学专业的教授。霍兰德生性开朗,热情洋溢,全身每个细胞都散发着对科学的喜爱。他对新思想的热情富于感染力,对既定教条的蔑视根深蒂固。正是这些特征,使得他在20世纪70年代成了进化计算的先驱。那时,他开发了一系列模拟进化的计算机算法(他称之为遗传算法),这些算法直到现在都还是进化计算中最强大的算法。通过他和其他人的工作,进化计算发展成了一门新兴学科,而且在今天拥有了成千上万的研究者,他们的目的就是在大自然的进化算法的基础上不断改进。

模拟退火是将单颗珠子推动着穿过解决方案景观。与模拟退火算法不同的是,遗传算法则面向多颗珠子或整个种群。在计算机内部,这个种群的每一个成员都携带着一条“染色体”,也就是图6-1(a)中的数字串,它编码了一个答案,答案的质量好坏未知,就像DNA编码了一个适应性未知的生物体一样。每条数字串都可以“变异”成为新的数字串,例如,每条“染色体”都编码了一个路径规划问题的答案,而将“染色体”上随机的两个客户进行调换就是一次变异。计算机可以借此在种群中选择最佳的解决方案,从而选择一个新的、改进的种群,就像生物进化一样。

遗传算法所遵循的是生物进化中久经考验的原则,所以,当它们面对复杂问题时,也会遇到同样的障碍。自然选择本身是无情的。和婆罗洲的丛林中进行的自然选择一样,在崎岖的景观中,计算机算法所执行的选择在寻找最高的适应性山峰或者最低成本的山谷时,表现非常拙劣。自然选择本身也是短视的,所有不完美的解决方案都会被它消灭。更糟糕的是,它不接纳任何失败,而这些失败对最终的成功是必不可少的。

幸运的是,遗传漂变可以帮助遗传算法避开这个陷阱,就像它对生物进化做的那样。大多数遗传算法所涉及的种群规模从几十到几千不等——种群规模越大,所需要的内存和时间越多。这些种群规模远小于十几亿的微生物群体,更像是大型动植物种群,遗传漂变在其中可以强大到克服选择对下坡路的厌恶。换句话说,遗传算法天然就不会受困于无情的选择,这要归功于其适度的种群规模,而适度的种群规模本身是由有限的计算能力决定的。

遗传算法也可以模拟有性生殖。在它们的种群中,一些个体通过交换模拟染色体上的片段,实现“交配”并生出“孩子”,于是产生了解决问题的新方法。这跟基因重组交换生物体内真实的DNA一样。这种人工重组还可以在景观中远距离传送个体,而要是想靠一步一步的算法推进,那可能永远也找不到新的解决方案。在生物进化过程中,我们看到了有性生殖所取得的惊人成功,在遗传算法中,重组也已经被证明是如此重要,以至于有些科学家在编制算法的时候,将90%的染色体变化设置为由重组引起,而只有10%由突变引起。

遗传算法和模拟退火算法只是求解算法大家族中的两个成员。这个家族中还有很多其他名字怪异的成员,如分支定界(branch-and-bound)、线性规划(linear programming)和禁忌搜索(tabu search)。科学家对“旅行推销员”这个古老、重要、复杂的问题进行了深入的思考,在洞彻其数学之道后,创造出了这些算法。正是日积月累的数学经验,帮助科学家在景观里找出了不同的捷径,并设计出擅长寻找这些捷径的算法。所有这些算法在应对类似“寻找最短路径”之类的棘手问题时,表现都相当出色。

例如,1987年,一条能够将全世界666个旅游目的地都连接起来的最短路径被世人广泛熟知。这是在超过10 1 500种可能路径中找到的最优解。到了1998年,经过10年的算法设计和算力提升,莱斯大学的研究人员终于发现了连接美国13 509座城镇的最短路径。

可能会让圣诞老人感兴趣的一个更大的问题是:找出连接所有已知的190万个人类居住区的最短路线。这个问题还未解决,目前取得最好结果的算法所发现的路线长度为750万千米,而这已经很了不起了:从数学上可以证明,这条路线比起那条还没有找到的最短路线最多长0.5%。假如圣诞老人经营着一家货运公司的话,他肯定要关心利润率,这下他终于可以放心啦。

这就是最先进的算法在拥有强大计算能力的计算机科学家团队手里所取得的成就。它们有时能针对某些具有惊人复杂度的问题找到最佳解决方案。如果做不到的话,那可能是因为景观太过复杂,即便算法进行了简化,但还是无能为力。例如,尽管模拟退火算法可以确保在任何景观中最终都能找到最深的山谷,但是求解一些问题所需的冷却过程是如此缓慢,以至于算法需要数千年的时间才能找到最优解。

大多数先进的算法针对的都是那些已经研究得比较透彻的问题,其解决方案已经具备了一个模糊的轮廓可供参考。然而,工程师每天还是需要面对很多新的问题,比如如何减少内燃机的废气排放,如何提升太阳能电池板的效率。在这种情况下,相应的景观还笼罩在黑暗之中,我们和算法都是在盲目地进行探索。这时候,遗传算法就可以派上用场了,因为这种算法采取的方式恰好就是生物进化探索适合度景观的方式:盲目变异再加上选择。如果你觉得很难接受这种盲目性,那么就想想同样盲目的生物进化所创造的众多奇迹吧。

今日之算法已经取得了非凡的成就,但大多数人并不会将其产出称为创造性的产品,无论我们说的是最短的送货路线,还是医院里最优的人员配置方案,更不用说那些嗡嗡作响的电网。缘何如此?让我们重新审视一下遗传算法吧。它们所遵循的步骤与进化创造出红杉树、蓝鲸这样令人惊叹的物种所采取的方法是一样的。我们当然认同这些物种都是一个个创造性过程的结果,那么,算法和进化之间又有什么区别呢?这种区别,一定不是取决于算法怎样创造出新生事物,因为这种“怎样”对生物进化和模拟进化来说是相同的。这种区别一定是来自算法创造了些什么,也就是说取决于算法的染色体和它所编码之物。

大多数遗传算法的染色体是由数字串组成的,代表着一些抽象事物,如访问客户的顺序。而真实染色体上的DNA是一串分子,可以对现实世界中的对象进行编码,无论是微小的蛋白质还是巨大的恐龙。每当进化创造出一种蛋白质,以消化一种新的食物、感知一种新的气味、抵抗一种新的抗生素,或者每当进化创造出一种跑得更快的瞪羚、飞得更高的鸟类、潜得更深的鱼类,它就解决了一个巨大的组合优化问题。而组成这个问题的基本元素就是那4个耳熟能详的DNA字母。进化,在适合度景观里寻找着高山之巅的时候,所做的就是将这4个字母以一种全新的方式组合在一起。

说到这儿,一切就都再清楚不过了:想要真正创新,就要先选择正确的构件。

最早理解这个原则并加以实施的是约翰·科扎(John Koza),他是遗传算法先驱约翰·霍兰德的一位博士生。从20世纪90年代起,科扎与其同事一起设计了遗传算法,其染色体不仅编码了电路元件(如电阻、电容),还编码了这些元件连接在一起的方式。他们使用这些算法创造出的新型电路,达到了法律所定义的“创造性”标准。这一标准与心理学家定义的“创造性”差不多,也就是“针对某个问题的新颖的解决方案”,只是它明确定义了“新颖”的含义:有资格获得专利。每一个发明都解决了某些问题,但只有最新颖的原创才有资格获得专利。用美国专利法的话来说,一项发明,如果对一个在其领域内拥有普通技能的人来说具备“非显而易见性”,那么它就是可以申请专利的。科扎的遗传算法帮助创造了达到这一标准的电路。

在之后的几年时间里,这些算法为十几个功能电路创建了线路图,比如向音响系统的低音炮发送低频声音的低频滤波器。其中有几个电路已有人类工程师发明过,而且在科扎之前已经由美国电话电报和贝尔实验室等公司申请了专利。但是不管怎样,科扎他们的这种“再发明”释放了一个强烈的信号:算法可以拥有创造性,其创造物可以和人类创造的物品相媲美。

2005年,科扎团队创造的算法发现了一种新的控制器,就是在汽车处于巡航状态时用于稳定车速的控制器。因为该控制器足够新颖,他们的团队获得了相关专利,而这也是第一个由机器发明的专利。

遗传算法的创新潜力并不止于此。利用染色体来编码,遗传算法可以进化出在捕获光线方面表现非常优异的表面结构,从而提高太阳能电池的效率。针对这个捕获光线的问题,存在着许多次优的表面结构,也就是景观里的那些浅谷,类似重组这样的算法可以帮助生物体避免在进化过程中陷入那些次优解中。

借助对望远镜的复杂镜头系统进行编码的染色体,遗传算法可以进化出一种宽视野目镜,比人类设计并取得过专利的镜头更优越。当把染色体编码作用于天线部件时,有一种遗传算法可以替美国国家航空航天局的太空任务装备新型的、在外太空使用的天线。2006年,在美国国家航空航天局的一次太空技术任务中,这种天线被安装在了卫星上。其独特之处在于,这是太空中的第一个人类制造物。与其说这个制造出来的硬件是由人类设计的,不如说这是由一个算法进化出来的。

上面说的都是工程领域的事情,而在科学领域又何尝不是如此?我们之所以对牛顿、伽利略等科学家的聪明才智尊崇不已,是因为他们能通过观察一颗星星或一个钟摆这样的物理系统提炼出大自然中的数学规律。事实证明,模拟进化过程的算法也有这样的能耐。2009年,康奈尔大学的科学家提出了一种可以发现钟摆系统运动方程的算法。这个系统可以是由一个悬挂着的重锤组成的简单钟摆,也可以是复杂些的双钟摆,也即由两个悬挂着的重锤组成的钟摆系统。算法所需要的是钟摆运行的数据,以及组成运动方程的解的构件。而构件就是变量和数学函数。换言之,这种算法不仅可以针对晶体管、透镜和电子线路,还可以针对数学函数。数学函数本身同样可以突变、重组,将这个过程重复下去,算法就会找到一个能够完美描述数据的函数组合。

算法有此壮举,因此当有人把遗传算法称为“盒子里的托马斯·爱迪生”时,我们也不会大惊小怪。或者我们也可以称其为“盒子里的伽利略”。显然,创造性算法的时代已经到来。

很多人对这样的想法都心存畏惧。这的确让人不安,就好像人类突然认识到了地球并不是宇宙的中心,承认了我们和黑猩猩有着共同的祖先,发现了我们不是唯一一种能从镜子中辨识出自己的动物。自哥白尼革命以来的几个世纪里,这样的发现一点一点地砸掉了人类的妄自尊大。但不安归不安,这些发现会一直持续下去,包括这一点:不是只有人类才有创造力。

下面的说法或许会让你好受些:“机器”这个词仍然会让很多人联想到过去时代的产品,像是18世纪的玩意儿,比如蒸汽机、纺织机,或者由弹簧、连杆、轴承、链条和齿轮构成的计时器。创造性机器可不是这样的,它们所执行的算法也不是。一个算法经常会被拿来和食谱类比,一些厨师会严格遵循食谱,机器会死板地执行算法,但这样的算法其实并不会产生任何新的东西,每次你运行算法,就跟按照食谱做菜一样,最后端出来的菜都是一样的。而遗传算法和类似模拟退火的算法,跟传统的食谱有很大区别,它们是随机的,有各种可能性。这意味着随机性对此类算法很重要,就像生物进化一样,基因组里每一次DNA发生突变和重组的位置都是随机的,而每一次随机变化都有可能改变进化的途径。所以,生物进化和创造性机器的产物都是不可预测的、新颖的、独一无二的,从这一点上来说,创造性机器和人类的艺术作品有着异曲同工之妙。

由计算机创作的艺术作品可能会比机器创造出来的技术更让你心神不宁。你可能会想到,伟大的艺术品都是自成一格、独一无二的,这说什么都跟一个算法在景观里钻来钻去的理念格格不入。为了消除这种不和谐感,我们有必要再次回忆一下。我们所遇到的景观都是辽阔无垠的,大到足以容纳无数像雪花一样独特的创造物,而一个算法的运行过程也是不可预测的,对每一个这样的创造物,它可能都只会发现一次。

日本东京的龙安寺有一件令人瞩目的艺术品,正好属于“生成式艺术算法”(artsy algorithm)所能解决的问题。这个寺庙中有一座著名的石庭,设计简约,在一层碎石床上精心布置着15块石头。庭院中散发着和谐宁静的神秘气氛。它被联合国教科文组织纳入了世界遗产名录,每年都有成千上万的游客到访。遗憾的是,我们不知道艺术家是如何营造出这座石庭的强大气场的,因为我们连这座拥有500年历史的石庭的创造者姓甚名谁都不知道。认知科学家格特·凡·托德(Gert van Tonder)及两位合作者使用数学工具分析了这座石庭的设计,发现了一个令人啧啧称奇的简单模式。从寺庙的主厅——石庭的最佳观景点看过去,对称排列的石头使人联想到了分形树木图案。这是一种对人类有特殊吸引力的模式,也许是因为我们进化的源头是非洲大草原吧。换句话说,石庭的吸引力部分来自从大自然里的一个无处不在的主题里提取出来的抽象图案。不管是有心还是无意,艺术家在解决创造宁静氛围这个问题时,采取了在石庭里布置石头的时候嵌入分形树木图案的方案。

理解艺术品的力量是一回事,创造艺术品则是另外一回事。但即使是在后一个领域内,算法也取得了长足的进步,特别是在创作音乐作品方面成绩斐然。这绝非巧合,而是因为音乐能够为创造性算法提供理想的构件。

音乐作品的基本构件是动机(motif),即以各种形式进行变化的旋律片段。几个世纪以来,作曲者和演奏者早已对这些变化的方式谙熟于心,并将其进行了分类。作曲家可以通过放慢节奏来“扩张”一个音乐动机,也可以通过加快节奏来“压缩”它,还可以采用倒序、排列置换、逆行、转调等技法。在18世纪,当音乐骰子(德国人称之为Musikalische Würfelspiele)成为欧洲流行的室内游戏时,人们已经通晓了将这种“变异”的音乐动机随机组合成新的音乐片段的技巧。这些游戏中最著名的当属莫扎特创作的游戏,人们通常会先掷骰子,然后根据结果从一大堆音乐片段中抽出小段来,拼接在一起组成一首华尔兹舞曲、波兰舞曲或小步舞曲。

计算机时代将这一传统推向了新的高度,并催生了一个专门的人工智能研究分支——用算法来作曲。其先驱者之一是戴维·科普(David Cope),他是一位颇有成就的美国作曲家。20世纪80年代,在科普还是个年轻人的时候,其作品就受到了音乐评论家的赞扬,并在卡内基音乐厅进行了演出。也就是在这段时间内,当他受人之托试图创作一部歌剧时,却经历了一段严重的长达几个月的瓶颈期。在为了养家糊口而绝望地继续创作之余,他开始思考计算机是否能帮他作曲。最终,在一个叫作“音乐智能实验”(Experiments in Musical Intelligence,EMI)的项目中,科普的努力取得了累累硕果,他亲切地称这个项目为“Emmy”。

当Emmy接收到作曲家的作品后,她(是的,科普就是这么称呼他的这个项目的)会进行分析,找出能够代表作曲家风格的标志性元素,也就是乐曲的构件。然后,她会在这些构件中加入变化,也就是突变,最后创造出新的组合。最终的结果就是产出了带有巴赫、马勒或维瓦尔第风格的新作品,速度之快,让人惊叹。用科普自己的话说:“你按下按钮,就会一下子出现成百上千部奏鸣曲。”

我们珍视作曲家的作品,部分原因是他们的作品数量有限。毕竟,作曲家也是凡人,也有生老病死。科普也意识到,Emmy无限的创造力会贬低这些作品的价值。于是他马上决定关掉了Emmy。几年后,他把她的数字大脑也给封存了起来,但此时他已经发表了上千首Emmy创作的作品。其中有些制作成了CD,有些则可以通过互联网平台欣赏。有些听众嘲笑这些作品没有灵魂,有些则认为这些作品非常感人。但是除非事先被告知,不然许多人都无法识别出哪些作品是由Emmy创作的。这使得Emmy的作品成了著名的图灵测试的音乐版。图灵测试的目的是区分人工智能和人类智能,在20世纪50年代的原始版本中,测试至少需要三方参加:人类、人工智能和裁判。裁判看不见其他两位参与者,只能向他们提问题,而且只能收到书面回答。然后,针对每一项答案,裁判要辨别其到底是来自人类智能还是人工智能。如果裁判错了,那就说明人工智能通过了测试。

俄勒冈大学也开展了一次类似的测试,对象是Emmy创作的一部巴赫风格的作品。评委们分别倾听了一部Emmy的作品、一部巴赫的作品,还有一部由巴赫同时代的作曲家创作的作品(也是巴赫风格的),这三部作品均由同一位专业钢琴家演奏。当评委们被问到这些曲子分别由谁创作的时候,他们答错了。他们认为Emmy的作品属于真正的巴赫,而第三部作品(人类的作品)是由计算机谱写的。Emmy通过了图灵测试!

尽管如此,一些评论家还是对Emmy的作品嗤之以鼻,斥之为“仿作”。为此,科普回应说,“所有的作曲家都会直接或间接地引用其他的音乐,包括他们自己的作品”,“我可以在莫扎特的交响乐中找到一段又一段引用或者演绎海顿类似段落的地方,我们还是非常尊崇两位作曲家”。科普将音乐创作视作“灵感的剽窃”,把Emmy的作品称为“重组的音乐”,而这丝毫没有贬低它们的原创性的意思。相反,它们复用、修改和重组了之前的内容,这跟大自然的做法如出一辙。

不过,尽管在Emmy的创作过程中,突变和重组都发挥了一定的作用,但她并没有执行遗传算法,即没有通过持续数代的突变和选择来进化出一部作品。也有其他一些算法做过类似的尝试,其中一个是“旋律体”(Melomics),其名字来自“Melody”(旋律)和“Genomics”(基因组学)两个单词的组合。2012年,“旋律体”创作了一部由伦敦交响乐团及其顶级音乐家演奏和录音的作品。一些听众认为,该作品极具艺术性,令人愉快且富于表现力。但就跟大多数现代音乐一样,人们对此的看法并不一致。

在其他音乐类型中,算法也可以从事创造性的工作,如爵士乐。其中一个叫作“继承者”(Continuator)的算法,是由来自巴黎索尼计算机科学实验室的弗朗索瓦·帕切特(Francois Pachet)发明的。“继承者”算法“倾听”了一位人类演奏者的即兴弹奏,并学着以同样的风格进行了创作。帕切特将这些即兴创作的作品送去参加图灵测试,同时参加测试的还有钢琴家阿尔伯特·范·维内达尔(Albert van Veenendaal)。帕切特聘请了两位音乐评论家进行评审。在听完一段即兴演奏后,他们必须判断这到底是来自维内达尔还是“继承者”算法。结果是,他们听不出来。

下面的故事来自另一次图灵测试:

在周一举行的比赛中,主队Friona队尽管打出了7次安打和8次得分,但在5局的比赛中还是以10:8输给了客队Boys Ranch队。Friona队表现完美,Hunter Sundre在Boys Ranch队的投球局里打成2:2,在第三局中上了一垒,在第四局中上了三垒……Friona队多次成功盗垒,横扫8个垒包。

这段文字是一场小联盟棒球赛的总结报道。这篇报道可不寻常,因为与小联盟有关的新闻报道并不多。而更不寻常的是,这篇报道是由计算机撰写的。位于芝加哥的Narrative Science是该算法的发明者。这家公司和其他一些合作者共同开发了专门针对体育赛事、公司收益或者房地产交易等各式报告的算法,只要有任何一家媒体客户订购,它们便可以根据现有的数据即时创建所需的文档。许多客户都倾向于匿名订购,因为记者们已经开始担心他们的饭碗不保了。订购者中也有一些实名的著名媒体,如《福布斯》杂志或美联社,它们会利用这些算法在每季度生产3 000份财务报告。很有可能,你正在阅读的一份杂志——无论是在线的还是纸质的,里面就有那么几则自动生成的报道。2014年的一项研究表明,人们根本分不清楚这类文本到底是人类撰写的还是计算机生成的。

计算机已经开始涉足人类创造力的多个领域。虽然它们还无法成为贝多芬、贝克特或毕加索,但它们的产品早已不是我们脑海里的老古董了。像Narrative Science或Jukedeck(Jukedeck是一家英国初创公司,主要业务是根据人们对视频音轨的需求来销售算法创作的音乐)这样的公司已经在大众当中积累了相当的人气,它们也正在走向商业化。更重要的是,如果以人工智能的其他分支为参考的话,它们的创造力提升的速度远比我们想象的更快。只要想想棋类计算机的威力是如何爆炸性地增长的就够了:一开始,它们低声下气,但在不到50年的时间里,它们就击败了像加里·卡斯帕罗夫(Gary Kasparov)这样的世界冠军。

不管这些创造性的算法还需要多久才可以在所有领域全面超越人类,至少它们已经在两个方面给了我们重要启示。首先,正确地选择构件对创造性的工作至关重要。在电子、音乐等领域,构件很清晰;但在类似视觉艺术这样的领域,仍然是雾里看花。其次,创造力所要征服的是复杂的景观,比如进化的适合度景观、车辆路径问题的代价景观、巴基球的能量景观等。在这些景观里,任何创造性的活动都必须小心避开邻近的山丘或者浅显的山谷,一旦陷进去,所得到的解决方案要么了无新意,要么十分平庸。要想得到新颖的、理想的结果,这些死亡陷阱不得不防。

早在生命出现之前,无论是在恒星内锻造的巴基球,还是在空中飘落的雪花,创造它们的过程虽然形形色色,但借助热振动的力量,宇宙已经设法避开了无处不在的小山丘。生命出现后,大自然又别具匠心地增加了自己的门道:遗传漂变、基因重组。现在,计算机科学家也有了自己的算法。所有这一切,都是为了在创造性景观里找到最高的山峰或者最深的山谷。

阅读大自然这本书远比阅读我们的大脑要容易,这就是为什么我们直到现在,还是无法绘制出人类意识的景观。然而,我们可以肯定地说,景观一定是人类创造力的核心,正如景观在其他领域中的作用一样。因为创造性是用来解决复杂问题的,而20世纪计算机科学的一个重要发现是,问题的复杂度是封装在其解决方案景观里的。不管一个问题是由一个进化的生物体还是一台计算机来解决,或者是由一个人的头脑来解决,它们必须要做的都是征服这个问题的景观。更重要的是,我们的思维景观一定是层峦叠嶂的,内有大量的山峰和山谷——平淡的故事、陈腐的诗歌、糟糕的作品,否则任何人都可以像托尔斯泰一样写作,像莫扎特一样作曲。但是,在开始探索人类的思维如何避免落入平庸的陷阱之前,我们还是先了解一下达尔文式的进化过程和思维的创造性过程这两者之间的关系吧,其相似度一定比你设想的要高得多。

以上就是睡前故事365小编整理的关于曼克斯猫的睡前故事,希望对您有所帮助。