◇军事领域的例子——阿帕奇族
白人刚踏上美洲大陆时,那里生活着非常多的印第安人,而且组织形态各异。在南美洲有非常庞大的印加帝国,在墨西哥有同样庞大的阿兹特克帝国。这两个帝国虽然庞大,但是很快就被白人殖民者灭掉了 (阿兹特克帝国于 1521 年灭亡,印加帝国 1533 年灭亡)。
与之对比,在北美洲的阿帕奇族,是所有印第安部落中抗争最久的——到了 19 世纪后期,他们才向美国政府投降 (那时的美国,已经是西方列强了)。
阿帕奇族从来就没有形成一个大帝国,而是始终处于松散的部落联盟形态。各个部落的酋长之间,【没有】 隶属关系。每个部落都是各自为战。这种形态,反而很难彻底消灭——因为找不到明显的 “单点故障”。相比之下,印加帝国和阿兹特克帝国都是等级森严的大帝国。白人殖民者只要干掉或俘虏了皇帝,整个帝国瞬间瓦解。
★“单点故障” 与 “木桶原理” 的异同
在看本小节之前,某些聪明的读者或许已经意识到这两者的相似性。
“木桶原理” 说的是:木桶的装水量取决于最短的那块木板。假设最短的木板长度为零,那么木桶的容量也变为零。这时候,木桶处于 “不可用” 的状态。这跟前面提到的某些 “单点故障” 的案例,有相似之处。
在本文开头,俺提到了 “单点故障” 的两种类型 (“可恢复” 与 “不可恢复”)。极端情况下的木桶 (某块木板长度为零) 类似于第一类 “单点故障”。换句话说,你可以用 “木桶原理” 来演示第一类单点故障;但是你 【没法】 用木桶原理来演示第二类单点故障。
★“单点故障” 与 “蝴蝶效应” 的异同
从表面上,“蝴蝶效应” 跟 “单点故障” 有某些相似之处——都是一个小小的因素产生了对系统的重大影响。
但其实,这两者的本质是完全不同的。能够产生 “蝴蝶效应” 的系统是 “混沌系统”,由于 “混沌”,并不是每一只蝴蝶都能产生 “蝴蝶效应”。如果某只蝴蝶之前曾经产生过混沌效应,之后未必能够再次产生。
与之相反,“单点” 之所以成为 “单点”,是由系统结构决定的。换句话说:单点所蕴含的 “单点故障” 是必然的,而不是偶然的。而且同一个单点有可能多次导致系统的 “单点故障”。
★“单点故障” 与 “黑天鹅现象” 的关系
“黑天鹅现象” 一词,源自塔勒布 (NassimNicholasTaleb) 所写的 《黑天鹅——如何应对不可预知的未来》。此书写得很好,有兴趣的同学建议从头看完 (俺的网盘上有电子版)。
如果你没看过此书,俺大致解释一下:“黑天鹅现象”(也称 “黑天鹅事件”) 指的是那些 “不可预测的、稀有的、影响巨大的事件”(比如 911 事件)。
俺个人认为,有相当一部分 “黑天鹅事件” 跟 “单点故障” 有关。能够引发 “黑天鹅事件” 的 “单点故障”,通常都非常隐蔽,以至于人们没有意识到该 “单点” 的存在。
比如 911 事件中倒塌的世贸双子塔,在当初设计的时候,已经考虑到 “飞机撞击” 的风险 (因为早些年,帝国大厦曾经被飞机误撞过)。但是设计师 【没有】 考虑到大量航空燃油燃烧导致的风险 (大量航空燃油产生的热量远大于普通火灾,导致了双子塔中钢结构的破坏)。911 当天,撞击双子塔的两架客机都是刚刚起飞,装满了航空燃油。
稍微跑题一下,说说 “911 阴谋论”:
几乎每个重大事件发生后,都能在网上看到阴谋论的影子。911 当然也不例外。俺举个阴谋论的反驳,作为例子。某些阴谋论者称:钢筋的熔点是 2700 度左右,而航空燃油燃烧只能达到 1500 度左右,所以不足以让钢筋熔化。但是捏,那些学过 “材料力学/金属力学/建筑力学” 的同学,会对这种质疑表示不屑——早在温度达到钢筋熔点之前,钢筋的强度就已经显著下降了。很多基于阴谋论的质疑,都如同上述这个——企图以外行的立场来质疑某个细节,进而质疑整个事件的真实性。
★“单点故障” 的防范措施
◇多样化/多元化
前面提到 “国企改制” 过程中,某些家庭的遭遇。这些家庭出问题的根源在于——家庭成员的收入来源太过单一化。
从这个例子反过来思考,就可以发现应对 “单点故障” 的措施之一——多元化/多样化。
前面提到生态圈的健壮性,同样也是基于 “多样化”。
◇备用系统
在 IT 行业搞过系统管理或运维的同学,应该都知道 “双机热备”。顾名思义就是:同时运行两台服务器,万一某台坏了,还有另一台。
这个原理,其实也可以应用到其它领域。