聊聊“单点故障”——关于“德国空难”和“李光耀”的随想

军事领域的例子——阿帕奇族


白人刚踏上美洲大陆时,那里生活着非常多的印第安人,而且组织形态各异。在南美洲有非常庞大的印加帝国,在墨西哥有同样庞大的阿兹特克帝国。这两个帝国虽然庞大,但是很快就被白人殖民者灭掉了(阿兹特克帝国于1521年灭亡,印加帝国1533年灭亡)。
与之对比,在北美洲的阿帕奇族,是所有印第安部落中抗争最久的——到了19世纪后期,他们才向美国政府投降(那时的美国,已经是西方列强了)。
阿帕奇族从来就没有形成一个大帝国,而是始终处于松散的部落联盟形态。各个部落的酋长之间,【没有】隶属关系。每个部落都是各自为战。这种形态,反而很难彻底消灭——因为找不到明显的“单点故障”。相比之下,印加帝国和阿兹特克帝国都是等级森严的大帝国。白人殖民者只要干掉或俘虏了皇帝,整个帝国瞬间瓦解。
★“单点故障”与“木桶原理”的异同
在看本小节之前,某些聪明的读者或许已经意识到这两者的相似性。
   “木桶原理”说的是:木桶的装水量取决于最短的那块木板。假设最短的木板长度为零,那么木桶的容量也变为零。这时候,木桶处于“不可用”的状态。这跟前面提到的某些“单点故障”的案例,有相似之处。
在本文开头,俺提到了“单点故障”的两种类型(“可恢复”与“不可恢复”)。极端情况下的木桶(某块木板长度为零)类似于第一类“单点故障”。换句话说,你可以用“木桶原理”来演示第一类单点故障;但是你【没法】用木桶原理来演示第二类单点故障。
  ★“单点故障”与“蝴蝶效应”的异同
从表面上,“蝴蝶效应”跟“单点故障”有某些相似之处——都是一个小小的因素产生了对系统的重大影响。
但其实,这两者的本质是完全不同的。能够产生“蝴蝶效应”的系统是“混沌系统”,由于“混沌”,并不是每一只蝴蝶都能产生“蝴蝶效应”。如果某只蝴蝶之前曾经产生过混沌效应,之后未必能够再次产生。
与之相反,“单点”之所以成为“单点”,是由系统结构决定的。换句话说:单点所蕴含的“单点故障”是必然的,而不是偶然的。而且同一个单点有可能多次导致系统的“单点故障”。
★“单点故障”与“黑天鹅现象”的关系
“黑天鹅现象”一词,源自塔勒布(NassimNicholasTaleb)所写的《黑天鹅——如何应对不可预知的未来》。此书写得很好,有兴趣的同学建议从头看完(俺的网盘上有电子版)。
如果你没看过此书,俺大致解释一下:“黑天鹅现象”(也称“黑天鹅事件”)指的是那些“不可预测的、稀有的、影响巨大的事件”(比如911事件)。
俺个人认为,有相当一部分“黑天鹅事件”跟“单点故障”有关。能够引发“黑天鹅事件”的“单点故障”,通常都非常隐蔽,以至于人们没有意识到该“单点”的存在。
比如911事件中倒塌的世贸双子塔,在当初设计的时候,已经考虑到“飞机撞击”的风险(因为早些年,帝国大厦曾经被飞机误撞过)。但是设计师【没有】考虑到大量航空燃油燃烧导致的风险(大量航空燃油产生的热量远大于普通火灾,导致了双子塔中钢结构的破坏)。911当天,撞击双子塔的两架客机都是刚刚起飞,装满了航空燃油。
稍微跑题一下,说说“911阴谋论”:
   几乎每个重大事件发生后,都能在网上看到阴谋论的影子。911当然也不例外。俺举个阴谋论的反驳,作为例子。某些阴谋论者称:钢筋的熔点是2700度左右,而航空燃油燃烧只能达到1500度左右,所以不足以让钢筋熔化。但是捏,那些学过“材料力学/金属力学/建筑力学”的同学,会对这种质疑表示不屑——早在温度达到钢筋熔点之前,钢筋的强度就已经显著下降了。很多基于阴谋论的质疑,都如同上述这个——企图以外行的立场来质疑某个细节,进而质疑整个事件的真实性。
★“单点故障”的防范措施
◇多样化/多元化
前面提到“国企改制”过程中,某些家庭的遭遇。这些家庭出问题的根源在于——家庭成员的收入来源太过单一化。
从这个例子反过来思考,就可以发现应对“单点故障”的措施之一——多元化/多样化。
前面提到生态圈的健壮性,同样也是基于“多样化”。
  ◇备用系统
在IT行业搞过系统管理或运维的同学,应该都知道“双机热备”。顾名思义就是:同时运行两台服务器,万一某台坏了,还有另一台。
这个原理,其实也可以应用到其它领域。

THE END
打赏
海报
聊聊“单点故障”——关于“德国空难”和“李光耀”的随想
前不久的两个热点新闻分别是:3月23日新加坡的李光耀死了,3月24日德国发生了空难。这两件事挨得很近,所以当俺看到这俩新闻的时候,“单点故障”这个词汇就在脑海中浮现。今天跟大伙儿聊聊与“单点故障”相关的话题……
<<上一篇
下一篇>>