The Basic Concept in IT Operations

Ivan Liu Thoughts on Technology


, the second largest airline in U.S, had a on Wednesday, canceling 2000 flights and incurring huge losses.

全美第二大航空 Delta 電腦世紀大出包,被迫取消二千多個航班,公司和旅客都承受了鉅大的損失。

妙的是,過去三年它在系統上的投資就已經高達數億美元,光今年到目前為止也有1.5億、也換上了新的CIO,那怎麼會慘成這德性?

就算是AWS也會出包

開始投入IT業未幾,我就從多次痛苦經驗中,學到一件事「再好再貴再國際知名的軟硬體,都會意外暴斃」。所以,從那時起,我就拼了老命研究 , , , fail-over, high-availability 等觀念,更因為自己向來對事業前途的不安全感,而自始奉行不渝。

有人說,如果Delta早上了AWS就不會出這種事,錯了。這是IT系統的基本架構認知問題,不是用誰家機房或哪家公有雲私有雲的問題;就算上了AWS,如果不事先設好並再三測試standby replica與secondary AZ這些神兵利器,Amazon出包的例子大家沒聽過啊?!

新聞來源:
Delta Air Lines CEO Takes Responsibility for Outage