淘新聞

求不坑!業界老大宕機的後果有多嚴重

2017年2月的最後一天,對於IT圈來說,註定是多災多難的一天。2月27日晚上,百度發生宕機,移動搜索功能長期無法使用。 3月1日淩晨,AWS的S3業務宕機5小時,導致一大批美國網站服務受損。兩個事件都證明了一件事兒,業界“老大”一宕機,大家都得跟著受苦……

進入資訊化社會後,資料量大幅度增加,IT變革一直在繼續,而AWS的S3業務可謂是雲計算鼻祖級業務。根據SimilarTech的資料顯示,S3託管著148213個網站和121761個獨立功能變數名稱,幾乎都是美國網站。在前排前100萬的網站裡,S3的使用率為0.8%,影響力巨大。

例如Airbnb、Pinterest、Time,、CNBC、Docker、IFTTT、Medium、Nest、News Corp、Quora、Razer、Slack、Sailthru和Zendesk等都是AWS S3的用戶。5個小時的宕機時間,讓此次事故成為AWS歷史上公共雲服務出錯最長且影響最大的一次。

Amazon S3

AWS官方資訊顯示,Amazon Simple Storage Service (Amazon S3)是一種物件存儲,它具有簡單的Web服務介面,可用於在Web上的任何位置存儲和檢索任意數量的資料。它能夠提供99.999999999%的持久性,並且可以在全球大規模傳遞數萬億物件。

然而,Amazon S3無論有多少個“9”作為保障,可在雲中提供功能多豐富的物件存儲。一但出現“高出錯率”,或者像這次的某些資料庫服務的查詢失敗,以及Amazon Simple Email Service的問題,儘管沒有檔丟失/損壞報告,但是大批公司業務都受到了影響,也就是說這些企業對於Amazon S3的綁定十分嚴重。

國內外無獨有偶的兩次大規模宕機事件,其實都讓我們拋出了一個同樣的問題,當我們過分依賴一個平臺時,就會喪失部分靈活性,我們應該記得留一個Plan B。