近日,谷歌雲全球執行長Thomas Kurian與澳洲非盈利性養老基金UniSuper的負責人聯合發表聲明,就UniSuper私有雲帳戶因谷歌雲服務的「錯誤配置」而被意外刪除的事件,向UniSuper的62萬名會員表達了「極其令人沮喪、極其令人失望」的歉意。
此次故障導致UniSuper基金的50多萬會員 自5月2日起 ,在整整一周內無法存取自己的退休金帳戶。盡管服務已於周四開始陸續恢復,但投資帳戶的余額數據仍需更新,以反映上周的金額。
UniSuper執行長Peter Chun在周三晚間向會員致信,明確表示此次故障並非由網路攻擊引起,且在故障過程中沒有個人數據泄露。他指出,谷歌雲服務是導致此次問題的原因。
在聯合聲明中,Kurian和Chun強調了此次事件的孤立性,並確認谷歌雲已經查明了導致服務中斷的原因,並采取了相應措施以防止類似事件再次發生。他們表示,這是一起「獨一無二的事件」,谷歌雲在全球的客戶以前從未遇到過這種情況。
盡管UniSuper通常在兩個地區都備有數據副本,但由於雲訂閱帳戶的刪除,兩個地區的雲例項均受到了影響。最終, 由於另一家供應商的備份 ,UniSuper得以恢復服務。這些備份將數據遺失降至最低,並提升了UniSuper和谷歌雲完成恢復的能力。
「UniSuper 和 Google Cloud 之間的奉獻與合作使我們的私有雲得到了廣泛的恢復,其中包括數百個虛擬機器、資料庫和應用程式。」
在UniSuper官網5月10日的「最新情況更 新」公告中,目前「我們在讓所有系統重新上線方面取得了巨大進展。會員可以透過會員線上登入自己的帳戶,檢視帳戶余額並檢視帳戶的最新投資表現。」
UniSuper管理著 約1 250億美元的資金,此次服務中斷引起了業界的廣泛關註和擔憂,同時也對全球雲服務的安全性和穩定性提出了質疑。谷歌雲作為全球領先的雲服務提供商,此次失誤對其聲譽造成了重大影響。
此次事件也提醒了全球雲服務使用者,註意數據安全和業務連續性計劃的重要性。隨著雲服務的普及,如何確保服務的穩定性和安全性,已成為所有雲服務提供商和使用者必須共同面對的挑戰。
針對此次事件,雲服務提供商和使用者也授權以在這些方面做些改進:
強化備份機制: 企業應建立全面的備份策略,包括定期備份、異地備份和雲備份。備份應定期進行測試,確保在數據遺失時能夠迅速恢復。此外,備份應與原數據儲存在不同的物理位置,以避免單點故障。
嚴格的存取控制: 必須對雲服務的存取許可權進行嚴格管理,避免未授權的存取和操作。應使用最小許可權原則,確保員工僅擁有完成其工作所必需的存取許可權。同時,對於關鍵操作,如數據刪除,應實施二次驗證機制。
變更管理流程: 對於任何可能影響數據完整性和可用性的配置更改,都應遵循正式的變更管理流程。這包括預先的變更影響評估、變更記錄、審批流程以及事後的變更審計。
即時監控和快速響應: 實施即時監控系統,以便在數據遺失或服務中斷發生時能夠立即檢測並響應。監控系統應能夠覆蓋所有關鍵的雲服務元件,並配置有自動警報機制。
服務等級協定(SLA)和合約條款: 在與雲服務提供商簽訂合約時,應明確服務水平協定(SLA),包括服務可用性、數據保護、恢復時間和違約賠償等條款。同時,合約中應詳細規定數據所有權和責任界限。
員工安全培訓: 定期對員工進行安全意識和最佳實踐培訓,特別是對於有許可權操作雲服務的員工。培訓內容應包括數據保護、辨識釣魚攻擊、安全配置和應急響應等。
災難恢復和業務連續性計劃: 制定詳盡的災難恢復計劃和業務連續性計劃,確保在發生重大故障時,能夠迅速切換到備用系統,最小化對業務的影響。
數據分類和敏感性管理: 對儲存在雲中的數據進行分類,並根據數據的敏感性和重要性采取相應的安全措施。對於高敏感性數據,應采用更高級別的加密和存取控制。
整理丨dbaplus社群
dbaplus社群歡迎廣大技術人員投稿,投稿信箱: [email protected]