当前位置: 欣欣网 > 码农

谷歌云一键「删库」:波及50多万用户、崩溃一周,1250亿美金岌岌可危

2024-05-12码农

近日,谷歌云全球首席执行官Thomas Kurian与澳大利亚非盈利性养老基金UniSuper的负责人联合发表声明,就UniSuper私有云账户因谷歌云服务的「错误配置」而被意外删除的事件,向UniSuper的62万名会员表达了「极其令人沮丧、极其令人失望」的歉意。

此次故障导致UniSuper基金的50多万会员 自5月2日起 ,在整整一周内无法访问自己的退休金账户。尽管服务已于周四开始陆续恢复,但投资账户的余额数据仍需更新,以反映上周的金额。

UniSuper首席执行官Peter Chun在周三晚间向会员致信,明确表示此次故障并非由网络攻击引起,且在故障过程中没有个人数据泄露。他指出,谷歌云服务是导致此次问题的原因。

在联合声明中,Kurian和Chun强调了此次事件的孤立性,并确认谷歌云已经查明了导致服务中断的原因,并采取了相应措施以防止类似事件再次发生。他们表示,这是一起「独一无二的事件」,谷歌云在全球的客户以前从未遇到过这种情况。

尽管UniSuper通常在两个地区都备有数据副本,但由于云订阅账户的删除,两个地区的云实例均受到了影响。最终, 由于另一家供应商的备份 ,UniSuper得以恢复服务。这些备份将数据丢失降至最低,并提升了UniSuper和谷歌云完成恢复的能力。

「UniSuper 和 Google Cloud 之间的奉献与合作使我们的私有云得到了广泛的恢复,其中包括数百个虚拟机、数据库和应用程序。」

在UniSuper官网5月10日的「最新情况更 新」公告中,目前「我们在让所有系统重新上线方面取得了巨大进展。会员可以通过会员在线登录自己的账户,查看账户余额并查看账户的最新投资表现。」

UniSuper管理着 约1 250亿美元的资金,此次服务中断引起了业界的广泛关注和担忧,同时也对全球云服务的安全性和稳定性提出了质疑。谷歌云作为全球领先的云服务提供商,此次失误对其声誉造成了重大影响。


此次事件也提醒了全球云服务用户,注意数据安全和业务连续性计划的重要性。随着云服务的普及,如何确保服务的稳定性和安全性,已成为所有云服务提供商和用户必须共同面对的挑战。

针对此次事件,云服务提供商和用户也许可以在这些方面做些改进:

  • 强化备份机制: 企业应建立全面的备份策略,包括定期备份、异地备份和云备份。备份应定期进行测试,确保在数据丢失时能够迅速恢复。此外,备份应与原数据存储在不同的物理位置,以避免单点故障。

  • 严格的访问控制: 必须对云服务的访问权限进行严格管理,避免未授权的访问和操作。应使用最小权限原则,确保员工仅拥有完成其工作所必需的访问权限。同时,对于关键操作,如数据删除,应实施二次验证机制。

  • 变更管理流程: 对于任何可能影响数据完整性和可用性的配置更改,都应遵循正式的变更管理流程。这包括预先的变更影响评估、变更记录、审批流程以及事后的变更审计。

  • 实时监控和快速响应: 实施实时监控系统,以便在数据丢失或服务中断发生时能够立即检测并响应。监控系统应能够覆盖所有关键的云服务组件,并配置有自动警报机制。

  • 服务等级协议(SLA)和合同条款: 在与云服务提供商签订合同时,应明确服务水平协议(SLA),包括服务可用性、数据保护、恢复时间和违约赔偿等条款。同时,合同中应详细规定数据所有权和责任界限。

  • 员工安全培训: 定期对员工进行安全意识和最佳实践培训,特别是对于有权限操作云服务的员工。培训内容应包括数据保护、识别钓鱼攻击、安全配置和应急响应等。

  • 灾难恢复和业务连续性计划: 制定详尽的灾难恢复计划和业务连续性计划,确保在发生重大故障时,能够迅速切换到备用系统,最小化对业务的影响。

  • 数据分类和敏感性管理: 对存储在云中的数据进行分类,并根据数据的敏感性和重要性采取相应的安全措施。对于高敏感性数据,应采用更高级别的加密和访问控制。

  • 整理丨dbaplus社群

    dbaplus社群欢迎广大技术人员投稿,投稿邮箱: [email protected]