当前位置: 欣欣网 > 码农

今晚直播丨B站面向故障的应急响应体系建设

2024-05-08码农

任何系统都无法保证100%的可用性,每一次线上故障都是对SRE稳定性保障的考验和挑战。如何革新传统人力运维,搭建高效的故障应急响应体系?

今晚7点,『基础设施运维专题』第一弹——【B站面向故障的应急响应体系建设】主题分享来袭 来自 B站的 资深SRE工程师洪鹏 老师将聚焦于故障发现、应急协同、定界定位、故障快恢,以及事后的复盘待办等内容,详细介绍面向故障的应急响应体系建设历程。

活动信息

  • 主题: B站面向故障的应急响应体系建设

  • 讲师: B站 资深SRE工程师 洪鹏

  • 时间: 5月8日周三晚7点

  • 地点: 线上直播间

  • 联合主办: dbaplus社群、分布式系统稳定性实验室、FinOps产业推进方阵

  • 讲师信息

    洪鹏

    B站 资深SRE工程师

  • 曾就职于京东和360,多年运维开发经验,2019年加入B站,负责稳定性体系平台开发,包括SLO质量运营体系、多活管控,目前专注于面向故障的应急响应体系建设。

  • 直播地址

    添加助手获取PPT、

    加入直播交流群

    更多 『基础设施运维专题』

    直播预约

    五月每周三晚,来自 阿里云智能、B站、去哪儿网、趣丸科技 的四位专家,将聚焦 监控、可观测性、故障管理 以及 高可用体系 四大热门主题深度探讨,带大家深化学习运维智能化、掌握可观测性的关键作用、学习故障管理与高可用体系的建设技巧。赶紧扫码预约直播吧!

    同期活动推荐

    AI时代下,数据库、大模型及算法、云计算这三大核心技术领域都各自呈现出多样化的发展趋势,这些趋势相互交织、相互影响,共同推动着整个AI生态系统的发展和进步。

    聚焦 数据库、大模型及算法、云计算 在运维管理中的挑战、对各类运维场景的适配,以及相互结合与赋能的创新应用,今年的 XCOPS智能运维管理人年会 梳理并精选出以下大会议题,希望能覆盖到更多企业及技术同学的实际发展、进阶所需。

    ↓点这里了解大会更多详情及报名