任何系統都無法保證100%的可用性,每一次線上故障都是對SRE穩定性保障的考驗和挑戰。如何革新傳統人力運維,搭建高效的故障應急響應體系?
今晚7點,『基礎設施運維專題』第一彈——【B站面向故障的應急響應體系建設】主題分享來襲 , 來自 B站的 資深SRE工程師洪鵬 老師將聚焦於故障發現、應急協同、定界定位、故障快恢,以及事後的復盤待辦等內容,詳細介紹面向故障的應急響應體系建設歷程。
活動資訊
主題: B站面向故障的應急響應體系建設
講師: B站 資深SRE工程師 洪鵬
時間: 5月8日周三晚7點
地點: 線上直播間
聯合主辦: dbaplus社群、分布式系統穩定性實驗室、FinOps產業推進方陣
講師資訊
洪鵬
B站 資深SRE工程師
曾就職於京東和360,多年運維開發經驗,2019年加入B站,負責穩定性體系平台開發,包括SLO品質營運體系、多活管控,目前專註於面向故障的應急響應體系建設。
直播地址
添加助手獲取PPT、
加入直播交流群
更多 『基礎設施運維專題』
直播預約
五月每周三晚,來自 阿裏雲智慧、B站、去哪兒網、趣丸科技 的四位專家,將聚焦 監控、可觀測性、故障管理 以及 高可用體系 四大熱門主題深度探討,帶大家深化學習運維智慧化、掌握可觀測性的關鍵作用、學習故障管理與高可用體系的建設技巧。趕緊掃碼預約直播吧!
同期活動推薦
AI時代下,資料庫、大模型及演算法、雲端運算這三大核心技術領域都各自呈現出多樣化的發展趨勢,這些趨勢相互交織、相互影響,共同推動著整個AI生態系的發展和進步。
聚焦 資料庫、大模型及演算法、雲端運算 在運維管理中的挑戰、對各類運維場景的適配,以及相互結合與賦能的創新套用,今年的 XCOPS智慧運維管理人年會 梳理並精選出以下大會議題,希望能覆蓋到更多企業及技術同學的實際發展、進階所需。
↓點這裏了解大會更多詳情及報名