在云原生时代,运维团队面临着数据质量波动、标注不足以及链路信息不完整等重大挑战,这些障碍严重影响了 AIOps(智能运维)的有效实施。监控数据的不确定性增加了运维任务的复杂度,使得从海量数据中提取有用信息并作出快速响应变得更加困难。
基于此,在 4 月 25、 2 6 日举办的 2024 全球机器学习技术大会 上,特邀请了来自阿里云的高级技术专家董善东给大家分享「 大模型在可观测 AIOps 的探索和应用实践 」主题演讲。
大模型强大的涌现能力和推理能力,为 AIOps 在复杂架构下提供更精准的数据关联和诊断提供了可能。阿里云可观测团队通过 AIOp 结合大模型应用, 探索了利用大模型进行知识问答和 PromQL 查询生成,极大地简化了对监控数据的查询与分析过程。此外,大模型在提供上下文明确的告警方面表现出色,通过与 ChatOps 机器人的整合,实现了更加自然和人性化的交互方式。这些实践不仅提高了诊断效率,也为系统异常的快速解决提供了有力支持。
然而,大模型作为 AIOps 实施中的双刃剑,同时也带来了一系列新的挑战,包括模型的解释性问题和与现有系统的集成问题。基于 ReAct 框架的 agent 协同诊断方案为这些挑战提供了可能的解决路径,使得 AIOps 不再局限于单一的自动化任务,而是朝着更加协同和自适应的方向发展。展望未来,我们预测大模型将继续在可观测性领域中扮演关键角色,推动 AIOps 技术的进一步发展和创新。
在本次全球机器学习技术大会上, 来自阿里、微软、蚂蚁集团、小米、智谱、零一万物、面壁智能、复旦大学教授、智源人工智能研究院等大模型领域的专家将云集于此,与你共同探讨人工智能的前沿发展和行业最佳实践。
他们包括:
Kaldi 之父,IEEE Fellow,小米集团首席语音科学家 Daniel Povey
复旦大学教授,博士生导师,MOSS大模型核心人员,前搜狗首席研究员 张奇
微软亚研首席研究员和研究经理 刘树杰
零一万物联合创始人,前字节跳动 AIGC 和视觉大模型 AI 平台负责人 潘欣
北京智源人工智能研究院基础语言与软件组负责人 刘广
新浪微博新技术研发负责人,中国中文信息学会理事 张俊林
新加坡国立大学计算机系的校长青年教授,潞晨科技创始人 尤洋
北京聆心智能科技有限公司联合创始人 CEO 郑叔亮
微软亚洲研究院首席研究员和研究经理 刘树杰
千芯科技董事长,人工智能、芯片专家 陈巍
面壁智能 CTO,OpenBMB 开源社区联合发起人 曾国洋
度小满金融技术委员会执行主席,数据智能应用部总经理 杨青
PPIO 联合创始人&CTO 王闻宇
阿里巴巴达摩院资深算法专家,阿里巴巴通义实验室对话智能负责人 李永彬
白海科技创始人兼 CEO,CCF 大数据专委常务委员和高性能专委委员 卢亿雷
文因互联工程 VP 兼首席科学家,中国人工智能学会会员工委会副秘书长 宋 劼
DeepWisdom 创始人兼 CEO,MetaGPT 项目作者 吴承霖
WPS AI 技术总监,中国图象图形学学会【文档图象分析与识别专委会】专业委员 熊龙飞
更多嘉宾与主题,请登陆大会官网:
www.ml-summit.org
,或点击「
阅读原文
」查看!