从理论到实践：剖析 Aquila 模型的研发过程和未来展望

2024-03-08资讯

本周的 AI 技术圈依然热闹非凡，，性能和速度全面赶超 GPT-4， Stability AI 发布论文来详细介绍了 Stable Diffusion 3 的底层技术 DiT（Diffusion Transformer）架构， ……回到国内，零一万物开源 Yi-9B 模型，北京智源人工智能研究院等研究团队提出 Cradle 框架，让智能体像人类一样直接控制键盘鼠标，，QQ 测试 AI 聊天搭子，抖音退出「话炉」的 AI 社交 App……

创新与竞争不断的环境之下，给人以更多期待与想象。 4 月 25 - 26 日，由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行。

来自 AI 科研先锋单位的北京智源人工智能研究院基础语言模型与软件组负责人刘广将出席本次盛会，并发表主题演讲。

专家介绍

刘广，北京智源人工智能研究院基础语言模型与软件组负责人

刘广，北京邮电大学智能科学与技术博士，北京智源人工智能研究院基础语言模型与软件组负责人，负责飞智 FlagAI 开源项目以及悟道·天鹰 Aquila 系列基础模型（7B/34B/70B)，主持科技创新 2030-「新一代人工智能」重大项目课题，在人工智能领域学术会议和期刊上发表论文，发明专利申请十余项，主要研究方向是预训练大模型等。

演讲主题

在 2024 全球机器学习技术大会上，刘广博士将分享自己的一线大模型实战经验，发表「从理论到实践：剖析 Aquila 模型的研发过程和未来展望」的主题演讲。

他将深度探讨 Aquila 大规模语言模型（LLM）的研发过程。从理论到实践全方位解析 Aquila 模型的研发背景、面临的问题，以及我们如何应对这些问题，具体的实践结果，及其未来发展的方向。

这个过程涵盖了从获取和处理语料库，优化模型训练过程，到提高模型效果和准确性的各个环节。这是一个典型的实战案例，展示了如何在实际项目中应用和优化大规模语言模型。

刘广的实战经验分享将为想要进一步了解大规模语言模型研发的人们提供深度的洞察和借鉴价值，而非仅仅停留在简单概念的理论层面。同时，他也会深入探讨 Aquila 模型的未来，包括如何提升其性能、准确性，拓宽其应用领域，以及如何在未来的研发过程中继续优化用户体验。

与此同时，刘广博士将与来自国内外的 50+ AI 专家、学者和业界精英们汇聚一堂，共同分享在大模型和 AI 领域的最新研究成果和实践经验。他们包括：

Daniel Povey， Kaldi之父，IEEE Fellow，小米集团首席语音科学家

复旦大学教授，博士生导师，MOSS大模型核心人员，前搜狗首席研究员张奇

零一万物联合创始人，前字节跳动 AIGC 和视觉大模型 AI 平台负责人潘欣

北京智源人工智能研究院基础语言与软件组负责人刘广

新浪微博新技术研发负责人，中国中文信息学会理事张俊林

北京聆心智能科技有限公司联合创始人 CEO 郑叔亮