從理論到實踐：剖析 Aquila 模型的研發過程和未來展望

2024-03-08資訊

本周的 AI 技術圈依然熱鬧非凡，，效能和速度全面趕超 GPT-4， Stability AI 釋出論文來詳細介紹了 Stable Diffusion 3 的底層技術 DiT（Diffusion Transformer）架構， ……回到國內，零一萬物開源 Yi-9B 模型，北京智源人工智慧研究院等研究團隊提出 Cradle 框架，讓智慧體像人類一樣直接控制鍵盤滑鼠，，QQ 測試 AI 聊天搭子，抖音結束「話爐」的 AI 社交 App……

創新與競爭不斷的環境之下，給人以更多期待與想象。 4 月 25 - 26 日，由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「全球機器學習技術大會」將在上海環球港凱悅酒店舉行。

來自 AI 科研先鋒單位的北京智源人工智慧研究院基礎語言模型與軟體組負責人劉廣將出席本次盛會，並行表主題演講。

專家介紹

劉廣，北京智源人工智慧研究院基礎語言模型與軟體組負責人

劉廣，北京郵電大學智慧科學與技術博士，北京智源人工智慧研究院基礎語言模型與軟體組負責人，負責飛智 FlagAI 開源計畫以及悟道·瓦西 Aquila 系列基礎模型（7B/34B/70B)，主持科技創新 2030-「新一代人工智慧」重大計畫課題，在人工智慧領域學術會議和期刊上發表論文，發明專利申請十余項，主要研究方向是預訓練大模型等。

演講主題

在 2024 全球機器學習技術大會上，劉廣博士將分享自己的一線大模型實戰經驗，發表「從理論到實踐：剖析 Aquila 模型的研發過程和未來展望」的主題演講。

他將深度探討 Aquila 大規模語言模型（LLM）的研發過程。從理論到實踐全方位解析 Aquila 模型的研發背景、面臨的問題，以及我們如何應對這些問題，具體的實踐結果，及其未來發展的方向。

這個過程涵蓋了從獲取和處理語料庫，最佳化模型訓練過程，到提高模型效果和準確性的各個環節。這是一個典型的實戰案例，展示了如何在實際計畫中套用和最佳化大規模語言模型。

劉廣的實戰經驗分享將為想要進一步了解大規模語言模型研發的人們提供深度的洞察和借鑒價值，而非僅僅停留在簡單概念的理論層面。同時，他也會深入探討 Aquila 模型的未來，包括如何提升其效能、準確性，拓寬其套用領域，以及如何在未來的研發過程中繼續最佳化使用者體驗。

與此同時，劉廣博士將與來自國內外的 50+ AI 專家、學者和業界精英們匯聚一堂，共同分享在大模型和 AI 領域的最新研究成果和實踐經驗。他們包括：

Daniel Povey， Kaldi之父，IEEE Fellow，小米集團首席語音科學家

復旦大學教授，博士生導師，MOSS大模型核心人員，前搜狗首席研究員張奇

零一萬物聯合創始人，前字節跳動 AIGC 和視覺大模型 AI 平台負責人潘欣

北京智源人工智慧研究院基礎語言與軟體組負責人劉廣

新浪微博新技術研發負責人，中國中文資訊學會理事張俊林

北京聆心智慧科技有限公司聯合創始人 CEO 鄭叔亮