當前位置: 妍妍網 > 資訊

從理論到實踐:剖析 Aquila 模型的研發過程和未來展望

2024-03-08資訊

本周的 AI 技術圈依然熱鬧非凡, ,效能和速度全面趕超 GPT-4, Stability AI 釋出論文來 詳細介紹了 Stable Diffusion 3 的底層技術 DiT(Diffusion Transformer)架構, ……回到 國內, 零一萬物開源 Yi-9B 模型,北京智源人工智慧研究院等研究團隊提出 Cradle 框架,讓智慧體像人類一樣直接控制鍵盤滑鼠, ,QQ 測試 AI 聊天搭子, 抖音結束「話爐」的 AI 社交 App……

創新與競爭不斷的環境之下,給人以更多期待與想象。 4 月 25 - 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「全球機器學習技術大 會」將在上海環球港凱悅酒店舉行。

來自 AI 科研先鋒單位的 北京智源人 工智慧研 究院基礎語言模型與軟體組負責人劉廣將出席本次盛會,並行表主題演講。

專家介紹

劉廣,北京智源人工智慧研 究院基礎語言模型與軟體組負責人

劉廣,北京郵電大學智慧科學與技術博士,北京智源人工智慧研究院基礎語言模型與軟體組負責人,負責飛智 FlagAI 開源計畫以及悟道·瓦西 Aquila 系列基礎模型(7B/34B/70B),主持科技創新 2030-「新一代人工智慧」重大計畫課題,在人工智慧領域學術會議和期刊上發表論文,發明專利申請十余項,主要研究方向是預訓練大模型等。

演講主題

在 2024 全球機器學習技術大會上,劉廣博士將分享自己的一線大模型實戰經驗,發表「 從理論到實踐: 剖析 Aquila 模型的研發過程和未來展望 」的主題演講。

他將 深度探討 Aquila 大規模語言模型(LLM)的研發過程。 從理論到實踐全方位解析 Aquila 模型的研發背景、面臨的問題,以及我們如何應對這些問題,具體的實踐結果,及其未來發展的方向。

這個過程涵蓋了從獲取和處理語料庫,最佳化模型訓練過程,到提高模型效果和準確性的各個環節。 這是一個典型的實戰案例,展示了如何在實際計畫中套用和最佳化大規模語言模型。

劉廣的實戰經驗分享將為想要進一步了解大規模語言模型研發的人們提供深度的洞察和借鑒價值,而非僅僅停留在簡單概念的理論層面。 同時,他也會深入探討 Aquila 模型的未來,包括如何提升其效能、準確性,拓寬其套用領域,以及如何在未來的研發過程中繼續最佳化使用者體驗。

與此同時,劉廣 博士將與來自國內外的 50+ AI 專家、學者和業界精英們匯聚一堂,共同分享在大模型和 AI 領域的最新研究成果和實踐經驗。 他們包括:

  • Daniel Povey, Kaldi之父,IEEE Fellow,小米集團首席語音科學家

  • 復旦大學教授,博士生導師,MOSS大模型核心人員,前搜狗首席研究員 張奇

  • 零一萬物聯合創始人,前字節跳動 AIGC 和視覺大模型 AI 平台負責人 潘欣

  • 北京智源人工智慧研究院基礎語言與軟體組負責人 劉廣

  • 新浪微博新技術研發負責人,中國中文資訊學會理事 張俊林

  • 北京聆心智慧科技有限公司聯合創始人 CEO 鄭叔亮

  • 面壁智慧 CTO,OpenBMB 開源社群聯合發起人 曾國洋

  • 度小滿金融技術委員會執行主席,數據智慧套用部總經理 楊青

  • 李永彬,阿裏巴巴達摩院資深演算法專家,阿裏巴巴通義實驗室對話智慧負責

  • 王勤龍,螞蟻集團 AI Infra 技術專家

  • 白海科技創始人兼 CEO,CCF 大數據專委常務委員和高效能專委委員 盧億雷

  • 文因互聯工程 VP 兼首席科學家,中國人工智慧學會會員工委會副秘書長 宋

  • 原騰訊音樂機器學習平台 CubeStudio 負責人,楷喬科技聯合創始人 欒鵬

  • DeepWisdom 創始人兼 CEO,MetaGPT 計畫作者 吳承霖

  • WPS AI 技術總監,中國圖像圖形學學會【文件圖像分析與辨識專委會】專業委員 熊龍飛

  • 更多嘉賓與主題,請登陸大會官網: www.ml-summit.org ,或點選「 閱讀原文 」檢視!