大模型為整個計算產業鏈帶來的計算範式、開發範式、互動範式共三大範式轉換,將深刻影響計算產業的未來,包括基礎設施、開發流程和套用形態。
「推理能力」是 AGI 的核心,倘若不能解決推理問題,大模型成為 AGI 是不可能的!
沒有大規模的多模態數據,大語言模型就難以獲取各個模態足夠多的知識,因此,預訓練應盡早納入多模態。
……
作者 | 【新程式設計師】編輯部
責編 | 夢依丹
出品 | CSDN(ID:CSDNnews)
4 月 25-26 日,備受業界關註的大模型風向標大會 ML-Summit 2024 全球機器學習技術大會在上海環球港凱悅酒店盛大開幕。
本次盛會共邀請 50+ 國內外頂尖專家,涉及產學研等多個領域,涵蓋微軟、阿裏、小米、百度、螞蟻集團、智譜、零一萬物、智源、面壁智慧、中科院、北大、復旦、上海交通大學、南方科技大學等大模型領域專家和學者,他們齊聚一堂,共同探討行業前沿動態,分享最新的研究成果和實踐經驗,為推動相關領域的發展貢獻智慧和力量。
現場座無虛席,超 1000 名各行各業的AI 技術精英齊聚一堂。圍繞大模型各層次技術棧與行業落地實踐共12 大主題展開研討與熱議。
嘉賓金句不斷
主旨演講精彩萬分
4 月 25 日上午的主會匯聚 CSDN 高級副總裁、Boolan 首席技術專家李建忠,Kaldi之父, IEEE Fellow、小米集團首席語音科學家 Daniel Povey,復旦大學教授、眸思大模型負責人張奇,水木分子聯合創始人和技術長喬木等業界大咖。他們從 AI 的發展歷程中深度剖析 AGI 的探索之路,以及大模型的行業套用,帶來一系列精彩的主題演講。
AGI 2024 技術創新研究與思考:大模型驅動的計算產業範式轉換
李 建 忠 CSDN 高級副總裁、Boolan 首席技術專家
The Current Moment in AI
Daniel Povey Kaldi 之父, IEEE Fellow、小米集團首席語音科學家
大語言模型是實作AGI的必由之路嗎?
張奇 復旦大學教授、眸思大模型負責人
多模態生物醫藥大模型及其行業套用
喬木 水木分子聯合創始人和技術長
圓桌論壇:大模型的演進與 AI 創新之路
隨後在 Athena labs CTO 王興明的主持下,上述幾位重磅嘉賓圍繞「大模型的演進與AI創新之路」進行高峰對話,這場高峰對話不僅僅是一次技術交流,更是對於大模型和AI創新領域的一次集中探討和思考。透過與會者們的分享和討論,可以看到這一領域的發展潛力和未來方向,為相關領域的研究和套用提供了寶貴的參考和啟示。
詳細報道:
在 4 月 25 日下午的第一個分會場,來自智源基礎語言模型與軟體組負責人劉廣、南方科技大學統計與數據科學系講席教授荊炳義、恒生電子AI首席技術專家林金曙分別從不同的角度和領域,分享了大模型在具體實踐中的研發案例與行業套用。
從理論到實踐:剖析 Aquila 模型的研發過程和未來展望
劉廣 智源基礎語言模型與軟體組負責人
面向大模型的大規模分布式系統
荊炳義 南方科技大學統計與數據科學系講席教授
金融行業大模型及套用實踐分享
林金曙 恒生電子AI首席技術專家
圓桌論壇:大模型賦能軟體開發變革
隨著預訓練技術的發展,大模型強大的語言理解和生成能力,助力開發者更高效地編寫程式碼、最佳化演算法、提升軟體效能。為此,我們特邀請了微軟首席套用科學家經理黃寓凡、阿裏巴巴通義實驗室資深演算法總監李永彬、百度 Comate 架構師張立理、智譜 AI-CodeGeeX 演算法工程師張鑫鵬等眾多行業翹楚,共同探討大模型在軟體開發領域的套用前景和創新實踐。他們分享各自在大模型賦能軟體開發方面的寶貴經驗和前沿技術,為我們帶來一場別開生面的技術盛宴。
CodeLLM在微軟開發者部門的發展及其套用
黃寓凡 微軟首席套用科學家經理
通義靈碼的技術進展和套用案例
李永彬 阿裏巴巴通義實驗室資深演算法總監
智慧化研發在百度的落地
張立理 百度Comate架構師
CodeGeeX:RAG和長文本模型在程式碼計畫級別的探索和套用實踐
張鑫鵬 智譜AI-CodeGeeX演算法工程師
本論壇聚焦於智慧駕駛、推理最佳化、算力基建等領域,來自元戎啟行副總裁兼技術合夥人劉軒,揭示端到端模型在智慧駕駛中的套用案例和技術突破;MiniMax技術總監星龍,分享了大模型在AI Infra方面的挑戰與實踐,以及應對策略;PPIO聯合創始人兼CTO王聞宇,探討了如何實作算力基建和推理最佳化的「軟硬兼施」與創新突破;螞蟻集團AI Infra技術專家王勤龍,介紹了DLRover訓練故障自愈技術,以大幅提升大規模AI訓練的算力效率,為參與者呈現一場前沿科技的盛宴,引領新質生產力的崛起。
端到端模型智駕如何催生新質生產力?
劉軒 元戎啟行副總裁,技術合夥人
大模型在AI Infra方面的挑戰與實踐
星龍 MiniMax技術總監
PPIO:如何做到算力基建和推理最佳化的"軟硬兼施"與創新突破
王聞宇 PPIO聯合創始人& CTO
DLRover 訓練故障自愈:大幅提升大規模AI訓練的算力效率
王勤龍 螞蟻集團 AI Infra 技術專家
在多模態大模型前沿技術專場,我們特邀請了零一萬物聯合創始人潘欣、上海交通大學教授倪冰冰、新浪微博新技術研發負責人張俊林、潞晨科技副總裁李彤就原生多模態、多模態架構及具體套用進行精彩分享。
多模態技術和套用
潘欣 零一萬物聯合創始人
視覺目標的向量化表征與內容生成技術
倪冰冰 上海交通大學教授
原生多模態大模型的方法與問題:以Gemini為例
張俊林 新浪微博新技術研發負責人
Sora開源復現架構模型與訓練揭秘
李彤 潞晨科技副總裁
40+ 主題演講同步進行
嘉賓聽眾互動不斷,激情碰撞
當我們談及大模型時,我們看到的是其在各個領域展現出的巨大潛力和無限可能。大模型如何落地到實際的套用中去,也是眾多大模型開發者關註的焦點。為此,我們特邀請了度小滿金融技術委員會執行主席、數據智慧套用部總經理楊青、文因互聯工程VP兼首席科學家宋劼、金山辦公文件AI技術總監熊龍飛、網易有道技術總監林輝、達觀數據聯合創始人張健、eBay支付風控部門演算法專家韓誌超就大模型套用落地實踐展開分享,現場聽眾更是意猶未盡,與嘉賓互動頻頻。
軒轅大模型實踐和套用
楊青 度小滿金融技術委員會執行主席、數據智慧套用部總經理
大語言模型在文件處理與金融實踐中的套用與融合
宋劼 文因互聯工程VP兼首席科學家
辦公領域大模型的技術路線和套用形態
熊龍飛 金山辦公文件AI技術總監
有道QAnything RAG引擎的演化史與落地經驗分享
林輝 網易有道技術總監
大語言模型技術與創新落地套用
張健 達觀數據聯合創始人
大模型與傳統模型在eBay電商業務中的融合開發策略
韓誌超 eBay支付風控部門演算法專家
智慧湧現、智慧體、機密計算、RAG 等技術成為大模型的重要實作細節,對推動大模型技術的發展和套用具有重要意義。本論壇邀請到 7 位資深技術專家,共同探討在不同場景下的大模型實作以及套用和挑戰,為推動智慧化技術的發展添磚加瓦。
面壁Agent探索,擁抱大模型群體智慧湧現
曾國洋 面壁智慧 CTO
MetaGPT:多智慧體引領程式碼生成與協同的革新探索
吳承霖 DeepWisdom創始人兼 CEO,MetaGPT計畫作者
上下文相關的決策最佳化:基礎模型在工業控制中的套用探索
宋磊 微軟亞研首席研究員
大模型在可觀測AIOps的探索和套用實踐
董善東 阿裏雲高級技術專家
機密計算實作大模型套用全生命周期安全
鄭琦 螞蟻集團高級技術專家
大模型RAG鏈路核心模組開發與實踐
龍定坤 阿裏巴巴通義實驗室演算法專家
構建企業級高效能模型推理平台
陸天明 eBay AI平台部研發工程師
AI Infra 大模型基礎設施是支撐人工智慧發展的堅實基石。它就像四通八達的高速公路,為大模型的執行提供了穩定、高效的環境。該專場特邀請了聆心智慧聯合創始人,CEO鄭叔亮、中科曙光儲存產品事業部副總經理,曙光儲存公司副總裁楊誌雷、白海科技創始人兼CEO盧億雷、千芯科技董事長陳巍、清昴智慧科技 CEO關超宇、百度飛槳資深研發工程師駱濤展開主題分享。
超擬人大模型和個人化場景化的AI服務
鄭叔亮 聆心智慧聯合創始人,CEO
曙光儲存AI大模型實踐分享
楊誌雷 中科曙光儲存產品事業部副總經理,曙光儲存公司副總裁
大模型訓推工具的落地實踐及前景展望
盧億雷 白海科技創始人兼CEO
視訊大模型架構解析及其芯片級訓練部署挑戰
陳巍 千芯科技董事長
面向國產AI芯片的高效推理框架的最佳化與實踐
關超宇 清昴智慧科技 CEO
飛槳在大模型工程化方面的挑戰與技術實踐
駱濤 百度飛槳資深研發工程師
圓桌論壇:AI Infra 大模型基礎設施
該專場由來自北京大學博士生導師袁粒、微軟亞研首席研究員劉樹傑、中科院自動化所副研究員、武漢人工智慧研究院演算法總監吳淩翔、自變量機器人 CTO王昊、OriginX AI Technologies Cofounder CTO 姚佳晨、小冰公司電腦視覺演算法專家王文斕、復旦大學工學碩士劉妍領銜開講。
Open-Sora Plan 視訊生成開源計劃 – 進展與不足
袁粒 北京大學博士生導師
預訓練方法在語音處理領域的探索和套用
劉樹傑 微軟亞研首席研究員
紫東太初多模態大模型創新與實踐套用
吳淩翔 中科院自動化所副研究員、武漢人工智慧研究院演算法總監
機器人的智慧革命:深入大模型技術
王昊 自變量機器人 CTO
多模態智慧體在下一代AI原生2C產品的探索和實踐
姚佳晨 Cofounder CTO, OriginX AI Technologies
小冰AI Beings的視覺革新:個人化表達的挑戰與突破
王文斕 小冰公司電腦視覺演算法專家
StepCoder:從編譯器反饋中強化學習以提高程式碼生成能力
劉妍 復旦大學工學碩士
鳴謝
ML-Summit 2024 全球機器學習技術大會的成功舉辦離不開贊助商們的大力支持和慷慨相助。特別感謝 元戎啟行 、曙光儲存、 金茂綠建 、PPIO、西雲算力、容數信創、戴爾、 輝達 ,是他們的共同努力,讓這場盛會得以圓滿舉行。
最後,我們放一波精彩紛呈的現場花絮照片~
至此,ML-Summit 2024 全球機器學習技術大會圓滿落幕,透過精彩的分享和深度的討論,與會者們深入探討了大模型技術的前沿與套用,探索了大模型工程與架構、多模態、產品創新的技術挑戰和解決方案。本次會議不僅展示了人工智慧領域的最新進展,也為業界人士提供了寶貴的交流與學習機會。我們期待著在未來的研究與實踐中,進一步推動機器學習、人工智慧、大模型、生成式 AI 等技術的創新與發展,共同開創智慧化時代的新篇章。最後感謝所有參與者的支持與貢獻,期待與您再次相聚!
與此同時, 2 024 全球軟體研發技術大會(http://sdcon.com.cn/)將於 7 月 4-5 日 在北京威斯汀酒店隆重舉行,敬請關註~