商 界 導 讀:目前國內大模型領域估值最高的獨角獸。
從 ChatGPT 到 Sora , OpenAI 在一年多時間裏連續釋出兩個重磅產品, 徹底拉開了AI時代的帷幕。
有專家稱, AI的變革對人類社會而言,堪比「工業革命」。
國內在驚羨於OpenAI強大的同時,不由得回頭來看: 中國何時能出現自己的 「 OpenAI 」 ?
時代浪潮之下,創投資金湧動。一家成立不足1年的AI創業公司——月之暗面,被巨額融資「推出了水面」。
就在近日, 月之暗面完成新一輪超10億美金(折合人民幣70億元左右)融資 ,投資方包括紅杉中國、阿裏、美團等。 此次融資後,月之暗面估值達約25億美金,成為國內大模型領域的頭部企業之一。
1
成立不到1年,單筆融資70億
在 OpenAI 引領的新風向裏,一場 AI 浪潮已然席卷市場 。 在輝達等公司在二級市場股價創新高的同時,一級市場裏也迎來一場全新的造富運動,引得無數資本盡折腰。
一時間,國內 AI 創業公司群雄並起,融資不斷:
去年 10 月,百川智慧完成了 3 億美元的 A 輪融資;
同月,智譜 AI 也宣布年內累計獲得 25 億人民幣融資;
更早之前, MiniMax 獲得超 2.5 億美元的融資。
2023 年 3 月,月之暗面成立於北京,剛剛成立就展現出超強的 融資能力。
成立不到3個月,月之暗面就完成了天使輪融資,金額約20億元,資方包括紅杉中國、真格基金、今日資本等。 今年2月初,就有媒體報道,月之暗面正在進行2億美元的融資,投前估值約15億美元。 2月19日,又有媒體報道: 該公司完成了超10億美元融資。 兩筆融資前後僅僅相距17天。
成立不到1年,月之暗面單筆融資已超越國內主流AI創業公司,創下行業新高。
本輪融資完成後,月之暗面的估值將達到 25 億美元,約合人民幣 179.5 億元,超過百川智慧最近一次融資後的估值 78 億元和智譜 AI 的 100 億元,也高於 MiniMax 和零一萬物的估值,成為 目前國內大模型領域估值最高的獨角獸 。
月之暗面背後的投資方囊括了多家主流互聯網公司,除了紅杉中國這個專註科技的明星私募基金,阿裏、小紅書、美團也在名單裏。
成立不到1年,融資70億,月之暗面憑什麽?
2
月之暗面憑什麽?
月之暗面這個名字,來源於搖滾樂隊 Pink Floyd 的專輯【 The Dark Side of the Moon 】,創始人楊植麟鐘愛搖滾,大學期間,他曾組建校園搖滾樂隊,並擔任樂隊的鼓手。
「 這個名字象征著神秘與未知,與公司在人工智慧領域的探索精神相契合。 」
出生於 1993 年的楊植麟是廣東汕頭人,本科畢業於清華大學電腦科學與技術系,博士就讀於卡內基梅隆大學語言技術研究所( LTI ),師從蘋果 AI 研究負責人 Ruslan Salakhutdinov 和谷歌首席科學家 William Cohen 。
在讀博期間,楊植麟用 4 年時間完成了一般 人 6 年才能完成的博士課程,並連續作為第一作者發表了兩項關鍵研究成果 —— Transformer-XL 和 XLNet 。
擁有漂亮履歷的楊植麟是毋庸置疑的超級學霸,他的學術論文在華人學者參照排名中位居前 10 ,在 40 歲以下排名第一。
2022 年, ChatGPT 橫空出世。 作為人工智慧實驗室 Open AI 開發的聊天機器人模型, ChatGPT 在科技領域掀起熱潮。
「 ChatGPT 剛發的時候,我非常激動,我好奇這個世界到底能做什麽樣的 AI ,我能多大程度去復制、甚至做得比人腦更好。 同時,我也陷入到非常沮喪的狀態 —— 我會開始想在這個浪潮裏我還能貢獻什麽,又開始興奮起來: 現在是非常好的 timing ,不管發生什麽,一定要做。 」
ChatGPT 的出現讓楊植麟很興奮,他覺得自己是時候做點什麽了。 之後,他與兩位清華校友周昕宇、吳育昕共同創立了月之暗面。
2023 年 10 月,月之暗面推出全球首款支持輸入 20 萬漢字的智慧助手產品 Kimi Chat ,除了聯網搜尋、知識查詢、文本生成、轉譯、圖片辨識等基礎功能, Kimi Chat 進行文本搜尋所得出的內容是深入研究、挖掘更全面的資訊。
釋出之初, Kimi Chat 就打出了 「 長文本 」 、 「 自研閉源 」 、 「 to C 」 等標簽,而 20 萬漢字,是目前全球市場上能夠產品化使用的大模型服務中所能支持的最長上下文輸入長度 。
據報道,大模型套用效果通常取決於兩個核心指標,一是模型參數量,決定了大模型的 「 計算 」 能力; 二是能夠接收多少文本輸入,即長文本技術,決定了大模型的 「 記憶體 」 能力。
目前,全球大多數大語言模型的輸入長度都在 2K 以內 。 相比當前市面上追求 「 面面俱到 」 的大模型, Kimi Chat 重點突破了長文本技術的挑戰。
作一個對比, Anthropic 的 Claude 支持最大長文本為 100k ,約 8 萬字 ; OpenAI 的 GPT-4 則是 32k ,約 2.5 萬字 ; 也就是說, Kimi Chat 的 20 萬字,是 Claude 的 2.5 倍和 GPT-4 的 8 倍。
楊植麟強調, Kimi Chat 透過創新的網路結構和工程最佳化,在千億參數下實作了無失真的長程註意力機制,不依賴於滑動視窗、降采樣、小模型等常見的對效能損害較大的 「 捷徑 」 方案。
這些改進允許 Kimi Chat 在不犧牲理解能力和生成品質的前提下,處理長達 20 萬漢字的輸入 。
「 這在當前的 AI 模型中是非常罕見的。 」
這樣的優勢讓 Kimi Chat 在金融、法律、科研等需要快速分析和總結長篇文件的領域,潛力巨大。
「 支持更長的上下文意味著大模型擁有更大的記憶體,使大模型的套用更加深入和廣泛。 比如透過多篇財報進行市場分析、處理超長的法務合約、快速梳理多篇文章或多個網頁的關鍵資訊、基於長篇小說設定進行角色扮演等。 」
有使用者在使用 Kimi Chat 之後表示, 「 Kimi Chat 適用於閱讀長文,能提供摘要和進行多輪問答。 」
月之暗面將長文本技術稱之為大模型 「 登月計劃 」 的第一步。
11 月,月之暗面又釋出了 Moonshot AI 開放平台,開發者可以在平台上建立自己的 API Key ,將 Kimi 智慧助手背後的同款 moon shot 模型能力接入到自己的產品或打造出全新產品。
如此硬核的月之暗面,必定不能缺少一個硬核的團隊。
據月之暗面內部員工稱,月之暗面團隊成員人數在近 200 人,匯聚了來自 CMU LTI 、 Google 、 Meta 、 Amazon 等全球頂級機構人才,在大模型、視覺、強化學習等 AI 技術創新方面實力強勁,比如,團隊成員發明了 RoPE 相對位置編碼,它 是 MetaLLaMa 和 GooglePALM 等大多數主流模型的重要組成部份。
在楊植麟自己看來,人才密度是月之暗面最主要的一個特色。
「 我們希望透過這種很高的人才密度以及組織力量,能夠打造一個很快叠代的組織機器,讓人才能夠快速基於我們現有和未來發展出的技術,開發出比較好的產品。 」
一位行業內人士指出,市場上大模型相關的人才非常稀缺, 「 真正有相關經驗、有計劃、有認知、願意創業且在合適年齡的人其實並沒有那麽多,在演算法創新方面的人才稀缺程度則比之更甚。 」
這或許就是月之暗面被資本熱捧的重要原因之一。
3
與OpenAI的距離
新年伊始, OpenAI 再出王炸, Sora 的爆火 ,不僅引發了人工智慧大模型領域的投資熱潮,還一舉將生成式 AI 的關註點從文生文、文生圖拉高至文生視訊。
一位行業人士表示, 「 如果說 AIGC (生成式人工智慧)是 AI 領域皇冠,那麽文生視訊就是皇冠上的寶石。 」
Sora 的出現,意味著大模型的競爭到了比拼多模態的階段。 楊植麟 和月之暗面 的追求也在於此。
2023 年之前,楊植麟認為亞洲可能並不存在做大模型公司的機會。 但從 2022 年年底起,楊植麟的判斷開始發生變化,因為 GPT 在美國市場引發很大關註。
如今行業對大模型的議題已從 ChatGPT 變為 Sora ,楊植麟表示,多模態過去幾年卡在架構上,缺少真正通用的模型, 「 2024 年月之暗面也會推出多模態產品,但公司的目標是在大模型領域做 To C 超級套用。 」
據張通社報道,從商業模式的角度來看,大模型產品分為 to B 與 to C 兩大陣營。 以 ChatGPT 和 Character.ai 為例,這兩個產品已經積累了大量的數據和使用者反饋,有大量的跡象證明已經透過這種產品產生了新的入口,新一代 AI 在 「 有用 」 和 「 有趣 」 兩個方向上,存在巨大潛力。
月之暗面仍在商業落地的探索中,雖保持著開放的心態,但其核心定位放在 to C 上。
「 AI Nat ive 的產品會在 to C 領域產生新的流量入口,成為 AI 時代的 Super App ,這是一個非常大的機會。 而要想做 Super App ,就必須用自研模型,因為只有自研模型才能在使用者體驗上產生差異化。 」
基於這個層面,楊植麟認為,開源模型無法構建產品壁壘,「比如,在海外有幾百個基於開源擴散模型Stable Diffusion的套用出現,但最後其實沒有任何一個跑出來。 其次,無法在開源技術的基礎上透過數據的虹吸效應讓模型持續地最佳化,因為開源模型本身是分布式部署,沒有一個集中的地方接收數據。 」
因此, 楊植麟堅定地表示,「不管是從底層邏輯還是當前的現象,都需要透過閉源模型構建產品壁壘。 」
浪潮已經被推起,從文生文的ChatGPT,到文生圖的DALL·E,再到此次文生視訊的Sora,OpenAI每次釋出的產品都會引來國內市場的不斷追問,我們距離OpenAI還有多遠?
據了解,國內目前在大模型領域主要分為兩派: 一派是以阿裏、百度、騰 訊、字節為代表的互聯網大廠,其所產出的大模型產品多從產業角度出發; 另一派是從技術側入手的創業公司,尤以清華系為重。
在這些從業者眼中,OpenAI是他們一直在追趕但尚未達到的目標。
楊植麟表示,追趕OpenAI的過程需要時間與技術創新,「一方面後發優勢可以利用OpenAI等先行者已做出的工作與成功。 但客觀上需承認,雙變異數距很大。 長期來看,AI是異質化的,不同人面對的AI維度不同。 另外,AI模型的自建也不存在超越與否的問題,不同工具在不同場景上的優勢也不同。 」
一切才剛剛開始,無論是市場,還是月之暗面,都需要時間去成長。
/部份資料來源/
1.【AI掀起新一輪造福浪潮】/華爾街見聞/劉寶丹
2.【超70億元!獨角獸企業月之暗面再獲新一輪融資】/張通社
3.【OpenAI訊號燈又亮了 Sora能照亮國內AGI前路嗎?】/第一財經
投資 · 傳媒 · 創新
關 於 本 文
作 者:封平
來源: 商界(ID:shangjie-1994)
文章為商界原創稿件,轉載請標明來源作者
精 彩 文 章
1.
2.
3.
4.
5.
致力為讀者提供精彩、深度、有料的商業財經內容
為企業提供全媒體品牌策劃、內容創作、推廣傳播
Hi,U can also follow us
出品 | 商界傳媒內容編輯部
投稿/合作/爆料 聯系微信:JEFF_MAIN
你再主動一點點 我們就有故事了