當前位置: 妍妍網 > 資訊

微軟不再獨寵 OpenAI!押註 GPT-4 最強競品、法國 AI 獨角獸 Mistral AI

2024-02-27資訊

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

OpenAI 領跑全球 AI 大模型時,很多人好奇誰會成為下一個或者有能力超越它的公司?

雖然目前並沒有準確的答案,但是就在今天 OpenAI 的確迎來了一個強有力的競爭對手,即總部位於法國巴黎的初創公司 Mistral AI。

2 月 26 日,Mistral AI 不僅推出了僅次於 GPT-4 效能的 Mistral Large,還帶來了 ChatGPT 的競爭對手 Le Chat 聊天機器人(目前處於預覽階段)。更重要的是,它還和 OpenAI 背後的金主微軟達成了合作。

據外媒 FT 報道, 如同當年 OpenAI 在艱難之際獲得微軟的資金和算力支持,時下,微軟總裁 Brad Smith 宣布與 Mistral 建立「多年合作夥伴關系」,以幫助這家成立 10 個月的公司將其人工智慧模型推向市場。作為合作的一部份,微軟擁有 Mistral AI 少量股份。

Mistral AI 用 10 個月成為歐洲生成式 AI 領域最大的「黑馬」

在大模型賽道上,相比已經推出 ChatGPT、GPT-4 等頂級模型的 OpenAI,以及帶來 Claude 系列模型的 Anthropic 等公司而言, Mistral AI 如同其於 2023 年 4 月成立的時間一樣,還非常年輕。

在此之前,讓這家初創公司頻登熱搜的也不是因為它推出了多麽超級厲害的大模型產品,而主要是資本的湧入。

要知道彼時 且在尚未釋出任何新品時,它便獲得了一輪高達 1.13 億美元的種子資金,成為當時歐洲生成式 AI 公司有史以來最大的種子輪融資。同時,這筆資金的進入讓 Mistral AI 的估值直接達到了 2.4 億歐元(2.6 億美元)。

不久之後,Mistral AI 釋出的新模型 Mistral 7B,在眾多基準測試中超越了 Llama2 13B 模型,從而一舉成名。

在 2023 年 12 月,Mistral AI 也靠實力說話,在直接開源了其 MoE(Mixture of Experts)大模型 Mixtral 8x7B 的同時,宣布完成新一輪 4.15 億美元的融資,此輪融資主要涉及加州基金 Andreessen Horowitz、法國巴黎銀行和軟體發行商 Salesforce。這筆資金也讓 Mistral AI 的估值翻了幾番,達到約 20 億美元。

放眼全球 AI 市場,Mistral AI 妥妥地就是資本的寵兒。對於這家公司的背景,我們也曾報道過,是由三位 30 歲+的大小夥創辦而成,他們分別來自 Google DeepMind、Meta 公司,都有著大模型方面的研究與開發經驗

其中,曾在 Facebook 母公司 Meta 工作現如今 32 歲的 Timothée Lacroix 和 33 歲的 Guillaume Lample,此前一起領導了 Meta 的 LLaMA 大模型的開發,當前在 Mistral AI 分別任職技術長和首席科學官。

以及今年 31 歲的 Arthur Mensch,他曾受雇於 Google DeepMind,是 Retro、Flamingo 和 Chinchilla 計畫的主要貢獻者,發表過 21 篇有關語言模型的 ArXiv 論文,當前在 Mistral AI 這家初創公司擔任 CEO。

據悉,他們三人在學習交流期間相識,彼時都在大廠公司任職 AI 重要崗位。

Mistral AI 聯合創始人:Guillaume Lample、Arthur Mensch、Timothée Lacroix

之所以想要創立 Mistral AI,Mensch 稱是在 2022 年的某個時候,他們開始看到了 AI 發展方向。

雖然他們沒有直接道明受 OpenAI ChatGPT 成功的鼓舞,但是 2022 年底ChatGPT 的出現,的確給了很多人不少啟發。

對標 GPT-4,Mistral AI 釋出 Mistral Large

時下,Mistral AI 最新釋出大模型——Mistral Large,直面當前最先進的模型 GPT-4 帶來的壓力。

值得註意的是,在公司成立之時,Mistral AI 堅信:「開源是刻在我們(Mistral AI) DNA 裏的一個核心部份。」所以,其起步時候釋出的 Mistral 7B、Mixtral 8x7B 等都是以開源的形式,但是如今 Mistral AI 似乎走上了和 OpenAI 相同的路徑,Mistral Large 不會開源。

根據 Mistral 官方介紹,Mistral Large 具有頂級推理能力,它可用於復雜的多語言推理任務,包括文本理解、轉換和程式碼生成。預設情況下,Mistral Large 支持 32K token 上下文視窗(通常超過 20,000 個英語單詞),可以從大型文件中精確呼叫資訊。

當然口說無憑, Mistral AI 也直接在官網上曬出 Mistral Large 與 GPT-4、Claude 2、Gemini Pro、GPT-3.5、LLaMA 2 70B 在各種基準上的測試成績。

推理能力

其中, 在常用的 MMLU 基準測試中,Mistral Large 推理能力還不錯,以 81.2% 的成績位居第二位,僅次於 GPT-4。


多語言能力

在語言能力上,Mistral Large 支持英語、法語、西班牙語、德語和義大利語, 對語法和文化背景有細致入微的理解。根據不同的基礎測試發現,其明顯優於 LLaMA 2 70B 模型。

數學和編碼

Mistral Large 在編碼和數學任務中表現出色,遠遠超過 LLaMA 2 70B 模型。

相比其他大模型,Mistral Large 還具有一些獨特的優勢:

原生支持函式呼叫。JSON 格式模式強制語言模型輸出為有效的 JSON 格式。這一功能使開發人員能夠更自然地與 Mistral Large 模型進行互動,以結構化的格式提取資訊,便於在其余管道中使用。

函式呼叫可讓開發人員將 Mistral 端點與他們自己的工具集連線起來,從而與內部程式碼、API 或資料庫進行更復雜的互動。

目前 Mistral Large 可以在 Mistral 自己的基礎設施(在歐洲托管)——La Plateforme 上使用,這個存取點使開發人員能夠在其全面的模型範圍內建立應用程式和服務。

同時, 隨著 Mistral 和微軟合作的展開,Mistral 的開放和商業語言模型能在微軟的 Azure AI 平台上可用,這也是繼 OpenAI 之後第二家在 Azure 上提供商業語言模型的公司。

Mistral Small 也於今天面世

Mistral AI 取名方式異常簡單,通俗易懂,大模型名字叫 Mistral Large,調優之後的模型就用 Small 來表示。

此次,Mistral AI 還釋出了新的最佳化模型 Mistral Small,與 Mistral 的 8x7B 模型相比,該模型針對延遲和成本進行了最佳化,延遲更低了。

當前,Mistral AI 正在簡化端點產品,以提供以下服務:

  • 具有價格競爭力的開放式端點。這包括 open-mistral-7B 和 open-mixtral-87b。

  • 新的最佳化模型端點:mistral-small-2402 和 mistral-large-2402。Mistral AI 透露,該團隊正在維護 mistral-medium,但今天不會更新。

  • 整體來看,Mistral AI 已釋出的幾款模型在推理、編碼、多語言方面的表現能力如下所示:

    ChatGPT 的替代方案——Le Chat

    除了以上,Mistral AI 今天還推出了一款名為 Le Chat 的聊天助手。任何人都可以在 chat.mistral.ai 上註冊並試用。

    該公司表示,目前 Le Chat 只是一個測試版,使用者可以其中使用 Mistral Small、Mistral Large 和一款名為 Mistral Next 的原型模型。

    值得註意的是,Le Chat 在測試階段,可能會出現一些奇怪的反饋,而且在使用時不能存取網路,所以也可能會出現資訊不準確或者回答過時內容的情況。

    未來,該公司還計劃推出面向企業客戶的付費版 Le Chat。其中企業客戶還可以定義稽核機制。

    Mistral AI 的商業模式

    在生成式 AI 產品商業化這條路上,Mistral AI 的商業模式和 OpenAI 的也有些類似,該公司透過付費 API 提供 Mistral Large,並根據使用量定價。

    目前, Mistral Large(mistral-large-2402)的費用為每百萬個輸入 token 為 8 美元,每百萬個輸出 token 為 24 美元。

    作為比較,GPT-4 Turbo 具有 128k token 上下文視窗,目前每百萬個輸入 token 的成本為 10 美元,每百萬個輸出 token 的成本為 30 美元。

    Mistral Large 目前比 GPT-4 Turbo 便宜一些。

    微軟為什麽牽手 Mistral AI?

    最後,在這次合作中, 微軟和 Mistral AI 雙方都沒有透露交易的財務細節,不過正如文章伊始所示,微軟稱對這家總部位於巴黎的初創公司是小額投資,這表明它遠小於微軟對 OpenAI 數十億美元的投資。

    對此, Mistral AI 聯合創始人兼執行長 Arthur Mensch 表示:「微軟對我們模型的信任是我們將前沿人工智慧交到每個人手中的旅程中向前邁出的一步。」

    至於為什麽微軟會選擇 Mistral AI,微軟總裁 Brad Smith 在接受外媒 CNBC 采訪時表示,「就微軟對歐洲的技術支持而言,今天是最重要的日子之一。我們從根本上同意與 Mistral AI 建立長期合作夥伴關系,這樣他們就可以在我們的人工智慧數據中心、我們的基礎設施上訓練和部署他們的下一代人工智慧模型,並立即生效... 對我們來說,重要的是要表明這不僅僅是微軟的技術,也不僅僅是美國的產品。這也將成為歐洲技術、創新和增長的引擎。

    除此之外,其實微軟和 Mistral AI 選擇當前這一時間點合作也頗為關鍵。據外媒報道,微軟目前因為向 OpenAI 投資 130 億美元而正面臨歐盟反壟斷監管機構的調查,對此外界也紛紛猜測微軟此舉也是為了平衡監管機構對於其可能帶來的反壟斷競爭的擔憂。

    不過,Mistral AI 在有微軟的助力下,首推的大模型嶄露頭角,於普通使用者而言,市場有競爭無疑也是一件好事。

    參考:

    https://mistral.ai/news/mistral-large/

    https://techcrunch.com/2024/02/26/mistral-ai-releases-new-model-to-rival-gpt-4-and-its-own-chat-assistant/

    https://www.cnbc.com/2024/02/26/microsoft-invests-in-europes-mistral-ai-to-expand-beyond-openai.html

    推薦閱讀: