當前位置: 妍妍網 > 資訊

GPT-4被拉下神壇,Claude 3完成首次超越!亞馬遜再度押註200億

2024-03-28資訊

整理 | 王軼群

責編 | 唐小引

出品丨AI 科技大本營(ID:rgznai100)

3月27日,亞馬遜這家科技和雲巨頭,將在其最初投資的12.5億美元支票基礎上,再投入27.5億美元(約合人民幣198億元)支持AI初創公司Anthropic,以尋求在新技術軍備競賽中取得優勢。 這創造了亞馬遜成立30年來最大規模的風險投資額度,也是雲服務商為在新技術革命為保持領先地位而進行的出手最快的一筆投資。

亞馬遜表示,將再斥資27.5億美元支持Anthropic——這一被廣泛視為生成人工智慧領域的領跑者,為其基礎模型和聊天機器人Claude 與OpenAI和ChatGPT 競爭。

Claude 3的最新表現,不失所望。 就在3月26日, Claude 3已首次在聊天機器人競技場首次超過GPT-4。

Chatbot Arena 是人工智慧研究人員用來衡量人工智慧語言模型相對能力的流行眾包排行榜。 自從 GPT-4於 2023 年 5 月 10 日左右被納入Chatbot Arena(排行榜於當年5月3日推出)以來,GPT-4 的變體至今一直在排行榜前列持續霸榜。 因此,GPT-4在Arena的戰敗是一個轟動AI圈的重大事件。

在人工智慧語言模型發展史上,這是一個裏程碑式的時刻——Anthropic的Claude 3 Opus大語言模型 (LLM) 在Chatbot Arena上首次超越了OpenAI的GPT-4(為 ChatGPT 提供支持),奪得第一名。 同時,Anthropic 的小型模型之一Haiku也因其在排行榜上的出色表現引人註目。

(Claude 3首次問鼎Chatbot Arena榜單)

「國王死了」,軟體開發者 Nick Dobos 在社交媒體上流傳的一篇比較GPT-4 Turbo和Claude 3 Opus的貼文中寫道, 「安息吧 GPT-4。」

聊天機器人競技場對研究人員來說很重要,因為他們在嘗試衡量人工智慧聊天機器人的效能時常常感到沮喪,因為人工智慧聊天機器人的輸出千差萬別,很難量化。外媒曾在對Claude 3的報道裏寫到客觀地對LLM進行基準測試有多麽困難。

獨立人工智慧研究員西蒙·威利森(Simon Willison) 表示:「有史以來最好的可用模型(用於高級任務的 Opus、用於成本和效率的 Haiku)首次來自OpenAI 之外的供應商。」 「這令人放心——我們都從這個領域的多元化頂級供應商中受益。GPT-4 目前已經存在一年多了,他人花了一年才後來居上。」

這家後來居上的Anthropic背後的主要金主,無疑是亞馬遜。2023年9月亞馬遜宣布對其初始投資12.5 億美元,並表示至多投資40億美元。這次27.5億美元的風投標誌著亞馬遜的第二筆資金到位。

該公司表示,亞馬遜將保留該公司的少數股權,並且不會擁有 Anthropic董事會席位。據訊息人士透露, 這筆交易是在Anthropic的最新估值為184億美元的情況下達成的。

在過去的一年裏,Anthropic完成了五筆不同的融資交易,價值約73億美元。該公司的產品在企業和消費者領域與OpenAI的ChatGPT直接競爭,並且由前OpenAI研究高管和員工創立。

亞馬遜再次投資的訊息是在Anthropic推出Claude 3的幾周後。Claude 3是其最新的人工智慧模型套件,據說是迄今為止最快、最強大的。該公司表示,其新模型最強大的效能超過了 OpenAI的GPT-4和谷歌的 Gemini Ultra進行的行業基準測試,例如本科水平知識、研究生水平推理和基礎數學。

「生成式人工智慧有望成為我們這個時代最具變革性的技術,我們相信我們與 Anthropic 的戰略合作將進一步改善我們客戶的體驗,並期待接下來的發展。」 AWS表示。

相關連結:

https://www.cnbc.com/2024/03/27/amazon-spends-2point7b-on-startup-anthropic-in-largest-venture-investment.html

https://arstechnica.com/information-technology/2024/03/the-king-is-dead-claude-3-surpasses-gpt-4-on-chatbot-arena-for-the-first-time/

4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼 進一步了解詳情。