當前位置: 妍妍網 > 資訊

中美AI打響價格戰,輝達竟成最大贏家?

2024-05-23資訊

整理 | 王軼群

責編 | 唐小引

出品丨AI 科技大本營(ID:rgznai100)

5月,大模型降價忙。

AI 降價潮愈演愈烈,國內國外都開啟了新一輪的 AI 價格戰。

國內AI價格激戰:降價、大幅降價、直接免費!

國內互聯網大廠,包括阿裏、字節、百度、騰訊,以及背靠雄厚資本的創業公司,持續釋出 AI 及大模型產品,同時逐步加快了降價的節奏,從降價、大幅降價,到直接免費、立即生效!

事情開始於1元可以購買100萬tokens。

5月6日,私募巨頭幻方量化的AGI(通用人工智慧)的新組織「深度求索(DeepSeek)」開源第二代 MoE 模型 DeepSeek-V2,把價格打到了僅為GPT-4-Turbo的近百分之一。其API的定價為:每百萬tokens輸入1元、輸出2元(32K上下文)。

5月13日,智譜大模型開放平台上線了新價格體系,入門級產品 GLM-3 Turbo 模型呼叫價格下調80%,從5元/百萬tokens降至1元/百萬tokens。調整後,1元可以購買100萬tokens,使用 GLM-3 Turbo 創作一萬條小紅書文案(以350字計)將僅需約1元錢。

大廠也同樣不甘示弱。

5月15日,字節跳動釋出豆包大模型,定價大幅低於行業價格。豆包主力模型在企業市場的定價僅為0.0008元/千tokens,即0.8厘就能處理1500多個漢字,比行業便宜99.3%。

在5月9日釋出通義千問2.5之時,阿裏表示個人使用者可以透過 APP、官網和小程式免費使用通義。而不到兩周後,在5月21日,阿裏通義千問開啟降價。 由此,1元可以購買100萬tokens,被阿裏卷到1元最多可購買200萬tokens。

通義千問 Qwen-Long 的 API 輸入價格大幅下調,從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味著1元錢可以購買200萬tokens,相當於5本【新華字典】的內容。該模型最高支持1000萬tokens的長文本輸入降價後的價格約為 GPT-4 的1/400。

阿裏的這波降價加限時免費,一定程度上已經超越了前幾次其他廠商的大模型降價。但,這並沒有讓阿裏坐穩價格戰的頭把交椅,甚至屁股都沒坐熱,就被打著「全面免費」的百度趕下。在阿裏宣布如此大幅降價的當日,5月21日晚些時候,百度宣布文心大模型的兩大主力模型將全面免費,立即生效。

之前咬緊的降價潮,被百度再卷一次,迎來了全面免費的階段,國內大模型價格戰的正式打響。

隨後, 僅在第二天,全面免費風頭就歸屬到了卷王騰訊雲。 5月22日,騰訊雲直接「一鍵三連」:正式對外宣布旗下AI程式碼助手全面對外開放,公布了全新大模型升級方案,API 輸入價格大幅下降,混元-lite模型全面免費。

騰訊雲主力模型之一混元-lite 模型,API輸入輸出總長度計劃從目前的4k升級到256k,價格從0.008元/千tokens調整為全面免費;混元-standard API 輸入價格從0.01元/千tokens降至0.0045元/千tokens ,下降55%,API輸出價格從0.01元/千tokens降至0.005元/千tokens,下降50%;混元-standard-256k,具備處理超過38萬字元的超長文本能力,API輸入價格下調至0.015元/千tokens,下降87.5%,API輸出價格下降至0.06元/千tokens,下降50%;最高配置萬億參數模型混元-pro,API 輸入價格從0.1元/千tokens降至0.03元/千tokens,降幅達70%。

騰訊雲表示,以上價格調整自釋出之時立即生效。

國內的 AI 價格戰,在本周打得尤為激烈。不僅模型參數及效能卷起來了,價格更是卷到飛起!從1元可購買100萬個tokens,到最多可買200萬個,再到免費,最後到全面免費。甚至有業內人士笑稱,眼瞅著下一家跟進的廠商可能就得發錢補貼讓客戶用 API 了。

國外AI:紮堆釋出、降本至免費,輝達坐收漁翁之利

在國內降價免費之前,國外已經走過了一輪大模型降價和免費階段。

5月初,谷歌就表示其AI聊天機器人的問答成本在過去一年中銳減了80%。這標誌著谷歌在 AI 領域再次取得了重要突破,透過 Gemini AI 模型和客製AI芯片的技術革新,谷歌有效降低了 AI 搜尋的營運成本。

不僅降本,谷歌還直接免費。一個月前,在4月10日,谷歌最強大模型Gemini 1.5 Pro「全面」對外開放,完全免費。Gemini 1.5 Pro100萬的上下文視窗這次也直接對外開放,可以處理的最長音訊約為11小時,最長視訊則為1小時。谷歌官方給這次免費開放的Gemini 1.5 Pro版本定義為「公開預覽版」,主要面向開發者,可在谷歌AI Studio中獲得API金鑰。這是在 Gemini Ultra 免費試用兩個月之後的又一次大模型免費舉動。

攪動渾水的鯰魚,非 OpenAI 莫屬。偏偏趕在谷歌 I/O 大會同一時間的前一天,在5月13日,OpenAI 推出了一款名為 GPT-4o 的「旗艦級」生成式人工智慧模型,面向所有 ChatGPT 的付費和免費使用者,取消其他所有限制,API 價格降價50%。

OpenAI這波對谷歌的阻擊力度不小。雖然OpenAI宣傳的是「取消所有限制」,但據使用者反饋,也存在每天的使用限制。其免費層的使用者將預設使用GPT-4o,但使用 GPT-4o 發送資訊的數量有限制,這將根據當前的使用情況和需求而變化。不可用時,免費層使用者將切換回GPT-3.5。

第二天,谷歌 I/O 大會以近10個大模型的升級釋出絕地反擊。

谷歌向全球所有開發者推出 Gemini 1.5 Pro 的改進版本,擁有 100 萬個 token 上下文的 Gemini 1.5 Pro 現在可以直接在 Gemini Advanced 中供消費者使用;將 Gemini 1.5 Pro 上下文視窗擴充套件到了 200 萬個 tokens,並以私人預覽版的形式提供給開發人員;比 Gemini 1.5 Pro 更輕量級的 Gemini 1.5 Flash 釋出;釋出可制作「高品質」 1080p 視訊的 Veo 模型和文本生成影像模型 Imagen 3;釋出采用全新架構、27B 大小尺寸的 Gemma 2.0;推出第一個視覺語言開放模型 PaliGemma。

一周後,微軟在 Build 開發者大會上也頻頻出招。僅僅在第一天兩個多小時的演講中,微軟就宣布了50多項更新,包括AI基礎設施、模型產品落地等多方面。

在谷歌預覽具備語音互動和視覺記憶的AI智慧體 Project Astra 後,微軟在會上釋出 Team Copilot 智慧體,作為 Copilot for Microsoft 365 的擴充套件,該智慧體更註重在執行工作任務上,能夠提升整個團隊的工作效率,完成主持會議、跟蹤並安排計畫進展等任務。同時,微軟宣布將 OpenAI 上周更新的ChatGPT-4o接入Azure雲平台,可對外提供API。在垂直領域套用上,微軟還與可汗學院合作為 K-12 教師免費提供人工智慧Agent,並將開發 Phi-3 數學模型。

在國外,無論是行業套用還是基礎模型,國外大模型的市場份額都牢牢被明星創業公司和大廠占據,要麽是 OpenAI、谷歌、Meta 等科技巨頭,要麽是有傳統科技巨頭大手筆投資的 Anthropic、Mistral AI 等明星初創公司。

然而,占據大部份市場份額的AI公司,其盈利能力卻一直不達預期。連 Meta 這樣的巨頭也無法指望立刻從AI中獲利,Meta 在2024年增加了高達100億美元的基礎設施支出,但預計多年內不會從其 AI 產品中賺錢。

那麽, AI 浪潮仍在激烈奔湧下,真正賺錢的是誰?算力巨頭輝達坐收漁翁之利。 在最新公布的財報中,輝達獲得了創紀錄的季度收入。據其釋出截至4月28日的2025財年第一財季報告,各項數據全面超越預期的狀態。

輝達第一季度實作收入260億美元,比去年同期增長262%;凈利潤為148.8億美元,同比增長高達644%。輝達預計,截至7月的本季度營收將達到280億美元,是去年同期的兩倍多,也高於華爾街的預期。

在隨後的電話會議上,財務長科萊特·克雷斯預計,每花費1美元采購輝達人工智慧基礎設施,雲提供商在未來四年內就有機會透過提供算力服務(GAAS)賺取5美元收入。

可見,在算力和數據這開發大模型無法繞過的兩大難點上,占一頭的優勢,輝達就獲利頗豐。

誰在獲益,誰在被裹挾,免費保增長還是收費報成本?

增算力,獲數據,擴市場,這是成為時代 AI 基建的底層邏輯。

目前,算力層面輝達一家獨大。AI模型廠商的眼光就瞄準在了市場、使用者和數據規模上。降價,免費,多效能多產品,即為保增長的獲客之道。

事實上,降價並沒有真的損失多少收入,畢竟大家都沒有輝達賺錢,都沒完全跑通商業模式。啟用下市場,在行業降價潮中及時入場賺個吆喝,促進企業從「免費試用」開始下水,擴大大模型API的呼叫量,有助於早點啟動大模型釋出公司對 AI 進入業務流的嘗試。

過去一年,國內大模型廠商在過去一年也做了一系列探索來降低 AI 套用的門檻,以期擴大大模型的呼叫量,但結果都不及預期,標準化的模型 API 並沒有迎來確定性的增長,不如直接降價、免費來得直接。

降價免費,降低使用門檻,促使更多使用者使用、更多的API呼叫,就能帶來更大市場,獲取更多數據。

數據是AI模型的基礎,AI 模型訓練獲取適合數據的難點和痛點在於:

  • 數據獲取難,實體層等資料來源缺失,套用難展開,采集數據顆粒度不統一,數據難套用;

  • 數據品質差,數據記錄不完整,套用難最佳化,數據記錄不準確,套用難商用;

  • 數據訓練成本高昂。

  • 根據HAI研究所的AI報告,訓練巨型模型的成本呈指數級增長,谷歌 Gemini Ultra 的訓練成本估計為1.91億美元,GPT-4 的訓練成本估計為7800萬美元。

    降價和免費,也是獲取更多可篩選訓練優質數據的方式之一。科技博主寶玉表示,現在 AI陷入價格戰了,AI服務商都陷入了免費保增長還是收費保成本的兩難境地。

    免費保增長,還是收費保成本?明顯,大廠的選擇是先降低使用門檻,然後逐步實作商業化。可以看到,本次降價中,降得最兇的都是有雲服務的大公司。 「這些雲服務商透過大模型來獲取雲使用者,羊毛出在豬身上,降得起。」 傅盛表示。

    想收費保成本的小廠正在這波降價潮中面臨尷尬。大廠和明星創業公司可以隨意降價,但由此引發的市場競爭加劇,普通 AI 大模型創業者就被裹挾其中。

    科技巨頭憑借雄厚的財力、廣泛的數據儲存庫和大量的算力基礎設施,在底層模型上可以建立牢固的立足點,明星創業公司背後站著明星投資機構。而初創公司,除非依靠大公司的財力,幾乎沒有能力承擔模型的高訓練成本,也沒有先發優勢,不能跟大廠直接對抗,除非瞄準差異化需求,做垂直細分的賽道,否則很難在裹挾中前進。

    目前,行業能形成價格戰的連鎖反應,也由於 當前各大模型的能力放在可用的場景中,尚未拉開差距,使用者可選擇空間大,甚至有免費開源產品可用 。也有質疑聲音稱一些降價的模型本身吞吐量就低,而高效能模型並沒有降價,且還有很多細節條款會讓最終企業用起來沒有宣傳的那麽便宜。

    需要註意的是,只提供模型的 API,距離 AI 套用在場景中落地還有很大距離,大部份 AI 套用還需要在一個通用的模型 API 之上,在場景裏餵數據、做微調等來最佳化模型引擎。

    若一個通用的模型 API 無法深度適配場景,企業使用者往往還是要自己基於開源模型,用場景數據做專門的深度訓練,並不會接通用的模型 API。無論使用門檻再低,如果與使用者需求不適配,依然換不來增長。

    卷價格來的直接,但不如卷精準符合使用者的需求來的實在且長久。

    參考連結:

    https://mp.weixin.qq.com/s/HA4RtjXvUhOY-sdHXYvUpg

    https://baijiahao.baidu.com/s?id=1799742413819805747&wfr=spider&for=pc

    https://baijiahao.baidu.com/s?id=1799762991336129582&wfr=spider&for=pc

    開發者正在迎接新一輪的技術浪潮變革。由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的 2024 年度「全球軟體研發技術大會」秉承幹貨實料(案例)的內容原則,將於 7 月 4 日-5 日在北京正式舉辦。大會共設定了 12 個大會主題:大模型智慧套用開發、軟體開發智慧化、AI 與 ML 智慧運維、雲原生架構……詳情👉: http://sdcon.com.cn/