中美AI打響價格戰，輝達竟成最大贏家？

2024-05-23資訊

整理 | 王軼群

責編 | 唐小引

出品丨AI 科技大本營（ID：rgznai100）

5月，大模型降價忙。

AI 降價潮愈演愈烈，國內國外都開啟了新一輪的 AI 價格戰。

國內AI價格激戰：降價、大幅降價、直接免費！

國內互聯網大廠，包括阿裏、字節、百度、騰訊，以及背靠雄厚資本的創業公司，持續釋出 AI 及大模型產品，同時逐步加快了降價的節奏，從降價、大幅降價，到直接免費、立即生效！

事情開始於1元可以購買100萬tokens。

5月6日，私募巨頭幻方量化的AGI（通用人工智慧）的新組織「深度求索（DeepSeek）」開源第二代 MoE 模型 DeepSeek-V2，把價格打到了僅為GPT-4-Turbo的近百分之一。其API的定價為：每百萬tokens輸入1元、輸出2元（32K上下文）。

5月13日，智譜大模型開放平台上線了新價格體系，入門級產品 GLM-3 Turbo 模型呼叫價格下調80%，從5元/百萬tokens降至1元/百萬tokens。調整後，1元可以購買100萬tokens，使用 GLM-3 Turbo 創作一萬條小紅書文案（以350字計）將僅需約1元錢。

大廠也同樣不甘示弱。

5月15日，字節跳動釋出豆包大模型，定價大幅低於行業價格。豆包主力模型在企業市場的定價僅為0.0008元/千tokens，即0.8厘就能處理1500多個漢字，比行業便宜99.3%。

在5月9日釋出通義千問2.5之時，阿裏表示個人使用者可以透過 APP、官網和小程式免費使用通義。而不到兩周後，在5月21日，阿裏通義千問開啟降價。 由此，1元可以購買100萬tokens，被阿裏卷到1元最多可購買200萬tokens。

通義千問 Qwen-Long 的 API 輸入價格大幅下調，從0.02元/千tokens降至0.0005元/千tokens，直降97%。這意味著1元錢可以購買200萬tokens，相當於5本【新華字典】的內容。該模型最高支持1000萬tokens的長文本輸入降價後的價格約為 GPT-4 的1/400。

阿裏的這波降價加限時免費，一定程度上已經超越了前幾次其他廠商的大模型降價。但，這並沒有讓阿裏坐穩價格戰的頭把交椅，甚至屁股都沒坐熱，就被打著「全面免費」的百度趕下。在阿裏宣布如此大幅降價的當日，5月21日晚些時候，百度宣布文心大模型的兩大主力模型將全面免費，立即生效。

之前咬緊的降價潮，被百度再卷一次，迎來了全面免費的階段，國內大模型價格戰的正式打響。

隨後， 僅在第二天，全面免費風頭就歸屬到了卷王騰訊雲。 5月22日，騰訊雲直接「一鍵三連」：正式對外宣布旗下AI程式碼助手全面對外開放，公布了全新大模型升級方案，API 輸入價格大幅下降，混元-lite模型全面免費。

騰訊雲主力模型之一混元-lite 模型，API輸入輸出總長度計劃從目前的4k升級到256k，價格從0.008元/千tokens調整為全面免費；混元-standard API 輸入價格從0.01元/千tokens降至0.0045元/千tokens ，下降55%，API輸出價格從0.01元/千tokens降至0.005元/千tokens，下降50%；混元-standard-256k，具備處理超過38萬字元的超長文本能力，API輸入價格下調至0.015元/千tokens，下降87.5%，API輸出價格下降至0.06元/千tokens，下降50%；最高配置萬億參數模型混元-pro，API 輸入價格從0.1元/千tokens降至0.03元/千tokens，降幅達70％。

騰訊雲表示，以上價格調整自釋出之時立即生效。

國內的 AI 價格戰，在本周打得尤為激烈。不僅模型參數及效能卷起來了，價格更是卷到飛起！從1元可購買100萬個tokens，到最多可買200萬個，再到免費，最後到全面免費。甚至有業內人士笑稱，眼瞅著下一家跟進的廠商可能就得發錢補貼讓客戶用 API 了。

國外AI：紮堆釋出、降本至免費，輝達坐收漁翁之利

在國內降價免費之前，國外已經走過了一輪大模型降價和免費階段。

5月初，谷歌就表示其AI聊天機器人的問答成本在過去一年中銳減了80%。這標誌著谷歌在 AI 領域再次取得了重要突破，透過 Gemini AI 模型和客製AI芯片的技術革新，谷歌有效降低了 AI 搜尋的營運成本。

不僅降本，谷歌還直接免費。一個月前，在4月10日，谷歌最強大模型Gemini 1.5 Pro「全面」對外開放，完全免費。Gemini 1.5 Pro100萬的上下文視窗這次也直接對外開放，可以處理的最長音訊約為11小時，最長視訊則為1小時。谷歌官方給這次免費開放的Gemini 1.5 Pro版本定義為「公開預覽版」，主要面向開發者，可在谷歌AI Studio中獲得API金鑰。這是在 Gemini Ultra 免費試用兩個月之後的又一次大模型免費舉動。

攪動渾水的鯰魚，非 OpenAI 莫屬。偏偏趕在谷歌 I/O 大會同一時間的前一天，在5月13日，OpenAI 推出了一款名為 GPT-4o 的「旗艦級」生成式人工智慧模型，面向所有 ChatGPT 的付費和免費使用者，取消其他所有限制，API 價格降價50%。

OpenAI這波對谷歌的阻擊力度不小。雖然OpenAI宣傳的是「取消所有限制」，但據使用者反饋，也存在每天的使用限制。其免費層的使用者將預設使用GPT-4o，但使用 GPT-4o 發送資訊的數量有限制，這將根據當前的使用情況和需求而變化。不可用時，免費層使用者將切換回GPT-3.5。

第二天，谷歌 I/O 大會以近10個大模型的升級釋出絕地反擊。

谷歌向全球所有開發者推出 Gemini 1.5 Pro 的改進版本，擁有 100 萬個 token 上下文的 Gemini 1.5 Pro 現在可以直接在 Gemini Advanced 中供消費者使用；將 Gemini 1.5 Pro 上下文視窗擴充套件到了 200 萬個 tokens，並以私人預覽版的形式提供給開發人員；比 Gemini 1.5 Pro 更輕量級的 Gemini 1.5 Flash 釋出；釋出可制作「高品質」 1080p 視訊的 Veo 模型和文本生成影像模型 Imagen 3；釋出采用全新架構、27B 大小尺寸的 Gemma 2.0；推出第一個視覺語言開放模型 PaliGemma。

一周後，微軟在 Build 開發者大會上也頻頻出招。僅僅在第一天兩個多小時的演講中，微軟就宣布了50多項更新，包括AI基礎設施、模型產品落地等多方面。

在谷歌預覽具備語音互動和視覺記憶的AI智慧體 Project Astra 後，微軟在會上釋出 Team Copilot 智慧體，作為 Copilot for Microsoft 365 的擴充套件，該智慧體更註重在執行工作任務上，能夠提升整個團隊的工作效率，完成主持會議、跟蹤並安排計畫進展等任務。同時，微軟宣布將 OpenAI 上周更新的ChatGPT-4o接入Azure雲平台，可對外提供API。在垂直領域套用上，微軟還與可汗學院合作為 K-12 教師免費提供人工智慧Agent，並將開發 Phi-3 數學模型。

在國外，無論是行業套用還是基礎模型，國外大模型的市場份額都牢牢被明星創業公司和大廠占據，要麽是 OpenAI、谷歌、Meta 等科技巨頭，要麽是有傳統科技巨頭大手筆投資的 Anthropic、Mistral AI 等明星初創公司。

然而，占據大部份市場份額的AI公司，其盈利能力卻一直不達預期。連 Meta 這樣的巨頭也無法指望立刻從AI中獲利，Meta 在2024年增加了高達100億美元的基礎設施支出，但預計多年內不會從其 AI 產品中賺錢。

那麽， AI 浪潮仍在激烈奔湧下，真正賺錢的是誰？算力巨頭輝達坐收漁翁之利。 在最新公布的財報中，輝達獲得了創紀錄的季度收入。據其釋出截至4月28日的2025財年第一財季報告，各項數據全面超越預期的狀態。

輝達第一季度實作收入260億美元，比去年同期增長262%；凈利潤為148.8億美元，同比增長高達644%。輝達預計，截至7月的本季度營收將達到280億美元，是去年同期的兩倍多，也高於華爾街的預期。

在隨後的電話會議上，財務長科萊特·克雷斯預計，每花費1美元采購輝達人工智慧基礎設施，雲提供商在未來四年內就有機會透過提供算力服務（GAAS）賺取5美元收入。

可見，在算力和數據這開發大模型無法繞過的兩大難點上，占一頭的優勢，輝達就獲利頗豐。

誰在獲益，誰在被裹挾，免費保增長還是收費報成本？

增算力，獲數據，擴市場，這是成為時代 AI 基建的底層邏輯。

目前，算力層面輝達一家獨大。AI模型廠商的眼光就瞄準在了市場、使用者和數據規模上。降價，免費，多效能多產品，即為保增長的獲客之道。

事實上，降價並沒有真的損失多少收入，畢竟大家都沒有輝達賺錢，都沒完全跑通商業模式。啟用下市場，在行業降價潮中及時入場賺個吆喝，促進企業從「免費試用」開始下水，擴大大模型API的呼叫量，有助於早點啟動大模型釋出公司對 AI 進入業務流的嘗試。

過去一年，國內大模型廠商在過去一年也做了一系列探索來降低 AI 套用的門檻，以期擴大大模型的呼叫量，但結果都不及預期，標準化的模型 API 並沒有迎來確定性的增長，不如直接降價、免費來得直接。

降價免費，降低使用門檻，促使更多使用者使用、更多的API呼叫，就能帶來更大市場，獲取更多數據。

數據是AI模型的基礎，AI 模型訓練獲取適合數據的難點和痛點在於：

數據獲取難，實體層等資料來源缺失，套用難展開，采集數據顆粒度不統一，數據難套用；

數據品質差，數據記錄不完整，套用難最佳化，數據記錄不準確，套用難商用；

數據訓練成本高昂。

根據HAI研究所的AI報告，訓練巨型模型的成本呈指數級增長，谷歌 Gemini Ultra 的訓練成本估計為1.91億美元，GPT-4 的訓練成本估計為7800萬美元。

降價和免費，也是獲取更多可篩選訓練優質數據的方式之一。科技博主寶玉表示，現在 AI陷入價格戰了，AI服務商都陷入了免費保增長還是收費保成本的兩難境地。

免費保增長，還是收費保成本？明顯，大廠的選擇是先降低使用門檻，然後逐步實作商業化。可以看到，本次降價中，降得最兇的都是有雲服務的大公司。 「這些雲服務商透過大模型來獲取雲使用者，羊毛出在豬身上，降得起。」 傅盛表示。

想收費保成本的小廠正在這波降價潮中面臨尷尬。大廠和明星創業公司可以隨意降價，但由此引發的市場競爭加劇，普通 AI 大模型創業者就被裹挾其中。

科技巨頭憑借雄厚的財力、廣泛的數據儲存庫和大量的算力基礎設施，在底層模型上可以建立牢固的立足點，明星創業公司背後站著明星投資機構。而初創公司，除非依靠大公司的財力，幾乎沒有能力承擔模型的高訓練成本，也沒有先發優勢，不能跟大廠直接對抗，除非瞄準差異化需求，做垂直細分的賽道，否則很難在裹挾中前進。

目前，行業能形成價格戰的連鎖反應，也由於 當前各大模型的能力放在可用的場景中，尚未拉開差距，使用者可選擇空間大，甚至有免費開源產品可用 。也有質疑聲音稱一些降價的模型本身吞吐量就低，而高效能模型並沒有降價，且還有很多細節條款會讓最終企業用起來沒有宣傳的那麽便宜。

需要註意的是，只提供模型的 API，距離 AI 套用在場景中落地還有很大距離，大部份 AI 套用還需要在一個通用的模型 API 之上，在場景裏餵數據、做微調等來最佳化模型引擎。

若一個通用的模型 API 無法深度適配場景，企業使用者往往還是要自己基於開源模型，用場景數據做專門的深度訓練，並不會接通用的模型 API。無論使用門檻再低，如果與使用者需求不適配，依然換不來增長。

卷價格來的直接，但不如卷精準符合使用者的需求來的實在且長久。

參考連結：

https://mp.weixin.qq.com/s/HA4RtjXvUhOY-sdHXYvUpg

https://baijiahao.baidu.com/s?id=1799742413819805747&wfr=spider&for=pc

https://baijiahao.baidu.com/s?id=1799762991336129582&wfr=spider&for=pc

開發者正在迎接新一輪的技術浪潮變革。由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的 2024 年度「全球軟體研發技術大會」秉承幹貨實料（案例）的內容原則，將於 7 月 4 日-5 日在北京正式舉辦。大會共設定了 12 個大會主題：大模型智慧套用開發、軟體開發智慧化、AI 與 ML 智慧運維、雲原生架構……詳情👉： http://sdcon.com.cn/