本文來自「 」。3 月 18 日, NVIDIA GTC 2024 召開,輝達 CEO 黃仁勛釋出了 B200 GPU :整合 2080 億個晶體管,采用台積電 N4P 制程,為雙芯片架構,兩塊小芯片間互聯速度高達 10TBps ;配備 192GB HBM3E ,儲存 帶 寬 8TB/s , AI 算 力 達 到 20peta FLOPS (FP4 精 度 ) , 而 Hopper 是 4peta FLOPS 。
文章來源:
1、全球 AI 芯片:輝達 B200 FP4 效能約為 Hopper 的 5 倍, AMD/Intel 加速產品升級
( 1 )輝達: B200 於 GTC2024 推出, FP4 效能約為 Hopper 的 5 倍
B200 預計 2024 年晚些推出、售價 3-4 萬美元, H200 預期 Q2 上市。 據財聯社, B200 GPU 售價或為 3-4 萬美元,輝達稱,包括亞馬遜雲科技、戴爾科技、谷歌、 Meta 、微軟、 OpenAI 、甲骨文、特斯拉和 xAI 將計劃采用 Blackwell 產品。
1 )機器人: 推出了 GR00T 計畫,為人形機器人提供了通 用基礎模型,也對 Isaac 機器人平台進行重大更新; 2 )自動駕駛: 集中式車載計算平台 DRIVE Thor 將搭載專為 Transformer 、大語言模型( LLM )和生成式 AI 工作負載而打造的全新 Blackwell 架構; 3 )推理微服務 NIM : 輝達提供預訓練好的 AI 模型並開放 API (應用程式介面),再由行業客戶開發套用,以簡化企業自己開發生成式 AI 套用的成本,每個 GPU 每年收取費用 4500 美元。
( 2 ) AMD : MI 系列產品加速叠代,完成全產品系列 AI 效能組合
AMD 將推出換用 HBM3e 的 AI 加速器 MI300 改版,以低價與競品輝達 B100 競爭,其記憶體在速度上進一步提升;而下一代 Instinct MI400 加速器將於 2025 年釋出,包含 Mercury / 維納斯 / Earth 三個代號、 X / A / C 三種變體類別,可實作從雲端到邊緣、 PC 和智慧終端裝置的新體驗和突破性 AI 功能。
MI300 中國特供版芯片 MI309 或推出,但仍需關註出口禁令限制情況。 據 3 月 5 日鈦媒體, AMD 即將向中國客戶銷售 MI300 系列「中國特供版」 AI 芯片,被稱為 MI309 ,但是,美國政府目前不同意這款特供芯片出口到中國。截至 3 月 5 日, AMD 、商務部拒絕發表評論,尚不清楚 AMD 是否依然在申請授權。
( 3 ) Intel : Gaudi 3 預期於 2024Q3 上市, Falcon Shores 預期 2025 年釋出
英特爾將 Gaudi 3 和 Falcon Shores 定位為後續產品,兩者都屬於同一條產品 線。 據超能網, Gaudi 3 將改用 5nm 工藝制造,已進入實驗室進行驗證, Gaudi3 計劃在 2024 年第三季度全面上市。硬體方面, Gaudi 3 加速器將采用與 Gaudi2 相同的高效能架構,不過計算能力是其 4 倍,網路頻寬是其 2 倍, HBM 記憶體頻寬是其 1.5 倍。 Falcon Shores 是數據中心 GPU ,采用多芯片模組化設計,同時會加入「可延伸的 I/O 設計」, Falcon Shores 計劃 2025 年釋出。
英特爾設立獨立 FPGA 業務部門,新工廠極大提振 AI 芯片產能。 據 3 月 1 日 IT 之家,英特爾公司宣布以獨立發展模式,正式成立 FPGA90 (現場可編程門陣列)公司 Altera ,並推出了包括 Agilex 9 、 Agilex 7 F 系列和 I 系列、 Agilex 5 和 Agilex 3 等產品。其中, Agilex 5 現已廣泛上市,是唯一註入人工智慧的 FPGA 結構,每瓦效能是同類產品的 1.6 倍,面向嵌入式和邊緣套用。
2、國產 GPU :輝達將華為定義為公司競爭對手,景嘉微推出景宏系列 AI 芯片
海思 5nm 麒麟處理器在東莞、北京等地的驗證情況良好, 預計 8 月開始大規模交付;根據快科技,在輝達近日向美國證券交易委員送出的正式檔中,首次將華為認定為人工智慧芯片等多個領域的主要競爭對手。 3 月 14 日,景嘉微推出景宏系列,是面向 AI 訓練、 AI 推理、科學計算等套用領 域的高效能智算模組及整機產品。
3、GPU 產業鏈:台積電 3nm/4nm 產能滿載, Meta 新建集群含超 4.9 萬塊 H100
AI 芯片帶動先進封裝,輝達下一代芯 片將采用台積電 3/4nm 制程,強勁訂單推動先進制程產能滿載、營收淡季不淡。
據 3 月 13 日財聯社,台積電 3 月對 CoWoS 裝置廠再次啟動新一波追單,交機 時間預計為今年四季度。原本預計 2024 年底台積電 CoWoS 月產能將達到 3.2 萬 ~3.5 萬片,如今預期或超過 4 萬片。
根據 TrendForce 集邦咨詢最新預估,以 2024 年全球主要雲端服務業者( CSP )對高端 AI 伺服器需求量觀察,預估美系四大 CSP 業者包括 Microsoft 、 Google 、 AWS 、 Meta 各家占全球需求比重分別達 20.2% 、 16.6% 、 16% 及 10.8% ,合計將超 6 成。其中,又以搭載 NVIDIA GPU 的 AI 伺服器機種占大宗。
關於CPU、伺服器和儲存詳細技術,請參考「 」,「 」、「 」、「 」、「 」、「 」、「 」、「 」等等。
下載連結:
走進芯時代(76):HBM叠代,3D混合鍵合成裝置材料發力點
走進芯時代(75):「半導核心材料」:萬丈高樓材料起,夯實中國「芯」地基」
走進芯時代(74):以芯助先進演算法,以算驅萬物智慧
走進芯時代(60):AI算力GPU,AI產業化再加速,智慧大時代已開啟
走進芯時代(58):高效能模擬替代漸入深水區,工業汽車重點突破
走進芯時代(57):算力大時代,處理器SOC廠商綜合對比
走進芯時代(49):「AI芯片」,AI領強算力時代,GPU啟新場景落地
走進芯時代(46):「新能源芯」,乘碳中和之風,基礎元件騰飛
走進芯時代(43):顯示驅動芯—面板國產化最後一公裏
走進芯時代(40):半導體裝置,再迎黃金時代
轉載申明:轉載 本號文章請 註明作者 和 來源 ,本號釋出文章若存在版權等問題,請留言聯系處理,謝謝。
推薦閱讀
更多 架構相關技術 知識總結請參考「 架構師全店鋪技術資料打包 (全) 」相關電子書( 41本 技術資料打包匯總詳情 可透過「 閱讀原文 」獲取)。
全店內容持續更新,現下單「 架構師技術全店資料打包匯總(全) 」一起發送「 」 和「 」 pdf及ppt版本 ,後續可享 全店 內容更新「 免費 」贈閱,價格僅收 249 元(原總價 399 元)。
溫馨提示:
掃描 二維碼 關註公眾號,點選 閱讀原文 連結 獲取 「 架構師技術全店資料打包匯總(全) 」 電子書資料詳情 。