本文来自「 」。3 月 18 日, NVIDIA GTC 2024 召开,英伟达 CEO 黄仁勋发布了 B200 GPU :集成 2080 亿个晶体管,采用台积电 N4P 制程,为双芯片架构,两块小芯片间互联速度高达 10TBps ;配备 192GB HBM3E ,存储 带 宽 8TB/s , AI 算 力 达 到 20peta FLOPS (FP4 精 度 ) , 而 Hopper 是 4peta FLOPS 。
文章来源:
1、全球 AI 芯片:英伟达 B200 FP4 性能约为 Hopper 的 5 倍, AMD/Intel 加速产品升级
( 1 )英伟达: B200 于 GTC2024 推出, FP4 性能约为 Hopper 的 5 倍
B200 预计 2024 年晚些推出、售价 3-4 万美元, H200 预期 Q2 上市。 据财联社, B200 GPU 售价或为 3-4 万美元,英伟达称,包括亚马逊云科技、戴尔科技、谷歌、 Meta 、微软、 OpenAI 、甲骨文、特斯拉和 xAI 将计划采用 Blackwell 产品。
1 )机器人: 推出了 GR00T 项目,为人形机器人提供了通 用基础模型,也对 Isaac 机器人平台进行重大更新; 2 )自动驾驶: 集中式车载计算平台 DRIVE Thor 将搭载专为 Transformer 、大语言模型( LLM )和生成式 AI 工作负载而打造的全新 Blackwell 架构; 3 )推理微服务 NIM : 英伟达提供预训练好的 AI 模型并开放 API (应用程序接口),再由行业客户开发应用,以简化企业自己开发生成式 AI 应用的成本,每个 GPU 每年收取费用 4500 美元。
( 2 ) AMD : MI 系列产品加速迭代,完成全产品系列 AI 效能组合
AMD 将推出换用 HBM3e 的 AI 加速器 MI300 改版,以低价与竞品英伟达 B100 竞争,其内存在速度上进一步提升;而下一代 Instinct MI400 加速器将于 2025 年发布,包含 Mercury / Venus / Earth 三个代号、 X / A / C 三种变体类别,可实现从云端到边缘、 PC 和智能终端设备的新体验和突破性 AI 功能。
MI300 中国特供版芯片 MI309 或推出,但仍需关注出口禁令限制情况。 据 3 月 5 日钛媒体, AMD 即将向中国客户销售 MI300 系列「中国特供版」 AI 芯片,被称为 MI309 ,但是,美国政府目前不同意这款特供芯片出口到中国。截至 3 月 5 日, AMD 、商务部拒绝发表评论,尚不清楚 AMD 是否依然在申请许可。
( 3 ) Intel : Gaudi 3 预期于 2024Q3 上市, Falcon Shores 预期 2025 年发布
英特尔将 Gaudi 3 和 Falcon Shores 定位为后续产品,两者都属于同一条产品 线。 据超能网, Gaudi 3 将改用 5nm 工艺制造,已进入实验室进行验证, Gaudi3 计划在 2024 年第三季度全面上市。硬件方面, Gaudi 3 加速器将采用与 Gaudi2 相同的高性能架构,不过计算能力是其 4 倍,网络带宽是其 2 倍, HBM 内存带宽是其 1.5 倍。 Falcon Shores 是数据中心 GPU ,采用多芯片模块化设计,同时会加入「可扩展的 I/O 设计」, Falcon Shores 计划 2025 年发布。
英特尔设立独立 FPGA 业务部门,新工厂极大提振 AI 芯片产能。 据 3 月 1 日 IT 之家,英特尔公司宣布以独立发展模式,正式成立 FPGA90 (现场可编程门阵列)公司 Altera ,并推出了包括 Agilex 9 、 Agilex 7 F 系列和 I 系列、 Agilex 5 和 Agilex 3 等产品。其中, Agilex 5 现已广泛上市,是唯一注入人工智能的 FPGA 结构,每瓦性能是同类产品的 1.6 倍,面向嵌入式和边缘应用。
2、国产 GPU :英伟达将华为定义为公司竞争对手,景嘉微推出景宏系列 AI 芯片
海思 5nm 麒麟处理器在东莞、北京等地的验证情况良好, 预计 8 月开始大规模交付;根据快科技,在英伟达近日向美国证券交易委员提交的正式文件中,首次将华为认定为人工智能芯片等多个领域的主要竞争对手。 3 月 14 日,景嘉微推出景宏系列,是面向 AI 训练、 AI 推理、科学计算等应用领 域的高性能智算模块及整机产品。
3、GPU 产业链:台积电 3nm/4nm 产能满载, Meta 新建集群含超 4.9 万块 H100
AI 芯片带动先进封装,英伟达下一代芯 片将采用台积电 3/4nm 制程,强劲订单推动先进制程产能满载、营收淡季不淡。
据 3 月 13 日财联社,台积电 3 月对 CoWoS 设备厂再次启动新一波追单,交机 时间预计为今年四季度。原本预计 2024 年底台积电 CoWoS 月产能将达到 3.2 万 ~3.5 万片,如今预期或超过 4 万片。
根据 TrendForce 集邦咨询最新预估,以 2024 年全球主要云端服务业者( CSP )对高端 AI 服务器需求量观察,预估美系四大 CSP 业者包括 Microsoft 、 Google 、 AWS 、 Meta 各家占全球需求比重分别达 20.2% 、 16.6% 、 16% 及 10.8% ,合计将超 6 成。其中,又以搭载 NVIDIA GPU 的 AI 服务器机种占大宗。
关于CPU、服务器和存储详细技术,请参考「 」,「 」、「 」、「 」、「 」、「 」、「 」、「 」等等。
下载链接:
走进芯时代(76):HBM迭代,3D混合键合成设备材料发力点
走进芯时代(75):「半导核心材料」:万丈高楼材料起,夯实中国「芯」地基」
走进芯时代(74):以芯助先进算法,以算驱万物智能
走进芯时代(60):AI算力GPU,AI产业化再加速,智能大时代已开启
走进芯时代(58):高性能模拟替代渐入深水区,工业汽车重点突破
走进芯时代(57):算力大时代,处理器SOC厂商综合对比
走进芯时代(49):「AI芯片」,AI领强算力时代,GPU启新场景落地
走进芯时代(46):「新能源芯」,乘碳中和之风,基础元件腾飞
走进芯时代(43):显示驱动芯—面板国产化最后一公里
走进芯时代(40):半导体设备,再迎黄金时代
转载申明:转载 本号文章请 注明作者 和 来源 ,本号发布文章若存在版权等问题,请留言联系处理,谢谢。
推荐阅读
更多 架构相关技术 知识总结请参考「 架构师全店铺技术资料打包 (全) 」相关电子书( 41本 技术资料打包汇总详情 可通过「 阅读原文 」获取)。
全店内容持续更新,现下单「 架构师技术全店资料打包汇总(全) 」一起发送「 」 和「 」 pdf及ppt版本 ,后续可享 全店 内容更新「 免费 」赠阅,价格仅收 249 元(原总价 399 元)。
温馨提示:
扫描 二维码 关注公众号,点击 阅读原文 链接 获取 「 架构师技术全店资料打包汇总(全) 」 电子书资料详情 。