本文來自「 」,當前全球範圍最「頂級」的交換芯片效能是51.2T,主要的套用場景包括:AI大模型訓練場景400G、800G互聯、雲技術超大規模400G介面互聯SPIN+LEAF互聯場景。
相關閱讀:
1、 AI大模型訓練場景400G、800G互聯:128個400G介面交換機,64個800G介面交換機;
2、 雲技術超大規模400G介面互聯場景: 128個400G介面交換機;
目前釋出51.2T交換芯片的廠商只有4家,分別是: 博通、思科、 Marvell 、輝達,以下是按照各家芯片的釋出時間排序。
1、輝達Spectrum-4
2022年6月,輝達隆重釋出了新一代乙太網路平台 NVIDIA Spectrum-4。該平台由 NVIDIA Spectrum-4 交換機系列、ConnectX-7 智慧網卡、NVIDIA BlueField-3 DPU 和 DOCA 數據中心基礎設施軟體組成,能夠大幅加速大規模雲原生套用。
作為全球第一個 400Gbps 端到端網路平台,NVIDIA Spectrum-4 的單芯片交換吞吐量達到了51.2Tbps,比上一代產品高出 4 倍,能夠為規模大數據中心基礎設施提供超高的網路效能和強大的安全性。由 Spectrum-4 加持的 SN5000 交換機,最高可以支持 128 個 400GbE 埠或 64 個 800GbE 埠。
為了實作更好的 AI 智慧管理運維,NVIDIA Spectrum-4 還最佳化了 RoCE 網路架構,並提供 自適應路由 (Adaptive Routing)和增強擁塞控制。其加密頻寬不但達到了令人驚嘆的12.8Tbps,而且還可以支持硬體級 MACsec 和 VXLANsec。這樣一來,搭載了 NVIDIA Spectrum-4 的數據中心不僅各種套用跑得更加暢快,而且在網路與安全效能上也有了更加可靠的保障。
值得一提的是,考慮到不同企業的實際情況,NVIDIA 還為使用者準備了全系列的智慧網卡,實作了從 10G 到 400G 速率的全覆蓋(10/25/40/50/100/200/400G),並且提供了包括 Cumulus Linux、 Mellanox 系列產品在內的豐富網路 OS、軟體及工具。輝達收購 Mellanox 和 Cumulus Networks 所產生的巨大價值,也在 NVIDIA Spectrum-4 身上得到了極佳的展現。
2、 博通Tomahawk 5
2022年8月,博通釋出了業內首款商用51.2T容量的交換芯片Tomahawk 5,采用5nm制程,由台積電代工生產。采用Monolithic,裸die封裝,每100Gbps功耗小於1W。
Tomahawk 5在支持傳統可插拔光模組的基礎上,更進一步相容了CPO封裝。與傳統的可插拔光模組相比,CPO封裝能夠降低高達50%的功耗,這一顯著優勢使得數據中心在追求高效能的同時,也能實作更低的能耗。此外,Tomahawk 5還支持多種配置的交換機,包括64埠800Gbps、128埠400Gbps和256埠200Gbps,其效能是前代產品TomaHawk 4的兩倍,充分滿足了數據中心不斷增長的網路需求。
在Tomahawk 5包含512個SerDes以每秒100Gb的速度執行,共同構建了高達51.2Tb/秒的頻寬。這一強大的效能使得Tomahawk 5能夠輕松應對數據中心日益增長的數據傳輸和處理壓力。
除了卓越的效能表現外,Tomahawk 5還針對超大規模數據中心和雲構建者的需求,提供了豐富的功能特性。其中包括 網路虛擬化 和分段技術,這些技術能夠幫助數據中心實作更靈活的網路架構和更高效的資源管理。此外,Tomahawk 5還支持單鍊結VxLAN路由和橋接功能,為數據中心提供了更為強大的網路擴充套件能力和更高的傳輸效率。而其獨特的「認知路由」功能則能夠智慧地避免網路擁塞,從而縮短作業完成時間,提升整體執行效率。
3 、 Marvell Teralynx 10
2023年3月Marvell推出了用於 800 Gb/秒交換機的 51.2 T效能的 Teralynx 10交換芯片。 據Marvell介紹,Teralynx 10 是更大、更胖(fat)的交換機 ASIC,是一款專為 800GbE 時代設計的 51.2T 可編程 5nm交換機芯片,旨在解決營運商頻寬爆炸的問題,同時滿足嚴格的功耗和成本要求。它可適用於下一代數據中心網路中的 leaf 和 spine 套用,以及 AI / ML 和高效能計算 (HPC) 結構。
Teralynx 10 具有 512 長距離 (LR) 112G SerDes。 提供全面的數據中心功能集,包括 IP 轉發、隧道、豐富的 QoS 和強大的 RDMA。它還提供可變的靈活轉發,使營運商能夠隨著網路需求的發展對新的封包轉發協定進行編程,而不會影響吞吐量、延遲或功耗。
Teralynx 10采用了超低延遲結構,相容 Teralynx 軟體,而且還支持 Teralynx Flashlight 高級遙測技術,包括 P4 帶內網路遙測 (INT)。
Teralynx 10單芯片尺寸為93X93mm,I/O數量為8855,在PCB設計部份,板材使用業界最新Low Dk/Df材料,PCB結構設計上采用12+12+12的結構設計,其中中間12層均采用2OZ銅箔,以滿足芯片供電需求。
值得一提的是,早期 Marvell主要生產面向園區網場景的中低端交換芯片,而 在2021年Marvell收購了雲數據中心商業交換機芯片供應商Innovium。Innovium於 2019 年 9 月推出了 Teralynx 5 芯片,速度範圍從 1 Tb/秒到 6.4 Tb/秒,隨後推出的Teralynx 7 直接與博通的「Tomahawk 4」StrataXGS對標, 2020 年 5 月,Innovium推出了 Teralynx 8 交換芯片,針對超大規模器和雲構建器的葉、脊和數據中心互連 (DCI) 用例,使用 100 Gb/秒 PAM-4 編碼跨 8 Tb/秒到 25.6 Tb/秒在給定頻寬下建立乙太網路埠。
4 、 思科Silicon One G200
2023年6月思科高調釋出了其51.2T芯片G200以及其對應的25.6T芯片G202,針對AI/ML網路做了大量特性最佳化,正式開啟了與Tomahawk 5/ Jericho 3/Spectrum 4在AI高效能網路領域的競爭。
Cisco Silicon One G200 是一款 5 奈米、51.2 Tbps、512 x 112 Gbps 的SerDes裝置,具有可編程、確定性、低延遲等特性,且具備高級可見性和控制能力。Cisco Silicon One G200 提供了統一架構的優勢,專註於基於乙太網路的增強型AI/ML和網路規模主幹部署。
G200 展示了業界首款完全客製的 P4 可編程並列封包處理器,每秒能夠啟動超過 4350 億次尋找。它以全速提供 SRv6 Micro-SID (uSID) 等高級功能,並支持復雜流程的完整執行到完成處理。這種獨特的封包處理架構確保了靈活性以及確定性的低延遲和功耗。
G200 擁有 512 個乙太網路 MAC地址,比博通 Tomahawk 5多一倍的MAC地址( Tomahawk 最多有 256 個 MAC 地址),支持100G及以下介面更大規模的組網;
思科從1999年收購半導體公司StratumOne Communications,之後透過多次收購半導體相關公司,積累了豐富的人才和技術資源。2019年,思科掀開了公司自研芯片的轟轟烈烈新序幕,並於當年12月首次推出了Silicon One芯片架構,當時稱其目標是為「未來網路奠定通用基礎」。
來源:牛逼的IT
https://mp.weixin.qq.com/s/hrK8pYrBdLBzrnPU5plJig
GPU技術篇:
更新提醒:「 」和「 」已經更新釋出,還沒有獲取的讀者,請在點選「原文連結」在微店留言獲取 ( PDF閱讀版本 )。
轉載申明:轉載 本號文章請 註明作者 和 來源 ,本號釋出文章若存在版權等問題,請留言聯系處理,謝謝。
推薦閱讀
更多 架構相關技術 知識總結請參考「 架構師全店鋪技術資料打包 (全) 」相關電子書( 41本 技術資料打包匯總詳情 可透過「 閱讀原文 」獲取)。
全店內容持續更新,現下單「 架構師技術全店資料打包匯總(全) 」一起發送「 」 和「 」 pdf及ppt版本 ,後續可享 全店 內容更新「 免費 」贈閱,價格僅收 249 元(原總價 439 元)。
溫馨提示:
掃描 二維碼 關註公眾號,點選 閱讀原文 連結 獲取 「 架構師技術全店資料打包匯總(全) 」 電子書資料詳情 。