Nvidia 近日宣布,其全新的 Vera Rubin 微架構正處于研發階段,計劃于2026年正式推出。該架構下的 Rubin CPX 變體將專注于滿足那些需要處理海量上下文窗口的人工智能工作負載。Nvidia 首席執行官黃仁勛在新聞發布會上表示:“Vera Rubin 平臺將標志著人工智能計算的新飛躍,推出下一代 Rubin GPU 和名為 CPX 的新類別處理器。”
Rubin CPX 特別適用于需要處理超過一百萬個 token 的應用場景,例如復雜的軟件開發和高清晰度視頻生成。根據 Nvidia 的計劃,Vera Rubin NDL144CPX 類 GPU 將于2026年底上市。CPX 模型是針對需要長上下文窗口的應用而特別設計的,能夠提供8exaflops 的人工智能性能、30PF NVFP4的上下文計算能力,以及相較于 Nvidia GB300NVL72系統提升了三倍的指數運算能力。此外,CPX 模型還配備了128GB GDDR7內存、4個編碼器和4個解碼器,專為生成視頻而設計,并提供100TB 的快速內存。
Nvidia 的高管表示,Vera Rubin NDL144CPX 可被視為大型人工智能工廠的一部分。為了支持大規模數據中心的構建,Nvidia 還計劃推出千兆規模的參考設計。這意味著,Nvidia 將與基礎設施公司密切合作,從計算的角度重新設計數據中心,以提供覆蓋建筑、設計、模擬、運營等各個方面的參考設計。
在此次發布前,Nvidia 還公布了最新的 MLPerf 推理測試結果,黑威爾 GPU 在該基準測試中創下了新記錄,超越了 Llama3.1405B 交互模型的基線。此項創新技術被稱為 “解耦服務”,能夠使相同硬件在性能上得到提升,這為已經部署解決方案的企業帶來了額外的收入機會。


產品與服務
聯系站長
關于我們