英伟达发布Rubin CPX GPU,专为超长上下文推理任务打造
talkingdev • 2025-09-10
1861 views
英伟达正式推出全新Rubin CPX GPU,该芯片专为处理超过100万token的超长上下文窗口而设计,标志着人工智能推理基础设施迈向新阶段。采用“分解式推理”架构理念,Rubin CPX针对视频生成、复杂软件开发等长序列上下文任务进行了深度优化,显著提升大模型在连续数据流处理中的性能表现。作为英伟达数据中心战略的重要组成,该芯片预计2026年底上市,将直接助力多模态AI、实时渲染和大型代码生成等前沿应用场景。此次发布进一步巩固了英伟达在AI计算领域的领导地位,其2025年第三季度数据中心业务营收达411亿美元的业绩也印证了市场对高性能推理硬件的迫切需求。
核心要点
- 专为超100万token长上下文优化,提升视频生成与软件开发任务性能
- 采用分解式推理架构,2026年底正式商用
- 延续英伟达数据中心业务增长势头,季度营收达411亿美元