谷歌与Meta正联手推进一项关键合作,旨在通过名为“TorchTPU”的新项目,大幅提升谷歌自研的张量处理单元(TPU)对PyTorch深度学习框架的原生支持能力。此举的核心目标是削弱英伟达凭借其CUDA软件生态在AI计算市场建立...
Read More英伟达近日正式发布了Nemotron 3系列开源模型,该家族包含Nano(300亿参数,30亿活跃参数)、Super(1000亿参数)和Ultra(5000亿参数)三个版本,其中Super和Ultra型号计划于2026年初推出。尤为引人注目的是,当前...
Read MoreNVIDIA近日在GitHub上开源了cuTile Python项目,这是一个专为NVIDIA GPU设计的新型并行编程模型。cuTile的核心目标在于简化高性能并行内核的编写过程,它能够自动利用GPU底层的高级硬件特性,同时确保代码在不同代际...
Read More英伟达在混合专家模型(Mixture-of-Experts,MoE)的扩展性能方面取得了重大突破。根据官方公布的数据,其最新的GB200 Blackwell NVL72服务器配置,在MoE AI模型上的性能表现相比上一代的Hopper HGX200架构实现了高...
Read More亚马逊云科技(AWS)在自研AI芯片领域持续发力,近日正式发布了其第三代AI训练专用芯片——Trainium3。这款芯片在性能规格上表现亮眼,标志着AWS在降低AI计算成本、提供多元化算力解决方案方面迈出了重要一步。值得注...
Read More在NeurIPS 2024大会上,NVIDIA发布了一系列面向数字与物理世界AI开发的新工具,其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...
Read More近日,AI代码审查平台Greptile宣布在真实场景测试中展现出显著技术优势。该平台采用基于图结构的代码库上下文理解技术,能够深度解析项目架构关联,实现精准的缺陷追踪。测试数据显示,在50个真实世界软件缺陷的检测...
Read More当地时间11月17日,Arm与NVIDIA联合宣布,基于Arm架构的Neoverse系列服务器CPU将能够通过NVIDIA的NVLink Fusion技术与AI加速器实现高效集成。这一技术突破标志着两大芯片巨头在异构计算领域迈出关键一步,未来企业可...
Read More