Nvidia的相关内容 - 漫话开发者

2025-12-08 talkingdev

开源|NVIDIA发布cuTile Python：面向GPU的下一代并行编程模型

NVIDIA近日在GitHub上开源了cuTile Python项目，这是一个专为NVIDIA GPU设计的新型并行编程模型。cuTile的核心目标在于简化高性能并行内核的编写过程，它能够自动利用GPU底层的高级硬件特性，同时确保代码在不同代际...

2025-12-04 talkingdev

英伟达在混合专家模型（Mixture-of-Experts，MoE）的扩展性能方面取得了重大突破。根据官方公布的数据，其最新的GB200 Blackwell NVL72服务器配置，在MoE AI模型上的性能表现相比上一代的Hopper HGX200架构实现了高...

2025-12-03 talkingdev

亚马逊云科技（AWS）在自研AI芯片领域持续发力，近日正式发布了其第三代AI训练专用芯片——Trainium3。这款芯片在性能规格上表现亮眼，标志着AWS在降低AI计算成本、提供多元化算力解决方案方面迈出了重要一步。值得注...

2025-12-02 talkingdev

在NeurIPS 2024大会上，NVIDIA发布了一系列面向数字与物理世界AI开发的新工具，其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...

2025-11-26 talkingdev

近日，AI代码审查平台Greptile宣布在真实场景测试中展现出显著技术优势。该平台采用基于图结构的代码库上下文理解技术，能够深度解析项目架构关联，实现精准的缺陷追踪。测试数据显示，在50个真实世界软件缺陷的检测...

2025-11-18 talkingdev

当地时间11月17日，Arm与NVIDIA联合宣布，基于Arm架构的Neoverse系列服务器CPU将能够通过NVIDIA的NVLink Fusion技术与AI加速器实现高效集成。这一技术突破标志着两大芯片巨头在异构计算领域迈出关键一步，未来企业可...

2025-10-20 talkingdev

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破，通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片，降幅达82%。该系统目前已在阿里云模型市场完成beta测试，其核心技...

2025-10-14 talkingdev

业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相，该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡：吞吐量（每GPU每秒处理令牌数）...