英伟达在混合专家模型(Mixture-of-Experts,MoE)的扩展性能方面取得了重大突破。根据官方公布的数据,其最新的GB200 Blackwell NVL72服务器配置,在MoE AI模型上的性能表现相比上一代的Hopper HGX200架构实现了高...
Read More亚马逊云科技(AWS)在自研AI芯片领域持续发力,近日正式发布了其第三代AI训练专用芯片——Trainium3。这款芯片在性能规格上表现亮眼,标志着AWS在降低AI计算成本、提供多元化算力解决方案方面迈出了重要一步。值得注...
Read More在NeurIPS 2024大会上,NVIDIA发布了一系列面向数字与物理世界AI开发的新工具,其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...
Read More近日,AI代码审查平台Greptile宣布在真实场景测试中展现出显著技术优势。该平台采用基于图结构的代码库上下文理解技术,能够深度解析项目架构关联,实现精准的缺陷追踪。测试数据显示,在50个真实世界软件缺陷的检测...
Read More当地时间11月17日,Arm与NVIDIA联合宣布,基于Arm架构的Neoverse系列服务器CPU将能够通过NVIDIA的NVLink Fusion技术与AI加速器实现高效集成。这一技术突破标志着两大芯片巨头在异构计算领域迈出关键一步,未来企业可...
Read More阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破,通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片,降幅达82%。该系统目前已在阿里云模型市场完成beta测试,其核心技...
Read More业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相,该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡:吞吐量(每GPU每秒处理令牌数)...
Read More据彭博社深度报道,OpenAI与英伟达、AMD等科技巨头正在通过复杂的循环交易网络助推人工智能市场估值突破万亿美元。这种企业间相互投资、交叉采购的商业模式引发行业担忧,被认为可能人为制造市场泡沫。具体表现为:A...
Read More