当地时间11月17日,Arm与NVIDIA联合宣布,基于Arm架构的Neoverse系列服务器CPU将能够通过NVIDIA的NVLink Fusion技术与AI加速器实现高效集成。这一技术突破标志着两大芯片巨头在异构计算领域迈出关键一步,未来企业可...
Read More加州大学伯克利分校研究团队开发的进化编码智能体OpenEvolve,成功将大型语言模型转化为自主代码优化器,在混合专家模型负载平衡任务中取得重大突破。该系统通过模拟自然选择机制,使LLM能够自主探索算法空间,最终...
Read MoreBasekick Labs团队在GitHub开源的高性能时序数据仓库Arc引发技术社区关注。该项目基于DuckDB列式存储引擎、Parquet文件格式和MinIO对象存储构建,在原生部署环境下实现了每秒189万条记录的写入性能,为物联网、金融...
Read MoreLinux内核社区近日迎来一项重大技术进展,开发者提交了名为“多内核架构支持(Multikernel Architecture Support)”的补丁集。该提案旨在通过多内核设计解决传统单内核架构在众核处理器时代面临的可扩展性瓶颈问题。...
Read MoreWebAssembly (Wasm) 3.0 版本已完成开发并正式发布,这是自2019年Wasm 1.0成为W3C标准以来最具里程碑意义的更新。新版本引入了64位地址空间支持,突破了4GB内存限制,为大型应用和高性能计算场景提供底层支持。同时...
Read More根据The Information记者Anissa Gardizy的报道,英伟达正在对其云端服务DGX Cloud进行重大战略调整,将该平台从原本面向外部客户的商业化服务转变为 primarily internal R&D use(主要内部研发用途)。DGX Cloud最初...
Read More最新技术基准测试表明,云端分布式训练中基础设施配置对大型语言模型(LLM)训练效率具有决定性影响。专业分析显示,网络架构与存储方案的差异可能导致训练性能出现高达6-7倍的波动,直接关联数百万美元的计算成本。...
Read More英伟达正式推出全新Rubin CPX GPU,该芯片专为处理超过100万token的超长上下文窗口而设计,标志着人工智能推理基础设施迈向新阶段。采用“分解式推理”架构理念,Rubin CPX针对视频生成、复杂软件开发等长序列上下文任...
Read More