据《华尔街日报》报道,人工智能领域的巨头OpenAI与芯片制造商英伟达之间一项价值高达1000亿美元的芯片采购与合作协议,目前已被搁置或面临重大不确定性。这笔潜在的“世纪交易”原本旨在为OpenAI未来数年的AI模型训练...
Read More近日,备受开发者关注的本地大语言模型运行平台LM Studio发布了其0.4.0版本更新。本次更新带来了多项关键性功能升级,核心聚焦于提升生产环境下的部署能力与推理性能。最引人注目的新特性是支持服务器部署模式,这使...
Read More近日,月之暗面(Moonshot AI)在GitHub上正式开源了Kimi Agent SDK,为开发者提供了与Kimi CLI进行程序化交互的官方接口。该SDK是一套多语言库,旨在将Kimi Code智能体运行时能力暴露给应用程序,使开发者能够基于...
Read More近日,GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架,旨在显著优化代码智能体(Coding Agents)在处理复杂软件工程任务时的效率与成本。该框架的核心在于,通过一个轻量级模型动态分析与...
Read More近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...
Read More根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...
Read More埃隆·马斯克旗下的人工智能公司xAI宣布,其名为“Colossus 2”的超级计算机集群已正式投入运行。这一系统被确认为全球首个达到吉瓦(1GW)功率规模的专用人工智能训练集群,标志着AI基础设施竞赛进入了一个新的量级门...
Read More近日,由D2I-ai团队在GitHub上开源的DASD(序列蒸馏)项目,提出了一种创新的模型蒸馏流程,旨在训练出更紧凑、高效的模型以应对复杂的推理任务。该流程整合了温度调度学习与发散感知采样等前沿技术,通过精细化的知...
Read More