近日,GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架,旨在显著优化代码智能体(Coding Agents)在处理复杂软件工程任务时的效率与成本。该框架的核心在于,通过一个轻量级模型动态分析与...
Read More近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...
Read More根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...
Read More埃隆·马斯克旗下的人工智能公司xAI宣布,其名为“Colossus 2”的超级计算机集群已正式投入运行。这一系统被确认为全球首个达到吉瓦(1GW)功率规模的专用人工智能训练集群,标志着AI基础设施竞赛进入了一个新的量级门...
Read More近日,由D2I-ai团队在GitHub上开源的DASD(序列蒸馏)项目,提出了一种创新的模型蒸馏流程,旨在训练出更紧凑、高效的模型以应对复杂的推理任务。该流程整合了温度调度学习与发散感知采样等前沿技术,通过精细化的知...
Read MoreAnthropic公司近期为其Claude Code开发工具推出了一项名为“MCP工具搜索”的重要功能更新。该功能的核心创新在于,它允许Claude Code根据实际需求,动态地将模型上下文协议工具加载到工作上下文中,而非传统的一次性全...
Read More近日,GitHub上开源了一个名为Sopro的轻量级文本转语音(TTS)模型,其核心亮点在于仅包含1.69亿参数,却实现了零样本语音克隆能力,并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布,迅速在技术社区引...
Read More英伟达创始人兼CEO黄仁勋近日宣布,其下一代AI芯片平台Vera Rubin已进入“全面生产”阶段。根据英伟达官方披露的技术信息,Vera Rubin平台在训练特定大型语言模型时,所需芯片数量可大幅减少至当前旗舰Blackwell架构平...
Read More