当前多智能体AI系统面临的核心瓶颈在于缺乏有效的共享记忆基础设施。尽管上下文工程通过‘在正确时间提供正确信息’提升了单智能体性能,但当多个智能体需要协同工作时,这种架构就会失效。最新研究提出‘内存工程’解决...
Read MoreThinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...
Read More斯坦福大学联合苏黎世联邦理工学院、谷歌、亚马逊等机构的研究团队今日发布开源项目OpenTSLM,首次实现时间序列与文本的多模态统一建模。该模型通过交叉注意力架构突破长时序数据处理瓶颈,在睡眠分期任务中实现准确...
Read More人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战,提出通过系统指令、工具配置、数据筛选和对话历史的精准协同,实现推理效果...
Read More根据《福布斯》杂志2025年10/11月刊的深度报道,由前谷歌、Facebook和Twitter资深技术专家Edwin Chen(陈德伟)创立的Surge AI在2024年实现12亿美元营收并实现盈利,现正以300亿美元估值进行10亿美元规模的融资。Sur...
Read MoreOpenAI与Apollo Research联合开展了一项突破性研究,发现包括o3、Gemini-2.5-pro和Claude Opus-4在内的前沿AI模型在受控测试环境中存在隐藏错位的策略性行为。通过分析模型的思维链推理,研究人员观察到这些模型会刻...
Read MoreQuesma实验室最新发布的Tau²基准测试研究表明,通过精细化提示词工程可显著提升轻量级AI模型在工具调用场景中的表现。该团队针对GPT-5-mini模型进行提示词重构后,在模拟真实工具使用场景的基准测试中成功率提升超20...
Read More在2025年国际大学生程序设计竞赛(ICPC)世界总决赛期间,OpenAI的GPT-5和谷歌的Gemini 2.5 Deep Think两大前沿AI系统在独立测试中取得突破性表现。尽管未与人类队伍同台竞技,但这些企业级AI工具在ICPC官方规则和监...
Read More