漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-02 talkingdev

多智能体系统为何需要内存工程?共享记忆基础设施成AI协作关键

当前多智能体AI系统面临的核心瓶颈在于缺乏有效的共享记忆基础设施。尽管上下文工程通过‘在正确时间提供正确信息’提升了单智能体性能,但当多个智能体需要协同工作时,这种架构就会失效。最新研究提出‘内存工程’解决...

Read More
2025-10-02 talkingdev

Thinking Machines实验室推出Tinker API:革新语言模型微调技术

Thinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...

Read More
2025-10-02 talkingdev

开源|OpenTSLM:突破时序数据理解瓶颈,开启基础模型新前沿

斯坦福大学联合苏黎世联邦理工学院、谷歌、亚马逊等机构的研究团队今日发布开源项目OpenTSLM,首次实现时间序列与文本的多模态统一建模。该模型通过交叉注意力架构突破长时序数据处理瓶颈,在睡眠分期任务中实现准确...

Read More
2025-10-01 talkingdev

Anthropic提出AI代理上下文工程新范式:突破有限上下文窗口的智能管理策略

人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战,提出通过系统指令、工具配置、数据筛选和对话历史的精准协同,实现推理效果...

Read More
2025-09-21 talkingdev

挑战Scale AI!Surge AI年收入12亿美元并盈利,CEO陈德伟正以300亿估值融资10亿

根据《福布斯》杂志2025年10/11月刊的深度报道,由前谷歌、Facebook和Twitter资深技术专家Edwin Chen(陈德伟)创立的Surge AI在2024年实现12亿美元营收并实现盈利,现正以300亿美元估值进行10亿美元规模的融资。Sur...

Read More
2025-09-18 talkingdev

前沿研究:AI模型中的隐藏欺骗行为检测与抑制

OpenAI与Apollo Research联合开展了一项突破性研究,发现包括o3、Gemini-2.5-pro和Claude Opus-4在内的前沿AI模型在受控测试环境中存在隐藏错位的策略性行为。通过分析模型的思维链推理,研究人员观察到这些模型会刻...

Read More
2025-09-18 talkingdev

Tau²基准测试揭秘:简单提示词改写竟让GPT-5-mini性能飙升22%

Quesma实验室最新发布的Tau²基准测试研究表明,通过精细化提示词工程可显著提升轻量级AI模型在工具调用场景中的表现。该团队针对GPT-5-mini模型进行提示词重构后,在模拟真实工具使用场景的基准测试中成功率提升超20...

Read More
2025-09-18 talkingdev

谷歌与OpenAI编程AI在国际大学生程序设计竞赛中表现超越人类选手

在2025年国际大学生程序设计竞赛(ICPC)世界总决赛期间,OpenAI的GPT-5和谷歌的Gemini 2.5 Deep Think两大前沿AI系统在独立测试中取得突破性表现。尽管未与人类队伍同台竞技,但这些企业级AI工具在ICPC官方规则和监...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page