漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-24 talkingdev

OpenAI发布GPT-5.5:更智能、更高效,专为复杂任务打造

OpenAI宣布推出其最新一代大语言模型GPT-5.5,号称是目前最智能的版本。该模型在推理能力、工具调用效率和多任务处理性能上均实现了显著提升。尽管保持了与前代模型相当的响应延迟,GPT-5.5在编程、知识检索和数据分...

Read More
2026-04-09 talkingdev

开源|Claw-Eval:首个经人类验证的LLM智能体基准测试集,覆盖139项真实任务

近日,GitHub上开源了一个名为Claw-Eval的评估框架,专门用于评估大型语言模型作为智能体的能力。该框架的核心价值在于其构建了一个全面且经过人类验证的基准测试集,涵盖了139项多样化的真实世界任务。与以往许多依...

Read More
2026-04-09 talkingdev

Meta发布Muse Spark:迈向个人超级智能的多模态推理与工具调用新模型

Meta公司近日正式推出了名为Muse Spark的新型多模态推理模型,标志着其在追求个人超级智能(Personal Superintelligence)的道路上迈出了关键一步。该模型集成了三大前沿技术能力:工具使用、视觉思维链以及多智能体...

Read More
2026-04-04 talkingdev

Anthropic调整API政策:Claude订阅用户将无法通过第三方工具(如OpenClaw)免费调用

人工智能公司Anthropic近日向用户发出通知,宣布自太平洋时间4月4日中午12点起,将调整其Claude API的使用政策。根据新规,用户将无法再使用其Claude订阅额度(包括Claude Code和Claude Cowork产品)通过第三方集成...

Read More
2026-04-02 talkingdev

开源|Agents Observe:实时洞察Claude Code智能体协作的“仪表盘”

近日,一个名为Agents Observe的开源项目在GitHub上发布,为基于Claude Code的智能体开发提供了强大的实时可观测性解决方案。该项目本质上是一个实时仪表盘,能够通过钩子(hooks)捕获智能体运行过程中的每一个动作...

Read More
2026-04-02 talkingdev

Arcee AI发布Trinity-Large-Thinking:开源前沿推理模型,为复杂长程智能体而生

人工智能公司Arcee AI近日正式发布了其前沿开源推理模型“Trinity-Large-Thining”。该模型专为处理复杂、长程任务的智能体(Agent)以及多轮工具调用场景而设计,被业界认为是目前中国境外发布的最强大的开源模型之一...

Read More
2026-03-23 talkingdev

OpenAI确立新“北极星”:倾力打造全自动AI研究员,2028年推出多智能体研究系统

OpenAI宣布了一项雄心勃勃的新研究目标:构建一个完全基于智能体的自动化AI研究员。据公司首席科学家雅各布·帕乔基透露,这一目标将成为未来几年的“北极星”方向。该AI研究员旨在独立处理大规模、复杂的科研问题,标...

Read More
2026-03-13 talkingdev

开源|Rudel:专为Claude Code设计的会话分析仪表盘,深度洞察AI编程助手使用模式

近日,GitHub上开源了一款名为Rudel的分析工具,专门用于对Anthropic公司推出的Claude Code编程会话进行深度数据洞察。该工具构建了一个功能全面的分析仪表盘,能够从多个维度解析开发者与AI编程助手的交互过程。其...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page