工具使用的相关内容 - 漫话开发者

2026-05-18 talkingdev

开源|Semble：为AI智能体打造的代码搜索神器，Token消耗减少98%

Semble是一款由MinishLab开发的高性能代码搜索库，专为帮助AI智能体通过自然语言快速定位代码片段而设计。它的核心亮点在于大幅降低Token消耗——相比传统的‘grep+read’方法，Semble能减少约98%的Token使用量，同时保...

2026-05-01 talkingdev

智谱AI团队发布的最新研究成果GLM-5V-Turbo，在人工智能领域迈出了关键一步。该模型的核心创新在于将多模态感知能力直接内嵌到模型的推理过程和工具使用中，而非作为独立的预处理步骤。这意味着模型能够同时处理并理...

2026-04-24 talkingdev

OpenAI宣布推出其最新一代大语言模型GPT-5.5，号称是目前最智能的版本。该模型在推理能力、工具调用效率和多任务处理性能上均实现了显著提升。尽管保持了与前代模型相当的响应延迟，GPT-5.5在编程、知识检索和数据分...

2026-04-09 talkingdev

近日，GitHub上开源了一个名为Claw-Eval的评估框架，专门用于评估大型语言模型作为智能体的能力。该框架的核心价值在于其构建了一个全面且经过人类验证的基准测试集，涵盖了139项多样化的真实世界任务。与以往许多依...

2026-04-09 talkingdev

Meta公司近日正式推出了名为Muse Spark的新型多模态推理模型，标志着其在追求个人超级智能（Personal Superintelligence）的道路上迈出了关键一步。该模型集成了三大前沿技术能力：工具使用、视觉思维链以及多智能体...

2026-04-04 talkingdev

人工智能公司Anthropic近日向用户发出通知，宣布自太平洋时间4月4日中午12点起，将调整其Claude API的使用政策。根据新规，用户将无法再使用其Claude订阅额度（包括Claude Code和Claude Cowork产品）通过第三方集成...

2026-04-02 talkingdev

近日，一个名为Agents Observe的开源项目在GitHub上发布，为基于Claude Code的智能体开发提供了强大的实时可观测性解决方案。该项目本质上是一个实时仪表盘，能够通过钩子（hooks）捕获智能体运行过程中的每一个动作...

2026-04-02 talkingdev

人工智能公司Arcee AI近日正式发布了其前沿开源推理模型“Trinity-Large-Thining”。该模型专为处理复杂、长程任务的智能体（Agent）以及多轮工具调用场景而设计，被业界认为是目前中国境外发布的最强大的开源模型之一...