人工智能公司Anthropic近期在Claude开发者平台推出三项突破性测试功能,显著提升了AI代理的工具使用能力。工具搜索工具允许Claude动态发现并加载相关工具,避免了预先加载大量工具定义对上下文窗口的占用,同时通过...
Read MoreAnthropic公司近日在Claude开发者平台推出突破性的高级工具使用能力,标志着AI代理技术迈入新阶段。该功能允许Claude模型动态发现、学习并执行外部工具,使AI系统能够主动在现实世界中完成复杂操作。这一技术突破通...
Read MoreMeta研究团队在最新论文中提出名为“早期经验”的创新训练范式,为解决语言智能体在复杂现实任务中的自主学习难题提供了突破性方案。传统方法依赖专家演示数据进行监督微调,存在泛化能力弱、数据多样性不足的缺陷。而...
Read MoreQuesma实验室最新发布的Tau²基准测试研究表明,通过精细化提示词工程可显著提升轻量级AI模型在工具调用场景中的表现。该团队针对GPT-5-mini模型进行提示词重构后,在模拟真实工具使用场景的基准测试中成功率提升超20...
Read More近日,开源终端模拟器项目Ghostty在GitHub上的一项拉取请求(#8289)引发技术社区广泛讨论。该提案要求开发者在提交代码时必须披露是否使用AI辅助工具(如Copilot、ChatGPT等),旨在维护代码透明性和知识产权清晰度...
Read MoreOpenAI近日公开了一份关于GPT-5在编程场景中应用的最佳实践指南,为开发者提供了从提示设计、函数调用到工具使用的全面建议。这份指南不仅详细阐述了如何通过优化提示词(prompt design)来提升代码生成质量,还深入...
Read MoreAnthropic公司推出的模型上下文协议(Model Context Protocol,MCP)旨在标准化大型语言模型(LLM)对外部工具的使用方式,正迅速成为工具集成的行业规范。该开源框架通过结构化接口,使AI代理能够更高效地调用外部A...
Read More通义千问团队正式发布Qwen3-Coder,这是迄今为止最先进的智能编码代理模型。该模型采用4800亿参数的混合专家架构(Mixture-of-Experts),其中激活参数达350亿,并支持超长上下文处理。在智能编码、浏览器操作和工具...
Read More