人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...
Read More知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...
Read MoreOpenAI正式推出其新一代前沿模型GPT-5.2,该模型被定位为专为专业工作场景和长期运行的智能体(agent)工作流而优化的最先进模型。相较于前代,GPT-5.2在多个关键维度实现了显著提升:其一,在知识工作领域,模型展...
Read More智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本:GLM-4.6V(106B)和GLM-4.6V-Flash(9B)。前者是面向云端和高性能集群场景设计的基础模型,后者则是为本地部署和低延迟应用优化...
Read MoreAnthropic公司近日在Claude开发者平台推出突破性的高级工具使用能力,标志着AI代理技术迈入新阶段。该功能允许Claude模型动态发现、学习并执行外部工具,使AI系统能够主动在现实世界中完成复杂操作。这一技术突破通...
Read More深度求索(DeepSeek)最新推出的DeepSeek-V3.1 Terminus模型标志着AI智能体技术迈入新阶段。该版本在工具调用(Tool Use)能力上实现重大突破,通过优化推理架构和指令遵循机制,显著提升了复杂任务执行的准确性和效...
Read MoreVercel最新技术博客揭示了MCP(模型控制协议)的重大范式转变:从面向开发者的API工具转向为大型语言模型量身定制的工作流工具。这一变革源于关键发现:LLM的操作逻辑与人类开发者截然不同,它们需要不断重新发现可...
Read More本期由Miro主办的专题研讨会中,Red Hat与索尼互动娱乐的高级工程师揭示了如何通过协同工具重塑工程生产力。会议重点演示了三大技术突破:一是利用AI驱动的智能图表技术,实现系统架构的自动化生成与实时协作优化;...
Read More