漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-21 talkingdev

评估报告:Claude Opus 4.5任务处理“半衰期”达4小时49分,性能较前代翻倍

人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...

Read More
2025-12-20 talkingdev

2025年大语言模型范式变革年度回顾:关键趋势与未来展望

知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...

Read More
2025-12-12 talkingdev

OpenAI发布GPT-5.2:专为专业工作与长期智能体优化的前沿模型

OpenAI正式推出其新一代前沿模型GPT-5.2,该模型被定位为专为专业工作场景和长期运行的智能体(agent)工作流而优化的最先进模型。相较于前代,GPT-5.2在多个关键维度实现了显著提升:其一,在知识工作领域,模型展...

Read More
2025-12-10 talkingdev

开源|智谱AI发布GLM-4.6V系列多模态大模型:原生工具调用与128K上下文窗口

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本:GLM-4.6V(106B)和GLM-4.6V-Flash(9B)。前者是面向云端和高性能集群场景设计的基础模型,后者则是为本地部署和低延迟应用优化...

Read More
2025-11-25 talkingdev

Claude开发者平台推出高级工具使用功能,实现动态学习与执行

Anthropic公司近日在Claude开发者平台推出突破性的高级工具使用能力,标志着AI代理技术迈入新阶段。该功能允许Claude模型动态发现、学习并执行外部工具,使AI系统能够主动在现实世界中完成复杂操作。这一技术突破通...

Read More
2025-09-29 talkingdev

深度求索发布DeepSeek-V3.1 Terminus:智能体工具调用能力全面升级

深度求索(DeepSeek)最新推出的DeepSeek-V3.1 Terminus模型标志着AI智能体技术迈入新阶段。该版本在工具调用(Tool Use)能力上实现重大突破,通过优化推理架构和指令遵循机制,显著提升了复杂任务执行的准确性和效...

Read More
2025-09-15 talkingdev

MCP第二波浪潮:为LLM而非开发者构建工具

Vercel最新技术博客揭示了MCP(模型控制协议)的重大范式转变:从面向开发者的API工具转向为大型语言模型量身定制的工作流工具。这一变革源于关键发现:LLM的操作逻辑与人类开发者截然不同,它们需要不断重新发现可...

Read More
2025-08-27 talkingdev

智能工程流程革新:Red Hat与索尼专家分享Miro的AI图表与自动化待办事项实践

本期由Miro主办的专题研讨会中,Red Hat与索尼互动娱乐的高级工程师揭示了如何通过协同工具重塑工程生产力。会议重点演示了三大技术突破:一是利用AI驱动的智能图表技术,实现系统架构的自动化生成与实时协作优化;...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page