漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-07 talkingdev

OpenAI发布AgentKit:可视化拖拽构建AI智能体新纪元

OpenAI正式推出AgentKit开发工具集,标志着AI智能体构建进入低门槛时代。该套件包含三大核心组件:首先,Agent Builder作为"智能体版Canva",通过可视化拖拽界面大幅降低开发难度,使非技术用户也能快速搭建专用AI助...

Read More
2025-10-06 talkingdev

LLM表格理解能力大比拼:11种数据格式测试结果揭晓

最新研究针对大型语言模型的表格理解能力展开系统性评测,通过向GPT-4.1-nano模型输入包含1000条员工记录的11种不同格式数据,评估其回答问题的准确率。研究结果显示,Markdown键值对格式(Markdown-KV)以最高准确...

Read More
2025-10-02 talkingdev

多智能体系统为何需要内存工程?共享记忆基础设施成AI协作关键

当前多智能体AI系统面临的核心瓶颈在于缺乏有效的共享记忆基础设施。尽管上下文工程通过‘在正确时间提供正确信息’提升了单智能体性能,但当多个智能体需要协同工作时,这种架构就会失效。最新研究提出‘内存工程’解决...

Read More
2025-10-01 talkingdev

Anthropic提出AI代理上下文工程新范式:突破有限上下文窗口的智能管理策略

人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战,提出通过系统指令、工具配置、数据筛选和对话历史的精准协同,实现推理效果...

Read More
2025-09-30 talkingdev

Anthropic推出Claude Agent SDK:构建全能AI智能体的开发利器

人工智能公司Anthropic正式发布Claude Agent SDK,标志着其AI技术从代码生成向通用智能体构建领域的重要拓展。该开发工具包通过系统化架构设计,使开发者能够构建适用于金融管理、客户支持等复杂场景的智能体系统。...

Read More
2025-09-30 talkingdev

Anthropic发布Claude Sonnet 4.5:刷新代码生成与智能体开发新标杆

人工智能公司Anthropic正式推出Claude Sonnet 4.5模型,该模型在SWE-bench Verified基准测试中以77.2%的得分刷新世界纪录,成为当前全球最卓越的代码生成模型。此次升级在计算机操作、复杂推理和数学计算三大核心领...

Read More
2025-09-30 talkingdev

ChatGPT推出即时结账功能与Agentic Commerce协议,开启AI代理购物新时代

OpenAI与支付巨头Stripe联合推出Agentic Commerce Protocol(代理商务协议),标志着AI驱动商业生态迈出关键一步。该协议通过标准化接口打通ChatGPT与商家的支付系统,实现用户与AI代理协同购物的无缝体验。技术层面...

Read More
2025-09-29 talkingdev

深度求索发布DeepSeek-V3.1 Terminus:智能体工具调用能力全面升级

深度求索(DeepSeek)最新推出的DeepSeek-V3.1 Terminus模型标志着AI智能体技术迈入新阶段。该版本在工具调用(Tool Use)能力上实现重大突破,通过优化推理架构和指令遵循机制,显著提升了复杂任务执行的准确性和效...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page