漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-28 talkingdev

开源|OpenAI发布Codex Symphony:将问题追踪器变为编码Agent控制中枢,PR吞吐量提升5倍

OpenAI 正式开源了名为 Symphony 的规范与框架,旨在重塑编码智能体(Agent)与开发工作流的交互方式。Symphony 的核心创新在于,它将开发者日常使用的 Issue 追踪器(如 GitHub Issues)直接转化为编码 Agent 的“控...

Read More
2026-04-27 talkingdev

AI沙箱:每位开发者必须掌握的智能体隔离技术

在AI智能体时代,为了防止自主代理对系统造成破坏性影响,沙箱技术已成为不可或缺的隔离基础。当前存在多种隔离方案,从传统的容器技术到更强大的gVisor用户态内核和Firecracker微虚拟机,各自在性能与安全性之间提...

Read More
2026-04-24 talkingdev

OpenAI发布GPT-5.5:更智能、更高效,专为复杂任务打造

OpenAI宣布推出其最新一代大语言模型GPT-5.5,号称是目前最智能的版本。该模型在推理能力、工具调用效率和多任务处理性能上均实现了显著提升。尽管保持了与前代模型相当的响应延迟,GPT-5.5在编程、知识检索和数据分...

Read More
2026-04-23 talkingdev

Qwen3.6-27B震撼发布:27B稠密模型实现旗舰级编码性能,超越前代397B MoE巨兽

Qwen团队今日发布了其最新的开源权重模型Qwen3.6-27B,在AI社区引发广泛关注。该模型虽然仅有27B参数(稠密架构),却在智能体编码任务中实现了旗舰级性能。据Qwen团队宣称,Qwen3.6-27B在全部主流编码基准测试中均...

Read More
2026-04-23 talkingdev

AI推理新挑战:基准测试揭示智能体工作负载对引擎性能的深层影响

随着人工智能向智能体(Agent)方向演进,传统的大模型推理基准测试正面临根本性变革。智能体工作负载不再是简单的单轮问答,而是包含多轮交互、工具调用等复杂场景。这种变化给推理引擎带来了前所未有的压力,尤其...

Read More
2026-04-22 talkingdev

OpenAI研发代号“Hermes”的常驻智能体平台,ChatGPT将能自主执行任务

OpenAI正在其ChatGPT内部开发一个代号为“Hermes”的常驻智能体平台,该平台允许用户创建并持续运行自定义智能体。这一创新功能集成了工作流创建、技能整合与任务调度等核心能力,使得智能体能够独立运作,而无需等待...

Read More
2026-04-21 talkingdev

通义千问Qwen3.6-Max-Preview发布:世界知识更强,代码能力大幅进化

阿里云旗下通义千问团队近日发布了其大型语言模型的最新预览版本——Qwen3.6-Max-Preview。该版本在多个核心能力上实现了显著提升,尤其是在世界知识的掌握与指令遵循的准确性方面表现突出。更为关键的是,模型在广泛...

Read More
2026-04-21 talkingdev

月之暗面发布Kimi K2.6系列模型,宣称多项基准超越GPT-5.4与Claude Opus

中国人工智能公司月之暗面(Moonshot AI)近日正式推出其新一代大模型系列Kimi K2.6,并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体(Agent)执行支持,旨在为开...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page