漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-28 talkingdev

开源|OpenAI发布Codex Symphony:将问题追踪器变为编码Agent控制中枢,PR吞吐量提升5倍

OpenAI 正式开源了名为 Symphony 的规范与框架,旨在重塑编码智能体(Agent)与开发工作流的交互方式。Symphony 的核心创新在于,它将开发者日常使用的 Issue 追踪器(如 GitHub Issues)直接转化为编码 Agent 的“控...

Read More
2026-04-23 talkingdev

上下文是软件,权重是硬件:AI学习的核心差异比你想象的更重要

在大型语言模型领域,一种新的视角正在引发讨论:将上下文视为“软件”,而将权重视为“硬件”。这种比喻揭示了模型运作的本质差异。上下文(如KV缓存)动态地调节模型的激活值,为特定任务提供临时性的“编程”,从而实现...

Read More
2026-04-21 talkingdev

通义千问Qwen3.6-Max-Preview发布:世界知识更强,代码能力大幅进化

阿里云旗下通义千问团队近日发布了其大型语言模型的最新预览版本——Qwen3.6-Max-Preview。该版本在多个核心能力上实现了显著提升,尤其是在世界知识的掌握与指令遵循的准确性方面表现突出。更为关键的是,模型在广泛...

Read More
2026-04-17 talkingdev

AI智能体Morphex深度进化:一年内自动提交数千PR,重构monday.com生产级单体架构

协作平台monday.com的工程团队近日披露了一项前沿技术实践:他们基于Anthropic的Claude Code SDK构建了一个名为Morphex的AI智能体,并将其直接部署在真实的生产代码库中进行了长达一年的“成长”实验。该智能体的核心...

Read More
2026-03-30 talkingdev

AI代理工作流新突破:揭秘Pretext算法背后的“约束-测量-隔离”循环

近期,一项名为Pretext的文本测量算法因其独特开发模式引发技术社区关注。该算法由AI代理工作流驱动构建,其核心创新在于能够在不依赖传统DOM测量与重排的前提下,快速、精准地完成网页布局计算。开发团队采用了一套...

Read More
2026-02-11 talkingdev

开源|AIRS-Bench:Meta发布首个端到端AI研究能力基准,量化大模型代理的科研潜力

Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...

Read More
2026-01-19 talkingdev

Cursor揭秘Bugbot进化之路:从定性评估到AI驱动指标,如何系统性提升代码审查智能体效能

Cursor公司近日详细披露了其AI驱动的代码审查智能体Bugbot的系统性优化历程。Bugbot专为在代码拉取请求中识别逻辑错误、性能问题和安全漏洞而设计,其发展路径标志着AI辅助开发工具从依赖定性反馈到建立量化评估体系...

Read More
2026-01-11 talkingdev

开源|Open Chaos:一个自我演化的开源项目

近日,一个名为Open Chaos的开源项目在技术社区引发了广泛关注。该项目定位为一个“自我演化”的开源项目,其核心理念在于构建一个能够根据社区贡献、用户反馈和环境变化而自主适应、持续进化的软件系统。这标志着开源...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page