软件开发的相关内容 - 漫话开发者

2026-07-27 talkingdev

Claude Opus 5发布：长时运行智能体迎来阶跃式升级，编程与科研性能大幅提升

Anthropic正式发布了新一代AI模型Claude Opus 5，作为Opus系列的重大迭代，该模型被定位为“面向长时间运行智能体的阶跃式改进”。相比前代Opus 4.8，Opus 5在性能与成本效益之间实现了更优平衡，尤其在软件工程和科学...

2026-07-20 talkingdev

ReactBench 是一个开源的编码代理评估框架，专注于在接近真实的 React 开发任务中衡量代理的编程能力。与传统仅要求代码通过行为测试的基准不同，ReactBench 引入了更全面的评价维度，要求生成的解决方案在满足功能...

2026-07-14 talkingdev

伴随AI编程代理（如Devin、OpenHands等）在软件开发流程中的渗透，如何安全地运行这些具备执行代码能力的智能体成为开发者面临的关键挑战。GitHub新开源项目Clawk给出了一种硬核解决方案：它为AI代理创建可即时销毁...

2026-07-13 talkingdev

著名数学家陶哲轩近日在其博客中分享了如何借助现代“编程代理”类AI工具，以极高效率完成了一系列数学可视化小程序的更新与创建工作。他将自己早在1999年用Java 1.0编写的复分析和线性代数教学小程序，通过AI辅助成功...

2026-07-12 talkingdev

Traycer 作为一款新兴的开源 AI 编排应用，正在重新定义智能体编码的工作流。它并非另一个需要单独付费的 AI 模型，而是一个强大的“神经中枢”，允许开发者连接现有的各种智能体订阅服务。其核心技术突破在于通过共享...

2026-07-12 talkingdev

知名AI编程工具Cursor发布的最新内部使用报告，揭示了人工智能在软件开发领域的深刻变革与巨大分化。数据显示，用户间的生产力鸿沟极为悬殊：前1%的重度用户平均每周可生成高达40,000行代码，而中位数用户仅为700行...

2026-07-12 talkingdev

SpaceXAI 正式推出其最新一代大语言模型 Grok 4.5，该模型被定义为迄今最先进版本，专为三大核心领域深度优化：编码生成与推理、自主代理（Agentic）任务执行以及高复杂度知识工作。与前代产品相比，Grok 4.5 在工具...

2026-07-12 talkingdev

在AI辅助软件开发快速演进的当下，本地运行的大语言模型正成为开发者关注的焦点。Martin Fowler官网近日发布了一篇来自ThoughtWorks同事的实践总结，详细记录了在编程智能体场景中使用本地模型的最新体验。该报告指...