近日,一项名为ProgramBench的新型基准测试引发了人工智能和软件工程领域的广泛关注。该测试旨在评估AI智能体(Agent)在没有源代码的情况下,仅通过阅读文档和进行实验,从零开始逆向构建软件可执行文件的能力。Pro...
Read MoreBroccoli 是一个新颖的开源工具,旨在通过AI代理(包括Claude和Codex)自动化软件开发中的工程工作流。其核心功能是可以直接将Linear项目管理工具中的工单(Tickets)自动转化为GitHub上的拉取请求(Pull Requests)...
Read More协作平台monday.com的工程团队近日披露了一项前沿技术实践:他们基于Anthropic的Claude Code SDK构建了一个名为Morphex的AI智能体,并将其直接部署在真实的生产代码库中进行了长达一年的“成长”实验。该智能体的核心...
Read More近日,开源AI智能体项目AutoBe发布了一项突破性技术成果,其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率,从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发,...
Read More在AI驱动的软件开发浪潮中,开发者代理(AI Agents)能够快速生成代码,但其传统工作模式存在一个根本性缺陷:它们通常在脱离真实运行环境的“真空”中编码,无法感知实际的API响应、数据库状态或微服务的真实行为。这...
Read More人工智能安全与研究公司Anthropic近日公布了一项突破性的AI协作编程实验成果。该公司组建了一个由16个并行运行的Claude Opus 4.6智能体组成的“AI开发团队”,成功自主构建了一个基于Rust语言的C编译器。这个由AI团队...
Read MoreDevCycle公司近日发布其MCP服务器解决方案,将功能标志(Feature Flagging)技术引入AI智能体工作流。这项创新允许开发人员通过AI代理直接创建、管理和评估功能标志,实现在编码环境中无缝进行功能测试与生产环境控...
Read MoreCode Index MCP是一款基于Model Context Protocol(MCP)的服务器工具,专为大型语言模型设计,旨在通过极简配置实现对代码仓库的高效索引、搜索与分析。该工具通过先进的搜索算法和代码解析技术,彻底改变了AI理解...
Read More