自动化软件开发的相关内容 - 漫话开发者

2026-07-12 talkingdev

马斯克旗下SpaceXAI发布Grok 4.5：专攻编码、智能代理与知识工作的最强模型

埃隆·马斯克旗下的人工智能公司SpaceXAI正式推出了新一代大语言模型Grok 4.5，将其定位为公司在编码、智能代理任务和知识工作领域的最强模型。官方披露，该模型在训练过程中与流行AI编程工具Cursor进行了深度协同优...

2026-06-26 talkingdev

DeepReinforce近日开源了其新一代编程模型家族Ornith-1.0，这一系列模型的最大亮点在于具备自我编写强化学习（RL）训练框架的能力，标志着AI模型在自我优化和自动化研究方向上迈出重要一步。Ornith-1.0家族基于预训...

2026-05-07 talkingdev

近日，一项名为ProgramBench的新型基准测试引发了人工智能和软件工程领域的广泛关注。该测试旨在评估AI智能体（Agent）在没有源代码的情况下，仅通过阅读文档和进行实验，从零开始逆向构建软件可执行文件的能力。Pro...

2026-04-23 talkingdev

Broccoli 是一个新颖的开源工具，旨在通过AI代理（包括Claude和Codex）自动化软件开发中的工程工作流。其核心功能是可以直接将Linear项目管理工具中的工单（Tickets）自动转化为GitHub上的拉取请求（Pull Requests）...

2026-04-17 talkingdev

协作平台monday.com的工程团队近日披露了一项前沿技术实践：他们基于Anthropic的Claude Code SDK构建了一个名为Morphex的AI智能体，并将其直接部署在真实的生产代码库中进行了长达一年的“成长”实验。该智能体的核心...

2026-03-30 talkingdev

近日，开源AI智能体项目AutoBe发布了一项突破性技术成果，其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率，从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发，...

2026-03-25 talkingdev

在AI驱动的软件开发浪潮中，开发者代理（AI Agents）能够快速生成代码，但其传统工作模式存在一个根本性缺陷：它们通常在脱离真实运行环境的“真空”中编码，无法感知实际的API响应、数据库状态或微服务的真实行为。这...

2026-02-06 talkingdev

人工智能安全与研究公司Anthropic近日公布了一项突破性的AI协作编程实验成果。该公司组建了一个由16个并行运行的Claude Opus 4.6智能体组成的“AI开发团队”，成功自主构建了一个基于Rust语言的C编译器。这个由AI团队...