漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-07 talkingdev

AI Agent新挑战:不靠源码,仅凭文档和实验逆向生成完整软件

近日,一项名为ProgramBench的新型基准测试引发了人工智能和软件工程领域的广泛关注。该测试旨在评估AI智能体(Agent)在没有源代码的情况下,仅通过阅读文档和进行实验,从零开始逆向构建软件可执行文件的能力。Pro...

Read More
2026-05-04 talkingdev

OpenAI 的“无代码”工程革命:用 AI Agent 编排软件开发新模式

OpenAI 近期在内部工程实践中推行了一种被称为“Harness Engineering”的软件开发理念,它并非字面意义上的不写代码,而是引导工程师将注意力从手写逻辑转向构建 AI Agent 能够自主运行的环境和“控具”(Harness)。核...

Read More
2026-05-03 talkingdev

中国开源模型Kimi K2.5在编程挑战中击败Claude、GPT-5.5和Gemini,引发业界震动

近日,一款名为Kimi K2.5的开源权重模型在编程挑战中击败了包括Claude、GPT-5.5和Gemini在内的多个顶级闭源模型。这一事件迅速在科技圈引发广泛关注,尤其在Hacker News上引发了激烈讨论。Kimi K2.5由中国团队开发,...

Read More
2026-04-29 talkingdev

Poolside发布Laguna系列编程模型:开源XS.2小而强,旗舰M.1专注长周期任务

人工智能编程领域迎来新玩家,初创公司Poolside正式发布Laguna系列编程模型,包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型,专为长周期、复杂推理的编程任务设计(Long-horizon co...

Read More
2026-04-27 talkingdev

善用AI编程助手,唤醒你的“烂尾”项目:Claude Code等工具让原型开发更高效

软件开发领域,利用AI编码辅助工具(如Anthropic推出的Claude Code)来加速个人项目的开发,正成为一种值得关注的新趋势。这些工具并非旨在取代开发者,而是作为高效的“加速器”,能够帮助程序员快速将想法转化为可...

Read More
2026-04-27 talkingdev

你的AI可能在对老板撒谎?AI编码贡献度量失真引发行业担忧

随着生成式AI在软件开发中的广泛应用,如何准确衡量AI对代码库的实际贡献成为一项棘手挑战。该文指出,AI的最佳用途有时是启发性的提问,并不直接产生任何代码,因此单纯以代码行数来衡量AI贡献不仅无法反映代码质量...

Read More
2026-04-23 talkingdev

开源|Broccoli:用Claude和Codex将Linear工单自动转化为GitHub PR,数据安全跑在你的Google Cloud上

Broccoli 是一个新颖的开源工具,旨在通过AI代理(包括Claude和Codex)自动化软件开发中的工程工作流。其核心功能是可以直接将Linear项目管理工具中的工单(Tickets)自动转化为GitHub上的拉取请求(Pull Requests)...

Read More
2026-04-23 talkingdev

开源|Argent:AI自主操控iOS模拟器的智能工具包,革新移动应用调试与性能分析

软件开发团队Software Mansion近日在GitHub上开源了一款名为Argent的创新工具包,它将人工智能代理(Agent)技术引入iOS模拟器的控制、调试与性能分析领域。Argent的核心价值在于,它允许AI助手以高度自主的方式与iO...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page