编程的相关内容 - 漫话开发者

2026-06-18 talkingdev

大模型输出不稳定？WorkOS用评估系统（evals）解决AI代码生成不一致难题

在AI辅助编程日益普及的今天，一个令人头疼的问题浮出水面：相同的输入和提示词，却总能得到不同的输出结果。这种不确定性严重阻碍了AI代理（Agent）在代码编写中的可靠性。知名身份认证平台WorkOS的工程师Nick Nisi...

2026-06-17 talkingdev

在AI代码生成能力日益强大的今天，如何将AI编写的代码快速、可靠地转化为可运行的真实应用，成为开发团队面临的新瓶颈。GitHub上的开源项目Nubase正试图解决这一痛点。作为一个AI原生的后端平台，Nubase将数据库、身...

2026-06-17 talkingdev

OpenAI 正在逐步将其编程智能体 Codex 打造成一个更强大的“浏览器代理”。最新消息显示，Codex 已集成 Chrome DevTools 协议（CDP），使其在内部的浏览器模式下能够实时访问和控制网页元素。这意味着，AI 不仅可以看...

2026-06-17 talkingdev

Z.ai 最新发布了其AI模型 GLM-5.2，这是一次面向编码领域的重大升级。该模型拥有高达 100 万 token 的超大上下文窗口，能够处理整个代码库的长程编码任务，并引入了新的推理控制机制。GLM-5.2 目前已向 Coding Plan...

2026-06-16 talkingdev

在AI驱动原型设计显著加速软件交付的当下，一篇来自技术作者Matt Sayar的洞察文章再次为行业敲响警钟：尽管借助Claude Code等工具，开发者可以快速从UI仓库克隆代码、添加功能并记录演示视频，但这些AI生成的原型距...

2026-06-15 talkingdev

在AI辅助编程日益普及的今天，如何让AI Agent生成更简洁、更高效的代码，避免过度工程化，成为开发者社区关注的热点。GitHub上一个名为Ponytail的新兴开源工具，以其反直觉的核心理念——“让你的AI Agent像房间里最懒...

2026-06-15 talkingdev

由 Z.ai 推出的新一代旗舰大模型 GLM-5.2 现已面向所有GLM编程计划的用户开放，包括 Lite、Pro、Max 和 Team 等套餐。该模型在前代基础上强化了代码生成能力，同时实现了可用的百万级Token超长上下文支持，在需要长...

2026-06-13 talkingdev

国内AI初创公司Moonshot AI于本周正式发布了其K2编程模型家族的最新开源版本——Kimi K2.7-Code。据该团队宣称，与上一代K2.6相比，新模型在保持高性能的同时，实现了推理过程中令牌（token）使用量降低30%的显著突破...