漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-06-18 talkingdev

大模型输出不稳定?WorkOS用评估系统(evals)解决AI代码生成不一致难题

在AI辅助编程日益普及的今天,一个令人头疼的问题浮出水面:相同的输入和提示词,却总能得到不同的输出结果。这种不确定性严重阻碍了AI代理(Agent)在代码编写中的可靠性。知名身份认证平台WorkOS的工程师Nick Nisi...

Read More
2026-06-17 talkingdev

开源|Nubase:将AI代码秒变真实应用的AI原生后端平台

在AI代码生成能力日益强大的今天,如何将AI编写的代码快速、可靠地转化为可运行的真实应用,成为开发团队面临的新瓶颈。GitHub上的开源项目Nubase正试图解决这一痛点。作为一个AI原生的后端平台,Nubase将数据库、身...

Read More
2026-06-17 talkingdev

OpenAI Codex 新增 CDP 支持,变身“浏览器代理”实时操控网页

OpenAI 正在逐步将其编程智能体 Codex 打造成一个更强大的“浏览器代理”。最新消息显示,Codex 已集成 Chrome DevTools 协议(CDP),使其在内部的浏览器模式下能够实时访问和控制网页元素。这意味着,AI 不仅可以看...

Read More
2026-06-17 talkingdev

Z.ai 发布 GLM-5.2:百万级Token上下文窗口与长程编码任务支持,专为智能体软件工程打造

Z.ai 最新发布了其AI模型 GLM-5.2,这是一次面向编码领域的重大升级。该模型拥有高达 100 万 token 的超大上下文窗口,能够处理整个代码库的长程编码任务,并引入了新的推理控制机制。GLM-5.2 目前已向 Coding Plan...

Read More
2026-06-16 talkingdev

AI加速原型设计不敌工程化交付:专业工程师仍不可或缺

在AI驱动原型设计显著加速软件交付的当下,一篇来自技术作者Matt Sayar的洞察文章再次为行业敲响警钟:尽管借助Claude Code等工具,开发者可以快速从UI仓库克隆代码、添加功能并记录演示视频,但这些AI生成的原型距...

Read More
2026-06-15 talkingdev

开源| Ponytail:让AI Agent像最懒的资深程序员一样思考,不写代码才是最高效的代码

在AI辅助编程日益普及的今天,如何让AI Agent生成更简洁、更高效的代码,避免过度工程化,成为开发者社区关注的热点。GitHub上一个名为Ponytail的新兴开源工具,以其反直觉的核心理念——“让你的AI Agent像房间里最懒...

Read More
2026-06-15 talkingdev

GLM-5.2 重磅发布:百万Token上下文与MIT开源许可,开发者可以自由构建

由 Z.ai 推出的新一代旗舰大模型 GLM-5.2 现已面向所有GLM编程计划的用户开放,包括 Lite、Pro、Max 和 Team 等套餐。该模型在前代基础上强化了代码生成能力,同时实现了可用的百万级Token超长上下文支持,在需要长...

Read More
2026-06-13 talkingdev

Moonshot AI发布Kimi K2.7-Code:推理令牌用量较K2.6降低30%,采用修改版MIT许可证开源

国内AI初创公司Moonshot AI于本周正式发布了其K2编程模型家族的最新开源版本——Kimi K2.7-Code。据该团队宣称,与上一代K2.6相比,新模型在保持高性能的同时,实现了推理过程中令牌(token)使用量降低30%的显著突破...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page