大模型的相关内容 - 漫话开发者

2026-06-18 talkingdev

大模型输出不稳定？WorkOS用评估系统（evals）解决AI代码生成不一致难题

在AI辅助编程日益普及的今天，一个令人头疼的问题浮出水面：相同的输入和提示词，却总能得到不同的输出结果。这种不确定性严重阻碍了AI代理（Agent）在代码编写中的可靠性。知名身份认证平台WorkOS的工程师Nick Nisi...

2026-06-17 talkingdev

Z.ai 最新发布了其AI模型 GLM-5.2，这是一次面向编码领域的重大升级。该模型拥有高达 100 万 token 的超大上下文窗口，能够处理整个代码库的长程编码任务，并引入了新的推理控制机制。GLM-5.2 目前已向 Coding Plan...

2026-06-15 talkingdev

由 Z.ai 推出的新一代旗舰大模型 GLM-5.2 现已面向所有GLM编程计划的用户开放，包括 Lite、Pro、Max 和 Team 等套餐。该模型在前代基础上强化了代码生成能力，同时实现了可用的百万级Token超长上下文支持，在需要长...

2026-06-15 talkingdev

近日，巴西里约热内卢市政府下属机构IplanRIO发布的“自研”大语言模型Rio-3.5-Open-397B陷入争议。GitHub社区及技术专家发现，该模型并非如其宣传所言“完全原创”，其权重实际上是通过对现有模型——Nex-AGI团队的Nex-N2...

2026-06-14 talkingdev

智谱AI（Zhipu AI）联合创始人兼CEO张鹏（jietang）在社交媒体X上正式宣布，GLM系列最新大语言模型GLM 5.2现已完全开源。这一举动在AI社区引发广泛关注。张鹏在声明中强调，当前某些前沿模型突然因非技术原因被限制...

2026-06-13 talkingdev

国内AI初创公司Moonshot AI于本周正式发布了其K2编程模型家族的最新开源版本——Kimi K2.7-Code。据该团队宣称，与上一代K2.6相比，新模型在保持高性能的同时，实现了推理过程中令牌（token）使用量降低30%的显著突破...

2026-06-12 talkingdev

小米近日在AI编程助手领域取得了突破性进展，正式开源了其终端原生AI编码工具——MiMo Code V0.1.0。这款工具在关键AI编码基准测试中表现抢眼，特别是在涉及超长周期、多步骤的复杂任务（超过200步）上，性能超越了知...

2026-06-09 talkingdev

OpenAI近日发布了一份名为SchemaFlow的技术指南，展示了如何利用其Agents SDK构建一套端到端的AI辅助数据库变更工作流程。该方案并非仅停留在理论层面，而是通过一个零售忠诚度积分体系的实例，系统性地拆解了从非结...