复杂推理的相关内容 - 漫话开发者

2026-06-27 talkingdev

OpenAI 预览 GPT-5.6 Sol：下一代模型在编程、科学和网络安全领域能力大幅跃升

OpenAI 正式对外预览了其下一代旗舰模型——GPT-5.6 Sol。这一模型不仅在编程、科学研究和网络安全等关键领域展现出显著增强的能力，更引人关注的是，它首次搭载了OpenAI迄今最先进的安全栈。从技术层面看，GPT-5.6 So...

2026-06-27 talkingdev

美国政府在人工智能监管与部署上迈出重要一步，正式允许AI公司Anthropic将其最新研发的强大AI模型“Mythos”向部分经筛选的“可信”美国组织进行限量发布。这一决策突显了美国政府在高性能AI应用与国家安全之间的审慎平...

2026-06-15 talkingdev

由 Z.ai 推出的新一代旗舰大模型 GLM-5.2 现已面向所有GLM编程计划的用户开放，包括 Lite、Pro、Max 和 Team 等套餐。该模型在前代基础上强化了代码生成能力，同时实现了可用的百万级Token超长上下文支持，在需要长...

2026-04-29 talkingdev

人工智能编程领域迎来新玩家，初创公司Poolside正式发布Laguna系列编程模型，包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型，专为长周期、复杂推理的编程任务设计（Long-horizon co...

2026-04-21 talkingdev

中国人工智能公司月之暗面（Moonshot AI）近日正式推出其新一代大模型系列Kimi K2.6，并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体（Agent）执行支持，旨在为开...

2026-02-06 talkingdev

人工智能研究公司Anthropic正式发布了其旗舰模型Claude Opus的最新版本——Claude Opus 4.6。此次升级标志着大语言模型在专业应用领域的能力边界再次被拓展。该模型在智能体编码、计算机使用、工具调用、信息检索及金...

2026-02-03 talkingdev

近日，NVIDIA研究团队提出了一种名为“金鹅”（Golden Goose）的创新方法，旨在解决大语言模型（LLM）强化学习领域的一个关键瓶颈。当前，基于可验证奖励的强化学习（RLVR）是解锁LLM复杂推理能力的重要基石，但其发展...

2025-12-15 talkingdev

人工智能平台Tinker今日宣布结束等待名单，正式向所有用户开放，并同步推出多项重要技术更新。本次更新的核心亮点包括：引入全新的推理模型Kimi K2 Thinking，该模型拥有万亿级参数，专为处理长链条复杂推理和工具调...