推理架构的相关内容 - 漫话开发者

2026-07-27 talkingdev

celeris-1 发布：超低延迟逼近 GPT-5 级智能，推理速度提升 15 倍

人工智能公司 celeris AI 正式推出全新通用语言模型 celeris-1，该模型在保持前沿智能水平的同时，实现了突破性的响应速度。celeris-1 的核心创新在于采用了一种基于扩散技术的新型推理架构，从根本上重构了传统自回...

2026-07-27 talkingdev

Baseten 为 GLM-5.2 模型构建的全新 API 在推理速度上取得了突破性进展，峰值速度高达 280 tokens/秒，平均速度约为 100 tokens/秒，整体性能达到发布日初版 API 的两倍以上。这一大幅提升得益于底层的系统级优化与...

2026-03-04 talkingdev

OpenAI近日发布了其最新对话模型GPT-5.3 Instant，该版本在Hacker News社区引发了广泛关注，获得了319个点赞和254条评论。作为GPT系列的最新迭代，GPT-5.3 Instant的核心升级在于显著提升了日常对话的流畅度和实用性...

2025-11-29 talkingdev

中国AI初创公司深度求索（DeepSeek）最新发布的DeepSeekMath-V2数学模型在国际数学奥林匹克竞赛（IMO）2025及中国数学奥林匹克2024中达到金牌级水平，标志着AI在复杂数学推理领域的重大突破。该模型通过创新的推理架...

2025-11-20 talkingdev

OpenAI最新推出的GPT-5.1-Codex-Max标志着智能编程助手领域的重大突破。该模型基于升级的推理架构构建，专门针对长期、复杂的软件工程任务进行优化。其核心创新在于支持跨多上下文窗口的持续操作，使开发者能够执行...

2025-11-07 talkingdev

中国人工智能实验室月之暗面（Moonshot AI）最新推出的Kimi K2 Thinking模型，以其创新的混合专家（MoE）推理架构引发行业关注。该模型在Humanity's Last Exam综合能力测评和BrowseComp浏览理解基准测试中，部分指标...

2025-10-17 talkingdev

斯坦福大学研究人员提出的递归语言模型（RLMs）实现了突破性的推理架构创新。该模型通过REPL环境将输入上下文分解为可交互变量，实现了对无限长上下文的递归处理。在OOLONG基准测试中，基于GPT-5-mini构建的RLMs模型...

2025-09-29 talkingdev

深度求索（DeepSeek）最新推出的DeepSeek-V3.1 Terminus模型标志着AI智能体技术迈入新阶段。该版本在工具调用（Tool Use）能力上实现重大突破，通过优化推理架构和指令遵循机制，显著提升了复杂任务执行的准确性和效...