推理模型的相关内容 - 漫话开发者

2026-01-16 talkingdev

开源|DASD：序列蒸馏技术打造高效推理模型，4B/30B版本在代码、数学与科学基准测试中表现强劲

近日，由D2I-ai团队在GitHub上开源的DASD（序列蒸馏）项目，提出了一种创新的模型蒸馏流程，旨在训练出更紧凑、高效的模型以应对复杂的推理任务。该流程整合了温度调度学习与发散感知采样等前沿技术，通过精细化的知...

2025-12-15 talkingdev

人工智能平台Tinker今日宣布结束等待名单，正式向所有用户开放，并同步推出多项重要技术更新。本次更新的核心亮点包括：引入全新的推理模型Kimi K2 Thinking，该模型拥有万亿级参数，专为处理长链条复杂推理和工具调...

2025-12-06 talkingdev

根据AI模型聚合平台OpenRouter发布的最新年度研究报告，通过对过去一年内超过100万亿个令牌（tokens）的实证分析，揭示了当前AI模型使用格局的重大转变。报告指出，以Claude 3.5 Sonnet、GPT-4o和o1系列为代表的“推...

2025-12-02 talkingdev

在NeurIPS 2024大会上，NVIDIA发布了一系列面向数字与物理世界AI开发的新工具，其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...

2025-11-14 talkingdev

在人工智能领域，世界模型（World Models）正成为新一代AI系统的核心研究方向。斯坦福大学教授李飞飞与图灵奖得主Yann LeCun近期分别提出了基于不同技术路径的世界模型架构。李飞飞团队聚焦于结合高斯溅射（Gaussian...

2025-11-07 talkingdev

中国人工智能实验室月之暗面（Moonshot AI）近日开源其革命性推理模型Kimi K2，在关键基准测试中展现出与国际顶尖模型的竞争实力。该模型在衡量综合认知能力的‘人类终极考试’（Humanity's Last Exam）中取得44.9%的...

2025-11-07 talkingdev

中国人工智能实验室月之暗面（Moonshot AI）最新推出的Kimi K2 Thinking模型，以其创新的混合专家（MoE）推理架构引发行业关注。该模型在Humanity's Last Exam综合能力测评和BrowseComp浏览理解基准测试中，部分指标...

2025-10-30 talkingdev

OpenAI最新推出的gpt-oss-safeguard系列模型（包含1200亿和200亿参数版本）标志着AI安全技术的重要突破。该模型创新性地允许开发者在推理阶段直接应用定制化安全策略，无需像传统方法那样依赖数千个标注样本训练分类...