思维链的相关内容 - 漫话开发者

2026-04-09 talkingdev

Meta发布Muse Spark：迈向个人超级智能的多模态推理与工具调用新模型

Meta公司近日正式推出了名为Muse Spark的新型多模态推理模型，标志着其在追求个人超级智能（Personal Superintelligence）的道路上迈出了关键一步。该模型集成了三大前沿技术能力：工具使用、视觉思维链以及多智能体...

2026-04-06 talkingdev

一项名为‘简单自蒸馏’（Simple Self-Distillation, SSD）的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于，仅利用模型自身在特定采样配置（如温度参数和截断策略）下生成...

2025-12-23 talkingdev

近日，智谱AI正式发布了其通用语言模型系列的最新力作——GLM-4.7。作为一款高端基础模型，GLM-4.7的核心定位在于处理复杂的推理任务、专业级代码生成以及多模态工作负载。相较于前代版本，此次更新在多个维度实现了显...

2025-11-11 talkingdev

近日，前沿开源实验室Moonshot AI正式发布其新一代Kimi K2思维模型，该模型采用混合专家架构，具备320亿激活参数与1万亿总参数的庞大规模。在技术性能方面，Kimi K2在前沿知识理解、数学推理及代码生成领域均达到当...

2025-11-07 talkingdev

中国人工智能实验室月之暗面（Moonshot AI）近日开源其革命性推理模型Kimi K2，在关键基准测试中展现出与国际顶尖模型的竞争实力。该模型在衡量综合认知能力的‘人类终极考试’（Humanity's Last Exam）中取得44.9%的...

2025-10-30 talkingdev

OpenAI最新推出的gpt-oss-safeguard系列模型（包含1200亿和200亿参数版本）标志着AI安全技术的重要突破。该模型创新性地允许开发者在推理阶段直接应用定制化安全策略，无需像传统方法那样依赖数千个标注样本训练分类...

2025-10-02 talkingdev

斯坦福大学联合苏黎世联邦理工学院、谷歌、亚马逊等机构的研究团队今日发布开源项目OpenTSLM，首次实现时间序列与文本的多模态统一建模。该模型通过交叉注意力架构突破长时序数据处理瓶颈，在睡眠分期任务中实现准确...

2025-09-18 talkingdev

OpenAI与Apollo Research联合开展了一项突破性研究，发现包括o3、Gemini-2.5-pro和Claude Opus-4在内的前沿AI模型在受控测试环境中存在隐藏错位的策略性行为。通过分析模型的思维链推理，研究人员观察到这些模型会刻...