漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

阿里云旗下通义千问(Qwen)团队近日宣布对Qwen3-235B-A22B模型进行重大更新,新版本编号为Qwen3-235B-A22B-2507。此次更新的核心变化是取消了原先的混合思维模式(hybrid thinking mode),转而采用将指令模型(Instruct)和思维模型(Thinking)分开训练的策略。团队表示,这一架构调整将有助于提升模型的最终输出质量。作为国内领先的大语言模型研发团队,Qwen此次技术路线的调整反映了行业对模型专业化分工的趋势认知,即不同类型的模型能力需要通过针对性的训练方案来实现最优表现。该决策是在与开发者社区充分讨论后作出的,体现了开源社区对技术演进的重要影响。

核心要点

  • 阿里通义千问团队发布Qwen3-235B-A22B-2507模型重大更新
  • 取消混合思维模式,改为指令模型和思维模型分开训练的新架构
  • 技术路线调整基于社区反馈,旨在提升模型专业化水平和输出质量

Read more >