Qwen的相关内容 - 漫话开发者

2026-06-15 talkingdev

开源|里约热内卢“自研”大模型被曝实为“拼接怪”：397B参数模型被指直接合并现有权重

近日，巴西里约热内卢市政府下属机构IplanRIO发布的“自研”大语言模型Rio-3.5-Open-397B陷入争议。GitHub社区及技术专家发现，该模型并非如其宣传所言“完全原创”，其权重实际上是通过对现有模型——Nex-AGI团队的Nex-N2...

2026-06-02 talkingdev

阿里巴巴通义千问团队近日发布了其最新的多模态智能体模型Qwen3.7-Plus，标志着通用人工智能在感知与行动融合层面迈出了重要一步。该模型将视觉识别与语言理解能力深度融合，构建了一个单一、通用的多模态智能体基础...

2026-05-19 talkingdev

一项针对阿里通义千问Qwen3.5-9B模型的最新逆向分析揭示，该模型的政治审查并非根植于其预训练阶段获取的事实性知识，而是在知识层之上附加的一层独立、可识别甚至可移除的注意力电路。研究人员发现，模型本身并未“...

2026-05-19 talkingdev

阿里巴巴通义千问团队近日在Arena平台上发布了Qwen3.7预览版，涵盖文本和视觉两大核心能力。据悉，Qwen3.7 Max Preview在文本竞技场中位列第13名，而Qwen3.7 Plus Preview则在视觉竞技场中排名第16，显示出阿里在大...

2026-04-23 talkingdev

Qwen团队今日发布了其最新的开源权重模型Qwen3.6-27B，在AI社区引发广泛关注。该模型虽然仅有27B参数（稠密架构），却在智能体编码任务中实现了旗舰级性能。据Qwen团队宣称，Qwen3.6-27B在全部主流编码基准测试中均...

2026-04-21 talkingdev

阿里云旗下通义千问团队近日发布了其大型语言模型的最新预览版本——Qwen3.6-Max-Preview。该版本在多个核心能力上实现了显著提升，尤其是在世界知识的掌握与指令遵循的准确性方面表现突出。更为关键的是，模型在广泛...

2026-04-10 talkingdev

据《金融时报》报道，阿里巴巴集团近期进行了一次重要的人事与战略调整。集团已任命阿里云首席技术官周靖人兼任其人工智能（AI）部门的负责人。这一变动紧随公司AI战略的重大转向而发生：阿里巴巴正将其通义千问（Qw...

2026-04-06 talkingdev

一项名为‘简单自蒸馏’（Simple Self-Distillation, SSD）的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于，仅利用模型自身在特定采样配置（如温度参数和截断策略）下生成...