Qwen的相关内容 - 漫话开发者

2026-04-23 talkingdev

Qwen3.6-27B震撼发布：27B稠密模型实现旗舰级编码性能，超越前代397B MoE巨兽

Qwen团队今日发布了其最新的开源权重模型Qwen3.6-27B，在AI社区引发广泛关注。该模型虽然仅有27B参数（稠密架构），却在智能体编码任务中实现了旗舰级性能。据Qwen团队宣称，Qwen3.6-27B在全部主流编码基准测试中均...

2026-04-21 talkingdev

阿里云旗下通义千问团队近日发布了其大型语言模型的最新预览版本——Qwen3.6-Max-Preview。该版本在多个核心能力上实现了显著提升，尤其是在世界知识的掌握与指令遵循的准确性方面表现突出。更为关键的是，模型在广泛...

2026-04-10 talkingdev

据《金融时报》报道，阿里巴巴集团近期进行了一次重要的人事与战略调整。集团已任命阿里云首席技术官周靖人兼任其人工智能（AI）部门的负责人。这一变动紧随公司AI战略的重大转向而发生：阿里巴巴正将其通义千问（Qw...

2026-04-06 talkingdev

一项名为‘简单自蒸馏’（Simple Self-Distillation, SSD）的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于，仅利用模型自身在特定采样配置（如温度参数和截断策略）下生成...

2026-04-03 talkingdev

阿里云通义千问团队近日发布了其最新旗舰模型Qwen3.6-Plus，标志着其在构建面向真实世界的智能体（Agents）道路上迈出了关键一步。该模型在多模态感知与推理能力上实现了显著提升，能够更精准地理解世界，为开发者生...

2026-04-02 talkingdev

富士通研究院近日开源了名为“OneCompression”（简称OneComp）的Python库，这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法，包括GPTQ和DBF，旨在帮助开发者和研究人员高效地将庞大的LL...

2026-03-30 talkingdev

近日，开源AI智能体项目AutoBe发布了一项突破性技术成果，其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率，从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发，...

2026-02-25 talkingdev

近日，通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破，旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...