Qwen的相关内容 - 漫话开发者

2026-04-03 talkingdev

通义千问Qwen3.6-Plus发布：迈向原生多模态智能体，开启“氛围编程”新体验

阿里云通义千问团队近日发布了其最新旗舰模型Qwen3.6-Plus，标志着其在构建面向真实世界的智能体（Agents）道路上迈出了关键一步。该模型在多模态感知与推理能力上实现了显著提升，能够更精准地理解世界，为开发者生...

2026-04-02 talkingdev

富士通研究院近日开源了名为“OneCompression”（简称OneComp）的Python库，这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法，包括GPTQ和DBF，旨在帮助开发者和研究人员高效地将庞大的LL...

2026-03-30 talkingdev

近日，开源AI智能体项目AutoBe发布了一项突破性技术成果，其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率，从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发，...

2026-02-25 talkingdev

近日，通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破，旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

2026-02-04 talkingdev

阿里巴巴近日推出了专为编程智能体（Coding Agent）优化的开源模型Qwen3-Coder-Next。该模型基于创新的混合专家（Mixture of Experts， MoE）架构构建，旨在显著提升智能体在代码生成与执行环境交互方面的能力。其核...

2026-02-04 talkingdev

近日，一项名为SWE-Universe的研究提出了一种革命性的可扩展框架，旨在从GitHub的拉取请求中自动构建真实世界的软件工程可验证环境。该研究成功解决了自动化构建中长期存在的三大挑战：构建成功率低、验证机制薄弱以...

2026-02-03 talkingdev

近日，NVIDIA研究团队提出了一种名为“金鹅”（Golden Goose）的创新方法，旨在解决大语言模型（LLM）强化学习领域的一个关键瓶颈。当前，基于可验证奖励的强化学习（RLVR）是解锁LLM复杂推理能力的重要基石，但其发展...

2026-02-03 talkingdev

一项最新研究显示，通过对开源大语言模型进行高效的微调，其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法，仅使用5400对偏好数据对GPT-OSS 120B模型进行训练，使其在RewardBench 2评估基准的人类偏好...