漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-23 talkingdev

Qwen3.6-27B震撼发布:27B稠密模型实现旗舰级编码性能,超越前代397B MoE巨兽

Qwen团队今日发布了其最新的开源权重模型Qwen3.6-27B,在AI社区引发广泛关注。该模型虽然仅有27B参数(稠密架构),却在智能体编码任务中实现了旗舰级性能。据Qwen团队宣称,Qwen3.6-27B在全部主流编码基准测试中均...

Read More
2026-04-21 talkingdev

通义千问Qwen3.6-Max-Preview发布:世界知识更强,代码能力大幅进化

阿里云旗下通义千问团队近日发布了其大型语言模型的最新预览版本——Qwen3.6-Max-Preview。该版本在多个核心能力上实现了显著提升,尤其是在世界知识的掌握与指令遵循的准确性方面表现突出。更为关键的是,模型在广泛...

Read More
2026-04-10 talkingdev

阿里云CTO周靖人接掌AI团队,开源通义千问转向商业化MaaS引高层变动

据《金融时报》报道,阿里巴巴集团近期进行了一次重要的人事与战略调整。集团已任命阿里云首席技术官周靖人兼任其人工智能(AI)部门的负责人。这一变动紧随公司AI战略的重大转向而发生:阿里巴巴正将其通义千问(Qw...

Read More
2026-04-06 talkingdev

论文推荐|简单自蒸馏显著提升大模型代码生成能力,无需额外验证器或强化学习

一项名为‘简单自蒸馏’(Simple Self-Distillation, SSD)的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于,仅利用模型自身在特定采样配置(如温度参数和截断策略)下生成...

Read More
2026-04-03 talkingdev

通义千问Qwen3.6-Plus发布:迈向原生多模态智能体,开启“氛围编程”新体验

阿里云通义千问团队近日发布了其最新旗舰模型Qwen3.6-Plus,标志着其在构建面向真实世界的智能体(Agents)道路上迈出了关键一步。该模型在多模态感知与推理能力上实现了显著提升,能够更精准地理解世界,为开发者生...

Read More
2026-04-02 talkingdev

开源|富士通发布OneComp:面向大语言模型的后训练量化开源库

富士通研究院近日开源了名为“OneCompression”(简称OneComp)的Python库,这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法,包括GPTQ和DBF,旨在帮助开发者和研究人员高效地将庞大的LL...

Read More
2026-03-30 talkingdev

开源|AutoBe革命性突破:函数调用成功率从6.75%跃升至99.8%,AI自动生成后端代码迈入新阶段

近日,开源AI智能体项目AutoBe发布了一项突破性技术成果,其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率,从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发,...

Read More
2026-02-25 talkingdev

通义千问Qwen3.5-35B-A3B模型发布:支持26万超长上下文,集成多模态与强化学习突破

近日,通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破,旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page