开源大模型的相关内容 - 漫话开发者

2026-07-20 talkingdev

阿里巴巴宣布2.4万亿参数模型Qwen3.8即将开源，预览版已上线

阿里巴巴通义千问团队正式公布Qwen3.8，这是一款参数规模高达2.4万亿的超大规模语言模型，并明确表示将以开放权重（Open-Weight）的方式面向全球发布。这不仅是Qwen系列模型参数的又一次飞跃，也反映出阿里巴巴在开...

2026-06-29 talkingdev

随着AI编程工具如Claude Code和GitHub Codex的普及，开发者对自主可控、低成本且注重隐私的替代方案需求日益增长。近日，一篇详尽的教程指南提出，利用开源模型和工具搭建本地编码代理成为新趋势。该指南深入剖析了...

2026-06-27 talkingdev

在人工智能领域，开放权重（open-weights）的大语言模型与闭源模型之间的性能差距一直是业界关注的焦点。近日，一项基于“人工分析基准”（Artificial Analysis benchmarks）的预测研究指出，到2026年12月3日，一款能...

2026-06-15 talkingdev

近日，巴西里约热内卢市政府下属机构IplanRIO发布的“自研”大语言模型Rio-3.5-Open-397B陷入争议。GitHub社区及技术专家发现，该模型并非如其宣传所言“完全原创”，其权重实际上是通过对现有模型——Nex-AGI团队的Nex-N2...

2026-06-14 talkingdev

智谱AI（Zhipu AI）联合创始人兼CEO张鹏（jietang）在社交媒体X上正式宣布，GLM系列最新大语言模型GLM 5.2现已完全开源。这一举动在AI社区引发广泛关注。张鹏在声明中强调，当前某些前沿模型突然因非技术原因被限制...

2026-06-01 talkingdev

MiniMax 最新发布的开源权重模型 M3 在编码和智能体（Agentic）任务上达到前沿水平。该模型不仅支持图像和视频输入，还可以直接操作桌面计算机。技术上，M3 引入了一种新的注意力架构，支持上下文缩放，并能够处理多...

2026-05-03 talkingdev

近日，一款名为Kimi K2.5的开源权重模型在编程挑战中击败了包括Claude、GPT-5.5和Gemini在内的多个顶级闭源模型。这一事件迅速在科技圈引发广泛关注，尤其在Hacker News上引发了激烈讨论。Kimi K2.5由中国团队开发，...

2026-04-29 talkingdev

人工智能编程领域迎来新玩家，初创公司Poolside正式发布Laguna系列编程模型，包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型，专为长周期、复杂推理的编程任务设计（Long-horizon co...