开源|里约热内卢“自研”大模型被曝实为“拼接怪”:397B参数模型被指直接合并现有权重
talkingdev • 2026-06-15
2404 views
近日,巴西里约热内卢市政府下属机构IplanRIO发布的“自研”大语言模型Rio-3.5-Open-397B陷入争议。GitHub社区及技术专家发现,该模型并非如其宣传所言“完全原创”,其权重实际上是通过对现有模型——Nex-AGI团队的Nex-N2_pro与阿里通义千问 Qwen3.5-397B——进行逐元素合并(element-wise merge)而来。具体而言,其权重可近似表示为 0.6 × Nex-N2_pro + 0.4 × Qwen。这一发现引发了关于AI开源社区模型透明度与学术诚信的广泛讨论。Nex-AGI团队在官方GitHub Issue中详细展示了对比数据,指出权重相似度极高,并质疑了IplanRIO声称“从头训练”的说法。尽管“拼接”或“合并”模型在开源社区中并非罕见,但将其作为原创成果发布并用于政府项目,可能涉及知识产权与伦理问题。此事不仅影响巴西本土AI研发的公信力,也为全球“开源大模型”的权属界定和再发布规范敲响警钟。目前,该议题已在Hacker News上获得超过300点的高热度讨论,凸显了社区对技术透明性的高度关注。
核心要点
- 巴西里约热内卢政府宣称自研的397B参数大模型Rio-3.5-Open-397B被指实际上是通过权重合并现有模型(Nex-N2_pro和Qwen3.5-397B)而成,并非原创训练。
- Nex-AGI团队在GitHub上公开举证,指出该模型权重与己方及阿里模型的合并结果高度吻合,质疑其科研诚信。
- 事件引发AI开源社区对模型透明度、IP归属及“自研”定义的大讨论,凸显了模型复用声明中的伦理与合规问题。