开源模型的相关内容 - 漫话开发者

2026-06-02 talkingdev

英伟达发布Cosmos 3：物理AI开源基础模型，融合视觉推理与多模态生成

英伟达今日正式发布Cosmos 3，这是一款面向物理AI的开源世界基础模型，标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器（Mixture-of-Transformers）架构，将视觉推理、世界生成...

2026-06-01 talkingdev

MiniMax 最新发布的开源权重模型 M3 在编码和智能体（Agentic）任务上达到前沿水平。该模型不仅支持图像和视频输入，还可以直接操作桌面计算机。技术上，M3 引入了一种新的注意力架构，支持上下文缩放，并能够处理多...

2026-05-29 talkingdev

在人工智能领域，开源模型的性能与顶尖闭源模型之间的差距一直是业界关注的焦点。最近一篇来自LessWrong平台的深入分析指出，尽管开源模型在整体能力上仍不及GPT-4、Claude等最先进的闭源模型，但实际差距并没有想象...

2026-05-14 talkingdev

Vercel最新发布了一份基于其AI网关产品七个月生产流量数据的分析报告，样本覆盖了数百个模型和超过20万个团队。报告揭示了几个显著趋势：一是智能体（Agentic）工作负载呈现爆发式增长，这类负载在处理时需要动态调...

2026-05-11 talkingdev

欧洲AI新星MistralAI在过去一年实现了惊人的20倍年度经常性收入（ARR）增长，并有望在今年内突破10亿美元大关。这一快速增长使其成为在由美国科技巨头主导的大模型市场中，一个不容忽视的“主权”力量。Mistral的核心...

2026-05-03 talkingdev

近日，一款名为Kimi K2.5的开源权重模型在编程挑战中击败了包括Claude、GPT-5.5和Gemini在内的多个顶级闭源模型。这一事件迅速在科技圈引发广泛关注，尤其在Hacker News上引发了激烈讨论。Kimi K2.5由中国团队开发，...

2026-04-29 talkingdev

人工智能编程领域迎来新玩家，初创公司Poolside正式发布Laguna系列编程模型，包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型，专为长周期、复杂推理的编程任务设计（Long-horizon co...

2026-04-23 talkingdev

Qwen团队今日发布了其最新的开源权重模型Qwen3.6-27B，在AI社区引发广泛关注。该模型虽然仅有27B参数（稠密架构），却在智能体编码任务中实现了旗舰级性能。据Qwen团队宣称，Qwen3.6-27B在全部主流编码基准测试中均...