基础模型的相关内容 - 漫话开发者

2026-06-02 talkingdev

英伟达发布Cosmos 3：物理AI开源基础模型，融合视觉推理与多模态生成

英伟达今日正式发布Cosmos 3，这是一款面向物理AI的开源世界基础模型，标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器（Mixture-of-Transformers）架构，将视觉推理、世界生成...

2026-06-02 talkingdev

阿里巴巴通义千问团队近日发布了其最新的多模态智能体模型Qwen3.7-Plus，标志着通用人工智能在感知与行动融合层面迈出了重要一步。该模型将视觉识别与语言理解能力深度融合，构建了一个单一、通用的多模态智能体基础...

2026-05-19 talkingdev

近日，一款名为HRM-Text的新型文本生成模型在GitHub上开源，引发了AI社区的广泛关注。该模型基于HRM架构，参数规模为10亿（1B），但其最大的亮点在于惊人的训练效率。据项目介绍，HRM-Text的训练所需的计算资源和数...

2026-05-19 talkingdev

人工智能安全与研究公司 Anthropic 宣布收购开发者工具初创公司 Stainless。Stainless 专注于 SDK 自动化平台，其解决方案能够帮助开发者快速生成和维护高质量的软件开发工具包。该平台在 AI 行业中拥有广泛的用户基...

2026-04-29 talkingdev

人工智能编程领域迎来新玩家，初创公司Poolside正式发布Laguna系列编程模型，包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型，专为长周期、复杂推理的编程任务设计（Long-horizon co...

2026-04-25 talkingdev

据彭博社独家报道，科技巨头谷歌计划向人工智能初创公司Anthropic投资高达400亿美元。这一巨额投资规模，超越了此前微软对OpenAI的数十亿美元注资，标志着AI领域的资本竞赛进入白热化阶段。Anthropic作为OpenAI的主...

2026-04-03 talkingdev

谷歌DeepMind正式推出了新一代开源模型系列Gemma 4，该系列模型基于其旗舰模型Gemini 3的研究成果构建，被官方称为“迄今为止最智能的开源模型”。Gemma 4的核心优化方向聚焦于复杂的推理能力和智能体（Agent）工作流...

2026-04-03 talkingdev

在ChatGPT于2022年底掀起生成式AI浪潮后，开源大模型的接力棒在多家公司间传递。近日，美国AI初创公司Arcee AI正式发布了其重量级开源模型——Trinity-Large-Thinking。该模型采用混合专家架构，参数量高达3990亿，是...