开源模型的相关内容 - 漫话开发者

2025-11-13 talkingdev

百度开源多模态AI模型ERNIE-4.5：28B参数动态激活3B，宣称超越GPT-5与Gemini

百度最新发布的开源多模态人工智能模型ERNIE-4.5-VL-28B-A3B-Thinking在技术架构上实现重大突破。该模型采用280亿参数规模，但通过创新的动态路由架构，在推理时仅激活30亿参数，即可在多项任务性能上媲美甚至超越规...

2025-11-07 talkingdev

中国人工智能实验室月之暗面（Moonshot AI）近日开源其革命性推理模型Kimi K2，在关键基准测试中展现出与国际顶尖模型的竞争实力。该模型在衡量综合认知能力的‘人类终极考试’（Humanity's Last Exam）中取得44.9%的...

2025-11-07 talkingdev

中国人工智能实验室月之暗面（Moonshot AI）最新推出的Kimi K2 Thinking模型，以其创新的混合专家（MoE）推理架构引发行业关注。该模型在Humanity's Last Exam综合能力测评和BrowseComp浏览理解基准测试中，部分指标...

2025-11-07 talkingdev

中国人工智能初创公司月之暗面（Moonshot）于11月6日正式推出新一代开源生成式AI模型Kimi K2 Thinking。该模型在智能体（Agentic）能力方面表现突出，据称已超越OpenAI的GPT-5水平，成为当前开源领域最具竞争力的AI...

2025-09-23 talkingdev

阿里巴巴正式推出通义千问Qwen3-Omni系列开源人工智能模型，该模型实现了对文本、音频、图像和视频四类模态数据的统一处理能力，并能同步生成文本与语音输出。作为中国科技企业对抗美国科技巨头的重要技术突破，Qwen...

2025-09-14 talkingdev

谷歌研究团队正式推出VaultGemma模型，这是目前全球最大的基于差分隐私技术从头训练的开源大语言模型，参数量达到10亿级别。该模型已在Hugging Face和Kaggle平台开放访问。VaultGemma采用严格的差分隐私训练框架，在...

2025-09-11 talkingdev

Mini-o3作为新兴开源视觉推理模型，实现了与OpenAI o3类似的多轮交互能力，支持高达数十轮的连续对话推理。该项目完全公开训练流程，涵盖数据构建、模型架构与训练策略，为学术界和工业界提供可复现的视觉-语言智能...

2025-09-02 talkingdev

据路透社报道，Meta正在采取一项战略性临时措施：在开发下一代大语言模型Llama 5期间，计划将谷歌和OpenAI的AI模型集成到其产品生态中。这一决策反映了当前AI军备竞赛中技术迭代与产品化需求之间的平衡策略。值得注...