漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-13 talkingdev

百度开源多模态AI模型ERNIE-4.5:28B参数动态激活3B,宣称超越GPT-5与Gemini

百度最新发布的开源多模态人工智能模型ERNIE-4.5-VL-28B-A3B-Thinking在技术架构上实现重大突破。该模型采用280亿参数规模,但通过创新的动态路由架构,在推理时仅激活30亿参数,即可在多项任务性能上媲美甚至超越规...

Read More
2025-11-07 talkingdev

开源|月之暗面Kimi K2推理模型:多项基准超越GPT-5与Claude Sonnet 4.5

中国人工智能实验室月之暗面(Moonshot AI)近日开源其革命性推理模型Kimi K2,在关键基准测试中展现出与国际顶尖模型的竞争实力。该模型在衡量综合认知能力的‘人类终极考试’(Humanity's Last Exam)中取得44.9%的...

Read More
2025-11-07 talkingdev

深度解析月之暗面Kimi K2推理模型:国产MoE架构突破性能边界

中国人工智能实验室月之暗面(Moonshot AI)最新推出的Kimi K2 Thinking模型,以其创新的混合专家(MoE)推理架构引发行业关注。该模型在Humanity's Last Exam综合能力测评和BrowseComp浏览理解基准测试中,部分指标...

Read More
2025-11-07 talkingdev

月之暗面发布开源模型Kimi K2 Thinking,宣称在智能体能力上超越GPT-5

中国人工智能初创公司月之暗面(Moonshot)于11月6日正式推出新一代开源生成式AI模型Kimi K2 Thinking。该模型在智能体(Agentic)能力方面表现突出,据称已超越OpenAI的GPT-5水平,成为当前开源领域最具竞争力的AI...

Read More
2025-09-23 talkingdev

阿里发布通义千问Qwen3-Omni:开源多模态AI模型可处理文本、音频、图像及视频输入并生成文本与语音输出

阿里巴巴正式推出通义千问Qwen3-Omni系列开源人工智能模型,该模型实现了对文本、音频、图像和视频四类模态数据的统一处理能力,并能同步生成文本与语音输出。作为中国科技企业对抗美国科技巨头的重要技术突破,Qwen...

Read More
2025-09-14 talkingdev

谷歌发布VaultGemma:全球最大具备差分隐私训练的开源10亿参数LLM

谷歌研究团队正式推出VaultGemma模型,这是目前全球最大的基于差分隐私技术从头训练的开源大语言模型,参数量达到10亿级别。该模型已在Hugging Face和Kaggle平台开放访问。VaultGemma采用严格的差分隐私训练框架,在...

Read More
2025-09-11 talkingdev

开源|Mini-o3:开源多轮视觉推理模型挑战OpenAI o3

Mini-o3作为新兴开源视觉推理模型,实现了与OpenAI o3类似的多轮交互能力,支持高达数十轮的连续对话推理。该项目完全公开训练流程,涵盖数据构建、模型架构与训练策略,为学术界和工业界提供可复现的视觉-语言智能...

Read More
2025-09-02 talkingdev

Meta考虑在Llama 5开发期间临时整合谷歌和OpenAI模型

据路透社报道,Meta正在采取一项战略性临时措施:在开发下一代大语言模型Llama 5期间,计划将谷歌和OpenAI的AI模型集成到其产品生态中。这一决策反映了当前AI军备竞赛中技术迭代与产品化需求之间的平衡策略。值得注...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page