漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-16 talkingdev

Mistral AI推出开源音频模型Voxtral,开启语音理解新纪元

Mistral AI近日发布了其首个开源音频模型套件Voxtral,标志着开源语音理解技术迈入新阶段。该套件包含两个关键版本:24B参数的大规模应用模型和3B参数的边缘计算优化版本。24B模型凭借庞大参数规模,可处理复杂语音...

Read More
2025-07-13 talkingdev

[开源] 月之暗面 Kimi K2 重磅开源:国产大模型 SOTA 新篇章?

月之暗面(Moonshot AI)近日在GitHub上重磅开源了其Kimi K2系列大型语言模型。作为国内领先的AI公司,月之暗面此举不仅展示了其在大模型研发领域的深厚实力,也为全球开源社区贡献了一股重要的力量。Kimi K2系列旨...

Read More
2025-07-09 talkingdev

Hugging Face发布SmolLM3:小型多语言长上下文推理模型

Hugging Face最新推出的SmolLM3是一款完全开源的3B参数语言模型,支持六种语言,具备强大的推理能力和长上下文处理能力。该模型旨在小型模型领域实现高性能,为多语言处理和复杂推理任务提供了新的解决方案。SmolLM3...

Read More
2025-07-09 talkingdev

AI2发布全开源语言模型OLMo 2系列,32B版本超越GPT-3.5 Turbo

艾伦人工智能研究所(AI2)近日推出OLMo 2全开源语言模型家族,标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模,其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...

Read More
2025-06-27 talkingdev

FLUX.1 Kontext [dev]发布开源权重:消费级硬件实现专业级图像编辑性能

FLUX.1 Kontext [dev]作为一款拥有120亿参数的开源模型,突破性地在消费级硬件上实现了媲美商业闭源软件的图像编辑性能。该模型采用FLUX.1非商业许可协议开放权重,为学术研究和非商业应用提供免费访问权限。技术亮...

Read More
2025-06-27 talkingdev

谷歌发布多模态开源模型Gemma 3n:支持文本、图像和音频输入

谷歌近日发布了具有重大意义的新开源权重模型Gemma 3n,该模型采用多模态设计,专为设备端优化。Gemma 3n能够接受文本、图像和音频作为输入,展现了强大的跨模态处理能力。为推广该模型,谷歌与AMD、Axolotl、Docker...

Read More
2025-06-27 talkingdev

Bria开源新一代T2I模型:4B参数媲美Flux质量,体积缩小三分之二

视觉AI平台服务商Bria推出新一代开源文本生成图像(T2I)模型,其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的生成质量,同时模型体积缩减67%。核心技术亮点包括:集成Contro...

Read More
2025-06-19 talkingdev

Moonshot AI开源模型Kimi-Dev-72B在SWE-bench测试中创下60.4%新纪录

近日,Moonshot AI推出的Kimi-Dev-72B开源模型在SWE-bench Verified测试中取得了60.4%的优异成绩,成为当前开源模型中的新标杆。这一突破性成果得益于其采用的大规模强化学习技术,该技术通过在Docker环境中直接修补...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page