漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-03 talkingdev

Mistral AI发布Mistral 3系列开源模型:含稀疏MoE巨兽与多款密集模型

人工智能领域迎来重要开源进展。Mistral AI正式发布了其新一代Mistral 3系列模型,该系列包含两大技术路线:一是三款不同规模的密集模型(参数规模分别为140亿、80亿和30亿),二是备受瞩目的Mistral Large 3稀疏混...

Read More
2025-12-02 talkingdev

开源|ViBT:20B参数视觉桥接Transformer,高效图像与视频编辑新突破

近日,GitHub上开源了一个名为ViBT(Vision Bridge Transformer)的项目,该项目将布朗桥模型(Brownian Bridge Models)扩展至高达200亿参数规模,专门用于高效的图像与视频条件生成任务。ViBT的核心创新在于其采用...

Read More
2025-12-02 talkingdev

开源|苹果发布STARFlow与STARFlow-V:基于Transformer自回归流的图像与视频生成新突破

苹果公司在Hugging Face平台开源了STARFlow与STARFlow-V模型,标志着图像与视频生成领域迎来了一项重要的技术进展。STARFlow是一种创新的Transformer自回归流模型,其核心在于巧妙地将自回归模型强大的表达能力与归...

Read More
2025-12-02 talkingdev

NVIDIA发布全球首个开源自动驾驶推理模型Alpamayo-R1,推动物理AI开放生态

在NeurIPS 2024大会上,NVIDIA发布了一系列面向数字与物理世界AI开发的新工具,其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...

Read More
2025-12-01 talkingdev

技术解析:Prompt缓存如何工作?深度剖析vLLM的Paged Attention与自动前缀缓存机制

在大型语言模型推理优化领域,Prompt缓存技术正成为提升服务效率、降低计算成本的关键前沿技术。本文深入解析了Prompt缓存的核心工作原理,特别聚焦于vLLM框架中创新的Paged Attention机制及其实现的自动前缀缓存。...

Read More
2025-11-29 talkingdev

Prime Intellect发布INTELLECT-3:1060亿参数开源MOE模型在数学代码科学领域超越更大模型

人工智能公司Prime Intellect正式推出INTELLECT-3模型,这是一个基于强化学习训练、具备1060亿参数的混合专家开源模型。该模型采用创新的MoE架构,通过动态激活专家网络显著提升计算效率,在数学推理、代码生成、科...

Read More
2025-11-29 talkingdev

DeepSeekMath-V2模型在IMO 2025与中国奥数2024斩获金牌级表现

中国AI初创公司深度求索(DeepSeek)最新发布的DeepSeekMath-V2数学模型在国际数学奥林匹克竞赛(IMO)2025及中国数学奥林匹克2024中达到金牌级水平,标志着AI在复杂数学推理领域的重大突破。该模型通过创新的推理架...

Read More
2025-11-28 talkingdev

为什么需要强一致性?Aurora DSQL如何解决最终一致性的痛点

在分布式系统领域,数据一致性始终是开发者面临的核心挑战。传统最终一致性模型虽然能提升系统可用性,却给客户和应用程序构建者带来显著困扰——不仅需要设计复杂的数据同步兜底方案,还容易因数据延迟导致业务逻辑错...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page