漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-02 talkingdev

开源|ViBT:20B参数视觉桥接Transformer,高效图像与视频编辑新突破

近日,GitHub上开源了一个名为ViBT(Vision Bridge Transformer)的项目,该项目将布朗桥模型(Brownian Bridge Models)扩展至高达200亿参数规模,专门用于高效的图像与视频条件生成任务。ViBT的核心创新在于其采用...

Read More
2025-12-02 talkingdev

NVIDIA发布全球首个开源自动驾驶推理模型Alpamayo-R1,推动物理AI开放生态

在NeurIPS 2024大会上,NVIDIA发布了一系列面向数字与物理世界AI开发的新工具,其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...

Read More
2025-11-29 talkingdev

Prime Intellect发布INTELLECT-3:1060亿参数开源MOE模型在数学代码科学领域超越更大模型

人工智能公司Prime Intellect正式推出INTELLECT-3模型,这是一个基于强化学习训练、具备1060亿参数的混合专家开源模型。该模型采用创新的MoE架构,通过动态激活专家网络显著提升计算效率,在数学推理、代码生成、科...

Read More
2025-11-26 talkingdev

中国开源AI模型全球下载份额首超美国,MIT与Hugging Face研究揭示行业格局变迁

麻省理工学院与Hugging Face联合研究显示,过去一年中国开发的开源AI模型全球下载量占比达17%,首次超越美国开发者的15.8%。这一数据标志着全球人工智能开发力量格局正在重构。研究指出,中国开源模型的崛起得益于北...

Read More
2025-11-20 talkingdev

Meta开源SAM 3:多模态提示实现智能分割新突破

Meta公司最新开源的Segment Anything Model 3(SAM 3)标志着图像分割技术进入全新发展阶段。该版本突破性地融合了文本与视觉双重提示能力,用户既可通过文字描述指定分割目标,也能通过点击、框选等视觉交互方式精...

Read More
2025-11-19 talkingdev

AI实践调查报告揭示企业AI应用现状与挑战

最新发布的《AI实践调查》通过系统化数据采集,揭示了当前AI技术在实际生产环境中的落地情况。报告显示,尽管每周都有新的智能体框架、评估套件、编排层或开源模型涌现,但企业团队在技术采纳方面呈现显著差异化。调...

Read More
2025-11-17 talkingdev

开源|字节跳动Seed团队发布Depth Anything 3:通用单/多视图深度估计新突破

字节跳动Seed团队在GitHub开源了Depth Anything 3(DA3)项目,这是深度估计领域的重要进展。该模型通过纯Transformer架构和创新的深度射线表示法,实现了无需相机位姿信息的单视图或多视图图像空间一致性深度估计。...

Read More
2025-11-16 talkingdev

中美AI战略呈现互补格局:中国聚焦具身AI与开源模型,美国主导AGI路线

最新行业观察显示,中美两国在人工智能发展路径上正形成战略互补。美国科技界普遍沉迷于通用人工智能(AGI)的终极目标,而中国则更注重具身人工智能(Embodied AI)与开源模型的实际应用落地。具身AI强调智能体与物...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page