近日,GitHub上开源了一个名为ViBT(Vision Bridge Transformer)的项目,该项目将布朗桥模型(Brownian Bridge Models)扩展至高达200亿参数规模,专门用于高效的图像与视频条件生成任务。ViBT的核心创新在于其采用...
Read More在NeurIPS 2024大会上,NVIDIA发布了一系列面向数字与物理世界AI开发的新工具,其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...
Read More人工智能公司Prime Intellect正式推出INTELLECT-3模型,这是一个基于强化学习训练、具备1060亿参数的混合专家开源模型。该模型采用创新的MoE架构,通过动态激活专家网络显著提升计算效率,在数学推理、代码生成、科...
Read More麻省理工学院与Hugging Face联合研究显示,过去一年中国开发的开源AI模型全球下载量占比达17%,首次超越美国开发者的15.8%。这一数据标志着全球人工智能开发力量格局正在重构。研究指出,中国开源模型的崛起得益于北...
Read MoreMeta公司最新开源的Segment Anything Model 3(SAM 3)标志着图像分割技术进入全新发展阶段。该版本突破性地融合了文本与视觉双重提示能力,用户既可通过文字描述指定分割目标,也能通过点击、框选等视觉交互方式精...
Read More最新发布的《AI实践调查》通过系统化数据采集,揭示了当前AI技术在实际生产环境中的落地情况。报告显示,尽管每周都有新的智能体框架、评估套件、编排层或开源模型涌现,但企业团队在技术采纳方面呈现显著差异化。调...
Read More字节跳动Seed团队在GitHub开源了Depth Anything 3(DA3)项目,这是深度估计领域的重要进展。该模型通过纯Transformer架构和创新的深度射线表示法,实现了无需相机位姿信息的单视图或多视图图像空间一致性深度估计。...
Read More最新行业观察显示,中美两国在人工智能发展路径上正形成战略互补。美国科技界普遍沉迷于通用人工智能(AGI)的终极目标,而中国则更注重具身人工智能(Embodied AI)与开源模型的实际应用落地。具身AI强调智能体与物...
Read More