漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-26 talkingdev

SISO技术:单张图像驱动的迭代生成与编辑

SISO(Single Image Iterative Subject-driven Generation and Editing)是一种无需训练的推理时优化方法,能够从单张图像中个性化生成或编辑图像内容。该技术通过高效的优化算法,直接在推理阶段实现对图像主体的个...

Read More
2025-03-26 talkingdev

开源Dereflection Any Image:基于扩散模型的图像反反射新技术

近日,Dereflection Any Image(DAI)项目推出了一种基于扩散模型的图像反反射新技术,该技术利用高质量数据集和渐进式训练方法,显著提升了图像反反射的效果。反反射技术一直是计算机视觉领域的重要研究方向,尤其...

Read More
2025-03-25 talkingdev

Roblox开源Cube 3D AI模型,文本生成3D对象助力创作效率提升

Roblox近日开源了其最新的AI模型Cube 3D,该模型能够通过文本提示生成3D对象,旨在提升创作效率。Cube 3D采用了先进的标记化技术,并通过授权和公开可用的数据集,以及Roblox自身的体验数据进行训练。未来,Cube 3D...

Read More
2025-03-20 talkingdev

[论文推荐] KoLMogorov 测试:通过代码生成实现压缩

Meta 最近引入了一种新的基准测试,用于评估语言模型的推理能力和知识水平。该测试向语言模型提供一个长序列数据,并要求模型输出能够重新生成该序列并停止运行的最短程序。这一过程被称为 Kolmogorov 压缩,且在多...

Read More
2025-03-18 talkingdev

[论文推荐]DriveLMM-o1:自动驾驶中的视觉推理新突破

近日,DriveLMM-o1项目发布了一款全新的数据集和基准测试,旨在提升自动驾驶系统中逐步视觉推理的准确性和决策能力。该数据集通过模拟复杂的驾驶场景,为人工智能驱动的自动驾驶技术提供了更加精细的视觉推理支持。D...

Read More
2025-03-17 talkingdev

Luma推出多模态模型预训练新方法:Inductive Moment Matching

Luma首席科学家宋嘉明,作为最早为扩散模型开发加速算法的先驱,近日发布了新的多模态预训练方法——Inductive Moment Matching(IMM)。这一新方法不仅超越了传统扩散模型在样本质量上的表现,还实现了10倍以上的效率...

Read More
2025-03-17 talkingdev

[论文推荐] DiLoCo跨数据中心训练算法的扩展定律

DeepMind近日发布了一篇详细介绍DiLoCo跨数据中心训练算法扩展定律的论文。DiLoCo是一种强大的训练算法,能够在全球范围内同步梯度,确保模型训练的稳定性。该算法通过在多个数据中心之间进行分布式训练,有效提升了...

Read More
2025-03-14 talkingdev

AnyMoLe:利用视频扩散模型生成任意角色的中间帧运动

在计算机视觉和图形学领域,生成角色的中间帧运动一直是一个具有挑战性的任务,尤其是当涉及个性化角色的动画生成时。传统的动画生成方法需要针对特定角色进行数据收集和模型训练,而新项目AnyMoLe通过引入视频扩散...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page