漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-07 talkingdev

无监督全景分割新突破:CUPS技术利用深度与运动线索实现无标注训练

德国视觉与学习实验室(Visinf)最新提出的CUPS(Contrastive Unsupervised Panoptic Segmentation)技术,开创性地实现了无需人工标注数据的全景分割模型训练。该方法通过挖掘场景中心图像中的深度信息和运动线索,...

Read More
2025-03-18 talkingdev

[论文推荐]DriveLMM-o1:自动驾驶中的视觉推理新突破

近日,DriveLMM-o1项目发布了一款全新的数据集和基准测试,旨在提升自动驾驶系统中逐步视觉推理的准确性和决策能力。该数据集通过模拟复杂的驾驶场景,为人工智能驱动的自动驾驶技术提供了更加精细的视觉推理支持。D...

Read More
2025-03-12 talkingdev

Hugging Face推出LeRobot平台扩展,发布最大开源多模态汽车AI数据集

Hugging Face与Yaak合作推出了L2D数据集,这是目前最大的开源多模态数据集,专为汽车人工智能(AI)领域设计。该数据集包含了从驾驶学校收集的专家和学生驾驶策略,并通过自然语言指令增强了空间智能模型的能力。这...

Read More
2025-02-21 talkingdev

基于3D Gaussian Splats的端到端驾驶RL模型训练取得突破

近日,一项创新的研究展示了使用3D Gaussian Splats渲染的逼真环境来训练端到端驾驶强化学习(RL)模型的潜力。该研究通过构建高度真实的虚拟驾驶场景,显著提升了模型的训练效果。实验结果表明,与传统方法相比,采...

Read More
2024-07-11 talkingdev

论文:SuperFlow推动自动驾驶的3D感知技术进步

SuperFlow是一种新的框架,通过使用连续的LiDAR-camera对进行时空预训练,增强了自动驾驶中的3D感知能力。在自动驾驶技术中,3D感知的重要性不言而喻,它可以帮助自动驾驶汽车更准确地理解周围环境,进行更安全、更...

Read More
2024-07-11 talkingdev

论文:自动驾驶的3D数据生成,PerlDiff方法引领新潮流

PerlDiff方法将3D几何信息与街景图像生成相结合,进一步提高了街景图像生成的精确性。这种方法的提出,无疑为自动驾驶领域的3D数据生成提供了新的研究方向和方法。通过更精确的街景图像生成,自动驾驶技术的安全性和...

Read More
2024-05-28 talkingdev

Scribble2Scene:提升3D场景补全效率的新方法

Scribble2Scene是一种针对语义场景补全的新方法,显著减少了对繁琐标注的需求。传统的3D场景补全技术通常需要大量的数据标注,这不仅耗时费力,而且成本高昂。然而,Scribble2Scene通过利用简单的涂鸦和稀疏的标注就...

Read More
2024-04-28 talkingdev

MIM4D:提升自动驾驶的全新视觉表现方法开源

MIM4D 是一种全新的方法,通过使用双重遮罩图像建模在自动驾驶中提升视觉表现学习。这种方法从多视角视频中捕获空间和时间的详细信息,大大提升了自动驾驶的性能和效率。MIM4D 的开源代码已经在GitHub上发布,对于自...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page