漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-17 talkingdev

开源|字节跳动Seed团队发布Depth Anything 3:通用单/多视图深度估计新突破

字节跳动Seed团队在GitHub开源了Depth Anything 3(DA3)项目,这是深度估计领域的重要进展。该模型通过纯Transformer架构和创新的深度射线表示法,实现了无需相机位姿信息的单视图或多视图图像空间一致性深度估计。...

Read More
2025-04-07 talkingdev

无监督全景分割新突破:CUPS技术利用深度与运动线索实现无标注训练

德国视觉与学习实验室(Visinf)最新提出的CUPS(Contrastive Unsupervised Panoptic Segmentation)技术,开创性地实现了无需人工标注数据的全景分割模型训练。该方法通过挖掘场景中心图像中的深度信息和运动线索,...

Read More
2024-07-18 talkingdev

论文:立体匹配的深度估计方法,视频立体匹配增强深度估计

科研人员最近提出了一种新的视频立体匹配方法,该方法通过确保时间连续性,增强了深度估计的能力。立体匹配是计算机视觉中的一个核心任务,主要用于恢复场景的深度信息。新的立体匹配方法在处理视频内容时,特别强调...

Read More
2024-07-16 talkingdev

ProDepth:动态场景中的单目深度估计新框架

ProDepth是一种新的单目深度估计框架,解决了动态场景中移动物体所引发的问题。它采用概率方法来识别并纠正深度估计中的不一致性。在动态场景中,移动物体会对深度估计产生重大影响,这是一种常见的问题。ProDepth通...

Read More
2024-06-21 talkingdev

GeoBench深度和单目几何模型标准突破

一项新的基准测试对当前先进的深度和表面法线估计模型进行了评估。这个基准测试将在众多模型中筛选出表现最优秀的,为研究者和开发者提供参考。这一进步对于提升计算机视觉技术,尤其是在深度感知和三维建模方面,具...

Read More
2024-03-12 talkingdev

论文:稳定扩散技术提升深度估计准确性

最新的研究表明,新型Stealing Stable Diffusion (SSD)技术能够提高单目深度估计在低光或雨天等恶劣环境下的准确性。该技术通过稳定扩散过程,克服了在这些条件下深度估计的挑战,同时能够提供更好的细节捕捉和更精...

Read More
2024-01-24 talkingdev

DepthAnything:通过大规模数据集提高单目深度估计精度

Depth Anything是一种新的单目深度估计方法,它依赖于约6200万张图像的大规模数据集来提高其精度。通过使用数据增强和预训练编码器的辅助监督,该模型实现了令人印象深刻的泛化能力,并在深度估计方面树立了新的标准...

Read More
2023-11-16 talkingdev

论文:MonoDiffusion-无需地面真值的深度估计技术

MonoDiffusion是一种新的自监督单目深度估计框架,其独特的方法将深度估计问题视为迭代去噪过程。它利用预训练的教师模型指导伪地面真值扩散过程,从而提高深度图精度,无需在训练中使用实际的深度真值。

Read More
  1. Next Page