深度估计的相关内容 - 漫话开发者

2026-04-27 talkingdev

论文推荐|Vision Banana通用视觉模型：将图像生成重定义为感知任务，刷新SOTA

来自arxiv的最新研究提出了一种名为Vision Banana的通用视觉模型，该模型的核心创新在于将传统的视觉感知任务重新表述为图像生成问题。通过指令微调（instruction-tuning）的图像生成模型，Vision Banana能够在多种...

2025-11-17 talkingdev

字节跳动Seed团队在GitHub开源了Depth Anything 3（DA3）项目，这是深度估计领域的重要进展。该模型通过纯Transformer架构和创新的深度射线表示法，实现了无需相机位姿信息的单视图或多视图图像空间一致性深度估计。...

2025-04-07 talkingdev

德国视觉与学习实验室（Visinf）最新提出的CUPS（Contrastive Unsupervised Panoptic Segmentation）技术，开创性地实现了无需人工标注数据的全景分割模型训练。该方法通过挖掘场景中心图像中的深度信息和运动线索，...

2024-07-18 talkingdev

科研人员最近提出了一种新的视频立体匹配方法，该方法通过确保时间连续性，增强了深度估计的能力。立体匹配是计算机视觉中的一个核心任务，主要用于恢复场景的深度信息。新的立体匹配方法在处理视频内容时，特别强调...

2024-07-16 talkingdev

ProDepth是一种新的单目深度估计框架，解决了动态场景中移动物体所引发的问题。它采用概率方法来识别并纠正深度估计中的不一致性。在动态场景中，移动物体会对深度估计产生重大影响，这是一种常见的问题。ProDepth通...

2024-06-21 talkingdev

一项新的基准测试对当前先进的深度和表面法线估计模型进行了评估。这个基准测试将在众多模型中筛选出表现最优秀的，为研究者和开发者提供参考。这一进步对于提升计算机视觉技术，尤其是在深度感知和三维建模方面，具...

2024-03-12 talkingdev

最新的研究表明，新型Stealing Stable Diffusion (SSD)技术能够提高单目深度估计在低光或雨天等恶劣环境下的准确性。该技术通过稳定扩散过程，克服了在这些条件下深度估计的挑战，同时能够提供更好的细节捕捉和更精...

2024-01-24 talkingdev

Depth Anything是一种新的单目深度估计方法，它依赖于约6200万张图像的大规模数据集来提高其精度。通过使用数据增强和预训练编码器的辅助监督，该模型实现了令人印象深刻的泛化能力，并在深度估计方面树立了新的标准...