在2024年CVPR(计算机视觉与模式识别)会议中,我们精心策划了一份计算机视觉领域的论文清单。这些论文涵盖了计算机视觉的各个方面,包括深度学习、物体检测、图像识别、语义分割等。每篇论文都代表了该领域的最新研...
Read MorexAI公司近日宣布,其最新旗舰模型Grok-1.5已具备视觉功能,与现有最先进模型相比肩,甚至在某些方面超越。Grok-1.5的推出,标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...
Read MoreSplatPose提出了一种新颖的3D高斯喷溅方法,有效解决了不同姿态下3D物体异常检测的难题。该技术通过模拟光线在物体表面的散射过程,实现了对物体表面细节的精确捕捉。即使在物体姿态多变的情况下,也能够准确地识别...
Read More最新的研究提出了一种从弱到强的引导框架,用于改进多摄像头3D物体检测(MC3D-Det)中的周边精细化处理。该领域借助鸟瞰技术得到了显著增强。该框架通过优化算法,提高了物体检测的精确度和实时性,对于自动驾驶、机...
Read More近日,一项名为ViT-CoMer的神经网络模型问世,增强了Vision Transformers(ViT)在密集预测任务中的表现,而无需预训练。这项研究由卡内基梅隆大学的学者领导,他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...
Read MoreEMIFF是一种创新的基于摄像头的3D检测框架,用于车辆基础设施协同物体检测。它使用多尺度交叉注意力和相机感知通道掩蔽来纠正来自相机异步性的姿态误差。EMIFF的开源代码现在可以在GitHub上获得。
Read More目标检测是识别物体及其边界框的过程。通常只能为训练前选择的一组固定物体进行检测。本研究介绍了一种实时方法,可以进行开放词汇目标检测,这意味着它可以检测任何在运行时指定的物体组合的边界框。该方法使用了一...
Read MoreHEDNet是一种新的编码器-解码器网络,旨在增强自动驾驶中的3D物体检测能力,特别是针对3D场景中稀疏点分布的挑战。该网络采用多分支设计,结合了高效的感受野对齐和多尺度信息融合技术,能够快速而准确地检测出道路...
Read More研究人员开发了Diffusion-SS3D,这是一种改进半监督3D物体检测的新方法,使用扩散模型添加噪声到3D空间中的物体大小和类别标签分布,然后使用扩散模型去噪和生成更好的边界框输出。
Read More近日,一项新的研究通过引入基于记忆的框架,为跨域物体检测问题带来了新的解决方案。该方法通过将源实例的特征存储在记忆模块中,从而克服了以前方法的局限性,实现了更好的目标实例对齐。这项创新的研究成果已经被...
Read More