物体检测的相关内容 - 漫话开发者

2024-06-25 talkingdev

2024年CVPR顶会论文精选-计算机视觉论文Top40

在2024年CVPR（计算机视觉与模式识别）会议中，我们精心策划了一份计算机视觉领域的论文清单。这些论文涵盖了计算机视觉的各个方面，包括深度学习、物体检测、图像识别、语义分割等。每篇论文都代表了该领域的最新研...

2024-04-15 talkingdev

xAI公司近日宣布，其最新旗舰模型Grok-1.5已具备视觉功能，与现有最先进模型相比肩，甚至在某些方面超越。Grok-1.5的推出，标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...

2024-04-12 talkingdev

SplatPose提出了一种新颖的3D高斯喷溅方法，有效解决了不同姿态下3D物体异常检测的难题。该技术通过模拟光线在物体表面的散射过程，实现了对物体表面细节的精确捕捉。即使在物体姿态多变的情况下，也能够准确地识别...

2024-04-12 talkingdev

最新的研究提出了一种从弱到强的引导框架，用于改进多摄像头3D物体检测（MC3D-Det）中的周边精细化处理。该领域借助鸟瞰技术得到了显著增强。该框架通过优化算法，提高了物体检测的精确度和实时性，对于自动驾驶、机...

2024-03-15 talkingdev

近日，一项名为ViT-CoMer的神经网络模型问世，增强了Vision Transformers（ViT）在密集预测任务中的表现，而无需预训练。这项研究由卡内基梅隆大学的学者领导，他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...

2024-02-29 talkingdev

EMIFF是一种创新的基于摄像头的3D检测框架，用于车辆基础设施协同物体检测。它使用多尺度交叉注意力和相机感知通道掩蔽来纠正来自相机异步性的姿态误差。EMIFF的开源代码现在可以在GitHub上获得。

2024-02-09 talkingdev

目标检测是识别物体及其边界框的过程。通常只能为训练前选择的一组固定物体进行检测。本研究介绍了一种实时方法，可以进行开放词汇目标检测，这意味着它可以检测任何在运行时指定的物体组合的边界框。该方法使用了一...

2024-01-26 talkingdev

HEDNet是一种新的编码器-解码器网络，旨在增强自动驾驶中的3D物体检测能力，特别是针对3D场景中稀疏点分布的挑战。该网络采用多分支设计，结合了高效的感受野对齐和多尺度信息融合技术，能够快速而准确地检测出道路...