MF-MOS是一种新模型,可以更好地使用LiDAR技术检测自动驾驶中的运动目标。该模型独特地分离运动和语义信息,使用残差图进行运动捕捉,使用距离图像进行语义引导。该模型的发布将进一步推动自动驾驶技术的发展。
Read MoreDeFlow是一种用于估计场景中三维运动的新方法,这是自动驾驶所必需的关键技能。它通过从基于体素的方法向基于点特征的方法过渡,并使用门控循环单元细化和引入新的损失函数,克服了传统体素化方法的局限性。
Read MoreHEDNet是一种新的编码器-解码器网络,旨在增强自动驾驶中的3D物体检测能力,特别是针对3D场景中稀疏点分布的挑战。该网络采用多分支设计,结合了高效的感受野对齐和多尺度信息融合技术,能够快速而准确地检测出道路...
Read More人工通用智能(AGI)通常被定义为在大部分经济有价值的工作中超越人类能力的自主系统。自动驾驶的最新发展是增加自动化的社会动态的一个好的早期案例研究。驾驶是一个难以自动化的问题,其自动化将影响大量人力资源...
Read MoreDepth Anything是一种新的单目深度估计方法,它依赖于约6200万张图像的大规模数据集来提高其精度。通过使用数据增强和预训练编码器的辅助监督,该模型实现了令人印象深刻的泛化能力,并在深度估计方面树立了新的标准...
Read More特斯拉开始推出全自动驾驶Beta v12更新,将车辆控制从显式的C++代码转移到了基于AI的单一神经网络。这一发布标志着该公司实现自动驾驶雄心壮志的重要进展,但是该软件仍被标记为测试版。在软件被小心翼翼地推向选择...
Read More据悉,苹果现在将集中精力开发更接近特斯拉汽车的驾驶辅助功能,其自动驾驶系统将具备转向和制动/加速支持,但驾驶员仍将控制汽车,并必须注意道路情况。
Read More本文探讨了开发自动驾驶汽车视觉基础模型(VFMs)所面临的挑战。通过分析超过250篇研究论文,它提供了有关数据准备,预训练和AI任务适应的见解,重点介绍了NeRF和3D高斯点渲染等前沿技术。
Read MoreLLaVA-Phi是一款创新的多模态助手,它使用Phi-2语言模型。尽管参数只有2.7B,但LLaVA-Phi在多模态对话中表现出色,结合了文本和视觉。该助手可以在多个领域内使用,例如智能家居和自动驾驶等。
Read More近年来,人工智能技术的发展趋势,使得图像处理技术得以广泛应用,如在自动驾驶、安保领域等。然而,一些研究表明,AI视觉系统与人类感知存在差异。 研究人员发现,图像伪造可影响人类感知,同时也可能误导AI视觉系...
Read More