Scribble2Scene是一种针对语义场景补全的新方法,显著减少了对繁琐标注的需求。传统的3D场景补全技术通常需要大量的数据标注,这不仅耗时费力,而且成本高昂。然而,Scribble2Scene通过利用简单的涂鸦和稀疏的标注就...
Read More由DeepMind科学家创办的AI初创公司H宣布完成2.2亿美元的种子轮融资,成为近年来最具规模的种子融资之一。这一轮融资的成功标志着法国AI人才的又一重大胜利。H公司致力于构建动作模型,这项技术有望在多个领域取得突...
Read MoreAnthropic公司在机械解释性领域取得了重大突破,通过在Sonnet中映射数百万个概念。他们甚至发现可以通过操控这些内部概念来改变Sonnet的自我认知。例如,研究人员成功地让Sonnet相信自己是金门大桥。这个发现不仅揭...
Read MorePSG-4D是一种全新的表示法,帮助AI理解空间和时间的四维世界。这种技术的GitHub Repo已经开源。该技术能够生成4D全景场景图,通过这种场景图,AI不仅能够理解物体的三维空间位置,还能理解物体随时间的变化。这是一...
Read More研究人员已经开发出一种新的技术,可以填补3D LiDAR扫描中的空白,使得自动驾驶汽车能够更好地理解周围的环境。这种技术通过使用先进的算法和数据处理技术,将不完整的3D视图转换成完整的视野,提供了一个更准确的环...
Read MoreESDNet是一个专为图像去雨任务设计的脉冲神经网络(SNN)。这个神经网络模型首次将雨像素的独特属性用于增强脉冲信号强度。其设计理念是利用雨滴的像素值的特性,通过特定的神经网络结构和算法,实现对图像中的雨滴...
Read More中国政府已经表示支持特斯拉在中国推出其先进的驾驶辅助服务。特斯拉将基于百度提供的地图和导航功能,部署其全自动驾驶(Full Self-Driving, FSD)服务。能在中国推出FSD,将有助于特斯拉与主要的中国汽车制造商竞...
Read MoreMIM4D 是一种全新的方法,通过使用双重遮罩图像建模在自动驾驶中提升视觉表现学习。这种方法从多视角视频中捕获空间和时间的详细信息,大大提升了自动驾驶的性能和效率。MIM4D 的开源代码已经在GitHub上发布,对于自...
Read MoreDGMamba框架是一种创新的技术,它利用状态空间模型Mamba来解决领域泛化中的挑战。状态空间模型是一种先进的机器学习方法,通过将系统状态表示为一组变量,并预测其在时间上的演变,从而提高模型的泛化能力和对新场景...
Read MorexAI公司近日宣布,其最新旗舰模型Grok-1.5已具备视觉功能,与现有最先进模型相比肩,甚至在某些方面超越。Grok-1.5的推出,标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...
Read More