漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-17 talkingdev

人工通用智能已经存在

尽管如今的AI模型并不完美,但仍有很大可能最终被认定为人工通用智能的首批真正例子。人工智能技术正在飞速发展,从语音识别到图像识别,再到自动驾驶和机器人等领域,都有了巨大的进步。但是,现有的AI技术仍然存在...

Read More
2023-10-17 talkingdev

论文:SupFusion提高LiDAR和相机检测能力

一篇发表在arXiv上的论文介绍了一种新技术SupFusion,它能够使激光雷达(LiDAR)和相机系统更好地协同工作,用于检测汽车或行人等物体。这项技术使用多任务学习方法,同时考虑激光雷达和相机的输出,将它们融合成更...

Read More
2023-10-04 talkingdev

巨型世界模型助力自动驾驶技术的发展

大多数自动驾驶系统都是基于规则的、专家系统和学习模块的大规模组合。Wayve公司的最新研究展示了一个具有90亿参数的联合视频、动作和文本模型,该模型在多样化的场景中表现出色。这个模型通过学习和理解大量的驾驶...

Read More
2023-09-26 talkingdev

NeuralLabeling-利用3D工具进行先进的场景注释

NeuralLabeling是一款使用3D技术进行详细场景注释的工具。这款工具可以帮助用户精确地标注出图像中的各个物体和场景,从而为计算机视觉应用如自动驾驶、虚拟现实等提供更丰富、更准确的数据。NeuralLabeling的优势在...

Read More
2023-09-26 talkingdev

论文:利用文本描述理解并标记3D场景的PVLFF新模型

科研人员近日开发出一种名为PVLFF的新模型,这种模型能够观察3D场景,并不仅能识别其中的内容,还可以利用文本描述区分同一物体的不同实例。在现实世界中,同一物体可能有许多不同的实例,而这种模型能够通过文本描...

Read More
2023-09-25 talkingdev

论文:在线视频实例分割技术TCOVIS

研究人员已经介绍了一种名为TCOVIS的在线视频实例分割技术,这种技术优先考虑时间一致性。在线视频实例分割是计算机视觉领域的热门课题,它的目的是将视频帧中的每个实例独立地识别和分割出来。然而,现有的方法通常...

Read More
2023-09-25 talkingdev

自动驾驶技术:更精细地结合相机和激光雷达数据

这个GitHub仓库介绍了FGFusion(Fine-Grained Fusion,细粒度融合),这是一种新的方法,用于在自动驾驶汽车中以更详细的方式结合相机和激光雷达的数据。与仅使用高级别的细节不同,FGFusion捕获大局和细节,以创建...

Read More
2023-09-12 talkingdev

通过语言指令让自动驾驶汽车更智能

本项目引入了NuPrompt,这是一套以日常语言形式的新指令,帮助自动驾驶汽车更好地理解和追踪周围的物体。NuPrompt的工作效果非常出色!它将在自动驾驶汽车的感知、决策和控制等环节中起到至关重要的作用。通过这种方...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page