漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-21 talkingdev

PSG-4D全景场景图生成,让AI理解时空世界的技术开源

PSG-4D是一种全新的表示法,帮助AI理解空间和时间的四维世界。这种技术的GitHub Repo已经开源。该技术能够生成4D全景场景图,通过这种场景图,AI不仅能够理解物体的三维空间位置,还能理解物体随时间的变化。这是一...

Read More
2024-05-17 talkingdev

Lidiff-自动驾驶汽车的3D场景完整性研究

研究人员已经开发出一种新的技术,可以填补3D LiDAR扫描中的空白,使得自动驾驶汽车能够更好地理解周围的环境。这种技术通过使用先进的算法和数据处理技术,将不完整的3D视图转换成完整的视野,提供了一个更准确的环...

Read More
2024-05-15 talkingdev

图像去雨技术的新突破——ESDNet神经网络模型

ESDNet是一个专为图像去雨任务设计的脉冲神经网络(SNN)。这个神经网络模型首次将雨像素的独特属性用于增强脉冲信号强度。其设计理念是利用雨滴的像素值的特性,通过特定的神经网络结构和算法,实现对图像中的雨滴...

Read More
2024-04-30 talkingdev

马斯克获得中国政府对特斯拉驾驶辅助服务的支持

中国政府已经表示支持特斯拉在中国推出其先进的驾驶辅助服务。特斯拉将基于百度提供的地图和导航功能,部署其全自动驾驶(Full Self-Driving, FSD)服务。能在中国推出FSD,将有助于特斯拉与主要的中国汽车制造商竞...

Read More
2024-04-28 talkingdev

MIM4D:提升自动驾驶的全新视觉表现方法开源

MIM4D 是一种全新的方法,通过使用双重遮罩图像建模在自动驾驶中提升视觉表现学习。这种方法从多视角视频中捕获空间和时间的详细信息,大大提升了自动驾驶的性能和效率。MIM4D 的开源代码已经在GitHub上发布,对于自...

Read More
2024-04-15 talkingdev

论文-DGMamba框架:采用状态空间模型应对领域泛化挑战

DGMamba框架是一种创新的技术,它利用状态空间模型Mamba来解决领域泛化中的挑战。状态空间模型是一种先进的机器学习方法,通过将系统状态表示为一组变量,并预测其在时间上的演变,从而提高模型的泛化能力和对新场景...

Read More
2024-04-15 talkingdev

xAI发布Grok-1.5视觉预览,性能媲美顶尖模型

xAI公司近日宣布,其最新旗舰模型Grok-1.5已具备视觉功能,与现有最先进模型相比肩,甚至在某些方面超越。Grok-1.5的推出,标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...

Read More
2024-04-15 talkingdev

特斯拉将全自动驾驶订阅费用降至每月99美元

特斯拉宣布,其全自动驾驶(Full Self-Driving,简称FSD)服务的月度订阅费用已降至99美元。目前,该公司正在推广FSD v12版本,这是一款完全基于人工智能的新版本,与以往版本相比有了显著提升。特斯拉要求经销商为...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page