漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-28 talkingdev

Scribble2Scene:提升3D场景补全效率的新方法

Scribble2Scene是一种针对语义场景补全的新方法,显著减少了对繁琐标注的需求。传统的3D场景补全技术通常需要大量的数据标注,这不仅耗时费力,而且成本高昂。然而,Scribble2Scene通过利用简单的涂鸦和稀疏的标注就...

Read More
2024-05-24 talkingdev

AI初创公司H完成2.2亿美元种子轮融资

由DeepMind科学家创办的AI初创公司H宣布完成2.2亿美元的种子轮融资,成为近年来最具规模的种子融资之一。这一轮融资的成功标志着法国AI人才的又一重大胜利。H公司致力于构建动作模型,这项技术有望在多个领域取得突...

Read More
2024-05-22 talkingdev

Anthropic在Claude Sonnet上实现词典学习突破

Anthropic公司在机械解释性领域取得了重大突破,通过在Sonnet中映射数百万个概念。他们甚至发现可以通过操控这些内部概念来改变Sonnet的自我认知。例如,研究人员成功地让Sonnet相信自己是金门大桥。这个发现不仅揭...

Read More
2024-05-21 talkingdev

PSG-4D全景场景图生成,让AI理解时空世界的技术开源

PSG-4D是一种全新的表示法,帮助AI理解空间和时间的四维世界。这种技术的GitHub Repo已经开源。该技术能够生成4D全景场景图,通过这种场景图,AI不仅能够理解物体的三维空间位置,还能理解物体随时间的变化。这是一...

Read More
2024-05-17 talkingdev

Lidiff-自动驾驶汽车的3D场景完整性研究

研究人员已经开发出一种新的技术,可以填补3D LiDAR扫描中的空白,使得自动驾驶汽车能够更好地理解周围的环境。这种技术通过使用先进的算法和数据处理技术,将不完整的3D视图转换成完整的视野,提供了一个更准确的环...

Read More
2024-05-15 talkingdev

图像去雨技术的新突破——ESDNet神经网络模型

ESDNet是一个专为图像去雨任务设计的脉冲神经网络(SNN)。这个神经网络模型首次将雨像素的独特属性用于增强脉冲信号强度。其设计理念是利用雨滴的像素值的特性,通过特定的神经网络结构和算法,实现对图像中的雨滴...

Read More
2024-04-30 talkingdev

马斯克获得中国政府对特斯拉驾驶辅助服务的支持

中国政府已经表示支持特斯拉在中国推出其先进的驾驶辅助服务。特斯拉将基于百度提供的地图和导航功能,部署其全自动驾驶(Full Self-Driving, FSD)服务。能在中国推出FSD,将有助于特斯拉与主要的中国汽车制造商竞...

Read More
2024-04-28 talkingdev

MIM4D:提升自动驾驶的全新视觉表现方法开源

MIM4D 是一种全新的方法,通过使用双重遮罩图像建模在自动驾驶中提升视觉表现学习。这种方法从多视角视频中捕获空间和时间的详细信息,大大提升了自动驾驶的性能和效率。MIM4D 的开源代码已经在GitHub上发布,对于自...

Read More
2024-04-15 talkingdev

论文-DGMamba框架:采用状态空间模型应对领域泛化挑战

DGMamba框架是一种创新的技术,它利用状态空间模型Mamba来解决领域泛化中的挑战。状态空间模型是一种先进的机器学习方法,通过将系统状态表示为一组变量,并预测其在时间上的演变,从而提高模型的泛化能力和对新场景...

Read More
2024-04-15 talkingdev

xAI发布Grok-1.5视觉预览,性能媲美顶尖模型

xAI公司近日宣布,其最新旗舰模型Grok-1.5已具备视觉功能,与现有最先进模型相比肩,甚至在某些方面超越。Grok-1.5的推出,标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page