漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-11 talkingdev

论文:SuperFlow推动自动驾驶的3D感知技术进步

SuperFlow是一种新的框架,通过使用连续的LiDAR-camera对进行时空预训练,增强了自动驾驶中的3D感知能力。在自动驾驶技术中,3D感知的重要性不言而喻,它可以帮助自动驾驶汽车更准确地理解周围环境,进行更安全、更...

Read More
2024-07-11 talkingdev

论文:自动驾驶的3D数据生成,PerlDiff方法引领新潮流

PerlDiff方法将3D几何信息与街景图像生成相结合,进一步提高了街景图像生成的精确性。这种方法的提出,无疑为自动驾驶领域的3D数据生成提供了新的研究方向和方法。通过更精确的街景图像生成,自动驾驶技术的安全性和...

Read More
2024-07-09 talkingdev

MIT利用阴影构建3D场景模型,包括被遮挡的物体

MIT和Meta的研究人员开发了一种名为PlatoNeRF的人工智能技术,该技术利用阴影和单光子激光雷达来创建3D场景模型,包括被遮挡的区域。这种方法可以增强自动驾驶车辆的安全性,并改善AR/VR体验。PlatoNeRF超越了传统方...

Read More
2024-06-19 talkingdev

优化引导神经迭代:新框架(OGNI-DC)发布

近日,一项名为OGNI-DC的全新框架在GitHub上发布。该框架采用了“优化引导神经迭代”(Optimization-Guided Neural Iterations,简称OGNI)的技术。这种技术通过优化深度梯度场并将深度梯度集成到深度地图中,从而实现深...

Read More
2024-06-19 talkingdev

多视图图像赋能3D表征学习:Duoduo CLIP模型发布

近日,一款名为Duoduo CLIP的3D表征学习模型引起了业界的广泛关注。与传统的3D表征学习模型不同,Duoduo CLIP采用多视图图像,而非点云数据作为输入。这种独特的设计,使得Duoduo CLIP在3D表征学习的效果上,可能会...

Read More
2024-06-03 talkingdev

AI技术向边缘计算迈进,开辟全新应用领域

随着人工智能(AI)技术的不断进步,AI正在向多模态和边缘计算方向发展。这种转变不仅改变了我们对AI的使用方式,还大大提高了其在实际应用中的有效性。多模态AI是指能够处理多种形式的数据,例如文本、图像和语音,...

Read More
2024-05-31 talkingdev

开源4K-Rain13k数据集:解决超高清图像去雨问题

研究人员近日发布了一个名为4K-Rain13k的新数据集,这一数据集中包含了13,000对4K分辨率的图像,旨在解决超高清(UHD)图像中的去雨问题。4K-Rain13k数据集的推出,为图像处理和计算机视觉领域提供了宝贵的资源,使...

Read More
2024-05-28 talkingdev

论文:多维度适应性分类器革新语义分割技术

一种新的语义和空间适应性(SSA)分类器被引入,以解决语义分割中的局限性。这种创新方法利用粗糙的掩码来指导原型的调整,从而增强细粒度识别并明确掩码边界。SSA分类器通过结合语义和空间信息,使得模型在处理复杂...

Read More
2024-05-28 talkingdev

Scribble2Scene:提升3D场景补全效率的新方法

Scribble2Scene是一种针对语义场景补全的新方法,显著减少了对繁琐标注的需求。传统的3D场景补全技术通常需要大量的数据标注,这不仅耗时费力,而且成本高昂。然而,Scribble2Scene通过利用简单的涂鸦和稀疏的标注就...

Read More
2024-05-24 talkingdev

AI初创公司H完成2.2亿美元种子轮融资

由DeepMind科学家创办的AI初创公司H宣布完成2.2亿美元的种子轮融资,成为近年来最具规模的种子融资之一。这一轮融资的成功标志着法国AI人才的又一重大胜利。H公司致力于构建动作模型,这项技术有望在多个领域取得突...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page