漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-04 talkingdev

论文:自动驾驶新突破,全球中心扩散变换器技术引领未来

最新研究表明,一种名为'全球中心扩散变换器'(World-Centric Diffusion Transformer,简称WcDT)的技术为自动驾驶汽车的路径规划带来了革命性的创新。该技术融合了扩散模型和变换器,旨在提高自动驾驶汽车在复杂环...

Read More
2024-04-01 talkingdev

自动驾驶赛车如何推动无人驾驶汽车技术的进步

自动驾驶赛车通过在高压条件下应用人工智能和机器学习技术,正推动无人驾驶汽车技术的发展。例如,Indy Autonomous Challenge等竞赛正在加速车辆安全性方面的创新。研究者和学生利用F1tenth等平台开发算法,在实际赛...

Read More
2024-03-26 talkingdev

PSALM:面向图像分割任务的多模态模型扩展

PSALM是大型多模态模型(LMM)的扩展版本,通过引入一个掩码解码器和多功能输入模式,在各种图像分割任务中表现出色。这种方法不仅克服了仅限于文本输出的限制,而且还使模型能够有效理解和分类复杂图像。PSALM的创...

Read More
2024-03-21 talkingdev

Waabi推出Copilot4D:自动驾驶的前沿基础模型

Waabi公司近日发布了名为Copilot4D的创新基础模型,这一模型通过利用激光雷达(LiDAR)数据,能够理解和预测环境随时间变化的三维动态,从而显著提升了自动驾驶机器的能力。Copilot4D的核心优势在于其对环境的深度学习...

Read More
2024-03-19 talkingdev

GroupContrast:重新定义自监督3D场景理解技术

最近,一个新的GitHub项目GroupContrast引起了技术界的广泛关注。该项目通过将片段分组与语义感知对比学习相结合,重新定义了自监督3D表示学习的概念。这种创新的方法不仅能够提高3D场景理解的准确性,还能够在不依...

Read More
2024-03-19 talkingdev

苹果研究团队在多模态人工智能领域取得重大突破

苹果公司的研究团队近期在人工智能领域实现了创新性进展,他们开发出了一种能够在文本和图像上同时训练大型语言模型的方法。这一成就推动了多模态AI任务在性能上的显著提升,达到了艺术级水平。所谓多模态AI,指的是...

Read More
2024-03-15 talkingdev

特斯拉推出新FSD Beta v12更新

特斯拉全自动驾驶Beta v12.3更新,埃隆·马斯克(Elon Musk)将其描述为“重大发布”,使用端到端神经网络控制车辆,从编程员编码控制转变。这个更新希望在更多的道路和驾驶环境下实现自动驾驶,之前的版本已经在美国获...

Read More
2024-03-14 talkingdev

Applied Intuition完成25亿美元D轮融资,估值达60亿美元

据报道,自动驾驶软件领导者Applied Intuition完成了2.5亿美元的D轮融资,其估值达到了60亿美元,比之前的估值增长了67%。该公司的生成式人工智能技术用于开发汽车、卡车和其他行业的软件,导致了三位数的盈利增长和...

Read More
2024-03-05 talkingdev

论文:CricaVPR引入新方法优化视觉地点识别

CricaVPR提出了一种新方法,通过关注多个图像之间的关系,即使在不同的条件下也能提高视觉地点识别的准确性。传统的视觉地点识别方法通常只考虑单个图像,而CricaVPR的方法将多个图像整合起来,进一步提高了识别精度...

Read More
2024-03-04 talkingdev

Drive-WM让自动驾驶更安全

Drive-WM可以生成高质量的多视角视频,预测未来情景,从而使自动驾驶汽车做出更安全、更高效的驾驶决策。该技术可以根据车辆周围的环境生成准确的预测模型,为自动驾驶汽车提供更高质量的输入数据。此外,Drive-WM还...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page