漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-09 talkingdev

论文:Phi-2语言模型助力多模态LLaVA-Phi发布

LLaVA-Phi是一款创新的多模态助手,它使用Phi-2语言模型。尽管参数只有2.7B,但LLaVA-Phi在多模态对话中表现出色,结合了文本和视觉。该助手可以在多个领域内使用,例如智能家居和自动驾驶等。

Read More
2024-01-03 talkingdev

图像伪造可影响人类感知,AI视觉系统与人类感知的相似性和差异性探究

近年来,人工智能技术的发展趋势,使得图像处理技术得以广泛应用,如在自动驾驶、安保领域等。然而,一些研究表明,AI视觉系统与人类感知存在差异。 研究人员发现,图像伪造可影响人类感知,同时也可能误导AI视觉系...

Read More
2023-12-22 talkingdev

Waymo的无人驾驶汽车“显著优于”人类驾驶员

Waymo的研究人员表示,与人类驾驶员相比,其无人驾驶汽车的报警率和导致伤害事故的发生率显著降低。Waymo正在广泛推动国际标准化,以对自动驾驶汽车碰撞数据进行有效分析。

Read More
2023-12-21 talkingdev

TokenAny-可对任何事物进行标记

近日,GitHub仓库上线了一款全新的模型,可同时进行图像分割、识别和标注,超越了之前的能力。这个新模型的优势在于可以标记任何事物,不再局限于传统的图像和文本。目前,该模型已经在多个领域得到了广泛的应用,包...

Read More
2023-12-19 talkingdev

论文:使用语言模型提升自动驾驶能力

DriveMLM是一种新的框架,它使用大型语言模型来提高自动驾驶的能力。这个系统将语言决策与车辆控制相结合,不仅与现有的自动驾驶系统集成,而且在模拟中表现更好。

Read More
2023-12-13 talkingdev

FamO2O框架,提高状态自适应平衡的RL算法

研究人员引入了FamO2O框架,旨在通过确定基于状态的最佳平衡来改进和约束当前的离线到在线RL算法的能力。该框架可自适应地根据环境状态调整平衡,以确保算法在不同的环境下都能得到最优的表现。FamO2O框架可以在多种...

Read More
2023-11-28 talkingdev

RLHF的替代方案,DPO实现方案开源

直接偏好优化是使用非常相似的数据的RLHF的稳定替代方法。该存储库包含一个实现,用于学习该技术。虽然DPO是一种新兴的技术,但它在许多情况下都能够提供比强化学习更好的结果。它非常适合解决一些现实世界中的问题...

Read More
2023-11-21 talkingdev

深度学习系统TopoMLP为自动驾驶提供先进的道路场景理解

TopoMLP是一个系统,旨在通过检测和分析道路中心线和交通元素,理解道路场景并确定自动驾驶车辆的行驶路径。TopoMLP基于深度学习,能够高度准确地识别道路中心线和车道宽度等信息,并根据道路的类型和驾驶情况,决定...

Read More
2023-11-17 talkingdev

论文:智能眼镜上的物体检测技术

该团队创建了一个新的面向视觉的RISC-V硬件,并训练了一个超小的YOLO计算机视觉模型,实现了低功耗和极低延迟的实时物体检测。该技术可广泛应用于智能眼镜、自动驾驶、智能家居等领域。

Read More
2023-11-15 talkingdev

使用视觉语言模型实现自主驾驶

本报告评估了GPT-4V在自主驾驶中的应用,重点关注其在场景理解、决策制定和实时响应方面的能力。GPT-4V是一种基于视觉语言模型的人工智能技术,能够自动识别和理解图像中的物体、道路、标志和其他要素,并作出相应的...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page