漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-08 talkingdev

AI与人类视觉对齐数据集——AI是否能像人类一样“看”图像?

本研究引入了一种数据集,用于探究AI是否能像人类一样“看”图像。该数据集主要分为三个组别——Must-Act、Must-Abstain和Uncertain——设计用于测试AI在清晰、不清晰或模糊图像上的决策能力。Must-Act组中的图像是明确的...

Read More
2023-08-04 talkingdev

论文:SoftMoE,一种改进的稀疏混合专家模型,低成本提高模型容量

SoftMoE 是一种新的模型架构,它改进了稀疏的混合专家(MoE)模型。通过使用软分配方法,每个专家处理输入令牌的子集,SoftMoE以更低的成本提供了更大的模型容量。在视觉识别任务中,SoftMoE的表现超过了标准的变压...

Read More
2023-07-31 talkingdev

谷歌机器人新突破:transformer模型助力机器人性能全面提升

transformer模型帮助机器人看,帮助机器人计划,甚至帮助机器人控制?看起来,变形金刚正在继续吞噬世界,这是谷歌在机器人技术方面的最新尝试,利用强大的预训练模型改善机器人的各种性能。这一新的尝试使得机器人...

Read More
2023-06-19 talkingdev

Seal:增强车辆视觉感知的框架(GitHub资源库)

Seal是一个新的系统,使用先进的视觉识别模型来更好地解释各种类型的车辆传感器数据,使其更高效和适应性。在测试中,与标准方法相比,它提高了近37%的传感器数据解释能力,显示了改善未来汽车安全和导航系统的巨大...

Read More
  1. Prev Page