漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-02 talkingdev

情感机器人Emo:实时模仿人类面部表情

Emo是一款能够实时预测并模仿人类面部表情的机器人,这一突破性的技术极大地增强了人机交互体验。Emo通过高精度的传感器和先进的算法,能够捕捉到人类的微妙表情变化,并迅速做出相应的反应。这不仅使得机器人更加自...

Read More
2024-04-01 talkingdev

论文:新技术助力研究人员深入理解户外环境

研究人员最近提出了一种全新的方法来认识户外环境,该方法克服了以往因条件变化和数据缺乏而限制发展的障碍。通过综合考虑户外环境的多样性和复杂性,研究者们开发了一套先进的算法和技术,能够更加准确地捕捉和分析...

Read More
2024-03-25 talkingdev

埃隆·马斯克宣称Neuralink技术助力盲猴重见光明

埃隆·马斯克近日透露,Neuralink公司研发的'Blindsight'产品已经在猴子身上进行了实验,成功帮助它们恢复了视觉。尽管目前恢复的视觉效果分辨率尚低,研究人员正在寻求提升图像清晰度的方法。目前尚不明确这些猴子是...

Read More
2024-02-02 talkingdev

基于LiDAR技术的自动驾驶运动目标分割(MF-MOS)新模型开源

MF-MOS是一种新模型,可以更好地使用LiDAR技术检测自动驾驶中的运动目标。该模型独特地分离运动和语义信息,使用残差图进行运动捕捉,使用距离图像进行语义引导。该模型的发布将进一步推动自动驾驶技术的发展。

Read More
2024-01-12 talkingdev

苹果Vision Pro 上市量传闻中比之前的预测要紧缩得多

著名的苹果分析师郭明錤认为,在苹果视觉 Pro 上市当天,苹果公司将有 6 万到 8 万个 Apple Vision Pro 设备可用。这个数字比之前的预测要紧缩得多,这意味着苹果可能会面临供应短缺的问题。苹果视觉 Pro 是一款专业...

Read More
2023-12-19 talkingdev

Meta开放首个大规模第一人称视频数据集

视频理解是一个古老的领域,现在才开始获得成功。成功的主要推动因素是高质量的数据集。Meta的这项工作包括许多传感器数据源和手势。它为现有方法提供了基准性能。

Read More
2023-12-05 talkingdev

SAFE:一种用于模式识别的融合框架开源

SAFE是一种新的模式识别融合框架,它结合了预训练的视觉和语言模型,使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景,具有广泛的应用前景。在实现过程中...

Read More
2023-11-20 talkingdev

一份帮助了解学生行为的数据集

研究人员扩展了SCB-ST-Dataset4,该数据集记录了诸如举手、阅读和书写等活动,以更好地通过深度学习来了解和检测学生的课堂行为。这个数据集是通过在课堂上安装传感器来捕捉学生行为的。研究人员使用了不同的深度学...

Read More
2023-10-19 talkingdev

MonoSKD开源,一张图像实现3D物体检测

MonoSKD是一种革命性的方法,它使用一张图像就可以检测3D物体,有效地弥合了LiDAR和普通RGB模型之间的知识鸿沟。传统的3D物体检测需要使用多个传感器来捕捉物体的深度信息和其它特征,而MonoSKD仅需要一张图像就能完...

Read More
2023-10-17 talkingdev

论文:SupFusion提高LiDAR和相机检测能力

一篇发表在arXiv上的论文介绍了一种新技术SupFusion,它能够使激光雷达(LiDAR)和相机系统更好地协同工作,用于检测汽车或行人等物体。这项技术使用多任务学习方法,同时考虑激光雷达和相机的输出,将它们融合成更...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page