漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-20 talkingdev

让深度估计更具灵活性

从单一的2D图像中确定3D深度是一项棘手的任务,因为许多3D场景在2D中看起来可能相同。这种方法将相机的细节与图片的内容进行了分离,使得在各种情况下更容易猜测深度。这种深度估计的灵活性可以在各种复杂环境下,如...

Read More
2023-09-12 talkingdev

PointLLM开源,教会语言模型理解3D形状

近日,GitHub发布了名为PointLLM的新工具,该工具的主要功能是帮助语言模型理解3D对象,而非仅限于文本和2D图像。这一工具的出现,标志着语言模型在处理和理解更为复杂的三维信息方面迈出了重要一步,这将极大地推动...

Read More
2023-08-29 talkingdev

nrhints-基于少量照片实现3D物体光照效果

近期,一项新的研究成果引起了众多科技爱好者的关注。该研究以创新的方式介绍了如何利用少量照片来重现光线与3D物体的交互效果。与旧有技术不同的是,我们的系统巧妙地利用了关于阴影和高光的提示,从而使其能够更有...

Read More
2023-08-28 talkingdev

FineRecon:深度感知前馈网络实现细节丰富的3D重建

苹果公司最新的研究成果在3D物体重建这一具有挑战性的问题上展现了惊人的性能。这项名为FineRecon的新技术,利用深度感知前馈网络,将2D图像转化为精细的3D模型。这一突破性的技术有望在许多领域得到应用,包括虚拟...

Read More
2023-08-18 talkingdev

3D图像的优化:新型关键点识别技术

关键点检测就像在图片中找到特定的点,以创建3D图像。一项名为DeDoDe的研究以全新、更优的方式找到这些点,确保他们在不同的视角中匹配,并提升3D图像的创建质量。关键点的定位和识别在3D图像的构建过程中起着至关重...

Read More
2023-07-20 talkingdev

引人注目的手部物体接触数据集开源

估计手部与物体接触的时机对于增强现实/虚拟现实和机器人技术来说是一项关键挑战。在深度学习领域,数据就是女王。这个新的大规模数据集包含了数百万帧的标注数据,可用于执行各种任务,如手部重构、模拟物体运动等...

Read More
2023-06-12 talkingdev

新加坡推出多模态文本/视觉模型

新闻概要: - 新加坡研究人员收集了一个新的视觉指导调整数据集。 - 他们训练了一个多模态文本/视觉模型,并在过程中进行了一些算法调整。 - 该模型的演示令人印象深刻,特别是在苹果发布增强现实技术后,展示了人...

Read More
2023-06-06 talkingdev

苹果发布新款 AR 头戴设备 Apple Vision Pro,售价 $3,499 起

据悉,苹果将于明年年初推出全新的增强现实头戴设备 Apple Vision Pro。这款设备能够无缝地将现实世界和数字世界融合在一起,不需要任何控制器,用户可以通过眼睛、手和声音来控制设备。如果用户戴眼镜,可以购买由...

Read More
2023-06-06 talkingdev

苹果:从未提及人工智能,却拥有大量AI技术

苹果公司或许是消费级人工智能的潜在领导者,虽然他们从未明确提及过AI技术,但在以下几个方面表现出色: - **变压器键盘**:苹果公司新推出的MacBook Pro配备了变压器键盘,这意味着每个键都有自己的处理器,可以...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page