漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-20 talkingdev

让深度估计更具灵活性

从单一的2D图像中确定3D深度是一项棘手的任务,因为许多3D场景在2D中看起来可能相同。这种方法将相机的细节与图片的内容进行了分离,使得在各种情况下更容易猜测深度。这种深度估计的灵活性可以在各种复杂环境下,如...

Read More
2023-09-19 talkingdev

e-NeRF:更出色的3D模型构建

事件相机具有一些独特的优点,如低功耗和快速响应时间,但在创建详细的3D模型方面却面临挑战。现在,研究人员引入了一种新方法——强大的e-NeRF,这种方法使得这些相机在构建3D模型方面表现得更好,即使在快速运动或光...

Read More
2023-09-19 talkingdev

打破维度界限:2D与3D图像创作的无缝融合

科研人员已经找到了一种方法,使得2D和3D技术能够无缝地协同工作,以实现更优秀且更具灵活性的设计。这种新的技术能够打破传统的维度界限,为图像设计领域带来革新性的突破。不仅如此,该方法还能大大提高图像设计的...

Read More
2023-09-18 talkingdev

SyncDreamer开源,多视图合成技术进一步提升

近期,3D生成领域取得了飞速发展,其中,一个稳定且具有广泛应用前景的项目在GitHub Repo上获得了大量关注。这项工作被认为是最稳定且通用的。用户只需要输入一张图像,模型就能合成多个视图并生成相应的3D模型。这...

Read More
2023-09-12 talkingdev

PointLLM开源,教会语言模型理解3D形状

近日,GitHub发布了名为PointLLM的新工具,该工具的主要功能是帮助语言模型理解3D对象,而非仅限于文本和2D图像。这一工具的出现,标志着语言模型在处理和理解更为复杂的三维信息方面迈出了重要一步,这将极大地推动...

Read More
2023-09-11 talkingdev

利用2D扩散概率模型雕刻3D人体模型

如果使用扩散模型生成包含距离和形状信息的2D法线图,然后使用3D重建算法,就可以利用底层身体模型生成逼真的3D人体化身。这对于合成化身和角色创建非常有用。扩散模型和3D重建算法的结合开启了一种全新的人体模型生...

Read More
2023-09-11 talkingdev

通过一张照片,精准定位篮球在3D空间的位置

本研究的作者们开发了一种新方法,只需要一张照片,就能准确地确定篮球在3D空间中的位置。这对于体育分析和机器人技术等领域来说,具有重大意义。对于传统的3D定位技术,通常需要多个相机或传感器才能实现精确定位,...

Read More
2023-09-08 talkingdev

HyperDiffusion:通过权重空间扩散生成隐式神经场

神经场利用多层感知器(MLP)来表示一个3D场景。现在,我们可以直接将扩散应用于MLP的权重,从而生成一个新的3D场景。通过这种方法,我们不仅可以更直观地理解和操作3D场景,而且还可以实现更高效的3D场景生成。这种...

Read More
2023-09-08 talkingdev

ResFields,时间维度下更深刻理解3D场景

ResFields是一种新型的神经网络,擅长理解随着时间变化的复杂3D场景。通过添加名为‘时间残差层’的组件,它能够处理更多的信息,同时保持准确性。时间残差层的引入,使ResFields在处理大量信息时,不仅能够准确识别3D...

Read More
2023-09-07 talkingdev

热门AI初创公司Kaedim,通过廉价人工制作3D模型

据报道,3D生成初创公司Kaedim在其发展过程中,经常利用人工艺术家来制作模型。在一些时候,Kaedim甚至会使用工人全程参与3D设计的制作。尽管这种方式在一定程度上降低了制作成本,但也引发了一些关于人工智能替代人...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page