漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-16 talkingdev

创新技术:使用鱼眼事件摄像机解决单目3D人体运动捕捉难题

在单目人体3D运动捕捉领域,特别是在复杂光照和快速移动的环境下,研究人员面临诸多挑战。最近,一项新颖的方法被提出,该方法利用鱼眼事件摄像机来捕捉和重建人体的三维运动。传统的3D运动捕捉技术往往受限于光线条...

Read More
2024-04-15 talkingdev

直接从文本生成360度全景图像开源

最近,一个名为PanFusion的项目引起了业界的广泛关注。该项目采用了一种双分支扩散模型,可以直接从文本提示生成360度全景图像。该方法结合了稳定的扩散技术和专门的全景分支,并通过独特的交叉注意力机制来减少图像...

Read More
2024-04-12 talkingdev

即时生成3D网格:InstantMesh框架秒级转换图像开源

InstantMesh项目近日亮相,该框架能够从单张图片中瞬间生成3D网格模型,其生成的模型质量与可扩展性均处于行业领先水平。该技术的出现极大地简化了3D建模过程,为游戏开发、虚拟现实、增强现实等领域带来前所未有的...

Read More
2024-04-12 talkingdev

论文:新型立体匹配网络MoCha-Stereo,增强几何细节识别

MoCha-Stereo即Motif Channel Attention Stereo Matching Network,是一种全新的立体匹配方法,它能够有效保留在传统立体匹配技术中常常丢失的几何结构。这一技术的出现有望在计算机视觉领域带来一场革命,尤其是在...

Read More
2024-04-11 talkingdev

Hash3D开源-引领3D生成建模加速

Hash3D最近推出了一种创新的方法,通过利用哈希机制来加速3D生成建模。该技术利用了相似摄像机位置和扩散时间步之间的特征图冗余,从而提高了3D建模的效率和速度。这一突破性的技术不仅能够为设计师和工程师提供更快...

Read More
2024-04-05 talkingdev

Meta未来蓝图:继收购Oculus十年后,VR和AR技术的新征程

自Facebook收购Oculus以来已过去十年,虚拟现实技术虽未大规模普及,但已多次成为主流。本文将探讨Meta接下来的发展方向,包括即将推出的Quest 3、人工智能、智能眼镜以及增强现实眼镜。Meta计划在本月晚些时候为Ray...

Read More
2024-03-25 talkingdev

论文:开放词汇注意力图谱革新图像分割技术

开放词汇注意力图谱(OVAM)是一种新兴的图像分割技术,它通过对类Stable Diffusion的文本到图像扩散模型进行改进,实现了对任意词汇生成注意力图的功能,打破了之前的限制。这意味着,通过OVAM,开发者和研究人员能...

Read More
2024-03-22 talkingdev

Meta Reality Labs推出场景脚本3D场景重建技术

Meta Reality Labs最新研发的模型能够将视觉输入转换为场景的三维表示。这个拥有7000万个参数的模型能够在设备上快速运行,并且展现出极高的稳定性。这一技术的发展,不仅为虚拟现实和增强现实领域带来了新的突破,...

Read More
2024-03-19 talkingdev

Stability AI发布Stable Video 3D,开创三维模型新纪元

Stability AI近日推出了基于Stable Video的新技术——Stable Video 3D。该技术能够通过单一图片生成3D模型,其性能超越了Stable Zero 123及其他现有方法。目前,Stable Video 3D的权重数据已经对外提供,旨在支持研究...

Read More
2024-03-18 talkingdev

ScoreHMR推出基于扩散模型的3D人体姿态重建技术

ScoreHMR公司近日推出了一种新颖的3D人体姿态和形状重建方法。该技术利用扩散模型的强大能力,避免了传统优化技术,采用了得分引导方式将人体模型与图像观测数据对齐。这一创新方法不仅提高了重建的准确性,还大大减...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page