漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-21 talkingdev

Art 3D:基于文本引导的高斯分布艺术场景生成技术

生成艺术性的二维图像是人工智能的一项有趣且富有创意的应用。这项工作通过高斯分布技术,将这一能力扩展到三维场景,并通过文本输入进行引导。高斯分布技术能够更加精准地捕捉和渲染三维空间中的细节,使得生成的3D...

Read More
2024-05-21 talkingdev

PSG-4D全景场景图生成,让AI理解时空世界的技术开源

PSG-4D是一种全新的表示法,帮助AI理解空间和时间的四维世界。这种技术的GitHub Repo已经开源。该技术能够生成4D全景场景图,通过这种场景图,AI不仅能够理解物体的三维空间位置,还能理解物体随时间的变化。这是一...

Read More
2024-05-15 talkingdev

谷歌Veo:超一分钟的1080p分辨率视频生成新模型

谷歌Deepmind最近发布了一款名为Veo的新型视频生成人工智能模型。这款AI模型拥有强大的视频生成能力,能够生成具有1080p分辨率的视频,且长度可以超越一分钟。在现有的视频生成技术中,这种能力是相当显著的。Veo利...

Read More
2024-05-02 talkingdev

微梦想家算法驱动的3D生成技术

科研人员已经开发出一种名为微梦想家(MicroDreamer)的创新3D生成算法。这种算法通过降低所需函数评估的数量,显著加快了3D生成的过程。微梦想家算法采用先进的计算策略和优化技术,大大提升了3D建模和渲染的效率和...

Read More
2024-04-18 talkingdev

Meta Llama 3发布,创新功能引领未来

近日,全球知名虚拟现实公司 Meta 发布了最新一代产品 Meta Llama 3,该产品搭载了一系列创新功能,引领了未来虚拟现实技术的发展。Meta Llama 3采用了全新的光学设计,大幅提升了视野范围和分辨率,同时还搭载了全...

Read More
2024-04-16 talkingdev

创新技术:使用鱼眼事件摄像机解决单目3D人体运动捕捉难题

在单目人体3D运动捕捉领域,特别是在复杂光照和快速移动的环境下,研究人员面临诸多挑战。最近,一项新颖的方法被提出,该方法利用鱼眼事件摄像机来捕捉和重建人体的三维运动。传统的3D运动捕捉技术往往受限于光线条...

Read More
2024-04-15 talkingdev

直接从文本生成360度全景图像开源

最近,一个名为PanFusion的项目引起了业界的广泛关注。该项目采用了一种双分支扩散模型,可以直接从文本提示生成360度全景图像。该方法结合了稳定的扩散技术和专门的全景分支,并通过独特的交叉注意力机制来减少图像...

Read More
2024-04-12 talkingdev

即时生成3D网格:InstantMesh框架秒级转换图像开源

InstantMesh项目近日亮相,该框架能够从单张图片中瞬间生成3D网格模型,其生成的模型质量与可扩展性均处于行业领先水平。该技术的出现极大地简化了3D建模过程,为游戏开发、虚拟现实、增强现实等领域带来前所未有的...

Read More
2024-04-12 talkingdev

PoLoPCAC:高效且适应性强的点云压缩新方法

PoLoPCAC代表了一种新型的无损点云属性压缩方法,它不仅压缩效率高,而且对不同规模和密度的点云数据具有良好的适应性。点云数据作为一种重要的三维数据表示形式,在众多领域如自动驾驶、城市规划、虚拟现实等都有着...

Read More
2024-04-11 talkingdev

Hash3D开源-引领3D生成建模加速

Hash3D最近推出了一种创新的方法,通过利用哈希机制来加速3D生成建模。该技术利用了相似摄像机位置和扩散时间步之间的特征图冗余,从而提高了3D建模的效率和速度。这一突破性的技术不仅能够为设计师和工程师提供更快...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page