漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-12 talkingdev

F2D-个性化可编辑的人脸生成技术

Face2Diffusion(F2D)为创建个性化人脸提供了一种新的解决方案,通过滤除非必要的身份信息,解决了过度拟合的常见问题,从而提高了可编辑性。F2D使用扩散卷积算法来生成人脸,该算法可以生成高质量的人脸图像,并且...

Read More
2024-03-12 talkingdev

SplattingAvatar推出新方法打造逼真虚拟人物

SplattingAvatar推出了一种新的方法,通过将3D网格几何与高斯分布合成,使虚拟人物的外貌更加逼真。该技术使用了一种称为“斑点”的方案,它在三维网格上绘制了一些高斯斑点,然后将它们合成为逼真的外观。这项技术可...

Read More
2024-03-12 talkingdev

扎克伯格坚称Quest 3也是计算机,不仅仅是为游戏而生,最新的Vision Pro回应

Quest 3不仅仅是为游戏而生,扎克伯格坚称它也是一台计算机。Quest的顶级应用程序包括社交应用程序、浏览器和视频播放器,同时也有一个对健身应用程序非常热情的社区。

Read More
2024-03-11 talkingdev

多视角图像生成技术 ViewFusion

近日,研究人员提出了一种名为 ViewFusion 的新算法,旨在改善扩散模型从新的视角生成图像的方式,确保图像在不同视角下保持一致。传统的扩散模型在处理多视角图像时,往往会产生不一致性,导致图像质量下降。ViewFu...

Read More
2024-03-04 talkingdev

Genie世界模型:可生成交互式环境

Google DeepMind的Genie是一个基础的世界模型,通过在互联网视频上进行训练,可以从合成图像、照片甚至草图中生成各种可玩(动作可控)的环境。该模型使用了深度强化学习和生成式建模技术,可以为游戏开发、虚拟现实...

Read More
2024-02-23 talkingdev

多视角扩散+:生成引人入胜的3D视图

最近,一种名为多视角扩散++的扩散模型引起了人们的注意。该模型可以生成一个对象的多个视图,然后将它们拼接在一起,形成一个引人入胜的3D版本。这个模型的基本原理是将对象分解成许多微小的部分,然后在每个部分上...

Read More
2024-02-21 talkingdev

Sora、Groq和虚拟现实

Vision Pro和OpenAI的Sora在同一个月份推出。与此同时,Groq正在展示实时推理可能比以前想象的更可行。台积电正在推动2nm芯片,而英特尔正在做出可靠的努力加入其中。虽然虚拟现实还需要更多的工作,但现在许多关键...

Read More
2024-02-16 talkingdev

Google发布Lumiere文本到视频模型

Google最近推出了一种新的文本到视频模型Lumiere,该模型可以将图像和风格作为输入,并使用一种新颖的“空时UNet”同时扩散所有内容。该模型采用了深度学习技术,可以将文本内容转换为相对应的视频,并且不需要任何人...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page