漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-22 talkingdev

Meta Reality Labs推出场景脚本3D场景重建技术

Meta Reality Labs最新研发的模型能够将视觉输入转换为场景的三维表示。这个拥有7000万个参数的模型能够在设备上快速运行,并且展现出极高的稳定性。这一技术的发展,不仅为虚拟现实和增强现实领域带来了新的突破,...

Read More
2024-03-19 talkingdev

谷歌发布能让静态图片“活”起来的AI技术

谷歌的研究团队近日推出了一款名为VLOGGER的人工智能技术,该技术能够通过单张照片生成人物说话和活动的逼真视频。这一技术突破不仅在视觉效果上取得了显著进展,也为人机交互和虚拟现实领域带来了新的可能性。VLOGG...

Read More
2024-03-19 talkingdev

Stability AI发布Stable Video 3D,开创三维模型新纪元

Stability AI近日推出了基于Stable Video的新技术——Stable Video 3D。该技术能够通过单一图片生成3D模型,其性能超越了Stable Zero 123及其他现有方法。目前,Stable Video 3D的权重数据已经对外提供,旨在支持研究...

Read More
2024-03-19 talkingdev

苹果研究团队在多模态人工智能领域取得重大突破

苹果公司的研究团队近期在人工智能领域实现了创新性进展,他们开发出了一种能够在文本和图像上同时训练大型语言模型的方法。这一成就推动了多模态AI任务在性能上的显著提升,达到了艺术级水平。所谓多模态AI,指的是...

Read More
2024-03-18 talkingdev

ScoreHMR推出基于扩散模型的3D人体姿态重建技术

ScoreHMR公司近日推出了一种新颖的3D人体姿态和形状重建方法。该技术利用扩散模型的强大能力,避免了传统优化技术,采用了得分引导方式将人体模型与图像观测数据对齐。这一创新方法不仅提高了重建的准确性,还大大减...

Read More
2024-03-18 talkingdev

VR头盔逼近眼睛分辨率极限

下一代增强现实、混合现实和虚拟现实头盔的关键在于极高像素密度。更多像素意味着更逼真的视觉效果和更小、更紧凑的显示器。在此规模上构建显示器会导致独特的技术难题,行业仍在努力克服。本文探讨了该领域的技术发...

Read More
2024-03-13 talkingdev

V3D开源-视频扩散模型增强3D生成技术

这个项目引入了一种新颖的方法,通过单个图像生成高质量、详细的3D物体,增强了3D物体的生成。该方法基于视频扩散模型,利用深度学习技术从单个视角的2D图像生成高质量的3D模型。此方法可应用于各种领域,如游戏制作...

Read More
2024-03-12 talkingdev

F2D-个性化可编辑的人脸生成技术

Face2Diffusion(F2D)为创建个性化人脸提供了一种新的解决方案,通过滤除非必要的身份信息,解决了过度拟合的常见问题,从而提高了可编辑性。F2D使用扩散卷积算法来生成人脸,该算法可以生成高质量的人脸图像,并且...

Read More
2024-03-12 talkingdev

SplattingAvatar推出新方法打造逼真虚拟人物

SplattingAvatar推出了一种新的方法,通过将3D网格几何与高斯分布合成,使虚拟人物的外貌更加逼真。该技术使用了一种称为“斑点”的方案,它在三维网格上绘制了一些高斯斑点,然后将它们合成为逼真的外观。这项技术可...

Read More
2024-03-12 talkingdev

扎克伯格坚称Quest 3也是计算机,不仅仅是为游戏而生,最新的Vision Pro回应

Quest 3不仅仅是为游戏而生,扎克伯格坚称它也是一台计算机。Quest的顶级应用程序包括社交应用程序、浏览器和视频播放器,同时也有一个对健身应用程序非常热情的社区。

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page