3D的相关内容 - 漫话开发者

2024-01-21 talkingdev

论文：自动驾驶汽车视觉基础模型前沿技术分析

本文探讨了开发自动驾驶汽车视觉基础模型（VFMs）所面临的挑战。通过分析超过250篇研究论文，它提供了有关数据准备，预训练和AI任务适应的见解，重点介绍了NeRF和3D高斯点渲染等前沿技术。

2024-01-20 talkingdev

Compose and Conquer公司推出了一种条件扩散模型，该模型在生成的图像中的三维空间中放置物体方面表现出色。该模型可用于生成逼真的图像，例如虚拟世界中的景观和人物。条件扩散模型的优点在于其可以对图像进行分层...

2024-01-11 talkingdev

研究人员开发了一种新的文本到3D生成模型的评估指标，解决了当前单一标准指标的局限性。这种先进的方法使用GPT-4V来创建提示并比较3D资产。它与人类偏好密切相关，并通过适应各种用户定义的标准来提供多样性。

2024-01-10 talkingdev

研究人员开发出一种人脸视频编辑架构，该架构结合了GAN-NeRF技术用于3D一致性和一种新的稳定器用于平滑的时间相干性。这种方法在编辑视频方面表现出色，通过保持一致的视角和帧之间的无缝转换来实现。

2024-01-08 talkingdev

随着视觉问答技术的不断发展，大多数模型只涉及2D推理，忽略了3D视觉场景的复杂性。这项研究提出了3D感知的视觉问答技术。通过对3D场景的理解和分析，模型可以更精准地回答问题，具有更高的准确率和可解释性。该技术...

2023-12-25 talkingdev

近日，一项关于单张图像快速重建3D模型的新技术取得了突破。该技术基于高斯飞溅技术，通过学习性技术将图像中的每个像素映射到一个3D高斯函数中，从而实现单张图像的3D重建。这一技术的创新点在于引入了“飞溅图像”，...

2023-12-22 talkingdev

新的3D-LFM模型采用变压器从2D标记点重建3D结构，无需“对应”3D数据。这种方法是首个这样处理不同点数量、遮挡并且具有泛化能力的方法。

2023-12-22 talkingdev

Zoo Dev（前身为Kitty Cad）进行了重新品牌推广并发布了一项新的文本转CAD功能。这是一个功能强大的平台，可以生成可用于打印或零件的3D资产。