漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-13 talkingdev

V3D开源-视频扩散模型增强3D生成技术

这个项目引入了一种新颖的方法,通过单个图像生成高质量、详细的3D物体,增强了3D物体的生成。该方法基于视频扩散模型,利用深度学习技术从单个视角的2D图像生成高质量的3D模型。此方法可应用于各种领域,如游戏制作...

Read More
2024-03-12 talkingdev

SplattingAvatar推出新方法打造逼真虚拟人物

SplattingAvatar推出了一种新的方法,通过将3D网格几何与高斯分布合成,使虚拟人物的外貌更加逼真。该技术使用了一种称为“斑点”的方案,它在三维网格上绘制了一些高斯斑点,然后将它们合成为逼真的外观。这项技术可...

Read More
2024-03-08 talkingdev

DP3引领机器人模仿学习新方向

DP3推出了一种先进的模仿学习方法,结合3D视觉数据和扩散策略,以高效的方式为机器人教授复杂技能。该方法通过将多个示教者的动作数据进行聚合,形成一个复杂的运动模型,并通过扩散过程来优化该模型。该模型可以有...

Read More
2024-03-05 talkingdev

dust3r-轻松实现 3D 几何视觉

这个项目支持从一组松散相关的图像中构建 GLB 格式的 3D 表示,这意味着您可以拍摄一个地点的几张照片,为 3D 使用重构它。

Read More
2024-03-04 talkingdev

PL2Map-轻量级神经网络实现3D建图

该项目介绍了一种新的3D建图和定位方法,使用轻量级神经网络处理点和线特征,显著提高了姿态准确性,同时占用更少的内存和计算要求。为了实现更快的姿态估计和更准确的3D建图,该方法使用了一种新的神经网络结构,该...

Read More
2024-02-29 talkingdev

自动驾驶中的3D物体检测框架开源

EMIFF是一种创新的基于摄像头的3D检测框架,用于车辆基础设施协同物体检测。它使用多尺度交叉注意力和相机感知通道掩蔽来纠正来自相机异步性的姿态误差。EMIFF的开源代码现在可以在GitHub上获得。

Read More
2024-02-28 talkingdev

多场景3D重建技术框架开源

该项目介绍了一个多视角3D重建框架,不需要先验场景深度知识。它智能地选择最相关的源帧,使其适用于包括大规模室外和俯视建筑环境在内的各种场景。这项技术的突破将极大地提高3D重建的效率和精度,可应用于数字娱乐...

Read More
2024-02-28 talkingdev

FlowMDM实现长时间人体动作生成

FlowMDM是一种新的模型,用于从文本描述生成长时间连续的人体运动序列。这种首创的扩散模型使用混合位置编码进行逼真的运动创建,无需额外的去噪步骤,在关键数据集上表现出卓越的准确性和逼真度。

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page