扩散模型的相关内容 - 漫话开发者

2024-03-21 talkingdev

VITON-利用预训练扩散模型提升虚拟试穿体验

StableVITON是一种全新的基于图像的虚拟试穿技术。该方法专注于在利用预训练扩散模型的生成能力的同时，保持服装细节的真实性。StableVITON学习预训练模型潜在空间中衣物与人体之间的语义对应关系，从而实现更加准确...

2024-03-21 talkingdev

DreamDA提出了一种全新的数据增强技术，该技术通过扩散模型合成多样化、高质量的图像，这些图像与原始数据分布极为相似。数据增强在机器学习和深度学习领域中扮演着至关重要的角色，尤其在训练模型时，能够提高模型...

2024-03-18 talkingdev

ScoreHMR公司近日推出了一种新颖的3D人体姿态和形状重建方法。该技术利用扩散模型的强大能力，避免了传统优化技术，采用了得分引导方式将人体模型与图像观测数据对齐。这一创新方法不仅提高了重建的准确性，还大大减...

2024-03-14 talkingdev

由于室外数据的复杂性和空白性，真实世界的室外环境一直是3D场景生成中被忽视的挑战。SemCity通过专注于真实世界的室外环境，彻底颠覆了3D场景生成，实现了真实的室外场景生成。SemCity通过3D扩散模型，将真实世界的...

2024-03-14 talkingdev

这项研究介绍了一种创新的视频生成方法，使用状态空间模型（SSMs）克服了传统的基于注意力扩散模型的内存限制，重点关注线性内存消耗。在UCF101和MineRL Navigate数据集的测试中，SSMs能够创建具有竞争力质量的更长...

2024-03-13 talkingdev

这个项目引入了一种新颖的方法，通过单个图像生成高质量、详细的3D物体，增强了3D物体的生成。该方法基于视频扩散模型，利用深度学习技术从单个视角的2D图像生成高质量的3D模型。此方法可应用于各种领域，如游戏制作...

2024-03-12 talkingdev

VideoElevator引入了一种新的方法，通过利用文本到图像模型的优势来增强文本到视频扩散模型。这种即插即用的方法将增强过程分为了调整时间运动和提升空间质量两个部分，从而产生了帧质量和文本对齐得到了提高的视频...

2024-03-11 talkingdev

近日，研究人员提出了一种名为 ViewFusion 的新算法，旨在改善扩散模型从新的视角生成图像的方式，确保图像在不同视角下保持一致。传统的扩散模型在处理多视角图像时，往往会产生不一致性，导致图像质量下降。ViewFu...