扩散模型的相关内容 - 漫话开发者

2024-07-03 talkingdev

instantstyle+：运用现代扩散模型和内容嵌入器进行风格转换

即时风格+是一种新兴的技术，它使用现代扩散模型和内容嵌入器进行风格转换。扩散模型是一种强大的机器学习工具，能够生成高质量的图像。内容嵌入器则是一种特殊的算法，能够从图像中提取出有意义的特征。结合这两种...

2024-06-27 talkingdev

近日，一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器（Trajectory Diffusion Transformer）和多视图...

2024-06-26 talkingdev

FreeTraj是一种使用扩散模型控制视频生成中的运动轨迹的无需调整的方法。它修改了噪声采样和注意力机制，以指导生成的内容。通过这种方法，用户可以直接操控视频生成的过程，以实现特定的动态效果。FreeTraj的核心优...

2024-05-27 talkingdev

研究人员提出了一种新的方法，通过使用分类器引导来定制扩散模型，从用户提供的参考图像中生成保持身份特征的图像。与传统方法需要大量特定领域的训练不同，这种技术利用分类器引导扩散模型，无需额外的训练。此方法...

2024-05-24 talkingdev

该项目推出了一种用于遥感图像变化描述的新型概率扩散模型（RSICC）。这一模型的引入旨在通过对时间推移中的环境变化进行描述，提高遥感图像的解读能力。遥感图像变化描述（RSICC）技术在环境监测、灾害评估及土地利...

2024-05-16 talkingdev

扰动注意力指引（PAG）是一种提升扩散模型生成图像质量的新方法，无需额外的训练或外部模块。通过创新地操作模型内部的自我关注机制，PAG显著提高了无条件样本和条件样本的结构和保真度。扩散模型一直以来都是生成对...

2024-04-16 talkingdev

本文深入探讨了如何训练扩散模型以生成视频，如何适配图像模型，甚至在无需额外训练的情况下，如何从图像模型中生成视频。扩散模型作为一种新兴的生成模型，已经在图像生成领域取得了显著的成果。文章首先介绍了扩散...

2024-04-15 talkingdev

最近，一个名为PanFusion的项目引起了业界的广泛关注。该项目采用了一种双分支扩散模型，可以直接从文本提示生成360度全景图像。该方法结合了稳定的扩散技术和专门的全景分支，并通过独特的交叉注意力机制来减少图像...