漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-03 talkingdev

instantstyle+:运用现代扩散模型和内容嵌入器进行风格转换

即时风格+是一种新兴的技术,它使用现代扩散模型和内容嵌入器进行风格转换。扩散模型是一种强大的机器学习工具,能够生成高质量的图像。内容嵌入器则是一种特殊的算法,能够从图像中提取出有意义的特征。结合这两种...

Read More
2024-06-27 talkingdev

Director3D开源-现实世界3D场景AI生成框架

近日,一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器(Trajectory Diffusion Transformer)和多视图...

Read More
2024-06-26 talkingdev

FreeTraj-无需训练自由控制视频生成轨迹

FreeTraj是一种使用扩散模型控制视频生成中的运动轨迹的无需调整的方法。它修改了噪声采样和注意力机制,以指导生成的内容。通过这种方法,用户可以直接操控视频生成的过程,以实现特定的动态效果。FreeTraj的核心优...

Read More
2024-05-27 talkingdev

论文:研究人员推出基于分类器引导的图像个性化扩散模型

研究人员提出了一种新的方法,通过使用分类器引导来定制扩散模型,从用户提供的参考图像中生成保持身份特征的图像。与传统方法需要大量特定领域的训练不同,这种技术利用分类器引导扩散模型,无需额外的训练。此方法...

Read More
2024-05-24 talkingdev

diffusion-rscc-概率扩散模型提升遥感图像变化描述能力

该项目推出了一种用于遥感图像变化描述的新型概率扩散模型(RSICC)。这一模型的引入旨在通过对时间推移中的环境变化进行描述,提高遥感图像的解读能力。遥感图像变化描述(RSICC)技术在环境监测、灾害评估及土地利...

Read More
2024-05-16 talkingdev

改进扰动注意力模型PAG:提升扩散模型的图像质量

扰动注意力指引(PAG)是一种提升扩散模型生成图像质量的新方法,无需额外的训练或外部模块。通过创新地操作模型内部的自我关注机制,PAG显著提高了无条件样本和条件样本的结构和保真度。扩散模型一直以来都是生成对...

Read More
2024-04-16 talkingdev

深度解析:视频扩散模型的生成与应用

本文深入探讨了如何训练扩散模型以生成视频,如何适配图像模型,甚至在无需额外训练的情况下,如何从图像模型中生成视频。扩散模型作为一种新兴的生成模型,已经在图像生成领域取得了显著的成果。文章首先介绍了扩散...

Read More
2024-04-15 talkingdev

直接从文本生成360度全景图像开源

最近,一个名为PanFusion的项目引起了业界的广泛关注。该项目采用了一种双分支扩散模型,可以直接从文本提示生成360度全景图像。该方法结合了稳定的扩散技术和专门的全景分支,并通过独特的交叉注意力机制来减少图像...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page