扩散模型的相关内容 - 漫话开发者

2024-01-20 talkingdev

CaC开源-将3D物体放置在图像生成中

Compose and Conquer公司推出了一种条件扩散模型，该模型在生成的图像中的三维空间中放置物体方面表现出色。该模型可用于生成逼真的图像，例如虚拟世界中的景观和人物。条件扩散模型的优点在于其可以对图像进行分层...

2024-01-10 talkingdev

扩散模型是一种强大的工具，可以将强化学习性能提升至新的高度。最近，一位研究团队建立了一个GitHub仓库，详细介绍了扩散模型在强化学习中的应用，并展望了未来的跨学科研究机会。扩散模型是一种模拟物质传播的方法...

2024-01-09 talkingdev

DiffusionEdge是一种新颖的边缘检测模型，它集成了扩散概率模型，可以在资源有效的同时提供更准确和清晰的边缘图。传统的边缘检测模型对于噪声和边缘不清晰的情况表现得不够稳定。DiffusionEdge的扩散模型可以帮助减...

2024-01-09 talkingdev

近日，一种名为GUESS的框架被引入，用于从文本中创建人体动作。该框架将复杂的人体姿态简化为各个层次上的更抽象形式，从而使从文本合成动作更加简洁稳定。

2024-01-08 talkingdev

MUSE是一种使用Transformers的掩蔽图像生成模型。HuggingFace和Stability AI已经合作开源复现该模型，并发布了训练代码、模型检查点和论文。虽然这些模型的训练时间不如一些最好的图像扩散模型长，但它们显示出了很...

2023-12-22 talkingdev

Diff-Text是一种新的无需训练的框架，可用于创建任何语言的具有文本的逼真图像。它通过使用手绘图像作为先验，增强了稳定扩散模型的多语言能力。

2023-12-20 talkingdev

最近的一项研究表明，与解码器相比，使用UNet编码器在扩散模型中表现更加稳定。这一发现导致了一种新的编码器传播方案，显著加快了文本到图像和文本到视频生成等任务的速度。该研究成果已在GitHub上发布。

2023-12-19 talkingdev

本项目介绍了一种新的技术，用于估计图像中的光照，克服了当前依赖HDR全景数据集的现有方法的局限性。通过使用扩散模型将铬球渲染到标准图像中，该技术揭示了铬球与扩散噪声之间的独特关系。这种技术有助于提高图像...