图像生成的相关内容 - 漫话开发者

2024-01-16 talkingdev

论文：采用潜在一致性模型实现快速可控图像生成

PixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度，并采用ControlNet样式提示实现更好的控制。

2024-01-08 talkingdev

MUSE是一种使用Transformers的掩蔽图像生成模型。HuggingFace和Stability AI已经合作开源复现该模型，并发布了训练代码、模型检查点和论文。虽然这些模型的训练时间不如一些最好的图像扩散模型长，但它们显示出了很...

2023-12-25 talkingdev

Llava是一个强大的多模型模型。该交互式设计现在允许聊天式交错文本、图像输入和图像输出。Llava是一个深度学习模型，能够对文本和图像数据进行联合建模，并产生准确的输出。与其他模型不同的是，Llava模型不仅考虑...

2023-12-25 talkingdev

研究人员开发了一种“序列感知”损失函数，以改进去噪概率模型(DPM)，解决了图像生成中时间步长相关性的问题。这种新方法不仅提供了更紧凑的损失估计，而且在诸如CIFAR10和CelebA等数据集上显示出显著的图像质量改进，...

2023-12-22 talkingdev

Midjourney V6已经发布alpha版。此次更新大幅提高了图像质量，并使模型能够在图像中生成易读文本。它还配备了全新的提示方法，更加灵敏，更加擅长理解用户。如果用户习惯于Midjourney V5提示，他们可能需要重新学习...

2023-12-13 talkingdev

DALL-E 3是一项有趣的实验，它展示了不同的提示如何生成不同的图像，以及后续的提示如何进一步完善这些图像。这项实验为人工智能领域的自然语言处理提供了新的思路和方法。

2023-12-11 talkingdev

Kandinsky 3.0是一种文本转图像模型，它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络（GAN）模型，通过学习图像语义和语法，从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...

2023-12-08 talkingdev

Meta发布了一个名为Imagine的独立图像生成器，其拥有自己的网站，使用生成式人工智能从文本提示中创建图像。该工具使用GAN（生成式对抗网络）技术，可以生成高度逼真的图像，用户只需输入文本提示，就可以生成与之相...