图像生成技术的相关内容 - 漫话开发者

2024-04-10 talkingdev

Visual Autoregressive Models：图像生成高分辨率解决方案

Visual Autoregressive Models是一个新的GitHub项目，它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开，但目前该项目已经引起了技...

2024-04-09 talkingdev

近期，研究人员开发了一种名为提示自动编辑（Prompt Auto-Editing，简称PAE）的新技术，旨在提升基于文本生成图像的技术水平。该技术利用了Imagen和Stable Diffusion等扩散模型，通过在线强化学习动态调整文本提示中...

2024-03-28 talkingdev

AID及其变体PAID是两种旨在通过加入文本和姿势等条件来改进图像插值的技术。这些方法确保生成的图像在不需要额外训练的情况下，具有更高的一致性、平滑度和真实性。图像生成技术的进步不仅推动了人工智能领域的创新...

2024-03-11 talkingdev

近日，研究人员提出了一种名为 ViewFusion 的新算法，旨在改善扩散模型从新的视角生成图像的方式，确保图像在不同视角下保持一致。传统的扩散模型在处理多视角图像时，往往会产生不一致性，导致图像质量下降。ViewFu...

2023-12-25 talkingdev

研究人员开发了一种“序列感知”损失函数，以改进去噪概率模型(DPM)，解决了图像生成中时间步长相关性的问题。这种新方法不仅提供了更紧凑的损失估计，而且在诸如CIFAR10和CelebA等数据集上显示出显著的图像质量改进，...

2023-12-08 talkingdev

Meta发布了一个名为Imagine的独立图像生成器，其拥有自己的网站，使用生成式人工智能从文本提示中创建图像。该工具使用GAN（生成式对抗网络）技术，可以生成高度逼真的图像，用户只需输入文本提示，就可以生成与之相...

2023-12-05 talkingdev

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型，提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性，更好地满足用户的需求。

2023-10-16 talkingdev

研究人员正在改进我们与文本到图像模型的交互方式，例如Midjourney和Stable Diffusion，这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”，使人们可以自然地与大型语言模型进行交互，以获得更...