近日,研究人员提出了一种名为 ViewFusion 的新算法,旨在改善扩散模型从新的视角生成图像的方式,确保图像在不同视角下保持一致。传统的扩散模型在处理多视角图像时,往往会产生不一致性,导致图像质量下降。ViewFu...
Read More研究人员开发了一种“序列感知”损失函数,以改进去噪概率模型(DPM),解决了图像生成中时间步长相关性的问题。这种新方法不仅提供了更紧凑的损失估计,而且在诸如CIFAR10和CelebA等数据集上显示出显著的图像质量改进,...
Read MoreMeta发布了一个名为Imagine的独立图像生成器,其拥有自己的网站,使用生成式人工智能从文本提示中创建图像。该工具使用GAN(生成式对抗网络)技术,可以生成高度逼真的图像,用户只需输入文本提示,就可以生成与之相...
Read More一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型,提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性,更好地满足用户的需求。
Read More研究人员正在改进我们与文本到图像模型的交互方式,例如Midjourney和Stable Diffusion,这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”,使人们可以自然地与大型语言模型进行交互,以获得更...
Read More研究人员使用预训练的扩散模型在较小的图像上进行训练,以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题,并将问题指向了模型结构的有限感知能力。
Read More由Nvidia赋能的Getty最近推出了一项商业图像生成服务,该服务提供了强大的商业保障。这一服务的推出,将进一步推动图像生成技术的商业应用,特别是在广告、媒体和娱乐等行业,提供更加贴近需求的图像内容。Getty与Nv...
Read More近日,一项名为ViCo的新技术问世,其可以根据文本描述生成逼真的图像,并且能够从仅有的几个样本中捕捉到新概念的细节。与其他方法不同,ViCo对系统资源的消耗较小,不需要对原始模型的参数进行微调,但它仍然通过专...
Read More