文本到图像的相关内容 - 漫话开发者

2024-01-25 talkingdev

Google Chrome增加AI功能

谷歌正在增强Chrome的功能，包括在线文本编辑助手、多标签页自动整理和基于文本到图像扩散模型的自定义主题创建器等AI功能。

2023-12-20 talkingdev

最近的一项研究表明，与解码器相比，使用UNet编码器在扩散模型中表现更加稳定。这一发现导致了一种新的编码器传播方案，显著加快了文本到图像和文本到视频生成等任务的速度。该研究成果已在GitHub上发布。

2023-12-12 talkingdev

RAVE是一种利用现有文本到图像扩散模型来增强视频的视频编辑方法。这种方法可以在保持原始运动和结构的同时实现高质量的视频编辑。

2023-12-06 talkingdev

Diffusion Models as Prior (DMP)是一种新的方法，它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务，例如3D属性估计和语义分割，在有限的训练数据下表现优...

2023-12-05 talkingdev

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型，提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性，更好地满足用户的需求。

2023-11-09 talkingdev

PixArt是一种新的文本到图像模型，它使用T5文本编码、交叉注意力和扩散变压器，以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型，可以比使用UNet模型训练快90%。PixArt模型的训练...

2023-10-16 talkingdev

研究人员正在改进我们与文本到图像模型的交互方式，例如Midjourney和Stable Diffusion，这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”，使人们可以自然地与大型语言模型进行交互，以获得更...

2023-09-21 talkingdev

OpenAI的最新文本到图像生成器DALL-E 3将于10月初向ChatGPT Plus和企业客户提供。OpenAI尚未发布有关该模型的任何技术细节。DALL-E 3可以更有效地精细化处理，例如手部细节，并可以创建引人入胜的图像，无需任何hack...