文本到图像模型的相关内容 - 漫话开发者

2023-12-06 talkingdev

DMP开源，可提升AI图像预测精度

Diffusion Models as Prior (DMP)是一种新的方法，它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务，例如3D属性估计和语义分割，在有限的训练数据下表现优...

2023-11-09 talkingdev

PixArt是一种新的文本到图像模型，它使用T5文本编码、交叉注意力和扩散变压器，以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型，可以比使用UNet模型训练快90%。PixArt模型的训练...

2023-10-16 talkingdev

研究人员正在改进我们与文本到图像模型的交互方式，例如Midjourney和Stable Diffusion，这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”，使人们可以自然地与大型语言模型进行交互，以获得更...

2023-07-28 talkingdev

稳定性AI近期发布了最新的先进文本到图像模型，稳定扩散XL (SDXL) 1.0，该模型已在亚马逊Bedrock，以及其自有API上提供。新模型提供了改进的颜色准确性和细节，并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....

2023-07-17 talkingdev

这份报告介绍了一个新系统，它可以为您使用Stable Diffusion、DreamBooth、LoRA等个性化文本到图像模型创建的任何图像添加逼真的运动。该系统使用一个“运动模块”，从现实生活的视频中学习，并可添加到任何文本到图像...

2023-07-08 talkingdev

DragonDiffusion是一种全新的方法，旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应，DragonDiffusion可以进行各种详细的图像修改，如移动和调整对象的大小，替换外观，以及拖动内容，同时保持图像...

2023-06-08 talkingdev

最近，研究人员发现文本图像模型（如Stable Diffusion）可以具有紧急对应关系检测能力。这些对应关系是图像中的语义特征，即表示相同的事物，例如人的鼻子，动物的耳朵，汽车的轮胎等。通过巧妙的算法，可以从各种图...

2023-05-04 talkingdev

一个名为“Pick-a-Pic”的网络应用程序被创建，让人们生成图像并分享他们的喜好，从而形成了一个大型的开放数据集，用于训练一个智能评分系统PickScore。PickScore非常擅长预测人们的喜好，并且在评估文本到图像模型方...