图像模型的相关内容 - 漫话开发者

2024-01-16 talkingdev

Prompt-Aligned：开源图像个性化技术大热

Dreambooth是目前最好的个性化图像模型的方法。Prompt对齐技术显著提高了对Prompt的遵循度，并且具有组合性。

2023-12-15 talkingdev

Google推出了Imagen 2，这是一种增强的AI图像模型，可供经批准的Google Cloud Vertex AI用户使用，提供文本渲染，标志以及多语言翻译等新功能。Imagen 2可以通过Google Cloud的AutoML API和Vision API实现。该模型使...

2023-12-11 talkingdev

Kandinsky 3.0是一种文本转图像模型，它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络（GAN）模型，通过学习图像语义和语法，从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...

2023-12-06 talkingdev

Diffusion Models as Prior (DMP)是一种新的方法，它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务，例如3D属性估计和语义分割，在有限的训练数据下表现优...

2023-11-09 talkingdev

PixArt是一种新的文本到图像模型，它使用T5文本编码、交叉注意力和扩散变压器，以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型，可以比使用UNet模型训练快90%。PixArt模型的训练...

2023-10-26 talkingdev

研究人员发现，当前领先的开源文本图像模型SDXL在推理时间上有了显著的加速，其速度提升了60%，同时体积缩小了50%。研究人员声称，在使用中，图像质量只有轻微的降低。

2023-10-16 talkingdev

研究人员正在改进我们与文本到图像模型的交互方式，例如Midjourney和Stable Diffusion，这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”，使人们可以自然地与大型语言模型进行交互，以获得更...

2023-07-28 talkingdev

稳定性AI近期发布了最新的先进文本到图像模型，稳定扩散XL (SDXL) 1.0，该模型已在亚马逊Bedrock，以及其自有API上提供。新模型提供了改进的颜色准确性和细节，并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....