UniFL是一种通过一系列复杂的反馈步骤来提高扩散模型输出质量的方法。这些步骤旨在提升生成图像的视觉质量、美感和偏好对齐。这些技术与底层模型无关,可用于提升任何图像生成模型的性能。
Read MoreOpenAI宣布其创新性AI图像生成模型DALL-E现已成功与聊天机器人ChatGPT整合。这一新功能的推出使得用户能够在网页版、iOS以及Android平台上直接编辑DALL-E生成的图像。DALL-E此前已因其惊人的图像创造能力而名声大噪...
Read MoreSakana AI开发了先进的日语语言、视觉和图像生成模型。该公司引入了一种进化模型融合技术,旨在无需昂贵的预训练即可发展基础模型。该模型融合技术已经发布,并附带了方法的解释。这一创新技术将有助于降低AI模型开...
Read MoreStable Diffusion 3(SD3)是一款具有革命性的图像生成模型,通过引入潜在对抗性扩散蒸馏技术,成功将扩散步骤数量减少至4步,同时保持了图像生成的高质量。这项技术的进步不仅提升了图像生成的效率,还为AI艺术创作...
Read MoreMobileClip是一个快速的文本和图像模型,与OpenAI的原始CLIP模型性能相同,但运行速度提高了7倍。它可以在设备上用于各种视觉和语言任务。
Read MoreStability AI宣布推出Stable Diffusion 3,这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型,参数范围从8亿到80亿,这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...
Read MorePixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度,并采用ControlNet样式提示实现更好的控制。
Read MoreMUSE是一种使用Transformers的掩蔽图像生成模型。HuggingFace和Stability AI已经合作开源复现该模型,并发布了训练代码、模型检查点和论文。虽然这些模型的训练时间不如一些最好的图像扩散模型长,但它们显示出了很...
Read More