图像模型的相关内容 - 漫话开发者

2025-04-30 talkingdev

CogView 4图像生成模型发布：性能超越Flux模型，开放许可引关注

清华大学知识工程组（KEG）与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目，该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...

2024-10-04 talkingdev

FLUX1.1 [pro]是由Black Forest Labs最新推出的文本到图像模型，代表了当前技术的前沿水平（SotA）。该模型通过先进的算法和深度学习技术，实现了更高质量和更快速度的图像生成能力。FLUX1.1 [pro]不仅在生成图像的...

2024-08-02 talkingdev

由 FAL 团队开发的 Flux 是一个新的文本到图像模型，它是一个参数量达到 120 亿的深度神经网络。这个模型能够从文本描述中生成高质量、多样性的图像，它会对输入的文本进行语义分析，并且能够根据文本描述生成精细的...

2024-07-11 talkingdev

研究人员引入了一个新的强化学习框架，以提高个性化文本到图像的生成效果。这种新的强化学习框架，是目前研究人员在个性化文本到图像模型领域的重要突破。这项技术的应用不仅可以大幅提高图像生成的质量，更可以实现...

2024-07-01 talkingdev

MUMU视觉模型是一种创新的生成图像模型，它的特点在于能够将文本和图像交织在一起进行更强的条件化处理。这种独特的方法使得MUMU视觉模型在性能上超越了纯文本条件化模型。MUMU视觉模型的核心优势在于，它不仅仅是将...

2024-05-07 talkingdev

最新的研究提出一种新的深度假象检测方法，这种方法主要关注于遮蔽图像模型，尤其是在频率域中。这种方法与传统的深度假象检测方法有所不同，对于识别由最新的AI生成技术制作的合成图像表现出显著的改进。遮蔽图像模...

2024-04-16 talkingdev

本文深入探讨了如何训练扩散模型以生成视频，如何适配图像模型，甚至在无需额外训练的情况下，如何从图像模型中生成视频。扩散模型作为一种新兴的生成模型，已经在图像生成领域取得了显著的成果。文章首先介绍了扩散...

2024-03-12 talkingdev

VideoElevator引入了一种新的方法，通过利用文本到图像模型的优势来增强文本到视频扩散模型。这种即插即用的方法将增强过程分为了调整时间运动和提升空间质量两个部分，从而产生了帧质量和文本对齐得到了提高的视频...