近日,GitHub上发布了一个名为“Tokenize an Image as a Set”的开源项目,该项目提出了一种全新的图像生成框架。该框架通过集合标记化(set-based tokenization)和新型离散扩散方法(discrete diffusion method),...
Read More最新的技术突破使得我们几乎可以通过在Diffusion Transformer中使用token替换来实现对任何图像的个性化,而无需进行额外的微调或训练。这一创新方法不仅大大简化了个性化图像的生成过程,还显著提高了效率。Diffusio...
Read More大多数文本到图像生成模型依赖于从网络上抓取的大量自定义数据。然而,一项最新研究探讨了仅使用ImageNet数据集训练图像生成模型的可能性。研究发现,通过合成生成的密集标注(dense captions)能够显著提升模型性能...
Read More近日,一项关于CoT(Chain-of-Thought)推理在自回归图像生成领域的研究项目引发了广泛关注。该项目通过探索CoT推理的潜力,旨在提升自回归图像生成模型的表现。自回归模型在图像生成任务中通常依赖于逐步预测像素值...
Read More在技术领域,一种名为MasterWeaver的新方法被提出,以提高个性化文本到图像生成模型的性能。这种技术的出现,无疑为AI领域的图像生成技术开辟了新的可能性,使得文本到图像的转换过程更为精确和个性化。MasterWeaver...
Read MoreVisual Autoregressive Models是一个新的GitHub项目,它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开,但目前该项目已经引起了技...
Read More近期,研究人员开发了一种名为提示自动编辑(Prompt Auto-Editing,简称PAE)的新技术,旨在提升基于文本生成图像的技术水平。该技术利用了Imagen和Stable Diffusion等扩散模型,通过在线强化学习动态调整文本提示中...
Read MoreAID及其变体PAID是两种旨在通过加入文本和姿势等条件来改进图像插值的技术。这些方法确保生成的图像在不需要额外训练的情况下,具有更高的一致性、平滑度和真实性。图像生成技术的进步不仅推动了人工智能领域的创新...
Read More