漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-04 talkingdev

ImageNet在文本到图像生成中的潜力探索

大多数文本到图像生成模型依赖于从网络上抓取的大量自定义数据。然而,一项最新研究探讨了仅使用ImageNet数据集训练图像生成模型的可能性。研究发现,通过合成生成的密集标注(dense captions)能够显著提升模型性能...

Read More
2025-01-28 talkingdev

1Prompt1Story:无需训练的文本到图像生成新方法

1Prompt1Story是一种无需训练的文本到图像生成方法,通过单一串联提示实现一致的图像生成。该方法的核心在于将多个提示信息串联成一个整体,从而在生成过程中保持一致性。与传统的训练依赖型方法不同,1Prompt1Story...

Read More
2025-01-27 talkingdev

DeepSeek发布Janus Pro:全新文本生成图像工具

近日,DeepSeek正式发布了其最新的文本生成图像工具Janus Pro。该工具基于先进的LLM技术,结合embedding和LoRA优化,能够将用户输入的文本描述快速转化为高质量的图像。Janus Pro不仅支持多种艺术风格,还通过RAG技...

Read More
2024-10-03 talkingdev

FLUX1.1 [pro]:Black Forest Labs推出全新SotA文本到图像模型

FLUX1.1 [pro]是由Black Forest Labs最新推出的文本到图像模型,代表了当前技术的前沿水平(SotA)。该模型通过先进的算法和深度学习技术,实现了更高质量和更快速度的图像生成能力。FLUX1.1 [pro]不仅在生成图像的...

Read More
2024-06-26 talkingdev

EvalAlign:一种文本到图像生成模型评估指标

EvalAlign是一种新型的用于改进文本到图像生成模型评估的指标。与现有的评估指标不同,EvalAlign提供了细粒度的准确性和稳定性。它主要关注图像的真实性和文本与图像的对齐性。与其他评估指标不同的是,EvalAlign不...

Read More
2024-05-16 talkingdev

论文:英汉文本到图像生成新标杆,混元-DiT的突破性发展

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆,特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道,为持续的模型改进提供了可能性。而这一突破性的发展,不仅提升了英汉文本...

Read More
2023-07-28 talkingdev

稳定性AI发布最新文本到图像模型:稳定扩散XL 1.0

稳定性AI近期发布了最新的先进文本到图像模型,稳定扩散XL (SDXL) 1.0,该模型已在亚马逊Bedrock,以及其自有API上提供。新模型提供了改进的颜色准确性和细节,并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....

Read More
2023-07-08 talkingdev

DragonDiffusion:一种采用特征对应提高文本到图像编辑精度的新方法

DragonDiffusion是一种全新的方法,旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应,DragonDiffusion可以进行各种详细的图像修改,如移动和调整对象的大小,替换外观,以及拖动内容,同时保持图像...

Read More