图像合成的相关内容 - 漫话开发者

2026-06-30 talkingdev

DiScoFormer：单一Transformer模型，跨分布同时估计密度与得分，性能碾压传统KDE

近日，AI2研究团队在Hugging Face博客上发布了DiScoFormer模型，这是一种基于Transformer架构的创新方法，能够在单次前向传播中同时完成数据的密度估计和得分函数估计，而无需针对新分布进行重新训练。与经典的核密...

2026-01-14 talkingdev

近日，开源社区迎来一款名为GLM-Image的工业级离散自回归图像生成模型，其采用了一种创新的混合架构，将自回归模块与扩散解码器相结合，标志着生成式AI在图像合成领域的技术路线探索进入新阶段。该模型的核心优势在...

2025-09-12 talkingdev

GitHub热门项目「Awesome-Nano-Banana-images」近期引发人工智能社区广泛关注，该项目通过精心策划的示例库，展示了基于Gemini-2.5-flash图像生成模型「Nano Banana🍌」的多样化应用场景。该仓库收录了包括超现实主义...

2025-08-20 talkingdev

加州大学洛杉矶分校研究团队最新提出的NVG（Next Visual Granularity）框架，标志着图像生成领域取得重大技术突破。该创新性方法采用结构化序列建模技术，通过多层次渐进式优化机制，首次实现了从全局布局语义到局部...

2025-05-27 talkingdev

近日，FoD研究团队提出了一种基于均值回归随机微分方程的前向生成建模框架（Forward-Only Diffusion）。该技术突破性地实现了非马尔可夫采样过程，在图像生成任务中以更少的迭代步骤达到业界竞争力水平。传统扩散模...

2025-05-07 talkingdev

近日，GitHub上开源了一个名为DDT（Decoupled Diffusion Transformer）的项目，该项目实现了一种结合Transformer和扩散模型的新型架构。该架构采用Encoder-Decoder设计，其中Decoder部分由扩散模型构成。初步实验表...

2025-04-21 talkingdev

最新研究通过两阶段优化策略，成功将自回归模型应用于个性化图像生成领域，其生成质量已达到当前主流的扩散模型水平。该论文提出创新性训练框架，第一阶段通过大规模数据集预训练构建基础模型，第二阶段采用针对性微...

2025-04-09 talkingdev

近日，图像生成领域取得了一项重要技术突破，成功解决了长期困扰业界的'大象难题'。这一突破性进展标志着生成式AI在图像合成质量与逻辑一致性方面迈上了新台阶。研究人员通过改进LLM与扩散模型的协同机制，结合创新...