漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-27 talkingdev

FoD提出前向扩散生成模型框架:仅需前向步骤实现高效图像生成

近日,FoD研究团队提出了一种基于均值回归随机微分方程的前向生成建模框架(Forward-Only Diffusion)。该技术突破性地实现了非马尔可夫采样过程,在图像生成任务中以更少的迭代步骤达到业界竞争力水平。传统扩散模...

Read More
2025-05-07 talkingdev

DDT开源:解耦扩散Transformer

近日,GitHub上开源了一个名为DDT(Decoupled Diffusion Transformer)的项目,该项目实现了一种结合Transformer和扩散模型的新型架构。该架构采用Encoder-Decoder设计,其中Decoder部分由扩散模型构成。初步实验表...

Read More
2025-04-21 talkingdev

[论文推荐]自回归模型实现个性化图像合成:两阶段优化媲美扩散模型

最新研究通过两阶段优化策略,成功将自回归模型应用于个性化图像生成领域,其生成质量已达到当前主流的扩散模型水平。该论文提出创新性训练框架,第一阶段通过大规模数据集预训练构建基础模型,第二阶段采用针对性微...

Read More
2025-04-08 talkingdev

图像生成技术迎来重大突破:告别'大象难题'

近日,图像生成领域取得了一项重要技术突破,成功解决了长期困扰业界的'大象难题'。这一突破性进展标志着生成式AI在图像合成质量与逻辑一致性方面迈上了新台阶。研究人员通过改进LLM与扩散模型的协同机制,结合创新...

Read More
2025-03-14 talkingdev

AnyMoLe:利用视频扩散模型生成任意角色的中间帧运动

在计算机视觉和图形学领域,生成角色的中间帧运动一直是一个具有挑战性的任务,尤其是当涉及个性化角色的动画生成时。传统的动画生成方法需要针对特定角色进行数据收集和模型训练,而新项目AnyMoLe通过引入视频扩散...

Read More
2025-01-23 talkingdev

TREAD:无需修改架构的扩散模型高效训练新方法

近日,一项名为TREAD(Token Routing for Efficient Architecture-agnostic Diffusion Training)的新技术引起了广泛关注。该技术通过创新的Token Routing机制,显著提升了扩散模型(Diffusion Models)的样本效率,...

Read More
2024-10-16 talkingdev

线性扩散变换器助力高效高分辨率图像合成

近日,研究人员提出了一种高效的线性扩散变换器(linear diffusion transformer),该技术显著提升了高分辨率图像合成的效率。传统的图像合成方法通常面临生成速度慢和计算资源消耗大的问题,而线性扩散变换器通过优...

Read More
2024-05-10 talkingdev

CLLM一致性语言模型:开创新的预测范式

预测多个令牌的同时生成是当前被积极研究的一个有趣的范式。如果成功,这将大大提高许多大型语言模型的生成速度。本篇文章中的方法,模仿了图像合成中的一致性模型,试图在精调的LLMs上使用并行解码策略来加快生成速...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page