潜在扩散模型的相关内容 - 漫话开发者

2026-04-30 talkingdev

Latent Diffusion突破文本推理瓶颈：苹果LaDiR框架让LLM思考更缜密

苹果机器学习研究团队提出了一种名为LaDiR（Latent Diffusion Reasoner）的创新推理框架，为大型语言模型（LLM）的文本推理能力带来了显著提升。LaDiR框架的核心在于巧妙地将连续潜在表示的强大表现力与潜在扩散模型...

2025-10-15 talkingdev

近期发布的表征自编码器（RAE）技术为潜在扩散模型带来重大升级。该技术通过使用DINO、SigLIP或MAE等预训练编码器替代传统变分自编码器（VAE），结合学习型解码器构建高维潜在空间。实验表明，这种新型架构能显著提...

2025-04-18 talkingdev

近日，一项名为REPA-E的技术突破引发了机器学习领域的广泛关注。该技术通过创新的表示对齐损失函数，首次实现了变分自编码器(VAE)与潜在扩散模型的稳定联合训练。这种端到端的训练方法在ImageNet数据集上取得了当前...

2024-06-27 talkingdev

近日，一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器（Trajectory Diffusion Transformer）和多视图...

2023-11-08 talkingdev

OpenAI最近发布了用于稳定扩散的一致性解码器，这将极大地改善潜在扩散模型生成图像的性能。这是一个开源项目，可在GitHub上获得。随着这种技术的进步，我们可以期待AI在图像生成方面的更多突破。

2023-07-04 talkingdev

研究人员提出了一种新的方法，使用一种扩散模型，具体来说是一种名为稳定扩散的潜在扩散模型（LDM），从通过fMRI捕获的人脑活动中重建高分辨率、高保真度的图像。该方法在保持生成性能的同时减少了计算成本，无需对...