Diffusion的相关内容 - 漫话开发者

2025-06-15 talkingdev

用PyTorch从零开始重新实现StableDiffusion 3.5

开发者yousef-rafat在GitHub上开源了miniDiffusion项目，这是一个完全使用PyTorch重新实现的Stable Diffusion 3.5版本。该项目去除了原始实现中的复杂依赖，仅依靠PyTorch框架，使得模型更加轻量化和易于理解。这一...

2025-06-09 talkingdev

近日，一项名为PTSD（Progressive Tempering Sampler with Diffusion）的新型采样技术在预印本平台arXiv上发布，该技术通过序列化温度调节训练扩散模型，显著提升了从未归一化概率密度中采样的效率。传统方法在复杂...

2025-06-04 talkingdev

来自arXiv的最新研究论文提出了一种名为DIME（Diffusion-based Interdependent Medical Effects）的突破性模型，该模型利用扩散模型技术构建医疗领域的联合概率分布预测框架。这项研究通过深度学习中的扩散过程，首...

2025-05-29 talkingdev

Goodfire公司最新发布的Paint With Ember工具突破了传统文本提示的局限，允许用户通过绘制简单的像素图像直接操控图像模型的神经激活。该工具采用稀疏自编码器技术，将Stable Diffusion XL-Turbo的内部特征解码为可...

2025-05-27 talkingdev

近日，FoD研究团队提出了一种基于均值回归随机微分方程的前向生成建模框架（Forward-Only Diffusion）。该技术突破性地实现了非马尔可夫采样过程，在图像生成任务中以更少的迭代步骤达到业界竞争力水平。传统扩散模...

2025-05-22 talkingdev

谷歌最新发布的Gemini Diffusion标志着大语言模型架构的重大突破，这是该公司首次采用扩散模型（Diffusion Model）完全替代传统的Transformer架构。技术文档显示，该模型在保持与Gemini 2.0 Flash-Lite相当性能表现...

2025-05-16 talkingdev

OpenThinkIMG项目为视觉语言模型(VLMs)提供了革命性的视觉工具调用框架，其核心技术突破体现在三个方面：首先，通过动态推理机制实现多工具链式调用，使AI能根据图像内容自主选择处理工具；其次，创新的V-ToolRL强化...

2025-05-16 talkingdev

Meta旗下FAIR（基础人工智能研究）团队近日宣布推出多项重要开源成果，涵盖三大前沿领域：1) 分子属性预测数据集与模型，将加速药物发现与材料科学研发流程；2) 扩散模型（Diffusion Models）相关资源，为当前最热门...