漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-20 talkingdev

NVG突破图像生成技术:结构化序列框架实现从全局到细节的渐进式优化

加州大学洛杉矶分校研究团队最新提出的NVG(Next Visual Granularity)框架,标志着图像生成领域取得重大技术突破。该创新性方法采用结构化序列建模技术,通过多层次渐进式优化机制,首次实现了从全局布局语义到局部...

Read More
2025-08-16 talkingdev

谷歌Gemini API全面开放Imagen 4系列模型,Imagen 4 Fast同步亮相

谷歌开发者博客宣布,其先进的文本生成图像模型Imagen 4系列现已在Gemini API中全面开放使用,同时推出性能优化的Imagen 4 Fast版本。这一里程碑式更新标志着多模态AI技术进入工业化应用阶段,开发者可基于该API实现...

Read More
2025-07-08 talkingdev

[论文推荐] Mercury:基于扩散模型的超高速语言模型

近日,研究人员发布了新一代商业级大语言模型Mercury,该模型基于扩散模型技术,采用Transformer架构进行参数化,并能够并行预测多个token。报告重点介绍了Mercury Coder,这是首套专为编程应用设计的扩散大语言模型...

Read More
2025-06-15 talkingdev

用PyTorch从零开始重新实现StableDiffusion 3.5

开发者yousef-rafat在GitHub上开源了miniDiffusion项目,这是一个完全使用PyTorch重新实现的Stable Diffusion 3.5版本。该项目去除了原始实现中的复杂依赖,仅依靠PyTorch框架,使得模型更加轻量化和易于理解。这一...

Read More
2025-06-09 talkingdev

[论文推荐]PTSD:基于扩散模型的渐进式温度调节采样器

近日,一项名为PTSD(Progressive Tempering Sampler with Diffusion)的新型采样技术在预印本平台arXiv上发布,该技术通过序列化温度调节训练扩散模型,显著提升了从未归一化概率密度中采样的效率。传统方法在复杂...

Read More
2025-06-04 talkingdev

[论文推荐]DIME:基于扩散模型的医疗联合治疗效果预测系统

来自arXiv的最新研究论文提出了一种名为DIME(Diffusion-based Interdependent Medical Effects)的突破性模型,该模型利用扩散模型技术构建医疗领域的联合概率分布预测框架。这项研究通过深度学习中的扩散过程,首...

Read More
2025-05-29 talkingdev

Goodfire推出Paint With Ember工具:通过像素画直接操控AI模型的神经激活

Goodfire公司最新发布的Paint With Ember工具突破了传统文本提示的局限,允许用户通过绘制简单的像素图像直接操控图像模型的神经激活。该工具采用稀疏自编码器技术,将Stable Diffusion XL-Turbo的内部特征解码为可...

Read More
2025-05-27 talkingdev

FoD提出前向扩散生成模型框架:仅需前向步骤实现高效图像生成

近日,FoD研究团队提出了一种基于均值回归随机微分方程的前向生成建模框架(Forward-Only Diffusion)。该技术突破性地实现了非马尔可夫采样过程,在图像生成任务中以更少的迭代步骤达到业界竞争力水平。传统扩散模...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page