漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-17 talkingdev

DeepSeek R1-0528与FLUX.1 Kontext图像编辑模型登陆Together AI平台,推理API与聊天应用免费体验

Together AI宣布在其Serverless Inference API和专用端点服务中集成两大前沿AI模型:DeepSeek R1-0528语言模型与FLUX.1 Kontext图像生成系统。DeepSeek R1-0528通过升级的推理能力、函数调用支持及代码生成优化,显...

Read More
2025-06-13 talkingdev

Bria 3.2新一代AI图像模型开放早期体验:100%合规数据训练,突破文本渲染技术

Bria最新发布的3.2版本AI图像生成模型在文本渲染领域实现技术突破,该模型采用100%经过授权的合规数据进行训练,为企业用户提供符合知识产权法规的AI解决方案。这一创新显著提升了生成图像中文本元素的准确性和自然...

Read More
2025-06-13 talkingdev

字节跳动Seedance 1.0登顶视频生成基准测试,超越谷歌Veo 3与OpenAI Sora

字节跳动旗下TikTok母公司最新发布的Seedance 1.0模型在文本生成视频(text-to-video)和图像生成视频(image-to-video)两项核心任务中均位列榜首,其性能表现超越谷歌Veo 3与OpenAI Sora等业界标杆。该模型仅需41...

Read More
2025-06-09 talkingdev

[论文推荐]PTSD:基于扩散模型的渐进式温度调节采样器

近日,一项名为PTSD(Progressive Tempering Sampler with Diffusion)的新型采样技术在预印本平台arXiv上发布,该技术通过序列化温度调节训练扩散模型,显著提升了从未归一化概率密度中采样的效率。传统方法在复杂...

Read More
2025-05-29 talkingdev

PixelFlow开源-直接在像素空间生成高质量图像

PixelFlow是近期在GitHub上开源的一个创新图像生成模型,其最大特点是直接在像素空间生成图像,无需依赖变分自编码器(VAE)。这一技术突破带来了显著的图像质量提升和更精细的语义控制能力,同时在生成效率和基准测...

Read More
2025-05-29 talkingdev

Goodfire推出Paint With Ember工具:通过像素画直接操控AI模型的神经激活

Goodfire公司最新发布的Paint With Ember工具突破了传统文本提示的局限,允许用户通过绘制简单的像素图像直接操控图像模型的神经激活。该工具采用稀疏自编码器技术,将Stable Diffusion XL-Turbo的内部特征解码为可...

Read More
2025-05-27 talkingdev

FoD提出前向扩散生成模型框架:仅需前向步骤实现高效图像生成

近日,FoD研究团队提出了一种基于均值回归随机微分方程的前向生成建模框架(Forward-Only Diffusion)。该技术突破性地实现了非马尔可夫采样过程,在图像生成任务中以更少的迭代步骤达到业界竞争力水平。传统扩散模...

Read More
2025-05-22 talkingdev

构建具备自我优化能力的智能图像生成

最新研究表明,大型语言模型在自然语言处理方面展现出强大的视觉缺陷推理能力,但在将这些高层次洞察转化为精确的像素级操作时仍面临挑战。这些模型在受限于明确、界定清晰的维度时表现优异,但当需要平衡抽象美学判...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page