漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-28 talkingdev

Flux Inpainting技术登陆Hugging Face Hub:扩散模型再添新功能

近日,Hugging Face Hub上线了Flux扩散模型的图像修复(Inpainting)功能,标志着这一前沿技术在计算机视觉领域的又一重要突破。Flux作为新一代高性能扩散模型,其独特的架构设计显著提升了生成图像的质量和效率。此...

Read More
2025-03-28 talkingdev

[论文推荐]Guidance-Free Training:无需分类器引导的视觉生成模型训练新方法

近日,一项名为Guidance-Free Training(GFT)的技术突破引发计算机视觉领域关注。该技术通过完全消除对Classifier-Free Guidance(CFG)的依赖,在保持生成质量的同时显著降低计算成本。与传统基于蒸馏的方法不同,...

Read More
2025-03-19 talkingdev

[开源] Stability AI发布多视角虚拟相机系统,支持新颖视图合成

Stability AI近日发布了一款强大的多视角虚拟相机系统,该系统能够实现新颖视图合成(Novel View Synthesis),为用户提供了一种高效且非商业化的解决方案。虽然该技术尚未达到行业最先进水平,但其优势在于仅需两次...

Read More
2025-03-19 talkingdev

Roblox开源其生成式3D模型Cube,革新虚拟世界创作

Roblox近日宣布开源其生成式AI系统Cube,该系统专注于3D和4D模型的生成。Cube的Beta版本将被集成到Roblox Studio中,并作为Lua API供开发者使用。这一重大技术突破不仅展示了Roblox在生成式AI领域的深厚积累,更预示...

Read More
2025-03-12 talkingdev

MovieAgent:长镜头电影生成技术突破

近日,一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态,利用基于角色的提示(persona-based prompting)来确保生成内容的一致性和准确性。MovieAgent进一步使用Stable Diffusion视频模型...

Read More
2025-03-12 talkingdev

MovieAgent:实现长视频一致性生成的新突破

近日,一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态,并采用基于角色的提示机制,显著提升了视频生成的一致性和准确性。MovieAgent利用Stable Diffusion视频模型生成并拼接帧,从而实现...

Read More
2025-03-04 talkingdev

Llama Stack:从零到卓越的生成式AI应用构建指南

Llama Stack 定义并标准化了将生成式AI应用推向市场所需的核心构建模块。这些构建模块以可互操作的API形式呈现,并由广泛的提供商提供其实现。它们被组装成易于开发者从零到生产的发行版。Llama Stack 的目标是简化...

Read More
2025-03-04 talkingdev

Stability AI与Arm合作推出智能手机端实时生成音频技术

Stability AI与Arm近日宣布合作,成功将实时生成音频技术引入智能手机。通过结合Stable Audio Open和Arm KleidiAI库,双方在移动设备上实现了音频生成速度的30倍提升。这一突破性进展不仅展示了生成式AI在音频领域的...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page