生成模型的相关内容 - 漫话开发者

2025-05-14 talkingdev

[开源]UCGM：统一框架实现连续生成模型的训练与采样

加州大学团队在GitHub开源了UCGM项目，为生成式AI领域带来突破性技术框架。该项目创新性地构建了统一架构，可同时支持多步（如扩散模型）和少步（如流模型）连续生成模型的训练与采样流程。通过数学层面的抽象整合，...

2025-05-09 talkingdev

Freepik近日发布了名为F Lite的AI图像生成模型，该模型是与Fal.ai合作开发，并利用64块Nvidia H100 GPU进行训练。F Lite的独特之处在于其训练数据全部来自经过授权的、适合工作场景的图像，确保了生成内容的合法性和...

2025-04-30 talkingdev

清华大学知识工程组（KEG）与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目，该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...

2025-04-28 talkingdev

Character.AI近日推出了一款名为AvatarFX的视频生成模型，该技术能够为AI生成的角色赋予动画效果，并支持从现有图像创建视频。尽管这一技术展现了巨大的潜力，但其可能被滥用于制作深度伪造（deepfake）视频的隐患也...

2025-04-24 talkingdev

ANFM研究团队在arXiv最新发表的论文中，提出了一种基于过滤技术（filtration techniques）的革命性图生成方法。该技术通过优化传统图生成模型的拓扑结构处理流程，实现了比扩散模型快100倍的训练速度，同时保持了具...

2025-04-22 talkingdev

Hugging Face Hub最新推出的MAGI 1模型标志着自回归视频生成技术的重要突破。该模型能够生成具有长期一致性的长视频内容，其性能与Wan视频生成模型相当，虽略逊于某些闭源商业模型，但作为开源解决方案展现出显著竞...

2025-04-18 talkingdev

近日，一项名为REPA-E的技术突破引发了机器学习领域的广泛关注。该技术通过创新的表示对齐损失函数，首次实现了变分自编码器(VAE)与潜在扩散模型的稳定联合训练。这种端到端的训练方法在ImageNet数据集上取得了当前...

2025-04-15 talkingdev

谷歌云在Next 25大会上宣布Vertex AI迎来重大更新，其视频、图像、语音及音乐生成模型获得增强功能，显著提升企业创意工作流的智能化水平。谷歌AI推出面向企业的专用AI代理解决方案，通过优化任务自动化流程实现生产...