HeyGen公司最新推出的Avatar IV标志着AI数字人技术进入新纪元。该模型采用神经音频-表情引擎技术,通过解析语音的声调、节奏和情感等多维特征,仅需单张静态图像即可驱动生成高度逼真的面部微表情动画。这项突破性技...
Read MoreOpenAI工程师团队近期披露了ChatGPT图像功能在3月发布时的技术挑战与解决方案。该功能上线首周即吸引1亿新用户,生成7亿张图像,其中印度市场每小时新增用户峰值达100万。面对同步图像生成系统无法承受的突发流量,...
Read More加州大学团队在GitHub开源了UCGM项目,为生成式AI领域带来突破性技术框架。该项目创新性地构建了统一架构,可同时支持多步(如扩散模型)和少步(如流模型)连续生成模型的训练与采样流程。通过数学层面的抽象整合,...
Read MoreFreepik近日发布了名为F Lite的AI图像生成模型,该模型是与Fal.ai合作开发,并利用64块Nvidia H100 GPU进行训练。F Lite的独特之处在于其训练数据全部来自经过授权的、适合工作场景的图像,确保了生成内容的合法性和...
Read More近日,GitHub上开源了一个名为DDT(Decoupled Diffusion Transformer)的项目,该项目实现了一种结合Transformer和扩散模型的新型架构。该架构采用Encoder-Decoder设计,其中Decoder部分由扩散模型构成。初步实验表...
Read More近日,一项名为'Attention Distillation for Diffusion-Based Image Stylization'的技术在图像生成领域取得重要进展。该技术通过利用预训练扩散模型中的自注意力特征,创新性地引入了注意力蒸馏损失函数,有效优化了...
Read More清华大学知识工程组(KEG)与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目,该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...
Read MoreCharacter.AI近日推出了一款名为AvatarFX的视频生成模型,该技术能够为AI生成的角色赋予动画效果,并支持从现有图像创建视频。尽管这一技术展现了巨大的潜力,但其可能被滥用于制作深度伪造(deepfake)视频的隐患也...
Read More