谷歌开发者博客宣布,其先进的文本生成图像模型Imagen 4系列现已在Gemini API中全面开放使用,同时推出高性能版本Imagen 4 Fast。这一里程碑式更新标志着谷歌在多模态AI领域取得重要突破,开发者可通过API直接调用具...
Read More谷歌开发者博客宣布,其先进的文本生成图像模型Imagen 4系列现已在Gemini API中全面开放使用,同时推出性能优化的Imagen 4 Fast版本。这一里程碑式更新标志着多模态AI技术进入工业化应用阶段,开发者可基于该API实现...
Read More视觉AI平台服务商Bria近日在Hugging Face发布新一代开源文本生成图像模型BRIA-3.2,其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的图像生成质量,且模型体积缩小至三分之一,...
Read MoreBria最新发布的3.2版本AI图像生成模型在文本渲染领域实现技术突破,该模型采用100%经过授权的合规数据进行训练,为企业用户提供符合知识产权法规的AI解决方案。这一创新显著提升了生成图像中文本元素的准确性和自然...
Read MoreGoodfire公司最新发布的Paint With Ember工具突破了传统文本提示的局限,允许用户通过绘制简单的像素图像直接操控图像模型的神经激活。该工具采用稀疏自编码器技术,将Stable Diffusion XL-Turbo的内部特征解码为可...
Read More清华大学知识工程组(KEG)与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目,该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...
Read MoreFLUX1.1 [pro]是由Black Forest Labs最新推出的文本到图像模型,代表了当前技术的前沿水平(SotA)。该模型通过先进的算法和深度学习技术,实现了更高质量和更快速度的图像生成能力。FLUX1.1 [pro]不仅在生成图像的...
Read More由 FAL 团队开发的 Flux 是一个新的文本到图像模型,它是一个参数量达到 120 亿的深度神经网络。这个模型能够从文本描述中生成高质量、多样性的图像,它会对输入的文本进行语义分析,并且能够根据文本描述生成精细的...
Read More