原始稳定扩散模型的创新之一是在扩散过程中使用较小的潜在空间。这意味着扩散不是发生在像素上,而是在某种压缩的图像表示上。本文深入探讨了一些解释SDXL潜在空间的方法。
Read More随着AlphaFold等人工智能技术的不断发展,科学研究进展的速度也在大幅提高。最近,一项研究开发出了RoseTTAFold All-Atom,这是一种神经网络技术,可以对蛋白质、药品、维生素、DNA和糖等广泛的分子进行建模。研究人...
Read More这项研究提出了3DStyle-Diffusion模型,这是一种用于对3D网格进行细节风格化的新方法,整合了2D扩散模型以增加对外观和几何形状的控制。它通过首先使用隐式MLP网络将3D网格的纹理参数化为反射和照明,然后使用预训练...
Read MorePixArt是一种新的文本到图像模型,它使用T5文本编码、交叉注意力和扩散变压器,以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型,可以比使用UNet模型训练快90%。PixArt模型的训练...
Read MoreOpenAI最近发布了用于稳定扩散的一致性解码器,这将极大地改善潜在扩散模型生成图像的性能。这是一个开源项目,可在GitHub上获得。随着这种技术的进步,我们可以期待AI在图像生成方面的更多突破。
Read More高斯混合解算器可以增强扩散模型,解决图像合成中的速度-质量平衡问题,为图像的细节和清晰度设定新标准。它基于高斯混合模型,通过聚类技术来确定数据的分布,进而提高图像质量。使用高斯混合模型可以更好地理解图...
Read More微软研究小组在一篇论文中提到,GPT-3.5-turbo(ChatGPT背后的模型)是一个具有20B参数的模型,该小组研究扩散模型用于代码。据称原始模型的参数为175B,因此可能进行了重新训练或蒸馏。
Read More最受欢迎的扩散模型,如稳定扩散,已经在各种数据上进行了训练,但其中很多数据受到不同的版权限制。MosaicML提出的这种新模型纯粹基于创意共享数据进行训练,其性能与SD2相当,并且只需要训练数据的一小部分。
Read More