扩散模型的相关内容 - 漫话开发者

2023-11-30 talkingdev

论文：创新方法增强手语视频隐私保护

DiffSLVA是一种创新的手语视频匿名化方法，可以在保留语言内容的同时进行隐私保护。该技术使用预训练的扩散模型和专门的面部表情模块，克服了以前的限制，不需要精确的姿势估计。

2023-11-30 talkingdev

StableVSR是一种新颖的视频超分辨率（VSR）方法，利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比，StableVSR可以更好地处理不同的噪声和失真情况，并且在不需要额外训练数据的情况下也...

2023-11-23 talkingdev

原始稳定扩散模型的创新之一是在扩散过程中使用较小的潜在空间。这意味着扩散不是发生在像素上，而是在某种压缩的图像表示上。本文深入探讨了一些解释SDXL潜在空间的方法。

2023-11-15 talkingdev

随着AlphaFold等人工智能技术的不断发展，科学研究进展的速度也在大幅提高。最近，一项研究开发出了RoseTTAFold All-Atom，这是一种神经网络技术，可以对蛋白质、药品、维生素、DNA和糖等广泛的分子进行建模。研究人...

2023-11-14 talkingdev

这项研究提出了3DStyle-Diffusion模型，这是一种用于对3D网格进行细节风格化的新方法，整合了2D扩散模型以增加对外观和几何形状的控制。它通过首先使用隐式MLP网络将3D网格的纹理参数化为反射和照明，然后使用预训练...

2023-11-09 talkingdev

PixArt是一种新的文本到图像模型，它使用T5文本编码、交叉注意力和扩散变压器，以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型，可以比使用UNet模型训练快90%。PixArt模型的训练...

2023-11-08 talkingdev

OpenAI最近发布了用于稳定扩散的一致性解码器，这将极大地改善潜在扩散模型生成图像的性能。这是一个开源项目，可在GitHub上获得。随着这种技术的进步，我们可以期待AI在图像生成方面的更多突破。

2023-11-08 talkingdev

高斯混合解算器可以增强扩散模型，解决图像合成中的速度-质量平衡问题，为图像的细节和清晰度设定新标准。它基于高斯混合模型，通过聚类技术来确定数据的分布，进而提高图像质量。使用高斯混合模型可以更好地理解图...