单个提示生成单个图像通常很好,但在生成视频时由于帧之间的时间变化而失败。 然而,更改文本时的一致性非常具有挑战性。 这项工作解决了这两个问题,并利用扩散技术实现了长达512帧的生成。
Read More近期,3D生成方法的研究领域又有新进展。这次的新方法,生成出的网格模型在全局上具有一致性,并且在语义上呈现出连贯性。更令人兴奋的是,这项技术还有极大的加速优化空间。通过采用多视角扩散的方法,3D模型生成技...
Read More近日,GitHub在其官方仓库中发布了一款名为Color-Diffusion的全新着色模型,该模型的主要功能是给黑白图片进行着色。Color-Diffusion模型采用了先进的扩散技术,可以将色彩自然地分布到黑白图片的每个像素点上,实现...
Read More该存储库介绍了主题扩散,这是开放领域个性化图像生成的一项突破性技术。它只需要一个参考图像,而且在测试时不需要进行微调。主题扩散技术的出现,将大幅提升图像生成的效率和准确性,且广泛应用于各类图像生成项目...
Read More一位Reddit用户最近发布了一系列采用稳定扩散技术制作的艺术二维码,其风格为动漫和亚洲艺术风格,可通过智能手机相机应用程序进行扫描。该用户显然训练了多个定制的稳定扩散控制网络模型,并在将QR码输入图像生成器...
Read More## 新闻内容: - 提出一种新方法,使用零样本声音引导视觉效果进行视频编辑,利用时间声音特征创建动态样式,同时保持时间一致性。 - 通过使用光流引导,引导去噪扩散概率模型与音频潜在表示相结合,该方法优于现有...
Read More