DragonDiffusion是一种全新的方法,旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应,DragonDiffusion可以进行各种详细的图像修改,如移动和调整对象的大小,替换外观,以及拖动内容,同时保持图像...
Read More本论文提出了一种新的方法,用于从文本生成一致且高质量的视频。它通过使用经过调整的图像模型创建关键帧,然后利用特殊的匹配和混合技术将这些样式传播到整个视频中,从而产生外观出色且流畅的视频。
Read More近年来,自主车辆研究的减速使计算机视觉领域的进展似乎放缓了。但现在,一种新技术正在让人们看到希望。该技术使用三个图像模型的水螅来增强自然图像抠图的性能,效果非常引人注目。 ## 核心要点: - Matte Anyth...
Read More最近,研究人员发现文本图像模型(如Stable Diffusion)可以具有紧急对应关系检测能力。这些对应关系是图像中的语义特征,即表示相同的事物,例如人的鼻子,动物的耳朵,汽车的轮胎等。通过巧妙的算法,可以从各种图...
Read More一个名为“Pick-a-Pic”的网络应用程序被创建,让人们生成图像并分享他们的喜好,从而形成了一个大型的开放数据集,用于训练一个智能评分系统PickScore。PickScore非常擅长预测人们的喜好,并且在评估文本到图像模型方...
Read More- Stability AI发布了下一代图像模型代码 - 模型是一个多阶段模型,具有冻结的T5文本编码器和两个超分辨率模型 - 模型能够呈现极高质量的文本,可能首先只面向研究,但会在社区反馈后开放。 深度学习模型 DeepFloyd...
Read More以下是该模型的三个核心要点: - 该模型能够处理多种语言的文本转图像,输出的质量非常高。 - 该模型基于LAION HighRes和内部专有图像数据集进行训练,尽管无法处理漫反射,但作者提供了在线演示。 - 该模型的参数...
Read More