漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-21 talkingdev

论文:高效评估文字至图像生成的新方法

目前,评价从文本生成的图像质量的方法存在一些问题,如无法真实捕获图像的美观程度或与文本的匹配程度。最新的研究论文介绍了一种新的方法,该方法可以估计生成的图像与给定文本的匹配程度,重点关注图像的最重要部...

Read More
2023-08-15 talkingdev

DatasetDM,计算机视觉合成图像生成崛起

该项目引入了一种名为DatasetDM的新工具,它可以生成无尽的虚假图像,并附带详细的标签,比如哪部分是哪个对象或者图像中的物体离得有多远。这对于训练计算机视觉系统非常有用,仅使用一小部分真实照片,合成的图像...

Read More
2023-08-15 talkingdev

Fooocus:一款免费开源且离线无需手动调整的图像生成软件

Fooocus是一款强大的图像生成软件。这款软件完全离线运行,无需联网,也无需手动调整,用户可以轻松生成所需的图像。最重要的是,Fooocus是一款开源软件,这意味着任何对此感兴趣的研究者和开发者都可以查看其源代码...

Read More
2023-08-14 talkingdev

SDXL ControlNet:利用边缘控制图像生成的最佳开源模型

图像生成是人工智能技术的一个重要应用场景,而如何更好地控制其生成过程,是业界一直在探索的问题。最佳开源模型SDXL,推出了其ControlNet版本,通过利用边缘来调整最终输出,为图像生成提供了新的解决方案。SDXL C...

Read More
2023-08-08 talkingdev

无分类器引导在HF变压器中的应用(GitHub拉取请求)

无分类器引导是一种引导模型生成的方式。它在图像生成中得到了广泛的应用。同时,它对于文本也同样适用,如今已被纳入Hugging Face模型的`.generate()`方法中。无分类器引导的工作原理是通过对模型的输出进行引导,...

Read More
2023-07-28 talkingdev

稳定性AI发布最新文本到图像模型:稳定扩散XL 1.0

稳定性AI近期发布了最新的先进文本到图像模型,稳定扩散XL (SDXL) 1.0,该模型已在亚马逊Bedrock,以及其自有API上提供。新模型提供了改进的颜色准确性和细节,并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....

Read More
2023-07-25 talkingdev

Subject-Diffusion: 提升个性化图像生成的新突破(GitHub仓库)

该存储库介绍了主题扩散,这是开放领域个性化图像生成的一项突破性技术。它只需要一个参考图像,而且在测试时不需要进行微调。主题扩散技术的出现,将大幅提升图像生成的效率和准确性,且广泛应用于各类图像生成项目...

Read More
2023-07-17 talkingdev

Meta发布新型文本-图像-文本模型

Meta最近发布了一种新型模型,该模型的工作原理与GPT系列的解码器仅Transformer相似,都是一次预测一个令牌。然而,如果你将交错的文本和图像视为令牌,这种模型就可以从文本生成图像,反之亦然。更令人惊奇的是,该...

Read More
2023-07-03 talkingdev

多视角扩散技术提供全景图像生成能力

这项工作允许您使用一张单一的图像和一个预训练的生成模型来生成全景图像或图像的多个视角。

Read More
2023-06-23 talkingdev

Stability发布全新Stable Diffusion模型,新版将不再出现意大利面手

稳定性人工智能发布了一种新的人工智能模型,用于生成比以往更逼真的图像。该模型名为SDXL 0.9,可以根据基于文本的提示创建图像,这些图像比以前的模型更美观,并具有更多的构图细节。据悉,Stable Diffusion的下一...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page