漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-08 talkingdev

DALL-E与ChatGPT实现整合,图像编辑功能登陆三大平台

OpenAI宣布其创新性AI图像生成模型DALL-E现已成功与聊天机器人ChatGPT整合。这一新功能的推出使得用户能够在网页版、iOS以及Android平台上直接编辑DALL-E生成的图像。DALL-E此前已因其惊人的图像创造能力而名声大噪...

Read More
2024-04-05 talkingdev

TGATE推出两阶段推理图像生成方法,提升效率与画质

TGATE最新研究成果展示了一种高效的图像生成方法,该方法通过将整个生成过程分为规划和细化两个阶段来实现。这种新颖的方法不仅通过早期确定某些输出而简化了生成过程,而且还意外地提高了生成图像的质量。在规划阶...

Read More
2024-04-04 talkingdev

DALL-E图像编辑功能现已集成至ChatGPT

OpenAI的DALL-E现已推出图像编辑工具,支持网页和移动端使用。用户可以使用预设的风格建议来激发图像创作灵感。这一图像生成平台已经与ChatGPT集成,用户可以在网页、iOS和Android上的ChatGPT中编辑DALL-E生成的图像...

Read More
2024-03-28 talkingdev

文本和姿势条件助力AID与PAID技术提升图像生成质量

AID及其变体PAID是两种旨在通过加入文本和姿势等条件来改进图像插值的技术。这些方法确保生成的图像在不需要额外训练的情况下,具有更高的一致性、平滑度和真实性。图像生成技术的进步不仅推动了人工智能领域的创新...

Read More
2024-03-26 talkingdev

论文:AI图像个性化技术取得新突破

研究人员开发了一种新的方法,用于提升人工智能创建个性化图像的能力,同时解决了过拟合问题。这种新方法确保了图像中概念的平衡和多样性表现。通过这种方法,AI系统能够更好地理解用户的需求,生成更具个性化和广泛...

Read More
2024-03-26 talkingdev

ElasticDiffusion-实现灵活尺寸和宽高比的文本生成图像

ElasticDiffusion是一种革新性的解码方法,它使得文本到图像的扩散模型能够在不经过额外训练的情况下,创建不同尺寸和宽高比的图像。这种技术的出现,为图像生成领域带来了新的可能性,尤其是在处理具有特定宽高比要...

Read More
2024-03-25 talkingdev

论文:开放词汇注意力图谱革新图像分割技术

开放词汇注意力图谱(OVAM)是一种新兴的图像分割技术,它通过对类Stable Diffusion的文本到图像扩散模型进行改进,实现了对任意词汇生成注意力图的功能,打破了之前的限制。这意味着,通过OVAM,开发者和研究人员能...

Read More
2024-03-22 talkingdev

论文:扩散状态空间模型引领图像生成新纪元

扩散状态空间模型(DiS)是一种新型的扩散模型,它采用状态空间骨干代替了传统的U-Net处理图像数据。这种模型在保持计算效率的同时,能够处理长距离依赖问题,并且能够生成高质量的图像。与传统的U-Net相比,DiS模型...

Read More
2024-03-22 talkingdev

日本顶尖AI实验室推出首个模型

Sakana AI开发了先进的日语语言、视觉和图像生成模型。该公司引入了一种进化模型融合技术,旨在无需昂贵的预训练即可发展基础模型。该模型融合技术已经发布,并附带了方法的解释。这一创新技术将有助于降低AI模型开...

Read More
2024-03-20 talkingdev

论文:Stable Diffusion 3-图像生成领域的新突破

Stable Diffusion 3(SD3)是一款具有革命性的图像生成模型,通过引入潜在对抗性扩散蒸馏技术,成功将扩散步骤数量减少至4步,同时保持了图像生成的高质量。这项技术的进步不仅提升了图像生成的效率,还为AI艺术创作...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page