漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-09 talkingdev

论文:AI图像生成技术新突破,提示自动编辑技术助力文本到图像转换

近期,研究人员开发了一种名为提示自动编辑(Prompt Auto-Editing,简称PAE)的新技术,旨在提升基于文本生成图像的技术水平。该技术利用了Imagen和Stable Diffusion等扩散模型,通过在线强化学习动态调整文本提示中...

Read More
2024-04-08 talkingdev

DALL-E与ChatGPT实现整合,图像编辑功能登陆三大平台

OpenAI宣布其创新性AI图像生成模型DALL-E现已成功与聊天机器人ChatGPT整合。这一新功能的推出使得用户能够在网页版、iOS以及Android平台上直接编辑DALL-E生成的图像。DALL-E此前已因其惊人的图像创造能力而名声大噪...

Read More
2024-04-05 talkingdev

TGATE推出两阶段推理图像生成方法,提升效率与画质

TGATE最新研究成果展示了一种高效的图像生成方法,该方法通过将整个生成过程分为规划和细化两个阶段来实现。这种新颖的方法不仅通过早期确定某些输出而简化了生成过程,而且还意外地提高了生成图像的质量。在规划阶...

Read More
2024-04-04 talkingdev

DALL-E图像编辑功能现已集成至ChatGPT

OpenAI的DALL-E现已推出图像编辑工具,支持网页和移动端使用。用户可以使用预设的风格建议来激发图像创作灵感。这一图像生成平台已经与ChatGPT集成,用户可以在网页、iOS和Android上的ChatGPT中编辑DALL-E生成的图像...

Read More
2024-03-28 talkingdev

文本和姿势条件助力AID与PAID技术提升图像生成质量

AID及其变体PAID是两种旨在通过加入文本和姿势等条件来改进图像插值的技术。这些方法确保生成的图像在不需要额外训练的情况下,具有更高的一致性、平滑度和真实性。图像生成技术的进步不仅推动了人工智能领域的创新...

Read More
2024-03-26 talkingdev

论文:AI图像个性化技术取得新突破

研究人员开发了一种新的方法,用于提升人工智能创建个性化图像的能力,同时解决了过拟合问题。这种新方法确保了图像中概念的平衡和多样性表现。通过这种方法,AI系统能够更好地理解用户的需求,生成更具个性化和广泛...

Read More
2024-03-26 talkingdev

ElasticDiffusion-实现灵活尺寸和宽高比的文本生成图像

ElasticDiffusion是一种革新性的解码方法,它使得文本到图像的扩散模型能够在不经过额外训练的情况下,创建不同尺寸和宽高比的图像。这种技术的出现,为图像生成领域带来了新的可能性,尤其是在处理具有特定宽高比要...

Read More
2024-03-25 talkingdev

论文:开放词汇注意力图谱革新图像分割技术

开放词汇注意力图谱(OVAM)是一种新兴的图像分割技术,它通过对类Stable Diffusion的文本到图像扩散模型进行改进,实现了对任意词汇生成注意力图的功能,打破了之前的限制。这意味着,通过OVAM,开发者和研究人员能...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page