漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-01 talkingdev

使用GitHub仓库创建时尚3D头像

利用预训练的图像-文本扩散模型和生成对抗网络(GAN)进行训练,作者提出了一种创新的方法来创建高质量、个性化的3D头像。通过使用这些先进的模型,我们可以创建各种风格的多视角头像图像,从而实现多样性。 ## 核...

Read More
2023-05-23 talkingdev

通过强化学习训练扩散模型

在最近的工作中,强化学习一直备受关注,主要集中在人类反馈方面。但事实证明,您也可以使用计算反馈作为奖励模型。在这项工作中,他们使用LLaVA视觉问答系统为多个不同任务给出bert分数。有趣的是,他们能够显着提...

Read More
2023-05-12 talkingdev

新 SDK 允许用户使用稳定 AI 文本转动画生成独特风格动画

近日,一家新兴科技公司发布了新的 SDK,使用户可以使用稳定扩散模型创建动画。这一创新技术可以生成无条件、图像条件或视频条件下的动画,其结果非常美观,但计算成本较高,且具有非常独特的风格。以下是该技术的...

Read More
2023-05-10 talkingdev

新技术提升图像生成模型能力:SUR-adapter

近日,科研团队推出了一种名为 SUR-adapter 的新技术,可升级计算机程序中的扩散模型,将简单的描述转化为详细的图像。通过训练这些模型更好地理解故事,并使用超过 57,000 个样本的新数据集,研究人员使模型更擅长...

Read More
2023-04-17 talkingdev

【技术新闻】C-LoRA方法在图像生成中取得重大突破

以下是本文的主要内容: - 文本到图像扩散模型在定制连续性概念时面临灾难性遗忘问题,导致过去概念的图像生成质量低下。 - 我们提出的C-LoRA方法通过持续自我正则化的低秩适应性克服了这个问题,在连续扩散方面优...

Read More
2023-04-14 talkingdev

C-LoRA:解决文本到图像扩散模型中的“灾难性遗忘”问题

以下是新闻内容的核心要点: - 文本到图像扩散模型在定制化时面临“灾难性遗忘”的问题,导致过去概念的图像生成质量较差。 - 研究人员提出了 C-LoRA 方法,通过持续自我正则化低秩适应来克服这个问题,在持续扩散方...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16